京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据变革传统投研模式
正是看到了大数据的前景和突破性,博时基金一直在往这方面发力。无论是在研究方法、理念,还是在成果方面,博时基金已有优势。
继2015年初与蚂蚁金服合作推出淘金100大数据指数后,日前,博时基金又和雪球合作推出了雪球智选大数据100指数。对于大数据基金,博时基金副总裁王德英表示,大数据正在改变传统的投研模式,未来博时还将推出一系列大数据基金。
打造大数据基金超市
无论是A股市场,还是海外市场,通过大数据进行量化投资可谓方兴未艾。博时基金早在2009年就已经布局量化投资,随着博时量化模型逐渐成熟,结合“互联网+”的大数据发展趋势,博时基金正在打造大数据基金超市。
据了解,2015年初,博时基金和蚂蚁金服合作,推出了国内第一只电商大数据指数——淘金100。此外,博时基金还与银联、雪球、搜房网合作,推出了银联智惠100、雪球智选100、房地产大数据等3只大数据指数,博时基金还将与多个不同领域/行业的龙头企业开展合作,不断扩展大数据领域。
据介绍,博时基金此次与雪球合作推出的雪球智选大数据100指数,主要是从海量的雪球投资组合中挖掘投资达人的交易热度信号,聚焦组合管理人交易行为。
王德英解释,决定个股股价的因素主要在于两方面,一是公司基本面,二是投资者情绪,大数据基金主要在这两方面着手。此次博时基金和雪球合作的大数据产品,主要是从过往业绩优异的雪球模拟组合中找到有价值的信息。其逻辑在于,雪球模拟组合过往业绩优异的选手选股和选时有独特性,通过对这些模拟组合筛选找到有价值的公司,然后结合综合财务因子、市场驱动因子、雪球热度因子,与其相应近期及长期历史表现之间的相关性作为加权依据,对这3类因子得分进行加权计算,股票综合评分前100只股票即为博时雪球智选大数据100指数基金样本股。
雪球智选大数据100指数以2012年12月31日为基日,以该日收盘后所有样本股的调整市值为基期,以1000点为基点。模拟数据显示,自基日以来到2015年8月14日,该指数累计收益率为379.64%,年化收益率达78.7%。
变革投研模式
从近年各类基金在投资上的表现来看,大数据基金已经崭露头角。王德英表示,传统投资方式主要是投研人员去上市公司调研,了解财务数据、行业信息等来做投资决策,而大数据基金通过海量数据分析,数据量更大,数据维度更全,数据更及时,因此,对公司未来表现的预测确定性更强,从这个角度说,大数据基金正在改变或升级传统的投研方式。
据介绍,大数据技术是利用海量的互联网大数据,如搜索热度、关注度、订单数、成交额、消费笔数等多维度的数据,通过量化模型,更早、更快、更准预判某个行业或者企业未来的景气程度或市场热度。基金公司综合大数据因子、财务价值因子、市场驱动因子等,精选出最具投资价值的个股组合编制成指数。
王德英表示,正是看到了大数据的前景和突破性,博时基金一直在往这方面发力。从时间上来说,博时基金从2009年起开始从华尔街引入量化人才,建立量化投资系统。从模型应用来看,以2014年为例,博时沪深300(3403.850, 38.02,1.13%)指数基金超额收益超过了9%。因此,无论是在研究方法、理念,还是在成果方面,博时基金已有优势。
从人才储备和队伍建设来说,目前博时基金已经在大数据产品上进行了战略布局,整个项目从商务洽谈、数据开发、指数编制、产品成立和产品销售都已成体系,其中,具体负责数据研发的是指数投资部,整个团队有11个人;同时,互联网金融部有专人负责与互联网大数据企业对接。
在有效性方面,博时基金表示,通过对较为长期的历史数据采用科学严格的回测方法,大数据因子确有显著的有效性。这是由数据的及时性及大数据与公司基本面和市场情绪方面的内在逻辑决定的。从实践结果看,大数据因子对于股市往往会有3到6个月的领先性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27