京公网安备 11010802034615号
经营许可证编号:京B2-20210330
跨界掘金“大数据” 基金也玩“互联网+”
近期,不少公募基金联合专业互联网企业已经或酝酿发行“大数据”基金,给基金印上了深深的“互联网+”烙印。人们不禁要问,究竟什么是“大数据”基金,它又能为投资者带来怎样的回报呢?
选股标准是什么?大数据说了算
目前,市场中已有多只跟踪不同大数据指数的基金。据不完全统计,其中既包括银河定投宝、广发百发100指基等已经发行一段时间的基金;也包括即将发行的南方大数据100基金;此外,博时基金也将推出两只与淘金100指数挂钩的基金产品。
值得研究的是,这几只基金挂钩的数据在选股模式中各具特色。其中,广发百发100指基挂钩的是百发100指数,该指数由百度与中证指数公司、广发基金合作推出,业内人士表示,其最大的特点就是引入了“投资者情绪指标”。何为“情绪指标”?根据官方解释,当某只股票被搜寻的时候,意味着有投资者对这只股票产生了关注。因此,股票在百度的搜索量某种程度上就可以反映投资者目前关注的股票以及投资偏好。将这样的因子加入到传统的量化模型中,就能优化选股模型。
而银河定投宝追踪的中证腾安指数是国内第一家由互联网媒体与专业机构编制发布的A股指数。业内人士表示,与百度百发的思路不同,该指数并没有利用互联网引入模型因子,而是利用腾讯微博的影响力挖掘了一大批来自于财经媒体、证券投资、资本运作、行业研究等不同领域的专家以甄别股票。
即将发行的南方大数据100基金挂钩的则是i100指数,该指数由南方基金、新浪财经和深证信息公司联合推出。据介绍,该指数综合财务、市场驱动、大数据三大因子形成选股策略,通过对财经领域的“大数据”进行定性与定量分析,同时考量股票基本面与市场驱动情况,精选出综合排名靠前的100只股票组成指数样本股。
此外,上周“新鲜出炉”的中证淘金大数据100指数则是由蚂蚁金服、博时基金、恒生聚源及中证指数共同发布的全球第一个电商大数据指数。其官方资料显示,该指数是基于海量的电商交易数据,经过大数据与金融的碰撞后,产生的全球首个电商大数据指数产品。该指数量化投资模型由行业景气指数、财务因子、市场驱动因子等构成。
量化模型创新 最终还需市场检验
值得注意的是,相较于传统指数,大数据指数调整周期普遍较短。例如,i100指数、中证淘金大数据100指数和百发100指数的换股周期均为1个月,而像沪深300指数这样的传统指数,则是每半年调整一次成分股。业内人士表示,大数据指数样本股调整周期缩短,可以起到摊薄风险、提高收益的作用。
事实上,国外也已经有运作得颇为成功的先例。在2012年7月,保罗·霍廷(Paul Hawtin)成立基于推特(Twitter)、新闻媒体信息等数据进行交易的对冲基金。根据CAYMAN ATLANTIC在其官网披露的基金历史收益数据显示,截至2014年10月,该基金的累计收益率达到51.05%,年化收益率超过20%,在基金运行的28个月中有24个月获得了正收益,最大回撤为-0.33%。
那么,神乎其神的大数据基金真有那么厉害吗?它是不是基金公司用来吸引投资者的营销噱头呢?对此,数米基金研究部主管王炜表示,大数据基金并不仅仅是一个营销噱头,“而是一种创新的量化决策模型”。他指出,大数据紧紧依靠数据、同时创新量化模型,确实可为投资者带来实实在在的好处。德圣基金首席分析师江赛春则表示,虽然现在许多基金都冠以“大数据”头衔,但是“不一样的数据来源和操作方法带来的指数、投资决策是不同的”。因而并不能说所有大数据基金都很好,“最终还是需要市场对其进行检验”。
对于“大数据”基金的流行,江赛春也提出了质疑:“大数据基金的数据来源平台非常多样,不同的平台有不同的用户,我们并不知道数据是怎样被处理的,也不知道基金公司在挖掘数据后是否会加以处理再推出市场。”他认为,基金公司在挖掘数据后,如果再经人工加工,“那数据就会失去原本的意义”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20