京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据基金纷涌而至 六大特点可掘金
正在发行的南方大数据300,成为目前第七只大数据基金。在“互联网+”时代背景下,大数据投资俨然成为牛市热潮,为投资者提供了新的投资选择。
从去年3月银河定投宝中证腾安指数基金发行,拉开了大数据基金的序幕,银河定投宝跟踪的指数中证腾安价值100指数由腾讯参与开发,是首只互联网与专业机构联合推出的指数。去年10月份成立的广发百发100跟踪的指数由百度参与编制,并采用百度金融搜索和用户行为的大数据编制而成,也是首只真正采用互联网大数据的指数。今年3月17日,天弘云端生活基金成立,这只基金被称为业内第一只大数据主动投资基金。今年4月份更是有3只大数据基金相继上市发售,掀起一波大数据基金浪潮。4月21日,依托电商大数据指数淘金100产生的第一只电商大数据基金博时招财一号在招财宝平台独家销售。4月22日,南方基金和新浪财经联合出品的大数据100指数基金开始发售,4月27日,博时淘金大数据100基金也上市发售。加上目前正在发行的南方大数据300,目前已经有7只大数据基金。
大数据基金有六大特点,投基者不妨重点关注。
1、依据互联网数据:无论是主动操作品种还是指数型基金,都将来自互联网的大数据作为投资的参考依据之一。互联网大数据相比传统数据而言,基于电商的全样本、实时数据能更直观、实时地反映各行业变化。而且能够反映一些传统数据无法统计的方面,比如投资者情绪、市场热点的变化等。
2、调整更为灵活:跟踪指数调整周期短,一般为一个月,传统指数调整周期大多为半年,且大多数采用等权重投资,避免单一股票对组合的影响,此类基金换股快,个股投资比例小。从已经成立时间较长的银河定投宝和广发100来看,两只基金前十大重仓股持股比例不超过20%,而且前十大重仓股更换率达到80%。
3、大数据的运用不是单一指标:大数据基金实际上是基于多因子模型的一个量化选股。互联网大数据是其选择股票的一个因子,其他的因子大多为市场以及基本面因子,比如百发100指数以财务因子、综合动量因子和搜索因子作为选股模型,淘金100指数则以财务因子、市场因子以及淘宝大数据因子纳入选股模型,大数据100以及300指数选择因子也包含了财务因子、市场因子与大数据因子。
4、大数据来源不同:目前大数据基本来源于三个渠道:电商(淘宝、京东)、门户网站(新浪、腾讯)、搜索网站(百度)。不同渠道的数据特征有所不同,比如,电商的数据代表了真实的成交额,价格走势等,而搜索网站的数据更多的反映了用户的关注点以及情绪因素,而不是实际发生的行为,门户网站的数据也更多的反映了用户关注点和情绪。
5、风格差异大:大数据指数依据的大数据来源、特点不同,量化选股模型不同,造成各个基金的风格、投向不同。即使依据相同大数据的基金风格也差别很大,比如同样依据新浪数据的大数据100和大数据300,前者偏成长,后者偏蓝筹,同样以淘宝大数据为投资依据的博时淘金100和天弘云端生活优选业绩分别为-0.69%和-3.74%,差距也非常大。
6、中长期业绩稳健:从基金成立后业绩表现来看,成立时间较长的基金广发百发100业绩排名持续位于30%左右,银河定投宝业绩排名持续位于40%左右,其余基金成立时间较短,业绩还不稳定,但是在大概率下能够排名在前50%。但是由于大数据基金,尤其是指数型基金持股十分分散,因此在业绩排名上很难排到十分靠前的位置。
我们认为,大数据基金融入了对投资者情绪以及更实时数据的分析,对市场的变化也更敏感,也更具有前瞻性和预测性,从业绩来看,表现较为稳健,但排名也很难十分靠前,同时受到数据的质量、受众、覆盖度、时间等的影响,也受到构建指数的量化模型的影响,大数据对于业绩并不是点石成金的金手指。对于目前日渐火爆的大数据基金,投资者应当存一份理性,在购买时还是需要多了解一下基金的风格、过往业绩表现、大数据的有效性等因素。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29