京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据基金纷涌而至 六大特点可掘金
正在发行的南方大数据300,成为目前第七只大数据基金。在“互联网+”时代背景下,大数据投资俨然成为牛市热潮,为投资者提供了新的投资选择。
从去年3月银河定投宝中证腾安指数基金发行,拉开了大数据基金的序幕,银河定投宝跟踪的指数中证腾安价值100指数由腾讯参与开发,是首只互联网与专业机构联合推出的指数。去年10月份成立的广发百发100跟踪的指数由百度参与编制,并采用百度金融搜索和用户行为的大数据编制而成,也是首只真正采用互联网大数据的指数。今年3月17日,天弘云端生活基金成立,这只基金被称为业内第一只大数据主动投资基金。今年4月份更是有3只大数据基金相继上市发售,掀起一波大数据基金浪潮。4月21日,依托电商大数据指数淘金100产生的第一只电商大数据基金博时招财一号在招财宝平台独家销售。4月22日,南方基金和新浪财经联合出品的大数据100指数基金开始发售,4月27日,博时淘金大数据100基金也上市发售。加上目前正在发行的南方大数据300,目前已经有7只大数据基金。
大数据基金有六大特点,投基者不妨重点关注。
1、依据互联网数据:无论是主动操作品种还是指数型基金,都将来自互联网的大数据作为投资的参考依据之一。互联网大数据相比传统数据而言,基于电商的全样本、实时数据能更直观、实时地反映各行业变化。而且能够反映一些传统数据无法统计的方面,比如投资者情绪、市场热点的变化等。
2、调整更为灵活:跟踪指数调整周期短,一般为一个月,传统指数调整周期大多为半年,且大多数采用等权重投资,避免单一股票对组合的影响,此类基金换股快,个股投资比例小。从已经成立时间较长的银河定投宝和广发100来看,两只基金前十大重仓股持股比例不超过20%,而且前十大重仓股更换率达到80%。
3、大数据的运用不是单一指标:大数据基金实际上是基于多因子模型的一个量化选股。互联网大数据是其选择股票的一个因子,其他的因子大多为市场以及基本面因子,比如百发100指数以财务因子、综合动量因子和搜索因子作为选股模型,淘金100指数则以财务因子、市场因子以及淘宝大数据因子纳入选股模型,大数据100以及300指数选择因子也包含了财务因子、市场因子与大数据因子。
4、大数据来源不同:目前大数据基本来源于三个渠道:电商(淘宝、京东)、门户网站(新浪、腾讯)、搜索网站(百度)。不同渠道的数据特征有所不同,比如,电商的数据代表了真实的成交额,价格走势等,而搜索网站的数据更多的反映了用户的关注点以及情绪因素,而不是实际发生的行为,门户网站的数据也更多的反映了用户关注点和情绪。
5、风格差异大:大数据指数依据的大数据来源、特点不同,量化选股模型不同,造成各个基金的风格、投向不同。即使依据相同大数据的基金风格也差别很大,比如同样依据新浪数据的大数据100和大数据300,前者偏成长,后者偏蓝筹,同样以淘宝大数据为投资依据的博时淘金100和天弘云端生活优选业绩分别为-0.69%和-3.74%,差距也非常大。
6、中长期业绩稳健:从基金成立后业绩表现来看,成立时间较长的基金广发百发100业绩排名持续位于30%左右,银河定投宝业绩排名持续位于40%左右,其余基金成立时间较短,业绩还不稳定,但是在大概率下能够排名在前50%。但是由于大数据基金,尤其是指数型基金持股十分分散,因此在业绩排名上很难排到十分靠前的位置。
我们认为,大数据基金融入了对投资者情绪以及更实时数据的分析,对市场的变化也更敏感,也更具有前瞻性和预测性,从业绩来看,表现较为稳健,但排名也很难十分靠前,同时受到数据的质量、受众、覆盖度、时间等的影响,也受到构建指数的量化模型的影响,大数据对于业绩并不是点石成金的金手指。对于目前日渐火爆的大数据基金,投资者应当存一份理性,在购买时还是需要多了解一下基金的风格、过往业绩表现、大数据的有效性等因素。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24