京公网安备 11010802034615号
经营许可证编号:京B2-20210330
南方大数据100年化42.93% 这个基金可以有
社交网络炒股可以很美
大数据(Big Data)这个词,经过过去几年媒体的大肆渲染,相信诸位已经不陌生了。在那些报道中,大数据神乎其神,从推荐图书到预测流行病无所不能。
如此神奇的大数据,自然会有人用于投资的研究。
拿什么大数据来辅助投资决策?从美国来看,社交网络Twitter的数据是研究最多的,这可能与Twitter渗透率高、数据量大同时还包含发布者的情感有关,适合做比较深入的研究。而从研究和实践来看,效果不错。
2010年,美国印第安纳大学的一项研究成果表明:从Twitter信息中表现出来的情绪指数与道琼斯工业指数的走势之间具有很强的相关性。研究表明,Twitter中表现出来的情绪和道指接下来几天的上涨或者下跌的相关性达到了87%。此外,美国佩斯大学在2011年的研究成果表明,社交媒体可以预测出三大国际知名品牌股票价格的涨跌,包括星巴克、可口可乐和耐克。
当然,以上不过是纸上谈兵,真正让市场相信Twitter大数据可以辅助投资的,还是“Twitter 对冲基金”CAYMAN ATLANTIC的实践结果。
利用Twitter进行投资决策可以产生超额收益
2012年7月,CAYMAN ATLANTIC成立,专注于利用Twitter数据进行投资。查看了下官网公布的投资数据,从基金成立到2015年3月,不但表现比S&P 500指数来的稳健,而且还有超额收益,相比S&P 500指数ETF19%的年化收益,CAYMAN ATLANTIC以22.1%的年化收益产生3%的超额收益——对于美股,这已经算很不错的成绩了。
微博助阵,大数据炒A股如鱼得水
社交网络大数据炒股,对于A股这样注重消息的市场,显然效果要比在美国好许多。
2014年9月12日,南方基金、新浪财经、深证信息公司三强联手宣布推出大数据100指数(简称:i100),你可以在行情软件中输入399415查看这一指数的走势。
i100指数采用的是三层数据选股的模型,包含了财务因子、市场驱动因子和大数据因子三个模块,其中大数据就是来自新浪的网络财经大数据。
i100指数
i100指数的历史回测数据从2010年2月开始,表现那是极为优异。
i100指数2010年以来超额收益显著
从下面与沪深300(4520.461, -1.46, -0.03%)指数和中证500指数的对比表可以看到,i100指数很智能,总能找准蓝筹和中小盘股的大格局。比如2011年大盘股沪深300指数抗跌,i100比沪深300指数更抗跌;2012年沪深300指数跑赢中证500指数,i100比沪深300指数更强;而到了2013年中证500指数走强的时候,i100又比中证500指数更强了。正是这样的智能,所以i100累计涨幅远胜于沪深300指数和中证500指数。
i100指数与沪深300对比
当然,i100指数最让我印象深刻的,是其超额收益的稳定性。
将2010年二季度开始每个季度i100相比沪深300指数和中证500指数的超额收益做了一个统计,i100指数在80%的季度中跑赢沪深300指数,而跑赢中证500指数的季度更多达90%。
绝大多数季度i100指数都有显著超额收益
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28