京公网安备 11010802034615号
经营许可证编号:京B2-20210330
南方大数据100年化42.93% 这个基金可以有
社交网络炒股可以很美
大数据(Big Data)这个词,经过过去几年媒体的大肆渲染,相信诸位已经不陌生了。在那些报道中,大数据神乎其神,从推荐图书到预测流行病无所不能。
如此神奇的大数据,自然会有人用于投资的研究。
拿什么大数据来辅助投资决策?从美国来看,社交网络Twitter的数据是研究最多的,这可能与Twitter渗透率高、数据量大同时还包含发布者的情感有关,适合做比较深入的研究。而从研究和实践来看,效果不错。
2010年,美国印第安纳大学的一项研究成果表明:从Twitter信息中表现出来的情绪指数与道琼斯工业指数的走势之间具有很强的相关性。研究表明,Twitter中表现出来的情绪和道指接下来几天的上涨或者下跌的相关性达到了87%。此外,美国佩斯大学在2011年的研究成果表明,社交媒体可以预测出三大国际知名品牌股票价格的涨跌,包括星巴克、可口可乐和耐克。
当然,以上不过是纸上谈兵,真正让市场相信Twitter大数据可以辅助投资的,还是“Twitter 对冲基金”CAYMAN ATLANTIC的实践结果。
利用Twitter进行投资决策可以产生超额收益
2012年7月,CAYMAN ATLANTIC成立,专注于利用Twitter数据进行投资。查看了下官网公布的投资数据,从基金成立到2015年3月,不但表现比S&P 500指数来的稳健,而且还有超额收益,相比S&P 500指数ETF19%的年化收益,CAYMAN ATLANTIC以22.1%的年化收益产生3%的超额收益——对于美股,这已经算很不错的成绩了。
微博助阵,大数据炒A股如鱼得水
社交网络大数据炒股,对于A股这样注重消息的市场,显然效果要比在美国好许多。
2014年9月12日,南方基金、新浪财经、深证信息公司三强联手宣布推出大数据100指数(简称:i100),你可以在行情软件中输入399415查看这一指数的走势。
i100指数采用的是三层数据选股的模型,包含了财务因子、市场驱动因子和大数据因子三个模块,其中大数据就是来自新浪的网络财经大数据。
i100指数
i100指数的历史回测数据从2010年2月开始,表现那是极为优异。
i100指数2010年以来超额收益显著
从下面与沪深300(4520.461, -1.46, -0.03%)指数和中证500指数的对比表可以看到,i100指数很智能,总能找准蓝筹和中小盘股的大格局。比如2011年大盘股沪深300指数抗跌,i100比沪深300指数更抗跌;2012年沪深300指数跑赢中证500指数,i100比沪深300指数更强;而到了2013年中证500指数走强的时候,i100又比中证500指数更强了。正是这样的智能,所以i100累计涨幅远胜于沪深300指数和中证500指数。
i100指数与沪深300对比
当然,i100指数最让我印象深刻的,是其超额收益的稳定性。
将2010年二季度开始每个季度i100相比沪深300指数和中证500指数的超额收益做了一个统计,i100指数在80%的季度中跑赢沪深300指数,而跑赢中证500指数的季度更多达90%。
绝大多数季度i100指数都有显著超额收益
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23