
大数据探究经济衰退的到来
当今全球经济风起云涌,全球市场普遍不景气,资本缩水,油价下跌严重,诸多大企业纷纷裁员,一时间经济唱衰的声音越来越多。《大数据文摘--商业与金融专栏》今天刊登一篇全球顶级资本大鳄黑石集团(BlackRock)的内部分析,本文从大数据分析的角度阐述了预测未来全球经济走势的研究方法。
在如今市场的动荡之下,投资者们纷纷质疑经济是否在正确方向上。衰退的论调在决策者的评论和刊物中随处可见,然而投资者究竟是否需要担忧经济衰退的风险呢?我们的分析显示:衰退还未真正到来。与其听信一些传言,不如让大数据帮助我们正确的评估“衰退”一词有多频繁地被提及。探究使用衰退一词的人数可以让我们更清晰的了解人们对经济增长持有悲观态度。我们也可决定是否也应该担忧。对比不久前,我们发现关于衰退的讨论增加了:谷歌趋势的数据表明,人们在互联网搜索“衰退”一词更加频繁了。当“衰退”一词被公众更多的讨论时,我们需要知道实际经济体系中的决策者们是否也持有同样的观点? 投资者和商业领袖们是否和公众一样,对潜在的经济衰退持同样的看法呢?
◆ ◆ ◆
每个季度,BlackRock都会通过分析3000个财报电话会议,来比较CEO和CFO的话题和用词。我们通过研究这些用词中的微小变化来探究他们对热点话题的想法。同样的研究方法也被用于投资者向管理层提问的Q&A环节中。在过去的两个季度里,“衰退”一次确实被更频繁的在Q&A环节提及。然而,几乎没有证据表明管理团队的言论中有相似“衰退”一词的增长。回顾2008年的经融危机场景,这种对比的解释是投资者认为经济已经开始衰退,而管理团队并不这么看。我们同样使用机器阅读了通讯社的新闻报道,例如Dow Jones的文章中显示“衰退”一词的频率有轻微增加。然而08年的全球金融危机时,衰退这个词的增长是十分显著的。从下面的图表也可以看出,经济衰退现并不具有话题性。
金融市场是对预期经济表现和现有风险的反映。不幸的是,经济数据是由一些信息落后的、在经济衰退已经发生之后才知道亡羊补牢的经济学家所提供的。大部分的经济数据只能提供给我们几周甚至几个月前发生的事情。即使第一季度从1月1日到3月31日止,关于第一季度的GDP预估绝对不会在4月28日前发布。更重要的是,经济衰退被定义为连续两个季度的负增长。我们是否在经历衰退?7月29日再来问我吧!或者我们还没面临经济衰退,不过下个季度就开始了,我们在10月28日会告诉你的……你懂的。
收集所有的数据来计算(或者预计)GDP是一项浩大的工程——这就是为什么报告总是来的很迟。然而现在有一些更及时的数据能告诉我们现在的经济正在发生什么。正如你不需要依靠昨晚的天气预报来判断现在是否下雨——你可以看看窗外——我们也可以用一些确切的消息来掌握经济的脉搏。
现在,人们在实体店或网上消费,乘客和货物通过汽车、火车、海运和空运进行周转,个人和公司同样使用信用卡支付。“现测”意在提供一个即时的检测手段,来研究某些不能被实时监控的物体,比如总体经济活跃度。不幸的是,观测经济状态并不像往窗外看看是否下雨这么简单。信息被收集起来,在不同的时间段被检查:失业率每周报告一次,零售业绩每个月一次,GPD则是每个季度一次。不同的测量手段表现也各不相同:工业产品可能会暴涨或暴跌,取决于库存与订单;进出口货物则对汇率反应更加迟缓。幸运的是,有些方法可以解决这些困难。在图像处理软件中,为了寻找一个图片丢失的细节,他们可以通过对相似图片和周围的细节部分进行分析来完善图片。研究者采用相似的手段,来探究在一个季度的数据中到底发生了什么,来与月度报告做比较。统计软件同样可以用于将起伏较大的数据和平缓的数据混合。
◆ ◆ ◆
应用大数据“现测”新方法预测经济未来增长
为了“现测”衰退可能,我们收集了70个不同的数据来源,以提供一个描绘经济活动的画面。这些数据远远超过了典型的LEI,这其中包括了犯罪率,甚至机动车驾驶里程数。因为这些数据来源有着不同的采集频率和时间间隔,我们需要在这些障碍中搭建“桥梁”使他们能形成一个可比较的数据流。通过一个叫Principal Component Analysis(PCA)的统计软件,我们提取出了一个指数,可以说明这系列数据中的大部分变化。这一个变量可以体现当下经济的总体健康状况。我们的“现测”经济健康指数每周更新,并体现了经济活动变化的即时表现。
当指数小于零的时候,说明NBER定义的经济衰退已经来临。我们同样将具体的70个原始数据输入以获得经济具体部分的图景(如花费和信用增长)在下图中,我们将NBER经济衰退周期和我们的指数叠加。如图所示,这个巨大的下降说明了我们的指数对经济衰退的响应度非常好。更重要的是,我们可以看到相似的趋势也在信用和消费上有所表现。指数同样表明,当经济活动减缓时,与过去的三个经济衰退期相比,整体依然健康,就业率依然坚挺,即使最后一张图表明总生产在一定程度上开始减缓增长。
所以经济衰退是否近在眼前?正如之前所说,我们的分析表明衰退并未到来。不过幸亏有大数据和“现测”,我们才不需要依赖事实发生之后的亡羊补牢,同时也可用更好的工具去探究经济衰退的到来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09