
大数据时代:GDP统计过时了吗?
国内生产总值(GDP)、失业率、通货膨胀以及贸易赤字等宏观经济统计数据,是经常用作宏观分析的先行指标。一段时间以来,GDP甚至成了衡量经济成败的标准。现如今,跨国公司生产销售的国际化、现代服务业的高速发展、网络经济与实体经济的融合等现象,让传统的宏观经济数据不再能涵盖经济发展的全貌。近期,国际舆论针对大数据应用如何弥补这一漏洞展开热议。在大数据时代,GDP等一系列传统的经济指标,真的已经“过时”了吗?
1、传统数据“漏掉”了什么?
2009年7月28日,国家统计局发布全国城镇单位在岗职工平均工资数据,各行业月平均工资都有不同程度上涨。不过,有网友却称自己的工资是“被增长”了。此后,“被增长”一词开始用于个人体验与宏观经济数据不符的现象。为什么会出现不符呢?专家解释称,由于地区等结构性差异因素,很可能导致一些未被计入的情况。同时,平均数据也往往会忽略微观层面的个人。
传统宏观统计数据的“不靠谱”还不仅仅出现在一国之内,随着全球化的深入推进,一些贸易数据的参考价值也大打折扣。举例来说,每当一部iPhone从富士康下线长途跋涉销往美国,美中贸易赤字大约就会增加200美元。而事实上,全球至少五个国家十几家公司都在供应iPhone的配件,每部iPhone价值中仅有约10美元最终流入中国经济中。
美国里弗特怀斯研究机构总裁扎卡里·卡拉贝尔在最近发表的《造成误导的先行指标》一文中指出,常规的贸易统计数字没有计算出中间阶段所增添的价值,其对双边贸易关系的描绘是扭曲的。
同样,GDP作为统计指标的意义也在下降。传统认为,GDP的增长就是就业的稳定,就是居民收入的增加等等。但是,从2008年以来,虽然英国的GDP增长率一直大致为零,但是其就业率却提高了。作为发达国家的GDP增速并不如一些发展中国家高,但我们发现这些国家间经济发展的质量差距却在拉大。
假如一座钢厂形成污染,其清理污染的费用会增加GDP,受到污染伤害的工人或居民的医疗费用也会增加GDP。相反,如果一个国家用寿命长的LED灯取代传统灯泡,结果用电花费较少,科技进步恰恰降低了GDP值。
GDP被广泛诟病的一点,是没有涉及商品和劳务的生产所造成的环境破坏。虽然GDP的增长率被看作是进步的衡量方法,但它从来都没有被用来度量幸福或者社会福利。中国人民大学统计学院院长赵彦云表示,国民经济核算统计集中系统整体的统计反映,而对于一些例如环境保护与生态经济、交通运输、旅游业、政府财政收支及收入分配调节、货币金融体系、科技创新、文化产业统计需求是不能有效满足的。
英国财政部前顾问戴安娜·科伊尔在其2月份发表的文章《超越GDP——经济绩效的衡量方法缺失了什么》一文中指出,国民核算等官方经济数据有各种来源,但有关个人和企业的调查构成其骨干。向某些企业发送表格或者派遣调查人员搜集不同店铺提供的有关价格的信息,这些常规的调查方法几乎不可能在经济结构本身发生变化的时候保持不断的更新。举一个明显的例子:调查表实际上没有把网上购物计算在内,而网上价格很可能比较低。
哈佛大学访问学者冯煦明指出,传统经济统计数据有两个缺陷:一是滞后性,二是低频率。例如:各国消费者物价指数(CPI)的发布一般都存在滞后期,以我国为例,通常要等到下个月的9号左右才发布上月的CPI数据。
专家表示,在同样的价值需求下,人们可能更加关注某大型电商(如淘宝网)的销售数据,而不需要再关注“社会消费品零售额”的统计指标。在发布结果时,仅仅告诉别人一个结果(如全国GDP数据)是远远不够的,还需要通过可视化、交互等方式给予用户更加方便、高效的使用方式,提供更为详尽的“意义”信息。
2、“垃圾”数据如何重新发光?
阿里巴巴基于淘宝推出的网络零售价格指数(iSPI),以网络交易的实时数据为基础,反映食品、烟酒及用品、衣着等十个商品与服务类别的网络零售价格和交易量的变化趋势。该指数与官方CPI环比指数呈现联动关系,并在关键转折点呈一定领先态势,可以辅助洞悉通货膨胀、经济增长、居民消费等宏观经济指标。
“传统的经济统计在未来将大数据化。”冯煦明认为,以往生产统计更多地停留在行业层面,或局限于规模以上企业,而未来可能是针对所有企业;传统的消费统计主要基于抽样调查,而未来可能具体到每个家庭或个人;传统的价格统计中仅包含千种商品、涉及几万个调查销售网点,而今后可能是几万种商品、所有的在线销售商和大部分线下销售网点。随着大数据技术的成熟,“样本即总体”将成为趋势,抽样越来越不重要。
“相对于传统经济统计而言,大数据引发的变革主要表现在四个方面:更快、更准、更广、更细。”冯煦明说,这些特性有益于未来行业政策和宏观经济决策。
随着计算机和互联网的普及以及电子商务的发展,越来越多的经济行为被记录下来。随着大数据相关技术的成熟,公共部门和私人企业过去积累的大量“垃圾”数据有可能重新焕发光彩。比如用交通事故和犯罪数据指导警力布局、用消费和税收数据指导收入分配、用客流量数据指导铁路和民航调配、用互联网关键词传播数据进行流行病预防等等。
赵彦云认为,在大数据时代,政府可以在国家层面建立数据集中平台,统筹管理经济社会的各项数据,包括经济社会统计数据的空间化,覆盖社会生活的方方面面,可以基于服务业各个部门管理的行政记录、业务统计、监管信息,建设服务业统计核算的科学统计方法体系。
“统计分析不能就数据论数据,还要追根求源,深入分析引起数据变化背后的原因。要做到这一点,就要求我们既要注重宏观分析,也要注重微观分析。”国家统计局局长马建堂说。
传统的平均值指标,掩盖了地域和个体的具体发展趋势。例如,如果把失业率当成全国性问题来处理,肯定是错误的,因为随着地域、性别及教育程度变化,就业趋势会有很大差别。但这些问题没有一个体现在失业率上,通过失业率制定的政策一开始就走错了方向。
专家表示,这些先行指标对于小企业或个人来说作用甚微。个人决定现在是否创业或买房时,不应该去参考失业率或者国家住房数量。对于想开一家服装店或者餐馆的人来说,CPI往往没有任何参考价值。相反,企业家应该注意当地市场动态及本行业的趋势。在30年前,这类统计可能相当困难,而今天获取这些信息只是在电脑上花几个小时而已。在大数据时代,我们需要的是专门为政府、企业、社区和个人的特定需求而定制指标,这在现在成为可能。
3、GDP如何“拥抱”大数据?
2013年11月19日,国家统计局与百度、阿里巴巴等11家企业签订了大数据战略合作框架协议。此举目的在于共同推进大数据在政府统计中的应用,不断增强政府统计的科学性和及时性。马建堂指出,过去传统的统计方式,是由统计专业人员设计统计表格,从名录库里找到企业去调查生产数据。但是,在大数据时代,有很多商业主体在名录库里找不到,却有交易活动和交易数据。这些数据是现成存在的,而且是海量的、非结构化的、非标准化的。统计部门要利用已经存在的数据,这类数据每天都可以获取,是统计的宝藏。
“当前,一个大规模生产、分享和利用大数据的时代正在来临。这是浩浩荡荡,不可阻挡的历史潮流,谁拥有了大数据,谁就占领了制高点,取得了主动权。”马建堂表示,就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础。
然而,大数据的统计并不是那么简单就能实现的。赵彦云指出,在目前各部门信息数据共享平台上,行政记录、业务统计、活动统计、财务信息等,都没有完成可以适应大数据分析的转化。
“指标不一致、指标口径不一致、时间不一致、空间不一致、指标体系不一致、分类不一致、编码不一致等,如此杂乱的数据库,基本上连常规的统计整理、统计描述和分析都无法做到。”赵彦云说,在大数据时代,我国需要推行共享、合作、协同的理念,使得政府职能部门打破传统各自为营的约束,真正开放共享部门数据,实现整体利益的最大化。长期以来,我国各部门过多关注自身利益,所谓共享工作也不过是应付交差。但在大数据时代,这将会直接限制我国经济社会的发展与产业升级。
“需要指出的是,大数据之于传统经济统计,是补充,而非替代。”冯煦明说,横向来看,传统统计方法在经济增长、税收、贸易、收入分配等领域的统计上具有主导优势,而大数据在物价、通货膨胀、失业率、消费等方面的统计上更具有优势。
那么,在大数据时代,GDP统计指标应该如何完善呢?对此,专家认为,应该优化GDP核算数据的来源,保证GDP核算数据的准确性与真实性。今后GDP核算的结果不能仅有总量和速度,还必须有各个产业、行业、类型和不同地区、不同区域的细项、分项指标数据,以此来满足不同对象、不同行业的个性化需求。政府统计将由对“宏观”的把握转变为对“微观”的运用,GDP将逐步成为宏观和微观都适用的大众化指标。同时,应该更多地通过图形、图像、地图、动画等更为生动、易懂的方式来展现数据的大小,诠释数据之间的关系和发展趋势,为人们提供易于理解、便于使用的结果。
名词解释
大数据(big data),或称巨量资料,指的是所涉及的资料量规模非常巨大,以至于无法通过目前主流软件在合理时间内撷取、管理、处理并整理成为帮助企业经营决策的资讯。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》一书中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
本次活动市场价2000元,现面向会员免费开放,会员朋友更可以邀请一位非会员免费参加。 【活动目标】 本课程 ...
2025-07-28CDA 数据分析师必备技能全解析 在数据驱动决策的时代,CDA 数据分析师作为连接数据与业务价值的桥梁,需要具备多元化的技能体系 ...
2025-07-28PowerBI 添加索引列全攻略 在使用 PowerBI 进行数据处理与分析时,添加索引列是一项极为实用的操作技巧。索引列能为数据表中的每 ...
2025-07-28t 检验与 Wilcoxon 检验:数据差异分析的两大核心方法 在数据分析的广阔领域中,判断两组或多组数据之间是否存在显著差异是一项 ...
2025-07-28PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-252025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-25从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-25用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21