京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据和未来国际政治
在2013年刚开始热议“大数据”这个观念的人们,会发现自己不知不觉已落伍过时。2014年的人们顾不上再空谈其概念和意义,他们蜂拥到大数据的各个富矿当中,埋头于各种开发应用。据业内人士预测,大数据技术很快会出现在社会各个领域。
从数据本身来讲,大数据的3个V(volume,velocity and variety/数据量大,输入和处理速度快,数据多样性)都是呈指数级发展的,翘首向上的曲线图明白无误地告诉人们,大数据的下一个数量级(无论叫什么)也将很快到来。一篇名为《2020年的数字宇宙》的研究报告计算出,从2005年到2020年,“数字宇宙”的规模将增加300倍之多,从130EB增加到40ZB,也就是40万亿GB,约为地球上所有海滩上的沙粒数量的57倍。
从古至今,海边沙子、天上星星,一直都是“不可胜数”的同义词,而在大数据时代的今天,它们竟成了不在话下的“小数据”。

大数据技术很快会出现在社会各个领域
伴随数据爆炸式发展,数据处理技术也飞快发展,目前还属于新奇玩意的数据批处理和存储技术,转眼就成了通用的计算基础设施,成了企业数据架构的核心组件。这意味着,目前还掌握在数据科学家手中的专业,将很快成为一般技能,几年之内,人们运用MapReduce和Hadoop等大数据工具,也许就像当年接受MS Office时的情况一样。
再看看资本方面。根据业界权威Gartner发布的统计,被大数据技术所驱动的IT支出,也呈现出成倍增长的势头,到2016年,全球将达到550亿美元,比2011年翻一番。
到了这个时候,再怀疑新技术革命是不是新一轮忽悠已没有意义,无论是资本驱动,还是技术驱动,总之,现实正紧追忽悠,忽悠正变成现实,两者合一了。
Google公司每天要处理超过24 PB(2的50次方字节)数据,Facebook每天收录30亿次点击和上传,Twitter上每天有超过4亿条微博发布。这些领跑大数据时代的公司,当然不是在自娱自乐,它们都极为认真地看待它们每日每时收集到的海量数据,把数据当作其核心资产。虽然巨头们还不急于推出太过惊世骇俗的应用,但人们明白,由于信息构成了世界的本质,一旦大数据开始不受约束地显示其力量,世界的各个领域都将被颠覆。
在目前这个阶段,大数据对个人的颠覆已轻松完成。曾几何时还被视为个人隐私坚固盾牌的三大措施——告知与许可、模糊化、匿名化,在大数据时代都已名存实亡。随着数据量越来越大,数据来源越来越多,个人毫无抵抗地变成了透明体。若一个小小的智能电表都有能力凭它所收集的用电数据推测你的生活方式和起居规律,那又何况你的手机、电脑和银行卡?又何况街上无处不在的摄像头?一家英国报纸曾说过,如果《一九八四》的作者乔治?奥威尔活到现在,他会发现在他的伦敦公寓60米范围内,起码有30多架摄像头在监视着他的一举一动。世界早已进入了“超级老大哥”时代,个人的自由意志在丧失,个人的生存价值在消散。
大数据对团体的颠覆也轻而易举。一个广为人知的案例是:为了揭示日本相扑赛事中非法操纵比赛的情况,芝加哥大学的经济学家们使用了11年中超过64000场比赛的记录数据,果真发现了消极比赛的发生规律,让业内的潜规则大白于天下。
这还属于很初级的应用。在目前的PB级时代,大数据技术刚刚成熟,还只是小试牛刀,从巨量的历史数据中随意抽取一部分相关关系,建立几个简单的算法模型,预测一下流感的传播、机票的打折、电影的票房、交通的状况…显得很无害,很友善,很为人民服务。但每年数百亿美元所养育的大数据技术当然不只是为了小小的“练习题”,十年之内,大数据的规模就将从PB级跨入EB级(2的60次方字节),再跨入ZB级(2的70次方字节)。坐拥历史上空前规模的数据量和空前发达的数据处理技术,“超级老大哥”们还会满足于小规模、小范围的颠覆吗?
如果能够轻而易举破解日本相扑业内部不为人知的“行规”,那么,从理论上讲,任何一个团体和组织的内部“行规”、隐秘知识、核心机密,都有可能通过海量的公开数据进行破解。而且,面对呼啸而来的大数据海浪,组织的规模和内部的信息封锁都不再构成障碍,安保能力的增长只是算术级的,数据能力的增长却是指数级的,在这场竞赛中,开始可能道高一尺魔高一丈,后来就会道高两尺魔高八丈,可以肯定,大数据全胜!
问题来了。主权国家这个人类社会的利维坦,不过就是个较大规模的组织。十年之内,今天看起来还巍然屹立坚不可摧的国家,也终将面临大数据浪潮的涤荡。就像破解日本相扑赛事,很快就会有人宣布,他利用大数据技术精准地破解了某个国家的特殊行为模式。
希腊的债务危机是如何形成的?日本的右倾化会走多远?伊朗核计划的真实状况如何?“薄荷四国”的提法是噱头还是现实?……这类题目的话语权将很快从政治分析师转到数据分析师手中,前者凭借经验和逻辑所建立起来分析框架,将被后者的海量数据冲得稀里哗啦。
在新加坡国立大学马凯硕教授近日发表的一篇文章中,作者开篇即提出问题:“中国强硬的新姿态背后传达出怎样的信息?是一个强有力的政府在宣告中国从今将表现得像一个真正的大国;还是一个弱势政府屈服于国内民族主义风潮?真相如何,外界不得而知,但我们能够推断,如果中国继续坚持强硬立场,其在亚太地区获取多少利益,便要在全球层面付出多少代价。这是中国未来不得不面对的新困境。”
在大数据时代,人们很快就不这样说话了。针对一国政府与国内民族主义风潮的互动关系,甚至会有现成的模型,随时通过大数据进行检验。至于一国在地区层面与全球层面的利益交换,也可以轻易数据化,得出基于量化指标的结论。
十年之内,各国政府都会设有应对大数据国际政治的专门机构。中国政府会发布大数据报告,揭示日本的军国主义历史演变轨迹;日本也会针锋相对,发布关于中国军力增长的大数据分析,甚至预测出中国建立海外军事基地的时间。随着各国政府从大数据分析中获得的新知识、新观察、新洞见越来越多,国际政治的整体局面必将大为改观。
但国家本身却不是这场数据革命的主导者,而是被动的接受者和追随者。“除了上帝,其他人必须用数据说话”,据说这是硅谷经理人的信仰,那些每日每时都在收集着“富可敌国”的数据资源的巨头企业,其实也早已拥有了“强可敌国”的大数据力量,在所有人都必须用数据说话的时代,它们就是新的上帝。是它们在引领变革,在将硅谷的信仰的行为规范推向全世界。如此看来,Google,Facebook,Twitter等公司在目前这个阶段的相对低调和隐忍,更显得其状不祥,大有风暴前短暂平静的模样。
而一个基本事实是,最大的大数据公司都在美国,用国家来衡量,美国早已是囊括了大数据资源最多的国家。如果大数据终将导致权力的重新分配,美国将再次占据优势。这是大数据时代国际政治格局的另一个维度,也不得不正视。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27