京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据和未来国际政治
在2013年刚开始热议“大数据”这个观念的人们,会发现自己不知不觉已落伍过时。2014年的人们顾不上再空谈其概念和意义,他们蜂拥到大数据的各个富矿当中,埋头于各种开发应用。据业内人士预测,大数据技术很快会出现在社会各个领域。
从数据本身来讲,大数据的3个V(volume,velocity and variety/数据量大,输入和处理速度快,数据多样性)都是呈指数级发展的,翘首向上的曲线图明白无误地告诉人们,大数据的下一个数量级(无论叫什么)也将很快到来。一篇名为《2020年的数字宇宙》的研究报告计算出,从2005年到2020年,“数字宇宙”的规模将增加300倍之多,从130EB增加到40ZB,也就是40万亿GB,约为地球上所有海滩上的沙粒数量的57倍。
从古至今,海边沙子、天上星星,一直都是“不可胜数”的同义词,而在大数据时代的今天,它们竟成了不在话下的“小数据”。

大数据技术很快会出现在社会各个领域
伴随数据爆炸式发展,数据处理技术也飞快发展,目前还属于新奇玩意的数据批处理和存储技术,转眼就成了通用的计算基础设施,成了企业数据架构的核心组件。这意味着,目前还掌握在数据科学家手中的专业,将很快成为一般技能,几年之内,人们运用MapReduce和Hadoop等大数据工具,也许就像当年接受MS Office时的情况一样。
再看看资本方面。根据业界权威Gartner发布的统计,被大数据技术所驱动的IT支出,也呈现出成倍增长的势头,到2016年,全球将达到550亿美元,比2011年翻一番。
到了这个时候,再怀疑新技术革命是不是新一轮忽悠已没有意义,无论是资本驱动,还是技术驱动,总之,现实正紧追忽悠,忽悠正变成现实,两者合一了。
Google公司每天要处理超过24 PB(2的50次方字节)数据,Facebook每天收录30亿次点击和上传,Twitter上每天有超过4亿条微博发布。这些领跑大数据时代的公司,当然不是在自娱自乐,它们都极为认真地看待它们每日每时收集到的海量数据,把数据当作其核心资产。虽然巨头们还不急于推出太过惊世骇俗的应用,但人们明白,由于信息构成了世界的本质,一旦大数据开始不受约束地显示其力量,世界的各个领域都将被颠覆。
在目前这个阶段,大数据对个人的颠覆已轻松完成。曾几何时还被视为个人隐私坚固盾牌的三大措施——告知与许可、模糊化、匿名化,在大数据时代都已名存实亡。随着数据量越来越大,数据来源越来越多,个人毫无抵抗地变成了透明体。若一个小小的智能电表都有能力凭它所收集的用电数据推测你的生活方式和起居规律,那又何况你的手机、电脑和银行卡?又何况街上无处不在的摄像头?一家英国报纸曾说过,如果《一九八四》的作者乔治?奥威尔活到现在,他会发现在他的伦敦公寓60米范围内,起码有30多架摄像头在监视着他的一举一动。世界早已进入了“超级老大哥”时代,个人的自由意志在丧失,个人的生存价值在消散。
大数据对团体的颠覆也轻而易举。一个广为人知的案例是:为了揭示日本相扑赛事中非法操纵比赛的情况,芝加哥大学的经济学家们使用了11年中超过64000场比赛的记录数据,果真发现了消极比赛的发生规律,让业内的潜规则大白于天下。
这还属于很初级的应用。在目前的PB级时代,大数据技术刚刚成熟,还只是小试牛刀,从巨量的历史数据中随意抽取一部分相关关系,建立几个简单的算法模型,预测一下流感的传播、机票的打折、电影的票房、交通的状况…显得很无害,很友善,很为人民服务。但每年数百亿美元所养育的大数据技术当然不只是为了小小的“练习题”,十年之内,大数据的规模就将从PB级跨入EB级(2的60次方字节),再跨入ZB级(2的70次方字节)。坐拥历史上空前规模的数据量和空前发达的数据处理技术,“超级老大哥”们还会满足于小规模、小范围的颠覆吗?
如果能够轻而易举破解日本相扑业内部不为人知的“行规”,那么,从理论上讲,任何一个团体和组织的内部“行规”、隐秘知识、核心机密,都有可能通过海量的公开数据进行破解。而且,面对呼啸而来的大数据海浪,组织的规模和内部的信息封锁都不再构成障碍,安保能力的增长只是算术级的,数据能力的增长却是指数级的,在这场竞赛中,开始可能道高一尺魔高一丈,后来就会道高两尺魔高八丈,可以肯定,大数据全胜!
问题来了。主权国家这个人类社会的利维坦,不过就是个较大规模的组织。十年之内,今天看起来还巍然屹立坚不可摧的国家,也终将面临大数据浪潮的涤荡。就像破解日本相扑赛事,很快就会有人宣布,他利用大数据技术精准地破解了某个国家的特殊行为模式。
希腊的债务危机是如何形成的?日本的右倾化会走多远?伊朗核计划的真实状况如何?“薄荷四国”的提法是噱头还是现实?……这类题目的话语权将很快从政治分析师转到数据分析师手中,前者凭借经验和逻辑所建立起来分析框架,将被后者的海量数据冲得稀里哗啦。
在新加坡国立大学马凯硕教授近日发表的一篇文章中,作者开篇即提出问题:“中国强硬的新姿态背后传达出怎样的信息?是一个强有力的政府在宣告中国从今将表现得像一个真正的大国;还是一个弱势政府屈服于国内民族主义风潮?真相如何,外界不得而知,但我们能够推断,如果中国继续坚持强硬立场,其在亚太地区获取多少利益,便要在全球层面付出多少代价。这是中国未来不得不面对的新困境。”
在大数据时代,人们很快就不这样说话了。针对一国政府与国内民族主义风潮的互动关系,甚至会有现成的模型,随时通过大数据进行检验。至于一国在地区层面与全球层面的利益交换,也可以轻易数据化,得出基于量化指标的结论。
十年之内,各国政府都会设有应对大数据国际政治的专门机构。中国政府会发布大数据报告,揭示日本的军国主义历史演变轨迹;日本也会针锋相对,发布关于中国军力增长的大数据分析,甚至预测出中国建立海外军事基地的时间。随着各国政府从大数据分析中获得的新知识、新观察、新洞见越来越多,国际政治的整体局面必将大为改观。
但国家本身却不是这场数据革命的主导者,而是被动的接受者和追随者。“除了上帝,其他人必须用数据说话”,据说这是硅谷经理人的信仰,那些每日每时都在收集着“富可敌国”的数据资源的巨头企业,其实也早已拥有了“强可敌国”的大数据力量,在所有人都必须用数据说话的时代,它们就是新的上帝。是它们在引领变革,在将硅谷的信仰的行为规范推向全世界。如此看来,Google,Facebook,Twitter等公司在目前这个阶段的相对低调和隐忍,更显得其状不祥,大有风暴前短暂平静的模样。
而一个基本事实是,最大的大数据公司都在美国,用国家来衡量,美国早已是囊括了大数据资源最多的国家。如果大数据终将导致权力的重新分配,美国将再次占据优势。这是大数据时代国际政治格局的另一个维度,也不得不正视。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16