京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,我们越来越以为外面的世界是真实的.....
遥想洪荒年代,有时候觉得,那会也是蛮好的,一切都赤裸裸的真实。
土地赤裸裸的真实,没有化肥加持;河流赤裸裸的真实,没有杂质;植物赤裸裸的真实,没有农药帮着祛除虫害;天空赤裸裸的真实,没有雾霾……
当然,“人”也赤裸裸的真实,从内到外。
在学习独立行走、打磨石器的过程中,“人”们的大脑日益发达,交流的方式,已经不再满足于用手势比活,或是挤眉弄眼地咿咿呀呀。语言的产生,随之水到渠成。
语言当然只是一种媒介,它离不开说话的“人”。那会,连土制的扩音设备也没有,所以,即便一个“人”嗓门再大,传播所及也很寥寥。交流,只能面对面口耳相传。
“人”变成了人,变得愈发聪明。拿根绳子打个结,或是在树上划上几道,按照事先达成的默契,就能表达或者解读出相关信息。这样,说话的人就不必一脸呆萌地站在原地傻等,别人只要看到他的“留言”,就能知道他想说啥。思想的传递,就此摆脱了对表达主体的物理束缚,传播也就慢慢突破了眼前的一亩三分地,变得更加广泛。
文字的形成,是“结绳记事”的2.0版。从功用来说,它们都实现了对表达主体的解放,但文字进一步减少了交流成本,不仅不用非得留一根打好结的绳子给对方,而且也不至于造成误会,因为你打这种结,本想表示跟他借钱,但在他们那堆人里面,这个结很有可能是表达爱意。文字更加一目了然,而且约定俗成的范围更广。
当然,文字刻在龟背或是竹简上还是有问题。写一封洋洋洒洒的情书给恋人,光搬运竹简就得累个半死,哪还有风花雪月的闲情逸致。所以,纸张和印刷术,又把传播向前推进了一大步,人类在传播上的局限,获得了物理上的突破。
这种突破一直在演进,最后出现了大众媒体。广播延伸了人的耳朵,电视延伸了人的眼睛,在本质上,它们同结绳记事延伸了人的身体是一样的,但更高端,更时尚,更让当时的人不明觉厉。
人类获得的自我解放,传播的发展功不可没。它让原本只能了解“目之所及”世界的人们,能够“听”到更多,“看”到更远,让远在天边的人,真的仿佛近在眼前。不同大陆的人因此有了探索其他大陆的欲望,由此也形成和推动了世界性的交往。
我们超越了“目之所及”,但是从此,那个赤裸裸真实的世界,模糊了,远去了,直至扭曲了。
二
早在20世纪20年代,美国著名政论家李普曼就在其所著的《公众舆论》一书中,首次使用“Pseudo-environment”一词,论及“拟态环境”问题。简单说,就是我们“了解”的世界,并不是真实世界的高保真还原,而是大众媒体为我们描摹出的“世界”。
举个例子说吧。假设你生活的城市,一天中总计发生了100件事。囿于容量有限,媒体需要根据自己的判断和价值观,对这100件事做出取舍,挑出10件来说给你听。再假设,这100件事中,60件是司空见惯的家长里短,30件是“美好人间”类的故事,让人觉得生活还不错,还有10件则是凶杀、盗窃、灾难等等,听着就让人揪心的事情。
媒体会怎么抉择?按照一般原则,那60件稀松平常的事情,媒体是不感兴趣的,先筛掉。在剩下来的40件事情中,媒体可能会优先选择最后10件中的一部分。为什么?其实很正常,尽管西方新闻观和马克思主义新闻观有许多质的不同,但是,“反常性”是被业界公认的新闻价值标准的。除此之外,媒体也会在那30件中挑选一些,因为人们也会喜欢“童话故事”。
那么好了,假设媒体尽最大诚意保持专业精神,挑选了30件令人高兴的事情当中的5件,以及10件令人悲伤的事情当中的5件,好事和坏事的比例是5:5(事实上,许多媒体是不会遵从这个比例的,它们对“坏事”的报道兴趣远胜过“好事”)。
看上去,还是挺平衡的吧?那么,你会因此对你生活的这个城市形成什么印象呢?
简单化地推断,你可能会认为这个城市喜忧参半,但是鉴于人们对于危险更为重视,印象更加深刻,所以你实际上会认为这个城市实在太糟糕了,竟然这么乱。
现在应该清楚了,你对这个城市,并不是按6:3:1的比例形成总体印象,尽管那才是城市的本来面目。
前几天,《人民日报》的小伙伴写了一篇介绍香港的文章,就是这种情况。
这还仅仅是一个城市,我们对自己的生活的城市至少还有不少直观的认知。推而广之,如果是别的城市、别的国家、别的大陆,这样的认知偏差还会更大。
其实历史也是一样。历史是一个无法确认起点的隧洞。我们发现了的各种文物、史料,如同一根根蜡烛,照亮了它周边的区域,但并不能让整个隧洞都灯火通明。我们把一点点烛光串起,勉强把烛光照射到的地方,连缀成历史。那些没有烛照的地方,就成了历史的黑洞。
所以我们了解的历史,同真实的历史也是不一样的。
回到现实。客观地说,“拟态环境”跟媒体有关,但不能怪媒体。
媒体每天向我们输送各种信息,让我们可以突破信息采集器官的局限,了解遥不可及的外部世界是个什么样子。在不可能做到事事都眼见为实的情况下,我们就必须在了解更多外部世界同把握世界真实之间做出选择。
前者显然占据上风,而媒体就承担了这个重任。
但是,对真实世界的探求,不仅是必须的,也是必要的。做到这一点,一来需要媒体“良心”,能够公正、客观、真实的反映现实,不仅是单个事实的真实,还要能通过这些单个事实,反映世界的整体和本质;二来需要人们自己的“理性”,能够在纷繁复杂的信息海洋中,作出合规律性的判断,不被各种暗藏陷阱的信息蒙蔽。
当然,这两个方面,能够做到任何一个都很难。
三
现在,更难的事情来了。
社交媒体的出现,不仅让媒体的“良心”常常无计可施,也让人们的“理性”面临更大的风险。
虽然也被称为“媒体”,但是社交媒体(social media)和传统意义上的大众媒体还是存在显著不同。过去,大众媒体有一个引以为傲的能力,就是议题设置。我不能左右这个世界发生什么,但我能左右你关注什么。这种能力,某种意义上说,正是人们对外部世界的理解产生偏差的“罪魁祸首”。
社交媒体则让用户享有了更多的选择权利和编辑能力,人们自发集结成某种社群,点击关注,加为好友,成为粉丝。每个人似乎都拥有了更大的自主能力,拥有设置议题的权力,但是很多时候,议题本身并不够专业,也没有传统媒体那样的把关人,导致各种信息芜杂,不知所云,又不知所踪。
最要命的是,因为本来就是按照“人以群分”的规则聚集到一起的,因此,在同一个议题中,越是持相同观点的人,越是抱得紧密,同时也越是排斥不同的意见。没有社交媒体的时候,即便是观点相同的人,也不过是散落各处的路人甲乙丙丁。有了社交媒体,这些原本呈原子状自在的个体,一下子汇聚一起,形成一股势力。在观点的传播中,呈现出“马太效应”,信某个观点的,更加坚信;不信的,反对的更加彻底。
这让理性、客观、清醒,面临更大的实现难度,真实世界看上去越来越像近在咫尺,实际上已经渐行渐远。
还有比这更糟糕的。
社交媒体毕竟还是你主动找上门去,算法时代的信息推送,则让人被动地陷入自我投射的虚幻世界。
比如,我是周星驰多年的死忠粉,甚至连当年的毕业论文也要向他致敬。有一阵我发现,这个世界上居然有那么多跟我一样,把星仔当作星爷供奉的人,因为只要打开XX头条的App,就会有连篇累牍的相关视频,视频下面的评论,一堆人把崇敬之情当作泛滥黄河、连绵江水。类似的是,我的一位酷爱羽毛球运动的同事,也真诚地认为,喜欢这项运动的人,简直数不胜数。
作为一个技术盲的文科生,直到有一天被大神点拨才幡然醒悟,原来我是中了“算法”的道。算法时代,传统的新闻把关人被一套由程序员编写的算法替代。这套算法的原则、目标和手段都只有四个字——投其所好。它会根据你表现出来的蛛丝马迹,推断“你可能喜欢”的东西,然后使劲给你推送,形成一个“信息茧房”。你沉溺其中,很享受,很惬意,然后就很容易以为这就是真实的世界。实际上,你已经把观点相异的言论,以及你不太感兴趣但又客观存在的其他事物,挡在视线之外。
由德国语言协会评出的德国2016年度热词为“后真相”(postfaktisch),这同牛津词典公布的“2016年度英文词汇”——“后真相”(Post-truth)——不谋而合,根据德国语言协会的解释,“后真相”指的是,客观事实对公众观点的影响要小于人们本身的主观感受和个人信念。换句话说,比起基于新闻事实引发的个人思考,人们更愿意从主观臆断去“重塑”甚至“扭曲”新闻事实。
算法,为你呈现了一个内心偏爱但却虚幻的世界,它为“后真相”大行其道,又添了一把柴。
四
如果仅仅如此,还不是最可怕的。如果你了解到下面这则新闻,可能你会更加心惊胆战。
近日英国媒体披露,美国富豪罗伯特•默瑟尔利用大数据分析,帮助特朗普赢得大选,并在英国脱欧中发挥“关键作用”。如果属实,这就意味着,2016年,两只世界级的“黑天鹅”,其实是人工“饲养”的。
英国《观察家报》的报道称,在美国总统大选和英国脱欧公投中,默瑟尔旗下的“剑桥分析”(Cambridge Analytica)公司,利用先进科技,在脸谱等社交网络上搜集摇摆选民的信息,并利用人工智能对其进行分析,寻求能够影响这些人的“情感因素”。他们将这些信息提供给自己支持的阵营,后者根据这些信息,向选民发送“定制”广告,以影响他们的选票去向。
报道称,特朗普的竞选团队曾向该公司支付600多万美元。英国《每日邮报》称,“剑桥分析”公司首席执行官亚历山大•尼克斯早前毫不讳言地表示:“很高兴,我们革命性的数据沟通方式,在特朗普的胜利中发挥了不可或缺的作用。”
此外,“剑桥分析”也为英国脱欧组织“脱离欧盟”(Leave.EU)提供摇摆选民信息,后者据此建立了一个包含一百万人信息的数据库。“脱离欧盟”的公关负责人威格莫尔对《观察家报》表示,“剑桥分析”的信息收集技术及收集信息的程度“令人毛骨悚然”。
可怕吗?如果仅仅是我们自己变得闭塞、狭隘些,可能也只能怪我们自己。然而现在,大数据正在分析并且利用我们的闭塞和狭隘,为我们量身定制一个所谓的“外部世界”,让我们服服帖帖地跟着别人的指挥棒走,却还以为是自己做出的明智选择。
五
是不是只能劝自己好自为之了呢?
好像还真的没有什么管用的办法,毕竟人类进化到今天,那么不容易。
只是,这多少又勾起我对洪荒年代的遐想,想念那种赤裸裸真实的世界。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02