京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“数据引导你的行为”:大数据背后的权力与不公
国内有网友发现,同样的商品或服务,老客户看到的价格反而比新客户要贵出许多,在机票、酒店、电影、电商、出行等多个价格有波动的平台都存在类似情况。这在互联网行业被称作“大数据杀熟”。另外,李彦宏在中国高层发展论坛上就个人信息利用问题发表的观点——“我想中国人可以更加开放,对隐私问题没有那么敏感。如果他们愿意用隐私交换便捷性,很多情况下他们是愿意的,那我们就可以用数据做一些事情。”此言一出,李彦宏成为众矢之的。
国外,Facebook也遭遇了数据泄露丑闻。根据一名剑桥分析公司员工的爆料,该公司在用户不知情的情况下,秘密分析了大约5000万脸书用户的个人资料,以此制定个人化的政治宣传,预测并影响选民投票,帮助美国总统特朗普赢得2016年的大选。
Facebook很快遭到了市场的惩罚,股价蹭蹭往下掉,市值蒸发500多亿美元。这一丑闻愈演愈烈,国外发起了#delete Facebook(删除Facebook)运动,埃隆·马斯克站出来当起了表率,注销了自己两家公司SpaceX和Tesla在Facebook的官方主页,越来越多的网友参与其中。并且,因为影响选举,数据泄露还上升为政治事件,引起了英美等国政要的“强烈不安”。
很长一段时间以来,我们享受到了大数据时代带来的种种便利,而忽视个人信息被攫取和利用的巨大风险。我们本以为逃匿在网络空间是为了“隐身”,可在互联网企业眼里,我们其实是在“裸奔”。人们关于个人信息安全的保护意识,开始苏醒。
数据引导你的作为
此次涉及非法收集用户信息的数据公司“剑桥分析”由共和党大金主、对冲基金亿万富豪罗伯特·默瑟投资,美国总统特朗普前首席战略顾问班农担任董事,与特朗普有着千丝万缕关系。
在纽约的一次公开演讲中,剑桥分析的CEO 亚历山大·尼克斯曾分享过这个公司的运作“秘密”:他们会对成千上万名调查者进行心理分析,并将他们分为32种不同的人格,然后融入选民的Facebook足迹、消费足迹和投票记录等,最终分析并影响他们的投票行为。也就是说,根据数据对每一个用户画像的捕捉,它就可以比用户的朋友更了解他。
在剑桥分析网站的首页,一行大字醒目而跳脱,Data drives all that we do(数据引导你的作为);而剑桥分析政治服务部门的广告语是:“我们定位你的选民,打动他们让他们采取行动。”在官网上,剑桥分析列出了自己的光荣业绩:“为五大洲超过100场竞选提供支持;仅在美国,我们就为赢得总统选举、国会选举和各州选举发挥了关键作用。”
数据在引导你的作为——表面上看这有些危言耸听,但当你足够多的数据被收集合并归纳之后,数据的确可以做到。
数据是社交媒体的生命线。为了提供准确的定制化、个人化信息服务,让资讯的推送与用户的偏好吻合,都需要对用户进行画像。而画像的基础数据,就是个人的身份信息、浏览习惯等。一旦你在互联网上有任何行为,比如进入某个APP,购买某样东西,阅读某篇文章,其实都在被记录、被分析。你的一切信息都会成为别人的数据库,被用来给你画像。
过去,这一切被统称为大数据,一直以来,舆论对大数据时代多持一种乐观态度。的确,数据潜藏着丰富的价值,比如大数据分析是更好的决策工具,很大程度便利了我们的生活……但对于数据对个体行为的引导,则缺乏足够的重视和警觉。
国际网络安全专家施奈尔(Bruce Schneier)在《隐形帝国》一书里写道:“脸书(facebook)只是根据按赞的动作,就可以推测一个人的种族、个性、性向、政治意识形态、感情状态和药物使用情形……”
谷歌公司研究员François Chollet在泄露事件后发表了一系列推文,警告说Facebook的问题不仅仅是隐私泄露或缺乏信任,而是由AI驱动的Facebook很快就会成为“极权主义的圆形监狱”。他在抨击Facebook的文章中写道:“不透明的社交媒体算法正在越来越多地决定我们阅读哪些文章,我们与谁保持联系,我们阅读谁的观点,获得谁的反馈。经过多年的训练,算法对我们所消费信息的处理使得这些系统在我们的生活中掌握了相当大的权力,决定了我们成为什么样的人。”
凯文·凯利认为,技术狂热是我们的一种自然状态,我们喜爱我们的东西,并且由它们引导。互联网公司先是大量收集你的数据,巨细无遗地捕捉、收集进云端数据库,对你进行数据画像,再根据你的画像不断向你投递个性化的信息流和广告,你习惯了这种信息接收方式,成为被种种信息喂养的你——技术瓦解了“自我的真实”。久而久之,互联网公司推送的信息就能够影响你的决策,“数据引导你的作为”成为一种现实。
无处不在的信息泄露
剑桥分析是如何攫取个人信息的?
2013年,当时在剑桥大学工作的研究者科根做了个性格测试软件,除了受访者本人之外,该应用还能收集受访者Facebook好友的数据资料。一共有约32万名美国选民参与了此次测试,但加上每人的Facebook好友,科根一共收集到了超过5000万Facebook用户的数据。后来,这些收集时号称被用作学术研究的信息,被转手给了剑桥分析。
Facebook的核心问题在于,它轻易地将用户数据分享给第三方。科根此前被允许收集Facebook用户信息,但仅限于学术目的,但它顺走了其他4000多万用户的信息,未得到用户许可,且在未经允许下将个人数据卖给另外的第三方,这才是最令人愤怒之处。
但环球同此凉热,未经允许被窃取信息并被利用的现象,在国内也非常普遍。支付宝在“年度账单”的首页让不少用户默认勾选了“我同意《芝麻服务协议》”以套取用户数据,他们的信息将“被同意”分享给第三方。腾讯方面,不少人质疑微信偷看用户聊天记录。今日头条被质疑利用手机麦克风获取用户数据隐私。“手机百度”、“百度浏览器”两款手机APP涉嫌在消费者安装前,在未告知用户、未取得用户同意的情况下,获取“监听电话、定位、读取短彩信、读取联系人、修改系统设置”等各种权限……
不少评论者建议,互联网企业应当自觉与用户建立隐私保护的契约,以文字证据提供权益保障。然而认真阅读超长的隐私政策的人寥寥可数,即便认真读了,用户也未必能发现其中暗藏的玄机;即便发现了其中的玄机,用户也没有什么说“不”的底气和权力。目前很多情况下,各种APP对个人信息的获取和使用有不对等的霸权,个人如果不通过授权,很多最重要的功能就无法使用。
就比如很多人已经习惯了使用支付宝和微信,习惯了“无现金”的生活状态;很多人也习惯了将微博和微信作为获取信息和人际交流的工具;很多人习惯了在淘宝、京东网购……但这些APP得以使用的前提,无一例外是你在注册之后必须同意它们设定的种种条款,即便这些其中有不少不平等、不合理,可能造成个人信息被泄露和滥用的条目,一旦你点击“不同意”,就意味着你无法使用这些工具。基于社交需要和生活便利需要,你很难对这些APP说“不”,不得不“让渡”出个人信息——即便你明明知道它正处在风险之中。
总之,那些让人们感到便捷舒适的服务,多半都以公众出让隐私为前提的。
避免“数据极权”
中国互联网企业的发展走在世界前列,其中一个很大的原因就是,我们对个人信息的保护持比较开放态度或者说保护力度较弱,互联网企业获取个人信息的成本很低。这可能是弯道超车必须承担的风险成本。但有风险,更凸显对风险管控的重要性,而非放任风险的存在,并最终像Facebook这样,被指“操控大众心理”,直接威胁美国的民主根基。
应该看到,数据并非是数据那么简单,数据还是一种权力。英国哲学家杰里米·边沁提出的全景监狱设想,在福柯这里衍生出了一种全新的权力运作方式。福柯曾说:“完美的规训机构应能使一切都一目了然。中心点应该既是照亮一切的光源,又是一切需要被了解的事情的汇聚点,应该是一只洞察一切的眼睛,又是一个所有的目光都转向这里的中心……这里发号施令,记录各种活动,察觉和裁决一切过错。而做到这一切仅仅需要一种精密的几何学的直接帮助。”而今,我们在网络上的行为受到了互联网公司全天候的监视,“全景敞视”成为一种现实。任何人在互联网上的踪迹和信息,都被数据公司所观看,并且这种观看无时不刻在进行。一方面你的确具备了使用互联网的权利,但另一方面你也赋予互联网公司掌控你的信息的权力,你的隐私权、自主权等轻易被剥夺。
罗素在《权力论》中指出:“我相信,机械权力必然产生一种新思想,这使得控制政府比以往任何时代都更为重要。由于技术的发展,民主或许会变得更为困难,但它也会变得更为重要。那拥有巨大的机械指挥权的人,如果得不到控制,也许会觉得自己是神——不是基督徒的爱神,而是异教的雷神会火神。”也即,数据权力不仅造成个人信息被滥用成为常态,并且,数据权力还可能变成一种“数据极权”,通过监视数据,进而监视思想、控制思想,轻而易举地“形塑人们对政治角色的体认、挑战既有的政治认同、解构大众的政治心理”。
因此,解决问题的关键在于,应该将互联网公司的数据权力关在笼子里,避免数据被滥用。一方面要打破全景敞视,赋予用户知情权。不仅应让用户知晓,哪些数据被监测,哪些数据被利用,被利用在什么地方;还应让用户知晓具体的分析算法是什么,以及该算法如何具体使用其数据。并且,应赋予用户信息使用事先的同意权,以及事后的撤回权、删除权。
除此之外,还应迅速构建起对搜集个人信息的行为的限制与监管体系。应该从法律的高度上保护数据隐私,打破互联网公司与用户之间不对等的权力关系,对涉及数据的采集及其目的使用进行必要的限制,同样需要对数据的使用过程有清晰、明确的边界和能够被严格理解的基本要求。
我们已经进入了一个大数据时代,它具有不可逆转的趋势,并让我们的社会生活实现了里程碑式的跨越;但也应该看到,人们在享受大数据提供的种种便利的同时,某些失控的行为正在发生。我们对此应有足够的重视和警惕——毕竟一旦科技用以作恶,后果比什么都可怕。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04