
警惕大数据成了互联网的“PX项目”
2018年新年伊始,BAT接连遇到了数据隐私问题带来的困扰。蚂蚁金服遭遇“支付宝个人账单隐私保护事件”,吉利控股的李书福曾发表了“微信天天盯着我们的聊天记录看”的言论让腾讯面临了一场不大不小的公关危机,江苏省消保委则是因数据隐私问题对百度提起消费民事公益诉讼,百度只能在法庭上自证清白。
BAT三个巨头不约而同在新年第一周遭遇类似的问题,着实让人感慨,中国互联网基础设施没那么好当。
大数据也成了互联网的“PX项目”——有点年纪的人可能都知道“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,导致相关项目在国内迟迟无法推进。
BAT三家都成了冤大头
事实上,BAT三家在公众对数据隐私的敏感性面前,都成了冤大头。
1月2日,用户查看支付宝年账单,因为某些项目会涉及芝麻信用的数据,需要事先同意《芝麻服务协议》。
但同意按钮非常小,网络上讨伐支付宝的声音愈演愈烈。后来芝麻信用出来道歉称,此做法初衷没错,但用了非常傻逼的方式,愚蠢至极,并已经调整了页面,取消默认勾选。
1月4日,吉利控股李书福在正和岛新年论坛上说, “微信天天盯着我们的聊天记录看”。
1、微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上;
2、微信不会将用户的任何聊天内容用于大数据分析;
3、因微信不存储、不分析用户聊天内容的技术模式,传言中所说“我们天天在看你的微信”纯属误解。
2018年1月5日,江苏省消费者权益保护委员会则是发布消息称,江苏省消保委于2017年12月11日对北京百度网讯科技有限公司涉嫌违法获取消费者个人信息及相关问题提起消费民事公益诉讼。2018年1月2日,南京市中级人民法院正式立案。
对此,百度详细地回应了这场诉讼中江苏省消保委对百度产品功能权限获取的误读,并通过亲自演示应用安装过程来进行自证清白——在安卓机上安装“手机百度”APP时每一步操作都会出现授权弹窗提醒,用户可自行决定是否接受百度获取其定位和存储等权限,百度APP没有出现越权行为。
完成“监听”要费九牛二虎之力,尤其是当前6.0以上版本的安卓操作系统对安卓手机权限的申请更加严格,手机权限申请由手机系统决定,手机APP根本没有机会进行越权操作。在手机旁边说话就能实现监听的情况,在技术上根本没办法实现。
坦率说,“被同意《芝麻服务协议》”这件事情中,蚂蚁金服有自己的小心思,某些做法确实比较鸡贼,在道德上确实诟病很多,但程序上总体是合法的。至于腾讯和百度两家,则是因为公众对技术缺乏了解,以至于造成了误会。
公众认知的几个误区
不管怎样,这一轮涉及BAT三家的数据隐私舆论危机都证明了一个问题:
公众对大数据隐私的认知非常迫切,对大数据环境下个人隐私的保护也非常重视。
但是,这种认知有时候存在误区。最简单的说,上次某媒体微博发布了极光大数据里有关王者荣耀用户画像的一则消息。
下面有一则评论和回复非常具有代表性:
评论说——我只是想问,腾讯哪里来的这么详细的数据,实名认证认证的不仅仅是年龄吗?难道知道身份证号之后就要把别人的隐私调查个底朝天,然后做成数据在洋洋得意的公布出来?
下面有个懂大数据的朋友则是回复这位网友说——这是粗颗粒的数据,早就脱敏过了。只有群像,没有单一的个体数据。评论之前最好去读一读数据相关的文章和资料。
大数据的采集、挖掘、提炼与分析本身是个技术壁垒很深,而且逻辑非常复杂的产业,大数据产业对公众认知设立了高高的技术门槛,以至于经常会产生误解。
简单来说,对大数据的认知必须把握这几个基本准则。
1、对于所有互联网公司来说,都必须遵守所在国的法律规定。滥用数据必然会遭遇法律制裁,对BAT这样的企业来说,法律永远是制约数据使用的绳索,触犯法律拿用户隐私进行商业分析,随时都会面临法律监管。
2、大数据的使用时要进行脱敏的,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。没有任何一家互联网企业敢直接拿着用户数据就拿来使用。
3、大数据环境下的数据匿名技术也是大数据环境下的普遍使用的数据处理技术。个人其实在大数据面前早已经被分解成了一个个标签的颗粒,单人的整体数据不可能会被提取。
4、大数据使用早已经进入了不触及用户隐私的阶段。基于数据失真的技术通过添加噪音等方法,使敏感数据失真但同时保持某些数据或数据属性不变,仍然可以保持某些统计方面的性质。阻塞与凝聚、差分隐私保护等技术能够让用户在可以保证隐私的同时,使得大数据同时可以使用。
人们对大数据滥用的担忧的确有必要性,这对巨头来说,是一种必要的制约,但是过渡担忧的话,则是有些杞人忧天。
大企业还需普及常识
这次接二连三的事件,其实给了笔者很深的触动。
因为很多在技术领域可能算是常识的问题,在公众面前,由于对技术缺乏了解,形成了“大数据隐私恐慌”。结果很多时候公众会不分青红皂白,通过愤怒的方式去保护自己的权益。
这种心态值得理解,但是也需要企业去做引导,普及更多有关大数据隐私的常识。
可惜的是,现在很多公司忌疾畏医,看到公众的恐慌反而更畏首畏尾,在有关大数据使用这个问题上,三缄其口躲躲闪闪。
此前和某家BAT级别云计算业务负责人沟通时,提到说大数据采集、利用的问题,这家负责人摆手不谈,称容易会引发舆论危机。私下交流才发现,这位负责人认为大数据隐私的问题太过敏感,公众对技术并不了解,容易造成误解,多说无益。
但这种鸵鸟策略实际上并无太多好处,反而容易加深误解。
就像是当年盛极一时的“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,认为对人体健康会造成恶劣影响。当地政府又躲躲闪闪不敢回应,造成了双方误解不断加深。最后PX项目在全国范围内遭到抵制,每去一个地方都会造成当地恐慌,随之而来的则是群体性事件要求PX项下马。
后来随着产业技术人员、专家不断普及PX项目的信息,公众对其环保忧虑才逐渐淡化。
大数据利用就像是互联网公司的PX项目,这次有关数据隐私的问题在开年就找上门来,也说明冰冻三尺非一日之寒。不过不管是百度这次法庭自证清白,还是腾讯对李书福公开回应都对传播大数据相关知识起到了重要作用。某种意义上来看,这对公众跟深刻了解大数据隐私保护,会起到正向作用。
大数据几乎是潮流。事实上,在未来,大企业还需要更多向公众普及常识,消除公众对大数据使用的恐慌。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18SPSS 赋值后数据不显示?原因排查与解决指南 在 SPSS( Statistical Package for the Social Sciences)数据分析过程中,变量 ...
2025-07-18在 DBeaver 中利用 MySQL 实现表数据同步操作指南 在数据库管理工作中,将一张表的数据同步到另一张表是常见需求,这有助于 ...
2025-07-18数据分析师的技能图谱:从数据到价值的桥梁 在数据驱动决策的时代,数据分析师如同 “数据翻译官”,将冰冷的数字转化为清晰的 ...
2025-07-17Pandas 写入指定行数据:数据精细化管理的核心技能 在数据处理的日常工作中,我们常常需要面对这样的场景:在庞大的数据集里精 ...
2025-07-17解码 CDA:数据时代的通行证 在数字化浪潮席卷全球的今天,当企业决策者盯着屏幕上跳动的数据曲线寻找增长密码,当科研人员在 ...
2025-07-17CDA 精益业务数据分析:数据驱动业务增长的实战方法论 在企业数字化转型的浪潮中,“数据分析” 已从 “加分项” 成为 “必修课 ...
2025-07-16MySQL 中 ADD KEY 与 ADD INDEX 详解:用法、差异与优化实践 在 MySQL 数据库表结构设计中,索引是提升查询性能的核心手段。无论 ...
2025-07-16解析 MySQL Update 语句中 “query end” 状态:含义、成因与优化指南 在 MySQL 数据库的日常运维与开发中,开发者和 DBA 常会 ...
2025-07-16如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-15CDA 精益业务数据分析:驱动企业高效决策的核心引擎 在数字经济时代,企业面临着前所未有的数据洪流,如何从海量数据中提取有 ...
2025-07-15MySQL 无外键关联表的 JOIN 实战:数据整合的灵活之道 在 MySQL 数据库的日常操作中,我们经常会遇到需要整合多张表数据的场景 ...
2025-07-15