
警惕大数据成了互联网的“PX项目”
2018年新年伊始,BAT接连遇到了数据隐私问题带来的困扰。蚂蚁金服遭遇“支付宝个人账单隐私保护事件”,吉利控股的李书福曾发表了“微信天天盯着我们的聊天记录看”的言论让腾讯面临了一场不大不小的公关危机,江苏省消保委则是因数据隐私问题对百度提起消费民事公益诉讼,百度只能在法庭上自证清白。
BAT三个巨头不约而同在新年第一周遭遇类似的问题,着实让人感慨,中国互联网基础设施没那么好当。
大数据也成了互联网的“PX项目”——有点年纪的人可能都知道“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,导致相关项目在国内迟迟无法推进。
BAT三家都成了冤大头
事实上,BAT三家在公众对数据隐私的敏感性面前,都成了冤大头。
1月2日,用户查看支付宝年账单,因为某些项目会涉及芝麻信用的数据,需要事先同意《芝麻服务协议》。
但同意按钮非常小,网络上讨伐支付宝的声音愈演愈烈。后来芝麻信用出来道歉称,此做法初衷没错,但用了非常傻逼的方式,愚蠢至极,并已经调整了页面,取消默认勾选。
1月4日,吉利控股李书福在正和岛新年论坛上说, “微信天天盯着我们的聊天记录看”。
1、微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上;
2、微信不会将用户的任何聊天内容用于大数据分析;
3、因微信不存储、不分析用户聊天内容的技术模式,传言中所说“我们天天在看你的微信”纯属误解。
2018年1月5日,江苏省消费者权益保护委员会则是发布消息称,江苏省消保委于2017年12月11日对北京百度网讯科技有限公司涉嫌违法获取消费者个人信息及相关问题提起消费民事公益诉讼。2018年1月2日,南京市中级人民法院正式立案。
对此,百度详细地回应了这场诉讼中江苏省消保委对百度产品功能权限获取的误读,并通过亲自演示应用安装过程来进行自证清白——在安卓机上安装“手机百度”APP时每一步操作都会出现授权弹窗提醒,用户可自行决定是否接受百度获取其定位和存储等权限,百度APP没有出现越权行为。
完成“监听”要费九牛二虎之力,尤其是当前6.0以上版本的安卓操作系统对安卓手机权限的申请更加严格,手机权限申请由手机系统决定,手机APP根本没有机会进行越权操作。在手机旁边说话就能实现监听的情况,在技术上根本没办法实现。
坦率说,“被同意《芝麻服务协议》”这件事情中,蚂蚁金服有自己的小心思,某些做法确实比较鸡贼,在道德上确实诟病很多,但程序上总体是合法的。至于腾讯和百度两家,则是因为公众对技术缺乏了解,以至于造成了误会。
公众认知的几个误区
不管怎样,这一轮涉及BAT三家的数据隐私舆论危机都证明了一个问题:
公众对大数据隐私的认知非常迫切,对大数据环境下个人隐私的保护也非常重视。
但是,这种认知有时候存在误区。最简单的说,上次某媒体微博发布了极光大数据里有关王者荣耀用户画像的一则消息。
下面有一则评论和回复非常具有代表性:
评论说——我只是想问,腾讯哪里来的这么详细的数据,实名认证认证的不仅仅是年龄吗?难道知道身份证号之后就要把别人的隐私调查个底朝天,然后做成数据在洋洋得意的公布出来?
下面有个懂大数据的朋友则是回复这位网友说——这是粗颗粒的数据,早就脱敏过了。只有群像,没有单一的个体数据。评论之前最好去读一读数据相关的文章和资料。
大数据的采集、挖掘、提炼与分析本身是个技术壁垒很深,而且逻辑非常复杂的产业,大数据产业对公众认知设立了高高的技术门槛,以至于经常会产生误解。
简单来说,对大数据的认知必须把握这几个基本准则。
1、对于所有互联网公司来说,都必须遵守所在国的法律规定。滥用数据必然会遭遇法律制裁,对BAT这样的企业来说,法律永远是制约数据使用的绳索,触犯法律拿用户隐私进行商业分析,随时都会面临法律监管。
2、大数据的使用时要进行脱敏的,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。没有任何一家互联网企业敢直接拿着用户数据就拿来使用。
3、大数据环境下的数据匿名技术也是大数据环境下的普遍使用的数据处理技术。个人其实在大数据面前早已经被分解成了一个个标签的颗粒,单人的整体数据不可能会被提取。
4、大数据使用早已经进入了不触及用户隐私的阶段。基于数据失真的技术通过添加噪音等方法,使敏感数据失真但同时保持某些数据或数据属性不变,仍然可以保持某些统计方面的性质。阻塞与凝聚、差分隐私保护等技术能够让用户在可以保证隐私的同时,使得大数据同时可以使用。
人们对大数据滥用的担忧的确有必要性,这对巨头来说,是一种必要的制约,但是过渡担忧的话,则是有些杞人忧天。
大企业还需普及常识
这次接二连三的事件,其实给了笔者很深的触动。
因为很多在技术领域可能算是常识的问题,在公众面前,由于对技术缺乏了解,形成了“大数据隐私恐慌”。结果很多时候公众会不分青红皂白,通过愤怒的方式去保护自己的权益。
这种心态值得理解,但是也需要企业去做引导,普及更多有关大数据隐私的常识。
可惜的是,现在很多公司忌疾畏医,看到公众的恐慌反而更畏首畏尾,在有关大数据使用这个问题上,三缄其口躲躲闪闪。
此前和某家BAT级别云计算业务负责人沟通时,提到说大数据采集、利用的问题,这家负责人摆手不谈,称容易会引发舆论危机。私下交流才发现,这位负责人认为大数据隐私的问题太过敏感,公众对技术并不了解,容易造成误解,多说无益。
但这种鸵鸟策略实际上并无太多好处,反而容易加深误解。
就像是当年盛极一时的“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,认为对人体健康会造成恶劣影响。当地政府又躲躲闪闪不敢回应,造成了双方误解不断加深。最后PX项目在全国范围内遭到抵制,每去一个地方都会造成当地恐慌,随之而来的则是群体性事件要求PX项下马。
后来随着产业技术人员、专家不断普及PX项目的信息,公众对其环保忧虑才逐渐淡化。
大数据利用就像是互联网公司的PX项目,这次有关数据隐私的问题在开年就找上门来,也说明冰冻三尺非一日之寒。不过不管是百度这次法庭自证清白,还是腾讯对李书福公开回应都对传播大数据相关知识起到了重要作用。某种意义上来看,这对公众跟深刻了解大数据隐私保护,会起到正向作用。
大数据几乎是潮流。事实上,在未来,大企业还需要更多向公众普及常识,消除公众对大数据使用的恐慌。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28