京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代更加注重个人隐私_数据分析师
近日,谷歌因侵犯数据隐私在法国被罚,理由是未整改其跟踪并储存用户信息的违法行为。此事要回溯到2012年3月,谷歌启用新的数据收集方案,修改了隐私政策,通过YouTube、Gmail等服务收集数据并整合在一起。虽然谷歌称此举可以为用户提供更加便捷、高效的服务,但法国国家信息自由委员会(CNIL)认为谷歌对用户信息的处理不够透明,用户既不知道这些数据会被怎样处理,也不知道谷歌处理其个人数据信息的目的,而且用户别无选择。
最终,谷歌被CNIL处罚15万欧元,虽然跟谷歌的收入相比简直微不足道,但此判罚将引发世界各地对个人隐私保护的连锁反应。据悉,谷歌新的隐私政策在西班牙、英国、德国、意大利以及荷兰都遭到了相似的指控。
上述案例是目前吵得沸沸扬扬的大数据与个人隐私之争的典型代表。未来随着大数据应用的进一步广泛,个人隐私保护将面临更为严峻的挑战。
福尔摩斯可以从微小的细节中发现案件的相关蛛丝马迹,勾勒出嫌疑人的形象。同样,大数据通过对海量数据的分析,也可以将一个人具象化。
互联网的个人隐私问题由来已久
自己的秘密不愿让他人知道,是自己的权利,这个权利就叫隐私权。在互联网时代,个人隐私问题主要是指对个人隐私权的侵犯。比如个人照片,当事人主动在网上分享与当事人不情愿却被他人放到网上分享是截然不同的两种情形,后者显然侵犯了个人隐私。人们的个人身份信息,以及人们在互联网上的各种行为,在没有任何提示的情况下被网站存储、利用,甚至泄露,这就是目前互联网在个人隐私方面涉及的主要问题。
互联网上个人隐私问题由来已久,因为个人隐私信息具有很高的利用价值。去年的央视315让人们了解到Cookie这一古老的收集个人上网行为的工具,在人们接触互联网的过程中,网民的性别、年龄、职业、兴趣等等都会成为有价值的数据,互联网广告可以通过这些数据实现精准的推送。在社交网络兴起之后,网民之间的社交关系同样极具价值:当你的某个朋友将要过生日时,生日礼物的广告已经铺天盖地提前占满所有屏幕。同样,LBS兴起之后,网民的地理位置信息同样可被利用,人们到达任意位置,附件商家的信息可以即时呈现。即使不用LBS,移动通信基站同样可以实现定位
大数据让互联网隐私问题更加突出
既然个人隐私问题是互联网Web2.0生来携带的胎毒,那为何还要与大数据应用起争执呢?我们知道,大数据分析是大数据应用的撒手锏,Gartner将大数据描述为具有更强的决策力、洞察发现力。大数据可以对海量的信息进行分析并发现其中的价值,这种能力让其成为了互联网应用中的夏洛克福尔摩斯。大数据应用中,前面所述的所有类型的个人信息都可以关联利用,使得这个人更加具象。所以说,大数据应用下互联网隐私问题显得更加突出。
不过,大数据与个人隐私之间的关系并非处处剑拔弩张。在讨论这个问题之前,可以先看这么几则案例:
送到机场的晚餐
当一位顾客开玩笑地通过推特向位于芝加哥的牛排连锁店Morton牛排店订餐,并要求送到纽约Newark机场(他将在一天工作之后抵达该处)时,Morton开始了自己的社交秀。首先,分析推特数据,发现该顾客是本店的常客,也是推特的常用者。根据客户以往的订单,推测出其所乘的航班,然后派出一位身着燕尾服的侍者为客户提供晚餐。
摸清赌客的脾气
现实中的赌客个个深藏不露,但在互联网上就没那么神了。Tipp24 AG针对欧洲博彩业构建的下注和预测平台,利用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。
定制化求婚
这不能算作一个案例。在百度有一个奇思妙想实验室,在足够规模的用户数据和技术积累下,输入一句简单的怎么向女友求婚,通过跨领域推荐引擎技术,便能找到一套为你量身打造的方案。甚至连道具、路线、天气,乃至如何讨得她家小狗欢心的方法都考虑得一应俱全。
大数据炒股
经典的大数据应用。华尔街有炒家利用电脑程序分析全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分。同时根据打分的结果,来处理手中数以百万美元的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析帮助该炒手今年第一季度获得了7%的收益率。
上述的四则案例中,前面三个均是针对个人的定制化服务,在利用大数据的过程中,必然会涉及大量的个人隐私信息,其中有哪些是用户授权的,哪些是未经授权的,这些分析系统未必能分得清楚,因此带来一系列的侵犯隐私的问题;对于第四种行为,对群体信息进行分析,笔者认为其实际上已经做到了脱敏,并不涉及隐私问题。
相比Cookie、社交、LBS的单一功能,大数据综合利用到更多的隐私信息,当然也带来更加定制化的服务。良好的用户体验恰恰又需要高度定制化的服务,因此如何平衡隐私与定制服务的关系成为难题。美国《连线》杂志创始人凯文凯利曾经说过说:如果需要个性化服务,就必须用透明度换取。最大化的个性化意味着最大化的透明化。如果不想透露任何信息,那就不能期待别人把自己当作有个性的个体。
对群体信息的分析实际上已经实现了脱敏
好坏之分:看AK47在谁的手里
每个网民、每个消费者都无法避免个人隐私被互联网记录和利用。虽然DNT(Do Not Track,禁止跟踪)技术可以阻止记录浏览行为,但通过对移动终端的定位,结合网关的上网行为分析依然能识别每一个人。大数据的特点已经讲过了,可以对所有的数据进行关联分析,从这个意义上说,大数据面前人人无所遁形。
大数据只是一个工具,好与坏要看人们怎么去用它。就像卡拉什尼科夫发明的AK47"
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 SQL Server 安装、服务启动、数据库文件操作等场景中,经常会遇到 “实例已在使用” 类报错,不同触发场景的原因与处理方式差 ...
2026-06-29在Excel数据统计、财务核算、销售复盘、库存盘点等办公场景中,经常需要在数据透视表中实现一列数据乘以另一列数据的计算需求, ...
2026-06-29在数据分析中,指标是连接业务与数据的核心语言。它并非一个简单的数字,而是一个将模糊的业务需求(如“提升用户粘性”)转化为 ...
2026-06-29【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18