
大数据时代下用户隐私安全挑战何时休
大数据正在改变个人隐私,而且并不是以人人平等的方式进行。我们越来越依赖技术,而技术又反过来需要我们的个人信息才能发挥作用。这种互惠关系使得人们难以明智地决定,应该对哪些信息进行保密。
大数据时代下用户隐私安全挑战何时休?
1、面对提供相同互联网服务的两家供应商,一家在隐私保护上做得较好,但价格高,而另一家则习惯于侵犯个人隐私,但价格低,那么大多数消费者还是会选择后者。这项研究还发现,如果两家公司以同样的价格提供一款产品,更注重保护隐私的那家公司将胜出。
2、大数据带来了一大挑战,即价值可能并不明确,数据收集者的动机(更不用说其身份)可能被隐藏,个人的预期可能混乱不清。
3、大数据经济的发展不仅应该促进隐私保护,还应该促进对社会凝聚力和广泛平等至关重要的礼仪规则。
或许更为重要的是,不同的人有不同的隐私考虑,具体则取决于一个人的社会经济地位。社会和政策制定者,尤其是后者,必须认识到个人在保护自身数据方面所承受的不同负担。
1.隐私的价值
关于隐私的种种标准,在定义社会和个人生活方面都发挥着重要作用,无论是对穷人还是富人而言都是如此。耶鲁法学院院长罗伯特·波斯特(RobertPost)在其关于隐私法社会基础的论文中写到,隐私支撑着社会的礼仪规则,而礼仪规则创造了“某种只存在于群体规范怀抱中的人类尊严和自主”。他提醒说,如果社会和公共关系被个人与大型监视机构的互动所取代,那么这些好处就会受到威胁。
如今,隐私已经变成一种可以买卖的大宗商品。虽然很多人把隐私视为宪法权利,甚至是基本人权,但大数据时代已经把隐私贬低成了一堆阿堵物。现在已经有很多人在做着量化隐私价值的事情,这既是危险的,也是愚蠢的。像Privacyfix这样的浏览器插件就试图让用户知道自己能为企业提供多大的价值,而一项研究显示,免费的互联网服务向用户提供了2,600美元的价值,以换取他们的数据。有意思的是,这个数字与美国著名法官亚历克斯·科津斯基(AlexKozinski)的一个说法相差无几。他说,他愿意每年花费2,400美元保护其家人的在线隐私。还有一个叫费德里科·扎内尔(FedericoZannier)的小伙子,是个程序员,他在Kickstarter网站上发起了一个有趣的众筹项目,决定挖掘自己的隐私数据,然后看看能值多少钱。扎内尔记录了他所有的在线活动,包括鼠标指针的位置、网络监控探头的图像资料和每天2美元的GPS定位数据,最后得出的结果是2,700多美元。
“隐私货币化”已经变成了当今数据经济的法宝。我们看到了付费社交网络的出现,还有那些以保护用户在线隐私为招牌的服务提供商大行其道,但这些服务都不便宜。在隐私保护方面,价格敏感性常常决定了个人的隐私选择。由于保护一条信息的“价格”远远高于出售那条信息的价格,因此人们在保护自己的隐私方面可能会感到左右为难。显然,隐私具有经济价值,花钱保护隐私的人比愿意出售隐私换取产品或服务的人更少。
欧洲网络与信息安全局(EuropeanNetworkandInformationSecurityAgency)最近进行的一项研究显示,面对提供相同互联网服务的两家供应商,一家在隐私保护上做得较好,但价格高,而另一家则习惯于侵犯个人隐私,但价格低,那么大多数消费者还是会选择后者。这项研究还发现,如果两家公司以同样的价格提供一款产品,更注重保护隐私的那家公司将胜出。有些人把这作为重视隐私保护的商业模式可以成功的证据,但这也预示着,在一切条件相同的情况下,企业可以选择不像竞争对手那样收集那么多的信息,只是为了让自己能贴上“重视保护隐私”的标签。而这将抹杀掉大数据经济本来可以带来的很多好处。
2.大数据挑战
大数据的基石在于收集尽可能多的原始信息,即使我们不知道能够从那些信息中得出怎样的见解。因此,由来已久的公平信息实践原则(FairInformationPractices),比如收集限制和目的限制,越来越被视为时代错误,很多机构和企业协会都呼吁隐私保护应该更多地聚焦于如何使用数据,而不是限制哪些数据可以被收集。争论的话题已经从结构性限制转向了机构和企业能够如何通过透明度来赢得用户的“信任”。另一种看法是建立一种商业模式,更直接地与个人分享数据的好处。在线数据仓库就是一个潜在的例子,哈佛大学伯克曼中心(HarvardBerkmanCenter)的“ProjectVRM”项目则提出要重新思考该如何为用户赋权,让他们能够利用自己的数据并控制其数据的访问权限。这种对个人隐私的认识变化或许不可避免,也可能大有裨益,但我们必须弄清楚这将给普通人带来什么影响。
《哈佛商业评论》最近的一篇文章认为,人们只应该“在价值明确的情况下出售(他们的)隐私”。作者解释道:“这个问题需要你做些功课。你必须弄清楚对方和你交易的动机,以及对方能从中得到什么。这些必须符合你的期望,使你不至于在放弃自己的隐私后感到不安。”更好地匹配数据持有者与其客户的利益是有可能的,这能使数据的处理与变现同时服务于企业和个人。然而,大数据带来了一大挑战,即价值可能并不明确,数据收集者的动机(更不用说其身份)可能被隐藏,个人的预期可能混乱不清。而且,就连最基本的名誉管理和数据隐私工具也要求用户付出时间或金钱,这可能让普通消费者和贫困人群难以承受。
3.大数据和阶级
越来越多的数据收集与分析,有可能加剧阶级分化。数据收集与分析将会提高市场效率,而市场效率有利于富裕的有产阶层。虽然数据经济的好处将会惠及整个社会,但有钱又有高学历的人更有可能成为那种能够利用大数据的成熟消费者。他们拥有良好的信用和理想的消费者形象,能够确保对他们隐私的任何侵犯都会对他们有利。因此,他们想要隐藏的信息要少得多,也没理由担心数据收集者的动机。要是有钱人希望保护自己的隐私,他们也处于最有利的位置,能够利用那些迎合其需求的隐私保护工具和隐私管理服务。从实际情况来看,有钱人可以更加从容地接受每月支付一笔隐私保护费。科津斯基法官或许愿意且有能力每月支付200美元来保护自己的隐私,但普通消费者可能会觉得这笔买卖不划算。
下层民众从大数据上感受到的负面影响可能是最大的。穷人向来没有什么隐私可言,毕竟城堡和高墙是为富人准备的。然而,即使是当今时代,穷人也是最先失去基本隐私保护的群体。克里斯托弗·斯洛博金(ChristopherSlobogin)教授就指出了美国宪法第四修正案中的“贫穷除外条款”问题,他认为,我们在预想隐私问题时所采用的界定方式,本身就让穷人的隐私和自主权更容易遭受政府的非法侵犯。大数据则加剧了这个问题。我们对大数据的种种最大担忧,诸如歧视、侧写、追踪、排外,大部分都会对穷人的自决权和自主权造成最大的威胁,而非其他的阶层。就算假定穷人能够获知自身隐私的价值,他们也无法拿出钱来保护自己的隐私,或者将其用作获得优惠价格的筹码,哪怕这会将他们置于非常不妙的境地。
大数据的本质就是分门别类。不管是什么人的数据,只有在汇总起来,或好或坏地加以利用时,才会变得有用。数据分析利用大量数据来建立详尽的机制进行分类和组织。归根结底,与其说我们担心个人信息被收集,不如说我们担心个人信息被归入错误或不利于我们的类别。例如,亚特兰大有一位居民,他度完蜜月回来后发现,他的信用卡额度从10,800美元被砍到3,800美元,就因为他在一些可能曾有其他人出现过不良还款记录的地方使用了他的信用卡。
一旦所有人都被分类归入详尽细致的社会经济类别,我们就踏上了通往透明社会的道路。社会礼仪规则被信息效率所取代。虽然这种变化可能会带来很多非常重要的社会和公共好处,但这些好处不会平等地落在所有人头上。纽约大学教授海伦·尼森鲍姆(HelenNissenbaum)解释道:“富有的政府机构和工商企业的需求对信息产品及服务的推动力要远为有力得多,从而导致整个市场环境远远称不上均衡。”大数据或许能实现信息的普及,但总的来说,信息在权势者手中可以发挥更大威力。
因此,分门别类可能会对中产阶级和穷人的隐私造成挤压。越来越多的人没有办法或能力来控制自己的数据被如何使用。鼓励人们思考他们的信息可能会被作何用途,还有如何能够最好地保护自己的隐私,是十分积极的一步,但要为此开展一场公共教育活动,虽然值得称道,却恐怕并不现实。社交网络、手机和信用卡是大数据经济的命脉,也是现代生活的必需品,就算让一般阶层放弃使用这些东西确有实际意义或者颇有裨益,那些工作过度、在经济上缺乏安全感的中产阶级却没有这个时间和精力来优先考虑他们仅存的隐私。
目前,隐私变现的另一个选择是赋予人们利用自己信息赚钱的权利。经营在线隐私管理网站Reputation.com的迈克尔·菲蒂克(MichaelFertik)认为,允许企业将“其终端用户数据的潜在价值”进行变现,籍此“与终端用户联手释放巨大价值”,在将来一定大有可为。Personal等初创公司则试图把自己塑造成量身定制的信息仓库,人们可以把自己的信息交给企业来换取价格折扣。这些都是值得探索的项目,但它们要求企业和个人之间高度信任,二者的利益也高度一致。然而,我们依然不可能建立一对一的数据交易所。费德里科·扎内尔在自己的实验中,将自己的个人数据以每天2美元的价格出售给任何愿意购买的人,但普通人恐怕永远无法真正地靠出售个人数据赚钱。一条个人信息连一分钱都卖不了,而且无名之辈的个人资料并不值钱,除非被收集后与其他来自相近社会经济类别的个人资料汇总在一起加以利用。
结论:
虽然应该鼓励数据保护和隐私创业,但不应该让人们必须付钱才能保护隐私或者获得优惠券作为补偿。如果我们想要我们的经济和法律框架从数据收集转向数据使用,就必须开始讨论我们希望摈弃哪些数据使用方式。一些实际发生的价格歧视或者不利雇佣决定就是很好的切入点,但我们还应该关注数据使用将如何影响不同的社会阶层。大数据经济的发展不仅应该促进隐私保护,还应该促进对社会凝聚力和广泛平等至关重要的礼仪规则。
如果不把普通人面临的现实挑战纳入考量,大数据反而会不利于社会平等的促进。届时我们将以各种各样的方式被分门别类,只有价值最高的那些类别才会获得数据所能提供的最大裨益。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26