
几乎每一刻我们都在为大数据作出“应有的贡献”
这是我们大多数人司空见惯的一天:早上起床后抓起手机看当天天气预报,然后是查询上班路线,再接下来打开汽车导航,上班后通过互联网查询资料,并不时用手机与外面联系,下班后通过手机APP订餐、购买电影或演出票,回家后通过互联网电视收看节目……“不论你喜欢与否,你的生活已经受控于技术”。在《大数据时代的隐私》一书的作者看来,几乎每一刻我们都在为大数据作出“应有的贡献”。当然,就是这样看似再寻常不过的日常生活,我们一天的行踪、偏好(哪怕有时仅仅只是一个闪念),早就暴露无遗,某种意义上,我们越来越像是一个没有私密可言的“透明人”。
技术就是这样一把双刃剑,既会给你带来诸多便利,同时也会在悄无声息中肆意“偷”走你的信息,根本不在乎你的情绪,这正是本书所要阐明的核心所在。书中每一章都展示了人们在家庭和工作中的日常活动如何成为大数据收集的一部分。或因第一作者本人有过白宫首席信息官的特殊经历,对大数据接触较多,对信息技术更为敏感,所以本书能够针对性提出个人避免隐私泄露的实操举措。此外,本书对改进公共监管举措、完善法律的思考亦不乏真知灼见。
上世纪九十年代,我们曾慨叹生活在一个信息爆炸的年代,今天我们则像是生活在一个数据爆炸甚至过剩的年代。资料表明,全球数据正在迅速增长,大约每18个月翻一番。有专家估计,到2020年全球将会有240亿台连接设备,其中一半是可移动的。届时,全球年数据产生量将会达到2009年的45倍。美国统计学家纳特·西尔弗也在《信号与噪声》一书中指出,在大数据时代,人类一天创造的内容甚至超过人类有史以来的所有内容。在本书作者看来,大数据越是这样蓬勃发展,对公众私密生活的威胁越可能“雪上加霜”。
大数据不仅改变了我们,还“战胜”了我们。2016年的“人机大战”无异于大数据对人类智商的一次不经意“嘲弄”:由谷歌公司研造的人工智能系统阿尔法围棋,挑战世界围棋冠军李世石,最终以4:1获胜。就此,中国科学院院士徐宗本一言以蔽之——人工智能的胜利其实就是大数据的胜利。素以智慧自居的人类败给了自己亲手创造的大数据,这是多么大的讽刺!
“悖论”远不止此,我们甚至还没有大数据更了解自己。举个许多人碰到但又不曾留意的例子。当你在互联网上偶尔点开一本书,你可能很快就会发现,你的电脑页面虽然与别人的大体相同,但你点过的那本书,或者与其关联的信息总会及时出现在页面一角。你原本没什么特别感觉,经这么反复刺激,你很可能在潜移默化中慢慢改变原来的看法,至而生成购买欲。还有,当我们打开APP,刚打出一个字,后面常常会联想出一串信息。这些信息绝非空穴来风,要么因为上了热搜榜,要么因为我们曾经浏览过,或者关注过关联的信息。
大数据蕴含无限商机。“数据挖掘的概念已经存在了至少20年”,“一项数据业务预测2020年企业持有的数据量将超过2012年收集量的30倍”。另一方面,近年来关于大数据泄露公众个人信息的案例屡见不鲜。如果数据的获取没有规则边界,那么就只剩下“裸奔”的利益。媒体多次披露,互联网上的个人信息贩卖已经形成黑色利益链。
内幕触目惊心。商业机构在“盗取”公众个人信息后,常常又以投其所好的方式出现在消费者面前。许多消费者只是觉得越来越方便,而很难意识到这种“贴心”服务是建立在自己信息被泄露基础之上。“我们需要越来越多的数据来满足无止境的欲望,然而我们还从未公开探讨哪些个人信息可以被收集以及如何被利用”。事实上,“信息收集和挖掘技术已经远远超出政府的能力范围,以致难以深思熟虑地通过一项兼顾商业和隐私保护的法律。正因如此,商业公司不知道它不可以做什么,而民众也没有得到保护”。
两位作者郑重指出,在大数据漫天飞舞的今天,只要我们使用手机、电脑、身份证、护照、社保卡、车载卫星定位等,个人信息就一定存在泄露风险。就此,本书从日常生活角度逐一提供技术防范举措。当然,这些举措未必一定确保个人信息的万无一失,但至少可以加上一道密级更高的锁,大大提升泄密的难度。
值得警醒的是,紧步商业机构后尘,一些国家的公共机构亦借大数据技术之利对公民信息“巧取豪夺”。《大数据时代》作者舍恩伯格曾称,“信任是大数据可持续发展的 货币 ”。这里的信任其实应加上引号,因为大多数数据的采集并没有经过被采集者的同意或者授权。2013年,美国中央情报局技术分析员斯诺登向英国《卫报》和美国《华盛顿邮报》泄露了美国国家安全局和联邦调查局启动的一个代号为“棱镜”的秘密监控项目,这也就是至今仍在发酵的“棱镜门”事件。根据斯诺登披露的文件,美国国家安全局可以接触到大量个人聊天日志、存储的数据、语音通信、文件传输、个人社交网络数据。
现实尚且如此,那是否意味,在可预见的未来,随着可穿戴技术和眼球捕捉技术等高科技的突飞猛进,届时无所不在的数据采集会否更令公众束手无策呢?有一点或无疑问,相较而言,今天的数据采集还显得粗放原始。这也就是说,虽然困难很大,从现在开始改进保护个人信息法律,这远比坐等日后数据采集更加泛滥时再纠偏更为容易。想必这也是本书两位作者的良苦用心所在。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02