京公网安备 11010802034615号
经营许可证编号:京B2-20210330
几乎每一刻我们都在为大数据作出“应有的贡献”
这是我们大多数人司空见惯的一天:早上起床后抓起手机看当天天气预报,然后是查询上班路线,再接下来打开汽车导航,上班后通过互联网查询资料,并不时用手机与外面联系,下班后通过手机APP订餐、购买电影或演出票,回家后通过互联网电视收看节目……“不论你喜欢与否,你的生活已经受控于技术”。在《大数据时代的隐私》一书的作者看来,几乎每一刻我们都在为大数据作出“应有的贡献”。当然,就是这样看似再寻常不过的日常生活,我们一天的行踪、偏好(哪怕有时仅仅只是一个闪念),早就暴露无遗,某种意义上,我们越来越像是一个没有私密可言的“透明人”。
技术就是这样一把双刃剑,既会给你带来诸多便利,同时也会在悄无声息中肆意“偷”走你的信息,根本不在乎你的情绪,这正是本书所要阐明的核心所在。书中每一章都展示了人们在家庭和工作中的日常活动如何成为大数据收集的一部分。或因第一作者本人有过白宫首席信息官的特殊经历,对大数据接触较多,对信息技术更为敏感,所以本书能够针对性提出个人避免隐私泄露的实操举措。此外,本书对改进公共监管举措、完善法律的思考亦不乏真知灼见。
上世纪九十年代,我们曾慨叹生活在一个信息爆炸的年代,今天我们则像是生活在一个数据爆炸甚至过剩的年代。资料表明,全球数据正在迅速增长,大约每18个月翻一番。有专家估计,到2020年全球将会有240亿台连接设备,其中一半是可移动的。届时,全球年数据产生量将会达到2009年的45倍。美国统计学家纳特·西尔弗也在《信号与噪声》一书中指出,在大数据时代,人类一天创造的内容甚至超过人类有史以来的所有内容。在本书作者看来,大数据越是这样蓬勃发展,对公众私密生活的威胁越可能“雪上加霜”。
大数据不仅改变了我们,还“战胜”了我们。2016年的“人机大战”无异于大数据对人类智商的一次不经意“嘲弄”:由谷歌公司研造的人工智能系统阿尔法围棋,挑战世界围棋冠军李世石,最终以4:1获胜。就此,中国科学院院士徐宗本一言以蔽之——人工智能的胜利其实就是大数据的胜利。素以智慧自居的人类败给了自己亲手创造的大数据,这是多么大的讽刺!
“悖论”远不止此,我们甚至还没有大数据更了解自己。举个许多人碰到但又不曾留意的例子。当你在互联网上偶尔点开一本书,你可能很快就会发现,你的电脑页面虽然与别人的大体相同,但你点过的那本书,或者与其关联的信息总会及时出现在页面一角。你原本没什么特别感觉,经这么反复刺激,你很可能在潜移默化中慢慢改变原来的看法,至而生成购买欲。还有,当我们打开APP,刚打出一个字,后面常常会联想出一串信息。这些信息绝非空穴来风,要么因为上了热搜榜,要么因为我们曾经浏览过,或者关注过关联的信息。
大数据蕴含无限商机。“数据挖掘的概念已经存在了至少20年”,“一项数据业务预测2020年企业持有的数据量将超过2012年收集量的30倍”。另一方面,近年来关于大数据泄露公众个人信息的案例屡见不鲜。如果数据的获取没有规则边界,那么就只剩下“裸奔”的利益。媒体多次披露,互联网上的个人信息贩卖已经形成黑色利益链。
内幕触目惊心。商业机构在“盗取”公众个人信息后,常常又以投其所好的方式出现在消费者面前。许多消费者只是觉得越来越方便,而很难意识到这种“贴心”服务是建立在自己信息被泄露基础之上。“我们需要越来越多的数据来满足无止境的欲望,然而我们还从未公开探讨哪些个人信息可以被收集以及如何被利用”。事实上,“信息收集和挖掘技术已经远远超出政府的能力范围,以致难以深思熟虑地通过一项兼顾商业和隐私保护的法律。正因如此,商业公司不知道它不可以做什么,而民众也没有得到保护”。
两位作者郑重指出,在大数据漫天飞舞的今天,只要我们使用手机、电脑、身份证、护照、社保卡、车载卫星定位等,个人信息就一定存在泄露风险。就此,本书从日常生活角度逐一提供技术防范举措。当然,这些举措未必一定确保个人信息的万无一失,但至少可以加上一道密级更高的锁,大大提升泄密的难度。
值得警醒的是,紧步商业机构后尘,一些国家的公共机构亦借大数据技术之利对公民信息“巧取豪夺”。《大数据时代》作者舍恩伯格曾称,“信任是大数据可持续发展的 货币 ”。这里的信任其实应加上引号,因为大多数数据的采集并没有经过被采集者的同意或者授权。2013年,美国中央情报局技术分析员斯诺登向英国《卫报》和美国《华盛顿邮报》泄露了美国国家安全局和联邦调查局启动的一个代号为“棱镜”的秘密监控项目,这也就是至今仍在发酵的“棱镜门”事件。根据斯诺登披露的文件,美国国家安全局可以接触到大量个人聊天日志、存储的数据、语音通信、文件传输、个人社交网络数据。
现实尚且如此,那是否意味,在可预见的未来,随着可穿戴技术和眼球捕捉技术等高科技的突飞猛进,届时无所不在的数据采集会否更令公众束手无策呢?有一点或无疑问,相较而言,今天的数据采集还显得粗放原始。这也就是说,虽然困难很大,从现在开始改进保护个人信息法律,这远比坐等日后数据采集更加泛滥时再纠偏更为容易。想必这也是本书两位作者的良苦用心所在。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20