京公网安备 11010802034615号
经营许可证编号:京B2-20210330
几乎每一刻我们都在为大数据作出“应有的贡献”
这是我们大多数人司空见惯的一天:早上起床后抓起手机看当天天气预报,然后是查询上班路线,再接下来打开汽车导航,上班后通过互联网查询资料,并不时用手机与外面联系,下班后通过手机APP订餐、购买电影或演出票,回家后通过互联网电视收看节目……“不论你喜欢与否,你的生活已经受控于技术”。在《大数据时代的隐私》一书的作者看来,几乎每一刻我们都在为大数据作出“应有的贡献”。当然,就是这样看似再寻常不过的日常生活,我们一天的行踪、偏好(哪怕有时仅仅只是一个闪念),早就暴露无遗,某种意义上,我们越来越像是一个没有私密可言的“透明人”。
技术就是这样一把双刃剑,既会给你带来诸多便利,同时也会在悄无声息中肆意“偷”走你的信息,根本不在乎你的情绪,这正是本书所要阐明的核心所在。书中每一章都展示了人们在家庭和工作中的日常活动如何成为大数据收集的一部分。或因第一作者本人有过白宫首席信息官的特殊经历,对大数据接触较多,对信息技术更为敏感,所以本书能够针对性提出个人避免隐私泄露的实操举措。此外,本书对改进公共监管举措、完善法律的思考亦不乏真知灼见。
上世纪九十年代,我们曾慨叹生活在一个信息爆炸的年代,今天我们则像是生活在一个数据爆炸甚至过剩的年代。资料表明,全球数据正在迅速增长,大约每18个月翻一番。有专家估计,到2020年全球将会有240亿台连接设备,其中一半是可移动的。届时,全球年数据产生量将会达到2009年的45倍。美国统计学家纳特·西尔弗也在《信号与噪声》一书中指出,在大数据时代,人类一天创造的内容甚至超过人类有史以来的所有内容。在本书作者看来,大数据越是这样蓬勃发展,对公众私密生活的威胁越可能“雪上加霜”。
大数据不仅改变了我们,还“战胜”了我们。2016年的“人机大战”无异于大数据对人类智商的一次不经意“嘲弄”:由谷歌公司研造的人工智能系统阿尔法围棋,挑战世界围棋冠军李世石,最终以4:1获胜。就此,中国科学院院士徐宗本一言以蔽之——人工智能的胜利其实就是大数据的胜利。素以智慧自居的人类败给了自己亲手创造的大数据,这是多么大的讽刺!
“悖论”远不止此,我们甚至还没有大数据更了解自己。举个许多人碰到但又不曾留意的例子。当你在互联网上偶尔点开一本书,你可能很快就会发现,你的电脑页面虽然与别人的大体相同,但你点过的那本书,或者与其关联的信息总会及时出现在页面一角。你原本没什么特别感觉,经这么反复刺激,你很可能在潜移默化中慢慢改变原来的看法,至而生成购买欲。还有,当我们打开APP,刚打出一个字,后面常常会联想出一串信息。这些信息绝非空穴来风,要么因为上了热搜榜,要么因为我们曾经浏览过,或者关注过关联的信息。
大数据蕴含无限商机。“数据挖掘的概念已经存在了至少20年”,“一项数据业务预测2020年企业持有的数据量将超过2012年收集量的30倍”。另一方面,近年来关于大数据泄露公众个人信息的案例屡见不鲜。如果数据的获取没有规则边界,那么就只剩下“裸奔”的利益。媒体多次披露,互联网上的个人信息贩卖已经形成黑色利益链。
内幕触目惊心。商业机构在“盗取”公众个人信息后,常常又以投其所好的方式出现在消费者面前。许多消费者只是觉得越来越方便,而很难意识到这种“贴心”服务是建立在自己信息被泄露基础之上。“我们需要越来越多的数据来满足无止境的欲望,然而我们还从未公开探讨哪些个人信息可以被收集以及如何被利用”。事实上,“信息收集和挖掘技术已经远远超出政府的能力范围,以致难以深思熟虑地通过一项兼顾商业和隐私保护的法律。正因如此,商业公司不知道它不可以做什么,而民众也没有得到保护”。
两位作者郑重指出,在大数据漫天飞舞的今天,只要我们使用手机、电脑、身份证、护照、社保卡、车载卫星定位等,个人信息就一定存在泄露风险。就此,本书从日常生活角度逐一提供技术防范举措。当然,这些举措未必一定确保个人信息的万无一失,但至少可以加上一道密级更高的锁,大大提升泄密的难度。
值得警醒的是,紧步商业机构后尘,一些国家的公共机构亦借大数据技术之利对公民信息“巧取豪夺”。《大数据时代》作者舍恩伯格曾称,“信任是大数据可持续发展的 货币 ”。这里的信任其实应加上引号,因为大多数数据的采集并没有经过被采集者的同意或者授权。2013年,美国中央情报局技术分析员斯诺登向英国《卫报》和美国《华盛顿邮报》泄露了美国国家安全局和联邦调查局启动的一个代号为“棱镜”的秘密监控项目,这也就是至今仍在发酵的“棱镜门”事件。根据斯诺登披露的文件,美国国家安全局可以接触到大量个人聊天日志、存储的数据、语音通信、文件传输、个人社交网络数据。
现实尚且如此,那是否意味,在可预见的未来,随着可穿戴技术和眼球捕捉技术等高科技的突飞猛进,届时无所不在的数据采集会否更令公众束手无策呢?有一点或无疑问,相较而言,今天的数据采集还显得粗放原始。这也就是说,虽然困难很大,从现在开始改进保护个人信息法律,这远比坐等日后数据采集更加泛滥时再纠偏更为容易。想必这也是本书两位作者的良苦用心所在。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05