
大数据时代 你还有隐私吗_数据分析师考试
“我点击了自己的名字,页面上出现了一张熟悉的照片――是我穿着一件蓝色衬衫的照片,旁边配有我的基本履历资料……我点开了一个最近更新的链接,地点是波士顿的马萨诸塞大街……两秒钟后,我在视频中看到了自己推开了地铁站那厚重的大门……每次看到自己出现在视频中,我都会浑身不自在。但现在可好,我的一举一动已经被LifeLinear网的系统给记录了下来……”
以上是出自美国作家艾伯特-拉斯洛・巴拉巴西今年的新书《爆发》中的片段,其中出现的能够每时每刻记录人们行踪的“LifeLinear系统”只是作者杜撰出来,并非真实存在。但是作者同时认为,在科技发达的今天,借助大数据的平台,“LifeLinear系统”并非不能实现。这样的场景又让人毛骨悚然:如果真有这样一套系统面世,我们的隐私岂不是要暴露在光天化日之下?大数据堪称一把双刃剑。不论是企业还是个人,都会因大数据的爆发获益匪浅,但同时个人隐私也无处遁形。随之而来的问题是:这些数据应当属于谁?谁有权利利用这些数据进行分析?这种利用能否有个限度?
大数据改变世界
大数据概念相对“年轻”,但是对于很多人并不陌生。数据的爆发归功于社交网络、电子商务和物联网的快速发展。
以前,人们只是将上网当做娱乐方式之一,现在,人们更多的是生活在网络平台上。这使得每18个月,数据量就会翻一番。海量数据的影响力是不可小觑的。麻省理工学院斯隆管理学院的经济学教授埃里克・布吕诺尔夫松(Erik Brynjolfsson)曾经指出,在商业、经济及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉。“我们的决策能够开始变得更加科学化。”他这样说。 越来越多的企业希望借助数据存储、数据分析等为自身带来更多利益。最典型的一个案例就是,华尔街有炒家利用电脑程序分析当时全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分,根据分数高低处理手中的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析软件帮助该炒家在今年第一季度获得了7%的收益率。
当然,消费者也会享受到更方便和更具个性化的服务。网购狂人李雪(化名)每天早上打开邮件,首先映入眼帘的就是各大电子商务网站发出的订阅邮件和个性化推荐的邮件,着实方便了她在网上进行目标性极强的有选择的“扫荡式”购物。这是商家根据对用户的页面停留时间、浏览与购买商品的分类等数据的分析作出的推荐。 另外,还可以通过数据分析来为人们的提供健康保障。总部位于美国加州的医疗管理财团Kaiser Permanente,收集并分析所有的临床分析和成本数据,发现了美国默沙东公司的神经和肌肉、骨骼系统药“万络”能够引发心脏病的副作用,最终成功使其退出市场。《爆发》一书中提出,如果大数据被充分利用,在流行病的控制等方面也会发挥奇效。
谁来掌控属于你的大数据
每个人都期待获得个性化服务。但是,在大数据时代,想要获得个性化服务,就一定会在某种程度上牺牲自己的隐私。 当你在使用电子邮件、社交网络的时候,你大概也会知道你的信息正在被记录下来,你发表的言论或者分享的照片、视频等都决定着互联网运营商即将向你推荐什么样的资源和广告;当你拿着iPhone满世界跑的时候,苹果早已通过定位系统把你的全部信息收罗在自己的数据库里,利用这些信息来构建地图和交通信息等;当你在享受着视频监控带来的安全感的同时,别忘了你也是被监控的一分子,你的一举一动都会暴露在镜头下面;你用手机通话时,运营商不仅知道你打给谁,打了多久,还知道你是在哪里进行的通话。 以前,这些记录几乎不会对普通人造成影响,因为它的数量如此巨大,除非刻意寻找,人们不会注意其中的某些信息。
但是,随着大数据技术的不断进步,这一状况正在发生改变。本文之前提到的悬而未决的问题随之而来,造成了很多尴尬的局面。例如,Facebook公司内部的科学家已经利用这些数据进行了大量研究并发表了超过30篇论文,但Facebook顾虑到隐私问题,并未公布原始数据,使得这些论文无法被业界承认并应用在广泛的社会学和心理学领域。同时,外界的研究者苦于没有数据,进行相关研究时远远没有Facebook得心应手。今年8月,Facebook公司表示正计划向社会学家开放有限的数据访问权限,这又会带来更多争议。此外,谷歌也和美国政府就数据利用问题产生了多次冲突。美国政府以各种理由不断要求谷歌提供用户数据并时常遭到谷歌拒绝。
同时,美国政府也对街景等应用进行调查,限制谷歌收集更多数据以制衡谷歌。 微软研究院的高级研究员博伊德(Danah Boyd)曾经表示:“如今,我们社交网络化的社会绝对有制造恐慌的天分。在大数据时代,对隐私泄露的担忧就是强大的紧张和焦虑的源泉。人们普遍认为,最令人焦虑的在于你根本不知道什么时候自己的隐私就无意中被泄露出去。”她认为,这并不是我们希望建立的社会。 人们最担心的,是对这种数据的无限制利用。《爆发》一书中更指出,人的行为看似随机无序,但实际上是存在某种规律的。社交网络如此发达的今天,大数据把人的行为进行放大分析,从而能够相对准确地预测人的性格和行程。
所以,不排除有这样一种可能:在忙完了一天的工作之后,你还没有决定要去哪儿,数据中心却早就先于你准确预测了接下来的目的地。 人们是否存在真正的隐私 当前,数据的数量时刻都在飞速增长。信息分享在全世界范围内越广泛,确保数据安全和保护人们隐私的任务就越难完成。现如今,人与人之间交流产生的流量远远大于文件传输产生的流量,但是,人与人之间的交流可以界定为隐私,属于比较敏感的范畴。
由此看来,整个互联网都是隐私的,是不可公开的。但是,现有的互联网结构下,你的所有应用对于服务提供商,其实都是透明的。那么,人们既想要借助互联网的平台与别人交流,又想要自己的空间不被窥探,这是完全不可能的。 《爆发》一书中指出,为获得便利,人们未来会接受匿名的隐私泄露。
但是,在过去的几年中,计算机专家一再表示,即使是匿名的数据也可以被重新确定,并且归属到具体的个人。例如,如果一笔超市购物记录中的零食全都和你的爱好相符、提供记录的超市正好位于你公司到家里的路上、购物时间刚好是你下班和到家之间的时间,这笔购物就很有可能与你相关,如果单子里刚好有你之前微博上表示感兴趣的商品,那就更有可能了。曾经,谷歌的一位工程师在解释“为什么不收集与人的名字相关的信息”的时候说道:“我们根本就不需要名字,名字对我们来说完全多余。谷歌记录网民搜索查询、位置和网上行为的大型数据库中就有大量信息,这足以让谷歌间接地了解一个人。”
这意味着人们隐私权的最后一道防线同样脆弱得不堪一击。 人们只能寄希望于在政府加大立法制度的同时,企业自身也设定相关规则实现自我管控。在美国北卡罗来纳州,曾经有人因为雇主看了他在Facebook上的信息而求职失败,求职者对雇主起诉并打赢官司。
为此,北卡罗来纳州专门立法规定雇主不得对雇员进行网上监控。Facebook也专门设立了首席隐私官。不过,政府和企业本身就拥有最多的数据,它们会真正限制自己对数据的应用吗?这将是未来大数据时代头上的一把达摩克利斯之剑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-05大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-05CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-05CDA认证在国际市场上的认可度正在逐渐增长。CDA(Certified Data Analyst)认证,源自中国,面向全球,旨在提升数字化人才的数据 ...
2025-08-04本次活动市场价2000元,现面向会员免费开放,会员朋友更可以邀请一位非会员免费参加。 【活动目标】 ...
2025-08-04MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-04反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-04CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-04评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-01通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-01CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-01K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-07-31大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-07-31CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-07-31SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29