京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据信息隐私杀伤力有多大
随着大数据被挖掘,我们在使用着大数据,享受着它带给我们的美好体验和便利生活。在此过程中,大数据技术越来越发达,人们可以用更加先进的方法使用大数据。同时,大数据相关分析工具的发展也稳步进行。国内大数据厂商也层出不穷。大数据魔镜就是一款强大而免费的大数据分析工具。有了这样的基础,人们对大数据的利用再慢慢加深。不过随之而来的,是数据信息对我们隐私的“探掘“。
我们在不断的隐私被侵犯中,慢慢学着“习惯”。在这过程中,有政府情报机构基于政治目的,对我们进行的监督和控制;有互联网企业基于商业目的,对我们进入的数据搜集与处理……包括苹果公司所说的,我们通过数据向用户投放定向广告,这是个优点,因为可以提供给用户与其收入情况相匹配的广告。对此,我们只能说“谢谢了”。
因为,你可以通过数据信息知道我的收入状况,也就意味着你可以知道更多状况;你可以把收入状况“分享”给广告客户,也就意味着你可以“分享”更多的内容给有需要的客户,最后只是你们之间商讨价码的问题。但是,就是这些你们认为可以赚钱而并没有那么严重的东西,或许就有可能给别人带来灾难性的伤害。
这让人想到了曾经的莫妮卡•莱温斯基,也许这个案例并不是最恰当的,但就是这么个普普通通的前白宫实习生,当她与美国总统克林顿的爱情丑闻被互联网公之于众时,瞬间变成了全世界公开羞辱的对象,被贴上了“淫妇”、,“荡妇”,“婊子”,“贱人”等标签。
庆幸,莱温斯基活下来了,但并不是每个人都那么幸运。在今年年初的TED大会上,莱温斯基在与大家分享《耻辱的代价》时,讲到了这样一个案例: 2010年9月,泰勒•克莱门蒂,美国罗格斯大学的大一新生。可爱、敏感、富有创意的克莱门蒂被室友偷拍到和另一个男人有亲密关系。当这个同性恋的视频在网络世界曝光后,嘲笑和网络欺凌的火种被迅速点燃。几天后,泰勒从乔治华盛顿大桥上纵身跳下。一个年仅18岁的生命就这样逝去。一个悲剧而无谓的死亡。或许有人会觉得克莱门蒂心理素质不过关,敢做还怕别人说嘛?这就好比说,比尔盖茨有亿万家产,他就不能介意自己的银行卡号和密码被泄密?理由只是“有钱还怕别人惦记”嘛?其实别说有钱,就是没钱也不乐意别人“惦记”我的卡号密码。因为那里面可能就是生命的全部财富支撑。如果信息被泄露了,如果卡上的数字瞬间“清零”了, 后果可想而知。
随着数字信息技术的不断发展,“网络匿名”有可能会变成“数学上不可能”的事。
1995年,欧盟出台的隐私法例将“个人资料”定义为可以直接或间接识别一个人的信息。很显然,当时立法者考虑的是那些带有身份标识号的文件资料之类的东西,这些标识号就好像人的姓名,而立法者们希望它们可以得到保护。
如今,“个人资料”这一定义所包含的内容已经远远超出当年那些立法官员的想象,甚至可以轻易地超过18年前他们通过这项法例时整个世界的数据量。
来看看到底发生了什么。首先,这个世界每年所创造的数据量在以指数形式增长,去年,这一数字则达到了2.8ZB(1ZB =10244GB),听起来就很可怕的数字,而且据知名信息行业咨询服务商IDC称,这一数字将在2015年翻一番。此外,这些数据中的3/4是由个体人在创造或移动数字文件时贡献的。举例来说,一个标准的美国上班族每年可以贡献180万MB的数据量,平均每天则有约5000MB,这其中包括下载的电影、文档、电邮以及这些数据通过移动或非移动互联网传播时所产生的附加数据量。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28