
大数据时代下如何保护隐私权
隐私权:个人私事免受干扰的权利
提及隐私,现代人可能会想到个人日记、通信通话等个人的隐秘事项,也可能会想到夫妻生活、消费开支等个人的私密事务,甚至还会想到身高体重、电话号码、邮箱地址等个人不愿公开的资料等。没错,这些不愿外人知道、不愿外人干涉的个人私事就是隐私。
当人类开始使用树叶做遮羞布的时候,“隐私”就已经在人脑中形成概念。而“家丑不可外扬”也从一个侧面说明人们希望个人的隐私得到保障。只不过,受交通、通信等手段和技术的限制,古时的生活不像现在这么开放,“采菊东篱下,悠然见南山”式的相对“隐居”隔离使人们并没有将隐私视为一种“权利”。即使人们意识到隐私的重要,凭借自己的力量就足以保护。两次工业革命之后,人类的文明进程大跨步向前迈进,交通、通讯等技术的飞速发展极大拓展了个体的活动空间,“隐私”遭遇“外扬”现象时有发生,依靠个体力量保护自己隐私变得越来越困难。
适应社会发展的趋势,为对抗他人对个人隐私的干预,1890年,美国私法学者布兰代斯和沃伦在《哈佛法学评论》上发表了《论隐私权》一文,首次提出了隐私权(the right to privacy)的概念。在这篇论文中,第一次将“隐私权”作为一种“不受别人干扰的权利”提出来,认为这项权利是个人自由的起点,只有通过界定这项“人类最广泛、文明最珍视”的权利,个人的“信仰、思想、情感和感受”才能得到保障。此后,隐私权作为公民人格权利的重要内容,逐渐得到各国法律的确认和保护。进入20世纪后,美国、法国、德国、日本等国家和地区,先后以法律法规等形式,相继对传统意义上的隐私权、信息网络时代的隐私权等保护作了针对性的规定。1948年联合国大会通过了《世界人权宣言》,其第12条也明确规定:“任何人的私生活、家庭、住宅和通信不得任意干涉,他的荣誉和名誉不得加以攻击。”
对隐私的合理期待
“风能进,雨能进,国王不能进”。因家庭住所等相对封闭的个人空间集中了公民的较多隐私,早期的公民隐私权保护主要集中在以住所为代表的物力空间之上。
1928年,一位名叫奥姆斯泰德的美国公民因涉嫌贩卖私酒,其住宅、办公电话被联邦调查局(FBI)在未获得搜查证的情况下搭线监听。被判有罪后,奥姆斯泰德认为,FBI的窃听行为违反了美国宪法第四修正案“任何人的人身、住宅、文件和财产不受无理搜查和查封”的规定,侵犯了公民的隐私权,所获证据应被排除。官司打到最高法院后,最高法院9名大法官以5:4的比例驳回了奥姆斯泰德的上诉,理由是:“会话”不属于“人身、住宅、文件和财产”,FBI在屋外窃听不构成对奥姆斯泰德隐私权的侵犯。
这场官司虽以奥姆斯泰德的败诉告终,但布兰代斯大法官发表的“异见”却引发广泛讨论。布兰代斯大法官指出:由于新技术的产生和发展,对隐私权的侵犯已经不需要物理的、强制性侵入。即使是国家行为,如果没有合法审批也应被视为违宪。其后,布兰代斯大法官的观点越来越受到社会关注和认可,在1967年的卡兹诉美国一案中,最高法院改变了奥姆斯泰德诉美国一案的判决,确立了“隐私的合理期待”保护标准,并成为其他国家界定“隐私权”的重要参考。
与奥姆斯泰德诉美国案类似,卡兹诉美国案中,FBI也是在没有申请搜查令的情况下,在户外公用电话亭安装窃听器,窃听卡兹与他人的通话,继而获得卡兹参与组织赌博的关键证据。被法院判决有罪后,卡兹以相同的理由提出上诉。如果按照奥姆斯泰德的判决,FBI因为没有侵入卡兹的住宅,也就不可能侵犯其隐私权。但时过境迁,当时的最高法院已经步入到“沃伦时代”,格外注重对公民权利的保护,最终认定FBI窃听获得的证据侵犯了公民的隐私权,应当依法予以排除。
卡兹诉美国案是隐私权历史上一个里程碑式的案件。在这一案件中,为加强对隐私权的保护,判决提出了“隐私的合理期待”判断标准。具体分为主观和客观两个要件:前者是指个人必须表现出对其主张的隐私存在真实的主观的期待;后者则指该期待是社会愿意承认合理的。它把隐私权的保障从原来的住宅扩展到公共场所,强调隐私权保障的是“人”而不是“场所”。如果一个人有意将自己揭露于公众,即使在家中亦不受保障;如果他要维护其隐私,即使公共场所,仍会受到保障。即,已经公共暴露或者明知可能会公共暴露的情况下,公民不得通过主张其隐私权对抗别人的“干扰”。
后来,在1971年的美国诉怀特案、1976年的美国诉米勒案、1986年的加利福尼亚州诉西若罗案等案件中,最高法院通过一系列案例明确像线人窃听、电话银行记录、空中监测、垃圾检查等活动获得的被告“私事”都不属于宪法第四修正案保护的个人隐私权,因为这些“私事”的获得要么属于应当承担的“交流对方向第三人(警方)透漏的风险”(风险承担),要么属于“其他人可以不用花费许多人力、技巧或金钱即可以相对轻易接触到的”(公共暴露)。但是,因“公共暴露”的认定并非易事,这些判决也引起了一定争议,类似案件在其他国家也出现了不同的判决。
“大数据”下重新审视隐私权
20世纪中期以来,随着计算机等相关技术的日益成熟与发展,人类的信息存储和处理能力不断得到扩展。现在,监视器、摄像头等布满整个城市的公园、路口、小区;信用卡、支付宝等消费于整个城市的酒店、商场、医院;个人电话、家庭成员、邮箱地址等广泛登记于政府、学校、社区组织,政府、非政府机构、商业组织等以数字化的形式收集了我们各种各样的大量信息。当这些被存储的数字化信息达到1太字节(字节是计算机存储信息的基本物理单位,一个英文字母的大小是一个字节,1太字节=1024GB=240字节)的时候,就形成了所谓的“大数据”。截至2012年人类拥有的信息总量,包括网络日志、音频、视频、图片、地理位置信息等大概是2.8泽字节(1泽字节=270字节),而且据知名信息行业咨询服务商IDC称,这一数字将在2015年翻一番。“大数据”之大,不仅仅是数据容量之大,更是数据抓取、整合和分析之大。在东德,即使号称拥有最强大特情搜集能力的史塔西,也只能做到监控三分之一的东德人口。但在大数据时代,像美国这样的高科技国家,通过收集、整合几个跨国互联网公司的数据,就可以对世界上大多数的人口进行监控。
显然,“大数据”下,公民的隐私权保护正受到前所未有的挑战:第一,当我们被通过立法、电子交易等形式,将个人的相关数据信息以“同意”的名义存储于服务提供商时,按照“隐私的合理期待标准”这些数据信息本身能构成“隐私”吗?如果不能,是不是意味着服务提供商可以随便向第三人披露这些数据信息?例如,交警公开摄像头拍下的行人违章视频是否属于侵犯隐私权行为?如果不属于,怎能避免不发生“高速袭胸门”之类的事件?第二,当我们在公开的互联网上发布个人的生活碎片时,按照“隐私的合理期待标准”,这些以数字形式存在的生活碎片不构成“隐私”。但将这些碎片进行整合分析得出来的个人相关数据信息是否也不构成“隐私”?如果不构成,是不是意味着第三人可以披露这些整合了公共暴露的信息基础上的个人数据信息?第三,当我们在特定目的下针对特定对象公开了个人信息后,第三人是否可以对此进行“人肉”并将这些已经公开的个人信息完整化公开呢?
对此,1988年美国发生的哥伦比亚广播公司诉司法部一案或许可以为我们解决问题提供参考。1988年,美国哥伦比亚广播公司(CBS)的一名新闻记者根据《信息自由法》向司法部下辖的联邦调查局提出申请,要求公开一名嫌犯麦迪科的犯罪记录。由于罪案记录属于隐私,FBI拒绝了CBS的要求,CBS遂将司法部告上了法院。案件进入最高法院后,CBS提出:麦迪科的这些信息,都曾经在某个特定的时候公开过,不能算作隐私。但是最高法院的9名大法官一致否定了这一抗辩理由,指出:“在一个有组织的社会里,几乎每一则信息都在不同的时候以不同的形式公开过。但是,就个人隐私而言,不同时期零散地公开和一次性完整地公开,即使内容相同,也有本质的区别。”这一案例表明,在现代社会的隐私权的保护上,似乎更应注重考量“隐私的合理期待”的主观标准,即除公民个人同意外,除非已经公共暴露,任何人无权对他人期待的“隐私”予以披露。具体到大数据时代,应当肯定存储于政府、商业组织、网络运营商等“数据库”中的个人数据完全属于个人隐私范畴,公民对此享有使用知情权、编辑管理权、删除不当权等权限。
该怎样保护我们的隐私权
尽管隐私权保护的标准可以放宽,但在大数据时代下,保护公民的个人隐私仍非易事。作为公民的个人信息,一旦被以数据化形式储存,便掌握在政府、非政府机构以及商业组织的数据库中,公民个人事实上很难进行保护。互联网等新兴技术的发展,使得个人信息存储的时间更久,但搜索起来却更为容易。在特定情形下发布的一些个人信息,经过一段时间,发布人或许早已忘却,但其他人却很容易在相关事件发生时瞬间搜索到并发布至互联网上。作为享有数据隐私权的公民个人对此很难阻止。而且,丰厚的商业利润也根本无法阻止拥有数据库的商业组织不将收集到的个人数据进行整合、分析和利用。更让人担心的是,一些国家的政府还经常以“国家安全”等名义,通过“立法”等合法途径对个人数据信息进行随时监控和检视。就像“棱镜门”事件所揭示的那样,不知道、不经意间,公民的通话通讯记录等个人隐私已为公权力所掌握。
但是,保护公民的隐私权并非毫无作为可言。目前,全世界已有近二十个国家制定了专门保护个人隐私的法律,像美国、法国、欧盟等还专门针对信息时代制定了隐私方面的法规。中国也于2012年12月28日通过了《关于加强网络信息保护的决定》,并出台了《信息安全技术公共及商用服务信息系统个人信息保护指南》,对大数据时代的个人数据信息管理进行了原则性的规定。而作为公民自己,也要提高自我保护和监督意识,在个人隐私权遭到侵犯时及时根据现有的法律法规维护自己的合法权益,并运用法律法规和网络行业规范中的知悉权及时跟踪自己的个人数据信息,监督政府、网络运营商以及其他网络用户对自己个人信息的使用情况。相信有了公民的监督,类似“棱镜门”事件等大数据时代下的个人隐私权保护终究会找到一个解决的路径。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10