
大数据时代的潜在风险与监管
当前,整个社会正迎来大数据时代。围绕数据的收集、存储、交易、开发等,相继诞生了一系列相关产业,逐渐展现出巨大经济潜力。甚至有一种观点认为,大数据是新时代的“黄金与石油”,是新的重要经济增长点。无疑,新事物的发展会带来机遇,但同时也会带来风险。当大数据呈现出美好的前景、巨大的经济价值以及便捷的个性需求时,它有可能带来的负面风险就尤其值得重视和防范。
首先,对大数据的收集、开发、交易、利用有可能侵害个体安全与人的价值、尊严。所谓大数据,其源头来自于社会个体在经济、社会、政治、个人生活轨迹中所产生的相关信息。通过大数据,可以勾勒和描述具体公民的所有个体与行为特征。在这种情况下,作为独立完整的个体被重新界定为一序列数据集合,并在个体未知的情况下被收集、观察、研究、开发、交易、利用。这就有可能直接损害了个体自身的基本自由与安全,乃至个体尊严。
其次,对大数据的收集、开发、交易、利用有可能损害国家利益与安全。针对大数据对个体可能带来的风险,有种观点认为,对这些数据进行所谓的“脱敏”处理,如隐去个体信息,就可以做到对个体的保护。然而,这种观点忽略了大数据的本质,即大数据的价值不仅在于针对个体的特质与行为描述,而且通过对海量个体信息的综合分析,构建出整个社会行为的全貌。在这个层面上,某一条信息具体来自哪个个体并不重要,重要的是,当对海量信息进行整体分析时,这个国家的经济、社会、政治行为,如商品交易、金融存量、社会偏好、政治倾向,乃至整个民族的特质,包括健康程度、生理特征(如掌握大量就医信息从宏观表征得出)等全貌就会通过大数据的聚合分析而再现。这就不仅侵害了个体自由与安全,而且把整个国家的自由与安全都暴露在数据拥有方手里。
此外,大数据资源具有潜在风险。对大数据开发利用的最大风险来自于大数据信息所具有的不确定性。不但数据的生产者不能确定其价值与危害(如某一个体认为自己的信息即便被收集了也没有关系),数据的收集者、交易者、购买者乃至监管方都难以在短时间内明确其价值与危害。由于大数据总体上是离散的海量数据的组合,通过不同模型与组合方式,就能够获得不同的价值与信息。很多看似完全无关、没有危害的信息,通过有效的组合就能够形成重要的、有价值的信息情报。从某种意义上说,只要掌握足够多的无关信息,就有可能得到想要的一切有价值信息。因此,大数据资源的流出,有可能使得任何一方,乃至监管方都无从评估与预料其产生的潜在危害。一个工业时代的例子就是,传统落后工业产生的矿渣由于无法有效利用被视为废物,而发达国家则通过大量进口废渣二次开发而提炼出具有战略价值的矿业物资。
由此可见,当人们为大数据时代的到来而欢呼时,当社会忙于开发具有巨大潜力的大数据矿藏时,就更加需要高度警惕大数据时代有可能带来的对个体与国家安全的危害和风险。这就提出了一系列围绕大数据的监管问题。
谁有权收集大数据?大数据的产生包括两个渠道,一是法律授权收集而来的,如国家机关从保障公共利益的角度出发收集公民信息;二是公民使用网络设备而自动形成的信息记录,如参与网络社区、网络购物、网络金融等,就会自动生成大量活动信息,从而被提供服务的企业所掌握和收集。这里产生的问题在于,到底谁有权收集公民信息。这个问题非常复杂,在现实中也存在很多情境,然而有一些基本原则需要遵守,首先是利益原则,即只有代表公共利益与更好满足个体利益的情况下,才有权收集公民数据信息;其次是知情与许可原则,也就是说除法律规定强制收集公民信息外,企业收集信息必须经公民知情和同意。
谁有权交易大数据?我们在对大数据进行开发利用时,对数据的需求和交易也逐渐展开。不容否认,企业拥有的大数据资源通过交易,有时可以更好发挥价值,服务公众利益要求,展现出巨大的潜力和经济效益。然而,问题也随即产生,那些一般认为没有价值的信息,经过大数据的系统分析后,可能变成极为有价值的信息,甚至脱敏后的个体信息经过系统分析,依然可能得到事关国家和社会安全的有效信息。如果任何组织都能够通过交易获取所需信息,并进行后期加工,那么这种信息扩散的危害将是不可想象的。所以,必须对参与大数据交易的主体以及其掌握的信息进行严格审查与审批。
如何监管大数据的产生与交易?毋庸置疑,对大数据产业发展的监管主体应是政府。也就是说,政府必须要代表公共利益,严格审查企业进行个体信息收集、储存、开发、利用、交易的全过程;要对企业的数据搜集、开发、交易行为进行评估和安全审查,从而最大程度避免涉及公民安全与国家安全信息的扩散与泄露。
对大数据产业发展有可能带来的风险,美国和欧盟也十分重视,他们的教训和经验值得我们注意。不久前,美国《爱国者法》在执行14年后,未获继续通过,从而收回了对公民信息监控的权限,而欧盟则进一步通过立法强化公民的信息删除权,欧盟法院在2014年底裁定谷歌等商业公司必须在收集公民信息6个月内完全删除。这些都是出于对公民个体乃至国家整体安全的保护。因此,中国在迎来大数据时代的同时,也必须高度重视信息保护,在享受开发大数据时代带来便利的同时,高度警惕和防范所产生的相关风险。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08