京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代的潜在风险与监管
当前,整个社会正迎来大数据时代。围绕数据的收集、存储、交易、开发等,相继诞生了一系列相关产业,逐渐展现出巨大经济潜力。甚至有一种观点认为,大数据是新时代的“黄金与石油”,是新的重要经济增长点。无疑,新事物的发展会带来机遇,但同时也会带来风险。当大数据呈现出美好的前景、巨大的经济价值以及便捷的个性需求时,它有可能带来的负面风险就尤其值得重视和防范。
首先,对大数据的收集、开发、交易、利用有可能侵害个体安全与人的价值、尊严。所谓大数据,其源头来自于社会个体在经济、社会、政治、个人生活轨迹中所产生的相关信息。通过大数据,可以勾勒和描述具体公民的所有个体与行为特征。在这种情况下,作为独立完整的个体被重新界定为一序列数据集合,并在个体未知的情况下被收集、观察、研究、开发、交易、利用。这就有可能直接损害了个体自身的基本自由与安全,乃至个体尊严。
其次,对大数据的收集、开发、交易、利用有可能损害国家利益与安全。针对大数据对个体可能带来的风险,有种观点认为,对这些数据进行所谓的“脱敏”处理,如隐去个体信息,就可以做到对个体的保护。然而,这种观点忽略了大数据的本质,即大数据的价值不仅在于针对个体的特质与行为描述,而且通过对海量个体信息的综合分析,构建出整个社会行为的全貌。在这个层面上,某一条信息具体来自哪个个体并不重要,重要的是,当对海量信息进行整体分析时,这个国家的经济、社会、政治行为,如商品交易、金融存量、社会偏好、政治倾向,乃至整个民族的特质,包括健康程度、生理特征(如掌握大量就医信息从宏观表征得出)等全貌就会通过大数据的聚合分析而再现。这就不仅侵害了个体自由与安全,而且把整个国家的自由与安全都暴露在数据拥有方手里。
此外,大数据资源具有潜在风险。对大数据开发利用的最大风险来自于大数据信息所具有的不确定性。不但数据的生产者不能确定其价值与危害(如某一个体认为自己的信息即便被收集了也没有关系),数据的收集者、交易者、购买者乃至监管方都难以在短时间内明确其价值与危害。由于大数据总体上是离散的海量数据的组合,通过不同模型与组合方式,就能够获得不同的价值与信息。很多看似完全无关、没有危害的信息,通过有效的组合就能够形成重要的、有价值的信息情报。从某种意义上说,只要掌握足够多的无关信息,就有可能得到想要的一切有价值信息。因此,大数据资源的流出,有可能使得任何一方,乃至监管方都无从评估与预料其产生的潜在危害。一个工业时代的例子就是,传统落后工业产生的矿渣由于无法有效利用被视为废物,而发达国家则通过大量进口废渣二次开发而提炼出具有战略价值的矿业物资。
由此可见,当人们为大数据时代的到来而欢呼时,当社会忙于开发具有巨大潜力的大数据矿藏时,就更加需要高度警惕大数据时代有可能带来的对个体与国家安全的危害和风险。这就提出了一系列围绕大数据的监管问题。
谁有权收集大数据?大数据的产生包括两个渠道,一是法律授权收集而来的,如国家机关从保障公共利益的角度出发收集公民信息;二是公民使用网络设备而自动形成的信息记录,如参与网络社区、网络购物、网络金融等,就会自动生成大量活动信息,从而被提供服务的企业所掌握和收集。这里产生的问题在于,到底谁有权收集公民信息。这个问题非常复杂,在现实中也存在很多情境,然而有一些基本原则需要遵守,首先是利益原则,即只有代表公共利益与更好满足个体利益的情况下,才有权收集公民数据信息;其次是知情与许可原则,也就是说除法律规定强制收集公民信息外,企业收集信息必须经公民知情和同意。
谁有权交易大数据?我们在对大数据进行开发利用时,对数据的需求和交易也逐渐展开。不容否认,企业拥有的大数据资源通过交易,有时可以更好发挥价值,服务公众利益要求,展现出巨大的潜力和经济效益。然而,问题也随即产生,那些一般认为没有价值的信息,经过大数据的系统分析后,可能变成极为有价值的信息,甚至脱敏后的个体信息经过系统分析,依然可能得到事关国家和社会安全的有效信息。如果任何组织都能够通过交易获取所需信息,并进行后期加工,那么这种信息扩散的危害将是不可想象的。所以,必须对参与大数据交易的主体以及其掌握的信息进行严格审查与审批。
如何监管大数据的产生与交易?毋庸置疑,对大数据产业发展的监管主体应是政府。也就是说,政府必须要代表公共利益,严格审查企业进行个体信息收集、储存、开发、利用、交易的全过程;要对企业的数据搜集、开发、交易行为进行评估和安全审查,从而最大程度避免涉及公民安全与国家安全信息的扩散与泄露。
对大数据产业发展有可能带来的风险,美国和欧盟也十分重视,他们的教训和经验值得我们注意。不久前,美国《爱国者法》在执行14年后,未获继续通过,从而收回了对公民信息监控的权限,而欧盟则进一步通过立法强化公民的信息删除权,欧盟法院在2014年底裁定谷歌等商业公司必须在收集公民信息6个月内完全删除。这些都是出于对公民个体乃至国家整体安全的保护。因此,中国在迎来大数据时代的同时,也必须高度重视信息保护,在享受开发大数据时代带来便利的同时,高度警惕和防范所产生的相关风险。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27