京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据背景下的信息安全问题_数据分析师
大数据具有体量巨大、类型繁杂、处理速度快、价值密度低四大特点,因此,对于个人来说,难以处理极其庞大的数据,只有国家和大型企业等组织或集团才有可能获取到各种敏感信息;大数据所搜集提取的个人信息可能连本人都不完全知晓,比如个人的行为特征、语言风格、爱好兴趣等。在大数据时代如何保护个人敏感信息或隐私,必将成为高难度的世界课题。
2013年6月,美国前中情局雇员斯诺登曝光了始于2007年小布什时期美国国家安全局和联邦调查局启动的代号为“棱镜”的秘密项目。美国国家安全局通过接入雅虎、谷歌、微软、苹果等9家美国互联网公司中心服务器,对邮件、图片、视频、电话等10类数据进行监控,以搜集情报,监视民众的网络活动。
“棱镜”项目缘于2004年美国政府的“星风”监视计划。但是,当时小布什政府由于法律程序等敏感问题而做出让步,美国本土的监听项目有所缩减。为了“星风”计划的继续进行,小布什政府通过司法程序将“星风”监视计划分拆成由国家安全局执行的4个监视计划,包括“棱镜”、“主干道”、“码头”和“核子”,均交由美国家安全局执掌。“棱镜”项目用于监视互联网个人信息。“主干道”和“码头”项目负责存储和分析通信和互联网上数以亿兆计的“元数据”。元数据主要指通话或通信的时间、地点、使用设备、参与者等,不包括电话或邮件等的内容。“核子”项目负责内容信息的获取,截获电话通话者对话内容及关键词,通过拦截通话以及通话者所提及的地点,来实现日常的监控。
由此可见,斯诺登不仅揭露了美国的大规模窃听计划,更揭示了大数据时代国家信息安全保护问题。大数据的分析与使用,无论对个人(如跟踪健康状况防范疾病)、对企业(如了解市场偏好以有效安排产品设计生产营销)乃至对国家(如防范疫情或恐怖主义)显然都有巨大的好处,从商业用途来说,谷歌、微软、雅虎等互联网公司,完全可以通过它们掌握到的数以百万计、千万计甚至亿万计的数据,经由“超级计算”,准确推断消费者的爱好及习惯、商品的销售额、疾病疫情的发展趋势。商业如此,在政治、经济、军事等方面亦存在诸多的用途和潜在利益。像“棱镜”计划里涉及的谷歌、雅虎、苹果、微软等大网站,人们每天由于各种业务需要,会把大量个人信息输入其中,但常常并不被事先告知数据的用途。而这些数据会被企业或政府用来进行一些特殊的计算或分析,如通过对大数据的分析预测来对人们尚未实施的行为进行惩罚。比如“大数据之父”舍恩伯格曾披露过一个例子:在美国有一个计划名为“预测式配警”,通过对大数据分析来预测美国某个城市的某条街道的某个时段是犯罪高峰时段,然后在那个位置部署更多的警力。从此该地区居民将长时间被监控,这是一种变相的侵犯或惩罚。他们不是因为做错事,而是因为某个计算机的算法预测他们可能做错事而被惩罚了,显然这是不公平的。美国国安局拥有的正是类似的一套基于“大数据”的新型情报收集系统,这套名为“无界爆料”的系统,以30天为周期,从全球网络系统中接收到970亿条讯息,再通过比对信用卡或者通讯记录等方式,能几近真实地还原个人的实时状况。当然,像谷歌这样的商业组织也有可能掌握同样量级的信息而进行商业预测分析。因此,必须建立一套规则予以规范和约束对大数据的收集和使用。第一,虽然这些信息储存在不同的服务器上,但这些数据是用户的资产,拥有权属于用户自己而不是这些公司,这是必须明确的,就像财产所有权一样,个人隐私数据也应该有所有权。第二,利用大数据、云计算技术给用户提供信息服务的公司或企业,需要把收集到的用户数据进行安全存储和传输,这是企业的责任和义务。第三,如果企业或政府要使用用户的信息,一定要让用户有知情权和选择权,泄露用户数据甚至牟利,不仅要被视作不道德的行为,而且是非法行为。
大数据时代的数据存储和应用方式是跨地域甚至是跨国界的。作为国家层面要将大数据上升为国家战略,奥巴马政府在2012年3月将“大数据战略”上升为最高国策,像陆权、海权、空权一样,将对数据的占有和控制作为重要的国家核心能力。我国也应从国家高度重视大数据,在对其进行安全保护、政策制定需要重视三个方面:一是要正视数据霸权,要清醒认识到我国在网络控制权、关键技术和高端设备等方面,还受制于西方。二是要明确主权,数据作为一种重要的战略资源,无论是个人拥有还是国家拥有,都要纳入到主权范围里面来考虑。三是要有治权,因为有主权不一定能够管治。比如:数据存到国外,云计算跨越国境,可能不在你的主权范围之内。要区别对待不同的数据,对确需保护的数据,必须有切实可靠的手段进行有效管理。如果做不到对数据的有效管理,大数据就必然面临失控的危险。
政策界定安全责任问题。大数据的安全问题涉及政府、相关企业、网络运营商、服务提供者,以及数据产生者、使用者等方方面面,必须对各自的安全责任有明晰的政策界定。信息安全风险存在于数据的全生命周期之中,从技术思路、产品开发、用户使用、服务管理,各个环节均要分担相应的安全责任。
监管保障基础设施安全问题。大数据的发展离不开电信网络甚至工控系统等关键基础设施,其安全可靠同样依赖于这些基础设施,受供应链全球化、产业私有化的影响,网络与关键基础设施间的安全日趋复杂,一国的大数据可能存放在别国的网络中,一国的基础设施可能同时服务于多个国家,高度的全球相互依赖性,挑战着原有的国家主权观念。所以,关键基础设施的安全监管体系十分重要,我国需要尽快确立对供应链的实质性国家安全审查和对基础网络的常态化安全监管。
网络空间冲突管理问题。大数据的资源价值越来越高,围绕大数据的争夺和冲突就越来越激烈。大数据的生成、处理和利用方式,将极大改变各种冲突的表现方式和破坏烈度。通过立法与国际合作应对包括知识产权的保护、网络犯罪的处置、网络破坏活动特别是网络恐怖主义的打击以及网络战争的威胁。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11