京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 隐私保护成“痛点”
如今的大数据,已让政务、旅游、环保、食品安全等各行各业生成“云”。一个信息迅速聚拢、分析、集中发布的便捷时代已经到来,“大数据惠民”不再是一句口号,而是实实在在落在每个人身边的“红利”。
但是,随着整个社会被强行推入“大数据时代”,不管人们是否愿意,我们的个人数据正在不经意间被动地被企业、个人搜集并使用。用户数据亦是危险的“潘多拉魔盒”,数据一旦泄露,用户的隐私将受到侵犯,造成损失和危害。
数据泄露事件就在身边
“张女士,您的儿子小军在成都的科华北路出了车祸,请速速打两万块到以下账户救命。”这是张女士收到的诈骗短信,让她百思不得其解的是,这个陌生人是怎么知道自己和儿子的名字的?又怎么会知道儿子在成都读大学呢?
市民张先生最近正在装修,于是在网上搜了“沙发”这个关键词。随后,他在上网时,无论是网页插件广告还是不时弹出的窗口,都换上了推销床、餐桌、电视等家居服务,邮箱里的垃圾邮件也是同样内容,甚至有人打来电话,向他推销各种品牌的家具。
“我的浏览记录被谁偷偷获取了?我的个人信息又是怎样泄露的?”张先生一连串的不解,让他感到了大数据信息泄露的不安。
然而,相对于这种个体的泄露事件,近年来国内外的数据泄露事件才令人担忧。
25日,中国工程院院士、中国互联网协会理事长邬贺铨在“数据安全与个人隐私保护论坛”上列举:2014年9月,“iCloud艳照门”事件爆发,数百张好莱坞女演员不雅照在网上被曝光,原因是黑客通过攻击iCloud云存储服务盗取了用户上传的照片。
2014年还相继发生携程信用卡信息泄露,小米社区用户信息泄露事件;2015年12月3日乌克兰伊万诺—弗兰科夫斯克地区首府断电几小时,因为电力公司接收的邮件中附件带入木马,利用计算机应用软件的漏洞实现远程入侵……
“数据安全已成为国家安全的新重点,个人隐私已经成为国家治理的新难题。”国家发改委高技术产业司调研员刘勇表示,大数据环境下个人数据不可避免地透明化和网络化,在享有大数据分析带来便捷化、精准化的同时,数据安全、个人信息保护也开始成为重要隐患。
数据隐私保护问题亟待解决
2016年4月19日,习近平总书记在网络安全与信息化座谈会上说:“要依法加强对大数据的管理。一些涉及国家利益、国家安全的数据,很多掌握在互联网企业手里,企业要保证这些数据安全。”
本次数博会上,李克强总理也提到网络隐私安全:“中国在推进新一轮更高水平的对外开放的同时,要注重保护知识产权,尊重和保护商业秘密,加强网络安全管理。”
本次数博会上,关于“大数据与隐私”的论坛共设置了上下两场,这是极少数设置两场论坛的话题。可见业内对这个问题的重视程度已相当高了。
为了解决大数据与隐私这一难题,《十三五规划纲要》中明确提出建设大数据安全技术:第一,加快海量数据采集、存储、清洗、分析发掘、可视化、安全与隐私保护等领域关键技术攻关;第二,集中力量突破信息管理、信息保护、安全审查和基础支撑关键技术,提高自主保障能力;第三,加强关键信息基础设施核心技术装备威胁感知和持续防范能力建设。
然而大数据产品尚未能做到安全可控,这是一个不得不承认的事实。
我国去年九月出台的《促进大数据发展行动纲要》指出:要促成一批满足大数据重大应用需求的安全产品、系统和解决方案,建立安全可信的大数据技术体系。探索大数据与传统产业协同发展的新业态。
“法律与技术在推动大数据信息安全方面是同等重要的。”中国科学院信息工程研究所研究员、副总工程师李凤华表示,光靠技术是不能完全解决信息安全问题的,法律是确保信息安全的最后一道防线,大数据也需要规范的法律去保障个人信息安全。
中央网信办网络安全协调局副局长卿昱则表示,面对日益严峻的大数据安全问题,国家有关部门正在积极加快推动网络安全法,积极推动关键基础设施保护、网络安全审查、个人信息保护、大数据安全管理等一系列法律法规制度的增补完善,积极推动网络安全责任制的落实。
利用大数据保护大数据隐私
“利用大数据来保护大数据隐私”是邬贺铨在此次数博会上提出的让人眼前一亮观点。
他认为,要保护大数据隐私离不开大数据的帮忙。利用大数据可以将威胁防控范围扩展到包括数据资产、软件资产、实物资产、人员资产、服务资产和其他为业务提供支持的无形产业。通过海量日志大数据的分析,可以挖掘发现大量新的网站攻击特征、网络漏洞,溯源定位攻击源。
大数据工具还特别适合用作高级持续性威胁(APT)的检测和取证。APT可能会持续很长时间,为了检测这些攻击,对企业内部网络进行全流量镜像侦听,存储网络所有访问请求,并对企业内部网络访问行为进行健康、关联分析及可视化。大数据能对大量分散的数据进行长期历史性相关性风险分析,自动发现网络异常行为,溯源并定位APT攻击过程。
但邬贺铨不是唯一一个提出此观点的人。360企业安全集团董事长齐向东在此次数博会上也提出,应该用大数据技术解决大数据时代的安全问题。他介绍,目前360公司正是基于“数据驱动安全”的思维,搭建了一套全新的互联网安全体系。这套新兴安全体系,包含漏洞挖掘技术、网络攻击技术、软件样行为分析技术以及由网络地址解析数据库、网络访问日志数据库、文件黑白名单数据库等组成大数据系统与分析技术,它是传统安全+互联网+大数据。
“大数据安全永远在路上,魔高一尺道高一丈,只有创新是永恒的,大数据应用本身既是安全防御的重点,也是保障网络与信息安全的有力手段。”齐向东表示,大数据已经成为信息社会的热点,也是信息安全博弈的焦点,大数据的安全需要从技术、产业与管理多维度来保障,还需要人才、法规来支撑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11