
大数据时代:如何守护我们的数据安全
不管你承认不承认,我们已经全面进入了大数据时代。无时无刻,我们的很多信息都被通过各种途径传播出去,这就必然导致安全问题的产生。
大数据的安全问题有多严重?在此前举办的“2016中国大数据产业峰会”上发生的一个实例,就可见一斑。
在360展区,市民严女士随手将钱包、手机放到安检筐里,空手走过安检门。她通过安检门,突然发现大屏幕上显示出自己银行卡的姓名拼音、身份证号、银行卡号、卡片有效期、最近10次的消费时间、消费地点、取现记录、转账记录等等。严女士惊呼:“遇到了魔术师”。
360安全专家刘洋解释,实际上,存放手机钱包的安检筐里存有一张具有nfc(近距离通信)功能的无线读卡器,旁边还有配套的信号接收器和电脑等设备,就像公交车刷卡器,只要银行卡靠近读卡器,卡片的信息就显示出来,安检门其实就是“安全魔术师”手中的障眼法。就在严女士将钱包放进安检筐的那一刻,严女士的个人信息就已经泄露了。
那么,我们靠什么来保障我们的数据安全呢?难道我们只能看着个人的数据和隐私到处泄露吗?
数据安全事件日益高发
近来,大数据安全事件呈高发之势。日前,广东警方破获一起高科技经济犯罪案件,17岁的“黑客”叶世广,攻破了多个商业银行网站,窃取了储户的身份证号、银行卡号、支付密码等数据,带领一批人在网上大肆盗刷别人的信用卡,涉案金额近15亿元,涉及银行49家。
今年2月,发生了世界上有史以来规模最大的网络盗窃案。黑客入侵了孟加拉国央行在纽约联邦储备银行的账户,盗走了8100万美元,后来孟加拉国官方表示,黑客出现了一个拼写错误,否则随后还将进行一笔近10亿美元的转账。
今年3月,与叙利亚有关联的激进黑客组织对一个自来水厂发起网络攻击。黑客操纵系统改变了进入到自来水中的化学物含量,阻碍净水过程。
类似的案例不胜枚举。
360公司总裁齐向东向《中国科学报》记者表示,接入互联网的设备越多,网络攻击的发生几率就越高,网络攻击首先瞄准大数据,攻击造成大数据丢失、情报泄密和破坏网络安全运行。大数据技术是一把双刃剑,既可以造福社会、造福人民,又可以被一些人用来损害社会公共利益和民众利益。
大数据安全体系构建势在必行
“在互联网乃至物联网时代,如果我们不能很好地解决安全问题,就会影响社会各方面的发展。因此,各级政府在鼓励发展大数据的同时,要同步考虑构建大数据安全体系。”齐向东表示。
值得注意的是,传统的网络安全思路已经无法保障大数据时代的安全。刘洋向记者介绍,传统网络安全的防护思路是划分边界,将内网、外网分开,业务网和公众网分离,用终端设备将潜在风险隔离。通过在每个边界设立网关设备和网络流量设备,来守住“边界”,以期解决安全问题。但随着移动互联网、云服务的出现,移动终端在4g信号、wi-fi信号、电缆之间穿梭,网络边界实际上已经消亡。
“很多传统的大企业认为,只要自己购买服务器并搭建独立的机房,安排专门的技术人员就能够保护企业的数据不被泄露,能够保护企业的信息安全。但实际上,在如今的互联网时代,这种传统的方法更加容易被不法分子所攻破。”阿里云安全资深总监肖力向《中国科学报》记者介绍,这是因为从技术实力来看,绝大部分企业并不是专门做网络安全、数据安全,其设置的技术壁垒难以阻挡专业的黑客。
齐向东介绍,360安全中心每天发现木马样本近千万个,每天发现的各种软硬件漏洞、网站漏洞超过120个,“每一个木马每一个漏洞,都可能攻破预先部署的安全设备和安全软件”。这种情况下,企业的传统防护的确难以奏效。
云平台和大数据需“双剑合璧”
在采访中,有专家认为,对付大数据时代的数据安全问题,防止信息泄露,除了完善相关法制法规,更加需要云平台的防护技术,结合大数据技术来应对数据安全。
“在云计算不断深入发展的当下,将数据存储在云平台上,或许比传统的企业信息防护更加安全。”肖力介绍,以阿里云为例,阿里云在架构设计之初就同步考虑了安全架构,不仅将安全的基因植入到整个云平台和各个云产品中,也将数据安全要求嵌入产品开发生命周期的各个环节。依靠专业的云计算平台,强大的技术团队能够更好地应付来自黑客的攻击。
不同用户之间,无论是cpu、内存,还是存储和网络,都默认相互隔离,既看不到对方的数据,也不会相互影响。“就像一间五星级酒店被分割成多个房间,他们之间是相互独立和封闭的,从而确保不同租户互不干扰和数据隔离。”肖力表示。
据介绍,目前全国35%的网站的数据安全防护都依托于阿里云平台的防护。阿里云的云盾,涵盖网络安全、服务器安全、数据安全、业务安全和移动安全这五个安全领域,来保护数据安全。
360也有自己的云安全管理平台。刘洋介绍,该平台将360独有的云安全漏洞挖掘能力输出给广大用户,通过统一管理、安全可见以及网络、主机、应用、数据的分层纵深防御,为用户全面解决云安全问题。
“用大数据技术来解决大数据时代的安全问题十分必要。”齐向东进一步指出,必须建立“数据驱动安全”的思维,搭建全新的互联网安全体系—“传统安全+互联网+大数据”。也就是说,要利用漏洞挖掘技术、网络攻击技术、软件样行为分析技术以及由网络地址解析数据库、网络访问日志数据库、文件黑白名单数据库等组成大数据系统与分析技术,构建全天候全方位感知网络安全态势。“要基于强大的大数据库、利用先进的大数据技术和广泛的用户覆盖率,提前感知网络威胁态势,为大众提供未知威胁的发现与回溯功能并进行有效防护。”齐向东说。
“未来还应当联合各方力量,共建互联网安全产业链生态,来应对大数据时代的安全风险。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11