京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将有效应用于安全、身份和欺诈管理
21世纪以来,互联网、移动互联网、云计算、物联网导致计算环境发生重大变化,企业和组织投入大量资源改善IT安全基础设施,安全边界变得模糊和脆弱。但是各类安全事件层出不穷,国内外多起严重数据泄漏事件不断挑战安全意识底限。“恐惧源于无知”应用在信息安全领域同样适用,当各种复杂的防御机制也无法阻挡恶意入侵,当著名安全组织不断爆出安全漏洞,业内人士也在思考问题的症结。现有安全体系类似古代城堡,将重要资产(如企业内网等)使用高高的城墙(如防火墙等)团团围住。实际上,安全的边界变得模糊和脆弱,黑客攻击也具有系统化、长期化和经济利益驱动等特点,甚至有国家背景支持,城堡式安全体系已经无法适应新兴攻击技术的发展。国际安全会议RSA 2015年的主题“变化:挑战当前的安全理念”也正反应出安全界转换理念的共识。
预测攻击影响 提供主动防御
大数据的兴起为新一代安全技术提供思路,大数据开放组件为各类安全数据(如事件日志、数据包等)提供海量存储、实时处理和数据挖掘等功能,为安全厂商快速、有效建立数据分析平台提供便利。大数据技术在数据规模、数据易变性以及非结构化处理具有明显的优势,应用于安全领域主要体现在安全管理、身份管理和欺诈管理三大领域。
在安全管理方面,针对传统的威胁,防御和检测技术通常以特征检测为主,新型威胁更多利用0Day漏洞进行攻击。由于无法提前明确特征信息,导致防御侧已有SIEM系统及检测技术失效。企业和组织需要从被动防御转换到主动防御。根据多种渠道数据来源,威胁情报(Threat Intelligence)基于大数据处理和分析技术实现预测攻击影响以及识别未知威胁。通过威胁情况,安全人员在第一时间了解IT资产面临的新漏洞、新型攻击方法和工具,威胁环境变化等,在威胁溢出之前阻断攻击者。2013年以来,威胁情报一直保持北美安全技术发展的热点。此外,安全企业和组织也积极共享威胁情报信息,采用“群防群控”方式提升资源的利用率并将安全损失最小化。威胁情报共享以来数据的标准化和规范化,美国相关工作主要由政府部门和安全企业共同推动。2014年,Fortinet、Palo Alto等安全公司建立网络威胁联盟(Cyber Threat Alliance),共享威胁情报,全面提升威胁态势感知能力。美国将网络威胁情报信息共享视作提升其联邦政府信息系统安全的必要手段之一,NIST发布NIST SP 800-150网络威胁信息共享指南的草案,将信息共享、协调、协同扩展至计算机安全事件响应生命周期。
颠覆传统认证方式 识别欺诈特征
身份认证是信息系统中确认操作者身份的过程,也是授权操作的基础。传统的认证方式通过用户知道的秘密(口令等)、用户拥有的凭证(短信验证码等)和用户所属的特性(指纹等)来鉴别用户。上述技术面临以下问题:(1)数据泄漏严重,密码不可靠;攻击者通过泄漏数据、社工等方式很容易获得账号、密码;(2)作为常用的二次认证方式,短信验证码同样面临被截取的风险;U盾具有安全性优势,但使用不便;(3)生物认证的用户体验好,但适用范围受到限制,只能在支持生物特征识别的设备上运行。新型身份认证技术需要安全性和易用性的平衡。基于大数据的身份认证通过收集用户、设备等行为数据,分析获得用户和设备的行为特征,并判断当前认证是否满足已有特征,如不满足则叠加多种认证方式。因此也被称为自适应(Adaptive)或基于风险(Risk-based)认证。大数据身份管理的核心是风险的判定,依赖于用户行为(例如时间、IP)和设备行为(例如设备号、失败次数),通过安全策略控制认证方式,黑客可能窃取账号、密码之后也无法完成认证。同时,对于绝大多数正常用户可以简化认证流程。
反欺诈是大数据安全应用的另一类场景,例如Yahoo和Thinkmail利用大数据分析技术过滤垃圾邮件,DataVisor提供恶意账户识别技术帮助Yelp减少虚假评论。这类欺诈行为跟业务流程直接相关,用户的刷单、刷奖类营销欺诈,盗卡类交易欺诈以及商户和用户串谋欺诈等场景识别不尽相同。通过收集设备数据、用户数据和业务数据,结合机器学习技术,欺诈管理可以识别欺诈特征,提升欺诈成本。
当然,大数据作为新型安全技术也带来多方面挑战。首先是数据的可信度,大数据安全的效果严重依赖数据质量,低质量的数据可能导致错误的结论。机器产生数据的可靠性具有保障,但也无法完全避免伪造或刻意制造的数据。因此需要从数据来源的真实性、数据传播途径和数据处理过程等多方面确保数据的可信。其次,用户隐私保护也成为各方关注焦点,通过数据碎片还原出有价值的信息,可能属于数据拥有者不愿意被披露的敏感数据。大数据安全也需要从大数据存储、搜索和计算等多方面全面考虑用户的隐私保护问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10