京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代如何应对大数据安全问题
这是明确的大数据时代,但它不一定是保证大数据安全的时代。有些大型企业的数据库遭到了可怕的大规模破坏,包括家得宝、塔吉特、NiemenMarcus,以及最近的阿什利麦迪逊公司。大多数大数据的收集器做得远远不够,不能保障自己宝贵的信息不被窥视。如果没有从消费者到生产商,再到供应商的安全协议的重大变化,大数据成为恶意黑客的目标的吸引力增加。
不幸的是,有一些阻止数据采集器最大充分保护他们的数据的问题。然而,针对这些问题的解决方案可以确保未来大数据的长期案例-只要你和其他人制定他们。
主要的大数据安全挑战
传统的安全机制,如防火墙和防病毒软件目前安装在你的计算机上,但却不足以保障大数据。问题是,这些措施是为了保护小规模、静态信息的文件,你有许多保存在你的硬盘的信息,而不是来自云计算的百万兆字节信息。相反,对于大数据的安全必须是灵活的和快速的,允许快速流和多个入口。
专家在与云安全联盟的成员(一个确定改善云安全非营利性组织)的对话中发现了一些现代企业使用大数据的方式的弱点,这些措施包括:
·安全计算的分布式编程框架。执行多个计算阶段的程序必须有多重保护:一个用于程序,一个保护程序中的数据。
·非关系数据存储的安全性。也被称为NoSQL,非关系型存储的不断进化,当他们这样做,适当的安全必须随着它们一起发展成熟。
·安全数据存储。在过去,当数据在层间移动时,IT管理人员可以直接控制,但对于大数据,很难进行直接控制。而自动分层需要额外的安全机制。
·端点输入验证。当一个系统接收到数以百万计的输入数据时,作为大数据收集通常是这样做的,必须确保每一个输入数据是可信的和有效的。
·实时安全监控。到目前为止,实时的安全在查明真正的安全威胁方面并不是优秀的,而每天都在产生数以千计的假信息。
·数据挖掘和保护隐私的分析。大数据离真实隐私的数据只有一步之遥,因为它可以不经过消费者的意识或同意,编辑强烈的私人信息。
·加密访问控制和安全通信。为了全面安全,数据必须加密终端到终端的数据,但它也必须是有效的,并提供给需要它的那些人。
·细粒度访问控制。不是所有的数据都是同样要保密,企业应该能够过滤他们的安全,尽可能多地分享,同时保持最敏感的信息安全。
·可扩展的审计。要学习违反安全性,必须有详细的审核可供审查;然而,由于大数据的大小规模,这些报告也必须是可扩展到这一事件。
·数据源。数据源的出处复杂性继续在增长,但分析的源图表已经满足计算能力的要求。
提高大数据安全有效性的建议
云计算专家认为,对大数据安全的改进,最明智的指南是已经有几十年的历史的杀毒软件行业。杀毒软件公司应对各种不同的威胁有很多的经验。有无数的杀毒软件商都在为此努力,并都尝试过保护数据免受讨厌的数字错误的渗透。
然而,云计算专家最看重杀毒行业的是其对数据的开放性。而不是锁定了他们的安全机密,获得对竞争对手的优势,反病毒厂商(包括非政府组织,公共机构,甚至是民营企业)都会自由地沟通交流威胁的数据。行业领导者可以一同抵制新的和危险的恶意软件,并保证无处不在的电脑安全。这种开放的沟通和缺乏破坏性竞争的正是大数据需要快速高效地构建强大的安全性所需要的。
目前,像云安全联盟组织正在试图为云保护进行合作,但目前还没有产生足够的信任,在行业创造真正的进步。你应该支持这些组织和团队的努力,以确保大数据获得强大的未来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22