京公网安备 11010802034615号
经营许可证编号:京B2-20210330
解决七大问题释放大数据力量
要充分发挥大数据的潜力,必须解决几个问题。
数据政策。随着数量越来越多的数据被数字化,在跨越组织边界而流动着,一系列政策问题将会越来越重要,这包括但不限于隐私、安全、知识产权和责任。显然,随着大数据的价值愈加明显,隐私是个重要性(尤其是对消费者来说)不断提高的问题。个人数据(例如健康和财务记录)经常能够提供最重要的人类福利,例如,帮助准确确定适当的医疗或者最恰当的金融产品。然而,消费者也将这些类别的数据视为最敏感的。显然,个人和其生活所在的社会将不得不努力在数据隐私和数据的功用之间权衡取舍。
另一个密切相关的担忧是数据安全--例如,如何保护竞争方面敏感的数据或者应该保持隐私的其他数据。最近的例子表明,数据被盗不仅暴露消费者个人信息和企业保密信息,甚至还会暴露国家安全秘密。鉴于严重的数据被盗事件有增无减,通过技术和政策工具解决数据安全问题将成为关键。
大数据日益提高的经济意义也提出了一系列法律问题,尤其是当与如下事实联系起来时:数据与许多其他资产具有根本性的差异。数据可以与其他数据结合起来完美而轻松地复制。同样一份数据可以由多个人同时使用。这些是数据与实体资产相比的独有特征。有关数据所附带的知识产权的问题不容回避:何人“拥有”某份数据,某一数据集附带着何种权利?数据的“公平使用”的定义是什么?此外,还有与责任相关的问题:当一份不准确的数据导致负面结果时谁应负责?要充分发挥大数据的潜力,此类法律问题需要澄清,也许会随着时间的推移逐步澄清。
技术和技能。要通过大数据获取价值,组织将不得不部署新的技术(例如存储、计算和分析软件)和技能(也就是新的分析类型)。技术难题的范围以及解决它们的优先次序将因机构的数据成熟度而异。以前遗留下来的旧系统和不兼容的标准和格式也常常会妨碍数据与能够通过大数据创造价值更尖端分析工具的整合。新的问题和不断提高的计算能力将刺激新型分析技能的开发。另外,人们还需要(技术和技能方面的)持续创新,以帮助个人和组织整合、分析、可视化和消费不断扩大的数据洪流。
组织变革和人才。组织领导往往对大数据蕴含的价值以及如何释放这一价值缺乏了解。在竞争性部门中,这对某些企业来说可能是阿喀琉斯之踵,因为它们那些站住阵脚的竞争对手(以及新进入者)可能会利用大数据与之竞争。正如我们指出的那样,许多组织没有现成的人才从大数据中获得洞察。此外,当前许多组织并没有适当构建工作流和激励措施以便优化大数据的使用,从而做出更好的决策并采取更有根据的行动。
使用大数据将成为现有企业的一个关键竞争领域,并将会创造新的竞争对手,它们能够吸引具备大数据世界关键技能的人才。
数据访问权。为了促成变革性的机遇,各企业将越来越需要整合来自多个数据源的信息。有些情况下,组织能够购买数据访问权。而另外有些情况下,第三方数据访问权往往并非能够轻易获得。第三方数据来源也许并未考虑分享这些数据。有时,经济激励措施并未协调一致以鼓励利益相关方分享数据。持有某一数据集的利益相关方也许将其视为一种竞争优势的来源,因此不愿意与其他利益相关方分享。其他利益相关方必须找到适当方式,向有价值数据的持有者提供富有说服力的价值主张。
行业结构。竞争强度和业绩透明度相对缺乏的部门,以及利润池高度集中的行业,在充分把握大数据的益处方面,可能步伐较慢。例如,在公共部门,由于缺乏竞争压力,效率和生产率受到限制;由此,该部门在通过运用大数据获取价值时面临着比其他部门更困难的障碍。美国医疗卫生是另一个例子,说明了行业结构可如何影响通过大数据获取价值的难易程度。该部门不仅缺乏成本和质量方面的业绩透明度,而且缺乏一种让参与者通过使用临床数据获得收益的行业结构(减少在不必要的治疗方面的支出)。然而,费用支付者取得的收益要由提供者来承受代价(收费的医疗活动减少),支付者又不得不从提供者那里获取临床数据。正如这些例子所表明的,组织领导和政策制定者将不得不考虑在大数据世界中行业结构应如何演变,以确定如何在单个公司、部门以及整个经济体的层次上优化价值创造过程。
有效使用大数据有可能改变经济格局,带来新一波的生产率增长和消费者剩余价值创造。使用大数据将成为现有企业的关键竞争基础,并将会创造能够吸引具备大数据世界关键技能的雇员的新竞争对手。组织领导需要认识到大数据所带来的潜在机会以及战略威胁。然后,他们应评估并弥补其目前的IT能力和数据战略与把握相关数据机会所需要的能力及战略之间的差距。领导者在决定可以将哪些数据池组合起来以创造价值和如何获得这些数据池的访问权时,以及在解决安全和隐私问题时,应具有创造性和前瞻性。就隐私和安全这一主题,当前的问题可包括帮助消费者了解使用大数据的收益和风险。同时,企业要在数据方面做到更为明智,需要招募并留住能够进行深入分析的人才,并留住自己的分析师和管理人员,建立一种在决策过程中重视大数据的使用并予以奖励的文化。
政策制定者需要认识到利用大数据释放其经济的下一波增长这一潜力。他们需要提供相应的制度框架,以便企业能够轻松通过数据创造价值,同时又可保护公民隐私并提供数据安全。他们还可以在通过教育和移民政策帮助缓解人才短缺方面,以及落实技术推动因素(包括诸如通信网络等基础设施)方面,发挥重要作用。此外,政策制定者必须确保加速进行选定领域(包括先进分析工具)的研究以及创造能够鼓励创新的知识产权框架。能够协调激励措施的创造性解决方案也是必需的--比如,包括要求分享某些数据以推动公共福利。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22