京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阻碍大数据成功的常见问题
缺乏熟练的数据专业人员(例如资源和内部技术能力)是很多企业面临最大的问题,此外,还缺乏高价值的商业案例。如今,为了收集大数据状态的见解,行业媒体与来自20家企业的22位高管进行了交流,他们主要从事大数据工作,或为客户提供大数据解决方案。
当人们问:“你们认为阻止企业获得大数据的好处的最常见的问题是什么?”以下是这些高管给出的答案:相信如果企业建立一个大数据湖,其结果变得明显。数据管理是一个问题。计划预期成果和企业想要实现的见解。思考如何进行更多的高级分析。使用正确的工具作业。确定要在数据仓库中使用的内容。企业不了解业务层面的大数据。他们没有确定他们需要解决的业务问题,了解什么是正常工作,以及可以做些什么来增加价值。
一半的IT项目正在整合应用程序。获取访问权限如何清理和应用数据治理,看到两个整合,以及有能力外包的厂商?虽然平台的访问费用较低,hadoop和Cassandra的进入障碍可能很高。
需要对不同的格式进行归一化,收集,洞察,标记,并采用可搜索的格式。
一个常见的问题是简单地低估了实现一个功能齐全的大数据系统的难度。还有很多其他的工具也会让企业开始,很多开放源码是伟大的沙盒,但对于生产级大数据系统是完全不同的。随着业务需求的变化,保持系统的运行和发展是另一个重大挑战。人们一再听到同样的故事,他们了解大数据解决方案,并说:“感谢这个想法,我们有一些大数据体验,我们认为自己也可以建立。”通常,这些团队在几个月后将会表示,这比我们想像的还要难。
能够动态地连接不同的来源,尽可能地保持工作的进程,使他们能够专注于更高层次的活动。复杂性加剧了整合和实施数据所需的技能。尝试将所有数据集中在一起,以便企业可以更改访问数据的80:20比例,并分析其数据。企业找不到需要查找的数据,因为它有太多的数据。有些文件名是神秘的,害怕给人们访问数据,因为不知道数据是什么。企业需要摄取,编目和查找数据。
惯性。没有开始
由公司的能力而异。对大数据集群的认知是10到50个,只有少数几个客户拥有数千个节点。开始运行并及时了解版本,而工具的标准化成为额外的工作。文化。大公司受益于大数据分析,摆脱项目必须成功的假设,允许失败和学习,允许迭代和实验。像西门子和菲利普斯这样的创新领导者可以向业务团队展示当允许失败时可以获得多大的成功。固定特定技术。确定正在尝试解决什么问题,并准备随着时间推移。拥有合适的人选。人才问题很大。企业必须有合格的候选人。数据科学家必须保持技术前沿,知道哪些工具正在发展以解决问题。
他们需要指导。生态系统正在迅速发展,企业必须处于不利地位,才能知道问题的最佳解决方案。Spark需要从存储密集型到计算密集型的不同架构。对于具有传统系统的传统企业而言更为困难。他们倾向于更加缓慢而有条不紊地采取行动。行业厂商为银行和保健公司创建了一个商业价值顾问团队。有客户设定具体目标(即减少4%的流失)达到或超过目标,然后转到下一个项目。开源的速度对大多数人来说是压倒性的。企业需要知道接下来会发生什么,所以可以相应地进行规划。行业厂商正在推动开放标准,使客户更加灵活,拥有更多技能和便携性的市场。在云计算和本地的大数据方面保证灵活性。
缺乏资源和内部的技术能力。每个人都需要了解人们在自己的网站和博客上做了什么。有几个好产品可以告诉你这些事情,比如MixPanel和Google Analytics(谷歌分析),而不再需要数据科学家的帮助。存在于孤岛的数据:太难以及时并入并提取有意义的见解。存储和忘记大数据的方法:没有明确的分析大数据的策略来实现业务收益。技能缺口:大数据系统/工具太复杂,无法用于大多数员工。收集涉及特定个人行为的数据时,担心法律问题。在B2B中,这是一个真正的关注点。“数据足够好”的问题总是发挥作用。这是一个有效的关注,但是没有做任何事情都没有回答这个问题。。如果你失败了,就会知道你的数据收集应该在哪里改善。企业明白可以应用的用例,但它是一种新型的项目,目前还没有很多系统集成商可以支持它们。
无法界定明确的业务目标。获得具有技能的人实现目标。没有足够的人拥有提供大型数据项目所需的知识和经验。软件工程师不仅要了解概念和可能性,还要了解如何提供。人们经常认为他们需要数据科学家,但他们需要产品所有者,数据工程团队,数据科学家等等。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02