京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阻碍大数据成功的常见问题
缺乏熟练的数据专业人员(例如资源和内部技术能力)是很多企业面临最大的问题,此外,还缺乏高价值的商业案例。如今,为了收集大数据状态的见解,行业媒体与来自20家企业的22位高管进行了交流,他们主要从事大数据工作,或为客户提供大数据解决方案。
当人们问:“你们认为阻止企业获得大数据的好处的最常见的问题是什么?”以下是这些高管给出的答案:相信如果企业建立一个大数据湖,其结果变得明显。数据管理是一个问题。计划预期成果和企业想要实现的见解。思考如何进行更多的高级分析。使用正确的工具作业。确定要在数据仓库中使用的内容。企业不了解业务层面的大数据。他们没有确定他们需要解决的业务问题,了解什么是正常工作,以及可以做些什么来增加价值。
一半的IT项目正在整合应用程序。获取访问权限如何清理和应用数据治理,看到两个整合,以及有能力外包的厂商?虽然平台的访问费用较低,hadoop和Cassandra的进入障碍可能很高。
需要对不同的格式进行归一化,收集,洞察,标记,并采用可搜索的格式。
一个常见的问题是简单地低估了实现一个功能齐全的大数据系统的难度。还有很多其他的工具也会让企业开始,很多开放源码是伟大的沙盒,但对于生产级大数据系统是完全不同的。随着业务需求的变化,保持系统的运行和发展是另一个重大挑战。人们一再听到同样的故事,他们了解大数据解决方案,并说:“感谢这个想法,我们有一些大数据体验,我们认为自己也可以建立。”通常,这些团队在几个月后将会表示,这比我们想像的还要难。
能够动态地连接不同的来源,尽可能地保持工作的进程,使他们能够专注于更高层次的活动。复杂性加剧了整合和实施数据所需的技能。尝试将所有数据集中在一起,以便企业可以更改访问数据的80:20比例,并分析其数据。企业找不到需要查找的数据,因为它有太多的数据。有些文件名是神秘的,害怕给人们访问数据,因为不知道数据是什么。企业需要摄取,编目和查找数据。
惯性。没有开始
由公司的能力而异。对大数据集群的认知是10到50个,只有少数几个客户拥有数千个节点。开始运行并及时了解版本,而工具的标准化成为额外的工作。文化。大公司受益于大数据分析,摆脱项目必须成功的假设,允许失败和学习,允许迭代和实验。像西门子和菲利普斯这样的创新领导者可以向业务团队展示当允许失败时可以获得多大的成功。固定特定技术。确定正在尝试解决什么问题,并准备随着时间推移。拥有合适的人选。人才问题很大。企业必须有合格的候选人。数据科学家必须保持技术前沿,知道哪些工具正在发展以解决问题。
他们需要指导。生态系统正在迅速发展,企业必须处于不利地位,才能知道问题的最佳解决方案。Spark需要从存储密集型到计算密集型的不同架构。对于具有传统系统的传统企业而言更为困难。他们倾向于更加缓慢而有条不紊地采取行动。行业厂商为银行和保健公司创建了一个商业价值顾问团队。有客户设定具体目标(即减少4%的流失)达到或超过目标,然后转到下一个项目。开源的速度对大多数人来说是压倒性的。企业需要知道接下来会发生什么,所以可以相应地进行规划。行业厂商正在推动开放标准,使客户更加灵活,拥有更多技能和便携性的市场。在云计算和本地的大数据方面保证灵活性。
缺乏资源和内部的技术能力。每个人都需要了解人们在自己的网站和博客上做了什么。有几个好产品可以告诉你这些事情,比如MixPanel和Google Analytics(谷歌分析),而不再需要数据科学家的帮助。存在于孤岛的数据:太难以及时并入并提取有意义的见解。存储和忘记大数据的方法:没有明确的分析大数据的策略来实现业务收益。技能缺口:大数据系统/工具太复杂,无法用于大多数员工。收集涉及特定个人行为的数据时,担心法律问题。在B2B中,这是一个真正的关注点。“数据足够好”的问题总是发挥作用。这是一个有效的关注,但是没有做任何事情都没有回答这个问题。。如果你失败了,就会知道你的数据收集应该在哪里改善。企业明白可以应用的用例,但它是一种新型的项目,目前还没有很多系统集成商可以支持它们。
无法界定明确的业务目标。获得具有技能的人实现目标。没有足够的人拥有提供大型数据项目所需的知识和经验。软件工程师不仅要了解概念和可能性,还要了解如何提供。人们经常认为他们需要数据科学家,但他们需要产品所有者,数据工程团队,数据科学家等等。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07在数据分析师的工作闭环中,数据探索与统计分析是连接原始数据与业务洞察的关键环节。CDA(Certified Data Analyst)作为具备专 ...
2026-01-07在数据处理与可视化场景中,将Python分析后的结果导出为Excel文件是高频需求。而通过设置单元格颜色,能让Excel中的数据更具层次 ...
2026-01-06在企业运营、业务监控、数据分析等场景中,指标波动是常态——无论是日营收的突然下滑、用户活跃度的骤升,还是产品故障率的异常 ...
2026-01-06在数据驱动的建模与分析场景中,“数据决定上限,特征决定下限”已成为行业共识。原始数据经过采集、清洗后,往往难以直接支撑模 ...
2026-01-06在Python文件操作场景中,批量处理文件、遍历目录树是高频需求——无论是统计某文件夹下的文件数量、筛选特定类型文件,还是批量 ...
2026-01-05在神经网络模型训练过程中,开发者最担心的问题之一,莫过于“训练误差突然增大”——前几轮还平稳下降的损失值(Loss),突然在 ...
2026-01-05在数据驱动的业务场景中,“垃圾数据进,垃圾结果出”是永恒的警示。企业收集的数据往往存在缺失、异常、重复、格式混乱等问题, ...
2026-01-05在数字化时代,用户行为数据已成为企业的核心资产之一。从用户打开APP的首次点击,到浏览页面的停留时长,再到最终的购买决策、 ...
2026-01-04在数据分析领域,数据稳定性是衡量数据质量的核心维度之一,直接决定了分析结果的可靠性与决策价值。稳定的数据能反映事物的固有 ...
2026-01-04