京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阻碍大数据成功的常见问题
缺乏熟练的数据专业人员(例如资源和内部技术能力)是很多企业面临最大的问题,此外,还缺乏高价值的商业案例。如今,为了收集大数据状态的见解,行业媒体与来自20家企业的22位高管进行了交流,他们主要从事大数据工作,或为客户提供大数据解决方案。
当人们问:“你们认为阻止企业获得大数据的好处的最常见的问题是什么?”以下是这些高管给出的答案:相信如果企业建立一个大数据湖,其结果变得明显。数据管理是一个问题。计划预期成果和企业想要实现的见解。思考如何进行更多的高级分析。使用正确的工具作业。确定要在数据仓库中使用的内容。企业不了解业务层面的大数据。他们没有确定他们需要解决的业务问题,了解什么是正常工作,以及可以做些什么来增加价值。
一半的IT项目正在整合应用程序。获取访问权限如何清理和应用数据治理,看到两个整合,以及有能力外包的厂商?虽然平台的访问费用较低,hadoop和Cassandra的进入障碍可能很高。
需要对不同的格式进行归一化,收集,洞察,标记,并采用可搜索的格式。
一个常见的问题是简单地低估了实现一个功能齐全的大数据系统的难度。还有很多其他的工具也会让企业开始,很多开放源码是伟大的沙盒,但对于生产级大数据系统是完全不同的。随着业务需求的变化,保持系统的运行和发展是另一个重大挑战。人们一再听到同样的故事,他们了解大数据解决方案,并说:“感谢这个想法,我们有一些大数据体验,我们认为自己也可以建立。”通常,这些团队在几个月后将会表示,这比我们想像的还要难。
能够动态地连接不同的来源,尽可能地保持工作的进程,使他们能够专注于更高层次的活动。复杂性加剧了整合和实施数据所需的技能。尝试将所有数据集中在一起,以便企业可以更改访问数据的80:20比例,并分析其数据。企业找不到需要查找的数据,因为它有太多的数据。有些文件名是神秘的,害怕给人们访问数据,因为不知道数据是什么。企业需要摄取,编目和查找数据。
惯性。没有开始
由公司的能力而异。对大数据集群的认知是10到50个,只有少数几个客户拥有数千个节点。开始运行并及时了解版本,而工具的标准化成为额外的工作。文化。大公司受益于大数据分析,摆脱项目必须成功的假设,允许失败和学习,允许迭代和实验。像西门子和菲利普斯这样的创新领导者可以向业务团队展示当允许失败时可以获得多大的成功。固定特定技术。确定正在尝试解决什么问题,并准备随着时间推移。拥有合适的人选。人才问题很大。企业必须有合格的候选人。数据科学家必须保持技术前沿,知道哪些工具正在发展以解决问题。
他们需要指导。生态系统正在迅速发展,企业必须处于不利地位,才能知道问题的最佳解决方案。Spark需要从存储密集型到计算密集型的不同架构。对于具有传统系统的传统企业而言更为困难。他们倾向于更加缓慢而有条不紊地采取行动。行业厂商为银行和保健公司创建了一个商业价值顾问团队。有客户设定具体目标(即减少4%的流失)达到或超过目标,然后转到下一个项目。开源的速度对大多数人来说是压倒性的。企业需要知道接下来会发生什么,所以可以相应地进行规划。行业厂商正在推动开放标准,使客户更加灵活,拥有更多技能和便携性的市场。在云计算和本地的大数据方面保证灵活性。
缺乏资源和内部的技术能力。每个人都需要了解人们在自己的网站和博客上做了什么。有几个好产品可以告诉你这些事情,比如MixPanel和Google Analytics(谷歌分析),而不再需要数据科学家的帮助。存在于孤岛的数据:太难以及时并入并提取有意义的见解。存储和忘记大数据的方法:没有明确的分析大数据的策略来实现业务收益。技能缺口:大数据系统/工具太复杂,无法用于大多数员工。收集涉及特定个人行为的数据时,担心法律问题。在B2B中,这是一个真正的关注点。“数据足够好”的问题总是发挥作用。这是一个有效的关注,但是没有做任何事情都没有回答这个问题。。如果你失败了,就会知道你的数据收集应该在哪里改善。企业明白可以应用的用例,但它是一种新型的项目,目前还没有很多系统集成商可以支持它们。
无法界定明确的业务目标。获得具有技能的人实现目标。没有足够的人拥有提供大型数据项目所需的知识和经验。软件工程师不仅要了解概念和可能性,还要了解如何提供。人们经常认为他们需要数据科学家,但他们需要产品所有者,数据工程团队,数据科学家等等。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21