京公网安备 11010802034615号
经营许可证编号:京B2-20210330
七个必定使数据分析失败的方式
数据分析正迅速成为赢得业务战略的关键。但是如果没有正确的方法、技巧和策略,你的数据举措可能永远没有结果。
数据分析已经成为企业最重要的业务和技术的差异化要素之一,数据分析使企业能够深入了解其运营的方方面面,从而在竞争中获得优势。
调研公司Gartner今年早些时候预测,2017年将是数据和分析成为主流的一年,为已经为转型做好准备的组织内外创造价值。Gartner表示,数据分析的方法正在变得更加整体化,涵盖整个业务。
Gartner的研究报告显示,在主要趋势中,分析将推动现代业务运营,而不仅仅是反映其绩效。企业将创建端到端的架构,这些架构考虑到了组织核心乃至组织边缘的数据管理和分析;高管们将数据和分析作为业务战略的一部分,使数据和分析专业人员能够发挥新的作用并创造业务增长。
公司正在为分析工具投入大量资金。国际数据公司(International Data Corp.)在2017年3月的一份报告中预测,今年全球大数据和业务分析的收入将达到1508亿美元,比2016年增长12%,该公司预计增长会一直持续到2020年,届时收入将超过2100亿美元。
然而在数据分析被反复强调的请况下,很多组织还是陷入了损害或浪费分析的真正价值的陷阱。根据IT领导者和行业专家的说法,以下是七个必定使数据分析失败的方式。
1. 急于试水,却不知道自己在找什么
如果你不知道在数据中需要检查哪些具体的趋势或信号,你怎么能期望从中获得真正的价值呢?
德勤分析(Deloitte Analytics)的高级顾问、《逐鹿分析:新的制胜之道》一书的作者Tom Davenport说:“分析过程中最大的问题是你不知道自己在找什么数据。”
Davenport说:“数据挖掘让系统找出数据中的有趣之处的理念使很多公司误入歧途。即便使用机器学习,从数据关系的角度来了解你正在寻找的东西也是大有裨益的。”
天气网站Weather.com的质量保证经理Todd Eaton说:“Weather.com强调要找到‘知道如何查询数据并能完整而准确地讲述数据要传达的含义的人’。”
Eaton说:“合适的人员对使用数据回答问题充满激情,然后愿意不断质疑他们的发现,确保数据不仅适合叙事,而且能够解释我们所看到的事物并有助于预测未来发展的目标。重要的是,每个人都知道我们正在试图发现数据和我们的总体目标,并收集一致的测量结果和数据。”
启动分析工作时,缺乏重点肯定会导致失败。通用电气公司的首席数据官Christina Clark表示:“当数据团队把重点放在优先考虑的成果上时,他们将是最成功的。团队往往会失败,因为他们希望立即解决很多的业务需求,最终由于精力过分分散而没有产生有意义的影响来保持兴趣或维持资金来源。”
2. 建立(维护)自己的基础设施
建立和维护自己的大数据基础设施可能是一个巨大的诱惑。但这可能会危及你的分析工作的使命。
网络安全公司Vectra的首席技术官Oliver Tavakoli表示:“这往往浪费了数据科学家大量时间,而不是实际开发更好的分析。”
Tavakoli说:“我们知道我们需要大量的数据来进行分析。我们开始做大家都要求做的事情:我们买了一堆有大量磁盘容量的服务器,我们把它们放在托管设施里,我们用Apache Spark创建了自己的Hadoop集群,并让我们的数据科学家编写Scala代码与集群进行交互。”
有时由于硬件故障,集群会中断,更多的时候是由于软件故障。软件包会过时,有时几小时过去了,集群都处在不可用的状态。
Tavakoli说:“我们终于有了足够的资源并决定将这部分问题外包出去。自打Vectra与外部供应商合作之后,它就很少花时间在这些基本问题上,“我们几乎所有的时间都致力于将数据提供给系统并分析其中的数据”,他这样说道。
3. 成为数据分割者,而不是数据统一者
长期以来,企业一直在努力解决阻止各部门共享信息的“数据孤岛”问题,从而使整个机构受益。分析也遇到了同样的挑战。
客户生命周期管理营销公司Zeta Global的首席信息官Jeffry Nimeroff说,统一不同的数据就是一个很好的最佳实践。
Nimeroff表示:“每个数据孤岛都会在能产生价值相互连接之间形成一个障碍。例如,考虑一个丰富的用户配置文件连接或断开网站活动数据。可以互连的数据越多越好,因为在这些互连里才能找到预测能力。”
Nimeroff说,这并不意味着必须将所有数据从初始系统移动到一个整体。他说:“相反,我们使用其中一种现代集成技术来提供统一的数据视图,而这一切都在当前的系统中。”
4. 回避良好的数据卫生
如果你正在分析的数据不准确、不是最新的、且没有条理,那么分析的价值可能会急剧下降。
Nimeroff说:“错进错出(garbage in, garbage out)是原始业务数据的容量和范围扩大的问题,最好的数据分析团队要质量渗透,因此,建立流程并利用技术来执行质量标准是一个必胜的组合。”
Nimeroff说,在流程方面,确保流程的可重复性以及对结果的可审计性是非常重要的。在技术方面,他说,部署包括分析、元数据管理、清理、采购等数据质量工具有助于确保获得更好的高质量数据。
Tavakoli说:组织需要使用工具来“清除碎片”——不完整和破坏的数据——并且从不同的来源获取数据,以使其兼容且易于理解,并尽可能简化分析。尽可能使数据一目了然,以便团队的所有成员都了解各种数据的意义。”
技术服务公司Incedo的首席执行官TP Miglani说,高质量的数据“是产生有用洞察的关键动力”。他说:“你需要建立数据仓库和数据湖泊,把结构化和非结构化的数据汇集在一起。成功的组织会确保他们会用清理、计算缺失值,并准确地标记数据来提高数据的质量。”
良好的数据卫生也意味着保持数据尽可能是最新的。Nimeroff说,数据需要新鲜度,“数据宇宙”要不断膨胀,企业才能从分析中获得价值。
Nimeroff说:“数据新鲜度要求了解当前数据采集过程的时效性。显然,一个系统越实时,新鲜度就越高。也可以通过使用第三方服务来支持新鲜度,以加强你现有的技术和流程。”
5. 放弃分析计划的高管赞助
与其它类型的重大IT项目一样,没有数据分析项目的高级管理人员的领导能力可能对成功不利。
Miglani说:“分析团队的目标是通过将数据与公司的战术和战略决策相结合来产生洞察。一个失败的例子就是如果一个数据科学团队做了大量的数据分析,开发出了准确的预测模型,但是结果并没有被实施,因为它需要组织和文化的变革。”
Clark说,建立数据管理基础需要多年持续不断的努力。他说:“数据和分析团队要促进的一些工作不会有立竿见影的效果,这可能与业务合作伙伴的预期不一致。这需要强有力的领导层支持,以及努力教育业务合作伙伴,以实现更加趋于数据驱动的未来。”
6. 忽略中层和下层管理者
数据科学家在真空中进行的分析和其他那些没有从最亲近分析需求的业务经理得到可靠输入的专家不太可能成功。
服务管理软件供应商Astea International的首席运营官David Giannetto表示:“如果没有中低层管理人员的积极参与,分析团队提供的信息往往不能真正地帮助管理层团队更好地完成工作。”
Giannetto说:“信息将是定向的,信息会指出更大的流程缺陷或可以改进的地方,但是管理层早晚要着手处理——当他们有时间的时候。而大多数管理者从来都没有多余的时间。只有当团队由真正懂业务的人组成,以及业务实际上每天都需要访问信息时,传递的信息才足以对业务产生积极影响。”
Giannetto说,如果分析能够告诉用户真正的问题在哪里——哪里可能会出现问题——他们有足够的时间来阻止问题,他们每天都使用这些信息,那么这一举措将会取得成功。
7. 缺乏支持良好数据分析的文化和技能
这对于组织来说是一个普遍的问题,很大程度上是因为数据科学这样的技术很难获取。但是,如果数据素养不是公司文化的核心,分析失败的可能性更大。
Miglani说:“对于不熟悉分析的人来说,数据科学被认为是解决问题的一种神奇的方式。预测和自学的概念很难让人掌握。要说服你的商业伙伴在不透明的算法上作出决策是很难的。你需要先教育他们。“
而且组织机构在继续努力寻找具有分析技能的数据科学家和其他专业人员。Miglani说:“培养这种能力的最好方法之一是培养这种才能,而不是在组织外物色超级明星。很多项目失败或者推迟,就是因为公司无法按时聘请或大量流失分析人员。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27