京公网安备 11010802034615号
经营许可证编号:京B2-20210330
企业大数据的实施要循序渐进
大数据带来的强大功能令人难以抗拒,它承诺将规模庞大且持续增长的数据转化为能为企业所利用的、涉及业务方方面面的宝贵情报。然而,这种诱惑的背后同样可能存在陷阱;如果不做详尽规划,技术消费很可能成为拖累企业的沉重包袱。
"大数据常常也带来巨大的消费风险,"NPI公益发展组织的IT采购管理顾问Jeff Muscarella指出。Muscarella警告称,即使是在用户已经对硬件、软件以及服务等内容支付过费用,大数据项目仍然能够轻而易举地带来百万美元级的增项支出。此外,不要被供应商拿出的所谓实际案例所蒙蔽,深入研究你可能会发现这些实例根本不像厂商吹嘘的那么出彩。
"在大部分情况下,只要我们能抽丝剥茧地将案例分解进行调查,就会意识到其中有很多虚假的成分,"他解释道。当然,这并不是说我们不该尝试引入大数据技术,Muscarella补充称。不过企业在着手进行采购之前,务必要深入研究、广泛收集信息。我们当然不应该为了花钱而花钱,只有在大数据项目确实能为业务提升带来帮助的前提下,这样的大动作才有意义。
"这不仅仅是一种新技术,"Muscarella表示。"确切来说,这是一种专为解决那些我们无法确定是否存在的业务问题而衍生的技术,CIO们一定得清楚这一点。目前对于大多数IT领导者来说,大数据究竟能带来哪些好处、其运作机制如何等等仍然是相当陌生的话题,甚至仅仅停留在概念层面。因此在部署之前,决策者必须勇于提问:新技术真能提升效益吗?如何提升、需要多长时间才能见效?在部署工作中,我们需要安排哪些基础设施建设?IT领导者们必须拿出一百二十分的关注度应对这类新项目,只有这样大数据这只"钱老虎"才可能真正为企业带来投资回报。
对待大数据:抛砖引玉、循序渐进
初次探索大数据项目时,千万别一起手就搞得声势浩大、劳民伤财,Muscarella提醒道。最好的方法是用Apache Hadoop这类开源工具先弄个试点案例,看看究竟收效如何。
"谁的钱也不是大风吹来的,所以相信各位一定希望投资能切实见效,"Muscarella指出。"先选一些可管理性较强的工具,小范围验证自己对大数据的认识。举例来说,如果我们的确能从试点案例中发掘到数据的价值、网络点击量的背后意义或者用户的消费习惯,接下来再深入思考如何利用这些结论改善企业的业务流程。"[page]
"千万不要陷入无限升级基础设施的怪圈,这种倾向非常危险,"他补充道。"先验证效果,再回头规划自己的具体实施方案。即使最后的结果证明大家一开始的选择是正确的,我们也不必为搞试点而后悔。毕竟这么做最稳妥、风险最小,明智的管理者绝不会在项目还充满不确定因素时就盲目加大资金投入。"
一旦业务需求核准完毕,接下来我们才能开始讨论大数据项目需要哪些基础设施支持。大数据项目的规模往往以PB、甚至是EB计,因此大家必须保证自己的存储基础设施能够跟上这种庞大的资源需求。Muscarella认为,尽管供应商们总是奉劝用户使用同一家存储服务商的产品以提高设施标准化程度,但他仍然建议我们利用存储虚拟化技术将竞争机制引入产品选择。这样我们不仅能够有效降低风险,更不必劳神于某一家服务商的架构能否适应未来的技术发展趋势。
"不要指望通过一家供应商获得所谓的标准化,"他表示。"最科学的办法是将资源需求分散解决,一部分交给云平台、另一部分交给企业内部的数据中心。总之,一定要让自己手头拥有足够的选择权,否则一旦被套牢,大家很可能就此泥足深陷。"
说到这里,他结合自身经历举了个实例。原先他曾为一家医院处理IT事务,当时院方领导就坚持采用同一家服务供应商的标准化产品。项目初期形势看起来还不错,他告诉我们,然而在经过数年的逐步升级后,院方终于发现自己已经被牢牢套死在同一家供应商手上。尽管到这时产品与服务已经与他们的需求相去甚远,但情况已经无法逆转,供应商已然掌握了所有的主动权。
"可以说,大家手中的备选方案越多,服务所带来的实际效果也就越好,"Muscarella评论道。"因此务必尽量使用多家服务厂商。另外,在确定升级周期等后续细节时,一定要在协议中努力为自己争取权益;只有让供应商明白我们其实随时可以选择其它服务,他们才会尽心竭力、老老实实地支持我们的业务。"
值得一提的是,存储机制同样需要倾注我们的心力与管理策略。首先,确保我们的设备支持费用处于合理的范围;其次是弄清楚存储产品组合方案中淘汰掉的硬件如何处理、采用什么样的周期,并在谈判中努力维护自己的利益、严格控制硬件成本。
在购置数据收集及分析类商务智能软件时,不妨先花点小钱做做评估
数据发掘及商务智能软件与服务在商业实例中经常会用到。也就是说供应商在兜售这类产品时,肯定会列举商业实例;而为了进一步打动企业客户,他们还要"附赠"免费业务分析服务,Muscarella指出。他们会派出几位顾问,对大家的企业环境及业务流程进行为时数天的调查;基本上他们的工作重点就是跟企业决策者聊天,并帮助部门主管了解他们的产品能为日常工作带来哪些提升或者便利。
"这是一帮老手,他们有办法把你哄得开开心心,并乖乖交出钱来,"Muscarella戏谑道。"但实际上这帮营销人士所做的案例分析往往漏洞百出,为了推销自己的产品他们经常夸大实际情况。即使是最厚道的供应商顾问也难免会把过分乐观的假设当成事实讲给我们听。"
他认为,最好的办法是花钱聘请这些供应商顾问或者第三方服务商对业务改善情况进行分析与评估。如此一来,他们就需要对自己的新差事负责,细心寻找案例中模棱两可的部分。而我们则能够从更诚实、更完整的评估结论中了解真实情况。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22