京公网安备 11010802034615号
经营许可证编号:京B2-20210330
构建大数据分析平台:没有捷径
通过创新、敏捷实践和IT内部划分等各种途径。为了实现这一点,相对于推动部门的转型,CIO们必须面对更为艰巨的挑战。他们需要向业务端显示自己在变革 方面的主导地位。但正如在近期于波士顿举行的大数据创新峰会上所显示的一样,在推动企业的数字化转型上,IT没有捷径可走。
“从总体上说,企业内部的IT组织最重要的任务就是防止故障的发生。”在峰会中的一次讨论中,NBCUniversal Media LLC的分析技术集团高级总监Moin Haque表示:“高层对IT的评估就是,以服务标准协议的形式来检验故障的多寡。在这种情况下,IT并没有进行试验和失败的空间。”但是,Haque的 分析团队则恰恰相反,其使命就是探索和实验,哪怕失败也在所不惜。
NBC的大数据分析平台是IT双重角色的最好例证:IT团队管理着自建的Hadoop平台;Haque的团队则置身于IT之外,通过各种试错来探索价值创 新。由于这两个团队的工作目标和节奏都不一样,Haque认为单独运作会带来明显的好处:“把责任属性从我们团队中去掉,可以让我们更加专注的进行探 索。”
是否外包
对于其他意在构建大数据分析平台的企业,Haque的建议也是如此:“那些能够自行完成或通过合作伙伴实现的工作,可以作为切入点。”实际上,当某位听众问到如何外包或引入大数据项目时,Haque的建议就是从另外的角度进行分解。
Haque表示,可以放到IT团队进行管理,也可以进行外包(如果企业尚不具备相应的大数据技能时)。同时,他也认为,只有在极少数情况下才需要将大数据分析外包出去。
“无论是开发模型还是算法,你都应该尽量走自建的道路。因为这样才能具有真正的独特性,才能使企业更具竞争力。”Haque认为。
人才培育
Chris Simokat是花旗集团的副总裁和大数据分析工程团队首席数据科学家,他同样提出了自己的看法。与其因为技能匮乏而把平台外包,CIO更应该注重内部的 人才发现和培养。“我们平台的起源和核心工程组件,来自于PeopleSoft工程团队的副产品。”Simokat表示。
对于Haque建议对大数据项目分解成更为可管理的模块,Simokat表示了赞同。同时,他认为应该在IT团队内部挖掘人才,对每个细分模块进行管理。即便对于那些已经外包的工作,也应如此。
“否则,就是厂商调查的不尽职,从而无法对工作进行切实的掌控。”Simokat表示。
创新的悖论
CIO和企业都表示在尽力寻找具有创新性思维的人才,但是这其实并不容易。“绝大多数的创新性人才都令人感到棘手,他们总是倾向于改变一切。”联合国助理秘书长和首席信息技术官Atti Riazi表示。她认为没有任何政府部门和企业能够容忍这一点。
Riazi表示,创新,历来都是一把双刃剑,能够解决艰难的问题,也往往导致意想不到的后果。“以互联网为例,已经成为我们生活的一部分,但是同样充斥着种种诸如贩卖人口之类的黑暗面。”Riazi举例说。
Riazi表示这并不意味着CIO们应该拒绝创新。相反,创新是进步的源泉。只不过,她认为听众应该对技术本身进行讨论,尤其是当技术被当作他用时。“提 到技术,我们总是想到硬件、软件、工具和云计算。但是,其中的内涵远不止如此,技术其实和经历、权力、人类的生活乃至环境有关,我们必须就此展开对话和思 考。”
Riazi认为,试图对技术和创新进行管理是错误的,这只会扼杀应有的活力。“那么该做什么呢?把创新看做一种责任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11