京公网安备 11010802034615号
经营许可证编号:京B2-20210330
构建大数据分析平台:没有捷径
通过创新、敏捷实践和IT内部划分等各种途径。为了实现这一点,相对于推动部门的转型,CIO们必须面对更为艰巨的挑战。他们需要向业务端显示自己在变革 方面的主导地位。但正如在近期于波士顿举行的大数据创新峰会上所显示的一样,在推动企业的数字化转型上,IT没有捷径可走。
“从总体上说,企业内部的IT组织最重要的任务就是防止故障的发生。”在峰会中的一次讨论中,NBCUniversal Media LLC的分析技术集团高级总监Moin Haque表示:“高层对IT的评估就是,以服务标准协议的形式来检验故障的多寡。在这种情况下,IT并没有进行试验和失败的空间。”但是,Haque的 分析团队则恰恰相反,其使命就是探索和实验,哪怕失败也在所不惜。
NBC的大数据分析平台是IT双重角色的最好例证:IT团队管理着自建的Hadoop平台;Haque的团队则置身于IT之外,通过各种试错来探索价值创 新。由于这两个团队的工作目标和节奏都不一样,Haque认为单独运作会带来明显的好处:“把责任属性从我们团队中去掉,可以让我们更加专注的进行探 索。”
是否外包
对于其他意在构建大数据分析平台的企业,Haque的建议也是如此:“那些能够自行完成或通过合作伙伴实现的工作,可以作为切入点。”实际上,当某位听众问到如何外包或引入大数据项目时,Haque的建议就是从另外的角度进行分解。
Haque表示,可以放到IT团队进行管理,也可以进行外包(如果企业尚不具备相应的大数据技能时)。同时,他也认为,只有在极少数情况下才需要将大数据分析外包出去。
“无论是开发模型还是算法,你都应该尽量走自建的道路。因为这样才能具有真正的独特性,才能使企业更具竞争力。”Haque认为。
人才培育
Chris Simokat是花旗集团的副总裁和大数据分析工程团队首席数据科学家,他同样提出了自己的看法。与其因为技能匮乏而把平台外包,CIO更应该注重内部的 人才发现和培养。“我们平台的起源和核心工程组件,来自于PeopleSoft工程团队的副产品。”Simokat表示。
对于Haque建议对大数据项目分解成更为可管理的模块,Simokat表示了赞同。同时,他认为应该在IT团队内部挖掘人才,对每个细分模块进行管理。即便对于那些已经外包的工作,也应如此。
“否则,就是厂商调查的不尽职,从而无法对工作进行切实的掌控。”Simokat表示。
创新的悖论
CIO和企业都表示在尽力寻找具有创新性思维的人才,但是这其实并不容易。“绝大多数的创新性人才都令人感到棘手,他们总是倾向于改变一切。”联合国助理秘书长和首席信息技术官Atti Riazi表示。她认为没有任何政府部门和企业能够容忍这一点。
Riazi表示,创新,历来都是一把双刃剑,能够解决艰难的问题,也往往导致意想不到的后果。“以互联网为例,已经成为我们生活的一部分,但是同样充斥着种种诸如贩卖人口之类的黑暗面。”Riazi举例说。
Riazi表示这并不意味着CIO们应该拒绝创新。相反,创新是进步的源泉。只不过,她认为听众应该对技术本身进行讨论,尤其是当技术被当作他用时。“提 到技术,我们总是想到硬件、软件、工具和云计算。但是,其中的内涵远不止如此,技术其实和经历、权力、人类的生活乃至环境有关,我们必须就此展开对话和思 考。”
Riazi认为,试图对技术和创新进行管理是错误的,这只会扼杀应有的活力。“那么该做什么呢?把创新看做一种责任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10