
不忘初心,大数据不是IT的狂欢
最近一直在做企业内一线大数据普及的工作,因此来谈谈想法。作为企业搞IT的人,的确有很多新的东西要学习和建设,投资也迎来了一波高潮;作为研发和销售大数据产品的公司,当然要不为余力的推销自己的产品,占领先机很重要。
但是,在喧嚣之中,还是要理性的回归价值思考,High翻天的新技术概念和平台建设,到底给予传统企业的业务人员带来了什么价值?给我们的营销一线的人员带来了哪些好处?
我们企业的最终用户,真实感受到了大数据带来的变化了吗?
IT可以提自己的传统架构被新的架构替换了,牛逼的实现了并行扩展,但这些对于业务人员,有多大的价值和感知?
IT在存量上的捣鼓,于我何干?系统不够了扩容,是IT必须要做的事情,至于采用什么架构,业务也不关心,有什么值得狂欢的呢?技术能否给我业务带来新的价值,才是我关心的。
IT也许可以提自己是在做长远的事情,没错,但再长远的事情,也需要兼顾短期的业务价值创造,没有短期的持续实践,很难说有未来的价值创造。
如果业务人员在起步的时候,仅仅是个旁观者和看客,我们的IT驱动的大数据战略是否有些问题,大数据的狂欢,似乎缺少了主角在场,让技术和业务这个平衡似乎倾斜了。
阿里的技术是跟着业务要求起步的,没有这个技术,新的商业模式根本没法创造,因此技术和业务的发展是相辅相成的,它应该达到了一个很好的平衡,举个例子,如果没有牛逼的多维分析能力,所谓的淘宝魔方这种新的业务产品不可能存在。
但传统企业有吗?似乎在技术上的关注远远超过了业务,大数据在业务上除了存量的改造,比如CRM改造成了云,数据仓库升级到了MPP或hadoop,我们对于大数据这项非常关注业务创新和运营的事业,似乎点到为止了。
企业IT团队与IT合作伙伴之间的狂欢,需要让更多的主角能够参与进来,比如业务人员,一线人员、建模为长的合作伙伴等等,这决定了大数据平台能否在建成时刻,在业务价值创造上也能开始起步,或者有所建树,改造一把存量,值得点赞,但绝对只是个开始。
首先,需要从关注大数据平台建设到大数据运营。
假如公司在大数据平台的建设上投资很多,那至少要划出很多在大数据运营上,30%?亦或40%?,后期则更甚,不仅仅需要挑选好的大数据平台厂家,更应该挑选擅长建模的合作伙伴,挑选擅长基于新的技术创造新业务场景的合作伙伴。
大数据平台建设完成时刻,就是大数据运营的开始,是真正创造价值的开始,所谓的运营绝对不是仅仅的平台运维,更多应是业务运营。
很多公司在大数据运营上的一毛不拔,是有深刻的原因的,也是无奈之举,大数据显然是技术驱动业务多一点,技术上可能有些人才可用,但对于大数据数据和业务兼而懂之的人才却极度缺乏,传统业务人员又显然还在门外,因此,造成了这一种不平衡。
同时,大数据业务创新风险性极高,想当前,真正能赚钱的大数据商业模式有几个? 就知道其实何其艰难和具有挑战性,创新大数据运营的钱当然可能打水漂,不如采购硬件和软件那么实在。
但是,既然要搞大数据,就应该想到这个风险,否则,几年后,除了同质化非常严重的一堆技术架构平台,各个企业的大数据的差异化竞争优势又在哪里?别提技术架构先进性,太容易复制了,传统企业也不可能像阿里那样程度的自主研发。
开源大势所趋,没有秘密可言,这种微小的领先支撑可能不到1-2年。而大数据建模及新的商业模式才可能是差异化竞争优势所在,所谓数据创新无极限,这个差异化也无极限。
当前,很多擅长平台的合作伙伴,也打着业务的旗子来,提什么客户洞察啥的,在架构蓝图上永远画着业务和服务,但到底业务服务怎么做,天知道?真正对于业务有点理解的又是何等的凤毛麟角。
有人问我,大数据最大的痛点是什么,我总是回答,业务创新,技术问题总能逐步解决,但业务,的确太难了。
举个例子,就能明白很多公司对于业务的理解能力了,某个客户说,你给我一辆5个轮胎的车子,然后这个技术公司真得研发出了5个轮子的汽车,但客户真正需要的,其实只要增加一个备胎。
当前业界有有实力、有运营能力的诸如建模等商业合作伙伴很少,但无论如何,还是要努力寻找,大数据不能缺了这条腿,或者就自己培养,这是当务之急。
一盘象棋,有再牛逼的车马炮又如何,于百万军中取上将之头,才是王道。
其次,大数据开放瓶颈不在开放平台,而在思维局限。
但当前总想着把平台打磨的完美无缺,枉顾一线甚至不知道这个舞台的存在,其实再破的舞台,也能跳舞的。
99%的企业不可能做成BAT吧,可能也等不到大规模使用的时刻,所谓的开放平台,到底有多少是真正承载了大量业务量的,有多少是用来当白老鼠的,而且这类开放平台,由于太面面俱到了,每个细节处,都是问题。
没有实践的任何开放平台和组件,都值得怀疑,从数据采集、数据管理、数据挖掘、可视化不一而足。
比如一个数据管理PaaS平台,业界要折腾多少点年才出来一个靠谱的东西,其他的,所谓客户洞察诸如此类的,只能笑而不语了。
不管是白猫还是黑猫,抓到老鼠就是好的,PaaS并不是不需要,但开放从没有必要从PaaS开始,也不用想着哪天厂家会给你一个惊喜,总是要一点点起来。
这个就像当年很多牛逼的有方法论但没实践经验的咨询公司来到你面前大谈特谈如何避免离网那么幼稚。
最后,企业的大数据的普及是如此重要,不要等。
不可能依靠一个部门或者一只IT团队实现大数据的创新突破,最终一定要走向普及,因为群众的智慧是无穷的,搞IT的往往自以为是,蒙头造车,对于一线市场的残酷性完全不知道,而一线人员对于业务才有绝对的发言权。
必须让一线知道大数据有哪些能力,让一线知道如何使用,让一线自主决定一些数据的东西,授人以鱼不如授人以渔,IT需要做好这个平台,而让一线在上面欢快的跳舞。
当前阻碍企业大数据普及的有以下一些问题,需要得以解决:
一是一线的一把手的决心,对于一些传统企业,职能型的组织机构、陈旧的机制、僵化的流程的确是限制大数据普及的障碍,但笔者认为关键还是在思想层面,管理者的视野和勇气决定了大数据能否走出第一步。
传统企业,屁股决定脑袋很正常,我们很多优秀的管理者,在业务上拥有丰富的经验,觉的这个不靠谱的想法很正常,因为太少的成功案例,大数据是大忽悠也不是空穴来风。
笔者是搞实践的,说句良心话,原来对于大数据是否能创造实际效益也有怀疑,虽然自己搞过挖掘,但对于建模的价值也是质疑的,因为自己以前建的并没有带来很好的效益。
但还是要往前看,经验主义的确害人,很多企业的数据已经到了一定的程度,基于大数据是可以发挥很好的价值的,所以觉得没价值,更多在于自身的思维局限,缺乏创造力,习惯于按习惯做事,这是致命的。
大数据不同于传统业务,其创新性,长期性,迭代性都是传统方式无法比拟的,未来是算法的时代,希望能理解这一点,
二是一线普及的手段要加强,传统企业应该有个独立的组织去承担这个职责,无论是宣传、培训或落地的指导,没有组织上的创新,很难,大家都知道“星星之火,可以燎原”,但星星的确很难找。
因此,笔者特别强调组织和运营的重要性,无论是自己,还是依靠合作伙伴,务必采取培训、现场驻点、课题安排等形式将已有的平台能力,数据能力,使用方式,建模方式,操作流程等技能传授给一线人员,这个工作的艰巨性远超想象。
但看的到企业,有几个真正去做了呢?
事实上,传统企业较互联网企业,普及落地大数据的难度更大,因为除了机制和流程,在人员结构、地域上也有巨大的差距,比如互联网企业的人员天然就可能有数据的血液,而传统企业不一样,因此如果某个传统企业普及成功,更值得喝彩。
还有,运营是讲究方法的,没有数据证明,就不要相信任何运营的效果,比如以前我们搞了多次百人的实操培训,但通过租户平台发现没有模型在创建,说明培训工作是失败的。
大数据运营,也要通过数据说话,不要想当然,要有打破砂锅问到底的精神,虽已在路上,但革命远未成功。
三是尊重大数据的客观裁决,收益是唯一评估标准,不要奢望搞个大数据样板工程,它没法改变企业,还是要讲究实事求是,从小事做起,它是润物细无声的,起步的时候,大都是探索性的。
比如做一个存量亲情网的拉新模型,需要去努力识别社交关系,需要一线配合做不少验证工作,需要不停调整模型,同时大数据不仅仅是一个模型的事情,还涉及一线取数模式、营销模式、人员职能等各个方面的改变。
大数据的普及实际就是跟传统方式博弈的过程,这个急不得,要向一线证明大数据有用,得有真本事,经得起实际的检验,也非一日之功,一线很务实,没效果,就一边玩去,一边玩去并不是鄙视你,反映的是市场很骨感,一线不相信概念和绣花枕头。
在企业内部的大数据实践中,实际上,并不是没有需求,而往往是大数据的支撑能力不够,因为它面对的环境太复杂了,涉及业务、数据、平台、产品、建模、安全等各个方面,一线人员的经验是值得尊敬的,我们的模型有时候甚至没有经验规则来得可靠。
传统企业用好大数据,难度远超互联网,对于大数据综合运营的能力要求更高,互联网企业招聘一个建模师可能短期就能做网页A/B测试了,而比如运营商等企业,招个建模师首先要做的是熟悉企业的庞大的业务规则,理解营销的场景,面对参差不齐的数据质量及不完整的营销评估数据,因此,能力的挑战巨大,这个是无法回避的。
但无论如何,我们评估大数据成功的标准,始终是给一线带来了多少实实在在的价值,而不是提建了多少平台,性能有多么牛逼,这个不以人的意志为转移。
起了个劲爆的题目,并不是否定大数据平台的建设,而恰恰是希望在万马奔腾建设平台的时候,不忘初衷,想想后续的路怎么走,如何才能与业务形成良好的衔接,让这个平台产生新的价值,因为就像当年的BI一样,大数据似乎在相当长的时间内,需要以IT为导向的。
但如果只想着延续过去,在大数据业务运营上不作布局,那么,大数据平台的价值,就仅限于一个类似双11的支撑数字了,那是很可悲的事情。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18