京公网安备 11010802034615号
经营许可证编号:京B2-20210330
做大数据真的能赚钱吗
于IT业内,大数据之火热程度,似乎无出其右者。当然,在其真正爆发前夜,也应该适时泼盆冷水。
谁能接触到数据
以我来形容中国大数据产业,可称“蒙面狂奔”四字。在没有思考清晰盈利模式之时,已蒙面狂奔,绝尘而去。
国内冠以大数据之名的企业数以千计,但细分其专注领域,大致可归属三类:其一,平台型企业,例如华为、星环科技、浪潮、新华三等;其二,工具型企业,例如在数据采集、数据分析、数据清洗、数据可视化等领域中的海量数据、帆软软件、明略数据等;其三,应用型企业,例如百分点,以及国内诸多行业方案商多属于此类型。
不需否认,大数据已在国内诸多行业领域展现出其价值,但深究典型案例,应远未如媒体宣传中显著。为何?有资格被称为大数据企业,取决于两个先要条件:其一,掌握或接触到用户数据;其二,有能力为用户提供数据服务。
先观察首要条件,大数据企业能否掌握,或接触到用户数据。答案:很难。除互联网公开数据之外,第三方能接触到的数据资源着实有限。以IT方案商为例,此前其以为用户设计、实施行业应用软件为主营业务,理论上距离数据最近,但就如建筑商,建设了广厦千万间,建设了条条大路通罗马,也不能掌握居民和车辆信息一样。方案商实施了行业应用软件,其中也承载了海量价值数据,但这并不等同于能接触到数据。
退一步说,在企业意识到数据也是资产,数据也能创造价值后,其正急需寻找数据服务商,或数据运营商。而能够承担此角色者,IT方案商应为首选。原因?方案商为企业用户提供了十余年IT服务,多少会产生些信任度,从IT服务,延伸到数据服务,应为顺其自然。
而问题又由此而来,大数据真的有用吗?实施了铁路车辆检修大数据系统,工人手中使用了几十年敲敲打打的“小铁锤”就能退休?实施了金融风险管控大数据系统,其结论是否能直接自动导入金融机构业务流程,而无需人工干预?答案基本否定。
原因在于,大数据应用服务商即使能获得用户数据,也极其有限、极其不全面。以城市交通信息为例,此类通常掌握在20余部门手中,方案商几乎不可能全面融合此类数据。而基于不全面的、错误的数据源,也就不可能推导出正确,有决策价值的结论。
做大数据真的能赚钱吗?
当然,基于局部数据,也仍有可能建设出经典的大数据案例。但大数据项目真的赚钱吗?未必。在诸多大数据企业中,融资进度大多在B轮和C轮之间,尚没有一家企业完成D轮融资。也就是说,距离赚钱尚早。
而细分技术领域,首先,大数据工具类企业业务模式相对简单,其只是产业链中的一环,实现盈利相对容易。其次,大数据平台型企业,其盈利模式比较复杂。单纯依靠销售大数据平台几乎不可能产生经济效益,而基于不同的业务出身,其业务模式又可分化为三个流派,一类企业希望以大数据平台带动底层硬件产品销售;而另一类企业,通过提供支持标准的SQL接口,依靠提供数据服务实现盈利。当然,第三类企业比较“野蛮”,希望通过数据,或基于用户数据的服务直接变现。
而除此之外,业务模式更为“枯燥”的是大数据应用类企业。通常行业方案商的大数据业务范畴包括:数据获取、整合、治理、应用和展现等,其中尤以数据治理最苦最累,在大数据项目中50%~60%的工作量也集中于此,不要忽悠什么人工智能、深度学习能解决此类问题,基本还属于纸上谈兵的阶段。
问题由此而来,脏活累活总还是要有人干。配备10名数据科学家不能算多吧!月薪1万元要也不算苛刻吧!如此算下来,稍有实力的方案商大数据部门,年均人力成本就应在250万元以上。250万元?要做多少大数据项目,而且前提是要保证每个项目间要有很好地时间衔接,还要保证每个项目的能力需求都要与数据科学家的专长技能相匹配。
同时,与云计算不同,云计算考验方案商纯IT方面能力,而大数据项目则需要方案商数据科学家与行业团队,以及用户业务专家紧密结合,合作建立基于应用场景的数据分析模型。由此,每个项目的成功均需具备“天时、地利、人和”。也就是说,单个大数据项目的定制化程度相对较高,达到50%~40%,项目间很难具有可复制性,方案商也因此较难建立成熟的大数据项目盈利模型。
但最后还需说一句,形容中国大数据产业为“蒙面狂奔”,也许言过其实,但诸多桎梏确实摆在眼前。不管是依靠数据服务,还是行业应用定制,中国大数据产业仍需极大的人力消耗,成熟的盈利模型尚未建立。“蒙面”是现状,也是必然阶段,但衷心希望中国大数据企业再“狂奔”一两年之后,面纱终能被一缕清风揭去。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01