京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
		做大数据真的能赚钱吗
于IT业内,大数据之火热程度,似乎无出其右者。当然,在其真正爆发前夜,也应该适时泼盆冷水。
谁能接触到数据
以我来形容中国大数据产业,可称“蒙面狂奔”四字。在没有思考清晰盈利模式之时,已蒙面狂奔,绝尘而去。
国内冠以大数据之名的企业数以千计,但细分其专注领域,大致可归属三类:其一,平台型企业,例如华为、星环科技、浪潮、新华三等;其二,工具型企业,例如在数据采集、数据分析、数据清洗、数据可视化等领域中的海量数据、帆软软件、明略数据等;其三,应用型企业,例如百分点,以及国内诸多行业方案商多属于此类型。
不需否认,大数据已在国内诸多行业领域展现出其价值,但深究典型案例,应远未如媒体宣传中显著。为何?有资格被称为大数据企业,取决于两个先要条件:其一,掌握或接触到用户数据;其二,有能力为用户提供数据服务。
先观察首要条件,大数据企业能否掌握,或接触到用户数据。答案:很难。除互联网公开数据之外,第三方能接触到的数据资源着实有限。以IT方案商为例,此前其以为用户设计、实施行业应用软件为主营业务,理论上距离数据最近,但就如建筑商,建设了广厦千万间,建设了条条大路通罗马,也不能掌握居民和车辆信息一样。方案商实施了行业应用软件,其中也承载了海量价值数据,但这并不等同于能接触到数据。
退一步说,在企业意识到数据也是资产,数据也能创造价值后,其正急需寻找数据服务商,或数据运营商。而能够承担此角色者,IT方案商应为首选。原因?方案商为企业用户提供了十余年IT服务,多少会产生些信任度,从IT服务,延伸到数据服务,应为顺其自然。
而问题又由此而来,大数据真的有用吗?实施了铁路车辆检修大数据系统,工人手中使用了几十年敲敲打打的“小铁锤”就能退休?实施了金融风险管控大数据系统,其结论是否能直接自动导入金融机构业务流程,而无需人工干预?答案基本否定。
原因在于,大数据应用服务商即使能获得用户数据,也极其有限、极其不全面。以城市交通信息为例,此类通常掌握在20余部门手中,方案商几乎不可能全面融合此类数据。而基于不全面的、错误的数据源,也就不可能推导出正确,有决策价值的结论。
做大数据真的能赚钱吗?
当然,基于局部数据,也仍有可能建设出经典的大数据案例。但大数据项目真的赚钱吗?未必。在诸多大数据企业中,融资进度大多在B轮和C轮之间,尚没有一家企业完成D轮融资。也就是说,距离赚钱尚早。
而细分技术领域,首先,大数据工具类企业业务模式相对简单,其只是产业链中的一环,实现盈利相对容易。其次,大数据平台型企业,其盈利模式比较复杂。单纯依靠销售大数据平台几乎不可能产生经济效益,而基于不同的业务出身,其业务模式又可分化为三个流派,一类企业希望以大数据平台带动底层硬件产品销售;而另一类企业,通过提供支持标准的SQL接口,依靠提供数据服务实现盈利。当然,第三类企业比较“野蛮”,希望通过数据,或基于用户数据的服务直接变现。
而除此之外,业务模式更为“枯燥”的是大数据应用类企业。通常行业方案商的大数据业务范畴包括:数据获取、整合、治理、应用和展现等,其中尤以数据治理最苦最累,在大数据项目中50%~60%的工作量也集中于此,不要忽悠什么人工智能、深度学习能解决此类问题,基本还属于纸上谈兵的阶段。
	
 
问题由此而来,脏活累活总还是要有人干。配备10名数据科学家不能算多吧!月薪1万元要也不算苛刻吧!如此算下来,稍有实力的方案商大数据部门,年均人力成本就应在250万元以上。250万元?要做多少大数据项目,而且前提是要保证每个项目间要有很好地时间衔接,还要保证每个项目的能力需求都要与数据科学家的专长技能相匹配。
同时,与云计算不同,云计算考验方案商纯IT方面能力,而大数据项目则需要方案商数据科学家与行业团队,以及用户业务专家紧密结合,合作建立基于应用场景的数据分析模型。由此,每个项目的成功均需具备“天时、地利、人和”。也就是说,单个大数据项目的定制化程度相对较高,达到50%~40%,项目间很难具有可复制性,方案商也因此较难建立成熟的大数据项目盈利模型。
但最后还需说一句,形容中国大数据产业为“蒙面狂奔”,也许言过其实,但诸多桎梏确实摆在眼前。不管是依靠数据服务,还是行业应用定制,中国大数据产业仍需极大的人力消耗,成熟的盈利模型尚未建立。“蒙面”是现状,也是必然阶段,但衷心希望中国大数据企业再“狂奔”一两年之后,面纱终能被一缕清风揭去。
                  数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28