京公网安备 11010802034615号
经营许可证编号:京B2-20210330
做大数据真的能赚钱吗
于IT业内,大数据之火热程度,似乎无出其右者。当然,在其真正爆发前夜,也应该适时泼盆冷水。
谁能接触到数据
以我来形容中国大数据产业,可称“蒙面狂奔”四字。在没有思考清晰盈利模式之时,已蒙面狂奔,绝尘而去。
国内冠以大数据之名的企业数以千计,但细分其专注领域,大致可归属三类:其一,平台型企业,例如华为、星环科技、浪潮、新华三等;其二,工具型企业,例如在数据采集、数据分析、数据清洗、数据可视化等领域中的海量数据、帆软软件、明略数据等;其三,应用型企业,例如百分点,以及国内诸多行业方案商多属于此类型。
不需否认,大数据已在国内诸多行业领域展现出其价值,但深究典型案例,应远未如媒体宣传中显著。为何?有资格被称为大数据企业,取决于两个先要条件:其一,掌握或接触到用户数据;其二,有能力为用户提供数据服务。
先观察首要条件,大数据企业能否掌握,或接触到用户数据。答案:很难。除互联网公开数据之外,第三方能接触到的数据资源着实有限。以IT方案商为例,此前其以为用户设计、实施行业应用软件为主营业务,理论上距离数据最近,但就如建筑商,建设了广厦千万间,建设了条条大路通罗马,也不能掌握居民和车辆信息一样。方案商实施了行业应用软件,其中也承载了海量价值数据,但这并不等同于能接触到数据。
退一步说,在企业意识到数据也是资产,数据也能创造价值后,其正急需寻找数据服务商,或数据运营商。而能够承担此角色者,IT方案商应为首选。原因?方案商为企业用户提供了十余年IT服务,多少会产生些信任度,从IT服务,延伸到数据服务,应为顺其自然。
而问题又由此而来,大数据真的有用吗?实施了铁路车辆检修大数据系统,工人手中使用了几十年敲敲打打的“小铁锤”就能退休?实施了金融风险管控大数据系统,其结论是否能直接自动导入金融机构业务流程,而无需人工干预?答案基本否定。
原因在于,大数据应用服务商即使能获得用户数据,也极其有限、极其不全面。以城市交通信息为例,此类通常掌握在20余部门手中,方案商几乎不可能全面融合此类数据。而基于不全面的、错误的数据源,也就不可能推导出正确,有决策价值的结论。
做大数据真的能赚钱吗?
当然,基于局部数据,也仍有可能建设出经典的大数据案例。但大数据项目真的赚钱吗?未必。在诸多大数据企业中,融资进度大多在B轮和C轮之间,尚没有一家企业完成D轮融资。也就是说,距离赚钱尚早。
而细分技术领域,首先,大数据工具类企业业务模式相对简单,其只是产业链中的一环,实现盈利相对容易。其次,大数据平台型企业,其盈利模式比较复杂。单纯依靠销售大数据平台几乎不可能产生经济效益,而基于不同的业务出身,其业务模式又可分化为三个流派,一类企业希望以大数据平台带动底层硬件产品销售;而另一类企业,通过提供支持标准的SQL接口,依靠提供数据服务实现盈利。当然,第三类企业比较“野蛮”,希望通过数据,或基于用户数据的服务直接变现。
而除此之外,业务模式更为“枯燥”的是大数据应用类企业。通常行业方案商的大数据业务范畴包括:数据获取、整合、治理、应用和展现等,其中尤以数据治理最苦最累,在大数据项目中50%~60%的工作量也集中于此,不要忽悠什么人工智能、深度学习能解决此类问题,基本还属于纸上谈兵的阶段。
问题由此而来,脏活累活总还是要有人干。配备10名数据科学家不能算多吧!月薪1万元要也不算苛刻吧!如此算下来,稍有实力的方案商大数据部门,年均人力成本就应在250万元以上。250万元?要做多少大数据项目,而且前提是要保证每个项目间要有很好地时间衔接,还要保证每个项目的能力需求都要与数据科学家的专长技能相匹配。
同时,与云计算不同,云计算考验方案商纯IT方面能力,而大数据项目则需要方案商数据科学家与行业团队,以及用户业务专家紧密结合,合作建立基于应用场景的数据分析模型。由此,每个项目的成功均需具备“天时、地利、人和”。也就是说,单个大数据项目的定制化程度相对较高,达到50%~40%,项目间很难具有可复制性,方案商也因此较难建立成熟的大数据项目盈利模型。
但最后还需说一句,形容中国大数据产业为“蒙面狂奔”,也许言过其实,但诸多桎梏确实摆在眼前。不管是依靠数据服务,还是行业应用定制,中国大数据产业仍需极大的人力消耗,成熟的盈利模型尚未建立。“蒙面”是现状,也是必然阶段,但衷心希望中国大数据企业再“狂奔”一两年之后,面纱终能被一缕清风揭去。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11