
大数据爆发可能性:基础要件已经具备 从数据源到数据应用形成完整生态
国内大数据市场爆发的核心要件已经具备。 基于对影响产业发展的核心因素的分析, 立足当前时点, 我们判断国内大数据产业已经具备规模爆发的可能性:在线数据爆发式增长,数据源可获得性、流动性明显改善;云计算、分布式架构等技术推动大数据相关基础技术设施趋于完善; 大数据分析应用领域明星案例不断增多, 市场对于大数据价值认可度持续提升;国家宏观政策、资本市场热情为大数据产业的发展提供强劲支撑。
全球大数据市场发展路径为国内市场提供良好的参考。 据 Wikibon 数据,全球大数据市场规模在 2015 年突破 400 亿美元,产业发展初具规模,同时全球市场发展具有如下典型特征:
( 1 )形成多层次、 融合的大数据来源,包括企业内数据、商业数据以及独立第三方机构数据源。
( 2)基础软件模块整体空间有限,市场收入主体主要由数据分析服务和基础硬件模块构成,开源工具引入使得软件模块整体空间非常有限。
( 3)技术、行业认知驱动新兴数据分析企业崛起,以 palantir、 splunk 为代表的企业依托突出的技术,以及对特定行业的深刻认知,迅速打破传统 IT 企业的壁垒,并在特定细分行业领域占据主导地位。
数据源:数据规模爆发式增长,数据可获得性、流动性持续改善。 根据 IDC 数据, 2011年全球数据总量约为 1.82ZB,是 2008 年的近 4 倍,中投顾问预计 2020 年国内数据总量将达到 38.59ZB,远超过目前的全球数据总量,数据量正呈现爆发式增长。从数据的可获得性、流动性来看,互联网的发展创造了大量的线上数据,同时互联网和传统行业的融合,以及 IOT时代的到来,数据的可获得途径正在被持续拓宽,互联网加速数据间的流动和融合。
基础技术:计算、存储、分析技术不断成熟。 在传统的数据分析时代,数据首先通过ORACLE、 DB2 等数据库集中存储形成结构化数据,并通过 BI 工具,借助传统的数据挖掘算法进行分析和展现。进入大数据时代,我们面临数据量大、 结构化数据占比低等突出问题,传统的 IT 架构、分析算法已经难以满足需求。 2003~2004 年间, Google 公司在其对外发表的两篇论文中提出了 GFS( Google File System)、 MapReduce 两个核心概念,奠定了分布式文件存储系统以及分布式计算模型的理论基础, 2006 年分布式计算和存储框架 hadoop项目被提出,后续围绕 hadoop 的技术生态不断发展, 大数据相关计算、存储、分析技术不断成熟和完善。
分析应用:大数据的价值正在获得持续认可。 伴随着企业和机构对大数据重视度的提升,大数据的商业价值正在逐步显现,各行业积极探索和大数据相结合的应用场景,例如 Palantir在协助美国政府进行反恐、国土安全等领域的突出表现,国内互联网公司借助大数据进行的精准广告投放等。根据德克萨斯州大学学者的研究统计, 如果企业数据使用率提高 10%,各行业效益将提升 17%-49%不等。
政策&资本:政府大力推进,资本热情持续高涨。 近一年来,中央政府强力推动数据开放和大数据运用, 国务院常务会议 10 次提及“互联网+” 及大数据战略, 强调提高数据的开放程度和搭建数据共享平台。基于对市场前景的一致预期,国内大数据行业投资热度不断上升,仅 2015 年在国内融资的大数据创业公司就有超过 50 家,企业获得投资额预计超过 20亿美元,较 2014 年大幅增加。
大数据业务成功运作依赖于多个环节的共同参与和协调,我们将大数据产业链分成如下环节:上游的数据源,中间的数据存储、 计算,以及下游的数据分析应用。 纵观全球市场,根据 wikibon 统计数据,到 201 7 年,全球大数据市场规模将突破 500 亿美元,美国、西欧等传统 IT 发达地区目前已经走在前列,在下文中,我们将通过对全球大数据市场的回顾和分析,以试图探究全球大数据产业发展的内在逻辑以及对中国市场的有益借鉴。
产业全景:贯穿大数据全生命周期。 经历近 20 年的理论准备和产业发展, 目前全球市场已经形成了从数据源采集、数据处理到数据分析应用的完整产业生态:
数据源。 数据类型上,包括传统数据库存储的结构型数据以及 cloudera 等存储的半结构化、 非结构化数据,数据的来源上,包括销售、营销等企业内和商业数据,也包括从事数据整合的第三方机构和组织所贡献的数据。
数据处理。 主要包括数据的 ETL(抽取、转化、加载)、存储、计算等过程,涉及数据的切割、融合等动作,大量的中小企业通过推出特定的插件模块、基础工具不断推动整个技术生态的繁荣。
数据应用。 在该领域既包括传统的 IT 信息企业、 统计分析企业,也包括新兴的大数据公司,比如 palantir、 inrix 等,这些企业针对不同的行业、应用场景纷纷推出相应的大数据解决方案。
产业模块:专业服务模块表现最为优异 。如果我们将大数据的产业收入来源简单分类为基础硬件、 基础软件和专业服务三个模块,根据 wikibon 统计数据, 基础硬件模块、专业服务的市场表现明显优于基础软件模块:
基础硬件。 计算、存储两个子模块显示出强劲的增长动力,且整体份额占比极高,显示出云计算和大数据两个子产业较强的相互拉动作用。
基础软件。 主要由 hadoop 计算框架和数据管理两个子模块构成,整体规模非常有限,且增长平缓, 整个数据管理模块的收入包括传统的数据软件产品收入( ORACLE、DB2 等)和 NoSQL 商业化产品收入。
专业服务。 为增长最为快速、 份额占比最高的子模块,整体持续保持高速增长。
Wikibon 统计了 2013 年全球大数据领域收入排名 TOP 30 的公司,其中不仅包括 IBM、 HP 等传统综合 IT 企业,也包括 palantir、 inrix 等专注于特定领域数据分析的新兴企业,我们尝试对该 30 家公司进行归类分析,并探索各类别企业背后的一些共性的因素。
传统 IT 企业。 以 IBM、 HP、 dell、 oracle 等企业为代表,该类企业具有完整的软、硬件产品线,并通过既有产品线、 hadoop 等开源计算框架的融合,迅速构建出综合性大数据解决方案。
传统互联网企业。 以 google、 amazon 为代表, 本身具有雄厚的技术和资金支持,且数据源丰富,自身业务对大数据具有较强的需求。
传统咨询公司。 以埃森哲、 BCG 等传统咨询公司为代表,作为咨询业务的延伸,依赖于对行业的理解,面向企业输出大数据实施方案以及承担相应的数据分析职能等。
新兴大数据企业。 以 palantir、 splunk 等为代表,依赖于融合的计算框架和强大的技术实力,并叠加对特定行业的深入理解, 提供相应的数据分析服务,典型的技术、行业认知驱动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27