
大数据引发数据库行业变革
数据库市场成形于上个世纪80年代。近年来随着云计算、大数据应用的兴起,面对爆发式增长的海量数据,传统数据库已难以应对;面对以视频、图片、文字等非结构化数据为主的大数据,传统商业智能系统和数据分析软件缺少有效地分析工具和方法。大数据引发数据库行业变革,国产数据库迎来三十年不遇的战略机遇期。
在激烈的市场竞争中,国产数据库厂商逐渐壮大起来,目前已经形成了以南大通用为首的国产数据库四大品牌。在新型数据库领域,国产技术已经与国外品牌站在了同一起跑线上。
2013年4月,相关媒体发布《中国数据库市场发展趋势报告》。通过深入分析大数据对于数据库市场的冲击,剖析OldSQL、NewSQL和NoSQL三类数据库技术的优缺点,梳理了中国数据库市场的发展特点、发展趋势,发展机遇、市场竞争环境等,从而为国产数据库厂商应对大数据时代的战略发展规划提供了重要的参考和建议。
一、大数据时代企业级数据处理需求
大数据可以分为行业大数据和互联网大数据两个类型,其中行业大数据又可分为四类:经营类、管理类、监管类和专业类。从占比上看,目前我们所说的大数据,有80%是来源于互联网大数据;从体量上看,行业大数据的体量与互联网大数据的体量相当,两者基本位于同一数量级上;从价值上看,行业大数据的价值密度高于互联网数据。
在未来3到5年,行业应用数据分析将成为大数据应用主战场。真正能够利用好大数据、并将其价值转化成生产力的企业必将具备强劲有力的竞争优势,从而成为行业的领导者。目前来看,政府、金融、电信、零售等将是最先使用大数据工具的行业。
表 1 大数据时代企业级数据处理需求
项目 业务特征 应用趋势
政府 公安 公安机关部门、警种繁多,造就了数据的海量化和类型的多样化。 利用对大数据的分析、挖掘,实现对人像,指纹比对,卡口等数据融合处理,从而为领导指挥决策,各情报分析提供支撑。
信息
安全 宏观上的网络安全态势感知和微观上的发现安全威胁,需要对海量日志信息进行定期的关系分析。 通过自动化分析处理与深度挖掘,将之前很多时候亡羊补牢式的事中、事后处理,转向事前自动评估预测、应急处理,让安全防护主动起来。
气象 数据包括温度和气压读数、风速、图像以及来自卫星、气球、船只和飞机的观测结果,而这些数据将以每天TB级的量级增长。 通过合理的梳理数据流,可提供更有价值、更加及时的气象信息,同时更好、更精确和更具预测性地进行环境预测。
交通
管理 系统性,数据量大;复杂性,涉及多方面数据;动态性,信息实时处理要求高。 对各种交通数据进行大量采集和系统分析,实现对道路和交通状况的全天候和全天时感知。
税务 税收信息包含种类繁多,人员涉及广泛。 通过税收数据的集中处理,真实、实时、全面地掌握税收工作各项数据和整体情况。
社保
管理 社保“一卡通”将产生的海量数据信息,并且呈现出几何式增长态势。 对于海量信息进行合理分类、科学分析、有效预测。
电信行业 数据量激增,保存时间长;受众群体大,市场饱和度高。 数据流量暴增,向智能化管道转型;规避同质化竞争,寻找差异化经营“蓝海”。
金融行业 设备先进,功能齐全;自动化程度高,安全保密性强。 金融智能决策、金融服务创新。
零售行业 零售行业需要及时响应客户需求,实现精准营销。 个性化精准营销要求零售企业对消费者消费行为、天气等进行大数据分析,结合客户的购物习惯,提供一致的个性化购物体验,以提高客户忠诚度。
二、大数据引发数据库行业技术变革
大数据引发数据库行业架构创新。美国著名数据库科学家迈克尔•斯通布雷克(Michael Stonebraker)指出,行业技术的发展趋势是由一种架构支持所有应用转变为用多种架构支持多类应用。在大数据和云计算的背景下,这一理论导致了数据库市场的大裂变:数据库市场分化为三大阵营,包括OldSQL(传统数据库)、NewSQL(新型数据库)和NoSQL(非关系型数据库)。为了提升性能,NewSQL阵营普遍采用了列存储技术;NoSQL阵营普遍采用了KV技术。三个阵营都不同程度地采用了分布式计算、分布式文件系统、内存计算技术,并积极地使用新的硬件技术,如大内存、Flash、SSD和高速网络连接(万兆交换机和Infiniband)等。
三者在数据管理能力、数据的价值密度以数据处理的实时性等方面各有所长,从而势必造成在未来的数据库软件市场上出现结构混搭、多种技术并存,并且和谐相处的局面。然而,由于受数据管理能力所限,伴随数据量逐年增加,OldSQL生命活力受到极大影响,未来将呈现不断弱化的趋势;在NoSQL领域,虽然其在数据管理能力方面具备先天优势,但是因为NoSQL处理的大多为互联网数据,其价值密度较低,因此其市场活力呈现较为稳定的态势;在NewSQL领域,其数据管理能力高于OldSQL,又面向数据价值密度较高的行业大数据,促使其具备较高的市场活力,虽然其进入市场时间较晚,但是未来其市场活力必将超越OldSQL、NoSQL,成为在数据处理技术领域新的“王者”。
面对大数据,传统的行式存储数据库已经尽显颓态,数据库软件巨头也通过加强研发、收购等方式加强自己在大数据领域的影响力,纷纷推出自己的面向大数据库的新型数据库解决方案。而在新型数据库中,以列式存储为主的数据库如Sybase IQ,GBase 8a,Vertica等表现优异,成为NewSQL的典型代表。
三、应对大数据,国产数据库迎来新机遇
由于国家信息化建设的需求,电子政务正处于深化应用阶段,对数据的开发利用将成为新的方向,这样就给国产数据库发展带来非常好的市场机会。特别是由于政府、能源等关键行业比较注重信息安全保障,因此国产数据库软件获得政府青睐。
经过十多年的刻苦发展,国产数据库在技术研发方面取得了长足进步,产品日趋成熟。与国外数据库软件相比,国产数据库企业借助安全、本土化优势已在政府和行业领域击败国外竞争对手。作为国产数据库代表,南大通用以新型数据库研发作为其战略核心,成为第一家支持列式存储和MPP架构的国产数据库厂商。其GBASE系列数据库已经成功应用到电信、金融、政务等多个行业和领域。在新型数据库领域已经具备与世界主流厂商在大数据分析类应用中直接竞争的能力,跃升成为国内新型数据库领域的前三强厂商。
大数据给国产数据库厂商带来了“天时、地利、人和”三者同时齐备的三十年不遇的战略机遇期。国内数据库厂商应当充分认识到未来三年,将是决定国产数据库在大数据领域成败的关键时期。如果国内企业能抓住这一机遇,在技术、商业模式上主动突破,形成自己的优势,在某些行业率先开辟出应用示范案例,那么在大数据时代,国产数据库厂商就能有效应对国际大厂商的强势压力和竞争,在市场上取得突破性的发展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08