京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据引发数据库行业变革
数据库市场成形于上个世纪80年代。近年来随着云计算、大数据应用的兴起,面对爆发式增长的海量数据,传统数据库已难以应对;面对以视频、图片、文字等非结构化数据为主的大数据,传统商业智能系统和数据分析软件缺少有效地分析工具和方法。大数据引发数据库行业变革,国产数据库迎来三十年不遇的战略机遇期。
在激烈的市场竞争中,国产数据库厂商逐渐壮大起来,目前已经形成了以南大通用为首的国产数据库四大品牌。在新型数据库领域,国产技术已经与国外品牌站在了同一起跑线上。
2013年4月,相关媒体发布《中国数据库市场发展趋势报告》。通过深入分析大数据对于数据库市场的冲击,剖析OldSQL、NewSQL和NoSQL三类数据库技术的优缺点,梳理了中国数据库市场的发展特点、发展趋势,发展机遇、市场竞争环境等,从而为国产数据库厂商应对大数据时代的战略发展规划提供了重要的参考和建议。
一、大数据时代企业级数据处理需求
大数据可以分为行业大数据和互联网大数据两个类型,其中行业大数据又可分为四类:经营类、管理类、监管类和专业类。从占比上看,目前我们所说的大数据,有80%是来源于互联网大数据;从体量上看,行业大数据的体量与互联网大数据的体量相当,两者基本位于同一数量级上;从价值上看,行业大数据的价值密度高于互联网数据。
在未来3到5年,行业应用数据分析将成为大数据应用主战场。真正能够利用好大数据、并将其价值转化成生产力的企业必将具备强劲有力的竞争优势,从而成为行业的领导者。目前来看,政府、金融、电信、零售等将是最先使用大数据工具的行业。
表 1 大数据时代企业级数据处理需求
项目 业务特征 应用趋势
政府 公安 公安机关部门、警种繁多,造就了数据的海量化和类型的多样化。 利用对大数据的分析、挖掘,实现对人像,指纹比对,卡口等数据融合处理,从而为领导指挥决策,各情报分析提供支撑。
信息
安全 宏观上的网络安全态势感知和微观上的发现安全威胁,需要对海量日志信息进行定期的关系分析。 通过自动化分析处理与深度挖掘,将之前很多时候亡羊补牢式的事中、事后处理,转向事前自动评估预测、应急处理,让安全防护主动起来。
气象 数据包括温度和气压读数、风速、图像以及来自卫星、气球、船只和飞机的观测结果,而这些数据将以每天TB级的量级增长。 通过合理的梳理数据流,可提供更有价值、更加及时的气象信息,同时更好、更精确和更具预测性地进行环境预测。
交通
管理 系统性,数据量大;复杂性,涉及多方面数据;动态性,信息实时处理要求高。 对各种交通数据进行大量采集和系统分析,实现对道路和交通状况的全天候和全天时感知。
税务 税收信息包含种类繁多,人员涉及广泛。 通过税收数据的集中处理,真实、实时、全面地掌握税收工作各项数据和整体情况。
社保
管理 社保“一卡通”将产生的海量数据信息,并且呈现出几何式增长态势。 对于海量信息进行合理分类、科学分析、有效预测。
电信行业 数据量激增,保存时间长;受众群体大,市场饱和度高。 数据流量暴增,向智能化管道转型;规避同质化竞争,寻找差异化经营“蓝海”。
金融行业 设备先进,功能齐全;自动化程度高,安全保密性强。 金融智能决策、金融服务创新。
零售行业 零售行业需要及时响应客户需求,实现精准营销。 个性化精准营销要求零售企业对消费者消费行为、天气等进行大数据分析,结合客户的购物习惯,提供一致的个性化购物体验,以提高客户忠诚度。
二、大数据引发数据库行业技术变革
大数据引发数据库行业架构创新。美国著名数据库科学家迈克尔•斯通布雷克(Michael Stonebraker)指出,行业技术的发展趋势是由一种架构支持所有应用转变为用多种架构支持多类应用。在大数据和云计算的背景下,这一理论导致了数据库市场的大裂变:数据库市场分化为三大阵营,包括OldSQL(传统数据库)、NewSQL(新型数据库)和NoSQL(非关系型数据库)。为了提升性能,NewSQL阵营普遍采用了列存储技术;NoSQL阵营普遍采用了KV技术。三个阵营都不同程度地采用了分布式计算、分布式文件系统、内存计算技术,并积极地使用新的硬件技术,如大内存、Flash、SSD和高速网络连接(万兆交换机和Infiniband)等。
三者在数据管理能力、数据的价值密度以数据处理的实时性等方面各有所长,从而势必造成在未来的数据库软件市场上出现结构混搭、多种技术并存,并且和谐相处的局面。然而,由于受数据管理能力所限,伴随数据量逐年增加,OldSQL生命活力受到极大影响,未来将呈现不断弱化的趋势;在NoSQL领域,虽然其在数据管理能力方面具备先天优势,但是因为NoSQL处理的大多为互联网数据,其价值密度较低,因此其市场活力呈现较为稳定的态势;在NewSQL领域,其数据管理能力高于OldSQL,又面向数据价值密度较高的行业大数据,促使其具备较高的市场活力,虽然其进入市场时间较晚,但是未来其市场活力必将超越OldSQL、NoSQL,成为在数据处理技术领域新的“王者”。
面对大数据,传统的行式存储数据库已经尽显颓态,数据库软件巨头也通过加强研发、收购等方式加强自己在大数据领域的影响力,纷纷推出自己的面向大数据库的新型数据库解决方案。而在新型数据库中,以列式存储为主的数据库如Sybase IQ,GBase 8a,Vertica等表现优异,成为NewSQL的典型代表。
三、应对大数据,国产数据库迎来新机遇
由于国家信息化建设的需求,电子政务正处于深化应用阶段,对数据的开发利用将成为新的方向,这样就给国产数据库发展带来非常好的市场机会。特别是由于政府、能源等关键行业比较注重信息安全保障,因此国产数据库软件获得政府青睐。
经过十多年的刻苦发展,国产数据库在技术研发方面取得了长足进步,产品日趋成熟。与国外数据库软件相比,国产数据库企业借助安全、本土化优势已在政府和行业领域击败国外竞争对手。作为国产数据库代表,南大通用以新型数据库研发作为其战略核心,成为第一家支持列式存储和MPP架构的国产数据库厂商。其GBASE系列数据库已经成功应用到电信、金融、政务等多个行业和领域。在新型数据库领域已经具备与世界主流厂商在大数据分析类应用中直接竞争的能力,跃升成为国内新型数据库领域的前三强厂商。
大数据给国产数据库厂商带来了“天时、地利、人和”三者同时齐备的三十年不遇的战略机遇期。国内数据库厂商应当充分认识到未来三年,将是决定国产数据库在大数据领域成败的关键时期。如果国内企业能抓住这一机遇,在技术、商业模式上主动突破,形成自己的优势,在某些行业率先开辟出应用示范案例,那么在大数据时代,国产数据库厂商就能有效应对国际大厂商的强势压力和竞争,在市场上取得突破性的发展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14