
别让大数据成“大箩筐”
对于大数据标准研制在中国的发展情况,中国电子技术标准化研究院(以下简称电标院)近日发布的《大数据标准化白皮书》(以下简称白皮书)指出,全国信息技术标准化技术委员会(TC28)持续开展数据标准化工作,在元数据、数据库、数据建模、数据交换与管理等领域推动相关标准的研制与应用,为提升跨行业领域数据管理能力提供标准化支持。具体而言,全国信标委于2012年成立了非结构化数据管理标准工作组,对口ISO/IECJTC1SC32WG4。全国信标委云计算标准工作组目前正在开展大数据存储和分析应用的研究工作,旨在研究大数据存储和分析技术的应用分析、技术框架和标准研究等。全国信标委SOA分技术委员会负责面向服务的体系结构(SOA)、Web服务和中间件的专业标准化的技术归口工作,并协助全国信息技术标准化技术委员会承担国际标准化组织相应分技术委员会的国内归口工作。
另外,全国信息安全标准化委员会(TC260)是在信息安全技术专业领域内,从事信息安全标准化工作的技术工作组织。委员会负责组织开展国内信息安全有关的标准化技术工作,技术委员会主要工作范围包括:安全技术、安全机制、安全服务、安全管理、安全评估等领域的标准化技术工作。全国信安标委目前正开展大数据安全技术、产业和标准研究,为大数据的安全保障提供支撑。
呼吁设立标准工作组
现有标准适用于大数据,提供了一定基础,但缺乏整体规划,呼吁设立标准工作组。
在研究提出大数据技术框架的基础上,结合数据全周期管理,数据自身标准化特点,当前各领域推动大数据应用的初步实践,以及未来大数据发展的趋势,白皮书提出了大数据标准体系框架,即大数据标准体系由六个类别的标准组成,分别为:基础标准,数据处理标准,数据安全标准,数据质量标准,产品和平台标准及应用和服务标准。
通过对现有各类标准情况进行分析,白皮书认为,一方面,从技术标准上来看,大数据相关的技术标准具有一定的工作基础。在数据整理方面,我国已经研制的一些相关标准,同样适用于大数据环境,目前急需加强这类标准的推广应用;数据分析是大数据的特点和难点,标准较为缺乏;在数据访问方面,目前在研多项数据库、云数据存储和管理类标准,适用于大数据底层数据接口,但是尚缺乏数据导入、导出类标准;数据安全方面,部分现有标准适用,但是尚缺乏针对大数据的安全框架、隐私、访问控制类标准;数据质量是大数据应用和发展的基础,目前有多项在研标准,但是均尚未发布,较为缺乏。
另一方面,针对大数据产品和平台,目前在研多项数据库、非结构化数据管理产品类标准,尚无针对大数据可视化工具、数据处理平台的标准;在大数据环境下,数据也已成为产品,而针对开放数据集、数据服务平台等新兴产品和服务形态,尚缺乏相应的标准。
因此,针对大数据,我国在数据管理、云计算、信息安全等方面,已经发布和在研一些标准,适用于大数据环境,提供了一定的基础,但是缺乏标准化整体规划;数据分析、数据安全、数据质量管理等技术标准,数据处理平台、开放数据集、数据服务平台类新型产品和服务形态的标准较为缺乏,急需研制。
大数据标准化工作是支撑大数据产业发展和应用的重要基础。目前国际、国内大数据标准化工作都刚刚起步,白皮书建议尽快成立大数据标准化工作组,吸纳国内产学研用各方面的力量,国内、国际标准化工作同步发展,梳理国内各方面成果,系统地研究国际先进成果,适时参与国际标准化工作。建议加强大数据标准化顶层设计,从产品、技术、安全、管理、应用等多个角度梳理大数据标准需求,认真分析智慧城市、云计算、移动互联网等相关领域与大数据的关系,建立健全大数据标准体系,重点突破一批涉及大数据发展的基础性、方法性、公共性标准的研制,为大数据发展和应用夯实标准化基础。梅宏也呼吁,有必要设立大数据技术与应用标准工作组,整合各方力量从而形成合力,构建统一的大数据标准体系。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08