大数据真是“大”吗？并不见得-CDA数据分析师官网

热线电话：13121318867

大数据真是“大”吗？并不见得

2016-07-22

大数据真是“大”吗？并不见得

数据并不只是因为成为了“大数据”才有了价值，“小数据”就没有价值吗？而是只要是数据都是有价值的。

大数据（bigdata），或称巨量资料，指的是所涉及的资料量规模巨大到无法通过目前主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯（见百度百科）。业界将其归纳为4“V”—Volume（大量）、Velocity（高速）、Variety（多样）、Veracity（真实性）。大数据的“大”，目前应该是指与计算机为代表的信息设备诞生以来这70年所产生的信息数据相比是“大”了，即与历史产生的信息数据相比是“巨量”了。但若我们将其放在纵、横两个维度上去比，大数据还“大”吗？

从数据产生的过程看。目前的大数据（从TB级别，跃升到了PB级别）与以往的MB、GB级别相比确实大了，但与未来的EB、ZB级别相比还只能称之为“小数据”。从数据以外方面看。首先与同为IT概念的IP地址的IPv6相比，即使目前定义数据量最大计量单位DB，与其相比还差近2个级别。再与信息（在此信息即为数据，下同）共同构成世界的物质、能量三要素的其他二要素物质、能量相比，地球的质量约为5.98×1027克，世界探明煤炭资源可采储量约为9.84×1017克，10TB大约等于一个人脑的存储量，全球70亿人的脑存储量约为6.52×270Byte，相对应来看目前所说的大数据也并不“大”。但我们也还没有称IPv6为“大IP地址”，没有称物质、能量为“大物质”、“大能量”等等。

在物质世界有“大”就有“小”，如物质就计量单位从小到大有克、十克、百克、千克……，从大到小有克、分克、厘克、毫克……。而数据，目前计量单位只能从小到大有bit、Byte、KB、MB……，但却不能从大到小。而我们知道数据计量单位每缩小一个级别，则数据量就可增加1024即210倍。

物质有限可分还是无限可分虽然还将争论下去，但就当今理论和实践的发展看物质是可分的，就物质的计量单位而言是具有双向性的（能大能小）。而数据似乎是不可分的，就数据的计量单位而言似乎是单向性的（只能大）。

若将物质资源的计量单位定为“克”，则煤炭储量的数值可与数据资源数值的EB对应；而若将物质资源的计量单位定为“毫克”，则煤炭储量的数值就可与数据资源数值的ZB对应。就当今理论和实践的发展看物质是可分的，则物质资源的数值相较数据资源就计量单位而言似乎是无限大的，数据资源的“大”就更待商榷了。

人类利用物质和能量资源的过程是：自然产生物质和能量资源（软件），人类发明工具开发物质和能量资源（硬件），人类改进工艺利用物质和能量资源。即先有物质和能量资源，再有开发物质和能量资源的硬、软件工具。

而人类利用数据资源的过程是：人类发明了计算机等信息设备来承载数据资源（硬件），人类设计了软件来处理数据资源（软件），数据才向人类展现出其资源的特性（资源）。即先有了开发数据资源的硬、软件工具，再有数据资源。

物质和能量资源的产生经过了亿万年自然的进化，其产生与人类没有关系，即不已人类的意志而转移。而数据资源的产生只有短短的几十年时间（该数据资源是指计算机诞生以后产生的信息数据资源），其产生与人类有直接关系，即其会随着人类的意志而转移。这种根本性的不同，对人类意味着什么？目前我们不得而知。物质不灭定律（又称“质量守恒定律”）告诉我们“物质虽然能够变化，但不能消灭或凭空产生”。数据是否也是不灭的，数据又将如何变化呢？这些，我们都是无法回答的。

目前，“大数据”的核心只是改变了人类以前的理解，即承载数据的硬件有价值，处理数据的软件有价值，而数据本身却不具有价值。由此，呈现了数据本身也是具有价值这一理念。

“大数据”一词，目前还只是IT界自说自话的技术术语，并没有体现出其价值所在，百姓并不明白它有什么用处。其实还不如称“大数据”为“数据资源”或“资源数据”。以突出“资源”一词所蕴含的价值，以体现数据的资源特性。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

大数据真是“大”吗？并不见得

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】层次回归分析：变量是否需要标准化？— ...

【CDA干货】SQL实时表实现解析：从技术原理到落地实 ...

CDA数据分析师：数据分析基础范式的践行者与价值放 ...

【CDA干货】成分得分系数矩阵与载荷矩阵：不是同一 ...

【CDA干货】大数据应用的行业密码：不同企业的实践 ...

CDA 数据分析师：从数据分析基本概念到实战落地 — ...

【CDA干货】金融统计实战案例：银行个人信贷违约预 ...

【CDA干货】mtcars 数据集的实战

CDA 数据分析师：企业数据需求与数据分析需求的精准 ...

【CDA干货】大模型每层神经元个数怎么定？从原理到 ...

【CDA干货】购买决策推动力分析

CDA 数据分析师：企业数字化转型的核心引擎 —— 从 ...

【CDA干货】用模型挖掘数据中的隐性特征：方法、案 ...

【CDA干货】大模型结果稳定性方法论：从输入到落地 ...

CDA 数据分析师：企业数据安全管理方法论落地指南 ...

【CDA干货】机器学习分类模型：从原理到实战的完整 ...

【CDA干货】交叉频数分布：分类变量的关联放大镜， ...

CDA 数据分析师：决策树分析实战指南 —— 可解释性 ...

【CDA干货】卡方检验 P 值与 OR 值：从关联判断到强 ...

【CDA干货】CDA 数据分析实战：三大行业真实案例的 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据真是“大”吗？ 并不见得

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】层次回归分析：变量是否需要标准化？— ...

【CDA干货】SQL实时表实现解析：从技术原理到落地实 ...

CDA数据分析师：数据分析基础范式的践行者与价值放 ...

【CDA干货】成分得分系数矩阵与载荷矩阵：不是同一 ...

【CDA干货】大数据应用的行业密码：不同企业的实践 ...

CDA 数据分析师：从数据分析基本概念到实战落地 — ...

【CDA干货】金融统计实战案例：银行个人信贷违约预 ...

【CDA干货】mtcars 数据集的实战

CDA 数据分析师：企业数据需求与数据分析需求的精准 ...

【CDA干货】大模型每层神经元个数怎么定？从原理到 ...

【CDA干货】购买决策推动力分析

CDA 数据分析师：企业数字化转型的核心引擎 —— 从 ...

【CDA干货】用模型挖掘数据中的隐性特征：方法、案 ...

【CDA干货】大模型结果稳定性方法论：从输入到落地 ...

CDA 数据分析师：企业数据安全管理方法论落地指南 ...

【CDA干货】机器学习分类模型：从原理到实战的完整 ...

【CDA干货】交叉频数分布：分类变量的关联放大镜， ...

CDA 数据分析师：决策树分析实战指南 —— 可解释性 ...

【CDA干货】卡方检验 P 值与 OR 值：从关联判断到强 ...

【CDA干货】CDA 数据分析实战：三大行业真实案例的 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据真是“大”吗？并不见得