想入门大数据分析？先来认识数据吧-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读想入门大数据分析？先来认识数据吧

想入门大数据分析？先来认识数据吧

2017-04-11

想入门大数据分析？先来认识数据吧

正确认识数据是数据分析的第一步，云途君带你认识数据的4种分类和不同类别数据的解读方法。

以云途君为例，对应四种不同类型的数据，可以这样做自我介绍：

国籍：中国-------- 定类数据（Nominal）

健康状况：良好---- 定序数据（Ordinal）

体温：36.2度------- 定距数据（Interval）

体重：56公斤------ 定比数据（Ratio）

以上的四个数据分别对应了4种不同类型的数据，每种类型的数据具有其自身的特征也对应着不同的解读方法。

1、定类数据（Nominal）

用于代表不同类别的事物，各个类别之间没有等级次序之分。例如：颜色，红色和蓝色没有优劣之分只是类别不同。

这类数据通常使用字符或者数字代号标示，例如电话号码区号010是北京的区号，021是上海的区号。

定类数据在数据分析中较为常见的应用场景是用户分群，将用户数据标签化，再按照不同的标签对用户进行分群，相同的标签表明具有相同属性的一类人群。

例如不同支付方式的性别分群，男性有55人，女性有60人分别占47.83%和52.17%，定类数据的类别较少时建议使用饼图，且“饼图”能表达出不同类别的占比情况。

但是“饼图”不适用于类别较多的情况。例如要分析56个民族不同人群的支付方式就不适合使用饼图，通常多个类别使用柱状图展示分析结果。

如下图是服装零售商的商品类别统计图：

定类数据在数据分析中通常被视作维度是离散型数据，也就是我们常说的观测数据的视角，用于对事物定性，并且对于定类数据只能进行计数运算，不能进行加减乘除操作。

2、定序数据（Ordinal）

不仅能够代表事物的分类，还能代表事物按照某种特性的排序，各个类别之间存在等级次序之分，等级之间差距不易衡量。

例如： “健康状况”，健康状况“良”与健康状况“良好”到底差距有多大，不太容易衡量，但是 “良好”肯定优于“良”。

这类数据通常也是使用字符或者数字代号标示，仍然用健康状况举例，使用1代表好、2代表良好、3代表良，但是用1除以2得出的0.5并不代表任何含义。所以定序数据与定类数据一样，他们只能进行计数操作不能参与加减乘除的运算。

通常定序数据也被视为数据分析中的维度数据是离散型数据，分析方法与定类数据的分析方法基本相同。

定序数据最重要的意义代表了一组数据中的某种逻辑顺序。

3、定距数据（Interval）

没有绝对零点，“0”是尺度上的一个点，不代表“不存在”，可以比较大小，两个值的差有实际意义，通常以数值形式标示。例如： “温度”，0度不代表没有温度，云途君的体温36.2度，相对于37度，云途君体温低但依然是正常体温。

定距数据进行计算后，可衍生出一组新的定类数据，比如，百分制考试成绩，分值之间的间隔设定为10分，即60~70分为一档，70~80分为一档，80~90分为一档。

定距数据只能进行加减运算，不能进行乘除运算。例如，某同学的期末考试成绩数学70分，物理80分，80除以70得出的数据是没有意义的，但是我们可以说物理成绩比数学成绩高10分，这个数据是有意义的，至少代表了这次物理考试比数学考试考得好。

定距数据在数据分析中通常被称为度量，用于对某一维度的定量描述。

思考一下

全班期中考试的数学平均分是多少分，这个命题如何计算？其中，会用到哪些数据，这些数据都是什么类型的数据？定距数据不能参与乘除运算为什么还要计算平均数？

4、定比数据（Ratio）

有绝对0点，“0”表示没有或者不存在，通常以数值形式标示是连续型数据，一般来说定比数据不可能取负值或零值。例如：体重、身高。体重50公斤与51公斤之间的差距是相对于1公斤进行放大的多少倍，所以在数据分析中，定比数据可以进行加减乘除运算，其天然的带有倍数关系。

例如下图中的营业额和订单量，同比的概念就使用了倍数关系。

以上4个不同的数据之间可以通过运算进行相互转换，但当数据具有绝对的某种数据特征时要注意是否恰当的使用了某种运算对数据进行分析。

此外，前文例举的都是数据特征较明显的情形，但是在实际数据分析过程中某些数据的特征辨识度较低，需要不断的练习才能准确的对数据用恰当的方法进行分析。

小结

定类数据：有类无序，计数，离散，维度

定序数据：有类有序，计数，离散，维度

定距数据：数字，0有意义，连续，加减，度量

定比数据：数字，无0无负，连续，加减乘除，度量

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据分析特征柱状图大数据

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

想入门大数据分析？先来认识数据吧

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载