【连载3】如何使用spss做非参数检验-CDA数据分析师官网

热线电话：13121318867

【连载3】如何使用spss做非参数检验

2014-11-28

【连载3】如何使用spss做非参数检验

非参数检验是一个相当宏大的命题。由于实际情况的复杂多变，因此非参数检验包括了许多的各种各样的检验方法。之前我们提过，参数检验的使用条件是被检验的样本总体服从正态分布，而非参数检验的使用条件自然就是总体不服从或不确定是否服从正态分布。（实际上，这里要特别说明一下，尽管非参数检验的使用条件更宽松，但是考虑到精确性，不是特殊要求的话，我们还是尽可能的使用均值检验。）

比较常见的单样本非参数检验包括游程检验和单样本K-S检验。

游程检验：

它通常用于检测两个不同的观测值出现的次序是否具有随机性。举个例子，假如我们想知道每天来门诊就诊的人是否生病的次序是否随机，那么我们就使用游程检验。我们记录下来个案依次是否生病，比如是为1，否为0。然后我们就有了一个由0和1构成的变量列，

我们选择分析——非参数检验——旧对话框——游程，在主面板的检验变量列表里选入我们的0,1变量列。选项卡里边选择描述性，其他默认。割点可以全选。

输出结果看p值就可以了（我真的不想再重复怎么看p值了）。

单样本K-S检验;

这个就比较重要了。这个检验的目的在于观测样本的分布。哦，想想也知道很重要。只要我们想做相关和回归，那我们就最好用K-S检验来检查一下样本的分布。毕竟pearson相关系数有效的一个重要条件就是样本服从正态分布。

我们选择分析——非参数检验——旧对话框——1样本K-S，在主对话框的检验变量列表里边选入我们想检验分布的变量（比如一群病号的血细胞数），选项卡里勾选描述性和四分位数，其他默认。在检验分布的下边有四个供勾选的框框，这个要注意一下，常规指的就是正态分布，相等则是指均匀分布，勾选你想检验的分布（一般是正态分布）。确定以后就可以看结果了。

描述性统计量表会给你一些基本指标，帮助你感受这些数据。K-S检验表的p值会告诉你样本是否服从指定的分布，如果是的话，表里边还有一些其他的指标可以参考。

单样本非参数检验已经结束了（怎么这么少？），下边我们说一下独立样本非参数检验。

两独立样本非参数检验：

打开菜单分析——非参数检验——旧对话框——2个独立样本，在主面板里边检验变量选入检验变量，分组变量选入分组变量，选项卡中选入描述性，四分位数，其他默认。在检验类型里边有四个供勾选的框框，我们一一学习。

Mann-whitney 检验：

就是大名鼎鼎的秩和检验。

这个检验利用样本观察值得秩来推断两样本所在总体的分布是否相同（不晓得什么是秩的回去翻一遍你们的高数课本）。这是一个最常用的检验。举例，假设我们知道一组患病的人和不患病的人的血细胞数，想检查是否具有差异，那么我们就使用秩和检验，我保证没举错例子，这个例子确实也可以用独立样本t检验来做（希望大家还记得什么叫独立样本t检验），当然也可以用秩和检验来做。

它会给出描述性统计量，秩表，检验统计量表。在最后的一个表里边我们通过p值判断差异是否显著。

Moses极端反应检验：

它适用于实验条件导致两个不同方向的极端反应情况（多用于医学，比如有的药物会导致一部分病人好转的同时也会导致一部分病人恶化）。

它通过比较实验组和观察组，会告诉你是否产生了极端反应。（很神奇是不是？）

两样本K-S检验：

这个检验用来判断两个样本的分布是否相同。也是看p值哈。

Wald wolfowit游程检验：

用来检验两样本是否来自相同的总体。

注意：K-S检验适用于数值变量资料或者有序分类资料。

多个独立样本非参数检验：

打开菜单分析——非参数检验——旧对话框——K 独立检验，在主面板的检验变量选入想检验的变量，分组变量选入分组变量。

检验类型有三种

K-W检验：

用来判断各样本分别代表的总体是否一致，（相当于单因素方差分析），适用于数值变量和有序分类变量。结果会给出秩，检验统计量。通过p值判断差异性。若想在进行两两比较，那就要用到上边介绍的秩和检验来进行比较了。

中位数：

适用于数值变量资料。用来检验样本代表的总体中位数是不是相等。这个用途还是比较广泛的。

Jonckheere-Terpstra检验：

这个检验用来处理完全随机的资料，比如研究随着年龄增加，学习成绩是否也增加？这种有序分组的变量就用这个检验来检验。（我真有点懒得介绍这么冷门的检验的冲动，不过为了完整还是写一下吧。）

两相关样本非参数检验：

打开两个关联样本检验主面板，检验对里边选择两个相关变量，检验类型有四种。

Wilcoxon：

它用来检验两个变量的分布是否有差异。比较常用。比如一种药物治疗前和治疗后是否有差别？就用这个检验。

符号检验和wilcoxon差不多，也是检查差值的。

Mcnemar检验：

上边两个都是数值型的连续性资料，这个检验则用于配对计数资料，将两组人进行配对，观察他们的某个指标是否有差异。

边际同质性检验是mcnemar检验的一般化和扩展，用于多分类配对计数资料。比如检验甲观察的分类结果和乙观察的分类结果是否有差异。（分好多类）

多个相关样本非参数检验：

打开多个相关样本检验主面板，选入检验变量，检验类型一共有三种。

Friedman检验：

用于检验多个相关样本是否来自同一总体，是wilcoxon的扩展。

KendallW检验：

检验样本的一致性的好坏（不考虑分布的形状，仅考虑分布是否一致）。

Cochran Q检验：

用于二分数据时，是mcnemar检验的延伸，可以比较多个二分变量的比例的差异是否显著。

非参数检验大概就是这些内容了。和参数检验一样，这些检验的操作操作并不复杂，结果也不难判断，学习的难点在于记住这些不同的检验方法的适用的不同范围。需要多做一些练习，才可以巩固掌握住非参数检验的内容。CDA 数据分析师培训

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

正态分布方差分析数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇随机森林 vs XGBoost vs 决策树：算法选择中的

下一篇图论在大数据分析中的作用！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

【连载3】如何使用spss做非参数检验

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载