
SPSS操作:多个相关样本的非参数检验(Cochran's Q检验)
一、问题与数据
某康复科医生拟评价康复训练对卒中后患者体能恢复的效果。患者分别在开始康复、康复3个月和康复6个月时进行体能测试。为了保证一致性,三次体能测试内容是一样的,体能测试的结果为“通过”和“不通过”。该医生想知道卒中后患者体能测试的结果为“通过”的比例是否一直上升。
该研究随机选取了63例进行康复训练的卒中后患者,并收集了所有研究对象的开始康复时的体能测试结果 (initial_fitness_test),康复3个月时的体能测试结果 (month3_fitness_test)和康复6个月时的体能测试结果 (final_fitness_test)。结果均为“通过(Passed)”和“不通过(Failed)”的形式(分别赋值为1和2)。部分数据如下图。
其中,Individual scores for each paticipant列出了每一个研究对象的情况,而Total count data (frequencies)则是对相同情况研究对象的数据进行了汇总。
二、对问题的分析
要检验三组或多组相关样本中,分类变量是否存在差异,可以使用Cochran's Q 检验,但需要考虑以下4个假设。
假设1:结局变量为二分类,且两类之间互斥。互斥是指一个研究对象只能在一个分组中,不可能同时出现在两个组中。例如 “安全”和“不安全”,“及格”和“不及格”等。
假设2:分组变量包含3个及以上分类,且各组之间相关。(当分组变量只有2个分类时,可使用McNemar’s检验)
假设3:样本是来自于研究人群的随机样本。然而实际中,样本并非都是随机样本。
假设4:样本量足够。当样本量n≥4且nk≥24(k为分组变量数)时,可以采用Cochran's Q检验;否则采用“精确” Cochran's Q检验。
本研究中,结局变量有两个分组且互斥(“通过”和“不通过”),符合假设1;分组变量包含3个分类(开始康复、康复3个月和康复6个月时),各组之间相关,符合假设2;研究对象是随机选取,符合假设3。
那么应该如何检验假设4,并进行比较呢?
三、SPSS操作
3.1 检验假设4:样本量足够
1. 转换数据格式
如果原始数据格式是Total count data (frequencies),则可以跳过此步。如果原始数据格式是Individual scores for each paticipant,则需要将数据转换成Total count data (frequencies)格式。
在主界面点击Data→Aggregate,出现Aggregate Data对话框。将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Break Variable(s)框中。
点击下方Number of cases框,并在Name框中填入“freq”。在Save下方勾选Create a new dataset containing only the aggregated variables,并在Dataset name框中填入新数据集的名字(例如“cochran_q_freq”)。
点击OK,产生新数据集。在新数据集中,可以看到新变量“freq”,代表每一种自变量组合的频数。
2. 数据加权
使用Total count data (frequencies)格式数据,并在主界面点击Data→Weight Cases,弹出Weight Cases对话框后,点击Weight cases by,激活Frequency Variable窗口。将freq变量放入Frequency Variable栏,点击OK。
3. 计算样本量
本研究的总样本数N=63,但计算Cochran's Q 检验的样本量时,需要减去三次测试结果都一致的样本数。如下突出显示所示,全部为“Failed”有20例,全部为“Passed”有7例,所以三次测试结果都一致的样本数为20+7=27,Cochran's Q 检验的样本量n=63-27=36。
其次,需要确定nk的大小。由于本研究共有三个分组,所以k=3,nk=36*3=108。
综上,n≥4且nk≥24,符合假设4。
3.2 计算比例
在主界面点击Descriptive Statistics→Frequencies,在Frequencies对话框中,将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Variable(s):框中,点击OK。
3.3 符合假设4的Cochran's Q检验
在主界面点击Analyze→Nonparametric Tests→Related Samples,出现Nonparametric Tests: Two or More Related Samples对话框。确认在What is your objective?区域勾选了Automatically compare observed data to hypothesized。
点击Fields,将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Test Fields框中。
点击Settings→Customize tests,勾选Cochran's Q (k samples)。
点击Define Success,在Cochran's Q: Define Success对话框中,点击Combine values into success category,在Success框中填入1(这里是“成功”对应的编码,本例中即为通过体能测试,“Passed”对应的是1,所以这里填“1”)。
点击OK→Run,输出结果。
3.4 不符合假设4的“精确”Cochran's Q检验
当不符合假设4时,需要使用“精确”Cochran's Q检验。在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→K Related Samples,出现Tests for Several Related Samples对话框。
将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Test Variables框中。在Test Type 下方去掉Friedman,然后勾选Cochran's Q。(如果数据符合假设4,则此时点击OK,结果与3.3部分的操作结果一致)
点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。
3.5 “精确”Cochran's Q检验后的两两比较
对于符合假设4的Cochran's Q检验(3.3部分),事后的两两比较将在结果解释部分展示(4.2部分)。
对于不符合假设4的“精确”Cochran's Q检验(3.4部分)事后的两两比较,可采用经Bonferroni法校正的多重McNemar检验。
在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→2 Related Samples。在Two-Related-Samples Tests对话框中,依次选择两两比较的变量,分别将变量initial_fitness_test和month3_fitness_test、变量initial_fitness_test和final_fitness_test、变量month3_fitness_test和final_fitness_test选入右侧Test Pairs中。 去掉Test Type下方的Wilcoxon,勾选McNemar。
点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。
四、结果解释
4.1 统计描述
3.2部分的操作后,得到的频数结果见下图。康复开始、康复3个月和康复6个月时培的体能测试的通过率分别为22.2%、44.4% 和 60.3%。
4.2 符合假设4的Cochran's Q检验及事后两两比较
3.3部分的操作后,得到Cochran's Q检验的结果如下图。
上图中,第一列(Null Hypothesis)是本研究的零假设。第二列(Test)显示本研究的假设检验方法,即Cochran's Q检验。第三列(Sig.)是假设检验的统计结果,即P值。第四列(Decision)是根据假设检验做出的判断,即判断是否拒绝零假设。
本研究Cochran's Q检验的P<0.001,拒绝零假设。即开始康复、康复3个月和康复6个月时,研究对象体能测试结果的差异具有统计学意义。
双击该表,SPSS会自动弹出Model Viewer界面,帮助我们进一步了解Hypothesis Test Summary表的结果。
Cochran's Q检验统计量服从自由度为k-1的 χ2分布。本研究的统计量为24.222,此时统计量可记为 χ2 = 24.222, P<0.001。
在该视图下方的View的下拉选项框中,选择“Pairwise Comparisons”,可以得到两两比较的结果。两两比较的方法为Dunn’s检验(经Bonferroni法校正)。
在Pairwise Comparisons图中(此处略),连接线代表两两比较的结果,黑色连接线代表两组间差异无统计学意义,橘黄色连接线代表两组差异具有统计学意义。
下方的表格(如下图)给出了更多的信息:比较的组别、统计量、标准误、标准化的统计量(=统计量/标准误)、P值和调整后的P值。
由于是事后的两两比较(Post hoc test),因此需要调整显著性水平(调整α水平),作为判断两两比较的显著性水平。依据Bonferroni法,调整α水平=原α水平÷比较次数。本研究共比较了3次,调整α水平=0.05÷3=0.0167。因此,最终得到的P值(上图中Sig.一列),需要和0.0167比较,小于0.0167则认为差异有统计学意义。
另外,SPSS也提供了调整后P值(上图中Adj. Sig.一列),其思想还是采用Bonferroni法调整α水平。该列是将原始P值乘以比较次数得到,因此可以直接和0.05比较,小于0.05则认为差异有统计学意义。
以上结果可以描述为:康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(调整后P=0.013),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(调整后P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义。
4.3 不符合假设4的“精确”Cochran's Q检验
3.4部分的操作中,既可以得到Cochran's Q检验的结果,也可以得到“精确”Cochran's Q检验的结果(取决于是否选择Exact选项)。
结果如下图。在Test Statistics表格中,左侧是Cochran's Q检验结果,右侧是“精确”Cochran's Q检验结果。
如果数据符合假设4,则Cochran's Q检验统计量服从自由度为k-1的 χ2分布。左侧表格中的P值为“Asymp. Sig.”所对应的“0.000”,即P<0.001。本研究的统计量为24.222,此时统计量可记为 χ2 = 24.222,P<0.001。
如果数据不符合假设4,则右侧表格中的P值为“Exact. Sig.”所对应的“0.000”,即P<0.001。本研究的统计量为24.222,此时统计量可记为Cochran's Q = 24.222, P<0.001。
4.4 “精确”Cochran's Q检验后的两两比较
当不满足假设4时,3.5部分的操作可得到经Bonferroni法校正的多重McNemar检验的结果。
由于是事后的两两比较(Post hoc test),因此需要调整显著性水平(调整α水平),作为判断两两比较的显著性水平。依据Bonferroni法,调整α水平=原α水平÷比较次数。本研究共比较了3次,调整α水平=0.05÷3=0.0167。因此,最终得到的P值(上图中Exact Sig. (2-tailed)一行),需要和0.0167比较,小于0.0167则认为差异有统计学意义。
以上结果可以描述为:康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(P=0.007),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义。
五、撰写结论
1. 符合假设4时(即样本量足够)
开始康复、康复3个月和康复6个月时,卒中后患者体能测试的通过率分别为22.2%、44.4%和60.3%。运用Cochran's Q 检验对三个时间点体能测试通过率进行检验,三个时间点通过率的差异具有统计学意义,χ2 = 24.222, P<0.001。
采用Dunn’s检验(经Bonferroni法校正)进行事后的两两比较,康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(调整后P=0.013),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(调整后P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义(调整后P=0.124)。
2. 不符合假设4时
开始康复、康复3个月和康复6个月时,卒中后患者体能测试的通过率分别为22.2%、44.4%和60.3%。运用Cochran's Q 检验对三个时间点体能测试通过率进行检验,三个时间点通过率的差异具有统计学意义, Cochran's Q = 24.222, P<0.001。
运用“精确”McNemar’s检验进行事后的两两比较(经Bonferroni法校正的α=0.0167)。康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(P=0.007),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义(P=0.031)。
推荐学习书籍
《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~
免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27