京公网安备 11010802034615号
经营许可证编号:京B2-20210330
手把手教你协方差分析的SPSS操作
一、问题与数据
某研究将73例脑卒中患者随机分为现代理疗组(38例)和传统康复疗法组(35例)进行康复治疗,采用Fugl-Meyer运动功能评分法(FMA)分别记录治疗前、后的运动功能情况,部分数据如下。试问现代理疗和传统康复治疗对脑卒中患者运动功能的改善是否有差异?
二、对数据结构的分析
整个数据资料涉及2组患者(共73例),每名患者有康复治疗前、后2个数据,测量指标为FMA评分。由于治疗前的FMA分数会对治疗后的FMA分数产生影响,因此在比较现代理疗和传统康复疗法对患者运动功能的改善情况时,应把治疗前的FMA评分作为协变量进行调整,若满足协方差分析的应用条件,可采用完全随机设计的协方差分析。
协方差分析可以控制混杂因素对处理效应的影响,提高假设检验的效能和分析结果的精度。其应用条件包括:受试对象的观测指标满足独立性,各处理组的观测指标均来自正态分布总体,且方差相等。需要控制的协变量(自变量)与观测指标(因变量)之间存在线性关系,且每个组用协变量(自变量)与观测指标(因变量)进行直线回归时,回归直线的斜率相同(即各组回归直线平行)。
1. 各组回归直线是否平行的假设检验;
2. 各组观测指标方差是否相同的假设检验;
3. 协变量(自变量)与观测指标(因变量)之间是否存在线性关系的假设检验;
4. 控制协变量的影响后,各组调整的均数是否相等的假设检验。
三、SPSS分析方法
1、数据录入SPSS
(组别1=现代理疗组,组别2=传统康复疗法组,FMA1=治疗前FMA评分,FMA2=治疗后FMA评分)
2、选择Analyze→General Linear Model→Univariate
3、选项设置
A. 主对话框设置:选择观测指标(FMA2)到Dependent Variable窗口,组别变量到Fixed Factor(s)窗口,协变量(FMA1)到Covariate(s)窗口。
B. Model设置:点击Model按钮→选择Custom选项→将组别和FMA1分别放入Model窗口→将组别和FMA1同时选中(按住Ctrl后分别点击“组别”和“FMA1”),选入Model窗口构成交互项→点击Continue返回主对话框→OK。
放入分组变量与协变量的交互项是为了检验各组回归直线是否平行,若交互项结果满足P>0.05,则尚不能认为各组协变量与观测指标之间的回归直线斜率不等。在各组回归直线平行的条件成立时,才可以考虑进一步使用协方差分析。当处理因素与协变量有交互作用,即各组回归直线平行的条件不成立时(P<0.05),应对资料进一步处理或采用其他方法。
得到结果后,这一步仅需要查看Tests of Between-Subjects Effects的结果,组别*FMA1一行为各组回归直线是否平行进行假设检验的结果。F=0.703,P(Sig.)=0.405 >0.05,尚不能认为两组治疗前FMA评分与治疗后FMA评分之间回归直线的斜率不等,即满足回归直线平行的条件(这一步是协方差分析的假设检验1)。因此,可以做协方差分析,接下来需要重复上述步骤2、步骤3,并在Model设置中,将分组变量与协变量的交互项从模型中去掉,如下图所示。
C. Options设置:点击Options按钮→在Display部分勾选Descriptive statistics(给出各组及总的例数、均数和标准差)、Homogeneity tests(给出方差齐性检验结果)、Parameter estimates(给出协方差模型的各个参数)→将组别变量放入Display means for窗口(给出各组调整均数的估计值)→点击Continue返回主对话框→OK。
四、结果解读
Descriptive Statistics表格给出了治疗后FMA评分的部分统计信息,包括两组及总的例数(N)、均数(Mean)和标准差(Std. Deviation)。
Levene’s Test of Equality of Error Variances表格给出了方差齐性检验的结果,F=0.199,P(Sig.)=0.657,尚不能认为两组治疗后FMA评分的方差不等,即满足方差齐的条件(这一步是协方差分析的假设检验2)。
Tests of Between-Subjects Effects表格给出了协方差分析结果(不含交互项),其中FMA1一行为协变量与观测指标之间是否存在线性关系的假设检验结果。F=134.213,P(Sig.)<0.001,可以认为治疗前FMA评分与治疗后FMA评分之间存在线性关系,即满足线性关系的条件(这一步是协方差分析的假设检验3)。
组别一行为各组观测指标调整的均数是否相等的假设检验结果。F=7.866,P(Sig.)=0.007 <0.05,两组之间治疗后FMA评分的差异具有统计学意义,说明现代理疗和传统康复治疗对脑卒中患者运动功能的改善是有差异的。(这一步是协方差分析的假设检验4。协方差分析需要满足前3个假设后,才能根据假设检验4推断研究问题。如果前3个假设不满足,则不能进行协方差分析)
Parameter Estimates表格给出了协方差模型参数估计的结果。本例中的协方差模型为:
Estimated Marginal Means表格给出了协方差分析时观测指标的调整均数,各组调整的均数是利用参数估计的结果计算的。用各组FMA1的总平均数代入上面的协方差模型,即可得到观测指标的调整均数。
五、撰写结论
根据基线运动功能调整后,现代理疗方法对脑卒中患者进行康复治疗的运动功能得分为55(95% CI:52-57),传统康复疗法的运动功能得分为50(95% CI:48-53)。两种方法对脑卒中患者运动功能改善的差异具有统计学意义,现代理疗方法优于传统康复疗法(F=7.866,P=0.007)。
六、延伸阅读
本例如果用康复治疗前、后的FMA评分相减,生成一个差值,再对两组间的差值进行两样本均数比较的t检验,其结果如何呢?
t=2.527,P=0.014,两组间FMA评分变化的差异具有统计学意义。虽然t检验得出的结论与协方差分析的结论相同,但是把前、后测量值转换为差值之后,原有的数据信息也会有所损失。而且,如果两组间基线值有差异,差值更不能作为判别组间差别的依据。因此,将基线值作为协变量进行校正的协方差分析是科学可行的常用方法。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20在商业数据分析领域,“懂理论、会工具”只是入门门槛,真正的核心竞争力在于“实践落地能力”——很多分析师能写出规范的SQL、 ...
2025-11-20在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11