
四种中介效应分析_spss中介效应结果分析
1.中介效应分析概述
中介效应分析广泛用于社会科学研究(Wood, Goodman, Beckmann, & Cook, 2008),如心理学(MacKinnon, Fairchild, &Fritz, 2007; Rucker, Preacher, Tormala, & Petty, 2011),管理学(Mathieu, DeShon, & Bergh, 2008)和传播学(Hayes, Preacher, &Myers,2011)等。Rucker等(2011)统计发现2005至2009年间发表在《人格与社会心理学杂志》(Journal of Personality and Social Psychology, JPSP) 和《人格与社会心理学公报》(Personality and Social Psychology Bulletin, PSPB)上59%和65%的文章使用了中介检验。
中介分析之所以如此流行,主要取决于如下几点原因(MacKinnon, 2008; MacKinnon, Fairchild, & Fritz, 2007):
第一,刺激—有机体—反应模型在心理学中的主导地位。
其次,中介变量是社会科学诸多理论中不可缺少的内容。
第三,方法学上的挑战,中介效应检验的精确性激起了方法学者的研究热情,新的方法或检验程序不断更新(Mathieu, DeShon, & Bergh, 2008)。
中介变量存在于多种模型,如路径模型,SEM,纵向模型(MacKinnon, 2008; von Soest & Hagtvet, 2011)和多水平模型(Preacher, Zyphur, & Zhang, 2010; 温忠麟等, 2012)等,下面介绍在路径模型的框架内结束中介效应分析,这里介绍的方法也适用于其他情况,潜变量路径分析(SEM)中的中介效应分析放在第8章介绍,关于其他模型的中介效应分析的内容可参见MacKinnon(2008)和温忠麟等(2012)的专著。
2.中介效应分析的意义
中介变量是联系两个变量之间关系的纽带,在理论上,中介变量意味着某种内部机制(MacKinnon, 2008)。自变量X的变化引起中介变量M的变化,中介变量M的变化引起因变量Y的变化。例如,某种治疗癌症的药物(X)需要通过特定的酶(M)才能有效杀死肿瘤细胞(Y),如果体内缺少这种酶,药物的作用将失效。可见中介变量是参与整个因果过程中的重要一环,不可或缺,正因为如此,中介效应分析的前提是变量间存在明确的(理论上或事实上的)因果关系(Baron & Kenny, 1986; Kenny et al., 1998;MacKinnon et al., 2002),否则结果很难解释。
文献中存在多种中介效应检验的程序(MacKinnon, 2008; MacKinnon et al.,2002; 温忠麟等, 2012),下面以最简单的中介模型为例说明中介效应分析的思路。如图3-9,自变量X作用于因变量Y,路径系数c。由于不涉及第三个变量,所以c代表自变量作用于因变量的总效应。
一般情况下,只有当c显著或X与Y相关显著时才会考虑中介变量(e.g., Baron & Kenny, 1986; Judd & Kenny, 1981; 温忠麟等, 2012),但不必然如此。下图是个单中介模型,a代表自变量X作用于中介变量M的效应,b表示中介变量M作用于因变量Y的效应,c’代表考虑或控制中介变量M后,自变量X作用于因变量Y的效应。
使用流行的统计分析软件或结构方程软件可以方便的获取a,b,c和c’的估计值及对应标准误,进行显著性检验和构建路径系数的置信区间(MacKinnon, 2008; Preacher & Hayes, 2008)。总效应等于所有中介效应加上c = ab + c’。c为总效应,c’为考虑中介效应后的直接效应,ab为中介效应也称间接效应。在回归模型中,ab = c-c’,但在其他模型(如logistic回归和多水平分析)中两者不一定完全相等(MacKinnon, 2008; 温忠麟等, 2012)。
(1) 逐步检验法(Causal Steps Approach; Baron & Kenny, 1986)
Kenny及其同事描述的中介效应检验程序是使用较多的检验程序,该方法易于理解和操作,具体步骤如下:
b.检验自变量作用于中介变量效应a是否显著;如果a显著则继续进行随后检验,否则终止分析,中介效应不存在;
c.检验中介变量作用于因变量效应是否b显著;如果b显著则继续进行随后检验,否则终止分析,中介效应不存在;
d.检验直接效应c’是否显著。在a和b都显著的情况下,如果c’不显著说明存在完全中介(Judd & Kenny, 1981),否则存在部分中介效应(Baron &Kenny, 1986)。
尽管逐步检验法易于理解和操作而且使用最频繁,但其存在问题也很明显。如前所述,c是否显著并非中介检验的必要前提,因为在有些情况下尽管c不显著仍然存在实质的中介效应即所谓的抑制模型(Suppression model; MacKinnon, Krull, &Lockwood, 2000)。如果按照逐步检验法的要求,c必须首先显著否则中介变量无从谈起,而实际中c不显著而存在实质性中介效应的情况又非常普遍,所以逐步检验法将错过很多实际存在的中介效应。另外,模拟研究发现,与其他方法相比逐步检验法的统计功效最小(MacKinnon, Lockwood, Hoffman, West, & Sheets, 2002; MacKinnon, Lockwood, & Williams,2004)。
(2) 系数乘积检验法(Product of Coefficients Approach)
系数乘积检验就是检验ab乘积是否显著即H0:ab = 0,此程序常使用Sobel(1982)提出的标准误计算公式,因此也将此检验称作Sobel检验。
ab乘积是中介效应的大小,所以检验ab乘积是否显著是对中介效应的直接检验。ab乘积作为抽样分布,文献中存在多种计算其标准误的方法,其中最常用的是Sobel(1982)给出的公式:
s2a和s2b分别为系数a,b标准误的平方。系数乘积检验法的统计量是z=ab/sab,如果检验显著说明中介效应显著。此公式被常用的SEM分析软件采用,例如EQS,LISREL和Mplus。也有其他的分析程序(Preacher & Hayes, 2004)使用不同的标准误公式如:
根据sab可以构建中介效应的置信区间:
系数乘积检验法存在的主要问题是,检验统计量依据的正态分布前提很难满足,特别是样本量较少时。因为即使a,b分别服从正态分布,ab的乘积也可能与正态分布存在较大差异。
(3) 差异系数检验
差异系数检验即检验H0:c–c’=0。通常情况下ab = c–c’,因此差异系数同系数乘积法有很多相同之处。c–c’的标准误估计通常使用如下公式(McGuigan & Langholz, 1988):
Sc和Sc’分别为两个直接效应估计的标准误,r为自变量与中介变量的相关系数。差异系数采用t检验,其统计量为t=c–c’/Sc-c’。
模拟研究发现(MacKinnon et al., 2002),系数乘积法和差异系数法比逐步检验法精确且具有较高的统计效力。
(4) Bootstrapping
Bootstrapping的原理是当正态分布假设不成立时,经验抽样分布可以作为实际整体分布用于参数估计。Bootstrapping以研究样本作为抽样总体,采用放回取样,从研究样本中反复抽取一定数量的样本(例如,抽取500次),通过平均每次抽样得到的参数作为最后的估计结果(Efron & Tibshirani, 1993; Mooney & Duval, 1993)。
Bootstrapping不需要分布假设所以避免了系数乘积检验违反分布假设的问题,而且该方法不依赖标准误所以避免了不同标准误公式产生结果不一致的问题。模拟研究发现,与其他中介效应检验方法相比Bootstrapping具有较高的统计效力(e.g., Briggs, 2006;Cheung, & Lau, 2008; MacKinnon et al., 2002,2004; Williams & MacKinnon, 2008;Taylor, MacKinnon, & Tein, 2008)。因此,Bootstrapping法是目前比较理想的中介效应检验法(Preacher, & Hayes, 2008;Preacher, Rucker, & Hayes, 2007;Hayes, Preacher, & Myers, 2011)。
Mplus提供两种Bootstrap[1]:标准的和残差的(Bollen & Stine, 1992; Efron & Tibshirani, 1993; Enders, 2002)。标准的Bootstrap只适应于ML,WLS,WLSM,WLSMV,ULS和GLS估计法,因为MLR,MLF,MLM和MLMV估计法的标准Bootstrap与ML结果相同。残差的Bootstrap只适应于连续变量的ML估计。通过使用Bootstrap语句以及MODEL INDIRECT和CINTERVAL,可以得到间接效应的Bootstrap标准误和偏差校正的Bootstrap置信区间[2]。
中介效应分析小结
本小结以最简单的中介模型为例,简要介绍了四种常用的中介效应检验方法。多中介等更复杂的效应检验与此大同小异,对于这些问题的进一步探讨请参见MacKinnon的专著(2008)和相关研究论文(e.g., Cheung, & Lau, 2008; Shrout, & Bolger, 2002; Taylor, MacKinnon, & Tein, 2008; von Soest, & Hagtvet, 2011)。
[1]因为涉及到再抽样,所以在估计时要求输入数据类型为个体数据即原始数据。
[2]如果置信区间包括0则说明系数不显著;如果不包括0说明系数显著。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26