t检验与Wilcoxon检验的选择：何时用t.test，何时用wilcox.test？

t 检验与 Wilcoxon 检验的选择：何时用 t.test，何时用 wilcox.test？

在统计学假设检验中，t 检验（t-test）和 Wilcoxon 检验（Wilcoxon test，又称秩和检验或符号秩检验）是比较两组或配对数据差异的常用方法。但二者的适用场景截然不同，选择错误可能导致分析结果失真。以下从核心原理、适用条件和实际案例出发，详解何时该用 t.test，何时该用 wilcox.test。

一、两种检验的核心原理与本质区别

t 检验和 Wilcoxon 检验的根本差异在于是否依赖数据的分布假设：

t 检验（参数检验）：基于数据服从正态分布的假设，通过比较两组数据的均值差异来判断总体是否存在统计学差异。它属于参数检验，对数据的分布形态、方差齐性等有严格要求。
Wilcoxon 检验（非参数检验）：不依赖数据的具体分布形态，通过对数据排序后的 “秩次” 进行分析，比较两组数据的位置（中位数）差异。它属于非参数检验，适用于不符合正态分布或分布未知的数据。

二、何时用 t.test？满足 “正态性 + 方差齐性” 是关键

t 检验的核心优势是统计效能高（在符合条件时更容易检测到真实差异），但需满足以下前提条件，否则结果可能不可靠：

1. 数据服从正态分布

t 检验对 “正态性” 假设非常敏感，尤其是小样本（通常 n<30）时。若数据呈现明显的偏态分布（如收入、病毒载量等右偏数据）或存在极端值，均值会受异常值影响被拉高或拉低，此时用 t 检验可能误判差异。

判断方法：可通过直方图、Q-Q 图直观观察分布形态，或用 Shapiro-Wilk 检验、Kolmogorov-Smirnov 检验进行正态性检验（P>0.05 通常认为符合正态性）。

2. 组间方差齐性（针对独立样本 t 检验）

独立样本 t 检验要求两组数据的总体方差相等（方差齐性）。若方差不齐，需使用校正 t 检验（如 Welch’s t-test），但本质仍属于 t 检验范畴。

判断方法：通过 Levene 检验或 Bartlett 检验（P>0.05 认为方差齐性）。

3. 数据类型为连续变量

t 检验适用于真正的连续数据（如身高、体重、血压、血糖等），这些数据可以取任意数值，且差异具有实际意义（如 “身高差 5cm” 是明确的）。

典型适用场景举例

比较两组健康成年人的血红蛋白水平（近似正态分布的连续数据）；
检验某药物治疗前后患者的血压变化（配对样本，且血压数据正态分布）；
大样本（n>50）下，即使数据轻微偏态，因中心极限定理，t 检验仍可近似使用。

三、何时用 wilcox.test？非正态、有序或极端值数据的首选

Wilcoxon 检验（包括独立样本的 Wilcoxon 秩和检验和配对样本的 Wilcoxon 符号秩检验）因不依赖分布假设，被称为 “非参数版 t 检验”，适用于以下场景：

1. 数据不满足正态分布

当数据呈现明显偏态（如肿瘤大小、住院天数、用户留存时间）、分布形态未知，或小样本（n<30）且正态性检验不通过时，Wilcoxon 检验是更安全的选择。例如：比较两组癌症患者的生存期（通常右偏分布），或两组儿童的龋齿数量（偏态离散数据）。

2. 数据为有序分类变量

有序分类变量（如满意度评分 “1-5 分”、疼痛等级 “无 / 轻度 / 中度 / 重度”）虽然以数字形式呈现，但数值间的 “差距” 并非等距（如 “2 分与 3 分的差异” 不等于 “3 分与 4 分的差异”），此时均值无实际意义，需用 Wilcoxon 检验比较秩次差异。

3. 存在极端值（离群值）

t 检验对极端值敏感，一个异常值可能大幅改变均值和标准差；而 Wilcoxon 检验基于数据的秩次（排序位置），极端值的影响被弱化。例如：比较两组家庭的月收入（可能存在少数极高收入家庭），或两组实验小鼠的体重（个别小鼠因异常因素体重骤增）。

4. 小样本且分布不明

当样本量极小（如 n<10），无法通过检验判断分布形态时，非参数检验更稳健，可避免因分布假设错误导致的结论偏差。

典型适用场景举例

比较两组患者的疼痛评分（1-10 分，有序数据）；
分析某干预措施前后患者的生活质量评分（偏态分布）；
检验两组产品的故障时间（存在极端长寿命个体，右偏分布）。

四、关键对比与选择流程图

特征	t 检验（t.test）	Wilcoxon 检验（wilcox.test）
分布假设	要求数据正态分布	无分布假设
数据类型	连续变量（等距 / 比率数据）	连续变量（非正态）或有序分类变量
对极端值敏感度	高（影响均值和标准差）	低（基于秩次，弱化极端值影响）
统计效能	符合条件时更高	正态数据下略低于 t 检验
核心分析指标	均值差异	中位数 / 秩次差异

选择简易流程：

明确数据类型：是连续变量还是有序分类变量？→ 有序变量直接选 Wilcoxon。
对连续变量：检验正态性（结合样本量和图形）。

正态分布且方差齐性→ t 检验；
非正态、方差不齐或存在极端值→ Wilcoxon 检验。

五、总结：选择的核心原则

t 检验和 Wilcoxon 检验并非 “非此即彼” 的对立关系，而是根据数据特性 “量体裁衣” 的工具。核心原则是：当数据满足正态性和方差齐性时，优先用 t 检验以利用其更高的统计效能；当数据偏离正态、为有序变量或存在极端值时，选择 Wilcoxon 检验以保证结果稳健性。在实际分析中，建议先通过可视化（直方图、箱线图）和正态性检验探索数据特征，再结合研究目的选择合适的方法 —— 科学的检验选择，是得出可靠结论的第一步。