
R语言中的t检验
问题
在R中,我们如何检验从总体中抽样得到的两组样本是否有不同的均值,或是通过总体中的某一组样本检验总体均值与某一理论均值间的差异。
指南
示例数据 我们选择内置的sleep数据集作为示例数据。
接下来,我们将sleep数据集处理为宽数据;在之前发布的教程中,我们曾谈到过数据集长宽转换的方法(R语言行动指南-36:长数据与宽数据的转换)。
两组数据的对比:独立双样本t检验
首先假设我们的两组数据完全由独立抽样得来;为了达成这个目的,我们暂且忽略掉ID这个变量的存在。
t.test函数可以直接用于检验像sleep这样的长数据,在下面的例子中,列extra中记录着用于检验的数值,而列group则为样本的分组依据;如果数据没有以数据框形式存储,我们同样可以通过指定两个独立的向量来完成这一操作。
默认地,t.test不会假设样本具有相同的方差,因此该函数默认地调用Welch t检验方法而不是student t检验。可以看到在上文的Welch t检验中,自由度df=17.776,这是由于方法内对于可能存在的非均等方差的调整。如果我们要调用student t检验方法,那么我们需要设置参数var.equal=TRUE。
配对样本t检验
有时需要我们检验的数据可能是同一个实验对象在实验前后的某一关键指标数值,或是相互匹配的两组对象在进行不同实验之后的数值反应,也就是说,我们得到的两组样本数据间具有某种配对关系。此时,我们可以通过配对样本t检验的方式对其进行检验。
同样的,在上文中我们提及了t-test函数可以兼用于一个带有分组变量的数据框或是两个独立的向量。在配对样本中,样本的配对关系取决于其对应的位置。如果我们的数据集为包含分组变量的数据框,那么程序将默认group=1的数据行中的第一行与group=2的数据行中的第一行相互匹配。所以我们需要特别注意数据的排列顺序并确保其中没有缺失值,否则样本间的配对就不得不被打破。在下面的例子中,我们运用group和ID两个变量来确保数据排序的正确。
配对t检验的实质等同于检验每组相互配对的样本数据的差值的总体均值是否为0。(详情可见下文中单样本t检验的内容)
样本与外生总体均值的对比:单样本t检验
假设现在我们的目的为检验列extra数据对应的总体均值是否为0,在下面的例子中,我们暂时忽略了变量group与变量ID。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-29解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-29解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-29鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-29用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-29从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-29CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-29解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-29用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-29从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-292025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-29PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-29t 检验与 Wilcoxon 检验:数据差异分析的两大核心方法 在数据分析的广阔领域中,判断两组或多组数据之间是否存在显著差异是一项 ...
2025-07-29PowerBI 添加索引列全攻略 在使用 PowerBI 进行数据处理与分析时,添加索引列是一项极为实用的操作技巧。索引列能为数据表中的每 ...
2025-07-29CDA 数据分析师必备技能全解析 在数据驱动决策的时代,CDA 数据分析师作为连接数据与业务价值的桥梁,需要具备多元化的技能体系 ...
2025-07-29解析 LSTM 训练后输出不确定:成因与破解之道 在深度学习处理序列数据的领域,长短期记忆网络(LSTM)凭借其捕捉长距离依赖关系 ...
2025-07-29χ² 检验与 t 检验:数据差异分析的两大核心工具 在统计学的方法论体系中,假设检验是验证数据规律、判断差异显著性的核心手段 ...
2025-07-29