京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
		R语言与显著性检验学习笔记
一、何为显著性检验
显著性检验的思想十分的简单,就是认为小概率事件不可能发生。虽然概率论中我们一直强调小概率事件必然发生,但显著性检验还是相信了小概率事件在我做的这一次检验中没有发生。
显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
常把一个要检验的假设记作H0,称为原假设(或零假设),与H0对立的假设记作H1,称为备择假设。
⑴在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;
⑵在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。
通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。这样的假设检验又称为显著性检验,概率α称为显著性水平。
我们常用的显著性检验有t检验,卡方检验,相关性检验等,在做这一些检验时,有什么需要注意的呢?
二、正态性与P值
t检验,卡方检验,相关性检验中的pearson方法都是建立在正态样本的假设下的,所以在假设检验开始时,一般都会做正态性分析。在R中可以使用shapiro.test()。来作正态性检验。当然在norm.test包中还提供了许多其他的方法供我们选择。
P值是可以拒绝原假设的最小水平值。
三、四个重要的量
综合前面的叙述,我们知道研究显著性检验有四个十分重要的量:样本大小,显著性水平,功效,效应值。
样本大小:这个显然,样本越多,对样本的把握显然越准确,但是鉴于我们不可能拥有无限制的样本,那么多少个样本可以达到要求?今天的分享中我们可以通过R来找到答案。
显著性水平:犯第一类错误的概率,这个在做检验前我们会提前约定,最后根据P值来决定取舍。
功效:这个是在显著性检验中一般不提及但实际十分有用的量。它衡量真实事件发生的概率。也就是说功效越大,第二类错误越不可能发生。虽然显著性假设检验不提及它,但衡量假设检验的好坏的重要指标便是两类错误尽可能小。
效应值:备择假设下效应的量
四、用pwr包做功效分析
Pwr包中提供了以下函数:
	
 
下面我们来介绍以上一些函数的用法。
	1、  t检验
        调用格式:
       pwr.t.test(n = NULL, d = NULL, sig.level =0.05, power = NULL,  type =c("two.sample", "one.sample", "paired"),alternative = c("two.sided", "less","greater"))
     参数说明:
     N:样本大小
     D:t检验的统计量
     Sig.level:显著性水平
     Power:功效水平
     Type:检验类型,这里默认是两样本,且样本量相同
     Alternative:统计检验是双侧还是单侧,这里默认为双侧
     举例说明:已知样本量为60,单一样本t检验的统计量的值为0.2(这个可以通过t.test(data)$statistic取出来),显著水平α=0.1,那么功效是多少呢?
    R中输入命令:
[plain] view plain copy
    pwr.t.test(d=0.2,n=60,sig.level=0.10,type="one.sample",alternative="two.sided")  
     得到结果:
One-sample t test power calculation
              n = 60
              d = 0.2
              sig.level = 0.1
              power = 0.4555818
              alternative = two.sided
       我们可以看到,犯第二类错误的概率在50%以上,我们应该相信这个结果吗(无论根据P值来看是拒绝还是接受)?显然不行,那么需要多少个样本才能把第二类错误降低到10%呢?
           在R中输入:
[plain] view plain copy
    pwr.t.test(d=0.2,power=0.9,sig.level=0.10,type="one.sample",alternative="two.sided")  
           得到结果:
One-sample t test power calculation
                       n = 215.4542
                       d = 0.2
                       sig.level = 0.1
                       power = 0.9
                        alternative = two.sided
           也就是说216个样本才可以得到满意的结果,使得第二类错误概率不超过0.1.
           对于两样本而言是类似的,我们不在赘述,我们下面再介绍另一种t检验的情况:两样本不相等。
          调用格式:
pwr.t2n.test(n1 = NULL, n2= NULL, d = NULL,sig.level = 0.05, power = NULL, alternative = c("two.sided","less","greater"))
          参数说明:
n1    Numberof observations in the first sample
n2    Numberof observations in the second sample
d     Effectsize
sig.level  Significancelevel (Type I error probability)
power     Powerof test (1 minus Type II error probability)
alternative      acharacter string specifying the alternative hypothesis, must be one of"two.sided" (default), "greater" or "less"
           例如:两个样本量为90,60,统计量为0.6,单侧t检验,α=0.05,为望大指标。
     R中的命令:
[plain] view plain copy
    pwr.t2n.test(d=0.6,n1=90,n2=60,alternative="greater")  
输出结果:
t test power calculation
            n1 = 90
            n2 = 60
            d = 0.6
            sig.level = 0.05
            power = 0.9737262
             alternative = greater
           可以看出功效十分大,且α=0.05,我们相信这次检验的结论很可信。
2、  相关性
            Pwr.r.test()函数对相关性分析进行功效分析。格式如下:
pwr.r.test(n = NULL, r = NULL, sig.level = 0.05, power = NULL,    alternative = c("two.sided", "less","greater"))
           这里和t检验不同的是r是线性相关系数,可以通过cor(data1,data2)获取,但需要注意的是不要输入spearman,kendall相关系数,他们是衡量等级相关的。
            假定我们研究抑郁与孤独的关系,我们的原假设和备择假设为:
H0:r<0.25  v.s.    H1:r>0.25
           假定显著水平为0.05,原假设不真,我们想有90%的信心拒绝H0,需要观测多少呢?
          下面的代码给出答案:
[plain] view plain copy
    pwr.r.test(r=0.25,sig.level=0.05,power=0.9,alt="greater")  
    approximate correlation power calculation (arctangh transformation)
             n = 133.8325
              r = 0.25
             sig.level = 0.05
             power = 0.9
             alternative = greater
        易见,需要样本134个
3、  卡方检验
        原假设为变量之间独立,备择假设为变量不独立。命令为pwr.chisq.test(),调用格式:
pwr.chisq.test(w = NULL, N = NULL, df = NULL, sig.level = 0.05, power = NULL)
     其中w为效应值,可以通过ES.w2计算出来,df为列联表自由度
举例:
[plain] view plain copy
    prob<-matrix(c(0.225,0.125,0.125,0.125,0.16,0.16,0.04,0.04),nrow=2,byrow=TRUE)  
    prob  
    ES.w2(prob)  
    pwr.chisq.test(w=ES.w2(prob),df=(2-1)*(4-1),N=200)  
   输出结果:
     Chi squared power calculation
              w = 0.2558646
              N = 200
              df = 3
              sig.level = 0.05
              power = 0.8733222
 NOTE: N is the number of observations
         也就是说,这个观测下反第二类错误的概率在13%左右,结果较为可信。
         在R中还有不少与功效分析有关的包,我们不加介绍的把它们列举如下:
	
	
                  数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28