京公网安备 11010802034615号
经营许可证编号:京B2-20210330
单样本t检验的spss实现
直接来看一个例子:
常规种植条件下某玉米品的平均穗重为 300g 。现在采用根外施肥(即将肥料制成液体养分,喷洒到玉米的叶面)后,调查了 20 个玉米棒 ,其穗重如表 1所示。问:改用叶面施肥后,穗重是 否显著增加了 ?(置信度为 95% 或者显著水平 α=0.05)

表1 20个玉米穗的重量(单位:g)
这是一个单尾测验,原假设和备择假设是:

原假设(无效假设):叶面施肥没有增产效果。
备择假设 :叶面施肥有增产效果
在SPSS中不能直接进行单尾测验,但是SPSS却可以输出t统计量的双侧检验相伴概率sig,将得到的相伴概率除以2,即得到单尾测验的相伴概率。将这个相伴概率与0.05进行比较,小于0.05则拒绝原假设。
单样本t检验的SPSS操作
首先将数据导入或者录入到spss中,然后依次 选择分析 <均值比较 <单样本t检验. 出现如下图所示的窗口。

将要检验的变量“穗重”选入到“检验变量”窗口,同时输入给定的用于对比的那个值,此处为常规种植条件下的穗重均值300.设置完毕后,点击确定。输出结果中的描述性统计这里就不讨论了,直接看t检验的结果。

你可以找一本统计学教材,对着t分布表,查看一下自由度为19,显著水平为0.05时,的双侧检验的t临界值,将这里得到的t值与那个临界值进行比较,如果这里的t值大于那个临界值,则拒绝原假设,这和p值小于0.05是等价的。
如下图所示,这里得到的双侧t检验相伴概率为0.006,那么单侧相伴概率为0.003,无论是双侧检验还是单侧检验,都可以拒绝原假设,考虑到叶面施肥后的穗重均值为300+7=307,因此认为叶面施肥能够极显著地增加穗重。

双侧检验与单侧检验
下面两张图片中,第一个图中黑色区域表示的是单侧检验的拒绝域。第二个图表示的双侧检验的拒绝域。同样是0.05的置信水平,双侧检验与单侧检验,临界值是不同的,因为黑色区域的位置不同,尽管它们的总面积是相等的。

进行大端单尾测验时,当计算得到的t统计量大于黑色区域与白色区域的临界位置对应的横轴值时,拒绝原假设。而这时,相伴概率也一定小于0.05,因此使用相伴概率和t临界值来决定原假设的取舍,原理本质上是一样的。只不过教材上进行案例讲解时,一般使用临界值,因为相伴概率计算困难。而统计软件一般直接给出相伴概率。(相伴概率即为p值或者spss输出的sig值。)

进行双侧检验时,计算得到的统计量落入两边任意一块黑色区域,就应该拒绝原假设。或者相伴概率小于0.05时,拒绝原假设。(黑色区域表示的是一个很小的概率,这样小的概率,通过一次试验一般是不会发生,如果发生,说明原假设有问题,说明真实的分布不是原假设成立时的这个分布,均值要改变才行,均值改变了才能符合被检验的数据,所以被检验的数据的均值与原来那个设定值是不同的。)
单侧检验的R语言实现
如果你一定要直接得出单侧检验的结果,那也不是没有办法,R语言可以直接得出单侧检验的结果。给出代码如下:
t_test01.1<-read.csv(file="D:/单样本t检验_玉米.csv",header=TRUE)
#载入数据
t.test(t_test01.1$穗重,
alternative =c("greater"),
mu =300, paired =FALSE,
conf.level =0.95
) #进行单样本t检验
输出结果如下
OneSample t-test
data: t_test01.1$穗重
t=3.1239, df=19, p-value =0.002794
alternative hypothesis: true mean is greater than 300
95 percent confidence interval:
303.1254 Inf
sample estimates:
mean of x
307
得到 p-value =0.002794<0.05,拒绝原假设,选择备择假设:alternative hypothesis: true mean is greater than 300。(实际均值大于300)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14