
“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较
小的子集)的均值配对比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。
Tukey (Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误
差率作为实验误差率。
Tukey's-b 用“stndent Range”分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。
Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。
Hochberg's GT2 用正态最大系数进行多重比较。
Gabriel 用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。
Waller-Dunca 用t统计量进行多重比较检验,使用贝叶斯逼近。
Dunnett 指定此选择项,进行各组与对照组的均值比较。默认的对照组是最后一组。选择了该项就激活下面的“Control
Category”参数框。展开下拉列表,可以重新选择对照组。
“Test”框中列出了三种区间分别为:
②方差不具有齐次性时(Equal Varance not assumed),检验各均数间是否有差异的方祛有四种可供选择:
Tamhane's T2, t检验进行配对比较。
Dunnett's T3,采用基于学生氏最大模的成对比较法。
Games-Howell,Games-Howell比较,该方法较灵活。
Dunnett's C,采用基于学生氏极值的成对比较法。
③ Significance 选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。
本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。
6) 设置输出统计量
单击“Options”按钮,打开“Options”对话框,如图5-5所示。选择要求输出的统计量。并按要求的方式显示这些统计量。在该对话框中还可以选择对缺失值的处理要求。各组选择项的含义如下:
图5-5输出统计量的设置
“Statistics”栏中选择输出统计量:
Descriptive,要求输出描述统计量。选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量
的95%置信区间。
Fixed and random effects, 固定和随机描述统计量
Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。用“Levene lest ”检验,即计算每个观测量与其组均
值之差,然后对这些差值进行一维方差分析。
Brown-Forsythe 布朗检验
Welch,韦尔奇检验
Means plot,即均数分布图,根据各组均数描绘出因变量的分布情况。
“Missing Values”栏中,选择缺失值处理方法。
Exclude cases analysis by analysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。
Exclude cases listwise选项,对含有缺失值的观测量,从所有分析中剔除。
以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按钮,显示有关的帮助信息。
本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。
6)提交执行
设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。
7) 结果与分析
输出结果:
表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。
表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。
表5-4方差分析表:第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。第2栏是离差平方和“Sum of Squares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之和。第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为21.900,组内均方为2.400。第5栏是F值9.125(组间均方与组内均方之比)。第6栏:F值对应的概率值,针对假设H0:组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。计算的F值9.125,对应的概率值为0.002。
表5-5 LSD法进行多重比较表,从表5-4结论已知该例子的方差具有其次性,因此LSD方法适用。第1栏的第1列“[i]品种”为比较基准品种,第2列“[j]品种”是比较品种。第2栏是比较基准品种平均数减去比较品种平均数的差值(Mean Difference),均值之间具有0.05水平(可图5-4对话框里设置)上有显著性差异,在平均数差值上用“*”号表明。第3栏是差值的标准误。第4栏是差值检验的显著性水平。第5栏是差值的95%置信范围的下限和上限。
表5-6 是多重比较的Duncan法进行比较的结果。第1栏为品种,按均数由小到大排列。第2栏列出计算均数用的样本数。第3栏列出了在显著水平0.05上的比较结果,表的最后一行是均数方差齐次性检验慨率水平,p>0.05说明各组方差具有齐次性。
多重比较比较表显著性差异差异的判读:在同一列的平均数表示没有显著性差异,反之则具有显著性的差异。例如,品种3横向看,平均数显示在第3列“2”小列,与它同列显示的有品种2的平均数,说明与品种2差异不显著(0.05水平),再往右看,平均数显示在第3列“3”小列,与它同列显示的有品种4的平均数,说明与品种4差异不显著(0.05水平)。则品种3与品种5和品种1具有显著性的差异(0.05水平)。
品种3和品种4都显示有平均数值。
结果分析:
根据方差分析表输出的p值为0.002可以看出,无论临界值取0.05,还是取0.01,p值均小于临界值。因此否定Ho假设,水稻品种对稻纵卷叶螟幼虫抗虫性有显著性意义,结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。根据该结论选择抗稻纵卷叶螟幼虫水稻品种,犯错误的概率几乎为0.008。
只有在方差分析中F检验存在差异显著性时,才有比较的统计意义。
LSD法多重比较表明:
品种1与品种2、品种3和品种5之间存在显著性差异;Duncan法多重比较表明:
品种5与品种3、品种4和品种1之间存在显著性差异。
品种2与品种4和品种1之间存在显著性差异;
品种3与品种5和品种1之间存在显著性差异;
品种4与品种5和品种2之间存在显著性差异;
品种1与品种5、品种2和品种3之间存在显著性差异;
两种方法比较结果一致。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10