数据分析之独立样本的T-Test分析_数据分析师-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读数据分析之独立样本的T-Test分析_数据分析师

数据分析之独立样本的T-Test分析_数据分析师

2014-11-04

数据分析之独立样本的T-Test分析

比较两个独立样本数据之间是否有显著性差异，将实验数据与标准数据对比，查看

实验结果是否符合预期。T-Test在生物数据分析，实验数据效果验证中很常见的数

据处理方法。- T-table查找表

独立样本T-test条件：

1. 每个样本相互独立没有影响

2. 样本大致符合正态分布曲线

3. 具有同方差异性

单侧检验(one-tail Test)与双侧检验(Two-Tail Test)

20140420223257859

基本步骤：

1.双侧检验, 条件声明 alpha值设置为0.05

根据t-table, alpha = 0.05, df = 38时, 对于t-table的值为2.0244

20140420223336734

2. 计算自由度(Degree of Freedom)

Df = （样本1的总数 + 样本2的总数）- 2

3. 声明决策规则

如果计算出来的结果t-value的结果大于2.0244或者小于-2.0244则拒绝

4. 计算T-test统计值

20140420223400687

5. 得出结论

如果计算结果在双侧区间之内，说明两组样本之间没有显著差异。

可重复样本的T-Test计算

同样一组数据在不同的条件下得到结果进行比对，发现是否有显著性差异，最常见

的对一个人在饮酒与不饮酒条件下驾驶车辆测试，很容易得出酒精对驾驶员有显著

影响

算法实现：

对独立样本的T-Test计算最重要的是计算各自的方差与自由度df1与df2

20140420223438750

对可重复样本的对比t-test计算

20140420223457937

程序实现：

		
								package com.gloomyfish.data.mining.analysis;
							
								public class TTestAnalysisAlg {
							
								    private double alpahValue = 0.05; // default
							
								    private boolean dependency = false; // default
							
								    public TTestAnalysisAlg() {
							
								        System.out.println("t-test algorithm");
							
								    }
							
								    public double getAlpahValue() {
							
								        return alpahValue;
							
								    }
							
								    public void setAlpahValue(double alpahValue) {
							
								        this.alpahValue = alpahValue;
							
								    }
							
								    public boolean isDependency() {
							
								        return dependency;
							
								    }
							
								    public void setDependency(boolean dependency) {
							
								        this.dependency = dependency;
							
								    }
							
								    public double analysis(double[] data1, double[] data2) {
							
								        double tValue = 0;
							
								        if (dependency) {
							
								            // Repeated Measures T-test.
							
								            // Uses the same sample of subjects measured on two different
							
								            // occasions
							
								            double diffSum = 0.0;
							
								            double diffMean = 0.0;
							
								            int size = Math.min(data1.length, data2.length);
							
								            double[] diff = new double[size];
							
								            for(int i=0; i
									            {
								
									                diff[i] = data2[i] -data1[i];
								
									                diffSum += data2[i] -data1[i];
								
									            }
								
									            diffMean = diffSum / size;
								
									            diffSum = 0.0;
								
									            for(int i=0; i
										            {
									
										                diffSum += Math.pow((diff[i] -diffMean), 2);
									
										            }
									
										            double diffSD = Math.sqrt(diffSum / (size - 1.0));
									
										            double diffSE = diffSD / Math.sqrt(size);
									
										            tValue = diffMean / diffSE;
									
										        } else {
									
										            double means1 = 0;
									
										            double means2 = 0;
									
										            double sum1 = 0;
									
										            double sum2 = 0;
									
										            // calcuate means
									
										            for (int i = 0; i < data1.length; i++) {
									
										                sum1 += data1[i];
									
										            }
									
										            for (int i = 0; i < data2.length; i++) {
									
										                sum2 += data2[i];
									
										            }
									
										            means1 = sum1 / data1.length;
									
										            means2 = sum2 / data2.length;
									
										            // calculate SD (Standard Deviation)
									
										            sum1 = 0.0;
									
										            sum2 = 0.0;
									
										            for (int i = 0; i < data1.length; i++) {
									
										                sum1 += Math.pow((means1 - data1[i]), 2);
									
										            }
									
										            for (int i = 0; i < data2.length; i++) {
									
										                sum2 += Math.pow((means2 - data2[i]), 2);
									
										            }
									
										            double sd1 = Math.sqrt(sum1 / (data1.length - 1.0));
									
										            double sd2 = Math.sqrt(sum2 / (data2.length - 1.0));
									
										            // calculate SE (Standard Error)
									
										            double se1 = sd1 / Math.sqrt(data1.length);
									
										            double se2 = sd2 / Math.sqrt(data2.length);
									
										            System.out.println("Data Sample one - > Means :" + means1
									
										                    + " SD : " + sd1 + " SE : " + se1);
									
										            System.out.println("Data Sample two - > Means :" + means2
									
										                    + " SD : " + sd2 + " SE : " + se2);

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据分析正态分布

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇随机森林 vs XGBoost vs 决策树：算法选择中的

下一篇图论在大数据分析中的作用！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

数据分析之独立样本的T-Test分析_数据分析师

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据透视表更新后数据消失？6大核心原因 ...

【CDA干货】机器学习引导下的有限元模型参数识别： ...

CDA数据分析师：以用户画像为核心，激活用户数据的 ...

【CDA干货】详解Python类方法：定义、分类、实操与 ...

【CDA干货】MySQL中ADD KEY与ADD INDEX的区别：一文 ...

CDA数据分析师与标签体系设计：用结构化标签激活数 ...

【CDA干货】重复测量问卷统计分析：实操指南，精准 ...

【CDA干货】一文读懂销售漏斗：定义、核心逻辑及在 ...

CDA数据分析师必备技能：创建表与视图，筑牢数据分 ...

【CDA干货】数据清洗中的假数据鉴别：方法、实操与 ...

【CDA干货】运用机器学习进行分析：从流程拆解到行 ...

CDA数据分析师与数据库：数据价值转化的双向赋能之 ...

【CDA干货】聚类分析与主成分分析（PCA）核心区别全 ...

【CDA干货】K-Means++初始化方法全解析：原理、实操 ...

CDA数据分析师：以专业能力搭建高效指标体系，赋能 ...

CDA一级知识点汇总手册：第5章业务数据的特征、处 ...

CDA一级知识点汇总手册：第4章战略与业务数据分析 ...

CDA一级知识点汇总手册：第3章商业数据分析框架 ...

CDA一级知识点汇总手册：第2章数据分析方法 ...

CDA一级知识点汇总手册：第1章数据分析思维 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

数据分析之独立样本的T-Test分析_数据分析师

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据透视表更新后数据消失？6大核心原因 ...

【CDA干货】机器学习引导下的有限元模型参数识别： ...

CDA数据分析师：以用户画像为核心，激活用户数据的 ...

【CDA干货】详解Python类方法：定义、分类、实操与 ...

【CDA干货】MySQL中ADD KEY与ADD INDEX的区别：一文 ...

CDA数据分析师与标签体系设计：用结构化标签激活数 ...

【CDA干货】重复测量问卷统计分析：实操指南，精准 ...

【CDA干货】一文读懂销售漏斗：定义、核心逻辑及在 ...

CDA数据分析师必备技能：创建表与视图，筑牢数据分 ...

【CDA干货】数据清洗中的假数据鉴别：方法、实操与 ...

【CDA干货】运用机器学习进行分析：从流程拆解到行 ...

CDA数据分析师与数据库：数据价值转化的双向赋能之 ...

【CDA干货】聚类分析与主成分分析（PCA）核心区别全 ...

【CDA干货】K-Means++初始化方法全解析：原理、实操 ...

CDA数据分析师：以专业能力搭建高效指标体系，赋能 ...

CDA一级知识点汇总手册：第5章 业务数据的特征、处 ...

CDA一级知识点汇总手册：第4章 战略与业务数据分析 ...

CDA一级知识点汇总手册：第3章 商业数据分析框架 ...

CDA一级知识点汇总手册：第2章 数据分析方法 ...

CDA一级知识点汇总手册：第1章 数据分析思维 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

CDA一级知识点汇总手册：第5章业务数据的特征、处 ...

CDA一级知识点汇总手册：第4章战略与业务数据分析 ...

CDA一级知识点汇总手册：第3章商业数据分析框架 ...

CDA一级知识点汇总手册：第2章数据分析方法 ...

CDA一级知识点汇总手册：第1章数据分析思维 ...