【R语言】单一样本推断问题-CDA数据分析师官网

热线电话：13121318867

【R语言】单一样本推断问题

2017-05-31

【R语言】单一样本推断问题

非参数统计概念：

在实际问题中，对数据的分布形式和统计模型难以作出比较明确的假定，最多只能对总体的分布做出类似于连续性型分布或者对某点对称等一般性假定。这种不假设总体分布的具体形式，尽量从数据（样本）本身获得所需要的信息，通过估计而获得分布的结构，并逐步建立对事物的数学描述和统计建模的方法称为非参数方法。

单一样本的推断问题：

符号检验

符号检验所关心的就是通过符号“+”“-”的个数来进行统计推断

eg：假设某城市16座欲出售的楼盘均价（单位：百元 /平方米）

36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35

问：该地盘楼盘价格是否与媒体公布的3700元/平方米说法相符？

分析：

总体均值的点估计是样本均值，总体中位数的点估计是样本中位数，由于中位数的稳健性，将37理解为总体的中位数，则假设问题为：

H0：M=37 H1: M不等于37（待检验的中位数值）

假设：

S+：位于37右边的个数 S-：位于37左边的个数

令K=min{S+，S-}，且K服从p=0.5的二项分布

R代码:

##1.S-为检验统计量

sign1.test = function(x,pi,q0){
s1 = sum(x<q0) #S-的个数
s2 = sum(x>q0) #S+的个数
n = s1+s2
p1 = pbinom(s1,n,pi) ### 取检验统计量K=S-，计算 P（K<=s1）
p2 = 1-pbinom(s1-1,n,pi)   ### 计算 P（K>=s1）
if(p1 < p2){ m1 = "one tail test:H1: Q > q0"
}else{
      m1 = "one tail test:H1: Q < q0"
  }
p.value = min(p1,p2)
m2 = "two tails test"
p.value2 = 2*p.value
list(sign.test.type = m1,p.values.of.one.test = p.value,p.value.of.two.tail.test = p.value2)
}

##以上便构建了符号检验的函数，接下来可以直接调用

data=c(36,31,25,28,36,40,32,41,26,35,35,32,87,33,35,32)##赋值

x=median(data)##获取样本中位数

sign1.test(data,0.5,37)

结果解读：

p=0.02127<0.05(显著性水平)，拒绝H0，认为该地盘楼盘价格是否与媒体公布的3700元/平方米存在显著差异。

趋势检验

对于趋势分析，我们用一些数对来反映前后数据的变化。为保证数对同分布，前后两个数的间隔应该固定；为保证数对不受局部干扰，前后两个数的间隔应该较大。Cox-Staut趋势检验，是以数列中位于中间位置的数为拆分点，前后两两组成数对。

例：一个住宅小区的夜间噪音长期一直保持在30分贝。后来附近有建筑工地施工。数据是连续12天夜间在该小区所测得的噪声水平（分贝）。

30,31,33,35,31,30,68,60,65,67,66,64

请问：该建筑工地是否提高了小区的噪声水平？

建立假设：

Ho:该建筑工地没有提高小区的噪声水平

H1：该建筑工地提高了小区的噪声水平

检验统计量选取：

S=min{S+，S-}

S+：每一数对前后两值之差为正的个数

S-：每一数对前后两值之差为负的个数

R代码：

CS.test = function(x){

m = length(x)

c = if(m/2-round(m/2)==0){m/2}else{(m+1)/2} ### 此处亦可用floor(m/2)代替round(m/2)

d = if(m/2-round(m/2)==0){x[1:c]-x[(c+1):m]}else{x[1:(c-1)]-x[(c+1):m]}

n1 = length(d[which(d > 0)]) ### n1 = length(which(d > 0))

n2 = length(d[which(d < 0)])

n = n1+n2

s1 = sum(sign(d)== 1)

s2 = sum(sign(d)== -1)

if(n1 > n2){

m1 = "one tail test:H1: decreasing"

p.value = pbinom(n2,n,0.5)

}else{

m1 = "one tail test:H1: increasing"

p.value = pbinom(n1,n,0.5)

}

m2 = "two tails test"

s = min(s1,s2)

p.value2 = 2*pbinom(s,n,0.5)

if(n1==n2){p.value = 0.5;p.value2 = 1}

list(sign.test.type = m1,p.values.of.one.test = p.value,p.value.of.two.tail.test = p.value2)

}

上述就是Cox-Staut检验的算法代码

代入数据：

x=c(30,31,33,35,31,30,68,60,65,67,66,64)

结果分析：

单边检验P=0.015625<0.05（显著性水平）

故拒绝H0，认为该建筑工地提高了小区的噪声水平。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

R语言

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

【R语言】单一样本推断问题

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据呈现与数据分析：核心区别+实操边界 ...

【CDA干货】Pandas读取dat文件：提取第一行数据并转 ...

CDA数据分析师核心能力：数据建模实操指南，让数据 ...

【CDA干货】MySQL课时排序累加全指南：3种方法+实操 ...

【CDA干货】Tableau环比计算全指南：3种方法+实操步 ...

CDA数据分析师实操指南：从0到1开展数据治理，激活 ...

【CDA干货】方法验证核心统计：重复性用卡方分析， ...

【CDA干货】两组数据的单因素方差分析：什么时候用 ...

CDA数据分析师：深耕数据治理体系，激活数据资产核 ...

【CDA干货】转置卷积后需要激活函数吗？深度学习实 ...

【CDA干货】搞懂算术平均与几何平均：什么时候用？ ...

CDA数据分析师：锚定数据治理驱动因素，筑牢数据价 ...

【CDA干货】Excel表外引用数据透视表数据：4种方法+ ...

【CDA干货】Excel相关性分析：从操作到解读，小白也 ...

CDA数据分析师必备：用应用效应分解法，解锁时间序 ...

【CDA干货】数据透视表更新后数据消失？6大核心原因 ...

【CDA干货】机器学习引导下的有限元模型参数识别： ...

CDA数据分析师：以用户画像为核心，激活用户数据的 ...

【CDA干货】详解Python类方法：定义、分类、实操与 ...

【CDA干货】MySQL中ADD KEY与ADD INDEX的区别：一文 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载