SPSS—描述性统计分析—列联表-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读SPSS—描述性统计分析—列联表

SPSS—描述性统计分析—列联表

2018-01-09

什么是列联表

列联表又称交互分类表，所谓交互分类，是指同时依据两个变量的值，将所研究的个案分类。交互分类的目的是将两变量分组，然后比较各组的分布状况，以寻找变量间的关系。

这里是按两个变量交叉分类的，该列联表称为两维列联表，若按3个变量交叉分类，所得的列联表称为3维列联表，依次类推。3维及以上的列联表通常称为“多维列联表”或“高维列联表”，而一维列联表就是频数分布表。

列联表的结构

二维列联表

r * c 列联表

观察值的分布

百分比分布

期望频数的分布

假设检验

独立性检验

假设观察频数与期望频数没有差别，而统计量χ2值表示二者间的偏离程度。

相关系数

ψ相关系数

皮尔逊定义的列联系数

V相关系数

Fisher精确检验

卡方统计量是近似的，而Fisher精确检验使用的是超几何分布。

相对危险度（Relative Risk, RR）

参考下面的SPSS实例

优势比(Odds Ratio, OR)

参考下面的SPSS实例

Kappa一致性检验

在数据分析中，比较两种预测方法预测结果的一致性用到Kappa检验。

配对χ2检验

通过Kappa检验，解决了两种测量间究竟有无关联的问题，但是通过列联表的观察，发现两位顾问的评价是否不太一致，这种假设又如何来加以分析呢？

McNemar配对χ2检验就是经典的配对检验，专门用于解决这类问题。

分层χ2检验

分层χ2检验是把研究对象分解成不同层次，按各层对象来进行行变量与列变量的独立性研究。Statistics中Cochran’s and Mantel-Haenszel statistics会自动给出结果。

分层χ2检验是一种很好的控制其他因素的方法，使分析者能得到更准确的结果。如果数据量足够大，还可以引入更多的分层因素加以控制。但是，和SAS中的CMH χ2不同，SPSS提供的CMH χ2检验只能进行二分类变量的检验，而不能进行多分类变量的检验。

检验比较

χ2检验
假设观察频数与期望频数没有差别，而统计量χ2值表示二者间的偏离程度。
卡方检验方法的适用条件

关联程度的度量

χ2检验从定性的角度分析是否存在相关行，而各种关联指标（相对危险度RR与优势比OR）从定量的角度分析相关的程度如何。

Kappa一致性检验与配对χ2检验

Kappa一致性检验对两种方法结果的一致程度进行评价，而配对χ2检验则用于分析两种分类方法的分类结果是否有差异。

分层χ2检验

SPSS分析

菜单

Analyze -> Descriptive Statistics -> Crosstabs

实例一：卡方检验和风险评估

数据集（site.sav）

某公司实行数据库营销，其杂志销售部每个月向数据库中的人们发送征订邮件，但是回应率极低。他们希望找到一种好的方法来定位潜在的客户，只向这些客户发放邮件，从而节省人力物力。数据库中的资料包括：个人一般信息（年龄、性别、婚姻状况、收入、受教育水平及是否退休等），个人行为特征（主要交通工具、有无手机、呼机、电视、CD及是否订阅报纸）。另外，在发送邮件后，还有一个变量也加入到了数据库中：是否对邮件进行回应，即是否在邮件的提示性进行杂志购买。经研究发现，报纸订阅与邮件发送有相关性。该部门经理想了解报纸订阅者回应邮件的概率是非订阅者的几倍。

参数设置

统计量

结果分析

交叉制表

列联表分析表明，并没有太多人对杂志的邮件做出回应，但是其中订阅人占了较大比例。

卡方检验

p值为0.000，故认为订阅报纸与邮件回应是相关的。那么报纸订阅者的回应概率是未订阅者的多少倍呢？通过计算RR来解决。

风险估计

对于报纸订阅者而言，邮件响应的相对危险度是其回应概率与非报纸订阅者的回应概率的比值，其估计值是(380/2768) / (299/3632) = 13.7% / 8.2%=1.668，表明报纸订阅者对邮件的响应概率是非报纸订阅者的1.668倍。或者说报纸订阅者对邮件的无响应的概率是非报纸订阅者的0.94倍。

而优势比即一个事件的Odds Ratio是它发生的概率除以不发生的概率