SPSS操作:多项测量指标的ROC曲线分析-CDA数据分析师官网

热线电话：13121318867

登录

首页精彩阅读SPSS操作:多项测量指标的ROC曲线分析

SPSS操作:多项测量指标的ROC曲线分析

2017-06-20

收藏

SPSS操作:多项测量指标的ROC曲线分析

在前面几讲中，我们已向大家介绍过如何依据一项测量指标设计和评价诊断试验。但在实际临床工作中，我们往往是根据多项指标综合判断病情的。比如，在诊断高血压时，我们会根据年龄、性别、并发症等多个因素同时评价受试者的患病情况。那么在这种情况下，我们应如何判断诊断结果的真实性呢？

一、问题与数据

某呼吸内科医生拟通过性别、年龄、BMI、COPD病史和是否吸烟等因素预测受试者的肺癌患病情况。他招募了85名肺癌患者，259名非肺癌患者，并通过查阅病历、问卷调查的方式收集了上述信息。变量的赋值和部分原始数据见表1和表2。如果该医生依据这几项因素预测受试者是否患肺癌，那么应如何预测，准确性又如何呢？

表1 肺癌危险因素分析研究的变量与赋值

表2 部分原始数据

从本质上讲，该研究也是结局变量为二分类的诊断试验。但是该诊断试验的测量指标很多，应该如何预测每一位受试者是否患肺癌呢？

我们可以通过二分类Logistic回归模型，用性别、年龄、BMI、COPD病史和是否吸烟等因素，计算受试者患肺癌的预测概率。

二、SPSS分析方法

1. 数据录入SPSS

2. Logistic回归分析（关于Logistic回归每一步设置的意义，可参考“SPSS实例教程：二分类Logistic回归”。）

选择Analyze→Regression→Binary Logistic

（1）主对话框设置

将因变量cancer送入Dependent框中，将纳入模型的自变量sex, age, BMI和COPD变量Covariates中，选择Forward: LR的自变量筛选方法（Method对话框）。

（2）Categorical设置

本研究中，COPD是多分类变量，我们指定“无COPD病史”的研究对象为参照组，分别比较“轻/中度”和“重度”组相对于参照组患肺癌的风险。

点击Categorical→将左侧Covariates中的COPD变量送入右侧Categorical Covariates中。在Reference Category的右侧选择First（表示选择变量COPD中，赋值最小的，即“0”作为参照。）→点击Change→点击Continue。

（3）Save设置

点击Save→选择Probabilities→点击Continue。

三、Logistic回归结果

1. 纳入Logistic回归模型的变量

最终模型纳入了性别（sex）、COPD病史（COPD）和吸烟（smoke）三个变量。也就是说，这该Logistic回归模型认为，这三个变量可以预测是否患肺癌，而年龄和BMI并没有预测意义。

2. 个体患肺癌的概率

根据上述Logistic回归的结果，我们可以写出每个受试者根据性别、COPD病史和是否吸烟三个因素，预测是否患肺癌的危险得分Logit(P)：

Logit(P)= -3.062 + 0.836*sex(男=1；女=0) + 0.454*COPD(轻度) + 1.281COPD(中/重度) + 1.237*smoke(无=0；曾吸/现吸=1)

并可以按照以下公式计算得到每一个受试者患肺癌的预测概率：

实际上，当点选了上述2.5的操作，运行该回归分析后，SPSS会自动生成每一位受试者的预测概率（PRE_1），而不需要上述的手工计算。

至此，我们就可以根据受试者的真实患病情况和预测概率，评估根据性别、COPD病史和是否吸烟三个因素，预测个体是否患肺癌的准确性了。

四、ROC曲线的绘制

1. 选择Analyze→ROC Curve

2. 主对话框设置

将已知的疾病情况cancer送入State Variable框中，预测概率Predicted probability送入Test Variable中，并在Value of State Variable框中填1→OK。

五、结果解读

SPSS的ROC曲线结果会给出ROC曲线和曲线下面积。

根据结果，我们可以知道该诊断试验的ROC曲线下面积是0.718,判断其准确性，并用于与其他诊断试验的比较。至于评价诊断试验的其它指标，需要我们根据预测概率（PRE_1）确定诊断截点（cut-off值）后再计算，有兴趣的小伙伴可以自己尝试计算哦。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

二分类回归分析多分类

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册