生存曲线的估计方法（2）：生存率的95%置信区间-CDA数据分析师官网

热线电话：13121318867

首页大数据时代生存曲线的估计方法（2）：生存率的95%置信区间

生存曲线的估计方法（2）：生存率的95%置信区间

2020-11-10

作者：丁点helper

来源：丁点帮你

生存分析的上一篇文章主要通过一张表格介绍了计算生存率的方法，称作K-M法，也叫乘积极限法，简单来讲就是将生存概率相乘获得生存率。

生存曲线的估计方法（1）：先看懂这个表，比如，前面我们讲过：

好比身高的样本均数，抽取的第一拨人计算的平均身高和第二拨人的平均身高是有差异的。

因为它们都是样本统计量，所以会随着样本的变化而变化。同样地，如果我们想象一下，把这些样本统计量放在一起再求平均数和标准差，那这次得到的这个标准差叫做什么呢？

还记得吗？叫标准误。

在学习均数抽样分布的时候，我们也重点谈过的。

因此，类似的，根据样本计算的生存函数，它也是一个样本统计量，它也可以被计算标准误。

理解了这一层，就应该能搞懂上一篇文章中最后一列出现的“生存率标准误”，如下表第（9）列。

这个“生存率标准误”的计算公式稍微有些复杂，我们可以不详细展开。重点是大家要意识到它所代表的含义：

如果单单由一个样本的生存率去代表总体，会存在误差（类比用一个城市的平均身高代表全国的平均身高），如何去衡量这个误差？由此我们就计算了标准误。

因此，如果搞懂了前面讲的样本均数的标准误等概念，这里就直接类比即可，可见基本的统计学理论和知识点需要重点掌握。

之所以要大费周章地搞懂“生存率的标准误”这个概念，是因为在实际应用中，我们可能经常会面临计算生存率95%置信区间的问题。

同样地，原理和均数95%置信区间几乎完全类似。对这个知识点不熟悉的同学可以阅读我们发的这篇文章。

只要搞懂了置信区间的大逻辑，相信对下面这个生存率的95%置信区间计算公式不会陌生：

因此，我们可以得出：手术后辅助化疗的肺癌患者，10个月生存率的95%置信区间为（0.2848，0.8580），或者写成百分数的形式（28.48%，85.80%）。

讲完生存率置信区间的算法，我们再来复习之前介绍过的一个概念——中位生存时间。

如下图，可以发现，当时间 t=11.124时，对应的生存率是0.5。这表示，当生存时间是11.124个月时，生存函数取值为0.5，从而意味着：

上图有一个专业的名字，叫K-M生存曲线（对应前文讲过的K-M乘积极限法）：横轴是生存时间，纵轴是生存率。

从图中我们可以看出，K-M生存曲线呈阶梯性，随着生存时间的增加，曲线呈下降趋势，意味着时间越长，仍然存活的人数越少，生存率越低。如果曲线阶梯陡峭，表明下降速度快，往往生存期较短。

——热门课程推荐：

想学习PYTHON数据分析与金融数字化转型精英训练营，您可以点击>>>“人才转型”了解课程详情；

想从事业务型数据分析师，您可以点击>>>“数据分析师”了解课程详情；

想从事大数据分析师，您可以点击>>>“大数据就业”了解课程详情；

想成为人工智能工程师，您可以点击>>>“人工智能就业”了解课程详情；

想了解Python数据分析，您可以点击>>>“Python数据分析师”了解课程详情；

想咨询互联网运营，你可以点击>>>“互联网运营就业班”了解课程详情；

想了解更多优质课程，请点击>>>

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据分析标准差人工智能大数据大数据分析抽样分布

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇让python在后台自动解压各种压缩文件！

下一篇时序数据处理难题攻略（上）

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

生存曲线的估计方法（2）：生存率的95%置信区间

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

从“点状静态”到“时序动态”：CDA数据分析师视角 ...

CDA持证人专访：王晓琳谈数据分析备考与秋招实战经 ...

【CDA干货】用户决策流程全解析：核心环节、影响因 ...

从“标签”到“人”：CDA数据分析师视角下的用户画 ...

【CDA干货】透视表跨表数据应用原理与实战方法 ...

【CDA干货】正态分布异常事件识别与处理方法：数据 ...

从“raw”到“ready”：CDA数据分析师视角下的标签 ...

CDA持证人专访：孙尚亮谈制造行业数据分析与生产采 ...

【CDA干货】DataFrame数据归一化：核心原理、常用方 ...

从“零散标识”到“结构资产”：CDA数据分析师视角 ...

【CDA干货】数据分析如何辅助商业谈判决策：从经验 ...

【CDA干货】T检验完整实操教程：核心原理、分类场景 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载