《生存分析 SPSS.ppt》由会员分享,可在线阅读,更多相关《生存分析 SPSS.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学从数据到结论第十七章 生存分析生存分析 什么是生存分析的内容?什么是生存分析的内容?“我的期望年龄是多少岁?我的期望年龄是多少岁?”“到到底底这这个个新新疗疗法法能能使使得得这这类类绝绝症症患患者者多多存存活活多多久久?”“还还有有什什么么别别的因素和存活长短有关?的因素和存活长短有关?”保保险险公公司司也也要要考考虑虑各各种种人人群群的的寿寿命命,以以确确保保其其人人寿寿保保险险或或医医疗疗保保险险既既具具有竞争力又有利可图。有竞争力又有利可图。在在工工程程上上,人人们们也也会会考考虑虑一一个个材材料料,一一个个原原件件,甚甚至至一一个个设设备备的的寿寿命命是是多少。多少。什么是生存分
2、析的内容?什么是生存分析的内容?对对于于某某一一特特定定个个体体“能能够够活活多多久久”这这一一类类的的问问题题,任任何何负负责责任任的的人人都都不会作出确定的回答。不会作出确定的回答。但但是是对对于于具具有有某某些些性性质质的的一一类类人人群群,则则可可以以通通过过对对数数据据的的分分析析来来得得到到活活过一定时间的概率。过一定时间的概率。如如果果关关心心不不同同治治疗疗手手段段的的效效果果,则则可可以以通通过过数数据据分分析析来来比比较较这这些些方方法法,看看它它们们是是否否有有效效,还还能能建建立立可可以以预预测测的的量量化化的的模模型型。下下面面引引进进一一个个例例子。子。例子例子 例
3、例 18.1(数数据据 surv.txt)为为了了研研究究对对农农药药中中毒毒的的治治疗疗,需需要要进进行行动动物物试试验验。研研究究人人员员利利用用40只只老老鼠鼠进进行行某某种种农农药药中中毒毒后的某种治疗方法试验。后的某种治疗方法试验。其其中中有有20只只鼠鼠接接受受治治疗疗处处理理;而而作作为为对对照的另外照的另外20只鼠没有接受治疗。只鼠没有接受治疗。在在此此之之后后观观察察这这些些老老鼠鼠的的生生存存时时间间(天天数数)。对对每每一一个个鼠鼠都都记记录录了了其其存存活活时时间间(t)、是是否否属属于于治治疗疗组组以以及及是是否否在在某某观观测测时时间间段数据出现删失。段数据出现删失
4、。例子例子 这这里里的的所所谓谓删删失失(censored)是是由由于于某某种种原原因因,无无法法继继续续观观测测;这这意意味味着着老老鼠鼠至至少少活活过过了了这这个个最最后后记记录录的的时时间间,但最终活了多久就不得而知了。但最终活了多久就不得而知了。这这种种删删失失在在对对于于人人类类疾疾病病的的跟跟踪踪研研究究中中 经经 常常 出出 现现;虽虽 然然 不不 如如 未未 删删 失失(uncensored)的的数数据据完完整整,但但也也包包含含了其至少活了多久这样的信息。了其至少活了多久这样的信息。这里数据中的删失称为右删失。这里数据中的删失称为右删失。一些概念一些概念在在生生存存分分析析中
5、中,人人们们往往往往希希望望知知道道存存活活过过时时间间t的的概概率率,这这就就是是所所谓谓的的生存函数生存函数(survival function)S(t)。显显然然它它等等于于1减减去去生生存存时时间间少少于于t的的概概率,即率,即S(t)=1-F(t)。还还有有一一个个在在t时时刻刻处处(附附近近),对对死死亡亡发发生生的的可可能能性性进进行行度度量量的的函函数数,称称为为危危险险函函数数(hazard function),用用h(t)表表示示,它它实实际际上上是是-lnS(t)的的关关于于t的导数(见后面公式)。的导数(见后面公式)。17.1 17.1 对生命数据的简单描述:生命表对生
6、命数据的简单描述:生命表 生生命命表表(Life Table)是是对对生生存存分分析析数据的一种数量和图形的描述。数据的一种数量和图形的描述。生生命命表表计计算算出出一一些些估估计计,并并依依此此画画出描绘性的图。出描绘性的图。下下页页的的生生存存函函数数图图是是从从简简单单生生命命表表得到的:得到的:横坐标为生存的时间,而纵坐标是生横坐标为生存的时间,而纵坐标是生存函数的大小。显然,随着时间流逝,存函数的大小。显然,随着时间流逝,生存的概率应该递减;因此这种曲线生存的概率应该递减;因此这种曲线都是呈下降趋势。都是呈下降趋势。治疗组治疗组的生存概率的生存概率要比要比对照组对照组看上去要高。看上
7、去要高。还可以得到生命表中的其他量的图,比如估计还可以得到生命表中的其他量的图,比如估计的概率密度函数和危险函数。由于它们并不比的概率密度函数和危险函数。由于它们并不比生存函数更直观,这里就不给出了。生存函数更直观,这里就不给出了。检验治疗组与对照组的生存函数是否不同:检验治疗组与对照组的生存函数是否不同:Wilcoxon(Gehan)检验。检验。在在上上面面得得到到的的生生存存函函数数的的估估计计下下,可可以以对对治治疗疗组组和和对对照照组组进进行行比比较较。所所用用的检验为的检验为Wilcoxon(Gehan)检验。检验。这这里里的的零零假假设设是是:这这两两组组的的生生存存函函数数相同。
8、相同。可可以以很很容容易易从从计计算算机机输输出出得得到到检检验验的的p-值值等等于于0.0564。因因此此,如如取取显显著著性性水平为水平为0.05,就不能拒绝零假设。,就不能拒绝零假设。17.2 对简单生命表的改进对简单生命表的改进:Kaplan-Meier方法方法 前前面面的的描描述述性性生生命命表表有有些些粗粗糙糙,对对于于删删失失数数据的处理也过于简单。据的处理也过于简单。Kaplan-Meier方方法法对对其其进进行行了了改改进进。主主要要是是对对 累累 积积 生生 存存 函函 数数(输输 出出 列列 为为 Cumulative Survival)的估计方法和前面的不同。的估计方法
9、和前面的不同。下下面面的的表表格格为为根根据据例例18.1数数据据按按照照Kaplan-Meier方法所产生的生命表。方法所产生的生命表。这这 里里 一一 共共 两两 个个 表表:第第 一一 个个 是是 对对 照照 组组 的的(treat=0),第第二二个个是是治治疗疗组组的的(treat=1)。这这里里Status=1意意味味着着没没有有删删失失,而而Status=0意意味着有删失。味着有删失。这这是是按按照照Kaplan-Meier方方法法所所估估计计的的生生存存函函数数的的图图。这这个个图图和和前前面面的的不不仅仅数数值值上上不不同,而且还标出了删失值的位置。同,而且还标出了删失值的位置
10、。治疗组与对照组的生存函数是否不同:三种检验治疗组与对照组的生存函数是否不同:三种检验 在在存存在在任任意意右右删删失失(例例18.1数数据据的的删删失失就就是是右右删删失失)的的情情况况下下,利利用用SPSS软软件件可可以以得得到到三三种种对对治治疗疗组组和和对对照照组组进进行行比比较较的的检检验验;检检验验的的零零假假设设均均为为:这这两两组组的的生生存存函函数数相相同同。这这三三种种检检验验是是对对数数秩秩(logrank)检检验验(Mantel-Cox检检验验)、Breslow检检验验(对对前前面面Wilcoxon检检验验的的改改进进),以以及及Tarone-Ware检检验验。通通过过
11、软软件件计计算算可以得到这三种检验的结果:可以得到这三种检验的结果:17.3 17.3 回归:回归:COX COX 比例危险模型比例危险模型 回回归归的的方方法法对对于于统统计计推推断断是是十十分分重重要要的的。那那么么,如如何何在在生生存存数数据据的的分分析析上上建立回归模型呢?建立回归模型呢?人人们们一一般般希希望望生生存存函函数数能能表表示示为为某某些些相相关关的的自自变变量量的的一一个个函函数数。在在例例18.1中中的的自自变变量量就就是是判判别别治治疗疗组组和和对对照照组组的哑元;的哑元;自自变变量量还还可可能能是是连连续续变变量量,比比如如年年龄龄,药物剂量等等。药物剂量等等。17
12、.3 17.3 回归:回归:COX COX 比例危险模型比例危险模型 用用x表表示示自自变变量量(变变量量可可能能是是向向量量,即即有有多个自变量);多个自变量);用用S(t|x)表表示示在在时时间间t的的生生存存函函数数,这这里里的的x表示有关的自变量;表示有关的自变量;用用 S0(t)表表 示示 待待 估估 计计 的的 基基 本本 生生 存存 函函 数数(baseline survival function);它它和和自自变变量量x无关;无关;Cox 比例危险模型为比例危险模型为例例18.118.1数据拟合数据拟合CoxCox回归模型的回归模型的SPSSSPSS输出:输出:可以得到各种点图
13、(可以得到各种点图(1 1)根据根据Cox模型所估计的模型所估计的治疗组治疗组(group=1)和和对对照组照组(group=0)的生存的生存函数图函数图 可以得到各种点图(可以得到各种点图(2 2)根据根据Cox模型所估计的模型所估计的治治疗组疗组(group=1)和和对照组对照组(group=0)的累积危险函的累积危险函数数 SPSS软件使用说明(描述性生命表软件使用说明(描述性生命表)选择选择AnalyzeSurvivalLife Tables;然后把变量然后把变量time选入选入Time;再在再在Display Time Intervals选选0 though 200 by 1(或者诸
14、如或者诸如5等任意间隔);等任意间隔);把变量把变量censored选入选入Status,再点击再点击Define Event来定义未删失值用来定义未删失值用1代表;再把变量代表;再把变量treat选入选入Factor,再点击再点击Define Range,在,在Minimum和和Maximum分别选分别选0和和1;之后点击之后点击Options,在其中点击在其中点击Life Table(默认默认值);在值);在Plot选择需要的图,比如选择需要的图,比如Survival;在在Compare Levels of First Factor处,可点处,可点Overall或根据需要。然后在点击或根据
15、需要。然后在点击Continue之后,之后,点击点击OK来运行。来运行。SPSS软件使用说明软件使用说明(Kaplan-Meier方法方法)选择选择AnalyzeSurvivalKaplan-Meier;然后把变量然后把变量time选入选入Time;把变量把变量censored选入选入Status,再点击再点击Define Event来定义未删失值为来定义未删失值为1;再把变量;再把变量treat选入选入Factor;之后点击之后点击Options,在其中点击在其中点击Survival Table(s)(默认值)和其他需要的表格;在默认值)和其他需要的表格;在Plot选选择需要的图,比如择需要
16、的图,比如Survival;回到主对话框后,点击回到主对话框后,点击Compare Factor Levels来来选择需要的检验;也可点击选择需要的检验;也可点击Save来存储一些输出。来存储一些输出。然后在点击然后在点击Continue之后,最后点击之后,最后点击OK来运行。来运行。SPSS软件使用说明软件使用说明(Cox 比例危险模型比例危险模型)选择选择AnalyzeSurvivalCox Regression;然后把变量然后把变量time选入选入Time;把变量把变量censored选入选入Status,再点击再点击Define Event来定义未删失值为来定义未删失值为1;再把变量;
17、再把变量treat选入选入Covariates;之后点击之后点击Categorical,把,把treat选选入;入;在主对话框点击在主对话框点击Options,在其中选择需要的表格输出在其中选择需要的表格输出内容;内容;在主对话框点击在主对话框点击Plots,选择需要的图形,其中可以把选择需要的图形,其中可以把Covariate Values Plotted at中的中的treat选入选入Separate Lines for以把定性协变量的不同水平的曲线放到一张图中以把定性协变量的不同水平的曲线放到一张图中1。然后在点击然后在点击Continue之后,回到主对话框,最后点击之后,回到主对话框,
18、最后点击OK来运行。来运行。1 注注意意在在SPSS12.0之之前前的的SPSS版版本本,这这个个操操作作有有问问题题(不能实现)。(不能实现)。附录:对生命数据的简单描述:生命表附录:对生命数据的简单描述:生命表 简简单单生生命命表表对对每每个个分分析析者者确确定定的的宽宽度度为为hi的的时时间间段段i:(ti,ti+1),给给出出了了如如下下信信息息(以(以SPSS输出为例):输出为例):简单生命表简单生命表 在在这这个个输输出出中中的的多多数数概概念念都都是是很很容容易易理理解解的的,最最多多参参见见最最后后一一列列的的简简单单定定义。义。这这种种表表格格仅仅仅仅是是数数据据通通过过初初等等运运算算的的一一些些汇汇总总。具具体体的的生生命命表表就就不不在在这这里里展展示示了了。后后面面一一节节还还将将介介绍绍并并展展示示改改进进的的生生命命表表。根根据据这这里里的的生生命命表表可可以以绘出描述性的图。绘出描述性的图。图图18.118.1是是根根据据例例18.118.1数数据据绘绘出出的的对对治治疗疗组组(组组1 1)和和对对照照组组(组组0 0)所所估估计计的生存函数图。的生存函数图。返回到生存函数图返回到生存函数图本章的内容和公式本章的内容和公式(基本)基本)本章的内容和公式本章的内容和公式(Kaplan-Meier)本章的内容和公式本章的内容和公式(Cox模型模型)