第16章--生存分析.ppt

上传人:得****1 文档编号:75398713 上传时间:2023-03-03 格式:PPT 页数:43 大小:313.50KB
返回 下载 相关 举报
第16章--生存分析.ppt_第1页
第1页 / 共43页
第16章--生存分析.ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《第16章--生存分析.ppt》由会员分享,可在线阅读,更多相关《第16章--生存分析.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、前 言l为什么要引入生存分析方法?为什么要引入生存分析方法?l临床上有许多随访资料临床上有许多随访资料,如有两组肺如有两组肺癌病人癌病人,病情、性别、年龄等因素齐病情、性别、年龄等因素齐同,一组并病人用单纯手术治疗,另同,一组并病人用单纯手术治疗,另一组用手术一组用手术+放疗,随访放疗,随访5年,怎样年,怎样综合评定治疗效果?综合评定治疗效果?1生存分析表表16-1 甲(手术组)、乙(手术甲(手术组)、乙(手术+放疗)两组治疗方案肺癌病人临床随访结果放疗)两组治疗方案肺癌病人临床随访结果2生存分析什么是生存时间资料?什么是生存时间资料?l所以疾病预后的好坏所以疾病预后的好坏,出现这种结局所需要

2、的时间。出现这种结局所需要的时间。l慢性疾病慢性疾病,如恶性肿瘤、糖尿病、高血压、心血管如恶性肿瘤、糖尿病、高血压、心血管等疾病疗效的分析,单纯的治愈率不能敏感地反映等疾病疗效的分析,单纯的治愈率不能敏感地反映出治疗的效果。出治疗的效果。l有一类资料含有结局和时间两方面的信息,它源于有一类资料含有结局和时间两方面的信息,它源于寿命统计,通过随访收集,特称为生存时间资料寿命统计,通过随访收集,特称为生存时间资料(survival data)。)。l生存时间资料的分析方法简称为生存分析。生存时间资料的分析方法简称为生存分析。3生存分析l某临床医生将某临床医生将22例肺癌患者随机分成两组,例肺癌患者

3、随机分成两组,分别采用分别采用化化疗和放化疗联合治疗,从缓解出疗和放化疗联合治疗,从缓解出院日开始随访,随访时间院日开始随访,随访时间(月月)如下如下(带带“+”号的数据表示患者至少活了多少个月号的数据表示患者至少活了多少个月)。化化疗组疗组1,2,3,5,6,9+,11,13,16,26,37+放化疗联合组放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+4生存分析共共 同同 特特 点点 l蕴涵有蕴涵有结局结局和和时间时间两个方面的信息;两个方面的信息;l结局为两分类互斥事件;结局为两分类互斥事件;l一般是通过随访收集得到,随访观察往一般是通过随访收集得到,随

4、访观察往往是从往是从某统一时间点某统一时间点(如确诊、入院或实施如确诊、入院或实施手术等某种处理措施后手术等某种处理措施后)开始,观察到开始,观察到某规某规定时间点截止定时间点截止;l常因失访等原因造成某些研究对象的生常因失访等原因造成某些研究对象的生存时间数据存时间数据不完整不完整,分布类型复杂。,分布类型复杂。5生存分析第一节第一节 生存分析中基本概念生存分析中基本概念2.起始事件起始事件:反映研究对象生存过程起始特征的事:反映研究对象生存过程起始特征的事件如疾病件如疾病“确诊确诊”、“开始治疗开始治疗”、“接触毒物接触毒物”等。等。3.终点事件终点事件(死亡事件、失效事件):(死亡事件、

5、失效事件):反映研究对反映研究对象生存过程特定结局的事件,如象生存过程特定结局的事件,如“死亡死亡”、“痊痊愈愈”、“出现毒性反应出现毒性反应”。1.生存时间生存时间(失效时间):起始事件与终点事件的(失效时间):起始事件与终点事件的时间间隔时间间隔t。时间的尺度可以是分、小时、天、月、时间的尺度可以是分、小时、天、月、年等。年等。1、基本概念、基本概念6生存分析截尾值截尾值(censored value)(终检终检)随访过程中,随访过程中,由于某种原因未能观察到所期望的事件发生,这由于某种原因未能观察到所期望的事件发生,这些个体所提供的数据称截尾值或删失值。些个体所提供的数据称截尾值或删失值

6、。l删失原因:删失原因:l 1.随访对象失访、死于其他疾病随访对象失访、死于其他疾病l 2.随访结束时对象仍存活随访结束时对象仍存活l 3.治疗措施改变治疗措施改变4.生存资料的类型生存资料的类型 完全数据完全数据:是指在整个随访研究期间能够观察到终:是指在整个随访研究期间能够观察到终点事件,即能够观察到从起点到终点的生存时间点事件,即能够观察到从起点到终点的生存时间 7生存分析5.1 观察对象同时进入研究,即研究起始时间相同,观察对象同时进入研究,即研究起始时间相同,这类研究常见于:队列研究这类研究常见于:队列研究、动物实验等。、动物实验等。5.随访研究的模式随访研究的模式5.2 观察对象逐

7、个进入研究,即研究起始时间不观察对象逐个进入研究,即研究起始时间不同,多见于临床随访研究。同,多见于临床随访研究。起始事件起始事件 终点事件终点事件 失失 访访 截截 尾尾 研究时间 研究时间 研究起点 研究终点 研究起点 研究终点 图 15-1 队列研究示意 图 15-2 临床随访研究示意 8生存分析l死亡率:死亡率:死亡概率死亡概率:q=年内死亡人数/年初观察人数生存概率生存概率:P=该年活满一年的人数/年初 观察人数=1-q9生存分析 6.生存函数(生存函数(survival function)生存函数又称累积生存概率,记为生存函数又称累积生存概率,记为 S(tk),是病是病人活到人活到

8、t时刻仍然存活的概率常用时刻仍然存活的概率常用S(tk)=P(T tk)。实实际应用中计算:际应用中计算:tk时刻仍然存活的例数时刻仍然存活的例数/观察总例数。观察总例数。其中其中T为病人存活的时间。但如果含有截尾数据,分为病人存活的时间。但如果含有截尾数据,分母分段校正。母分段校正。故采用故采用概率乘法原理概率乘法原理计算生存率,生存计算生存率,生存概率用概率用p表示,生存率估计的应用公式为:表示,生存率估计的应用公式为:S(tk)=P(T tk)=p1p2 pk S(0)=1 S()=010生存分析生存曲线:生存曲线:各时点的累积生存概率连接在各时点的累积生存概率连接在一起的曲线图。一起的

9、曲线图。半数生存期半数生存期 中位生存期(中位生存期(median survival time):即寿即寿 命表中的中位数,表示有命表中的中位数,表示有50%的个体存活的个体存活的时间。的时间。11生存分析12生存分析7.死亡函数:死亡函数:表示一个观察对象从开始观察到表示一个观察对象从开始观察到时间时间t为止的死亡概率,随时间上升的函数为止的死亡概率,随时间上升的函数F(t,X)=P(T t,X),t +时,时,F(t,X)=1生存函数与死亡函数的关系:生存函数与死亡函数的关系:S(t,X)=1-F(t,X)8.死亡密度函数:死亡密度函数:所有观察对象在所有观察对象在t时刻的时刻的 瞬时死亡

10、率瞬时死亡率 13生存分析9.风险函数:风险函数:生存时间达到生存时间达到t的一群观察对的一群观察对象在象在 t+t区间内死亡的概率极限。区间内死亡的概率极限。14生存分析l例例16-1 现有现有40个肝癌病人的随访资料,见表个肝癌病人的随访资料,见表16-2,试估计生存函数、死亡密度函数和风试估计生存函数、死亡密度函数和风险函数。险函数。表16-2 40个肝癌病人的随访资料 15生存分析二、生存分析的基本内容二、生存分析的基本内容 生存分析已形成了一套较为完善的理论体系,生存分析已形成了一套较为完善的理论体系,可概括如下:可概括如下:16生存分析三、生存分析的基本方法三、生存分析的基本方法研

11、究目的研究目的非(半)参数方法非(半)参数方法参数方法参数方法生存过程的描述生存过程的描述乘积乘积极限法极限法(Kaplan-Meier)指数分布指数分布寿命表法寿命表法Weibull分布分布Turnbull估计(危险估计(危险率估计)率估计)Gamma分布分布Logistic分布分布对数正态分布对数正态分布17生存分析研究目的研究目的非(半)参数方法非(半)参数方法参数方法参数方法生存过程的比较生存过程的比较对数秩(对数秩(log-rank)检验)检验指数分布指数分布分层对数秩检验分层对数秩检验Weibull分布分布Gehan检验检验Gamma分布分布广义广义Wilcoxon检验检验 Log

12、istic分布分布 Mantel-Haenszel检验检验对数正态分布对数正态分布18生存分析研究目的研究目的非(半)参数方法非(半)参数方法参数方法参数方法影响因素的分析影响因素的分析Cox比例风险模型比例风险模型指数分布指数分布非比例风险模型非比例风险模型Weibull分布分布Logistic回归模型回归模型19生存分析第二节 生存率的估计一、小样本生存率的乘积极限法一、小样本生存率的乘积极限法(Kaplan-Meier)例例16-2 在儿童急性淋巴细胞白血病(在儿童急性淋巴细胞白血病(ALL)的)的生存研究中,有生存研究中,有21例高危儿童例高危儿童ALL的临床随访的临床随访资料。资料。

13、生存时间生存时间定义为确诊日期到病人死亡日定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表期的时间跨度,得到的生存时间(月),见表16-3第(第(1)栏,其中有)栏,其中有“”者是截尾数者是截尾数据,据,表示病人仍生存或失访。试计算其生存率与标表示病人仍生存或失访。试计算其生存率与标准误。准误。20生存分析表表16-3 高危高危ALL儿童生存率计算方法儿童生存率计算方法 21生存分析l生存率的标准误计算 表示把小于和等于表示把小于和等于t时刻的各种非截尾值所对应的时刻的各种非截尾值所对应的全部加起来全部加起来(式(式15-6)(式(式15-7)22生存分析l总体生存率的可信区

14、间 计算公式:计算公式:第五个月总体生存率的第五个月总体生存率的95%CI:(1)正态分布法)正态分布法23生存分析(2)尾部总体率的区间估计)尾部总体率的区间估计G(Tt)的渐近标准误为:的渐近标准误为:生存率的对数变换公式生存率的对数变换公式 G(Tt)的的95CI:总体生存率总体生存率95CI:24生存分析l生存曲线高危儿童高危儿童ALL病人生存曲线病人生存曲线 0.000.250.500.751.00month020406080100120140Censored Observations25生存分析l中位生存时间的计算中位生存时间的计算采用内插法:采用内插法:t=15.5(月)(月)2

15、6生存分析二、大样本生存资料的寿命表估计法二、大样本生存资料的寿命表估计法 在样本较大时,随访病例的生存时间常在样本较大时,随访病例的生存时间常可按年、月或日进行分组,得出具有若干可按年、月或日进行分组,得出具有若干时间段的频数表。时间段的频数表。例例16-4 某研究收集了某研究收集了1980-1993年中山市肺年中山市肺癌新发患者癌新发患者2238例,经随访将有关资料整理例,经随访将有关资料整理后列于表后列于表16-5,其中生存时间是以月计算的,其中生存时间是以月计算的,试计算其生存率及其标准误。试计算其生存率及其标准误。27生存分析表表16-5 2238例肺癌病人生存率及其标准误计算例肺癌

16、病人生存率及其标准误计算28生存分析 图16-4 2238例肺癌病人生存率曲线 29生存分析第三节第三节 生存曲线的比较生存曲线的比较 两组及多组生存曲线的比较一般用两组及多组生存曲线的比较一般用log-rank检验。检验。log-rank 检验是以生存时间的检验是以生存时间的对数为基础推导出来的,其基本思想是实对数为基础推导出来的,其基本思想是实际死亡数与期望死亡数之间的比较。际死亡数与期望死亡数之间的比较。v=组数组数130生存分析 例例 根据例根据例16-2和例和例16-3的随访资料,的随访资料,问高危儿童和标危问高危儿童和标危ALL儿童的生存率有儿童的生存率有无差别?无差别?31生存分

17、析注意事项注意事项l对于大样本资料生存率比较,可以将其整理成对于大样本资料生存率比较,可以将其整理成频数表形式,其基本原理与上述方法相同。用频数表形式,其基本原理与上述方法相同。用log-rank检验对样本生存率进行比较时,要求检验对样本生存率进行比较时,要求两组生存曲线不能交叉,生存曲线的交叉提示两组生存曲线不能交叉,生存曲线的交叉提示有某种混杂因子存在。此时应采用分层的方法有某种混杂因子存在。此时应采用分层的方法或多因素的方法来校正混杂因素。另外,当假或多因素的方法来校正混杂因素。另外,当假设检验推断有差别时,可以通过生存曲线、半设检验推断有差别时,可以通过生存曲线、半数生存期及相对危险度

18、等指标来评价其效果。数生存期及相对危险度等指标来评价其效果。32生存分析l对于生存分析数据,国外学者提出针对具体问对于生存分析数据,国外学者提出针对具体问题提出了许多处理方法,包括统计描述和统计题提出了许多处理方法,包括统计描述和统计推断推断l在实践中,人们发现许多生存分析资料,尤其在实践中,人们发现许多生存分析资料,尤其是医学随访资料有其特殊性:生存时间分布复是医学随访资料有其特殊性:生存时间分布复杂;存在截尾数据;有时需要将多个因素同时杂;存在截尾数据;有时需要将多个因素同时考虑考虑l1972年英国统计学家年英国统计学家Cox提出了比例风险模型提出了比例风险模型(Coxs proporti

19、onal hazard regression model),解决了上述的问题,解决了上述的问题如何进行生存时间的影响因素分析?如何进行生存时间的影响因素分析?第四节第四节 Cox比例风险模型比例风险模型33生存分析Cox模型的基本形式模型的基本形式l生存分析的目的在于研究因素与观察结生存分析的目的在于研究因素与观察结果之间的关系;当累积生存率或称生存函果之间的关系;当累积生存率或称生存函数数S(t,X)受到因素的影响时,传统的方法受到因素的影响时,传统的方法是考虑回归分析,即各因素对是考虑回归分析,即各因素对S(t,X)的影的影响响lox模型不直接考察生存函数模型不直接考察生存函数S(t,X)

20、与因与因素之间的关系,而用风险率函数素之间的关系,而用风险率函数h(t,X)作作为应变量为应变量34生存分析Cox模型的表达形式及含义模型的表达形式及含义中,中,右右侧侧可以分可以分为为两部分:两部分:h0(t)没有明确定没有明确定义义,其分布与形状,其分布与形状无明确的假定,无明确的假定,这这是非参数部分;另一部分是参数部分,其参数是非参数部分;另一部分是参数部分,其参数可以通可以通过样过样本的本的实际观实际观察察值值来估来估计计。由于由于h0(t)分布分布类类型未知,将型未知,将它移到等式左它移到等式左边边,并取自然,并取自然对对数,得到:数,得到:由式中可以看到,由式中可以看到,j 表示

21、当协变量表示当协变量Xj每改变一个单位每改变一个单位时,所引起的相对危险度的自然对数值的改变。时,所引起的相对危险度的自然对数值的改变。t时刻个体暴露于危险因素与非时刻个体暴露于危险因素与非(低)暴露状态下发病的风险比(低)暴露状态下发病的风险比35生存分析参数估计与假设检验lCox模型中的参数是在偏似然函数模型中的参数是在偏似然函数(Partial likelihood function)的基础上采用最大似然的基础上采用最大似然法估计的,在得到参数后,还需对参数进法估计的,在得到参数后,还需对参数进行假设检验。行假设检验。1.似然比检验似然比检验 2.得分检验得分检验 3.Wald检验检验

22、36生存分析l例例16-5 为了探索影响儿童急性淋巴细胞白血病为了探索影响儿童急性淋巴细胞白血病(ALL)长期生存的预后因素。采用回顾性队列研)长期生存的预后因素。采用回顾性队列研究,对究,对1990年年1月月1日至日至1995年年12月月30日期间在苏州日期间在苏州大学附属儿童医院血液科就诊大学附属儿童医院血液科就诊,治疗时间大于治疗时间大于2周周,年龄年龄0.7)一起进入模一起进入模型,否则易引起多重共线性型,否则易引起多重共线性l具体具体SAS程序也可用:逐步回归法程序也可用:逐步回归法39生存分析Cox模型的注意事项模型的注意事项l样本量不能太小,样本量不能太小,40以上,为协变量数目

23、的以上,为协变量数目的520倍倍l尽量避免失访的发生,否则易引起结果偏性尽量避免失访的发生,否则易引起结果偏性l要求病人要求病人“死亡死亡”的风险与基础风险在各时的风险与基础风险在各时点恒定的,即点恒定的,即ox模型的假设是风险率不随模型的假设是风险率不随时间变化而变化,否则应用非比例风险模型。时间变化而变化,否则应用非比例风险模型。40生存分析l验证等比例风险的方法:在模型中增验证等比例风险的方法:在模型中增加协变量与时间的交互作用项,考察加协变量与时间的交互作用项,考察该项是否有统计学意义。如有,则等该项是否有统计学意义。如有,则等比例风险不成立。比例风险不成立。当等比例风险不成立,可以引

24、入时间当等比例风险不成立,可以引入时间变量,建立非比例风险模型,并对这变量,建立非比例风险模型,并对这种现象进行解释。种现象进行解释。41生存分析时依协变量时依协变量l定义:随时间而改变的协变量称时依协变量。定义:随时间而改变的协变量称时依协变量。l1.外在时依变量:变量的取值不随时间改变,外在时依变量:变量的取值不随时间改变,效应随时间改变。效应随时间改变。例例 1945后日本妇女乳腺癌的发生率,后日本妇女乳腺癌的发生率,t自自1945后后的随访时间,的随访时间,x为协变量,为协变量,x=1暴露过原子弹辐暴露过原子弹辐射,射,x=0未暴露未暴露42生存分析l2.内在时依变量:变量的取值随时间改变,内在时依变量:变量的取值随时间改变,导致效应随时间改变。如肺癌的研究中,导致效应随时间改变。如肺癌的研究中,构造构造X(t)表示累积吸烟量;或随访期间,)表示累积吸烟量;或随访期间,病人改变了习惯,如不吸烟改为吸烟;等。病人改变了习惯,如不吸烟改为吸烟;等。l合理地构造时依变量,得到很多有用的信合理地构造时依变量,得到很多有用的信息。息。43生存分析

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁