《医学统计学之生存分析.pptx》由会员分享,可在线阅读,更多相关《医学统计学之生存分析.pptx(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学统计学之生存分析2生存分析survival analysis 3何为生存分析4传统方法在分析随访资料时的困难传统方法在分析随访资料时的困难o时间和生存结局都成为了要关心的因素时间和生存结局都成为了要关心的因素 除了生存结局作为判定标准以外,只要能让病人存活时间延长,这种药物也应当是被认为有效的。即时间延长也认为有效 如果将两者均作为应变量拟和多元模型,因为时间分布不明(一般不呈正态分布,在不同情况下的分布规律也不同),拟和多元模型极为困难5传统方法在分析随访资料时的困难传统方法在分析随访资料时的困难o存在大量失访的资料存在大量失访的资料失去联系(病人搬走,电话号码改变)无法观察到结局(死于
2、其他原因)研究截止 显然,将失访数据无论是算作死亡还是存活似乎都不大合理6第一节 概述7一、基本概念(一)生存时间(survival time):1定义:广义的生存时间是指从某个起始事件开始到某个终点事件的发生(出现反应)所经历的时间。也称失效时间(failure time)。2特点:(1)分布类型不易确定。一般不服从正态分布,有时近似服从指数分布、Weibull分布、Gompertz分布等,多数情况下往往不服从任 何规则的分布类型。8(2)生存时间的影响因素多而复杂且不易控制。(3)根据研究对象的结局,生存时间数据可分两种类型:完全数据完全数据(complete data):观察对象在观察期
3、内出现反应(终点事件),这时记录到的时间信息是完整的,这种生存时间数据称为完全数据。截尾数据截尾数据(截尾值、删失数据,censored data):尚未观察到研究对象出现反应(终点事件)时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存时间数据称为不完全数据或截尾值。常用符号常用符号“”表示。表示。9截尾值(截尾值(Censored value)出现的原因)出现的原因截尾的原因主要有3种:失访:失访:生存但中途失访:包括拒绝访问、失去联系等。退出:退出:中途退出试验、改变治疗方案、死于其它与研究无关的原因:如肺癌患者死于心机梗塞、自杀或因车祸死亡,终止随访时间为死亡时间。
4、终止:终止:指观察期结束时仍未出现结局。10关于截尾或删失随访开始事件失访失访失访失访研究截止时仍存活研究截止时仍存活研究截止时点患者进入期间删失的模式图删失的模式图1112131415161718风险函数与生存函数的关系19202122第二节 生存率估计的非参数法 23242526图图16-2 两种疗法治疗后白血病患者的生存率曲线两种疗法治疗后白血病患者的生存率曲线 10.900.7930.686 70.56110.42130.2127282930313233343536第三节 生存率的比较 生存率比较的假设检验方法有参数法、半参数法和非参数法,因医学研究中的生存时间资料大多为不规则分布或者
5、分布未知,常采用非参数法进行假设检验。非参数法是将生存率曲线作为整体进行曲线与曲线之间的比较,其零假设为各总体生存率曲线相同。常用的非参数检验方法有log-rank 检验(时序检验)、Gehan比分检验和Breslow检验等。373839404142续表续表434445对于大样本资料生存率的比较,可以将其整理成对于大样本资料生存率的比较,可以将其整理成频数表形式,采用寿命表法计算生存率然后进行频数表形式,采用寿命表法计算生存率然后进行比较,其基本原理与上述方法相同。比较,其基本原理与上述方法相同。46第四节第四节 Cox比例风险回归模型比例风险回归模型 4748一、一、Cox比例风险回归模型的
6、基本形式比例风险回归模型的基本形式 看下面例子看下面例子49如果分析x1-x6这6个因素对生存时间t的影响,能否用线性回归分析建立时间t与影响因素间的线性回归方程?或建立生存函数S(t)与影响因素间的线性回归方程?t=b0+b1x1+b2x2+b6x6?S(t)=b0+b1x1+b2x2+b6x6?1、生存时间t一般不服从正态 分布;2、生存时间t中含有截尾值。50利用生存率函数S(t,X)与风险函数h(t,X)的关系可导出 较好的解决截尾值的问题 反映了协变量X与生存函数的关系 Cox模型的基本形式 51所有危险因素为0时的基础风险率,它是未知的,但假定它与h(t,X)是呈比例的。右侧可分为
7、两部分:h0(t)没有明确的定义,分布无明确的假定,参数无法估计,为非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计的,正因为Cox模型有非参数和参数两部分组成,故又称为半参数模型。525354555657二、二、CoxCox回归分析的步骤:回归分析的步骤:确定自变量和因变量参数估计,拟和模型对模型的假设检验模型的解释及应用对模型的拟和优度检验 58模型的参数估计(一)参数估计-偏似然估计 59代表ti时刻以后危险集R(ti)中对似然函数作贡献的个体 将n个病人死亡的 条件概率相乘 60模型的假设检验 616263Cox回归分析的应用实例回归分析的应用实例 6465调用调用
8、Cox模型分析模块模型分析模块,分析数据集为,分析数据集为cox建立生存时间为建立生存时间为t,截尾指示变量,截尾指示变量为为d 的的Cox模型,模型,d 取值为取值为1时表时表示截尾示截尾 选入和剔出水平均为选入和剔出水平均为0.05计算筛选因素的相对危险度计算筛选因素的相对危险度及其及其95%的可信区间的可信区间 66Summary of Stepwise Selection Variable Number Score Wald Step Entered Removed In Chi-Square Chi-Square Pr ChiSq 1 x4 1 13.0399 .0.0003 2 x
9、5 2 4.7039 .0.0301筛选过程总结筛选过程总结Analysis of Maximum Likelihood Estimat Parameter Standard Hazard 95%HR Variable DF Estimate Error Chi-Square PrChiSq Ratio Confidence Limits x4 1 1.76128 0.54785 10.3356 0.0013 5.820 1.989 17.031 x5 1 0.93133 0.44455 4.3890 0.0362 2.538 1.062 6.066最大似然估计结果最大似然估计结果治疗方式(治疗方式(x4):相对危险度为:相对危险度为5.820,说明传统的治疗方式和新的治疗方式相比,说明传统的治疗方式和新的治疗方式相比,病人死亡的风险为病人死亡的风险为5.820倍,相对危险度的倍,相对危险度的95%的可信区间为的可信区间为1.98917.031;淋巴结是否转移(淋巴结是否转移(x5)的)的RR值的含义与治疗方式相同。值的含义与治疗方式相同。