《生存分析SurvivalAnalysis.ppt》由会员分享,可在线阅读,更多相关《生存分析SurvivalAnalysis.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、生存分析SurvivalAnalysis Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望内容内容生存资料生存资料1生存分析的基本概念生存分析的基本概念2STATA实现实现3生存资料生存资料v一些医学事件所经历的时间:从开始观察到事件一些医学事件所经历的时间:从开始观察到事件发生的时间,不是短期内可以明确判断的发生的时间,不是短期内可以明确判断的乳腺癌病人术后生存时间幼儿乳牙萌出的时间白血病病人化疗后缓解持续的时间两种方法治疗某慢性病产生疗效的时间v针对这类生存资料
2、的分析方法:生存分析针对这类生存资料的分析方法:生存分析生存分析生存分析v生存分析生存分析v基本目的基本目的 描述生存过程比较不同人群的生存过程分析生存时间的相关因素生存资料的特点生存资料的特点v生存资料的特点生存资料的特点随访资料时间和结局(失效、删失)有不完全数据通常不服从正态分布生存资料生存资料患者编号性别年龄从确诊到手术的时间(月)手术时间终止随访时间结局生存时间1男32101994.01.231994.12.24死亡112女48121998.02.141999.01.01失访10+3女2661992.03.041995.04.12死亡374男5531999.08.202001.09.
3、21死于其他25+5女5882001.03.102001.12.31存活9+315241992.03.042001.12.31生存分析的基本概念生存分析的基本概念-终点事件终点事件/起始事件起始事件v生存时间生存时间survival time(survival time(失效时间失效时间failure failure time)time):终点事件与被观察对象发生终点事件之间所经历的时间间隔,用t表示要获得准确的生存时间研究目的不同,时间单位不同,使用恰当的时间单位从疾病确诊到死亡从治疗开始到治愈从出生到第一颗乳牙萌出生存分析的基本概念生存分析的基本概念-生存时间生存时间生存分析的基本概念生存
4、分析的基本概念-死亡概率死亡概率/生存概率生存概率v终检终检censoringcensoring:删失值,在终点事件发生前,由于某种原因被观察对象的观测过程终止了v右删失:右删失:终点事件发生在最后一次观察的右方特点特点:不完全信息(不知道确切生存时间),但可知真实的生存时间不会短于现在观察到的时间。发生的原因发生的原因失访随访结束时仍存活死于其他原因治疗措施改变生存分析的基本概念生存分析的基本概念-终检终检v生存函数生存函数 (累计生存概率累计生存概率):个体生存时间大于t的概率。任一时刻t对应的生存函数就是该时点的生存率。S(0)=1;2年生存率:个体生存时间超过2年的概率S(2)v生存曲
5、线:生存曲线:所有时点的生存率构成生存曲线生存分析的基本概念生存分析的基本概念-生存率生存率v生存率计算生存率计算无删失无删失:有删失有删失:需分段计算各时间段的生存概率pi,然后利用概率乘法将pi相乘得到t时刻的生存率第i个时段开始的人数为 ,在第i个时段内死亡人数为 ,删失人数为 ,则 ,生存分析的基本概念生存分析的基本概念-生存率生存率乘积极限法乘积极限法(K-M(K-M法法)估计生存率估计生存率v适用于原始数据的资料适用于原始数据的资料v例:例:研究人员对20名某肿瘤术后病人进行跟踪随访三年,记录他们的生存时间。试估计生存率绘制生存曲线,资料如下3,5+,5,8,9,9,9+,9+,1
6、1,15,15+,16,20,20+,25,28,28+,28+,28+,32乘积极限法乘积极限法(K-M(K-M法法)估计生存率估计生存率总体生存率的区间估计总体生存率的区间估计vK-MK-M法计算的样本生存率是总体生存率的点估计法计算的样本生存率是总体生存率的点估计v区间估计:区间估计:SE是标准误生存曲线及中位生存期生存曲线及中位生存期v生存曲线生存曲线 survival curvesurvival curve:以随访时间为横坐标,生存率为纵坐标绘制的曲线v中位生存期中位生存期median survival timemedian survival time:半数生存时间/平均生存时间,恰
7、好由50%个体存活s(t)=0.5的时间生存时间一般为非正态,故用中位生存期可采用内插法计算:t0.5=20.4(月)如果生存期最长的死亡对象的生存率高于50%,则无法估计中位生存期。v适用于大样本资料适用于大样本资料v数据按时间区间分组数据按时间区间分组v利用删失资料信息,按删失资料对进行校正利用删失资料信息,按删失资料对进行校正v区间中的删失个体折算半个人时区间中的删失个体折算半个人时生存寿命表法计算生存率生存寿命表法计算生存率寿命表法计算生存率寿命表法计算生存率v例:例:10.2生存率曲线的比较生存率曲线的比较vLog-rankLog-rank检验:检验:时序检验,属于非参数方法,比较整
8、个生存时间的分布大样本卡方检验2条或多条生存曲线比较H H0 0:总体生存率曲线相同:总体生存率曲线相同H H1 1:总体生存率曲线不同:总体生存率曲线不同 例例10.310.3:现有两组白血病病人的随访研究资料,其缓解时间(周)记录如下,现欲比较治疗组与安慰剂组的病人生存曲线是否一样?资料资料 治疗组(第1组):6,6,6,7,10,13,16,22,23,6+,9+,10+,11+,17+,19+,20+,25+,32+,32+,34+,35+安慰剂组(第2组):1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23生存率曲线的比较生存率曲线的比
9、较两组生存曲线的统计描述两组生存曲线的统计描述试验组对照组Log-rank testLog-rank test方法方法计算计算Log-rankLog-rank检验统计量检验统计量 H H0 0为真时,为真时,Log-rankLog-rank统计量统计量 2 2服从自由度为服从自由度为1 1的卡的卡方分布方分布Log-rank Log-rank 检验的实例计算检验的实例计算本例的检验统计量计算为本例的检验统计量计算为查卡方界值表,P0.001,基于两组生存曲线的位置,可以认为试验组的生存率高于对照组,差异有统计学意义。StataStata软件实现软件实现一、用一、用StataStata软件计算生
10、存率及软件计算生存率及9595可信区间可信区间 1.定义生存分析的时间变量是time,结果变量是status stset time status 2.显示Kaplan-Meier方法的计算生存率结果 sts list Stata软件实现软件实现二、用二、用StataStata软件绘制生存曲线软件绘制生存曲线 1.定义生存分析的时间变量是time,结果变量是status stset time status 2.绘制Kaplan-Meier法估计的生存曲线 sts graphStataStata软件实现软件实现三、用三、用StataStata软件进行软件进行Log RankLog Rank检验检验 1.确定生存分析的时间变量是week,结局变量是outcome Stset week outcome 2.对两条曲线进行Log Rank检验 sts test group,logrank 即:Sts test 分组变量,logrank