《华西统计第十五章.ppt》由会员分享,可在线阅读,更多相关《华西统计第十五章.ppt(84页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、随访资料的生存分析随访资料的生存分析随访资料的生存分析随访资料的生存分析朱 彩 蓉1华西公共卫生学院卫生统计教研室l120例食管癌手术后生存情况研究结果如下,若观察期间无人失访,请计算1年生存率和2年生存率。100120 900123实例实例2华西公共卫生学院卫生统计教研室根据传统率的概念计算n年生存率:3华西公共卫生学院卫生统计教研室l120例食管癌手术后生存情况研究结果如下,其中术后1年到2年期间有20例患者失访,请计算1年生存率和2年生存率。100120 700123实例实例4华西公共卫生学院卫生统计教研室用用该该方方法法计计算算的的n年年生生存存率率损损失失了了部部分分信信息息,不不能
2、能对对生生存存率率作作出出正确的估计。正确的估计。5华西公共卫生学院卫生统计教研室6华西公共卫生学院卫生统计教研室某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,22名患者生存时间(月)如下,试比较化疗和放化疗联合治疗肺癌的疗效有无差别。实例实例7华西公共卫生学院卫生统计教研室l化疗组:1,2,3,5,6,9,11,13,16,26,37l放化疗联合组:10,11,14,18,22,22,26,32,38,40,428华西公共卫生学院卫生统计教研室某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,22名患者生存时间(
3、月)如下,试比较化疗和放化疗联合治疗肺癌的疗效有无差别。实例实例9华西公共卫生学院卫生统计教研室l化疗组:1,2,3,5,6,9+,11,13,16,26,37+l放化疗联合组:10,11+,14,18,22,22,26,32,38,40+,42+注:带“+”号的数据表示患者至少存活了多少个月10华西公共卫生学院卫生统计教研室隐含的研究目的两组生存率是否有差别两组生存时间是否有差别11华西公共卫生学院卫生统计教研室随访资料具有其特殊性,观察对象既有随访结果又有随访时间,不能套用前面所学的统计方法;当比较不同治疗方案的治疗效果时,仅比较某个时点的生存率,有时可能出现不正确的结论。12华西公共卫生
4、学院卫生统计教研室生存分析生存分析(survival analysis)将研究对象的随访结局和随访时间两个因素同时结合起来考虑的一种统计分析方法;能充分利用所获得的信息,达到较准确、全面地评价和比较随访资料的目的。13华西公共卫生学院卫生统计教研室生存资料的特点生存资料的特点蕴涵有结局和时间两方面信息;结局为两分类互斥事件;通过随访收集资料;常因失访等原因造成生存时间数据不完整,分布类型复杂。14华西公共卫生学院卫生统计教研室例15.1 某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误
5、、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。15华西公共卫生学院卫生统计教研室生存分析中的几个基本概念生存分析中的几个基本概念“死亡死亡”事件事件 失败事件失败事件(failure event)生存时间生存时间(survival time)死亡概率死亡概率(mortality probability)生存概率生存概率(survival probability)生存率生存率(survival rate)中位生存时间中位生存时间(median survival time)16华西公共卫生学院卫生统计教研室死亡事件(death event)又称失效事件(failure even
6、t)死亡事件是一个广义概念,不单是指通常意义下的生物体死亡,而是泛指标志某种处理措施失败或失效的特征事件。17华西公共卫生学院卫生统计教研室失效事件实例例15.1 宫颈癌患者死亡;接受健康教育后青少年戒烟一段时间后又吸烟;投保某种健康险后中途退保。18华西公共卫生学院卫生统计教研室生存时间(survival time)指观察到的存活时间,可用天、周、月、年等时间单位记录,常用符号t表示;生存时间是一个广义概念,不单是指通常意义下生物体的存活时间,而是泛指研究者所关心的某现象的持续时间。19华西公共卫生学院卫生统计教研室如:例15.1 宫颈癌患者生存的时间;白血病患者化疗后的缓解时间;肾移植患者
7、的存活时间;接受健康教育后青少年的戒烟时间;投保某种健康险至中途退保的时间等。20华西公共卫生学院卫生统计教研室21华西公共卫生学院卫生统计教研室生存时间的两种类型完全数据(complete data):指从观察起点到发生死亡事件所经历的时间,如表15.1中2和6号患者对应的生存天数89天和85天。截尾数据(censored data):简称截尾值(censored value),又称删失值或终检值。习惯上在生存时间右上标注“”表示。生存时间观察过程的截止不是由于死亡事件或失效事件,而是由于其他原因引起的,称截尾(censored)。22华西公共卫生学院卫生统计教研室月 份(如1998年)生存
8、时间原始记录示意图(+为仍存活,下同)23华西公共卫生学院卫生统计教研室天 数 图2 生存时间排序整理数据示意图 24华西公共卫生学院卫生统计教研室截尾的主要原因失访(withdrawal):指失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等;退出:指死于非研究因素或非处理因素而退出研究,如死于车祸等意外事件、死于其它疾病等;终止:指设计时规定的研究时限已到而终止观察,但研究对象仍然存活。25华西公共卫生学院卫生统计教研室死亡概率与生存概率 死亡概率(mortality probability):记为 ,是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。生存概
9、率(survival probability):记为 ,与死亡概率相对立,表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。26华西公共卫生学院卫生统计教研室生存率(survival rate)指某个观察对象指某个观察对象活过活过t 时刻时刻的概率,常用的概率,常用p(xt)表示;表示;根据不同随访资料的失败事件根据不同随访资料的失败事件,生存率,生存率可以是缓解率、某种状态的维持率等可以是缓解率、某种状态的维持率等。27华西公共卫生学院卫生统计教研室生存曲线(survival curve)将各个时点的生存率在坐标轴上连接在一起的曲线图;用以描述生存过程。28华西公共卫生学院卫
10、生统计教研室中位生存时间(median survival time)又称半数生存期,指生存率为0.5时对应的生存时间,表示有50%的观察对象可以活这么长时间;一般采用内插法进行估计。29华西公共卫生学院卫生统计教研室图15.1乘积极限法生存曲线(Kaplan-Meier曲线)30华西公共卫生学院卫生统计教研室生存资料的2种类型未分组资料分组资料31华西公共卫生学院卫生统计教研室例15.1 某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,
11、并绘制生存曲线。32华西公共卫生学院卫生统计教研室33华西公共卫生学院卫生统计教研室例15.2某医师对110例原发性肺癌患者确诊后进行随访,得资料见表15.3第(2)栏第(4)栏,试估计各时点生存率及其标准误、各时点总体生存率的95%置信区间、中位生存时间,并绘制生存曲线。34华西公共卫生学院卫生统计教研室35华西公共卫生学院卫生统计教研室未分组资料的生存分析未分组资料的生存分析 l未分组资料生存率的估计:主要是用乘积极未分组资料生存率的估计:主要是用乘积极限法限法(product-limit estimates),又,又称称Kaplan-Meier法;法;l主要适用于小样本,是一种非参数方法
12、。主要适用于小样本,是一种非参数方法。36华西公共卫生学院卫生统计教研室例15.1 某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。37华西公共卫生学院卫生统计教研室38华西公共卫生学院卫生统计教研室生存率及其标准误的计算本例生存时间以“月”为单位,并将t月当作一个时点看待;具体计算过程见表15.2;39华西公共卫生学院卫生统计教研室第(1)栏为序号:本例k=1,2,312;第(2)栏是将生存时间t由小到大顺次排列;如某
13、时间点既有完全数据又有截尾数据,将截尾数据排在后面。15.2中各栏的含义40华西公共卫生学院卫生统计教研室第(3)栏为t月的死亡人数dk,如生存时间t为5个月时有1例死亡,相应的d4=1。截尾患者即便是已死亡,也非死于处理措施(手术疗法),如生存时间t为8月时有1例截尾,相应的d6=0。41华西公共卫生学院卫生统计教研室第(4)栏为期初病例数nk,即恰好在t时点以前尚存活的病例数如t为5月时对应的n4=9,表示恰好在5月时点前有9人存活42华西公共卫生学院卫生统计教研室第(5)栏计算各时点死亡概率qk,即恰好在t时点以前尚存活的患者在t时点上(第t个月)死亡的概率,其计算公式为:如“q4”表示
14、恰好在5月时点前尚存活的9例患者在5月时点上(实指治疗后第五个月的第一天到第三十天)的死亡概率为43华西公共卫生学院卫生统计教研室第(6)栏计算各时点生存概率pk,即恰好在t时点以前尚存活的患者在t时点上(第t个月)继续存活的概率,其计算公式为 如t为5月时对应:44华西公共卫生学院卫生统计教研室第(7)栏计算各时点生存率S(tk),即恰好在t时点以前尚存活的患者活过t时点的概率,按式(15.5)计算:如生存时间t为4月的生存率为:45华西公共卫生学院卫生统计教研室第(8)栏为各时点生存率的标准误,其计算公式为:46华西公共卫生学院卫生统计教研室如S(t3)的标准误SES(t3)为:47华西公
15、共卫生学院卫生统计教研室各时点总体生存率的可信区间各时点总体生存率的可信区间采用正态近似原理估计生存率的可信区间48华西公共卫生学院卫生统计教研室l本例4月总体生存率的95%可信区间下限 上限 l宫颈癌患者术后4月生存率的95%可信区间为50.5099.50%。49华西公共卫生学院卫生统计教研室采用内插法由表15.2可见,中位生存时间估计在711月之间,计算如下:中位生存时间的计算中位生存时间的计算50华西公共卫生学院卫生统计教研室51华西公共卫生学院卫生统计教研室图15.1乘积极限法生存曲线(Kaplan-Meier曲线)52华西公共卫生学院卫生统计教研室(711):(7t)=(0.5833
16、0.4861):(0.58330.5)即宫颈癌患者术后中位生存时间为10.4个月。53华西公共卫生学院卫生统计教研室生存曲线它是以生存时间t为横轴,生存率 为纵轴,绘制而成的连续型的阶梯形曲线,说明生存时间与生存率之间的关系;未分组资料的生存曲线也称Kaplan-Meier曲线。54华西公共卫生学院卫生统计教研室图15.1乘积极限法生存曲线(Kaplan-Meier曲线)55华西公共卫生学院卫生统计教研室例15.2某医师对110例原发性肺癌患者确诊后进行随访,得资料见表15.3第(2)栏至第(4)栏,试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。
17、56华西公共卫生学院卫生统计教研室寿命表法(life-table method)当样本例数足够多时,乘积极限法可按时间分组计算,这就是寿命表法。寿命表法的提出早于乘积极限法,但实质上是乘积极限法的一种近似(频数表法)。57华西公共卫生学院卫生统计教研室生存率及其标准误的计算本例生存时间以“月”为单位,具体计算过程见表15.3;58华西公共卫生学院卫生统计教研室第(1)栏为序号:本例k=1,2,310;第(2)栏是为确诊后月数tk。“0”表示从确诊日起不满1月,“1”表示确诊后满1月但未满2月,其他依此类推。15.3中各栏的含义59华西公共卫生学院卫生统计教研室第(3)栏为期内截尾人数Ck,表示
18、确诊后满t月但未满t+1月期间截尾的人数。如C3=1,表示确诊后满2月但未满3月期间有1例截尾。60华西公共卫生学院卫生统计教研室第(4)栏为期内死亡人数 ,表示确诊后满t月但未满t+1月期间发生死亡事件的人数。如 =25,表示确诊后未满1月有25例死于原发性肺癌;=18表示确诊后满3月但未满4月有18例死于原发性肺癌。61华西公共卫生学院卫生统计教研室l第(5)栏为期初观察人数 ,指t月初尚存活的病例数。l此栏自下而上累计求得,见式(15.8)l如本例 =4,则 余类推62华西公共卫生学院卫生统计教研室第(6)栏为校正人数Nk,即实际观察人月数;凡在t月内截尾的病例,按平均观察半月计算;因此
19、校正人数Nk等于月初观察人数减去当月截尾人数的一半,其计算公式为:63华西公共卫生学院卫生统计教研室第(7)栏为死亡概率 ,表示确诊后活满t月的病人在今后一个月内死亡的概率,其计算公式为:64华西公共卫生学院卫生统计教研室第(8)栏为生存概率 ,表示确诊后活满t月的病人在今后一个月内存活的概率,其计算公式为65华西公共卫生学院卫生统计教研室第(9)栏为t月生存率,表示确诊后活满t月的概率,采用式(15.5)计算得到。如1月生存率2月生存率3月生存率余类推66华西公共卫生学院卫生统计教研室第(10)栏为生存率的标准误,其计算公式为:67华西公共卫生学院卫生统计教研室分组资料与未分组资料的生存率计
20、算比较分组资料与未分组资料的生存率计算比较l分组资料与未分组资料生存率的计算相似分组资料与未分组资料生存率的计算相似。l未未分分组组资资料料生生存存率率的的计计算算是是以以观观察察人人数数为为计计算单位,生存时间未分组;算单位,生存时间未分组;l而而分分组组资资料料的的生生存存率率的的计计算算是是以以观观察察人人时时数数为单位,生存时间等距离分组。为单位,生存时间等距离分组。68华西公共卫生学院卫生统计教研室统统计计描描述述主主要要包包括括各各组组生生存存率率及及其其标标准准误的计算误的计算;统统计计推推断断包包括括总总体体生生存存率率的的可可信信区区间间估估计、两样本或多样本生存率比较等。计
21、、两样本或多样本生存率比较等。生存率分析的内容生存率分析的内容69华西公共卫生学院卫生统计教研室1.描述生存过程描述生存过程研究生存时间的分布特点,估计生存率、研究生存时间的分布特点,估计生存率、生存率曲线等。生存率曲线等。例如例如 根据白血病化疗后的缓解年数资料,根据白血病化疗后的缓解年数资料,可以估计不同年数的缓解率可以估计不同年数的缓解率p(Xt),如,如p(X3),p(X5)等,也可以获得这些病人等,也可以获得这些病人的缓解率曲线。的缓解率曲线。70华西公共卫生学院卫生统计教研室 2.比较生存过程比较生存过程在获得生存率及其标准误的估在获得生存率及其标准误的估计值后,进行两组或多组生存
22、计值后,进行两组或多组生存率比较。率比较。例如例如 比较不同方案治疗白血病比较不同方案治疗白血病的缓解率曲线,以了解哪种方案的缓解率曲线,以了解哪种方案较优。较优。71华西公共卫生学院卫生统计教研室3.生存过程的影响因素分析生存过程的影响因素分析例如例如 为了改善乳腺癌手术后的预后,为了改善乳腺癌手术后的预后,应该了解影响病人预后的主要因素,应该了解影响病人预后的主要因素,从而在手术前、后加以预防和干预。从而在手术前、后加以预防和干预。72华西公共卫生学院卫生统计教研室两样本生存率曲线的比较两样本生存率曲线的比较 73华西公共卫生学院卫生统计教研室例15.322例肺癌患者经随机化分配到放疗组和
23、放化疗联合组,从缓解出院日开始随访,随访时间(月)如下,试比较放疗组和放化疗联合组患者的生存曲线有无差别。甲:放疗组1,2,3,5,6,9+,11,13,16,26,37+乙:放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+74华西公共卫生学院卫生统计教研室图15.3放疗组和放化疗联合组患者的生存曲线75华西公共卫生学院卫生统计教研室1.建立检验假设和确定检验水准H0:放疗组与放化疗联合组患者的生存曲线位 置相同H1:放疗组与放化疗联合组患者的生存曲线位 置不同 0.0576华西公共卫生学院卫生统计教研室77华西公共卫生学院卫生统计教研室2.计算统计量 值将两
24、组患者按生存时间统一从小到大排序,并标明组别、死亡数。生存时间相同的甲、乙两组列在同一行,如生存时间为26个月的患者有2例,甲组和乙组各1例,故甲、乙两组列在同一行;某时间点既有完全数据又有截尾数据,截尾数据排在后面。如生存时间t为11个月时,甲组和乙组各1例,但乙组为截尾数据,故排在后面。见表15.4第(1)(4)栏。78华西公共卫生学院卫生统计教研室列出各时点的期初病例数,见表15.4第(5)(7)栏。分别计算甲、乙两组各时点的理论死亡数甲组各时点的理论死亡数=(该时点病死数期初病例总数)甲组期初病例数(4)(5)/(7)乙组各时点的理论死亡数(4)(6)(7)79华西公共卫生学院卫生统计
25、教研室l求出甲组和乙组理论死亡数的合计值分别为5.1282、11.8718。v=211 80华西公共卫生学院卫生统计教研室3.求出P值,作出推断结论 查附表9,界值表,得P0.05,按 =0.05水准拒绝H0,接受H1,又因从图15.3可直观地看出放化疗联合组的生存曲线位置较高,故可认为放化疗联合治疗肺癌的效果较好。81华西公共卫生学院卫生统计教研室对数秩检验的注意事项 该方法亦适用于分组资料以及多组间的比较。该方法用于比较生存曲线,若要比较两条生存曲线某时间点的生存率(如2年生存率或3年生存率)有无差别,可按P196式15.14计算检验统计量,然后查t界值表确定P值。82华西公共卫生学院卫生统计教研室对数秩检验的注意事项(续)各处理措施的优劣除了可根据各组生存曲线的高低直观判断外,还可以根据中位生存时间和死亡比SMR的大小来判断。本法除需满足生存资料的基本要求外,还要求各样本生存曲线不能交叉.83华西公共卫生学院卫生统计教研室作业作业P420综合分析题综合分析题1、2、3小题小题84华西公共卫生学院卫生统计教研室