研究生医学统计学生存分析.pptx

上传人:莉*** 文档编号:88340628 上传时间:2023-04-25 格式:PPTX 页数:45 大小:328.84KB
返回 下载 相关 举报
研究生医学统计学生存分析.pptx_第1页
第1页 / 共45页
研究生医学统计学生存分析.pptx_第2页
第2页 / 共45页
点击查看更多>>
资源描述

《研究生医学统计学生存分析.pptx》由会员分享,可在线阅读,更多相关《研究生医学统计学生存分析.pptx(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1研究生医学统计学生存分析研究生医学统计学生存分析 生存分析的生存分析的目的目的n n1.估计:根据样本生存资料估计总体生存率及其他有关指标n n (如中位生存期)等。n n2.比较:对不同组生存率进行比较。n n3.影响因素分析:为探索和了解影响生存时间长短的因素,或平衡n n 某些因素后,研究某个或某些因素对生存的影响。n n4.预测:对具有不同因素、不同水平的个体进行生存预测。第1页/共45页n n第一节生存时间资料的特点第一节生存时间资料的特点n n第二节小样本生存率的第二节小样本生存率的kaplan-Meierkaplan-Meier估估计计n n第三节大样本生存率的寿命表法估

2、计第三节大样本生存率的寿命表法估计n n第四节第四节 生存曲线比较的假设检验生存曲线比较的假设检验n n n n 第2页/共45页n n第一节生存时间资料的特点n n一、数据结构一、数据结构n n二、统计描述指标二、统计描述指标n n三、资料要求三、资料要求 n n 第3页/共45页一、数据结构一、数据结构n n 在临床医学中在临床医学中,对病人疗效考查:对病人疗效考查:1.1.治疗结局?治疗结局?2.2.生存时间?生存时间?n n 第4页/共45页 “生存时间生存时间”的概念的概念 开始事件开始事件 终点事件终点事件 生物生存生物生存 死亡死亡 生存时间生存时间电脑开始使用正常 出现故障 疾

3、病产生 治愈疾病治愈 复发 阴性 阳性第5页/共45页生存时间的三个要点生存时间的三个要点n n n n 一、起始事件一、起始事件n n二、二、终点事件终点事件n n三、生存时间三、生存时间n n 第6页/共45页医学例子:起始事件医学例子:起始事件医学例子:起始事件医学例子:起始事件 随访时间随访时间随访时间随访时间 终点事件终点事件终点事件终点事件n n 疾病确诊疾病确诊 死亡死亡 治疗开始 死亡治疗开始 痊愈接触危险物 出现反应治愈出院 复发广义的广义的“生存时间生存时间”也可为医也可为医疗费用(元)、疗费用(元)、医疗设备使用次数、车辆行驶总医疗设备使用次数、车辆行驶总里程里程(公里公

4、里)等等 第7页/共45页随访(随访(随访(随访(follow-upfollow-up)资料的记录资料的记录资料的记录资料的记录n n 生存资料一般通过随访收集,n n记录的项目:(起始与终止)随访事件生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等)分组变量(处理方法)和其它协变量(性别、年龄、职业、文化程度等)第8页/共45页月 份(2000年)图12-1 生存时间原始记录示意(+截尾)天 数图12-2 生存时间排序整理数据示意01167第9页/共45页生存时间资料的特点生存时间资料的特点 2 2个效应变量个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等

5、)删失(截尾)数据删失(截尾)数据:在规定的观察期内,对某些观察对象由于某种原因未能观察到死亡结局,并不知道确切的生存时间,称为生存时间的删失数据(censored data)。如表12-1中的1号和 3号病人未观察到底,不知他们究竟能活多长时间。产生结尾原因:(1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出 (4)研究结束时终点事件尚未发生分布类型复杂分布类型复杂:生存时间分布不服从正态分布,常常呈正偏态分布、Weibull分布、Gamma分布或更为复杂的分布,因此要用特殊的统计方法。第10页/共45页 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等)错误错

6、误1 1:忽略生存时间,采用Logistic回归分析死亡率错误错误2 2:忽略结局,采用t检验、线性回归分析生存时间第11页/共45页n n得不到确切的生存时间,但它们提供的生存时间长于观察期的时间,这种数据为不完全数据。或截尾数据、删失数据或终检值。n n (如有确切的生存时间,则这种数据称为完全数据。)n n两种错误的做法:n n错误错误1 1:丢弃截尾数据,只考虑确切数据。(损失了信息)n n错误错误2 2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。截尾截尾(删失删失)数据或终检值数据或终检值(censored data)(censored data)第12页/共45页n

7、 nn n两种错误的做法:n n错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。n n错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)正偏正偏态态(positive skewnesspositive skewness)数据数据第13页/共45页二、生存分析的统计描述指标二、生存分析的统计描述指标1.死亡概率、生存概率死亡概率、生存概率2.生存率及其标准误生存率及其标准误3.半数生存期(中位数)半数生存期(中位数)及四分位数间距及四分位数间距第14页/共45页n n 例例1 1 手术治疗手术治疗6060例肺癌病人,术后每年死亡例

8、肺癌病人,术后每年死亡1010例,无删失。试求基本生存分析指标。例,无删失。试求基本生存分析指标。NN=60=60n n;术后 年内 年内 年初 年 死亡死亡 死亡死亡 生存生存 (t+1)年年 年 死亡 截尾 观察 平均 率率 概率概率 概率概率 生存率生存率 数 例数 例数 例数 例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0(n0-d)/n0 (n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)0 10 0 60 55 .181 .167 .833 .833 1 10 0 50 45 .222 .200 .800 .667 2 10 0

9、40 35 .286 .250 .750 .500 3 10 0 30 25 .400 .333 .667 .333 4 10 0 20 15 .667 .500 .500 .167第15页/共45页n n 1.1.死亡率、死亡概率、生存概率死亡率、死亡概率、生存概率n n(1)(1)死亡率死亡率 (mortality rate(mortality rate,death rate)death rate)n n 表示某单位时间内的死亡强度表示某单位时间内的死亡强度。n n n n n n 年平均人口数年平均人口数=(=(年初人口数年初人口数+年末人年末人 口数口数)/2)/2第16页/共45页n

10、 n(2)(2)死亡概率死亡概率 (mortality probability)(mortality probability)n n 是指单位时段开始时存活的个体到该时段结是指单位时段开始时存活的个体到该时段结束时死亡的可能性,即死于某时段束时死亡的可能性,即死于某时段t tt+nt+n内的内的概率概率。nn d/n0 nn nnn n年内有删失,分母用校正人口数:年内有删失,分母用校正人口数:n n 校正人口数校正人口数=年初人口数年初人口数删失删失例数例数 /2/2n n n n0 0c c/2/2nn 第17页/共45页n n(3)(3)生存概率生存概率 (survival probab

11、ility)(survival probability)n n 指某单位时段开始时存活的个体指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。到该时段结束时仍存活的可能性的大小。n n n n n n n n (n0-d)/n0 n n分子为年末尚存人数,分子为年末尚存人数,n n 若年内有删失,分母用校正人口数。若年内有删失,分母用校正人口数。第18页/共45页n n生存率生存率 (survival rate)(survival rate)n n (累积生存概率累积生存概率 cumulative probability of cumulative probability of

12、survival)survival)n n 指病人经历指病人经历t t个单位时间后仍存个单位时间后仍存活的概率。活的概率。n n 生存概率指单个时段的概率,生存概率指单个时段的概率,n n 生存率指从生存率指从0 0t t多个时段的积累概多个时段的积累概率率。2.生存率及其生存率及其标准误标准误第19页/共45页n n 生存率与生存概率仅一字之差,含义生存率与生存概率仅一字之差,含义却是不同的。却是不同的。n n 生存概率是针对单位时间而言的,生生存概率是针对单位时间而言的,生存率是针对某个较长时间段的,它是生存存率是针对某个较长时间段的,它是生存概率的累积结果。概率的累积结果。n n 如评价

13、肿瘤预后常用的如评价肿瘤预后常用的5 5年生存率,是年生存率,是指第指第1 1年存活、第年存活、第2 2年也存活,年也存活,直至,直至第第5 5年仍存活的累积概率,而这年仍存活的累积概率,而这5 5年间每年间每1 1年有不同的生存概率。年有不同的生存概率。n n 第20页/共45页n n如数据中无删失,生存率可用下式计算如数据中无删失,生存率可用下式计算n nn n如果有删失数据,则需分时段计算不同单如果有删失数据,则需分时段计算不同单位时间的生存概率位时间的生存概率P Pi i(i=1,2,(i=1,2,t),t),然后利用然后利用概率乘法原理将概率乘法原理将P Pi i相乘得到相乘得到t

14、t时刻生存率。时刻生存率。n nS S(t t)=)=P P(T T t tk k )=)=p p1 1 p p2 2 p pk kn n n n n n 第21页/共45页n n例如手术治疗50例肺癌病人,术后1,2,3年的n n 死亡数分别为10,10,10例,无截尾数据。n n 试求各年的 生存概率和3年生存率。n n 解:n n 各年生存概率 p1=(50 10)/50,n n p2=(40 10)/40,n n p3=(30 10)/30n n 3 年生存率 n n S(3)=P(T 3)(n n0 0-d-d)/)/N N=(50 30)/50=0.4000n n n n或 S(3

15、)=p1 p2 p3 =0.4000 第22页/共45页n n生存率的标准误生存率的标准误n n n n生存率置信区间生存率置信区间n n 第23页/共45页n n生存曲线生存曲线n n 以生存时间为横轴,生存率为纵轴绘制的曲线n n (a)研究终止在475天 (b)研究终止在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天)图12-4 寿命表法生存曲线(折线折线)及其半数生存期(Md=1.7年)第24页/共45页生存曲线给我们的信息生存曲线给我们的信息生存曲线给我们的信息生存曲线给我们的信息n n阶梯状;每一级阶梯代表一个死亡时间点(在截尾时间点无阶梯);

16、如果最大时间点是截尾则生存曲线不与曲线相交(见下图),否则与横轴相交。DeathCensored第25页/共45页n nMedian SurvivalMedian Survival1.8 Years生存曲线给我们的信息第26页/共45页n n3.3.半数生存期及四分位数间距半数生存期及四分位数间距n n半数生存期也称中位生存期(半数生存期也称中位生存期(median survival median survival time)time),即生存时间中位数,表示恰好有即生存时间中位数,表示恰好有50%50%的的个体活过此时间,即生存率为时对应的个体活过此时间,即生存率为时对应的生存时间(集中趋势

17、指标)。其数值可借助生生存时间(集中趋势指标)。其数值可借助生存曲线进行粗略的图表法估计,或用线性内插存曲线进行粗略的图表法估计,或用线性内插法求解精确的数值。删失数据超过样本量的法求解精确的数值。删失数据超过样本量的50%50%时,无法估计中位生存时间。此时较为实际的时,无法估计中位生存时间。此时较为实际的做法是使用生存时间超过一给定时间长度的概做法是使用生存时间超过一给定时间长度的概率(如率(如3 3年生存率或年生存率或5 5年生存率)年生存率)生存期的四分位数间距生存期的四分位数间距tt,反映离散程度大小反映离散程度大小第27页/共45页三、资料的基本要求三、资料的基本要求n n1.1.

18、死亡例数(或死亡比例)不宜太少,死亡例数(或死亡比例)不宜太少,否否 则宜出现偏性;则宜出现偏性;n n2.2.截尾原因无偏性;截尾原因无偏性;n n3.3.生存时间尽可能记录精确生存时间尽可能记录精确n n 第28页/共45页生存率估计生存率估计常用的两种方法常用的两种方法:1.1.乘积极限法,即乘积极限法,即kaplan-Meierkaplan-Meier法法 (小样本时)(小样本时)2.2.寿命表法寿命表法 (大样本时)(大样本时)第29页/共45页n n第二节小样本生存率的kaplan-Meier估计n n n n 第30页/共45页 n n乘乘 积积 极极 限限 法法(product

19、-limit(product-limit method)method)又又 称称Kaplan-Meier Kaplan-Meier 法法,由由KaplanKaplan和和MeierMeier于于19581958年年提提出出 ,主主要要针针对对小小样样本本资资料料,也也可可用用于大样本,是一种非参数方法。于大样本,是一种非参数方法。n n基基本本思思想想:将将生生存存时时间间由由小小到到大大依依次次排排列列,在在每每个个死死亡亡点点上上,计计算算其其期期初初人人数数、死死亡亡人人数数、死死亡亡概概率率、生生存存概概率率和和生生存存率。率。n n 第31页/共45页1111名接受名接受名接受名接受

20、“手术手术手术手术+化疗化疗化疗化疗”治疗的乳腺癌患者的生存时间:治疗的乳腺癌患者的生存时间:治疗的乳腺癌患者的生存时间:治疗的乳腺癌患者的生存时间:10,14,15,1610,14,15,16+,19,19,20,20,19,19,20,20+,24,26,28,24,26,28序序号号时间时间(月月)死死亡亡数数删删失失数数期初例期初例数数生存概率生存概率生存率生存率标准误标准误itidiciniPi=(ni-di)/niS(ti)SE(S(ti)110101110/11=0.90910.90910.086721410109/10=0.90000.81820.11633151098/9=0

21、.88890.72730.1343416+0188/8=1.00000.72730.13435192075/7=0.71430.51950.15696201054/5=0.80000.41560.1562720+0144/4=1.00000.41560.15628241032/3=0.66670.27710.15379261021/2=0.50000.13850.124510281010/1=0.00000.0000-第32页/共45页第33页/共45页第34页/共45页 (a)研究终止在475天 (b)研究终止在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=15

22、8天)00第35页/共45页n第三节 大样本生存率的寿命表法估计n n n n 寿命表法寿命表法(life-table method)(life-table method)的应用早的应用早于于KaplanKaplanMeierMeier法,它是法,它是KaplanKaplanMeierMeier法的近似方法法的近似方法(频数表法频数表法)n n 第36页/共45页第37页/共45页图图图图12-4 12-4 寿命表法生存曲线寿命表法生存曲线寿命表法生存曲线寿命表法生存曲线(折线折线折线折线)及其半数生存期(及其半数生存期(及其半数生存期(及其半数生存期(Md=1.7Md=1.7年)年)年)年)

23、寿命表法只估计时段右端点的生存率右端点的生存率,省略了时段内的生存率估计 第38页/共45页n 第四节 n生存曲线比较的假设检验1.1.Log rank(Log rank(时序时序)检验检验(也称为Cox-Mantel检验)2.2.BreslowBreslow检验检验(也称Breslow广义Wilcoxon检验)n n 第39页/共45页2121例乳腺癌患者两种疗法的生存时间(月)例乳腺癌患者两种疗法的生存时间(月)例乳腺癌患者两种疗法的生存时间(月)例乳腺癌患者两种疗法的生存时间(月)手手术术组组691315181919202224手手术术+化化疗疗组组10141516+19192020+2

24、42628第40页/共45页序号序号时间时间单纯单纯手术手术组组手术手术加加化疗化疗组组合合计计itin1id1ic1iT1in2id2ic2iT2iNiDi1610100.476211000.5238211299100.450011000.55002013108000.421111100.57891914138100.444410000.55561815147000.411810100.58821716157100.87509101.1250162716+6000.00008010.00001408186100.46157000.53851319195201.66677202.333312410203100.75005101.2500821120+2000.00004010.00006015280000.00001101.000011合计合计101006.8567119212.143319第41页/共45页第42页/共45页期初人数第43页/共45页第44页/共45页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁