《生存曲线说课材料.ppt》由会员分享,可在线阅读,更多相关《生存曲线说课材料.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、生存曲线第一节第一节 生存分析基本概念生存分析基本概念一、一、生存时间生存时间(survival time,failure time)o终点事件终点事件与与起始事件起始事件之间的时间间隔。之间的时间间隔。o终点事件指研究者所关心的特定结局。终点事件指研究者所关心的特定结局。o起始事件是反映研究对象生存过程的起起始事件是反映研究对象生存过程的起 始特征的事件。始特征的事件。生存时间举例生存时间举例 起始事件起始事件 终点事件终点事件 服药服药 痊愈痊愈 手术切除手术切除 死亡死亡 染毒染毒 死亡死亡 化疗化疗 缓解缓解 缓解缓解 复发复发o终点事件和起始事件是相对而言的,终点事件和起始事件是相对
2、而言的,它们都由研究目的决定,须在设计时它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,明确规定,并在研究期间严格遵守,不能随意改变。不能随意改变。生存时间的类型生存时间的类型1.完全数据完全数据(complete data)从起点至死亡(死于所研究疾病)所经历从起点至死亡(死于所研究疾病)所经历的时间。的时间。2.截尾数据截尾数据(删失数据,(删失数据,censored data)从起点至截尾点所经历的时间。从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。束时病人尚存活等。例如,某肿瘤医院调查了例如,某肿瘤
3、医院调查了1991-1995年间经手年间经手术治疗的大肠癌患者术治疗的大肠癌患者150例,对可能影响大肠例,对可能影响大肠癌术后生存时间的因素进行了调查,如性癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为分期等。随访截止日期为2000年年12月月30日,日,随访记录见下表。随访记录见下表。大肠癌患者的随访记录大肠癌患者的随访记录 编号编号 性别性别 年龄年龄 手术日期手术日期 随访终止日期随访终止日期 随访结局随访结局 生存时间生存时间(天天)1 男男 45 1991.05.20 1995.06.04 死亡死
4、亡 1476 2 男男 50 1992.01.12 1998.08.25 死亡死亡 2417 3 女女 36 1991.10.24 1994.03.18 失访失访 876+4 男男 52 1994.11.02 2000.12.30 存活存活 2250+5 女女 56 1994.06.25 1995.03.17 死亡死亡 265 6 女女 60 1993.12.05 1996.08.16 死于其它死于其它 985+生存时间生存时间o生存时间的度量单位可以是年、月、生存时间的度量单位可以是年、月、日、小时等。常用符号日、小时等。常用符号t表示,截尾数据在表示,截尾数据在其右上角标记其右上角标记“+
5、”。o生存资料的主要特点:生存资料的主要特点:n含有截尾数据。含有截尾数据。n截尾数据的特点:真实的生存时间未知,截尾数据的特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。只知道比观察到的截尾生存时间要长。n生存时间的分布一般不呈正态分布。生存时间的分布一般不呈正态分布。二、条件生存概率、生存率、生存曲线二、条件生存概率、生存率、生存曲线o条件生存概率:条件生存概率:(conditional probability of survival)表示某单位时段开始时存活的个体,到该表示某单位时段开始时存活的个体,到该时段结束时仍存活的可能性。时段结束时仍存活的可能性。年条件生存概率表示年
6、初尚存人口存年条件生存概率表示年初尚存人口存活满活满1年的可能性。年的可能性。o生存率:生存率:(survival rate,survival function)指观察对象经历指观察对象经历t个单位时段后仍存活的个单位时段后仍存活的可能性。可能性。条件生存概率和生存率的计算例:手术治疗例:手术治疗100例食管癌患者,术后例食管癌患者,术后1、2、3年的死亡数分别为年的死亡数分别为10、20、30,若无,若无截尾数据,试求各年条件生存概率及逐年截尾数据,试求各年条件生存概率及逐年生存率。生存率。生存率计算方法:生存率计算方法:n直接法直接法n概率乘法定理概率乘法定理由例子可看出,生存率与条件生存
7、概由例子可看出,生存率与条件生存概率不同。条件生存概率是单个时段的率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生结果,而生存率实质上是累积条件生存概率(存概率(cumulative probability of survival),是多个时段的累积结果。),是多个时段的累积结果。例如,例如,3年生存率是第年生存率是第1年存活,第年存活,第2年年也存活,第也存活,第3年还存活的可能性。年还存活的可能性。o生存曲线(生存曲线(survival curve)以观察(随访)时间为横轴,以生存率以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率为纵轴,将各个时间点所对
8、应的生存率连接在一起的曲线图。连接在一起的曲线图。o生存曲线是一条下降的曲线,分析时生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较期,陡峭的生存曲线表示低生存率或较短生存期。短生存期。某医师收集某医师收集20例脑瘤患者甲、乙两疗法例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下:治疗的生存时间(周)如下:甲甲疗法组疗法组 1 3 3 7 10 15 15 23 30乙乙疗法组疗法组 5 7+13 13 23 30 30+38 42 42 45+三
9、、中位生存期三、中位生存期o中位生存期(中位生存期(median survival time)又称半数生存期,表示恰好有又称半数生存期,表示恰好有50的的个体尚存活的时间。个体尚存活的时间。o中位生存期越长,表示疾病的预后越好;中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。中位生存期越短,预后越差。o估计中位生存期常用图解法或线性内插估计中位生存期常用图解法或线性内插法。法。生存资料统计学处理方法生存资料统计学处理方法(一)设计(一)设计o目的:专业目的:据专业知识确定。目的:专业目的:据专业知识确定。统计学目的:统计学目的:n估估计计:根根据据样样本本生生存存资资料料估估计计
10、总总体体生生存存率率及及其其它它有有关关指指标标(如如中中位位生生存存期期等等),如如根根据据脑脑瘤瘤患患者者治治疗疗后后的的生生存存时时间间资资料料,估估计计不不同同时时间间的的生生存存率率、生生存存曲曲线线以以及及中位生存期等。中位生存期等。n比较比较:对不同处理组生存率进行比较,如:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。哪种治疗方案较优。n影影响响因因素素分分析析:目目的的是是为为了了探探索索和和了了解解影影响响生生存存时时间间长长短短的的因因素素,或或平平衡衡某某些些因因素素影影响响后后,研研究究某某个个
11、或或某某些些因因素素对对生生存存率率的的影影响响。如如为为改改善善脑脑瘤瘤病病人人的的预预后后,应应了了解解影影响响病病人人预预后后的的主主要要因因素素,包包括括病病人人的的年年龄、性别、病程、肿瘤分期、治疗方案等。龄、性别、病程、肿瘤分期、治疗方案等。n预预测测:具具有有不不同同因因素素水水平平的的个个体体生生存存预预测测,如如根根据据脑脑瘤瘤病病人人的的年年龄龄、性性别别、病病程程、肿肿瘤瘤分分期期、治治疗疗方方案案等等预预测测该该病病人人t t年年(月月)生存率。生存率。o方法:前瞻性队列研究方法:前瞻性队列研究 回顾性队列研究回顾性队列研究o确确定定起起始始事事件件、终终点点事事件件、
12、随随访访终终止止日日期、生存时间、截尾。期、生存时间、截尾。o确确定定可可能能的的影影响响因因素素、水水平平以以及及量量化化方方法。法。大肠癌影响因素量化表大肠癌影响因素量化表变量名变量名 因素因素 量化值量化值 病例数病例数 构成比(构成比(%)X1 性别性别 女女=0 32 48.5 男男=1 34 51.5 X2 年龄(岁)年龄(岁)40=1 10 15.1 40-60=2 37 56.1 60=3 19 28.8 X3 组织学分类组织学分类 乳头状腺癌乳头状腺癌=0 20 30.3 管状腺癌管状腺癌=1 46 69.7 X4 肿瘤大小(肿瘤大小(cm)6=0 29 43.9 6=1 3
13、7 56.1 X5 细胞增殖抗原(细胞增殖抗原(PCNA)0,RR1,说说明明变变量量X增增加加时时,危危险率增加,即险率增加,即X是危险因素。是危险因素。o0,RR1,说说明明变变量量X增增加加时时,危危险率下降,即险率下降,即X是保护因素。是保护因素。o=0,RR=1,说说明明变变量量X增增加加时时,危危险率不变,即险率不变,即X是危险无关因素。是危险无关因素。二、参数估计与假设检验二、参数估计与假设检验(一)参数估计(一)参数估计 最大似然法最大似然法(二)假设检验(二)假设检验n似然比检验(似然比检验(likelihood ratio test)n得分检验(得分检验(score tes
14、t)nWald检验(检验(Wald test)三、因素筛选与最优模型的建立三、因素筛选与最优模型的建立o变量筛选方法变量筛选方法n向前引入法(前进法)向前引入法(前进法)Forwardn向后剔除法(后退法)向后剔除法(后退法)Backwardn逐步引入逐步引入-剔除法(逐步法)剔除法(逐步法)Stepwiseo检验水准检验水准n初初步步的的、探探索索性性的的研研究究,或或变变量量数数较较少少时时,可取可取0.10。n设设计计严严谨谨的的、证证实实性性的的研研究究,或或变变量量数数较较多时,可取多时,可取0.05或或0.01。n检检验验水水准准包包括括引引入入的的检检验验水水准准和和剔剔除除的的
15、检检验水准。一般地,剔除验水准。一般地,剔除引入引入。分析结果(结果解释)分析结果(结果解释)o与生存相关的因素与生存相关的因素o因因素素作作用用大大小小及及方方向向:保保护护因因素素还还是危险因素、相对危险度的大小。是危险因素、相对危险度的大小。o因因素素作作用用大大小小排排序序:标标准准化化回回归归系系数的绝对值。数的绝对值。分析结果(结果解释)分析结果(结果解释)p个体的预后指数及预后分组:个体的预后指数及预后分组:预后指数(预后指数(prognostic index,PI)=预后指数越小,预后越好;预后指数越小,预后越好;预后指数越大,预后越差。预后指数越大,预后越差。分析结果(结果解
16、释)分析结果(结果解释)n例如:例如:传统治疗方式,淋巴结转移,传统治疗方式,淋巴结转移,PI2.6929 传统治疗方式,淋巴结无转移,传统治疗方式,淋巴结无转移,PI1.7616 新治疗方式,淋巴结转移,新治疗方式,淋巴结转移,PI0.9313 新治疗方式,淋巴结无转移,新治疗方式,淋巴结无转移,PI0n据据PI的的大大小小可可将将病病人人分分为为不不同同的的危危险险组组,常常见见分分三三组组(即即低低危危组组、中中危危组组、高高危危组组)或或五五组组。绘绘制制分分组组的的生生存存曲曲线线,直直观观比比较较各各危危险险组组的的生生存情况,如中位生存期、存情况,如中位生存期、t年生存率等。年生
17、存率等。六、六、Cox模型的注意事项及应用范围模型的注意事项及应用范围(一)注意事项(一)注意事项o设计阶段应注意的问题设计阶段应注意的问题o模型配合时应注意的问题模型配合时应注意的问题应应用用条条件件:除除生生存存资资料料的的基基本本要要求求外外,还还要要求求因因素素对对生生存存时时间间的的作作用用不不随随时时间间变变化化(比比例例风风险险假假定定)。如如观观察察年年限限超超过过10年年时时,癌癌症症手手术术后后放放疗疗的的治治疗疗作作用用可可能能逐逐渐渐消消失失,从从而而不满足这一要求。不满足这一要求。o因素分析时应注意的问题因素分析时应注意的问题n筛筛选选变变量量时时,考考虑虑该该指指标
18、标是是否否容容易易收收集、是否费用较高等临床因素。集、是否费用较高等临床因素。n对对连连续续变变量量,看看其其分分布布,如如服服从从偏偏态态分布,一般进行对数变换后参与计算。分布,一般进行对数变换后参与计算。n选入模型的变量是统计学上的有关变量,选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。其中不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,未选某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变量,要入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试验中对该变作用,或因例
19、数不够,或试验中对该变量进行了控制而引起。量进行了控制而引起。n检检查查可可能能的的交交互互作作用用项项是是否否显显著著(方方法法:一一次次引引入入一一个个交交互互作作用用项项,看看其其对对应应的的回回归系数是否为归系数是否为0)。)。n模模型型拟拟合合优优度度考考察察:据据预预后后指指数数PI分分组组,比比较较各各组组基基于于Cox模模型型的的生生存存曲曲线线与与基基于于kaplan-Meier法法估估计计的的生生存存曲曲线线,如如两两组组曲线吻合较好,表明曲线吻合较好,表明Cox模型拟合较好。模型拟合较好。n生生存存率率分分析析:生生存存曲曲线线不不能能随随意意延延长长,也也不不能能轻轻易
20、易用用于于预预测测预预报报,经经过过大大量量研研究究所所得的生存曲线才有可能推广应用。得的生存曲线才有可能推广应用。(二)适用范围(二)适用范围o因素分析因素分析logistic回归模型可以作多因素分析,并可进行回归模型可以作多因素分析,并可进行相对危险度估计,但不考虑生存时间的长短,相对危险度估计,但不考虑生存时间的长短,不能处理随访中常见的截尾数据。不能处理随访中常见的截尾数据。Cox比例风比例风险回归模型具有险回归模型具有logistic回归模型的所有优点;回归模型的所有优点;同时考虑生存结局和生存时间的长短,可处理同时考虑生存结局和生存时间的长短,可处理截尾数据;且不考虑基准风险的分布
21、。截尾数据;且不考虑基准风险的分布。o生存预测生存预测n强调设计的重要性强调设计的重要性n专专业业知知识识角角度度:选选择择疾疾病病种种类类、终终点点事事件件、影响因素及结果的专业解释等。影响因素及结果的专业解释等。n统统计计学学角角度度:样样本本例例数数、因因素素的的赋赋值值、生生存存时时间间准准确确到到天天数数、因因素素筛筛选选方方法法、结结果果的统计学解释等的统计学解释等。小结(论文报告中应写明)小结(论文报告中应写明)1材料与方法材料与方法o病病例例来来源源、起起始始事事件件、终终点点事事件件、观观察察终终止止时时间间、截截尾尾情情况况、随随访访结结果果的的获获得得方方法法,样样本含量
22、、截尾例数及百分比本含量、截尾例数及百分比(%)。o建立数据库方法建立数据库方法o统计学处理方法统计学处理方法 Kaplan-Meier法估计生存率法估计生存率 log-rank检验进行组间生存率比较检验进行组间生存率比较 Cox模型进行多因素分析模型进行多因素分析 2结果结果o估计估计:Kaplan-Meier生存率及生存曲线。生存率及生存曲线。o比较比较:log-rank检验卡方值及其检验卡方值及其P值。值。o因素分析及预测因素分析及预测:n变量赋值变量赋值(数量化方法数量化方法)表表n变量统计描述:变量统计描述:各组病例数和构成比(分类变量)各组病例数和构成比(分类变量)均数和标准差(数
23、值变量)均数和标准差(数值变量)n变量筛选方法及检验水准变量筛选方法及检验水准nCox回归结果及统计解释回归结果及统计解释Cox回归与多元线性回归、回归与多元线性回归、logistic回归的比较回归的比较多元线性回归多元线性回归logisticlogistic回归回归Cox回归数据类型数据类型Y Y数值变量数值变量Y Y分类变量分类变量Y Y二分类变量二分类变量+时间时间 X X数值变量、分类变量、等级变量数值变量、分类变量、等级变量模型结构模型结构变量筛选变量筛选前进法;后退法;逐步法前进法;后退法;逐步法参数估计参数估计最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法参数检验参
24、数检验F-testF-testt-testt-test似然比检验似然比检验WaldWald检验检验 scorescore检验检验似然比检验似然比检验WaldWald检验检验 scorescore检验检验参数解释参数解释回归系数回归系数b b优势比优势比ORORRR样本含量样本含量至少变量数的至少变量数的1010倍倍至少变量数的至少变量数的2020倍倍非截尾例数至少变至少变量数的量数的1010倍倍应用应用因素分析因素分析预测预报预测预报 Y Y因素分析因素分析预测、判别预测、判别P(YP(Y1)1)因素分析因素分析生存预测生存预测 S(t)S(t)案例分析某研究者观察了确诊后采取同样方案进行化疗
25、某研究者观察了确诊后采取同样方案进行化疗的的26例急性混合型白血病患者,欲了解某种不例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,将治疗良染色体是否会影响患者病情的缓解,将治疗后后120天内症状是否缓解作为结果变量(缓解天内症状是否缓解作为结果变量(缓解0;未缓解;未缓解1),有无不良染色体作为研究),有无不良染色体作为研究因素。整理资料见下表。因素。整理资料见下表。有无不良染色体与缓解的关系有无不良染色体与缓解的关系不良染色体不良染色体 缓解缓解 未缓解未缓解 合计合计 缓解率()缓解率()有有 5 13 18 27.8 无无 3 5 8 37.5 合合 计计 8 1
26、8 26 30.8o考虑到例数较小,采用考虑到例数较小,采用Fisher确切概率法,确切概率法,得到得到P0.667,尚不能认为不良染色体影响,尚不能认为不良染色体影响病情的缓解。病情的缓解。o这种情况下的结果并不可靠,原因是两个这种情况下的结果并不可靠,原因是两个比较组之间其它影响患者病情缓解的因素比较组之间其它影响患者病情缓解的因素不一定均衡,因而需要考虑平衡其它可能不一定均衡,因而需要考虑平衡其它可能的影响因素如年龄(岁)、骨髓原幼细胞的影响因素如年龄(岁)、骨髓原幼细胞分组(分组(501;500)、)、CD34表表达(阳性达(阳性1;阴性;阴性0)、性别(男)、性别(男1;女女0)的作
27、用。)的作用。多因素多因素logistic回归分析结果回归分析结果 因素因素 回归系数回归系数 Wald卡方卡方 P OR染色体染色体 1.457 1.161 0.281 4.29骨髓原幼骨髓原幼 2.961 4.778 0.029 19.2细胞分组细胞分组o采用多因素采用多因素logistic回归分析,经逐步法按回归分析,经逐步法按0.10水准,平衡骨髓原幼细胞分组后,有水准,平衡骨髓原幼细胞分组后,有无不良染色体不影响患者的缓解(无不良染色体不影响患者的缓解(P0.281)。)。o有一位临床医生指出,仅考虑是否缓解还有一位临床医生指出,仅考虑是否缓解还不够,如果进一步利用缓解时间的长短来不
28、够,如果进一步利用缓解时间的长短来进行分析,信息利用得更充分。进行分析,信息利用得更充分。o费了很大辛苦,幸好查到了所有患者的缓费了很大辛苦,幸好查到了所有患者的缓解时间,于是采用解时间,于是采用log-rank检验比较有无不检验比较有无不良染色体两组病人的生存曲线,得卡方良染色体两组病人的生存曲线,得卡方1.28,P0.2579,仍然显示患者的缓解时,仍然显示患者的缓解时间与不良染色体无关。间与不良染色体无关。o生存时间的比较仍然需要考虑组间的可比生存时间的比较仍然需要考虑组间的可比性,经多因素性,经多因素Cox回归分析,当检验水准回归分析,当检验水准0.10时的结果如下。时的结果如下。因素因素 回归系数回归系数 卡方卡方 P RR染色体染色体 1.838 3.709 0.054 6.29CD34 1.877 8.904 0.003 6.54骨髓原幼骨髓原幼 3.205 8.838 0.003 24.4细胞分组细胞分组此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢