《生存分析SPSS学习.pptx》由会员分享,可在线阅读,更多相关《生存分析SPSS学习.pptx(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1.1.何为生存分析?生存分析生存分析(survival analysis)是将是将事件的结果事件的结果(终点事件)和(终点事件)和出现结果经历的出现结果经历的时间时间结合起来分析的一种统计分析方法。结合起来分析的一种统计分析方法。2.2.生存分析的目的:(1)(1)描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-MeierKaplan-Meier(K-MK-M)法、寿命表法。(2)(2)比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。统计方法log-ranklog-rank检验等。(3)(3)影响因素分
2、析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法coxcox比例风险回归模型等。(4)(4)预测:建立coxcox回归预测模型。生存分析的理论复习第1页/共31页生存分析(Survival Analysis)菜单第2页/共31页寿命表(Life Tables)过程Life tables 过程用于(小样本和大样本资料):1.估计某生存时间的生存率,以及中位生存时间。2.绘制各种曲线:如生存函数、风险函数曲线等。3.对某一研究因素不同水平的生存时间分布的比较。4.控制另一个因素后对研
3、究因素不同水平的生存时间分布的比较。5.对多组生存时间分布进行两两比较。(比较总体生存时间分布采用wilcoxon检验)第3页/共31页Company Logo实例分析例1:为了比较不同手术方法治疗肾上腺肿瘤的疗效,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下所示:其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。(1)计算甲、乙两法术后10月的生存率和标准误。(2)估计两组的中位生存期。(3)绘制各组生存函数曲线。(4)比较两组的总体生存时间分布有无差别。第4页/共31页Company Logo一、建立数据文件(data-01.sav)定义5个
4、变量:生存时间变量:t,值标签“生存时间(月)”生存状态变量:status,取值“1=死亡,0=删失或存活”频数变量:freq,值标签“人数”分组变量:group,取值“1=甲组,2=乙组”生存时间序号变量(可无):i第5页/共31页二、操作过程主菜单:分析Analyze生存Survival寿命表Life tables对话框参数设置:1.时间time框:选入“t”。2.显示时间间隔Display time intervals框:步长by前面填入最大生存时间的上限(必须包括生存时间最大值),步长by后面填入生存时间的组距。本例上限填“60”,组距填“1”。3.状态status框:选入“statu
5、s”,击define events 钮,在single value框填入“1”4.因子factor框:选入“group”,定义最小值“1”,最大值“2”。5.单击选项option按钮,弹出对话框:1)寿命表,系统默认。2)图:生存函数 3)比较第一个因子的水平:整体比较第6页/共31页三、主要输出结果1.10月生存率的估计:甲法 48%,标准误 0.1 乙法 30%,标准误 0.1 2.两组的中位生存期估计:第7页/共31页Company Logo3.绘制生存曲线:第8页/共31页Company Logo4.两组生存时间分布的比较:两组生存时间分布的比较:第9页/共31页Kaplan-Meie
6、r 过程Kaplan-Meier过程用于(尤其小样本资料):1.估计各生存时间的生存率以及中位生存时间。2.绘制各种曲线:如生存函数、风险函数曲线等。3.比较某研究因素不同水平的生存时间有无差异。4.控制某个分层因素后对研究因素不同水平的生存时间分布进行比较。5.对多组生存时间分布进行两两比较。(各总体分布比较采用Log-rank等非参数方法)第10页/共31页Company Logo实例分析例2:(数据同例1)为了比较不同手术方法治疗肾上腺肿瘤的疗效,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下所示:其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡
7、人数。(1)计算甲、乙两法各生存时间的生存率和标准误。(2)估计两组的中位生存期。(3)绘制各组生存函数曲线。(4)比较两组的总体生存时间分布有无差别。第11页/共31页一、建立数据文件(同前)二、操作过程主菜单:分析Analyze生存SurvivalKaplan-Meier对话框参数设置:1.时间time框:选入“t”。2.状态status框:选入“status”,击define events 钮,在single value框填入“1”。3.因子factor框:选入“group”。4.单击选项option按钮,弹出对话框:1)统计量:生存分析表,系统默认。均值和中位生存时间,系统默认。2)图
8、:生存函数5.单击比较因子Compare Factor按钮,弹出对话框:1)检验统计量Test Statistics:都用于检验时间分布是否相同。对数秩Log-rank:各时间点的权重一样。Breslow:按各时间点的观察例数赋权。Tarone-Ware:按各时间点观察例数的平方根赋权。第12页/共31页二、操作过程2)水平间的两两比较。水平间的两两比较。6.单击Save按钮,弹出保存新变量Save new variables 对话框:第13页/共31页三、主要输出结果1.生存表:略 2.两组的中位生存期估计:第14页/共31页3.绘制生存曲线:第15页/共31页Company Logo4.两
9、组生存时间分布的比较:两组生存时间分布的比较:第16页/共31页Cox回归过程Cox回归过程用于:1.多个因素对生存时间的影响作用分析和比较 2.生存(或死亡)风险预测第17页/共31页实例分析实例分析例3:为探讨某恶性肿瘤的预后,某研究者收集了63例患者的生存时间、生存结局及影响因素。影响因素包括病人年龄、性别、组织学类型、治疗方式、淋巴结转移、肿瘤浸润程度,生存时间以月计算。变量的赋值和所收集的资料分别见表17-8和表17-9。试用Cox回归模型进行分析。第18页/共31页NoX1X2X3X4X5X6tYNoX1X2X3X4X5X6tY154001105203362000101200257
10、01000510344011101 40135800011351355010010 26144311110103036331100012005480100071375711100120064001000600384810010120074401000580392800010 3183600011291405410110120193911101700413501011 71104201001670424700010 18111420100066043491011012001242101108704443010001200135111100850454811000 1511455010018204
11、64400010 411549111017604760111001200165211101740484000010 161174811100630493201001 2411854101111010504400011 19119380100010005148100101200204011101661527201010 241213800010930534200010 212219000102415463101101200236710110930555501100 121243700110900563900010 51254310010151574400010120026490001031584
12、2111001200275011111870597400011 712853111001200606101010 401293211100120061451011010803046010011200623801000 2413143101101200636200010 1613244101101200表17-9 63名某恶性肿瘤患者的生存时间(月)及影响因素第19页/共31页一、建立数据文件(data-03.sav)二、操作过程主菜单:分析Analyze生存SurvivalCox RegressionCox回归主对话框回归主对话框第20页/共31页二、操作过程二、操作过程主对话框参数设置:主对
13、话框参数设置:1.时间time框:选入“t”。2.状态status框:选入“y”,击define events 钮,在single value框填入“1”3.协变量Covariates框:选入“x1x6”。4.方法Method框:选择自变量进入Cox模型的方法,SPSS提供以下7种方法。第21页/共31页1.分析例数描述三、主要输出结果第22页/共31页2-1.模型检验(全变量模型)结果提示:(1)对模型总体检验有显著意义(P=0.003),即至少有1个自变量的总体回归系数不为0。第23页/共31页2-2.模型检验(逐步回归模型,Method=向前法LR,自变量进入P0.05,剔除P0.10)
14、(2)采用逐步回归法进行Cox模型分析的结果提示:模型拟合自变量进入和剔除的检验水准分别为0.05和0.1时,筛选后的最佳模型包含两个协变量,即X4(治疗方式)和X5(淋巴结是否转移),该拟合模型总体检验提示具有统计学意义(整体卡方=17.594,P0.10)B:偏回归系数,SE:偏回归系数的标准误Wald:用于检验总体偏回归系数与0有无显著差异,v=1时,W=(B/SE)2。Exp(B):相对危险度估计(RR值)(3)X4(治疗方式)对生存时间有影响,采用新疗法病人的死亡风险降至传统疗法的17.2%(RR的95%CI为0.0590.503)。(4)X5(淋巴结是否转移)对生存时间也有影响,有
15、淋巴结转移病人的死亡风险为无淋巴结转移病人的2.538倍(RR的95%CI为1.0626.066)。第25页/共31页4.自/协变量的均值(选入2个变量的模型)第26页/共31页o5.生存曲线(选入2个变量的模型)第27页/共31页Company Logop 练习练习1:某临床试验对20名第或第期黑色素瘤的患者进行随访研究,截至研究期结束,记录的生存资料见表1。应用SPSS软件建立数据文件,并计算100周生存率。表1 20名第或期黑色素瘤患者的治疗后生存时间(周)12.815.624.0+26.429.230.8+39.242.058.4+72.0+77.282.487.2+94.4+97.2
16、+106.0+114.8+117.2+140.0+168.0+练习题第28页/共31页练习练习2:某研究者随访收集了某地男性心绞痛患者2418例,其生存时间数据整理后见表2。(1)建立SPSS数据文件。(2)估计该地男性心绞痛患者的2年生存率和标准误,以及中位生存期。第29页/共31页练习3:某研究者分别用免疫疗法、药物+免疫疗法治疗黑色素瘤患者,经随访得到各患者的生存时间(月)见数据文件ex-03.sav。(1)试用Kaplan-Meier过程计算其生存率和标准误。(2)对两组的生存率进行log-rank检验。(3)绘制生存曲线,计算中位生存期。第30页/共31页Company Logo感谢您的观看!第31页/共31页