《医学统计学第十六章Logistic回归分析.ppt》由会员分享,可在线阅读,更多相关《医学统计学第十六章Logistic回归分析.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/2/3医学统计学1 第十六章第十六章 logistic回归分析回归分析 (Logistic Regression)第一页,编辑于星期六:十九点 二分。2023/2/3医学统计学2ContentnLogisticregressionnConditionallogisticregressionnApplication 第二页,编辑于星期六:十九点 二分。2023/2/3医学统计学3讲述内容讲述内容:第一节第一节 logisticlogistic回归回归第二节第二节 条件条件logisticlogistic回归回归第三节第三节 logisticlogistic回归的应用回归的应用 及其注意
2、事项及其注意事项第三页,编辑于星期六:十九点 二分。2023/2/3医学统计学4目的:目的:作出以多个自变量(危险因素)估计作出以多个自变量(危险因素)估计应应变量(变量(结果因素)结果因素)的的logistic回归方程。属于回归方程。属于概率型非线性回归。概率型非线性回归。资料:资料:1.应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值变量;变量;2.自变量宜全部或大部分为分类变量,自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。可有少数数值变量。分类变量要数量化。第四页,编辑于星期六:十九点 二分。2023/2/3医学统计学5用途:用途:研究某种
3、疾病或现象发生和多个危研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。险因素(或保护因子)的数量关系。用用检验(或检验(或u检验)的检验)的局限性局限性:1.只能研究只能研究1个危险因素;个危险因素;2.只能得出定性结论。只能得出定性结论。第五页,编辑于星期六:十九点 二分。2023/2/3医学统计学6 种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条件)配对(条件)logistic回归方程。回归方程。第六页,编辑于星期六:十九点 二分。2023/2/3医学统计学7第一节第一节 logistic回归回归(非条件(非条件logistic回归
4、回归)第七页,编辑于星期六:十九点 二分。2023/2/3医学统计学8一、基本概念一、基本概念,在m个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:第八页,编辑于星期六:十九点 二分。2023/2/3医学统计学9若令若令:回回归归模模型型概率概率P:01,logitP:。取值范围取值范围 第九页,编辑于星期六:十九点 二分。2023/2/3医学统计学10图图16-1logistic函数的图形函数的图形第十页,编辑于星期六:十九点 二分。2023/2/3医学统计学11模模型型参参数数的的意意义义常数常数项项表示暴露剂量为表示暴露剂量为0时个体发病时个体发病与不发病概
5、率之比的自然对数。与不发病概率之比的自然对数。回归系数回归系数 表示自变量表示自变量 改变一个单位时改变一个单位时logitP 的改变量。的改变量。第十一页,编辑于星期六:十九点 二分。2023/2/3医学统计学12流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的比数比例比数比例指标。计算指标。计算公式为:公式为:优势比优势比OR(oddsratio)第十二页,编辑于星期六:十九点 二分。2023/2/3医学统计学13与与logisticP 的关系的关系:第十三页,编辑于星期六:十九点 二分。2023/2/3医学统计学14第十四页,编辑于星期六:十九点 二分。2023/2/3医学统
6、计学15二、logistic回归模型的参数估计回归模型的参数估计 1.参数估计参数估计 原理:最大似然原理:最大似然(likelihood)估计估计 第十五页,编辑于星期六:十九点 二分。2023/2/3医学统计学16 2.优势比估计优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。第十六页,编辑于星期六:十九点 二分。2023/2/3医学统计学17例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例对照资料,试作logistic回归分析。确确定定各各变变量量编编码码 第十七页,编辑于星期六:十九点 二分。2023/2/3医学统计学18表表16-1吸烟与食道癌关系的病例对照
7、调查资料吸烟与食道癌关系的病例对照调查资料第十八页,编辑于星期六:十九点 二分。2023/2/3医学统计学19经logistic回归计算后得:的95可信区间:第十九页,编辑于星期六:十九点 二分。2023/2/3医学统计学20 三、三、logistic回归模型的假设检验回归模型的假设检验 2.1.似然比检验第二十页,编辑于星期六:十九点 二分。2023/2/3医学统计学21方法:方法:前进法、后退法和逐步法前进法、后退法和逐步法。检验统计量:检验统计量:不是不是F统计量,而是似然比统计量、统计量,而是似然比统计量、Wald统计量和计分统计量之一。统计量和计分统计量之一。四、变量筛选四、变量筛选
8、例16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26例冠心病病人和例冠心病病人和28例对照者进行病例例对照者进行病例 对照研究,各因素的对照研究,各因素的说明及资料见表说明及资料见表16-2和表和表16-3。试用。试用logistic逐步回归分析逐步回归分析方法筛选危险因素。方法筛选危险因素。第二十一页,编辑于星期六:十九点 二分。2023/2/3医学统计学22表表16-2冠心病冠心病8个可能的危险因素与赋值个可能的危险因素与赋值第二十二页,编辑于星期六:十九点 二分。2023/2/3医学统计学23表表16-3冠心病危险因素的病例冠心病危险因素的病例 对照调
9、查资料对照调查资料 第二十三页,编辑于星期六:十九点 二分。2023/2/3医学统计学24表表16-4例例16-2进入方程中的自变量及有关参数的估计值进入方程中的自变量及有关参数的估计值学会看结果!学会看结果!第二十四页,编辑于星期六:十九点 二分。2023/2/3医学统计学25第二十五页,编辑于星期六:十九点 二分。2023/2/3医学统计学26一、原理 第二节 条件logistic回归 第二十六页,编辑于星期六:十九点 二分。2023/2/3医学统计学27表表16-51:M 条件条件logistic回归数据的格式回归数据的格式*t=0 为病例,其他为对照 第二十七页,编辑于星期六:十九点
10、二分。2023/2/3医学统计学28条件 logistic 模型第二十八页,编辑于星期六:十九点 二分。2023/2/3医学统计学29二、应用实例第二十九页,编辑于星期六:十九点 二分。2023/2/3医学统计学30表表16-7喉癌喉癌1:2配对病例配对病例 对照调查资料整理表对照调查资料整理表P344:第三十页,编辑于星期六:十九点 二分。2023/2/3医学统计学31表16-8 例16-3进入方程中的自变量及有关参数的估计值 采用逐步法 6个危险因素 变量筛选 4个进方程,结果见表16-9。第三十一页,编辑于星期六:十九点 二分。2023/2/3医学统计学32一、logistic回归的应用
11、1流行病学危险因素分析 logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究。logistic回归既适合于队列研究(cohort study),也适合于病例-对照研究(case-control study),同样还可以用于断面研究(cross-sectional study)第三节 logistic回归的应用及其注意事项第三十二页,编辑于星期六:十九点 二分。2023/2/3医学统计学332临床试验数据分析 临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非
12、处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组内的分布仍有可能不均衡,需要在分析阶段对构成混杂的非处理因素进行调整。当评价指标为二值变量时(如有效和无效),可以利用logistic回归分析得到调整后的药物评价结果。对于按分层设计的临床试验可以用相同的方法对分层因素进行调整和分析。第三十三页,编辑于星期六:十九点 二分。2023/2/3医学统计学343分析药物或毒物的剂量反应 在一些药物或毒物效价的剂量-反应实验研究中,每一只动物药物耐受量可能有很大的不同,不同剂量使动物
13、发生“阳性反应”的概率分布常呈正偏态,将剂量取对数后则概率分布接近正态分布。由于正态分布函数与logistic分布函数十分接近,如果用P表示在剂量为X时的阳性率,可用下述模型表示它们之间的关系用这一模型可以求出任一剂量的阳性反应率用这一模型可以求出任一剂量的阳性反应率传传统统的的一一些些方方法法往往往往对对实实验验设设计计有有严严格格的的要要求求,如如剂剂量量按按等等比比级级数数排排列列,各各剂剂量量组组的的例例数数必必须须相相同同等等,采采用用logistic回回归归的的方方法法则则没没有这些限制。有这些限制。第三十四页,编辑于星期六:十九点 二分。2023/2/3医学统计学354预测与判别
14、 logistic回归是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。关于判别问题见第十八章。第三十五页,编辑于星期六:十九点 二分。2023/2/3医学统计学36二、logistic回归应用的注意事项第三十六页,编辑于星期六:十九点 二分。2023/2/3医学统计学37本章小结:本章小结:目的:目的:作出以多个自变量(危险因素)估计应变量(结果因作出以多个自变量(危险因素)估计应变量(结果因素)的素)的logistic回归方程。属于概率型非线性回归。回归方程。属于概率型非线性回归。资料:资料:1.应变量为反映某现象发生与不发生的二值变量;应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数值自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。变量。分类变量要数量化。用途:用途:研究某种疾病或现象发生和多个危险因素(或保护因子)研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。的数量关系。种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条件)配对(条件)logistic回归方程。回归方程。第三十七页,编辑于星期六:十九点 二分。