医学统计学Logistic回归分析.ppt

上传人:得****1 文档编号:74780648 上传时间:2023-02-28 格式:PPT 页数:66 大小:1.87MB
返回 下载 相关 举报
医学统计学Logistic回归分析.ppt_第1页
第1页 / 共66页
医学统计学Logistic回归分析.ppt_第2页
第2页 / 共66页
点击查看更多>>
资源描述

《医学统计学Logistic回归分析.ppt》由会员分享,可在线阅读,更多相关《医学统计学Logistic回归分析.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、医学医学统计学学Logistic回回归分析分析第十六章第十六章 Logistic回归分析回归分析 Logistic Regression Analysis 第一节第一节第一节第一节 非条件非条件非条件非条件LogisticLogisticLogisticLogistic回归分析回归分析回归分析回归分析第二节第二节第二节第二节 条件条件条件条件LogisticLogisticLogisticLogistic回归分析回归分析回归分析回归分析教学内容教学内容第三节第三节第三节第三节 LogisticLogisticLogisticLogistic回归分析的应用回归分析的应用回归分析的应用回归分析的应

2、用 及注意事项及注意事项及注意事项及注意事项流行病学概念回顾流行病学概念回顾流行病学概念回顾流行病学概念回顾Department ofHealth Statistics掌握掌握了解了解1.Logistic1.Logistic1.Logistic1.Logistic回归参数估计的基本思想回归参数估计的基本思想回归参数估计的基本思想回归参数估计的基本思想2.Logistic2.Logistic2.Logistic2.Logistic回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法教学目标教学目标1.Logistic1.

3、Logistic1.Logistic1.Logistic回归分析结果及解释回归分析结果及解释回归分析结果及解释回归分析结果及解释2.Logistic2.Logistic2.Logistic2.Logistic回归变量筛选方法回归变量筛选方法回归变量筛选方法回归变量筛选方法3.Logistic3.Logistic3.Logistic3.Logistic回归系数的流行病学意义回归系数的流行病学意义回归系数的流行病学意义回归系数的流行病学意义4.Logistic4.Logistic4.Logistic4.Logistic回归的应用及注意事项回归的应用及注意事项回归的应用及注意事项回归的应用及注意事项

4、理解理解非条件非条件非条件非条件LogisticLogisticLogisticLogistic回归和条件回归和条件回归和条件回归和条件LogisticLogisticLogisticLogistic回归的回归的回归的回归的区别区别区别区别Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦几个重要的流行病学概念几个重要的流行病学概念 病病病病因因因因分分分分析析析析(预预预预后后后后分分分分析析析析)的的的的目目目目的的的的:找找找找出出出出影影影影响响响响疾疾疾疾病病病病发发发发生生生生(或或或或预预预预后后后后好好好好坏坏坏坏)的的的

5、的影影影影响响响响因因因因素素素素及及及及其其其其影影影影响响响响的的的的强强强强度度度度。如如如如果果果果某某某某因因因因素素素素对对对对疾疾疾疾病病病病发发发发生生生生有有有有影影影影响响响响,就就就就称称称称该该该该因因因因素素素素与与与与疾疾疾疾病病病病的的的的发发发发生生生生有有有有关关关关联联联联,关关关关联联联联的的的的强强强强度度度度则则则则反反反反映映映映其其其其对对对对疾疾疾疾病病病病发发发发生生生生影影影影响响响响的的的的大大大大小小小小。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦几个重要的流行病学概念几个重

6、要的流行病学概念v队列研究(队列研究(cohort studycohort study)v病例对照研究(病例对照研究(case-control studycase-control study)v危险度(危险度(riskrisk)v相对危险度(相对危险度(relative riskrelative risk,RRRR)v比数比或优势比(比数比或优势比(odds ratioodds ratio,OROR)Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦队列研究队列研究 队列研究(队列研究(队列研究(队列研究(cohort studycoho

7、rt studycohort studycohort study):对对对对“因因因因”分类上分类上分类上分类上的人群作追踪随访,观察其的人群作追踪随访,观察其的人群作追踪随访,观察其的人群作追踪随访,观察其“果果果果”,然后对资料,然后对资料,然后对资料,然后对资料进行比较分析,从而判断进行比较分析,从而判断进行比较分析,从而判断进行比较分析,从而判断“因因因因”与与与与“果果果果”之间有之间有之间有之间有无关联及关联的强度。无关联及关联的强度。无关联及关联的强度。无关联及关联的强度。患病患病患病患病 未患病未患病未患病未患病暴露组暴露组暴露组暴露组非暴露组非暴露组非暴露组非暴露组Depar

8、tment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦病例对照研究病例对照研究 病病病病例例例例对对对对照照照照研研研研究究究究(case-control case-control case-control case-control studystudystudystudy):是是是是对对对对“果果果果”分分分分类类类类上上上上的的的的人人人人群群群群作作作作回回回回顾顾顾顾性性性性调调调调查查查查,观观观观察察察察其其其其“因因因因”,然然然然后后后后对对对对资资资资料料料料进进进进行行行行比比比比较较较较分分分分析析析析,从从从从而而而而判判判判断

9、断断断“果果果果”与与与与“因因因因”间关联有无统计学意义及关联的强度。间关联有无统计学意义及关联的强度。间关联有无统计学意义及关联的强度。间关联有无统计学意义及关联的强度。暴露暴露暴露暴露 未暴露未暴露未暴露未暴露病例病例病例病例对照对照对照对照Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦危险度危险度 危险度(危险度(危险度(危险度(riskrisk):通常指某个不幸事件发生的概:通常指某个不幸事件发生的概:通常指某个不幸事件发生的概:通常指某个不幸事件发生的概率。危险度大表示发生的可能性大。率。危险度大表示发生的可能性大。率。危

10、险度大表示发生的可能性大。率。危险度大表示发生的可能性大。某病发病危险度某病发病危险度某病发病危险度某病发病危险度:观察对象在观察期间内发生某:观察对象在观察期间内发生某:观察对象在观察期间内发生某:观察对象在观察期间内发生某病的概率,即某病病的概率,即某病病的概率,即某病病的概率,即某病发病率发病率发病率发病率。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦相对危险度相对危险度 RRRR1 1:表示该因素为危险因素,使发病危险度增大。:表示该因素为危险因素,使发病危险度增大。:表示该因素为危险因素,使发病危险度增大。:表示该因素为危

11、险因素,使发病危险度增大。RRRR1 1:表示该因素为保护因素,使发病危险度减小。:表示该因素为保护因素,使发病危险度减小。:表示该因素为保护因素,使发病危险度减小。:表示该因素为保护因素,使发病危险度减小。RR=1RR=1:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。相对危险度(相对危险度(相对危险度(相对危险度(relative riskrelative risk,RRRR):暴露于某种:暴露于某种:暴露于某种:暴露于某种危险因子的发病率危险因子的发病率危险因子的发病率危险因子的发病率 p pe e 与不暴露

12、于该种危险因子的与不暴露于该种危险因子的与不暴露于该种危险因子的与不暴露于该种危险因子的发病率发病率发病率发病率 p p0 0 之比。之比。之比。之比。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦相对危险度相对危险度 患病患病患病患病 未患病未患病未患病未患病暴露组暴露组暴露组暴露组非暴露组非暴露组非暴露组非暴露组队列研究队列研究队列研究队列研究病例对照研究一般不能计算病例对照研究一般不能计算病例对照研究一般不能计算病例对照研究一般不能计算RRRR。病例对照研究病例对照研究病例对照研究病例对照研究Department ofHealt

13、h Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦比数比数比数比数(odds)(odds):发生率与未发生率之比,即发生率与未发生率之比,即发生率与未发生率之比,即发生率与未发生率之比,即 p/(1-p)p/(1-p),即阳性率即阳性率即阳性率即阳性率/阴性率。阴性率。阴性率。阴性率。比数比比数比比数比比数比(odds ratioodds ratio,OROR):两个比数之比,:两个比数之比,:两个比数之比,:两个比数之比,即即即即 ,通常在流行病研究中,通常在流行病研究中,通常在流行病研究中,通常在流行病研究中p p1 1为病例组的暴露率,为病例组的暴露率,为病例组的暴露

14、率,为病例组的暴露率,p p2 2为对照组的暴露率。为对照组的暴露率。为对照组的暴露率。为对照组的暴露率。比数比比数比对发对发对发对发病率较低病率较低病率较低病率较低的疾病,一般有的疾病,一般有的疾病,一般有的疾病,一般有RRORRRORDepartment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦比数比比数比患病患病患病患病 未患病未患病未患病未患病暴露组暴露组暴露组暴露组非暴露组非暴露组非暴露组非暴露组暴露暴露暴露暴露 未暴露未暴露未暴露未暴露病例病例病例病例对照对照对照对照 (对发对发对发对发病率较病率较病率较病率较低低低低的疾病的疾病的疾病的

15、疾病)病例对照研究病例对照研究病例对照研究病例对照研究队列研究队列研究队列研究队列研究病例对照研究一般用病例对照研究一般用病例对照研究一般用病例对照研究一般用OROR替代替代替代替代RRRR。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦一个病例对照研究资料一个病例对照研究资料ORORDepartment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦 医学研究中常碰到医学研究中常碰到医学研究中常碰到医学研究中常碰到应变量应变量应变量应变量的可能取值仅有两的可能取值仅有两的可能取值仅有两的可能取值

16、仅有两个(即个(即个(即个(即二分类变量二分类变量二分类变量二分类变量),如发病与未发病、阳性与),如发病与未发病、阳性与),如发病与未发病、阳性与),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重回归的条件。露等,显然这类资料不满足多重回归的条件。露等,显然这类资料不满足多重回归的条件。露等,显然这类资料不满足多重回归的条件。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHe

17、alth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦目的:目的:目的:目的:作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量(结果因素)的(结果因素)的(结果因素)的(结果因素)的logisticlogisticlogisticlogistic回归方程。属于概率型非回归方程。属于概率型非回归方程。属于概率型非回归方程。属于概率型非线性回归。线性回归。线性回归。线性回归。资料:资料:资料:资料:1.1.1.1.应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与

18、不发生的二值应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值变量;变量;变量;变量;2.2.2.2.自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦用途:用途:研究某种疾病或现象

19、发生和多个危险因素(或保研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。护因子)的数量关系。用用 检验(或检验(或u u检验)的检验)的局限性局限性:1.1.只能研究只能研究1 1个危险因素;个危险因素;2.2.只能得出定性结论。只能得出定性结论。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦 种类种类种类种类:1.1.1.1.成组(非条件)成组(非条件)成组(非条件)成组(非条件)logisticlogisticlogisticlogistic回归方程

20、。回归方程。回归方程。回归方程。2.2.2.2.配对(条件)配对(条件)配对(条件)配对(条件)logisticlogisticlogisticlogistic回归方程。回归方程。回归方程。回归方程。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦第一节第一节 Logistic回归分析回归分析 Logistic Regression实例实例表表表表16-1 16-1 膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料

21、Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦例例例例16-2 16-2 16-2 16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26262626例冠心病病人和例冠心病病人和例冠心病病人和例冠心病病人和28282828例对照者进行病例例对照者进行病例例对照者进行病例例对照者进行病例 对照研究,对照研究,对照研究,对照研究,调查记录了调查记录了调查记录了调查记录了8 8 8 8个可能的危险因素,试用个可能的危险因素,试用个可能的危

22、险因素,试用个可能的危险因素,试用LogisticLogistic逐步逐步逐步逐步回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作用大小。用大小。用大小。用大小。实例实例Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦表表表表16-2 16-2 16-2 16-2 冠心病冠心病冠心病冠心病8 8 8 8个可能的危险因素与编码说明个可能的危险因素与编码说明个可能的危险因素与编码说明个可能的危险因素与编码说明实例实

23、例Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦实例实例表表表表16-3 16-3 冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦Logistic回回归归模模型型在在在在mm个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:LogitLog

24、it变换变换变换变换Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦Logistic回归模型回归模型这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中可能出现的应变量值域的窘境。可能出现的应变量值域的窘境。可能出现的应变量值域的窘境。可能出现的应变量值域的窘境。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦Logistic曲曲线线Department ofHea

25、lth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦常数项:常数项:常数项:常数项:表示暴露剂量表示暴露剂量表示暴露剂量表示暴露剂量 为为为为0 0 0 0时个体发病与不时个体发病与不时个体发病与不时个体发病与不发病概率之比的自然对数。发病概率之比的自然对数。发病概率之比的自然对数。发病概率之比的自然对数。回归系数:回归系数:回归系数:回归系数:表示自变量表示自变量表示自变量表示自变量 改变一个单位时改变一个单位时改变一个单位时改变一个单位时LogitLogitLogitLogit(P P P P)的改变量。的改变量。的改变量。的改变量。模型参数的意义模型参数的意义Log

26、isticLogistic模型还有另一种线性化表达形式,称为模型还有另一种线性化表达形式,称为模型还有另一种线性化表达形式,称为模型还有另一种线性化表达形式,称为LogitLogit模型模型模型模型:Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦 流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的比数比比数比比数比比数比指标。指标。指标。指标。计算公式为:计算公式为:计算公式为:计算公式为:模型参数的意义模型参数的意义 比数比比数比OR(odds ratio)Dep

27、artment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦模型参数的意义模型参数的意义 OR与与 Logit(P)的关系的关系 j j 表示表示表示表示 ORORj j 的自然对数值。的自然对数值。的自然对数值。的自然对数值。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦模型参数的意义模型参数的意义 Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦模型参数的意义模型参数的意义 Department ofHealth Statistics

28、卫生统计学教研室卫生统计学教研室 张彦琦张彦琦logistic回归模型的参数估计回归模型的参数估计 原理:最大似然原理:最大似然原理:最大似然原理:最大似然(likelihood)(likelihood)估计估计估计估计 参数估计参数估计Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦可反映某一因素两个不同水平(可反映某一因素两个不同水平(可反映某一因素两个不同水平(可反映某一因素两个不同水平(c c c c1 1 1 1,c c c c0 0 0 0)的优势比)的优势比)的优势比)的优势比。优势比估计优势比估计logistic回归模型

29、的参数估计回归模型的参数估计 Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦logistic回归模型的假设检验回归模型的假设检验2.2.1.1.1.1.似然比检验似然比检验似然比检验似然比检验:-2ln-2ln-2ln-2lnL L L L近似服从近似服从近似服从近似服从 分布分布分布分布 G G G G=2(ln=2(ln=2(ln=2(lnL L L L1 1 1 1-ln-ln-ln-lnL L L L0 0 0 0)=2ln)=2ln)=2ln)=2ln(L L L L1 1 1 1/L L L L0 0 0 0)=p-l=p

30、-l=p-l=p-lDepartment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦标准化回归系数标准化回归系数标准化回归系数绝对值越大标准化回归系数绝对值越大标准化回归系数绝对值越大标准化回归系数绝对值越大,说明相应变量说明相应变量说明相应变量说明相应变量的作用越大的作用越大的作用越大的作用越大.Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦v数数数数据据据据准准准准备备

31、备备成成成成3 3列列列列:例例例例数数数数、吸吸吸吸烟烟烟烟史史史史(1 1:有有有有,0 0:无无无无),膀膀膀膀胱胱胱胱癌癌癌癌(1 1:有有有有,0 0:无无无无)实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦vDataWeight cases实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦vAnalyzeRegressionBinary Logistic实例分析实例分析Department ofHealth Statistics卫生统计

32、学教研室卫生统计学教研室 张彦琦张彦琦vv应变量编码应变量编码应变量编码应变量编码vv模型拟合结果模型拟合结果模型拟合结果模型拟合结果实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦方法:方法:方法:方法:前进法、后退法和逐步法。前进法、后退法和逐步法。前进法、后退法和逐步法。前进法、后退法和逐步法。检验统计量:检验统计量:检验统计量:检验统计量:不是不是不是不是 F F F F 统计量,而是似然比统计量、统计量,而是似然比统计量、统计量,而是似然比统计量、统计量,而是似然比统计量、Wald Wald Wald Wald

33、 统计量和计分统计量之一。统计量和计分统计量之一。统计量和计分统计量之一。统计量和计分统计量之一。变量的筛选变量的筛选Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦变变量量的的筛筛选选例例例例16-2 16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对2626例冠心病病人和例冠心病病人和例冠心病病人和例冠心病病人和2828例对照者进行病例例对照者进行病例例对照者进行病例例对照者进行病例 对照研究,对照研究,对照研究,对照研究,调查记

34、录了调查记录了调查记录了调查记录了8 8个可能的危险因素,试用个可能的危险因素,试用个可能的危险因素,试用个可能的危险因素,试用LogisticLogistic逐步逐步逐步逐步回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作用大小。用大小。用大小。用大小。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦表表表表16-2 16-2 16-2 16-2 冠心病冠心病冠心病冠心病8 8 8 8个可能的危险因素与编码说

35、明个可能的危险因素与编码说明个可能的危险因素与编码说明个可能的危险因素与编码说明实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦实例分析实例分析表表表表16-3 16-3 冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦由标准化回归系数可以看出,选入的四个危险因素按其影响由标准化回归系数可以看出,选入的四个危险因素按其影响由标准化

36、回归系数可以看出,选入的四个危险因素按其影响由标准化回归系数可以看出,选入的四个危险因素按其影响大小排列的顺序为大小排列的顺序为大小排列的顺序为大小排列的顺序为X X6 6、X X8 8、X X5 5、X X1 1,它们分别是动物脂肪摄它们分别是动物脂肪摄它们分别是动物脂肪摄它们分别是动物脂肪摄入量、入量、入量、入量、A A型性格、高血脂史和年龄增高。型性格、高血脂史和年龄增高。型性格、高血脂史和年龄增高。型性格、高血脂史和年龄增高。实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦第二节第二节 条件条件Logistic回

37、归分析回归分析Conditional Logistic Regression条件条件Logistic回归的原理回归的原理v条件条件条件条件LogisticLogistic回归(回归(回归(回归(conditional Logistic regressionconditional Logistic regression)是针对是针对是针对是针对配对或分层资料配对或分层资料配对或分层资料配对或分层资料分析的一种方法。分析的一种方法。分析的一种方法。分析的一种方法。v为了控制一些重要的混杂因素(如性别和年龄等),为了控制一些重要的混杂因素(如性别和年龄等),为了控制一些重要的混杂因素(如性别和年龄等

38、),为了控制一些重要的混杂因素(如性别和年龄等),流行病学常采用流行病学常采用流行病学常采用流行病学常采用1:1:MM配对配对配对配对的研究方法,即每一个病的研究方法,即每一个病的研究方法,即每一个病的研究方法,即每一个病例与例与例与例与MM个与它条件相一致的对照形成一个匹配组个与它条件相一致的对照形成一个匹配组个与它条件相一致的对照形成一个匹配组个与它条件相一致的对照形成一个匹配组(每一匹配组为一个层)。(每一匹配组为一个层)。(每一匹配组为一个层)。(每一匹配组为一个层)。v条件条件条件条件LogisticLogistic回归,其实质是在构造似然函数时利用回归,其实质是在构造似然函数时利用

39、回归,其实质是在构造似然函数时利用回归,其实质是在构造似然函数时利用适当的适当的适当的适当的条件分布条件分布条件分布条件分布,实现在各层中进行比较。,实现在各层中进行比较。,实现在各层中进行比较。,实现在各层中进行比较。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦表表16-5 1:M 条件条件logistic回归数据的格式回归数据的格式*t=0 为病例,其他为对照 1:M数据格式数据格式Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦条件条件Logistic回归模型回归模型

40、Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦实例分析实例分析vv例例例例1 1 1 16 6 6 6-3 3 3 3 某某某某市市市市调调调调查查查查三三三三种种种种生生生生活活活活方方方方式式式式与与与与胃胃胃胃癌癌癌癌发发发发病病病病的的的的关关关关系系系系,采采采采用用用用1 1 1 1:1 1 1 1配配配配对对对对的的的的病病病病例例例例 对对对对照照照照研研研研究究究究形形形形式式式式。按按按按每每每每个个个个病病病病例例例例的的的的性性性性别别别别、年年年年龄龄龄龄和和和和居居居居住住住住地地地地选选选选取取取取一一一

41、一个个个个健健健健康康康康作作作作为为为为对对对对照照照照。调调调调查查查查的的的的三三三三种种种种生生生生活活活活方方方方式式式式取取取取值值值值见见见见表表表表1 1 1 16 6 6 6-7 7 7 7,共共共共调调调调查查查查了了了了5 5 5 50 0 0 0对对对对病病病病例例例例与与与与对对对对照照照照。试试试试作作作作条条条条件件件件L L L Lo o o og g g gi i i is s s st t t ti i i ic c c c逐逐逐逐步步步步回回回回归归归归分分分分析析析析。表表表表16-7 16-7 三种生活方式取值三种生活方式取值三种生活方式取值三种生活方

42、式取值Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦v数据准备成4列:X1、X2、X3,配对号及疾病发生情况Y(1:病例,0:对照)。实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦v模型拟合结果v显然,存在不显著的变量,可以进行逐步回归分析。实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦实例分析实例分析Department ofHealth Statistics卫生统计学教研室卫生统计

43、学教研室 张彦琦张彦琦第三节第三节 Logistic回归的应用回归的应用 及注意事项及注意事项logisticlogistic回归分析的特点之一是参数意义清楚,即得回归分析的特点之一是参数意义清楚,即得回归分析的特点之一是参数意义清楚,即得回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因到某一因素的回归系数后,可以很快估计出这一因到某一因素的回归系数后,可以很快估计出这一因到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比素在不同水平下的优势比素在不同水平下的优势比素在不同水平下的优势比OROR或近似相对危险度或近似相对危险度或近似相对危险度或

44、近似相对危险度RRRR,因此非常适合于流行病学研究。因此非常适合于流行病学研究。因此非常适合于流行病学研究。因此非常适合于流行病学研究。logisticlogistic回归既适合于队列研究回归既适合于队列研究回归既适合于队列研究回归既适合于队列研究(cohort study)(cohort study),也适,也适,也适,也适合于病例合于病例合于病例合于病例-对照研究对照研究对照研究对照研究(case-control study),(case-control study),同样还可以同样还可以同样还可以同样还可以用于横断面研究用于横断面研究用于横断面研究用于横断面研究(cross-sectio

45、nal study)(cross-sectional study)logistic回归的应用回归的应用流行病学危险因素分析流行病学危险因素分析Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦 临床试验的目的大多是为了评价某种药物或治疗方法临床试验的目的大多是为了评价某种药物或治疗方法临床试验的目的大多是为了评价某种药物或治疗方法临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非处理因素的效果,如果有其他影响效果的非处理因素的效果,如果有其他影响效果的非处理因素的效果,如果有其他影响效果的非处理因素(如年龄、病如

46、年龄、病如年龄、病如年龄、病情等情等情等情等)在试验组和对照组中分布不均衡,就有可能夸大或在试验组和对照组中分布不均衡,就有可能夸大或在试验组和对照组中分布不均衡,就有可能夸大或在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。掩盖试验组的治疗效果。掩盖试验组的治疗效果。掩盖试验组的治疗效果。当非处理因素过多时,可能会遇到各层样本量过小和当非处理因素过多时,可能会遇到各层样本量过小和当非处理因素过多时,可能会遇到各层样本量过小和当非处理因素过多时,可能会遇到各层样本量过小和非处理因素在试验组和对照组内的分布不均衡的问题。非处理因素在试验组和对照组内的分布不均衡的问题。非处理因素

47、在试验组和对照组内的分布不均衡的问题。非处理因素在试验组和对照组内的分布不均衡的问题。用单因素分析很难保证对比组间的齐同性。用单因素分析很难保证对比组间的齐同性。用单因素分析很难保证对比组间的齐同性。用单因素分析很难保证对比组间的齐同性。当评价指标为当评价指标为当评价指标为当评价指标为二值二值二值二值变量时变量时变量时变量时(如有效和无效如有效和无效如有效和无效如有效和无效),可以利用,可以利用,可以利用,可以利用logisticlogistic回归分析得到调整后的药物评价结果。回归分析得到调整后的药物评价结果。回归分析得到调整后的药物评价结果。回归分析得到调整后的药物评价结果。临床试验数据分

48、析临床试验数据分析logistic回归的应用回归的应用Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦在在在在一一一一些些些些药药药药物物物物或或或或毒毒毒毒物物物物效效效效价价价价的的的的剂剂剂剂量量量量-反反反反应应应应实实实实验验验验研研研研究究究究中中中中,每每每每一一一一只只只只动动动动物物物物药药药药物物物物耐耐耐耐受受受受量量量量可可可可能能能能有有有有很很很很大大大大的的的的不不不不同同同同,不不不不同同同同剂剂剂剂量量量量使使使使动动动动物物物物发发发发生生生生“阳阳阳阳性性性性反反反反应应应应”的的的的概概概概率率率

49、率分分分分布布布布常常常常呈呈呈呈正正正正偏偏偏偏态态态态,将将将将剂剂剂剂量量量量取取取取对对对对数数数数后后后后则则则则概概概概率率率率分分分分布布布布接接接接近近近近正正正正态态态态分分分分布布布布。由由由由于于于于正正正正态态态态分分分分布布布布函函函函数数数数与与与与logisticlogisticlogisticlogistic分分分分布布布布函函函函数数数数十十十十分分分分接接接接近近近近,如如如如果果果果用用用用P P P P表表表表示示示示在在在在剂剂剂剂量量量量为为为为X X X X时时时时的的的的阳阳阳阳性性性性率率率率,可可可可用用用用下下下下述述述述模模模模型型型型表

50、示它们之间的关系表示它们之间的关系表示它们之间的关系表示它们之间的关系用这一模型可以用这一模型可以用这一模型可以用这一模型可以求出任一剂量的求出任一剂量的求出任一剂量的求出任一剂量的阳性反应率阳性反应率阳性反应率阳性反应率传传传传统统统统的的的的一一一一些些些些方方方方法法法法往往往往往往往往对对对对实实实实验验验验设设设设计计计计有有有有严严严严格格格格的的的的要要要要求求求求,如如如如剂剂剂剂量量量量按按按按等等等等比比比比级级级级数数数数排排排排列列列列,各各各各剂剂剂剂量量量量组组组组的的的的例例例例数数数数必必必必须须须须相相相相同同同同等等等等,采采采采用用用用logisticlo

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁