《第九章偏倚及其控制deng课件.ppt》由会员分享,可在线阅读,更多相关《第九章偏倚及其控制deng课件.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、流行病学流行病学 配套光盘人人民民卫卫生生出出版版社社主主 编编 /叶冬青叶冬青指指 导导 /李立明李立明第1页,此课件共58页哦中学生近中学生近视:视:40%中学生近中学生近视?视?PP=40%?描述性研究描述性研究Population Sample 第2页,此课件共58页哦分析性研究分析性研究假设:完全母乳喂养3个月以上的婴儿1岁内感染性疾病的发病比人工喂养婴儿少。设计类型:Case control studyCohort study结果:OR1?RR1?第3页,此课件共58页哦第一节第一节 研究结果的变异性研究结果的变异性 概概述述 个体水平的变异性个体水平的变异性 群体水平的变异性群体
2、水平的变异性 样本水平的变异性样本水平的变异性 第4页,此课件共58页哦变异性变异性(variability)研究结果包括描述性和分析性数据(指标)的变动或波动。第一节第一节 研究结果的变异性研究结果的变异性一一、概、概 述述第5页,此课件共58页哦生物学(真实)变异和测量变异生物学(真实)变异和测量变异生物学变异生物学变异 真实的客观变异真实的客观变异测量变异测量变异 测量过程的误差测量过程的误差随机变异和系统变异随机变异和系统变异随机变异随机变异 绝对值和方向交错变化,正态分布绝对值和方向交错变化,正态分布系统变异系统变异 绝对值和方向保持恒定绝对值和方向保持恒定 变异的来源分为两个层次变
3、异的来源分为两个层次第一节第一节 研究结果的变异性研究结果的变异性第6页,此课件共58页哦某个体特征测得值的变化,是个体真值随时间的改变,某个体特征测得值的变化,是个体真值随时间的改变,或是由于测量误差引起的变化。或是由于测量误差引起的变化。二、个体水平的变异性二、个体水平的变异性第一节第一节 研究结果的变异性研究结果的变异性第7页,此课件共58页哦个体的累计变异个体的累计变异群体中的个体具有不同的遗传素质并受环境影响群体中的个体具有不同的遗传素质并受环境影响常大于个体变异常大于个体变异根据群体的变异范围确定根据群体的变异范围确定“正常值正常值”范围,用于判定个体范围,用于判定个体测得值是否测
4、得值是否“正常正常”群体水平的变异性受测量误差影响群体水平的变异性受测量误差影响三、群体水平的变异性三、群体水平的变异性第一节第一节 研究结果的变异性研究结果的变异性第8页,此课件共58页哦描述性结果的样本变异性第一节第一节 研究结果的变异性研究结果的变异性四、样本水平的变异性四、样本水平的变异性第9页,此课件共58页哦分析性结果的样本变异性膳食改良组膳食改良组膳食改良组膳食改良组降低胆固醇药物组降低胆固醇药物组降低胆固醇药物组降低胆固醇药物组 研究A(研究对象200人,随机分配到两组)第一节第一节 研究结果的变异性研究结果的变异性第10页,此课件共58页哦第二节第二节 研究的真实性研究的真实
5、性 概概述述 内部真实性内部真实性 外部真实性外部真实性 第11页,此课件共58页哦真实性(效度,validity):指研究收集的数据、分析结果和所得结论与客观实际的符合程度。研究误差(error):真实性的反面。包括随机误差和系统误差。一、概一、概 述述第二节第二节 研究的真实性研究的真实性第12页,此课件共58页哦真实值真实值真实值真实值随机抽样误差BIASBIAS系统误差第二节第二节 研究的真实性研究的真实性第13页,此课件共58页哦 系统误差(偏倚):来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差。随机误差:用统计学方法来估计,增大样本含量可减少,没有固定方向
6、和固定大小,一般呈正态分布。第二节第二节 研究的真实性研究的真实性第14页,此课件共58页哦二、内部真实性二、内部真实性 内部真实性(内部真实性(internal validity)定定义义研研究究结结果果与与实实际际研研究究对对象象真真实实情情况况的的符符合合程度程度,它回答一个研究本身是否真实或有效。它回答一个研究本身是否真实或有效。改善措施改善措施 限制研究对象的类型和研究的环境条件。限制研究对象的类型和研究的环境条件。第二节第二节 研究的真实性研究的真实性第15页,此课件共58页哦 三、外部真实性三、外部真实性 外部真实性(外部真实性(external validity)定定义义研研究
7、究结结果果与与推推论论对对象象真真实实情情况况的的符符合合程程度度,又又称称为为普普遍遍性性(generalizability)。它它回回答答一一个个研研究究能否推广应用到研究对象以外的人群。能否推广应用到研究对象以外的人群。改善措施改善措施 增增加加研研究究对对象象的的异异质质性性,使使得得研研究究对对象象的的代代表表性性范范围围扩大。扩大。第16页,此课件共58页哦第三节第三节 研究的偏倚研究的偏倚 选择偏倚选择偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚 混杂偏倚的分层分析混杂偏倚的分层分析第17页,此课件共58页哦Bias:systematic,non-random deviation o
8、f results and inference from the truth or process leading to such deviation,any trend in the collection,analysis,interpretation,publication or review of data,that can be lead to conclusion which are systematically difference from the truth.Dictionary of Epidemiology,3rd ed.第三节第三节 研究的偏倚研究的偏倚第18页,此课件共
9、58页哦在流行病学研究中由于系统误差的存在,使样在流行病学研究中由于系统误差的存在,使样本人群的测量指标系统的偏离目标人群的真实本人群的测量指标系统的偏离目标人群的真实值,从而影响研究结果和推论的现象。值,从而影响研究结果和推论的现象。偏倚可发生于研究的任何阶段。偏倚可发生于研究的任何阶段。第19页,此课件共58页哦 1946年,Berkson最著名的偏倚研究并给予证实,又称为Berkson偏倚。1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类:选择偏倚选择偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚第三节第三节 研究的偏倚研究的偏倚第20页,此课件共58页哦一、选择偏倚
10、一、选择偏倚(selection bias)定义研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。第三节第三节 研究的偏倚研究的偏倚第21页,此课件共58页哦中学生近中学生近视:视:40%重点高中学重点高中学生近视?生近视?pP=40%?第22页,此课件共58页哦某计划生育门诊随诊的IUD使用者中,生殖道感染现象严重,为此,该门诊收集了半年的病例进行了分析,发现STI 感染率达到50%,所以,该门诊医生得出结论:IUD使使用者中用者中STI感染率为感染率为50%。第23页
11、,此课件共58页哦IUD使用者使用者有症状有症状无症状无症状就医就医STI感染感染:50%SO:IUD使用者中使用者中STI感染率为感染率为:50%?第24页,此课件共58页哦呼吸道疾病一般人群骨和运动疾病住院病人骨和运动疾病+合计+合计 +1720722451520 1842376256018219237合计2012583278423234257OR1.064.06一般人群和住院人群中骨、运动疾病和呼吸道疾病的关系一般人群和住院人群中骨、运动疾病和呼吸道疾病的关系第25页,此课件共58页哦 描述性研究的选择偏倚主要体现主要体现在样本对总体的代表性上如不是采用随机抽样而是使用方便样本,或某些特
12、定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法控制方法 尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等 第三节第三节 研究的偏倚研究的偏倚第26页,此课件共58页哦 分析性研究的选择偏倚主主要要体体现现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。控制方法控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关第三节第三节 研究的偏倚研究的偏倚第27页,此课件共58页哦常见选择偏倚入院偏倚失访偏倚志愿者偏倚第三节第三节 研究的偏倚研究的
13、偏倚第28页,此课件共58页哦 确定有无选择偏倚的关键 把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度控制方法严密掌握对象选取的各个环节,注意选取对象的代表性,增加应答和减少失访等第三节第三节 研究的偏倚研究的偏倚第29页,此课件共58页哦二、信息偏倚(二、信息偏倚(information bias)定义又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类偏倚(misclassification bias)。信息偏倚同样影响描述性研究和分析性研究的结果。第三节第三节 研
14、究的偏倚研究的偏倚第30页,此课件共58页哦无差异性错误分类和差异性错误分类表8-3无差异性错误分类无差异性错误分类差异性错误分类差异性错误分类错误分类数据错误分类数据错误分类数据错误分类数据研究真实数据研究真实数据研究真实数据研究真实数据第三节第三节 研究的偏倚研究的偏倚第31页,此课件共58页哦差异性信息偏倚的两种常见类型回忆偏倚(recall bias)产生于研究对象记忆过去活动和暴露能力的差异。调查者偏倚(interviewer bias)产生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。第三节第三节 研究的偏倚研究的偏倚第32页,此课件共58页哦 为了减少错误分
15、类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biological markers)。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。第三节第三节 研究的偏倚研究的偏倚第33页,此课件共58页哦三、混杂偏倚(三、混杂偏倚(confounding bias)定义:定义:在流行病学研究中,由于一个或多个与暴露和研究在流行病学研究中,由于一个或多个与暴露和研究疾病均有关的第三因子的影响,掩盖或夸大了研究因疾病均有关的第三因子的影响,掩盖或夸大了研究因素和疾病之间的真实联系。称为混杂偏倚。素和疾病之间的真实联系。称为混杂偏倚。第三节第三节 研究的偏倚研究的偏
16、倚第34页,此课件共58页哦混杂的特征:混杂的特征:混杂因素是所研究疾病的一个独立危险因素混杂因素是所研究疾病的一个独立危险因素混杂因素与所研究的暴露因素存在统计学联系混杂因素与所研究的暴露因素存在统计学联系混杂因素不是所研究暴露因素和疾病之间因果链混杂因素不是所研究暴露因素和疾病之间因果链的中间环节。的中间环节。第35页,此课件共58页哦混杂的判断:混杂的判断:未分层的未分层的OROR不等于分层调整后不等于分层调整后OROR在非暴露组可疑混杂因子与疾病相关在非暴露组可疑混杂因子与疾病相关aRR负混杂 cRRaRR第38页,此课件共58页哦中年人少量饮酒与心肌梗塞危险性中年人少量饮酒与心肌梗塞
17、危险性 混杂因素示例混杂因素示例 少量饮酒不饮酒心肌梗塞发病(例)140100随访人年(人年)30,00030,000发病率(1/千)4.673.33RR=1.40第39页,此课件共58页哦不同性别中年人少量饮酒与心肌梗塞危险性不同性别中年人少量饮酒与心肌梗塞危险性 混杂因素示例混杂因素示例 男性女性少量饮酒不饮酒少量饮酒不饮酒心肌梗塞发病(例)120602040随访人年(人年)20,00010,00010,00020,000发病率(1/千)6.006.002.002.00RR=1.0RR=1.0第40页,此课件共58页哦第41页,此课件共58页哦口服避孕药口服避孕药心肌梗死心肌梗死对照对照合
18、计合计2913516420516071812合计合计23417421796 cOR=1.68口服避孕药与心肌梗死的关系口服避孕药与心肌梗死的关系第42页,此课件共58页哦心肌梗死组和对照组年龄分布心肌梗死组和对照组年龄分布年龄(岁)年龄(岁)心肌梗死例数心肌梗死例数构成比()构成比()对照组人数对照组人数 构成比()构成比()2562.628616.430 219.042324.335 3715.835620.440 7130.337121.345 499942.330617.6合计234100.01742100.0第43页,此课件共58页哦年龄组年龄组病例组口服避病例组口服避孕药暴露率孕药暴
19、露率对照组口服避对照组口服避孕药暴露率孕药暴露率ORi2566.721.77.23042.97.88.93510.87.31.5408.52.43.745496.13063.9合计12.47.7cOR=1.68OR=3.97心肌梗死组和对照组口服避孕药年龄别暴露率()心肌梗死组和对照组口服避孕药年龄别暴露率()第44页,此课件共58页哦C?DE高血清胆高血清胆固醇固醇冠心病冠心病黄色瘤黄色瘤?吸烟吸烟咖啡咖啡胰腺癌胰腺癌 继发关联继发关联(secondary association)第三节第三节 研究的偏倚研究的偏倚第45页,此课件共58页哦第三节第三节 研究的偏倚研究的偏倚第46页,此课件共
20、58页哦混杂的控制混杂的控制:设计阶段:限制(restriction),匹配(matching)随机化(randomization)分析阶段:标准化率、分层分层和多变量分析第47页,此课件共58页哦限制限制(restriction)是在选择研究对象时,限制在具有一定特征的对象中进行观察,以排除其他因素的干扰。可提高可比性。这种方法所获得的结论常有很大局限性,影响研究对象的代表性,使研究结果外推至一般人群时受限。第48页,此课件共58页哦匹配匹配(matching)匹配是指在为研究对象设立对照时,使研究组对象和其对照在一个或多个潜在混杂因素上相同或相近,从而消除混杂因素对研究结果的影响。第49页
21、,此课件共58页哦匹配的目的是为了控制混杂、提高研究的统计提高研究的统计学效率。学效率。病例对照研究、队列研究和实验研究均可采用匹配。尤其是队列研究,使用匹配可达到直接控制混杂的效果,但病例对照研究中仍需进行分层分析来较好地控制混杂。第50页,此课件共58页哦随机化随机化(randomization)随机化是指以随机化原则将研究对象以同等的机率被分配在各处理组中,从而使潜在的混杂因素在各组间分布均衡。随机化多用于实验研究,尤其是临床试验。第51页,此课件共58页哦标准化标准化(standardization)当比较两个率时,如果两组对象内部构成存在的差别足以影响结论,可用率的标准化加以校正,亦
22、即使可能影响结果的因素受到同等的加权,使这两个率可比、无偏倚,这种方法称为标准化。第52页,此课件共58页哦分层分层(stratification)分层是指将研究所获资料按可疑的混杂因素分成数层(亚组)进行分析。Mantel-Haenszel分层分析是最常用的检出和控制偏倚的方法之一。但如果欲控制的混杂因素较多,则分层分析对样本量的要求较大,此时,可以应用多因素分析方法如Logistic回归分析等来估计和控制混杂。第53页,此课件共58页哦四、混杂偏倚的分层分析四、混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤1.按可疑的混杂因素进行分层按可疑的混杂因素进行分层
23、2.层间一致性检验;判定层间层间一致性检验;判定层间RR或或OR是否相等或相近是否相等或相近3.合并计算调整的合并计算调整的(控制混杂后控制混杂后)RR或或OR4.将将调调整整RR或或OR与与分分层层前前的的粗粗RR或或粗粗OR(cRR或或cOR)进进行行比较比较第三节第三节 研究的偏倚研究的偏倚第54页,此课件共58页哦 队列研究(1)累计发病率资料第三节第三节 研究的偏倚研究的偏倚第55页,此课件共58页哦(2)发病密度资料第三节第三节 研究的偏倚研究的偏倚第56页,此课件共58页哦 病例对照研究第三节第三节 研究的偏倚研究的偏倚第57页,此课件共58页哦 (1)按可能的混杂因素吸烟分层aibim1icidim0inin0ti 第三节第三节 研究的偏倚研究的偏倚OR1=1.56OR2=1.59cOR=3.69第58页,此课件共58页哦