《第九章偏倚及其控制deng.ppt》由会员分享,可在线阅读,更多相关《第九章偏倚及其控制deng.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、流行病学流行病学 配套光盘人人民民卫卫生生出出版版社社主主 编编 /叶冬青叶冬青指指 导导 /李立明李立明现在学习的是第1页,共58页中学生近中学生近视:视:40%中学生近中学生近视?视?PP=40%?描述性研究描述性研究Population Sample 现在学习的是第2页,共58页分析性研究分析性研究 假设:完全母乳喂养3个月以上的婴儿1岁内感染性疾病的发病比人工喂养婴儿少。设计类型:Case control study Cohort study 结果:OR1?RR1?现在学习的是第3页,共58页第一节第一节 研究结果的变异性研究结果的变异性 概概 述述 个体水平的变异性个体水平的变异性
2、群体水平的变异性群体水平的变异性 样本水平的变异性样本水平的变异性 现在学习的是第4页,共58页变异性变异性(variability)研究结果包括描述性和分析性数据(指标)的变动或波动。第一节第一节 研究结果的变异性研究结果的变异性一一、概、概 述述现在学习的是第5页,共58页 生物学(真实)变异和测量变异生物学(真实)变异和测量变异生物学变异生物学变异 真实的客观变异真实的客观变异测量变异测量变异 测量过程的误差测量过程的误差 随机变异和系统变异随机变异和系统变异随机变异随机变异 绝对值和方向交错变化,正态分布绝对值和方向交错变化,正态分布系统变异系统变异 绝对值和方向保持恒定绝对值和方向保
3、持恒定 变异的来源分为两个层次变异的来源分为两个层次第一节第一节 研究结果的变异性研究结果的变异性现在学习的是第6页,共58页某个体特征测得值的变化,是个体真值随时间的改变,某个体特征测得值的变化,是个体真值随时间的改变,或是由于测量误差引起的变化。或是由于测量误差引起的变化。二、个体水平的变异性二、个体水平的变异性第一节第一节 研究结果的变异性研究结果的变异性现在学习的是第7页,共58页 个体的累计变异个体的累计变异 群体中的个体具有不同的遗传素质并受环境影响群体中的个体具有不同的遗传素质并受环境影响 常大于个体变异常大于个体变异 根据群体的变异范围确定根据群体的变异范围确定“正常值正常值”
4、范围,用于判定个体测得值是范围,用于判定个体测得值是否否“正常正常”群体水平的变异性受测量误差影响群体水平的变异性受测量误差影响三、群体水平的变异性三、群体水平的变异性第一节第一节 研究结果的变异性研究结果的变异性现在学习的是第8页,共58页描述性结果的样本变异性第一节第一节 研究结果的变异性研究结果的变异性四、样本水平的变异性四、样本水平的变异性现在学习的是第9页,共58页分析性结果的样本变异性膳食改良组膳食改良组膳食改良组膳食改良组降低胆固醇药物组降低胆固醇药物组降低胆固醇药物组降低胆固醇药物组 研究A(研究对象200人,随机分配到两组)第一节第一节 研究结果的变异性研究结果的变异性现在学
5、习的是第10页,共58页第二节第二节 研究的真实性研究的真实性 概概 述述 内部真实性内部真实性 外部真实性外部真实性 现在学习的是第11页,共58页 真实性(效度,validity):指研究收集的数据、分析结果和所得结论与客观实际的符合程度。研究误差(error):真实性的反面。包括随机误差和系统误差。一、概一、概 述述第二节第二节 研究的真实性研究的真实性现在学习的是第12页,共58页随机抽样误差系统误差第二节第二节 研究的真实性研究的真实性现在学习的是第13页,共58页 系统误差(偏倚):来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差。随机误差:用统计学方法来估
6、计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。第二节第二节 研究的真实性研究的真实性现在学习的是第14页,共58页二、内部真实性二、内部真实性 内部真实性(内部真实性(internal validity)定义定义研究结果与实际研究对象真实情况的符合研究结果与实际研究对象真实情况的符合程度程度,它回答一个研究本身是否真实或有效。它回答一个研究本身是否真实或有效。改善措施改善措施 限制研究对象的类型和研究的环境条件。限制研究对象的类型和研究的环境条件。第二节第二节 研究的真实性研究的真实性现在学习的是第15页,共58页 三、外部真实性三、外部真实性 外部真实性(外部真实性(ext
7、ernal validity)定义定义研究结果与推论对象真实情况的符合程度,研究结果与推论对象真实情况的符合程度,又称为普遍性(又称为普遍性(generalizability)。)。它回答一个研究能否它回答一个研究能否推广应用到研究对象以外的人群。推广应用到研究对象以外的人群。改善措施改善措施 增加研究对象的异质性,使得研究对象的代表性范围扩大。增加研究对象的异质性,使得研究对象的代表性范围扩大。现在学习的是第16页,共58页第三节第三节 研究的偏倚研究的偏倚 选择偏倚选择偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚 混杂偏倚的分层分析混杂偏倚的分层分析现在学习的是第17页,共58页 Bias:s
8、ystematic,non-random deviation of results and inference from the truth or process leading to such deviation,any trend in the collection,analysis,interpretation,publication or review of data,that can be lead to conclusion which are systematically difference from the truth.Dictionary of Epidemiology,3
9、rd ed.第三节第三节 研究的偏倚研究的偏倚现在学习的是第18页,共58页 在流行病学研究中由于系统误差的存在,使样本在流行病学研究中由于系统误差的存在,使样本人群的测量指标系统的偏离目标人群的真实值,人群的测量指标系统的偏离目标人群的真实值,从而影响研究结果和推论的现象。从而影响研究结果和推论的现象。偏倚可发生于研究的任何阶段。偏倚可发生于研究的任何阶段。现在学习的是第19页,共58页 1946年,Berkson最著名的偏倚研究并给予证实,又称为Berkson偏倚。1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类:选择偏倚选择偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏
10、倚第三节第三节 研究的偏倚研究的偏倚现在学习的是第20页,共58页一、选择偏倚一、选择偏倚(selection bias)定义 研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。第三节第三节 研究的偏倚研究的偏倚现在学习的是第21页,共58页中学生近视中学生近视:40%重点高中学生重点高中学生近视?近视?pP=40%?现在学习的是第22页,共58页 某计划生育门诊随诊的IUD使用者中,生殖道感染现象严重,为此,该门诊收集了半年的病例进行了分析,发现STI 感染率达到50%
11、,所以,该门诊医生得出结论:IUD使用者中使用者中STI感染率为感染率为50%。现在学习的是第23页,共58页IUD使用者使用者有症状有症状无症状无症状就医就医STI感染感染:50%SO:IUD使用者中使用者中STI感染率为感染率为:50%?现在学习的是第24页,共58页呼吸道疾病一般人群骨和运动疾病住院病人骨和运动疾病+合计+合计 +1720722451520 1842376256018219237合计2012583278423234257OR1.064.06一般人群和住院人群中骨、运动疾病和呼吸道疾病的关系一般人群和住院人群中骨、运动疾病和呼吸道疾病的关系现在学习的是第25页,共58页 描
12、述性研究的选择偏倚 主要体现主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法控制方法 尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等 第三节第三节 研究的偏倚研究的偏倚现在学习的是第26页,共58页 分析性研究的选择偏倚 主要体现主要体现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。控制方法控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关第三节第三节 研究
13、的偏倚研究的偏倚现在学习的是第27页,共58页常见选择偏倚 入院偏倚 失访偏倚 志愿者偏倚第三节第三节 研究的偏倚研究的偏倚现在学习的是第28页,共58页 确定有无选择偏倚的关键 把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度 控制方法 严密掌握对象选取的各个环节,注意选取对象的代表性,增加应答和减少失访等第三节第三节 研究的偏倚研究的偏倚现在学习的是第29页,共58页二、信息偏倚(二、信息偏倚(information bias)定 义 又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息
14、偏倚又可称为错误分类偏倚(misclassification bias)。信息偏倚同样影响描述性研究和分析性研究的结果。第三节第三节 研究的偏倚研究的偏倚现在学习的是第30页,共58页无差异性错误分类和差异性错误分类表8-3无差异性错误分类无差异性错误分类差异性错误分类差异性错误分类错误分类数据错误分类数据错误分类数据错误分类数据研究真实数据研究真实数据研究真实数据研究真实数据第三节第三节 研究的偏倚研究的偏倚现在学习的是第31页,共58页差异性信息偏倚的两种常见类型 回忆偏倚(recall bias)产生于研究对象记忆过去活动和暴露能力的差异。调查者偏倚(interviewer bias)产
15、生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。第三节第三节 研究的偏倚研究的偏倚现在学习的是第32页,共58页 为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biological markers)。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。第三节第三节 研究的偏倚研究的偏倚现在学习的是第33页,共58页三、混杂偏倚(三、混杂偏倚(confounding bias)定义:定义:在流行病学研究中,由于一个或多个与暴露和研究疾病均有在流行病学研究中,由于一个或多个与暴露和研究疾病均有关的第三因子的影响,掩盖或夸大
16、了研究因素和疾病之间的真关的第三因子的影响,掩盖或夸大了研究因素和疾病之间的真实联系。称为混杂偏倚。实联系。称为混杂偏倚。第三节第三节 研究的偏倚研究的偏倚现在学习的是第34页,共58页 混杂的特征:混杂的特征:混杂因素是所研究疾病的一个独立危险因素混杂因素是所研究疾病的一个独立危险因素混杂因素与所研究的暴露因素存在统计学联系混杂因素与所研究的暴露因素存在统计学联系混杂因素不是所研究暴露因素和疾病之间因果链混杂因素不是所研究暴露因素和疾病之间因果链的中间环节。的中间环节。现在学习的是第35页,共58页 混杂的判断:混杂的判断:未分层的未分层的OROR不等于分层调整后不等于分层调整后OROR在非
17、暴露组可疑混杂因子与疾病相关在非暴露组可疑混杂因子与疾病相关aRR 负混杂 cRRaRR现在学习的是第38页,共58页中年人少量饮酒与心肌梗塞危险性中年人少量饮酒与心肌梗塞危险性 混杂因素示例混杂因素示例 少量饮酒不饮酒心肌梗塞发病(例)140100随访人年(人年)30,00030,000发病率(1/千)4.673.33 RR=1.40 现在学习的是第39页,共58页不同性别中年人少量饮酒与心肌梗塞危险性不同性别中年人少量饮酒与心肌梗塞危险性 混杂因素示例混杂因素示例 男性 女性 少量饮酒不饮酒 少量饮酒不饮酒心肌梗塞发病(例)12060 2040随访人年(人年)20,00010,000 10
18、,00020,000发病率(1/千)6.006.00 2.002.00 RR=1.0 RR=1.0现在学习的是第40页,共58页现在学习的是第41页,共58页口服避孕药口服避孕药心肌梗死心肌梗死对照对照合计合计2913516420516071812合计合计23417421796 cOR=1.68口服避孕药与心肌梗死的关系口服避孕药与心肌梗死的关系现在学习的是第42页,共58页心肌梗死组和对照组年龄分布心肌梗死组和对照组年龄分布年龄(岁)年龄(岁)心肌梗死例数心肌梗死例数构成比()构成比()对照组人数对照组人数 构成比()构成比()2562.628616.430 219.042324.335 3
19、715.835620.440 7130.337121.345 499942.330617.6合计234100.01742100.0现在学习的是第43页,共58页年龄组年龄组病例组口服避病例组口服避孕药暴露率孕药暴露率对照组口服避对照组口服避孕药暴露率孕药暴露率ORi2566.721.77.23042.97.88.93510.87.31.5408.52.43.745496.13063.9合计12.47.7cOR=1.68OR=3.97心肌梗死组和对照组口服避孕药年龄别暴露率()心肌梗死组和对照组口服避孕药年龄别暴露率()现在学习的是第44页,共58页C?DE高血清胆高血清胆固醇固醇冠心病冠心病黄
20、色瘤黄色瘤?吸烟吸烟咖啡咖啡胰腺癌胰腺癌 继发关联继发关联(secondary association)第三节第三节 研究的偏倚研究的偏倚现在学习的是第45页,共58页第三节第三节 研究的偏倚研究的偏倚现在学习的是第46页,共58页 混杂的控制混杂的控制:设计阶段:限制(restriction),匹配(matching)随机化(randomization)分析阶段:标准化率、分层分层和多变量分析现在学习的是第47页,共58页限制限制(restriction)是在选择研究对象时,限制在具有一定特征的对象中进行观察,以排除其他因素的干扰。可提高可比性。这种方法所获得的结论常有很大局限性,影响研究对
21、象的代表性,使研究结果外推至一般人群时受限。现在学习的是第48页,共58页匹配匹配(matching)匹配是指在为研究对象设立对照时,使研究组对象和其对照在一个或多个潜在混杂因素上相同或相近,从而消除混杂因素对研究结果的影响。现在学习的是第49页,共58页 匹配的目的是为了控制混杂、提高研究的统计学提高研究的统计学效率。效率。病例对照研究、队列研究和实验研究均可采用匹配。尤其是队列研究,使用匹配可达到直接控制混杂的效果,但病例对照研究中仍需进行分层分析来较好地控制混杂。现在学习的是第50页,共58页随机化随机化(randomization)随机化是指以随机化原则将研究对象以同等的机率被分配在各
22、处理组中,从而使潜在的混杂因素在各组间分布均衡。随机化多用于实验研究,尤其是临床试验。现在学习的是第51页,共58页标准化标准化(standardization)当比较两个率时,如果两组对象内部构成存在的差别足以影响结论,可用率的标准化加以校正,亦即使可能影响结果的因素受到同等的加权,使这两个率可比、无偏倚,这种方法称为标准化。现在学习的是第52页,共58页分层分层(stratification)分层是指将研究所获资料按可疑的混杂因素分成数层(亚组)进行分析。Mantel-Haenszel分层分析是最常用的检出和控制偏倚的方法之一。但如果欲控制的混杂因素较多,则分层分析对样本量的要求较大,此时
23、,可以应用多因素分析方法如Logistic回归分析等来估计和控制混杂。现在学习的是第53页,共58页四、混杂偏倚的分层分析四、混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤按可疑的混杂因素进行分层按可疑的混杂因素进行分层层间一致性检验;判定层间层间一致性检验;判定层间RR或或OR是否相等或相近是否相等或相近合并计算调整的合并计算调整的(控制混杂后控制混杂后)RR或或OR1.将调整将调整RR或或OR与分层前的粗与分层前的粗RR或粗或粗OR(cRR或或cOR)进)进行比较行比较第三节第三节 研究的偏倚研究的偏倚现在学习的是第54页,共58页 队列研究(1)累计发病率
24、资料2221010/1iiiiiMHiiiiiia dbcTN N M MTT01/iiiMHiiia NTRRc NT第三节第三节 研究的偏倚研究的偏倚现在学习的是第55页,共58页(2)发病密度资料01/iiiM Hiiia NTR Rc NT2112110/iiiiMHiiiiaN MTMN NT 第三节第三节 研究的偏倚研究的偏倚现在学习的是第56页,共58页 病例对照研究/iiiM Hiiia dtO Rb ct2221010/1iiiiiM Hiiiiiia db ctm mn ntt第三节第三节 研究的偏倚研究的偏倚现在学习的是第57页,共58页 (1)按可能的混杂因素吸烟分层ai bi m1i ci di m0ini n0 ti 第三节第三节 研究的偏倚研究的偏倚OR1=1.56OR2=1.59cOR=3.69现在学习的是第58页,共58页