《流行病学07流行病学中的偏倚.ppt》由会员分享,可在线阅读,更多相关《流行病学07流行病学中的偏倚.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1/1/20231蚌埠医学院流行病学研究中的偏倚流行病学研究中的偏倚1/1/20232蚌埠医学院引 言研究的解说涉及到研究的真实性与因果推断研究的解说涉及到研究的真实性与因果推断的问题。研究的真实性直接关系到是否获得的问题。研究的真实性直接关系到是否获得正确的结论,而真实性需要通过变异性估计正确的结论,而真实性需要通过变异性估计来确定来确定对于因果关系的研究,从研究结果如何做出对于因果关系的研究,从研究结果如何做出正确的因果推断,也是非常重要的正确的因果推断,也是非常重要的但在研究过程中,由于各种因素的影响,使但在研究过程中,由于各种因素的影响,使研究结果与真实情况往往存在差异,有时甚研究结果
2、与真实情况往往存在差异,有时甚至回作出错误的结论。原因:随机误差、系至回作出错误的结论。原因:随机误差、系统误差(偏倚统误差(偏倚biasbias)1/1/20233蚌埠医学院流行病学研究中的误差流行病学研究中的误差误差误差(error)error)定义 指对事物某一特征的度量值偏指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值离真实值的部分,即测定值与真实值之差之差分类 随机误差随机误差(random error)系统误差(系统误差(systematic error偏倚偏倚bias)1/1/20234蚌埠医学院举例:用动脉血压计测量某人血压(实际值为80mmHg),各次读数的均值为
3、100mmHg,系统误差和随机误差可用以下图示随机误差随机误差80100舒张压舒张压(mmHg)系统误差系统误差发发生生频频次次图图3 血压计法测量舒张压值的分布血压计法测量舒张压值的分布1/1/20235蚌埠医学院流行病学研究中的误差流行病学研究中的误差随机误差随机误差(random error)广义 因机遇不同估计总体参数时所产生的误差,如选择的机遇、时间的机遇狭义 随机抽样所得均值对总体均值的误差特点 没有固定方向和固定大小 一般呈正态分布1/1/20236蚌埠医学院180,174,215,305233,276,146,195205,188,190,295170,164,248,1622
4、20,219,228,250295,146,220,162,228219,164,190,188,233205,276,195,215,170源群体 样本A 样本B 样本C 高胆固醇率=40%=20%=0%高胆固醇率=25%(240mg/dL)图1 源群体与样本高胆固醇率的样本误差示例1/1/20237蚌埠医学院流行病学研究中的误差流行病学研究中的误差系统误差(偏倚系统误差(偏倚bias)定义 属于系统误差,在研究或推论过程中所获得的结果系统地偏离其真实值特点 具有单方向性 可高于真值,也可低于真值(按规律变化)分类 选择偏倚、信息偏倚、混杂偏倚1/1/20238蚌埠医学院流行病学研究中的误差
5、流行病学研究中的误差随机误差和系统误差的区别随机误差和系统误差的区别种类种类来源来源主要控制方法主要控制方法随机误差测量方法和测量对象的变异(统计方法问题)增加测量次数和样本量,对测量结果进行统计处理等系统误差仪器、理论和个人误差改变测量工具或测量方法,对测量结果考虑修正值等1/1/20239蚌埠医学院偏偏 倚(倚(bias)bias)偏偏倚倚 定义定义 属于系统误差,在研究或推论过程中所属于系统误差,在研究或推论过程中所获得的结果系统地偏离其真实值获得的结果系统地偏离其真实值特点特点 具有单方向性具有单方向性 可高于真值,也可低于真值可高于真值,也可低于真值分类分类 选择偏倚、信息偏倚、混杂
6、偏倚选择偏倚、信息偏倚、混杂偏倚1/1/202310蚌埠医学院偏偏 倚(倚(bias)bias)一一、选选择择偏偏倚倚 (selection bias)研研究究者者在在挑挑选选研研究究人人群群时时由由于于选选择择条条件件受受限限制制或或设设计计失失误误所所致致的的系系统误差统误差1/1/202311蚌埠医学院偏偏 倚(倚(bias)bias)常见种类常见种类 入院率偏倚入院率偏倚 现患现患-新发病例偏倚新发病例偏倚易感性偏倚易感性偏倚 无应答偏倚无应答偏倚 检出征候偏倚检出征候偏倚 时间效应偏倚时间效应偏倚排除偏倚排除偏倚 志愿者偏倚志愿者偏倚1/1/202312蚌埠医学院偏偏 倚(倚(bia
7、s)bias)入院率偏倚入院率偏倚(admission rate bias)利用医院就诊或住院病人作为利用医院就诊或住院病人作为研究对象时,由于入院率或就诊机研究对象时,由于入院率或就诊机会不同而导致的偏差会不同而导致的偏差 1/1/202313蚌埠医学院偏偏 倚(倚(bias)bias)特别是用住院病人进行研究时,很容易产特别是用住院病人进行研究时,很容易产生这种偏倚,主要是因为住院病人作为研究对生这种偏倚,主要是因为住院病人作为研究对象时可能没有包括:象时可能没有包括:(1 1)、抢救不及时而死亡的病例)、抢救不及时而死亡的病例(2 2)、距离医院远的病例)、距离医院远的病例(3 3)、无
8、钱住院的病例)、无钱住院的病例(4 4)、病情轻的病例)、病情轻的病例 此外不同医院的技术专长、专业水平也会此外不同医院的技术专长、专业水平也会造成不同疾病在不同的医院的就诊断或住院率造成不同疾病在不同的医院的就诊断或住院率的差别。的差别。1/1/202314蚌埠医学院偏偏 倚(倚(bias)bias)例如:在一般人群和住院病人中研究骨和运动器官疾病与呼吸道疾病之间的关系。一般人群 住院病人 +合计 +合计 +17 207 224 5 15 20 184 2376 2560 18 219 237合计 201 2583 2784 23 234 257 OR 1.06 4.06呼吸道呼吸道疾病疾病
9、1/1/202315蚌埠医学院 高血高血压 肝癌肝癌 糖尿病糖尿病 合合计 +200 200 400 800 800 1600 合计 1000 1000 2000 OR=ad/bc=200800/200 800=1 说明肝癌的发生与高血压无关例:以糖尿病为对照研究肝癌与高血压的关系,假例:以糖尿病为对照研究肝癌与高血压的关系,假如人群中糖尿病和肝癌患者各如人群中糖尿病和肝癌患者各10001000人,两种病人暴人,两种病人暴露于高血压者各露于高血压者各200200人,暴露率为人,暴露率为20%20%,计算结果如,计算结果如下:下:1/1/202316蚌埠医学院假定肝癌、糖尿病、高血假定肝癌、糖尿
10、病、高血压患者的住院率分患者的住院率分别为20%,50%和和40%,计算算结果如下:果如下:高血压高血压 肝癌肝癌 糖尿病糖尿病 合计合计 +104 140 244 160 400 560 合计 264 540 804 OR=ad/bc=104 400/160 140=1.86 说明两者有联系说明两者有联系1/1/202317蚌埠医学院偏偏 倚(倚(bias)bias)现患现患-新发病例偏倚(新发病例偏倚(prevalence-incidence bias)又又称称奈奈曼曼偏偏倚倚,凡凡因因现现患患病病例例与与新新病病例例的的构构成成不不同同,只只调调查查典典型型病病例例或或者者现现患患病病例
11、例的的暴暴露露情情况况,致致使使调调查查结结果果出出现现的的系系统统误误差差都都属属于于本类误差本类误差1/1/202318蚌埠医学院偏偏 倚(倚(bias)bias)例如:例如:FriedmanFriedman等人在美国弗明汉地区对心血等人在美国弗明汉地区对心血管系统疾病的研究中发现,男性居民在队列研管系统疾病的研究中发现,男性居民在队列研究和病例对照研究中究和病例对照研究中RRRR和和OROR分别为分别为2.42.4和和1.161.16,进一步分析发现,冠心病病人在确诊后,改变进一步分析发现,冠心病病人在确诊后,改变了原来的生活习惯或嗜好,从而使血中胆固醇了原来的生活习惯或嗜好,从而使血中
12、胆固醇水平降低或与正常人相比血中胆固醇水平增长水平降低或与正常人相比血中胆固醇水平增长速度较慢所致。速度较慢所致。1/1/202319蚌埠医学院血胆固醇与冠心病的关系 队列研究 病例对照研究 病例 对照 合计 病例 对照 合计 75 85 462 547 38 34 72 75 116 1511 1627 113 117 230合计 201 1973 2174 151 151 302 RR=2.40 OR=1.16 胆固醇胆固醇水平水平1/1/202320蚌埠医学院偏偏 倚(倚(bias)bias)易感性偏倚易感性偏倚(susceptibility bias)观观察察对对象象可可能能因因各各种
13、种主主客客观观原原因因不不同同,暴暴露露于于危危险险因因素素的的概概率率不不同同,使使得得各各比比较较组组对对所所研研究究疾疾病病的的易易感感性性有有差差异异,从从而而可可能能夸夸大大或或缩缩小小了了暴暴露露因因素素与与疾疾病病间间的的关关联联强强度度,导致两者间的虚假联系导致两者间的虚假联系无应答偏倚(无应答偏倚(non-respondent bias)调调查查研研究究中中那那些些因因各各种种原原因因不不回回答答或或不不能能回回答答所所提提出出问问题题的的人人、不不依依研研究究设设计计接接受受治疗者人称为无应答者治疗者人称为无应答者1/1/202321蚌埠医学院偏偏 倚(倚(bias)bia
14、s)检出征候偏倚检出征候偏倚 (detection signal bias)在疾病和暴露之外存在一个征候因素,在疾病和暴露之外存在一个征候因素,即一种临床症状或体征;这种症状或体征不即一种临床症状或体征;这种症状或体征不是疾病的危险因素,但人们因具有这种征候是疾病的危险因素,但人们因具有这种征候去就诊,从而提高了早期病例的检出率;致去就诊,从而提高了早期病例的检出率;致使过高地估计了暴露程度,因而发生了系统使过高地估计了暴露程度,因而发生了系统误差,最终可能得出该征候因素与该疾病有误差,最终可能得出该征候因素与该疾病有联系的错误结论联系的错误结论1/1/202322蚌埠医学院偏偏 倚(倚(bi
15、as)bias)时间效应偏倚时间效应偏倚(time effect bias)许多慢性病(如恶性肿瘤、冠心病)许多慢性病(如恶性肿瘤、冠心病)自接触有效暴露(内、外环境的危险因自接触有效暴露(内、外环境的危险因素)之日起至出现临床症状止,其间经素)之日起至出现临床症状止,其间经过一段漫长的潜隐过程;在此期间他们过一段漫长的潜隐过程;在此期间他们实际上是有暴露史但未出现症状,用现实际上是有暴露史但未出现症状,用现有检测手段未能发现有症状的病人;但有检测手段未能发现有症状的病人;但由于无明显的症状,因此常被错误地归由于无明显的症状,因此常被错误地归入健康对照组内入健康对照组内1/1/202323蚌埠
16、医学院偏偏 倚(倚(bias)bias)排除偏倚排除偏倚(exclusive bias)研究者在设计时除规定研究对象诊断标准、纳入标准外,还应规定哪些个体不能选作研究对象,即规定排除标准,这些标准在实施期间不得更改志愿者偏倚志愿者偏倚(volunteer bias)志愿参加观察的研究者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有差异,因志愿者常被入选为观察对象,而非志愿者常被落选,故这样的观察或研究结果肯定有选择偏倚1/1/202324蚌埠医学院偏偏 倚(倚(bias)bias)测量(测量(以病例对照研究为例)以病例对照研究为例)总体 选择概率 暴露 非暴露 暴露
17、非暴露病例非病例样样 本本xx1x2x3xx1x2x3病例非病例Y=x/xY1=x1/x1Y2=x2/x2Y3=x3/x31/1/202325蚌埠医学院偏偏 倚(倚(bias)bias)上图所示:总人群X.X3/X1.X2样本1 x.x 3/x 1.x 2根据选择概率1 选择偏倚选择偏倚 或=-1Y.Y3Y1.Y2OR1-ORORY.Y3Y1.Y21/1/202326蚌埠医学院偏偏 倚(倚(bias)bias)选择偏倚控制方法选择偏倚控制方法v了解整个研究中可能出现的选择偏倚了解整个研究中可能出现的选择偏倚v严格掌握研究对象纳入、排除标准严格掌握研究对象纳入、排除标准v取得研究对象合作,减少无
18、应答、失访取得研究对象合作,减少无应答、失访v尽量采用多种对照尽量采用多种对照v采用严格科学的研究设计采用严格科学的研究设计1/1/202327蚌埠医学院偏偏 倚(倚(bias)bias)二二、信信 息息 偏偏 倚倚(information information biasbias)在在收收集集和和整整理理有有关关暴暴露露或或疾疾病病资资料料时时所所出出现现的的系系统统误误差差,主主要要发发生生在在观察、收集资料及测量等实施阶段观察、收集资料及测量等实施阶段 这种偏倚既可来自于这种偏倚既可来自于研究对象、研究研究对象、研究者本身,也可来自于测量仪器、设备、方者本身,也可来自于测量仪器、设备、方
19、法等。法等。1/1/202328蚌埠医学院偏偏 倚(倚(bias)bias)常见种类常见种类暴露怀疑偏倚暴露怀疑偏倚 诊断怀疑偏倚诊断怀疑偏倚测量偏倚测量偏倚 报告偏倚报告偏倚回忆偏倚回忆偏倚 归类错误偏倚归类错误偏倚 诱导偏倚诱导偏倚1/1/202329蚌埠医学院偏偏 倚(倚(bias)bias)暴露怀疑偏倚暴露怀疑偏倚(exposure suspicion bias)研究者在收集并确定病例组的暴露比例研究者在收集并确定病例组的暴露比例时所具有的认真、细致、深入程度同对照组时所具有的认真、细致、深入程度同对照组相比有重大的系统差别相比有重大的系统差别 诊断怀疑偏倚诊断怀疑偏倚(diagnos
20、tic suspicion bias)常发生在前瞻性研究中,在病例对照研常发生在前瞻性研究中,在病例对照研究中也可发生,特别是诊断亚临床病例,判究中也可发生,特别是诊断亚临床病例,判断药物的毒副作用时,研究者主观偏见和研断药物的毒副作用时,研究者主观偏见和研究对象的主观因素究对象的主观因素1/1/202330蚌埠医学院偏偏 倚(倚(bias)bias)测量偏倚(测量偏倚(detection bias)实验过程中由于实验的仪器和试剂质量及操作人员的操作误差造成的偏倚称为测量偏倚,又叫检出偏倚 报告偏倚报告偏倚(reporting bias)研究对象的有意做假所造成,即有意的夸大或缩小某些信息而导
21、致的偏倚,亦被称作说谎偏倚1/1/202331蚌埠医学院偏偏 倚(倚(bias)bias)回忆偏倚(回忆偏倚(recalling bias)研究对象在回忆以往发生的事件或经历时,由于记忆失真或不完整在准确性和完整性上的差异所致的系统误差归类错误偏倚(归类错误偏倚(misclassification bias)每项病症所用的客观诊断试验或测定仪器都有一定的灵敏度和特异度,而不可能是100%,于是就会产生一定的假阳性和假阴性错误即误诊和漏诊这就发生了错分,即本应是病人,错将他分入了对照组,而本应是健康者,错将其分入了病例组1/1/202332蚌埠医学院偏偏 倚(倚(bias)bias)诱导偏倚诱导
22、偏倚(inducement bias)调查者的询问技术不正确,或为获得阳性结论诱使被调查者做一倾向性回答,往往表现为对病例组做诱导,而对对照组不做诱导或负诱导,由此只能作出虚假的结论1/1/202333蚌埠医学院偏偏 倚(倚(bias)bias)测量测量 信息偏倚的表现形式为错误分类,暴露状态、疾病结局、混杂因素都可能发生错分。目前用于错分的软件有很多种,以暴露因素的错分为例进行分析。以研究对象的一个样本(对照组)为例,令:真正暴露X=1,真正非暴露X=0;被分类为暴露X*=1,被分为非暴露X*=0。由此得到四个概率:1/1/202334蚌埠医学院偏偏 倚(倚(bias)bias)SeSe=暴
23、露对象被分为暴露的概率=灵敏度=Pr(X*=1 X=1)FnFn=暴露对象被分为非暴露的概率=假阴性概率=Pr(X*=0 X=1)=1-SeSpSp=非暴露对象被分类为非暴露的概率=特异度=Pr(X*=0 X=0)FpFp=非暴露对象被分类为暴露的概率=假阳性概率=Pr(X*=1 X=0)=1-Sp1/1/202335蚌埠医学院偏偏 倚(倚(bias)bias)假设研究对象B1是真正暴露,研究对象B0是真正非暴露,那么:B1=预期被分类为暴露的研究对象数 =Se B1+Fp B0 (方程式1)*1/1/202336蚌埠医学院偏偏 倚(倚(bias)bias)B0=预期被分类为非暴露的研究对象数
24、=Fn B1+Sp B0 (方程式2)注意注意:Se+Fn=Fp+Sp=1,故错分不改变总数:M0=B1+B0=(Se+Fn)B1+(Sp+Fp)B0 =B1+B0 在大多数研究中,观察到的是正确分类数和错分类数的和。假定灵敏度和特异度分别为Se和Sp,(则Fn=1-Se,Fp=1-Sp),那么通过解方程式1和式2可以估计B1 和 B0*1/1/202337蚌埠医学院偏偏 倚(倚(bias)bias)从方程式2得到:B0=(B0-Fn B1)/Sp代入方程式1得到:B1=Se B1+(B0-Fn B1)/Sp求得:B1=(B1 Fp M0)/(Se+Sp-1)B0=M0-B1同样可以从错分的病
25、例数A1和A0来估计A1和A0:A1=(A1-FpM1)/(Se+Sp-1)*1/1/202338蚌埠医学院偏偏 倚(倚(bias)bias)A0=M1-A1,M1是观察的病例总数,然后进行暴露分类的灵敏度分析。此方法可应用于病例对照、封闭队列和患病率调查资料的分析。信息偏倚信息偏倚=OROR1 1-OR/OR-OR/OR如如=0=0不存在不存在如如000存在,正偏倚存在,正偏倚 1/1/202339蚌埠医学院偏偏 倚(倚(bias)bias)两种结果两种结果无差异性错误分类无差异性错误分类 暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;在多数情况下模糊了研究组的差异,使OR偏低差
26、异性错误分类差异性错误分类 暴露或疾病的错误分类同研究分组有关,各比较组间存在差异;造成高估或低估效应值1/1/202340蚌埠医学院1/1/202341蚌埠医学院两组调查所得暴露情况与实际暴露情况 实际暴露情况调查所得 病例 对照暴露情况 +-合计 +-合计 +54 12 66 27 21 48 -6 28 34 3 49 52 合计 60 40 100 30 70 100 1/1/202342蚌埠医学院偏偏 倚(倚(bias)bias)OR=60OR=6070/30 40=3.570/30 40=3.5OROR1 1=66 52/34 48=2.1=66 52/34 48=2.1信息偏倚信
27、息偏倚=2=2.1-3.5/3.5=-0.40.1-3.5/3.5=-0.400 aRRM-H或aORM-H,为正偏倚,阳性偏倚。(2)、cRR或cOR1表示:因素E可能与疾病D的发生有关1/1/202359蚌埠医学院偏偏 倚(倚(bias)bias)进一步考虑年龄对结果的影响(表2),可见对照组80%对象年龄小于40岁,病例组仅50%小于40岁,两组年龄分布不一致。表2:各比较组的年龄分布年龄(岁)病例 对照 40 50 8040 50 20合计 100 1001/1/202360蚌埠医学院偏偏 倚(倚(bias)bias)从表3可见:代表一般人群的对照组中小于40岁的暴露比例低于40岁及以
28、上者。表3:对照组中因素E与年龄的关系年龄(岁)有E 无E E(%)40 8 72 10 40 10 10 50 合计 18 82 18 1/1/202361蚌埠医学院偏偏 倚(倚(bias)bias)病例组中因素E与年龄的关系如表4:表4:病例组中因素E与年龄的关系 年龄(岁)有E 无E E(%)40 5 45 50 40 25 25 10 合计 30 70 30 1/1/202362蚌埠医学院偏偏 倚(倚(bias)bias)将上述对象按年龄分为小于40岁和大于等于40岁进行分层分析(表5)表5:因素E与疾病按年龄的分层分析 40 40 病例 对照 病例 对照 有 5 8 25 10 无
29、45 72 25 10合计 50 80 50 20因素E1/1/202363蚌埠医学院偏偏 倚(倚(bias)bias)OR40=1.0,用Mantel-Haenszel计算调整后的效应估计值aOR为1.0。aOR cOR,此时可认为年龄作为一个混杂因素,夸大了E与D之间的真实联系。当外来干涉因素符合混杂因素的四当外来干涉因素符合混杂因素的四个基本条件,其个基本条件,其cRRcRR或或cOR=cOR=分层后的分层后的RRRRi i或或ORORi i,各分层的相等或相近,则混各分层的相等或相近,则混杂偏倚存在。杂偏倚存在。1/1/202364蚌埠医学院偏偏 倚(倚(bias)bias)混杂偏倚的控制混杂偏倚的控制v标准化率分析标准化率分析v分层分析分层分析v多变量分析多变量分析v配比配比v随机化分配随机化分配v限制进入限制进入1/1/202365蚌埠医学院