《研究的真实性与偏倚.ppt》由会员分享,可在线阅读,更多相关《研究的真实性与偏倚.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 研究的真实性与偏倚 主要内容主要内容研究结果的变异性研究结果的变异性研究的偏倚研究的偏倚研究的真实性研究的真实性引言研究的解说涉及到研究的真实性与因果推断的问题。研究的真实性直接关系到是否获得正确的结论,而真实性需要通过变异性估计来确定对于因果关系的研究,从研究结果如何做出正确的因果推断,也是非常重要的表表1 变异性的水平变异性的水平变异性 描述性和分析性数据(指标)的变动或波动 一 个体水平的变异性 定义 某个体特征测得值的变化,可以是个体真值随时间的改变,也可以是由于测量误差引起的变化来源 个体状态 测量误差表表2 个体水平的变异来源个体水平的变异来源 二 群体水平的变异性来源 个体间遗
2、传变异 环境变异 测量误差 特点 变异程度常常大于个体的变异 也受到测量误差的影响 可确定“正常值”范围三 样本水平的变异性定义 不同样本的研究所得结果的差异性来源 抽样方式 样本大小 测量误差分类 描述性结果的样本变异性(图1)分析性结果的样本变异性(图2)180,174,215,305233,276,146,195205,188,190,295170,164,248,162220,219,228,250295,146,220,162,228219,164,190,188,233205,276,195,215,170源群体 样本A 样本B 样本C 高胆固醇率=40%=20%=0%高胆固醇率=
3、25%(240mg/dL)图1 源群体与样本高胆固醇率的样本变异性示例 源群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。如果增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大 图图2 2 膳食与药物预防心机梗死的样本变异性示例膳食与药物预防心机梗死的样本变异性示例n图2,研究A和研究B中膳食改良组五年内发生心梗死的风险为9%,降胆固醇药物组为6%nA样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,从而发生重叠,统计检验无显著性差异n研究B样本较大(2000人),两组效应指标的95%可信限较小,从而未发生重叠,统计检验有显著性差异
4、n一般而言,研究样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小 误差定义 指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值之差分类 随机误差 系统误差(偏倚)n举例:用动脉血压计测量某人血压(实际值为80mmHg),各次读数的均值为100mmHg,系统误差和随机误差可用以下图示随机误差随机误差80100舒张压舒张压(mmHg)系统误差系统误差发发生生频频次次图图3 血压计法测量舒张压值的分布血压计法测量舒张压值的分布随机误差广义 因机遇不同估计总体参数时所产生的误差,如选择的机遇、时间的机遇狭义 随机抽样所得均值对总体均值的误差特点 没有固
5、定方向和固定大小 一般呈正态分布 偏倚 定义 属于系统误差,在研究或推论过程中所获得的结果系统地偏离其真实值特点 具有单方向性 可高于真值,也可低于真值分类 选择偏倚、信息偏倚、混杂偏倚误差误差随机误差2系统误差2一一 选择偏倚 (selection bias)研究者在挑选研究人群时由于选择条件受限制或设计失误所致的系统误差常见种类控制方法 常见种类v 入院率偏倚v现患-新发病例偏倚v易感性偏倚v无应答偏倚v 检出征候偏倚v时间效应偏倚v排除偏倚 v志愿者偏倚 有人把选择偏倚按照是否能被临床科研设计消除分为:消除型偏倚 非消除型偏倚消除型偏倚 指能通过科研设计,如采用随机化方法,而消除的选择型
6、偏倚。包括传统分法中的:入院率偏倚 现患病例-新发病例偏倚 检出征候偏倚 无应答偏倚非消除型偏倚n 指的是不能通过随机化的方法消除的选择偏倚,常发生在以特殊人群作为研究对象的研究中。包括传统分法中的易感性偏倚。健康工人效应 非消除型选择偏倚分三种类型:平行型指两组人群(如病例组和对照组)的某一观察指标,随时间变化呈现相似效应(如率,or等)变化(图1,A),即观察效应无正效应,亦无负效应,两组指标差值近似常数。递增型指两组的某一观察指标随时间变化呈现不同的变化趋势(图1,B)。两组指标数据间差值随时间变化而增大,它是正效应还是负效应要具体分析。递减型指两组的某一观察指标随时间变化呈现不同的变化
7、趋势(图1,C)。两组指标数据间差值随时间变化而缩小,它是正效应还是负效应要具体分析。选择偏倚的控制随机选择研究对象;选择多种对照;明确规定纳入和排除标准;选择依从性高的对象,掌握调查技巧;延长收集病例的时间;尽量采用敏感的疾病早期检查技术,或者开展观察期较长的纵向调查;二 信息偏倚(information bias)在收集和整理有关暴露或疾病资料时所出现的系统误差,主要发生在观察、收集资料及测量等实施阶段常见种类两种结果控制方法信息偏倚常见的种类信息偏倚常见的种类n不应答偏倚不应答偏倚n回忆偏倚回忆偏倚n报告偏倚报告偏倚(说谎偏倚说谎偏倚)n社会期望偏倚社会期望偏倚n诊断怀疑偏倚诊断怀疑偏倚
8、n暴露怀疑偏倚暴露怀疑偏倚n测量偏倚测量偏倚来自于被调查者来自于调查者来自于测量仪器 信息偏倚的测量信息偏倚的测量 一项研究资料是否存在信息偏倚以及偏倚的方向与大小,可通过比较、分析在一定研究对象中调查所得到的信息与实际信息(如客观检查、记录等)予以测量。两种结果无差异性错误分类 暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;在多数情况下模糊了研究组的差异,使OR偏低差异性错误分类 暴露或疾病的错误分类同研究分组有关,各比较组间存在差异;造成高估或低估效应值 控制方法v明确资料收集方法和严格质量控制v尽可能采用盲法v采用客观指标的信息v采用调查技巧避免回忆偏倚v资料校正三 混杂偏倚
9、 暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰判定方法引起的假关联控制方法 判定方法 v专业知识v分层分析进行定量判别 混杂偏倚 假关联继发关联直接因果关联的歪曲CEDDEFDEF(1)继发关联继发关联(2)直接因果关联的歪曲直接因果关联的歪曲(3)直接因果关联的歪曲直接因果关联的歪曲图图5 5 混杂偏倚引起假关联混杂偏倚引起假关联?1.继发关联(secondary association)纯粹由混杂偏倚产生的关联怀疑的病因(暴露)E与疾病D并不存在因果关系,而由于两者(E,D)有共同的原因C,从而继发产生E与D的关联E与C有相关(因果方向不明)而产生继发关联?例:例:继发关联
10、 2.直接因果关联的歪曲 怀疑的病因(暴露)E与疾病D既存在直接关联,又存在间接关联或与其他危险(保护)因素F存在相关直接因果关联程度或方向将可能受到混杂干扰,歪曲估计值?例:例:直接因果关联的歪曲 调控方法v分层分析分层分析v多变量分析多变量分析v配比配比v随机化分配随机化分配v限制进入限制进入真实性(validity)定义 研究收集的数据、分析结果和所得结论与客观实际的符合程度两个方面 内部真实性 外部真实性 真实性的反面(研究误差)概念 研究结果与客观实际存在不符合的地方分类 系统误差 随机误差一一 内部真实性(内部真实性(internal validityinternal validi
11、ty)v定义 研究结果与实际研究对象真实情况的符合程度,回答一个研究本身是否真实或有效v改善措施 限制研究对象类型 限定研究的环境条件 限定干预措施二 外部真实性(external validity)研究结果与推论对象真实情况的符合程度,又称普遍性,回答一个研究能否推广应用到研究对象以外的人群推论代表性不好,内部真实性可能好,而外部真实性差增加研究对象的同质性(如限制类型如年龄、职业、体质特征或疾病分型等),可改善内部真实性增加研究对象的异质性,可改善外部真实性在实际研究需综合考虑研究对象的同质性和异质性问题内部真实性与外部真实性的联系内部真实性与外部真实性的联系各位同学在本学期对我的支持!预祝大家都能取得好成绩!谢谢