《循证医学讲稿-证据评价.docx》由会员分享,可在线阅读,更多相关《循证医学讲稿-证据评价.docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章证据评价第一节证据评价的基本原则证据评价主要包括真实性评价、重要性评价及适用性评价,用以依次回答下列问 题:证据本身是否真实可靠?有多大临床意义和实用价值?用于临床实践的可行性 及适用程度如何?其中研究结果的真实性和重要性是评价证据的重点,只有真实、 可靠、重要的研究结果才有利用价值。下面分别就原始研究证据和二次研究证据 的评价原则加以阐述。一、原始研究证据的评价原则(一)真实性评价真实性(validity )评价是评价证据的核心。证据真实性指该研究本身研究方法 是否合理、统计分析是否正确、结论是否可靠、研究结果是否支持作者的结论等。 如果真实性有缺陷,则无需谈论其他方面的价值和意义。(
2、二)重要性评价一旦证据被证实是真实可靠的,需要进一步对其展开重要性(importance )评 价。证据重要性指研究结果本身是否具有临床价值。循证医学强调采用客观量化 指标来评价,主要围绕结局指标自身的重要性及其估计结果的实际价值等进行综 合评估。不同的研究问题具评价标准和指标有所不同。表4-1原始研究证据的评价原则(三)适用性评价证据适用性(applicability )评价是指研究结果针对不同人群、不同地点和具 均衡尚不明确时,难以形成最终推荐意见,但有一点可以肯定,就是形成强烈推 荐意见的可能性不大。例如,阿司匹林治疗心肌梗死,能有效降低病死率,且毒 性小、成本低,利大于弊,可以强烈推荐
3、在临床使用;又如华法林治疗心房纤颤, 尽管药物能降低中风发生率,但同时增大了出血风险且使用不便,利弊均衡甚至 弊大于利,一般不推荐使用。(三)患者意愿和价值取向实践循证医学,必须有患者的配合,方能达到预期效果。患者应参与临床决策过 程,但由于患者的主观意愿和价值取向差异明显,即使对于一项利弊明确的干预 措施,患者的取舍也不尽相同。如:淋巴瘤放射治疗,年轻患者更为看重的是放 疗能否延长生存时间,而对放疗的毒副作用并不在意,但对于老年患者则正好相 反,患者可能因过于看重放疗的毒副作用而放弃放疗。(四)卫生服务资源的可及性及其经济性1 .成本如何?耗用的卫生资源是否合理?2,若有可能,建议确定相应的
4、NNT界值,即治疗总投入与治疗总产出相等时的 货币化界值。3 .需要建立一个NNT界值点,并以此为标准进行比较判断。4 .计算N NT界值需要借助卫生经济学的理论与方法,将利弊证据单元货币化。5 .NNT界值在理论上是指治疗总投入等于治疗总产出时的界值点,也可以解释 成:6,建立NNT界值涉及三大步骤:7.该界值点综合考虑了有效性、安全性以及经济性等三方面指标(五)形成最终推荐意见和推荐强度 根据上述证据评价以及利弊综合分析结果,形成最终推荐意见及推荐强度。推荐 意见先分为推荐和不推荐两个方向进而又细分为强和弱两个等级,见表4r9。 表419推荐强度一览表第四节案例分析现以冠心病患者使用药物预
5、防心脑血管事件为例,阐述证据综合评价过程。循证 问题是“与使用大剂量他汀类药物干预相比,使用低剂量他汀类药物能否达到预 期心脑血管事件发生的效果?一、检索证据根据循证问题的PICO原则,制定检索策略,全面系统检索相关证据,结果发现 一 篇 新 近 发 表 的 系 统 综 述 (EMillsfet.al.IntensiveStatinTherapyComparedwithModeratedosingf orPreventionofCardiovascularEvents.EuropeanHeartJournalr2011r32, 1409-1415 ),进而采用AMSTAR工具评价,该系统综述质
6、量较好,那么相关 证据能否用于指导循证临床实践呢?可采用GRADE模式对此证据进行综合评价。 二、证据评价步骤首先确定与他汀类药物有关的所有特异性结局指标,进而分为三大类,即重要的 关键指标、重要非关键指标、非重要结局指标。判断哪些结局指标是关催的、哪 些结局指标重要但不是关键的、哪些结局指标相对更重要些等,需要主观判断, 与个人的价值取向有关。表4-20证据概要表 三、利弊综合分析 上述关耀指标中,有利结局指标是减少不良心脑血管事件发生(包括死亡、CVD. NMI),证据质量尚可,大剂量与小剂量他汀类药物相比,只有非致死性心肌梗 死(NMI)降低绝对值有统计学意义,NNT为72 ( 95%Q
7、:54 130%使用 大剂量他汀药物可使肝功受损,谷草转氨SS ( NNH=232,95%Q:761667 1 谷丙转氨酶(NNH = 116,95%CI:70-227 )等超标且有统计学意义。显然,利 弊综合分析结果是利大于弊。但由于N NT较大,使用大剂量他汀类药物的优势 并不明显。四、考虑患者意愿、价值取向以及卫生服务资源的可及性因他汀类药物需要长期服用且比较昂贵,享有基本医疗保险、公费医疗以及自费 患者可能会因不同的费用负担形式,对上述利弊的认知存在分歧,需进一步迸行 卫生经济学评价并建立NNT界值NNT ( m,注意考虑成本后,利弊分析结果 有可能发生改变。在此例中,目标事件为发生非
8、致死性心肌梗死,不良反应事件选取AST、ALT 超标。NNT ( T ) = ( Costmme+Valuemma ) / ( Costmimom+CostAex RateA E+Va I u eAE x Ratexr 工其中Cost.mmn为预防目标事件出现而产生的单患者治疗费用。本例 Cost 为他汀类药物大小剂量费用之差人年平均按5000元计。Costmm, 为出现目标事件时,治疗一个目标事件所需的费用。治疗一例非致死性心肌梗死 的常规费用(排除介入治疗、手术治疗),按单病种住院费用平均计为25000元。Costxs为防治一个不良反应事件所需的费用。 因本例有统计学意义的不良反应事件只有
9、转氨酶超标,保肝降酶一个疗程的治疗 费用按500元计。RateAe为患者不良反应发生率,因AST, ALT均可能超标, 但发生率不同,统一取最大值,不良反应事件发生率按1.5%计。Valuemm为 避免一个目标事件出现而产生的效益,相当于患者愿意出多少钱避免一例目标事 件的出现,这与患者的价值取向有关,可采取标准博弈法、平衡等价法等方法加 以确定。本例Valuewm为5000元,即假设患者愿意花费5000元,来预防一 例心肌梗死的发生。ValueAk为治疗该不良事件所需的成本,相当于患者愿意 出多少钱用以避免一例不良反应事件的发生,本例Valuexg为500元。本例计算NNT ( m )所需基
10、础数据如下:Cost.mmmt=5000元(他汀类药物治疗费用)Costmma=25000元(治疗一例心肌梗死的平均费用)Coste=500元(保肝降醐治疗一例转氨酶超标患者的费用估计)Rateae=1.5% (发生肝功受损的比例)Valuems=5000元(避免一例心肌梗死发生所产生的预期获益)ValueAe=500元(避免一例肝功受损所产生的预期获益)NNT ( r ) = ( Costmge+Valuemge ) / ( Costmcmcm+CostE x RateAe+ValueAexRateAe ) = ( 25000+5000 )/( 5000+500xl.5%+500 xl.5%
11、) 6本例NNT界值为6,是按照临床常规处置的平均医疗费用以及基于一定假设而大 致估计的结果,仅供临床参考。注意在不同医疗环境、医疗条件下,上述估计N NT界值所用的基础数据可能会有所变化,N NT界值也会相应改变。五、形成最终推荐意见和推荐强度 本例NNT=72,NNT界值=6,考虑经济学评价结果后,NNTNNT界值,则表 明弊大于利,与低剂量口服他汀类药物相比,使用大剂量干预得不偿失,因而不 建议在临床推广应用。小结证据评价原则包括真实性评价、重要性评价和适用性评价,证据质量涉及方法学 质量和报告质量。证据评价步骤包括确定评价目的、初筛证据、明确研究类型、 合理选择质量评价方法及工具。在此
12、基础上,利用GRADE系统完成证据的综合 评价,最终形成推荐意见,付诸临床实践。体病例的推广应用价值。适用性评价主要考虑当前病例与文献中研究对象特点是 否类似及患者价值观对证据应用的影响。评价证据的适用性,可借助下列一些评 价工具。1. “PROGRESS评测清单PROGRESS”评测清单提出了八个可能影响适用 性的因素:2.INCLEN/KMP 适用性评价工具 INCLEN/KMP 协作组 (InternationalClinicalEp-idemiologyNetwork,KnowledgeManageme ntProject,INCLEN/KMP )根据不同设计方案提出了适用性评价工具系
13、列。表4-2随机对照试验适用性评价工具二、二次研究证据评价(一)真实性评价1.OQAQ量表评价系统综述真实性最常用的工具是OQAQ(1)围绕研究问题是否采用了检索策略查找原始文献?(2 )文献检索是否全面系统?(3)是否报告了文献的纳入标准?(4)可能出现的文献选择偏倚是否被避免?(5)是否报告了纳入文献的质量评价标准?(6)是否采用合理方法评价了纳入文献的真实性?(7)是否报告了文献结果的汇总分析方法?(8)针对研究问题,纳入文献结果的汇总分析是否合理?(9)最终结论是否有数据或分析结果支持?(10 )对该系统综述质量的总体评分是多少?(二)重要性评价L结局指标重要性评价主要围绕结局指标自身
14、的重要性及其估计结果的实际价 值等进行综合评估。表4-3结局指标重要性分级表(肾衰竭伴高磷血症)2 .效应量重要性评价在确定重要结局指标的基础上,继续考核其效应量大小及其 精度,进而围绕效应量从统计学意义和临床意义两方面进行综合判断。具体有以 下几种情况:(1)当效应量无临床意义时,即使P值再小,也无临床应用价值。(2)当效应量既有临床意义,又有统计学意义时,即能作出重要性结论。(3)仅有临床意义而无统计学意义时,不能完全否定其临床价值,应计算其口 型错误或检验效能。(4)若研究结果既无临床意义,又无统计学意义,则此证据的重要性可忽略。(三)适用性评价若将上述真实性好且有重要临床价值的证据在临
15、床实践中加以应用和推广,同样 应结合自己患者的实际病况和接受意愿、现有医疗条件和知识技能水平以及社会 经济状况的承受能力等,对其临床适用性展开评价,如计算其成本效果 (cost-effectiveness )、成本效益(cost-benefit )以及成本效用 (cost-utility )等,使那些成本低、效果佳的研究成果,得以推广应用。第二节证据评价的具体实施步骤一、确定评价目的确定评价目的有助于对证据进行有针对性的评价。评价目的不同,其评价内容和 重点会有所变化,如评价证据的报告质量、方法学质量或两者兼顾。二、初筛证据初筛证据的真实性和相关性决定是否继续阅读,需要考虑以下问题,见表44。
16、表4-4初筛证据真实性和相关性三、明确证据的研究类型通过阅读文献的摘要或前言完成证据的初筛后,进一步对纳入证据的研究类型加 以明确。一般来说,原始研究证据主要涉及四大临床研究问题,即病因、诊断、 治疗和预后,常用的设计方案有所侧重,见表45。同样,二次研究证据也有系 统综述、临床实践指南、决策分析或经济学分析等不同的研究形式。表4-5原始研究证据的常用设计方案四、合理选择质量评价方法及工具鉴于临床研究旨在解决临床上常见的诊断、病因、防治、预后四大方面问题,因 此,原始研究证据也以上述四类为主。有关这四类研究的设计、测量与评价内容 在临床流行病学教材中均有专门介绍,特别是有关三性”(真实性、重要
17、性、 适用性)评价原则可以直接参考相关书籍。同时为方便证据评价,也可以借鉴一 些已有的质量评价工具。评价工具大致分为方法学质量评价工具和报告质量评价 工具两类,现将原始研究证据与二次研究证据的一些常用评价工具简述如下: (一)原始研究评价工具1 .随机对照试验研究(1)方法学质量评价:随机对照试验方法学质量评价推荐使用Cochrane协作 网偏倚风险评价工具,见表46,包括六个方面:随机化分配方法;随机分 配方案隐藏;盲法实施情况;结果数据的完整性;选择性报告研究结果; 其他偏倚来源。表4-6Cochrane协作网偏倚风险评价工具(2 )报告质量评价:报告质量评价推荐使用CONSORT (Co
18、nsolidatedStandardsofReportingTrials,CONSORT 声明见表 48。CONSORT声明翻译为中文是“临床试验报告统一标准的声明”,由西方医学家 与医学杂志编辑共同制定,于1996年发布,2001年修订,用于指导临床试验 报告的规范。近年来,又陆续发布了草药CONSORT声明、危害CONSORT 声明、不良反应CONSORT声明等对临床试验报告的规范越来越明确和细致, 每一篇临床试验报告的撰写和报告都应该遵循声明中的相关条例。表 4-8CONSORT 声明.观察性研究对于观察性研究的评价工具有 NOStheNewcastle-OttawaScale(NOS)
19、forAssessingtheQualityofNonrandomizedStudies系列、CASP 系列 (CriticalAp-praisalSkillsProgramme)等。表4-9队列研究的NOS评价标准.诊断试验Cochrane协作网推荐使用QUADAS清单评价诊断试验的方法学质 量。QUADAS清单是基于已有的影响诊断试验结果真实性、重要性和适用性的 研究证据采用严格的专家共识方法所制定的通用评价工具2003年发表2006 年再次修订。Co-chrane协作网采用其中11个条目,对每个条目作出是 否和不清楚”的判断,判断应结合研究目的确定,见表412。表4-12诊断试验评价条目
20、(来自QUADAS ).注意事项使用上述工具评价原始研究证据时,对评价结果应审慎对待,因为这 些评价工具,并不是量身定做的具研发过程也不是很严格伺时选用不同工具, 对同一证据的质量评价结果可能不尽相同。另外,这些评价工具中设置的条目也 不够全面,只能评估证据的某一方面属性,如单独对真实性进行评价。(二)二次研究评价工具.临床实践指南(clinicalpracticeguideline,CPG )临床实践指南证据评价使 用 临 床 指 南 研 究 与 评 价 系 统 (appraisalofguidelinesresearchandevaluation,ACREE),对指南制定中是 否存在潜在的
21、偏倚,推荐强度的真实性、重要性和适用性等作出判断。AGREE 包括6个领域的23个条目。2009年AGREE国际协作组织对2003版AGREE 修正后制定出新的AGREE即AGREEH,见表4-130表4-13AGREEII条目表.系统综述系统综述评价工具同样包括方法学质量评价工具和报告质量评价工 具两类,现分述如下:(1)系统综述方法学质量评价:推荐使用AMSTAR测量工具。统综述的首选质量评价工具。AMSTAR测量工具见表414,其测量清单及说明 见表415。(2 )报告质量评价:推荐使用PRISMA评价标准。表4-14AMSTAR测量工具表4-15AMSTAR测量清单及说阻表4-16PR
22、ISMA评价标准图4-1系统综述制作不同阶段的流程图第三节证据的综合评价在循证医学实践中,针对某一具体临床问题,获取的证据可能不止一个,证据级 别各异,研究重点也不尽相同,如安全性研究证据、有效性研究证据或卫生经济学 研究证据。如何整合这些证据返就涉及证据的综合评价问题。综合评价基本步骤如下: 一、证据初筛与证据一览表将循证问题按照PICO进行分解,制定检索策略,全面系统检索相关证据,根据 检索结果和事先制定的纳入与排除标准完成证据的初筛,再依据与循证问题的相 关程度及研究类型等绘制候选证据分布一览表,用以明确证据数量与相应证据级 别分布。表417候选证据一览表二、候选证据的严格评价按照临床流
23、行病学的严格评价原则和方法,合理选用评价工具,逐一对上述候选 证据的真实性、重要性与适用性展开评价。鉴于临床实践指南本身就是证据的综 合结果,若上述候选证据中包括有现成的临床实践指南,并且经三性”评价后, 发现该临床实践指南的真实性、重要性和适用性俱佳,可以考虑将其用于指导临 床实践,没有必要实施下一轮的证据综合评价。三、证据综合评价参照GRADE系统的模式与基本程序,将系统综述中原有的顺序打乱,重新构建 以结局指标为证据基本单元的证据概要表,进而围绕纳入研究的设计方案、纳入 研究发生偏倚的风险大小、研究结果的一致性、间接性和精确性以及报告偏倚的 可能性等评价要素,逐一评价各证据单元的质量,绘
24、制结果汇总表或证据概要表, 从而实现证据综合评价全程的透明化。(一)GRADE证据质量分级grade系统将证据质量分为高质量、中等质量、低质量和极低质量四个等级, 具体见表418。表4-18GRADE质量评价标准(二)结果汇总选取与试验干预有关的关键指标,将汇总结果分别以相对危险度(relativerisk,RR )和绝对危险度(absoluterisk,AR )的形式报告。提取数 据包括合并RR值及其95%可信区间(95%confidenceinterval,95%CI 基 础危险率(一般以纳入研究对照组的目标事件发生率中位数计)等,进而计算出 绝对危险降低率(riskdifference,
25、RD )及其95%可信区间。依次列出相关关键 指标的汇总结果后,形成结果汇总表。(三)利弊综合分析利弊综合分析就是分别将上述“有利”证据单元综合在一起,得到“利”的综合 结果有害或不利”证据单元同样放在一起得到“弊”的综合质量评判, 若大多数证据质量高,则“利弊证据综合的质量也高。利弊综合分析时,不能 只对有益证据单元进行综合质量评判,忽视了 “有害证据,特别是当有害” 证据单元为关键指标时,即使证据质量不高,也不能完全忽略。四、推荐意见及推荐强度的形成在循证临床实践中,证据能否最终用于临床决策,取决于四大因素,即证据综合 质量、利弊综合分析结果、患者的意愿及价值取向、卫生服务资源的可及性及其 经济性等。(一)证据综合质量L证据的综合质量越高,越有可能影响临床决策。2.证据质量高低是指效应量估计正确的可信程度大小,证据质量高,则可信程度 高。推荐意见强度分级是指遵循该推荐意见获取利大于弊效果的可信程度。(二)利弊综合分析结果利弊综合分析结果无外乎出现四种情况,即利大于弊、弊大于利、利弊均衡、利 弊均衡不明确。对于前两种情况,容易作出抉择,但后两种情况,特别是当利弊