《让医生更加相信你4——治疗研究的金标准.pptx》由会员分享,可在线阅读,更多相关《让医生更加相信你4——治疗研究的金标准.pptx(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、让医生更加相信你RCT:治疗研究的金标准主要内容RCT试验概述对照的原则及方法随机的原因及分类盲法的意义及分类观察指标和样本数的要求P值和置信区间临床数据的分类和不同处理方法其他与RCT相关的概念RCT是治疗研究的金标准随机对照试验已经成为治疗研究的金标准随机+对照是必须的,任何试验可以做到。盲法并非每个试验都能做到实际上,真正高质量的RCT在新英格兰杂志中仅有40%,在中国仅有6.8%(仅从书面检验)很多竞争对手引证的RCT试验,我们是可以挑战的。为什么要设立对照?在美国,有一段时间抗组胺药物用于感冒治疗风靡一时,因为试验证明抗组胺药物能使得大部分感冒在一周之内痊愈有比较才有鉴别,比较的基础
2、就是对照。对照正确与否直接关系到研究结论的科学性和价值:可排除或控制自然转归和非实验因素对观察结果的影响。可消除或减少实验误差。设立对照的原则专设任何一个对照组都是为了试验专设的,不得来自其他研究或者历史文献记载。同步两组在研究进程中始终处于同一时空对等非研究因素在治疗和对照两组中分布对等试验对照的种类(I)平行对照RCT交叉对照RCT历史对照非随机自身对照适合慢性病研究试验对照的种类(II)空白对照对照组不做任何处理:常用于动物试验安慰剂对照临床试验常常给予基础支持治疗(伦理+优效性检验)剂量对照考察药物的“量效”关系阳性对照对照组为公认有效(治疗金标准)+非劣效检验为什么分组需要随机化?让
3、那些已知的或未知的非研究因素(混杂)在各组之间公平分配:举例:研究重组产品和尿制品在治疗不孕症上的临床疗效差异研究因素:重组产品VS尿制品非研究因素:年龄、体重、夫精质量、患者顺应性、未知混杂等只有以上非研究因素得以公平分配,才能凸显纯粹由药物差异导致的疗效差异。思考:除了随机分组,还有什么其他办法处理这些已知非研究因素?随机分组的种类简单随机分组区组随机分组分层随机分组分层区组随机分组动态随机简单随机的原理治疗组 对照组区组随机的原理区组研究对象样本1、2、3、4治疗组对照组分层随机的原理高龄层低龄层治疗组对照组其他两种随机方法简单随机分组区组随机分组分层随机分组分层区组随机分组多中心RCT
4、多以中心进行分层,然后在各中心进行区组随机化动态随机指在临床实验的过程中每例患者分到各组的 概率不是固定不变的,而是根据一定的条件进行调整的方法,它能有效的保证各实验组的例数和重要的非处理因素接近一致。随机分组的隐藏顺序编码密封信:治疗方案被预先随机分配到按顺序密封的信封中,研究对象同意试验,信封开封。中心随机系统:远程随机,研究者确认合格研究对象后,通过远程输入患者基本信息到中心随机系统,系统随机分配方案。分组完成后,隐藏即结束;不同于盲法,需要持续到试验和随访结束。隐藏每个试验都能做到,盲法则不然盲法的意义排除来自研究者与受试者主观偏倚的影响。盲法的种类单盲入组患者不知自己实际接受的是何种
5、干预方案以指标的客观性来消除研究者的主观性偏倚双盲。入组患者和方案实施人员均不知接受和采取的是何种干预方案。三盲入组患者、方案实施人员、资料分析人员均不知晓所接受、所采取、所分析的是何种干预方案。双盲双模拟掩盖治疗方案的差异什么样观察指标是合适的?为什么不能拿出血率来衡量黄体支持的疗效?2010年mayers荟萃分析中,为什么说获卵数而不是卵子质量或者妊娠率是评价药物质量的最佳指标?观察指标的基本要求客观性:试验研究中应以客观指标而非主观指标作为首选指标。有效性:既能灵敏反应阳性结果,又能高特异性的排除阴性结果,终点指标优于中间指标。精确性:能准确测量,能重复再现,准确度和精密度均高。多少样本
6、数才是足够的?:标准差u、u:1-、1-的标准正态分布百分位数(等效试验中用/2替代)k、1-k:治疗和对照两组在总样本中所占比例:两组结局的真实差值(等效性试验中为零):临床上可以接受的有意义界值多少样本数才是足够的?预计两组疗效的差别差别越大,所需样本越少预设允许的错误概率水平、允许错误概率越高,所需样本越少对照组结局风险水平越靠近50%,所需样本越少预估的脱落率脱落率越高,所需样本越多你能和医生交流什么?主任,这个试验没有设立对照,可信度有限,我这里有一个RCT试验,结果完全不同主任,这是两个产品分别做的RCT,虽然这两个试验结论不一,看似我们的试验结局要差一些,但是我们选取的对照组经典
7、的治疗方案,而对方选择的仅仅是安慰剂,在疗效上肯定有不同表现。这里有一份两个产品直接对照的RCT主任,这个试验结论我回去仔细研究了一下,发现原文提及的对照组和治疗组在基线水平上有很大差异,治疗组平均年龄比对照组年轻两岁,您知道年龄是治疗结局很大的一个影响因素,可见他们产品的疗效并没有试验看来的那么有效。我手头这篇文献在病例分配方面做到了真正的随机,两组基线水平没有差异。主任,显然拿这个指标作为主要终点指标,主观性太强了,很多时候不同医生对同一个卵子会做出不同级别的评价。主任,的确如您所见,我们这个试验的样本数不如他们的试验,理论上来说,样本数当然是越多越精确,但是试验越庞大,质量和成本的控制都
8、会很难,而我们这个试验的样本数也是经过精确计算的,足以说明治疗和对照疗效差异的统计学显著性。在此基础上,更多的样本数并不能带来试验可信度的明显提高。P值的意义:统计显著性检验P值代表治疗组和对照组资料来自于同一个总体可能性。代表我们可以接受的发生“假阳性”事件的概率(通常为0.05 or 0.01)当P时,不能说概率越大,组间差别就越大试验结局:治疗组和对照组的结局差异P值变小P值的意义:其他范围的P值P值仅仅是证据强弱的水平值仅仅是证据强弱的水平P值 0.1 表示在治疗之间差异缺乏证据P值为0.05 0.1有时称作“临界值”,但是通常提示缺乏证据P值 0.05是“有统计学意义”结果的传统定义
9、P值 0.01表示具有强烈的证据,通常会使人信服P值 0.001足可以使每一个人信服,并提示可以提早停止试验为什么要进行统计显著性检验?样本均数出现范围样本均数出现范围当治疗组和对照组选取样本足够大时,则样本能代表总体人群的情况:即样本各组平均数接近总体平均数,出现在总体正态分布中间区域,而样本组间差异可以看作是不同总体之间的差异。两组差异来自同一总体的概率 P治疗前总体人群分布治疗后总体人群分布当两组样本不够时,这种组间差异则有可能来自同一个总体的抽样误差,也就是这种总体之间差异存在的可能性缩小了,而不是差异本身缩小了。两组差异来自同一总体的概率P 临床意义VS统计学意义临床意义不同于统计学
10、意义统计学意义仅仅是对结论可靠性的判断临床意义则仅仅回答试验是否给临床带来值得的“收益”。我们评价一个研究是否值得在临床推广时,应该同时考虑两方面的因素。可信区间confidence interval95%CI(可信区间)按一定概率去估计总体参数(均数或率)所在的范围。表示治疗效果的准确度,也就是可信程度。可信区间越小,可信度就越靠近真实值,反之则可信度差。一般大约等于平均值加减1.96标准差,标准差越小,表示样本数值的离散度越小,试验结果越集中,CI越狭窄,预测的可能性越大。总体平均值样本值样本概率95%CI-1.96+1.96试验的目的就是用样本平均值去估计总体平均值,假设总体概率为1,9
11、5%CI代表了样本平均值有95%可能性出现在的数值区域置信水平固定,置信区间越小越好可信区间就像是中靶范围越小越好,越准确,越可预测临床数据的分类数值变量表现为数值的大小不同如:血压、年龄、获卵数、用药量分类变量没有数值的大小,互不相容类别或者属性无序分类变量如:妊娠与否,存活与否,血型、性别有序分类变量如:无效、有效、显效、治愈;轻、中、重数值变量常用指标指指标名称名称作用作用适用的适用的资料料均数(X)描述一组数据的平均水平,集中位置正态分布、近正态分布中位数(M)偏态分布,未知分布,两端无界几何均数(G)对数正态分布,等比资料众数()标准差(S)表述一组数据的变异大小,离散程度正态分布、
12、近正态分布四分位差偏态分布,未知分布,两端无界极差(R)观察例数先进的数值变量变异系数(CV)比较几组资料间的变异大小分类变量常用指标指指标名称名称计算公式算公式意意义举例例率描述事件发生的强度和频率妊娠率(发生妊娠人数/用药后可能发生妊娠人数),活产率构成比事物内部各组分所占比重显效占比,相对比A指标为B指标的倍数或百分之几优势比,风险比临床数据分析常犯的错误将数值变量资料误判为分类变量加以处理如:数值变量比较可用t检验、u检验,分类变量“率”的检验用x2检验将数值变量强行转化为分类变量临床试验中尽可能选择量化指标反应试验效果,无法定量是才采用分类数据,一般不能强行转化将分类变量中,“比”和
13、“率”混淆:构成比当成疾病发生率解释某病例数/就诊人数=发病率将分类变量中,把各种“率”混淆:发病率VS患病率、死亡率VS病死率使用均数、标准差来描述偏态分布、未知分布、两端无界的资料。药物经济学成本直接成本直接医疗成本:挂号费,化验检查费,手术费、住院费、药费、病床费、护理费、康复费、麻醉费直接非医疗成本伙食、交通、住宿、看护、物料、家属缺勤间接成本因疾病而丧失的社会资源与病残率有关成本:缺勤病假、残疾劳动力下降。与死亡率有关成本:死亡给家庭社会的全部损失隐性成本疼痛、悲伤、抑郁等敏感度sensitivity&特异度specificity将采用金标准诊断“有病”的病例,采用某诊断方法检测时,
14、阳性例数的比例。比例越高,敏感度越高,漏诊率越低将采用金标准诊断“无病”的病例,采用某诊断方法检测时,阴性例数的比例。比例越高,特异度越高,误诊率越低对于RCT研究来说,观察指标的基本要求包括保证其有效性,即指标的敏感度和特异度均需要能足够令人满意。例如:出血对于流产的判断来说,就是一个敏感性足够但特异性不够的中间指标。故使用出血率来衡量黄体支持的疗效,会出现偏差。假阳性错误和假阴性错误爱的反面是:恨 or 不爱?治疗、对照组确定有差异(P0.05)的反面是:治疗、对照组确定没有差异or治疗、对照组不确定有差异?假阳性错误和假阴性错误假阳性错误其概率预设为一般为0.05治疗组和对照组的差异不是
15、来自于疗效引起的两组总体差异,而是来自同一总体里抽样的误差消费者风险在一个新药临床试验中,第I类错误会将疗类错误会将疗效不佳或无效的新药不恰当地奉为有效的创新药,批准上市以至消费者利益受损。假阴性错误其概率预设为一般为0.1治疗组和对照物的无差异是来自于抽样误差,而不是因为两组疗效相同。研发者风险在一个新药临床试验中,第II类错误会埋没类错误会埋没效果较好的新药,致使得不到批准和生产。优效性VS非劣效性评价试验优效性评价试验研究假设:试验药的疗效比安慰剂相比更佳有临床意义的界值:例如:两组妊娠率相差大于10%非劣效性评价试验研究假设试验药的疗效与阳性对照药(金标准)相比相当有临床意义的界有临床
16、意义的界值:例如:两组妊娠率相差小于5%)发病率&患病率发病率(Incidence Rate)测量疾病发生的频率和强度。动态指标用于分析性流行病学研究如某市99年吸烟人群肺癌发病率。=该人群同期某病新发病例数/某人群某时期的暴露人口数*100%用于急慢性疾病患病率(Prevalence Rate)描述新老病例在人群的比例。静态指标用于横断面研究如某市99年全员骨关节炎患病率。=该人群同期某病的新老病例数/某人群某时间的平均人口数*100%一般用于慢性病优势比OR&风险比RROdds ratio又称比值比Case control:病例组中暴露人数与非暴露人数,相比对照组中该项比值的倍数为什么病例
17、对照要使用OR而不是RR来衡量结果?OR越远离1,越有临床价值,最好大于4。可信区间也是影响OR值的一个因素精确度,统计学意义Relative riskRCT&Cohort:暴露组发病率与为暴露组发病率的比值(治疗组成功率与对照组的比值,治疗组副作用发生率与对照组的比值)RR越远离1,越有临床价值,通常认为RCT或者Cohort研究RR值超过3才有临床意义。受可信区间影响。敏感性分析改变某些影响结果的重要因素(可能的偏倚)如纳入标准、研究质量的差异、失访情况、统计方法(固定效应或随机效应模型)和效应量的选择(OR or RR)等,以观察同质性和合成结果是否发生变化,从而判断结果的稳定性。混杂:
18、调整混杂因素之后OR、RR值反而变大说明结果可信,反之则前后结果都不可信。暴露组&治疗组暴露在流行病学里,是指待研究的致病因素例如,在吸烟导致肺癌的发生风险研究里,吸烟就是暴露因素,遗传因素、射线因素在此研究中则不是暴露因素,而是混杂干扰因素。治疗在临床试验里,是指待研究的干预因素有时候也被称之为暴露,而对照组成为非暴露组。例如,在二甲双胍对糖尿病病人死亡率的影响的研究里,服用二甲双胍就是治疗因素,也可称为暴露因素。NNT&NNHNumber Need to Treat防治一例不良事件发生需要治疗的病例数NNT等于绝对危险降低率的倒数,1/RD(risk diference)Number Ne
19、ed to Harm导致额外一例疾病的发生需要暴露在可疑危险因素中易感个体的数目导致一例副作用发生,需要接受治疗措施的病人数。对于临床医师、患者而言更直观更易理解的指标有助于医药代表理解和传递试验的现实意义主任:换用我们的药品,您每治疗*位这样的患者,就能使他们中间多一个成功妊娠,以中心现在的月门诊量计算,每月可以多出*例妊娠。稳定性和可比性不如RR&ORA型不良反应&B型不良反应A型不良反应量效关系密切,药物不良反应与剂量的大小有直接关系是药物药理学作用相对增强的结果,或有药物及其代谢物引起的毒性作用可在动物研究中发现,一般可预见和预防发生率高、死亡率低可根据病人治疗的需要和耐受程度进行剂量
20、调整如代谢毒性、耐受性、依赖性、停药反跳等B型不良反应量效关系不密切,是病人敏感性增高,对药物反应发生质的改变,与正常药理作用无关的异常反应是遗传药理学变异或者获得性药物变态反应难以预见发生率低5%、死亡率高立即停药,不再使用特异性反应、药物变态反应、药物后效应(致癌、免疫抑制、抗生育、致畸)风险&预后使患病的几率增加描述为患病者低概率事件:年率1/100-1/10000难凭经验估计,需要大量严格论证结果:生病、不生病疾病发生后预测其过程描述患者相对频繁的事件可凭经验估计结果:死亡、并发症、残疾、病痛致病的危险因素未必是预后不良的因素:如:吸烟相对于肺癌如:低血压可以降低患急性心梗风险,但一旦
21、发生,反而成为不良预后体征如:雌激素的使用增加内膜癌的风险,但预后更好(实际上与检测偏倚有关)年轻的时候人找病上了年纪病找人EBM文献检索资源Medline美国国立医学图书馆数据库,自1966年,收录70余国家,3900多种杂志。PubMed最常见:http:/www.ncbi.nlm.nih.gov/PubMed/Embase欧洲生物医学文献数据库,收录3500余种杂志,以药物研究文献著名网址:http:/ biomedical literature datebase)中国医科院信息研究所开发,收录自1980年,1000多种中国生物医学期刊,汇编,共计170余万条参考资料王家良/刘鸣 21世
22、纪的临床医学-循证医学 2001年柴晓文 循证医学 2006.12中国中医药杂志 赵亚双 王滨有 随机对照试验及其应用 哈医大学报2003.6魏来 指南时代还是证据时代,知其然还是知其所以然 2011中国医学前沿杂志杨岫岩 怎样实践循证医学 2011.10中华风湿学杂志循证消化病学吴宏涛 周东 何俐 非随机对照试验的意义 2004 chinese J Evidence-Based Medicine刘建平 单个病例随机对照试验的设计与应用 2005 中国中西医结合杂志胡东升 流行病学 郑州大学公共卫生学院课件 王小钦 Meta 分析 复旦大学附属华山医院张科 等 浅谈非随机对照试验的系统评价 2002 循证医学杨岫岩 如何识别和控制临床中的混杂和偏倚 2000.4中华风湿学杂志杨岫岩 实践循证医学需要识别“循证广告”2005.18 中华医学杂志人群健康研究中流行病学原理和方法 姚晨 临床RCT研究中相关统计学问题 北京大学第一医院