《临床试验的数据管理与统计分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《临床试验的数据管理与统计分析ppt课件.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、北京大学第一医院医学统计室北京大学第一医院医学统计室(66115216)姚 晨临床试验监查CRF统计分析统计分析统计与临床报告统计与临床报告SFDA/CDESFDA/CDE批准与上市批准与上市计划和安排数据管理数据管理一、临床试验的数据管理一、临床试验的数据管理将在临床试验中产生的大量数据及时填写、准确录入、计算机辅助人工审核校对、疑问问答校正,数据盲态下审核与锁定等全过程。 数据产生的过程数据产生的过程n研究者填写研究者填写CRF表表n监察员核查、传递给数据管理单位监察员核查、传递给数据管理单位n根据根据CRF建立录入程序建立录入程序n双人双份独立录入双人双份独立录入n核查并产生数据疑问表(
2、核查并产生数据疑问表(DQF)n监察员将监察员将DQF交研究者复核并回答交研究者复核并回答n数据库修改并核查数据库修改并核查n不良事件及合并用药编码不良事件及合并用药编码n盲态下的数据审核盲态下的数据审核n数据锁定数据锁定n数据传递(统计分析人员)数据传递(统计分析人员)数据管理流程项目启动管理计划核查计划CRF注释录入程序核查程序数据录入疑问管理临床试验中心质量检查数据关闭管理报告 数据审核数据审核数据锁定数据传递数据管理计划(DMP) 阐述该项目的数据管理过程、时间约定、项目组成员、数据核查计划、关键指标及非关键指标的约定、疑问管理方式等。 该计划由项目申办单位、统计单位和数据管理单位签署
3、,做为该项目数据管理的依据。核查与疑问管理数据核查计划数据核查程序疑问表(DQF)的产生DQF的回答DQF的返回及处理数据核查目的 项目核查人员对CRF表中的各个指标的数值和相互关系根据临床试验方案要求进行核查,对于缺失、逻辑矛盾、有误或不能够确定的数据,以疑问表的形式由临床试验监查员传递给临床试验中心,由研究者对疑问做出回答。 数据核查计划通用数据项核查条件统一描述按病例报告表页码和各页数据项内容顺序撰写。所有已进入数据库的数据均需描述核查条件对各数据项应描述其核查范围和发疑问或确认的标准内容完成相同的页,可合并撰写(如各访视内容) 核查计划传递给申办方,申办方审核并提出修改意见核查计划签字
4、后方生效数据核查程序 核查程序是根据数据检查计划,在SAS 环境下按数据核查计划内容编写的核查程序。 主要检查CRF表中数据缺失、误填、数据逻辑矛盾等问题。程序核查后人工校对数据疑问常见类型1 、补充补充: 病例报告表中有缺失的项目,或字迹不清楚的数据。2、 确认确认: A.入选/排除标准的确认: B.实验室检查:数值与临床意义判断与各个中心提供的正常值范围不一致。 C.时间的确认:所填写的时间不在试验时间范围内;或所填写的访视时间不在方案要求的访视时间窗内。 D.合并用药的确认:填写数据与各访视所填内容有矛盾;使用了方案中明确禁止的药物,药物名称无法编码的。 E.不良事件的确认:填写数据与各
5、访视所填内容有矛盾;各项之间的逻辑关系有矛盾;判定为严重不良事件。不良事件描述不清楚,无法做编码的。DQF的提问方式1、XX项数据缺失,请补充2、出生日期为XXXX年XX月XX日,请确认3、WBC测定值为11x109/L,临床意义为“正常”,请确认4、访一时间为XXXX年XX月XX日,访二时间为XXXX年XX月XX日,不在时间窗内,请确认5、不良事件:“XXXX”,为方便编码,请进一步详细描述疑问表式样举例DQF的回答 根据问题,查阅原始资料和CRF表所填内容,慎重回答 如果某一数据的修改,会影响其它数据时,请一并回答编码(Coding)为便于统计分析,将研究者填写的合并用药和不良事件根据相应
6、标准进行规范化处理的过程。不良事件编码:不良事件编码: 1、如将上感、感冒等统一编码为上呼吸道感染 2、如将恶心呕吐拆分为两个AE编码,分别编码为“恶心”和“呕吐”合并用药编码合并用药编码(按药品通用名编码按药品通用名编码) EPIAO、罗可曼、利血宝和济脉欣等均编码为“红细胞生成素” 不良事件 COSTART (FDA) WHO ART (WHO) MedDRA诊断和处理 ICD-10-CM药物 WHO Drug (WHO) PDR患者数据列表 中止试验患者 方案偏离 从疗效分析中剔除的患者 人口统计学数据 依从性和/或药物浓度数据(如果有) 个例疗效反应数据 不良事件列表(每名患者) 按患
7、者列表的个例实验室检查值(管理当局要求时)ICH E3(ICH E3(临床试验报告的结构与内容临床试验报告的结构与内容): Sec.16.2): Sec.16.2患者表格 人口统计学数据的汇总图表 有效性数据的汇总图表 安全性数据的汇总图表a)a) 不良事件的描述不良事件的描述b)b) 死亡、其它严重不良事件以及其它重要的不良事件清单死亡、其它严重不良事件以及其它重要的不良事件清单c)c) 死亡、其它严重不良事件以及某些其它重要的不良事件叙述死亡、其它严重不良事件以及某些其它重要的不良事件叙述d)d) 实验室检查异常值清单(每名患者)实验室检查异常值清单(每名患者)ICH E3(ICH E3(
8、临床试验报告的结构与内容临床试验报告的结构与内容): ): Sec.14.1-14.3临床试验数据盲态下审核是指在完成临床试验数据盲态下审核是指在完成数据核查、疑问解答结束,数据库关闭后数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审直到揭盲前,对数据库数据再次进行的审核与评判。核与评判。参加数据参加数据审核会议审核会议人员人员,一般由主要,一般由主要研究者、统计分析员、数据管理员、监查研究者、统计分析员、数据管理员、监查员和申办者员和申办者组成。组成。1、对双盲临床试验中的盲态进行审核。、对双盲临床试验中的盲态进行审核。2、对数据中存在的需讨论的问题做出决定,、对数据
9、中存在的需讨论的问题做出决定,重点在分析并决定统计分析人群。重点在分析并决定统计分析人群。 3、对数据的整体质量做出评估。、对数据的整体质量做出评估。4、讨论并定稿统计分析计划。、讨论并定稿统计分析计划。 5、决定是否锁定数据与揭盲。、决定是否锁定数据与揭盲。 1、数据管理员应准备一份数据管理报告,内、数据管理员应准备一份数据管理报告,内容至少应包括:容至少应包括:数据管理的过程及一般情况介绍、病例入数据管理的过程及一般情况介绍、病例入组及完成情况组及完成情况(含脱落受试者清单)(含脱落受试者清单) 、判断、判断统计分析人群时涉及的项目及需讨论并解决的统计分析人群时涉及的项目及需讨论并解决的问
10、题(问题(入选入选/排除标准检查、完整性检查、逻排除标准检查、完整性检查、逻辑一致性检查、离群数据检查、时间窗检查、辑一致性检查、离群数据检查、时间窗检查、合并用药检查、不良事件检查等)合并用药检查、不良事件检查等)2、数据管理理员准备一份关键变量的清单,、数据管理理员准备一份关键变量的清单,于会议前交相关人员进行会前审核以便于会议前交相关人员进行会前审核以便更充分地发现并解决问题。更充分地发现并解决问题。 3、如果是双盲临床试验,申办方将各中心、如果是双盲临床试验,申办方将各中心随试验用药下发的应急信件收回,交盲随试验用药下发的应急信件收回,交盲态审核用。态审核用。4、提交临床试验总盲底。、
11、提交临床试验总盲底。 1、全体参会人员通过对总盲底及应急信件的、全体参会人员通过对总盲底及应急信件的检查,对双盲临床试验的盲态做出判断。检查,对双盲临床试验的盲态做出判断。 2、数据管理员报告数据管理的一般情况及数、数据管理员报告数据管理的一般情况及数据库中存在的需要讨论解决的条目。据库中存在的需要讨论解决的条目。 3、主要研究者、申办方代表、统计分析人员、主要研究者、申办方代表、统计分析人员、数据管理员共同就数据管理员提交的问题数据管理员共同就数据管理员提交的问题进行讨论并做出处理决定。进行讨论并做出处理决定。 4、与会人员讨论并决定统计分析人群。、与会人员讨论并决定统计分析人群。5、统计分
12、析计划的修正与定稿。、统计分析计划的修正与定稿。6、决定是否锁定数据。、决定是否锁定数据。7、当揭盲条件成立时,具体执行揭盲。、当揭盲条件成立时,具体执行揭盲。 最后签署盲态审核决议,将锁定后最后签署盲态审核决议,将锁定后的数据交统计分析人员进行统计分析。的数据交统计分析人员进行统计分析。 二、临床试验统计分析二、临床试验统计分析 各阶段受试者流各阶段受试者流程。特别是报告随机程。特别是报告随机分配到各组的人数、分配到各组的人数、接受意向治疗接受意向治疗(ITT)的的人数、按方案完成治人数、按方案完成治疗疗(PP)的人数以及对的人数以及对主要结局分析的人数。主要结局分析的人数。描述与计划的研究
13、方描述与计划的研究方案偏离的情况和理由。案偏离的情况和理由。意向治疗分析 临床试验有效性分析应保罗所有的随机临床试验有效性分析应保罗所有的随机化后的受试者,也即原计划好处理(治疗)化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的分析际上完成的受试者。按这种原则所作的分析是最好的分析,其结果是每一个随机分配到是最好的分析,其结果是每一个随机分配到试验组或对照组的受试者都应该完整地随访,试验组或对照组的受试者都应该完整地随访,记录研究结果,而不管他们的依从性如何。记录研究结果,而不管他们的依从性如何
14、。 ITT原则原则(意向治疗原则、(意向治疗原则、Intention-To-Treat Principle)l全分析集(全分析集(Full Analysis SetFull Analysis Set)FASFAS 是指尽可能接近符合意向治疗分析原则是指尽可能接近符合意向治疗分析原则(ITT)(ITT)的理想的的理想的受试者集。该数据集是从所有随机化的受试者中,以最少受试者集。该数据集是从所有随机化的受试者中,以最少的和合理的方法剔除受试者后得出的。在选择全分析集进的和合理的方法剔除受试者后得出的。在选择全分析集进行统计分析时,对主要指标缺失值的估计,可以采用最接行统计分析时,对主要指标缺失值的
15、估计,可以采用最接近的一次观察值进行结转。近的一次观察值进行结转。 l符合方案集符合方案集(Per Protocol Set)(Per Protocol Set) 符合方案集是全分析集的一个子集,在这个数据集中符合方案集是全分析集的一个子集,在这个数据集中每位受试者是依从性好,不违背方案。一般是指全分析集每位受试者是依从性好,不违背方案。一般是指全分析集中至少符合下列三个条件的受试者。中至少符合下列三个条件的受试者。 主要指标的基线值完备。主要指标的基线值完备。 不违背方案,符合入选排除标准,未合并使用方案规定不能用药物不违背方案,符合入选排除标准,未合并使用方案规定不能用药物 依从性好依从性
16、好二、随机入组病例特征描述l基线定义为随机入组时间,病例特征一般包括基线定义为随机入组时间,病例特征一般包括为患者的人口学信息、饮食运动情况、疾病情为患者的人口学信息、饮食运动情况、疾病情况等。况等。l根据变量的数字特征,采用根据变量的数字特征,采用t检验检验/Wilcoxon秩秩和检验对患者年龄、身高、体重、病程、生命和检验对患者年龄、身高、体重、病程、生命体征等定量数据进行比较。采用卡方检验体征等定量数据进行比较。采用卡方检验Fisher确切概率检验或者确切概率检验或者Wilcoxon秩和检验对秩和检验对患者的性别、饮食控制、运动治疗、降糖药物患者的性别、饮食控制、运动治疗、降糖药物治疗史
17、、疾病史等分类变量进行基线比较。治疗史、疾病史等分类变量进行基线比较。l基线描述分析采用基线描述分析采用FAS数据集。数据集。 三、有效性评价(定量指标) 对基线和不同访视点及其相对基线的评价指标变化进行统计描述,计算例数、均数、标准差、中位数、最小值、最大值。 采用协方差分析(ANCOVA)模型对治疗前后的评价指标变化进行两组间比较,此分析模型以基线评价指标为协变量,考虑分组、中心的作用。在此模型的基础上,计算各组的最小二乘均数 (LSMEANS)、95% 可信区间以及两组变化值之差的的最小二乘均数 (LSMEANS)、95% 可信区间。对各研究中心结果的一致性的检验,应用在上述模型中增加治
18、疗分组与研究中心交互作用项的协方差模型分析,并在0.10水平判断交互项是否有意义,即:是否存在交互作用。此外,对每组各指标治疗前后的变化将采用配对t检验进行比较。三、有效性评价(定性指标) 对定性指标对定性指标(如治疗是否成功如治疗是否成功),分别,分别对各访视点对各访视点(包括终点包括终点)按该指标的分类情按该指标的分类情况进行描述,计算各分类的例数和百分数,况进行描述,计算各分类的例数和百分数,在在=0.05显著水平下,采用按中心分层的显著水平下,采用按中心分层的CMH-2检验对两组进行比较。以此模型为检验对两组进行比较。以此模型为基础计算评价终点时该指标的基础计算评价终点时该指标的95%
19、可信区可信区间。间。 应用应用协方差分析协方差分析(COANOVA)在在18周时评价周时评价SISBP变化这一主要终点,以研究中心和治疗方法变化这一主要终点,以研究中心和治疗方法的因素,基线的因素,基线SISBP为协变量。计算每个治疗组从为协变量。计算每个治疗组从基线变化的基线变化的最小二乘均数最小二乘均数和和95%CI。计算。计算95%CI显示最小二乘均数的差异。如果双侧显示最小二乘均数的差异。如果双侧95%CI显示的显示的差异小于差异小于6mmHg(18周时氯沙坦组周时氯沙坦组SISBP平均变化平均变化值值-氨氯地平为主治疗的平均氨氯地平为主治疗的平均SISBP变化值变化值),则认为,则认
20、为氯沙坦为主的治疗氯沙坦为主的治疗不劣于不劣于氨氯志平为主的治疗。根据氨氯志平为主的治疗。根据95%CI评价组内变化值。研究规模可以提供评价组内变化值。研究规模可以提供90%的把握度,证实的把握度,证实SISBP下降显示氯沙坦为主的治疗下降显示氯沙坦为主的治疗不劣于氨氯地平为主的治疗。不劣于氨氯地平为主的治疗。统计学新名词统计学新名词1、协方差分析、协方差分析(协变量协变量)2、95%CI3、最小二乘均数、最小二乘均数4、不劣于、不劣于(非劣效非劣效)两组比较的类型优效优效(Superiority): 或或 “试验组试验组(E)优于优于对照组对照组(C )” 等效等效(Equivalence)
21、: = 或或 “试验组试验组(E)与对照组与对照组(C )相当相当”非劣效非劣效(Non-inferiority ): 或或 “试验组试验组(E) 与对照组与对照组(C ) 差不多差不多”无效假设:无效假设:试验组与对照组均数相等试验组与对照组均数相等 Ho: T-C=0 备择假设:备择假设:试验组与对照组均数不等试验组与对照组均数不等 H1: T-C0 推论结果推论结果 拒绝拒绝不拒绝不拒绝假假设设正确正确错误错误 把握度把握度 1 - 假设被告无罪(犯罪嫌疑人)原告辩护律师获胜阳性对照试验的优效性检验阳性对照试验的优效性检验(P0.05)(P0.05)非劣效非劣效/等效等效(错错!) 误解
22、误解?检验假设的构建和检验用统计量结论的推断 可信区间提供一个围绕某统计量可信区间提供一个围绕某统计量(如样本均数如样本均数)的的范围,这个范围可以以一定的可信度包含相应范围,这个范围可以以一定的可信度包含相应的参数的参数(如总体均数如总体均数).例如,样本均数的例如,样本均数的 95% 可信区间可以解释为:可信区间可以解释为:“有有95%的把握认为总体均数在这个围绕样本的把握认为总体均数在这个围绕样本均数的区间内均数的区间内.)观察到试验组与对照组成功率之差观察到试验组与对照组成功率之差 如:如:- 2% (样本率样本率)200 名受试者名受试者, 有效性评价指标有效性评价指标-成功率,成功
23、率,试验药试验药: 88%, 对照药对照药: 90%, 95% CI: (-8.6% 4.6%) 4.6%- 8.6%0%总体率范围总体率范围l建立可信区间与进行假设检验的过程几乎建立可信区间与进行假设检验的过程几乎是相同的是相同的:二者均需要标准误、统计量的抽二者均需要标准误、统计量的抽样分布,二者均找到统计量的判断界值样分布,二者均找到统计量的判断界值. l如果一个可信区间的上限低于另一个可信如果一个可信区间的上限低于另一个可信区间的下限,那么两样本区间的下限,那么两样本 t 检验也会同时检验也会同时提示两均数不相等提示两均数不相等.优效的定义“E C” 的结果并非的结果并非100%可信可
24、信差差好好C CE E“E E 的真的真值值”因为因为 E C E C 0, 差差 好好E E C C 0 0 E C 的的 95% 可信区间可信区间 包含在区间包含在区间 (0, ) 内内 假设假设 E = C 的检验结果:的检验结果: P0.05 优效性试验的统计分析试验组试验组(E)是否优于对照组是否优于对照组(C)?步骤步骤从试验结果判断差异的大小从试验结果判断差异的大小 CI 包含于包含于 (0, ) 假设检验的假设检验的 p值值 0.05(有统计学意义有统计学意义) 列出实际列出实际P值表明其对差异的支持程度值表明其对差异的支持程度如果统计学有意义,判断差异的临床价值如果统计学有意
25、义,判断差异的临床价值优效: E C 的 95% 可信区间强支持优效强支持优效支持优效支持优效不支持优效不支持优效0 0试验组更好试验组更好对照组更好对照组更好p = 0.002p = 0.002p = 0.05p = 0.05p = 0.2p = 0.2()等效性试验的统计分析E 是否等效于是否等效于 C? 或或, 确定差异在事先定好的范围确定差异在事先定好的范围 内内步骤步骤选择一个临床等效的界值选择一个临床等效的界值 计算差异的计算差异的 95% 可信区间是否在可信区间是否在 ( , )内内等效: E C 的 95% 可信区间支持等效支持等效不支持等效不支持等效0 0试验组好试验组好对照
26、组好对照组好( ( ( () ) ) )不支持等效不支持等效 + + 非劣效的定义绝对的相等绝对的相等 E = C 是不可能的是不可能的非劣效非劣效: E 与与 C相近相近,可以差一些,但不能太大,可以差一些,但不能太大,具体根据事先确定的界值具体根据事先确定的界值 判断判断差差好好 E E C C 0 0 95% 可信区间的下限大于可信区间的下限大于 .非劣效试验的统计分析 E 是否非劣于是否非劣于C(至少与至少与C一样好)一样好)? 或或, E与与 C (阳性对照阳性对照) 的差距在界值的差距在界值 以内以内 步骤步骤选择临床非劣效的界值选择临床非劣效的界值 计算差异的计算差异的 95%
27、可信区间是否在可信区间是否在( , )内内非劣效: E C 的 95% 可信区间支持非劣支持非劣0 0试验组好试验组好对照组好对照组好( ( () ) )不支持非劣不支持非劣 非劣效与优效比较对照组好对照组好试验组好试验组好优效优效临床劣效临床劣效临床非劣效,但统计学临床非劣效,但统计学劣效劣效0 0 E-C的的95% CI 为评价某治疗糖尿病新药的有效性,采用随机、双盲双模拟、阳性对照药平行对照、多中心临床研究设计方案,整个试验过程历时18周,其中药物治疗16周,以16周测定的周测定的HbA1c 相对基线相对基线(0周周)变化值变化值作为主要疗效指标作为主要疗效指标。根据临床经验规定如果试验
28、组主要疗效指标不比阳性对照药差0.3,即可判定试验药有效,必要时还可进一步评价是否优于对照药。 这里提出的是一个非劣效检验的问题,根据对照药的有效性,由临床专家提出了0.3这一非劣效的标准,即:当两组主要疗效指标的总体差值不超过0.3时,该差距在临床上没有实际意义,认为两组药物疗效相当。 1、主要疗效指标治疗前后变化2、各中心主要疗效指标治疗前后变化3、主要疗效指标中心效应分析ANOVA数据的图形表达 男女男女男女男女l最小二乘法最小二乘法(最早称为回归分析法最早称为回归分析法)是一种数学优化是一种数学优化技术,它通过最小化误差的平方和找到一组数据的技术,它通过最小化误差的平方和找到一组数据的
29、最佳函数匹配最佳函数匹配,由著名的英国生物学家、统计学家由著名的英国生物学家、统计学家道尔顿(道尔顿(F.Gallton)达尔文的表弟所创。达尔文的表弟所创。l ANOVA是利用线性回归模型研究变量之间存在关是利用线性回归模型研究变量之间存在关系系 。l最小二乘均数最小二乘均数(LSmeans)是校正其他因素影响后的是校正其他因素影响后的估计的独立效应大小,其估计的独立效应大小,其95%CI为总体效应大小。为总体效应大小。ANOVA中的最小二乘均数(LSmeans)4、主要疗效指标有效性分析有效性判定: 试验组 对照组 差值的 95% CI不支持非劣不支持非劣支持非劣支持非劣( () )0 0
30、对照组好试验组好 0.20.20.10.1-0.1-0.1-0.5-0.5-0.4-0.4-0.3-0.3-0.2-0.20.30.30.40.40.50.5( () )- -0.140.14- -0.370.370.090.09( () )支持优效支持优效l患者暴露于研究药物的时间患者暴露于研究药物的时间 研究时间(天)研究时间(天)=(末次随访日期初诊日期)(末次随访日期初诊日期)+ 1 治疗时间(天)治疗时间(天)= 按照患者实际用药天数计算按照患者实际用药天数计算 患者用药依从性患者用药依从性=(发药量剩余量)应服药数量(发药量剩余量)应服药数量100%, l安全性评价指标安全性评价指
31、标 生命体征生命体征(心率、收缩压、舒张压)(心率、收缩压、舒张压)、体重、体重、 实验室检查实验室检查(心电图心电图) 不良事件不良事件 四、安全性评价四、安全性评价l生命体征、体重:对基线和每次访视时检查结果生命体征、体重:对基线和每次访视时检查结果进行定量描述,组内采用配对进行定量描述,组内采用配对t检验,组间采用检验,组间采用两组两组t检验进行比较。检验进行比较。l心电图:采用治疗前后交叉表的形式描述各治疗心电图:采用治疗前后交叉表的形式描述各治疗周期心电图变化。周期心电图变化。l实验室检查:采用治疗前后交叉表的形式定性描实验室检查:采用治疗前后交叉表的形式定性描述其有临床意义的变化。述其有临床意义的变化。l不良事件的种类、严重程度、发生频率及与研究不良事件的种类、严重程度、发生频率及与研究药物的关系将列表描述。药物的关系将列表描述。安全性评价统计分析方法安全性评价统计分析方法Thank you联系人:姚晨问题与解答