《床科研数据的提取与管.ppt》由会员分享,可在线阅读,更多相关《床科研数据的提取与管.ppt(152页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、临床科研数据的提取与管理第三军医大学卫生统计学教研室第三军医大学卫生统计学教研室Department of Health statistics,TMMUDepartment of Health statistics,TMMU68752343 刘刘刘刘 岭岭岭岭1数据的数据的质质量控制量控制2数据管理中的几个常数据管理中的几个常见见问题问题3统计统计分析分析结结果与表达果与表达主 要 内 容(一)(一)研究研究设计(二)(二)收集收集资料料:完整、准确完整、准确(三)(三)整理整理资料料:核查、清洗核查、清洗(四)(四)分析分析资料料统计工作的基本步骤统计工作的基本步骤统计工作的基本步骤统计工作
2、的基本步骤 1数据的数据的质质量控制量控制(一)数据的来源与数据集(一)数据的来源与数据集观察性数据观察性数据实验性数据实验性数据科研数据科研数据观察性数据(观察性研究):卫生工作报表,病例资料观察性数据(观察性研究):卫生工作报表,病例资料观察性研究:客观地观察、记录和描述事物规律或现象的认识活观察性研究:客观地观察、记录和描述事物规律或现象的认识活动。动。实验性数据(实验性研究):临床病例资料,动物实验实验性数据(实验性研究):临床病例资料,动物实验记录记录实验性研究:人为控制实验条件或对研究对象施加一定干预措施实验性研究:人为控制实验条件或对研究对象施加一定干预措施所做的研究。所做的研究
3、。多中心临床实验或大型调查研究:样本量大,变量数多多中心临床实验或大型调查研究:样本量大,变量数多编号编号性别性别年龄年龄民族民族体重体重(kgkg)身高身高(cmcm)冠心病冠心病糖尿病糖尿病1 1男男7272汉汉78.5478.54169.0169.0有有无无2 2女女8181汉汉33.5033.50142.0142.0无无无无3 3男男9090回回65.8365.83170.0170.0无无可疑可疑4 4男男7272汉汉86.2686.26181.0181.0无无无无5 5女女7070其他其他69.4669.46158.5158.5无无有有735735男男7171汉汉88.0888.08
4、181.0181.0无无无无某地某地20022002年年735735例例6565岁以上老年人健康检查记录岁以上老年人健康检查记录casevariable数据矩阵数据矩阵编号编号性别性别年龄年龄民族民族体重体重(kgkg)身高身高(cmcm)冠心病冠心病糖尿病糖尿病1 1男男7272汉汉78.5478.54169.0169.0有有无无2 2女女8181汉汉33.5033.50142.0142.0无无无无3 3男男9090回回65.8365.83170.0170.0无无可疑可疑4 4男男7272汉汉86.2686.26181.0181.0无无无无5 5女女7070其他其他69.4669.46158
5、.5158.5无无有有735735男男7171汉汉88.0888.08181.0181.0无无无无某地某地20022002年年735735例例6565岁以上老年人健康检查记录岁以上老年人健康检查记录分析变量分析变量标识变量标识变量编号编号性别性别年龄年龄民族民族体重体重(kgkg)身高身高(cmcm)冠心病冠心病糖尿病糖尿病1 1男男7272汉汉78.5478.54169.0169.0有有无无2 2女女8181汉汉33.5033.50142.0142.0无无无无3 3男男9090回回65.8365.83170.0170.0无无可疑可疑4 4男男7272汉汉86.2686.26181.0181.
6、0无无无无5 5女女7070其他其他69.4669.46158.5158.5无无有有735735男男7171汉汉88.0888.08181.0181.0无无无无某地某地20022002年年735735例例6565岁以上老年人健康检查记录岁以上老年人健康检查记录反应变量反应变量解释变量解释变量解释变量解释变量:指示变量、分组变量、因素、协变量、预测变量等:指示变量、分组变量、因素、协变量、预测变量等反应变量反应变量:表示试验效应或观测结果的指标。:表示试验效应或观测结果的指标。注意:注意:变量名:英文、不超过变量名:英文、不超过8个字符,分类变量适当数量化处理。个字符,分类变量适当数量化处理。(
7、二)数据录入(二)数据录入 数据数据录入入是将研究收集到的各种信息是将研究收集到的各种信息转换为数据形数据形式,式,输入到入到计算机算机进行保存、管理的行保存、管理的过程。程。数据审核数据审核:对收集到的原始资料进行审查与核实的过程。:对收集到的原始资料进行审查与核实的过程。真实、准确、完整、标准真实、准确、完整、标准制定数据编码表制定数据编码表:使研究得到的信息数字化和标准化。:使研究得到的信息数字化和标准化。封闭性、开放性、缺失数据封闭性、开放性、缺失数据建立数据库建立数据库:运用专业的数据库管理软件。:运用专业的数据库管理软件。数据管理、查询、修改功能数据管理、查询、修改功能number
8、sexagenationalityweight(kg)height(cm)coronarydiabetes1 11 172721 178.5478.54169.0169.01 10 02 20 081811 133.5033.50142.0142.00 00 03 31 190902 265.8365.83170.0170.00 01 14 41 172721 186.2686.26181.0181.00 00 05 50 070704 469.4669.46158.5158.50 02 27357351 171711 188.0888.08181.0181.00 00 0原始数据录入格式原始
9、数据录入格式数据数据录入的原入的原则 1 1、方便方便录入入:将字符:将字符变量量转换成数成数值变量;量;2 2、便于核便于核查:一定要有:一定要有标识变量,以方便数据的核量,以方便数据的核对;3 3、易于易于转换:录入数据入数据时要考要考虑不同不同软件的要求;件的要求;4 4、利于分析利于分析:同一研究:同一研究课题的的结果最好果最好录成一个数据成一个数据库文件。文件。同一资料进行双人重复录入方法,应用程序对两同一资料进行双人重复录入方法,应用程序对两个数据库进行比对,核查错误。个数据库进行比对,核查错误。EpiData 特点特点n简单简单简单简单易学、易学、易学、易学、实实实实用性用性用性
10、用性强强强强n对计对计对计对计算机硬件要求不高算机硬件要求不高算机硬件要求不高算机硬件要求不高n调查调查调查调查表表表表设计设计设计设计便捷便捷便捷便捷n与与与与调查调查调查调查表形式一致的可表形式一致的可表形式一致的可表形式一致的可视视视视数据数据数据数据录录录录入界面入界面入界面入界面n数据核数据核数据核数据核查查查查功能功能功能功能强强强强大且大且大且大且实现简实现简实现简实现简便便便便 nEpiDataEpiData AnalysisAnalysis可用于一般的可用于一般的可用于一般的可用于一般的统计统计统计统计分析与制分析与制分析与制分析与制图图图图 n数据数据数据数据转换转换转换转
11、换功能功能功能功能强强强强大大大大 建立调查表文件建立调查表文件建立调查表文件建立调查表文件创建数据库创建数据库创建数据库创建数据库建立核查文件建立核查文件建立核查文件建立核查文件录入数据录入数据录入数据录入数据数据库管理数据库管理数据库管理数据库管理输出数据输出数据输出数据输出数据 EpiData的基本流程的基本流程数据数据库的的导出(出(Data in)SPSS文件文件SAS文件文件DBF文件文件 Stata文件文件REC文件1.二二.数据管理中的几个数据管理中的几个常常见问题见问题(一)数据的质量控制(一)数据的质量控制1 1、输入信息的有效性,即入信息的有效性,即幅度幅度检查;2 2、
12、输入信息相互之入信息相互之间的一致性,即的一致性,即逻辑检查;3 3、查漏:原始数据的漏:原始数据的编号与数据号与数据库的的编号核号核对;4 4、运用、运用统计软件件观察察频数分布是否异常;数分布是否异常;5 5、进行描述性行描述性统计,有无离群,有无离群值和缺失和缺失值。(二)变量的设置(二)变量的设置1 1、连续型型变量量的的输入:直接入:直接录入;入;2 2、离散型离散型变量量的的输入:数入:数值化化处理理。变量的量的设置方式:置方式:资料料类型、研究目的、型、研究目的、变量的量的分布形式、分布形式、统计方法的方法的应用条件。用条件。(三)缺失值处理(三)缺失值处理p 缺失缺失值主要来自
13、主要来自资料收集中的漏料收集中的漏报和漏填;和漏填;p 缺失缺失值应控制在数据控制在数据记录总量的量的10%10%以内;以内;p 注意将缺失注意将缺失值与与“0”0”区分开来,缺失区分开来,缺失值一般用一般用“.”.”表示;表示;p 缺失比例很小缺失比例很小时,可舍弃;缺失比例,可舍弃;缺失比例较大大时,可,可进行插行插补(不得已,慎用)。(不得已,慎用)。(四)离群数据的处理(四)离群数据的处理有无离群有无离群值?p 频数表、箱式数表、箱式图或直方或直方图可初步判断;可初步判断;p 线性回性回归方法判断。方法判断。离群值离群值(outlieroutlier)是指超出数据通常变化范围的特大)是
14、指超出数据通常变化范围的特大值或特小值的观测值。值或特小值的观测值。出出现离群离群值的的处理理 p 在离群在离群值附近多次抽附近多次抽样,了解数据的真,了解数据的真实结构;构;p 专业知知识与与统计方法方法结合。合。(五)统计学方法的应用条件(五)统计学方法的应用条件p 正态性检验正态性检验p 方差齐性检验方差齐性检验p 多重共线性判断多重共线性判断统计方法的正确选择1.三三.统计统计分析分析结结果与表果与表达达医学论著的基本结构医学论著的基本结构 摘摘 要要引引 言言1.1.材料与方法材料与方法2 2.结结 果果3.3.讨讨 论论AbstractIntroductionMaterials a
15、nd MethodsMaterials and MethodsResults Discussion统计表统计表统计图统计图摘摘 要要 Abstract对处理组和对照组的对处理组和对照组的对处理组和对照组的对处理组和对照组的主要统计结果主要统计结果主要统计结果主要统计结果进行概述进行概述进行概述进行概述:qq 均数(中位数、率),标准差(标准误)均数(中位数、率),标准差(标准误)均数(中位数、率),标准差(标准误)均数(中位数、率),标准差(标准误),P P 值值值值;qq 两组均数(率)之差或者两组均数(率)之差或者两组均数(率)之差或者两组均数(率)之差或者OROR值,值,值,值,95%9
16、5%可信区间(可信区间(可信区间(可信区间(CICI););););qq 多个观察指标的相关系数及其多个观察指标的相关系数及其多个观察指标的相关系数及其多个观察指标的相关系数及其P P 值等值等值等值等.q 简要说明研究背景和研究目的。简要说明研究背景和研究目的。q 给出文献分析的给出文献分析的综合复习综合复习结果:结果:如如如如组间差别组间差别组间差别组间差别(Difference Among GroupsDifference Among Groups););););P P 值值值值(P P-value)-value)等。等。等。等。q 采用循证医学的方法。采用循证医学的方法。引引 言言In
17、troduction材料与方法材料与方法Materials and MethodsMaterials and Methods统计表达统计表达 研究设计方案(Design of Research Methods)统计分析方法及软件(Analysis Methods and Software)目的:以使读者确认论文中所有统计分析结果的目的:以使读者确认论文中所有统计分析结果的目的:以使读者确认论文中所有统计分析结果的目的:以使读者确认论文中所有统计分析结果的 可靠性和研究结论的合理性。可靠性和研究结论的合理性。可靠性和研究结论的合理性。可靠性和研究结论的合理性。研究设计方案(Design of R
18、esearch Methods)qq 研究对象的来源和选择方法,包括观察对象的基本情况研究对象的来源和选择方法,包括观察对象的基本情况研究对象的来源和选择方法,包括观察对象的基本情况研究对象的来源和选择方法,包括观察对象的基本情况qq 需要说明诊断标准需要说明诊断标准需要说明诊断标准需要说明诊断标准qq病例入选标准、病例排除标准、病例剔除标准、疗效评价标准病例入选标准、病例排除标准、病例剔除标准、疗效评价标准病例入选标准、病例排除标准、病例剔除标准、疗效评价标准病例入选标准、病例排除标准、病例剔除标准、疗效评价标准。qq有无失访(失访比例有无失访(失访比例有无失访(失访比例有无失访(失访比例,
19、不可超过不可超过不可超过不可超过2020)、有无)、有无)、有无)、有无“知情同意知情同意知情同意知情同意”qq评价疗效有无遮蔽(评价疗效有无遮蔽(评价疗效有无遮蔽(评价疗效有无遮蔽(“单盲单盲单盲单盲Single Blind”Single Blind”、“双盲双盲双盲双盲Double Double Blind”Blind”或或或或“多盲多盲多盲多盲Multiple Blind”Multiple Blind”)等)等)等)等qq均衡性分析结果:影响因素(如年龄、性别、病情)均衡性分析结果:影响因素(如年龄、性别、病情)均衡性分析结果:影响因素(如年龄、性别、病情)均衡性分析结果:影响因素(如年
20、龄、性别、病情)qq样本量估计的依据样本量估计的依据样本量估计的依据样本量估计的依据(Sample Size)(Sample Size)qq常用统计方法简单说明常用统计方法简单说明常用统计方法简单说明常用统计方法简单说明:如如如如 检验、检验、检验、检验、t t t t 检验、单因素方差分析(检验、单因素方差分析(检验、单因素方差分析(检验、单因素方差分析(ANOVAANOVA)等;等;等;等;qq特殊的统计方法给出相应的参考文献特殊的统计方法给出相应的参考文献特殊的统计方法给出相应的参考文献特殊的统计方法给出相应的参考文献:如聚类分析如聚类分析如聚类分析如聚类分析(ClusterCluste
21、r)、生存分析生存分析生存分析生存分析(Survival AnalysisSurvival Analysis)等等等等;pp一般统计计算软件给出名称一般统计计算软件给出名称一般统计计算软件给出名称一般统计计算软件给出名称 如如如如SPSSSPSSSPSSSPSS、SASSASSASSAS、STATASTATASTATASTATA等等等等,EXCELEXCELEXCELEXCEL不能作为处理软件不能作为处理软件不能作为处理软件不能作为处理软件qq特殊的计算软件要给出软件的过程名特殊的计算软件要给出软件的过程名特殊的计算软件要给出软件的过程名特殊的计算软件要给出软件的过程名统计分析方法及软件(An
22、alysis Methods and Software)统计表达统计表达 统计图表(Statistical Graphs&Tables)结结 果果ResultsP 值的表达(Suitable Expression of P)统计指标(Statistical Indexes)数据精度(Numerical Precision)统计表统计表统计图统计图讨讨 论论Discussion统计解释统计解释 P P 值的解释(Interpretation of P)关联的解释(Interpretation of Association)因果的解释(Interpretation of Causation)r r
23、 值的解释(Interpretation of r)统计资料的分类统计资料的分类Statistical classification编号编号性别性别年龄年龄民族民族体重体重(kgkg)身高身高(cmcm)冠心病冠心病糖尿病糖尿病1 1男男7272汉汉78.5478.54169.0169.0有有无无2 2女女8181汉汉33.5033.50142.0142.0无无无无3 3男男9090回回65.8365.83170.0170.0无无可疑可疑4 4男男7272汉汉86.2686.26181.0181.0无无无无5 5女女7070其他其他69.4669.46158.5158.5无无有有735735男
24、男7171汉汉88.0888.08181.0181.0无无无无某地某地20022002年年735735例例6565岁以上老年人健康检查记录岁以上老年人健康检查记录计量计量计量计量计量计量计数计数计数计数计数计数等级等级1.1.计量资料(或定量变量)计量资料(或定量变量)measurment data ,quantitative data定义定义:测定每个观察单位的某项指标量的大小,:测定每个观察单位的某项指标量的大小,所得的资料称为计量资料。其变量值是定量的,一所得的资料称为计量资料。其变量值是定量的,一般带有度量衡或其它单位。般带有度量衡或其它单位。特点特点:每个观察单位的观察值之间有量的区
25、别。每个观察单位的观察值之间有量的区别。定定义义:将将观观察察单单位位按按某某种种属属性性或或类类别别分分组组计计数数,分组汇总得到各组观察单位数称为计数资料。分组汇总得到各组观察单位数称为计数资料。特特点点:计计数数排排列列是是无无序序分分组组,同同组组各各观观察察单单位位之之间间没没有有量量的的差差别别,但但各各组组间间有有质质的的不不同同,各各组组互互不不相容。相容。二项分类和多项分类二项分类和多项分类2.2.计数资料(或无序分类变量)计数资料(或无序分类变量)enumeration data,unordered category data3.3.等级资料(或有序分类变量)等级资料(或有
26、序分类变量)ranked data,ordinal category data 定义:定义:将观察单位按某个指标量的大小分成等级或将观察单位按某个指标量的大小分成等级或某种属性的不同程度分成等级后分组计数,分类汇总各某种属性的不同程度分成等级后分组计数,分类汇总各组的观察单位数称为等级资料。组的观察单位数称为等级资料。特点:特点:等级等级是是有序有序分组。同计数资料的区别是:分组。同计数资料的区别是:属属性性的的分组有程度的差别分组有程度的差别,各组按一定顺序排列;与计量,各组按一定顺序排列;与计量资料的区别是:资料的区别是:每个观察单位未确切定量每个观察单位未确切定量,所以又称为,所以又称为
27、半定半定量量资料。资料。常用的统计指标常用的统计指标Analysis Index 统计指指标可可用用于于描描述述性性的的统计分分析析,也也是是反反映映数数据据基基本本特特征征的的统计分分析析方方法法。并并可可使使人人们准准确确、全全面面地地了了解解数数据据资料料所所包包涵涵的的信信息息,以以便便于于在在此此基基础上上完完成成资料料的的进一一步步统计分析。分析。常用统计指标的特点及其应用场合常用统计指标的特点及其应用场合指标特点应用场合应用场合精确,易受极端值影响精确,易受极端值影响均匀分布的小样本数据或近似正态分布数据均匀分布的小样本数据或近似正态分布数据稳定,不受特大或特小稳定,不受特大或特
28、小值的影响值的影响应用范围广,特别是大样本偏态分布资料应用范围广,特别是大样本偏态分布资料粗糙,不受极端数值的粗糙,不受极端数值的影响影响小样本的探索性数据小样本的探索性数据同一资料,几何均数同一资料,几何均数 0.05 0.05 0.05 0.05 记为记为记为记为“NS”NS”NS”NS”,P P P P0.05 0.05 0.05 0.05 记为记为记为记为“*”“*”“*”“*”,P P P P0.01 0.01 0.01 0.01 记为记为记为记为“*”“*”“*”“*”提倡表达提倡表达 提倡报告精确提倡报告精确提倡报告精确提倡报告精确 P P P P 值值值值应给出检验统计量的实际
29、值应给出检验统计量的实际值p 相关系数保留相关系数保留2 2位小数;位小数;p 检验统计量,如检验统计量,如Chi-squareChi-square值、值、t t值保留值保留2 2位小数即可。位小数即可。p 计量资料的统计指标(均数、标准差、标准误、中位数、计量资料的统计指标(均数、标准差、标准误、中位数、百分位数等)的保留小数位数,应该与原始数据的保留百分位数等)的保留小数位数,应该与原始数据的保留小数位数相同;小数位数相同;p 计数资料的百分比保留计数资料的百分比保留1 1位小数,一般不超过位小数,一般不超过2 2位小数;位小数;病死率、发病率按惯例选择比例基数,如病死率、发病率按惯例选择
30、比例基数,如10001000,10000/10000/万,万,1010万万/10/10万等,或自行选择合适的比例基数,万等,或自行选择合适的比例基数,使率的表达至少有使率的表达至少有1 1位整数;位整数;数据的精确度数据的精确度 关于 应应应应用用用用条条条条件件件件:只只只只有有有有属属属属于于于于正正正正态态态态分分分分布布布布的的的的数数数数据据据据才才才才可可可可以以以以表表表表示示示示为为为为 ,虽虽虽虽属属属属于于于于正正正正态态态态分分分分布布布布,但但但但 出出出出现现现现负负负负数数数数 (即即即即 sss1RR1时时时时,可,可,可,可认为试验组发认为试验组发认为试验组发认
31、为试验组发生率大于生率大于生率大于生率大于对对对对照照照照组组组组;n当当当当RR1RR1时时时时,可,可,可,可认为试验组发认为试验组发认为试验组发认为试验组发生率小于生率小于生率小于生率小于对对对对照照照照组组组组;RR的可信区的可信区间间,应应采用自然采用自然对对数数进进行行计计算,即算,即应应求求RR的自然的自然对对数数值值ln(RR)和和ln(RR)的的标标准准误误SE(lnRR),其其计计算公式如下:算公式如下:nln(RR)的的1-可信区可信区间为间为:ln(RR)uSE(lnRR)nRR的可信区的可信区间为间为:Expln(RR)uSE(lnRR)n由由于于RR=1时时为为试试
32、验验因因素素与与疾疾病病无无关关,故故其其可可信信区区间间不不包包含含1时时为为有有统统计计学学意意义义;反反之之,其其可信区可信区间间包含包含1时为时为无无统计统计学意学意义义n阿斯匹林治阿斯匹林治疗组疗组的病死率的病死率p1=15/125,对对照照组组的病死的病死率率p0=30/120,其,其RR和可信区和可信区间为间为:nLn(RR)=ln0.48=-0.734 =0.289n故故RR的的95%的可信区的可信区间为间为:Expln(RR)1.96SE(lnRR)=exp-0.7341.960.289=0.272,0.846n该该例例RR的的95%的的可可信信区区间间为为0.2720.84
33、6,使使用用阿阿斯斯匹匹林林治治疗疗的的病病人人,其其病病死死率率小小于于对对照照组组,可可认认为为阿阿斯斯匹匹林林可可降降低低心心肌肌梗梗死死有效。有效。4、OR及其可信区及其可信区间间n优优优优势势势势比比比比OROR又又又又称称称称比比比比值值值值比比比比,指指指指病病病病例例例例组组组组中中中中暴暴暴暴露露露露人人人人数数数数与与与与非非非非暴暴暴暴露露露露人人人人数数数数的的的的比比比比值值值值除除除除以以以以对对对对照照照照组组组组中中中中暴暴暴暴露露露露人人人人数数数数与与与与非非非非暴暴暴暴露露露露人人人人数数数数的比的比的比的比值值值值。OROR计算的四格表计算的四格表计算的
34、四格表计算的四格表:组别组别 暴露暴露 非暴露非暴露 例数例数 病例病例组组 a b a b a+ba+b 非病例非病例组组 c d c d c+dc+d 合合计计 a+ca+c b+db+d a+b+c+da+b+c+dn当当所所研研究究疾疾病病的的发发病病率率较较低低时时,即即a和和c均均较较小小时时,OR近近似似于于RR,故故在在回回顾顾性性研研究究中中可可用用OR估估计计RR;n由由于于前前瞻瞻性性研研究究中中,OR的的可可信信区区间间与与RR的的可可信信区区间间很很相相近近,且且OR的的计计算算更更为为简简便便,因因此此,常常用用OR可可信信区区间间的的计计算算来来代代替替RR的的可
35、信区可信区间间的的计计算。算。nOR值值的解的解释释与与RR相同。相同。在在临临床床随随机机对对照照试试验验(RCT)中中,常常用用OR代代替替RR,但但必必须须注注意意使使用用条条件件,即即发发病率较低。病率较低。OR的的可可信信区区间间同同样样需需要要采采用用自自然然对对数数计计算算,其其ln(OR)的的标标准准误误SE(lnOR)按下式按下式计计算:算:nln(OR)的可信区的可信区间为间为:ln(OR)uSE(lnOR)nOR的可信区的可信区间为间为:Expln(OR)uSE(lnOR)OROR计算的四格表:计算的四格表:计算的四格表:计算的四格表:组别组别 暴露暴露 非暴露非暴露 例
36、数例数 病例组病例组 a b a+ba b a+b 非病例组非病例组 c d c+dc d c+d 合计合计 a+c b+d a+b+c+da+c b+d a+b+c+d阿斯匹林治阿斯匹林治疗疗心肌梗死的效果心肌梗死的效果试试估估计计其其OR的的95%可可信区信区间间:nOR的的95%可信区可信区间为间为:Expln(OR)1.96SE(lnOR)=exp-0.8941.960.347 =0.207,0.807n该该例例OR的的95%可可信信区区间间为为0.2070.807,可可认为认为阿斯匹林治阿斯匹林治疗疗心肌梗死有效。心肌梗死有效。5.RRR及可信区及可信区间间nRRR为为相相对对危危险
37、险度减少率度减少率(relative risk reduction),其其计计算公式算公式为为:RRR=|CER-EER|/CER=1-RRnRRR的可信区的可信区间间可由可由1-RR计计算得到算得到:如前例如前例RR=0.48,95%可信区可信区间为间为0.2720.846则则其其RRR=1-0.48=0.52n95%可信区可信区间为间为0.154 0.728nRRR反反映映了了某某试试验验因因素素使使结结果果的的发发生生率率增增加加或或减减少的相少的相对对量量,但无法衡量但无法衡量发发生率增减的生率增减的绝对绝对量。量。n如如:试试验验人人群群中中某某病病的的发发生生率率为为39%,对对照
38、照组组人人群的群的发发生率生率为为50%,则则RRR=(50%-39%)/50%=22%n但但是是,若若在在另另一一研研究究中中,试试验验组组的的疾疾病病发发生生率率为为0.39/10万万,对对照照组组的的疾疾病病发发生生率率为为0.50/10万万,其其RRR仍仍为为22%.6.RRInRRI,相相对对危危险险度度增增加加率率(relative risk increase,RRI),试试验验组组中中某某不不利利结结果果的的发发生生率率为为EERb,对对照照组组中中某某不不利利结结果果的的发发生生率率为为CERb,RRI可按下式可按下式计计算:算:RRI=|EERb-CERb|/CERbn该该指
39、指标标可可反反应应采采用用试试验验因因素素处处理理后后,患患者者的的不利不利结结果增加的百分比。果增加的百分比。7.RBInRBI,相相 对对 获获 益益 增增 加加 率率(relative benefit increase,RBI),试试验验组组中中某某有有益益结结果果的的发发生生率率为为EERg,对对照照组组某某有有益益结结果果的的发发生生率率为为CERg,RBI可按下式可按下式计计算算:RBI=|EERg-CERg|/CERgn该该指指标标可可反反应应采采用用试试验验因因素素处处理理后后,患患者者的的有益有益结结果增加的百分比。果增加的百分比。8.ARR及可信区及可信区间间n绝对绝对绝对
40、绝对危危危危险险险险度减少率度减少率度减少率度减少率(absolute risk reduction,ARR),(absolute risk reduction,ARR),其其其其计计计计算公式算公式算公式算公式为为为为:ARR=|CER-EER|ARR=|CER-EER|nARRARR的可信区的可信区的可信区的可信区间为间为间为间为:ARRuARRu SESEn例如:例如:试验组试验组某病某病发发生率生率为为15/125=12%对对照照组组某病某病发发生率生率为为30/120=25%,其其ARR=25%-12%=13%n标标准准误为误为95%的可信区的可信区间为间为:ARRuSE =(0.1
41、3-1.960.049,0.13+1.960.049)=(3.4%,22.6%)该该治愈率的治愈率的95%的可信区的可信区间为间为3.4%22.6%9.ARIn绝绝对对危危险险度度增增加加率率(absolute risk increase,ARI),即即试试验验组组中中某某不不利利结结果果发发生生率率EERb与与对对照照组组某不利某不利结结果果发发生率生率CERb的差的差值值n不不利利结结果果(bad outcomes)如如:死死亡亡、复复发发、无无效等,其效等,其计计算公式算公式为为:ARI=|EERb-CERb|n该该指指标标可可反反映映采采用用试试验验因因素素处处理理后后,患患者者的的不
42、不利利结结果增加的果增加的绝对值绝对值。10.ABIn绝绝对对受受益益增增加加率率(absolute benefit increase,ABI),即即试试验验组组中中某某有有益益结结果果发发生生率率EERg与与对对照照组组某有益某有益结结果果发发生率生率CERg的差的差值值n有有益益结结果果(good outcomes)如如:治治愈愈、显显效效、有有效等,其效等,其计计算公式算公式为为:ABI=|EERg-CERg|n该该指指标标可可反反映映采采用用试试验验因因素素处处理理后后,患患者者的的有有益益结结果增加的果增加的绝对值绝对值。数数值资值资料的指料的指标标1.WWD(weighted me
43、an difference),加加权权均数差均数差,某个研究的两均数差某个研究的两均数差d可按下式可按下式计计算算n从从公公式式可可见见,加加权权均均数数差差(weighted mean difference,WWD)即)即为为两均数的差两均数的差值值。n该该指指标标以以试试验验原原有有的的测测量量单单位位,真真实实地地反反映映了了试试验验效效应应,消消除除了了绝绝对对值值大大小小对对结结果果的的影影响响,在在实实际际应应用用时时,该该指指标标容容易易被被理理解解和解和解释释。2.SMD(standardised mean difference),标标准准化均数差化均数差 某个研究的某个研究的
44、标标准化均数差准化均数差d,可按下式,可按下式计计算:算:标标准化均数差准化均数差d的方差的方差S2可按下式可按下式计计算:算:nSMD可可简简单单地地理理解解为为两两均均数数的的差差值值再再除除以以合合并并标标准准差差的的商商,它它不不仅仅消消除除了了某某研研究究的的绝绝对对值值大大小小的的影影响响,还还消消除除了了测测量量单单位位对对结结果果的的影影响响。因因此此,该该指指标标尤尤其其适适用用于于单单位位不不同同或或均均数数相相差差较较大的数大的数值资值资料分析。料分析。n但但是是,标标准准化化均均数数差差(SMD)是是一一个个没没有有单单位位的的值值,因因而而,对对SMD分分析析的的结结果果解解释释要要慎慎重。重。