《临床研究中常用统计分析方法及选择知识讲解.ppt》由会员分享,可在线阅读,更多相关《临床研究中常用统计分析方法及选择知识讲解.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、临床科研中临床科研中常用统计常用统计(tngj)(tngj)方法及方法及选择选择2014.6 CQMU.PB第一页,共39页。u统计(tngj)学方法有什么用?u合理选择统计(tngj)方法的四个因素u数据资料的描述u数据资料的组间比较u变量间关系研究主要(zhyo)内容第二页,共39页。一张关于(guny)统计学的图片一、统计学方法(fngf)有什么用?第三页,共39页。例子例子1:一研究者宣布找到一种治疗某病的新药,试:一研究者宣布找到一种治疗某病的新药,试验的结果验的结果(ji gu)如下:如下:药物例数有效有效率新药604270%安慰剂502550%该新药是否该新药是否(sh fu)值
2、得推广?值得推广?几个几个(j)例子例子假设检验及临床优效性检验假设检验及临床优效性检验第四页,共39页。例子例子(l zi)2(l zi)2:英国某年全人口统计资料:英国某年全人口统计资料矛盾:移民组的发病率在各个矛盾:移民组的发病率在各个(gg)年龄组均高于英格兰和年龄组均高于英格兰和威尔士组,为什么它的合计发病率反而低?威尔士组,为什么它的合计发病率反而低?分析中混杂分析中混杂(hnz)因素的控制因素的控制第五页,共39页。胃癌胃癌(wi i)228 235 143 187 250 胃炎胃炎 100 153 178 143 200 非胃病非胃病 98 123 170 100 120 例子
3、例子3 3:为鉴别胃癌、胃炎、非胃病患者,各测定了:为鉴别胃癌、胃炎、非胃病患者,各测定了5050名对象的铜兰名对象的铜兰蛋白等指标,其中铜兰蛋白的观察蛋白等指标,其中铜兰蛋白的观察(gunch)(gunch)结果如下结果如下:问:三种人的铜兰蛋白有无不同?问:三种人的铜兰蛋白有无不同?能否根据测定的铜兰蛋白数据能否根据测定的铜兰蛋白数据(shj)对患者进行初步诊断对患者进行初步诊断?假设检验及判别诊断假设检验及判别诊断第六页,共39页。结局指标:心性结局指标:心性(xnxng)死亡死亡 预后因素:年龄、性别、高血压病、心梗位置、心梗分级、预后因素:年龄、性别、高血压病、心梗位置、心梗分级、传
4、导阻滞、溶栓治疗,传导阻滞、溶栓治疗,.,等,等例子例子4 4:研究心肌梗死患者预后:研究心肌梗死患者预后(yhu)(yhu)的影响因素,以的影响因素,以是否发生心性死亡作为观察结果指标,对是否发生心性死亡作为观察结果指标,对116116名心梗患者名心梗患者的的2222个可能影响预后个可能影响预后(yhu)(yhu)的因素进行观察和记录的因素进行观察和记录哪些预后因素与发生心性哪些预后因素与发生心性(xnxng)(xnxng)死亡有关系死亡有关系?关系的强度如何?关系的强度如何?影响因素筛选影响因素筛选回归分析回归分析第七页,共39页。统计学在医学(yxu)科研中作用n统计学是进行医学科研的重
5、要工具n满足统计学原则要求是保障医学科研科学性的前提n采用恰当的统计学方法是研究结论可靠、可信的前提n课题申报、论文(lnwn)撰写均有明确的统计学要求第八页,共39页。u研究设计(shj)u分析目的u资料类型u数据特征二、合理选择统计方法(fngf)的四个因素第九页,共39页。n完全随机设计(成组设计)完全随机设计(成组设计)n-最常见,最易实施的实验设计方案最常见,最易实施的实验设计方案n-将研究将研究(ynji)(ynji)对象随机分配到几个组,然后对象随机分配到几个组,然后做实验做实验n配对设计配对设计(区组设计区组设计)n-将具有相似特征的研究将具有相似特征的研究(ynji)(ynj
6、i)对象配成对子,对象配成对子,然后再将每个对子的对象随机分配到两个组进行实然后再将每个对子的对象随机分配到两个组进行实验验n-常见形式:同源配对(如样品一分为二)常见形式:同源配对(如样品一分为二)n 异源配对(按性别、体异源配对(按性别、体重、年龄配对)重、年龄配对)n 自身前后配对(试验前自身前后配对(试验前后的对比)后的对比)(一)研究(一)研究(ynji)(ynji)设计设计第十页,共39页。n析因设计析因设计n-同时研究多个实验因素对结果的影响同时研究多个实验因素对结果的影响(yngxing)(yngxing)n-例如,研究药物剂量例如,研究药物剂量(3mg(3mg、6mg)6mg
7、)及给药方式及给药方式(口口服、肌注服、肌注)对结果的影响对结果的影响(yngxing)(yngxing),每种组合均,每种组合均需要做试验需要做试验(3mg+(3mg+口服,口服,3mg+3mg+肌注,肌注,6mg+6mg+口服,口服,6mg+6mg+肌注肌注),为,为2222析因设计析因设计n重复测量设计重复测量设计n-同一对象在不同时间点上进行某个指标的观测,同一对象在不同时间点上进行某个指标的观测,以分析该指标在时间上的变化。以分析该指标在时间上的变化。n-临床上很常见的一类资料临床上很常见的一类资料(一)研究(一)研究(ynji)(ynji)设计设计第十一页,共39页。n对临床资料进
8、行统计描述n描述性统计分析方法n如,均数,中位数,标准差,百分比,频数分布等n估计总体参数n95%可信区间n对几组资料进行差异性检验n假设检验方法n如,t检验,卡方检验,方差分析,秩和检验等n探讨变量之间的关系,或者(huzh)自变量(影响因素)对应变量(结果变量)的影响大小n多变量分析方法n如,线性相关,线性回归,Logistic回归,Cox回归、生存分析等(二)分析(二)分析(fnx)(fnx)目的目的第十二页,共39页。数值变量资料数值变量资料 计量计量(jling)(jling)资料资料无序分类变量资料无序分类变量资料 计数资料计数资料 有序分类变量资料有序分类变量资料 等级资料等级资
9、料(三)资料(三)资料(zlio)(zlio)类型类型无序分类:指类别或属性间无顺序无序分类:指类别或属性间无顺序(shnx)(shnx)、程度之分、程度之分例如,性别(男、女)为二分类例如,性别(男、女)为二分类 血型(血型(A A、B B、ABAB、O O)为多分类)为多分类 有序有序分类分类:指类别间存在着次序,或程度上的差异。例如,治疗效果:无效、好转、显效、治愈 实验室检验:、+、+、+数值变量数值变量:每一个观察对象都有一个数值,且大小差异有意义例如,血红蛋白(g/L),住院天数,产前检查次数,住院费用第十三页,共39页。n任何统计方法都有自己的适用条件,只有当某个或某些条件满足时
10、,统计计算公式才成立n适用条件可根据数据(shj)特征来判断n数据(shj)的分布特征(正态、偏态)n方差齐性n理论数大小n样本量大小(四)数据(四)数据(shj)(shj)特征特征第十四页,共39页。编号 年龄 性别 治疗组 舒张压 心电图 疗效(lioxio)NO X1 X2 X3 X4 X5 X6 1 37 男 A 11.27 正常 显效 2 45 女 B 12.53 正常 有效 3 43 男 A 10.93 异常 有效 4 59 女 B 14.67 异常 无效 108 54 男 B 16.80 正常 无效108例高血压患者(hunzh)治疗后临床记录三、数据资料的描述三、数据资料的描述
11、(mio sh)(mio sh)第十五页,共39页。n通过绘制直方图可以直观了解(lioji)数据的分布(一)数值(一)数值(shz)(shz)变量资料的描述变量资料的描述偏态分布偏态分布(fnb)(fnb)近似正态分布近似正态分布变异水平变异水平 平均水平平均水平 平均水平平均水平第十六页,共39页。偏态分布(fnb)形状研究中,右偏态分布更常见,如住院时间,住院费用,病程等研究中,右偏态分布更常见,如住院时间,住院费用,病程等左偏态分布较少见,如考生成绩左偏态分布较少见,如考生成绩(chngj)有时呈左偏态分布有时呈左偏态分布第十七页,共39页。n方差齐性n方差是否齐同(相等)n粗略判断n
12、 两组标准差之比在2.5倍以上(yshng),就得警惕方差不齐第十八页,共39页。指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小描述数值描述数值(shz)(shz)变量资料的常用指标变量资料的常用指标第十九页,共39页。变异水平变异水平 平均水平平均水平 平均水平平均水平偏态分布偏态分布(fnb)(fnb)近似近似(jn s)(jn s)正态分布正态分布中位数中位数均数均
13、数标准差标准差P25,P75四分四分(s fn)位数间距位数间距第二十页,共39页。n正态分布或近似(jn s)正态分布:n 均数 与 标准差n偏态分布或未知分布n 中位数 与 P25、P75(四分位数间距)论文(lnwn)中最常用组合第二十一页,共39页。通常需要(xyo)描述各个类别的频数及频率(百分比)(二)分类变量资料(zlio)的描述第二十二页,共39页。二维频数(pn sh)表研究研究(ynji)中通常需要列出二维频数表中通常需要列出二维频数表第二十三页,共39页。四、数据资料的组间比较四、数据资料的组间比较(bjio)(bjio)n假设检验出发点是:n判断样本(yngbn)之间差
14、异由什么原因造成的n样本(yngbn)数据间的差异有两种原因所致n样本(yngbn)来自同一总体,差异因抽样误差所引起n样本(yngbn)来自不同总体,差异因不同总体所引起n假设检验以P值大小作为推断依据nP值大,表示差异由抽样误差引起可能性大nP值小,表示差异由抽样误差引起可能性小,即由总体不同引起的可能性大n一般以0.05作为临界值来判断(一)组间比较采用(一)组间比较采用(ciyng)(ciyng)技术技术-假设检验假设检验第二十四页,共39页。n根据根据(gnj)(gnj)资料类型选择资料类型选择n计量资料的假设检验计量资料的假设检验nt t检验、检验、F F检验(方差分析)、检验(方
15、差分析)、Z Z检验、秩和检验(检验、秩和检验(WilcoxonWilcoxon秩和检验、秩和检验、H H检验、检验、FriedmanFriedman检验)等检验)等n计数资料的假设检验计数资料的假设检验n卡方检验、卡方检验、Z Z检验等检验等n等级资料的假设检验等级资料的假设检验n秩和检验(秩和检验(WilcoxonWilcoxon秩和检验、秩和检验、H H检验、检验、FriedmanFriedman检验)检验)(二)组间比较(二)组间比较(bjio)(bjio)常用的假设检验方法常用的假设检验方法第二十五页,共39页。比较目的应用条件统计方法样本与总体比较n较大Z检验n大小均可t检验两组资
16、料的比较(完全随机设计)n较大Z检验n较小,正态分布,方差齐t检验n较小,非正态分布,方差不齐Wilcoxon秩和检验t检验1 1、常用计量、常用计量(jling)(jling)资料的假设检验资料的假设检验第二十六页,共39页。比较目的应用条件统计方法配对资料的比较n较大(任意分布)配对设计Z检验(配对设计)n较小,差值为正态配对设计的t检验n较小,差值为非正态配对设计的秩和检验多组资料的比较正态分布,方差齐方差分析(完全随机设计)非正态分布,方差不齐秩和检验(H检验)配伍资料的比较正态分布,方差齐配伍设计的方差分析(配伍设计)非正态分布,方差不齐配伍设计的秩和检验(Friedman检验)1
17、1、常用计量、常用计量(jling)(jling)资料的假设检验(续表)资料的假设检验(续表)第二十七页,共39页。比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布的直接法np5且n(1-p)5二项分布的Z检验两个率或构成比的比较(完全随机设计)np5且n(1-p)5二项分布的Z检验n40且T5卡方检验n40且1T5校正卡方检验n40或T40配对卡方检验np5且n(1-p)5校正配对卡方检验多个率或构成比的比较(完全随机设计)全部格子T5或1T5小于25%卡方检验T1或1T5超过25%Fisher精确检验2 2、常用计数、常用计数(j sh)(j sh)资料假设检验方法(续表)资料
18、假设检验方法(续表)第二十九页,共39页。比较目的统计方法两组比较(完全随机设计)多组比较(完全随机设计)Wilcoxon秩和检验秩和检验(H检验)配伍设计秩和检验(Friedman检验)配对设计符号秩和检验3 3、常用等级、常用等级(dngj)(dngj)资料假设检验方法资料假设检验方法第三十页,共39页。实例(shl)1 30只大鼠随机分为A、B、C三组,每组10只,分别给予三种药物,5天后测定某指标值如下表。几个(j)例子资料特点:完全随机设计,计量资料,三组资料特点:完全随机设计,计量资料,三组(sn z)(sn z)不妥的方法:不妥的方法:t t检验检验恰当的方法:方差分析恰当的方法
19、:方差分析第三十一页,共39页。实例2 36只大鼠随机分为对照组、实验组1、实验组2三组,每组12只,分别给予三种饲料,分别于10天、15天、20天、25天测定(cdng)大鼠体重,如下表。资料特点:完全随机设计,计量资料,三组,重复测量资料特点:完全随机设计,计量资料,三组,重复测量不妥不妥(b tu)(b tu)的方法:每个时间点用的方法:每个时间点用t t检验或方差分析检验或方差分析恰当的方法:重复测量的方差分析恰当的方法:重复测量的方差分析第三十二页,共39页。实例3 72只小鼠随机分为3组,每组24只,进行实验,分别于试验后1,3,5,7天处死小鼠6只小鼠,测定大脑中酪氨酸激酶(jm
20、i)B的表达水平,如下表。资料特点:计量资料,三组,重复测量资料特点:计量资料,三组,重复测量?析因设计析因设计?不妥的方法:每个时间不妥的方法:每个时间(shjin)(shjin)点用点用t t检验,重复测量的方差检验,重复测量的方差分析分析恰当的方法:恰当的方法:3434析因设计方差分析析因设计方差分析第三十三页,共39页。实例4 两组手术病人(bngrn),采用两种不同的镇痛方式(试验组、对照组),于手术后24小时测定血清中的IL-6,结果如下表。资料特点:计量资料,两组,标准差相差资料特点:计量资料,两组,标准差相差(xin ch)(xin ch)比较大比较大(方差方差不齐不齐)不妥的
21、方法:不妥的方法:t t检验检验恰当的方法:恰当的方法:tt检验检验 或者或者 Wilcoxon Wilcoxon秩和检验秩和检验第三十四页,共39页。实例5 两组病人,采用(ciyng)两种药物治疗,治疗疗效如下表。经卡方检验,P=0.0486,差异有统计学意义。因此可以认为试验组的疗效比对照组的疗效好。资料特点:计数资料,两组,例数比较少资料特点:计数资料,两组,例数比较少不妥的方法:卡方检验不妥的方法:卡方检验(jinyn)(jinyn)恰当的方法:恰当的方法:FisherFisher精确检验精确检验(jinyn)(jinyn)第三十五页,共39页。实例(shl)6 两组病人,采用两种药
22、物治疗,治疗疗效如下表。经卡方检验,P=0.0570,差异无统计学意义。资料特点:等级资料,两组资料特点:等级资料,两组不妥的方法:卡方检验不妥的方法:卡方检验(jinyn)(jinyn)恰当的方法:恰当的方法:WilcoxonWilcoxon秩和检验秩和检验(jinyn)(jinyn)第三十六页,共39页。临床研究中,经常(jngchng)需要分析某些因素与疾病之间的关系,探讨疾病的危险因素。这些通常会涉及到多变量分析。五、变量间关系(gun x)研究第三十七页,共39页。实例7 欲研究治疗某病的改进法(传统药+辅药)与传统法(传统药)在不同剂量下的疗效。将150例研究对象随机分成10组,每组15例;每种剂量及每种疗法下观察(gunch)15例。结果如下表:资料特点:结果变量:是否有效,二分类(有效、无效)资料特点:结果变量:是否有效,二分类(有效、无效)两个影响因素:治疗方法、药物剂量两个影响因素:治疗方法、药物剂量不妥的方法:卡方检验或不妥的方法:卡方检验或FisherFisher精确精确(jngqu)(jngqu)检验检验恰当的方法:多因素分析中的恰当的方法:多因素分析中的LogisticLogistic回归分析回归分析第三十八页,共39页。谢谢(xi xie)!第三十九页,共39页。