《等级资料常用检验方法PPT精选文档.ppt》由会员分享,可在线阅读,更多相关《等级资料常用检验方法PPT精选文档.ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、等级资料常用检验方法临床流行病学应用研究室临床流行病学应用研究室 周罗晶周罗晶1在在医医学学资资料料中中,特特别别是是临临床床医医学学资资料料中中,常常常常遇遇到到一一些些定定性性指指标标,如如临临床床疗疗效效的的评评价价、疾疾病病的的临临床床分分期期、症症状状严严重重程程度度的的临临床床分分级级、中中医医诊诊断断的的一一些些临临床床症症状状等等,对对这这些些指指标标常常采采用用分分成成若若干干等等级级然然后后分分类类计计数数的的办办法法来来解解决决它它的的量量化化问问题题,这这样样的的资资料料我我们们在在统统计计学学上上称称为为有有序序变变量量(ordered ordered variabl
2、evariable)或或半半定定量量资资料料,也也称称为为等等级资料(级资料(ranked dataranked data)。)。等级资料定义:等级资料定义:2等级资料划分的两种情况:等级资料划分的两种情况:特点:特点:观察结果具有等级差别。观察结果具有等级差别。v按按性性质质划划分分:如如药药物物疗疗效效分分为为痊痊愈愈、显显效效、好好转转、无效;麻醉效果分为无效;麻醉效果分为、级等。级等。v按按数数量量分分组组:数数据据两两端端不不能能确确切切测测定定的的计计量量资资料料。如如抗抗体体滴滴度度分分为为1:20,1:20,1:40,1:80,1:20,1:20,1:40,1:80,1:80;
3、年年龄分为龄分为10,100.050.05)10等级资料正确的统计分析方法:等级资料正确的统计分析方法:非参数统计的秩和检验非参数统计的秩和检验 Kendall Kendall、spearmanspearman等级相关等级相关 CMHCMH卡方检验卡方检验 RiditRidit分析分析 线性趋势卡方检验线性趋势卡方检验 有序变量的有序变量的LogisticLogistic回归分析回归分析11一、非参秩和检验一、非参秩和检验 由于非参数检验法不考虑数据的分由于非参数检验法不考虑数据的分布规律,检验不涉及总体参数,检验统布规律,检验不涉及总体参数,检验统计量多是人们在总结经验的基础上创造计量多是人
4、们在总结经验的基础上创造出来的,所以这类检验方法的特点是针出来的,所以这类检验方法的特点是针对性强。但是不同设计、不同目的所用对性强。但是不同设计、不同目的所用的非参数检验法是不同的。的非参数检验法是不同的。12v单向有序行列表单向有序行列表 在表的两个方向上的分类中,一在表的两个方向上的分类中,一个方向(横向)无顺序和等级概念,个方向(横向)无顺序和等级概念,另一个方向(纵向)是有顺序的分类,另一个方向(纵向)是有顺序的分类,称为单向有序行列表。称为单向有序行列表。13a.a.两组独立样本两组独立样本等级资料比较的等级资料比较的Mann-Mann-WhitneyWhitney秩和检验秩和检验
5、以表以表1 1为例。将无效、有效、显效三个疗效等级数量化,为例。将无效、有效、显效三个疗效等级数量化,数值用平均秩号,然后比较各组平均秩号的大小。数值用平均秩号,然后比较各组平均秩号的大小。14两组的平均秩号分别为:两组的平均秩号分别为:治疗组:治疗组:R1=(610.5+1940+3589)/60=65.6R1=(610.5+1940+3589)/60=65.6对照组:对照组:R2=R2=(1410.5+2040+24891410.5+2040+2489)/58=53.1/58=53.1 经秩和检验,经秩和检验,u=2.169u=2.169,P P0.050.05,两组疗效差异有,两组疗效差
6、异有统计学意义,因为治疗组平均秩号大于对照组,所以治统计学意义,因为治疗组平均秩号大于对照组,所以治疗组疗效好。疗组疗效好。计算两组秩号并进行秩和检验计算两组秩号并进行秩和检验15 Analyze Nonparametric Tests 2 independent Samples Test variable List:result Grouping variable:group Define groups:group1:1;group2:2,Test Type:Mann-Whitney OKSPSSSPSS窗口操作过程:窗口操作过程:16分析结果:分析结果:17结结论论:两两组组疗疗效效差差异
7、异有有统统计计学学意意义义,且且治治疗疗组效果好于对照组。组效果好于对照组。=-2.169=-2.169,P P0.050.05 结论:两组疗效差异没有统计学意义。结论:两组疗效差异没有统计学意义。20b.b.两两组组配配对对样样本本等等级级资资料料比比较较的的WilcoxonWilcoxon秩和检验秩和检验c.c.多多组组等等级级资资料料比比较较的的KruskalKruskal-Wallis-Wallis秩秩和检验和检验 该方法对该方法对K(K2)K(K2)组独立样本进行组独立样本进行K K个个总体分布函数相同假设的检验,是在总体分布函数相同假设的检验,是在WilcoxonWilcoxon秩
8、和检验基础上扩展的方法,称秩和检验基础上扩展的方法,称为为K-WK-W检验。检验。21例例2 2 对对5454例例牙牙病病患患者者的的6464颗颗患患牙牙的的根根端端形形态态不不同同分分为为3 3种种,X X线线片片显显示示喇喇叭叭口口状状为为A A型型,管管壁壁平平行行状状为为B B型,管壁由聚状为型,管壁由聚状为C C型型比较不同根端形态患牙的疗效有否差别。比较不同根端形态患牙的疗效有否差别。221、建立数据库、建立数据库1.1定义变量定义变量 group:1 A型型 2 B型型 3 C型型 result:1成功成功 2进步进步 3失败失败 count:例数例数1.2录入数据录入数据1.3
9、权重频数权重频数SPSS软件操作步骤:软件操作步骤:23Analyze Nonparametric Tests K independent Samples Test variable List:result Grouping variable:group Define range:minimum:1;maximum:3 Continue Test Type:KruskalKruskal-Wallis-Wallis HOK2、分析:、分析:243 3、结果、结果25结论:按结论:按=0.05=0.05的检验水平,三组间差异有统计学意义。的检验水平,三组间差异有统计学意义。H=6.528,P=0.
10、03826 计算结果中显示的计算结果中显示的2值并不是值并不是2检检验,只是验,只是Kruskal-Wallis TestKruskal-Wallis Test的检验统计的检验统计量量H H,此时近似,此时近似2分布,所以按分布,所以按2分布分布的近似值来确定概率,它的自由度的近似值来确定概率,它的自由度=组数组数-1-1。注意:注意:27v 双向有序资料行列表双向有序资料行列表KendallKendall等级相关等级相关法和法和SpearmanSpearman等级相关分析法等级相关分析法 例例3 3 某病病情与疗效的关系某病病情与疗效的关系 28 两表的区别仅在于病情两表的区别仅在于病情“极
11、重极重”组和组和“中中”组组的数据进行了互换。的数据进行了互换。29 分分别别对对上上面面两两个个表表格格数数据据进进行行2检检验验和和多多组等级资料比较的组等级资料比较的Kruskal-WallisKruskal-Wallis秩和检验。秩和检验。对于表对于表4 4:2=40.000,P=0.000 H=24.896,P=0.000对于表对于表5 5:2=40.000,P=0.000 H=24.896,P=0.000两两种种检检验验都都无无法法表表达达表表4 4和和 表表5 5的的差差别别,直直观观地地看看,表表4 4的的资资料料显显示示病病情情越越轻轻者者疗疗效效越越好好,表表5 5却却未未
12、显显示示这这种种趋趋势势来来。30此时我们选用此时我们选用KendallKendall和和SpearmanSpearman等级相关等级相关分析法分别计算相关系数分析法分别计算相关系数t t和和r rs s。计算公式:计算公式:t=n n:总例数:总例数 m m:最长对角线上的格子数:最长对角线上的格子数 S S:专用统计量:专用统计量Kendall等级相关意义:等级相关意义:当一个变量的等级为标准时,当一个变量的等级为标准时,另一个变量的等级与它不一致的情况(可分析两个以另一个变量的等级与它不一致的情况(可分析两个以及多个变量间的等级相关性)。及多个变量间的等级相关性)。31rs=1-n n:
13、总例数:总例数 d d:每一对值的等级差:每一对值的等级差Spearman等等级级相相关关意意义义:两两个个变变量量之之间间的等级相关性。的等级相关性。(只适用于分析两个变量关系)(只适用于分析两个变量关系)Spearman等级相关公式:等级相关公式:321.1.建立数据库建立数据库2.2.录入数据录入数据3.3.权重频数权重频数4.4.界面操作(界面操作(以表以表4 4为例为例):):Analyze Correlate Bivariate Row(s):疗疗效效 Column(s):病病情情 Statistics Kendalls tau-b,Spearman OKSPSSSPSS操作演示:
14、操作演示:33表表4检验结果:检验结果:34表表5检验结果:检验结果:35v 重复测量等级资料时间趋势检验重复测量等级资料时间趋势检验 CMHCMH卡方检验卡方检验 实例实例4 4 在某药治疗闭塞性动脉炎的临床试验中在某药治疗闭塞性动脉炎的临床试验中,治疗治疗2626例下肢溃疡例下肢溃疡的病人溃疡改善情况见表的病人溃疡改善情况见表6 6,评价该药有无促进溃疡愈合的作用。,评价该药有无促进溃疡愈合的作用。36本例特点:本例特点:1.1.个体的重复测量个体的重复测量 2.2.溃疡随时间的变化趋势溃疡随时间的变化趋势 卡方检验卡方检验,Cochran-Mantel-,Cochran-Mantel-H
15、anselHansel检验简称检验简称,包括非零相关、行平分差包括非零相关、行平分差和一般联系和一般联系3 3种检验方法。对于这种重复测量种检验方法。对于这种重复测量的等级变量的等级变量,行列变量均为等级变量行列变量均为等级变量,应该作非应该作非零相关检验。本方法仅限于检验线性趋势。零相关检验。本方法仅限于检验线性趋势。37计算公式:计算公式:Q Qcscs=结果:结果:2=4.7424,P=0.0294结论:溃疡改善程度随着治疗时间延长有变好的趋势。结论:溃疡改善程度随着治疗时间延长有变好的趋势。38v多组等级资料的两两比较多组等级资料的两两比较RiditRidit分析分析 Ridit Ri
16、dit是是“Relative to an identified distribution“Relative to an identified distribution integral transformation”integral transformation”的首个字母缩写,意指的首个字母缩写,意指对于一个确认的分布作积分变换。对于一个确认的分布作积分变换。Ridit Ridit分析是一种关于等级资料进行对比组分析是一种关于等级资料进行对比组与标准组比较的假设检验方法,其基本思想是与标准组比较的假设检验方法,其基本思想是先先确定一个标准组确定一个标准组作为特定总体,求得各等级作为特定总体,
17、求得各等级的的RiditRidit值,标准组平均值,标准组平均RiditRidit值理论上可以证明值理论上可以证明等于等于0.50.5,其他各组与标准组比较,看其可信区,其他各组与标准组比较,看其可信区间是否与间是否与0.50.5重叠,来判断组间的统计学显著性,重叠,来判断组间的统计学显著性,最后得出专业解释。最后得出专业解释。39RiditRidit分析适用范围:分析适用范围:1.1.两两组组或或两两组组以以上上等等级级资资料料的的比比较和分析较和分析 2.2.两两端端数数据据不不确确切切的的计计量量资资料料分分组组转转换换成成计计数数资资料料的的分分析析,如如血血清清滴度等。滴度等。特点:
18、特点:简便、直观、适用性广。简便、直观、适用性广。40RiditRidit分析关键步骤:分析关键步骤:一、确定标准组:一、确定标准组:1.1.利利用用已已知知的的标标准准分分布布(传传统统方方法法)作作为为标标准准组组。如如某某药药物物大大规规模模的的观观察察研研究究结结果果,计算不同疗效的计算不同疗效的R R值。值。2.2.以例数最多的一组作为标准组。以例数最多的一组作为标准组。3.3.各组的例数都差不多时,可把各组观察各组的例数都差不多时,可把各组观察结果合并起来作为标准组。结果合并起来作为标准组。41二、计算标准组的二、计算标准组的RiditRidit值:值:三、利用对照组计算各组的平均
19、三、利用对照组计算各组的平均R R值值四、置信区间判断四、置信区间判断五、统计检验五、统计检验:u u检验、检验、t t检验、检验、2检验检验RiditRidit分析关键步骤:分析关键步骤:42RiditRidit分析(实例分析(实例5 5):):表表7 三种方剂对某妇科病患者治疗效果比较三种方剂对某妇科病患者治疗效果比较43PEM3.1PEM3.1操作过程:操作过程:1.1.建立数据库建立数据库 1.1 1.1 定义变量名定义变量名 1.2 1.2 录入数据录入数据2.2.界面操作:界面操作:其他统计分析其他统计分析 RiditRidit分析分析 分分析目的:析目的:多个样本比较多个样本比较
20、 分组变量:分组变量:分组分组 类别变量类别变量:类别类别 频数变频数变量:量:例数例数 确定确定 44主要结果:主要结果:检验水准检验水准:=0.05 :=0.05 选用同一参照组选用同一参照组(各样本合计为参照组各样本合计为参照组)样本数样本数 k=3 k=3 等等 级级 数数:4:4 45主要结果:主要结果:46各样本平均各样本平均R R 样本名样本名 频数合计频数合计 平均平均R R 第第1 1组组 361 0.4819 361 0.4819 第第2 2组组 58 0.6287 58 0.6287 第第3 3组组 77 0.4881 77 0.4881主要结果:主要结果:47卡方检验卡
21、方检验:卡方值卡方值 =13.0887 =13.0887 自由度自由度 v=3 v=3 概概 率率 P=0.0044 P=0.0044 结论:结论:三种药物对妇科病的疗效差异有统计三种药物对妇科病的疗效差异有统计 学意义。学意义。主要结果:主要结果:48三者之间究竟有何种差异呢?三者之间究竟有何种差异呢?1.1.标准组平均标准组平均R R值值 :=248.00/496=248.00/496=0.50.5 2.2.标准组方差、标准差的计算:标准组方差、标准差的计算:49方差方差=160.16 =160.16 2482/496/2482/496/(496-1496-1)=0.0730=0.0730
22、标准差标准差=0.2702=0.2702标准组方差、标准差的计算标准组方差、标准差的计算50对比组平均对比组平均R值值糖衣组糖衣组=0.4819 =0.4819 黄体酮组黄体酮组=0.6287=0.6287 复方组复方组=0.4881=0.4881 51 如如果果等等级级是是由由劣劣到到优优的的顺顺序序排排列列,则则平平均均 RiditRidit值值越越大大越越好好,否否则则越越小小越越好好。但但我我们们不不能能单单纯纯以以各各组组平平均均RiditRidit值值的的大大小小来来判判断断各各组组的的差差异异,因因为为RiditRidit值值是是一一个个点点估估计计,没没有有考考虑虑抽抽样样误误
23、差差,而而样样本本正正好好等等于于总总体体指指标标的的可可能能性性很很小小,因因此此应应该该结结合合可可信信区区间间或或统统计计检检验验方方法法综综合合判断。判断。注意:注意:52计算对比组可信区间计算对比组可信区间对比组标准误:对比组标准误:对比组对比组95%可信区间:可信区间:53计算对比组计算对比组95%CI并进行判断并进行判断糖衣组糖衣组95%CI95%CI:0.45340.45340.51030.5103黄体酮组黄体酮组95%CI95%CI:0.55780.55780.69970.6997复方组复方组95%CI95%CI:0.42650.42650.54970.5497判断:通过可信
24、区间比较对比组与标准组的差判断:通过可信区间比较对比组与标准组的差别。看对比组别。看对比组95%95%可信区间是否包括标准组可信区间是否包括标准组RiditRidit值(值(0.50.5),不包括,则),不包括,则P0.05P0.05,差别有统,差别有统计学意义。否则反之。计学意义。否则反之。54对比组对比组95%CI图图标准组标准组 55多个对比组的两两比较多个对比组的两两比较 统计界限:统计界限:u0.05,u0.05,差异无统计意义差异无统计意义 u1.96,P0.05,u1.96,P0.05,差异有统计意义差异有统计意义 u2.58,P0.01,u2.58,P0.01,差异有统计意义差异有统计意义 u 1,2=3.84,u 1,3=0.18,u 2,3=2.9956小小 结结57