《非参数检验研优秀PPT.ppt》由会员分享,可在线阅读,更多相关《非参数检验研优秀PPT.ppt(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、非参数检验研2022/12/71第一页,本课件共有78页参数检验 parametric test(1)总体分布类型已知,如率服从二项分布、样本均数服从正态分布;(2)由样本统计量推断未知总体参数。这时,对总体参数m、p的假设检验称为参数检验。如 t 检验:F 检验:2022/12/72第二页,本课件共有78页 非参数检验(nonparametric test)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-free test),它直接对总体分布的位置作假设检验。2022/12/73第三页,本课件共有78页已知已知已知已知总体分布类型总体分布类型总体分布类型总体分布
2、类型,对,对,对,对未知参数进行统计推断未知参数进行统计推断未知参数进行统计推断未知参数进行统计推断依赖于特定分布类型,依赖于特定分布类型,依赖于特定分布类型,依赖于特定分布类型,比较的是比较的是比较的是比较的是参数参数参数参数 参数检验参数检验 (parametric testparametric test)非参数检验非参数检验 (nonparametric testnonparametric test)对总体的分布类型对总体的分布类型对总体的分布类型对总体的分布类型不作严格要求不作严格要求不作严格要求不作严格要求 不受分布类型的影响,不受分布类型的影响,不受分布类型的影响,不受分布类型的影
3、响,比较比较比较比较的是的是的是的是总体分布位置总体分布位置总体分布位置总体分布位置 优点:优点:优点:优点:方法简便、易学易用,易于推广使用、应方法简便、易学易用,易于推广使用、应方法简便、易学易用,易于推广使用、应方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料用范围广;可用于参数检验难以处理的资料用范围广;可用于参数检验难以处理的资料用范围广;可用于参数检验难以处理的资料(如等如等如等如等级资料,或含数值级资料,或含数值级资料,或含数值级资料,或含数值“50mg”“50mg”等等等等)缺点:缺点:方法比较粗糙,对于符合参数检验条件者,采用非方法比较粗糙,对于符合
4、参数检验条件者,采用非参数检验参数检验会损失部分信息,其检验效能较低会损失部分信息,其检验效能较低;样本含量较大;样本含量较大时,两者结论常相同时,两者结论常相同第四页,本课件共有78页应用非参数检验的情况1.不满足正态和方差齐性条件的小样本资料;不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;总体分布类型不明的小样本资料;3.一一端端或或二二端端是是不不确确定定数数值值(如如0.002、65等)的资料(必选);等)的资料(必选);4.单向有序列联表资料(等级资料);单向有序列联表资料(等级资料);5.各种资料的初步分析。各种资料的初步分析。2022/12/75第五页,
5、本课件共有78页秩次(rank)将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例例1 11只大鼠存活天数:只大鼠存活天数:存活天数存活天数 4,10,7,50,3,15,2,9,13,60,60秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5本章介绍的非参数统计方法 均基于秩次秩次秩次相同取平均秩次!秩次相同取平均秩次!2022/12/76第六页,本课件共有78页例例2 7名名 肺炎病人的治疗结果:肺炎病人的治疗结果:危险程度危险程度 治愈治愈 治愈治愈 死亡死亡 无效无效 治愈治愈 有效有效 治愈治愈秩次 1 2 7 6 3 5 4平均秩次平均秩次 2.5
6、2.5 7 6 2.5 5 2.5秩和检验(秩和检验(rank sum test)一类用数据的秩次代替原数据进行假设检验的非参一类用数据的秩次代替原数据进行假设检验的非参数统计分析方法数统计分析方法2022/12/77第七页,本课件共有78页第一节 Wilcoxon符号秩和检验一、配对设计两样本比较的符号秩和检验【例例11-1】为观察血浆置换法治疗出凝血功能异常的临床疗效,某医师治疗了11例出凝血功能异常患者,置换前后各患者的凝血酶原时间见表11-1。问:血浆置换治疗前后凝血酶原时间有无差别患者患者编号编号(1)血浆置换血浆置换前前(2)血浆置换血浆置换后后(3)差值差值d(4)=(2)-(3
7、)125.3314.6910.64210.4513.13-2.68330.8712.6818.19424.3113.4510.86515.5015.50 0.00658.2514.2044.05779.2713.3965.88814.3812.05 2.33975.2915.1760.121012.9515.28-2.331111.8512.48-0.632022/12/78第八页,本课件共有78页患者编号患者编号(1)血浆置换前血浆置换前(2)血浆置换后血浆置换后(3)差值差值d (4)=(2)-(3)秩次秩次(5)125.3314.6910.64 5210.4513.13-2.68-433
8、0.8712.6818.19 7424.3113.4510.86 6515.5015.50 0.00658.2514.2044.05 8779.2713.3965.8810814.3812.05 2.33 2.5975.2915.1760.12 91012.9515.28-2.33-2.51111.8512.48-0.63-1按照差值的绝对值从小到大编秩按照差值的绝对值从小到大编秩差值为差值为0 0者不参加编秩者不参加编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相反时取平均秩次绝对值相等,符号相反时取平均秩次2022/12/79第九页,本课件共有78页1、建
9、立检验假设 2、计算检验统计量 求差值 编秩 求秩和,确定检验统计量 值 (任取 或 为统计量)计算分析步骤2022/12/710第十页,本课件共有78页3 3、确定、确定P P 值值 查表法:用于有效对子数查表法:用于有效对子数 若若T T值在上、下界值范围内,则值在上、下界值范围内,则P P值大于相应的概率值大于相应的概率 若若T T值在上、下界值上或外,则值在上、下界值上或外,则P P值小于等于相应的概率值小于等于相应的概率本例本例n=10n=10,T=7.5T=7.5,查附表,查附表1010(p345p345)得双侧)得双侧p0.05 p0.05 N N 双侧双侧 0.05 0.02
10、0.05 0.02 10 810 847 5-5047 5-50 2022/12/711第十一页,本课件共有78页4 4、做出推断结论、做出推断结论 按按a=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计,差异有统计学意义,可以认为血浆置换治疗前后出凝血功学意义,可以认为血浆置换治疗前后出凝血功能异常患者的凝血酶原时间有差别。能异常患者的凝血酶原时间有差别。2022/12/712第十二页,本课件共有78页正态近似法:用于有效对子数 相同秩次的个数不超过n25%时:相同秩次的个数较多,需用下式校正:2022/12/713第十三页,本课件共有78页秩次秩次 1 2.5 2.5 4 5
11、.5 5.5 8 8 8 101 2.5 2.5 4 5.5 5.5 8 8 8 10 为第为第 个相同秩次的个数个相同秩次的个数 2022/12/714第十四页,本课件共有78页统计推断逻辑统计推断逻辑 1、差值变换为秩次、差值变换为秩次(dT):d的变异度因分布不同而异,任意分布都可以将的变异度因分布不同而异,任意分布都可以将数值变换为秩次(这种变换会损失信息),然数值变换为秩次(这种变换会损失信息),然后用秩次分布的规律来作统计推断。后用秩次分布的规律来作统计推断。2022/12/715第十五页,本课件共有78页2、秩和、秩和(T)的分布:的分布:假定差值总体的正负值相互抵消,即差值总体
12、假定差值总体的正负值相互抵消,即差值总体中位数中位数 Md=0。当差值。当差值 d 变换为秩次变换为秩次 T后,后,正正负差值的差别负差值的差别就变为就变为正负秩次的差别正负秩次的差别,这种差,这种差别的大小可用平均秩来反映,但其分布规律用别的大小可用平均秩来反映,但其分布规律用秩和来描述比较方便。秩和来描述比较方便。2022/12/716第十六页,本课件共有78页二、单样本资料的二、单样本资料的WilcoxonWilcoxon符号秩和检验符号秩和检验 与配对设计的与配对设计的Wilcoxon符号秩和检验比较符号秩和检验比较不同点:不同点:差值的计算为差值的计算为相同点:相同点:假设的建立、编
13、秩、统计量的计算、假设的建立、编秩、统计量的计算、值的确定值的确定2022/12/717第十七页,本课件共有78页【例例11-2】已知某地正常人尿汞含量的中位数为2.50g/L,某医师从该地某厂从事土法炼金(汞齐法)的汞作业工人中随机抽取10名工人,测得尿汞含量(g/L)为11.01,2.13,2.56,2.79,12.95,3.12,3.56,4.37,5.13,18.90。问:汞作业工人的尿汞含量是不是高于一般正常人?2022/12/718第十八页,本课件共有78页按照差值的绝对值从小到大编秩按照差值的绝对值从小到大编秩差值为差值为0 0者不参加编秩者不参加编秩绝对值相等,符号相同时顺次编
14、秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相反时取平均秩次绝对值相等,符号相反时取平均秩次2022/12/719第十九页,本课件共有78页 1 1、建立检验假设、建立检验假设 H H0 0:该厂工人的尿汞含量总体中位数等于该厂工人的尿汞含量总体中位数等于2.5ug/L2.5ug/L H H1 1:该厂工人的尿汞含量总体中位数大于该厂工人的尿汞含量总体中位数大于2.5ug/L2.5ug/L 单侧单侧 a=0.05a=0.052 2、计算检验统计量、计算检验统计量T T 求差值求差值 编秩次编秩次 求秩和:求秩和:=50.5 =4.5=50.5 =4.5 计算分析步骤2022/12/720第
15、二十页,本课件共有78页3 3、确定、确定P P 值,做出推断结论值,做出推断结论 本例本例n=10,T=4.5 n=10,T=4.5 查附表查附表1010得单侧得单侧p0.01p0.01 按按a=0.05a=0.05水准拒绝水准拒绝H H0 0,接受接受H H1 1,差别有统计学,差别有统计学 意义意义,可以认为可以认为该厂工人的尿汞含量总体中位数大于该厂工人的尿汞含量总体中位数大于2.5ug/L2.5ug/L。N 单侧单侧 0.01 10 5-502022/12/721第二十一页,本课件共有78页第二节 两样本比较的秩和检验 完全随机设计的两个样本比较,若不满足完全随机设计的两个样本比较,
16、若不满足参数检验的条件(如参数检验的条件(如t检验),可以用检验),可以用成组设成组设计两样本比较的秩和检验计两样本比较的秩和检验方法,本法利用方法,本法利用两两样本观察值的秩和样本观察值的秩和来推断样本分别代表的来推断样本分别代表的两总两总体分布是否相同体分布是否相同。2022/12/722第二十二页,本课件共有78页一、原始数据的两样本比较一般方法步骤:1、建立检验假设,确定检验水准2、计算检验统计量编秩求秩和,确定检验统计量T值两样本例数不等时两样本例数不等时,以以样本例数小样本例数小的秩和为的秩和为T T两样本例数相等时两样本例数相等时,任取一组的秩和为任取一组的秩和为T T2022/
17、12/723第二十三页,本课件共有78页3、确定P值,做出推断结论查表法:用于 且 附表11(P346),左侧找到 ,表上方找到两组例数之差 ,二者交叉处即为T的界值若若T值在上、下界值范围内,则值在上、下界值范围内,则P值大于相应的值大于相应的概率概率若若T值在上、下界值上或外,则值在上、下界值上或外,则P值小于等于相应的值小于等于相应的概率概率2022/12/724第二十四页,本课件共有78页正态近似法:1)相同秩次的个数不超过n25%时2)相同秩次的个数超过n25%时zzz2022/12/725第二十五页,本课件共有78页 【例【例11-3】为探讨转化生长因子】为探讨转化生长因子 (TG
18、F-)在肾病在肾病综合征患者血中的表达及其在发病中的作用,某医综合征患者血中的表达及其在发病中的作用,某医师对师对13例原发性肾病综合征患者和例原发性肾病综合征患者和9例正常人采用酶例正常人采用酶联免疫吸附法测定血中的联免疫吸附法测定血中的TGF-水平水平(pg/ml),得,得TGF-的测量值如下:的测量值如下:2022/12/726第二十六页,本课件共有78页肾病综合征组:肾病综合征组:358.74 398.45 489.48 548.75 599.87 698.98 896.45 975.48 988.61 1234.68 1766.98 2044.87 2897.41正常组:正常组:19
19、8.43 199.45 205.99 242.22 246.92 248.24 289.44 298.36 398.452022/12/727第二十七页,本课件共有78页经正态性检验,经正态性检验,W=0.84,;经方差齐性检验,经方差齐性检验,F=138.97,;不能做两样本均数比较的不能做两样本均数比较的t检验。检验。2022/12/728第二十八页,本课件共有78页完全随机(成组)设计两样本完全随机(成组)设计两样本Wilcoxon秩和检验的目的是推断两独立样本所来秩和检验的目的是推断两独立样本所来自总体的分布是否相同。自总体的分布是否相同。2022/12/729第二十九页,本课件共有7
20、8页基本思想:基本思想:假设假设 成立,即两样本来自同一总体,成立,即两样本来自同一总体,将两样本统一由小到大编秩,然后分别计算两组将两样本统一由小到大编秩,然后分别计算两组的秩和的秩和 与与 ,取样本例数较小组的秩和作为检验,取样本例数较小组的秩和作为检验统计量统计量T,此时应与,此时应与 相差不大,若相差不大,若T与之与之相差过大,则有理由怀疑相差过大,则有理由怀疑 的成立,从而拒绝它。的成立,从而拒绝它。2022/12/730第三十页,本课件共有78页1.建立检验假设,确定检验水准建立检验假设,确定检验水准 :两总体分布相同:两总体分布相同 :两总体分布不同:两总体分布不同 2022/1
21、2/731第三十一页,本课件共有78页2.计算检验统计量计算检验统计量T值值 编秩编秩 求秩和求秩和 确定检验统计量确定检验统计量 2022/12/732第三十二页,本课件共有78页表表11-4 肾病综合征组与正常组血中肾病综合征组与正常组血中TGF-水平水平(pg/ml)测定结果测定结果肾病综合征组肾病综合征组正常组正常组水平水平(1)秩次秩次(2)水平水平(3)秩次秩次(4)358.74 9198.431 398.45 10.5199.452 489.4812205.993 548.7513242.224 599.8714246.925 698.9815248.246 896.451628
22、9.447 975.4817298.368 988.6118398.45 10.51234.68191766.98202044.87212897.4122n2=13T2=206.5n1=9T1=46.5编秩原则:编秩原则:将两组数据混合起来从小到大统一编秩将两组数据混合起来从小到大统一编秩数值相等且数值相等且组别相同时顺次编秩组别相同时顺次编秩数值相等但数值相等但组别不同时取平均秩次组别不同时取平均秩次2022/12/733第三十三页,本课件共有78页 ,按按 水准水准拒绝拒绝H0,接受,接受H1,差异有统计学意义,可认为两组血中,差异有统计学意义,可认为两组血中TGF-水平的总体分布不同,肾
23、病组高于正常组。水平的总体分布不同,肾病组高于正常组。3.确定确定P值,做出统计推断值,做出统计推断 查表法查表法:当当 且且 时,查附表时,查附表11 正态近似法正态近似法:若若 或或 本例,本例,,2022/12/734第三十四页,本课件共有78页【例11-4】某医师为探讨斯康杜尼和利多卡因应用于深牙周袋刮治术的临床局部麻醉效果。将患有牙周病需进行深牙周袋刮治术的患者109人随机分为两组,观察斯康杜尼和利多卡因麻醉后的麻醉效果,结果见表11-5。二、频数表资料的两样本比较2022/12/735第三十五页,本课件共有78页表表11-5 两种药物对各种牙齿麻醉效果比较两种药物对各种牙齿麻醉效果
24、比较组别组别人数人数完全完全良好良好有效有效失败失败斯康杜尼组5647 531利多卡因组531623862022/12/736第三十六页,本课件共有78页两样本比较的两样本比较的Wilcoxon秩和检验秩和检验【检验步骤检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 :两种药物麻醉效果的总体分布相同:两种药物麻醉效果的总体分布相同 :两种药物麻醉效果的总体分布不同:两种药物麻醉效果的总体分布不同 2022/12/737第三十七页,本课件共有78页【检验步骤检验步骤】2.计算检验统计量计算检验统计量T 值值 编秩编秩 求秩和求秩和 计算计算z 值值 2022/12/738第三
25、十八页,本课件共有78页表表11-6 两种两种药药物物对对各种牙各种牙齿齿麻醉效果比麻醉效果比较较麻醉效果麻醉效果(1)斯斯 康康杜尼组杜尼组(2)利利 多多卡因组卡因组(3)合计合计(4)秩次秩次范围范围(5)平均平均秩次秩次(6)秩和秩和斯康杜尼斯康杜尼(7)=(2)(6)利多卡因组利多卡因组(8)=(3)(6)完全完全471663 163321504 512良好良好 523286491 77.5 387.5 1782.5有效有效 3 81192102 97 291 776失败失败 1 6 7103109 106 106 636合计合计56(n2)53(n1)1092288.5(T2)37
26、06.5(T1)2022/12/739第三十九页,本课件共有78页2022/12/740第四十页,本课件共有78页3.确定确定P值,做出统计推断值,做出统计推断 ,按,按 水准,拒绝水准,拒绝 ,接受,接受 ,差异有统计学意义,可以认为斯康,差异有统计学意义,可以认为斯康杜尼和利多卡因应用于深牙周袋刮治术的局部杜尼和利多卡因应用于深牙周袋刮治术的局部麻醉效果的总体分布不同,斯康杜尼的效果好麻醉效果的总体分布不同,斯康杜尼的效果好于利多卡因。于利多卡因。2022/12/741第四十一页,本课件共有78页2022/12/742第四十二页,本课件共有78页A2022/12/743第四十三页,本课件共
27、有78页2022/12/744第四十四页,本课件共有78页2022/12/745第四十五页,本课件共有78页2022/12/746第四十六页,本课件共有78页2022/12/747第四十七页,本课件共有78页=90150300(600+1)/2 0.5=9015090150 0.5=0本例,本例,00.05按按a=0.05检验水准,不拒绝检验水准,不拒绝H0,尚不能认为两尚不能认为两种治疗方法疗效有区别。种治疗方法疗效有区别。2022/12/748第四十八页,本课件共有78页第三节 成组设计多个样本比较的秩和检 Kruskal-Wallis法(H检验)2022/12/749第四十九页,本课件共
28、有78页【例例11-5】为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将15只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测量兔血清总胆固醇(TC)水平,结果如下:正常饮食组:0.86 0.78 1.38 0.88 1.70高脂饮食组:40.35 41.79 44.00 40.72 27.05高脂饮食加开博通组:41.20 33.04 40.60 32.05 40.49一、原始数据的多个样本比较2022/12/750第五十页,本课件共有78页2022/12/751第五十一页,本课件共有78页计算分析步骤 1、建立检验假设,确定检验水准、建立检验假设
29、,确定检验水准 H0:3个总体的分布位置相同 H1:3个总体的分布位置不全相同 2、计算检验统计量、计算检验统计量H (1)编秩 (2)求秩和 (3)计算检验统计量H值2022/12/752第五十二页,本课件共有78页统计量统计量H的计算:的计算:当相同秩次的个数当相同秩次的个数当相同秩次较多时,按下式求校正值当相同秩次较多时,按下式求校正值 C为校正系数为校正系数,tj为第为第j个相同秩次的个数。个相同秩次的个数。2022/12/753第五十三页,本课件共有78页本例:2022/12/754第五十四页,本课件共有78页2022/12/755第五十五页,本课件共有78页2022/12/756第
30、五十六页,本课件共有78页二、频数表资料或等级资料的多个样本比较 注意事项:编秩方法与前述相同确定秩次范围,求平均秩次,计算各组秩和计算H值后需进行校正Hc值确定P值时,需查自由度为组数-1的卡方界值表2022/12/757第五十七页,本课件共有78页2022/12/758第五十八页,本课件共有78页2022/12/759第五十九页,本课件共有78页2022/12/760第六十页,本课件共有78页2022/12/761第六十一页,本课件共有78页第四节 随机区组设计的秩和检验一、M检验(Friedman 法)查表法用于区组数b15,处理组数k15分析步骤:建立检验假设,确定检验水准计算检验统计
31、量编秩、求各处理组的秩和Ri 求平均秩和求检验统计量M 值 确定P值、作出统计推断结论2022/12/762第六十二页,本课件共有78页2022/12/763第六十三页,本课件共有78页计算分析过程建立检验假设,确定检验水准H0:三组的总体分布相同,即多发伤后三个时间点血清ESM-1的检测结果的总体分布相同H1:三组的总体分布不同或不全相同,即多发伤后三个时间点血清ESM-1的检测结果的总体分布不同或不全相同 2022/12/764第六十四页,本课件共有78页2022/12/765第六十五页,本课件共有78页计算检验统计量编秩、求各处理组的秩和Ri 求平均秩和求检验统计量M 值 2022/12
32、/766第六十六页,本课件共有78页确定P值、作出统计推断结论根据区组数b=12及处理组数k=3查附表13,本例M=276.5M0.05(12,3)=72,概率P值P0.051与3558.66.898.540.052022/12/773第七十三页,本课件共有78页 随机区组设计资料的两两比较计算步骤:计算各处理组的秩和Ri 计算各对比组秩和之差的绝对值计算Ca界值,是以a为检验水准,以 为自由度的t界值;b为配伍组数,k为处理组数 2022/12/774第七十四页,本课件共有78页2022/12/775第七十五页,本课件共有78页2022/12/776第七十六页,本课件共有78页非参数检验秩和
33、检验 Wilcoxon符号秩和检验(配对设计)Wilcoxon两样本(成组设计)Kruskal-Wallis 法(H检验)成组设计多样本 Friedman 法(M检验)(随机区组设计)2022/12/777第七十七页,本课件共有78页数据资料计量资料计数资料非参数检验等级相关分析秩和检验统计描述统计推断参数估计假设检验t 检验方差分析完全随机设计随机区组设计交叉设计析因设计重复测量设计 Wilcoxon符号秩和检验(配对设计)Wilcoxon两样本(成组设计)Kruskal-Wallis 法 成组设计多样本 Friedman 法(随机区组设计)相对数统计推断参数估计假设检验确切概率法卡方检验四格表卡方检验配对四格表卡方检验行列表卡方检验Z检验单样本t 检验配对t 检验两独立样本t 检验t 检验2022/12/778第七十八页,本课件共有78页