《应用统计学非参数检验.ppt》由会员分享,可在线阅读,更多相关《应用统计学非参数检验.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、重庆交通大学管理学院30 十一月 2022*应用统计学非参数检验 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望重庆交通大学管理学院30 十一月 2022*两个配对样本的非参数检验两个配对样本的非参数检验 两个独立样本的非参数检验两个独立样本的非参数检验 多个独立样本的非参数检验多个独立样本的非参数检验 多个相关样本的非参数检验多个相关样本的非参数检验内容提要内容提要非参数检验非参数检验重庆交通大学管理学院30 十一月 2022*v 参数统计方法往往假设统计总体的
2、分布形态已知,但参数统计方法往往假设统计总体的分布形态已知,但是在更多的实际场合,常常由于缺乏足够信息,无法合是在更多的实际场合,常常由于缺乏足够信息,无法合理地去假设一个总体具有某种分布形式,此时就不能使理地去假设一个总体具有某种分布形式,此时就不能使用相应的参数方法了。因此,应该放弃对总体分布参数用相应的参数方法了。因此,应该放弃对总体分布参数的依赖,转而寻求更多的纯粹来自数据的信息,这就是的依赖,转而寻求更多的纯粹来自数据的信息,这就是非参数统计方法。非参数统计方法。非参数检验非参数检验重庆交通大学管理学院30 十一月 2022*和参数方法相比,和参数方法相比,非参数检验方法的优势如下非
3、参数检验方法的优势如下 稳稳健健性性。因因为为对对总总体体分分布布的的约约束束条条件件大大大大放放宽宽,不不至至于于因因为为对对统统计计中中的的假假设设过过分分理理想想化化而而无无法法切切合合实实际际情情况况,从从而而对对个个别别偏离较大的数据不至于太敏感。偏离较大的数据不至于太敏感。对对数数据据的的测测量量尺尺度度无无约约束束,对对数数据据的的要要求求也也不不严严格格,什什么么数数据类型都可以做。据类型都可以做。适合于小样本、无分布样本、数据污染样本、混杂样本等。适合于小样本、无分布样本、数据污染样本、混杂样本等。非参数检验非参数检验重庆交通大学管理学院30 十一月 2022*例例1 1 以
4、下为治疗前后,病人某项指标的测量值,数据见以下为治疗前后,病人某项指标的测量值,数据见npa.sav治疗前(治疗前(x):):24.00 16.70 21.60 23.70 37.50 31.40 14.90 37.30 17.90 15.50 29.00 19.90治疗后(治疗后(Y):):23.10 20.40 17.70 20.70 42.1 36.10 21.80 40.30 26.00 15.50 35.40 25.50配对样本的非参数检验配对样本的非参数检验重庆交通大学管理学院30 十一月 2022*配对样本的非参数检验配对样本的非参数检验重庆交通大学管理学院30 十一月 2022
5、*Wilcoxon符号检验符号检验 适用于连续变量适用于连续变量 sign符号检验符号检验 适用于对无法用数字计量的情况进行比较,如两分类,对于适用于对无法用数字计量的情况进行比较,如两分类,对于 连续资料最好不要使用连续资料最好不要使用 McNemar 实际上就是常用的配对实际上就是常用的配对2检验,只适用于二分类资料检验,只适用于二分类资料 Marginal Homogeneity 是是McNemar法向多分类情形下的扩展,适用于资料为有序法向多分类情形下的扩展,适用于资料为有序 分类情况分类情况配对样本的非参数检验配对样本的非参数检验重庆交通大学管理学院30 十一月 2022*Exact
6、:用于计算确切概率:用于计算确切概率只给出近似概率只给出近似概率 蒙特卡罗方法蒙特卡罗方法给出精确概率值,并给出精确概率值,并可设定耗时限制可设定耗时限制配对样本的非参数检验配对样本的非参数检验重庆交通大学管理学院30 十一月 2022*v共共12对对指指标标,指指标标值值治治疗疗后后小小于于治治疗疗前前的的有有3对对,其其平平均均秩秩次次为为2.83,总总秩秩和和为为8.50;治治疗疗后后大大于于治治疗疗前前的的有有8对对,其其平平均均秩秩次次为为7.19,总总秩秩和和为为57.50;治治疗疗后后等于治疗前的有等于治疗前的有1对。对。分析结果分析结果(1)秩次表秩次表配对样本的非参数检验配对
7、样本的非参数检验重庆交通大学管理学院30 十一月 2022*v Wilcoxon符符号号秩秩检检验验的的统统计计量量Z值值-2.179,近近似似概概率率(Asymp.sig.)P0.029,按按0.05的的水水准准可可以以认认为为治治疗前后该指标值的差别具有统计学意义。疗前后该指标值的差别具有统计学意义。分析结果分析结果(2)检验统计量检验统计量配对样本的非参数检验配对样本的非参数检验重庆交通大学管理学院30 十一月 2022*例例2 在缺氧条件下,观察在缺氧条件下,观察4只猫与只猫与12只兔的生存时间(分钟),只兔的生存时间(分钟),结果如下。试判断猫、兔在缺氧条件下生存时间的差异是否具结果
8、如下。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。数据见有统计学意义。数据见npb.sav:生存时间(猫):生存时间(猫):25 34 44 46 46生存时间(兔):生存时间(兔):15 15 16 17 19 21 21 23 25 27 28 28 30 35两独立样本的非参数检验两独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*两独立样本的非参数检验两独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*两独立样本的非参数检验两独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*两独立样本的非参数检验两独立样本的非参数检验重庆交通大学
9、管理学院30 十一月 2022*默认的默认的Mann-Whitney U检验最常用检验最常用两独立样本的非参数检验两独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*v 生生存存时时间间样样本本共共19例例,其其中中猫猫的的生生存存时时间间5例例,其其平平均均秩秩次次为为15.70,总总秩秩和和为为78.50;兔兔的的生生存存时时间间14例,其平均秩次为例,其平均秩次为7.96,总秩和为,总秩和为111.50。(1)秩次表秩次表两独立样本的非参数检验两独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*v 给给出出Mann-Whitney U、Wilcoxon W 统
10、统计计量量和和Z值值,近近似似值值概概率率(Asymp.Sig)和和精精确确概概率率值值(Exact.sig)均均小小于于0.05,结结论论一一致致,表表明明猫猫、兔兔在在缺缺氧氧条条件件下下的的生生存存时时间间的的差差异异具具有有统统计计学学意意义义,由由平平均均秩秩次次猫猫(15.7)、兔()、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。)来看,可以认为缺氧条件下猫的生存时间长于兔。分析结果分析结果两独立样本的非参数检验两独立样本的非参数检验(2)检验统计量检验统计量重庆交通大学管理学院30 十一月 2022*例例3 14名名新新生生儿儿出出生生体体重重按按其其母母亲亲的的吸
11、吸烟烟习习惯惯分分组组(A组组:每每日日吸吸烟烟多多于于20支支;B组组:每每日日吸吸烟烟少少于于20支支;C组组:过过去去吸吸烟烟而而现现已已戒戒烟烟;D组组:从从不不吸吸烟烟),具具体体如如下下。试试问问四四个个吸烟组出生体重分布是否相同?数据见吸烟组出生体重分布是否相同?数据见npc.sav:A组:组:2.7 2.4 2.2 3.4 B组:组:2.9 3.2 3.2C组:组:3.3 3.6 3.4 3.4多个独立样本的非参数检验多个独立样本的非参数检验D组:组:3.5 3.6 3.7重庆交通大学管理学院30 十一月 2022*多个独立样本的非参数检验多个独立样本的非参数检验重庆交通大学管
12、理学院30 十一月 2022*多个独立样本的非参数检验多个独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*设置组别变量的最小值设置组别变量的最小值1、最大值、最大值4多个独立样本的非参数检验多个独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*多个独立样本的非参数检验多个独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*Kruskal-Wallis H检检验验:k=3个个独独立立随随机机连连续续分分布布样样本本的的比比较较,而而正正态态性性假假设设及及等等方方差差假假设设存存在在问问题题时时,它它可以进行总体是否相同的检验。可以进行总体是否相同的检验
13、。Median:中中位位数数检检验验,三三种种方方法法中中检检验验效效能能最最低低,但但对于拖长尾的对称分布很有效对于拖长尾的对称分布很有效 Jonckheere-Terpstra:对对连连续续性性资资料料或或有有序序分分类类资资料料都都适适用用,并并当当分分组组变变量量为为有有序序分分类类资资料料时时,此此法法的的检检验验效效能要高于能要高于Kruskal-Wallis法。法。多个独立样本的非参数检验多个独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*v 母母亲亲每每日日吸吸烟烟多多于于20支支组组共共4名名新新生生儿儿,体体重重平平均均秩秩次次3.75;每每日日吸吸烟烟少少
14、于于20支支组组共共3名名新新生生儿儿,体体重重平平均均秩秩次次5.00;过过去去吸吸烟烟现现已已戒戒烟烟组组共共4名名新新生生儿儿,体体重重平平均均秩秩次次9.38;从不吸烟组共;从不吸烟组共3名新生儿,平均秩次名新生儿,平均秩次12.50。分析结果分析结果多个独立样本的非参数检验多个独立样本的非参数检验(1)秩次表秩次表重庆交通大学管理学院30 十一月 2022*v Kruskal-Wallis H统统计计量量的的近近似似显显著著概概率率为为0.023,按按0.05的的水水准准拒拒绝绝原原假假设设,可可认认为为四四个个组组中中至至少少有有两两组组出出生生体体重重的总体分布不同。的总体分布不
15、同。分析结果分析结果(2)检验统计量检验统计量多个独立样本的非参数检验多个独立样本的非参数检验重庆交通大学管理学院30 十一月 2022*例例4 三三批批甘甘蓝蓝叶叶样样本本分分别别在在甲甲、乙乙、丙丙、丁丁四四种种条条件件下下测测量量核核黄黄素素浓浓度度,试试验验结结果果如如下下。问问四四种种条条件件下下的的测测量量结结果果的的差差异异是是否具有统计学意义?数据见否具有统计学意义?数据见npd.sav:多个相关样本的非参数检验多个相关样本的非参数检验重庆交通大学管理学院30 十一月 2022*多个相关样本的非参数检验多个相关样本的非参数检验重庆交通大学管理学院30 十一月 2022*Frie
16、dman:常用的多个配伍样本的非参数检验:常用的多个配伍样本的非参数检验 Kendalls W:可进一步给出一致性程度:可进一步给出一致性程度 Cochrans Q:是两配对样本:是两配对样本McNemar方法的推广,方法的推广,只适合二分类变量只适合二分类变量多个相关样本的非参数检验多个相关样本的非参数检验重庆交通大学管理学院30 十一月 2022*分析结果分析结果(1)秩次表秩次表v 经经Friedman Test,近近似似概概率率(Asymp.sig.)P0.042,小小于于0.05,故故拒拒绝绝原原假假设设,认认为为四四种种条条件件下下测测量量结结果果的的差差别别具有统计学意义的。具有统计学意义的。(2)检验统计量检验统计量多个相关样本的非参数检验多个相关样本的非参数检验