《应用统计学非参数检验讲稿.ppt》由会员分享,可在线阅读,更多相关《应用统计学非参数检验讲稿.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用统计学非参数检验第一页,讲稿共二十九页哦 两个配对样本的非参数检验两个配对样本的非参数检验 两个独立样本的非参数检验两个独立样本的非参数检验 多个独立样本的非参数检验多个独立样本的非参数检验 多个相关样本的非参数检验多个相关样本的非参数检验内容提要内容提要非参数检验非参数检验第二页,讲稿共二十九页哦 参数统计方法往往假设统计总体的分布形态已知,但是在更多参数统计方法往往假设统计总体的分布形态已知,但是在更多的实际场合,常常由于缺乏足够信息,无法合理地去假设一个总的实际场合,常常由于缺乏足够信息,无法合理地去假设一个总体具有某种分布形式,此时就不能使用相应的参数方法了。因此体具有某种分布形式
2、,此时就不能使用相应的参数方法了。因此,应该放弃对总体分布参数的依赖,转而寻求更多的纯粹来自数,应该放弃对总体分布参数的依赖,转而寻求更多的纯粹来自数据的信息,这就是非参数统计方法。据的信息,这就是非参数统计方法。非参数检验非参数检验第三页,讲稿共二十九页哦和参数方法相比,和参数方法相比,非参数检验方法的优势如下非参数检验方法的优势如下 稳健性。稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。大的数据不至于
3、太敏感。对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。都可以做。适合于小样本、无分布样本、数据污染样本、混杂样本等。适合于小样本、无分布样本、数据污染样本、混杂样本等。非参数检验非参数检验第四页,讲稿共二十九页哦例例1 1 以下为治疗前后,病人某项指标的测量值,数据见以下为治疗前后,病人某项指标的测量值,数据见npa.sav治疗前(治疗前(x):):24.00 16.70 21.60 23.70 37.50 31.40 14.90 37.30 17.90 15.50 29.00 19.90治疗后(治疗后(Y):):
4、23.10 20.40 17.70 20.70 42.1 36.10 21.80 40.30 26.00 15.50 35.40 25.50配对样本的非参数检验配对样本的非参数检验第五页,讲稿共二十九页哦配对样本的非参数检验配对样本的非参数检验第六页,讲稿共二十九页哦 Wilcoxon符号检验符号检验 适用于连续变量适用于连续变量 sign符号检验符号检验 适用于对无法用数字计量的情况进行比较,如两分类,对于适用于对无法用数字计量的情况进行比较,如两分类,对于 连续资料最好不要使用连续资料最好不要使用 McNemar 实际上就是常用的配对实际上就是常用的配对2检验,只适用于二分类资料检验,只适
5、用于二分类资料 Marginal Homogeneity 是是McNemar法向多分类情形下的扩展,适用于资料为有序法向多分类情形下的扩展,适用于资料为有序 分类情况分类情况配对样本的非参数检验配对样本的非参数检验第七页,讲稿共二十九页哦Exact:用于计算确切概率:用于计算确切概率只给出近似概率只给出近似概率 蒙特卡罗方法蒙特卡罗方法给出精确概率值,并可设给出精确概率值,并可设定耗时限制定耗时限制配对样本的非参数检验配对样本的非参数检验第八页,讲稿共二十九页哦共共12对指标,指标值治疗后小于治疗前的有对指标,指标值治疗后小于治疗前的有3对,其平均秩对,其平均秩次为次为2.83,总秩和为,总秩
6、和为8.50;治疗后大于治疗前的有;治疗后大于治疗前的有8对,其平均对,其平均秩次为秩次为7.19,总秩和为,总秩和为57.50;治疗后等于治疗前的有;治疗后等于治疗前的有1对。对。分析结果分析结果(1)秩次表秩次表配对样本的非参数检验配对样本的非参数检验第九页,讲稿共二十九页哦 Wilcoxon符号秩检验的统计量符号秩检验的统计量Z值值-2.179,近似概率(,近似概率(Asymp.sig.)P0.029,按,按0.05的水准的水准可以认为治疗前后该可以认为治疗前后该指标值的差别具有统计学意义。指标值的差别具有统计学意义。分析结果分析结果(2)检验统计量检验统计量配对样本的非参数检验配对样本
7、的非参数检验第十页,讲稿共二十九页哦例例2 在缺氧条件下,观察在缺氧条件下,观察4只猫与只猫与12只兔的生存时间(分钟),结只兔的生存时间(分钟),结果如下。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计果如下。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。数据见学意义。数据见npb.sav:生存时间(猫):生存时间(猫):25 34 44 46 46生存时间(兔):生存时间(兔):15 15 16 17 19 21 21 23 25 27 28 28 30 35两独立样本的非参数检验两独立样本的非参数检验第十一页,讲稿共二十九页哦两独立样本的非参数检验两独立样本的非参数检验第
8、十二页,讲稿共二十九页哦两独立样本的非参数检验两独立样本的非参数检验第十三页,讲稿共二十九页哦两独立样本的非参数检验两独立样本的非参数检验第十四页,讲稿共二十九页哦默认的默认的Mann-Whitney U检验最常用检验最常用两独立样本的非参数检验两独立样本的非参数检验第十五页,讲稿共二十九页哦 生存时间样本共生存时间样本共19例,其中猫的生存时间例,其中猫的生存时间5例,其平例,其平均秩次为均秩次为15.70,总秩和为,总秩和为78.50;兔的生存时间;兔的生存时间14例,其例,其平均秩次为平均秩次为7.96,总秩和为,总秩和为111.50。(1)秩次表秩次表两独立样本的非参数检验两独立样本的
9、非参数检验第十六页,讲稿共二十九页哦 给出给出Mann-Whitney U、Wilcoxon W 统计量和统计量和Z值,近似值概率(值,近似值概率(Asymp.Sig)和精确概率值(和精确概率值(Exact.sig)均小于)均小于0.05,结论一致,表明猫、兔在缺氧条件下的生存时间,结论一致,表明猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫(的差异具有统计学意义,由平均秩次猫(15.7)、兔()、兔(7.96)来看,可以认为缺氧条件下猫的)来看,可以认为缺氧条件下猫的生存时间长于兔。生存时间长于兔。分析结果分析结果两独立样本的非参数检验两独立样本的非参数检验(2)检验统计量检
10、验统计量第十七页,讲稿共二十九页哦例例3 14名新生儿出生体重按其母亲的吸烟习惯分组(名新生儿出生体重按其母亲的吸烟习惯分组(A组:每日组:每日吸烟多于吸烟多于20支;支;B组:每日吸烟少于组:每日吸烟少于20支;支;C组:过去吸烟而现已戒组:过去吸烟而现已戒烟;烟;D组:从不吸烟),具体如下。试问四个吸烟组出生体重分布是组:从不吸烟),具体如下。试问四个吸烟组出生体重分布是否相同?数据见否相同?数据见npc.sav:A组:组:2.7 2.4 2.2 3.4 B组:组:2.9 3.2 3.2C组:组:3.3 3.6 3.4 3.4多个独立样本的非参数检验多个独立样本的非参数检验D组:组:3.5
11、 3.6 3.7第十八页,讲稿共二十九页哦多个独立样本的非参数检验多个独立样本的非参数检验第十九页,讲稿共二十九页哦多个独立样本的非参数检验多个独立样本的非参数检验第二十页,讲稿共二十九页哦设置组别变量的最小值设置组别变量的最小值1、最大值、最大值4多个独立样本的非参数检验多个独立样本的非参数检验第二十一页,讲稿共二十九页哦多个独立样本的非参数检验多个独立样本的非参数检验第二十二页,讲稿共二十九页哦 Kruskal-Wallis H检验:检验:k=3个独立随机连续分布样本的比较,而个独立随机连续分布样本的比较,而正态性假设及等方差假设存在问题时,它可以进行总体是否相同的检正态性假设及等方差假设
12、存在问题时,它可以进行总体是否相同的检验。验。Median:中位数检验,三种方法中检验效能最低,但对于拖:中位数检验,三种方法中检验效能最低,但对于拖长尾的对称分布很有效长尾的对称分布很有效 Jonckheere-Terpstra:对连续性资料或有序分类资料都适用,并:对连续性资料或有序分类资料都适用,并当分组变量为有序分类资料时,此法的检验效能要高于当分组变量为有序分类资料时,此法的检验效能要高于Kruskal-Wallis法。法。多个独立样本的非参数检验多个独立样本的非参数检验第二十三页,讲稿共二十九页哦 母亲每日吸烟多于母亲每日吸烟多于20支组共支组共4名新生儿,体重平均秩次名新生儿,体
13、重平均秩次3.75;每日吸烟少于每日吸烟少于20支组共支组共3名新生儿,体重平均秩次名新生儿,体重平均秩次5.00;过去;过去吸烟现已戒烟组共吸烟现已戒烟组共4名新生儿,体重平均秩次名新生儿,体重平均秩次9.38;从不吸烟;从不吸烟组共组共3名新生儿,平均秩次名新生儿,平均秩次12.50。分析结果分析结果多个独立样本的非参数检验多个独立样本的非参数检验(1)秩次表秩次表第二十四页,讲稿共二十九页哦 Kruskal-Wallis H统计量的近似显著概率为统计量的近似显著概率为0.023,按,按0.05的水的水准拒绝原假设,可认为四个组中至少有两组出生体重的总体分布不同。准拒绝原假设,可认为四个组
14、中至少有两组出生体重的总体分布不同。分析结果分析结果(2)检验统计量检验统计量多个独立样本的非参数检验多个独立样本的非参数检验第二十五页,讲稿共二十九页哦例例4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素浓度,试验结果如下。问四种条件下的测量结果的差异是否具有统浓度,试验结果如下。问四种条件下的测量结果的差异是否具有统计学意义?数据见计学意义?数据见npd.sav:多个相关样本的非参数检验多个相关样本的非参数检验第二十六页,讲稿共二十九页哦多个相关样本的非参数检验多个相关样本的非参数检验第二十七页,讲稿共二十九页哦 Friedm
15、an:常用的多个配伍样本的非参数检验:常用的多个配伍样本的非参数检验 Kendalls W:可进一步给出一致性程度:可进一步给出一致性程度 Cochrans Q:是两配对样本:是两配对样本McNemar方法的推广,方法的推广,只适合二分类变量只适合二分类变量多个相关样本的非参数检验多个相关样本的非参数检验第二十八页,讲稿共二十九页哦分析结果分析结果(1)秩次表秩次表 经经Friedman Test,近似概率(,近似概率(Asymp.sig.)P0.042,小于,小于0.05,故拒绝原假设,认为四种条件下测量结果的差别具有统计学意义的。,故拒绝原假设,认为四种条件下测量结果的差别具有统计学意义的。(2)检验统计量检验统计量多个相关样本的非参数检验多个相关样本的非参数检验第二十九页,讲稿共二十九页哦