非参数第五章精选PPT.ppt

上传人:石*** 文档编号:43302796 上传时间:2022-09-17 格式:PPT 页数:69 大小:2.85MB
返回 下载 相关 举报
非参数第五章精选PPT.ppt_第1页
第1页 / 共69页
非参数第五章精选PPT.ppt_第2页
第2页 / 共69页
点击查看更多>>
资源描述

《非参数第五章精选PPT.ppt》由会员分享,可在线阅读,更多相关《非参数第五章精选PPT.ppt(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、非参数第五章第1页,此课件共69页哦5.1 Kruskal5.1 KruskalWallisWallis秩和检验秩和检验例例5.15.1 在一项健康试验中,三组人有三种生活方式,它在一项健康试验中,三组人有三种生活方式,它们的减肥效果如下表:们的减肥效果如下表:生活方式 1 2 3 一个月后减少的重量(单位500g)3.7 7.3 9.03.7 5.2 4.93.0 5.3 7.13.9 5.7 8.72.7 6.5 ni5 5 4 人们想要知道的是从这些数据能否得出它们的减人们想要知道的是从这些数据能否得出它们的减肥效果(位置参数)是一样的肥效果(位置参数)是一样的.第2页,此课件共69页哦

2、数据形式为(这里各个样本的大小不一定一样,观测值数据形式为(这里各个样本的大小不一定一样,观测值总数记为总数记为 )1 2 k 第3页,此课件共69页哦 在各个总体为等方差正态分布及观测值独立的假定下,问题归结于各个样本所代表的总体均值 是否相同.零假设为 ;备择假设通常为 .检验统计量为F在下的分布为自由度为的分布第4页,此课件共69页哦若假定这个样本有相似的连续分布(除了位置若假定这个样本有相似的连续分布(除了位置可能不同外),而且所有的观测值在样本内和样本之可能不同外),而且所有的观测值在样本内和样本之间是独立的间是独立的即:即:假定个独立样本有连续分布函数假定个独立样本有连续分布函数,

3、零假设为零假设为;而备择假设为,这里;而备择假设为,这里是某连续分布函数,而且这些位置参数并不全部相同是某连续分布函数,而且这些位置参数并不全部相同第5页,此课件共69页哦 这个问题也可以写成线性模型的形式,假定有这个问题也可以写成线性模型的形式,假定有 个个样本,各样本的样本量为样本,各样本的样本量为 ,那么,观测值可,那么,观测值可以写成下面的线性模型:以写成下面的线性模型:这里,误差是独立同分布的这里,误差是独立同分布的.我们要检验的是我们要检验的是第6页,此课件共69页哦 把多个样本混合起来后求秩,再求各自样本的秩之和把多个样本混合起来后求秩,再求各自样本的秩之和 1 2 k 其中其中

4、 ,第7页,此课件共69页哦Kruskal-WallisKruskal-Wallis统计量统计量这里这里 为所有观测值得秩的平均为所有观测值得秩的平均水平水平 的的Kruskal-WallisKruskal-Wallis检验可以定义为:如果使检验可以定义为:如果使 的值大于其实现值的分配数目小于的值大于其实现值的分配数目小于 (这里这里 )则拒绝零假设。则拒绝零假设。第8页,此课件共69页哦 在在 时,其在零假设下的分布有表可以查;时,其在零假设下的分布有表可以查;在在 大时,并且对每个大时,并且对每个 趋于某个非零数趋于某个非零数 ,则,则 在零假设下近似于有个自由度在零假设下近似于有个自由

5、度 的的 分分布。布。另外在大样本时,还有一个零假设下近似于另外在大样本时,还有一个零假设下近似于 分布的统计量分布的统计量第9页,此课件共69页哦第10页,此课件共69页哦生活方式 1 2 3一个月后减少的重量(单位500g)3.7(3.5)7.3(12)9.0(14)3.7(3.5)5.2(7)4.9(6)3.0(2)5.3(8)7.1(11)3.9(5)5.7(9)8.7(13)2.7(1)6.5(10)秩和秩平均 15 46 44 3 9.2 11第11页,此课件共69页哦 Kruskal-Wallis rank sum test Kruskal-Wallis rank sum tes

6、tdata:a,1 and a,2 data:a,1 and a,2 Kruskal-Wallis chi-squared=9.4322,df=2,p-Kruskal-Wallis chi-squared=9.4322,df=2,p-value=0.00895value=0.00895在存在打结的情况,上面的检验统计量可以修正为在存在打结的情况,上面的检验统计量可以修正为这里的为结统计量,而为结的个数这里的为结统计量,而为结的个数第12页,此课件共69页哦5.2 5.2 正态记分检验正态记分检验假定个独立样本有连续分布函数假定个独立样本有连续分布函数,零假设零假设为;而备择假设为为;而备择假设

7、为,这里是某连续分布函数,而且这些位置参数并不全部相,这里是某连续分布函数,而且这些位置参数并不全部相同同构造正态记分的过程如下:构造正态记分的过程如下:先把所有的样本混先把所有的样本混合,然后按照升幂排列,再把每一个观测值在合,然后按照升幂排列,再把每一个观测值在混合样本中的秩替换为第个标准正混合样本中的秩替换为第个标准正态分位点(正态记分),记之为正态记分态分位点(正态记分),记之为正态记分定义为定义为第13页,此课件共69页哦2.7 1 1-1.501085952.7 1 1-1.501085953.0 1 2-1.110771623.0 1 2-1.110771623.7 1 3-0.

8、841621233.7 1 3-0.841621233.7 1 4-0.622925723.7 1 4-0.622925723.9 1 5-0.430727303.9 1 5-0.430727304.9 3 6-0.253347104.9 3 6-0.253347105.2 2 7-0.083651735.2 2 7-0.083651735.3 2 8 0.083651735.3 2 8 0.083651735.7 2 9 0.253347105.7 2 9 0.253347106.5 2 10 0.430727306.5 2 10 0.430727307.1 3 11 0.622925727

9、.1 3 11 0.622925727.3 2 12 0.841621237.3 2 12 0.841621238.7 3 13 1.110771628.7 3 13 1.110771629.0 3 14 1.501085959.0 3 14 1.50108595第14页,此课件共69页哦 d=read.table(E:/data/wtloss.txt)d=read.table(E:/data/wtloss.txt)d=dorder(d,1),d=dorder(d,1),n1=sum(d,2=1)n1=sum(d,2=1)n2=sum(d,2=2)n2=sum(d,2=2)n3=sum(d,2

10、=3)n3=sum(d,2=3)n=nrow(d)n=nrow(d)r=rank(d,1)r=rank(d,1)w=qnorm(r/(n+1)w=qnorm(r/(n+1)z=cbind(d,r,w)z=cbind(d,r,w)第15页,此课件共69页哦nn=sum(sum(wz,2=1)2/n1,sum(wz,2=2)2/n2,sum(wz,2=3)2/n3)T=(n-1)*nn/sum(w2)pchisq(T,3-1,low=F)1 0.010679031 9.078947第16页,此课件共69页哦5.3 Jonckheere-Terpstra5.3 Jonckheere-Terpstra

11、检验检验假定个独立样本有相同形状的连续分布函数,有假定个独立样本有相同形状的连续分布函数,有位置参数(比如中位数)位置参数(比如中位数),令,令 为来自第为来自第 个样本的第个样本的第 个独立观测值个独立观测值 同样这个问题也可以写成线性模型的形式,假定这同样这个问题也可以写成线性模型的形式,假定这 个样本的样本量分别为个样本的样本量分别为 ,那么,观测,那么,观测值可以写成下面的线性模型:值可以写成下面的线性模型:这里,误差是独立同分布的。这里,误差是独立同分布的。第17页,此课件共69页哦如果样本的位置显现出趋势,比如持续上升的趋势,如果样本的位置显现出趋势,比如持续上升的趋势,则可能在检

12、验中考虑下面参数有序的备择假设则可能在检验中考虑下面参数有序的备择假设如果样本呈现下降趋势,则备择假设为:如果样本呈现下降趋势,则备择假设为:本节的本节的Jonckheere-TerpstraJonckheere-Terpstra统计量先计算统计量先计算第18页,此课件共69页哦然后,对所有的然后,对所有的 在在 范围求和,这样就范围求和,这样就产生了产生了Jonckheere-TerpstraJonckheere-Terpstra统计量:统计量:它的大小从它的大小从0 0到到 变化变化.如果有结出现,如果有结出现,可稍作可稍作变更为变更为而而 也相应地变为也相应地变为第19页,此课件共69页

13、哦当当 或或 大时,应拒绝零假设大时,应拒绝零假设.可以通过查表,从可以通过查表,从 及检验水平及检验水平 来得到在零假设下的临界值来得到在零假设下的临界值 ,它满足,它满足 .然而,当有结时,表不准确然而,当有结时,表不准确(样本大的时候较好)(样本大的时候较好).在样本太大,超出表的范围时,在样本太大,超出表的范围时,可以用正态近似,即当可以用正态近似,即当 时时Jonckheere-TerpstraJonckheere-Terpstra检验是由检验是由TerpstraTerpstra(19521952)和)和JonckheereJonckheere(19541954)独立提出来的)独立提

14、出来的.它比它比Kruskal-WallisKruskal-Wallis检验有更强的势检验有更强的势().第20页,此课件共69页哦再看上节的减肥例子,因为觉得可能有上升趋势,所采再看上节的减肥例子,因为觉得可能有上升趋势,所采取的备择假设为取的备择假设为生活方式 1 2 3 一个月后减少的重量(单位500g)3.7 7.3 9.03.7 5.2 4.93.0 5.3 7.13.9 5.7 8.72.7 6.5 ni5 5 4比较上面数据表中的每两列,很容易得出比较上面数据表中的每两列,很容易得出第21页,此课件共69页哦第22页,此课件共69页哦利用正态近似,得到利用正态近似,得到 ,进而得

15、到,进而得到 值为值为0.000960.00096,因,因此,可以在水平此,可以在水平 时拒绝零假设时拒绝零假设.第23页,此课件共69页哦5.4 5.4 区组设计数据分析回顾区组设计数据分析回顾 上面减肥数据的例子中,假定在每一个样本中的上面减肥数据的例子中,假定在每一个样本中的观测值是相互独立的,样本之间也是相互独立的观测值是相互独立的,样本之间也是相互独立的.每每一个样本代表了一个变量或因素,习惯上称为一个样本代表了一个变量或因素,习惯上称为“处处理理”.然而在实践中,除了处理之外,往往还有别然而在实践中,除了处理之外,往往还有别的因素起作用的因素起作用.比如在关于肥料(处理)效能的农比

16、如在关于肥料(处理)效能的农业试验中,不同条件的土壤就构成了另外一个因业试验中,不同条件的土壤就构成了另外一个因素,习惯上称为素,习惯上称为“区组(区组(blockblock)”.如果随机地把如果随机地把所有处理分配到所有的区组中,使得总的变化可以所有处理分配到所有的区组中,使得总的变化可以分解为:分解为:(1 1)处理造成的不同;()处理造成的不同;(2 2)区组内的变)区组内的变化;(化;(3 3)区组之间的变化)区组之间的变化.这就是这就是随机化完全区组随机化完全区组设计(设计(Randomized Complete Block DesignRandomized Complete Blo

17、ck Design).当区当区组存在时,代表处理的样本的独立性就不再成立组存在时,代表处理的样本的独立性就不再成立了了.第24页,此课件共69页哦以一例来说明一些常见的概念以一例来说明一些常见的概念.例例5.25.2 在不同的城市对不同的人群进行血液中铅的含量测试;一共在不同的城市对不同的人群进行血液中铅的含量测试;一共有有A A,B B,C C三个汽车密度不同的城市代表着三种三个汽车密度不同的城市代表着三种()()不同的处理不同的处理.对对试验者按职业分四组(试验者按职业分四组()取血()取血(4 4个区组)个区组).他们血中铅的含量列在下面表中(他们血中铅的含量列在下面表中():):城市(

18、处理)职业(区组)ABC80 100 51 6552 76 52 5340 52 34 35每一个处理在每一个区组中出现并仅出现一次每一个处理在每一个区组中出现并仅出现一次.这是一个完全区组这是一个完全区组设计,每个处理和区组的组合都有一个观测值设计,每个处理和区组的组合都有一个观测值.第25页,此课件共69页哦在实践中,并不一定能把每一个处理分配到每一个区组中在实践中,并不一定能把每一个处理分配到每一个区组中,这样就产生了不完全区组设计这样就产生了不完全区组设计.在不完全区组设计中最容易在不完全区组设计中最容易处理的是处理的是平衡的不完全区组设计(平衡的不完全区组设计(Balanced Ba

19、lanced Incomplete Block Design-BIBDIncomplete Block Design-BIBD).如果一共有如果一共有 个个处理及处理及 个区组,而且在每一个区组含有个区组,而且在每一个区组含有 个处理个处理.平衡平衡的不完全区组设计的不完全区组设计 满足下面条件:满足下面条件:(1 1)每个处理在同)每个处理在同一区组中最多出现一次;(一区组中最多出现一次;(2 2);(;(3 3)每个处)每个处理都出现在相同多(理都出现在相同多()个区组中;)个区组中;(4 4)每两个处)每两个处理在一个区组中相遇次数一样(理在一个区组中相遇次数一样(次)次).用数学语言用

20、数学语言来说,这些参数满足来说,这些参数满足如果如果 ,则为完全区组设计,则为完全区组设计.第26页,此课件共69页哦例例5.3 5.3 一个一个BIBBIB设计的例子是比较四种材料设计的例子是比较四种材料 在四个部位在四个部位 的磨损,数据可以写成下面两种形式:的磨损,数据可以写成下面两种形式:材料(处理)部位(区组)ABCD34 28 3636 30 4540 48 60 44 54 59部位(区组)34(A)30(B)48(C)59(D)36(B)28(A)54(D)60(C)40(C)44(D)36(A)45(B)这里这里第27页,此课件共69页哦 在正态假定下,如何进行这种检验,用在

21、正态假定下,如何进行这种检验,用 表示表示第第 个处理在第个处理在第 个区组的观测值个区组的观测值(这里仅考虑对于每对(这里仅考虑对于每对 只有一个观测值的情况)只有一个观测值的情况).在检在检验处理的均值验处理的均值 是否相等时的零假设为是否相等时的零假设为 ,备择检验为备择检验为 “不是所有的不是所有的 都相等都相等.”对于完全区组试验,正态总体条件下的检验统计对于完全区组试验,正态总体条件下的检验统计量为量为第28页,此课件共69页哦5.5 5.5 完全区组设计:完全区组设计:FriedmanFriedman秩和检验秩和检验 完全区组设计中每个处理在每个区组中恰好有一完全区组设计中每个处

22、理在每个区组中恰好有一个观测值个观测值.关于处理的位置参数(用关于处理的位置参数(用 表示)表示)的零假设为的零假设为 ;而备择假设为;而备择假设为 :“不是所有的位置参数都相等不是所有的位置参数都相等.”由于区组的影响,要首由于区组的影响,要首先在每一个区组中计算各个处理的秩,再把每一个先在每一个区组中计算各个处理的秩,再把每一个处理在各区组中的秩相加处理在各区组中的秩相加.如果如果 表示在表示在 各区组中各区组中 处理的秩。则秩按照处理而求得处理的秩。则秩按照处理而求得的和为的和为 这样做的目的是这样做的目的是在每个区组内比较处理在每个区组内比较处理.第29页,此课件共69页哦 区组处理

23、1 2 b 1 2k第30页,此课件共69页哦FriedmanFriedman统计量定义为:统计量定义为:该统计量是该统计量是FriedmanFriedman(19371937)提出来的,后来又被)提出来的,后来又被Kendall(1938,1962),KendallKendall(1938,1962),KendallSmith(1939)Smith(1939)发展到多元变发展到多元变量的协同系数相关问题上量的协同系数相关问题上.对于有限的对于有限的 和和 ,有零假,有零假设下的分布表可查,查的时候要作变换设下的分布表可查,查的时候要作变换 ,当查不到,当查不到时,可用自由度为时,可用自由度为

24、 的的 分布近似分布近似.对于固定的对于固定的 ,当当 时,在零假设下有时,在零假设下有第31页,此课件共69页哦第32页,此课件共69页哦第33页,此课件共69页哦 城市(处理)职业(区组)1194 ABC80(3)100(3)51(2)65(3)52(2)76(2)52(3)53(2)40(1)52(1)34(1)35(1)由此可得由此可得 ,对,对 查查表得到相应于表得到相应于 的临界值为的临界值为 这里这里 .由于由于 ,由此对于水平,由此对于水平 可以拒绝零假设可以拒绝零假设.第34页,此课件共69页哦在某区组存在结时,在某区组存在结时,可以修正为可以修正为 Friedman Fri

25、edman检验和通常正态假定下方差分析相比较的检验和通常正态假定下方差分析相比较的渐近相对效率(渐近相对效率(AREARE).记记 的分布为的分布为 ,如,如果由于区组效应,尺度参数果由于区组效应,尺度参数 不一样,则不一样,则FriedmanFriedman检验检验对于通常方差分析的对于通常方差分析的AREARE即使对正态总体也可以超过即使对正态总体也可以超过1.1.如果区组效应造成其尺度和位置二参数在区组间都不同,如果区组效应造成其尺度和位置二参数在区组间都不同,该该AREARE有下界有下界 .在正态假定成立并且等方差在正态假定成立并且等方差时,时,AREARE可高达可高达 .因此,即使正

26、态假定成立,因此,即使正态假定成立,作方差分析时,为了对抗异方差性,可以考虑作方差分析时,为了对抗异方差性,可以考虑FriedmanFriedman检验检验.第35页,此课件共69页哦 成对处理的比较成对处理的比较 上面的零假设和备择假设是关于所有处理的,但有时想上面的零假设和备择假设是关于所有处理的,但有时想知道某两个处理的比较知道某两个处理的比较.下面介绍大样本时的基于下面介绍大样本时的基于FriedmanFriedman秩和检验的一个方法秩和检验的一个方法.如果零假设为:如果零假设为:“处理和处理和 处理没处理没有区别有区别”,那么,双边检验的统计量为,那么,双边检验的统计量为 ;对于置

27、信水对于置信水平平 ,如果,如果则拒绝零假设,这里则拒绝零假设,这里第36页,此课件共69页哦d=read.table(E:/data/blead.txt)d=read.table(E:/data/blead.txt)d d V1 V2 V3 V1 V2 V31 80 52 401 80 52 402 100 76 522 100 76 523 51 52 343 51 52 344 65 53 35 4 65 53 35 friedman.test(as.matrix(d)friedman.test(as.matrix(d)Friedman rank sum test Friedman ra

28、nk sum testdata:as.matrix(d)data:as.matrix(d)Friedman chi-squared=6.5,df=2,p-Friedman chi-squared=6.5,df=2,p-value=0.03877value=0.03877第37页,此课件共69页哦5.6 Kendall协同系数检验协同系数检验 在实践中,经常需要按照某特别的性质来多次在实践中,经常需要按照某特别的性质来多次(次)对次)对 个个体进行评估或排序;比如个个体进行评估或排序;比如 个个裁判员对于裁判员对于 种品牌酒类的排队,种品牌酒类的排队,个选民对个选民对 个个候选人的评价,候选人的

29、评价,个咨询机构对一系列个咨询机构对一系列(个个)企业企业的评估以及体操裁判员对运动员的打分等等的评估以及体操裁判员对运动员的打分等等.人们人们往往想知道,这往往想知道,这 个结果是否或多或少地一致个结果是否或多或少地一致.如如果不一致,则这个评估多少有些随机性,没有多大果不一致,则这个评估多少有些随机性,没有多大意义意义.第38页,此课件共69页哦例例5.4(airp.txt)下面是)下面是4个独立的环境研究单位对个独立的环境研究单位对10个个城市空气等级排序的结果城市空气等级排序的结果:评估机构 被评估的10个城市(A-J)的排名()A B C D E F G H I JABCD 9 2

30、4 10 7 6 8 5 3 110 1 3 8 7 5 9 6 4 2 8 4 2 10 9 7 5 6 3 1 9 1 2 10 6 7 4 8 5 336 8 11 38 29 25 26 25 15 7人们想知道这四个评估机构的结果是否是随机的人们想知道这四个评估机构的结果是否是随机的.第39页,此课件共69页哦令零假设为令零假设为 :“这些评估(对于不同个体)是不相关这些评估(对于不同个体)是不相关的或是随机的的或是随机的”,而备择假设为,而备择假设为 :“它们(对各个个它们(对各个个体)是正相关的或者是多少一致的体)是正相关的或者是多少一致的.”Kendall和和Smith(193

31、9)提出了)提出了协同系数协同系数(coefficient of concordance),协同系数可以看成为二元变量的协同系数可以看成为二元变量的Kendall 在多元的推广在多元的推广.Kendall协同系数定义为协同系数定义为这里这里 是个体的总秩与平均秩的偏差的平方和是个体的总秩与平均秩的偏差的平方和.每个评每个评估者估者(共共 个个)对于所有参加排序的个体有一个从对于所有参加排序的个体有一个从1 1到到 的排序的排序(秩秩););而每个个体有而每个个体有 个打分个打分(秩秩)第40页,此课件共69页哦记记 为第为第 个个体的秩的和个个体的秩的和()(),则,则Kendall协同系数协

32、同系数 还可以写成下面的形式还可以写成下面的形式:的取值范围是从的取值范围是从0 0到到1.1.第41页,此课件共69页哦 d=read.table(E:/data/airp.txt)d=read.table(E:/data/airp.txt)d d V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V1 V2 V3 V4 V5 V6 V7 V8 V9 V101 9 2 4 10 7 6 8 5 3 11 9 2 4 10 7 6 8 5 3 12 10 1 3 8 7 5 9 6 4 22 10 1 3 8 7 5 9 6 4 23 8 4 2 10 9 7 5 6 3 13 8

33、 4 2 10 9 7 5 6 3 14 9 1 2 10 6 7 4 8 5 34 9 1 2 10 6 7 4 8 5 3 R=apply(d,2,sum)R=apply(d,2,sum)R R V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 36 8 11 38 29 25 26 25 15 7 36 8 11 38 29 25 26 25 15 7 第42页,此课件共69页哦 m=nrow(d)m=nrow(d)m m1 41 4 n=ncol(d)n=ncol(d)n n1 101 10 S=sum(R-m*

34、(n+1)/2)2)S=sum(R-m*(n+1)/2)2)S S1 11261 1126 W=12*S/m2/(n3-n)W=12*S/m2/(n3-n)W W1 0.85303031 0.8530303第43页,此课件共69页哦当当 大时,可以利用大样本性质:在零假设下,对固定的大时,可以利用大样本性质:在零假设下,对固定的 ,当,当 ,pchisq(m*(n-1)*W,n-1,low=F)pchisq(m*(n-1)*W,n-1,low=F)1 0.00033203491 0.0003320349可能更精确一些的近似为可能更精确一些的近似为 统计量统计量第44页,此课件共69页哦 的值大

35、(的值大(显著显著),意味着各个个体在评估中),意味着各个个体在评估中有明显的不同;可以认为这样所产生的评估结果有明显的不同;可以认为这样所产生的评估结果是有道理的是有道理的.而如果而如果 不显著不显著,意味着评估者对,意味着评估者对于各个个体意见很不一致,则没有理由认为能够于各个个体意见很不一致,则没有理由认为能够产生一个共同的评估结果产生一个共同的评估结果.第45页,此课件共69页哦5.7 5.7 完全区组设计:关于二元响应的完全区组设计:关于二元响应的Cochran检验检验例例5.5(candid.txt)下面是某村村民对四个候选人下面是某村村民对四个候选人(A,B,C,D)的赞同与否的

36、调查(数字)的赞同与否的调查(数字“1”代表同意,代表同意,“0”代表不同意);代表不同意);处理区组:20个村民对A,B,C,D四个候选人的评价ABCD0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 0 1 1 11 1 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 0 0 00 1 1 1 1 0 0 0 0 1 0 0 0 1 1 0 1 0 1 00 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 0 0 0 1611 9 61 3 2 1 2 3 2 2 3 3 1 2 2 3 3 3 2 1 2 142第46页,此课件共69页哦 所关心

37、的是这四个候选人在村民眼中有没有区别所关心的是这四个候选人在村民眼中有没有区别.即检即检验验 ,对应于备择假设,对应于备择假设 “不是所有不是所有的位置参数都相等的位置参数都相等.”如果用如果用Friedman检验,将会有很多打结现象,即检验,将会有很多打结现象,即许多秩相同许多秩相同.而而Cochran检验就解决了打结问题检验就解决了打结问题.Cochran把把 看成为固定的,在零假设下,对每个看成为固定的,在零假设下,对每个 ,个个“1 1”在各个处理中是等可能的在各个处理中是等可能的.也就是说每个处理有也就是说每个处理有同等的概率得到同等的概率得到“1 1”,而且该概率依赖于固定的,而且

38、该概率依赖于固定的 值值.的值随着不同的观察的值随着不同的观察 而不同而不同.下面给出下面给出CochranCochran检验统计检验统计量的定义量的定义第47页,此课件共69页哦在零假设下,对于固定的在零假设下,对于固定的 ,当,当 时时这里检验了排列的对称性,即在零假设下,这里检验了排列的对称性,即在零假设下,在给定在给定 时和时和 有同样的条件分布,这有同样的条件分布,这里里 为为 的任意排列的任意排列.第48页,此课件共69页哦 V1 V2 V3 V4 V1 V2 V3 V41 0 1 0 01 0 1 0 02 1 1 1 02 1 1 1 03 1 0 1 03 1 0 1 04

39、0 0 1 04 0 0 1 05 0 0 1 15 0 0 1 16 1 1 0 16 1 1 0 17 1 1 0 07 1 1 0 08 1 1 0 08 1 1 0 09 1 1 0 19 1 1 0 110 1 1 1 010 1 1 1 0 V1 V2 V3 V4 V1 V2 V3 V411 1 0 0 011 1 0 0 012 1 1 0 012 1 1 0 013 1 1 0 013 1 1 0 014 1 0 1 114 1 0 1 115 1 1 1 015 1 1 1 016 1 1 0 116 1 1 0 117 0 0 1 117 0 0 1 118 1 0 0 0

40、18 1 0 0 019 1 0 1 019 1 0 1 020 1 0 0 020 1 0 0 0 x=read.table(E:/data/candid.txt)x=read.table(E:/data/candid.txt)x x第49页,此课件共69页哦 n=apply(x,2,sum)n=apply(x,2,sum)n nV1 V2 V3 V4 V1 V2 V3 V4 16 11 9 6 16 11 9 6 N=sum(n)N=sum(n)N N1 421 42 L=apply(x,1,sum)L=apply(x,1,sum)L L 1 2 3 4 5 6 7 8 9 10 11 1

41、2 13 14 15 16 17 18 19 20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 3 2 1 2 3 2 2 3 3 1 2 2 3 3 3 2 1 2 1 1 3 2 1 2 3 2 2 3 3 1 2 2 3 3 3 2 1 2 1 第50页,此课件共69页哦 k=dim(x)2 k=dim(x)2 k k1 41 4 Q=(k*(k-1)*sum(n-mean(n)2)/(k*N-sum(L2)Q=(k*(k-1)*sum(n-mean(n)2)/(k*N-sum(L2)Q Q1 9.3529411 9.3529

42、41 pvalue=pchisq(Q,k-1,low=F)pvalue=pchisq(Q,k-1,low=F)pvalue pvalue1 0.024948401 0.02494840第51页,此课件共69页哦5.8 完全区组设计:完全区组设计:Page检验检验对于完全区组设计的检验问题对于完全区组设计的检验问题PagePage(19631963)引进下面的检验统计量)引进下面的检验统计量.和和FriedmanFriedman统统计量一样,首先在每一个区组中,对处理排序;然后计量一样,首先在每一个区组中,对处理排序;然后对每个处理把观测值在各区组中的秩加起来,得到对每个处理把观测值在各区组中的

43、秩加起来,得到 .它具体定义为它具体定义为 第52页,此课件共69页哦 其中每一项乘以其中每一项乘以 的主要思想在于:如果的主要思想在于:如果 是正确是正确的,这可以的,这可以“放大放大”备择假设备择假设 的效果的效果.在总体分布为在总体分布为连续的条件下,如果没有打结,则该检验是和总体分连续的条件下,如果没有打结,则该检验是和总体分布无关的布无关的.对于一部分对于一部分 和和 的值可以由查表来得到的值可以由查表来得到在零假设下的临界值在零假设下的临界值 ,满足,满足 ,当当 固定,固定,而而 时,在零假设下有正态近似时,在零假设下有正态近似第53页,此课件共69页哦在区组内有打结的情况下,在

44、区组内有打结的情况下,可以修正为可以修正为这里这里 为在第为在第 个处理中及第个处理中及第 个结中的观测值个数(结统个结中的观测值个数(结统计量)计量).城市(处理)职业(区组)1194 ABC80(3)100(3)51(2)65(3)52(2)76(2)52(3)53(2)40(1)52(1)34(1)35(1)例例5.2第54页,此课件共69页哦第55页,此课件共69页哦 城市(处理)职业(区组)4911 CBA40(1)52(1)34(1)35(1)52(2)76(2)52(3)53(2)80(3)100(3)51(2)65(3)检验问题为:检验问题为:第56页,此课件共69页哦 d=r

45、ead.table(E:/data/blead1.txt)d=read.table(E:/data/blead1.txt)d d V1 V2 V3 V1 V2 V31 40 52 801 40 52 802 52 76 1002 52 76 1003 34 52 513 34 52 514 35 53 654 35 53 65 rd=apply(d,1,rank)rd=apply(d,1,rank)rd rd 1 2 3 4 1 2 3 4V1 1 1 1 1V1 1 1 1 1V2 2 2 3 2V2 2 2 3 2V3 3 3 2 3V3 3 3 2 3第57页,此课件共69页哦 R=ap

46、ply(rd,1,sum)R=apply(rd,1,sum)R RV1 V2 V3 V1 V2 V3 4 9 11 4 9 11 L=sum(R*1:length(R)L=sum(R*1:length(R)L L1 551 55 k=dim(d)2 k=dim(d)2 k k1 31 3 b=dim(d)1 b=dim(d)1 b b1 41 4第58页,此课件共69页哦 m=b*k*(k+1)2/4 m=b*k*(k+1)2/4 m m1 481 48 s=sqrt(b*(k3-k)2/144/(k-1)s=sqrt(b*(k3-k)2/144/(k-1)s s1 2.8284271 2.8

47、28427 Z=(L-m)/s Z=(L-m)/s Z Z1 2.4748741 2.474874 P=pnorm(Z,low=F)P=pnorm(Z,low=F)P P1 0.0066641641 0.006664164第59页,此课件共69页哦5.9 5.9 不完全区组设计:不完全区组设计:DurbinDurbin检验检验 考虑不完全区组设计考虑不完全区组设计BIBD().BIBD().首先首先假定总体分布为连续的,而且不存在打结;再假假定总体分布为连续的,而且不存在打结;再假定区组之间相互独立定区组之间相互独立.考虑检验考虑检验 ,对对 “不是所有的位置参数都相等不是所有的位置参数都相等

48、.”和前面的和前面的FriedmanFriedman检验一样,在每一个区组中,对处理排检验一样,在每一个区组中,对处理排序;然后对每个处理把观测值在各区组中的秩加序;然后对每个处理把观测值在各区组中的秩加起来起来.如果记如果记 为在第为在第 区组中的第区组中的第 个处理的个处理的秩,按处理相加得到秩,按处理相加得到 ,第60页,此课件共69页哦Durbin(1951)Durbin(1951)检验统计量为检验统计量为 对于显著性水平对于显著性水平 ,如果,如果D很大,比如大于或等于很大,比如大于或等于 ,这里,这里 为最小的满足为最小的满足 的值,我们则可的值,我们则可以对于水平以对于水平 拒绝

49、零假设拒绝零假设.在零假设下,对于固定的在零假设下,对于固定的 和和 ,当,当 时时第61页,此课件共69页哦 对于有打结现象时,需要对上面公式进行修正,相关公对于有打结现象时,需要对上面公式进行修正,相关公式为式为另一个稍微精确些的统计量是对这个统计量的修正另一个稍微精确些的统计量是对这个统计量的修正第62页,此课件共69页哦例例5.3 材料(处理)部位(区组)3588 ABCD34(1)28(1)36(1)36(2)30(2)45(1)40(3)48(2)60(3)44(3)54(3)59(2)第63页,此课件共69页哦d=read.table(E:/data/mater.txt)d=re

50、ad.table(E:/data/mater.txt)k=max(d,2)k=max(d,2)k k1 41 4 b=max(d,3)b=max(d,3)b b1 41 4 t=length(dd,3=1,1)t=length(dd,3=1,1)t t1 31 3 r=length(dd,2=1,1)r=length(dd,2=1,1)r r1 31 3第64页,此课件共69页哦 R=d R=d R R for(i in 1:k)Rd,3=i,1=rank(dd,3=i,1)for(i in 1:k)Rd,3=i,1=rank(dd,3=i,1)RV=NULL RV=NULL for(i in

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁