《非参数统计--第3章(第四版)课件.ppt》由会员分享,可在线阅读,更多相关《非参数统计--第3章(第四版)课件.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 两样本位置检验两样本位置检验第一节 Brown-Mood中位数检验在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽油中哪一个污染更少,两种市场营销策略中哪种更有效,两种药物中哪种更有效传统上,人们假设总体是正态分布或近似的正态分布,然后利用两样本的T检验。但是关于总体是正态的假设并不一定合理。在小样本时,近似也不一定合适。本章的目标就是在对总体不作任何分布假设的前提下,解决两样本检验问题。两样本位置检验例3.1(数据:salary.txt,salary.sav)我国
2、两个地区一些(分别为17个和15个)城镇职工的工资(元):地区1:6864730474777779789583488461955399191007310270115811347213600139621501917244地区2:102761053310633108371120911393118641204012642126751319913683140491406116079人们想要知道这二个地区城镇职工工资的中位数是否一样,这就是检验二个独立总体的位置参数是否相等的问题。Brown-Mood中位数检验检验原理:在零假设成立时,中位数如果一样的话,它们共同的中位数,即这(15+17=)32个数的
3、样本中位数(记为MXY)。也就是说,在X1,X2,X17或在Y1,Y2,Y15 的二个样本中,大于或小于混合后的中位数MXY的样本点应该大致一样多。容易算得MXY=11301,在用两个样本和MXY比较之后得到各个样本中大于和小于它的数目(见下表)假设(X1,X2,Xm)X,(Y1,Y2,Yn)Y,地区1样本数据所代表的总体中位数为,而地区2的为这里如果有和MXY相同的观测值,可以去掉它,也可以随机地把这些相等的值放到大于或小于MXY的群中以使得检验略微保守一些。就本例来说,二个样本的中位数不很相同,如何做正式的检验呢?可以看出上表是一个22的列联表,由初等概率可知,对于一般的22列联表令A表示
4、列联表中左上角取值a的X 样本中大于的变量,在m、n及t固定时,A的分布在零假设下为超几何分布(对于不超过m的k)现在可以用上面A的分布,直接进行前面所提的单边检验。在给定m,n和t的时候,如果A的值a太大或太小时就应该怀疑零假设。下表列出了Brown-Mood中位数检验的基本内容。计算计算检验基本内容检验基本内容P-值检验统计量对于水平 ,如果p-值小于 ,那么拒绝零假设,否则不能拒绝。在mn时因A不对称,双边检验结果不那么理想。例题例题3.1的解法的解法 在例3.1中,a=6,b=10,m=17,n=15用备择假设作单边检验时,可以根据R软件超几何分布的语句phyper(6,17,15,1
5、6),即p值=P(Aa)等于phyper(a,m,n,a+b),得到p值为P(Aa)=P(A6)=0.07780674。根据这个p值,无法对常用的显著性水平0.05来拒绝零假设。对于二个方差差不多相等的正态总体,该检验相对于t检验的ARE为2/=0.637显然,它和单样本情况的符号检验同属一类。这个检验为一般列联表的Fisher精确检验在22表情况的特例。如果用C表示上面表中的矩阵 那么,可以用R软件的函数fisher.test(C,alt=less)得到和上面两样的p值。可以看出,前面22表中a较大等价于ma较小,b较大等价于nb较小,也就是说,根据形成22表时的对称性(即行列可互换,行间及
6、列间可互换),用a,b,ma,nb的任何一个数目都可以根据超几何分布语句得到p值。检验的大样本近似检验的大样本近似 在零假设下,在大样本情况时,可以使用检验统计量所服从超几何分布的正态近似进行检验(包括连续性的修正):研究表明,该近似在min(m,n)12时相当精确。另外,在双边检验时,对于大样本情况,可以用Pearson卡方检验统计量来进行检验,它有近似的自由度为1的卡方分布。另外如果X和Y+有同样的分布,可求得置信区间为:其中c和c满足:第二节 Wilcoxon(Mann-Whitney)秩和检验在前面一节,比较两个总体的中位数的检验时,只利用了样本大于或小于共同中位数的数目,如同前面的单
7、独符号秩检验一样,只有方向的信息,没有差异大小的信息。作为单样本的Wilcoxon秩和检验的推广,下面我们讨论两个样本的Wilcoxon秩和检验。为了对假设作出判定,把样本X1,X2,Xm和Y1,Y2,Yn混合起来,这m+nN个观察值按照从小到大排列起来,这样每一个Y的观测值在混合排列中都有自己的秩,令Ri为在Yi这N个数中的秩(即Yi是第Ri小的)。显然,如果这些秩的和很小,则Y样本的值偏小,可以怀疑零假设。同样,对于X的样本也可以得到其样本点在混合样本中的秩之和WX。人们称WY或WX为Wilcoxon秩和统计量,该统计量是由Wilconxon于1945年提出的。另一种等价的统计量另一种等价
8、的统计量Mann-Whitney与1947年提出了另一种检验量WXY和WYX。这里定义WXY为所有X 观察值在混合样本中超过Y 观察值的个数,WYX为所有Y 观察值在混合样本中大于X 观察值的个数,W为WXY和WYX中较小者,即。若H0成立,WXY和WYX的差别不会很大,W不会太小。如果W很小,我们就有理由怀疑H0。实际上,检验统计量WY、WX和W等价,二者之间只是一个线性变换关系,一般将其统称为Wilconxon-Mann-Whitney统计量。m=n=2情形下统计量的可能取值情形下统计量的可能取值Ri为Yi在N=n+m个数中的秩,且有:性质和检验性质和检验定理4.2在零假设下:若,且,时:
9、在检验时 ,其中a,b值由前面定理确定。对于打结的情况需要使用修正的公式。大样本(m,n大于10),用正态近似如有打结(打结的情况超过全部数据的1/5时),对Z应修正为:在例3.1中,地区1(m=17)和地区2(n=15)的秩和分别为WY=306,WX=222(见P66),并由此计算WXY=WY-n(n+1)/2=186,WYX=69。对于H1:MXMY,p值为0.01352166,因此,对于=0.05的显著性水平,可以拒绝零假设。这个结论比第一节(p值为0.07780674)的中位数检验有效。关于Wilcoxon秩和检验(Mann-Whitney检验)总结如下:3.2.2 MX-MY的点估计
10、和区间估计MX-MY的点估计就是X和Y观察值成对相减后的中位数(共有mn对)。例4.1的MX-MY的点估计为-2479.求MX-MY的(1-)置信区间的步骤为:(1)得到所有mn个差额Xi-Yj;(2)记按升序排列的差为D1,DN(N=mn);(3)从表中查出W/2,它满足P(P(WXY W/2)=)=/2。则所要的置信区间为(D W/2,D mn+1-W/2)例4.1的D/2=76,置信区间为(D 76,D 255+1-76)=(-3916,-263)。第四节第四节 成对数据的检验成对数据的检验 要使比较有意义,必须要假定:(1)每一对数据或者来自同一个或者可比较的类似对象;(2)对和对之间
11、是独立;(3)都是连续变量.设 为对子之间的差的中位数,则检验为:例4.2 有10个病人在进行了某种药物治疗的前后的血压为:问题:该药物是否有效?这里要检验的是Di的中位数MD是否大于MD0=0。可能大家已经看到问题到这一步就和前面的单单样本问题完全一样了。147 140 142 148 169 170 161 144 171 161128 129 147 152 156 150 137 132 178 12819 11 -5 -4 13 20 24 12 -7 33现在只需要用符号检验或Wilcoxon符号秩检验即可。就本例子而言,因为X观测值看来比Y的要大,应检验:。这里先利用Wilcox
12、on符号秩检验,下表给出了上面的对子之差及它们的符号和相应的秩。19 11 -5 -4 13 20 24 12 -7 33Di的符号+的秩7 4 2 1 6 8 9 5 3 10容易算出,正符号的秩之和为 ,而负符号的秩之和为 。故选检验统计量 ,得到p值为0.01367188,由此可以在显著性水平大于0.014时拒绝零假设。在用正态近似时,得到p值为0.01616。虽然样本不大,但是对此例,两个结果差得不太多。如果用符号检验,也会有类似的结论。3.5 McNemar检验实践中有很对配对二元取值数据,如下例例3.3(数据:athletefootp.txt,athletefootp.sav)某药
13、厂想比较A和B两种治疗脚癣的疗效.实验中有40个病人,每人在左脚和右脚上分别使用A和B两种药.下面是脚癣是否治愈的数据(1为治愈,0为没治愈)病人1234567891011121314151617181920药A11111111110000000000药B11111100000000000000病人2122232425262728293031323334353637383940药A00000000000000000000药B11111111111111111111McNemar检验将上面数据写成列联表形式,有如下表药B治愈没治愈药A治愈没治愈McNemar检验McNemar检验3.6 Cohens Kappas Kappa系数系数 Cohens Kappa系数由Cohen(1960)提出,是度量两位评估者之间评估一致性的指标.先看一个简单的例子例3.4(数据:music.txt,music.sav)两位评委给参加声乐大赛的100名选手打分,打分结果只有两种:晋级和淘汰,见下表数据评委B淘汰晋级评委A淘汰晋级Cohens Kappas Kappa系数系数Cohens Kappas Kappa系数系数Cohens Kappas Kappa系数系数