《2022年非参数统计学讲义讲稿 .docx》由会员分享,可在线阅读,更多相关《2022年非参数统计学讲义讲稿 .docx(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品_精品资料_非参数统计学讲义第四章多样本模型 1k 个相关样本的非参数检验在参数统计中,检验几个样本是否来自完全相同的总体,采纳方差分析或F 检验.运用 F 检验的假定条件是:样本是从正态分布的总体中独立抽选的.总体具有相同的方差.数据的测量层次至少是定距尺度.当被用来分析的数据不符合这些假定条件,或研究者不期望作这些假设,以便增加结论的普遍性时,不宜采纳参数统计的方法,而必需运用非参数方法.假如 k等于或大于3个样本是按某种或某些条件匹配的,那么k 个样本称为相关的,否就为独立的.k 个相关和独立样本的差异与两个相关和独立样本之间的差异类似.本节介绍k 个相关样本的非参数检验.一、 Co
2、chran Q 检验1. 争论背景Cochran Q 检验也译为科库兰检验 .它是用以检验匹配的三组或三组以上的频数或比例之间有无显著差异的方法.这种匹配可以用不同形式获得.例如,检验三种不同类型的采访形式对被采访者的有效答复是否有影响,可以抽选一些人,分成n 组,每组有3 个匹配的被采访者, 要求他们的有关情形相同. 每组的 3 名成员被随机的置于 3 种条件之下, 即分别接受三种类型的采访, 于是, 就获得了 3 个匹配的样本,即 k3,每个样本有 n 个观测结果. k 个相关样本也可以采纳同一组人,对不同的k 个条件的反应匹配成样本,这类似于两个相关样本中以争论对象作为自身的对比者.例如
3、,检验几种教学手段对同学把握学问是否有显著不同,可以随机抽取 n 个同学,让他们先后置于k 种教学手段之下,再作出评判.这样可以获得k 个匹配的样本,每个样本有n 个观测结果.在现实生活中,许多数据是以二元数据的形式显现的,【例 4-1 】村民对四个候选人的评判得到结果:表 4-1村民评判结果处区组: 20 个村民对 A、B、C、D 四个候选人的评判Ni理A0110011111111111011116B1100011111011011000011C011110000100011010109D000011001000010110006L j1321232233122333212142其中: 1
4、表示同意. 0 表示不同意.关怀的问题是候选人在村民眼中有无区分,即检验H 0: 12k 是否成立.2. 基本方法假设有 k 个相关样本,每个样本有n 个观测结果,检验 k 个样本间是否有显著差异,可以建立双侧备择,假设组为可编辑资料 - - - 欢迎下载精品_精品资料_H 0 : k个样本间无显著差异可编辑资料 - - - 欢迎下载精品_精品资料_H 1 : k 个样本间有显著差异由于三个及三个以上样本间差异的方向不便于判定,因而,通常只建立双侧备择进行检验.为对假设作出判定,所分析的数据测量层次为定类尺度即可.获得的数据可排成一个n 行 k 列的表.假如H0 为真,那么将测量结果分为“胜利
5、”和“失败”的话,“胜利”与“失败”应随机的分布在表中的各行各列.Cochran Q 检验的统计量定义为kk可编辑资料 - - - 欢迎下载精品_精品资料_k k1 NN 2k k1N 2 k1) N 2可编辑资料 - - - 欢迎下载精品_精品资料_ii可编辑资料 - - - 欢迎下载精品_精品资料_Qi 1i 14.1可编辑资料 - - - 欢迎下载精品_精品资料_bbkNL2kNL2iij 1j 1可编辑资料 - - - 欢迎下载精品_精品资料_式中, k 为处理数. b 为区组数.N 为行总和. L 为列总和. NNL . N1N .可编辑资料 - - - 欢迎下载精品_精品资料_ii
6、jiijjki由于 Q 统计量的抽样分布近似为自由度df k 一 1 的 2 分布,所以依据自由度df k 一 1,给定的显著性水平,能够在附表中查找临界值2 ,假设Q2就在显著性水平下拒绝 H 0,说明样本之间存在着显著差异.相反,就不能拒绝H0.3使用说明可编辑资料 - - - 欢迎下载精品_精品资料_运用 Cochran Q 检验时应留意,只有当行数n 不太小时, Q 的抽样分布才近似于df k 一 1 的2 分布.但是, n 的最小数值日前并没有明确的说明,使用者采纳时视详细问题而定. Cochran Q 检验适用于定类尺度测量的数据,其它测量层次的数据也可以运用,但要象例4-2 那样
7、,转化为两类,但这样做可能铺张数据中包含的信息.因此,Cochran Q 检验一般只用于定类尺度的数据.4. 应用【续例 4-1 】候选人的例子可编辑资料 - - - 欢迎下载精品_精品资料_43162Q1129262 342 29.357.81523可编辑资料 - - - 欢迎下载精品_精品资料_44212322212 0.05可编辑资料 - - - 欢迎下载精品_精品资料_因而,拒绝原假设,认为这4 位候选人在选民眼中不同.【例 4-2 】消费者对饮料的爱好是否存在差异某商店为打算经营饮料的品种、数量,对消费者的爱好进行了一次调查.随机抽取18 个消费者,请他们对四种饮料:热牛奶、酸奶、果
8、汁、可口可乐的喜好作出评判,凡喜好的记作1,不喜好记作0.调查结果如表 4 2.表 4-2消费者对饮料喜好的调查结果消费者热牛奶酸奶果汁可口可乐合计110012200101300112411002510102601001700011801001901102101110311001011200101131001214110021511002160100117100121800011yi 可编辑资料 - - - 欢迎下载精品_精品资料_合计x j 887629可编辑资料 - - - 欢迎下载精品_精品资料_分析:为检验消费者对四种饮料的爱好是否有差异,建立双侧各择,假设组为H 0 : 消费者对四种
9、饮料爱好无显著差异H1 : 消费者对四种饮料爱好有显著差异由于数据为定类尺度测量, 只有“爱好” 与“不爱好” 两种结果, 且是两个以上相关样本, 这里是四种饮料, k4,所以选用 CochranQ 检验.可编辑资料 - - - 欢迎下载精品_精品资料_依据表 4 1 的调查数据,运算 H 0 成立时的统计量 Q. x1 8 表示喜爱第一种饮料热牛奶的总次数,4x 28 是喜爱酸奶的总可编辑资料 - - - 欢迎下载精品_精品资料_次数,其它的依此类推.4x j29 是全部四种饮料中,消费者表示喜爱的总次数.j 1kyi 是第 i 个消费者喜爱各种饮料的次数.n可编辑资料 - - - 欢迎下载
10、精品_精品资料_yi29 ,是各个消费者对四种饮料表示喜爱的总次数.j 1x j 表示按样本数运算的消费者喜爱的总次数,而j 1yi 表示按观看i 1可编辑资料 - - - 欢迎下载精品_精品资料_对象即消费者或说按样品数运算的对各种饮料喜爱的总次数.这两个总和应相等,即有k nx jy i.统计量 Q 正是用于说明按可编辑资料 - - - 欢迎下载精品_精品资料_样本数运算的总次数与按样品数运算的总次数的符合程度.按4.1 式,可以运算出Q=j 1i 1可编辑资料 - - - 欢迎下载精品_精品资料_依据给定的显著性水平,自由度 df 4l 3,查附表,得到临界值2 782.明显, Q 05
11、238 2 782 .因而, 调查数据在 5的显著性水平上不能拒绝H 0,即消费者对四种饮料的爱好没有显著差异.【例 4-3 】三种不同教学方法的成效是否有显著差异三种不同教学方法:电视教学、课堂讲授、课堂争论,对同学掌握学问的成效是否有所不同.为检验这一问题,抽选部分学生分为 18 组,每组 3 名匹配的同学,他们的有关情形类似.各组中3 名同学被随机的置于 3 种条件下,即随机的指定接受某种教学方法.实施不同教学方法后进行测验,成果合格为有效,记作1.成果不合格为无效,记作0.结果如表 43.表 4-3实施不同教学方法的同学成果可编辑资料 - - - 欢迎下载精品_精品资料_同学组电视教学
12、课堂讲授课堂争论合计yi 可编辑资料 - - - 欢迎下载精品_精品资料_100002011230101400005101260112701128010191012100000110112120112130112140112150112161113170011180112可编辑资料 - - - 欢迎下载精品_精品资料_合计x j 3121328可编辑资料 - - - 欢迎下载精品_精品资料_分析:同学的考试成果是定距尺度测量,这里将其转化为合格、不合格两类,就视为定类尺度.合格即教学方法有效为1,不合格为教学方法无效,记作0.接受三种不同教学方法的同学在每一组是匹配的,即构成3 个相关样本,
13、k 3.检验三种教学方法的成效是否存在差异,建立的假设组为H 0 :三种教学方法的成效无显著差异H 1 :三种教学方法的成效有显著差异由于是定类尺度测量的数据,相关样本数目大于2,因此,宜采纳 Cochran Q 检验.利用表42 的数据运算检验统计量Q=13给定显著性水平0 05, df3 1 2,查附表中相应临界值2 5 99.明显, Q13 2 599,在 5的显著性水平上调查数据拒绝 H .,说明三种不同教学方法的成效有显著差异.最终的判定,仍可以采纳这种方法,运算其尾概率.5. 软件处理可编辑资料 - - - 欢迎下载精品_精品资料_C o chra n QTes t 例 4-1.s
14、ta N umber ofv alid cases: 18Q = .5238096, df= 3, p .913630Cochra n Q T est 例 4-2.sta Number ofv alid cases: 18Q = 13.00000, df= 2, p .001504可编辑资料 - - - 欢迎下载精品_精品资料_VariableSumPercent 0sPercent 1s热 牛奶8.00000055.5555644.44444酸 奶8.00000055.5555644.44444果 汁7.00000061.1111138.88889可 口可乐6.00000066.666673
15、3.33333VariableSumPercent 0sPercent 1s可编辑资料 - - - 欢迎下载精品_精品资料_电 视 教 学3.0000083.3333316.66667课 堂 讲 授12.0000033.3333366.66667课 堂 讨 论13.0000027.7777872.22222二、 Friedman检验可编辑资料 - - - 欢迎下载精品_精品资料_Friedman 检验亦称佛利得曼的2 检验 .或佛利得曼双向评秩方差分析,或者 Friedman 秩和检验. 它是对 k 个样本是否来自同一总体的检验. k 个样本是匹配的,实现匹配的方法与前面类似.可以是k 个条件
16、下同一组受试者构成,即受试对象作为自身的对比者,也可以将受试者分为n 个组,每组均有k 个匹配的受试者,随机的将k 个受试者置于k 个条件之下形成.在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相像.1. 基本方法与 Cochran Q 检验相像, Friedman 检验也是用来检验各个样本所得的结果在整体上是否存在显著差异.因此建立的也是双侧备择,假设组为H 0:k 个样本间无显著差异或者H0: 12kH 1:k 个样本间有显著差异H1:不全相等为对假设作出判定,所分析的数据应是定序尺度测量.获得的数据排成一个n 行 k 列的表,行代表不同的受试者或匹配的受试小组,列代表各种条
17、件.由于是定序尺度测量的数据,因此,可以对每一行的观测结果分别评秩,即评等级,等级1 是最小的,依次排序,秩从 1 到 k.假如 H 0 为真,那么每一列中秩的分布应当是随机的,即各个秩显现在全部列中的频数应几乎相等,也就是说各列的秩和应当大致相等.可编辑资料 - - - 欢迎下载精品_精品资料_STEP1:在每一个区组中运算各个处理的秩:bRij .可编辑资料 - - - 欢迎下载精品_精品资料_STEP2:运算秩和 RiRijj 1i1, 2, k .可编辑资料 - - - 欢迎下载精品_精品资料_STEP3:定义 Friedman 检验统计量为.kQ12 Rib k1212k2Ri3bk
18、14.2可编辑资料 - - - 欢迎下载精品_精品资料_bk k1 i 1NOTE : Q 越大对 H 0 越不利.在小样本时,要查临界值表,查表时,要作变换2bk kWQ.bk11) i 1可编辑资料 - - - 欢迎下载精品_精品资料_在大样本时,有 Q 的抽样分布在 n、k 不太小时,近似于自由度df k l 的2 分布,即 Q 2 k1,k 定,b.因此,可编辑资料 - - - 欢迎下载精品_精品资料_r在附表中,可以依据给定的显著性水平,自由度 df k 一 1 查得 H0 为真时,相应的临界值2 .假设22 ,就在水平上可编辑资料 - - - 欢迎下载精品_精品资料_拒绝 H 0,
19、否就不能拒绝 H 0.某区组中存在结时, Q 应作适当的修正.2. 应用【例 4-4】在不同的城市对不同的人群进行血液中铅含量测试.设有A、B、C 三个城市汽车密度不同代表三种不同的处理k=3,对试验者按职业分组 b=4 取血四个区组 .他们血液中铅含量及其评秩的结果如下:表 4-4不同城市居民血液铅含量评秩城市职业区组处理A803100351265311B5227625235329C4015213413514由此可以运算出Q6.5W0.8125Ri【例 4-4 】三种不同教学方法的成效是否有显著差异三种不同教学方法同例4-2,抽选的同学也分为18 组,每组 3 名匹配的同学,其有关情形类似.
20、各组中3 名同学被随机的支配接受某种教学方法.实施不同教学方法后,进行测验,按成果高低对3 名匹配同学的成果排列等级即评秩,结果如表4 4.表 4-4实施不同教学方法的同学成果同学组电视教学课堂讲授课堂争论11322123323143215213613271238231可编辑资料 - - - 欢迎下载精品_精品资料_92131021311132121321312314132151161231712318123可编辑资料 - - - 欢迎下载精品_精品资料_合计Rj 25可编辑资料 - - - 欢迎下载精品_精品资料_分析:这个问题与例4-3 类似,也是检验三种教学方法的成效,有无差异,因而应建
21、立双侧备择,假设组为Ho :三种学方法的成效无显著差异H 1:三种教学方法的成效有显著差异表 4-4 实施不同教学方法的同学成果等级由于数据的测量已转化为定序尺度,且是两个以上相关样本,故可以来用Friedmanr检验.依据表44 的数据 1,按 式运算检验统计量2r210.8可编辑资料 - - - 欢迎下载精品_精品资料_r给定显著性水平005,自由度 df kl 2,查附表中 H0 成立时相应的临界值2 599.明显, 2因此数据在 5的显著性水平上拒绝H 0,三种教学方法的成效有显著差异.【例 4-5 】四部分技术训练的有效性有无差异10.8 2 599,可编辑资料 - - - 欢迎下载
22、精品_精品资料_某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素养. 为检验这四个部分的技术训练方案是否的确有效,随机抽选了 14 名新学员,分别接受四个部分的训练.每一训练终止后,均进行该部分的测验,成果以10 分为最高.检测结果如表 4-5 .表 4-5学员受训后检测的成果学员编号技术训练技术训练技术训练技术训练110368225943410384631045341066546777106586103591057610897611542612354713451091465810分析:学员的测验成果是定距尺度测量的,但可以将其转换为定序尺度.将每一学员的4 个成果,按由低到
23、高的次序排列,给出等级即评秩,得到表4 一 5.由于是两个以上相关样本,且数据为定序尺度,故可以运用Friedman 检验.建立的假设组为Ho :四个部分技术训练的有效性无显著差异H 1:四个部分技术训练的有效性有显著差异1 表 43 中,第 15 组接受课堂讲授和课堂争论方法的同学测验成果相同,因此排序时,取秩2 和 3 的平均值,均记为 25.以平均秩替代同分,不影响这一检验的有效性.可编辑资料 - - - 欢迎下载精品_精品资料_依据表 4 5 的数据,按 4.2 运算得到r20.7714在附表中,查找与显著性水平 005,自由度 df k 13 相对应的临界值2 782.明显 Q077
24、142 782, 调查结果在 5的显著性水平上不能拒绝H 0,说明四个技术训练的有效性没有显著差异.3. 软件处理Frie dmanANOV A a nd Ke nda ll Coe f f. ofCon cord anc e 例 4-3.st a ANOVA Chi Sqr. N = 18, df= 2 = 10.33803 p .00569Coef f. ofConcordance = .28717 Aver. rank r = .24524VariableAv erageRankSum ofRanksMeanStd.Dev.电 视 教学 1.38888925.000001.3888890
25、.607685课 堂 讲授 2.25000040.500002.2500000.732642课 堂 讨论 2.36111142.500002.3611110.763228Friedman ANOVA and Kendall Coeff. ofC oncordance 例 4-4.sta ANOVA Chi Sqr. N = 14, df= 3 = .7714286 p .85629Coef f. ofConcordance = .01837 Aver. rank r = -.0571VariableAv erageRankSum ofRanksMeanStd.Dev.技 术 训练2.35714
26、333.000005.6428572.468483技 术 训练2.35714333.000005.8571432.656115技 术 训练2.57142936.000006.5000002.738613技 术 训练2.71428638.000006.5000001.786703三、 Cochran Q 检验与 Friedman检验这两个检验都用于 k 个相关样本是否可能来自同一个总体的检验.但对数据测量层次的要求不同.Cochran Q 检验适用于定类尺度的测量数据,其它测量层次的数据也可以使用,但应转化为两类数据.有时观看值是以“是”或“否”,“喜爱”或“不喜爱”等二元数据的形式显现,假如用
27、Friedman 秩和检验将会显现许多打结的现象,即秩相同.Cochran Q 检验就解决了打结的问题.但当数据为定类尺度测量,只能运用Cochran Q 检验.由于,这一检验对于定类尺度或仅分为两类的定序尺度测量数据是极为r有效的.假设数据测量层次至少为定序尺度时,应优先选用 Friedman2 检验.由于假设将定序尺度转换为定类尺度,而采纳 CochranQ 检验,可能会铺张数据包含的信息四、区组设计的另外两种检验:Page 检验和 Durbin 检验1. 完全区组设计的 Page 检验可编辑资料 - - - 欢迎下载精品_精品资料_对于单边检验问题H 0 :1k , H1 :1kk ,P
28、age 于 1963 年引入下面统计量:可编辑资料 - - - 欢迎下载精品_精品资料_LiRi0.1可编辑资料 - - - 欢迎下载精品_精品资料_式中 Ri 为秩Rij在第 j 个区组中的秩和 Rii 1bRij .j 1可编辑资料 - - - 欢迎下载精品_精品资料_NOTE : L 值越大对 H0 越不利.Lbkk12b k 3k 2可编辑资料 - - - 欢迎下载精品_精品资料_在 b时,有正态近似ZL N 0,1 ,其中:LL2. L4144 k,证明过程详见笔记.1可编辑资料 - - - 欢迎下载精品_精品资料_存在打结时,需要进行修正.【续例 4-4 】血液中含铅量的例子这里将
29、城 A 和 C 对调,即检验H 0 :123 , H 1 :123 .可编辑资料 - - - 欢迎下载精品_精品资料_R14, R29 , R31可编辑资料 - - - 欢迎下载精品_精品资料_所以, L419211 355,查表 2得,P L50.010.05 ,拒绝原假设,认为有显著性影响.可编辑资料 - - - 欢迎下载精品_精品资料_L正态近似运算,ZLL55482.4751.96 .3 / 3可编辑资料 - - - 欢迎下载精品_精品资料_2. 不完全区组设计的Durbin 检验可编辑资料 - - - 欢迎下载精品_精品资料_考虑平稳的不完全区组设计BIBDk ,b,r , t, ,
30、检验H 0 :1k , H 1 : 不全相等. Durbin 于 1951 年提出检验统计量为:可编辑资料 - - - 欢迎下载精品_精品资料_2 P187 表, k3, b4 .可编辑资料 - - - 欢迎下载精品_精品资料_可以使用下面的简化运算:12kDrk t 21k1 i 1 Rir t21 20.2可编辑资料 - - - 欢迎下载精品_精品资料_12 k1k3r k1t1可编辑资料 - - - 欢迎下载精品_精品资料_DR20.3可编辑资料 - - - 欢迎下载精品_精品资料_rk t2i1 i 1t1可编辑资料 - - - 欢迎下载精品_精品资料_在原假设成立时, D 统计渐近听
31、从2 k1可编辑资料 - - - 欢迎下载精品_精品资料_【例 4-6】比较四种材料 k4 在四个部位b4 的磨损,数据可以记为下面两种形式:可编辑资料 - - - 欢迎下载精品_精品资料_表 4-6a不完全区组设计举例表 4-6b不完全区组设计举例材料部位区组Ri部位区组处理A341281361334A30B48C59DB362302451536B28A54D60CC403482603840C44D36A45BD4435435928解:从右边的表简洁看出BIB 设计的平稳性质,这里 k ,b, r , t,4, 4,3,3, 2 .可编辑资料 - - - 欢迎下载精品_精品资料_12k1k3
32、r k1t1可编辑资料 - - - 欢迎下载精品_精品资料_DR26.756.252 3可编辑资料 - - - 欢迎下载精品_精品资料_rk t 2i1) i 1t10.1可编辑资料 - - - 欢迎下载精品_精品资料_拒绝原假设,认为在10%的显著性水平下,不同材料的磨损情形存在区分.可编辑资料 - - - 欢迎下载精品_精品资料_ 2k 个独立样本的非参数检验一、Kruskal-Wallis检验Kruskal Wallis 检验亦有译为克拉夏尔瓦里斯检验,或简称为克氏检验. 它是两个独立样本 Mann Whitney Wilcoxon 检验的一种推广 .1. 问题的提出【例 4-7 】在一
33、项健康试验中,有三种生活方式,减肥成效如下表,问:每种生活方式的减肥成效是否相同?表 4-7减肥成效表生活方式123一个月后削减的重量单位 500g更为一般的数据形式为:ni15表 4-825一般的数据结构4kx11 x12x21 x22xk1x k 2x1n1x 2n 2xknk在数理统计学中,应作单因素方差分析可编辑资料 - - - 欢迎下载精品_精品资料_原假设:H 0 :12SSAkn xx 2 / k1可编辑资料 - - - 欢迎下载精品_精品资料_检验统计量:FSSEiixijxi 2 / N F kk1, Nk可编辑资料 - - - 欢迎下载精品_精品资料_但这是要求不同的样原来
34、自于具有相同方差的正态总体.然而,这种条件在现实中难以满意.2. Kruskal Wallis 检验基本方法1. 基本假定假定这 k 个样本具有相像的连续分布.全部的观看值在样本内和样本间是相互独立的.2. 提出原假设可编辑资料 - - - 欢迎下载精品_精品资料_假设有 k 个总体,各自的连续累积分布函数为F1 x, F2 x, Fk x ,那么 Kruskal Wallis 检验的一般零假设为可编辑资料 - - - 欢迎下载精品_精品资料_H 0 : F1 xF 2 xFk x对全部的 x可编辑资料 - - - 欢迎下载精品_精品资料_假如在争论总体是否相同时,偏重于考察位置参数,并且位置
35、参数采纳各个总体的中位数,即么,H 0 等价于 k 个总体的中位可编辑资料 - - - 欢迎下载精品_精品资料_数相等.假设仍以M 1 , M 2 , M k 代表 k 个总体的中位数,就Kruskal Wallis 检验建立的假设组为可编辑资料 - - - 欢迎下载精品_精品资料_H 0 : M 1M 2M k可编辑资料 - - - 欢迎下载精品_精品资料_H 1 : Mj j1, k 中至少有两个不相等可编辑资料 - - - 欢迎下载精品_精品资料_这里的备择对于 k 2 时不存在单侧备择的配对,由于对于3. 基本原理 3M j j1, k 来说,有k. 种不同的有序排列,这不便于进行检验.可编辑资料 - - - 欢迎下载精品_精品资料_为对假设作出判定, 需要的数据是k 个独立的随机样本, 其大小为n1 , n 2 , nk 样本独立的分别从各自总体抽取,总体分别具可编辑资料 - - - 欢迎下载精品_精品资料_有连续的累积概率分布F1 x, F 2 x, Fk x .数据的测量层次至少在定序尺度上.可编辑资料 - - - 欢迎下载精品_精品资料_记观看值xij在混合样本中的秩为niRij.就有可编辑资料 - - - 欢迎下载精品_精品资料_RiRij ,ij 11,