2022年非参数统计学讲义讲稿2 .docx

上传人:Q****o 文档编号:37758177 上传时间:2022-09-01 格式:DOCX 页数:20 大小:296.02KB
返回 下载 相关 举报
2022年非参数统计学讲义讲稿2 .docx_第1页
第1页 / 共20页
2022年非参数统计学讲义讲稿2 .docx_第2页
第2页 / 共20页
点击查看更多>>
资源描述

《2022年非参数统计学讲义讲稿2 .docx》由会员分享,可在线阅读,更多相关《2022年非参数统计学讲义讲稿2 .docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、_归纳总结汇总_ - - - - - - - - - 非参数统计学讲义第四章 多样本模型 1 k 个相关样本的非参数检验在参数统计中,检验几个样本是否来自完全相同的总体,采纳方差分析或 F 检验;运用 F 检验的假定条件是:样本是从正态分布的总体中独立抽选的;总体具有相同的方差;数据的测量层次至少是定距尺度;当被用来分析的数据不符合这些假定条件,或研究者不期望作这些假设,以便增加结论的普遍性时,不宜采纳参数统计的方法,而必需运用非参数方法;假如 k等于或大于 3个样本是按某种或某些条件匹配的,那么 k 个样本称为相关的,否就为独立的;k 个相关和独立样本的差异与两个相关和独立样本之间的差异类似

2、;本节介绍 k 个相关样本的非参数检验;一、 Cochran Q 检验1争论背景Cochran Q 检验也译为科库兰检验;它是用以检验匹配的三组或三组以上的频数或比例之间有无显著差异的方法;这种匹配可以用不同形式获得;例如,检验三种不同类型的采访形式对被采访者的有效答复是否有影响,可以抽选一些人,分成 n 组,每组有3 个匹配的被采访者,要求他们的有关情形相同;每组的 3 名成员被随机地置于 3 种条件之下, 即分别接受三种类型的采访,于是,就获得了 3 个匹配的样本,即 k3,每个样本有 n 个观测结果; k 个相关样本也可以采纳同一组人,对不同的 k 个条件的反应匹配成样本,这类似于两个相

3、关样本中以争论对象作为自身的对比者;例如,检验几种教学手段对同学把握学问是否有显著不同,可以随机抽取 n 个同学,让他们先后置于k 种教学手段之下,再作出评判;这样可以获得k 个匹配的样本,每个样本有n 个观测结果;在现实生活中,许多数据是以二元数据的形式显现的,【例 4-1】村民对四个候选人的评判得到结果:处表 4-1 村民评判结果1 1 0 21 1 N i区组: 20 个村民对 A、B、 C、D 四个候选人的评判理A 0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 16 B 1 1 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 0 0 0 11 C 0 1 1

4、1 1 0 0 0 0 1 0 0 0 1 1 0 1 0 1 0 9 D 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 0 0 0 6 Lj1 3 2 1 2 3 2 2 3 3 1 2 2 3 3 3 2 1 2 1 42 其中: 1 表示同意; 0 表示不同意;关怀的问题是候选人在村民眼中有无区分,即检验H 0:1k是否成立;2基本方法假设有 k 个相关样本,每个样本有 n 个观测结果,检验 k 个样本间是否有显著差异,可以建立双侧备择,假设组为H 0 : k 个样本间无显著差异H 1 : k 个样本间有显著差异由于三个及三个以上样本间差异的方向不便于判定,因而,通

5、常只建立双侧备择进行检验;为对假设作出判定,所分析的数据测量层次为定类尺度即可;获得的数据可排成一个 n 行 k 列的表;假如 H0 为真,那么将测量结果分为“ 胜利” 和“ 失败” 的话,“ 胜利” 与“ 失败” 应随机地分布在表中的各行各列;Cochran Q 检验的统计量定义为k k2 2 2k k 1 N i N k k 1 N i k 1 Ni 1 i 1Q b b 4.1 2 2kN L i kN L ij 1 j 1式中, k 为处理数; b 为区组数;N 为行总和;i L 为列总和;j N i N i j L;N 1k i N i;由于 Q 统计量的抽样分布近似为自由度 df

6、k 一 1 的 2 分布,所以依据自由度 dfk 一 1,给定的显著性水平,能够在附表中查找临界值 2 ,假设2Q就在显著性水平 下拒绝 H 0,说明样本之间存在着显著差异;相反,就不能拒绝 H0;3使用说明_精品资料_ 第页1 第 1 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - 运用 Cochran Q 检验时应留意,只有当行数n 不太小时, Q 的抽样分布才近似于df k 一 1 的2 分布;但是, n 的最小数值日前并没有明确的说明,使用者采纳时视详细问题而定; Cochran Q 检验适用于定类尺度测量的数据,其它测量层次的数据也可以

7、运用,但要象例 4-2 那样,转化为两类,但这样做可能铺张数据中包含的信息;因此,Cochran Q 检验一般只用于定类尺度的数据;4应用【续例 4-1 】候选人的例子Q431622 1132922 6 234229.357.815234422 122 1 0.05因而,拒绝原假设,认为这4 位候选人在选民眼中不同;【例 4-2】消费者对饮料的爱好是否存在差异某商店为打算经营饮料的品种、数量,对消费者的爱好进行了一次调查;随机抽取 18 个消费者,请他们对四种饮料:热牛奶、酸奶、果汁、可口可乐的喜好作出评判,凡喜好的记作 1,不喜好记作 0;调查结果如表 4 2;表 4-2 消费者对饮料喜好的

8、调查结果消费者 热牛奶 酸奶 果汁 可口可乐 合计iy 1 1 0 0 1 2 2 0 0 1 0 1 3 0 0 1 1 2 4 1 1 0 0 2 5 1 0 1 0 2 6 0 1 0 0 1 7 0 0 0 1 1 8 0 1 0 0 1 9 0 1 1 0 2 10 1 1 1 0 3 11 0 0 1 0 1 12 0 0 1 0 1 13 1 0 0 1 2 14 1 1 0 0 2 15 1 1 0 0 2 16 0 1 0 0 1 17 1 0 0 1 2 18 0 0 0 1 1 合计jx 8 8 7 6 29 分析:为检验消费者对四种饮料的爱好是否有差异,建立双侧各择,假

9、设组为由于数据为定类尺度测量,H0:消费者对四种饮料爱好无显著差异这里是四种饮料, k4,所以选用 Cochran H1:消费者对四种饮料爱好有显著差异只有“ 爱好”与“ 不爱好”两种结果, 且是两个以上相关样本,Q 检验;依据表 4 1 的调查数据,运算 H 0成立时的统计量 Q;x 8 表示喜爱第一种饮料热牛奶的总次数,x 2 8 是喜爱酸奶的总4次数,其它的依此类推;x j 29 是全部四种饮料中,消费者表示喜爱的总次数;iy 是第 i 个消费者喜爱各种饮料的次数;j 14 k niy 29,是各个消费者对四种饮料表示喜爱的总次数;x j 表示按样本数运算的消费者喜爱的总次数,而 iy

10、表示按观看j 1 j 1 i 1k n对象即消费者或说按样品数运算的对各种饮料喜爱的总次数;这两个总和应相等,即有 x j y i;统计量 Q 正是用于说明按j 1 i 1样本数运算的总次数与按样品数运算的总次数的符合程度;按 4.1式,可以运算出Q= _精品资料_ 第页2 第 2 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - 依据给定的显著性水平,自由度 df 4l 3,查附表,得到临界值 2 782;明显, Q 052382 782;因而,调查数据在 5的显著性水平上不能拒绝 H 0,即消费者对四种饮料的爱好没有显著差异;【例 4-3】三种

11、不同教学方法的成效是否有显著差异三种不同教学方法:电视教学、课堂讲授、课堂争论,对同学掌握学问的成效是否有所不同;为检验这一问题,抽选部分学生分为 18 组,每组 3 名匹配的同学,他们的有关情形类似;各组中 3 名同学被随机地置于 3 种条件下,即随机地指定接受某种教学方法;实施不同教学方法后进行测验,成果合格为有效,记作 1;成果不合格为无效,记作 0;结果如表 43;表 4-3 实施不同教学方法的同学成果同学组 电视教学 课堂讲授 课堂争论 合计iy 1 0 0 0 0 2 0 1 1 2 3 0 1 0 1 4 0 0 0 0 5 1 0 1 2 6 0 1 1 2 7 0 1 1 2

12、 8 0 1 0 1 9 1 0 1 2 10 0 0 0 0 11 0 1 1 2 12 0 1 1 2 13 0 1 1 2 14 0 1 1 2 15 0 1 1 2 16 1 1 1 3 17 0 0 1 1 18 0 1 1 2 合计x 3 12 13 28 分析:同学的考试成果是定距尺度测量,这里将其转化为合格、不合格两类,就视为定类尺度;合格即教学方法有效为 1,不合格为教学方法无效,记作 0;接受三种不同教学方法的同学在每一组是匹配的,即构成 3 个相关样本, k 3;检验三种教学方法的成效是否存在差异,建立的假设组为H 0 : 三种教学方法的成效无显著差异H 1 : 三种教学

13、方法的成效有显著差异由于是定类尺度测量的数据,相关样本数目大于 2,因此,宜采纳 Cochran Q 检验;利用表 42 的数据运算检验统计量 Q=13 给定显著性水平0 05, df3 1 2,查附表中相应临界值 2 5 99;明显, Q132 599,在 5的显著性水平上调查数据拒绝 H;,说明三种不同教学方法的成效有显著差异;最终的判定,仍可以采纳这种方法,运算其尾概率;5软件处理C o chra n Q Tes t 例 4-1.st aN umber of v alid cases: 18Q = .5238096, df = 3, p .913630Sum Percent Percen

14、tVariable 0s 1s热 牛 奶 8.000000 55.55556 44.44444酸 奶 8.000000 55.55556 44.44444果 汁 7.000000 61.11111 38.88889可 口 可 乐 6.000000 66.66667 33.33333二、 Friedman 检验第页3 _精品资料_ - - - - - - -第 3 页,共 16 页_归纳总结汇总_ - - - - - - - - - Friedman 检验亦称佛利得曼的 2 检验 ;或佛利得曼双向评秩方差分析,或者 Friedman 秩和检验; 它是对 k 个样本是否来自同一总体的检验;k 个样

15、本是匹配的,实现匹配的方法与前面类似;可以是 k 个条件下同一组受试者构成,即受试对象作为自身的对照者,也可以将受试者分为 n 个组,每组均有 k 个匹配的受试者,随机地将 k 个受试者置于 k 个条件之下形成;在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相像;1基本方法与 Cochran Q 检验相像, Friedman 检验也是用来检验各个样本所得的结果在整体上是否存在显著差异;因此建立的也是双侧备择,假设组为H 0:k 个样本间无显著差异 或者 H0:1 2 kH1:k 个样本间有显著差异 H1:不全相等为对假设作出判定,所分析的数据应是定序尺度测量;获得的数据排成一个

16、n 行 k 列的表,行代表不同的受试者或匹配的受试小组,列代表各种条件;由于是定序尺度测量的数据,因此,可以对每一行的观测结果分别评秩,即评等级,等级 1 是最小的,依次排序,秩从 1 到 k;假如 H 0 为真,那么每一列中秩的分布应当是随机的,即各个秩显现在全部列中的频数应几乎相等,也就是说各列的秩和应当大致相等;STEP1:在每一个区组中运算各个处理的秩:bR ;k;STEP2:运算秩和R iR iji1,2,j1STEP3:定义 Friedman 检验统计量为;Q121ik1R ib k12121ik1R i23 b k14.2 bk k2bk kNOTE : Q 越大对 H0 越不利

17、;在小样本时,要查临界值表,查表时,要作变换WQ1;Q2k2 r1,k定,b;因此,b k在大样本时,有Q 的抽样分布在n、k 不太小时,近似于自由度df k l 的2 分布,即在附表中,可以依据给定的显著性水平,自由度 dfk 一 1 查得 H0 为真时,相应的临界值2 ;假设2 ,就在水平上拒绝 H 0,否就不能拒绝H 0;某区组中存在结时,Q 应作适当的修正;2应用【例 4-4】在不同的城市对不同的人群进行血液中铅含量测试;设有 A、 B、 C 三个城市汽车密度不同代表三种不同的处理 k=3,对试验者按职业分组 b=4 取血四个区组 ;他们血液中铅含量及其评秩的结果如下:表 4-4 不同

18、城市居民血液铅含量评秩城市 职业区组iR处理 A 803 1003 512 653 11 B 522 762 523 532 9 C 401 521 341 351 4 由此可以运算出 Q 6.5 W 0.8125【例 4-4】三种不同教学方法的成效是否有显著差异三种不同教学方法同例 4-2,抽选的同学也分为 18 组,每组 3 名匹配的同学,其有关情形类似;各组中 3 名同学被随机地支配接受某种教学方法;实施不同教学方法后,进行测验,按成果高低对 3 名匹配同学的成果排列等级即评秩,结果如表 4 4;表 4-4 实施不同教学方法的同学成果同学组 电视教学 课堂讲授 课堂争论1 1 3 2 2

19、 1 2 3 3 2 3 1 4 3 2 1 5 2 1 3 6 1 3 2 7 1 2 3 8 2 3 1 第 页 4 _精品资料_ 第 4 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - 9 2 1 3 10 2 1 3 11 1 3 2 12 1 3 2 13 1 2 3 14 1 3 2 15 1 16 1 2 3 17 1 2 3 18 1 2 3 合计R j 25 分析:这个问题与例 4-3 类似,也是检验三种教学方法的成效,有无差异,因而应建立双侧备择,假设组为Ho :三种学方法的成效无显著差异H1:三种教学方法的成效有显著差异表

20、4-4 实施不同教学方法的同学成果等级由于数据的测量已转化为定序尺度,且是两个以上相关样本,故可以来用10. 8Friedman检验;依据表44 的数据1,按 式运算检验统计量2 r2 599,2 r10 8.给定显著性水平005,自由度 dfkl 2,查附表中 H0 成立时相应的临界值2 599;明显,2 r因此数据在5的显著性水平上拒绝H 0,三种教学方法的成效有显著差异;【例 4-5】四部分技术训练的有效性有无差异某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素养;为检验这四个部分的技术训练方案是否的确有效,随机抽选了 14 名新学员,分别接受四个部分的训练;每一训练终

21、止后,均进行该部分的测验,成果以 10 分为最高;检测结果如表 4-5;表 4-5 学员受训后检测的成果学员编号 技术训练 技术训练 技术训练 技术训练1 10 3 6 8 2 2 5 9 4 3 4 10 3 8 4 6 3 10 4 5 3 4 10 6 6 5 4 6 7 7 7 10 6 5 8 6 10 3 5 9 10 5 7 6 10 8 9 7 6 11 5 4 2 6 12 3 5 4 7 13 4 5 10 9 14 6 5 8 10 分析:学员的测验成果是定距尺度测量的,但可以将其转换为定序尺度;将每一学员的 4 个成果,按由低到高的次序排列,给出等级即评秩,得到表 4

22、一 5;由于是两个以上相关样本,且数据为定序尺度,故可以运用 Friedman 检验;建立的假设组为Ho :四个部分技术训练的有效性无显著差异H 1:四个部分技术训练的有效性有显著差异1 表 43 中,第 15 组接受课堂讲授和课堂争论方法的同学测验成果相同,因此排序时,取秩2 和 3 的平均值,均记为25;以平均秩替代同分,不影响这一检验的有效性;5 第页_精品资料_ 第 5 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - 依据表 4 5 的数据,按 4.2运算得到2 r.077142 782;明显 Q077142 782,在附表中,查找与显著

23、性水平 005,自由度 df k 13 相对应的临界值调查结果在5的显著性水平上不能拒绝H 0,说明四个技术训练的有效性没有显著差异;3软件处理Frie dman ANOV A a nd Ke nda ll Coe f f. ofCon cord anc e 例 4-3.st aCochran ANOVA Chi Sqr. N = 18, df = 2 = 10.33803 p .00569Coef f. of Concordance = .28717 Aver. rank r = .24524Av erageSum ofMeanStd.Dev.Variable 电 视 教 学RankRank

24、s1.3888890.6076851.38888925.00000课 堂 讲 授2.25000040.500002.2500000.732642课 堂 讨 论2.36111142.500002.3611110.763228Friedman ANOVA and Kendall Coeff. of C oncordance 例 4-4.staANOVA Chi Sqr. N = 14, df = 3 = .7714286 p .85629Coef f. of Concordance = .01837 Aver. rank r = -.0571Av erageSum ofMeanStd.Dev.Va

25、riableRankRanks5.6428572.468483技 术 训 练2.35714333.00000技 术 训 练2.35714333.000005.8571432.656115技 术 训 练2.57142936.000006.5000002.738613技 术 训 练2.71428638.000006.5000001.786703三、 Cochran Q 检验与 Friedman检验这两个检验都用于k 个相关样本是否可能来自同一个总体的检验;但对数据测量层次的要求不同;Cochran Q 检验适用于定类尺度的测量数据,其它测量层次的数据也可以使用,但应转化为两类数据;有时观看值是以“

26、 是”或“ 否” ,“ 喜爱” 或“ 不喜爱” 等二元数据的形式显现,假如用Friedman 秩和检验将会显现许多打结的现象,即秩相同;Q 检验就解决了打结的问题;但当数据为定类尺度测量,只能运用 Cochran Q 检验;由于,这一检验对于定类尺度或仅分为两类的定序尺度测量数据是极为有效的;假设数据测量层次至少为定序尺度时,应优先选用 Friedman r检验;由于假设将定序尺度转换为定类尺度,2 而采纳 Cochran Q 检验,可能会铺张数据包含的信息四、区组设计的另外两种检验:Page 检验和 Durbin 检验1完全区组设计的Page 检验k,H1:1k,Page 于 1963 年引

27、入下面统计量:对于单边检验问题H0:1k式中R 为秩R 在第 j 个区组中的秩和R iLb1iR i0.1 1R ;ijNOTE : L 值越大对 H0 越不利;在 b时,有正态近似ZLLLN0,1,其中:Lbk k2 1;2b k3kk2,证明过程详见笔记;L14414存在打结时,需要进行修正;【续例 4-4 】血液中含铅量的例子这里将城 A 和 C 对调,即检验H0:123,H1:123;0.05,拒绝原假设,认为有显著性影响;R 14,R 29,R 3150.01所以,L4 19211 355,查表2得,P L正态近似运算,ZLLL55482.4751.96;1k,H1:不全相等; Du

28、rbin 于 1951 年提出检验统计量为:3 / 32不完全区组设计的Durbin 检验H0:考虑平稳的不完全区组设计BIBD k b r t,检验2 P187 表,k3,b4;第页6 _精品资料_ 第 6 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - D12k1ikR ir t2120.2 rk t211可以使用下面的简化运算:D12k1ik12 R i3 r k1 t10.3 rk t21t1在原假设成立时,D 统计渐近听从2k1b4的磨损,数据可以记为下面两种形式:【例 4-6】比较四种材料k4在四个部位表 4-6a 不完全区组设计举例

29、表 4-6b 不完全区组设计举例材料部位区组iR部位区组处理A 341 281 361 3 34A 30B 48C 59D B 362 302 451 5 36B 28A 54D 60C C 403 482 603 8 40C 44D 36A 45B D 443 543 592 8 解:从右边的表简洁看出R iBIB 设计的平稳性质,这里 , , , , 4, 4,3,3, 2;7 D12k1ik123 r kt1t16.756.2523rk t2110.1拒绝原假设,认为在10%的显著性水平下,不同材料的磨损情形存在区分;第页_精品资料_ - - - - - - -第 7 页,共 16 页_

30、归纳总结汇总_ - - - - - - - - - 2 k 个独立样本的非参数检验一、Kruskal-Wallis 检验Kruskal Wallis 检验亦有译为克拉夏尔瓦里斯检验,或简称为克氏检验;它是两个独立样本 MannWhitney Wilcoxon 检验的一种推广 ;1问题的提出【例 4-7】在一项健康试验中,有三种生活方式,减肥成效如下表,问:每种生活方式的减肥成效是否相同?生活方式1 表 4-7 减肥成效表3 2 一个月后削减的重量单位 500gni5 5 4 更为一般的数据形式为:1 表 4-8 一般的数据结构k 2 x 11x 21 xk 1x12x22 xk2 x 1n1x

31、2n2xknk 在数理统计学中,应作单因素方差分析原假设:H0:F12knix ixx2/k1Fk,1Nk检验统计量:SSASSExiji2/Nk但这是要求不同的样原来自于具有相同方差的正态总体;然而,这种条件在现实中难以满意;2 Kruskal Wallis 检验基本方法1.基本假定假定这 k 个样本具有相像的连续分布;全部的观看值在样本内和样本间是相互独立的;2.提出原假设假设有 k 个总体,各自的连续累积分布函数为 F 1 x , F 2 x , , F k x ,那么 Kruskal Wallis 检验的一般零假设为H 0 : F 1 x F 2 x F k x 对全部的 x 假如在争

32、论总体是否相同时,偏重于考察位置参数,并且位置参数采纳各个总体的中位数,即么,H 0 等价于 k 个总体的中位数相等;假设仍以 M 1 , M 2 , , M k 代表 k 个总体的中位数,就 Kruskal Wallis 检验建立的假设组为H 0: M 1 M 2 M kH 1 : M j j ,1 , k 中至少有两个不相等这里的备择对于 k 2 时不存在单侧备择的配对,由于对于 M j j ,1 , k 来说,有 .k 种不同的有序排列,这不便于进行检验;3.基本原理3为对假设作出判定,需要的数据是 k 个独立的随机样本, 其大小为 n 1 , n 2 , , n k 样本独立地分别从各

33、自总体抽取,总体分别具有连续的累积概率分布 F 1 x , F 2 x , , F k x ;数据的测量层次至少在定序尺度上;记观看值 x ij 在混合样本中的秩为 R ;就有inR i R ij , i ,1 2 , , k 为第 i 个样本的秩和j 13 统计量的构造可以仿照两样本的 Wilcoxon 秩和检验,先混合两个样本,然后找出各个观看值在混合样本中的秩,分别按样本求和;第 页 8 _精品资料_ 第 8 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - 当R iRi/ni,i,12,k为第 i 个样本的平均秩和H 0.4 RikRiN1

34、2NNNN1N2112NR 存在较大差异时,有理由疑心H0 是否为真;由此,仿照方差分析的做法,可以构造检验的统计量,将它定义为HN121 jk1niR iRH 0 2 2k1 N 4.7式仍可以写成下面的形式2H 12 k R j3 N 1 0.5 N N 1 j 1 n j或者可以这样来摸索;将全部数据按从小到大的次序合并成一个单一的样本,其大小 N n 1 n 2 n k;将每一个观看值给出一个等级即评秩,秩为整数,从 1 到 N;对于 N 个观看值来说,平均等级是1 2 N N N 1 N 1N 2 N 2对于含有 n 个观看值的第 j 个样原来说,等级总和的期望值是 n j N 1

35、/ 2;假设以 R 表示第 j 个样本的实际等级总和,那么 R j n j N 1 / 2 就表示 k 个样本中第 j 个样本等级总和与其均值的偏差;假如 H0 为真,全部样本数据混合排列成一个单一的随机样本,等级即秩次应当在 k 个样本之间匀称地分布,也就是说,各样本实际的等级总和即秩次和 R 与期望等级总和n j N 1 / 2 之间的偏差应很小;因此, Kruskal wallis 检验定义的统计量可以建立在实际等级总和 R 与期望等级总和 n j N 1 / 2 的偏差的基础上;运算公式为H12jk1RjnjN1 /2 20.6 NN1 nj4.9式也可以写4.8式;4.检验统计量检验

36、统计量为:HN121 jk1Rjj23N1 2 k1nN5.确定 P 值小样本时,可以查附表 K-W ;大样本时,可以查 2 分布表;当样本数 k、每个样本包含的观看值数目 n ,不是很小时,检验统计量 H 渐近的抽样分布是自由度 df k 1 的 2 分布;根据给定的显著性水平,自由度 dfk 一 1,在附表中可以查找到 H 0 为真时的临界值 2 ;假设 H2 ,说明 H 是一个较小的值,数据支持 H 0,k 个样本之间无显著差异;假设 H2 ,反映实际的秩次和分布与期望的分布之间不一样,数据拒绝 H0, k 个样本来自不同总体;通常情形下,当 k 3 和各个 n j 5 时,渐近的 P

37、值无法由卡方分布表得到,而只能查找附表 K-W 附表;这个表是 Kruskal W H 和 WallisW A于 1952 年在其合作的著作中发表的;Note:在大样本时,仍可以构造一个F 统计量来作多个独立样本的检验;H0.7 F*ikniRiijN12/k1Fk,1Nk12kn i1R2/NkR ii1j统计量F*与 H 之间的关系为:F*NkH/k1 N13应用【例 4-8】续前例_精品资料_ 分析:将样本观看值进行混合,然后进行评秩,结果见表第4 9 3 9 表 4-9 减肥成效评秩表生活方式1 2 一个月后 12 14削减的重量7 6页第 9 页,共 16 页- - - - - - -_归纳总结汇总_ - - - - - - - - - 在该题中,单位 500g 28 11 59 13 1 1044 秩和R i15 46 秩平均R i3 11 n =5,n =5,n

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁