《非参数统计4讲解优秀PPT.ppt》由会员分享,可在线阅读,更多相关《非参数统计4讲解优秀PPT.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 多样本数据检验多样本数据检验在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,运用的方法是方差分析,在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。更严密的说,当几个总体的分布相同的条件下,探讨其位置参数是否相等。方差分析过程须要假定条件,F检验才有效。可有时候所采集的数据常常不能满足这些条件,像多样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。第一节 Kruskal-Wallis检验 基本原理:与处理两样本位置检验的基本原理:与处理两样本位置检验的W-M-WW-M-W方法类方法类似,将多个
2、样本混合起来求秩,假如遇到打结的似,将多个样本混合起来求秩,假如遇到打结的状况,接受平均秩,然后再按样本组求秩和。将状况,接受平均秩,然后再按样本组求秩和。将 k k 组数据混合,并从小到大排列,列出等级,如组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,假如原假设为不真,有相同数据则取平均等级,假如原假设为不真,某个总体的位置参数太大,则其观测值也倾向于某个总体的位置参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大。取较大的值,则该总体的观测值的秩和也会偏大。检验方法检验方法计算第j组的样本平均秩:对秩仿照方差分析原理:得到Kruskal-Wallis的
3、H统计量:在零假设状况下,H近似听从 ,当 的时候拒绝零假设。例:为探讨4种不同药物对儿童咳嗽的治疗效果,将25个体质相像的病人随机分为4组,各自接受A/B/C/D四种药物进行治疗,假定其他条件均保持相同。5天后测量每个病人每天咳嗽次数如下,试比较这4种药物的治疗效果是否相同。例:从我国上市公司中分别随机抽取了工业、商业、建筑业、交通运输业等四个行业,其在1999年的总资产酬劳率如下:问四个行业资产酬劳率是否有显著性差异.分析:要检验这四个组数据的差异性,也可以利用方差分析,但方差分析须要假定观测值听从正态分布,所以用Kruckal-Wallis检验。首先将四个组的数据混合,然后排序求秩多重比
4、较多重比较对比其中每两组差异的时候,用Dunn(1964)年提出用:其中假如那么表示i和j两组之间存在差异,为标准正态分布分位数。其次节 Jonckheere-Terpstra 检验在在上上一一节节中中,我我们们只只是是考考虑虑了了备备选选假假设设无无方方向向时时的的秩秩检检验验法法,而而在在实实际际中中有有很很多多问问题题,其其备备选选假假设设可可能能是是有有方方向向的的。比比如如,在在探探讨讨某某种种治治头头痛痛药药的的疗疗效效时时,第第i组组患患者者的的药药量量可可能能跟跟i有有关关;在在探探讨讨某某项项教教学学方方法法的的效效果果时时,学学校校效效果果的的好好坏坏可可能能跟跟班班上上的
5、的听听课课人人数数有有关关系系等等等等。此此时时要要检验的备择假设即为有方向性(倾向性)的。前面的检验的备择假设即为有方向性(倾向性)的。前面的K-W检验则无法反映这一方向性。检验则无法反映这一方向性。检验原理以及方法检验原理以及方法假假设设k个个独独立立的的样样本本:分分别别来来自自于于k个形态相同的分布:个形态相同的分布:.假设检验问题:假设检验问题:至少有一不等式严格成立。至少有一不等式严格成立。检验步骤检验步骤2.计算Jonckheere-Terpstra统计量:3.当J取大值的时候,考虑拒绝零假设,J精确分布可以查零分布表,对于大样本,可以考虑正态近似。1.计算打结的状况时,接受变形
6、的公式:例题分析例题分析所以接受J-T检验。U12=25,U13=31,U23=28.5 J=25+31+28=84.5(查表)Ex:人们在探讨肺病患者的生理性质时发觉患者的肺活量与他早在儿童时期是否接受过某种治疗有关。现视察3组病人,第一组早在儿童时期接受过肺部辐射;其次组接受过胸外科手术,第三组没有治疗过。现视察到其肺活量占其正常值的百分比如下:以往的阅历告知我们,这三组病人的肺活量有如下关系:其次组 第一组 第三组。试推断这一阅历是否牢靠。Ex:人们在探讨肺病患者的生理性质时发觉患者的肺活量与他早在儿童时期是否接受过某种治疗有关。现视察3组病人,第一组早在儿童时期接受过肺部辐射;其次组接
7、受过胸外科手术,第三组没有治疗过。现视察到其肺活量占其正常值的百分比如下:以往的阅历告知我们,这三组病人的肺活量有如下关系:其次组 第一组 第三组。试推断这一阅历是否牢靠。第五节 Friedman秩和检验 因子1因子2因子k区组1区组2区组b完全随机区组设计表假设检验问题:处理1处理2处理k区组1区组2区组b秩和在每一个区组中计算各个处理的秩,再计算每个处理水平下的秩和,即由于每个处理水平的平均秩为:检验统计量检验统计量利用一般类似方差分析构造统计量:在零假设成立下 ,假如 偏大,那么就考虑拒绝原价设。假如存在打结的状况,则可接受修正公式计算。检验统计量Q=7.6,因此可得W=0.76,结论呢
8、?Hollander-Wolfe两处理两处理比较检验比较检验 当用Friedman检验,认为处理之间表现出差异的时候,那么可以进一步探讨处理两两之间是否存在差异。Hollander-Wolfe检验公式:其中,在打结的状况下可运用修正的公式。当 时认为两个处理之间存在差异,其中 ,是显著性水平。第六节 Kendall协同系数检验 在实际生活中常常须要对n个个体进行m次评估,比如m个裁判对n个运动员进行评分,m个选民对n个候选人的评价等等。人们往往想知道,这m个结果之间是否一样。假如很不一样,则这个评分(价)多少有些随机,没有多大意义。检验检验假设检验问题:Kendall协同系数:当W值偏大的时候
9、,考虑拒绝零假设。第七节第七节 二元变量的二元变量的Cochran检验检验第七节第七节 二元变量的二元变量的Cochran检验检验检验原理以及计算:检验原理以及计算:当完全区组设计,并且观测只是二元定性数据时,CochranQ检验方法进行处理。数据形式见下表。检验检验假设检验问题:CochranQ检验统计量:Q近似听从分布,当Q值偏大的时候,考虑拒绝零假设。第八节第八节 Page检验检验类似于备选假设为有序时所应用的Jonckheere检验,对于完全区组设计的检验也一样:与Friedman统计量一样,首先在每个区组中对处理排序,然后对每个处理求出秩和。由上表易得:L=1*22.5+2*22.5
10、+3*27=148.5查表可知0.05下,Page检验的临界值为153,故无法拒绝第九节第九节 Durbin不完全区组分析不完全区组分析 原理:原理:可可能能存存在在处处理理特特别别多多,但但是是每每个个区区组组中中允允许许的的样样本本量量有有限限的的时时候候,每每一一个个区区组组中中不不行行能能包包含含全全部部的的处处理理,比比如如重重要要的的均均衡衡不不完完全全区区组组BIB设设计计。Durbin检检验验便便是是针针对对这这种问题。种问题。表示第j个处理第i个区组中的观测值,Rij为在第i个区组中第j个处理的秩,计算:构造统计量:当D值较大的时候,可以考虑拒绝零假设,认为处理之间存在差异。在零假设成立时,大样本状况下,D近似听从分布。打结的时候,只要长度不大,对结果影响不太大。解答解答