《第8章非参数检验.ppt》由会员分享,可在线阅读,更多相关《第8章非参数检验.ppt(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学导论统计学导论曾五一曾五一 肖红叶肖红叶 主编主编第八章第八章 非参数检验非参数检验 n第一节第一节 非参数检验概述非参数检验概述n第二节第二节 符号检验与符秩检验符号检验与符秩检验n第三节第三节 秩和检验与秩和检验与 检验检验n第四节第四节 等级相关检验等级相关检验n第五节第五节 EXCEL在非参数检验中的应用在非参数检验中的应用2第一节第一节 非参数检验概述非参数检验概述n一、什么是非参数检验一、什么是非参数检验n二、非参数检验的优缺点二、非参数检验的优缺点3一、什么是非参数检验一、什么是非参数检验n 所谓非参数检验,又被称为自由分布检所谓非参数检验,又被称为自由分布检验,它是一种不
2、需要事先对总体分布的形状验,它是一种不需要事先对总体分布的形状加以限制而进行的假设检验。加以限制而进行的假设检验。n 应当指出,这里所谓的应当指出,这里所谓的“非参数非参数”,只,只是指在检验的过程中,未对检验统计量服从是指在检验的过程中,未对检验统计量服从的分布及参数做出限制,并不意味着在检验的分布及参数做出限制,并不意味着在检验中中“不涉及参数不涉及参数”或或“不对参数进行检验不对参数进行检验”。4二、非参数检验的优缺点二、非参数检验的优缺点n优点:优点:首先,检验条件比较宽松,适应性强。非参数首先,检验条件比较宽松,适应性强。非参数检验对资料的要求不像参数检验那样严格,它适合检验对资料的
3、要求不像参数检验那样严格,它适合于处理诸如非正态的、方差不等的或分布形状未知于处理诸如非正态的、方差不等的或分布形状未知的资料。的资料。其次,自由分布检验的方法比较灵活,用途广泛其次,自由分布检验的方法比较灵活,用途广泛。它不但可以应用于处理测量层次较高的定距、定。它不但可以应用于处理测量层次较高的定距、定比数据,也适用于处理层次较低的定类、定序数据。比数据,也适用于处理层次较低的定类、定序数据。对于那些不能进行加、减、乘、除运算的定类数据对于那些不能进行加、减、乘、除运算的定类数据与定序数据,也可进行检验。与定序数据,也可进行检验。再次,自由分布检验的计算相对简单。由于自由再次,自由分布检验
4、的计算相对简单。由于自由分布的检验方法不用复杂计算,一般使用计数方法分布的检验方法不用复杂计算,一般使用计数方法就可以了,它的计数过程与结果都比较简单、直观就可以了,它的计数过程与结果都比较简单、直观与明显。与明显。5n缺点:缺点:它对原始数据中包含的信息利用得不够充它对原始数据中包含的信息利用得不够充分,检验的功效相对较弱。分,检验的功效相对较弱。结论:参数检验与非参数检验是针对不结论:参数检验与非参数检验是针对不同情况提出的两种统计方法,它们各有同情况提出的两种统计方法,它们各有优缺点,可互为补充。优缺点,可互为补充。6第二节第二节 符号检验与符秩检验符号检验与符秩检验n一、单总体问题的符
5、号检验一、单总体问题的符号检验n二、两总体问题的符号检验二、两总体问题的符号检验n三、威尔科克森配对符号秩检验三、威尔科克森配对符号秩检验7一、单总体问题的符号检验一、单总体问题的符号检验n单总体符号检验适用于检验总体中位数是否在某单总体符号检验适用于检验总体中位数是否在某一指定位置。一指定位置。89二、两总体问题的符号检验二、两总体问题的符号检验n两总体符号检验适用于检验配对样本情形下,两总体符号检验适用于检验配对样本情形下,两总体分布在位置特征上是否有差异。两总体分布在位置特征上是否有差异。n所谓配对样本,是指对每一个观测单元(个所谓配对样本,是指对每一个观测单元(个体)作两次观测。体)作
6、两次观测。10111213三、威尔科克森配对符号秩检验三、威尔科克森配对符号秩检验 以上所介绍的两总体情形下符号检验方法,以上所介绍的两总体情形下符号检验方法,仅仅用配对观测之间差别的符号进行检验,仅仅用配对观测之间差别的符号进行检验,而不注重差别的大小,因此对资料的利用不而不注重差别的大小,因此对资料的利用不够充分。当配对观测之间的差别可以从数量够充分。当配对观测之间的差别可以从数量上来测定时,威尔科克森(上来测定时,威尔科克森(Wilcoxon)配对)配对符号秩检验比符号检验更有效符号秩检验比符号检验更有效。14151617第三节第三节 秩和检验与检验秩和检验与检验n一、秩和检验一、秩和检
7、验n二、皮尔逊二、皮尔逊 统计量统计量n三、分布拟合检验三、分布拟合检验18一、秩和检验一、秩和检验n 秩和检验可用于检验两个独立样本是否来秩和检验可用于检验两个独立样本是否来自具有相同位置特征的总体。这里要求两个自具有相同位置特征的总体。这里要求两个总体具有相同的分布形状(不论是何种分布总体具有相同的分布形状(不论是何种分布形状)。形状)。1920212223二、皮尔逊二、皮尔逊 统计量统计量242526三、分布拟合检验三、分布拟合检验n 在理论研究和实际应用中,常常根据所在理论研究和实际应用中,常常根据所作随机试验的特点,认定无限总体的分布符作随机试验的特点,认定无限总体的分布符合某种概率
8、分布模型,这时,说该无限总体合某种概率分布模型,这时,说该无限总体具有已知的分布。但是,有许多时候,无法具有已知的分布。但是,有许多时候,无法根据所作随机试验认定无限总体符合何种概根据所作随机试验认定无限总体符合何种概率分布模型。这时,便需要根据统计数据提率分布模型。这时,便需要根据统计数据提供的信息,为总体选配一个合适的概率分布供的信息,为总体选配一个合适的概率分布模型。模型。27n一般作法是:一般作法是:首先,对样本数据作分组整理,计算各组的频首先,对样本数据作分组整理,计算各组的频率,称所得到的分布列为经验分布;率,称所得到的分布列为经验分布;其次,根据有关理论和实际知识以及经验分布其次
9、,根据有关理论和实际知识以及经验分布的特点,猜测无限总体的分布符合某种概率模型,的特点,猜测无限总体的分布符合某种概率模型,称所选择的概率模型为理论分布;称所选择的概率模型为理论分布;然后,用显著性检验的方法,将经验分布与理然后,用显著性检验的方法,将经验分布与理论分布作比较,检验观察到的差异能否显著地表明论分布作比较,检验观察到的差异能否显著地表明两种分布的真实差异存在,如果表明真实差异存在两种分布的真实差异存在,如果表明真实差异存在的证据不足,则可以期望所选理论分布能较好地描的证据不足,则可以期望所选理论分布能较好地描述所研究的无限总体的分布规律。述所研究的无限总体的分布规律。这类显著性检
10、验称作分布拟合检验。分布拟合检这类显著性检验称作分布拟合检验。分布拟合检验的方法很多,我们只介绍分布拟合的皮尔逊验的方法很多,我们只介绍分布拟合的皮尔逊 检验。检验。282930表表8-1 钟表走时误差的经验分布与理论分布的比较钟表走时误差的经验分布与理论分布的比较313233第四节第四节 等级相关检验等级相关检验n一、斯皮尔曼等级相关系数一、斯皮尔曼等级相关系数n二、斯皮尔曼等级相关系数的统计检验二、斯皮尔曼等级相关系数的统计检验n三、两点说明三、两点说明34一、斯皮尔曼等级相关系数一、斯皮尔曼等级相关系数n 第七章所讨论的两变量之间相关系数的第七章所讨论的两变量之间相关系数的前提是:两随机
11、变量的联合分布是二维正态前提是:两随机变量的联合分布是二维正态分布。当随机变量的分布不能满足正态性要分布。当随机变量的分布不能满足正态性要求时,或者所要研究的变量不是数量型变量求时,或者所要研究的变量不是数量型变量时,通常的相关分析方法不宜使用,而需要时,通常的相关分析方法不宜使用,而需要利用斯皮尔曼等级相关系数进行考察。利用斯皮尔曼等级相关系数进行考察。353637二、斯皮尔曼等级相关系数的统计检验二、斯皮尔曼等级相关系数的统计检验3839三、两点说明三、两点说明n(一)等级相关检验适用于变量值表现为等级的变(一)等级相关检验适用于变量值表现为等级的变量。不过,对于变量值表现为数值而不是等级
12、的变量。不过,对于变量值表现为数值而不是等级的变量,有时也可以把它划分为若干等级,用等级相关量,有时也可以把它划分为若干等级,用等级相关的方法来研究。这样做是出于下面的一些理由:的方法来研究。这样做是出于下面的一些理由:(1)无法假定总体的分布;)无法假定总体的分布;(2)其中有一个变量是只能用等级来反映的;)其中有一个变量是只能用等级来反映的;(3)把测量值划分为等级更能反映事物的本质(例)把测量值划分为等级更能反映事物的本质(例如,把年龄按生命过程阶段划分比用实际年龄更便如,把年龄按生命过程阶段划分比用实际年龄更便于研究生命过程的统计规律)。把测量值转换为等于研究生命过程的统计规律)。把测
13、量值转换为等级的方法是:首先,按实际观察值大小排序,并赋级的方法是:首先,按实际观察值大小排序,并赋予每个观察值秩次;其次,把测量值的取值范围划予每个观察值秩次;其次,把测量值的取值范围划分为若干等级区间。分为若干等级区间。40n(二)斯皮尔曼等级相关系数是以变量没有(二)斯皮尔曼等级相关系数是以变量没有相同等级为前提的。但有时,观察结果出现相同等级为前提的。但有时,观察结果出现了相同的等级,这时,须计算这几个观察结了相同的等级,这时,须计算这几个观察结果所在位置秩次的简单算术平均数作为它们果所在位置秩次的简单算术平均数作为它们相应的等级。在这种情形下应用斯皮尔曼等相应的等级。在这种情形下应用
14、斯皮尔曼等级相关系数计算公式所得之结果显然只是近级相关系数计算公式所得之结果显然只是近似的。若相同等级不是太多,可以近似应用似的。若相同等级不是太多,可以近似应用上述公式,否则应加以修正上述公式,否则应加以修正。41第五节第五节 EXCEL在非参数检验中的应用在非参数检验中的应用n一、符号检验一、符号检验n二、威尔科克森配对符号秩检验二、威尔科克森配对符号秩检验n三、分布拟合的皮尔逊卡方检验三、分布拟合的皮尔逊卡方检验42一、符号检验一、符号检验43利用Excel求解步骤如下:(一)输入数据,见图8-1。A、B列为原始输入数据,样本数据存放在A2:A29单元格区域,图中未完全显示出来,D、E列
15、为计算得出的结果。(二)计算样本观察值大于中位数的个数(即正号的个数)。在E1中输入公式如下的公式=COUNTIF(A2:A29,90)COUNTIF函数计算区域中满足给定条件的单元格的个数。(三)计算样本容量n(不含0差数)。在E2中输入公式=COUNT(A2:A29)-COUNTIF(A2:A29,=90)44(四)使用公式(四)使用公式8.1计算检验统计量计算检验统计量Z。在。在E3中输入公式中输入公式=(E1-0.5*E2)/SQRT(0.25*E2)(五)计算临界值(五)计算临界值Z/2。在。在E4中输入公式中输入公式“=ABS(NORMSINV(B2/2)”。n图图8-1(六)结论
16、。由于(六)结论。由于-4.54 46,检检验验统统计计量量的的样样本本值值落落在在拒拒绝绝域域,故故否否定定原原假假设设。所所以以说说,该该专专业业学学生生在在两两次次测测验验的的时时间间上上,该该项项成成绩绩水水平有改变。平有改变。55三、分布拟合的皮尔逊卡方检验三、分布拟合的皮尔逊卡方检验n【例例8-5】用用Excel实现本章例实现本章例8-1的计算过程。的计算过程。n解:主要操作步骤如下。解:主要操作步骤如下。n(一)构造工作表,见图(一)构造工作表,见图8-4。图中方框之内为计算。图中方框之内为计算所得结果,方框之外为原始的输入数据。所得结果,方框之外为原始的输入数据。图图8-48-
17、4565758 本章小结本章小结 1非参数检验,又被称为自由分布检验,它非参数检验,又被称为自由分布检验,它是一种不需要事先对总体分布的形状和参数是一种不需要事先对总体分布的形状和参数加以限制而进行的假设检验。加以限制而进行的假设检验。2单总体问题的符号检验。单总体问题的符号检验。3两总体问题的符号检验。两总体问题的符号检验。4威尔科克森配对符号秩检验。威尔科克森配对符号秩检验。59 5秩和检验。秩和检验。6皮尔逊检验。皮尔逊检验。7等级相关检验。等级相关检验。8对于非参数检验,主要是利用对于非参数检验,主要是利用Excel中的中的公式、公式复制的功能以及相关的数学与统公式、公式复制的功能以及相关的数学与统计函数进行计算,有些非参数检验还利用了计函数进行计算,有些非参数检验还利用了Excel的排序、分类汇总的功能。的排序、分类汇总的功能。60