第七章SPSS非参数检验.ppt

上传人:石*** 文档编号:50889471 上传时间:2022-10-16 格式:PPT 页数:80 大小:5.83MB
返回 下载 相关 举报
第七章SPSS非参数检验.ppt_第1页
第1页 / 共80页
第七章SPSS非参数检验.ppt_第2页
第2页 / 共80页
点击查看更多>>
资源描述

《第七章SPSS非参数检验.ppt》由会员分享,可在线阅读,更多相关《第七章SPSS非参数检验.ppt(80页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第七章SPSS非参数检验现在学习的是第1页,共80页本章内容7.1 单样本的非参数检验单样本的非参数检验7.2 两独立样本的非参数检验两独立样本的非参数检验7.3 多独立样本的非参数检验多独立样本的非参数检验7.4 两配对样本的非参数检验两配对样本的非参数检验7.5 多配对样本的非参数检验多配对样本的非参数检验现在学习的是第2页,共80页非参数检验非参数检验:非参数检验:(1)在总体分布)在总体分布未知未知或知道或知道甚少甚少的情况下,利用的情况下,利用样本数据对总体样本数据对总体分布形态分布形态等进行推断的方法。等进行推断的方法。(2)推断过程中)推断过程中不涉及不涉及有关总体分布的有关总体

2、分布的参数参数。现在学习的是第3页,共80页7.1 单样本的非参数检验1.目的:样本来自总体的分布是否与某个已知的分布目的:样本来自总体的分布是否与某个已知的分布相吻合?相吻合?绘制样本数据的直方图、绘制样本数据的直方图、pp图、图、QQ图判断图判断粗略粗略通过非参数检验通过非参数检验精确精确2.单样本非参数检验单样本非参数检验(1)对单个总体的分布形态等进行推断)对单个总体的分布形态等进行推断(2)方法:卡方检验、二项分布检验、)方法:卡方检验、二项分布检验、K-S检验、检验、变量值随机性检验等。变量值随机性检验等。现在学习的是第4页,共80页7.1.1总体分布的卡方检验1、基本思想的理论依

3、据:、基本思想的理论依据:如果从一个随机变量如果从一个随机变量X中随机抽取若干个观察中随机抽取若干个观察样本,这些观察样本落在样本,这些观察样本落在X的的k个互不相交的子集个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。基于这一思想,趋于无穷时近似服从卡方分布。基于这一思想,对变量对变量X总体分布的检验可从对各个观察频数的分总体分布的检验可从对各个观察频数的分析入手。析入手。现在学习的是第5页,共80页7.1.1总体分布的卡方检验1.基本思想基本思想-吻合性检验吻合性检验 (1)原假设:样本来自的总体分布与期

4、望分布)原假设:样本来自的总体分布与期望分布无显著无显著差异。差异。变量值落入第变量值落入第i个子集中的理论概率为个子集中的理论概率为 ,相应的期望频率为,相应的期望频率为 现在学习的是第6页,共80页二二.总体分布卡方检验的应用实例:总体分布卡方检验的应用实例:SPSS总体分布的卡方检验对数据存放,需要总体分布的卡方检验对数据存放,需要定义一个存放变量值的定义一个存放变量值的SPSS变量和一个存放各变变量和一个存放各变量值观测频数的变量,并指定该变量为加权变量。量值观测频数的变量,并指定该变量为加权变量。现在学习的是第7页,共80页2.实现步骤实现步骤Analyze-Nonparametri

5、c Tests-Chi-Square现在学习的是第8页,共80页(1)选定待检验的变量到)选定待检验的变量到Test Variable list(2)在)在Expected Range中确定参与分析的观测值的范围:中确定参与分析的观测值的范围:Get from data:所有观测数据都参与分析所有观测数据都参与分析use specified range:只在该取值范围内的观测数据才参与分析。:只在该取值范围内的观测数据才参与分析。(3)Expected values给出各理论值给出各理论值All categories equal:所有子集的频数都相同所有子集的频数都相同value:依次输入值,

6、通过:依次输入值,通过add、change、remove进行增进行增加、修改和删除。加、修改和删除。(4)单击单击Options按钮,在按钮,在Statistics栏中选择输出统计量。栏中选择输出统计量。Descriptive 复选项,指定输出变量的均值、标准差、最大值、最小值、复选项,指定输出变量的均值、标准差、最大值、最小值、非缺失个体的数量。非缺失个体的数量。现在学习的是第9页,共80页Quartiles复选项,输出四分位数。复选项,输出四分位数。(2)Missing Values 栏中选择对缺失值的处理栏中选择对缺失值的处理方式。方式。Exclude case test-by-test

7、 选项,将参与对选项,将参与对比中的缺失值排除。比中的缺失值排除。Exclude cases listwise 选项,剔除任何变量选项,剔除任何变量中所有含缺失值的样品。中所有含缺失值的样品。现在学习的是第10页,共80页3.应用案例医学研究表明心脏病人猝死人数与日期的关系为:医学研究表明心脏病人猝死人数与日期的关系为:一周内,星期一猝死者较多,其他日子基本相当,一周内,星期一猝死者较多,其他日子基本相当,各天的比例近似为:各天的比例近似为:2.8:1:1:1:1:1:1 根据根据“心脏病猝死心脏病猝死”数据,推断总体分布是否与理数据,推断总体分布是否与理论分布相吻合。论分布相吻合。分析:分析

8、:利用总体分布卡方检验实现。利用总体分布卡方检验实现。现在学习的是第11页,共80页4.应用练习掷一颗六面体掷一颗六面体300次,用数字型数据次,用数字型数据1、2、3、4、5、6分别代表六面的六个点,试问这颗六面体分别代表六面的六个点,试问这颗六面体是否均匀。是否均匀。123456434956456641现在学习的是第12页,共80页7.1.2二项分布检验在现实生活中有很多数据的取值是二值的,例如,在现实生活中有很多数据的取值是二值的,例如,人群可以分为男性和女性,产品可以分为合格和不人群可以分为男性和女性,产品可以分为合格和不合格,学生可以分为三好学生和非三好学生。通常合格,学生可以分为三

9、好学生和非三好学生。通常将这样的二值分别用将这样的二值分别用1和和0表示。如果进行表示。如果进行n次相同次相同的实验,则出现两类(的实验,则出现两类(1或或0)的次数可以用离散型的次数可以用离散型随机变量来描述。如果随机变量值为随机变量来描述。如果随机变量值为1代表成功,代表成功,其概率设为其概率设为p,则随机变量值为,则随机变量值为0的概率的概率q便等于便等于1-p,则成功次数变量,则成功次数变量X的分布为二项分布。的分布为二项分布。现在学习的是第13页,共80页7.1.2二项分布检验1.基本思想基本思想(1)通过样本数据检验样本来自的总体是否服从指定概率)通过样本数据检验样本来自的总体是否

10、服从指定概率p的二的二项分布。项分布。(2)小样本)小样本-精确检验:计算精确检验:计算n次试验中某类出现的次数小于等于次试验中某类出现的次数小于等于x次次的概率:的概率:大样本大样本-近似检验近似检验现在学习的是第14页,共80页2.实现步骤 Analyze-Nonparametric Tests-Binomial现在学习的是第15页,共80页(1)选定待检验的变量到)选定待检验的变量到Test Variable list(2)define dichotomy中指定如何分类中指定如何分类get from data:检验变量为二值变量:检验变量为二值变量cut point:输入具体数值,小于等

11、于该值的为第:输入具体数值,小于等于该值的为第一组,大于该组的为第二组一组,大于该组的为第二组(3)Test proportion:输入二项分布的检验:输入二项分布的检验概率值概率值现在学习的是第16页,共80页3.应用案例利用利用“产品合格率产品合格率”数据,推断该批产品的一级品数据,推断该批产品的一级品率是否为率是否为90%。分析:分析:产品合格与否属于二值变量,可以通过二项分布检产品合格与否属于二值变量,可以通过二项分布检验实现。验实现。现在学习的是第17页,共80页3.应用练习1.掷一枚硬币掷一枚硬币31次,出现正面和反面在上的结果次,出现正面和反面在上的结果见下表,试问这枚硬币是否均

12、匀。见下表,试问这枚硬币是否均匀。2.根据居民储蓄存款的数据,分析储户对未来收入根据居民储蓄存款的数据,分析储户对未来收入的看法,检验储户总体对收入持保守或悲观态度的的看法,检验储户总体对收入持保守或悲观态度的比例是否与比例是否与0.4有显著性差异。有显著性差异。次次12345678910111213141516面面ABABBAAABBABBAAA次次171819202122232425262728293031面面BA BBABBABABBABA现在学习的是第18页,共80页7.1.3单样本K-S检验1.基本思想基本思想(1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名)以俄罗斯数学家柯尔莫哥和斯

13、米诺夫名字命名(2)利用样本数据推断样本来自的总体是否服从某一理论分布,是一种)利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度拟合优度的检验方法,适用于探索的检验方法,适用于探索连续型连续型随机变量的分布随机变量的分布(3)步骤)步骤计算各样本观测值在理论分布中出现的计算各样本观测值在理论分布中出现的理论累计概率值理论累计概率值F(x)计算各样本观测值的计算各样本观测值的实际累计概率值实际累计概率值S(x)计算理论累计概率值与实际累计概率值的计算理论累计概率值与实际累计概率值的差差D(x)计算差值序列中计算差值序列中最大绝对差值最大绝对差值D现在学习的是第19页,共80页(

14、4)原假设成立时:)原假设成立时:小样本下:小样本下:Dkolmogorov分布分布大样本下:大样本下:近似服从近似服从K(x)分布分布SPSS仅给出大样本下的仅给出大样本下的 和对应的和对应的p值值(5)决策)决策D统计量的统计量的p值值显著性水平,不拒绝原假设,样本来自的显著性水平,不拒绝原假设,样本来自的总体与指定分布无显著差异总体与指定分布无显著差异现在学习的是第20页,共80页2.实现步骤Analyze-Nonparametric Tests-1-sample K-S现在学习的是第21页,共80页(1)选定待检验的变量到)选定待检验的变量到Test Variable list(2)T

15、est distribution:选择理论分布选择理论分布normal:正态分布正态分布uniform:均匀分布:均匀分布poisson:泊松分布:泊松分布exponential:指数分布:指数分布现在学习的是第22页,共80页3.应用案例利用利用“儿童身高儿童身高”数据分析周岁儿童身高总体是否数据分析周岁儿童身高总体是否服从正态分布。服从正态分布。分析:分析:可以通过单样本可以通过单样本K-S检验实现。检验实现。现在学习的是第23页,共80页3.应用练习1、利用存款储蓄调查数据,分析储户一次存款金、利用存款储蓄调查数据,分析储户一次存款金额的总体是否服从正态分布,并结合存款金额的额的总体是否

16、服从正态分布,并结合存款金额的pp图和图和qq图来分析。图来分析。现在学习的是第24页,共80页7.1.4 变量值随机性检验1.基本思想基本思想(1)通过对样本变量值的分析,实现对总体的变量值出)通过对样本变量值的分析,实现对总体的变量值出现现是否随机是否随机进行检验。进行检验。(2)原假设:总体变量值出现是随机的。)原假设:总体变量值出现是随机的。检验依据:游程检验依据:游程-样本序列中连续出现相同的变量值样本序列中连续出现相同的变量值的次数。的次数。游程数太大或太小都表明变量值存在不随机的现象游程数太大或太小都表明变量值存在不随机的现象现在学习的是第25页,共80页关于随机性的游程检验关于

17、随机性的游程检验(run test)游程检验方法是检验一个取两个值的变量的这两个值游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由的出现是否是随机的。假定下面是由0和和1组成的一组成的一个这种变量的样本:个这种变量的样本:0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的其中相同的0(或相同的(或相同的1)在一起称为一个游程)在一起称为一个游程(单独的(单独的0或或1也算)。也算)。这个数据中有这个数据中有4个个0组成的游程和组成的游程和3个个1组成的游程。组成的游程。一共是一共是R=7个游程。其中个游程。

18、其中0的个数为的个数为m=15,而,而1的个数为的个数为n=10。现在学习的是第26页,共80页(3)检验统计量)检验统计量(4)决策:)决策:Z统计量的统计量的p值值显著性水平,不拒绝原假设,变量值的出现是随机的。显著性水平,不拒绝原假设,变量值的出现是随机的。现在学习的是第27页,共80页关于随机性的游程检验(关于随机性的游程检验(run testrun test)例(run2.sav):从某装瓶机出来的30盒化妆品的重量如下(单位克)当然,游程检验并不仅仅用于只取两个值的变量,它还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于0和1的个数)是否随机的问题。看下面例子。71.

19、6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9为了看该装瓶机是否工作正常,首先需要验证是否大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。现在学习的是第28页,共80页关于随机性的游程检验(关于随机性的游程检验(run testrun test)如果把小于中位数的记为0,否则记为1,上面数据变成下面的01序列1 1 1 1 1 1

20、 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 这就归为上面的问题。当然这里进行这种变换只是为了易于理解。实际计算时,用不着这种变换,计算机会自动处理这个问题的。直接利用这个数据,通过SPSS,得到下面游程检验结果的输出。现在学习的是第29页,共80页2.实现步骤Analyze-Nonparametric Tests-Runs现在学习的是第30页,共80页(1)选定待检验的变量到)选定待检验的变量到Test Variable list(2)cut point:计算游程数的分界值计算游程数的分界值median:样本中位数为分界值:样本中位数为分界

21、值mode:样本众数为分界值:样本众数为分界值mean:样本均值为分界值:样本均值为分界值custom:以用户输入的值为分界值,:以用户输入的值为分界值,SPSS将将小于该分界值的所有变量作为一组,大于或等于该小于该分界值的所有变量作为一组,大于或等于该分界值的所有变量作为一组,计算游程。分界值的所有变量作为一组,计算游程。现在学习的是第31页,共80页3.应用案例利用利用“电缆数据电缆数据”推断耐压设备的工作是否正常。推断耐压设备的工作是否正常。分析:分析:若耐压数据的变动是随机的若耐压数据的变动是随机的-则设备工作正常则设备工作正常若耐压数据的变动不是随机的若耐压数据的变动不是随机的-则设

22、备工作存在不则设备工作存在不正常正常可以通过变量值随机性检验实现。可以通过变量值随机性检验实现。现在学习的是第32页,共80页4.应用练习掷硬币掷硬币20次得到的实验数据,试问硬币实验是否次得到的实验数据,试问硬币实验是否是随机的。是随机的。11010001101011100110现在学习的是第33页,共80页7.2两独立样本的非参数检验(1)独立样本:在一个总体中随机抽样对在另一个)独立样本:在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。总体中随机抽样没有影响的情况下所获得的样本。(2)推断样本来自的两个总体的)推断样本来自的两个总体的分布分布等是否存在等是否存在

23、显显著差异著差异。(3)方法:曼)方法:曼-惠特尼惠特尼U检验、检验、K-S检验、检验、W-W游游程检验、极端反应检验等。程检验、极端反应检验等。现在学习的是第34页,共80页秩(rank)非非参参数数检检验验中中秩秩是是最最常常使使用用的的概概念念。什什么么是是一一个个数数据据的的秩秩呢呢?一一般般来来说说,秩秩就就是是该该数数据据按按照照升升幂幂排排列列之之后后,每每个个观观测测值值的的位位置置。例例如如我我们们有有下下面面数据数据.Xi159183178513719Ri75918426310这下面一行(记为Ri)就是上面一行数据Xi的秩。现在学习的是第35页,共80页秩(秩(rank)利

24、利用用秩秩的的大大小小进进行行推推断断就就避避免免了了不不知知道道背背景景分分布布的的困困难难。这这也也是是非非参参数数检检验验的的优点。优点。多多数数非非参参数数检检验验明明显显地地或或隐隐含含地地利利用用了了秩秩的的性性质质;但但也也有有一一些些非非参参数数方方法法没没有有涉及秩的性质。涉及秩的性质。现在学习的是第36页,共80页7.2.1两独立样本的曼-惠特尼U检验1.基本思想基本思想(1)原假设:两组独立样本来自的两总体分布无显著差异。)原假设:两组独立样本来自的两总体分布无显著差异。(2)通过两组样本)通过两组样本平均秩平均秩的研究实现推断的研究实现推断 秩秩-变量值排序的变量值排序

25、的名次名次,变量值有几个,对应的秩便有几个。,变量值有几个,对应的秩便有几个。(3)检验步骤)检验步骤 将两组样本混合并升序排列,得每个数据的秩将两组样本混合并升序排列,得每个数据的秩 分别对样本分别对样本X和和Y的秩求平均,得平均秩的秩求平均,得平均秩 和和 计计算样本算样本X优于样本优于样本Y秩的个数秩的个数 和样本和样本Y优于样本优于样本X秩的个数秩的个数 依据依据 和和 计算计算WilcoxonW统计量和曼统计量和曼-惠特尼惠特尼U统计量。统计量。现在学习的是第37页,共80页WilcoxonW统计量:统计量:曼曼-惠特尼统计量惠特尼统计量U为:为:大样本下,大样本下,U近似服从正态分

26、布近似服从正态分布现在学习的是第38页,共80页现在学习的是第39页,共80页7.2.2两独立样本的K-S检验1.基本思想基本思想(1)原假设:两组独立样本来自的两总体的分布无显著差异。)原假设:两组独立样本来自的两总体的分布无显著差异。(2)与单样本)与单样本K-S检验的基本思路大体一致,差别在于:以检验的基本思路大体一致,差别在于:以变量值变量值的秩的秩为分析对象,而非变量值本身。为分析对象,而非变量值本身。(3)检验步骤)检验步骤将两组样本混合并按升序排列将两组样本混合并按升序排列分别计算两组样本秩的累计频数和累计频率分别计算两组样本秩的累计频数和累计频率计算两组累计频率的差,得秩的差值

27、序列及计算两组累计频率的差,得秩的差值序列及D统计量统计量,SPSS计算大样本下的计算大样本下的 和对应的和对应的p值值(3)决策:)决策:拒绝原假设,两总体的分布有显著差异:拒绝原假设,两总体的分布有显著差异 :不拒绝原假设,两总体的分布无显著差异:不拒绝原假设,两总体的分布无显著差异 现在学习的是第40页,共80页2.k-s检验n将两样本混合并按升序排序n分别计算两个样本在相同点上的累计频数和累计频率n两个累计频率相减.n如果差距较小,则认为两总体分布无显著差异应保证有较大的样本数现在学习的是第41页,共80页现在学习的是第42页,共80页7.2.3两独立样本的游程检验1.基本思想基本思想

28、(1)原假设:两组独立样本来自的两总体的分布无显著差异。)原假设:两组独立样本来自的两总体的分布无显著差异。(2)检验步骤)检验步骤将两组样本混合并按升序排列,组标记值也随之重新排列将两组样本混合并按升序排列,组标记值也随之重新排列计算计算组标记值序列组标记值序列的游程数的游程数,如果游程数较大如果游程数较大,则说明是由于两类样本则说明是由于两类样本数据充分混合的结果数据充分混合的结果,即即:认为两总体分布无显著差异认为两总体分布无显著差异.根据游程数计算根据游程数计算Z统计量,统计量,Z统计量近似服从正态分布统计量近似服从正态分布(3)决策:)决策:拒绝原假设,两总体的分布有显著差异:拒绝原

29、假设,两总体的分布有显著差异 :不拒绝原假设,两总体的分布无显著差异:不拒绝原假设,两总体的分布无显著差异现在学习的是第43页,共80页7.2.4极端反应检验1.基本思想基本思想(1)原假设:两独立样本来自的两个总体的分布无显著差异。)原假设:两独立样本来自的两个总体的分布无显著差异。(2)一组样本为)一组样本为控制样本控制样本,一组样本为,一组样本为实验样本实验样本,看实验样本相对于控,看实验样本相对于控制样本是否出现了极端反应。制样本是否出现了极端反应。(3)检验步骤)检验步骤两组样本混合按升序排列两组样本混合按升序排列求控制样本的最小秩求控制样本的最小秩 和最大秩和最大秩 计算跨度计算跨

30、度 为了消除样本数据中的极端值,计算跨度前可按比例(通常为了消除样本数据中的极端值,计算跨度前可按比例(通常5%)去除控制样本中靠近两端的样本值,再求跨度,得截头跨度去除控制样本中靠近两端的样本值,再求跨度,得截头跨度针对跨度或截头跨度计算针对跨度或截头跨度计算H统计量:统计量:现在学习的是第44页,共80页小样本下,小样本下,H服从服从Hollander分布分布,大样本下,大样本下,H近似服从正态分布近似服从正态分布(4)决策:)决策:H统计量的统计量的p值值显著性水平,不拒绝原假设,两独立样本来自的总体分布显著性水平,不拒绝原假设,两独立样本来自的总体分布不存在显著差异不存在显著差异现在学

31、习的是第45页,共80页7.2.5两独立样本非参数检验的步骤Analyze-Nonparametric Tests-2 independent samples(1)选择待检验的变量到)选择待检验的变量到Test variable list(2)grouping variable:存放组标志的变量,存放组标志的变量,并通过并通过define groups给出两组的标志值。给出两组的标志值。(3)test type:选择相应的检验方法选择相应的检验方法现在学习的是第46页,共80页现在学习的是第47页,共80页7.2.6两独立样本非参数检验的方法比较不同的分析方法对同批数据的分析不同的分析方法对同

32、批数据的分析,其结论可能不尽相同。一方面说其结论可能不尽相同。一方面说明分析过程中对数据进行反复探索是极为必要的,另一方面也注明分析过程中对数据进行反复探索是极为必要的,另一方面也注意不同方法本身侧重点的差异性。意不同方法本身侧重点的差异性。1、曼、曼-惠特尼惠特尼U检验注重对分布的中心位置(平均水平)作检验,检验注重对分布的中心位置(平均水平)作检验,实际上是检验实际上是检验:两样本所对应的总体具有相同的中心位置(中两样本所对应的总体具有相同的中心位置(中位数)。若不能明确两总体分布的形状是否相同,则不宜单独位数)。若不能明确两总体分布的形状是否相同,则不宜单独使用此方法。使用此方法。2、K

33、-S检验用于两总体分布是否存在显著差异性,对两总体检验用于两总体分布是否存在显著差异性,对两总体的全貌作检查,即位置和分布形状的差异性的检验。的全貌作检查,即位置和分布形状的差异性的检验。3、游程检验与、游程检验与K-S检验相似,也是对全貌作检验,但其功效不检验相似,也是对全貌作检验,但其功效不如如K-S检验。检验。4、极端反应检验注重对分布范围(变异程度)作检验,实际、极端反应检验注重对分布范围(变异程度)作检验,实际上是检验两样本所对应的总体具有相同的分布范围,要求样本上是检验两样本所对应的总体具有相同的分布范围,要求样本足够大。足够大。现在学习的是第48页,共80页7.2.7应用案例利用

34、利用“使用寿命使用寿命”数据,判断两种工艺下产品的使数据,判断两种工艺下产品的使用寿命的分布是否存在显著差异,进而对两个工艺用寿命的分布是否存在显著差异,进而对两个工艺的优劣进行判断。的优劣进行判断。分析:分析:两个工艺产品的使用寿命可看作两独立样本,可以两个工艺产品的使用寿命可看作两独立样本,可以通过曼通过曼-惠特尼惠特尼U检验、检验、K-S检验、检验、W-W游程检验、游程检验、极端反应检验实现。极端反应检验实现。现在学习的是第49页,共80页7.2.8应用练习1、设有甲、乙两种安眠药,考虑比较它们的治疗、设有甲、乙两种安眠药,考虑比较它们的治疗效果,独立观察效果,独立观察20名患者。名患者

35、。10人服甲药,令人服甲药,令10人人服乙药,睡眠延长的时数见下表。试问这两种药物服乙药,睡眠延长的时数见下表。试问这两种药物的疗效有无显著性差异。的疗效有无显著性差异。2、利用居民储蓄调查数据,对城镇和农村储户的、利用居民储蓄调查数据,对城镇和农村储户的存款金额的分布进行比较分析。存款金额的分布进行比较分析。服甲药睡眠延长时数服甲药睡眠延长时数1.90.81.10.10.14.45.51.64.63.4服乙药睡眠延长时数服乙药睡眠延长时数0.7-1.6-0.2-1.2-0.13.43.70.80.02.0现在学习的是第50页,共80页7.3多独立样本的非参数检验1.通过分析多组独立样本数据,

36、推断样本来自的多个通过分析多组独立样本数据,推断样本来自的多个总体的总体的中位数中位数或或分布分布是否存在显著差异。是否存在显著差异。2.方法:中位数检验、方法:中位数检验、Kruskal-Wallis检验、检验、Jonckheere-Terpstra检验。检验。现在学习的是第51页,共80页7.3.1中位数检验1.基本思想基本思想(1)原假设:多个独立样本来自的多个总体的中位数无显著差)原假设:多个独立样本来自的多个总体的中位数无显著差异。异。(2)检验步骤)检验步骤将多组样本混合升序排列,求混合样本的将多组样本混合升序排列,求混合样本的中位数中位数分别计算各组样本中大于和小于中位数的样本个

37、数,形成列联表分别计算各组样本中大于和小于中位数的样本个数,形成列联表(p230 表表7-13)利用卡方检验分析各组样本来自的总体对中位数的分布是否一致。利用卡方检验分析各组样本来自的总体对中位数的分布是否一致。现在学习的是第52页,共80页(3)决策)决策卡方统计量的卡方统计量的p值值显著性水平,不拒绝原假设,多个独立样本显著性水平,不拒绝原假设,多个独立样本来自的总体的中位数不存在显著差异。来自的总体的中位数不存在显著差异。现在学习的是第53页,共80页7.3.2多独立样本的Kruskal-Wallis检验1.基本思想基本思想(1)原假设:多个独立样本来自的多个总体的分布无显著差异。)原假

38、设:多个独立样本来自的多个总体的分布无显著差异。(2)是两独立样本曼)是两独立样本曼-惠特尼惠特尼U检验的推广检验的推广(3)检验步骤)检验步骤将多组样本数据将多组样本数据混合并升序混合并升序排列,求各变量的秩排列,求各变量的秩考察各组考察各组秩的均值秩的均值是否有显著差异是否有显著差异各组秩的差异借助各组秩的差异借助方差分析方差分析:秩的变差分解为:组间差和组内差:秩的变差分解为:组间差和组内差 a若秩的总变差大部分可由组间差解释,则各样本组的总体分布存在显若秩的总变差大部分可由组间差解释,则各样本组的总体分布存在显著差异著差异 b若秩的总变差大部分不能由组间差解释,则各样本组的总体分布若秩

39、的总变差大部分不能由组间差解释,则各样本组的总体分布无显著差异无显著差异现在学习的是第54页,共80页构造构造K-W统计量统计量(4)决策:)决策:SPSS自动计算自动计算K-W统计量和对应的统计量和对应的p值值 p值值显著性水平,不拒绝原假设,多个独立样本来自的多个总体显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。分布无显著差异。现在学习的是第55页,共80页7.3.3多独立样本的Jonckheere-Terpstra检验1.基本思想基本思想(1)原假设:多个独立样本来自的多个总体的分布无显著差异)原假设:多个独立样本来自的多个总体的分布无显著差异(2)J-T统计量统计

40、量现在学习的是第56页,共80页(3)决策:)决策:SPSS自动计算自动计算J-T统计量,统计量,Z统计量和对应的统计量和对应的p值值 p值值显著性水平,不拒绝原假设,多个独立样本来自的多个总体显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。分布无显著差异。现在学习的是第57页,共80页7.3.4多独立样本非参数检验的步骤1.按规定的格式组织数据:按规定的格式组织数据:设置设置两个两个变量分别存放变量分别存放样本值样本值和和组标记值组标记值2.菜单:菜单:Analyze-Nonparametric Tests-K independent samples(1)选择待检验的变量

41、到)选择待检验的变量到Test variable list(2)grouping variable:存放组标志的变量,并通过存放组标志的变量,并通过define groups给出标志值的取值范围。给出标志值的取值范围。(3)test type:选择相应的检验方法选择相应的检验方法现在学习的是第58页,共80页现在学习的是第59页,共80页7.3.5 应用案例利利用用“多多城城市市儿儿童童身身高高”数数据据,对对北北京京、上上海海、成成都都、广广州州四四城城市市的的周周岁岁儿儿童童身身高高进进行行比比较较分分析析,推推断四城市周岁儿童身高是否存在显著差异。断四城市周岁儿童身高是否存在显著差异。分

42、析:分析:(1)对对身身高高分分布布无无确确切切把把握握,涉涉及及多多个个独独立立样样本本采采采用多独立样非参数检验采用多独立样非参数检验(2)分分别别用用中中位位数数检检验验、多多独独立立样样本本的的Kruskal-Wallis检检 验验、多多 独独 立立 样样 本本 的的 Jonckheere-Terpstra检验实现。检验实现。现在学习的是第60页,共80页7.4两配对样本的非参数检验1.通通过过两两配配对对样样本本推推断断样样本本来来自自的的两两个个总总体体的的分分布布是否存在显著差异。是否存在显著差异。2.方方 法法:McNemar检检 验验、符符 号号 检检 验验、Wilcoxon

43、符号秩检验。符号秩检验。现在学习的是第61页,共80页7.4.1两配对样本的McNemar检验1.基本思想基本思想(1)McNemar检验是一种检验是一种变化显著性变化显著性检验,将研究对象自身作为检验,将研究对象自身作为对照者检验其对照者检验其“前后前后”的变化是否显著。的变化是否显著。(2)原假设:两配对样本来自的两总体的分布无显著差异。)原假设:两配对样本来自的两总体的分布无显著差异。(3)分析的变量是)分析的变量是二值变量二值变量,若不是二值变量,应现将数据转换后再,若不是二值变量,应现将数据转换后再使用。导致该方法的应用范围具有局限性。使用。导致该方法的应用范围具有局限性。(4)Mc

44、Nemar检验采用检验采用二项分布检验二项分布检验方法,小样本下计算二项分布方法,小样本下计算二项分布的累计精确概率,大样本下采用修正的的累计精确概率,大样本下采用修正的Z统计量。统计量。(5)SPSS自动计算自动计算Z统计量和对应的统计量和对应的p值值 p值值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异显著差异现在学习的是第62页,共80页7.4.2两配对样本的符号检验1.基本思想基本思想(1)原假设:两配对样本来自的两总体的分布无显著差异。)原假设:两配对样本来自的两总体的分布无显著差异。(2)利用)利用正负符号的个数

45、正负符号的个数实现检验。实现检验。(3)检验步骤)检验步骤分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为+,差值为,差值为负记为负记为-将将+的个数与的个数与-的个数进行比较:采用二项分布检验法,对的个数进行比较:采用二项分布检验法,对正负符号变量正负符号变量进行单进行单样本二项分布检验。样本二项分布检验。小样本下计算二项分布的累计精确概率,大样本下采用修正的小样本下计算二项分布的累计精确概率,大样本下采用修正的Z统计量统计量(4)SPSS自动计算自动计算Z统计量和对应的统计量和对应的p值值 p值值显著性水平,不拒绝

46、原假设,两配对样本来自的两总体分布无显著差异显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异(4)缺陷:缺陷:两配对样本的符号检验注重对两配对样本的符号检验注重对变化方向变化方向的分析,只考虑了数据变化的的分析,只考虑了数据变化的性质,性质,没有考虑变化的幅度没有考虑变化的幅度,对数据的利用不够充分。,对数据的利用不够充分。现在学习的是第63页,共80页7.4.3两配对样本Wilcoxon符号秩检验1.基本思想基本思想(1)原假设:两配对样本来自的两总体的分布无显著差异。)原假设:两配对样本来自的两总体的分布无显著差异。(2)检验步骤)检验步骤分别用第二组样本的各观察值减第一组对

47、应样本观察值,差值为正分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为记为+,差值为负记为,差值为负记为-,并保持差值数据,并保持差值数据将差值变量按升序排列,并求差值变量的秩将差值变量按升序排列,并求差值变量的秩分别计算正号秩总和分别计算正号秩总和 负号秩总和负号秩总和 统计量统计量现在学习的是第64页,共80页(3)决策:)决策:SPSS自动计算自动计算Z统计量和对应的统计量和对应的p值值 p值值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异著差异现在学习的是第65页,共80页7.4.4两配对样本非参数检

48、验的步骤1.按规定的格式组织数据:按规定的格式组织数据:设置设置两个变量两个变量分别存放两组样本的样本值分别存放两组样本的样本值2.菜单:菜单:Analyze-Nonparametric Tests-2 related samples(1)选择待检验的两个配对变量到)选择待检验的两个配对变量到Test pairs list(2)test type:选择相应的检验方法选择相应的检验方法现在学习的是第66页,共80页现在学习的是第67页,共80页7.4.5应用案例1.利用利用“统计学习统计学习”数据,分析学生在学习数据,分析学生在学习“统计学统计学”课程前后对统计学重要性的认知程度是否发生了课程前

49、后对统计学重要性的认知程度是否发生了显著改变。显著改变。分析:分析:(1)统计学习前后,属于配对样本)统计学习前后,属于配对样本(2)认知程度属二值变量)认知程度属二值变量(3)可以采用两配对样本)可以采用两配对样本McNemar检验检验现在学习的是第68页,共80页2.利利用用“训训练练成成绩绩”数数据据,分分析析新新训训练练方方法法是是否否有有助于提高跳远运动员的成绩。助于提高跳远运动员的成绩。分析:分析:(1)新训练方法使用前后,属于配对样本)新训练方法使用前后,属于配对样本 (2)可可采采用用两两配配对对样样本本的的符符号号检检验验、两两配配对对样样本本Wilcoxon符号秩检验实现。

50、符号秩检验实现。现在学习的是第69页,共80页7.5多配对样本的非参数检验1.通过多组配对样本推断样本来自的多个总体的通过多组配对样本推断样本来自的多个总体的中中位数位数或或分布分布是否存在显著差异。是否存在显著差异。2.方法:方法:Friedman检验、检验、Cochran Q检验、检验、Kendall协同系数检验。协同系数检验。现在学习的是第70页,共80页7.5.1多配对样本的Friedman检验1.基本思想基本思想(1)原假设:多个配对样本来自的多个总体的分布无显著差异。)原假设:多个配对样本来自的多个总体的分布无显著差异。(2)原理)原理利用利用秩秩,通过类似,通过类似方差分析方差分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁