第7章SPSS200非参数检验.ppt

上传人:石*** 文档编号:50889443 上传时间:2022-10-16 格式:PPT 页数:63 大小:6.42MB
返回 下载 相关 举报
第7章SPSS200非参数检验.ppt_第1页
第1页 / 共63页
第7章SPSS200非参数检验.ppt_第2页
第2页 / 共63页
点击查看更多>>
资源描述

《第7章SPSS200非参数检验.ppt》由会员分享,可在线阅读,更多相关《第7章SPSS200非参数检验.ppt(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第7章SPSS200非参数检验现在学习的是第1页,共63页本章内容n7.1 单样本的非参数检验n7.2 两独立样本的非参数检验n7.3 多独立样本的非参数检验n7.4 两配对样本的非参数检验n7.5 多配对样本的非参数检验现在学习的是第2页,共63页非参数检验n非参数检验:(1)在总体分布未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。(2)推断过程中不涉及有关总体分布的参数。现在学习的是第3页,共63页7.1 单样本的非参数检验1.目的:样本来自总体的分布是否与某个已知的分布相吻合?绘制样本数据的直方图、pp图、QQ图判断粗略通过非参数检验精确2.单样本非参数检验(1)对

2、单个总体的分布形态等进行推断(2)方法:卡方检验、二项分布检验、K-S检验、变量值随机性检验等。现在学习的是第4页,共63页7.1.1总体分布的卡方检验n1.基本思想-吻合性检验 (1)原假设:样本来自的总体分布与期望分布无显著差异。变量值落入第i个子集中的理论概率为 ,相应的期望频率为 现在学习的是第5页,共63页n2.实现步骤 分析-非参数检验-旧对话框-卡方检验现在学习的是第6页,共63页(1)选定待检验的变量到“检验变量列表”框(2)在“期望全距”栏中确定参与分析的观测值的范围:从数据中获取:所有观测数据都参与分析 使用指定的范围:只在该取值范围内的观测数据才参与分析。(3)期望值:给

3、出各理论值 所有类别相等:所有子集的频数都相同 值:依次输入值,通过【添加】、【更改】、【删除】进行增加、修改和删除。现在学习的是第7页,共63页3.应用案例n医学研究表明心脏病人猝死人数与日期的关系为:一周内,星期一猝死者较多,其他日子基本相当,各天的比例近似为:2.8:1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布是否与理论分布相吻合。分析:利用总体分布卡方检验实现。现在学习的是第8页,共63页7.1.2二项分布检验n1.基本思想(1)通过样本数据检验样本来自的总体是否服从指定概率p的二项分布。(2)小样本-精确检验大样本-近似检验现在学习的是第9页,共63页2.实现步骤 分

4、析-非参数检验-旧对话框-二项式现在学习的是第10页,共63页(1)选定待检验的变量到“检验变量列表”框(2)定义二分法:指定如何分类 从数据中获取:检验变量为二值变量 割点:输入具体数值,大于等于该值的为第一组,大于该组的为第二组(3)检验比例:输入二项分布的检验概率值现在学习的是第11页,共63页3.应用案例n利用“产品合格率”数据,推断该批产品的一级品率是否为90%n分析:产品合格与否属于二值变量,可以通过二项分布检验实现。现在学习的是第12页,共63页7.1.3单样本K-S检验n1.基本思想(1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名(2)利用样本数据推断样本来自的总体是否服从某一理

5、论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。(3)步骤计算各样本观测值在理论分布中出现的理论累计概率值F(x)计算各样本观测值的实际累计概率值S(x)计算理论累计概率值与实际累计概率值的差D(x)计算差值序列中最大绝对差值D现在学习的是第13页,共63页(4)原假设成立时:小样本下:Dkolmogorov分布大样本下:近似服从K(x)分布SPSS仅给出大样本下的 和对应的p值(5)决策D统计量的p值显著性水平,不拒绝原假设,样本来自的总体与指定分布无显著差异现在学习的是第14页,共63页2.实现步骤 分析-非参数检验-旧对话框-1单样本 K-S现在学习的是第15页,共63

6、页(1)选定待检验的变量到“检验变量列表”框(2)检验分布:选择理论分布 常规:正态分布 相等:均匀分布 泊松:泊松分布 指数分布:指数分布现在学习的是第16页,共63页3.应用案例n利用“儿童身高”数据分析周岁儿童身高总体是否服从正态分布。n分析:可以通过单样本K-S检验实现。现在学习的是第17页,共63页7.1.4 变量值随机性检验n1.基本思想(1)通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。(2)原假设:总体变量值出现是随机的。检验依据:游程-样本序列中连续出现相同的变量值的次数。游程数太大或太小都表明变量值存在不随机的现象现在学习的是第18页,共63页(3)检验统

7、计量(4)决策:Z统计量的p值显著性水平,不拒绝原假设,变量值的出现是随机的。现在学习的是第19页,共63页2.实现步骤 分析-非参数检验-旧对话框-游程现在学习的是第20页,共63页(1)选定待检验的变量到“检验变量列表”框(2)割点:计算游程数的分界值 中位数:样本中位数为分界值 众数:样本众数为分界值 均值:样本均值为分界值 设定:以用户输入的值为分界值,SPSS将小于该分界值的所有变量作为一组,大于或等于该分界值的所有变量作为一组,计算游程。现在学习的是第21页,共63页3.应用案例n利用“电缆数据”推断耐压设备的工作是否正常。n分析:若耐压数据的变动是随机的-则设备工作正常若耐压数据

8、的变动不是随机的-则设备工作存在不正常可以通过变量值随机性检验实现。现在学习的是第22页,共63页7.2两独立样本的非参数检验(1)独立样本:在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。(2)推断样本来自的两个总体的分布等是否存在显著差异。(3)方法:曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。现在学习的是第23页,共63页7.2.1两独立样本的曼-惠特尼U检验n1.基本思想(1)原假设:两组独立样本来自的两总体分布无显著差异。(2)通过两组样本平均秩的研究实现推断 秩-变量值排序的名次,变量值有几个,对应的秩便有几个。(3)检验步骤 将两组样本

9、混合并升序排列,得每个数据的秩 分别对样本X和Y的秩求平均,得平均秩 和 计算样本X优于样本Y秩的个数 和样本Y优于样本X秩的个数 依据 和 计算WilcoxonW统计量和曼-惠特尼U统计量。现在学习的是第24页,共63页nWilcoxonW统计量:n曼-惠特尼统计量U为:n大样本下,U近似服从正态分布现在学习的是第25页,共63页现在学习的是第26页,共63页7.2.2两独立样本的K-S检验1.基本思想(1)原假设:两组独立样本来自的两总体的分布无显著差异。(2)与单样本K-S检验的基本思路大体一致,差别在于:以变量值的秩为分析对象,而非变量值本身。(3)检验步骤将两组样本混合并按升序排列分

10、别计算两组样本秩的累计频数和累计频率计算两组累计频率的差,得秩的差值序列及D统计量SPSS计算大样本下的 和对应的p值(3)决策:拒绝原假设,两总体的分布有显著差异 :不拒绝原假设,两总体的分布无显著差异 现在学习的是第27页,共63页现在学习的是第28页,共63页7.2.3两独立样本的游程检验n1.基本思想(1)原假设:两组独立样本来自的两总体的分布无显著差异。(2)检验步骤将两组样本混合并按升序排列,组标记值也随之重新排列计算组标记值序列的游程数根据游程数计算Z统计量,Z统计量近似服从正态分布(3)决策:拒绝原假设,两总体的分布有显著差异 :不拒绝原假设,两总体的分布无显著差异现在学习的是

11、第29页,共63页7.2.4极端反应检验n1.基本思想(1)原假设:两独立样本来自的两个总体的分布无显著差异。(2)一组样本为控制样本,一组样本为实验样本,看实验样本相对于控制样本是否出现了极端反应。(3)检验步骤两组样本混合按升序排列求控制样本的最小秩 和最大秩 计算跨度 为了消除样本数据中的极端值,计算跨度前可按比例(通常5%)去除控制样本中靠近两端的样本值,再求跨度,得截头跨度针对跨度或截头跨度计算H统计量:现在学习的是第30页,共63页小样本下,小样本下,H服从服从Hollander分布分布,大样本下,大样本下,H近似服从正态分布近似服从正态分布(4)决策:)决策:H统计量的统计量的p

12、值值显著性水平,不拒绝原假设,两独立样本来自的总显著性水平,不拒绝原假设,两独立样本来自的总体分布不存在显著差异体分布不存在显著差异现在学习的是第31页,共63页7.2.5两独立样本非参数检验的步骤n分析-非参数检验-旧对话框-2 独立样本(1)选择待检验的变量到“检验变量列表”框(2)分组变量:存放组标志的变量,并通过“定义组”给出两组的标志值。(3)检验类型:选择相应的检验方法现在学习的是第32页,共63页现在学习的是第33页,共63页7.2.6应用案例n利用“使用寿命”数据,判断两种工艺下产品的使用寿命的分布是否存在显著差异,进而对两个工艺的优劣进行判断。n分析:两个工艺产品的使用寿命可

13、看作两独立样本,可以通过曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验实现。现在学习的是第34页,共63页7.3多独立样本的非参数检验1.通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。2.方法:中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。现在学习的是第35页,共63页7.3.1中位数检验n1.基本思想(1)原假设:多个独立样本来自的多个总体的中位数无显著差异。(2)检验步骤将多组样本混合升序排列,求混合样本的中位数分别计算各组样本中大于和小于中位数的样本个数,形成列联表(p230 表7-13)利用卡方检

14、验分析各组样本来自的总体对中位数的分布是否一致。现在学习的是第36页,共63页(3)决策卡方统计量的p值显著性水平,不拒绝原假设,多个独立样本来自的总体的中位数不存在显著差异。现在学习的是第37页,共63页7.3.2多独立样本的Kruskal-Wallis检验n1.基本思想(1)原假设:多个独立样本来自的多个总体的分布无显著差异。(2)是两独立样本曼-惠特尼U检验的推广(3)检验步骤将多组样本数据混合并升序排列,求各变量的秩考察各组秩的均值是否有显著差异各组秩的差异借助方差分析:秩的变差分解为:组间差和组内差 a若秩的总变差大部分可由组间差解释,则各样本组的总体分布存在显著差异 b若秩的总变差

15、大部分不能由组间差解释,则各样本组的总体分布无显著差异现在学习的是第38页,共63页n构造K-W统计量n(4)决策:SPSS自动计算K-W统计量和对应的p值 p值显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。现在学习的是第39页,共63页7.3.3多独立样本的Jonckheere-Terpstra检验n1.基本思想(1)原假设:多个独立样本来自的多个总体的分布无显著差异(2)J-T统计量现在学习的是第40页,共63页(3)决策:SPSS自动计算J-T统计量,Z统计量和对应的p值 p值显著性水平,不拒绝原假设,多个独立样本来自的多个总体分布无显著差异。现在学习的是第41页,

16、共63页7.3.4多独立样本非参数检验的步骤1.按规定的格式组织数据:设置两个变量分别存放样本值和组标记值2.菜单:分析-非参数-旧对话框-K独立样本(1)选择待检验的变量到“检验变量列表”框(2)分组变量:存放组标志的变量,并通过“定义组”给出标志值的取值范围。(3)检验类型:选择相应的检验方法现在学习的是第42页,共63页现在学习的是第43页,共63页7.3.5 应用案例n利用“多城市儿童身高”数据,对北京、上海、成都、广州四城市的周岁儿童身高进行比较分析,推断四城市周岁儿童身高是否存在显著差异。n分析:(1)对身高分布无确切把握,涉及多个独立样本采采用多独立样非参数检验(2)分别用中位数

17、检验、多独立样本的Kruskal-Wallis检验、多独立样本的Jonckheere-Terpstra检验实现。现在学习的是第44页,共63页7.4两配对样本的非参数检验n1.通过两配对样本推断样本来自的两个总体的分布是否存在显著差异。n2.方 法:McNemar检 验、符 号 检 验、Wilcoxon符号秩检验。现在学习的是第45页,共63页7.4.1两配对样本的McNemar检验n1.基本思想(1)McNemar检验是一种变化显著性检验,将研究对象自身作为对照者检验其“前后”的变化是否显著。(2)原假设:两配对样本来自的两总体的分布无显著差异。(3)分析的变量是二值变量,若不是二值变量,应

18、现将数据转换后再使用。导致该方法的应用范围具有局限性。(4)McNemar检验采用二项分布检验方法,小样本下计算二项分布的累计精确概率,大样本下采用修正的Z统计量。(5)SPSS自动计算Z统计量和对应的p值 p值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异现在学习的是第46页,共63页7.4.2两配对样本的符号检验n1.基本思想(1)原假设:两配对样本来自的两总体的分布无显著差异。(2)利用正负符号的个数实现检验。(3)检验步骤分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为+,差值为负记为-将+的个数与-的个数进行比较:采用二项分布检验法,对正负符号变量进行单

19、样本二项分布检验。小样本下计算二项分布的累计精确概率,大样本下采用修正的Z统计量(4)SPSS自动计算Z统计量和对应的p值 p值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异(4)缺陷:两配对样本的符号检验注重对变化方向的分析,只考虑了数据变化的性质,没有考虑变化的幅度,对数据的利用不够充分。现在学习的是第47页,共63页7.4.3两配对样本Wilcoxon符号秩检验n1.基本思想(1)原假设:两配对样本来自的两总体的分布无显著差异。(2)检验步骤分别用第二组样本的各观察值减第一组对应样本观察值,差值为正记为+,差值为负记为-,并保持差值数据将差值变量按升序排列,并求差值变量的

20、秩分别计算正号秩总和 负号秩总和 统计量现在学习的是第48页,共63页(3)决策:SPSS自动计算Z统计量和对应的p值 p值显著性水平,不拒绝原假设,两配对样本来自的两总体分布无显著差异现在学习的是第49页,共63页7.4.4两配对样本非参数检验的步骤1.按规定的格式组织数据:设置两个变量分别存放两组样本的样本值2.菜单:分析-非参数检验-2相关样本(1)选择待检验的两个配对变量到“检验对”框中(2)检验类型:选择相应的检验方法现在学习的是第50页,共63页现在学习的是第51页,共63页7.4.5应用案例1.利用“统计学习”数据,分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生

21、了显著改变。分析:(1)统计学习前后,属于配对样本(2)认知程度属二值变量(3)可以采用两配对样本McNemar检验现在学习的是第52页,共63页n2.利用“训练成绩”数据,分析新训练方法是否有助于提高跳远运动员的成绩。n分析:(1)新训练方法使用前后,属于配对样本 (2)可采用两配对样本的符号检验、两配对样本Wilcoxon符号秩检验实现。现在学习的是第53页,共63页7.5多配对样本的非参数检验n1.通过多组配对样本推断样本来自的多个总体的中位数或分布是否存在显著差异。n2.方法:Friedman检验、Cochran Q检验、Kendall协同系数检验。现在学习的是第54页,共63页7.5

22、.1多配对样本的Friedman检验n1.基本思想(1)原假设:多个配对样本来自的多个总体的分布无显著差异。(2)原理利用秩,通过类似方差分析的方法实现检验若不同样本下的秩不存在显著差异,则秩的组间差在秩的总平均变差中占较小的比例。(3)检验步骤以行为单位将数据升序排列,并求各变量在各自行中的秩分别计算各组样本下的秩总和和平均秩现在学习的是第55页,共63页计算Frideman检验统计量Frideman检验统计量与多独立样本的Kruskal-Wallis检验中的K-W统计量相似,区别在于:K-W统计量中的秩是全体数据排序后得到的,Frideman检验统计量的秩是在各区组内分别独立排序得到的。现

23、在学习的是第56页,共63页(4)决策:SPSS自动计算Frideman统计量和对应的p值 p值显著性水平,不拒绝原假设,多配对样本来自的多个总体分布无显著差异(5)适用于定距型数据现在学习的是第57页,共63页7.5.2多配对样本Cochran Q检验n1.基本思想(1)原假设:多个配对样本来自的多个总体的分布无显著差异(2)适用于对二值品质型数据进行检验。(3)Cochran Q检验统计量现在学习的是第58页,共63页(4)SPSS自动计算Cochran Q统计量和对应的p值 p值显著性水平,不拒绝原假设,多配对样本来自的多个总体分布无显著差异现在学习的是第59页,共63页7.5.3多配对

24、样本Kendall协同系数检验n1.基本思想(1)该方法与Frideman检验相结合,可实现对评判者评判标准是否一致进行分析。(2)原假设:评判者的评判标准不一致。(3)通过协同系数W对评分的一致性进行分析现在学习的是第60页,共63页(4)决策:)决策:SPSS自动计算协同系数自动计算协同系数W和对应的和对应的p值值 p值值显著性水平,不拒绝原假设,评判者的评判标准不一致显著性水平,不拒绝原假设,评判者的评判标准不一致现在学习的是第61页,共63页7.5.4多配对样本非参数检验步骤1.按规定的格式组织数据:有多少组样本就设置多少个变量分别存放各组样本的样本值2.菜单:分析-非参数检验-旧对话框-K个相关样本(1)选择待检验的若干配对变量到“检验变量”框(2)检验类型:选择相应的检验方法现在学习的是第62页,共63页现在学习的是第63页,共63页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁