《非参数统计法.pps》由会员分享,可在线阅读,更多相关《非参数统计法.pps(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章第八章 非参数统计方法非参数统计方法nonparametric testnonparametric test温州医学院环境与公共卫生学院温州医学院环境与公共卫生学院 叶晓蕾叶晓蕾1一、基本一、基本概念概念(一)非参数统计(一)非参数统计(一)非参数统计(一)非参数统计 不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否
2、已知,不是参数间的比较,而是用于分布之间的比较。用于分布之间的比较。用于分布之间的比较。用于分布之间的比较。(二)参数统计(二)参数统计(二)参数统计(二)参数统计 依赖于总体分布形式,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较。律可循,是总体参数间的比较。律可循,是总体参数间的比较。律可循,是总体参数间的比较。2(三三三三)两类统计方法的优缺点:两类统计方法的优缺点:两类统计方法的优缺点:两类统计方法的优缺点:参数统计参数统计参数统计参数统计检验效率较高
3、,但使用条件较严格检验效率较高,但使用条件较严格检验效率较高,但使用条件较严格检验效率较高,但使用条件较严格.非参数统计非参数统计非参数统计非参数统计由于对资料无特殊要求,因此适用由于对资料无特殊要求,因此适用由于对资料无特殊要求,因此适用由于对资料无特殊要求,因此适用范围广,资料收集和分析比较简便。但统计效率范围广,资料收集和分析比较简便。但统计效率范围广,资料收集和分析比较简便。但统计效率范围广,资料收集和分析比较简便。但统计效率较低(较低(较低(较低(较大)较大)较大)较大)。n n选择:选择:选择:选择:首先考虑参数检验,当条件不符,才选择非参数首先考虑参数检验,当条件不符,才选择非参
4、数首先考虑参数检验,当条件不符,才选择非参数首先考虑参数检验,当条件不符,才选择非参数统计方法。统计方法。统计方法。统计方法。3(四四)非参数统计适用情况非参数统计适用情况(1 1)偏态分布资料;)偏态分布资料;)偏态分布资料;)偏态分布资料;(2 2)总体分布不明资料;)总体分布不明资料;)总体分布不明资料;)总体分布不明资料;(3 3)数据一端或两端有未确定值;)数据一端或两端有未确定值;)数据一端或两端有未确定值;)数据一端或两端有未确定值;(4 4)等级资料;)等级资料;)等级资料;)等级资料;(5 5)方差不齐资料。)方差不齐资料。)方差不齐资料。)方差不齐资料。4二、秩和检验(二、
5、秩和检验(rank sum testrank sum test)是非参数检验中效率较高,而且比较系统是非参数检验中效率较高,而且比较系统是非参数检验中效率较高,而且比较系统是非参数检验中效率较高,而且比较系统完整的一种。完整的一种。完整的一种。完整的一种。1.1.1.1.配对资料比较配对资料比较配对资料比较配对资料比较WWilcoxox signed rank test2.2.2.2.成组设计两样本比较成组设计两样本比较成组设计两样本比较成组设计两样本比较 Wilcoxon Mann-Whitney test3.3.3.3.多组资料比较多组资料比较多组资料比较多组资料比较4.4.4.4.多个样
6、本的两两比较多个样本的两两比较多个样本的两两比较多个样本的两两比较5(一)配对资料比较(一)配对资料比较(一)配对资料比较(一)配对资料比较符号秩和检验符号秩和检验符号秩和检验符号秩和检验为什么要用为什么要用为什么要用为什么要用非参数检验非参数检验非参数检验非参数检验?T T T T-=58 T+=58 T+=58 T+=58 T+-=8=8=8=8SPSS67基本步骤基本步骤基本步骤基本步骤:(1 1 1 1)建立检验假设)建立检验假设)建立检验假设)建立检验假设,确定检验水准确定检验水准确定检验水准确定检验水准:H H H H0 0 0 0:差值的总体中位数为差值的总体中位数为差值的总体中
7、位数为差值的总体中位数为0 0 0 0;即即即即M M M Md d d d=0=0=0=0 H H H H1 1 1 1:差值的总体中位数不为差值的总体中位数不为差值的总体中位数不为差值的总体中位数不为0 0 0 0。即。即。即。即M M M Md d d d0 =0.050 =0.050 =0.050 =0.05(2 2 2 2)求检验统计量求检验统计量求检验统计量求检验统计量T T T T:求差值求差值求差值求差值:编秩编秩编秩编秩:按差值的绝对值从小到大编秩。按差值的绝对值从小到大编秩。按差值的绝对值从小到大编秩。按差值的绝对值从小到大编秩。差值为差值为差值为差值为 0 0,舍去不记,
8、舍去不记,舍去不记,舍去不记,n n相应减少;相应减少;相应减少;相应减少;差值绝对值相同,取平均秩次。差值绝对值相同,取平均秩次。差值绝对值相同,取平均秩次。差值绝对值相同,取平均秩次。求秩和并确定检验统计量求秩和并确定检验统计量求秩和并确定检验统计量求秩和并确定检验统计量:T T+、T T-,两者均可作为两者均可作为两者均可作为两者均可作为检验统计量。检验统计量。检验统计量。检验统计量。(3 3 3 3)确定确定确定确定P,P,P,P,作出统计推断结论作出统计推断结论作出统计推断结论作出统计推断结论8结果判断结果判断结果判断结果判断:(1 1)查表法:)查表法:)查表法:)查表法:当当当当
9、n n n n25252525时时时时,查,查,查,查T T T T界值表界值表界值表界值表(符号秩和检验(符号秩和检验(符号秩和检验(符号秩和检验用)用)用)用),得:,得:,得:,得:T T T T0.05,110.05,110.05,110.05,11=10=10=10=1056565656,(,(,(,(T T T T0.01,110.01,110.01,110.01,11=5=5=5=561616161)若若若若T T T T+或或或或T T T T-:落在范围内,则落在范围内,则落在范围内,则落在范围内,则P0.05;P0.05;P0.05;P0.05;落在范围外落在范围外落在范围
10、外落在范围外,则则则则P0.05P0.05P0.05P25时时,可近似认为可近似认为T分布逼近正态分布。分布逼近正态分布。u 检验的公式为:检验的公式为:如果相同秩次较多,则需要进行校正,校正公式为:如果相同秩次较多,则需要进行校正,校正公式为:10Wilcoxon Signed Ranks Test11查表得查表得查表得查表得:T:T0.05,110.05,11=1056=1056,T T0.01,110.01,11=561=561 P 0.01 P 10,n2-n1 10)u检验公式为:检验公式为:相同秩次较多时,需要校正:相同秩次较多时,需要校正:正态近似法:正态近似法:正态近似法:正态
11、近似法:15例例例例11.1 11.1 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白值(患者和正常人若干名,并测得血铁蛋白值(患者和正常人若干名,并测得血铁蛋白值(患者和正常人若干名,并测得血铁蛋白值(ugug/L/L)如下表。如下表。如下表。如下表。因难以确定数据分布情况,故决定用秩和检验。因难以确定数据分布情况,故决定用秩和检验。因难以确定数据分布情况,故决定用秩和检验。因难以确定数据分布情况,故决定用秩和检验
12、。患者组:均数为患者组:均数为患者组:均数为患者组:均数为301301,标准差为,标准差为,标准差为,标准差为199199正常组:均数为正常组:均数为正常组:均数为正常组:均数为101101,标准差为,标准差为,标准差为,标准差为 8585(一一一一)原始数据两组比较原始数据两组比较原始数据两组比较原始数据两组比较:16T=183.5,n1=10,n2-n1=6,查表得:查表得:0.01P0.02SPSS1718(二二二二)等级资料或频数表资料两组比较等级资料或频数表资料两组比较等级资料或频数表资料两组比较等级资料或频数表资料两组比较问铅作业工人尿棕色素是否高于正常人?问铅作业工人尿棕色素是否
13、高于正常人?u=4.493,P 3 或或 ni 5,此时此时H分布近似分布近似服从自由度为服从自由度为 k-1的的X2分布。分布。(3)若相同秩次较多,需对)若相同秩次较多,需对H值校正:值校正:21例例 11.3 为研究为研究吸烟与吸烟与尿中硫尿中硫氰酸盐氰酸盐含量的含量的关系,关系,某医生某医生收集了收集了下述数下述数据,问据,问不同吸不同吸烟量者烟量者尿中的尿中的硫氰酸硫氰酸盐有无盐有无差别?差别?22 本例本例k=4,=4 1=3,X20.01(3)=11.34,H11.34,所以,所以 P 0.01。可认为可认为不同吸烟量者尿中的硫氰酸不同吸烟量者尿中的硫氰酸盐有差别。盐有差别。SP
14、SS23例例 某医师为研究早产、足月产及过期产者在产后一个月某医师为研究早产、足月产及过期产者在产后一个月内泌乳量的差别,收集了如下资料,问三种产妇乳量有内泌乳量的差别,收集了如下资料,问三种产妇乳量有无差别?无差别?24所以所以 P 0.01,按,按=0.05水准水准,拒绝拒绝H0,接受接受H1,可可认为三种产妇的乳量不全相同。认为三种产妇的乳量不全相同。考虑到相同秩次很多,需要进行校正考虑到相同秩次很多,需要进行校正(ti3-ti)=(1723-172)+(3423-342)+(4793-479)=154991382Hc=14.30/(1-154991382)/(9933-993)=17.0SPSS25