《第8章 非参数统计法.ppt》由会员分享,可在线阅读,更多相关《第8章 非参数统计法.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章第八章 非参数统计方法非参数统计方法nonparametric testnonparametric test温州医学院环境与公共卫生学院温州医学院环境与公共卫生学院 叶晓蕾叶晓蕾1Yes变量类型变量类型变量类型变量类型定量变量定量变量等级变量等级变量无无序序分分类类变变量量正态分布正态分布?单样本资料单样本资料两组比较两组比较多组比较多组比较单单样样本本t检检验验方差齐方差齐?t检验检验方差分析方差分析成组成组t检验检验配对配对t检验检验单因素方差分析单因素方差分析两因素方差分析两因素方差分析YesYesnono非参数统计法非参数统计法(秩和检验秩和检验)析因方差分析,析因方差分析,等等
2、2一、基本一、基本概念概念(一)非参数统计(一)非参数统计(一)非参数统计(一)非参数统计 不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否已知,不是参数间的比较,而是用于分布之间的比较。用于分布之间的比较。用于分布之间的比较。用于分布之间的比较。(二)参数统计(二)参数统计(二)参数统计(二)参数统计 依赖于总体分布形式
3、,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较。律可循,是总体参数间的比较。律可循,是总体参数间的比较。律可循,是总体参数间的比较。3(三三三三)两类统计方法的优缺点:两类统计方法的优缺点:两类统计方法的优缺点:两类统计方法的优缺点:参数统计参数统计参数统计参数统计检验效率较高,但使用条件较严格。检验效率较高,但使用条件较严格。检验效率较高,但使用条件较严格。检验效率较高,但使用条件较严格。非参数统计非参数统计非参数统计非参数统计由于对资料无特殊要求,因此适
4、用由于对资料无特殊要求,因此适用由于对资料无特殊要求,因此适用由于对资料无特殊要求,因此适用范围广,资料收集和分析比较简便。但统计效率范围广,资料收集和分析比较简便。但统计效率范围广,资料收集和分析比较简便。但统计效率范围广,资料收集和分析比较简便。但统计效率较低(较低(较低(较低(较大)较大)较大)较大)。n n选择:选择:选择:选择:首先考虑参数检验,当条件不符,才选择非参数首先考虑参数检验,当条件不符,才选择非参数首先考虑参数检验,当条件不符,才选择非参数首先考虑参数检验,当条件不符,才选择非参数统计方法。统计方法。统计方法。统计方法。4(四四)非参数统计适用情况非参数统计适用情况(1
5、1)偏态分布资料)偏态分布资料)偏态分布资料)偏态分布资料 (2 2)总体分布不明资料)总体分布不明资料)总体分布不明资料)总体分布不明资料 (3 3)方差不齐资料)方差不齐资料)方差不齐资料)方差不齐资料(4 4)数据一端或两端有未确定值)数据一端或两端有未确定值)数据一端或两端有未确定值)数据一端或两端有未确定值 (5 5)等级资料)等级资料)等级资料)等级资料 定量变量定量变量 5二、秩和检验(二、秩和检验(rank sum testrank sum test)是非参数检验中效率较高,而且比较系统是非参数检验中效率较高,而且比较系统是非参数检验中效率较高,而且比较系统是非参数检验中效率较
6、高,而且比较系统完整的一种。完整的一种。完整的一种。完整的一种。两组资料比较两组资料比较两组资料比较两组资料比较 配对设计配对设计配对设计配对设计WWilcoxox signed rank test 成组设计成组设计成组设计成组设计Wilcoxon Mann-Whitney test多组资料比较多组资料比较多组资料比较多组资料比较 完全随机设计完全随机设计完全随机设计完全随机设计Kruskal-Wallis H test 随机区组设计随机区组设计随机区组设计随机区组设计Friedman M test 6(一)配对资料比较(一)配对资料比较(一)配对资料比较(一)配对资料比较符号秩和检验符号秩和
7、检验符号秩和检验符号秩和检验为什么要用为什么要用为什么要用为什么要用非参数检验非参数检验非参数检验非参数检验?T T T T-=58 T=58 T=58 T=58 T+=8=8=8=8SPSS78基本步骤基本步骤基本步骤基本步骤:(1 1 1 1)建立检验假设)建立检验假设)建立检验假设)建立检验假设,确定检验水准确定检验水准确定检验水准确定检验水准:H H H H0 0 0 0:差值的总体中位数为差值的总体中位数为差值的总体中位数为差值的总体中位数为0 0 0 0;即即即即M M M Md d d d=0=0=0=0 H H H H1 1 1 1:差值的总体中位数不为差值的总体中位数不为差值
8、的总体中位数不为差值的总体中位数不为0 0 0 0。即。即。即。即M M M Md d d d0 =0.050 =0.050 =0.050 =0.05(2 2 2 2)求检验统计量求检验统计量求检验统计量求检验统计量T T T T:求差值求差值求差值求差值:编秩编秩编秩编秩:按差值的绝对值从小到大编秩。按差值的绝对值从小到大编秩。按差值的绝对值从小到大编秩。按差值的绝对值从小到大编秩。差值为差值为差值为差值为 0 0,舍去不记,舍去不记,舍去不记,舍去不记,n n相应减少;相应减少;相应减少;相应减少;差值绝对值相同,取平均秩次。差值绝对值相同,取平均秩次。差值绝对值相同,取平均秩次。差值绝对
9、值相同,取平均秩次。求秩和并确定检验统计量求秩和并确定检验统计量求秩和并确定检验统计量求秩和并确定检验统计量:T T+、T T-,两者均可作为两者均可作为两者均可作为两者均可作为检验统计量。检验统计量。检验统计量。检验统计量。(3 3 3 3)确定确定确定确定P,P,P,P,作出统计推断结论作出统计推断结论作出统计推断结论作出统计推断结论9结果判断结果判断结果判断结果判断:(1 1)查表法:)查表法:)查表法:)查表法:当当当当n n n n50505050时时时时,查,查,查,查T T T T界值表界值表界值表界值表(符号秩和检验(符号秩和检验(符号秩和检验(符号秩和检验用)(用)(用)(用
10、)(P.716P.716P.716P.716),得:,得:,得:,得:T T T T0.05,110.05,110.05,110.05,11=10=10=10=1056565656,(,(,(,(T T T T0.01,110.01,110.01,110.01,11=5=5=5=561616161)若若若若T T T T+或或或或T T T T-:落在范围内,则落在范围内,则落在范围内,则落在范围内,则P0.05;P0.05;P0.05;P0.05;落在范围外落在范围外落在范围外落在范围外,则则则则P0.05P0.05P0.05P50时时,可近似认为可近似认为T分布逼近正态分布。分布逼近正态分
11、布。u 检验的公式为:检验的公式为:如果相同秩次较多,则需要进行校正,校正公式为:如果相同秩次较多,则需要进行校正,校正公式为:11Wilcoxon Signed Ranks Test12查表得查表得查表得查表得:T:T0.05,110.05,11=1056=1056,T T0.01,110.01,11=561=561 P 0.01 P 10,n2-n1 10)u检验公式为:检验公式为:相同秩次较多时,需要校正:相同秩次较多时,需要校正:正态近似法:正态近似法:正态近似法:正态近似法:15例例例例 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺
12、炎患某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白值(者和正常人若干名,并测得血铁蛋白值(者和正常人若干名,并测得血铁蛋白值(者和正常人若干名,并测得血铁蛋白值(ugug/L/L)如下表。如下表。如下表。如下表。因难以确定数据分布情况,故决定用秩和检验。因难以确定数据分布情况,故决定用秩和检验。因难以确定数据分布情况,故决定用秩和检验。因难以确定数据分布情况,故决定用秩和检验。患者组:均数为患者组:均数为患者组:均数为患者组:均数为301301,标准差为,标准差为,标准差为,标准差为199199正常组:均数为
13、正常组:均数为正常组:均数为正常组:均数为101101,标准差为,标准差为,标准差为,标准差为 8585(一一一一)原始数据两组比较原始数据两组比较原始数据两组比较原始数据两组比较:16T=183.5,n1=10,n2-n1=6,查表得:查表得:0.01P0.02SPSS1718(二二二二)等级资料或频数表资料两组比较等级资料或频数表资料两组比较等级资料或频数表资料两组比较等级资料或频数表资料两组比较问铅作业工人尿棕色素是否高于正常人?问铅作业工人尿棕色素是否高于正常人?u=4.493,P 3 或或 ni 5,此时此时H分布近似分布近似服从自由度为服从自由度为 k-1的的X2分布。分布。(3)
14、若相同秩次较多,需对)若相同秩次较多,需对H值校正:值校正:21例例 11.3 为研究为研究吸烟与吸烟与尿中硫尿中硫氰酸盐氰酸盐含量的含量的关系,关系,某医生某医生收集了收集了下述数下述数据,问据,问不同吸不同吸烟量者烟量者尿中的尿中的硫氰酸硫氰酸盐有无盐有无差别?差别?(一)原始资料多组比较(一)原始资料多组比较(一)原始资料多组比较(一)原始资料多组比较22 本例本例k=4,=4 1=3,X20.01(3)=11.34,H11.34,所以,所以 P 0.01。可认为可认为不同吸烟量者尿中的硫氰酸不同吸烟量者尿中的硫氰酸盐有差别。盐有差别。SPSS23例例 某医师为研究早产、足月产及过期产者
15、在产后一个月某医师为研究早产、足月产及过期产者在产后一个月内泌乳量的差别,收集了如下资料,问三种产妇乳量有内泌乳量的差别,收集了如下资料,问三种产妇乳量有无差别?无差别?(二)等级资料或频数表资料的多组比较(二)等级资料或频数表资料的多组比较(二)等级资料或频数表资料的多组比较(二)等级资料或频数表资料的多组比较SPSS24五五.随机区组设计多组资料比较随机区组设计多组资料比较 Friedman M test 例例 欲用学生的综合评分来评价四种教学方式的不同,欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机按照年龄、性别、年级、社会经济地位、学习动机相同
16、和智力水平、学习情况相近作为配伍条件,将相同和智力水平、学习情况相近作为配伍条件,将4 4名学生分为一组,共名学生分为一组,共8 8组,每区组的组,每区组的4 4名学生随机分名学生随机分到四种不同的教学实验组,经过相同的一段时间后,到四种不同的教学实验组,经过相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对测得学习成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?学生学习成绩的综合评分影响有无不同?25H0:四种教学方法学生综合评分的总体分布相同:四种教学方法学生综合评分的总体分布相同H1:四种教学方法学生综合评分的总体分布不同或不全相同四种教学方法学生综合评分的总体分布不同或不全相同 =0.05SPSS2627