《非参数检验 (2)2精选文档.ppt》由会员分享,可在线阅读,更多相关《非参数检验 (2)2精选文档.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、非参数检验非参数检验本讲稿第一页,共五十四页应用假设检验的注意点应用假设检验的注意点1.不同的资料应选用不同检验方法,即基于不同的检不同的资料应选用不同检验方法,即基于不同的检验统计量的抽样分布验统计量的抽样分布2.结论不能绝对化结论不能绝对化 记住无论接受哪种假设,都有可能存在错误记住无论接受哪种假设,都有可能存在错误本讲稿第二页,共五十四页两类错误及记号两类错误及记号 假设检验是根据样本的信息并依据小概率原理,假设检验是根据样本的信息并依据小概率原理,作出接受还是拒绝作出接受还是拒绝H0的判断。由于样本具有随机性,的判断。由于样本具有随机性,因而假设检验所作出的结论有可能是错误的因而假设检
2、验所作出的结论有可能是错误的.这种错误这种错误有两类有两类:(1)当原假设当原假设H0为真为真,观察值却落入拒绝域观察值却落入拒绝域,而作而作出了拒绝出了拒绝H0的判断的判断,称做称做第一类错误第一类错误,又叫又叫弃真错误弃真错误.犯第一类错误的概率是显著性水平犯第一类错误的概率是显著性水平本讲稿第三页,共五十四页(2)当原假设当原假设H0不真不真,而观察值却落入接受域而观察值却落入接受域,而作而作出了接受出了接受H0的判断的判断,称做称做第二类错误第二类错误,又叫又叫取伪错误取伪错误.当样本容量当样本容量 n n 一定时一定时,若减少犯第一类错误的若减少犯第一类错误的概率概率,则犯第二类错误
3、的概率往往增大则犯第二类错误的概率往往增大.犯第二类错误的概率记为犯第二类错误的概率记为 若要使犯两类错误的概率都减小若要使犯两类错误的概率都减小,除非增加样本除非增加样本容量容量.本讲稿第四页,共五十四页平均数差异检验小结平均数差异检验小结总体分布样本情况总体参数统计假设检验统计量拒绝阈正态独立样本独立样本独立样本成对数据(相关样本)非正态独立大样本成对大样本小样本可用非参数检验的方法本讲稿第五页,共五十四页第九讲:非参数检验第九讲:非参数检验李庆功李庆功本讲稿第六页,共五十四页主要内容主要内容非参数检验的基本概念非参数检验的基本概念1 1非参数检验的具体方法非参数检验的具体方法2 2统计软
4、件的应用统计软件的应用3 3作业和上机练习作业和上机练习4 4本讲稿第七页,共五十四页参数检验和非参数检验参数检验和非参数检验n参数检验:参数检验:许多统计推断方法,要求来自总体分布许多统计推断方法,要求来自总体分布类型是已知的,在这种假设基础上,对总体进行统类型是已知的,在这种假设基础上,对总体进行统计检验,称为参数检验。计检验,称为参数检验。参数检验所检验的是总体参数检验所检验的是总体的参数的参数n非参数检验:非参数检验:不依赖于总体分布类型,也不对总体不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法称为非参数检参数进行统计推断的假设检验的方法称为非参数检验。验。非参数检验
5、所检验的是总体的分布非参数检验所检验的是总体的分布本讲稿第八页,共五十四页非参数统计方法适用情况非参数统计方法适用情况n未知抽样分布的类型,或样本数太少未知抽样分布的类型,或样本数太少而使得抽样分而使得抽样分布状况尚未显示出来布状况尚未显示出来n数据类型:顺序数据或类别数据数据类型:顺序数据或类别数据n总体分布极度偏态总体分布极度偏态n组内个别随机变量偏离过大,存在异常值组内个别随机变量偏离过大,存在异常值本讲稿第九页,共五十四页非参数检验的优点和缺点:非参数检验的优点和缺点:n优点:优点:1.不受总体分布的限制,适用范围广。不受总体分布的限制,适用范围广。2.适宜定量模糊的变量和等级变量。适
6、宜定量模糊的变量和等级变量。3.方法简便易学。方法简便易学。n缺点:缺点:非参数统计检验方法对数据的限制较为宽松,只能从中非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信提取一般的信息,相对参数统计检验方法会浪费一些信息。息。当测量的数据能够满足参数统计的所有假设时,当测量的数据能够满足参数统计的所有假设时,尽量使用参数检验尽量使用参数检验本讲稿第十页,共五十四页主要内容主要内容非参数检验的基本概念非参数检验的基本概念1 1非参数检验的具体方法非参数检验的具体方法2 2统计软件的应用统计软件的应用3 3作业和上机练习作业和上机练习4 4本讲稿第十
7、一页,共五十四页非参数检验的具体方法非参数检验的具体方法n选择非参数检验的方法时,考虑选择非参数检验的方法时,考虑2个因素个因素样本情况:独立样本或相关样本?样本情况:独立样本或相关样本?数据类型:顺序数据或类别数据?数据类型:顺序数据或类别数据?样本情况样本情况数据类型数据类型具体方法具体方法独立样本独立样本顺序数据顺序数据Mann-Whitney(也称秩和)检验(也称秩和)检验独立样本独立样本类别数据类别数据2 检验检验相关样本相关样本顺序数据顺序数据Wilcoxon Wilcoxon(也称符号秩次)检验(也称符号秩次)检验相关样本相关样本类别数据类别数据McNemar检验检验本讲稿第十二
8、页,共五十四页独立样本独立样本-顺序数据:顺序数据:Mann-Whitney检验检验1、将两个样本数据混合、将两个样本数据混合由小到大由小到大排列秩次(如果大小相同就计算它们排列秩次(如果大小相同就计算它们的平均秩次);的平均秩次);2、把样本容量较小的样本中各数据的秩次相加,以、把样本容量较小的样本中各数据的秩次相加,以T表示;表示;3、建立假设、建立假设 H0:A总体与总体与B总体相同;总体相同;H1:A总体与总体与B总体不同总体不同4、检验、检验 把把T值与秩和检验表中的临界值比较(值与秩和检验表中的临界值比较(T1下限,下限,T2上限)上限)T T1 或或 T T2,则表明两样本差异显
9、著;,则表明两样本差异显著;T1 T T2,则意味着两样本差异不显著。则意味着两样本差异不显著。本讲稿第十三页,共五十四页秩和检验表秩和检验表本讲稿第十四页,共五十四页例子:哪个班成绩好?例子:哪个班成绩好?班级班级实验班实验班 n1=5普通班普通班 n2=7分数分数928588769075859690688785秩秩115839.525129.5175计算秩和(实验班):计算秩和(实验班):T=11+5+8+3+9.5=36.5T=11+5+8+3+9.5=36.5假设:假设:H H0 0:实验班与普通班相同;:实验班与普通班相同;H H1 1:实验班与普通班不同:实验班与普通班不同查表:查
10、表:n1=5,n2=7,n1=5,n2=7,=0.05,=0.05,可知两个临界值:可知两个临界值:T1=22T1=22,T2=43 T2=43 检验:检验:T1 T T2T1 T 3.84,所以拒绝,所以拒绝H0,接受,接受H1。即在统计学。即在统计学意义上不同年级喜欢上外语课的比率不同意义上不同年级喜欢上外语课的比率不同 本讲稿第二十二页,共五十四页非参数检验的具体方法非参数检验的具体方法n选择非参数检验的方法时,考虑选择非参数检验的方法时,考虑2个因素个因素样本情况:独立样本或相关样本?样本情况:独立样本或相关样本?数据类型:顺序数据或类别数据?数据类型:顺序数据或类别数据?样本情况样本
11、情况数据类型数据类型具体方法具体方法独立样本独立样本顺序数据顺序数据Mann-Whitney(也称秩和)检验(也称秩和)检验独立样本独立样本类别数据类别数据2 检验检验相关样本相关样本顺序数据顺序数据Wilcoxon Wilcoxon(也称符号秩次)检验(也称符号秩次)检验相关样本相关样本类别数据类别数据McNemar检验检验本讲稿第二十三页,共五十四页1.把相关样本每个成对数据之差值按绝对值从小到大作等级排列把相关样本每个成对数据之差值按绝对值从小到大作等级排列(注意差值为零时,零不参加等级排列);(注意差值为零时,零不参加等级排列);如果差值相同,则就取如果差值相同,则就取它们的平均秩次;
12、它们的平均秩次;2.在各等级前面添上原来的正负号;在各等级前面添上原来的正负号;3.分别求出带正号的等级和(分别求出带正号的等级和(T+)与带负号的等级和()与带负号的等级和(T-),取两),取两者之中较小的记作者之中较小的记作T;4.建立假设:建立假设:H0:A和和B分布相同分布相同 H1:A和和B分布不同分布不同5.根据根据N,T查成对秩和检验表查成对秩和检验表相关样本相关样本-顺序数据:顺序数据:Wilcoxon检验检验本讲稿第二十四页,共五十四页成对数据秩和检验表成对数据秩和检验表对子数对子数较小的秩号之和较小的秩号之和对子数对子数较小的秩号之和较小的秩号之和(n)=0.05=0.01
13、(n)=0.05=0.01601630207217352384018402896219463210832052381111521594312147226649131710237355142113248161152516258968本讲稿第二十五页,共五十四页1.把相关样本每个成对数据之差值按绝对值从小到大作等级排列把相关样本每个成对数据之差值按绝对值从小到大作等级排列(注意差值为零时,零不参加等级排列);(注意差值为零时,零不参加等级排列);如果差值相同,则如果差值相同,则就取它们的平均秩次;就取它们的平均秩次;2.在各等级前面添上原来的正负号;在各等级前面添上原来的正负号;3.分别求出带正号
14、的等级和(分别求出带正号的等级和(T+)与带负号的等级和()与带负号的等级和(T-),取两),取两者之中较小的记作者之中较小的记作T;4.建立假设:建立假设:H0:A和和B分布相同分布相同 H1:A和和B分布不同分布不同5.根据根据N,T查成对秩和检验表查成对秩和检验表T T表表:接受:接受H0T T表表:拒绝:拒绝H0相关样本相关样本-顺序数据:顺序数据:Wilcoxon检验检验本讲稿第二十六页,共五十四页解:解:H0:前后跑步成绩分布一致;:前后跑步成绩分布一致;H1:前后跑步成绩分布不一致:前后跑步成绩分布不一致 T-1+6+2+514;T+=8+4+3+7+9=31,T=T-14,N=
15、9,查符号秩次检验表:查符号秩次检验表:T0.056,因为因为T T0.05,所以,接受所以,接受H0例子:训练能让人跑得更快吗?例子:训练能让人跑得更快吗?本讲稿第二十七页,共五十四页非参数检验的具体方法非参数检验的具体方法n选择非参数检验的方法时,考虑选择非参数检验的方法时,考虑2个因素个因素样本情况:独立样本或相关样本?样本情况:独立样本或相关样本?数据类型:顺序数据或类别数据?数据类型:顺序数据或类别数据?样本情况样本情况数据类型数据类型具体方法具体方法独立样本独立样本顺序数据顺序数据Mann-Whitney(也称秩和)检验(也称秩和)检验独立样本独立样本类别数据类别数据2 检验检验相
16、关样本相关样本顺序数据顺序数据Wilcoxon Wilcoxon(也称符号秩次)检验(也称符号秩次)检验相关样本相关样本类别数据类别数据McNemar检验检验本讲稿第二十八页,共五十四页相关样本相关样本-类别数据:类别数据:McNemar检验检验例子:随机选择例子:随机选择100名被试,依次品尝名被试,依次品尝“大麻子大麻子”牌酥牌酥饼和饼和“明月楼明月楼”牌酥饼,并评价这两个牌子酥饼是否牌酥饼,并评价这两个牌子酥饼是否好吃,结果如下表。请问人们对两种牌子酥饼的评价好吃,结果如下表。请问人们对两种牌子酥饼的评价是否一样?是否一样?McNemar检验需要用到四格表,统计检验量是检验需要用到四格表
17、,统计检验量是2 值值本讲稿第二十九页,共五十四页1、将数据整理成四格表、将数据整理成四格表2、根据四格表计算、根据四格表计算2 值值3、建立假设、建立假设 H0:A总体与总体与B总体相同;总体相同;H1:A总体与总体与B总体不同总体不同4、检验、检验 根据根据2分布计算临界值,确定拒绝域分布计算临界值,确定拒绝域 第第2步所得的步所得的2 如果落入拒绝域,则拒绝如果落入拒绝域,则拒绝H0,接受接受H1 第第2步所得的步所得的2 如果没有落入拒绝域,如果没有落入拒绝域,则接受则接受H0相关样本相关样本-类别数据:类别数据:McNemar检验步骤检验步骤本讲稿第三十页,共五十四页相关样本相关样本
18、-类别数据:类别数据:McNemar检验检验1 1、将数据整理成四格表、将数据整理成四格表2 2、根据四个表计算、根据四个表计算2 2值值本讲稿第三十一页,共五十四页相关样本相关样本-类别数据:类别数据:McNemar检验检验3、建立假设、建立假设 H0:觉得两种牌子酥饼好吃的比率相同:觉得两种牌子酥饼好吃的比率相同 H1:觉得两种牌子酥饼好吃的比率不同:觉得两种牌子酥饼好吃的比率不同4、检验、检验 临界值临界值20.05(1)=3.84 因为因为2=5 3.84,所以拒绝,所以拒绝H0,接受,接受H1。即在统计学意义。即在统计学意义上两种酥饼受欢迎程度不同上两种酥饼受欢迎程度不同 本讲稿第三
19、十二页,共五十四页主要内容主要内容非参数检验的基本概念非参数检验的基本概念1 1非参数检验的具体方法非参数检验的具体方法2 2统计软件的应用统计软件的应用3 3作业和上机练习作业和上机练习4 4本讲稿第三十三页,共五十四页具体内容具体内容n非参数检验非参数检验独立样本独立样本-顺序数据:顺序数据:Mann-Whitney检验检验 独立样本独立样本-类别数据:类别数据:2 检验检验相关样本相关样本-顺序数据:顺序数据:Wilcoxon 检验检验对立样本对立样本-类别数据:类别数据:McNemar检验检验本讲稿第三十四页,共五十四页class实验班实验班 n1=5普通班普通班 n2=7score9
20、28588769075859690688785独立样本独立样本-顺序数据:顺序数据:Mann-Whitney检验检验Data05-08 3.点击点击 ,定义,定义Group1为实验班;为实验班;Group2为普通班为普通班Define Groups1.Test Variable list框中放入框中放入“score”;Analysis Nonparametric Test2-independent-sample Test2.Grouping Variable框中放入框中放入“class”5.点击点击 OK4.Test type 中勾选中勾选 Mann-Whitney本讲稿第三十五页,共五十四页
21、输出结果输出结果本讲稿第三十六页,共五十四页结果报告结果报告T T=T T实验班实验班=36.5;=36.5;p p=0.512 0.05=0.512 0.05Mann-WhitneyMann-Whitney检验的结果检验的结果 假设检验:假设检验:H H0 0:两个班的成绩没有差异;:两个班的成绩没有差异;H H1 1:两个班的成绩有差异:两个班的成绩有差异答:答:根据这些结果接受根据这些结果接受H H0 0,即两班的成绩在统计学意义上没有差异。即两班的成绩在统计学意义上没有差异。本讲稿第三十七页,共五十四页具体内容具体内容n非参数检验非参数检验独立样本独立样本-顺序数据:顺序数据:Mann
22、-Whitney检验检验 独立样本独立样本-类别数据:类别数据:2 检验检验相关样本相关样本-顺序数据:顺序数据:Wilcoxon 检验检验对立样本对立样本-类别数据:类别数据:McNemar检验检验本讲稿第三十八页,共五十四页独立样本独立样本-类别数据:类别数据:2 检验(比率差异检验)检验(比率差异检验)n例子:喜欢上外语课吗?例子:喜欢上外语课吗?Data05-09 2.点击点击statistics1.Row框中放入框中放入“grade”;Column框中放入框中放入“like”Analysis Descriptive StatisticsCrosstabs4.点击点击 OK3.勾选勾选
23、Chi-squarenumgradegradelikelike111220 本讲稿第三十九页,共五十四页结果输出结果输出本讲稿第四十页,共五十四页结果报告结果报告2=11.03;df=1df=1;p p=0.001 0.05=0.001 0.05=0.314 0.05WilcoxonWilcoxon检验检验的结果的结果 假设检验:假设检验:H H0 0:训练前后没有差异;:训练前后没有差异;H H1 1:训练前后有差异:训练前后有差异答:答:根据这些结果接受根据这些结果接受H H0 0,即训练前后在统计学意义上没有差异。即训练前后在统计学意义上没有差异。本讲稿第四十五页,共五十四页具体内容具体
24、内容n非参数检验非参数检验独立样本独立样本-顺序数据:顺序数据:Mann-Whitney检验检验 独立样本独立样本-类别数据:类别数据:2 检验检验相关样本相关样本-顺序数据:顺序数据:Wilcoxon 检验检验对立样本对立样本-类别数据:类别数据:McNemar检验检验本讲稿第四十六页,共五十四页相关样本相关样本-类别数据:类别数据:McNemar检验检验例子:哪个牌子酥饼好吃?例子:哪个牌子酥饼好吃?“大麻子大麻子”或或“明月楼明月楼”Data05-11 2.点击点击statistics1.Row框中放入框中放入“dmz”;Column框中放入框中放入“myl”Analysis Descr
25、iptive StatisticsCrosstabs4.点击点击 OK3.勾选勾选 McNemarnumdmzdmzmylmyl111201 本讲稿第四十七页,共五十四页输出结果输出结果本讲稿第四十八页,共五十四页结果报告结果报告p p=0.041 0.05=0.041 0.05McNemarMcNemar检验的结果检验的结果 假设检验:假设检验:H H0 0:人们对两种牌子的酥饼评价一致;:人们对两种牌子的酥饼评价一致;H H1 1:人们对两种牌子的酥饼评价不一致:人们对两种牌子的酥饼评价不一致答:答:根据这些结果拒绝根据这些结果拒绝H H0 0,接受,接受H H1 1,即在统计学意义上人们
26、对两种酥饼的评价不一致即在统计学意义上人们对两种酥饼的评价不一致本讲稿第四十九页,共五十四页主要内容主要内容非参数检验的基本概念非参数检验的基本概念1 1非参数检验的具体方法非参数检验的具体方法2 2SPSSSPSS软件的应用软件的应用3 3作业和上机练习作业和上机练习4 4本讲稿第五十页,共五十四页练习练习n分别用分别用Data05-08,Data05-09,Data05-10,Data05-11练习用练习用SPSS进行非参数检验进行非参数检验本讲稿第五十一页,共五十四页作业作业09-01随机选择男性被试随机选择男性被试6060,其中认为事业更重要的有,其中认为事业更重要的有4545 女性被
27、试女性被试5050,其中认为家庭更重要的有,其中认为家庭更重要的有3838家庭和事业哪个更重要?家庭和事业哪个更重要?要求:把上述数据输入要求:把上述数据输入SPSSSPSS软件,然后选用正确的方法来检验男女软件,然后选用正确的方法来检验男女在对待家庭和事业的态度上是否有差异?在对待家庭和事业的态度上是否有差异?本讲稿第五十二页,共五十四页作业作业 09-02:日常化妆好不好?:日常化妆好不好?n随机选取了随机选取了100名女性,调查她们对于日常化妆的名女性,调查她们对于日常化妆的态度。调查分两次进行,中间间隔态度。调查分两次进行,中间间隔10年。第一次调年。第一次调查时平均年龄为查时平均年龄为25岁,第二次调查时平均年龄为岁,第二次调查时平均年龄为35岁。其结果如下表所示。岁。其结果如下表所示。试问:两次调查的结果是否一致?即随着年龄增长,试问:两次调查的结果是否一致?即随着年龄增长,女性认为日常化妆女性认为日常化妆“好好”的比率是否发生变化?的比率是否发生变化?第一次调查总计不好好第二次调查不好161531好501969总计6634100本讲稿第五十三页,共五十四页再 见!本讲稿第五十四页,共五十四页