《第七章假设检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第七章假设检验PPT讲稿.ppt(133页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章假设检验第1页,共133页,编辑于2022年,星期一第七章 假设检验第一节 假设检验的一般问题 第二节 一个正态总体的参数检验第三节 两个正态总体的参数检验第四节 假设检验中的其他问题第2页,共133页,编辑于2022年,星期一假设检验在统计方法中的地位第3页,共133页,编辑于2022年,星期一学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.能对实际问题作假设检验能对实际问题作假设检验4.利用置信区间进行假设检验利用置信区间进行假设检验5.利用利用P-值进行假设检验值进行假设检验第4页,共133页,编辑于2022年,星期一第一节 假
2、设检验的一般问题一一.假设检验的概念假设检验的概念二二.假设检验的步骤假设检验的步骤三三.假设检验中的小概率原理假设检验中的小概率原理四四.假设检验中的两类错误假设检验中的两类错误五五.双侧检验和单侧检验双侧检验和单侧检验第5页,共133页,编辑于2022年,星期一假设检验的概念与思想第6页,共133页,编辑于2022年,星期一什么是假设?对总体参数的一种看法总体参数包括总总体体均均值值、比比例例、方差方差等分析之前之前必需陈述我认为该企业生产的零件我认为该企业生产的零件的平均长度为的平均长度为4 4厘米厘米!第7页,共133页,编辑于2022年,星期一什么是假设检验?1.概念概念事先对总体参
3、数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立2.类型类型参数假设检验非参数假设检验3.特点特点采用逻辑上的反证法依据统计上的小概率原理第8页,共133页,编辑于2022年,星期一假设检验的基本思想.因此我们拒绝假设因此我们拒绝假设因此我们拒绝假设因此我们拒绝假设因此我们拒绝假设因此我们拒绝假设 =50=50=50.如果这是总体的如果这是总体的如果这是总体的如果这是总体的如果这是总体的如果这是总体的真实均值真实均值真实均值真实均值真实均值真实均值样本均值样本均值样本均值 =50=50抽样分布抽样分布抽样分布抽样分布H HH00这个值不像我们应该这个值不像我们应该这个值不像我们应该
4、这个值不像我们应该这个值不像我们应该这个值不像我们应该得到的样本均值得到的样本均值得到的样本均值得到的样本均值得到的样本均值得到的样本均值 .202020第9页,共133页,编辑于2022年,星期一总体总体假设检验的过程(提出假设抽取样本作出决策)抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选择别无选择.作出决策作出决策作出决策作出决策第10页,共133页,编辑于2022年,星期一假设检验的步骤假设检验的步骤提出原假设和备择假设提出原假设和备
5、择假设提出原假设和备择假设提出原假设和备择假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策第11页,共133页,编辑于2022年,星期一提出原假设和备择假设 什么是原假设?什么是原假设?(Null Hypothesis)1.待检验的假设,又称“0假设”2.如果错误地作出决策会导致一系列后果3.总是有等号 ,或 4.表示为 H0H0:某一数值 指定为=号,即 或 例如,H0:3190(克)为什么叫为什么叫为什么叫0 00假设假设假设第12页,共133页,编辑于2022年,星期一为什么
6、叫 0 假设?之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第13页,共133页,编辑于2022年,星期一 什么是备择假设?什么是备择假设?(Alternative Hypothesis)1.与原假设对立的假设2.总是有不等号:,或 3.表示为 H1H1:某一数值,或 某一数值例如,H1:3910(克),或3910(克提出原假设和备择假设提出原假设和备择假设第14页,共133页,编
7、辑于2022年,星期一 什么检验统计量?什么检验统计量?1.用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量第15页,共133页,编辑于2022年,星期一规定显著性水平 什么显著性水平?什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定第16页,共133页,编辑于2022年,星期一作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临
8、界值Z或Z/23.将检验统计量的值与 水平的临界值进行比较4.得出接受或拒绝原假设的结论第17页,共133页,编辑于2022年,星期一假设检验中的小概率原理第18页,共133页,编辑于2022年,星期一假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小概率?什么是小概率?什么是小概率?第19页,共133页,编辑于2022年,星期一什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家Ronald Fisher 把20分
9、之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的第20页,共133页,编辑于2022年,星期一假设检验中的两类错误假设检验中的两类错误(决策风险)(决策风险)第21页,共133页,编辑于2022年,星期一假设检验中的两类错误1.第一类错误(弃真错误)第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)第22页,共133页,编辑于2022年,星期一H
10、 H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H01-第二类错第二类错误误()拒绝拒绝H0第一类错第一类错误误()功效功效(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程第23页,共133页,编辑于2022年,星期一 错误和 错误的关系 你不能同时减你不能同时减少两类错误少两类错误!和和和和 的
11、关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小第24页,共133页,编辑于2022年,星期一影响 错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当减少时增大3.总体标准差 当增大时增大4.样本容量 n当 n 减少时增大第25页,共133页,编辑于2022年,星期一双侧检验和单侧检验第26页,共133页,编辑于2022年,星期一双侧检验与单侧检验(假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0=0 0 0 0 0 0H1 0 0 0 0第2
12、7页,共133页,编辑于2022年,星期一双侧检验(原假设与备择假设的确定)1.双侧检验属于决决策策中中的的假假设设检检验验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施2.例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格3.建立的原假设与备择假设应为 H0:10 H1:10第28页,共133页,编辑于2022年,星期一双侧检验(确定假设的步骤)1.例如问题为:检验该企业生产的零件平均长度为4厘米2.步骤从统计角度陈述问题(=4)从统计角度提出相反的问题(4)必需互斥和穷尽提出原假设(=4)提出备择假设(4)有 符号第29页,共133页,编辑
13、于2022年,星期一提出原假设:H0:=4提出备择假设:H1:4 该企业生产的零件平均长度是该企业生产的零件平均长度是4厘米吗厘米吗?(属于决策中的假设)双侧检验(例子)第30页,共133页,编辑于2022年,星期一双侧检验(显著性水平与拒绝域)抽样分布抽样分布抽样分布抽样分布HHH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平第31页,共133页,编辑于2022年,星期一双侧检验(显著性水平与拒绝域)H H0 0值值临界值
14、临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第32页,共133页,编辑于2022年,星期一双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第33页,共133页,编辑于2022年,星期一双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域抽样分布抽样分布1-
15、1-置信水平置信水平置信水平置信水平第34页,共133页,编辑于2022年,星期一单侧检验(原假设与备择假设的确定)检验检验研究中的假设研究中的假设1.将所研究的假设作为备择假设H12.将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设3.先确立备择假设H1第35页,共133页,编辑于2022年,星期一单侧检验(原假设与备择假设的确定)q例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为 H0:1500 H1:1500q例如,改进生产工艺后,会使产品的废品率降低到2%以下属于研究中的假设建立
16、的原假设与备择假设应为 H0:2%H1:2%第36页,共133页,编辑于2022年,星期一单侧检验(原假设与备择假设的确定)检验检验某项声明的有效性某项声明的有效性1.将所作出的说明(声明)作为原假设2.对该说明的质疑作为备择假设3.先确立原假设H0除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的第37页,共133页,编辑于2022年,星期一单侧检验(原假设与备择假设的确定)q例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的建立的原假设与备择假设应为 H0:1000 H1:1
17、000第38页,共133页,编辑于2022年,星期一提出原假设:H0:1000选择备择假设:H1:1000 q该批产品的平均使用寿命超过该批产品的平均使用寿命超过1000小时吗小时吗?(属于检验声明的有效性,先提出原假设)单侧检验(例子)第39页,共133页,编辑于2022年,星期一提出原假设:H0:25选择备择假设:H1:25 q学生中经常上网的人数超过学生中经常上网的人数超过25%吗吗?(属于研究中的假设,先提出备择假设)(属于研究中的假设,先提出备择假设)单侧检验(例子)第40页,共133页,编辑于2022年,星期一单侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值 样本统计量样
18、本统计量拒绝域拒绝域接受域接受域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第41页,共133页,编辑于2022年,星期一左侧检验(显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第42页,共133页,编辑于2022年,星期一左侧检验(显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量
19、样本统计量样本统计量拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平第43页,共133页,编辑于2022年,星期一右侧检验(显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量第44页,共133页,编辑于2022年,星期一右侧检验(显著性水平与拒绝域)H HH0 00值值值临
20、界值临界值临界值 样本统计量样本统计量样本统计量接受域接受域接受域抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域第45页,共133页,编辑于2022年,星期一第二节 一个正态总体的参数检验一一.总体方差已知时的均值检验总体方差已知时的均值检验二二.总体方差未知时的均值检验总体方差未知时的均值检验三三.总体比例的假设检验总体比例的假设检验第46页,共133页,编辑于2022年,星期一一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值
21、一个总体一个总体比例比例方差方差第47页,共133页,编辑于2022年,星期一检验的步骤 陈述原假设 H0 陈述备择假设 H1 选择显著性水平 选择检验统计量 选择n 给出临界值 搜集数据 计算检验统计量 进行统计决策 表述决策结果第48页,共133页,编辑于2022年,星期一总体方差已知时的均值检验(双尾 Z 检验)第49页,共133页,编辑于2022年,星期一一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差第50页,共133
22、页,编辑于2022年,星期一均值的双尾 Z 检验(2 已知)1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)2.原假设为:H0:=0;备择假设为:H1:03.使用z-统计量第51页,共133页,编辑于2022年,星期一均值的双尾 Z 检验(实例)【例例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05)属于决策中的属于决策中的假设!假设!第5
23、2页,共133页,编辑于2022年,星期一均值的双尾 Z 检验(计算结果)H0:=0.081H1:0.081 =0.05n=200临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025决策决策决策决策:结论结论结论结论:拒绝拒绝H H0 0有有证证据据表表明明新新机机床床加加工工的的零零件件的的椭圆度与以前有显著差异椭圆度与以前有显著差异第53页,共133页,编辑于2022年,星期一总体方差已知时的均值检验(单尾 Z 检验)第54页,共133页,编辑于2022年,
24、星期一均值的单尾 Z 检验(2 已知)1.假定条件总体服从正态分布若不服从正态分布,可以用正态分布来近似(n30)2.备择假设有符号3.使用z-统计量第55页,共133页,编辑于2022年,星期一均值的单尾 Z 检验(提出假设)左侧:左侧:左侧:左侧:H H0 0:0 0 0 0 H H1 1:0 0 0 0必须必须必须必须显著地显著地显著地显著地大于大于大于大于 0 0 0 0,小的值满小的值满小的值满小的值满足足足足 H H0 0,不能拒绝,不能拒绝,不能拒绝,不能拒绝Z Z0 0拒绝拒绝 H H0 0 第56页,共133页,编辑于2022年,星期一均值的单尾Z检验(实例)【例例】某批发商
25、欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(0.05)属于检验声明的有属于检验声明的有效性!效性!第57页,共133页,编辑于2022年,星期一均值的单尾Z检验(计算结果)H0:1000H1:1020 =0.05n=16临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用寿命有显著提有证据表明这批灯泡的使用寿命有显著提高高决策决策决
26、策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.645第60页,共133页,编辑于2022年,星期一总体方差未知时的均值检验(双尾 t 检验)第61页,共133页,编辑于2022年,星期一一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差第62页,共133页,编辑于2022年,星期一均值的双尾 t 检验(2 未知)1.假定条件总体为正态分布如果不是正态分布,只有轻微偏斜和大样本(n 30)条件下2.
27、使用t 统计量第63页,共133页,编辑于2022年,星期一均值的双尾 t 检验(实例)【例例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?属于决策中的假属于决策中的假设!设!第64页,共133页,编辑于2022年,星期一均值的双尾 t 检验(计算结果)H0:=1000H1:1000 =0.05df=9-1=8临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上接受的水平上接受H H
28、0 0有证据表明这天自动包装机有证据表明这天自动包装机工作正常工作正常决策:决策:结论:结论:结论:结论:t t0 02.3062.306-2.306-2.306.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025第65页,共133页,编辑于2022年,星期一总体方差未知时的均值检验(单尾 t 检验)第66页,共133页,编辑于2022年,星期一均值的单尾 t 检验(实例)【例例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。
29、已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)属于检验声明有效性属于检验声明有效性的假设!的假设!第67页,共133页,编辑于2022年,星期一均值的单尾 t 检验(计算结果)H0:40000H1:40000 =0.05df=20-1=19临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在=0.05=0.05的水平上接受的水平上接受H H0 0有证据表明轮胎使用寿命显著地大于有证据表明轮胎使用寿命显著地大于4000040000公里公里决策决策决策决策:结论结论:-1.7291-1.7291t t0 0拒绝域拒绝域
30、.05.05第68页,共133页,编辑于2022年,星期一总体比例的假设检验(Z 检验)第69页,共133页,编辑于2022年,星期一适用的数据类型第70页,共133页,编辑于2022年,星期一一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差第71页,共133页,编辑于2022年,星期一一个总体比例的 Z 检验1.假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 z 统计量P P0 0为假设的总体比例为假设的总体比
31、例为假设的总体比例为假设的总体比例第72页,共133页,编辑于2022年,星期一一个总体比例的 Z 检验(实例)【例例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(=0.05)属于决策中的属于决策中的假设!假设!第73页,共133页,编辑于2022年,星期一一个样本比例的 Z 检验(结果)H0:p=0.3H1:p 0.3 =0.05n=200临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上接受的水平上接受H H0 0有证据表明研究者的估计可信有证据表明研究者的估计可信
32、决策决策决策决策:结论结论结论结论:Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025第74页,共133页,编辑于2022年,星期一总体方差的检验(2 检验)第75页,共133页,编辑于2022年,星期一一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差第76页,共133页,编辑于2022年,星期一方差的卡方(2)检验1.检验一个总体的方差或标准差2.假设总
33、体近似服从正态分布3.原假设为 H0:2=024.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差第77页,共133页,编辑于2022年,星期一卡方(2)检验实例【例例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(0.05)属于决策中的属于决策中的假设!假设!第78页,共133页,编辑于2022年,星期一卡方(2)检验 计算结果H0:2=0.0025H1:2 0.0025 =0.05df=20-1=19临界
34、值临界值(s):统计量统计量统计量统计量:在在 =0.05的水平上接受的水平上接受H0 0有证据表明该日纤度的波动比平时没有显著有证据表明该日纤度的波动比平时没有显著差异差异 2 220 0032.85232.85232.8528.9078.9078.907 /2=.05/2=.05/2=.05决策决策决策决策:结论结论结论结论:第79页,共133页,编辑于2022年,星期一第三节 两个正态总体的参数检验一一.两个总体参数之差的抽样分布两个总体参数之差的抽样分布二二.两个总体均值之差的检验两个总体均值之差的检验三三.假设检验中相关样本的利用假设检验中相关样本的利用四四.两个总体比例之差的检验两
35、个总体比例之差的检验第80页,共133页,编辑于2022年,星期一两个正态总体的参数检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均值均值比例比例方差方差第81页,共133页,编辑于2022年,星期一两个独立样本的均值检验第82页,共133页,编辑于2022年,星期一两个独立样本之差的抽样分布 1 1总体总体1 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算
36、每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1-2 22 2抽样分布抽样分布抽样分布抽样分布第83页,共133页,编辑于2022年,星期一两个总体均值之差的Z检验(12、22 已知)1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和 n230)2.原假设:H0:1-2=0;备择假设:H1:1-2 0检验统计量为第84页,共133页,编辑于2022年,星期一两个总体均值之差的Z检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均
37、值均值2 2H0H1 0=0 0 0 0第85页,共133页,编辑于2022年,星期一两个总体均值之差的Z检验(例子)属于决策中的假属于决策中的假设!设!【例例例例】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。根根据据以以往往的的资资料料得得知知,第第一一种种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,第第二二种种方方法法的的标标准准差差为为1010公公斤斤。从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,样样本本容容量量分分别别为为n n1 1=32=32,
38、n n2 2=40=40,测测得得 x x2 2=5050公公斤斤,x x1 1=4444公公斤斤。问问这这两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是是否否有有显显著著差差别别?(=0.050.05)第86页,共133页,编辑于2022年,星期一两个总体均值之差的Z检验(计算结果)H0:1 1-2 2=0H1:1 1-2 2 0 =0.05n1=32,n2=40临界值临界值(s):检验统计量检验统计量:决策决策决策决策:结论结论结论结论:拒绝拒绝H H0 0有证据表明两种方法生产的产品其抗拉强度有显著差有证据表明两种方法生产的产品其抗拉强度有显著差异异Z Z0 01.961
39、.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025第87页,共133页,编辑于2022年,星期一两个总体均值之差的 t 检验(12、22未知)1.检验具有等方差的两个总体的均值2.假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=223.检验统计量其中:其中:其中:第88页,共133页,编辑于2022年,星期一两个总体均值之差的 t 检验(例子)属于研究中的假属于研究中的假设!设!【例例例例】一一个个车车间间研研究究用用两两种种不不同同的的工工艺艺组组装装某某种种产产品品所所用用的的时时间间是是否否相相同同。让让
40、一一个个组组的的1010名名工工人人用用第第一一种种工工艺艺组组装装该该产产品品,平平均均所所需需时时间间为为26.126.1分分钟钟,样样本本标标准准差差为为1212分分钟钟;另另一一组组8 8名名工工人人用用第第二二种种工工艺艺组组装装,平平均均所所需需时时间间为为17.617.6分分钟钟,样样本本标标准准差差为为10.510.5分分钟钟。已已知知用用两两种种工工艺艺组组装装产产品品所所用用时时间间服服从从正正态态分分布布,且且 1 1 1 12 2 2 2 2 2 2 22 2 2 2 。试试问问能能否否认认为为用用第第二二种种方方法法组组装装比比用第一中方法组装更好?用第一中方法组装更
41、好?(=0.05=0.05)第89页,共133页,编辑于2022年,星期一两个总体均值之差的 t 检验(计算结果)H0:1 1-2 2 0H1:1 1-2 2 0 =0.05n1=10,n2=8临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:接受接受H H0 0没有证据表明用第二种方法组装更好没有证据表明用第二种方法组装更好t t0 0拒绝域拒绝域0.050.051.74591.7459第90页,共133页,编辑于2022年,星期一两个相关(配对或匹配)样本的均值检验假设检验中相关样本的利用假设检验中相关样本的利用第91页,共133页,编辑于2
42、022年,星期一两个总体均值之差的检验(配对样本的 t 检验)1.检验两个相关总体的均值配对或匹配重复测量(前/后)2.利用相关样本可消除项目间的方差3.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1 30,n2 30)第92页,共133页,编辑于2022年,星期一配对样本的 t 检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 总体总体2 2H0 D=0 D 0 D 0H1 D 0 D 0注:注:D Di i=X X1 1i i-X X2 2i i ,对第,对第 i i 对观察值对观察值第93页
43、,共133页,编辑于2022年,星期一配对样本的 t 检验(数据形式)观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1=x 11-x 212x 12x 22D1=x 12-x 22MMMMMMMMix 1ix 2iD1=x 1i-x 2iMMMMMMMMnx 1nx 2nD1=x 1n-x 2n第94页,共133页,编辑于2022年,星期一配对样本的 t 检验(检验统计量)样本均值样本均值样本均值样本均值样本标准差样本标准差样本标准差样本标准差自由度自由度df df n nD D-1-1统计量统计量第95页,共133页,编辑于2022年,星期一【例例】一个以减肥为主要
44、目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:配对样本的 t 检验(例子)在 =0.05=0.05的显著性水平下,调查结果是否支持该俱乐部的显著性水平下,调查结果是否支持该俱乐部的声称?的声称?训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102属于检验某项声明属于检验某项声明的假设!的假设!第96页,共133页,编辑于2022年,星期一样本差值计算表样本差值计算表训练前训练前训
45、练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5配对样本的 t 检验(计算表)第97页,共133页,编辑于2022年,星期一配对样本的 t 检验(计算结果)样本均值样本均值样本标准差样本标准差样本标准差样本标准差第98页,共133页,编辑于2022年,星期一H0:1 2 8.5H1:1 2 8.5 =0.05df=10-1=9临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:决策决策:结论结论结论结论:接受
46、接受H H0 0有证据表明该俱乐部的宣称是可信的有证据表明该俱乐部的宣称是可信的配对样本的 t 检验(计算结果)-1.833-1.833t t0 0拒绝域拒绝域.05.05第99页,共133页,编辑于2022年,星期一两个总体比例之差的检验(Z 检验)经济、管理类基础课程统计学统计学第100页,共133页,编辑于2022年,星期一1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似2.检验统计量两个总体比例之差的Z检验第101页,共133页,编辑于2022年,星期一两个总体比例之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 比例
47、比例2 2比例比例1 1 比例比例2 2H0P1P2=0P1P2 0P1P2 0H1P1P2 0P1P20第102页,共133页,编辑于2022年,星期一两个总体比例之差的Z检验(例子)属于研究中的假属于研究中的假设!设!【例例例例】对对两两个个大大型型企企业业青青年年工工人人参参加加技技术术培培训训的的情情况况进进行行调调查查,调调查查结结果果如如下下:甲甲厂厂:调调查查6060人,1818人参加技术培训。乙厂调查4040人,1414人人参参加加技技术术培培训训。能能否否根根据据以以上上调调查查结结果果认认为为乙乙厂厂工工人人参参加加技技术术培培训训的的人人数数比比例例高于甲厂?高于甲厂?(
48、=0.05)第103页,共133页,编辑于2022年,星期一两个总体比例之差的Z检验(计算结果)H0:P1 1-P2 2 0H1:P1 1-P2 2 0 =0.05n1=60,n2=40临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:接受接受H H0 0没没有有证证据据表表明明乙乙厂厂工工人人参参加加技技术术培培训训的的人人数数比比例例高高于甲厂于甲厂-1.645-1.645Z Z0 0拒绝域拒绝域 第104页,共133页,编辑于2022年,星期一第四节 假设检验中的其他问题一一.用置信区间进行检验用置信区间进行检验二二.利用利用P-值进行检验
49、值进行检验第105页,共133页,编辑于2022年,星期一利用置信区间进行假设检验第106页,共133页,编辑于2022年,星期一利用置信区间进行假设检验(双侧检验)1.求出双侧检验均值的置信区间 2 2 2 2已知时:已知时:2 2 2 2未知时:未知时:2.若总体的假设值 0在置信区间外,拒绝H0 第107页,共133页,编辑于2022年,星期一利用置信区间进行假设检验(左侧检验)1.求出单边置信下限2.2.若总体的假设值若总体的假设值 0小于单边置信下限,拒绝小于单边置信下限,拒绝H H0第108页,共133页,编辑于2022年,星期一利用置信区间进行假设检验(右侧检验)1.求出单边置信
50、上限2.2.若总体的假设值若总体的假设值 0 0大于单边置信上限,拒绝H H0 0第109页,共133页,编辑于2022年,星期一利用置信区间进行假设检验(例子)【例例】一一种种袋袋装装食食品品每每包包的的标标准准重重量量应应为为1000克。现从生产的一批产品中随机抽取1616袋,测得其平均重量为991克克。已已知知这这种种产产品品重重量量服服从从标标准准差差为为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05)属于决策的属于决策的假设!假设!香脆香脆香脆蛋卷蛋卷蛋卷第110页,共133页,编辑于2022年,星期一利用置信区间进行假设检验(计算结果)H0:=1000H1:100