《《统计学假设检验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学假设检验》PPT课件.ppt(113页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、4-1统计学统计学第第 4 章章 假设检验假设检验统计学4-2统计学统计学第第 4 章章 假设检验假设检验4.1 假设检验的基本问题假设检验的基本问题 4.2 一个正态总体参数的检验一个正态总体参数的检验4.3 两个正态总体参数的检验两个正态总体参数的检验4.4 假设检验中的其他问题假设检验中的其他问题4-3统计学统计学假设检验在统计方法中的地位假设检验在统计方法中的地位4-4统计学统计学学习目标学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.对实际问题作假设检验对实际问题作假设检验4.利用利用P-值进行假设检验值进行假设检验4-5统计学统
2、计学4.1 假设检验的基本问题假设检验的基本问题一一.假设检验的概念和思想假设检验的概念和思想二二.假设检验的步骤假设检验的步骤三三.小概率原理小概率原理四四.两类错误两类错误五五.原假设预备择假设的确定原假设预备择假设的确定六六.假设检验中的假设检验中的P值值4-6统计学统计学假设检验的概念与思想假设检验的概念与思想4-7统计学统计学总体总体总体总体假设检验的过程假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选择别无选择.作出决
3、策作出决策作出决策作出决策4-8统计学统计学假设检验的基本思想假设检验的基本思想.因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设绝假设绝假设 =50=50=50.如果这是如果这是如果这是如果这是如果这是如果这是总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均值值值值值值样本均值样本均值样本均值 =50=50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本
4、均值样本均值样本均值样本均值.2020204-9统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)再看一个例子:某味精厂用一台包装机自动包装味精,已知袋装味精的重量XN(u,0.0152),机器正常时其均值u0=0.5公斤,某日开工后随机抽取9袋袋装味精,其净重为:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512问这台机器是否正常?4-10统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)解:已知袋装味精的重量解:已知袋装味精的重量XN(u,0.015XN(u,0.0152
5、 2),),假设现假设现在包装机工作正常在包装机工作正常,即提出如下假设即提出如下假设:原假设原假设原假设原假设H H0 0:=0 0=0.5=0.5 备择假设备择假设备择假设备择假设H H1 1:0 0=0.5=0.5当原假设为真时当原假设为真时当原假设为真时当原假设为真时,4-11统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)当原假设为真时当原假设为真时,对于对于给定的很小的数给定的很小的数0000 1111,例如例如例如例如 =0.05,0.05,有有有有其中其中其中其中,Z,Z a/2 a/2为标准正态分为标准正态分为标准正态分为标准正态分布上侧布上
6、侧布上侧布上侧a/2a/2分位数分位数分位数分位数.Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-12统计学统计学什么是假设检验什么是假设检验?(hypothesis testing)可见,假设检验是一种带有概率性质的反证法.纯数学的反证法,是在假设成立的条件下推出逻辑上的绝对矛盾.这里所说的带有概率性质的反证法,是依据实际推断原理.即认为小概率事件在一次试验中几乎不可能发生.统计上的假设检验,即根据样本检验一个发生概率很小的事件是否发生,若发生了即认为假设有问题,则拒绝原假设.4-13统计学统计学参数假设检验与
7、非参数假设检验参数假设检验与非参数假设检验1.参数假设检验需要对总体分布作出某种假设,然后利用样本信息来判断关于总体的参数的原假设是否成立,效率高,但要求已知总体分布类型2.非参数假设检验则是一种不依赖于总体分布的检验方法,检验条件较宽松,适应性强,但功效较低。(含总体的分布类型检验及独立性检验等)4-14统计学统计学假设检验的步骤假设检验的步骤提出假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值,判断落入拒绝域还判断落入拒绝域还是接受域是接受域作出统计决策作出统计决策4-15统计学统计学提出原假设和备择假设提出原假设和备择
8、假设 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号 ,或 4.表示为 H0n nH H0 0:某一数值某一数值 n n指定为指定为 =号,即号,即 或或 n n例如例如,H H0 0:31903190(克)克)4-16统计学统计学 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设,总是有不等号:,或 3.表示为 H1n nH H1 1:某一数值,或某一数值,或 某一数值某一数值n n例如例如,
9、H H1 1:3190(3190(克克),或,或 3190(3190(克克)提出原假设和备择假设提出原假设和备择假设4-17统计学统计学 什么是检验统计量?什么是检验统计量?1.用于假设检验决策的统计量,要求分布完全已知.2.选择统计量的方法与参数估计相同,需考虑n n是大样本还是小样本是大样本还是小样本n n总体方差已知还是未知等总体方差已知还是未知等确定适当的检验统计量确定适当的检验统计量4-18统计学统计学规定显著性水平规定显著性水平(significant level)什么显著性水平?什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率3.表示为(alpha)n n常用的
10、常用的 值有值有0.0.01,01,0.0.05,05,0.0.10104.由研究者事先确定,主要根据弃真和取伪的代价4-19统计学统计学作出统计决策作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z,t或t3.将检验统计量的值与 水平的临界值进行比较4.得出接受或拒绝原假设的结论4-20统计学统计学假设检验中的小概率原理假设检验中的小概率原理4-21统计学统计学假设检验中的小概率原理假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有较充足理由拒绝原假设3.小概率由研
11、究者事先确定4-22统计学统计学假设检验中的两类错误假设检验中的两类错误(决策风险决策风险)4-23统计学统计学假设检验中的两类错误假设检验中的两类错误1.1.第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)n n原假设为真时拒绝原假设原假设为真时拒绝原假设n n会产生一系列后果会产生一系列后果n n第一类错误的概率为第一类错误的概率为 l l被称为显著性水平被称为显著性水平2.2.第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)n n原假设为假时接受原假设原假设为假时接受原假设n n第二类错误的概率为第二类错误的
12、概率为(Beta)(Beta)4-24统计学统计学H H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)陪审团审判陪审团审判陪审团审判陪审团审判裁决裁决裁决裁决实际情况实际情况实际情况实际情况无罪无罪无罪无罪有罪有罪有罪有罪无罪无罪无罪无罪正确正确正确正确错误错误错误错误有罪有罪有罪有罪错误错误错误错误正确正确正确正确H H0 0 检验检验检验检验决策决策决策决策实际情况实际情况实际情况实际情况H H0 0为真为真为真为真H H0 0为假为假为假为假接受接受接受接受H H0 0正确决策正确决策正确决策正确决策(1 (1 )第二类错第二类错第二类错第二类错
13、误误误误()拒绝拒绝拒绝拒绝H H0 0第一类错第一类错第一类错第一类错误误误误()正确决策正确决策正确决策正确决策(1-(1-(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程4-25统计学统计学 错误和错误和 错误的关系错误的关系 我们只控制了第我们只控制了第我们只控制了第我们只控制了第一类错误的概率一类错误的概率一类错误的概率一类错误的概率 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小4-26统计学统计学影响影响
14、错误的因素错误的因素1.显著性水平 n n当当 减少时增大减少时增大2.总体标准差 n n当当 增大时增大增大时增大3.样本容量 nn n当当 n n 减少时增大减少时增大4-27统计学统计学原假设与备择假设的确定原假设与备择假设的确定4-28统计学统计学双侧检验与单侧检验双侧检验与单侧检验 (假设的形式假设的形式)假设假设假设假设研究的问题研究的问题研究的问题研究的问题双侧检验双侧检验双侧检验双侧检验左侧检验左侧检验左侧检验左侧检验右侧检验右侧检验右侧检验右侧检验H H0 0=0 0 0 0 0 0H H1 1 0 0 0 04-29统计学统计学原假设与备择假设的确定原假设与备择假设的确定(
15、单侧检验单侧检验)1.将将研研究究者者想想收收集集证证据据予予以以支支持持的的假假设设作作为为备备择择假设假设H H1 1 例例如如,一一个个研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论是是正正确的确的 一个销售商总是想证实供货商的说法是不正确的一个销售商总是想证实供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致备择假设的方向与想要证明其正确性的方向一致2.将将研研究究者者想想收收集集证证据据证证明明其其不不正正确确的的假假设设作作为为原假设原假设H H0 03.先确立备择假设先确立备择假设H H1 14-30统计学统计学原假设与备择假设的确定原假设与备择假设
16、的确定(单侧检验单侧检验)q一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立n n研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论(寿寿命命延延长长)是正确的是正确的n n备择假设的方向为“”(寿命延长寿命延长)n n建立的原假设与备择假设应为 H0:1500 H1:15004-31统计学统计学原假设与备择假设的确定原假设与备择假设的确定(单侧检验单侧检验)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立n n研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论(废废品品率率降低降低)是
17、正确的是正确的n n备择假设的方向为“”(废品率降低废品率降低)n n建立的原假设与备择假设应为 H0:2%H1:2%4-32统计学统计学原假设与备择假设的确定原假设与备择假设的确定(单侧检验单侧检验)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方检验权在销售商一方作作为为销销售售商商,你你总总是是想想收收集集证证据据证证明明生生产产商商的的说说法法(寿寿命命在在10001000小小时时以以上上)是是不不是是正正确确的的n n备择假设的方向为“”(寿寿命命不不足足10001000小小时时)建立的原假设与备择假设应为建立
18、的原假设与备择假设应为 H H0 0:1000 H 1000 H1 1:100010004-33统计学统计学显著性水平与拒绝域显著性水平与拒绝域(双侧检验双侧检验)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平4-34统计学统计学显著性水平与拒绝域显著性水平与拒绝域(双侧检验双侧检验)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平4-35统计学
19、统计学显著性水平与拒绝域显著性水平与拒绝域(双侧检验双侧检验)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平4-36统计学统计学显著性水平与拒绝域显著性水平与拒绝域 (左侧检验左侧检验)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量
20、观察到的样本统计量4-37统计学统计学显著性水平与拒绝域显著性水平与拒绝域 (左侧检验左侧检验)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平4-38统计学统计学显著性水平与拒绝域显著性水平与拒绝域 (右侧检验右侧检验)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的
21、样本统计量观察到的样本统计量观察到的样本统计量4-39统计学统计学显著性水平与拒绝域显著性水平与拒绝域 (右侧检验右侧检验)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域4-40统计学统计学假设检验中的假设检验中的 P 值值4-41统计学统计学左侧检验的左侧检验的P 值值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出
22、的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值4-42统计学统计学右侧检验的右侧检验的P 值值H HH0 00值值值临界值临界值临界值 拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值4-43统计学统计学双侧检验的双侧检验的P 值值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的
23、样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值P P P 值值值 P P P 值值值4-44统计学统计学什么是什么是P 值值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率n n左侧检验时,左侧检验时,P P-值为曲线上方值为曲线上方小于等于小于等于小于等于小于等于检检验统计量部分的面积验统计量部分的面积n n右侧检验时,右侧检验时,P P-值为曲线上方值为曲线上方大于等于大于等于大
24、于等于大于等于检检验统计量部分的面积验统计量部分的面积3.被称为观察到的(或实测的)显著性水平4-45统计学统计学利用利用 P 值进行检验值进行检验(决策准则决策准则)1.单侧检验n n若若p-p-值值 ,不能拒绝不能拒绝 H H0 0n n若若p-p-值值 ,拒绝拒绝 H H0 02.双侧检验n n若若p-p-值值 ,不能拒绝不能拒绝 H H0 0n n若若p-p-值值 1020 1020 =0.050.05n n =1616临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用
25、有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.6454-56统计学统计学 2 未知,大样本均值的检验未知,大样本均值的检验 (例题分析例题分析)【例例例例】某某电电子子元元件件批批量量生生产产的的质质量量标标准准为为平平均均使使用用寿寿命命12001200小小时时。某某厂厂宣宣称称他他们们采采用用一一种种新新工工艺艺生生产产的的元元件件质质量量大大大大超超过过规规定定标标准准。为为了了进进行行验验证证,随随机机抽抽取取了了100100件件作作为为样样本本,测测得得平平均均使使用用寿寿命命124512
26、45小小时时,标标准准差差300300小小时时。能能否否说说该该厂厂生生产产的的电电子子元元件件质质量量显显著著地地高高于规定标准?于规定标准?(0.050.05)单侧检验单侧检验4-57统计学统计学 2 未知,大样本均值的检验未知,大样本均值的检验 (例题分析例题分析)H H0 0:12001200H H1 1:1200 1200 =0.050.05n n=100100临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不能拒绝的水平上不能拒绝H H0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于1
27、2001200小时小时H H0 0:12001200决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.6454-58统计学统计学原假设与备择假设的选择例题原假设与备择假设的选择例题H H0 0:12001200H H1 1:1200 1200 =0.050.05n n=100100临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不能拒绝的水平上不能拒绝H H0 0即不能认为该厂生产的元件寿即不能认为该厂生产的元件寿命显著地低于命显著地低于12001200小时小时H H0 0:120012
28、00决策决策决策决策:结论结论结论结论:-1.645-1.645Z Z0 0拒绝域拒绝域.05.054-59统计学统计学总体均值的检验总体均值的检验(2未知小样本未知小样本)1.假定条件n n总体为正态分布总体为正态分布n n 2 2未知,且小样本未知,且小样本2.使用t 统计量4-60统计学统计学 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析)【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验双侧检验4-61统计学统计学 2 未知
29、小样本均值的检验未知小样本均值的检验 (例题分析例题分析)H H0 0:=5=5H H1 1:5 5 =0.05=0.05df df=10=10-1=9-1=9临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0在在 =0.05=0.05的水平上的水平上说明该说明该机器的性能不好机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-62统计学统计学 2 未知小
30、样本均值的检验未知小样本均值的检验(P 值的计算与应用值的计算与应用)第第1 1步步:进进入入ExcelExcel表表格格界界面面,选选择择“插插入入”下下拉拉菜菜单单第第2 2步步:选选择择“函函数数”点点击击,并并在在函函数数分分类类中中点点击击“统统 计计”,然后,在函数名的菜单中选择字符,然后,在函数名的菜单中选择字符 “TDISTTDIST”,确定,确定第第3 3步:步:在弹出的在弹出的X X栏中录入计算出的栏中录入计算出的t t值值3.16 3.16 在自由度在自由度(Deg-freedomDeg-freedom)栏中录入栏中录入9 9 在在TailsTails栏中录入栏中录入2
31、2,表明是双侧检验,表明是双侧检验(单测单测 检验则在该栏内录入检验则在该栏内录入1 1)P P值的结果为值的结果为0.011550.0250.01155 40000 40000 =0.=0.0505df df=20-1=1920-1=19临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不能拒绝的水平上不能拒绝H H0 0无证据表明轮胎使用寿命显著无证据表明轮胎使用寿命显著地大于地大于4000040000公里公里决策决策决策决策:结论结论结论结论:t t0 0拒绝域拒绝域0.050.051.72911.72914-65统计学统
32、计学总体比例的检验总体比例的检验(Z 检验检验)4-66统计学统计学适用的数据类型适用的数据类型4-67统计学统计学一个总体比例检验一个总体比例检验1.假定条件n n有两类结果有两类结果n n总体服从二项分布总体服从二项分布n n可用正态分布来近似可用正态分布来近似2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例4-68统计学统计学一个总体比例的检验一个总体比例的检验 (例题分析例题分析)【例例例例】一一项项统统计计结结果果声声称称,某某市市老老年年人人口口(年年龄龄在在6565岁岁以以上上)的的比比重重为为14.714.7%,该该市市老老年年
33、人人口口研研究究会会为为了了检检验验该该项项统统计计是是否否可可靠靠,随随机机抽抽选选了了400400名名居居民民,发发现现其其中中有有5757人人年年龄龄在在6565岁岁以以上上。调调查查结结果果是是否否支支持持该该市市老老年年人人口口比比重重为为14.7%14.7%的看法?的看法?(=0.050.05)双侧检验双侧检验4-69统计学统计学一个总体比例的检验一个总体比例的检验 (例题分析例题分析)H H0 0:=14.7%=14.7%H H1 1:14.7%14.7%=0.05=0.05n n =400400临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在
34、在 =0.05=0.05的水平上不能拒绝的水平上不能拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策:结论结论结论结论:Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-70统计学统计学总体方差的检验总体方差的检验(2 2 检验检验)4-71统计学统计学方差的卡方差的卡方方(2 2)检验检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差4-72统计学统计学方差的卡方
35、差的卡方方(2 2)检验检验(例题分析例题分析)【例例例例】某某厂厂商商生生产产出出一一种种新新型型的的饮饮料料装装瓶瓶机机器器,按按设设计计要要求求,该该机机器器装装一一瓶瓶一一升升(1000cm1000cm3 3)的的饮饮料料标标准准误误差差上上下下不不超超过过1cm1cm3 3。如如果果达达到到设设计计要要求求,表表明明机机器器的的稳稳定定性性非非常常好好。现现从从该该机机器器装装完完的的产产品品中中随随机机抽抽取取2525瓶瓶,分分 别别 进进 行行 测测 定定(用用 样样 本本 减减1000cm1000cm3 3),得得到到如如下下结结果果。检检验验该该机机器器的的性性能能是是否否达
36、达到到设设计计要求要求 (=0.05=0.05)0.30.3-0.4-0.4-0.7-0.71.41.4-0.6-0.6-0.3-0.3-1.5-1.50.60.6-0.9-0.91.31.3-1.3-1.30.70.71 1-0.5-0.50 0-0.6-0.60.70.7-1.5-1.5-0.2-0.2-1.9-1.9-0.5-0.51 1-0.2-0.2-0.6-0.61.11.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验4-73统计学统计学方差的卡方差的卡方方(2 2)检验检验(例题分析例题分析)H H0 0:2 2
37、=1=1H H1 1:2 2 1 1 =0.=0.0505df df=25-1=2425-1=24临界值临界值临界值临界值(s):(s):统计量统计量统计量统计量:在在 =0.05=0.05的水平上不能拒绝的水平上不能拒绝H H0 0可以认为该机器的性能达到设可以认为该机器的性能达到设计要求计要求 2 220 0 039.3639.3639.3612.4012.4012.40 /2=.05/2=.05/2=.05决策决策决策决策:结论结论结论结论:4-74统计学统计学8.3 两个正态总体参数的检验两个正态总体参数的检验一一.检验统计量的确定检验统计量的确定二二.两个总体均值之差的检验两个总体均
38、值之差的检验三三.两个总体比例之差的检验两个总体比例之差的检验四四.两个总体方差比的检验两个总体方差比的检验五五.检验中的匹配样本检验中的匹配样本4-75统计学统计学两个正态总体参数的检验两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均值均值比例比例方差方差4-76统计学统计学独立样本总体均值之差的检验独立样本总体均值之差的检验4-77统计学统计学两个独立样本之差的抽样分布两个独立样本之差的抽样分布1 1总体总体1 2 2总体总体2抽取
39、简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1-2 22 2抽样分布抽样分布抽样分布抽样分布4-78统计学统计学两个总体均值之差的两个总体均值之差的检验检验(12、22 已知已知)1.1.假定条件假定条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n n1 1 3030和和 n n2 2 30)
40、30)2.检验统计量为检验统计量为4-79统计学统计学两个总体均值之差的检验两个总体均值之差的检验(假设的形式假设的形式)假设假设假设假设研究的问题研究的问题研究的问题研究的问题没有差异没有差异没有差异没有差异有差异有差异有差异有差异均值均值均值均值1 1 1 1 均值均值均值均值2 2 2 2均值均值均值均值1 1 1 1 均值均值均值均值2 2 2 2H H0 0 1 1 2 2=0=0 1 1 2 2 0 0 1 1 2 2 0 0H H1 1 1 1 2 2 0 0 1 1 2 2 0 0 04-80统计学统计学两个总体均值之差的检验两个总体均值之差的检验(例题分析例题分析)双侧检验!
41、双侧检验!【例例例例】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。根根据据以以往往的的资资料料得得知知,第第一一种种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,第第二二种种方方法法的的标标准准差差为为1010公公斤斤。从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,样样本本容容量量分分别别为为n n1 1=32=32,n n2 2=40=40,测测得得 x x2 2=5050公公斤斤,x x1 1=4444公公斤斤。问问这这两两种种方方法法生生产产的的产产品品
42、平平均均抗抗拉拉强强度度是否有显著差别?是否有显著差别?(=0.05=0.05)4-81统计学统计学两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析)H H0 0:1 1 1 1-2 2 2 2=0=0H H1 1:1 1 1 1-2 2 2 2 0 0 =0.050.05n n1 1 =32 32,n n2 2 =4040临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其
43、抗拉强度有显著差异Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0254-82统计学统计学两个总体均值之差的两个总体均值之差的检验检验(12、22 未知且不相等未知且不相等,小样本小样本)1.检验具有不等方差的两个总体的均值检验具有不等方差的两个总体的均值2.假定假定条件条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n两个总体方差未知且不相等两个总体方差未知且不相等 1 1 3.检验检验统计量统计量4-83统计学统计学两个总体均值之差的两个总体均值之差的检验检验
44、(12、22 未知但相等未知但相等,小样本小样本)1.检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.假定假定条件条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n两个总体方差未知但相等两个总体方差未知但相等 1 1=3.检验检验统计量统计量4-84统计学统计学两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析)单侧检验单侧检验 【例例】“多多吃吃谷谷物物,将将有有助助于于减减肥肥。”为为了了验验证证这这个个假假设设,随随机机抽抽取取了了3535人人,询询问问他他们们早早餐餐和和午午餐餐的的通通常常食食谱
45、谱,根根据据他他们们的的食食谱谱,将将其其分分为为二二类类,一一类类为为经经常常的的谷谷类类食食用用者者(总总体体1 1),一一类类为为非非经经常常谷谷类类食食用用者者(总总体体2 2)。然然后后测测度度每每人人午午餐餐的的大大卡卡摄摄取取量量。经经过过一一段段时时间间的的实实验验,得得到到如如下下结果:检验该假设结果:检验该假设(=0.05=0.05)4-85统计学统计学两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析用统计量进行检验用统计量进行检验)H H0 0:1 1 1 1-2 2 2 2 0 0H H1 1:1 1 1 1-2 2 2 2 0 0 =0.050.05n
46、 n1 1 =15 15,n n2 2 =2020临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0没有证据表明没有证据表明多吃谷物将有助多吃谷物将有助于减肥于减肥-1.694-1.694t t0 0拒绝域拒绝域.05.054-86统计学统计学两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析用用Excel进行检验进行检验)第第1 1步步:选选择择“工工具具”下下拉拉菜菜单单,并并选选择择“数数据据分分析析”选项选项第第2 2步:步:选择选择“t t检
47、验,双样本同方差假设检验,双样本同方差假设检验,双样本同方差假设检验,双样本同方差假设”第第3 3步:步:当出现对话框后当出现对话框后 在在“变量变量1 1的区域的区域”方框内键入方框内键入数据区域数据区域 在在“变量变量2 2的区域的区域”方框内键入方框内键入数据区域数据区域 在在“假设平均差假设平均差”的方框内键入的方框内键入0 0 在在“”“”框内键入框内键入0.050.05 在在“输出选项输出选项”中选择输出区域中选择输出区域 选择确定选择确定 用用用用用用ExcelExcelExcel进进进进进进行行行行行行检验检验检验检验检验检验4-87统计学统计学两个匹配两个匹配(或配对或配对)
48、样本的均值检验样本的均值检验4-88统计学统计学两个总体均值之差的检验两个总体均值之差的检验(匹配匹配样本的样本的 t 检验检验)1.检验两个总体的均值n n配对或匹配配对或匹配n n重复测量重复测量(前前/后后)3.假定条件n n两个总体都服从正态分布两个总体都服从正态分布n n如果不服从正态分布,可用正态分布来近如果不服从正态分布,可用正态分布来近似似(n n1 1 30,30,n n2 2 30)30)4-89统计学统计学匹配样本的匹配样本的 t 检验检验(假设的形式假设的形式)假设假设假设假设研究的问题研究的问题研究的问题研究的问题没有差异没有差异没有差异没有差异有差异有差异有差异有差
49、异总体总体总体总体1 1 1 1 总体总体总体总体2 2 2 2总体总体总体总体1 1 1 1 总体总体总体总体2 2 2 2H H0 0 D D=0 0 D D 0 0 D D 0 0H H1 1 D D 0 0 D D 0 0 0注:注:D Di i=X X1 1i i-X X2 2i i ,对第,对第 i i 对观察值对观察值4-90统计学统计学匹配样本的匹配样本的 t 检验检验(数据数据形式形式)观察序号观察序号观察序号观察序号样本样本样本样本1 1 1 1样本样本样本样本2 2 2 2差值差值差值差值1x x 11 11x x 21 21D D1 1=x x 11 11-x x 21
50、 212x x 12 12x x 22 22D D1 1=x x 12 12-x x 22 22M MM M M MM M M MM M M Mix x 1i 1ix x 2i 2iD D1 1=x x 1 1i i-x x 2 2i iM MM M M MM M M MM M M Mnx x 1n 1nx x 2n 2nD D1 1=x x 1n 1n-x x 2n 2n4-91统计学统计学匹配样本的匹配样本的 t 检验检验(检验统计量检验统计量)样本差值均值样本差值均值样本差值均值样本差值均值样本差值标准差样本差值标准差样本差值标准差样本差值标准差自由度自由度df df n nD D-1-