《(08)第8章假设检验.ppt》由会员分享,可在线阅读,更多相关《(08)第8章假设检验.ppt(83页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 8 章 假设检验第 8 章 假设检验8.1 假设检验的基本问题假设检验的基本问题 8.2 一个正态总体参数的检验一个正态总体参数的检验8.3 假设检验中的其他问题假设检验中的其他问题学习目标1.1.了解假设检验的基本思想了解假设检验的基本思想 2.2.掌握假设检验的步骤掌握假设检验的步骤3.3.对实际问题作假设检验对实际问题作假设检验4.4.利用置信区间进行假设检验利用置信区间进行假设检验5.5.利用利用P P-值进行假设检验值进行假设检验8.1 假设检验的基本问题一一一一.假设问题的提出假设问题的提出二二二二.假设的表达式假设的表达式三三三三.两类错误两类错误四四四四.假设检验中的值假设
2、检验中的值五五五五.假设检验的另一种方法假设检验的另一种方法六六六六.单侧检验单侧检验假设检验的概念与思想什么是假设?(hypothesis)n n 对总体参数的的数值所作的一种陈述n n总总体体参参数数包包括括总总总总体体体体均均均均值值值值、比例比例比例比例、方差方差方差方差等等n n分析分析之前之前之前之前必需陈述必需陈述我认为该地区新生婴儿我认为该地区新生婴儿的平均体重为的平均体重为31903190克克!什么是假设检验?(hypothesis testing)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2。采用逻辑上的反证法,依据统计上的小概率原理总体
3、总体总体总体假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选择别无选择.作出决策作出决策作出决策作出决策假设检验的步骤假设检验的步骤提出假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策提出原假设和备择假设n n 什么是原假设?什么是原假设?(null hypothesis)1.1.待检验的假设,又称“0假设”2.2.研究者想收集证据予以反
4、对的假设n n3.总是有等号 ,或 n n4.表示为 H0n nH H0 0:某一数值某一数值 n n指定为指定为 =号,即号,即 或或 n n例如例如,H,H0 0:31903190(克)(克)为什么叫为什么叫为什么叫0 00假设假设假设?规定显著性水平(significant level)n n 什么显著性水平?什么显著性水平?n n1.是一个概率值n n2.原假设为真时,拒绝原假设的概率n n被称为抽样分布的拒绝域被称为抽样分布的拒绝域n n3.表示为(alpha)n n常用的常用的 值有值有0.01,0.05,0.100.01,0.05,0.10n n4.由研究者事先确定假设检验中的两
5、类错误假设检验中的两类错误(决策风险决策风险)假设检验中的两类错误n n1.1.第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)n n原假设为真时拒绝原假设原假设为真时拒绝原假设n n会产生一系列后果会产生一系列后果n n第一类错误的概率为第一类错误的概率为 n n被称为显著性水平被称为显著性水平n n2.2.第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)n n原假设为假时接受原假设原假设为假时接受原假设n n第二类错误的概率为第二类错误的概率为(Beta)(Beta)H H0 0:无罪无罪无罪无罪假设检验中的两
6、类错误假设检验中的两类错误(决策结果)(决策结果)陪审团审判陪审团审判陪审团审判陪审团审判裁决裁决裁决裁决实际情况实际情况实际情况实际情况无罪无罪无罪无罪有罪有罪有罪有罪无罪无罪无罪无罪正确正确正确正确错误错误错误错误有罪有罪有罪有罪错误错误错误错误正确正确正确正确HH0 0 检验检验检验检验决策决策决策决策实际情况实际情况实际情况实际情况HH0 0为真为真为真为真HH0 0为假为假为假为假接受接受接受接受HH0 0正确决策正确决策正确决策正确决策(1(1 )第二类错第二类错第二类错第二类错误误误误()拒绝拒绝拒绝拒绝HH0 0第一类错第一类错第一类错第一类错误误误误()正确决策正确决策正确决
7、策正确决策(1-(1-(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程 错误和 错误的关系 你不能同时减你不能同时减少两类错误少两类错误!和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小影响 错误的因素n n1.总体参数的真值n n随着假设的总体参数的减少而增大随着假设的总体参数的减少而增大n n2.显著性水平 n n当当 减少时增大减少时增大n n3.总体标准差 n n当当 增大时增大增大时增大n n4.样本容量 nn
8、n当当 n n 减少时增大减少时增大双侧检验和单侧检验双侧检验与单侧检验(假设的形式)假假设研究的研究的问题双双侧检验左左侧检验右右侧检验H0=0 0 0 0 0 0H1 0 0 0 0假设检验的基本思想.因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设绝假设绝假设 =50=50=50.如果这是总如果这是总如果这是总如果这是总如果这是总如果这是总体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值样本均值样本均值样本均值 =50=50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个
9、值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值样本均值样本均值 .202020双侧检验(原假设与备择假设的确定)1.1.属于决策中的假设检验决策中的假设检验2.2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格n n我我们们想想要要证证明明(检检验验)大大于于或或小小于于这这两两种种可可能能性性中的任何一种是否成立中的任何一种是否成立4.4.建立的原假设与备择假设应为n n H0:10 H1:10双侧检验(显著性
10、水平与拒绝域)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平假设检验中的小概率原理假设检验中的小概率原理n n 什么小概率?什么小概率?n n1.在一次试验中,一个几乎不可能发生的事件发生的概率n n2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设n n3.小概率由研究者事先确定什么是小什么是小什么是小概率?概率?概率?双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值
11、临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平单侧检验(原假设与备择假设的确定)1.1.将将研研
12、究究者者想想收收集集证证据据予予以以支支持持的的假假设设作作为为备备择择假设假设H H1 1 例例如如,一一个个研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论是是正正确的确的 一个销售商总是想正确供货商的说法是不正确的一个销售商总是想正确供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致备择假设的方向与想要证明其正确性的方向一致2.2.将将研研究究者者想想收收集集证证据据证证明明其其不不正正确确的的假假设设作作为为原假设原假设H H0 03.3.先确立备择假设先确立备择假设H H1 1单侧检验(原假设与备择假设的确定)qq一项研究表明,采用新技术生产后,将会使产品
13、的使用寿命明显延长到1500小时以上。检验这一结论是否成立n n研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论(寿寿命命延延长长)是正确的是正确的n n备择假设的方向为“”(寿命延长寿命延长)n n建立的原假设与备择假设应为n n H0:1500 H1:1500单侧检验(原假设与备择假设的确定)qq一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立n n研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论(废废品品率率降低降低)是正确的是正确的n n备择假设的方向为“”(废品率降低废品率降低)n n建立的原假设与备择假设应为n n H0:2
14、%H1:2%单侧检验(原假设与备择假设的确定)qq某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验 检验权在销售商一方检验权在销售商一方 作作为为销销售售商商,你你总总是是想想收收集集证证据据证证明明生生产产商商的说法的说法(寿命在寿命在10001000小时以上小时以上)是不是正确的是不是正确的n n备择假设的方向为“”(寿寿命命不不足足10001000小小时时)建立的原假设与备择假设应为建立的原假设与备择假设应为n n HH0 0:1000 H 1000 H1 1:1020 1020n n =0.050.05n nn n =1616n n
15、临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.6452 未知大样本均值的检验(例题分析)n n【例例例例】某某电电子子元元件件批批量量生生产产的的质质量量标标准准为为平平均均使使用用寿寿命命12001200小小时时。某某厂厂宣宣称称他他们们采采用用一一种种新新工工艺艺生生产产的的元元件件质质量量大大大大超超过过规规定定标标准准。为为了
16、了进进行行验验证证,随随机机抽抽取取了了100100件件作作为为样样本本,测测得得平平均均使使用用寿寿命命12451245小小时时,标标准准差差300300小小时时。能能否否说说该该厂厂生生产产的的电电子子元元件件质质量量显显著著地地高高于于规规定定标准?标准?(0.050.05)单侧检验单侧检验2 未知大样本均值的检验(例题分析)n nHH0 0:12001200n nHH1 1:1200 1200n n =0.050.05n nn n=100100n n临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H
17、 H0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.645总体均值的检验(2未知小样本)n n1.假定条件n n总体为正态分布总体为正态分布n n 2 2未知,且小样本未知,且小样本n n2.使用t 统计量2 未知小样本均值的检验(例题分析)n n【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验双侧检验2 未
18、知小样本均值的检验(例题分析)n nHH0 0:=5=5n nHH1 1:5 5n n =0.05=0.05n ndf df=10=10-1=9-1=9n n临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0252 未知小样本均值的检验(P 值的计算与应用)n n第第1 1步步:进进入入
19、ExcelExcel表表格格界界面面,选选择择“插插入入”下下拉拉菜单菜单n n第第2 2步步:选选择择“函函数数”点点击击,并并在在函函数数分分类类中中点点击击“统统计计”,然然后后,在在函函数数名名的的菜菜单单中中选选择择字字符符n n “TDISTTDIST”,确定,确定n n第第3 3步:步:在弹出的在弹出的X X栏中录入计算出的栏中录入计算出的t t值值3.16 3.16 n n 在自由度在自由度(Deg-freedomDeg-freedom)栏中录入栏中录入9 9n n在在TailsTails栏栏中中录录入入2 2,表表明明是是双双侧侧检检验验(单单测测检检验验则则在该栏内录入在该
20、栏内录入1 1)n n P P值的结果为值的结果为0.011550.0250.01155 40000 40000n n =0.=0.0505n ndf df=20-1=1920-1=19n n临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0认为制造商的产品同他所说的认为制造商的产品同他所说的标准不相符标准不相符决策决策决策决策:结论结论结论结论:0 0拒绝域拒绝域0.050.051.72911.7291总体比例的检验(Z 检验)一个总体比例检验1.1.假定条件n n有两类结果有两类结果n n总体
21、服从二项分布总体服从二项分布n n可用正态分布来近似可用正态分布来近似2.2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例一个总体比例的检验(例题分析)n n【例例例例】一一项项统统计计结结果果声声称称,某某市市老老年年人人口口(年年龄龄在在6565岁岁以以上上)的的比比重重为为14.714.7%,该该市市老老年年人人口口研研究究会会为为了了检检验验该该项项统统计计是是否否可可靠靠,随随机机抽抽选选了了400400名名居居民民,发发现现其其中中有有5757人人年年龄龄在在6565岁岁以以上上。调调查查结结果果是是否否支支持持该该市市老老年年人人
22、口口比比重重为为14.7%14.7%的的看看法法?(=0.050.05)双侧检验双侧检验一个总体比例的检验(例题分析)n nHH0 0:=14.7%=14.7%n nHH1 1:14.7%14.7%n n =0.05=0.05n nn n =400400n n临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策:结论结论结论结论:Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H
23、H0 0.025.025总体方差的检验(2 检验)方差的卡方(2)检验1.1.检验一个总体的方差或标准差2.2.假设总体近似服从正态分布3.3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差方差的卡方(2)检验(例题分析)n n【例例例例】某某厂厂商商生生产产出出一一种种新新型型的的饮饮料料装装瓶瓶机机器器,按按设设计计要要求求,该该机机器器装装一一瓶瓶一一升升(1000cm1000cm3 3)的的饮饮料料误误差差上上下下不不超超过过1cm1cm3 3。如如果果达达到到设设计计要要求求,表表明明机机器器的的稳稳定定性性非非常常好好。现现从从该
24、该机机器器装装完完的的产产品品中中随随机机抽抽取取2525瓶瓶,分分别别进进行行测测定定(用用样样本本减减1000cm1000cm3 3),得得到到如如下下结结果果。检检验验该该机机器器的的性性能能是是否否达达到到设设计计要要求求 (=0.05=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验方差的卡方(2)检验(例题分析)n nHH0 0:2 2 1 1
25、n nHH1 1:2 2 1 1n n =0.=0.0505n ndf df=25-1=2425-1=24n n临界值临界值临界值临界值(s):(s):统计量统计量统计量统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0认为该机器的性能达到设计要认为该机器的性能达到设计要求求 2 220 0 036.41536.41536.415 =0.05 =0.05 =0.05决策决策决策决策:结论结论结论结论:一个总体参数的检验Z 检验检验(单尾和双尾)(单尾和双尾)t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾)2 2检验检验(单尾和双尾)(单尾
26、和双尾)均值均值一个总体一个总体比例比例方差方差8.4 假设检验中的其他问题一一一一.用置信区间进行检验用置信区间进行检验二二二二.单侧检验中假设的建立单侧检验中假设的建立三三三三.用用p值进行检验(值进行检验(Excel)用置信区间进行检验用置信区间进行检验(单侧检验)1.1.左侧检验:求出单边置信下限2.若总体的假设值若总体的假设值 0 0小于单边置信下限,拒绝小于单边置信下限,拒绝H H0 03.右侧检验:求出单边置信上限4.若总体的假设值若总体的假设值 0 0大于单边置信上限,拒绝大于单边置信上限,拒绝H H0 0用置信区间进行检验(双侧检验)1.1.求出双侧检验均值的置信区间 2 2
27、 2 2已知时:已知时:已知时:2 2 2 2未知时:未知时:未知时:2.若总体的假设值 0在置信区间外,拒绝H0 用置信区间进行检验(单侧检验)1.1.左侧检验:求出单边置信下限2.若总体的假设值若总体的假设值 0 0小于单边置信下限,拒绝小于单边置信下限,拒绝H H0 03.右侧检验:求出单边置信上限4.若总体的假设值若总体的假设值 0 0大于单边置信上限,拒绝大于单边置信上限,拒绝H H0 0用置信区间进行检验(例题分析)n n 【例例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试
28、确定这批产品的包装重量是否合格?(=0.05)双侧检验!双侧检验!香脆香脆香脆蛋卷蛋卷蛋卷用置信区间进行检验(例题分析)n nHH0 0:=1000 1000n nHH1 1:1000 1000n n =0.050.05n nn n n n =49 49n n临界值临界值临界值临界值(s):(s):置信区间为置信区间为置信区间为置信区间为决策决策决策决策:结论结论结论结论:假设的假设的 00=991=991在在0 0置信区置信区间内,不拒绝间内,不拒绝H H0 0不能认为这批产品的包装重量不能认为这批产品的包装重量不合格不合格Z Z0 01.961.96-1.96-1.96.025.025拒绝
29、拒绝 H H0 0拒绝拒绝 H H0 0.025.025单侧假设的选择n n例题1n n例题2 为什么不同方向会产生矛盾结果?如何看待?如何选择方向?单侧检验中假设方向的选择n n遵循“保守主义”原则 把“原有的、传统的、经验验证过的”放在 -原假设 把“未知的、新生的、需要验证的”放在-备择假设假设检验中的假设检验中的 P 值值什么是P 值?(P-value)1.1.是一个概率值2.2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率n n左侧检验时,左侧检验时,P P-值为曲线上方值为曲线上方小于等于小于等于小于等于小于等于检验检验统计量部分的面积统计量部分的面积n n右侧检验
30、时,右侧检验时,P P-值为曲线上方值为曲线上方大于等于大于等于大于等于大于等于检验检验统计量部分的面积统计量部分的面积3.3.被称为观察到的(或实测的)显著性水平n nH H0 0 能被拒绝的能被拒绝的的最小值的最小值双侧检验的P 值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P
31、 P 值值值1/2 1/2 1/2 P P P 值值值左侧检验的P 值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的P 值H HH0 00值值值临界值临界值临界值 拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值利用 P 值进行检验(决策准则)1.1.单侧检验n n若若p-p-值值 ,不拒绝不拒绝 H H0 0n n若若p-p-值值 ,不拒绝不拒绝 H H0 0n n若若p-p-值值 ,拒绝拒绝 H H0 0本章小节n n1.假设检验的概念和类型假设检验的概念和类型 n n2.假设检验的过程假设检验的过程 3.基于一个样本的假设检验问题基于一个样本的假设检验问题n n4.用置信区间进行检验用置信区间进行检验n n 5.单侧假设的选择单侧假设的选择n n 6.利用利用p p-值进行检验值进行检验结结 束束