《第6章-假设检验.pptx》由会员分享,可在线阅读,更多相关《第6章-假设检验.pptx(110页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2008年8月 正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。Jan Kmenta统计名言第1页/共110页第第 6 6 章章 假设检验假设检验 6.16.1 假设检验的基本问题假设检验的基本问题 6.26.2 一个总体参数的检验一个总体参数的检验 6.36.3 两个总体参数的检验两个总体参数的检验第2页/共110页2008年8月学习目标学习目标l l假设检验的基本思想和原理假设检验的基本思想和原理 l l假设检验的步骤假设检验的步骤l l一个总体参数的检验一个总体参数的检验l l两个总体参数的检验两
2、个总体参数的检验l lP P值的计算与应用值的计算与应用l l用用ExcelExcel进行检验进行检验第3页/共110页2008年8月正常人的平均体温是37oC吗?当当问问起起健健康康的的成成年年人人体体温温是是多多少少时时,多多数数人人的的回回答答是是3737o oC C,这这似似乎乎已已经经成成了了一一种种共共识识。下下面面是是一一个个研研究究人人员员测测量量的的5050个个健健康康成成年人的体温数据年人的体温数据 37.137.136.936.936.936.937.137.136.436.436.936.936.636.636.236.236.736.736.936.937.637.6
3、36.736.737.337.336.936.936.436.436.136.137.137.136.636.636.536.536.736.737.137.136.236.236.336.337.537.536.936.937.037.036.736.736.936.937.037.037.137.136.636.637.237.236.436.436.636.637.337.336.136.137.137.137.037.036.636.636.936.936.736.737.237.236.336.337.137.136.736.736.836.837.037.037.037.036.1
4、36.137.037.0第4页/共110页2008年8月正常人的平均体温是37oC吗?根根据据样样本本数数据据计计算算的的平平均均值值是是36.836.8o oC C ,标标准准差差为为0.360.36o oC C 根根据据参参数数估估计计方方法法得得到到的的健健康康成成年年人人平平均均体体温温的的95%95%的的置置信信区区间间为为(36.7(36.7,36.9)36.9)。研研究究人人员员发发现这个区间内并没有包括现这个区间内并没有包括3737o oC C 因因此此提提出出“不不应应该该再再把把3737o oC C作作为为正正常常人人体体温温的的一个有任何特定意义的概念一个有任何特定意义的
5、概念”我我们们应应该该放放弃弃“正正常常人人的的平平均均体体温温是是3737o oC”C”这这个个共共识识吗吗?本本章章的的内内容容就就将将提提供供一一套套标标准准统统计计程程序来检验这样的观点序来检验这样的观点第5页/共110页6.1 假设检验的基本原理 6.1.1 怎样提出假设?6.1.2 怎样做出决策?6.1.3 怎样表述决策结果?第 6 章 假设检验第6页/共110页6.1.1 6.1.1 怎样提出假设?怎样提出假设?6.1 假设检验的基本原理第7页/共110页2008年8月什么是假设?(hypothesis)在参数检验中,在参数检验中,对总体参数的具体数值所作的陈述对总体参数的具体数
6、值所作的陈述 就一个总体而言,总体参数包括就一个总体而言,总体参数包括总体均值总体均值、比例比例、方差方差等等 分析分析之前之前必需陈述必需陈述第8页/共110页2008年8月什么是假设检验?(hypothesis test)1.先先对对总总体体的的参参数数(或或分分布布形形式式)提提出出某某种种假假设设,然然后后利利用用样样本本信信息息判判断断假假设设是是否否成成立立的的统统计计方法方法2.有参数检验和有参数检验和非非参数检验参数检验3.逻辑上运用反证法,统计上依据小概率原理逻辑上运用反证法,统计上依据小概率原理 小小概概率率是是在在一一次次试试验验中中,一一个个几几乎乎不不可可能能发发生生
7、的事件发生的概率的事件发生的概率 在在一一次次试试验验中中小小概概率率事事件件一一旦旦发发生生,我我们们就就有有理由拒绝原假设理由拒绝原假设第9页/共110页2008年8月原假设(null hypothesis)1.1.又称又称“0 0假设假设”,研,研究者想收集证据予以反对的究者想收集证据予以反对的假设,用假设,用HH0 0表示表示2.2.所表达的含义总是指所表达的含义总是指参数没有变化或变量之间参数没有变化或变量之间没有关系没有关系 3.3.最初被假设是成立的,之后根据样本数据确定最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它是否有足够的证据拒绝它 4.4.总是有符号总是有
8、符号 ,或或 HH0 0:=某一数值某一数值 HH0 0:某一数值某一数值 HH0 0:某一数值某一数值l l例如例如,HH0 0:10cm10cm第10页/共110页2008年8月1.1.也也称称“研研究究假假设设”,研研究究者者想想收收集集证证据据予予以以支支持持的假设,用的假设,用HH1 1或或HHa a表示表示2.2.所所表表达达的的含含义义是是总总体体参参数数发发生生了了变变化化或或变变量量之之间有某种关系间有某种关系3.3.备备择择假假设设通通常常用用于于表表达达研研究究者者自自己己倾倾向向于于支支持持的的看看法法,然然后后就就是是想想办办法法收收集集证证据据拒拒绝绝原原假假设设,
9、以支持备择假设以支持备择假设 4.4.总是有符号总是有符号 ,或或 HH1 1:某一数值某一数值 HH1 1:某一数值某一数值 HH1 1:”或或“”的的假假设设检检验验,称称为为单侧检验或单尾检验单侧检验或单尾检验(one-tailed test)(one-tailed test)备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验 双侧检验与单侧检验第12页/共110页2008年8月双侧检验与单侧检验(假设的形式)假假假假设设双双双双侧检验侧检验单侧检验单侧检验单侧检验单侧检验左左左左侧检验侧检验右右右右侧检验侧检验原假设原假设原假设原假设H H0 0:=0 0H H0 0:0
10、 0H H0 0:0 0备择假设备择假设备择假设备择假设H H1 1:0 0H H1 1:0 0以总体均值的检验为例以总体均值的检验为例第13页/共110页2008年8月【例例】一一种种零零件件的的生生产产标标准准是是直直径径应应为为10cm10cm,为为对对生生产产过过程程进进行行控控制制,质质量量监监测测人人员员定定期期对对一一台台加加工工机机床床检检查查,确确定定这这台台机机床床生生产产的的零零件件是是否否符符合合标标准准要要求求。如如果果零零件件的的平平均均直直径径大大于于或或小小于于10cm10cm,则则表表明明生生产产过过程程不不正正常常,必必须须进进行行调调整整。试试陈陈述述用用
11、来来检检验验生生产产过过程程是是否否正正常常的的原假设和被择假设原假设和被择假设提出假设(例题分析)解解解:研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“生生生产产产过过过程程程不不不正正正常常常”。建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为 H HH0 0 0:10cm 10cm 10cm H HH1 1 1:10cm10cm10cm 第14页/共110页2008年8月【例例】某某品品牌牌洗洗涤涤剂剂在在它它的的产产品品说说明明书书中中声声称称:平平均均净净含含量量不不少少于于500500克克。从从
12、消消费费者者的的利利益益出出发发,有有关关研研究究人人员员要要通通过过抽抽检检其其中中的的一一批批产产品品来来验验证证该该产产品品制制造造商商的的说说明明是是否否属属实。试陈述用于检验的原假设与备择假设实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H H H0 0 0:500 500
13、 500 H H H1 1 1:500 500 500第15页/共110页2008年8月【例例】一一家家研研究究机机构构估估计计,某某城城市市中中家家庭庭拥拥有有汽汽车车的的比比例例超超过过30%30%。为为验验证证这这一一估估计计是是否否正正确确,该该研研究究机机构构随随机机抽抽取取了了一一个个样样本本进进行行检检验验。试试陈陈述述用用于于检检验验的的原原假假设设与与备备择择假假设设提出假设(例题分析)解:解:解:研究者想收集证据予以支持的假研究者想收集证据予以支持的假研究者想收集证据予以支持的假设是设是设是“该城市中家庭拥有汽车的比例该城市中家庭拥有汽车的比例该城市中家庭拥有汽车的比例超过
14、超过超过30%30%30%”。建立的原假设和备择假设。建立的原假设和备择假设。建立的原假设和备择假设为为为 H H H0 0 0:30%30%30%H H H1 1 1:30%30%30%第16页/共110页2008年8月1.原假设和备择假设是一个完备事件组,而且相互对立 在在一一项项假假设设检检验验中中,原原假假设设和和备备择择假假设设必必有有一个成立,而且只有一个成立一个成立,而且只有一个成立2.先确定备择假设,再确定原假设 3.等号“=”总是放在原假设上 4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)第17页/共110页6.1.2 6.1.
15、2 怎样做出决策?怎样做出决策?6.1 假设检验的基本原理第18页/共110页2008年8月假设检验的基本思想.因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设 =50=50=50.如果这是总如果这是总如果这是总体的假设均值体的假设均值体的假设均值样本均值样本均值样本均值 =50=50抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值 .202020第19页/共110页2008年8月两类错误与显著性水平1.1.研究者总是希望能做出正确的决策,但由于决策是建研究者总是希望能做出正确的决策,但由于决策是建立在样
16、本信息的基础之上,而样本又是随机的,因而立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误就有可能犯错误2.2.原假设和备择假设不能同时成立,决策的结果要么拒原假设和备择假设不能同时成立,决策的结果要么拒绝绝HH0 0,要么不拒绝,要么不拒绝HH0 0。决策时总是希望当原假设正。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误上很难保证不犯错误 3.3.第第类错误类错误(错误错误)原假设为正确时拒绝原假设原假设为正确时拒绝原假设 第第类错误的概率记为类错误的概率记为,被称为显著性水平被称为显著性水平
17、 2.2.第第类错误类错误(错误错误)原假设为错误时未拒绝原假设原假设为错误时未拒绝原假设 第第类错误的概率记为类错误的概率记为 (Beta)(Beta)第20页/共110页2008年8月两类错误的控制1.1.一般来说,对于一个给定的样本,如果犯第一般来说,对于一个给定的样本,如果犯第 类错类错误的代价比犯第误的代价比犯第类错误的代价相对较高,则将类错误的代价相对较高,则将犯第犯第类错误的概率定得低些较为合理;反之,类错误的概率定得低些较为合理;反之,如果犯第如果犯第 类错误的代价比犯第类错误的代价比犯第类错误的代价相类错误的代价相对较低,则将犯第对较低,则将犯第类错误的概率定得高些类错误的概
18、率定得高些2.2.一般来说,发生哪一类错误的后果更为严重,就一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第应该首要控制哪类错误发生的概率。但由于犯第 类错误的概率是可以由研究者控制的,因此在假类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第设检验中,人们往往先控制第 类错误的发生概率类错误的发生概率第21页/共110页2008年8月显著性水平 (significant level)1.事先确定的用于拒绝原假设事先确定的用于拒绝原假设HH0 0时所必须的证时所必须的证据据2.能够容忍的犯第能够容忍的犯第类错误的最大概率类错误的最大概率(上
19、限值上限值)2.2.原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率 抽样分布的拒绝域抽样分布的拒绝域3.3.表示为表示为 (alpha)(alpha)常用的常用的 值有值有0.01,0.05,0.100.01,0.05,0.104.4.由研究者事先确定由研究者事先确定第22页/共110页2008年8月依据什么做出决策?1.1.若若假假设设为为HH0 0=500=500,HH1 1500 I 临界值,拒绝临界值,拒绝HH0 0 左侧检验:左侧检验:统计量统计量 -临界值,拒绝临界值,拒绝HH0 0第28页/共110页2008年8月用P 值决策 (P-value)1.1.如如果果原原
20、假假设设为为真真,所所得得到到的的样样本本结结果果会会像像实实际际观观测测结结果果那那么么极极端端或或更更极极端端的的概概率率 P P值值告告诉诉我我们们:如如果果原原假假设设是是正正确确的的话话,我我们们得得到到得得到到目目前前这这个个样样本本数数据据的可能性有多大,如果这个可能性很小,就应该拒绝原假设的可能性有多大,如果这个可能性很小,就应该拒绝原假设 2.2.被称为观察到的被称为观察到的(或实测的或实测的)显著性水平显著性水平3.3.决策规则:决策规则:若若p p值值 ,拒绝拒绝 HH0 0第29页/共110页2008年8月双侧检验的P 值 /2 2 /2 2 Z Z拒绝拒绝H H0 0
21、拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值第30页/共110页2008年8月左侧检验的P 值 Z Z拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量1/2 1/2 1/2 P P P 值值值第31页/共110页2008年8月右侧检验的P 值 Z Z拒绝拒绝H H0 00 0 0计算出的样本统计量计算出的样本统计量计算出的样本统计
22、量临界值临界值临界值1/2 1/2 1/2 P P P 值值值第32页/共110页2008年8月P值是关于数据的概率1.1.P P值值原假设的对或错的概率无关原假设的对或错的概率无关2.2.它它反反映映的的是是在在某某个个总总体体的的许许多多样样本本中中某某一一类类数数据据出出现现的的经经常常程程度度,它它是是当当原原假假设设正正确确时时,得得到到目目前这个样本数据的概率前这个样本数据的概率 比比如如,要要检检验验全全校校学学生生的的平平均均生生活活费费支支出出是是否否等等于于500500元元,检检验验的的假假设设为为HH0 0:=500=500;HH0 0:500 500。假假定定抽抽出出
23、一一 个个 样样 本本 算算 出出 的的 样样 本本 均均 值值 600600元元,得得 到到 的的 值值 为为P=0.02P=0.02,这这 个个 0.020.02是是 指指 如如 果果 平平 均均 生生 活活 费费 支支 出出 真真 的的 是是500500元元的的话话,那那么么,从从该该总总体体中中抽抽出出一一个个均均值值为为600600的的样样本本的的概概率率仅仅为为0.020.02。如如果果你你认认为为这这个个概概率率太太小小了了,就就可可以以拒拒绝绝原原假假设设,因因为为如如果果原原假假设设正正确确的的话话,几几乎乎不不可可能能抓抓到到这这样样的的一一个个样样本本,既既然然抓抓到到了
24、了,就就表表明明这这样样的的样样本不在少数,所以原假设是不对的本不在少数,所以原假设是不对的3.3.值越小,你拒绝原假设的理由就越充分值越小,你拒绝原假设的理由就越充分第33页/共110页2008年8月 要要证证明明原原假假设设不不正正确确,P P值值要要多多小小,才才能能令人信服呢?令人信服呢?原原假假设设的的可可信信度度又又多多高高?如如果果HH0 0所所代代表表的的假假设设是是人人们们多多年年来来一一直直相相信信的的,就就需需要要很很强强的的证据证据(小的小的P P值值)才能说服他们才能说服他们 拒拒绝绝的的结结论论是是什什么么?如如果果拒拒绝绝HH0 0而而肯肯定定HH1 1 ,你你就
25、就需需要要有有很很强强的的证证据据显显示示要要支支持持HH1 1。比比如如,HH1 1代代表表要要花花很很多多钱钱把把产产品品包包装装改改换换成成另另一一种种包包装装,你你就就要要有有很很强强的的证证据据显显示示新新包包装装一一定定会会增增加加销销售售量量(因因为为拒拒绝绝HH0 0要要花花很很高高的的成本成本)多大的P 值合适?第34页/共110页2008年8月1.1.有有了了P P值值,我我们们并并不不需需要要用用5%5%或或1%1%这这类类传传统统的的显显著著性性水水平平。P P值值提提供供了了更更多多的的信信息息,它它让让我我们们可可以以选选择择任任意意水水平平来来评评估估结结果果是是
26、否否具具有有统统计计上上的的显显著著性性,从而可根据我们的需要来决定是否要拒绝原假设从而可根据我们的需要来决定是否要拒绝原假设 只只要要你你认认为为这这么么大大的的P P值值就就算算是是显显著著了了,你你就就可以在这样的可以在这样的P P值水平上拒绝原假设值水平上拒绝原假设2.2.传传统统的的显显著著性性水水平平,如如1%1%、5%5%、10%10%等等等等,已已经经被被人人们们普普遍遍接接受受为为“拒拒绝绝原原假假设设足足够够证证据据”的的标标准准,我我们们大大概概可可以以说说:10%10%代代表表有有“一一些些证证据据”不不利利于于原原假假设设;5%5%代代表表有有“适适度度证证据据”不不
27、利利于于原原假设;假设;1%1%代表有代表有“很强证据很强证据”不利于原假设不利于原假设固定显著性水平是否有意义第35页/共110页2008年8月1.1.用用P P值值进进行行检检验验比比根根据据统统计计量量检检验验提提供供更更多多的的信信息息2.2.统统计计量量检检验验是是我我们们事事先先给给出出的的一一个个显显著著性性水水平平,以以此此为为标标准准进进行行决决策策,无无法法知知道道实实际际的的显显著著性性水水平究竟是多少平究竟是多少 比比如如,根根据据统统计计量量进进行行检检验验时时,只只要要统统计计量量的的值值落落在在拒拒绝绝域域,我我们们拒拒绝绝原原假假设设得得出出的的结结论论都都是是
28、一一样样的的,即即结结果果显显著著。但但实实际际上上,统统计计量量落落在在拒拒绝绝域域不不同同的的地地方方,实实际际的的显显著著性性是是不不同同的的。比比如如,统统计计量量落落在在临临界界值值附附近近与与落落在在远远离离临临界界值值的的地地方方,实实际际的的显显著著性性就就有有较较大大差差异异。而而P P值值给给出出的的是是实实际际算算出出的的显显著著水水平,它告诉我们实际的显著性水平是多少平,它告诉我们实际的显著性水平是多少P 值决策与统计量的比较第36页/共110页2008年8月拒绝拒绝H H0 0P 值决策与统计量的比较拒绝拒绝拒绝H HH0 00的两个统计量的不同显著性的两个统计量的不
29、同显著性的两个统计量的不同显著性 Z Z拒绝拒绝H H0 00 0 0统计量统计量统计量1 11 P PP1 11 值值值统计量统计量统计量2 22 P PP2 22 值值值拒绝拒绝H H0 0临界值临界值临界值第37页/共110页6.1.3 6.1.3 怎样表述决策结果?怎样表述决策结果?6.1 假设检验的基本原理第38页/共110页2008年8月假设检验不能证明原假设正确1.假假设设检检验验的的目目的的主主要要是是收收集集证证据据拒拒绝绝原原假假设设,而支持你所倾向的备择假设而支持你所倾向的备择假设2.假假设设检检验验只只提提供供不不利利于于原原假假设设的的证证据据。因因此此,当当拒拒绝绝
30、原原假假设设时时,表表明明样样本本提提供供的的证证据据证证明明它它是是错错误误的的,当当没没有有拒拒绝绝原原假假设设时时,我我们们也也没没法法证证明明它它是是正正确确的的,因因为为假假设设检检验验的的程程序序没没有有提提供它正确的证据供它正确的证据 这这与与法法庭庭上上对对被被告告的的定定罪罪类类似似:先先假假定定被被告告是是无无罪罪的的,直直到到你你有有足足够够的的证证据据证证明明他他是是有有罪罪的的,否否则则法法庭庭就就不不能能认认定定被被告告有有罪罪。当当证证据据不不足足时时,法法庭庭的的裁裁决决是是“被被告告无无罪罪”,但但这这里里也也没没有有证证明明被被告就是清白的告就是清白的第39
31、页/共110页2008年8月假设检验不能证明原假设正确1.1.假设检验得出的结论都是根据原假设进行阐述的假设检验得出的结论都是根据原假设进行阐述的 我们要么拒绝原假设,要么不拒绝原假设我们要么拒绝原假设,要么不拒绝原假设2.2.当当不不能能拒拒绝绝原原假假设设时时,我我们们也也从从来来不不说说“接接受受原原假假设设”,因为没有证明原假设是真的,因为没有证明原假设是真的 采采用用“接接受受”原原假假设设的的说说法法,则则意意味味着着你你证证明明了了原原假假设设是是正确的正确的3.3.没没有有足足够够的的证证据据拒拒绝绝原原假假设设并并不不等等于于你你已已经经“证证明明”了了原原假假设设是是真真的
32、的,它它仅仅仅仅意意为为着着目目前前还还没没有有足足够够的的证证据据拒拒绝绝原原假假设设,只只表表示示手手头头上上这这个个样样本本提提供供的的证证据据还还不足以拒绝原假设不足以拒绝原假设 比比如如,在在例例6.26.2中中,如如果果拒拒绝绝原原假假设设,表表明明样样本本提提供供的的证证据据证证明明该该品品牌牌洗洗涤涤剂剂的的净净含含量量与与说说明明书书所所标标识识的的不不相相符符。如如果果不不拒拒绝绝原原假假设设,只只能能说说这这个个样样本本提提供供的的证证据据还还不不足足证证明明净净含含量量不不是是500500克克或或500500克克以以上上,并并不不等等于于证证明明了了净净含含量量就超过了
33、就超过了500500克克4.4.“不不拒拒绝绝”的的表表述述方方式式实实际际上上意意味味着着没没有有得得出出明明确确的的结论结论第40页/共110页2008年8月假设检验不能证明原假设正确1.“接受接受”的说法有时会产生误导的说法有时会产生误导 这这种种说说法法似似乎乎暗暗示示着着原原假假设设已已经经被被证证明明是是正正确确的的了了 实实事事上上,HH0 0的的真真实实值值我我们们永永远远也也无无法法知知道道,不不知知道真实值是什么,又怎么能证明它是什么?道真实值是什么,又怎么能证明它是什么?HH0 0只只是是对对总总体体真真实实值值的的一一个个假假定定值值,由由样样本本提提供供的信息也就自然
34、无法证明它是否正确的信息也就自然无法证明它是否正确2.采采用用“不不拒拒绝绝”的的表表述述方方法法更更合合理理一一些些,因因为为这这种种表表述述意意味味着着样样本本提提供供的的证证据据不不够够强强大大,因因而而没没有有足足够够的的理理由由拒拒绝绝,这这不不等等于于已已经经证证明明原原假设正确假设正确 第41页/共110页2008年8月假设检验不能证明原假设正确【例】比如原假设为H0:=10,从该总体中抽 出 一 个 随 机 样 本,得 到 x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H
35、0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?其人弗能应也第42页/共110页2008年8月假设检验不能证明原假设正确1.1.假假设设检检验验中中通通常常是是先先确确定定显显著著性性水水平平,这这就就等等于于控控制制了了第第 类类错错误误的的概概率率,但但犯犯第第类类错错误误的的概概率率却是不确定的却是不确定的2.2.在在拒拒绝绝HH0 0时时,犯犯第第类类错错误误的的概概率率不不超超过过给给定定的的显显著著性性水水平平,当当样样本本结结果果显显示示没没有有充充分分理理由由拒拒绝绝原原假假设设时时,
36、也也难难以以确确切切知知道道第第类类错错误误发发生生的的概率概率 3.3.采采用用“不不拒拒绝绝”而而不不采采用用“接接受受”的的表表述述方方式式,在多数场合下便避免了在多数场合下便避免了 错误发生的风险错误发生的风险 因因为为“接接受受”所所得得结结论论可可靠靠性性将将由由第第类类错错误误的的概概率率 来来测测量量,而而 的的控控制制又又相相对对复复杂杂,有有时时甚甚至至根根本本无无法法知知道道的的值值,除除非非你你能能确确切切给给出出 ,否否则则就就不不宜宜表表述述成成“接受接受”原假设原假设第43页/共110页2008年8月假设检验不能证明原假设正确 在在实实际际检检验验中中,针针对对一
37、一个个具具体体的的问问题题,将将检检验验结结果果表表述述为为“不不拒拒绝绝”原原假假设,这似乎让人感到无所是从设,这似乎让人感到无所是从 比比如如,你你想想购购买买一一批批产产品品,检检验验的的结结果果没没有有拒拒绝绝原原假假设设,即即达达到到合合同同规规定定的的标标准准要要求求,你你是是否否购购买买这这批批产产品品呢呢?这这时时,你你可可以以对对检检验验的的结结果果采采取取某某种种默默认认态态度度,退退一一步步说说,你你可可以以将将检检验验结结果果表表述述为为“可可以以接接受受”原原假设,你但这并不等于说你假设,你但这并不等于说你“确实接受确实接受”它它第44页/共110页2008年8月统计
38、上显著不一定有实际意义1.1.当当 拒拒 绝绝 原原 假假 设设 时时,我我 们们 称称 样样 本本 结结 果果 是是 统统 计计 上上 显显 著著 的的(statistically(statistically Significant)Significant)2.2.当不拒绝原假设时,我们称样本结果是当不拒绝原假设时,我们称样本结果是统计上不显著的统计上不显著的3.3.在在“显显著著”和和“不不显显著著”之之间间没没有有清清除除的的界界限限,只只是是在在P P值值越越来来越越小小时时,我我们们就有越来越强的证据,检验的结果也就越来越显著就有越来越强的证据,检验的结果也就越来越显著第45页/共1
39、10页2008年8月1.1.“显显著著的的”(SignificantSignificant)一一词词的的意意义义在在这这里里并并不不是是“重重要要的的”,而而是是指指“非非偶然的偶然的”2.2.一一项项检检验验在在统统计计上上是是“显显著著的的”,意意思思是是指指:这这样样的的(样样本本)结结果果不不是是偶偶然然得得到的,或者说,不是靠机遇能够得到的到的,或者说,不是靠机遇能够得到的3.3.如果得到这样的样本概率如果得到这样的样本概率(P)(P)很小,则拒绝原假设很小,则拒绝原假设 在在这这么么小小的的概概率率下下竟竟然然得得到到了了这这样样的的一一个个样样本本,表表明明这这样样的的样样本本经
40、经常常出现,所以,样本结果是显著的出现,所以,样本结果是显著的统计上显著不一定有实际意义第46页/共110页2008年8月统计上显著不一定有实际意义1.1.在在进进行行决决策策时时,我我们们只只能能说说P P值值越越小小,拒拒绝绝原原假假设设的证据就越强,检验的结果也就越显著的证据就越强,检验的结果也就越显著2.2.但但P P值值很很小小而而拒拒绝绝原原假假设设时时,并并不不一一定定意意味味着着检检验验的结果就有实际意义的结果就有实际意义 因因为为假假设设检检验验中中所所说说的的“显显著著”仅仅仅仅是是“统统计计意意义义上上的显著的显著”一一个个在在统统计计上上显显著著的的结结论论在在实实际际
41、中中却却不不见见得得就就很很重重要要,也不意味着就有实际意义也不意味着就有实际意义3.3.因因为为值值与与样样本本的的大大小小密密切切相相关关,样样本本量量越越大大,检检验验统统计计量量的的P P值值也也就就越越大大,P P值值就就越越小小,就就越越有有可可能拒绝原假设能拒绝原假设第47页/共110页2008年8月统计上显著不一定有实际意义1.1.如果你主观上要想拒绝原假设那就一定能拒绝它如果你主观上要想拒绝原假设那就一定能拒绝它 这类似于我们通常所说的这类似于我们通常所说的“欲加之罪,何患无词欲加之罪,何患无词”只要你无限制扩大样本量,几乎总能拒绝原假设只要你无限制扩大样本量,几乎总能拒绝原
42、假设2.2.当样本量很大时,解释假设检验的结果需要小心当样本量很大时,解释假设检验的结果需要小心 在在大大样样本本情情况况下下,总总能能把把与与假假设设值值的的任任何何细细微微差差别别都都能查出来,即使这种差别几乎没有任何实际意义能查出来,即使这种差别几乎没有任何实际意义3.3.在在实实际际检检验验中中,不不要要刻刻意意追追求求“统统计计上上的的”显显著著性性,也也不不要要把把统统计计上上的的显显著著性性与与实实际际意意义义上上的的显显著性混同起来著性混同起来 一一个个在在统统计计上上显显著著的的结结论论在在实实际际中中却却不不见见得得很很重重要要,也不意为着就有实际意义也不意为着就有实际意义
43、第48页/共110页6.2 一个总体参数的检验 6.2.1 总体均值的检验 6.2.2 总体比例的检验 6.2.3 总体方差的检验第 6 章 假设检验第49页/共110页6.2.1 总体均值的检验 (大样本)6.2 一个总体参数的检验第50页/共110页2008年8月总体均值的检验(大样本)1.1.假定条件假定条件 大样本大样本(n n 30)30)2.2.使用使用z z检验统计量检验统计量 2 2 已知:已知:2 2 未知:未知:第51页/共110页2008年8月总体均值的检验(2 已知)(例题分析大样本)【例例】一一种种罐罐装装饮饮料料采采用用自自动动生生产产线线生生产产,每每罐罐的的容容
44、量量是是255ml255ml,标标准准差差为为5ml5ml。为为检检验验每每罐罐容容量量是是否否符符合合要要求求,质质检检人人员员在在某某天天生生产产的的饮饮料料中中随随机机抽抽取取了了4040罐罐进进行行检检验验,测测得得每每罐罐平平均均容容量量为为255.8ml255.8ml。取取显显著著性性水水平平=0.05=0.05 ,检检验验该该天生产的饮料容量是否符合标准要求?天生产的饮料容量是否符合标准要求?双侧检验双侧检验第52页/共110页2008年8月总体均值的检验(2 已知)(例题分析大样本)HH0 0 :=255=255HH1 1 :255255 =0.050.05n n =4040临
45、界值临界值(c c):):检验统计量检验统计量:决策决策:结论结论:用用ExcelExcel中的中的【NORMSDISTNORMSDIST】函数得到的双尾检验函数得到的双尾检验P=0.312945P=0.312945不拒绝不拒绝H H0 0没没有有证证据据表表明明该该天天生生产产的的饮饮料料不符合标准要求不符合标准要求 z z0 01.961.96-1.96-1.960.0050.005拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0050.005第53页/共110页2008年8月总体均值的检验(z检验)(P 值的计算与应用)第第1 1步:步:进入进入ExcelExcel表格界面,直接点击表
46、格界面,直接点击【fxfx】第第2 2步:步:在函数分类中点击在函数分类中点击【统计统计】,并在函数名,并在函数名 菜菜单单下下选选择择【NORMSDISTNORMSDIST】,然然后后【确定确定】第第3 3步:步:将将 z z 的绝对值的绝对值1.011.01录入,得到的函数值为录入,得到的函数值为 0.8437523450.843752345 P P值值=2(1-=2(1-0.8437523450.843752345)=)=0.3124950.312495 P P值远远大于值远远大于,故不拒绝,故不拒绝HH0 0第54页/共110页2008年8月总体均值的检验(2 未知)(例题分析大样本)
47、【例例】一一种种机机床床加加工工的的零零件件尺尺 寸寸 绝绝 对对 平平 均均 误误 差差 为为1.35mm1.35mm。生生 产产 厂厂 家家 现现 采采 用用一一种种新新的的机机床床进进行行加加工工以以期期进进一一步步降降低低误误差差。为为检检验验新新机机床床加加工工的的零零件件平平均均误误差差与与旧旧机机床床相相比比是是否否有有显显著著降降低低,从从某某天天生生产产的的零零件件中中随随机机抽抽取取5050个个进进行行检检验验。利利用用这这些些样样本本数数据据,检检验验新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差差与与旧旧机机床床相相比比是是否否有有显显著著降降低低?(=0.
48、01)=0.01)左侧检验左侧检验5050个零件尺寸的误差数据个零件尺寸的误差数据个零件尺寸的误差数据个零件尺寸的误差数据 (mmmm)1.261.261.191.191.311.310.970.971.811.811.131.130.960.961.061.061.001.000.940.940.980.981.101.101.121.121.031.031.161.161.121.121.121.120.950.951.021.021.131.131.231.230.740.741.501.500.500.500.590.590.990.991.451.451.241.241.011.01
49、2.032.031.981.981.971.970.910.911.221.221.061.061.111.111.541.541.081.081.101.101.641.641.701.702.372.371.381.381.601.601.261.261.171.171.121.121.231.230.820.820.860.86第55页/共110页2008年8月总体均值的检验(例题分析大样本)HH0 0 :1.351.35HH1 1 :1.351.35 =0.010.01n n =5050临界值临界值(c c):):检验统计量检验统计量:拒绝拒绝H H0 0新新机机床床加加工工的的零零件
50、件尺尺寸寸的的平平均均误误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决策:结论结论:-2.33-2.33z z0 0拒绝拒绝H H0 00.010.01第56页/共110页2008年8月总体均值的检验(P 值的计算与应用大样本)第第1 1步:步:进入进入ExcelExcel表格界面,直接点击表格界面,直接点击【f f(x x)】第第2 2步步:在在函函数数分分类类中中点点击击【统统计计】,并并在在函函数数名名的的菜菜单单下选下选 择择【ZTESTZTEST】,然后,然后【确定确定】第第3 3步步:在在所所出出现现的的对对话话框框【ArrayArray】框框中中,输输入入原原始始数数据