《统计学总体参数的假设检验.pptx》由会员分享,可在线阅读,更多相关《统计学总体参数的假设检验.pptx(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计学总体参数的假设检验统计学总体参数的假设检验n n如果一个人说他从来没有骂过人。如果一个人说他从来没有骂过人。他能够证明吗?他能够证明吗?n n要证明他没有骂过人,他必须出要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录示他从小到大每一时刻的录音录像,所有书写的东西等等,还要像,所有书写的东西等等,还要证明这些物证是完全的、真实的、证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。没有间断的。这简直是不可能的。n n即使他找到一些证人,比如他的即使他找到一些证人,比如他的同学、家人和同事,那也只能够同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,证明在那
2、些证人在场的某些片刻,他没有被听到骂人。他没有被听到骂人。第1页/共67页n n反过来,如果要证明这个人反过来,如果要证明这个人骂过人很容易,只要有一次骂过人很容易,只要有一次被抓住就足够了。被抓住就足够了。n n看来,企图肯定什么事物很看来,企图肯定什么事物很难,而否定却要相对容易得难,而否定却要相对容易得多。这就是假设检验背后的多。这就是假设检验背后的哲学。哲学。n n科学总往往是在否定中发展科学总往往是在否定中发展第2页/共67页n n在假设检验中,一般要设立在假设检验中,一般要设立一个一个原假设原假设(上面的(上面的“从来从来没骂过人没骂过人”就是一个例子);就是一个例子);n n而设
3、立该假设的动机主要是而设立该假设的动机主要是企图利用人们掌握的反映现企图利用人们掌握的反映现实世界的数据来找出假设与实世界的数据来找出假设与现实之间的矛盾,从而否定现实之间的矛盾,从而否定这个假设。这个假设。第3页/共67页n n在多数统计教科书中在多数统计教科书中(除理论除理论探讨外探讨外)假设检验都是以否定假设检验都是以否定原假设为目标。原假设为目标。n n如否定不了,说明证据不足,如否定不了,说明证据不足,无法否定原假设。但不能说无法否定原假设。但不能说明原假设正确。明原假设正确。n n就像一两次没有听过他骂人就像一两次没有听过他骂人还远不能证明他从来没有骂还远不能证明他从来没有骂过人。
4、过人。第4页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n先先要要提提出出个个原原假假设设,比比如如某某正正态态总总体体的的均均值值等等于于5(m m=5)。这这种种原原假假设设也也称称为为零假设零假设(null hypothesis),记为,记为H0。n n与与此此同同时时必必须须提提出出备备选选假假设设(或或称称为为备备择择假假设设,alternative hypothesis),比比如如总总体体均均值值大大于于5(m m5)。备备选选假假设设记记为为H1或或Ha。形形式式上上,这这个个关关于于总总体体均值的均值的H0相对于相对于H1的检验记为的检验记为第5页/共67页6
5、.1 假设检验的过程和假设检验的过程和逻辑逻辑n n备备选选假假设设应应该该按按照照实实际际世世界界所所代代表表的的方方向向来来确确定定,即即它它通通常常是是被被认认为为可可能能比零假设更符合数据所代表的现实。比零假设更符合数据所代表的现实。n n比比如如上上面面的的H1为为m m5;这这意意味味着着,至至少样本均值应该大于少样本均值应该大于5;n n至于是否显著,依检验结果而定。至于是否显著,依检验结果而定。n n检检验验结结果果显显著著(significant)意意味味着着有有理理由由拒拒绝绝零零假假设设。因因此此,假假设设检检验验也也被被称为称为显著性检验显著性检验(significan
6、t test)。第6页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n有有了了两两个个假假设设,就就要要根根据据数数据据来来对对它它们进行判断。们进行判断。n n数数据据的的代代表表是是作作为为其其函函数数的的统统计计量量;它它在在检检验验中中被被称称为为检检验验统统计计量量(test statistic)。n n根根据据零零假假设设(不不是是备备选选假假设设!),可可得得到到该该检检验验统统计计量量的的分分布布;再再看看这这个个统统计计量量的的数数据据实实现现值值(realization)属不属于小概率事件。属不属于小概率事件。第7页/共67页6.1 假设检验的过程和假设检验
7、的过程和逻辑逻辑n n也也就就是是说说把把数数据据代代入入检检验验统统计计量量,看看其其值值是是否否落落入入零零假假设设下下的的小小概概率范畴率范畴;n n如如果果的的确确是是小小概概率率事事件件,那那么么就就有有可可能能拒拒绝绝零零假假设设,或或者者说说“该该检验显著,检验显著,”n n否否则则说说“没没有有足足够够证证据据拒拒绝绝零零假假设设”,或者,或者“该检验不显著。该检验不显著。”第8页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n注注意意:在在我我们们所所涉涉及及的的问问题题中中,零零假假设和备选假设在假设检验中并不对称。设和备选假设在假设检验中并不对称。n n因
8、因检检验验统统计计量量的的分分布布是是从从零零假假设设导导出出的的,因因此此,如如果果发发生生矛矛盾盾,就就对对零零假假设不利了。设不利了。n n不不发发生生矛矛盾盾也也不不能能说说明明零零假假设设没没有有问问题。题。第9页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n在在零零假假设设下下,检检验验统统计计量量取取其其实实现现值值及及(沿沿着着备备选选假假设设的的方方向向)更更加加极极端端值的概率称为值的概率称为p-值(值(p-value)。n n如如果果得得到到很很小小的的p-值值,就就意意味味着着在在零零假设下小概率事件发生了。假设下小概率事件发生了。n n如如果果小小概
9、概率率事事件件发发生生,是是相相信信零零假假设设,还是相信数据呢?还是相信数据呢?n n当然多半是相信数据,拒绝零假设。当然多半是相信数据,拒绝零假设。第10页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n但但小小概概率率并并不不能能说说明明不不会会发发生生,仅仅仅仅发发生生的的概概率率很很小小罢罢了了。拒拒绝绝正正确确零零假假设设的的错错误误常常被被称称为为第第一一类类错错误误(type I error)。n n在在备备选选假假设设正正确确时时反反而而说说零零假假设设正正确确的的错错误误,称称为为第第二二类类错错误误(type II error)。在在本本书书的的假假设设检
10、检验验问问题题中中,由由于于备备选选假假设设不不是是一一个个点点,所所以无法算出犯第二类错误的概率。以无法算出犯第二类错误的概率。第11页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n零零假假设设和和备备选选假假设设哪哪一一个个正正确确,是是确确定定性性的的,没没有有概概率率可可言言。而而可可能能犯犯错错误的是人。误的是人。n n涉涉及及假假设设检检验验的的犯犯错错误误的的概概率率就就是是犯犯第第一一类类错错误误的的概概率率和和犯犯第第二二类类错错误误的的概率。概率。n n负负责责任任的的态态度度是是无无论论做做出出什什么么决决策策,都应该给出该决策可能犯错误的概率。都应该给
11、出该决策可能犯错误的概率。第12页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n到到到到底底底底p p-值值值值是是是是多多多多小小小小时时时时才才才才能能能能够够够够拒拒拒拒绝绝绝绝零零零零假假假假设设设设呢呢呢呢?也就是说,需要有什么是小概率的标准。也就是说,需要有什么是小概率的标准。也就是说,需要有什么是小概率的标准。也就是说,需要有什么是小概率的标准。n n这这这这要要要要看看看看具具具具体体体体应应应应用用用用的的的的需需需需要要要要。但但但但在在在在一一一一般般般般的的的的统统统统计计计计书书书书和和和和软软软软件件件件中中中中,使使使使用用用用最最最最多多多多的
12、的的的标标标标准准准准是是是是在在在在零零零零假假假假设设设设下下下下(或或或或零零零零假假假假设设设设正正正正确确确确时时时时)根根根根据据据据样样样样本本本本所所所所得得得得的的的的数数数数据据据据来来来来拒拒拒拒绝绝绝绝零零零零假假假假设设设设的的的的概概概概率率率率应应应应小小小小于于于于0.050.05,当当当当然然然然也可能是也可能是也可能是也可能是0.010.01,0.0050.005,0.0010.001等等。等等。等等。等等。n n这这这这 种种种种 事事事事 先先先先 规规规规 定定定定 的的的的 概概概概 率率率率 称称称称 为为为为 显显显显 著著著著 性性性性 水水水
13、水 平平平平(significant level)(significant level),用字母,用字母,用字母,用字母a a a a来表示。来表示。来表示。来表示。第13页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n na a a a并并并并不不不不一一一一定定定定越越越越小小小小越越越越好好好好,因因因因为为为为这这这这很很很很可可可可能能能能导导导导致致致致不不不不容容容容易易易易拒拒拒拒绝绝绝绝零零零零假假假假设设设设,使使使使得得得得犯犯犯犯第第第第二二二二类类类类错错错错误误误误的的的的概概概概率增大。率增大。率增大。率增大。n n当当当当p-p-值值值值小小小小于
14、于于于或或或或等等等等于于于于a a a a时时时时,就就就就拒拒拒拒绝绝绝绝零零零零假假假假设设设设。所所所所以以以以,a a a a是是是是所所所所允允允允许许许许的的的的犯犯犯犯第第第第一一一一类类类类错错错错误误误误概概概概率率率率的的的的最最最最大大大大值值值值。当当当当p-p-值值值值小小小小于于于于或或或或等等等等于于于于a a a a时时时时,就就就就说说说说这这这这个个个个检检检检验验验验是显著的。是显著的。是显著的。是显著的。n n无无无无论论论论统统统统计计计计学学学学家家家家用用用用多多多多大大大大的的的的a a a a作作作作为为为为显显显显著著著著性性性性水水水水平
15、平平平都都都都不不不不能能能能脱脱脱脱离离离离实实实实际际际际问问问问题题题题的的的的背背背背景景景景。统统统统计计计计显显显显著著著著不不不不一一一一定等价于实际显著。反过来也一样。定等价于实际显著。反过来也一样。定等价于实际显著。反过来也一样。定等价于实际显著。反过来也一样。第14页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:n n1.1.写出零假设和备选假设;写出零假设和备选假设;写出零假设和备选假设;写出零假设和备选假设;n n2.2.确定
16、检验统计量;确定检验统计量;确定检验统计量;确定检验统计量;n n3.3.确定显著性水平确定显著性水平确定显著性水平确定显著性水平a a a a;n n4.4.根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;n n5.5.根据这个实现值计算根据这个实现值计算根据这个实现值计算根据这个实现值计算p-p-值;值;值;值;n n6.6.进进进进行行行行判判判判断断断断:如如如如果果果果p-p-值值值值小小小小于于于于或或或或等等等等于于于于a a a a,就就就就拒拒拒拒绝绝绝绝零零零零假假假假设设设设,这这这这时时时时
17、犯犯犯犯(第第第第一一一一类类类类)错错错错误误误误的的的的概概概概率率率率最最最最多多多多为为为为a a a a;如如如如果果果果p-p-值值值值大大大大于于于于a a a a,就就就就不不不不拒拒拒拒绝绝绝绝零零零零假假假假设,因为证据不足。设,因为证据不足。设,因为证据不足。设,因为证据不足。第15页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n实实实实际际际际上上上上,多多多多数数数数计计计计算算算算机机机机软软软软件件件件仅仅仅仅仅仅仅仅给给给给出出出出p-p-值值值值,而不给出而不给出而不给出而不给出a a a a。这有很多方便之处。这有很多方便之处。这有很多方便
18、之处。这有很多方便之处。n n比比比比如如如如a a a a=0.05=0.05,而而而而假假假假定定定定所所所所得得得得到到到到的的的的p-p-值值值值等等等等于于于于0.0010.001。这这这这时时时时如如如如果果果果采采采采用用用用p-p-值值值值作作作作为为为为新新新新的的的的显显显显著著著著性性性性水水水水平平平平,即即即即新新新新的的的的a a a a=0.001=0.001,于于于于是是是是就就就就可可可可以以以以说说说说,在在在在显著性水平为显著性水平为显著性水平为显著性水平为0.0010.001时,拒绝零假设。时,拒绝零假设。时,拒绝零假设。时,拒绝零假设。n n这这这这样
19、样样样,拒拒拒拒绝绝绝绝零零零零假假假假设设设设时时时时犯犯犯犯错错错错误误误误的的的的概概概概率率率率实实实实际际际际只只只只是是是是千千千千分分分分之之之之一一一一而而而而不不不不是是是是旧旧旧旧的的的的a a a a所所所所表表表表明明明明的的的的百百百百分分分分之之之之五五五五。在在在在这这这这个个个个意意意意义义义义上上上上,p-p-值值值值又又又又称称称称为为为为观观观观测测测测的的的的显显显显著著著著性性性性水平(水平(水平(水平(observed significant levelobserved significant level)。第16页/共67页6.1 假设检验的过程和
20、假设检验的过程和逻辑逻辑n n在在在在统统统统计计计计软软软软件件件件输输输输出出出出p-p-值值值值的的的的位位位位置置置置,有有有有的的的的用用用用“p-p-value”value”,有有有有的的的的用用用用significantsignificant的的的的缩缩缩缩写写写写“Sig”Sig”就就就就是这个道理。是这个道理。是这个道理。是这个道理。n n根根根根据据据据数数数数据据据据产产产产生生生生的的的的p-p-值值值值来来来来减减减减少少少少a a a a的的的的值值值值以以以以展展展展示示示示结结结结果的精确性总是没有害处的。果的精确性总是没有害处的。果的精确性总是没有害处的。果的
21、精确性总是没有害处的。n n这这这这好好好好比比比比一一一一个个个个身身身身高高高高180180厘厘厘厘米米米米的的的的男男男男生生生生,可可可可能能能能愿愿愿愿意意意意被被被被认认认认为为为为高高高高于于于于或或或或等等等等于于于于180180厘厘厘厘米米米米,而而而而不不不不愿愿愿愿意意意意说说说说他他他他高高高高于于于于或或或或等等等等于于于于155155厘厘厘厘米米米米,虽虽虽虽然然然然这这这这第第第第二二二二种种种种说说说说法法法法数数数数学上没有丝毫错误。学上没有丝毫错误。学上没有丝毫错误。学上没有丝毫错误。第17页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n关
22、关于于“临临界界值值”的的注注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临临界界值值(critical value),它定义为,统计量取该值或更极端的值的概率等于a。也就是说,“统统计计量量的的实实现现值值比比临临界界值值更更极极端端”等等价价于于“p-值值小小于于a a”。使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。第18页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n使使使使用用用用临临临临界界界界值值值值而而而而不不不不是是是是p-p-值值值值来来来来判判判判断断断断拒拒拒拒绝绝绝绝与与与与否否否否是是是是前前前前计计
23、计计算算算算机机机机时时时时代代代代的的的的产产产产物物物物。当当当当时时时时计计计计算算算算p-p-值值值值不不不不易易易易,只只只只采采采采用用用用临临临临界界界界值值值值的的的的概概概概念念念念。但但但但从从从从给给给给定定定定的的的的a a a a求求求求临临临临界界界界值值值值同同同同样样样样也也也也不不不不容容容容易易易易,好好好好在在在在习习习习惯惯惯惯上上上上仅仅仅仅仅仅仅仅在在在在教教教教科科科科书书书书中中中中列列列列出出出出相相相相应应应应于于于于特特特特定定定定分分分分布布布布的的的的几几几几个个个个有有有有限限限限的的的的a a a a临临临临界界界界 值值值值(比比
24、比比 如如如如 a a a a=0.05=0.05,a a a a=0.025=0.025,a a a a=0.01=0.01,a a a a=0.005=0.005,a a a a=0.001=0.001等等等等等等等等),或或或或者者者者根根根根据据据据分分分分布布布布表反过来查临界值(很不方便也很粗糙)。表反过来查临界值(很不方便也很粗糙)。表反过来查临界值(很不方便也很粗糙)。表反过来查临界值(很不方便也很粗糙)。n n现现现现在在在在计计计计算算算算机机机机软软软软件件件件大大大大都都都都不不不不给给给给出出出出a a a a和和和和临临临临界界界界值值值值,但但但但都都都都给给给给
25、出出出出p-p-值值值值和和和和统统统统计计计计量量量量的的的的实实实实现现现现值值值值,让让让让用用用用户户户户自自自自己决定显著性水平是多少。己决定显著性水平是多少。己决定显著性水平是多少。己决定显著性水平是多少。第19页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n在在在在一一一一些些些些统统统统计计计计教教教教科科科科书书书书中中中中会会会会有有有有不不不不能能能能拒拒拒拒绝绝绝绝零零零零假假假假设设设设就就就就“接接接接受受受受零零零零假假假假设设设设”的的的的说说说说法法法法。这这这这种种种种说说说说法法法法是是是是不不不不严格的。严格的。严格的。严格的。n n首
26、首首首先先先先,如如如如果果果果你你你你说说说说“接接接接受受受受零零零零假假假假设设设设”,那那那那么么么么就就就就应应应应该该该该负负负负责责责责任任任任地地地地提提提提供供供供接接接接受受受受零零零零假假假假设设设设时时时时可可可可能能能能犯犯犯犯第第第第二二二二类类类类错错错错误误误误的的的的概概概概率率率率。这这这这就就就就要要要要算算算算出出出出在在在在备备备备选选选选假假假假设设设设正正正正确确确确的的的的情情情情况况况况下下下下错错错错误误误误接接接接受受受受零零零零假假假假设设设设的的的的概概概概率率率率。但但但但是是是是,这这这这只只只只有有有有在在在在备备备备选选选选假假
27、假假设设设设仅仅仅仅仅仅仅仅是是是是一一一一个个个个与与与与零零零零假假假假设设设设不不不不同同同同的的的的确确确确定定定定值值值值(而而而而不不不不是是是是范范范范围围围围)时时时时才才才才有有有有可可可可能。能。能。能。n n多多多多数数数数基基基基本本本本统统统统计计计计教教教教科科科科书书书书的的的的备备备备选选选选假假假假设设设设是是是是一一一一个个个个范范范范围而根本无法确定犯第二类错误的概率。围而根本无法确定犯第二类错误的概率。围而根本无法确定犯第二类错误的概率。围而根本无法确定犯第二类错误的概率。第20页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n在在许许多
28、多统统计计教教科科书书中中,往往往往把把一一系系列列不不能能拒拒绝绝零零假假设设的的检检验验当当成成接接受受这这些些假设的通行证。假设的通行证。n n比比如如不不能能拒拒绝绝某某样样本本的的正正态态性性就就变变成成了证明了该样本是正态的等等。了证明了该样本是正态的等等。n n不不能能拒拒绝绝这这些些零零假假设设,仅仅仅仅说说明明根根据据所所使使用用的的检检验验方方法法(或或检检验验统统计计量量)和和当当前前的的数数据据没没有有足足够够证证据据拒拒绝绝这这些些假设而已。假设而已。第21页/共67页6.1 假设检验的过程和假设检验的过程和逻辑逻辑n n对对于于同同一一个个假假设设检检验验问问题题,
29、往往往往都都有有多多个个检检验验统统计计量量;而而且且人人们们还还在在构构造造更优良的检验统计量。更优良的检验统计量。n n人人们们不不可可能能把把所所有有的的目目前前存存在在的的和和将将来可能存在的检验都实施。来可能存在的检验都实施。n n因因此此,只只能能够够说说,按按照照目目前前的的证证据据,不不足足以以拒拒绝绝零零假假设设而而已已。后后面面将将会会用用例例子子说说明明“接接受受零零假假设设”的的说说法法是是不不妥当的。妥当的。第22页/共67页6.2 对于正态总体均值的检对于正态总体均值的检验验6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行
30、检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n例例例例6.16.1一一一一个个个个顾顾顾顾客客客客买买买买了了了了一一一一包包包包标标标标有有有有500g500g重重重重的的的的一一一一包包包包红红红红糖糖糖糖,觉觉觉觉得得得得份份份份量量量量不不不不足足足足,于于于于是是是是找找找找到到到到监监监监督督督督部部部部门门门门;当当当当然然然然他他他他们们们们会会会会觉觉觉觉得得得得一一一一包包包包份份份份量量量量不不不不够够够够可可可可能能能能是是是是随随随随机机机机的的的的。于于于于是是是是监监监监督督督督部部部部门门门门就就就就去去去去商商商商店店店店称
31、称称称了了了了5050包包包包红红红红糖糖糖糖(数数数数据据据据在在在在sugar.txtsugar.txt);其其其其中中中中均均均均值值值值(平平平平均均均均重重重重量量量量)是是是是498.35g498.35g;这这这这的的的的确确确确比比比比500g500g少少少少,但但但但这这这这是是是是否否否否能能能能够够够够说说说说明明明明厂厂厂厂家家家家生生生生产产产产的的的的这这这这批批批批红红红红糖糖糖糖平平平平均均均均起起起起来来来来不不不不够够够够份份份份量量量量呢呢呢呢?于于于于是是是是需需需需要要要要统统统统计计计计检检检检验验验验。可可可可以以以以画画画画出这些重量的直方图出这些
32、重量的直方图出这些重量的直方图出这些重量的直方图第23页/共67页50包红糖重量的直方图包红糖重量的直方图 第24页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n这这这这个个个个直直直直方方方方图图图图看看看看上上上上去去去去象象象象是是是是正正正正态态态态分分分分布布布布的的的的样样样样本本本本。不妨假定这一批袋装红糖有正态分布。不妨假定这一批袋装红糖有正态分布。不妨假定这一批袋装红糖有正态分布。不妨假定这一批袋装红糖有正态分布。n n由由由由于于于于厂厂
33、厂厂家家家家声声声声称称称称每每每每袋袋袋袋500g500g(标标标标明明明明重重重重量量量量),因因因因此此此此零零零零假假假假设设设设为为为为总总总总体体体体均均均均值值值值等等等等于于于于500g500g(被被被被怀怀怀怀疑疑疑疑对对对对象总是放在零假设);象总是放在零假设);象总是放在零假设);象总是放在零假设);n n而而而而且且且且由由由由于于于于样样样样本本本本均均均均值值值值少少少少于于于于500g(500g(这这这这是是是是怀怀怀怀疑疑疑疑的的的的根根根根据据据据),把把把把备备备备选选选选假假假假设设设设定定定定为为为为总总总总体体体体均均均均值值值值少少少少于于于于500
34、g500g(备备备备选选选选假假假假设设设设为为为为单单单单向向向向不不不不等等等等式式式式的的的的检检检检验验验验称称称称为为为为单单单单尾尾尾尾检验检验检验检验,为不等号为不等号为不等号为不等号“”“”的称为双尾检验的称为双尾检验的称为双尾检验的称为双尾检验)第25页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n检检验验统统计计量量就就是是第第四四章章引引进进的的作作为为对对均值的某种标准化的均值的某种标准化的o符符号号中中的的m m0通通常常表表示示为
35、为零零假假设设中中的的均均值值(这这里里是是500)。在在零零假假设设之之下下,它它有有自自由由度度为为n-1=49的的t分分布布。当当然然实实际际上上不不必必代代入入这这个个公公式式去去手手工工计计算算了了,让计算机去代劳好了。让计算机去代劳好了。第26页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n计计计计算算算算结结结结果果果果是是是是t t=-2.696=-2.696(也也也也称称称称为为为为t t值值值值),同同同同时时时时得得得得到到到到p-p-
36、值值值值为为为为0.0050.005(由由由由于于于于计计计计算算算算机机机机输输输输出出出出的的的的为为为为双双双双尾尾尾尾检检检检验验验验的的的的p-p-值值值值,比比比比单单单单尾尾尾尾的的的的大大大大一一一一倍倍倍倍,应应应应该该该该除除除除以以以以2 2)。看看看看来来来来可可可可以以以以选选选选择择择择显显显显著著著著性性性性水水水水平平平平为为为为0.0050.005,并并并并宣宣宣宣称称称称拒拒拒拒绝绝绝绝零零零零假假假假设设设设,而而而而错错错错误误误误拒拒拒拒绝绝绝绝的的的的概概概概率率率率为为为为0.0050.005。第27页/共67页统计量统计量t=-2.696相应于左
37、边相应于左边尾概率(尾概率(p-值)值)0.005 第28页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n上上 面面 例例 子子 的的 备备 选选 假假 设设 为为 小小 于于(“”)某某个值的情况。个值的情况。n n取取备备选选假假设设为为均均值值大大于于或或小小于于某某个个值值的的检检验验称称为为单单尾尾检检验验(one-tailed test,也也称称为为单单侧侧检检验验或或单单边边检检验验)。下下面面举举一一个个选选假假设设为为均均值大于(值大于(“
38、”)某个值的例子。)某个值的例子。第29页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n例例例例6.26.2(exh.txtexh.txt)汽汽汽汽车车车车厂厂厂厂商商商商声声声声称称称称其其其其发发发发动动动动机机机机排排排排放放放放标标标标准准准准的的的的一一一一个个个个指指指指标标标标平平平平均均均均低低低低于于于于2020个个个个单单单单位位位位。在在在在抽抽抽抽查查查查了了了了1010台台台台发发发发动动动动机机机机之之之之后后后后,得得得得到到到
39、到下下下下面面面面的的的的排排排排放放放放数数数数据据据据:17.017.0、21.721.7、17.917.9、22.922.9、20.720.7、22.422.4、17.317.3、21.821.8、24.224.2、25.425.4。该该该该 样样样样 本本本本 均均均均 值值值值 为为为为21.1321.13。究究究究竟竟竟竟能能能能否否否否由由由由此此此此认认认认为为为为该该该该指指指指标标标标均均均均值值值值超超超超过过过过2020?这次的假设检验问题就是?这次的假设检验问题就是?这次的假设检验问题就是?这次的假设检验问题就是第30页/共67页6.2.1 6.2.1 根据一个样本对
40、其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n和和和和前前前前面面面面的的的的例例例例子子子子的的的的方方方方法法法法类类类类似似似似,可可可可以以以以发发发发现现现现p-p-值值值值为为为为0.12430.1243(计计计计算算算算机机机机输输输输出出出出的的的的双双双双尾尾尾尾检检检检验验验验的的的的p-p-值值值值除除除除以以以以2 2),因因因因此此此此,没没没没有有有有证证证证据据据据否否否否定定定定零零零零假假假假设设设设。这这这这时时时时的的的的检检检检验验验验统统统统计计计计量量量量t t
41、=1.2336=1.2336。也也也也可可可可以以以以画画画画出出出出类类类类似似似似于于于于图图图图6.26.2的的的的图图图图(图图图图6.36.3)这这这这时时时时的的的的t t分分分分布布布布的的的的自自自自由由由由度度度度为为为为9 9。下面是结果的计算机输出:。下面是结果的计算机输出:。下面是结果的计算机输出:。下面是结果的计算机输出:第31页/共67页统计量统计量t=1.2336相应于右边相应于右边尾概率(尾概率(p-值)值)0.1243 第32页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小
42、进行检验根据一个样本对其总体均值大小进行检验n n注注注注意意意意:在在在在假假假假设设设设检检检检验验验验中中中中往往往往往往往往也也也也用用用用带带带带等等等等号号号号的的的的不不不不等式来表示零假设,比如上述的检验记为等式来表示零假设,比如上述的检验记为等式来表示零假设,比如上述的检验记为等式来表示零假设,比如上述的检验记为o但但这这里里用用于于计计算算p-值值的的零零假假设设还还是是m m=20;但但如如果果能能够够拒拒绝绝零零假假设设m m=20,那那么么对对于于任任何何m m小小于于20的的零零假假设设就就更更有有理理由由拒拒绝绝了了。这这和和以以拒拒绝绝零零假假设设为为初衷的假设
43、检验思维方式是一致的。初衷的假设检验思维方式是一致的。第33页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n还还有有所所谓谓的的双双尾尾检检验验(two tailed test,也称为也称为双侧检验双侧检验或或双边检验双边检验)问题,即问题,即o在在这这种种情情况况下下,尾尾概概率率不不仅仅是是左左边边或或右右边边的的一一个个尾尾概概率率,而而是是两两边边尾尾概概率率之之和和。因因此此如如果果是是一一个个单单尾尾检检验验问问题题,用用了了双双尾尾检检验验的的
44、模模式式,p-值值就就比比用用单单尾检验时大了一倍。尾检验时大了一倍。第34页/共67页6.2.1 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验n n如如果果上上面面发发动动机机排排放放指指标标例例子子的的检检验验问问题题改改为为是是否否该该发发动动机机的的排排放放指指标标均均值等于值等于20。即。即o这这时时t统统计计量量还还是是取取原原来来的的值值1.2336,但但p-值值为为0.12432=0.2486。图图6.3就就变变成图成图6.4的样子的样子第35页/共67页统计量统计量
45、t=1.2336,而,而p-值等于值等于左右尾概率之和,即左右尾概率之和,即0.2486第36页/共67页6.2.2 6.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验n n例例6.3(数数据据:drug.txt)为为检检测测某某种种药药物物对对攻攻击击性性情情绪绪的的影影响响,对对处处理理组组的的100名名服服药药者者和和对对照照组组的的150名名非非服服药药者者进进行行心心理理测测试试,得得到到相相应应的的某某指指标标。要要检检验验处处理理组组指指标标的
46、的总总体体均均值值m m1是是否否等等于于对对照照组组指指标标的的总总体体均均值值m m2。相相应应的假设检验问题为:的假设检验问题为:或第37页/共67页6.2.2 6.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验n n通通通通 过过过过 计计计计 算算算算,t t统统统统 计计计计 量量量量 等等等等 于于于于 0.9420.942,p-p-值值值值 为为为为0.17350.1735(输输输输出出出出中中中中的的的的双双双双尾尾尾尾检检检检验验验验p-
47、p-值值值值的的的的一一一一半半半半)。因因因因此此此此无无无无法法法法拒拒拒拒绝绝绝绝零零零零假假假假设设设设,即即即即不不不不能能能能得得得得出出出出处处处处理理理理组组组组的的的的平平平平均均均均指指指指标标标标大大大大于于于于对对对对照照照照组组组组的的的的结结结结论论论论。计计计计算算算算机机机机输输输输出出出出的的的的相相相相应应应应表表表表格格格格(部部部部分分分分,删删删删除除除除了了了了置置置置信信信信区区区区间间间间部部部部分)为:分)为:分)为:分)为:第38页/共67页6.2.2 6.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体
48、均值的检验根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验n n注注注注意意意意:这这这这个个个个输输输输出出出出的的的的前前前前面面面面三三三三列列列列用用用用LeveneLevene的的的的F-F-检检检检验验验验来来来来看看看看这这这这两两两两个个个个样样样样本本本本所所所所代代代代表表表表的的的的总总总总体体体体之之之之方方方方差差差差是是是是否否否否相相相相等等等等(零零零零假假假假设设设设为为为为相相相相等等等等)。第第第第一一一一行行行行是是是是该该该该检检检检验验验验的的的的零零零零假假假假设设设设:两两两两个个个个总总总总体体体体方方方
49、方差差差差相相相相等等等等,而而而而第第第第二二二二行行行行为为为为备备备备选选选选假假假假设设设设:两两两两个个个个总总总总体体体体方方方方差差差差不不不不等等等等。如如如如果果果果该该该该检检检检验验验验显显显显著著著著,即即即即在在在在SigSig列列列列中中中中的的的的该该该该LeveneLevene检检检检验验验验p-p-值值值值很很很很小小小小(这这这这里里里里是是是是0.0080.008),就就就就应应应应该该该该看看看看第第第第二二二二行行行行备备备备选选选选假假假假设设设设的的的的t t检检检检验验验验输输输输出出出出,这这这这里里里里是是是是0.3470.347;由由由由于
50、于于于是是是是单单单单边边边边检检检检验验验验,p-p-值值值值0.347/2=0.17350.347/2=0.1735;如如如如果果果果LeveneLevene检检检检验验验验的的的的p-p-值值值值较较较较大大大大(本本本本例例例例并并并并不不不不大大大大),则则则则看看看看第第第第一一一一行行行行原原原原假假假假设设设设下下下下的的的的结结结结果果果果。之之之之所所所所以以以以要要要要检检检检验验验验总总总总体体体体方方方方差差差差,是是是是因因因因为为为为总总总总体体体体方差相同时使用的检验统计量与方差不同时使用的不同。方差相同时使用的检验统计量与方差不同时使用的不同。方差相同时使用的