《概率论第八章 假设检验优秀课件.ppt》由会员分享,可在线阅读,更多相关《概率论第八章 假设检验优秀课件.ppt(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率论第八章概率论第八章假设假设检验检验第1页,本讲稿共88页上一章介绍了对总体中未知参数的估计方法。上一章介绍了对总体中未知参数的估计方法。本章将讨论统计推断的另一个重要方面本章将讨论统计推断的另一个重要方面统计假设检验统计假设检验。出于某种需要,对未知的或不完。出于某种需要,对未知的或不完全明确的总体给出某些假设,用以说明总体可能全明确的总体给出某些假设,用以说明总体可能具备的某种性质,这种假设称为具备的某种性质,这种假设称为统计假设统计假设。如。如正正态分布态分布的假设,的假设,总体均值总体均值的假设等。这个假设是的假设等。这个假设是否成立,还需要考察,这一过程称为否成立,还需要考察,这
2、一过程称为假设检验假设检验,并最终作出判断,是接受假设还是拒绝假设。并最终作出判断,是接受假设还是拒绝假设。本章主要介绍假设检验的基本思想和常用的本章主要介绍假设检验的基本思想和常用的检验方法,重点解决正态总体参数的假设检验检验方法,重点解决正态总体参数的假设检验。第2页,本讲稿共88页 1假设检验的基本思想假设检验的基本思想一、一、假设检验问题的提出假设检验问题的提出二、假设检验的基本思想二、假设检验的基本思想三、假设检验中两类错误三、假设检验中两类错误第3页,本讲稿共88页统计推断的另一个重要问题是假设检验问题。统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式,但不
3、知其参在总体的分布函数未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的关于总体的假设。例如,提出总体服从泊松分布的假设,又如,对于正态总体提出数学期望假设,又如,对于正态总体提出数学期望 0的假的假设等。设等。这里,先结合例子来说明假设检验的基本思这里,先结合例子来说明假设检验的基本思想和做法。想和做法。假设检验就是根据样本对所提出的假设作出假设检验就是根据样本对所提出的假设作出判断:是判断:是接受接受,还是,还是拒绝拒绝。第4页,本讲稿共88页例例1已知某炼铁厂的铁水含碳量已知某炼
4、铁厂的铁水含碳量X在某种工艺条件在某种工艺条件下服从正态分布下服从正态分布N(4.55,0.1082)。现改变了工艺条件,。现改变了工艺条件,测了五炉铁水,其含碳量分别为:测了五炉铁水,其含碳量分别为:4.28,4.40,4.42,4.35,4.37根据以往的经验,总体的方差根据以往的经验,总体的方差 2=0.1082一般不会改变。一般不会改变。试问工艺条件改变后,铁水含碳量的均值有无改变?试问工艺条件改变后,铁水含碳量的均值有无改变?第5页,本讲稿共88页 显然,这里需要解决的问题是,如何根据样显然,这里需要解决的问题是,如何根据样本判断现在冶炼的铁水的含碳量是服从本判断现在冶炼的铁水的含碳
5、量是服从 4.55的的正态分布呢?还是与过去一样仍然服从正态分布呢?还是与过去一样仍然服从=4.55的的正态分布呢?若是前者,可以认为新工艺对铁水正态分布呢?若是前者,可以认为新工艺对铁水的含碳量有显著的影响;若是后者,则认为新工的含碳量有显著的影响;若是后者,则认为新工艺对铁水的含碳量没有显著影响。通常,选择其艺对铁水的含碳量没有显著影响。通常,选择其中之一作为假设后,再利用样本检验假设的真伪。中之一作为假设后,再利用样本检验假设的真伪。第6页,本讲稿共88页例例2某自动车床生产了一批铁钉,现从该批铁钉中某自动车床生产了一批铁钉,现从该批铁钉中随机抽取了随机抽取了11根,测得长度根,测得长度
6、(单位:单位:mm)数据为:数据为:10.41,10.32,10.62,40.18,10.77,10.64,10.82,10.49,10.38,10.59,10.54。试问铁钉的长度试问铁钉的长度X是否服从正态分布?是否服从正态分布?而在本例中,我们关心的问题是总体而在本例中,我们关心的问题是总体X是否服从是否服从正态分布。正态分布。如同例如同例1那样,选择那样,选择“是是”或或“否否”作为假设,作为假设,然后利用样本对假设的真伪作出判断。然后利用样本对假设的真伪作出判断。第7页,本讲稿共88页 以上两例都是实际问题中常见的假设检验问题。以上两例都是实际问题中常见的假设检验问题。我们把问题中涉
7、及到的假设称为我们把问题中涉及到的假设称为原假设原假设或称或称待检假待检假设设,一般用,一般用H0表示。而把与原假设对立的断言称为表示。而把与原假设对立的断言称为备备择假设择假设,记为,记为H1。如例如例1,若原假设为,若原假设为H0:=0=4.55,则备择假设,则备择假设为为H1:4.55。若例若例2的原假设为的原假设为H0:X服从正态分布,则备择假设服从正态分布,则备择假设为为H1:X不服从正态分布。不服从正态分布。第8页,本讲稿共88页 当然,在两个假设中用哪一个作为原假设,哪一当然,在两个假设中用哪一个作为原假设,哪一个作为备择假设,视具体问题的题设和要求而定。个作为备择假设,视具体问
8、题的题设和要求而定。在许多问题中,当总体分布的类型已知时,只对在许多问题中,当总体分布的类型已知时,只对其中一个或几个未知参数作出假设,这类问题通常称其中一个或几个未知参数作出假设,这类问题通常称之为之为参数假设检验参数假设检验,如例,如例1。而在有些问题中,当总体的分布完全不知或不确而在有些问题中,当总体的分布完全不知或不确切知道,就需要对总体分布作出某种假设,这种问题切知道,就需要对总体分布作出某种假设,这种问题称为称为分布假设检验分布假设检验,如例,如例2。第9页,本讲稿共88页接下来我们要做的事是:给出一个合理的法则,接下来我们要做的事是:给出一个合理的法则,根据这一法则,利用巳知样本
9、做出判断是接受假设根据这一法则,利用巳知样本做出判断是接受假设H0,还是拒绝假设,还是拒绝假设H0。第10页,本讲稿共88页二、假设检验的基本思想二、假设检验的基本思想假设检验的一般提法是:在给定备择假设假设检验的一般提法是:在给定备择假设H1下,下,利用样本对原假设利用样本对原假设H0作出判断,若拒绝原假设作出判断,若拒绝原假设H0,那,那就意味着接受备择假设就意味着接受备择假设H1,否则,就接受原假设,否则,就接受原假设H0。换句话说,假设检验就是要在原假设换句话说,假设检验就是要在原假设H0和备择假设和备择假设H1中作出拒绝哪一个和接受哪一个的判断。究竟如何中作出拒绝哪一个和接受哪一个的
10、判断。究竟如何作出判断呢?对一个统计假设进行检验的依据是所谓作出判断呢?对一个统计假设进行检验的依据是所谓小概率原理小概率原理,即,即概率很小的事件在一次试验中是几乎不可能发生概率很小的事件在一次试验中是几乎不可能发生概率很小的事件在一次试验中是几乎不可能发生概率很小的事件在一次试验中是几乎不可能发生!第11页,本讲稿共88页例如,在例如,在100件产品中,有一件次品,随机地件产品中,有一件次品,随机地从中取出一个产品是次品的事件就是小概率事件。从中取出一个产品是次品的事件就是小概率事件。因为此事件发生的概率因为此事件发生的概率=0.01很小,因此,从很小,因此,从中任意抽一件产品恰好是次品的
11、事件可认为几乎中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的,如果确实出现了次品,我们就有不可能发生的,如果确实出现了次品,我们就有理由怀疑这理由怀疑这“100件产品中只有一件次品件产品中只有一件次品”的真实的真实性。性。那么那么 取值多少才算是小概率呢?这就要视实取值多少才算是小概率呢?这就要视实际问题的需要而定,一般际问题的需要而定,一般 取取0.1,0.05,0.01等。等。第12页,本讲稿共88页以例以例1为例:首先建立假设为例:首先建立假设:H0:=0=4.55,H1:4.55。其次,从总体中作一随机抽样得到一样本观察其次,从总体中作一随机抽样得到一样本观察值值(x1,x2,
12、xn)。第13页,本讲稿共88页注意到注意到是的无偏估计量。因此,若是的无偏估计量。因此,若H0正确,则正确,则与与 0的偏差一般不应太大,即的偏差一般不应太大,即不应太大,若过分大,我们有理由怀疑不应太大,若过分大,我们有理由怀疑H0的正确性而拒的正确性而拒绝绝H0。由于。由于因此,考察因此,考察的大小等价于考察的大小等价于考察的大小,哪么如何判断的大小,哪么如何判断是否偏大呢?是否偏大呢?第14页,本讲稿共88页具体设想是,对给定的小正数具体设想是,对给定的小正数,由于事件,由于事件是概率为是概率为 的小概率事件,即的小概率事件,即因此,当用样本值代入统计量因此,当用样本值代入统计量具体计
13、算得到其观察值具体计算得到其观察值第15页,本讲稿共88页统计量统计量称为检验统计量。称为检验统计量。当检验统计量取某个区域当检验统计量取某个区域C中的值时,就拒绝中的值时,就拒绝H0,则称则称C为为H0的拒绝域,拒绝域的边界点称为临界值。如的拒绝域,拒绝域的边界点称为临界值。如例例1中拒绝域为中拒绝域为,临界值为,临界值为和和若若即说明在一次抽样中,小概率事件居然发生了。即说明在一次抽样中,小概率事件居然发生了。因此依据小概率原理,有理由拒绝因此依据小概率原理,有理由拒绝H0,接受,接受H1;,则没有理由拒绝,则没有理由拒绝H0,只能接受,只能接受H0。若若第16页,本讲稿共88页将上述检验
14、思想归纳起来,可得参数的假设检验的将上述检验思想归纳起来,可得参数的假设检验的一般步骤:一般步骤:(1)根据所讨论的实际问题建立原假设根据所讨论的实际问题建立原假设H0及备择假设及备择假设H1;(2)选择合适的检验统计量选择合适的检验统计量Z,并明确其分布;,并明确其分布;(3)对预先给定的小概率对预先给定的小概率 0,由,由P|Z|z/2=确定确定临界值临界值z/2;(4)由样本值具体计算统计量由样本值具体计算统计量Z的观察值的观察值z,并作出判,并作出判断,若断,若|z|z/2,则拒绝,则拒绝H0,接受,接受H1;若;若|z|z/2,则接受则接受H0。第17页,本讲稿共88页现在,我们来解
15、决例现在,我们来解决例1提出的问题:提出的问题:(1)假设假设H0:=0=4.55,H1:4.55;(2)选择检验用统计量选择检验用统计量(3)对于给定小正数,如对于给定小正数,如=0.05,查标准正态分表,查标准正态分表得到临界值得到临界值z/2=z0.025=1.96;因为因为|z|=3.91.96,所以拒绝,所以拒绝H0,接受,接受H1,即,即认为新工艺改变了铁水的平均含碳量。认为新工艺改变了铁水的平均含碳量。(4)具体计算:这里具体计算:这里n=5,故故Z的观察值的观察值第18页,本讲稿共88页三、假设检验中两类错误三、假设检验中两类错误第第类错误类错误,当原假设,当原假设H0为真时,
16、却作出拒绝为真时,却作出拒绝H0的判断,通常称之为的判断,通常称之为弃真错误弃真错误,由于样本的随机,由于样本的随机性,犯这类错误的可能性是不可避免的。若将犯这性,犯这类错误的可能性是不可避免的。若将犯这一类错误的概率记为一类错误的概率记为,则有,则有P拒绝拒绝H0|H0为真为真=。第第类错误类错误,当原假设,当原假设H0不成立时,却作出接不成立时,却作出接受受H0的决定,这类错误称之为的决定,这类错误称之为取伪错误取伪错误,这类错误,这类错误同样是不可避免的。若将犯这类错误的概率记为同样是不可避免的。若将犯这类错误的概率记为,则有则有P接受接受H0|H0为假为假=。第19页,本讲稿共88页自
17、然,我们希望一个假设检验所作的判断犯这两自然,我们希望一个假设检验所作的判断犯这两类错误的概率都很小。事实上,在样本容量类错误的概率都很小。事实上,在样本容量n固定的固定的情况下,这一点是办不到的。因为当情况下,这一点是办不到的。因为当 减小时,减小时,就就增大;反之,当增大;反之,当 减小时,就减小时,就 增大。增大。那么,如何处理这一问题呢?那么,如何处理这一问题呢?事实上,在处理实际问题中,一般地,对原假事实上,在处理实际问题中,一般地,对原假设设H0,我们都是经过充分考虑的情况下建立的,或,我们都是经过充分考虑的情况下建立的,或者认为犯弃真错误会造成严重的后果。者认为犯弃真错误会造成严
18、重的后果。第20页,本讲稿共88页例如,原假设是前人工作的结晶,具有稳定性,例如,原假设是前人工作的结晶,具有稳定性,从经验看,没有条件发生变化,是不会轻易被否定的,从经验看,没有条件发生变化,是不会轻易被否定的,如果因犯第如果因犯第类错误而被否定,往往会造成很大的损类错误而被否定,往往会造成很大的损失。失。因此,在因此,在H0与与H1之间,我们主观上往往倾向于之间,我们主观上往往倾向于保护保护H0,即,即H0确实成立时,作出拒绝确实成立时,作出拒绝H0的概率应是的概率应是一个很小的正数,也就是将犯弃真错误的概率限制在一个很小的正数,也就是将犯弃真错误的概率限制在事先给定的范围内,这类假设检验
19、通常称为事先给定的范围内,这类假设检验通常称为显著性假显著性假设检验设检验,小正数,小正数 称为称为检验水平检验水平或称或称显著性水平显著性水平。第21页,本讲稿共88页8.2 正态总体下未知参数的假设检验正态总体下未知参数的假设检验 一、单个正态总体情形一、单个正态总体情形第22页,本讲稿共88页1均值均值 的检验的检验原假设原假设H0:=0,备择假设,备择假设H1:0。(a)2已知已知由上节的讨论可知,在由上节的讨论可知,在H0成立的条件下,选用检验成立的条件下,选用检验统计量统计量对给定的检验水平对给定的检验水平,查正态分布表得临界值,查正态分布表得临界值z/2,再再由样本值具体计算统计
20、量由样本值具体计算统计量Z的观察值的观察值z并与并与z/2比较比较,若,若|z|z/2,则拒绝,则拒绝H0,接受,接受H1;若;若|z|z/2,则,则接受接受H0。这种检验法常称为。这种检验法常称为Z检验法。检验法。一、单个正态总体情形一、单个正态总体情形第23页,本讲稿共88页例例1设某车床生产的钮扣的直径设某车床生产的钮扣的直径X服从正态分布,根据以往的经验,服从正态分布,根据以往的经验,当车床工作正常时,生产的钮扣的平均直径当车床工作正常时,生产的钮扣的平均直径 0=26mm,方差,方差 2=2.62。某天开机一段时间后,为检验车床工作是否正常,随机地从刚生某天开机一段时间后,为检验车床
21、工作是否正常,随机地从刚生产的钮扣中抽检了产的钮扣中抽检了100粒,测得均值为粒,测得均值为26.56。假定方差没有什么变。假定方差没有什么变化。试分别在化。试分别在 1=0.05,2=0.01下,检验该车床工作是否正常下,检验该车床工作是否正常?由由 1=0.05及及 2=0.01,查正态分布表,得临界值,查正态分布表,得临界值z 1/2=z0.025=1.96,z 2/2=z0.005=2.58。而。而解:原假设解:原假设H0:=0,备择假设,备择假设H1:0。第24页,本讲稿共88页因此,因此,|z|=2.151.96,但,但|z|=2.152.58,故在,故在检验水平检验水平 1=0.
22、05下,应当拒绝下,应当拒绝H0,接受,接受H1,即认为,即认为该天车床工作不正常;而在检验水平该天车床工作不正常;而在检验水平 2=0.01下,应下,应当接受当接受H0,即认为该天车床工作是正常的。,即认为该天车床工作是正常的。第25页,本讲稿共88页上例说明:上例说明:1)对于同一个问题,同一个样本,由于检验水平不)对于同一个问题,同一个样本,由于检验水平不一样,可能得出完全相反的结论。因此,在实际应用一样,可能得出完全相反的结论。因此,在实际应用中,如何合理地选择检验水平是非常重要的。中,如何合理地选择检验水平是非常重要的。第26页,本讲稿共88页(b)2未知未知由于由于 2未知,因此,
23、不能用未知,因此,不能用Z作为检验统计量,但注作为检验统计量,但注意到样本方差意到样本方差是是 2的无偏估计量,因此,我们自然会想到用的无偏估计量,因此,我们自然会想到用s2代替代替 2,而在第六章的定理,而在第六章的定理3也已经证明,在也已经证明,在H0成立的条成立的条件下,统计量件下,统计量第27页,本讲稿共88页于是,对给定的显著性水平于是,对给定的显著性水平 0,查,查t分布表可分布表可得临界值得临界值t/2,使,使P|t|t/2=成立。再由样本值具成立。再由样本值具体计算统计量体计算统计量T的观察值的观察值t,并与,并与t/2比较,若比较,若|t|t/2,则拒绝,则拒绝H0,接受,接
24、受H1;若;若|t|t/2,则接受,则接受H0。这。这种检验法也称为种检验法也称为t 检验法检验法。例例2某厂利用某种钢生产钢筋,根据长期资料的分析,某厂利用某种钢生产钢筋,根据长期资料的分析,知道这种钢筋强度知道这种钢筋强度X服从正态分布,今随机抽取六根服从正态分布,今随机抽取六根钢筋进行强度试验,测得强度钢筋进行强度试验,测得强度X(单位:单位:kg/mm2)为为48.5,49.0,53.5,56.0,52.5,49.5。试问:能否据此认为这种钢筋的平均强度为试问:能否据此认为这种钢筋的平均强度为52.0kg/mm2(=0.05)?第28页,本讲稿共88页解解设设XN(,2),依题意建立假
25、设依题意建立假设H0:=0,H1:0。这里这里 2未知,故在未知,故在H0成立的条件下应选取检验统计量成立的条件下应选取检验统计量由已知由已知=0.05,查,查t分布表得临界值分布表得临界值t/2=t0.025(61)=2.571。第29页,本讲稿共88页又由样本值算得又由样本值算得因为,因为,|t|0.412.571,故接受,故接受H0,即可以认为这,即可以认为这种钢筋的平均强度为种钢筋的平均强度为52.0kg/mm2。第30页,本讲稿共88页第31页,本讲稿共88页2方差的检验方差的检验设总体设总体XN(,2),均未知,均未知,(X1,X2,Xn)来自总体来自总体X的样本,要求进行的检验的
26、样本,要求进行的检验(设显著性水设显著性水平为平为 0)为为原假设原假设H0:=,备择假设,备择假设H1:。是是的无偏估计量,因此由第六章的定理的无偏估计量,因此由第六章的定理3知当知当H0为真时,统计量为真时,统计量第32页,本讲稿共88页因此对给定检验水平因此对给定检验水平 0,由,由 2分布表求得临界分布表求得临界值值(n1)及及(n1)使使再由样本值再由样本值(x1,x2,xn)具体计算统计量具体计算统计量 2的观察值的观察值判断:判断:这种检验法称为这种检验法称为 2检验法。检验法。第33页,本讲稿共88页例例4某种电子元件的寿命某种电子元件的寿命(单位:单位:h)XN(,2),其中
27、其中,2未知。现检测了未知。现检测了16只电子元件,其寿命如下:只电子元件,其寿命如下:159,280,101,212,224,279,179,264,222,362,168,250,149,260,485,170。试问元件寿命的方差试问元件寿命的方差 2是否等于是否等于1002(=0.05)?解解依题意,假设依题意,假设H0:2=1002,H1:21002,选取,选取检验统计量检验统计量第34页,本讲稿共88页因此对给定检验水平因此对给定检验水平=0.05,由,由 2分布表求得临界值分布表求得临界值又据样本值算得:又据样本值算得:因为因为6.26212.8127.488,所以,应接受,所以,
28、应接受H0,即,即可以认为电子元件寿命的方差可以认为电子元件寿命的方差 2与与1002无显著差异。无显著差异。第35页,本讲稿共88页例例5某厂生产的某种型号的电池,其寿命长期以来服某厂生产的某种型号的电池,其寿命长期以来服从方差从方差 2=5000(小时(小时2)的正态分布,现有一批这种)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取现随机抽取26只电池,测出其寿命的样本方差只电池,测出其寿命的样本方差s2=9200(小时(小时2)。问根据这一数据能否推断这批电)。问根据这一数据能否推断这批电池的寿命波动性较
29、以往有显著改变(取池的寿命波动性较以往有显著改变(取=0.02)?第36页,本讲稿共88页所以拒绝所以拒绝H0,由此可以推断这批电池的寿命波,由此可以推断这批电池的寿命波动性较以往有显著改变。动性较以往有显著改变。第37页,本讲稿共88页在实际应用中,常常遇到两正态总体参数的比较在实际应用中,常常遇到两正态总体参数的比较问题,如两个车间生产的灯泡寿命是否相同;两批电问题,如两个车间生产的灯泡寿命是否相同;两批电子元件的电阻是否有差别;两台机床加工零件的精度子元件的电阻是否有差别;两台机床加工零件的精度是否有差异等等。一般都可归纳为两正态总体参数的是否有差异等等。一般都可归纳为两正态总体参数的假
30、设检验。假设检验。第38页,本讲稿共88页第39页,本讲稿共88页因此,对给定显著性水平因此,对给定显著性水平 0,可查,可查t分布表求得分布表求得临界值临界值t/2(n1+n22)。再由样本值具体计算统计量。再由样本值具体计算统计量T的观察值的观察值t,并与,并与t/2(n1+n22)比较,若比较,若|t|t/2(n1+n22),则拒绝,则拒绝H0,接受,接受H1;若;若|t|t/2(n1+n22),则接受,则接受H0。例例5从甲、乙两煤矿各抽样数次,测得其含灰率从甲、乙两煤矿各抽样数次,测得其含灰率(%)如下:如下:甲矿:甲矿:24.3,20.8,23.7,21.3,17.4;乙矿:乙矿:
31、18.2,16.9,20.2,16.7假设各煤矿含灰率都服从正态分布且方差相等。试问假设各煤矿含灰率都服从正态分布且方差相等。试问甲、乙两煤矿含灰率有无显著差异甲、乙两煤矿含灰率有无显著差异(=0.05)?第40页,本讲稿共88页解解依题意,假设依题意,假设H0:1=2,H1:1 2。对给定的检验水平对给定的检验水平=0.05,查,查t分布表得临界值分布表得临界值又由样本观察值算得又由样本观察值算得:第41页,本讲稿共88页由于由于2.2452.365,故接受,故接受H0,即可以认为两煤,即可以认为两煤矿的含灰率无显著差异。矿的含灰率无显著差异。注意到注意到2.245与临界值与临界值2.365
32、比较接近,为慎重起比较接近,为慎重起见,最好再抽样一次,并适当增加样本容量,重新见,最好再抽样一次,并适当增加样本容量,重新进行一次计算再作决定。进行一次计算再作决定。第42页,本讲稿共88页例例6下面分别给出两个文学家马克下面分别给出两个文学家马克吐温吐温(MarkTwain)的的8篇小品文以及斯诺特格拉斯篇小品文以及斯诺特格拉斯(Snodgrass)的的10篇小品文中由篇小品文中由3个字母组成的词的比例:个字母组成的词的比例:马克马克吐温:吐温:0.225,0.262,0.217,0.240,0.230,0.229,0.235,0.217斯诺特格拉斯:斯诺特格拉斯:0.209,0.205,
33、0.196,0.210,0.202,0.207,0.224,0.223,0.220,0.201设两组数据分别来自正态总体设两组数据分别来自正态总体,且两总体方差相等且两总体方差相等,两样本相互独立两样本相互独立.问两个作家所写的小品文中包含问两个作家所写的小品文中包含3个字母组成的词的比例是否有显著的差异个字母组成的词的比例是否有显著的差异(取取=0.05)?第43页,本讲稿共88页对给定的检验水平对给定的检验水平=0.05,查,查t分布表得临界值分布表得临界值第44页,本讲稿共88页拒绝拒绝H0,即认为两个作家所写的小品文中包含由,即认为两个作家所写的小品文中包含由3个字母组成的词的比例有显
34、著的差异。个字母组成的词的比例有显著的差异。第45页,本讲稿共88页2、两总体方差比、两总体方差比的检验的检验作为检验统计量。作为检验统计量。因此,当因此,当H0成立时,即成立时,即,我们可取,我们可取第46页,本讲稿共88页对给定的正数对给定的正数 0,由,由可得临界值可得临界值:再由样本值具体计算统计量再由样本值具体计算统计量F的观察值的观察值f 之值,并之值,并与临界值相比较:与临界值相比较:则拒绝则拒绝H0,接受,接受H1;则接受则接受H0。这种检验法称为。这种检验法称为F 检验法检验法。第47页,本讲稿共88页例例5两家工商银行分别对两家工商银行分别对21个储户和个储户和16个储户的
35、年存个储户的年存款余额进行抽样调查,测得其平均年存款余额分别为款余额进行抽样调查,测得其平均年存款余额分别为2600元和元和2700元,样本标准差相应为元,样本标准差相应为s1=81元和元和s2=105元。假设年存款余额服从正态分布,试比较两家银行元。假设年存款余额服从正态分布,试比较两家银行的平均年存款余额有无显著差异的平均年存款余额有无显著差异(=0.10)?解解依题意,需要检验依题意,需要检验 1与与 2是否相等,但方差未知,是否相等,但方差未知,而使用而使用t检验,必须在方差相等的条件下进行。因此,检验,必须在方差相等的条件下进行。因此,首先应检验首先应检验12,22,是否相等:,是否
36、相等:第48页,本讲稿共88页(1)检验假设检验假设H0:,H1:。由于由于=0.10,查,查F分布表可得临界值分布表可得临界值计算统计量计算统计量F的观察值:的观察值:因为因为0.450.59512.33,故应接受,故应接受H0,即可,即可以认为它们的方差是相等的。以认为它们的方差是相等的。第49页,本讲稿共88页(2)检验假设:检验假设:1=2,:,:1 2。由由(1)知,因此可用知,因此可用t 检验。检验。由于由于=0.10,查,查t 分布表可得临界值分布表可得临界值计算统计量计算统计量T的观察值为的观察值为:因为因为|t|=3.2731.67,故应拒绝,故应拒绝H0,接受,接受H1,也
37、就,也就是说两家银行客户的平均年存款余额有显著差异。是说两家银行客户的平均年存款余额有显著差异。第50页,本讲稿共88页例例5从某锌矿的东从某锌矿的东,西两支矿脉中西两支矿脉中,各抽取样本容量分别为各抽取样本容量分别为9与与8的样本进行测试的样本进行测试,得样本含锌平均数及样本方差如下得样本含锌平均数及样本方差如下:东支东支:=0.230.=0.1337.=9;西支西支:=0.269,=0.1736,=8。若东、西两支矿脉的含锌量都服从正态分布,问东、西两若东、西两支矿脉的含锌量都服从正态分布,问东、西两支矿脉支矿脉含锌量的平均值是否可以看作一样含锌量的平均值是否可以看作一样(=0.05)?解
38、:解:本题是在未知方差,又没有说明方差是否相等的本题是在未知方差,又没有说明方差是否相等的情况下要求检验两总体均值是否相等的问题,首先必情况下要求检验两总体均值是否相等的问题,首先必须检验方差是否相等:须检验方差是否相等:12=22,即检验假设即检验假设H0:12=22。第51页,本讲稿共88页因因0.204f=0.7702 t/2(n1+n2-2),由由n1=9,n2=8,=0.05,得得t /2(n1-1,n2-2)=t0.025(15)=2.1315。因此因此H0 的拒绝域为的拒绝域为|t|2.1315。第53页,本讲稿共88页因因t 没有落入拒绝域,故没有落入拒绝域,故H0 相容,认为
39、东、西两相容,认为东、西两支矿脉的平均含锌量可以看作一样,无显著差异。样支矿脉的平均含锌量可以看作一样,无显著差异。样本均值之间的差异可以认为是由随机性所导致的,而本均值之间的差异可以认为是由随机性所导致的,而不是系统偏差。不是系统偏差。第54页,本讲稿共88页8.3单侧假设检验单侧假设检验以上介绍的假设检验,归纳起来为下面两种形式:以上介绍的假设检验,归纳起来为下面两种形式:(1)原假设原假设H0:=0,备择假设,备择假设H1:0,其中,其中 0为某一常数;为某一常数;(2)原假设原假设H0:1=2,备择假设,备择假设H1:1 2,其,其中中 1,2分别为两相互独立的总体分别为两相互独立的总
40、体X与与Y的参数。的参数。这类假设的共同特点是,将检验统计量的观察这类假设的共同特点是,将检验统计量的观察值与临界值比较,无论是偏大还是偏小,都应否定值与临界值比较,无论是偏大还是偏小,都应否定H0,接受,接受H1。因此,通常也称为。因此,通常也称为双侧假设检验双侧假设检验。第55页,本讲稿共88页但在某些实际问题中,例如,对于设备、元件但在某些实际问题中,例如,对于设备、元件的寿命来说,寿命越长越好,而产品的废品率当的寿命来说,寿命越长越好,而产品的废品率当然越低越好,同时均方差越小也是我们所希望的。然越低越好,同时均方差越小也是我们所希望的。因此,在实际应用中,除了上述的双侧假设检验因此,
41、在实际应用中,除了上述的双侧假设检验之外,还有许多其它形式的假设检验问题:之外,还有许多其它形式的假设检验问题:(3)原假设原假设H0:0(或或 0),备择假设备择假设H1:0(或或 0)。其中为总体。其中为总体X的未知参数,的未知参数,0为一常数;为一常数;第56页,本讲稿共88页(4)原假设原假设H0:1 2(或或 1 2),备择假设备择假设H1:1 2(或或 1 2)。其中。其中 1,2为相互独立的总体为相互独立的总体X与与Y的未知参数。的未知参数。(3)、(4)两种统计假设,常称之为两种统计假设,常称之为单侧假设单侧假设,相应的假设检验称为相应的假设检验称为单侧(左、右)假设检验单侧(
42、左、右)假设检验。第57页,本讲稿共88页例例1某厂生产的电子元件的寿命某厂生产的电子元件的寿命(单位:单位:h)XN(,2),其中未知。但据以往的经验,电子元件,其中未知。但据以往的经验,电子元件的寿命一直稳定在的寿命一直稳定在0=200小时,现该厂对生产工艺小时,现该厂对生产工艺作了某些改进,为了了解技术革新的效果,从刚生作了某些改进,为了了解技术革新的效果,从刚生产的电子元件中任意抽取产的电子元件中任意抽取16只,测得寿命如下:只,测得寿命如下:199,280,191,232,224,279,179,254,222,192,168,250,189,260,285,170。试问:工艺改进后
43、,在检验水平试问:工艺改进后,在检验水平=0.05下是否可以下是否可以认为元件的平均寿命有了显著的提高?认为元件的平均寿命有了显著的提高?第58页,本讲稿共88页解解显然,该问题是要判断新产品的寿命是否服从显然,该问题是要判断新产品的寿命是否服从 200小时的正态分布?由此,建立假设小时的正态分布?由此,建立假设原假设原假设H0:0=200,备择假设,备择假设H1:200。分两种情况讨论分两种情况讨论:1)当当=0时,由于时,由于 2未知,取统计量未知,取统计量因此,对给定的小正数因此,对给定的小正数,由,由Ptt(n-1)得临界值得临界值t(n-1)。第59页,本讲稿共88页显然,显然,是概
44、率为是概率为 的小概率事件或的小概率事件或tt(n-1)是是H0的拒绝域。的拒绝域。2)当当 0,只要由样本值计算统计量,只要由样本值计算统计量T的的观察值观察值tt(n-1),就应当拒绝,就应当拒绝H0,接受,接受H1;否则;否则就接受就接受H0。现在我们来解决例现在我们来解决例1。第62页,本讲稿共88页由样本观察值具体计算得由样本观察值具体计算得:由由=0.05查查t分分布表得临界值布表得临界值所以,应拒绝所以,应拒绝H0,接受,接受H1,即认为经过工艺改进,即认为经过工艺改进后,元件的平均寿命有了显著的提高。后,元件的平均寿命有了显著的提高。其它类似的情况见书其它类似的情况见书P178
45、页表页表8-1。第63页,本讲稿共88页例例2某工厂生产的固体燃料推进器的燃料率某工厂生产的固体燃料推进器的燃料率X服从正服从正态分布态分布N(,2),=40cm/s,=2cm/s。现在用新方。现在用新方法生产了一批推进器法生产了一批推进器,从中随机地取从中随机地取n=25只只,测得燃烧测得燃烧率的样本均值为率的样本均值为=41.25cm/s.设在新方法下总体均方设在新方法下总体均方差仍为差仍为2cm/s,这批推进器的燃烧率是否较以往生产的这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著性水平推进器的燃烧率有显著的提高?取显著性水平=0.05。H1:0(即假设新方法提高了燃
46、烧率)(即假设新方法提高了燃烧率)解解按题意需检验假设按题意需检验假设H0:0=40(即假设新方法没有提高燃烧率)(即假设新方法没有提高燃烧率)第64页,本讲稿共88页即即z的值落在拒绝域中。所以我们在显著性水平的值落在拒绝域中。所以我们在显著性水平=0.05下,拒绝下,拒绝H0。即认为这批推进器的燃料率。即认为这批推进器的燃料率较以往生产的有显著地提高。较以往生产的有显著地提高。这是右侧检验问题,其拒绝域为这是右侧检验问题,其拒绝域为第65页,本讲稿共88页第66页,本讲稿共88页(2)(2)灯泡合格,即灯泡的使用寿命应不显著低于标灯泡合格,即灯泡的使用寿命应不显著低于标准值准值 0 0=1
47、000=1000小时,因而属单边左侧检验。故待验小时,因而属单边左侧检验。故待验假设应为假设应为 第67页,本讲稿共88页注:注:题解中的能否换成题解中的能否换成H0:1000,H1:1000(单边右侧检验单边右侧检验)呢?答案是否定的。呢?答案是否定的。因为,此时,因为,此时,t=1.81.75。故应考虑接受。故应考虑接受H0:1000。但此时,既不能认为这批元件是不合格。但此时,既不能认为这批元件是不合格的的(有可能有可能=1000),也不能认为是合格的,也不能认为是合格的(有可能有可能 1000)。由此可见,就本题的题设而言,待检假设。由此可见,就本题的题设而言,待检假设只能是只能是H0
48、:1000,H0:102。(1)检验假设检验假设H0:,H1:由于由于 2未知,应选择检验统计量未知,应选择检验统计量由由=0.05,查查t分布表得临界值分布表得临界值第71页,本讲稿共88页由样本观察值具体计算,得由样本观察值具体计算,得因为因为,故可以认为平均每袋盐的净,故可以认为平均每袋盐的净重为重为500g,即机器包装没有产生系统误差。,即机器包装没有产生系统误差。第72页,本讲稿共88页(2)检验假设检验假设102,。这是方差的单侧检验问题,选取检验统计量这是方差的单侧检验问题,选取检验统计量由由=0.05,查,查 2分布表得临界值分布表得临界值故拒绝故拒绝,接受,接受,即认为其方差
49、超过,即认为其方差超过102。即包装机工作虽然没有系统误差,但是不够。即包装机工作虽然没有系统误差,但是不够稳定。因此,在显著性水平稳定。因此,在显著性水平=0.05下,下,可以认可以认定该天包装机工作不够正常。定该天包装机工作不够正常。第73页,本讲稿共88页例例6有两台车床生产同一种型号的钢球,根据已有两台车床生产同一种型号的钢球,根据已往的经验可以认为,这两台机床生产的钢球的直往的经验可以认为,这两台机床生产的钢球的直径均服从正态分布。现从这两台车床生产的产品径均服从正态分布。现从这两台车床生产的产品中分别抽出中分别抽出8个和个和9个钢球,测得钢球的直径如下个钢球,测得钢球的直径如下(单
50、位:单位:mm):甲车床:甲车床:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8;乙车床:乙车床:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1,14.9。试问据此是否可以认为乙车床生产的产品的方差试问据此是否可以认为乙车床生产的产品的方差比甲车床小比甲车床小(取取=0.05)?第74页,本讲稿共88页解解提出假设提出假设H0:1222,H1:1222选取检验统计量选取检验统计量由由=0.05,查,查F分布表得临界值分布表得临界值由样本观察值具体计算,得由样本观察值具体计算,得故应拒绝故应拒绝H0,接受,接受H1,即可以认为乙车床