《试验设计与统计统计假设测验.pptx》由会员分享,可在线阅读,更多相关《试验设计与统计统计假设测验.pptx(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章统计假设检验第一节第一节 统计假设检验的基本原理统计假设检验的基本原理 第二节第二节 样本平均数的假设检验样本平均数的假设检验第三节第三节 参数的区间估计参数的区间估计 本章主要内容本章主要内容第一节统计假设检验的基本原理统计假设检验的基本原理统计学的一个主要任务是研究总体和样本之间的关系。统计学的一个主要任务是研究总体和样本之间的关系。研研 究究第第一一个个方方向向第第二二个个方方向向(抽样分布抽样分布)(统计推断统计推断)总总 体体样样 本本 研究从总体中抽出研究从总体中抽出的所有可能样本的统计的所有可能样本的统计数的分布及其与原总体数的分布及其与原总体的关系。的关系。即从一个或若干
2、个即从一个或若干个样本所得的结果去推断样本所得的结果去推断其所属总体的特性。其所属总体的特性。所谓统计推断是指根据样本分布和概率理论所谓统计推断是指根据样本分布和概率理论,由样本结果由样本结果(统计量统计量)来推断总体特征来推断总体特征(参数参数)。统计推断包括:假设检验统计推断包括:假设检验,参数估计两个方面。参数估计两个方面。一个试验相当于一个样本,由一个样本平均数可以对总体一个试验相当于一个样本,由一个样本平均数可以对总体平均数作出估计,但样本平均数是因不同样本而变化的,即样平均数作出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差。用存在误差的样本平均数来推断总体,本平均
3、数有抽样误差。用存在误差的样本平均数来推断总体,其结论并不是绝对正确的。其结论并不是绝对正确的。总体总体随机随机样本样本123无穷个无穷个样本样本图图5.1 总体和样本的关系总体和样本的关系 例:某罐头厂生产肉类罐头,其自动装罐机在正常工作状态时例:某罐头厂生产肉类罐头,其自动装罐机在正常工作状态时每罐净质量具有正态分布每罐净质量具有正态分布N(500,64)(单位为单位为g)。某日随机抽查了。某日随机抽查了10瓶罐头,得结果如下:瓶罐头,得结果如下:505,512,497,493,508,515,502,495,490,510,问该装罐机该日工作是否正常?,问该装罐机该日工作是否正常?该装罐
4、机该日所装罐头的平均重量比正常工作状态时所装罐该装罐机该日所装罐头的平均重量比正常工作状态时所装罐头重量看起来高,即头重量看起来高,即502.7500=2.7g是试验的表面效应。是试验的表面效应。方法是将表面效应与误差作比方法是将表面效应与误差作比较,若表面效应并不大于误差,较,若表面效应并不大于误差,则无充分证据说该装罐机不正常;则无充分证据说该装罐机不正常;相反,若表面效应大于误差,则相反,若表面效应大于误差,则推断表面效应不是误差,该装罐推断表面效应不是误差,该装罐机有问题。机有问题。这个尺度如何掌握呢这个尺度如何掌握呢?造成造成这种这种差异差异可能可能有两有两种原种原因因该装罐机有问题
5、该装罐机有问题 可能是试验误差可能是试验误差 如何权衡并判断造成这种如何权衡并判断造成这种差异是哪种原因?差异是哪种原因?根据上章抽样误差出现的概率可利用抽样分布来计算,因此,根据上章抽样误差出现的概率可利用抽样分布来计算,因此,只要设定一概率标准,例如,表面效应属于误差的概率不大于只要设定一概率标准,例如,表面效应属于误差的概率不大于5%5%便便可推论表面效应不大可能属误差所致。可推论表面效应不大可能属误差所致。这里把试验的表面效应与误差大小相比较并由表面效应可能这里把试验的表面效应与误差大小相比较并由表面效应可能属误差的概率而作出推论的方法称为属误差的概率而作出推论的方法称为统计推断统计推
6、断。此时计算表面效应由误差造成的概率首先必须假设表面效此时计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成,也就是假设该装罐机工作正常。应是由误差造成,也就是假设该装罐机工作正常。一、统计假设一、统计假设两个总体间的差异如何比较?两个总体间的差异如何比较?一种方法是检验整个总一种方法是检验整个总体材料,获得全部结果体材料,获得全部结果 这种研究全部总体的方法是这种研究全部总体的方法是很准确的,但往往是不可能进行很准确的,但往往是不可能进行的,因为总体往往是无限总体,的,因为总体往往是无限总体,或者是包含个体很多的有限总体。或者是包含个体很多的有限总体。另一种方法,即研究样本,通另一
7、种方法,即研究样本,通过样本研究其所代表的总体。过样本研究其所代表的总体。如果发现假设和试验结果相符的可如果发现假设和试验结果相符的可能性大,该假设就被接受;反之,假设能性大,该假设就被接受;反之,假设符合试验结果的可能性很小,该假设就符合试验结果的可能性很小,该假设就被否定。因此往往首先需要提出一个有被否定。因此往往首先需要提出一个有关某一总体参数的假设。关某一总体参数的假设。在科学研究中,往往首先要提出一个有关某一总体参数的在科学研究中,往往首先要提出一个有关某一总体参数的假设,这种假设称为统计假设。假设,这种假设称为统计假设。v 这种利用样本的结果以检验假设是否正确这种利用样本的结果以检
8、验假设是否正确(或错误或错误)的过的过 程称为假设检验。程称为假设检验。v 通过测验,发现假设和试验结果相符,该假设就被接受;通过测验,发现假设和试验结果相符,该假设就被接受;反之,如果假设不符合试验结果,该假设就应被否定。反之,如果假设不符合试验结果,该假设就应被否定。(一一)单个平均数的假设单个平均数的假设 假设一个样本是从一个具有平均数假设一个样本是从一个具有平均数0 0的总体中随机抽出的的总体中随机抽出的,记作:记作:H HO O:=O O 假设某一新工艺的加工产量与原来旧工艺加工产量一假设某一新工艺的加工产量与原来旧工艺加工产量一 样。即新工艺是原来旧工艺的一个随机样本,其平均样。即
9、新工艺是原来旧工艺的一个随机样本,其平均 产量产量等于某一指定值等于某一指定值0 0,记为记为H HO O:=O O例:例:假设某一品牌奶粉的蛋白质含量假设某一品牌奶粉的蛋白质含量()具有行业标准上具有行业标准上 某一指定的标准某一指定的标准(C C),),记为:记为:H HO O:=C C(二二)两个平均数相比较的假设两个平均数相比较的假设 假设两个样本是从两个具有相等参数的总体中随机抽出,假设两个样本是从两个具有相等参数的总体中随机抽出,记为:记为:HO:1=2 或或HO:1-2=0和零假设相对应的称为和零假设相对应的称为备择假备择假设设(alternative hypothesis),记
10、,记作作HA:O 或或HA:12。如果否定了零假设,则接受备如果否定了零假设,则接受备择假设;如果接受了零假设,择假设;如果接受了零假设,则否定了备择假设。则否定了备择假设。上述假设称为上述假设称为零假设零假设(null hypothesis)。因为假设总体。因为假设总体参数参数(平均数平均数)与某一指定值与某一指定值相等或假设两个总体参数相相等或假设两个总体参数相等,即假设其没有效应差异,等,即假设其没有效应差异,或者说实际得到的差异是由或者说实际得到的差异是由误差造成的。误差造成的。为什么首先要做零假设?为什么首先要做零假设?只有当零假设成立时,才能从假设的总体中获只有当零假设成立时,才能
11、从假设的总体中获得其平均数的抽样分布,并进一步计算出某一样本得其平均数的抽样分布,并进一步计算出某一样本平均数指定值出现的概率,这样就可以研究样本和平均数指定值出现的概率,这样就可以研究样本和总体的关系,作为假设检验的理论依据。总体的关系,作为假设检验的理论依据。先按研究目的提出一个假设;先按研究目的提出一个假设;先按研究目的提出一个假设;先按研究目的提出一个假设;然后通过试验或调查,取得样本资料;然后通过试验或调查,取得样本资料;最后检查这些资料结果,看看是否与零假设所提最后检查这些资料结果,看看是否与零假设所提出的有关总体参数相符。如果在一定的概率范围出的有关总体参数相符。如果在一定的概率
12、范围内两者接近,则接受零假设;反之,则接受备择内两者接近,则接受零假设;反之,则接受备择假设。假设。二、统计假设检验的基本方法二、统计假设检验的基本方法 基本方法基本方法 例:某酿造厂原生产标准酿出的醋的醋酸含量为例:某酿造厂原生产标准酿出的醋的醋酸含量为09.75%,并从长期生产结果获得其标准差,并从长期生产结果获得其标准差5.30%。现引进了一种酿醋的新曲种,采用新曲种酿。现引进了一种酿醋的新曲种,采用新曲种酿造得造得30个醋样,其醋酸含量平均值为个醋样,其醋酸含量平均值为 11.99%,问是否能由采用新曲种的问是否能由采用新曲种的30个醋样的平均数个醋样的平均数 与原与原生产标准的总体平
13、均数生产标准的总体平均数0的差异的差异 02.24%来说来说明采用新曲种后醋酸含量有所改变?明采用新曲种后醋酸含量有所改变?则假设两个样本的总体平均数相等,即则假设两个样本的总体平均数相等,即H0:12,也就是假设两个样本,也就是假设两个样本平均数的差数平均数的差数 属随机误差,而非真实差异;其对应假设则为属随机误差,而非真实差异;其对应假设则为HA:12。上例中,假定采用新曲种总体平均数上例中,假定采用新曲种总体平均数等于原曲种的总体平均数等于原曲种的总体平均数0=9.75%,而样本平均数和,而样本平均数和0 之间的差数:之间的差数:11.9%-9.75%=2.24%属随机误差;对应假设则为
14、属随机误差;对应假设则为HA:0。v 检验单个平均数检验单个平均数v 检验两个平均数检验两个平均数(一一)提出一个零假设提出一个零假设 则假设该样本是从一已知总体则假设该样本是从一已知总体(总体平均数为指定值总体平均数为指定值0)中随机抽出的,即中随机抽出的,即H0:0。上例中,零假设为上例中,零假设为H0:0,即新曲种醋酸产量与原曲种醋,即新曲种醋酸产量与原曲种醋酸产量总体无显著差异。在此前提下,该样本平均数的抽样分酸产量总体无显著差异。在此前提下,该样本平均数的抽样分布是可以推知的,即呈正态分布(布是可以推知的,即呈正态分布(n=30)。)。(二二)在承认零假设的前提下,获得平均数的抽样分
15、布,计算假在承认零假设的前提下,获得平均数的抽样分布,计算假设正确的概率设正确的概率 通过试验,如果新品种的平均产量很接近通过试验,如果新品种的平均产量很接近9.75%,则应接受则应接受H0。如果新品种的平均产量为。如果新品种的平均产量为20%,与总体假设相差很大,则应,与总体假设相差很大,则应否定否定H0。但如果试验结果与总体假设并不相差悬殊,例如上例。但如果试验结果与总体假设并不相差悬殊,例如上例那样那样 0=2.24%,那应如何判断呢?,那应如何判断呢?第五章第五章 统计假设测验统计假设测验 平均数:平均数:9.75%标准误:标准误:在假设在假设H H0 0为正确的条件下,根据为正确的条
16、件下,根据 的抽样分布算出获得的抽样分布算出获得 =11.99%=11.99%的概的概率,或者说算得出现随机误差率,或者说算得出现随机误差 0 0=2.24%=2.24%的概率:的概率:1.计算概率计算概率 方法方法:u u检验公式可算得:检验公式可算得:因为假设是新曲种醋酸产量有大于或小于原曲种产量的可能性因为假设是新曲种醋酸产量有大于或小于原曲种产量的可能性,所以需所以需用两尾检验。查附表用两尾检验。查附表2,2,当当u=2.315u=2.315时时,P(,P(概率概率)界于界于0.020.02和和0.030.03之间之间,即这一试即这一试验结果验结果:0 0=2.24%,=2.24%,属
17、于抽样误差的概率小于属于抽样误差的概率小于5%5%。于是可作出供选择的两。于是可作出供选择的两种推论:种推论:v 或者这一差数是随机误差,但其出现概率小于或者这一差数是随机误差,但其出现概率小于5%5%。v 或者这一差数不是随机误差,则这一样本或者这一差数不是随机误差,则这一样本(=11.99%)(=11.99%)不是假设总体不是假设总体 (0 0=9.75%)=9.75%)中的一个随机样本,其概率大于中的一个随机样本,其概率大于95%95%。u如如 在这一区间外则否定在这一区间外则否定H H0 0。如如 在这一区间内则接受在这一区间内则接受H H0 0。在假设在假设H H0 0为正确的条件下
18、,根据为正确的条件下,根据 的抽样分布划出一个区间。的抽样分布划出一个区间。2.计算接受区和否定区计算接受区和否定区若若 落在这一区间外,该差数应解释为真实差数。落在这一区间外,该差数应解释为真实差数。其意思是:其意思是:若若 落在这一区间内,则可解释为随机误差;落在这一区间内,则可解释为随机误差;因此因此,在在 的抽样分布中,落在的抽样分布中,落在()()区间内的区间内的 有有95%95%,落在这一区间外,落在这一区间外(即即 -1.96 -1.96 和和 +1.96 )+1.96 )的的 只有只有5%5%。如何确定这一区间呢?根据上章所述如何确定这一区间呢?根据上章所述 和和 的分布,的分
19、布,2.2.计算接受区和否定区计算接受区和否定区可知可知:因之可写为:因之可写为:而而 -1.96 和和 +1.96 为两个否定为两个否定H0区域。区域。否定区域和接受区域的两个临界值写作否定区域和接受区域的两个临界值写作1.96 ,即当即当 在在(-1.96,+1.96 )区间内为接受区间内为接受H0区域。区域。如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限,则前者为接受假设的区域,简称的界限,则前者为接受假设的区域,简称接受区接受区(acceptance region);后者为否定假设的区域,简称;后者为否定假设的区域,简称否定区否定区(rejection region)。
20、在。在u检验时,一般将检验时,一般将上述区间为上述区间为95%置信度置信度如果将如果将置信度设为置信度设为99%,则:,则:否定区域和接受区域的两个临界值写作否定区域和接受区域的两个临界值写作2.58 ,即当即当 在在(-2.58 ,+2.58 )区间内为接受区间内为接受H0区域。区域。而而 -2.58 和和 +2.58 为两个否定为两个否定H0区域。区域。如上述酿醋的新曲种为例如上述酿醋的新曲种为例,0=9.75%,0.97%,1.96 =1.90%。因之,它的两个。因之,它的两个2.5%概率的否定区域为概率的否定区域为 9.75%-1.90%和和 9.75%+1.90%,即,即 大于等于大
21、于等于10.65%和小于等于和小于等于7.85%的概率只有的概率只有5%。5%5%显著水平假设检验图示(表示接受区域和否定区域)显著水平假设检验图示(表示接受区域和否定区域)(三三)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理接受或否定零假设原理接受或否定零假设当一事件的概率很小时可认为该事件在一次试验中几乎是不可当一事件的概率很小时可认为该事件在一次试验中几乎是不可能实现。故当能实现。故当 由随机误差造成的概率小于由随机误差造成的概率小于5%或或1%时,即时,即可认为它不属于抽样误差,应否定零假设。可认为它不属于抽样误差,应否定零假设。因随机误差而得到该差数的概率因随
22、机误差而得到该差数的概率P0.05,称这个差数是显著的;,称这个差数是显著的;如果概率如果概率P0.01,则称这个差数是极显著的。,则称这个差数是极显著的。用来测验假设的概率标准用来测验假设的概率标准5%或或1%等,称为显著水平,一般以等,称为显著水平,一般以表示,如表示,如=0.05或或=0.01。上例算得。上例算得u值的概率小于值的概率小于5%,即说明,即说明差数差数2.24%已达已达=0.05显著水平显著水平(significance level)。假设检验时选用的显著水平:假设检验时选用的显著水平:应根据试验的要求或试验结论的重要性而定:应根据试验的要求或试验结论的重要性而定:常用常用
23、=0.05和和=0.01,有时也选,有时也选=0.10或或=0.001。v如果试验中难以控制的因素较多,试验误差可能较大,如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即则显著水平可选低些,即值取大些。值取大些。v反之,对精确度的要求较高,不容许反复,或者试验反之,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即结论的应用事关重大,则所选显著水平应高些,即值应值应该小些。该小些。显著水平显著水平对假设测验的结论是有直接影响的,所以对假设测验的结论是有直接影响的,所以它应在试验开始前即规定下来。它应在试验开始前即规定下来。在假设检验时所考
24、虑的概率为正态曲线左边一尾概率在假设检验时所考虑的概率为正态曲线左边一尾概率(小于小于9.75%)和右边一尾概率和右边一尾概率(大于大于9.75%)的总和。这类检验称为的总和。这类检验称为两尾两尾检验检验(two-tailed test),它具有两个否定区域。,它具有两个否定区域。三、两尾检验与一尾检验三、两尾检验与一尾检验 在提出一个统计假设时,必有一个相对应的备择假设。备择在提出一个统计假设时,必有一个相对应的备择假设。备择假设为否定零假设时必然要接受的假设。假设为否定零假设时必然要接受的假设。若零假设为若零假设为 H0:0则备择假设为则备择假设为HA:0v 例上述单个平均数检验,例上述单
25、个平均数检验,若否定若否定H0,则必然接受,则必然接受HA:90%。因而,这个对应的备择假。因而,这个对应的备择假设仅有一种可能性设仅有一种可能性,而统计假设仅有一个否定区域,即正态曲线而统计假设仅有一个否定区域,即正态曲线的右边一尾。这类检验称为的右边一尾。这类检验称为一尾检验一尾检验(one-tailed test)。零假设为零假设为 H0:0备择假设为备择假设为HA:0v 又如统计假设:又如统计假设:例某杀菌剂规定杀菌效果达例某杀菌剂规定杀菌效果达90%方为合格方为合格,则其统计假设为:则其统计假设为:零假设为零假设为 H0:90备择假设为备择假设为HA:90零假设为零假设为 H0:0备
26、择假设为备择假设为HA:0v 一尾检验还有另一种情况,即否定区域在左边一尾:一尾检验还有另一种情况,即否定区域在左边一尾:例使用某种防腐剂后腐败率为例使用某种防腐剂后腐败率为10%,不使用的情况下为,不使用的情况下为20%,要检验使用防腐剂后是否降低了腐败率。,要检验使用防腐剂后是否降低了腐败率。零假设为零假设为 H0:20备择假设为备择假设为HA:20四、假设检验的两类错误四、假设检验的两类错误 假设检验时由样本结果来推断总体,依据的是假设检验时由样本结果来推断总体,依据的是“小概率事件实小概率事件实际不可能发生原理际不可能发生原理”,我们并不能百分之百地肯定不发生错误。,我们并不能百分之百
27、地肯定不发生错误。零假设是错误的,检验结果却接受了它零假设是错误的,检验结果却接受了它 这种错误包括两类:这种错误包括两类:零假设是正确的,但检验结果却否定了它零假设是正确的,但检验结果却否定了它参数间本来有差异,可检验结果无差异,这种错误称为参数间本来有差异,可检验结果无差异,这种错误称为第第二类错误二类错误(type II error)。不同总体的参数间本来没有差异,可是检验结果有差异,不同总体的参数间本来没有差异,可是检验结果有差异,这种错误称为这种错误称为第一类错误第一类错误(type I error)。v 犯犯第第一一类类错错误误的的概概率率犯第一类错误的概率为犯第一类错误的概率为
28、作出这种统计推断可能犯的错误是:作出这种统计推断可能犯的错误是:如果客观上样本所代表如果客观上样本所代表的总体参数与已知总体间有差异,可是假设测验却不能发现这的总体参数与已知总体间有差异,可是假设测验却不能发现这种差异,测验结果认为没有差异,这是第二类错误,错误的概种差异,测验结果认为没有差异,这是第二类错误,错误的概率为率为值。值。值的计算方法就是计算抽样平均数落在已知总体接受区的概值的计算方法就是计算抽样平均数落在已知总体接受区的概率率(这里的已知总体是假定的这里的已知总体是假定的)。v 犯第二类错误的概率犯第二类错误的概率已知总体的均值已知总体的均值0=300kg,其平,其平均数抽样标准
29、误为均数抽样标准误为15,被抽样总,被抽样总体的平均数体的平均数315kg、标准误为、标准误为15。从被抽样总体抽得的平均数可能落在从被抽样总体抽得的平均数可能落在c1和和c2间的概率为被抽样总间的概率为被抽样总体的抽样分布曲线与体的抽样分布曲线与c1和和c2两条直线以及横轴围成的面积,这个两条直线以及横轴围成的面积,这个面积正是抽样平均数落在已知总体接受区的可能性。面积正是抽样平均数落在已知总体接受区的可能性。提高显著水平提高显著水平,如取,如取=0.01或或0.001,则,则c1线向线向左移动,左移动,c2线向右移动,因线向右移动,因而而值会增大。值会增大。注意!注意!由此说明,显著水平过
30、高由此说明,显著水平过高(值过小值过小),会增大犯第二类错误,会增大犯第二类错误的危险。的危险。如果假定新总体的如果假定新总体的=345 kg,即离,即离0=300kg更远一些,则犯第二类错误更远一些,则犯第二类错误的概率的概率=0.15=15%。注意!注意!因此,因此,值的大小依赖于真值的大小依赖于真与假设与假设的的0间的距离。如间的距离。如和和0靠近,则靠近,则易接受错误的易接受错误的H0,犯第二类错误的,犯第二类错误的概率概率较大,如较大,如和和0相距较远,则相距较远,则犯第二类错误概率较小。犯第二类错误概率较小。样本容量增加,则两类错误的概率都可减小。样本容量增加,则两类错误的概率都可
31、减小。注意!注意!现如将现如将n从从25增至增至225,则,则因而因而0=300kg曲线的否定区域为曲线的否定区域为:290.2和和 309.8kg=345kg曲线的否定区域为曲线的否定区域为:335.2和和 354.8kg第二节第二节 平均数的假设检验平均数的假设检验第五章第五章 统计假设测验统计假设测验从一个平均数为从一个平均数为、方差为、方差为2的正态总体中抽样,或者在一个的正态总体中抽样,或者在一个非正态总体里抽样只要样本容量有足够大,则所得一系列样本非正态总体里抽样只要样本容量有足够大,则所得一系列样本平均数的分布必趋向正态分布,具有平均数的分布必趋向正态分布,具有N(,),并且标准
32、化离差,并且标准化离差 遵循标准正态分布遵循标准正态分布N(0,1)。一、一、u检验和检验和t检验检验1、u/z检验检验 当总体方差当总体方差2已知,或已知,或2虽未知但样本容量相当大,可虽未知但样本容量相当大,可用用s2直接作为直接作为2估计值时采用估计值时采用u检验检验。为样本平均数的标准误,它是为样本平均数的标准误,它是 的估计值,其中的估计值,其中s为为样本标准差,样本标准差,n为样本容量。为样本容量。当样本容量不太大当样本容量不太大(n30)且且2为未知时,如以样本均方为未知时,如以样本均方s2估估计计2,则其标准化离差的分布不呈正态,而作,则其标准化离差的分布不呈正态,而作t分布分
33、布,具有自,具有自由度由度=n-1。其中其中2、t检验检验 t分布分布(t-distribution)1908年年.S.Gosset首先提出,又叫学生氏分布,因为他当时首先提出,又叫学生氏分布,因为他当时是以笔名是以笔名“学生学生student”发表研究论文的。发表研究论文的。它是一组对称密度函数曲线,具有一个单独参数它是一组对称密度函数曲线,具有一个单独参数以确定某以确定某一特定分布。一特定分布。是自由度。在理论上,当是自由度。在理论上,当增大时,增大时,t分布趋向分布趋向于正态分布。于正态分布。t分布的概率密度函数为分布的概率密度函数为t检验检验:在假设检验时,当算得的:在假设检验时,当算
34、得的|t|大于或等于大于或等于t时,则表明其时,则表明其属于随机误差的概率小于规定的显著水平,因而可否定零假属于随机误差的概率小于规定的显著水平,因而可否定零假设。反之,若算得的设。反之,若算得的|t|t,则接受零假设。,则接受零假设。这是检验某一样本平均数所属总体平均这是检验某一样本平均数所属总体平均数是否和某一指定的总体平均数相同。数是否和某一指定的总体平均数相同。二、单个样本平均数的假设检验二、单个样本平均数的假设检验这里总体这里总体2为未知,又是小样本,故需用为未知,又是小样本,故需用t 检验检验;又新工艺每;又新工艺每100g山楂山楂出果冻量可能高于也可能低于原工艺,故需作出果冻量可
35、能高于也可能低于原工艺,故需作两尾检验两尾检验。检验步骤为:检验步骤为:H0:新工艺每:新工艺每100g山楂出果冻的量与传统工艺相同,即山楂出果冻的量与传统工艺相同,即0500g;或简记为或简记为H0:500g。HA:500g。显著水平显著水平0.01因为:因为:例:用山楂加工果冻,传统工艺平均每例:用山楂加工果冻,传统工艺平均每100g山楂出果冻山楂出果冻500g,现采用一种,现采用一种新工艺进行加工,测定了新工艺进行加工,测定了16次,得知每次,得知每100g山楂出果冻平均数为山楂出果冻平均数为520g,标,标准差准差S12g。问新工艺每。问新工艺每100g山楂出果冻量与传统工艺有无差异?
36、山楂出果冻量与传统工艺有无差异?=15时,时,t0.01=2.947。得。得|t|t=2.947,故,故P0.05。推断:肯定推断:肯定H0:12,即认为两种工艺的粗提物中茶多糖,即认为两种工艺的粗提物中茶多糖含量无明显差异。含量无明显差异。3、两个样本的总体方差、两个样本的总体方差12和和22为未知,且为未知,且1222时,用时,用 近似近似t检验检验 由于由于12 22,故差数标准误需用两个样本的均方,故差数标准误需用两个样本的均方s12和和s22分别分别估计估计12和和22,即有:,即有:但是,所得但是,所得t值不再做成准确的值不再做成准确的t分布,因而仅能进行近似的分布,因而仅能进行近
37、似的t检检验。在作验。在作t检验时需先计算检验时需先计算k值和值和/(有效自由度)。(有效自由度)。近似于近似于t分布,具有有效自由度为分布,具有有效自由度为/,从而据之查,从而据之查t表得出概率。表得出概率。(二二)成对数据的平均数比较成对数据的平均数比较 若试验设计是将性质相同的两个供试单位配成一对,并设有若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。同处理,则所得观察值为成对数据。同一配对内两个供试单位的试验条件很是接近,而不同配对同一配对内两
38、个供试单位的试验条件很是接近,而不同配对间的条件可以有差异,而这一差异又可通过同一配对的差数予间的条件可以有差异,而这一差异又可通过同一配对的差数予以消除。以消除。可以有效地控制试验误差,精确度较高。可以有效地控制试验误差,精确度较高。例:例:在每一批产品内分别安排一对处理的试验;在每一批产品内分别安排一对处理的试验;同一食品对分成两部分来安排一对处理的试验;同一食品对分成两部分来安排一对处理的试验;同一供试单位进行处理前和处理后的对比。同一供试单位进行处理前和处理后的对比。设两个样本的观察值分别为设两个样本的观察值分别为y1和和y2共配成共配成n对观察值:对观察值:各对的差数为各对的差数为d
39、i=y1i-y2i,可简写为,可简写为d=y1-y2差数的平均数为差数的平均数为则差数平均数的标准误则差数平均数的标准误 为:为:即可检测即可检测H0:d=0。例例 为研究电渗处理对草莓果实中钙离子含量的影响,选用为研究电渗处理对草莓果实中钙离子含量的影响,选用10个草莓品种来进行电渗处理与对照的对比试验个草莓品种来进行电渗处理与对照的对比试验(配对果实条件基配对果实条件基本一致本一致),问电渗处理对草莓钙离子含量是否有影响?,问电渗处理对草莓钙离子含量是否有影响?品种号品种号品种号品种号 1 12 2 3 34 45 56 67 78 89 91010电渗处理电渗处理电渗处理电渗处理(y(y
40、1 1)/mg)/mg22.2322.2323.4223.4223.2523.2521.3821.3824.4524.4522.4222.4224.3724.3721.7521.7519.8219.8222.5622.56对照对照对照对照(y(y2 2)/mg)/mg18.0418.0420.3220.3219.6419.6416.3816.3821.3721.3720.4320.4318.4518.4520.0420.0417.3817.3818.4218.42差数差数差数差数(d=y(d=y1 1-y-y2 2)4.194.193.103.103.613.615.005.003.083.0
41、81.991.995.925.921.711.712.442.444.144.14电渗处理草莓果实钙离子含量电渗处理草莓果实钙离子含量电渗处理草莓果实钙离子含量电渗处理草莓果实钙离子含量配对设计,因电渗处理对果实中钙离子含量的影响并未明确,故用两尾测验。配对设计,因电渗处理对果实中钙离子含量的影响并未明确,故用两尾测验。假设:处理对果实中钙离子含量无影响,即假设:处理对果实中钙离子含量无影响,即H0:d=0;HA:d0;显著水平显著水平=0.01(两尾概率两尾概率)=10-1=9时,时,t0.01(9)=3.250。现实得。现实得|t|t0.01(9),故,故P0.01。推断:否定推断:否定H
42、0:d=0;接受接受HA:d0,即电渗处理对草莓钙离子,即电渗处理对草莓钙离子含量有极显著影响。含量有极显著影响。在实践上,如将成对数据按成组数据的方法比较,容易使统在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应有的显著差异。故在计推断发生第二类错误,即不能鉴别应有的显著差异。故在应用时需严格区别。应用时需严格区别。注意!注意!成对数据和成组数据平均数比较所依据的条件是不相同的。成对数据和成组数据平均数比较所依据的条件是不相同的。成对数据是假定各个配对的差数来自差数的分布为正态总成对数据是假定各个配对的差数来自差数的分布为正态总体,具有体,具有N(0,)
43、;而每一配对的两个供试单位是彼此相;而每一配对的两个供试单位是彼此相关的。关的。成组数据则是假定两个样本皆来自具有共同成组数据则是假定两个样本皆来自具有共同(或不同或不同)方差的方差的正态总体,而两个样本的各个供试单位都是彼此独立的。正态总体,而两个样本的各个供试单位都是彼此独立的。第五章第五章 统计假设测验统计假设测验第三节第三节 参数的区间估计参数的区间估计用样本计算的统计量估计总体参数。用样本计算的统计量估计总体参数。参数估计参数估计v 点估计点估计指以样本的统计量指以样本的统计量 直接估计总体的相应参数直接估计总体的相应参数。由于抽样误差,不同样本将有不同的由于抽样误差,不同样本将有不
44、同的 值,那么哪一值,那么哪一个值最能代表总体相应参数呢?个值最能代表总体相应参数呢?这是难以判断的。因此,有必要在一定的概率保证之下,这是难以判断的。因此,有必要在一定的概率保证之下,估计出一个范围或区间能够覆盖参数估计出一个范围或区间能够覆盖参数。v 区间估计区间估计 这个区间称置信区间这个区间称置信区间(confidence interval),区间的上、下限称为置信限区间的上、下限称为置信限(confidence limit),区间的长度称为置信距。一般以区间的长度称为置信距。一般以L1和和L2分别表示分别表示置信下限和上限。保证该区间能覆盖参数的概率置信下限和上限。保证该区间能覆盖参
45、数的概率以以P=(1-)表示,称为置信系数或置信度。以上这表示,称为置信系数或置信度。以上这种估计就称为参数的区间估计。种估计就称为参数的区间估计。例:在例:在 的分布中,的分布中,则按图,则按图5.1的接受区域,将的接受区域,将有有95%(即即1,=0.05)的样本的样本 值将落在值将落在(-1.96 )至至(+1.96 )的范围内,的范围内,即:即:或称在或称在(1-)概率下:概率下:当当=0.05时,时,所所 以以于是可得在置信度于是可得在置信度P=(1-)时,对时,对的置信区间为:的置信区间为:上述置信区间的意义为:如果从总体中抽出容量为上述置信区间的意义为:如果从总体中抽出容量为n的
46、所有样本,并且每一的所有样本,并且每一样本都算出其样本都算出其L1,L2,则在所有的,则在所有的L1,L2区间中,将有区间中,将有95%区间能覆盖参数区间能覆盖参数。一、总体平均数一、总体平均数的置信限的置信限(一一)在总体方差在总体方差2为已知或为已知或2未知但为大样本时未知但为大样本时的置信区间为:的置信区间为:以上式中的以上式中的为正态分布下置信度为正态分布下置信度1-时的时的u临界值。临界值。(二二)在总体方差在总体方差2为未知时为未知时2需由样本均方需由样本均方s2估计,于是置信区间为:估计,于是置信区间为:上式中的上式中的t为置信度为置信度P=(1-)时时t分布的分布的t临界值。临
47、界值。例例5.13 某肉类加工线某肉类加工线36天的肉类平均日产量为天的肉类平均日产量为 吨,已吨,已知知=0.3吨,求吨,求99%置信度下该肉类加工线日产量置信度下该肉类加工线日产量的置信区间。的置信区间。(一一)在总体方差在总体方差2为已知或为已知或2未知但为大样本时未知但为大样本时在置信度在置信度P=(1-)=99%下,由附表下,由附表3查得查得u0.01=2.58;并算得;并算得故故99%置信区间为:置信区间为:(4.1-2.580.05)(4.1+2.580.05)即即:4.04.2 推断:估计该肉类加工线平均日产量在推断:估计该肉类加工线平均日产量在4.04.2吨之间,此吨之间,此
48、 估计值的可靠度有估计值的可靠度有99%。例例5.14 假设一条香肠加工线在假设一条香肠加工线在8个工作日的平均重量个工作日的平均重量 ,。试估计在置信度为。试估计在置信度为95%时该加工线生产的香肠重量范围。时该加工线生产的香肠重量范围。(二二)在总体方差在总体方差2为未知时为未知时由附表由附表4查得查得v=7时,时,t0.05=2.365故有:故有:35.2-2.3650.5835.2+2.3650.58 即:即:33.836.6 推断:该加工线总体香肠重推断:该加工线总体香肠重在在33.8g36.6g之间的置信之间的置信度为度为95%。二、两总体平均数差数二、两总体平均数差数(12)的置
49、信限的置信限在一定的置信度下,估计两总体平均数在一定的置信度下,估计两总体平均数1和和2至少能差多少。至少能差多少。估计方法依两总体方差是否已知或是否相等而有不同。估计方法依两总体方差是否已知或是否相等而有不同。1、在两总体方差为已知或两总体方差虽未知但为大样本时、在两总体方差为已知或两总体方差虽未知但为大样本时2、在两总体方差为未知,且为小样本时、在两总体方差为未知,且为小样本时(1)两总体方差相等两总体方差相等(2)两总体方差不相等两总体方差不相等(一一)在两总体方差为已知或两总体方差虽未知但为大样本时在两总体方差为已知或两总体方差虽未知但为大样本时对对12的的1-置信区间应为:置信区间应
50、为:上式中的上式中的 为平均数差数标准误,为平均数差数标准误,u为正态分布下置为正态分布下置信度为信度为1-时的时的u临界值。临界值。例:测得例:测得A品种西红柿品种西红柿332株的单株平均产量,株的单株平均产量,750g,s1=265g,B品种西红柿品种西红柿282株,株,=600(g),s2=185(g)。试估计。试估计两品种单株平均产量的相差在两品种单株平均产量的相差在95%置信度下的置信区间。置信度下的置信区间。(一一)在两总体方差为已知或两总体方差虽未知但为大样本时在两总体方差为已知或两总体方差虽未知但为大样本时由附表由附表3查得置信度为查得置信度为0.95时,时,u0.05=1.9