《第四章统计假设检验优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章统计假设检验优秀课件.ppt(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章统计假设检验第1页,本讲稿共71页一、大样本平均数的假设检验-u检验1、u检验的基本原理c.将计算所得将计算所得u值与设定显著性水平下的否定无效值与设定显著性水平下的否定无效假设的临界值假设的临界值u比较比较a.根据正态分布的理论分布,计算抽样平均数总体根据正态分布的理论分布,计算抽样平均数总体的标准差的标准差第2页,本讲稿共71页2、u检验的适用条件抽样分布为正态分布(1 1)基础总体为正态分布,无论样本容量大小,其抽样分布)基础总体为正态分布,无论样本容量大小,其抽样分布肯定为正态分布肯定为正态分布(2 2)未知基础总体,样本容量很大时,根据中心极限定理,)未知基础总体,样本容量很大
2、时,根据中心极限定理,其抽样分布也可以看作正态分布其抽样分布也可以看作正态分布 因为用的是大样本的均因为用的是大样本的均方,所以此样本的均方对方,所以此样本的均方对总体方差的估计是有效的。总体方差的估计是有效的。直接用大样本的均方代直接用大样本的均方代替总体方差,这时替总体方差,这时第3页,本讲稿共71页3 3、一个样本平均数的检验、一个样本平均数的检验例:在江苏沛县调查例:在江苏沛县调查333333 m2 2小地老虎虫害情况的结果,小地老虎虫害情况的结果,=4.73头头,=2.63头。用某种抽样方法随机抽得一个样本头。用某种抽样方法随机抽得一个样本(n=30),计算得,计算得 =4.37头。
3、问这个样本对该已知总体有无代头。问这个样本对该已知总体有无代表性?表性?第4页,本讲稿共71页解解:注意:此处注意:此处是对总体参是对总体参数做假设数做假设a.提出无效假设提出无效假设(一尾一尾or两尾?两尾?)b.确定一个否定确定一个否定H0的概率的概率 a a 0.05c.检验概率计算(检验概率计算(首先判断要用什么分布首先判断要用什么分布)Q Q 总体标准差已知,且抽样为大样本(总体标准差已知,且抽样为大样本(n=30)可以用可以用u检验检验第5页,本讲稿共71页d.做出推断结论并加以解释做出推断结论并加以解释根据以上计算可知样本在假定根据以上计算可知样本在假定总体中出现的概率总体中出现
4、的概率P 0.05,即差异不显著,所以,应该接受,即差异不显著,所以,应该接受H0否定否定HA。由此,我们应该认为,由此,我们应该认为,所抽得的样本平均数对总体平均所抽得的样本平均数对总体平均数有代表性,抽样平均数和总体平均数之间的差异是抽数有代表性,抽样平均数和总体平均数之间的差异是抽样误差造成的。样误差造成的。第6页,本讲稿共71页(1)在两个样本的总体方差在两个样本的总体方差 和和 为已知时,用为已知时,用u检验检验 由抽样分布的公式知,两样本平均数由抽样分布的公式知,两样本平均数 和和 的差数标准误的差数标准误 ,在,在 和和 是已知时为:是已知时为:并有并有:在假设在假设 下,正态离
5、差下,正态离差u值为值为 ,故可对两样本平均数的差异作出假设检验。故可对两样本平均数的差异作出假设检验。4 4、两个样本平均数的检验、两个样本平均数的检验第7页,本讲稿共71页 例:例:据以往资料,已知某小麦品种每平方米产量的据以往资料,已知某小麦品种每平方米产量的 。今在该品种的一块地上用。今在该品种的一块地上用A、B两法取样,法取两法取样,法取12个样点,得每平方米产量个样点,得每平方米产量 =1.2(kg);B法取法取8个样点,得个样点,得 =1.4(kg)。试比较。试比较A、B两法的每平方米产量是否有显著差异两法的每平方米产量是否有显著差异?假设假设H0:A、B两法的每平方米产量相同,
6、即两法的每平方米产量相同,即 系随机误差;对系随机误差;对 显著水平显著水平 因为实得因为实得|u|0.05 推断推断:接受接受 ,即即A、B两种取样方法所得的每平方两种取样方法所得的每平方米产量没有显著差异。米产量没有显著差异。第8页,本讲稿共71页G当总体的分布情况以及总体的方差未知,且样本容量很小(n30)时,只有用样本算出的均方s2来估计总体的方差,此时,二、小样本平均数的假设检验-t 检验第9页,本讲稿共71页 1908年年W.S.Gosset首先提出,又叫学生氏首先提出,又叫学生氏t分布分布(Students t-distribution)1、t 分布的提出第10页,本讲稿共71页
7、第11页,本讲稿共71页2、u分布与分布与t分布的比较分布的比较a.t分布的平均数与分布的平均数与u分布分布相同,都是相同,都是0,并在,并在t=0处曲线最高,以处曲线最高,以0为中心为中心左右对称左右对称c.t分布的曲线性状随自由度分布的曲线性状随自由度而改变,自由度而改变,自由度越小,其分越小,其分布越离散,随布越离散,随值增大,逐渐趋近于值增大,逐渐趋近于u分布,当自由度增分布,当自由度增大到大到30时基本接近时基本接近u分布分布b.与与u分布曲线相比,分布曲线相比,t分布分布曲线的峰高较低,两侧曲线的峰高较低,两侧接近接近x轴的速度更缓慢轴的速度更缓慢第12页,本讲稿共71页3 3、t
8、 t分布的概率估计分布的概率估计第13页,本讲稿共71页4 4、t t 检验检验T检验通过比较t值与t的大小关系来判断否定还是接受H0t可以通过查附表3获得(注意是两尾的临界值)第14页,本讲稿共71页一尾检验的t临界值t(1)通过查附表中的相应自由度下对应2的t2(2)获得t表中,相同时,P越大,t值越小,反之亦然因此,当计算所得|t|大于或等于表中所查t时,说明,其属于随机误差的概率小于或等于规定的显著性水平,即t位于否定区内,则否定H0,否则接受H0第15页,本讲稿共71页5、单个样本平均数的假设检验、单个样本平均数的假设检验 这是检验某一样本所属的总体平均数是否和某这是检验某一样本所属
9、的总体平均数是否和某一指定的总体平均数相同。一指定的总体平均数相同。例:某春小麦良种的千粒重例:某春小麦良种的千粒重0 0=34g=34g,现自外地,现自外地引入一高产品种,在引入一高产品种,在8 8个小区种植,得其千粒重个小区种植,得其千粒重(g)(g)为:为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引入品种的千粒重与当地良种有无显著差异?问新引入品种的千粒重与当地良种有无显著差异?第16页,本讲稿共71页检验步骤为:H0:新引入品种千粒重与当地良种千粒重指定值相同,即
10、=0=34g;对HA:34g显著水平=0.05检验计算:=(35.6+37.6+34.6)/8=35.2(g)第17页,本讲稿共71页查附表3,=7时,t 0.05=2.365。现实得|t|t=2.365,故P0.05。推断:接受H0:=34g,即新引入品种千粒重与当地良种千粒重指定值无显著差异。第18页,本讲稿共71页6、两个样本平均数的假设检验两个样本平均数的假设检验 这是由两个样本平均数的相差,以检验这两个样本所属的总体平均数有无显著差异。检验的方法因试验设计的不同而分为成组数据成组数据的平均数比较和成对数据成对数据的比较两种。第19页,本讲稿共71页(1 1)成组数据成组数据的平均数比
11、较的平均数比较 如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数成组数据据,以组平均数组平均数作为相互比较的标准。1、在两个样本的总体方差已知时,用u 检验。第20页,本讲稿共71页 例:据以往资料,已知某小麦品种每平方米产量的2=0.4(kg)2。今在该品种的一块地上用A、B两法取样,A法取了12个样点,得每平方米 =1.2(kg);B法取得8个样点,得 =1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异?系随机误差;假设H0:A、B两法的产量相同,即H0:第21页,本讲稿共71页对HA:12,=0.05推断:接受H0:1 12
12、 2,即,即A A、B B两种取样方法所得每两种取样方法所得每平方米产量没有显著差异。平方米产量没有显著差异。检验计算:因为实得|u|u0.05=1.96,故P0.05。第22页,本讲稿共71页的加权平均值,即:2、在两个样本的总体方差和为未知,但可假定=2,而两个样本又为小样本时,用t 检验。首先,从样本变异算出平均数差数的均方,作为对2的估计。由于可假定=2,故应为两样本均方第23页,本讲稿共71页当n1=n2=n 时,则上式变为:第24页,本讲稿共71页由于假设H0:1 2,故上式为:例:研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其观察值如下表:第25页,
13、本讲稿共71页y1(喷施矮壮素)160160200160200170150 210y2(对照)170270180250270290270 230 170 从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因此假设H0:喷施矮壮素的株高与未喷的相同或更高,即H0:12对对HA:1 12,即喷施矮壮素的株高较未喷的为矮。显著水平=0.05。检验计算:检验计算:第26页,本讲稿共71页第27页,本讲稿共71页 按=7+8=15,查t 表得一尾t0.05=1.753(一尾检验t0.05等于两尾检验的t0.10),现实得t=-3.05-t0.05=-1.753,故P0.05。推断:否定H0:1
14、2,接受HA:12,即认为玉米喷施矮壮素后,其株高显著地矮于对照。第28页,本讲稿共71页(2 2)成对数据成对数据的比较的比较 若试验设计是将性质相同性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数成对数据据。第29页,本讲稿共71页成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为第30页,本讲稿共71页它具有=n-1。若假设H0:
15、d=0,则上式改成:即可检验 H H H H0 0 0 0:d d d d=0=0=0=0。则差数平均数的标准误为:第31页,本讲稿共71页 例:选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果,表中结果为组别y1(A法)y2(B法)d11025-152131213814-64315-1252027-762020-77618-12第32页,本讲稿共71页病毒在番茄上产生的病痕数目,试检验两种处理方法的差异显著性。假设:两种处理对纯化病毒无不同效果,即:H H0 0:d d=0=0;对
16、H HA A:d d00。显著水平。显著水平=0.01=0.01。检验计算:第33页,本讲稿共71页查附表4,=7-1=6时,t0.01=3.707。实得|t|t0.01,故P0.01。推断:否定推断:否定H0:d=0,接受H HA A:d0,即A、B两法对纯化病毒的效应有极显著差异。第34页,本讲稿共71页第三节第三节 样本频率的假设检验样本频率的假设检验 许多生物试验的结果是用百分数或成数表示的,称为样本频许多生物试验的结果是用百分数或成数表示的,称为样本频率,如结实率、发芽率等,这些百分数系由计数某一属性的个体率,如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求得,属数目求得,
17、属间断性的计数资料间断性的计数资料。在理论上,这类百分数的假设检验应按二项分布进行,即从在理论上,这类百分数的假设检验应按二项分布进行,即从二项式二项式(p+q)n的展开式中求出某项属性个体百分数的展开式中求出某项属性个体百分数 的概率。的概率。但是,如样本容量但是,如样本容量n 较大,较大,p较小,而较小,而np和和nq又均不小于又均不小于5时时,(p+q)n的分布趋近于正态。因而可以将百分数资料作正态分布的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的检验。处理,从而作出近似的检验。适于用适于用u检验所需的二项样本容量检验所需的二项样本容量n见下表。见下表。第35页,本
18、讲稿共71页(样样本百分数本百分数)(较较小小组组次数次数)n(样本容量样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400 表表4.1 适于用正态离差检验的二项样本的适于用正态离差检验的二项样本的 和和n值表值表第36页,本讲稿共71页一、一个样本频率的假设检验一、一个样本频率的假设检验 检验某一样本频率检验某一样本频率 所属总体频率与某一理论值或期望值所属总体频率与某一理论值或期望值p0的差异显著性。的差异显著性。由于样本频率的标准误由于样本频率的标准误 为:为:故由故由 即可检验即可检验H0:p=p0,HA:p p0。第37页
19、,本讲稿共71页 例例 以紫花和白花的大豆品种杂交,在以紫花和白花的大豆品种杂交,在F2代共得代共得289株,株,其中紫花其中紫花208株,白花株,白花81株。如果花色受一对等位基因控制,株。如果花色受一对等位基因控制,则根据遗传学原理,则根据遗传学原理,F2代紫花株与白花株的分离比率应为代紫花株与白花株的分离比率应为31,即紫花理论百分数,即紫花理论百分数p=0.75,白花理论百分数,白花理论百分数q=1p=0.25。问该试验结果是否符合一对等位基因的遗传规律?问该试验结果是否符合一对等位基因的遗传规律?假设大豆花色遗传符合一对等位基因的分离规律,紫花假设大豆花色遗传符合一对等位基因的分离规
20、律,紫花植株的百分数是植株的百分数是75%,即,即H0:p=0.75;对;对HA:p0.75。显著水平显著水平 0.05,作两尾检验,作两尾检验,u0.05=1.96。检验计算:检验计算:第38页,本讲稿共71页因为实得因为实得|u|0.05。推断:接受推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数基因的遗传规律的,紫花植株百分数 =0.72和和p=0.75的相差的相差系随机误差。系随机误差。以上资料亦可直接用次数进行假设检验。当二项资料以次以上资料亦可直接用次数进行假设检验。当二项资料以次数表示时,数表示时,,故检验计
21、算:故检验计算:于是于是 结果同上结果同上 第39页,本讲稿共71页二、两个样本频率相比较的假设检验二、两个样本频率相比较的假设检验 检验两个样本频率和所属总体频率检验两个样本频率和所属总体频率p1和和p2的差异显著性的差异显著性.一般假定两个样本的总体方差是相等的,即一般假定两个样本的总体方差是相等的,即 ,设,设两个样本某种属性个体的观察频率分别为两个样本某种属性个体的观察频率分别为 和和 ,而两样本总体该种属性的个体频率分别为,而两样本总体该种属性的个体频率分别为p1和和 p2,则两样本频率的差数标准误,则两样本频率的差数标准误 为:为:上式中的上式中的q1=(1p1),q2=(1p2)
22、。这是两总体频率为已。这是两总体频率为已知时的差数标准误公式。知时的差数标准误公式。第40页,本讲稿共71页如果假定两总体的频率相同,即如果假定两总体的频率相同,即 p1=p2=p,q1=q2=q,则:,则:p1 和和 p2 未知时,则在未知时,则在 的假定下,可用两样本频率的假定下,可用两样本频率的加权平均值的加权平均值 作为作为 p1 和和 p2 的估计。的估计。第41页,本讲稿共71页因而两样本频率的差数标准误为:因而两样本频率的差数标准误为:故由故由即可对即可对 H0:p1=p2 作出假设检验。作出假设检验。第42页,本讲稿共71页 例例 调查低洼地小麦调查低洼地小麦378株株(n1)
23、,其中有锈病株,其中有锈病株355株株(y1),锈病率,锈病率93.92%();调查高坡地小麦;调查高坡地小麦396株株(n2),其中有锈病,其中有锈病346株株(y2),锈病率,锈病率87.31%()。试检验。试检验两块麦田的锈病率有无显著差异?两块麦田的锈病率有无显著差异?假设假设H0:两块麦田的总体锈病率无差别,即:两块麦田的总体锈病率无差别,即 H0:p1=p2;对;对 HA:p1 p2。显著水平取显著水平取 ,作两尾检验,作两尾检验,u0.05=1.96。检验计算:检验计算:第43页,本讲稿共71页实得实得|u|u0.05,故,故P0.05,推断:否定推断:否定H0:p1=p2 接受
24、接受HA:p1 p2,即两块麦田,即两块麦田的锈病率有显著差异。的锈病率有显著差异。第44页,本讲稿共71页 例例 原杀虫剂原杀虫剂A在在1000头虫子中杀死头虫子中杀死657头,新杀虫剂头,新杀虫剂B在在1000头虫子中杀死头虫子中杀死728头,问新杀虫剂头,问新杀虫剂B的杀虫率是否高于的杀虫率是否高于原杀虫剂原杀虫剂A?假设新杀虫剂假设新杀虫剂B的杀虫率并不高于原杀虫剂的杀虫率并不高于原杀虫剂A,即,即 H0:P2P1;对;对 HA:P2P1。显著水平显著水平 ,作一尾检验,作一尾检验,u0.01=2.326(一尾概率一尾概率)。检验计算:检验计算:第45页,本讲稿共71页 实得实得uu0
25、.01=2.326,故,故P0.01,推断:否定推断:否定H0:P2P1,接受,接受HA:P2P1,即新杀虫剂,即新杀虫剂的杀虫率极显著地高于原杀虫剂的杀虫率极显著地高于原杀虫剂A。第46页,本讲稿共71页三、二项样本假设检验时的连续性矫正三、二项样本假设检验时的连续性矫正 二项总体的频率的分布是间断性的二项分布。把它当作二项总体的频率的分布是间断性的二项分布。把它当作连续性的正态分布或连续性的正态分布或t分布处理,结果会有些出入,一般容易分布处理,结果会有些出入,一般容易发生第一类错误。发生第一类错误。因此因此,在假设检验时需进行连续性矫正。在假设检验时需进行连续性矫正。(1)在在n30,而
26、,而 5时这种矫正是必须的;经过连续性时这种矫正是必须的;经过连续性矫正的正态离差矫正的正态离差u值或值或t 值,分别以值,分别以uC 或或 tC 表示。表示。(2)如果样本大,试验结果符合前表条件,则可以不作矫如果样本大,试验结果符合前表条件,则可以不作矫正,用正,用u检验。检验。第47页,本讲稿共71页(一一)单个样本频率假设检验的连续性矫正单个样本频率假设检验的连续性矫正单个样本频率的连续性矫正公式为:单个样本频率的连续性矫正公式为:它具有它具有 v=n1。式中。式中是是 的估计值的估计值(523)(524)第48页,本讲稿共71页 例例 用基因型纯合的糯玉米和非糯玉米杂交,按遗传用基因
27、型纯合的糯玉米和非糯玉米杂交,按遗传学原理,预期学原理,预期F1植株上糯性花粉粒的植株上糯性花粉粒的p0=0.5,现在一视野,现在一视野中检视中检视20粒花粉,得糯性花粉粒花粉,得糯性花粉8粒,试问此结果和理论百粒,试问此结果和理论百分数分数p0=0.5是否相符?是否相符?假设系假设系p=p0=0.5的一个随机样本,即的一个随机样本,即H0:p=0.5 对对HA:p0.5 显著水平取显著水平取 ,用两尾检验。用两尾检验。检验计算:检验计算:np=nq=200.5=10 第49页,本讲稿共71页 推断认为实得频率推断认为实得频率0.4与理论百分数与理论百分数0.5没有显著差没有显著差异。异。查附
28、表查附表4,v=201=19,t0.05=2.093,现实得,现实得|t|0.05 =200.4=8粒粒(糯糯),=20-8=12粒粒(非糯非糯)第50页,本讲稿共71页(二二)两个样本频率相比较的假设检验的连续性矫正两个样本频率相比较的假设检验的连续性矫正 设两个样本频率中,取较大值的具有设两个样本频率中,取较大值的具有 y1 和和 n1,取较小值,取较小值的具有的具有 y2 和和 n2,则经矫正的,则经矫正的 tC 公式为:公式为:(525)它具有它具有 v=n1+n22。其中其中 为为 中中 的估计值。的估计值。第51页,本讲稿共71页 例例 用新配方农药处理用新配方农药处理25头棉铃虫
29、,结果死亡头棉铃虫,结果死亡15头,头,存活存活10头;用乐果处理头;用乐果处理24头,结果死亡头,结果死亡9头,存活头,存活15头。问头。问两种处理的杀虫效果是否有显著差异?两种处理的杀虫效果是否有显著差异?本例不符合表本例不符合表5.6条件,故需要进行连续性矫正。条件,故需要进行连续性矫正。假设两种处理的杀虫效果没有差异,即假设两种处理的杀虫效果没有差异,即H0:p1=p2;对对HA:p1 p2。显著水平显著水平 ,作两尾检验。,作两尾检验。检验计算:检验计算:第52页,本讲稿共71页 查附表,查附表,v=24+252=4745时,时,t0.05=2.014。现实。现实得得|tC|0.05
30、。推断:接受推断:接受H0:p1=p2,否定,否定HA:p1 p2,即承认两,即承认两种杀虫剂的杀虫效果没有显著差异。种杀虫剂的杀虫效果没有显著差异。本例如不作连续性矫正,本例如不作连续性矫正,t=(0.600.375)/0.143,大,大于于1.29,增加了否定,增加了否定H0 发生第一类错误的可能性。发生第一类错误的可能性。第53页,本讲稿共71页第四节第四节 参数的区间估计与点估计参数的区间估计与点估计 参数估计(参数估计(estimation of parameter),是统计是统计推断的另一个方面,它是指由样本统计结果对总体参推断的另一个方面,它是指由样本统计结果对总体参数在一定概率
31、水平下所作出的估计。参数估计包括区数在一定概率水平下所作出的估计。参数估计包括区间估计(间估计(interval estimation)和点估计()和点估计(point estimation)。)。所谓参数的区间估计所谓参数的区间估计,是指在一定的概率保证之是指在一定的概率保证之下下,估计出一个范围或区间以能够覆盖参数。估计出一个范围或区间以能够覆盖参数。第54页,本讲稿共71页一、一、参数区间估计与点估计的原理参数区间估计与点估计的原理 参数估计和点估计是建立在一定理论分布基础上的一参数估计和点估计是建立在一定理论分布基础上的一种方法。由中心极限定理和大数定律得知,只要抽样为大种方法。由中心
32、极限定理和大数定律得知,只要抽样为大样本,不论其总体是否为正态分布,其样本平均值都近似样本,不论其总体是否为正态分布,其样本平均值都近似地服从地服从 正态分布,因而,当概率水平正态分布,因而,当概率水平=0.05或或0.01时,即置信度为时,即置信度为p=1-=0.95或或0.99的条件下,有:的条件下,有:第55页,本讲稿共71页则:则:因此对于某一概率标准因此对于某一概率标准,则有通式:则有通式:第56页,本讲稿共71页二、一个总体平均数区间估计与点估计二、一个总体平均数区间估计与点估计(一一)在总体方差在总体方差 为已知时,服从正态分布为已知时,服从正态分布 的区间估计为:的区间估计为:
33、并有并有 以上式中的以上式中的 为正态分布下置信度为正态分布下置信度1 时的时的u临界值。临界值。(二二)在总体方差在总体方差 为未知时为未知时,服从,服从t分布分布需由样本均方需由样本均方s2 估计,于是区间估计为:估计,于是区间估计为:并有并有 上式中的上式中的 为置信度为置信度P=(1 )时时 t 分布的分布的 t 临界值。临界值。第57页,本讲稿共71页 例例 某棉花株行圃某棉花株行圃36个单行的皮棉平均产量为个单行的皮棉平均产量为 kg,已知,已知 =0.3kg,求,求99%置信度下该株行圃单行皮棉产量的置信度下该株行圃单行皮棉产量的置信区间。置信区间。在置信度在置信度P=(1 )=
34、99%下,由附表下,由附表3查得查得 u0.01=2.58;并;并算得算得 ;故;故99%置信区间为置信区间为 即即 推断:估计该株行圃单行皮棉平均产量在推断:估计该株行圃单行皮棉平均产量在4.04.2kg之间,之间,此估计值的可靠度有此估计值的可靠度有99%。第58页,本讲稿共71页 例例 上例已算得某春小麦良种在上例已算得某春小麦良种在8个小区的千粒重平均个小区的千粒重平均数数 ,。试估计在置信度为。试估计在置信度为95%时该品种的千时该品种的千粒重范围。粒重范围。由附表由附表4查得查得 v=7时时 t0.05=2.365,故代入前面,故代入前面通式有有 ,即即 推断:该品种总体千粒重在推
35、断:该品种总体千粒重在33.836.6g之间的置信度为之间的置信度为95%。在表达时亦可写作。在表达时亦可写作 形式,即该品种总体千粒形式,即该品种总体千粒重重95%置信度的区间是置信度的区间是35.2(2.3650.58)=35.21.4(g),即,即33.836.6g。第59页,本讲稿共71页 三三、两个总体平均数差数、两个总体平均数差数()的区间估计的区间估计 在一定的置信度下,估计两总体平均数在一定的置信度下,估计两总体平均数 至少能差至少能差多少。多少。估计方法依两总体方差是否已知或是否相等而有不同。估计方法依两总体方差是否已知或是否相等而有不同。(一一)在两总体方差为已知或两总体方
36、差虽未知但为大样本时在两总体方差为已知或两总体方差虽未知但为大样本时 对对 的的1 置信区间应为:置信区间应为:并且并且 上式中的上式中的 为平均数差数标准误,为平均数差数标准误,为正态分布下置为正态分布下置信度为信度为1 时的时的u临界值。临界值。第60页,本讲稿共71页 例例 测得高农选测得高农选1号甘薯号甘薯332株的单株平均产量,株的单株平均产量,1550(g),5.350(g),白皮白心甘薯,白皮白心甘薯282株,株,1250(g),3.750(g)。试估计两品种单株平均产量。试估计两品种单株平均产量的相差在的相差在95%置信度下的置信区间。置信度下的置信区间。由附表查得置信度为由附
37、表查得置信度为0.95时,时,u0.05=1.96;并可算得:;并可算得:因而,因而,95%的置信限为:的置信限为:L1=(750-600)1.9618=114.7(g)L2=(750-600)+1.9618=185.3(g)故高农选故高农选1号甘薯的单株平均产量比白皮白心甘薯多号甘薯的单株平均产量比白皮白心甘薯多114.7185.7(g),这个估计有,这个估计有95%的把握。的把握。第61页,本讲稿共71页(二二)在两个总体方差为未知时在两个总体方差为未知时,有两种情况:有两种情况:1.假设两总体方差相等,即假设两总体方差相等,即 :的的1-置信区间为:置信区间为:并有并有 以上的以上的 为
38、平均数差数标准误,为平均数差数标准误,是置信度为是置信度为1 ,自由度为自由度为 v=n1+n22 时时 t 分布的临界值。分布的临界值。第62页,本讲稿共71页 例例 试估计试估计右边表中右边表中资料两种密资料两种密度亩产量差数在置信度为度亩产量差数在置信度为99%时的置时的置信区间。信区间。计算得:计算得:由附表由附表3查得查得 v=8 时,时,t0.01=3.355 故有故有 L1=(428440)(3.35511.136)=49.4,L2=(428440)+(3.35511.136)=25.4(kg)。的。Y1(每每亩亩30万苗万苗)Y2(每每亩亩35万苗万苗)400450420440
39、435445460445425420第63页,本讲稿共71页 当当 被接受时,意味着两总体平均数相等,即被接受时,意味着两总体平均数相等,即 。因此,可用两样本平均数的加权平均数。因此,可用两样本平均数的加权平均数 作作为对为对 的估计:的估计:或或 因而对因而对 的置信区间为:的置信区间为:第64页,本讲稿共71页 2.两总体方差不相等,即两总体方差不相等,即 ,这时由两样本的这时由两样本的 和和 作为作为 和和 估计而算得的估计而算得的 t,已不是,已不是 v=v1+v2 的的 t 分布,分布,而是近似于自由度为而是近似于自由度为 的的 t 分布。分布。可得对的可得对的1 的置信区间为:的
40、置信区间为:故根据故根据并有并有 为置信度为置信度1 时自由度时自由度 的的 t 分布临界值分布临界值 其中其中第65页,本讲稿共71页 例例 测定冬小麦品种东方红测定冬小麦品种东方红3号的蛋白质含量号的蛋白质含量(%)10次,次,得得 y1=14.3,s12=1.621;测定农大;测定农大139号的蛋白质含量号的蛋白质含量5次,次,得得y2=11.7,s22=0.135。试求东方红。试求东方红3号小麦的蛋白质含量号小麦的蛋白质含量与农大与农大139号小麦蛋白质含量的相差的号小麦蛋白质含量的相差的95%置信限。置信限。计算得:计算得:由附表由附表3查得查得 故有故有L1=(14.311.7)(
41、2.2010.435)=1.6(%),L2=(14.311.7)+(2.2010.435)=3.6(%)因此东方红因此东方红3号小麦的蛋白质含量可比农大号小麦的蛋白质含量可比农大139号高号高1.63.6%,这种估计的可靠度为,这种估计的可靠度为95%。第66页,本讲稿共71页四、一个总体频率四、一个总体频率p的区间估计和点估计的区间估计和点估计 二项总体百分数二项总体百分数p的置信区间,在资料符合表的置信区间,在资料符合表4.1条件时条件时可按二项分布或正态分布来估计。在置信度可按二项分布或正态分布来估计。在置信度p=1 下,对下,对总体总体p置信区间的近似估计为:置信区间的近似估计为:其置
42、信区间的上下限:其置信区间的上下限:,以上式中以上式中 点估计为:点估计为:注:当样本容量较小时,需要进行连续性矫正。注:当样本容量较小时,需要进行连续性矫正。第67页,本讲稿共71页 例例 调查调查100株玉米,得到受玉米螟危害的为株玉米,得到受玉米螟危害的为20株,即株,即 =20/100=0.2或或 =20。试计算。试计算95%置信度的玉米螟危害率区置信度的玉米螟危害率区间估计和点估计。间估计和点估计。由于由于 小于小于30,需要进行连续性矫正,计算得:,需要进行连续性矫正,计算得:故故 L1=0.2(1.960.04)0.5/100=0.1166,L2=0.2+(1.960.04)+0
43、.5/100=0.2834第68页,本讲稿共71页五、两个总体频率差数五、两个总体频率差数(p1p2)的区间估计和点估计的区间估计和点估计这是要确定某一属性个体的频率在两个二项总体间的相这是要确定某一属性个体的频率在两个二项总体间的相差范围。差范围。这一估计只有在已经明确两个百分数间有显著差异时才这一估计只有在已经明确两个百分数间有显著差异时才有意义。有意义。若资料符合表若资料符合表4.1条件,该区间可按正态分布估计。条件,该区间可按正态分布估计。在在1 的置信度下,的置信度下,p1p2 的区间估计为:的区间估计为:并有并有 其中其中第69页,本讲稿共71页 例例 已测知低洼地小麦的锈病率已测
44、知低洼地小麦的锈病率 =93.92%(n1=378),高坡地小麦的锈病率,高坡地小麦的锈病率 =87.31%(n2=396),它们有,它们有显著差异。试按显著差异。试按95%置信度估计两地锈病率差数的区间估计。置信度估计两地锈病率差数的区间估计。由附表由附表2查得查得 u0.05=1.96,而,而故有故有 L1=(0.93920.8731)(1.960.02075)=0.0256,L2=(0.93920.8731)+(1.960.02075)=0.1070,即低洼地的锈病率比高坡地高即低洼地的锈病率比高坡地高2.5610.70%,此估计,此估计的置信度为的置信度为95%。第70页,本讲稿共71页作业:作业:教材第教材第 73页页 4.1 4.11第71页,本讲稿共71页