《应用统计学第6章参数估计(置信区间)教学文案.ppt》由会员分享,可在线阅读,更多相关《应用统计学第6章参数估计(置信区间)教学文案.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用统计学第6章参数估计(置信区间)我们希望确定一个区间,使我们能以比较我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值高的可靠程度相信它包含真参数值.未知参数的真值未知参数的真值 “可靠程度可靠程度”是用概率来度量的,称为置信是用概率来度量的,称为置信概率,置信度或置信水平概率,置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个很小的正数很小的正数.一、一、置信区间定义:置信区间定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定若由样本若由样本X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的置信水平为的
2、置信水平为 的置的置信区间信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.N(0,1)选选 的点估计为的点估计为求参数求参数 的置信水平为的置信水平为 的置信区间的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,二、置信区间的求法二、置信区间的求法 寻找未知参数的寻找未知参数的一个良好估计一个良好估计.解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出Z取值于任意区间的概率取值于任意区间的概率.对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得对于给定的置信水平
3、对于给定的置信水平,根据根据Z的分布,的分布,确定一个区间确定一个区间,使得使得Z取值于该区间的概率为取值于该区间的概率为置信水平置信水平.使使也可简记为也可简记为于是所求于是所求 的的 置信区间为置信区间为从中解得:从中解得:求置信区间的一般步骤求置信区间的一般步骤(1-2):给定置信水平给定置信水平 :1.寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)2.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函数 J(T,),且其分布为已知且其分布为已知.3.对于给定的置信水平对于给定的置信水平 ,根据,根据J(T,)的分布,确定常数的分布,确定常数a,
4、b,使得,使得 P(a J(T,)b)=4.对对“aJ(T,)b”作等价变形作等价变形,得到如得到如下下形式形式:则则 就是就是 的的100()的置信区间的置信区间.求置信区间的一般步骤求置信区间的一般步骤(3-4):可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻找一个待估参数一个待估参数 的估计量的估计量T 和函数和函数J(T,),且且J(T,)的分布为已知的分布为已知,不依赖于任何未知不依赖于任何未知参数参数(这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型
5、,至关重要形式是否已知,是怎样的类型,至关重要.区间估计的关键区间估计的关键 1.当总体为当总体为正态分布正态分布时,教材上给出时,教材上给出了几个重要的抽样分布定理了几个重要的抽样分布定理.这里不加证这里不加证明地叙述明地叙述.几个重要的抽样分布定理几个重要的抽样分布定理 定理定理 1 样本均值的分布样本均值的分布-(已知)已知)(P.111)设设X1,X2,Xn是取自正态总体是取自正态总体的样本,则有的样本,则有 设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有 定理定理 2 样本均值的一个分布样本均值的一个分布(未知
6、)未知)P.112 定理定理 3(样本方差的分布样本方差的分布)P.114设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有定理7:设(X1,Xn)是总体的一个样本,当较大时,近似有()()2非正态总体情况非正态总体情况:2非正态总体情况:总体XB(1,p),p称为总体比例例例2 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X随机抽查随机抽查n个婴儿个婴儿,得得n个体重数据个体重数据:X1,X2,Xn 的区间估计的区间估计求求和和(置信水平为(置信水平为1-).解:这是单总体均值和方差的估计解:这是单总体均值和方差的估计
7、已知已知1.先求均值先求均值 的区间估计的区间估计.因方差未知,取统计量因方差未知,取统计量对给定的置信水平对给定的置信水平使使即即确定分位数:确定分位数:均值均值 的置信水平为的置信水平为 的区间估计的区间估计.即为即为从中解得从中解得取统计量取统计量从中解得从中解得2.求方差求方差 的置信水平为的置信水平为 的区间估计的区间估计.使使 对给定的置信水平对给定的置信水平 ,分位数分位数确定确定于是于是 所求置信区间为:所求置信区间为:【例【例2】求例求例1中元中元件寿命方差件寿命方差 2 的的 95%置置信信区间。区间。n解解:由例1,S2=196.52,n=10,/2=0.025,n1-/
8、2=0.975,故所求 2的置信区间为 (135.22,358.82)(n-1)S2/(n-1)S2/=9196.52/19.023=9196.52/2.7=135.22=358.82 需要指出的是,给定样本,给定置信水需要指出的是,给定样本,给定置信水平,平,置信区间也置信区间也不是唯一不是唯一的。的。对同一个参数,我们可以构造许多置信对同一个参数,我们可以构造许多置信区间。区间。下面以单个总体均值下面以单个总体均值(方差已知)的置方差已知)的置信区间估计为例来说明。信区间估计为例来说明。N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到 均值均值 的置信水平为
9、的置信水平为的的置信区间为置信区间为我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信类似地,我们可得到若干个不同的置信区间区间.任意两个数任意两个数a和和b,只要包含,只要包含f(u)下下95%的的面积,就确定一个面积,就确定一个95%的置信区间的置信区间.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短.a=-b 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上仍取对称的百分位点,习惯上仍取对称的百分位点来计算未知参数的置信区间
10、来计算未知参数的置信区间.也就是说,要想得到的区间估计可靠度也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差高,区间长度就长,估计的精度就差.实用中应在保证足够可靠的前提下,尽实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些量使得区间的长度短一些.一对一对“矛盾矛盾”我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水置信水平的平的置信区间,并且置信区间,并且置信水平越高,相应的置信水平越高,相应的置信区间置信区间平均长度平均长度越长越长.N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到 均值均值 的置信水平为的置信水平为的的
11、置信区间为置信区间为 考虑单个正态总体考虑单个正态总体的的置信区间置信区间:当当已知已知时时,置信度与置信区间长度的关系置信度与置信区间长度的关系由由 P(-2.33Z2.33)=0.99这个区间比前面一个要长一些这个区间比前面一个要长一些.置信区间为置信区间为我们得到我们得到 均值均值 的置信水平为的置信水平为的的 也就是说,要想得到的也就是说,要想得到的区间估计可靠区间估计可靠度高,区间长度就长,估计的精度就差度高,区间长度就长,估计的精度就差.这是一对矛盾这是一对矛盾.(.(当样本容量当样本容量n n固定时固定时)(1)实用中应在保证足够可靠的前提)实用中应在保证足够可靠的前提下,尽量使
12、得区间的长度短一些下,尽量使得区间的长度短一些.(2)增大)增大样本容量样本容量n,可可在保证足够可在保证足够可靠的前提下靠的前提下,提高估计的精度提高估计的精度.解决办法:解决办法:估计均值估计均值时的时的样本容量样本容量n确定确定1.指定估计的精度指定估计的精度:2.指定估计的可靠度指定估计的可靠度1-;3.3.确定确定:(1)(1)由历史资料确定由历史资料确定;(2)(2)预抽小样本预抽小样本n,n,计算计算s s来代替来代替;(3)(3)由其它方法估计由其它方法估计.则样本容量样本容量为:总体均值区间估计时样本容量的确定在给定置信度和允许误差 d 的条件下,由可得 其中总体标准差或样本
13、标准差也是未知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限.例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了.这时,可将置信上限取为这时,可将置信上限取为+,而只着,而只着眼于置信下限,这样求得的置信区间叫单眼于置信下限,这样求得的置信区
14、间叫单侧置信区间侧置信区间.单侧置信区间和置信限的定义:单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信上限称为单侧置信上限.【例【例5】(1)求例1中元件平均寿命的95%置信下限。(2)求元件寿命方差的95%置信上限。解解:(1)从而 的单侧 1-置信下限为本例中,t
15、 0.05(9)=1.8331,故所求置信下限为1423.1-1.8331196.5/该在95%的置信度下,该元件的平均寿命大于1309.2小时。=1390.2可得由6.4 单侧置信限的区间估计 同理可得 2 的置信度为 1-的单侧置信上限为本例中,故所求2的95%置信上限为 9196.52/3.325=323.32(小时2)由以上分析可知,求单侧置信限与求双侧置信限的差别仅在于用相应分布的右侧 分位点代替双侧区间估计公式中的右侧/2 分位点。解解(2)(2):2 的的置信置信上限上限 3 总体比例总体比例p的的 置信区间置信区间 设总体设总体XB(1,p),即即X只取两个值只取两个值:X=1
16、(具有某属性具有某属性),概率为概率为p;X=0(不具有某属性不具有某属性),概率为概率为1-p.其中其中,p称为称为总体比例总体比例,即具有某属性的即具有某属性的人在总体中所占的比例人在总体中所占的比例.从总体从总体X抽取一个样本抽取一个样本(X1,X2,Xn).例如例如:一个一个n=5的样本为的样本为:0,1,1,0,0.总体比例总体比例p的点估计为的点估计为:总体比例总体比例p的的 置信区间置信区间(大样本情况大样本情况:n50)考虑考虑0-1分布未知参数分布未知参数p的置信区间估计的置信区间估计:精确估计公式精确估计公式(0p1):p也称为也称为总体比例总体比例实际应用中常用如下近似的
17、估计公式:n【例例4】某厂为了解产品的质量情况,随机抽取了300件产品进行检验,其中有5件次品,求该厂产品次品率的置信度为95%的置信区间。n 解解:产品次品率为比例,=1-0.95=0.05,n /2=0.025,n=300,,查表得 Z0.025=1.96,n 样本成数 该厂产品次品率的置信度为95%的置信区间为 估计总体比例估计总体比例p时的样本容量时的样本容量n确定确定1.指定估计的精度指定估计的精度:2.指定估计的可靠度1-:3.案例思考题n国外民意调查机构在进行民意调查时,通常要求在95%的置信度下将调查的允许误差(即置信区间的 d 值)控制在3%以内。n问为满足该调查精度要求,至
18、少需要多大的样本?n如果要求置信度达到99%,调查误差仍为3%,此时至少需要多大的样本?n 案例思考题解答(1)故需要的样本容量至少为 例:某企业要重新制定产品抽样检验的规范。已知过去检验的次品率在3.6%左右,现要求允许误差不超过2%,置信度为95%。问每次至少应抽查多少产品?n解解:由题意,要推断的是总体成数,np=0.036,1-p=0.964,d=0.02,=0.05,nz/2=z0.025=1.96故每次至少应抽查 334 件产品。由此可知,在总体比例的区间估计问题中,要达由此可知,在总体比例的区间估计问题中,要达到一定的精度要求,样本到一定的精度要求,样本容量至少要在几百以上。容量
19、至少要在几百以上。区间估计小结 P 2 2已知 2未知双侧双侧双侧双侧单侧上限单侧上限单侧下限单侧下限 两个正态总体时两个正态总体时,未知参数的未知参数的 置信区间置信区间的求法的求法.6.5两个正态总体未知参数的置信区间两个正态总体未知参数的置信区间 定理定理 4(两总体样本两总体样本均值均值差的分布差的分布)P.118则有则有分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,均值均值:Y1,Y2,是是样本样本 定理定理 5(两总体样本均值差的分布两总体样本均值差的分布)P.119分别是这两个样本的分别是这两个样本的且且
20、X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值均值,则有则有Y1,Y2,是是样本样本 定理定理 6(两总体样本方差比的分布两总体样本方差比的分布)P.120分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值,均值,则有则有Y1,Y2,是是样本样本1.1.两个正态总体均值差的置信区间两个正态总体均值差的置信区间其中其中可解得可解得 1-2 的置信区间的置信区间2.2.两个两个正态总体方差比的置信区间正态总体方差比的置信区间假定假定 1,2未知未知此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢