《概率论与数理统计PPT课件第七章正态总体的区间总计.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计PPT课件第七章正态总体的区间总计.ppt(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 前面,我们讨论了参数的点估计前面,我们讨论了参数的点估计.它是用样本算的一个值去估计未知参数它是用样本算的一个值去估计未知参数.但是,点估计仅仅给出了未知参数的一但是,点估计仅仅给出了未知参数的一个近似值,它没有反映出这种估计的精个近似值,它没有反映出这种估计的精度度.区间估计正好弥补了点估计的这个不区间估计正好弥补了点估计的这个不足之处足之处.7.4 正态总体的区间估计正态总体的区间估计1可信度:越大越好可信度:越大越好估计估计你的年龄你的年龄 八成八成在在21212828岁之间岁之间被估参数被估参数可信度可信度范围、区间范围、区间区间:越小越好区间:越小越好2 引例引例 在估计湖中鱼数的
2、问题中,若我在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数们根据一个实际样本,得到鱼数N的最大的最大似然估计为似然估计为10001000条条.实际上,实际上,N的真值可能大于的真值可能大于1000条,条,也可能小于也可能小于1000条条.为此,我们希望确定一个为此,我们希望确定一个区间区间来估计参数真值来估计参数真值3a 使我们能以比较高的使我们能以比较高的可靠程度可靠程度相信它相信它包含真参数值包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的是用概率来度量的b 区间估计的区间估计的精度精度要高要高.4 设设X1,X2,,Xn为来自
3、总体为来自总体X F(x;)的一个的一个样本样本,是未知参数是未知参数.若对于给定的若对于给定的(0 1),),存在两个统计量存在两个统计量 使得对任意的使得对任意的 满足满足 一一 置信区间的定义置信区间的定义5则称随机区间则称随机区间 为参数为参数 的的置信水平置信水平(confidence level)为为1-1-的的置信区间置信区间(confidence interval).置信水平置信水平又称为又称为置信度置信度,置信区间的左端点,置信区间的左端点 又称为又称为置信下界置信下界,置信区间的右端点,置信区间的右端点 又称为又称为置信上界置信上界.671.要求要求 以很大的可能被包含在区
4、间以很大的可能被包含在区间内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间长度长度 尽可能短,或能体现该要求尽可能短,或能体现该要求的其它准则的其它准则.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件一般是在保证可靠度的条件下下尽可能提高精度尽可能提高精度.8(1)从未知参数从未知参数 的某个点估计的某个点估计 出发,构造出发,构造 与与 的一个函数的一个函数W(,),使得使得W的分布已知,且不依赖于未知参数的分布已知,且不依赖于未知参数 该函数通常称为
5、该函数通常称为枢轴量枢轴量.二二 构造置信区间的方法构造置信区间的方法1.枢轴量法枢轴量法9(3)利用不等式运算,将不等式利用不等式运算,将不等式(2)适当适当选取两个常数选取两个常数a,b,使对给定的使对给定的,有有等价变形为等价变形为10即即 此时参数此时参数 的置信水平为的置信水平为1-1-的置信区的置信区间为间为112.如何确定如何确定a,b我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.任意两个数任意两个数a和和b,只要它们的纵标包含只要它们的纵标包含f(u)下下95%的面积的面积,就确定一个就确定一个95%的置信的置信区间区间.12在在 概率密度为单峰且对称的情形,概率密
6、度为单峰且对称的情形,当当a=-b时求得的置信区间的长度为最短时求得的置信区间的长度为最短.a=-b13 即使即使 的概率密度不对称的情的概率密度不对称的情形,如形,如 分布分布,F分布分布,习惯上仍取对称的,习惯上仍取对称的百分位点来计算未知参数的置信区间百分位点来计算未知参数的置信区间.14三三 正态总体均值与方差的区间估计正态总体均值与方差的区间估计15N(0,1)选选 的点估计为的点估计为求参数求参数 的置信水平为的置信水平为 的置信区间的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数 ,要求,要求其分
7、布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出Z取值于任意区间的概率取值于任意区间的概率.16对给定的置信水平对给定的置信水平对于给定的置信水平对于给定的置信水平,根据根据Z的分布,的分布,确定一个区间确定一个区间,使得使得Z取值于该区间的取值于该区间的概率为置信水平概率为置信水平.使使17对给定的置信水平对给定的置信水平使使从中解得从中解得18的一个置信水平为的一个置信水平为 的置信区间的置信区间置信区间的长度为置信区间的长度为19说明:说明:(2)置信区间的中心是样本均值置信区间的中心是样本均值(3)置信水平置信水平 越大,越大,越大,因此越大,因此 置信区间越长置信区间越
8、长(4)样本容量样本容量n越大,置信区间越短越大,置信区间越短置信区间的长度为置信区间的长度为(1)L越小,置信区间提供的信息越精确越小,置信区间提供的信息越精确2021因方差未知,则因方差未知,则不是统计量不是统计量.想法:用样本均方差想法:用样本均方差 S 代替代替.22于是取于是取 对给定的置信水平对给定的置信水平 ,确定分位数确定分位数使使即即23均值均值 的置信水平为的置信水平为 的置信区间的置信区间.即为即为从中解得从中解得24例例2 2 有一大批糖果有一大批糖果.现从中随机的取现从中随机的取1616袋,袋,称得重量称得重量(以克记以克记)如下如下:设每袋糖果的重量近似服从正态分布
9、,设每袋糖果的重量近似服从正态分布,试求总体均值试求总体均值 的置信水平为的置信水平为0.95的的置信区间置信区间506 508 499 503 504 510 497 512514 505 493 496 506 502 509 49625解:解:这是这是单总体方差未知,总体均值单总体方差未知,总体均值 的区间估计问题的区间估计问题.根据给出的数据,算得根据给出的数据,算得这里这里均值均值 的置信水平为的置信水平为 的置信区间为的置信区间为26均值均值 的置信水平为的置信水平为0.95 的置信区间的置信区间为为27取枢轴量取枢轴量从中解得从中解得(2)(2)方差方差 的置信水平为的置信水平为
10、 的置信区间的置信区间.对给定的置信水平对给定的置信水平 ,确定分位数确定分位数 使使28 方差方差 的置信水平为的置信水平为 的置信区间为的置信区间为 标准差标准差 的置信水平为的置信水平为 的置信区间的置信区间.29例例3 3 求例求例2中总体标准差中总体标准差 的置信水平的置信水平 为为0.95的置信区间的置信区间解:解:根据给出的数据,算得根据给出的数据,算得这里这里30 标准差标准差 的置信水平为的置信水平为 的置信区间的置信区间.代入具体数值算得代入具体数值算得31正态总体参数的置信区间正态总体参数的置信区间总体个数待估参数条件枢轴 量置 信 区 间一个3233343536373839因此所求置信区间为因此所求置信区间为40 由于所得置信区间包含由于所得置信区间包含0,实际中,实际中,认为采用这两种催化剂所得的得率的认为采用这两种催化剂所得的得率的均值没有显著差别均值没有显著差别.414243444546因此所求置信区间为因此所求置信区间为4748总体个数待估参数条件枢轴量置信区间二个49 作业作业 7.13;7.18;7.19;7.13;7.18;7.19;7.25;7.25;50