《大学课件概率论 第七章参数估计2.pptx》由会员分享,可在线阅读,更多相关《大学课件概率论 第七章参数估计2.pptx(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、估计量优劣性的评价,标准:无偏性、有效性、相合性、充分性与完备性*,无偏性,无偏估计量:设 是 的估计量,如果 则称 是 的无偏估计量。,即无系统偏差,例: 设总体的数学期望EX=和方差VarX=2都存在, 证明:样本均值 修正样本方差 分别是EX、VarX的无偏估计,,证明:之前已经计算了样本均值和修正样本方差的期望,这也是为何用修正样本方差,而非样本方差的原因,有 效 性,设 是 的无偏估计量,当样本容量n固定时,使 达到最小的 称为 的有效估计.,由于方差是度量随机变量落在它的均值E的邻域内的集中或分散程度的。所以一个好的估计量,不仅应该是待估参数的无偏估计,而且应该有尽可能小的方差。,
2、例如 及 (其中 )都是EX的无偏 估计,但 比 有效。,首先,算术平均平方平均,其次,一致最小方差无偏估计量,要求无偏 最有效,定义:设总体XFX(,).若T0(X1, Xn)为g()的无偏估计量,且对g()的任意无偏估计量T(X1, Xn),都有,则称T0(X1, Xn)为g()的一致最小无偏估计量,注意:没有普遍可行的构造办法,我们不仅希望一个估计是无偏的,且具有较小的方差,有时还希望当样本容量无限增大时,即观察次数无限增多时,估计能在某种意义下越来越接近被估计的参数的真实值,这就是所谓一致性的要求。,相合性,定义,注意:,依概率收敛到真值,可以证明:,证明(1),(2),根据切比雪夫不
3、等式,(3)证明很难,这里不介绍了,补充例题,例:,试讨论这两个估计量的无偏性,有效性和相合性。,有矩估计量和极大似然估计量,无偏性,利用顺序统计量的性质可得X(n)的密度函数为:,需要了解X(n)的密度函数,直接计算有:,不是无偏估计量,只是渐近无偏估计量.,有效性,这个例子中的极大似然估计更有效,最后看两个估计量的相合性:,之前证明过:样本均值是总体期望的相合估计量.,故矩法估计量是相合估计量.,极大似然估计量在一般情况下也有相合性,证明很复杂,我们这里就不给出了.,相合性,参数的区间估计,点估计:如果构造一个统计量,来作为参数的估计量,则称为参数的点估计。,回忆:,点估计总是有误差的,但
4、没有给出偏差的程度,,引例 设某厂生产的灯泡使用寿命XN(,100),现 随机抽取5只,用样本均值估计其平均寿命。测三组数据:,但范围有多大呢?,取样本1,得到估计值1473.4,是一个真实存在的确定的数,只是我们不知道确切的值,取样本2,得到估计值1400,取样本3,得到估计值1480,区间估计的思想,用 来作为参数可能取值范围的估计,同时给出 参数落在随机区间 中的概率,称为区间估计。,构造两个统计量,考虑U统计量:,已经知道:,方差已知,但是是一个未知参数,使用起来不方便。,如何处理样本均值这一统计量?,查表得,有90%的把握成立,注意:对于某个给定的观测值,上述不等式不是一定成立,但是
5、有100组数据的话,其中应当有90个估计是成立的,即成立的可能为90%。,先找正数,使得,(-)=1- (),置信水平、置信区间,设总体的分布中含有一个参数,对给定的(很小), 如果由样本(X1,X2,Xn)确定两个统计量 1( X1,X2,Xn ), 2( X1,X2,Xn ), 使得P(1 2)=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。,1置信下限 2置信上限,上例:,注意: 1- 只是一种记法,但是这种记法会简化计算,定义,区间估计的一般定义,几点说明,2、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包
6、含总体参 数的真值。,3、不同的置信水平,参数的置信区间不同。,4、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。不降低可靠性的同时要缩小估计范 围,则必须增大样本容量,增加抽样成本。,1、估计和估计g() 并没有本质区别。,分位数,设 X f (n)(f 为某种分布,n 为有关的自由 度),01,则称满足,的数 f(n) 为分布 f (n) 的 分位数(或分位点),查课本后面的表可得 2分布, t 分布, F 分布的分位数。,注意,若X
7、 2(n) 分布,当n趋于无穷时, 近似的服从 N(0,1),故当自由度较大时,近似的有,对于 F(m,n) 分布和 (01),有,对于 t(n) 分布,当 n 趋于无穷时,分布趋于 N(0,1),故当自由度较大时,用标准正态分布的分位数 u 代替 t(n) 的分位数。,单个正态总体参数的区间估计,正态总体方差已知,对均值的区间估计,如果总体XN(,2),其中2已知, 未知, 则取U-统计量 ,对做区间估计。,对给定的置信水平1-,由,将观测值 代入,则可得具体的区间。,确定临界值(X的双侧分位数)得的置信区间为,例1 某车间生产滚珠,从长期实践中知道,滚珠直径X 可以认为服从正态分布,从某天
8、的产品中随机抽取6个, 测得直径为(单位:cm) 14.6,15.1,14.9,14.8,15.2,15.1 (1)试求该天产品的平均直径EX的点估计; (2)若已知方差为0.06,试求该天平均直径EX的置信 区间:=0.05;=0.01。,解: (1)由矩法估计得EX的点估计值为,续解 (2)由题设知XN(,0.06),构造U-统计量,得EX的置信区间为,当=0.05时,,而,所以,EX的置信区间为 14.754,15.146,当=0.01时,,所以,EX的置信区间为 14.692,15.208,置信水平提高,置信区间扩大,估计精确度降低。,例2 假定某地一旅游者的消费额X服从正态分布N(,
9、2),且标准差=12元,今要对该地旅游者的平均消费额EX加以区间估计,为了能以95%的置信度相信这种估计误差小于2元,问至少要调查多少人?,解 由题意知:消费额XN(,122),设要调查n人。,由,即,得,查表得,而,解得,至少要调查139人,例2 续:估计误差小于1元,问至少要调查多少人?,解得,至少要调查554人,在方法不变的前提下,要想提高精度,只能增加样本的容量,正态总体方差未知,对均值的区间估计,如果总体XN(,2),其中,均未知,试取U-统计量,仍然服从标准正态分布,若将其作为区间估计的分布,得置信度1-的置信区间,未知,置信上限下限中都含有未知参数,不是统计量,如何来处理?,用某
10、种统计量来替换未知量2,构造T-统计量,当置信水平为1-时,有,查t-分布表确定,从而得的置信水平为1-的置信区间为,由于T分布也是对称的,在例1中若滚珠直径的方差2未知,用同样的数据求的置信概率为0.95的置信区间。,解:回忆公式,例3,根据题设有:,续解,查表有:,将所求的数值代入公式,得,的置信概率为0.95的置信区间为14.714, 15.186,比较例1和例2的结果会发现,由同一组样本观察值,按同样的置信概率,对计算出的置信区间因为2的是否已知会不一样。,当2已知,我们掌握的信息多一些,在其他条件相同的情况下,对的估计精度要高一些,即表现为的置信区间长度要小些。当2未知,对的估计精度
11、要低一些,即表现为的置信区间长度在大一些。,2为已知时, 14.754,15.146,2为未知时, 14.714, 15.186,例4 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。,解 由题设可知:口杯的重量XN(,2),由于方差未知,故考虑分布,由抽取的9个样本,可得,例4续 某厂生产的一种塑料口杯的重量X被认为服从正态分布,今随机抽取4个,测得其重量为(单位:克):21.1,21.3,21.4,21.5。试
12、用95%的置信度估计全部口杯的平均重量,比较与例4的区别。,由,得,查表得,全部口杯的平均重量的置信区间为 21.26,21.54,正态总体均值已知,对方差的区间估计,总体XN(,2),其中已知,2未知,先从点估计入手,估计方差一般使用样本方差,但是注意到已知,考虑,故S2是2的无偏估计量,构造2-统计量,查2- 分布表,确定双侧分位数,从而得2的置信水平为1-的置信区间为,但是S2的分布依赖于参数2,由,例5已知某种果树产量服从(218,2),随机 抽取6棵计算其产量为(单位:公斤)221,191,202,205,256,236。试以95%的置信水平估计产量的方差。,解 :,计算,查表,果树
13、方差的置信区间为,如果总体XN(,2),其中 已知,2未知,是否 可取U-统计量 ,或者U2对做区间估计?,则 ,只有单向的控制,提示:,思考:,1、,2、 估计精度太低,人为刻意造出的估计量效果往往没有有点估计背景的估计量好,正态总体均值未知,对方差的区间估计,如果总体XN(,2),其中 ,2均未知,构造2-统计量,中包含两个未知参数,不能用来估计2,自然想到,用样本方差 替换分子,当置信水平为1-时,由,查2- 分布表,确定双侧分位数,从而得2的置信水平为1-的置信区间为,例6 设某灯泡的寿命XN(,2), ,2未知,现 从中任取5个灯泡进行寿命试验,得数据10.5,11.0, 11.2,
14、12.5,12.8(单位:千小时),求置信水平为 90%的2的区间估计。,解: 修正样本方差及均值分别为,2的置信区间为 0.4195,5.5977,由,得,查表得,比较已知和未知时方差的估计,设(X1,X2,Xn)为取自正态总体XN( , 2)的样本,则,(1),思考:当已知时,能否用,作为统计量估计 2,例已知某种果树产量服从(218,2),随机抽取6棵计算其产量为(单位:公斤)221,191,202,205,256,236,试以95%的置信水平估计产量的方差。,解:,计算 ,查表,果树方差的置信区间为,估计精度大大降低,关键,找到一个仅含待估计参数 ,不含其它未知参数的样本函数(抽样分布
15、函数),如何找这样的函数?,从相应的参数的点估计量出发,区间估计的步骤分析,对进行区间估计,若统计量R是的点估计量,确定R的分布函数,其中可能包含参数。 将R中的参数约化,得统计量S,不含任何未知参数 利用统计量S的分布得到参数的区间估计T1,T2,2、考虑U统计量:,1、点估计中用 估计:,以总体XN(,2),其中2已知, 未知,对做区间估计为例说明。,3、得到区间估计:,大家不需要掌握区间估计估计量的构造过程,只需要记住所需的统计量及其分布即可,(1)方差已知,对均值的区间估计,构造U统计量,(2)方差未知,对均值的区间估计,构造T统计量,总体服从正态分布的对均值的区间估计,区间估计小结,
16、(4)均值未知,对方差的区间估计,构造2统计量,(3)均值已知,对方差的区间估计,构造2统计量,总体服从正态分布的对方差的区间估计,期望与方差的区间估计的区别:,正态分布和t分布对称,只需找一个分位数 卡方(2)分布不对称,要找双侧分位数,点估计和区间估计的关系,点估计是区间估计的基础,区间估计的统计量一般从点估计中引出; 区间估计除了使用统计量本身以外,还需要计算统计量相应的分布函数,计算量更大; 区间估计比点估计更精确,包含信息量更大。,第七章知识小结,(1)矩估计 思想:用样本k阶原点矩估计总体k阶原点矩,样本 k阶中心矩估计总体k阶中心矩.,(2)最大似然估计,第七章知识小结,(2)最大似然估计,第七章知识小结,(3)无偏估计,(4)相合估计,第七章知识小结,(5)参数的区间估计,