《第6章_参数估计.pdf》由会员分享,可在线阅读,更多相关《第6章_参数估计.pdf(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1参数估计参数估计第六章第六章第六章第六章引言引言上一讲,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理上一讲,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理.它们是进一步学习统计推断的基础它们是进一步学习统计推断的基础.第一讲第一讲第一讲第一讲点估计点估计点估计点估计总体样本统计量总体样本统计量描述描述作出推断研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质作出推断研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性
2、质.随机抽样随机抽样现在我们来介绍一类重要的统计推断问题参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数现在我们来介绍一类重要的统计推断问题参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数.参数估计估计废品率参数估计估计废品率估计新生儿的体重估计湖中鱼数估计新生儿的体重估计湖中鱼数估计降雨量估计降雨量在参数估计问题中,假定总体分布形式已知,未知的仅仅是一个或几个参数在参数估计问题中,假定总体分布形式已知,未知的仅仅是一个或几个参数.这类问题称为这类问题称为参数估计参数估计.参数估计问题的一般提法参数估计问题的一般提法X1,X2,Xn要依据
3、该样本对参数要依据该样本对参数 作出估计,或估计作出估计,或估计 的某个已知函数的某个已知函数.)(g现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量).为为 F(x,),其中 为未知参数,其中 为未知参数(可以是可以是 参数估计点估计区间估计参数估计点估计区间估计矩估计极大似然估计矩估计极大似然估计2)1.0,(2 N(假定身高服从正态分布)设这(假定身高服从正态分布)设这5个数是个数是:1.65 1.67 1.68 1.78 1.69 估计为估计为1.68,这是,这是点估计点估计.这是这是区间估计区间估计.估计估计 在区间
4、在区间1.57,1.84内,假如我们要估计某队男生的平均身高内,假如我们要估计某队男生的平均身高.现从该总体选取容量为现从该总体选取容量为5的样本,我们的任务是要根据选出的样本(的样本,我们的任务是要根据选出的样本(5个数)求出总体均值的估计个数)求出总体均值的估计.而全部信息就由这而全部信息就由这5个数组成个数组成.一、点估计概念及讨论的问题一、点估计概念及讨论的问题例例1 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X),(2 N,2未知 随机抽查随机抽查100个婴儿个婴儿得得100个体重数据个体重数据10,7,6,6.5,5,5.2,呢?呢?据此,我们应如何估计和而全部信息就由这据此
5、,我们应如何估计和而全部信息就由这100个数组成个数组成.为估计为估计,我们需要构造出适当的样本的函数我们需要构造出适当的样本的函数T(X1,X2,Xn),每当有了样本,就代入该函数中算出一个值,用来作为的估计值,每当有了样本,就代入该函数中算出一个值,用来作为的估计值.把样本值代入把样本值代入T(X1,X2,Xn)中,得到中,得到 的一个点估计值的一个点估计值.T(X1,X2,Xn)称为参数称为参数 的点估计量,的点估计量,请注意,被估计的参数 是一个未知常数,而估计量请注意,被估计的参数 是一个未知常数,而估计量 T(X1,X2,Xn)是一个随机变量,是样本的函数是一个随机变量,是样本的函
6、数,当样本取定后,它是个已知的数值当样本取定后,它是个已知的数值,这个数常称为的估计值这个数常称为的估计值.使用什么样的统计量去估计?使用什么样的统计量去估计?可以用样本均值可以用样本均值;也可以用样本中位数也可以用样本中位数;还可以用别的统计量还可以用别的统计量.问题是问题是:,)(XE我们知道,服从正态分布我们知道,服从正态分布,.),(2vXrN的 由大数定律,由大数定律,1|1|lim1niinXnP自然想到把样本体重的平均值作为总体平均体重的一个估计.自然想到把样本体重的平均值作为总体平均体重的一个估计.22 估计S类似地,用样本体重的方差.类似地,用样本体重的方差.,估计X用样本体
7、重的均值用样本体重的均值,11niiXnXniiXXnS122)(11样本体重的平均值样本体重的平均值3二、二、寻求估计量的方法寻求估计量的方法1.矩估计法矩估计法2.极大似然法极大似然法3.最小二乘法最小二乘法4.贝叶斯方法贝叶斯方法这里我们主要介绍前面两种方法这里我们主要介绍前面两种方法.1.矩估计法矩估计法其基本思想是其基本思想是用样本矩估计总体矩用样本矩估计总体矩.理论依据理论依据:它是基于一种简单的它是基于一种简单的“替换替换”思想建立起来的一种估计方法思想建立起来的一种估计方法.是英国统计学家是英国统计学家K.皮尔逊皮尔逊最早提出的最早提出的.大数定律大数定律记总体记总体k阶原点矩
8、为阶原点矩为)(kkXE 样本样本k阶原点矩为阶原点矩为 nikikXna11用相应的样本矩去估计总体矩的估计方法就称为用相应的样本矩去估计总体矩的估计方法就称为矩估计法矩估计法.记总体记总体k阶中心矩为阶中心矩为kkXEXE)(样本样本k阶中心矩为阶中心矩为nikikXXnB1)(1设总体的分布函数中含有设总体的分布函数中含有k个未知参数个未知参数k ,1都是这都是这k个参数的函数个参数的函数,记为:记为:k ,1,那么它的前那么它的前k阶矩一般阶矩一般),(1kiiq i=1,2,k从这从这k个方程中解出个方程中解出j=1,2,k那么用诸的估计量那么用诸的估计量ai分别代替上式中的诸分别代
9、替上式中的诸,即可得诸的矩估计量:即可得诸的矩估计量:i i j),(1kjjh),(1kjjaah j=1,2,k矩估计的一般步骤矩估计的一般步骤:1.求出总体求出总体X的前的前m阶原点矩阶原点矩),(),()(),(212122222111mmmmmmqEXqEXDXEXqEX 3用样本原点矩代替总体矩用样本原点矩代替总体矩 nikikXna11mkk,2,1,即得未知参数的矩估计即得未知参数的矩估计),(2,1mkkaaah 2.解上面方程组得:解上面方程组得:),(),(),(2121222111mmmmmhhh 4解解:dxxxXE)1()(10121)1(110 dxx由矩法由矩法
10、,21 X样本矩样本矩总体矩总体矩从中解得从中解得,112XX 的矩估计的矩估计.即为即为数学期望是一阶原点矩数学期望是一阶原点矩例例2 设总体设总体X的概率密度为的概率密度为其它,010,)1()(xxxf 是未知参数是未知参数,其中其中1 X1,X2,Xn是取自是取自X的样本的样本,求参数的矩估计求参数的矩估计.解解:由密度函数知例由密度函数知例3 设设X1,X2,Xn是取自总体是取自总体X的一个样本的一个样本为未知参数其它,0,1)()(xexfXx其中其中0,求的矩估计求的矩估计.,X具有均值为的指数分布具有均值为的指数分布 故故E(X-)=2 D(X-)=即即E(X)=2 D(X)=
11、X niiXXn12)(1 解得解得niiXXn12)(1令令XniiXXn122)(1 用样本矩估计总体矩用样本矩估计总体矩即即E(X)=2 D(X)=.,的矩估计即为参数矩法的优点是简单易行矩法的优点是简单易行,并不需要事先知道总体是什么分布并不需要事先知道总体是什么分布.缺点是,当总体类型已知时,没有充分利用分布提供的信息缺点是,当总体类型已知时,没有充分利用分布提供的信息.一般场合下一般场合下,矩估计量不具有唯一性矩估计量不具有唯一性.其主要原因在于建立矩法方程时,选取那些总体矩用相应样本矩代替带有一定的随意性其主要原因在于建立矩法方程时,选取那些总体矩用相应样本矩代替带有一定的随意性
12、.2.极大似然估计法极大似然估计法是在总体类型已知条件下使用的一种参数估计方法是在总体类型已知条件下使用的一种参数估计方法.它首先是由德国数学家它首先是由德国数学家高斯高斯在在1821年提出的年提出的,GaussFisher然而,这个方法常归功于英国统计学家然而,这个方法常归功于英国统计学家费歇费歇.费歇费歇在在1922年重新发现了这一方法,并首先研究了这种方法的一些性质年重新发现了这一方法,并首先研究了这种方法的一些性质.极大似然估计法的基本思想极大似然估计法的基本思想先看一个简单例子:一只野兔从前方窜过先看一个简单例子:一只野兔从前方窜过.是谁打中的呢?是谁打中的呢?某位同学与一位猎人一起
13、外出打猎某位同学与一位猎人一起外出打猎.如果要你推测,你会如何想呢如果要你推测,你会如何想呢?只听一声枪响,野兔应声倒下只听一声枪响,野兔应声倒下.5下面我们再看一个例子下面我们再看一个例子,进一步体会极大似然法的基本思想进一步体会极大似然法的基本思想.你就会想,只发一枪便打中你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命中的概率猎人命中的概率一般大于这位同学命中的概率.看来这一枪是猎人射中的看来这一枪是猎人射中的.这个例子所作的推断已经体现了极大似然法的基本思想这个例子所作的推断已经体现了极大似然法的基本思想.例例4 设设XB(1,p),p未知未知.设想我们事先知道设想我们事先知
14、道p只有两种可能只有两种可能:问问:应如何估计应如何估计p?p=0.7 或或p=0.3如今重复试验如今重复试验3次次,得结果得结果:0,0,0由概率论的知识由概率论的知识,3次试验中出现次试验中出现“1”的次数的次数),3(pBYk=0,1,2,3knkppkkYP)1(3)(将计算结果列表如下:应如何估计将计算结果列表如下:应如何估计p?p=0.7 或或p=0.3kkppkkYP3)1(3)(k=0,1,2,3p值值P(Y=0)P(Y=1)P(Y=2)P(Y=3)0.70.027 0.1890.4410.343 0.30.343 0.4410.1890.027出现出现估计估计出现出现出现出现
15、出现出现估计估计估计估计估计估计0.3430.4410.4410.343如果有如果有p1,p2,pm可供选择可供选择,又如何合理地选又如何合理地选p呢呢?从中选取使从中选取使Qi最大的最大的pi 作为作为p的估计的估计.);();(0iipkYPpkYPi=1,2,m则估计参数则估计参数p为为0ipp 0ipp 时时Qi最大最大,比方说比方说,当若重复进行试验当若重复进行试验n次次,结果结果“1”出现出现k次次(0 kn),我们计算一切可能的我们计算一切可能的P(Y=k;pi)=Qi,i=1,2,m如果只知道如果只知道0p1,并且实测记录是并且实测记录是Y=k(0 kn),又应如何估计又应如何
16、估计p呢呢?注意到注意到knkppknpkYP)1();(是是p的函数的函数,可用求导的方法找到使可用求导的方法找到使f(p)达到极大值的达到极大值的p.但因但因f(p)与与lnf(p)达到极大值的自变量相同达到极大值的自变量相同,故问题可转化为求故问题可转化为求lnf(p)的极大值点的极大值点.=f(p)nkp 将将ln f(p)对对p求导并令其为求导并令其为0,这时这时,对一切对一切0p1,均有均有);();(pkYPpkYP从中解得从中解得pknpkdppfd1)(ln=0便得便得p(n-k)=k(1-p)1ln()(lnln)(lnpknpkknpf6以上这种以上这种选择一个参数使得实
17、验结果具有最大概率选择一个参数使得实验结果具有最大概率的思想就是极大似然法的基本思想的思想就是极大似然法的基本思想.这时这时,对一切对一切0p0,niixndLd1ln)(ln求导并令其为求导并令其为0=0从中解得从中解得niixn1ln 即为 的即为 的MLE.对数似然函数为对数似然函数为niixnL1ln)1(ln)(ln解:解:似然函数为例似然函数为例7 设设X1,X2,Xn是取自总体是取自总体X的一个样本的一个样本为未知参数其它,0,1)()(xexfXx其中其中0,求的极大似然估计求的极大似然估计.,其它,,01),(1)(niixxeLii=1,2,n其它,0min,11)(1ix
18、nxenii对数似然函数为对数似然函数为niixnL1)(1ln),(ln解:解:似然函数为似然函数为其它,,01),(1)(niixxeLii=1,2,nniixn11 nL),(ln=0 (2)由由(1)得得niixnL12)(1),(ln=0 (1)对分别求偏导并令其为对分别求偏导并令其为0,对数似然函数为对数似然函数为niixnL1)(1ln),(ln用求导方法无法最终确定用求导方法无法最终确定用极大似然原则来求用极大似然原则来求.、,8是是inix1min 对对,0),(,min Lxi故使达到最大的即的故使达到最大的即的MLE,),(L,niixn11 于是取其它值时,于是取其它值
19、时,.0),(L 即为的即为的MLE.,且是 的增函数且是 的增函数 其它,0min,1),(1)(1ixnxeLnii由于由于第二次捕出的有记号的鱼数第二次捕出的有记号的鱼数X是是r.v,X具有超几何分布:具有超几何分布:,SNkSrNkrkXP为了估计湖中的鱼数为了估计湖中的鱼数N,第一次捕上,第一次捕上r条鱼,做上记号后放回条鱼,做上记号后放回.隔一段时间后隔一段时间后,再捕出再捕出S条鱼条鱼,结果发现这结果发现这S条鱼中有条鱼中有k条标有记号条标有记号.根据这个信息,如何估计湖中的鱼数呢?最后,我们用极大似然法估计湖中的鱼数根据这个信息,如何估计湖中的鱼数呢?最后,我们用极大似然法估计
20、湖中的鱼数),min(0rSk 应取使应取使L(N;k)达到最大的达到最大的N,作为作为N的极大似然估计的极大似然估计.但用对但用对N求导的方法相当困难求导的方法相当困难,我们考虑比值:我们考虑比值:)1;();(NkXPNkXP把上式右端看作把上式右端看作N的函数,记作的函数,记作L(N;k).SNkSrNkrkXP)()(kSrNNrNSN经过简单的计算知,这个比值大于或小于经过简单的计算知,这个比值大于或小于1,kSrN 或或kSrN 而定而定.由由)1;();(NkXPNkXP)()(kSrNNrNSN经过简单的计算知,这个比值大于或小于经过简单的计算知,这个比值大于或小于1,kSrN
21、 或或kSrN 而定而定.由由这就是说,当这就是说,当N增大时,序列增大时,序列P(X=k;N)先是上升而后下降先是上升而后下降;当当N为小于的最大整数时为小于的最大整数时,达到最大值达到最大值.故故N的极大似然估计为的极大似然估计为.kSrN kSr请看演示请看演示捕鱼问题捕鱼问题样本均值是否是的一个好的估计量?样本均值是否是的一个好的估计量?(2)怎样决定一个估计量是否比另一个估计量“好”?怎样决定一个估计量是否比另一个估计量“好”?样本方差是否是的一个好的估计量?样本方差是否是的一个好的估计量?2 这就需要讨论以下几个问题:这就需要讨论以下几个问题:(1)我们希望一个“好的”估计量具有什
22、么特性?我们希望一个“好的”估计量具有什么特性?(3)如何求得合理的估计量?如何求得合理的估计量?那么要问:那么要问:9二、估计量的优良性准则在介绍估计量优良性的准则之前,我们必须强调指出:二、估计量的优良性准则在介绍估计量优良性的准则之前,我们必须强调指出:评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量.这是因为估计量是样本的函数,是随机变量这是因为估计量是样本的函数,是随机变量.因此,由不同的观测结果,就会求得不同的参数估计值因此,由不同的观测结果,就会求得不同的参数估计值.因此一个好
23、的估计,应在多次试验中体现出优良性因此一个好的估计,应在多次试验中体现出优良性.常用的几条标准是:常用的几条标准是:1无偏性无偏性2有效性有效性3相合性相合性这里我们重点介绍前面两个标准这里我们重点介绍前面两个标准.估计量是随机变量,对于不同的样本值会得到不同的估计值估计量是随机变量,对于不同的样本值会得到不同的估计值.我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值.这就导致无偏性这个标准这就导致无偏性这个标准.1无偏性无偏性)(E则称为的无偏估计则称为的无偏估计.),(1nXX 设是未知参数的估计量,若
24、设是未知参数的估计量,若 例如,用样本均值作为总体均值的估计时,虽无法说明一次估计所产生的偏差,但这种偏差随机地在例如,用样本均值作为总体均值的估计时,虽无法说明一次估计所产生的偏差,但这种偏差随机地在0的周围波动,对同一统计问题大量重复使用不会产生系统偏差的周围波动,对同一统计问题大量重复使用不会产生系统偏差.无偏性是对估计量的一个常见而重要的要求无偏性是对估计量的一个常见而重要的要求.无偏性的实际意义是指没有系统性的偏差无偏性的实际意义是指没有系统性的偏差.所以无偏估计以方差小者为好所以无偏估计以方差小者为好,这就引进了有效性这一概念这就引进了有效性这一概念.的大小来决定二者的大小来决定二
25、者21)(E和和2 1 一个参数往往有不止一个无偏估计一个参数往往有不止一个无偏估计,若和都是参数的无偏估计量,比较我们可以若和都是参数的无偏估计量,比较我们可以22)(E谁更优谁更优.211)()(ED由于由于222)()(ED2有效性有效性D()0,有有n 0)(lim nnP则称估计量是未知参数的相合则称估计量是未知参数的相合(或一致或一致)估计量估计量.),(21nnnXXX 可以证明都是总体方差可以证明都是总体方差DX的相合估计的相合估计.2S和和2S作业作业P158 1、6 P164 2、4、5 引言引言前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它是用样本算得的一个值去
26、估计未知参数它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷区间估计正好弥补了点估计的这个缺陷.第二讲第二讲第二讲第二讲区间估计区间估计区间估计区间估计譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然估计为的极大似然估计为1000条条.若我们能给出一个区间,在此区间内我们合理地相信若我们能给出一个区间
27、,在此区间内我们合理地相信N 的真值位于其中的真值位于其中.这样对鱼数的估计就有把握多了这样对鱼数的估计就有把握多了.实际上,实际上,N的真值可能大于的真值可能大于1000条,也可能小于条,也可能小于1000条条.也就是说,我们希望确定一个区间,使我们能以比较高的也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的“这里所说的“可靠程度可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作 1,这里是一个很小
28、的正数,这里是一个很小的正数.置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.例如,通常可取置信水平例如,通常可取置信水平=0.95或或0.9等等.1121P根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信水平,我,21 小的区间,使们求出一个尽可能置信区间小的区间,使们求出一个尽可能置信区间.称区间为的称区间为的,21 1置信水平为的置信水平为的11下面我们就来正式给出置信区间的定义下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法并通过例子说明求置信区间的方法.一、置信区间定义:一、置信区间定义:121P),(2111nXXX),(
29、2122nXXX)(21满足设是 一个待估参数,给定满足设是 一个待估参数,给定,0 若由样本若由样本X1,X2,Xn确定的两个统计量则称区间是的确定的两个统计量则称区间是的置信水平置信水平(置信度、置信概率)为的置信区间(置信度、置信概率)为的置信区间.,21 121和分别称为置信下限和置信上限分别称为置信下限和置信上限.一旦有了样本,就把估计在区间一旦有了样本,就把估计在区间,21 内内.这里有两个要求这里有两个要求:可见,可见,11对参数 作区间估计,就是要设法找出两个只依赖于样本的界限对参数 作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量构造统计量)22)(21(X1,X
30、n)(X1,Xn)2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间12长度尽可能短,或能体现该要求的其它准则长度尽可能短,或能体现该要求的其它准则.,21 1.要求以很大的可能被包含在区间要求以很大的可能被包含在区间 21P内,就是说,概率要尽可能大内,就是说,概率要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.构造置信区间的一般办法:构造置信区间的一般办法:1.构造一个含有未知参数构造一个含有未知参数而不含其它未知参数的随机变量,使其分布为
31、已知且与而不含其它未知参数的随机变量,使其分布为已知且与无关;无关;);,(21 nxxxT 1);,(21dxxxTcPn2.对给定的,根据对给定的,根据T的分布找出两个临界值的分布找出两个临界值c与与d,使得,使得 1),(),(212211nnxxxxxxP则有:则有:3.将不等式转化为等价形式将不等式转化为等价形式dxxxTcn );,(21),(),(212211nnxxxxxx 于是即为的置信度为的置信区间。于是即为的置信度为的置信区间。),(21 112教材已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简要介绍一下教材已经给出了概率分布的上侧分位数(分位点
32、)的定义,为便于应用,这里我们再简要介绍一下.在求置信区间时,要查表求分位数在求置信区间时,要查表求分位数.例如例如:645.105.0u96.1025.0u设设0 1,对标准正态变量对标准正态变量X,称满足,称满足 )(uXP 的点为标准正态变量的点为标准正态变量X的上侧分位数的上侧分位数.u 标准正态分布的上侧分位数标准正态分布的上侧分位数 u 例如例如:348.9)3(2025.0 216.0)3(2975.0 设设0 1,对卡方变量对卡方变量X,称满足,称满足 )(2nXP 的点为的点为X的上侧分位数的上侧分位数.)(2n 分布的上分位数分布的上分位数)(2n 2 自由度为自由度为n的
33、的例如例如:8331.1)9(05.0t1788.2)12(025.0t设设0 1,对随机变量对随机变量T,称满足,称满足 )(ntTP 的点为的点为T分布的上侧分位数分布的上侧分位数.)(nt Tt(n).)(nt 设设0 1,对随机变量对随机变量F,称满足,称满足 ),(21nnFFP 的点为的点为F分布的上侧分位数分布的上侧分位数.)(2,1nnF F分布的上侧分位数分布的上侧分位数),(21nnF 自由度为自由度为n1,n2的的N(0,1)选的点估计为选的点估计为X求参数 的置信度为的置信区间求参数 的置信度为的置信区间.例例1 设设X1,Xn是取自的样本,是取自的样本,,2已知),(
34、2 N 1nXU取二、置信区间的求法二、置信区间的求法明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参数的一个良好估计寻找未知参数的一个良好估计.解:解:寻找一个待估参数和估计量的函数,要求其分布为已知寻找一个待估参数和估计量的函数,要求其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.1.单个正态总体参数的区间估计单个正态总体参数的区间估计13,1 对给定的置信水平查正态分布表得对给定的置信水平查正态分布表得,2 u对于给定的置信水平对于给定的置信水平(大概率大概率),根据根据U的分布,
35、确定一个区间的分布,确定一个区间,使得使得U取值于该区间的概率为置信水平取值于该区间的概率为置信水平.1|2unXP使使为什么这样取为什么这样取?,1 对给定的置信水平查正态分布表得对给定的置信水平查正态分布表得,2 u 122unXunXP 1|2unXP使从中解得使从中解得,22 unXunX也可简记为也可简记为2 unX 122unXunXP于是所求的 置信区间为于是所求的 置信区间为 例例2 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X),(2 N,2未知 随机抽查随机抽查100个婴儿个婴儿得得100个体重数据个体重数据X1,X2,X100 的区间估计的区间估计2 求和(置信水平
36、为求和(置信水平为1-).解:解:这是单总体均值和方差的估计这是单总体均值和方差的估计未知22,),(NX已知已知 先求均值的区间估计先求均值的区间估计.)1(ntnSXt 因方差未知,取对给定的置信度因方差未知,取对给定的置信度,确定分位数确定分位数 1),1(2nt使使1)1(|2nttP1)1(|2ntnSXP即即)1(),1(22ntnSXntnSX均值的置信水平为的区间估计均值的置信水平为的区间估计.即为即为 1从中解得从中解得1)1()1(22ntnSXntnSXP14)1()1(222nSn取取1)1()1()1(2222221nSnnP从中解得从中解得1)1()1()1()1(
37、22122222nSnnSnP2 再求方差的置信水平为的区间估计再求方差的置信水平为的区间估计.1对给定的置信度对给定的置信度,确定分位数确定分位数 1,)1(22n使使,)1(221n于是即为所求于是即为所求.)1()1(,)1()1(2212222nSnnSn1)1()1()1()1(22122222nSnnSnP例例3.零件尺寸与规定尺寸的偏差零件尺寸与规定尺寸的偏差XN(,2),今测得今测得10个零件,得偏差值(单位:微米)个零件,得偏差值(单位:微米)2,1,-2,3,2,4,-2,5,3,4,试求,试求,2的无偏估计值和置信度为的无偏估计值和置信度为0.9的置信区间的置信区间.解:
38、解:的无偏估计为的无偏估计为2101101iiXX2的无偏估计为的无偏估计为778.54109110122iiXS的置信区间为的置信区间为:)10)9(,10)9(05.005.0StXStX1623.38331.1)9(,205.010 2.404,S ,tX的置信度为的置信度为0.9的置信区间为的置信区间为:(0.6064,3.3935);2的置信区间为的置信区间为:325.3)9(,919.16)9()1()1(,)1()1(295.0205.022/1222/2 nSnnSn2的置信度为的置信度为0.9的置信区间为的置信区间为:(3.075,15.6397).需要指出的是,给定样本,给
39、定置信水平,置信区间也需要指出的是,给定样本,给定置信水平,置信区间也不是唯一不是唯一的.对同一个参数,我们可以构造许多置信区间.的.对同一个参数,我们可以构造许多置信区间.N(0,1)nXU取由标准正态分布表,对任意取由标准正态分布表,对任意a、b,我们可以求得,我们可以求得P(aUb).例如,设例如,设X1,Xn是取自的样本,是取自的样本,,2已知),(2 N求参数的置信水平为的求参数的置信水平为的 1置信区间置信区间.15N(0,1)nXU例如,由例如,由P(-1.96U1.96)=0.95)(ufu96.196.195.0我们得到 均值的置信水平为我们得到 均值的置信水平为 1的置信区
40、间为的置信区间为96.1,96.1nXnX由由P(-1.75U2.33)=0.95这个区间比前面一个要长一些.置信区间为这个区间比前面一个要长一些.置信区间为33.2,75.1nXnX我们得到 均值的置信水平为我们得到 均值的置信水平为 1的的)(ufu33.275.1我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信区间.任意两个数我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信区间.任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(x)下下95%的面积,就确定一个的面积,就确定一个95%的置信区间.的置信区间.0buuu)(ufaaabb950.9
41、50.950.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.时求得的置信区间的长度为最短.a=-b0buuu)(ufaaabb950.950.950.即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如分布分布,F分布分布,习惯上仍取对称的百分位点来计算未知参数的置信区间.,习惯上仍取对称的百分位点来计算未知参数的置信区间.2 我们可以得到未知参数的的任何置信水平小于我们可以得到未知参数的的任何置信水平小于1的置信区间,并且置信水平越高,相应的置信区间平均长度越长.的置信区间,并且置信水平越高,相应的置信区间平均长度越长.)(22
42、n)(221n)(xfx)(2nX 也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差.这是一对矛盾.实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差.这是一对矛盾.实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些.162.两个正态总体参数的区间估计两个正态总体参数的区间估计求:求:(1)的置信区间的置信区间;2221 例例1.设总体为总体设总体为总体X的容量为的容量为n1的样本,为总体的样本,为总体Y的容量为的容量为n2的样本,设两个样本相互独立的样本,设两个样本相互独立,).,(总体),(22
43、2211 NYNX 1,21nXXX2,21nYYY(2)的置信区间的置信区间.(置信度为置信度为)212221,求当求当 1解解:(1)由于由于.对给定的置信度对给定的置信度1,确定分位数确定分位数)1,1(2121222221nnFSSF )1,1(),1,1(212/212/1nnFnnF 使得使得:.1)1,1()1,1(212/212/1 nnFnnFP F)1,1(1,)1,1(1(212/12221212/2221nnFSSnnFSS 将上式变形得的置信区间为将上式变形得的置信区间为:2221 (2)时时,由于由于2221当 )2(11)(212121nntnnSYXtW 其中其
44、中2)1()1(21222211nnSnSnSW对给定的置信度对给定的置信度1,确定分位数确定分位数)2(212/nnt 使得使得:.1)2()2(212/212/nntnntP t 将上式变形得的置信区间为将上式变形得的置信区间为:21 ).11)2(,11)2(21212/21212/nnSnntYXnnSnntYXWW这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态正态的情形的情形.若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参
45、数的区间估计.3.大样本区间估计大样本区间估计以上都是对正态总体估计其未知参数以上都是对正态总体估计其未知参数,当总体是非正态总体时当总体是非正态总体时,统计量分布很难确定统计量分布很难确定,只好利用中心极限定理只好利用中心极限定理,对未知参数进行区间估计对未知参数进行区间估计,这就需要这就需要n充分大。(充分大。(1)一般总体均值的区间估计设总体)一般总体均值的区间估计设总体X均值为均值为,方差为已知,今从总体方差为已知,今从总体X中不断抽取样本,得到一个独立同分布的随机变量序列由中心极限定理,对一切中不断抽取样本,得到一个独立同分布的随机变量序列由中心极限定理,对一切xR,有有2 nXXX
46、,2117)(21212limxdtexnnXPxtniin当当n充分大时,近似服从充分大时,近似服从N(0,1)。)。nXu 对给定,查表得对给定,查表得 1)(,2/2/2/P有有的置信度近似为的置信度近似为1的置信区间为的置信区间为:),(2/2/nXnX 当未知,当未知,n充分大时,有充分大时,有)1,0(N近似服从近似服从nSXu 故得的置信度近似为故得的置信度近似为1的置信区间为的置信区间为:),(2/2/nSXnSX (2)01分布参数的区间估计设总体分布参数的区间估计设总体XB(1,p)(0p1).=p,=p(1-p).为估计为估计p,取容量取容量n充分大的样本,由中心极限定理
47、,充分大的样本,由中心极限定理,2 nXXX,21)1,0(近似服从n)1(XNpppnXu 对给定,查表得对给定,查表得 1)(,2/2/2/P有有p的置信度近似为的置信度近似为1的置信区间为的置信区间为:),(21pp其中其中).4(21),4(212221acbbapacbbap请自己画一张表,将各种情况下的区间估计加以总结请自己画一张表,将各种情况下的区间估计加以总结.留作作业留作作业置信区间演示置信区间演示为了使你对置信区间概念有更好的理解,并对样本容量、置信水平对置信区间的影响建立直观印象,请看演示:为了使你对置信区间概念有更好的理解,并对样本容量、置信水平对置信区间的影响建立直观印象,请看演示:18同学们可通过练习,掌握各种求未知参数的 置信区间的具体方法同学们可通过练习,掌握各种求未知参数的 置信区间的具体方法.这一讲,我们介绍了区间估计这一讲,我们介绍了区间估计.作业作业P169 5 P180 4、5、8