《《概率论与数理统计教学课件》7第七章-区间估计.ppt》由会员分享,可在线阅读,更多相关《《概率论与数理统计教学课件》7第七章-区间估计.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率统计问题的引出问题的引出 第四、五节第四、五节 区间估计区间估计 在在参数的点估计参数的点估计中用样本构造一个估计量中用样本构造一个估计量 ,用用 去估计去估计 ,这仅仅是解决了一个求未知参数,这仅仅是解决了一个求未知参数 的一个的一个“近似值近似值”问题,而没有解决问题,而没有解决“近似值近似值”的精确程度问题,即没有给出这个近似值的误差的精确程度问题,即没有给出这个近似值的误差范围和估计的可信程度。范围和估计的可信程度。在在参数的区间估计参数的区间估计中则要用样本去给出未知参中则要用样本去给出未知参数数 的一个大致的范围,并使未知参数的一个大致的范围,并使未知参数 在其中在其中有指定的
2、概率。有指定的概率。概率统计 具体具体:若估计参数为若估计参数为 ,要考虑估计量,要考虑估计量 落在落在 的可能性有多大。的可能性有多大。即求即求 ,若给定了可能的,若给定了可能的值,则就可以求出它的可能范围。值,则就可以求出它的可能范围。在估计湖中鱼数的问题中,若已知得到鱼数在估计湖中鱼数的问题中,若已知得到鱼数 N 的的极大似然估计极大似然估计为为1000条。而实际上条。而实际上N 的的真值可能大于真值可能大于1000条,也可能小于条,也可能小于1000条。条。则在则在区间估计中区间估计中就可以给出一个区间,在此就可以给出一个区间,在此区间内合理地相信区间内合理地相信 N 的真值位于其中。
3、这样的真值位于其中。这样对鱼数的估计就有把握多了对鱼数的估计就有把握多了.例如:例如:概率统计也就是说,所讨论的问题是希望确定一个区间,也就是说,所讨论的问题是希望确定一个区间,使得在使得在该区间该区间内能以比较高的内能以比较高的可靠程度可靠程度相信它相信它包含未知参数的真值。包含未知参数的真值。而这而这“可靠程度可靠程度”是用概率来度量的,称为是用概率来度量的,称为置信概率、置信度或置信水平置信概率、置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个很小的正数。称很小的正数。称该区间该区间为为置信区间置信区间。湖中鱼数的真值湖中鱼数的真值概率统计 一一.置信
4、区间置信区间定义定义:设总体设总体 X 的分布函数的分布函数 含有一个未知参含有一个未知参数数 ,和和满足满足:,对于给定的值对于给定的值,若由样本,若由样本确定的两个统计量:确定的两个统计量:是是 的置信度为的置信度为 的的置信区间置信区间,和和为置信度为为置信度为的双侧置信区间的的双侧置信区间的置信下限置信下限和和置信上限置信上限.称为称为置信水平。置信水平。则称随机区间则称随机区间概率统计注注:定义的定义的含义含义是指是指:在反复抽样多次在反复抽样多次(各种得到的样各种得到的样本容量相等,均为本容量相等,均为 n),每个样本值确定一个区间,每个样本值确定一个区间 ,每个这样的区间要么包含
5、,每个这样的区间要么包含 的真值,的真值,要么不包含要么不包含 的真值,按贝努力大数定理可知的真值,按贝努力大数定理可知在这么多的区间中包含在这么多的区间中包含 真值的约占真值的约占 不包含不包含 真值的仅占真值的仅占 对置信区间对置信区间 有两个要求:有两个要求:大的可能被包含在该区间内,即要求:大的可能被包含在该区间内,即要求:一是要求一是要求 以很以很尽可能大尽可能大.二是要求估计的精度要二是要求估计的精度要尽可能的高,即要求区间尽可能的高,即要求区间尽可能短。尽可能短。可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可
6、能提高精度.概率统计一般地,寻求未知参数一般地,寻求未知参数 的置信区间的具体做法如下:的置信区间的具体做法如下:(1)寻求一个样本寻求一个样本 和和 的函数的函数,使得,使得W的的 分布不依懒于分布不依懒于 以及其他未知参数,称具有这种性质的函数以及其他未知参数,称具有这种性质的函数W为为枢轴量枢轴量。(2)对于给定的置信水平)对于给定的置信水平 ,定出两个常数,定出两个常数a,b使得使得若能从若能从 得到与之等价得到与之等价的的 的不等式的不等式 ,其中,其中概率统计和和是两个统计量。那么是两个统计量。那么 就是就是 的一个置信水平的一个置信水平为为 的置信区间。的置信区间。注:注:枢轴量
7、的构造,通常可以从枢轴量的构造,通常可以从 的点估计着手考虑。的点估计着手考虑。概率统计正态随机变量情形的区间估计正态随机变量情形的区间估计.给定置信度给定置信度 ,求置信区间,求置信区间.讨论的问题:讨论的问题:讨论的对象:讨论的对象:二二.正态总体均值的区间估计正态总体均值的区间估计1.单各正态总体单各正态总体 情形情形问题问题:设设 X1,Xn 是取自是取自 的样本,的样本,已知已知求:参数求:参数 的置信度为的置信度为 的置信区间的置信区间.解解:(1).当方差当方差 已知已知的情形的情形选选 的点估计的点估计(无偏估计无偏估计)为为寻找未知参寻找未知参数的一个良数的一个良好估计好估计
8、 N(0,1),且统计量且统计量而且而且概率统计U 不依赖于任何未知参数。不依赖于任何未知参数。现对于给定的置信水平现对于给定的置信水平 (大概率大概率),根据根据 U 的分布,确定一个区间,使得的分布,确定一个区间,使得U 取值于该区间的取值于该区间的概率为概率为 故故对于给定的置信水平,对于给定的置信水平,按照标准正态分布的按照标准正态分布的分位点的定义有:分位点的定义有:从中解得:从中解得:概率统计于是所求于是所求 的的置信度为置信度为 置信区间为置信区间为:也可简记为:也可简记为:概率统计例例1.某实验室测量铝的比重某实验室测量铝的比重 16 次,得平均值次,得平均值,设总体,设总体(
9、高斯已证明测量误差是服从正态分布)(高斯已证明测量误差是服从正态分布)求求:的的 95%的置信区间的置信区间.解解:由已知:由已知:查正态分布表得:查正态分布表得:得:得:概率统计即用即用 来估计来估计 值的可靠程度达到值的可靠程度达到 95%的区间范围是的区间范围是(2.691,2.719)(2).方差方差 未知未知的情形的情形用用 去代替去代替 得统计量:得统计量:它是不依赖于任何它是不依赖于任何未知参数的未知参数的.从而从而 的的 的置信区间为:的置信区间为:未知,但考虑到样本方差是未知,但考虑到样本方差是 的无偏估计,的无偏估计,概率统计即:即:从中解得:从中解得:于是所求于是所求 的
10、的置信度为置信度为 置信区间为置信区间为:概率统计例例2.求求:的置信度为的置信度为 95%的置信区间的置信区间解解:由已知:由已知:查查 t 分布表得:分布表得:得:得:从而从而 的的 的置信区间为:的置信区间为:确定某种溶液的化学浓度,现任取确定某种溶液的化学浓度,现任取4个样品,测个样品,测得样本均值为得样本均值为现溶液的化学浓度近似服从正态分布现溶液的化学浓度近似服从正态分布.概率统计2.两个正态总体两个正态总体 的情形的情形 问题问题:是来自第一个总体是来自第一个总体的样本的样本,是来自第二个总体是来自第二个总体的样本的样本,它们相互独立,又设它们相互独立,又设分别是两个总体的样本均
11、值;分别是两个总体的样本均值;求:两个总体均值差求:两个总体均值差 的置信区间的置信区间.分别是两个总体的样本方差。给定置信度为分别是两个总体的样本方差。给定置信度为解解:均为已知均为已知时时概率统计又由又由 的独立性的独立性以及已知:以及已知:故有:故有:所以得统计量所以得统计量:分别为分别为 的无偏估计的无偏估计是是的无偏估计的无偏估计概率统计(2).均为未知均为未知时时同单个总体在方差未知的情形下用同单个总体在方差未知的情形下用 代替代替 的构思的构思相同,可以得到当相同,可以得到当 均很大时均很大时(一般大于一般大于50)的一个置信度为的一个置信度为 的近似置信区间的近似置信区间:于是
12、所求于是所求 的的置信度为置信度为 置信区间为置信区间为:概率统计未知未知时时同单个总体方差未知的情形类似同单个总体方差未知的情形类似(又因又因 )其中其中得统计量:得统计量:于是所求于是所求 的的置信度为置信度为 置信区间为置信区间为:概率统计例例3.分别用金球和铂球测定引力常数分别用金球和铂球测定引力常数(单位单位:)设测定值总体为设测定值总体为 均为未知均为未知.(1)用金球测定观察值为用金球测定观察值为:6.683,6.681,6.676,6.678,6.679,6.672(2)用铂球测定观察值为用铂球测定观察值为:6.661,6.661,6.667,6.667,6.667,6.664
13、1.分别就分别就(1),(2)两种情况两种情况求求 的置信度为的置信度为0.9的置信区间的置信区间2.若设用金球和用铂球测定时测定值总体的方差相等若设用金球和用铂球测定时测定值总体的方差相等,求求两个测定值总体均值差的置信度为两个测定值总体均值差的置信度为0.9的置信区间的置信区间.概率统计解解:在在(1)中:中:用用6.678作为引力常数的估计值的可靠程作为引力常数的估计值的可靠程度为度为 90%的区间是的区间是(6.675,6.681)1.又又即:即:于是所求于是所求 的的置信度为置信度为 90%置信区间为:置信区间为:概率统计在在(2)中中于是所求于是所求 的的置信度为置信度为 90%置
14、信区间为:置信区间为:用用6.664作为引力常数的估计值的可靠程作为引力常数的估计值的可靠程度为度为 90%的区间是的区间是(6.661,6.667)概率统计两个测定值总体的方差相等但又未知,两个测定值总体的方差相等但又未知,现要求现要求 的置信区间,的置信区间,可依公式计算可依公式计算:2.概率统计注注:于是所求于是所求 的的置信度为置信度为 0.9 的置信区间为的置信区间为:一般,若一般,若 的置信区间包含零,则可认为这的置信区间包含零,则可认为这两个总体的均值没有显著差别;若下限大于零,两个总体的均值没有显著差别;若下限大于零,则可认为则可认为 比比 大。大。即用即用 0.014 作为作
15、为 的估计值的可靠程度达到的估计值的可靠程度达到90%的区间是的区间是概率统计问题问题:求求:方差方差 的置信区间的置信区间.解解:是不依赖于任何未知参数的。是不依赖于任何未知参数的。三三.正态总体方差的区间估计正态总体方差的区间估计1.单个正态总体单个正态总体 的情形的情形设总体设总体 未知。未知。体方差,给定置信度体方差,给定置信度是总体是总体 X 的一个样本,的一个样本,是总是总是是 的无偏估计,且统计量:的无偏估计,且统计量:概率统计故故对于给定的置信水平,对于给定的置信水平,按照按照 分布的上分布的上 分位分位点的定义有:点的定义有:于是所求于是所求 的的置信度为置信度为 置信区间为
16、置信区间为:概率统计标准差标准差 的一个置信度为的一个置信度为 的置信区间的置信区间:于是所求于是所求 的的置信度为置信度为 置信区间为置信区间为:概率统计例例4.求求 例例3 中的中的(1),(2)两种情况下,两种情况下,的置信度为的置信度为0.9 的置信区间的置信区间.解解:在在(1)中中 的置信度为的置信度为0.9的置信区间为的置信区间为:(1)用金球测定观察值为用金球测定观察值为:6.683,6.681,6.676,6.678,6.679,6.672概率统计2.两个正态总体两个正态总体 的情形的情形问题问题:来自来自 的样本的样本,来自来自 的样本,的样本,它们相互独立。它们相互独立。
17、求:两个总体方差比求:两个总体方差比 的置信区间的置信区间.解题思路同单个总体情况类似解题思路同单个总体情况类似 分别是两个总体的样本方差与分别是两个总体的样本方差与样本均值,且样本均值均为未知,样本均值,且样本均值均为未知,给定置信给定置信度度解解:概率统计且这两个统计量是相互独立的。且这两个统计量是相互独立的。由由 F 分布的定义得统计量分布的定义得统计量:是不依赖于任何是不依赖于任何 未知参数的。未知参数的。概率统计故故对于给定的置信水平,对于给定的置信水平,按照按照 F 分布的上分布的上 分位分位点的定义有:点的定义有:a a从中解得:从中解得:概率统计例例5.在例在例3 中若测定值总
18、体的方差分别为中若测定值总体的方差分别为 ,解解:于是所求于是所求 的的置信度为置信度为 置信区间为:置信区间为:求:这两个测定值总体方差比的置信度为求:这两个测定值总体方差比的置信度为 0.9 的置的置 信区间信区间.概率统计这两个测定值总体方差比这两个测定值总体方差比 的置信度为的置信度为 0.9的的置信区间置信区间为为:概率统计注注:如果如果 即即表明正态总体表明正态总体 的波动较小的波动较小如果如果 即即表明正态总体表明正态总体 的波动较小的波动较小一般,一般,两者没有显著差别。两者没有显著差别。与与除了两种情况外,其它情况都不能判断出除了两种情况外,其它情况都不能判断出 还是小。还是
19、小。但但若若 的置信区间包含的置信区间包含 1,则,则可认为可认为 与与 中谁的波动性大中谁的波动性大概率统计这是一种特殊的离散型分布的区间估计,取自容这是一种特殊的离散型分布的区间估计,取自容量量 n 50 的大样本。取大样本的的大样本。取大样本的目的目的是意在利用是意在利用中心极限定理,使其近似服从标准正态分布中心极限定理,使其近似服从标准正态分布.问题问题:设总体设总体 X 服从参数为服从参数为 p 的的(0-1)分布分布且且 第六节第六节 (0-1)分布参数的区间估计分布参数的区间估计 即即 X 的分布律为的分布律为:概率统计其中其中 p 为未知参数为未知参数解解:是一个大样本是一个大
20、样本,所以由中心极限定理得所以由中心极限定理得:求求:p 的置信水平为的置信水平为 的置信区间的置信区间.由已知,由已知,概率统计而不等式而不等式:等价于等价于:记:记:即为二次方程即为二次方程的两个根的两个根概率统计其中:其中:得得 p 的近似的置信度为的近似的置信度为 的置信区间为的置信区间为:例例6.从一大批产品中任取从一大批产品中任取100件产品进行检验,发件产品进行检验,发现其中有现其中有 60 件是一级品。件是一级品。试求:这批产品的一级品率试求:这批产品的一级品率 p 的置信度为的置信度为 95%的置信区间的置信区间.解解:由题意可知:由题意可知:一级品率一级品率 p 是是(0-
21、1)分布的参数分布的参数概率统计查表得:查表得:又又 (大样本),(大样本),经计算得:经计算得:概率统计得一级品率得一级品率 p 的置信度为的置信度为 95%的置信区间的置信区间:即用即用 作为一级品率作为一级品率 p 的估计值的可靠程度的估计值的可靠程度达到达到 95%的区间为的区间为 概率统计前面介绍的置信区间中置信限都是双侧的,但在前面介绍的置信区间中置信限都是双侧的,但在有些实际问题,人们所关心的只是参数在一个方有些实际问题,人们所关心的只是参数在一个方向的界限。向的界限。对于设备、元件的使用寿命来说,平均寿命长对于设备、元件的使用寿命来说,平均寿命长没什么问题,过短就有问题了没什么
22、问题,过短就有问题了.这时,可将置信上限取为这时,可将置信上限取为+,而只着眼于置信下限而只着眼于置信下限,这样求得的置信区间称为这样求得的置信区间称为单侧置信区间单侧置信区间.第七节第七节 单侧置信区间单侧置信区间 问题的引出问题的引出例如例如,概率统计一一.单侧置信区间定义单侧置信区间定义定义定义:满足满足:给定给定 若由样本若由样本 确定确定的的则则称随机区间称随机区间:是是的置信度为的置信度为 的的单侧置信区间。单侧置信区间。度为度为 单侧置信下限单侧置信下限(或称(或称 为为置信度为为置信度置信度为置信度为 的的单侧置信上限单侧置信上限)称为置信称为置信概率统计 二二.单侧置信区间的
23、求法单侧置信区间的求法同双侧量区间的求法同双侧量区间的求法例例7.思路思路:不同处:不同处:在求单侧置信区间时在求单侧置信区间时不是查双侧不是查双侧 分位分位点,而点,而是查单侧是查单侧 分位点。分位点。设有某部门对所属区域的职工家庭人均月收入设有某部门对所属区域的职工家庭人均月收入进行调查,现抽取进行调查,现抽取 20 个家庭,所得的月平均收个家庭,所得的月平均收入入 (元),(元),试以试以 95%的置信度估计该区域职工家庭人均月收的置信度估计该区域职工家庭人均月收 入的最低下限为多少?入的最低下限为多少?(单侧置信下限)(单侧置信下限)概率统计解解:用用 表示职工家庭人均月收入表示职工家
24、庭人均月收入,表示测到的数表示测到的数值,它是一个正态随机变量。值,它是一个正态随机变量。现要根据所抽取的现要根据所抽取的20 个家庭所得的月平均收入个家庭所得的月平均收入的数据,在方差未知的条件下求的数据,在方差未知的条件下求 的的单侧置信下限。单侧置信下限。由题设可知由题设可知 的置信度为的置信度为 的单侧置信下限的单侧置信下限 为:为:(即(即 )概率统计即即:于是得到于是得到 的一个置信水平为的一个置信水平为 的单侧置信的单侧置信区间区间即即:概率统计得得:该区域职工家庭人均月收入的该区域职工家庭人均月收入的 最低下限为最低下限为219.3(元元).所求的所求的 的单侧置信下限为的单侧置信下限为: