《第07章 参数估计.ppt》由会员分享,可在线阅读,更多相关《第07章 参数估计.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章参参 数数 估估 计计授课教师:程晓谟授课教师:程晓谟主要内容主要内容1 置信区间与置信水平置信区间与置信水平2 一个总体参数的区间估计一个总体参数的区间估计3 SPSS输出某分布的上输出某分布的上a分位点和累积概率分位点和累积概率4 估计总体均值时样本容量的确定估计总体均值时样本容量的确定 5 SPSS输出均值的置信区间输出均值的置信区间第一节第一节 参数估计的基本原理参数估计的基本原理参数估计参数估计(parameter estimation)n n参数估计参数估计参数估计参数估计用样本统计量去估计总体的参数用样本统计量去估计总体的参数用样本统计量去估计总体的参数用样本统计量去
2、估计总体的参数用样本均值用样本均值用样本均值用样本均值 x x 估计总体均值估计总体均值估计总体均值估计总体均值 ;用样本方差;用样本方差;用样本方差;用样本方差s s2 2估计估计估计估计 2 2n n估计量(估计量(估计量(估计量(estimatorestimator)用于估计总体参数的统计量的名称用于估计总体参数的统计量的名称用于估计总体参数的统计量的名称用于估计总体参数的统计量的名称如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等用符号用符号用符号用符号 表示表示表示表示n n估计值(估计值(估计值(估计值
3、(estimated value)estimated value)用样本计算出来的估计量的数值用样本计算出来的估计量的数值用样本计算出来的估计量的数值用样本计算出来的估计量的数值如果样本均值如果样本均值如果样本均值如果样本均值x x x x=80=80,则,则,则,则8080就是就是就是就是 的估计值的估计值的估计值的估计值点估计点估计(point estimate)n n用用样样本本的的估估计计量量的的某某个个取取值值直直接接作作为为总总体体参数参数q q的估计值;的估计值;例如:用样本均值直接例如:用样本均值直接例如:用样本均值直接例如:用样本均值直接作为作为作为作为总体均值的估计总体均值
4、的估计总体均值的估计总体均值的估计没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息l l由由由由于于于于样样样样本本本本是是是是随随随随机机机机的的的的,抽抽抽抽出出出出一一一一个个个个具具具具体体体体的的的的样样样样本本本本得得得得到到到到的的的的估计值估计值估计值估计值很可能不同于很可能不同于很可能不同于很可能不同于总体真值总体真值总体真值总体真值l l一个具体的点估计值无法给出估计的可靠性度量一个具体的点估计值无法给出估计的可靠性度量一个具体的点估计值无法给出估计的可靠性度量一个具体的点估计值
5、无法给出估计的可靠性度量 n 是总体分布的一个待估参数,根据随机样本X1,X2,Xn,估计 的统计量为:n根据样本观察值x1,x2,xn,得到 的估计值:判断点估计的优劣标准判断点估计的优劣标准无偏性无偏性(unbiasedness)n无无偏偏性性:估计量抽样分布的数学期望等于被估计的总体参数 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()一致性一致性(con
6、sistency)n一致性:一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()区间估计区间估计(interval estimate)n在点估计的基础上,给出总体参数的一在点估计的基础上,给出总体参数的一个估计区间,该区间由个估计区间,该区间由样本统计量加减样本统计量加减估计误差估计误差而得到而得到;n根据样本统计量的抽样分布根据样本统计量的抽样分布,能够度量,能够度量样本统计量样本统计量与与总体参数总体参数的接近程度的概的接近程度的概率率;置信区间置信区间
7、(confidence interval)n设总体X的分布函数F(x;)含有一个未知参数 ,对于给定值 ,若由来自X的样本X1,X2,Xn确定的两个统计量:对于任意 满足则称 是 的置信水平为1-a的置信区间。置信区间估计置信区间估计 Confidence Interval Estimation置信下限Lower Limit置信上限 Upper Limit置信区间Confidence Interval样本统计量Sample Statisticn将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平(置信度)。n表示为(1-为是总体参数未在区间内的比例n常用的置信水
8、平值有 99%,95%,90%相应的相应的 为0.01,0.05,0.10置信水平置信水平 (confidence level)置信区间与置信水平置信区间与置信水平用某种方法构造的所有区间中,有95%的区间包含总体参数的真值,5%的区间不包含,该区间称为置信水平为95%的置信区间。根据样本得到的多个区间95%的区间包含 .5%不包含.n n置置信信区区间间是是一一个个随随机机区区间间,会会因因样样本本的的不不同同而而变变化化,而而且且不不是是所所有有的的区区间间都都包包含含总总体参数体参数;n n实实际际估估计计时时往往往往只只抽抽取取一一个个样样本本,据据此此构构造造的的置置信信区区间间是是
9、大大量量包包含含总总体体参参数数真真值值的的区区间间中中的的一一个个,但但也也可可能能是是少少数数几几个个不不包包含参数真值的区间中的一个。含参数真值的区间中的一个。置信区间的表述置信区间的表述(confidence interval)n n一一个个特特定定的的置置信信区区间间总总是是“包包含含”或或“绝绝对对不不包包含含”参参数数的的真真值值,不不存存在在“以以多多大大的概率包含总体参数的概率包含总体参数”的问题;的问题;n n置置信信水水平平表表示示在在多多次次估估计计得得到到的的区区间间中中有有多多少少个个区区间间包包含含参参数数真真值值,而而不不是是针针对对所所抽取的这个样本所构建的区
10、间而言的。抽取的这个样本所构建的区间而言的。置信区间的表述置信区间的表述(confidence interval)置信区间的表述置信区间的表述(95%的置信区的置信区间间)从均值为从均值为从均值为从均值为185185的总体中抽出的总体中抽出的总体中抽出的总体中抽出2020个样本构造出个样本构造出个样本构造出个样本构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 我没有抓住参数!我没有抓住参数!我没有抓住参数!我没有抓住参数!点估计值点估计值点估计值点估计值 第二节第二节 一个总体参数的一个总体参数的区区 间间 估估 计计已知总体方差求总体均值的已知总体方差求总体均值的置信区间置
11、信区间n n假定条件假定条件总体服从正态分布,且方差()已知不是正态分布不是正态分布不是正态分布不是正态分布,方差已知,大样本大样本大样本大样本(n 30)n n总体均值总体均值 在在1-置信水平下的置信水平下的置信区间置信区间n n使用正态分布统计量构造置信区间使用正态分布统计量构造置信区间1-/2/2置信区间随机变量确定数值常用置信水平的常用置信水平的Za/2值值置信水平aa/2Za/290%0.100.051.64595%0.050.0251.9699%0.010.0052.58区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96
12、+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x 2已知时已知时总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量袋食品的重
13、量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3 2已知时已知时总体均值的区间估计总体均值的区间估计(例题分析例题分析)该食品平均重量的置信区间为101.44克109.28克之间解解:已知N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:总体均值在1-置信水平下的置信区间为如何用如何用SPSS计算计算上上a分位点分位点先输入一个数,否则无法计算Inverse DF反概率密度
14、函数反概率密度函数求上求上a分位点分位点Idf.NormalIdf.Normal求正态分布的求正态分布的上上a分位点分位点Idf.Normal(累计概率,均值,标准差累计概率,均值,标准差)a=0.05X服从标准正态分布时服从标准正态分布时1-0.050.050.050.05Idf.Normal(0.025,0,1)计算上0.025分位点-Idf.Normal(0.025,0,1)Z0.0250.025=1.96n假定条件总体服从正态分布,且方差()未知总体非正态分布,方差未知,大样本n总体均值 在1-置信水平下的置信区间为未知总体方差求总体均值的未知总体方差求总体均值的置信区间置信区间n使用
15、 t 分布统计量/2/21-2未知未知总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470 2未知未知总体均值的区间估计总体均值的区间估计(例题分析例题分析)该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时解解:已 知N(,2),n=16,1-=95%,t/2=2.131
16、根据样本数据计算得:,总体均值在1-置信水平下的置信区间为ta/2=t0.025a=0.05,自由度为自由度为15,如何计算,如何计算IDF.T(累积概率,自由度累积概率,自由度)a=0.05X服从服从t分布时分布时1-0.050.050.050.05IDF.T(0.025,15)计算上0.025分位点IDF.T(0.975,15)总体分布总体分布样本量样本量 已知已知 未知未知正态分布正态分布正态分布正态分布大样本小样本非正态分布非正态分布非正态分布非正态分布大样本总体均值区间估计与方差未知的置信区间不一样统计实验统计实验n到130a=0.0530以上差距变小大样本时,可以用大样本时,可以用
17、t统计量代替统计量代替z统计量统计量总体分布总体分布样本量样本量 已知已知 未知未知正态分布正态分布正态分布正态分布大样本小样本非正态分布非正态分布非正态分布非正态分布大样本总体均值区间估计 未知时,用未知时,用t统计量统计量总体比例的区间估计总体比例的区间估计n n假定条件假定条件假定条件假定条件总体服从二项分布可以由正态分布来近似np(成功次数)和n(1-p)(失败次数)均应该大于5n n使用正态分布统计量使用正态分布统计量使用正态分布统计量使用正态分布统计量 z zn nn总体比例总体比例总体比例总体比例总体比例总体比例 在在在在在在1-1-1-置信水平下置信水平下置信水平下置信水平下置
18、信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为总体比例的区间估计总体比例的区间估计(例题分析)(例题分析)【例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的置信区间的置信区间解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该该该城城城城市市市市下下下
19、下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的的的的置置置置信信信信区间为区间为区间为区间为55.65%74.35%55.65%74.35%未知总体均值求总体方差的未知总体均值求总体方差的置信区间置信区间n估计一个总体的方差或标准差n假设总体服从正态分布n总体方差 2 的点估计量为S2,且n 总体方差在1-置信水平下的置信区间为总体方差的区间估计总体方差的区间估计(图示图示)1-1-1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间未知总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例例】一家食品生产企业以生产袋装食品为主,现从某天生产的
20、一批食品中随机抽取了25袋,测得每袋重量如下表7所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3 未知未知总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解:已知n25,1-95%,根据样本数据计算得s2=93.21 2置信度为95%的置信区间为 该企业生产的食品总体重量标准差的
21、的置信区间为7.54克13.43克标标准正准正态态分布分布t分布分布F分布分布2分布分布累累积积概率概率函数函数CDF.NORMAL(?,?,?)CDF.T(?,?)CDF.F(?,?,?)CDF.CHISQ(?,?)参数含参数含义义(X0,均,均值值,标标准差)准差)(X0,自由,自由度)度)(X0,自由,自由度度m,自由度,自由度n)(X0,自由度),自由度)上上a分位点分位点函数函数IDF.NORMAL(?,?,?)IDF.T(?,?)IDF.F(?,?,?)IDF.CHISQ(?,?)参数含参数含义义(累(累积积概率,均概率,均值值,标标准差)准差)(累(累积积概率,概率,自由度)自由
22、度)(累(累积积概率,概率,自由度自由度m,自,自由度由度n)(累(累积积概率,自概率,自由度)由度)用SPSS计算累计概率第三节第三节 样本容量的确定样本容量的确定估计总体均值时样本容量的确定估计总体均值时样本容量的确定 n为什么要确定样本容量?扩大置信区间可以提高估计的可靠度,但过宽的置信区间的实际意义不大;如果既想缩小置信区间,又想不降低置信程度,就需要增加样本容量;但样本容量增加太多,会增加增加调查工作量;因此需要确定一个适当的样本容量。估计总体均值时样本容量的确定估计总体均值时样本容量的确定(已知总体的方差)(已知总体的方差)设 的最大值为E在大样本时,可以用s令例题例题(要求会计算
23、)(要求会计算)【例例】对共和党与民主党的支持率进行民意调查,希望预测的误差不超过3%,已知上一年调查的样本方差为0.18,试计算在95%的置信水平上本次调查所需要的样本量。(Z0.025=1.96)解:=0.03,s2=0.18通常将样本容量取成较大的整数,即小数点后面的数值一律进位成整数。n=769估计两个总体均值之差时估计两个总体均值之差时样本量的确定样本量的确定 n设n1和n2为来自两个总体的样本,并假定n1=n2n根据均值之差的区间估计公式可得两个样本的容量n为估计两个总体均值之差时样本量的确定估计两个总体均值之差时样本量的确定(例题分析例题分析)【例例】一一所所中中学学的的教教务务
24、处处想想要要估估计计试试验验班班和和普普通通班班考考试试成成绩绩平平均均分分数数差差值值的的置置信信区区间间。要要求求置置信信水水平平为为95%,预预先先估估计计两两个个班班考考试试分分数数的的方方差差分分别别为为:试试验验班班 12=90,普普通通班班 22=120。如如果果要要求求估估计计的的误误差差范范围围(边边际际误误差差)不不超超过过5分分,在在两个班应分别抽取多少名学生进行调查?两个班应分别抽取多少名学生进行调查?估计两个总体均值之差时样本量的确定估计两个总体均值之差时样本量的确定(例题分析例题分析)解解:已已知知 1 12 2=90=90,2 22 2=120=120,E E=5
25、,=5,1-1-=95%=95%,z z/2/2=1.96=1.96即应抽取即应抽取即应抽取即应抽取3333人作为样本人作为样本人作为样本人作为样本 第四节第四节 SPSS在参数估计中的应用在参数估计中的应用电脑销量均值和方差的点估计电脑销量均值和方差的点估计电脑销量均值和方差的点估计电脑销量均值和方差的点估计电脑平均销量的电脑平均销量的电脑平均销量的电脑平均销量的95%95%的置信区间的置信区间的置信区间的置信区间得到均值、方差的点估计值均值均值点估计点估计标准差标准差点估计点估计输出置信区间输出置信区间填入置信度,填入置信度,默认为默认为95%置信区间总体构成比例的估计,设计为0-1变量。0-1分布比例的区间估计