《第4章-参数估计分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第4章-参数估计分析优秀PPT.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 4 章 参数估计n4.1 参数估计的基本原理参数估计的基本原理n4.2 一个总体参数的区间估计一个总体参数的区间估计n4.3 两个总体参数的区间估计两个总体参数的区间估计n4.4 样本容量的确定样本容量的确定注:本章以下探讨内容均以重复抽样为例名人名言n“概率论是生活真正的领路人,假如没有对概率的某种估计,我们就寸步难行,无所作为”.n英国逻辑学家和经济学家杰文斯n(Jevons,18351882)n 这句话是在有一次,他在评论一些经济问题时所说的话。统计推断/抽样推断统计推断:就是依据已知的部分数据对总体进统计推断:就是依据已知的部分数据对总体进行估计的一种推断方法。行估计的一种推断方法
2、。统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计矩估计法矩估计法最大似然估计法最大似然估计法双侧置信区间双侧置信区间单侧置信区间单侧置信区间侧重于用样本统计量估计总体的某一未知参数侧重于用样本资料验证总体是否具有某种性质或数字特征抽样估计的意义1、在不行能进行全面调查的状况。对于无限总体和总体单位特殊多的有限总体以及破坏性的产品质量检查,不行能进行全面调查,只能接受部分单位调查,从而推断总体状况,如了解某市空气污染状况、电子元件的寿命等等。2、在不必要进行全面调查的状况下,可接受抽样调查。如居民家计调查、电视台节目收视率调查等,没必要耗费大量的人力、物力和时间去全
3、部逐一登记。3、在来不及进行全面调查的状况下,可接受抽样调查。如物价部门检查企业有无违反物价规定的状况。4、为了对全面资料进行补充和修正,也常常接受抽样调查。普查范围广、耗费大,故比较长时间才进行一次。一般在普查之后,要进行一次抽样复查,用抽样的资料与范围内的普查资料对比,去修正普查资料。由于抽样调查具有花费小、适应性强、科学性高等其他调查方法无法相比的优越性,它在社会经济工作中得到了广泛的应用。归纳起来,主要有以下几种状况常常接受抽样调查:抽样推断方法与其它统计调查方法相抽样推断方法与其它统计调查方法相比,具有省时、省力、快捷的特点,能以比,具有省时、省力、快捷的特点,能以较小的代价刚好获得
4、总体的有关信息。较小的代价刚好获得总体的有关信息。1.1.依据样本资料对总体的数量特征作出具依据样本资料对总体的数量特征作出具有确定牢靠性的估计和推断有确定牢靠性的估计和推断.2.2.依据随机性原则从全部总体中抽取样本依据随机性原则从全部总体中抽取样本单位单位.3.3.抽样推断必定会产生抽样误差抽样推断必定会产生抽样误差.特点 用样本指标来代表总体指标时就会产生确定的误用样本指标来代表总体指标时就会产生确定的误差,这种误差是抽样推断方法本身所固有的,所以叫差,这种误差是抽样推断方法本身所固有的,所以叫抽样误差,属于代表性误差。抽样误差,属于代表性误差。抽样误差主要包括样本平均数与总体平均数的差
5、抽样误差主要包括样本平均数与总体平均数的差数,样本成数与总体成数的差数。抽样误差愈小,表数,样本成数与总体成数的差数。抽样误差愈小,表示样本的代表性愈高;反之,代表性就愈低。示样本的代表性愈高;反之,代表性就愈低。抽样误差的大小确定于以下几个因素:抽样误差的大小确定于以下几个因素:1.1.样本容量样本容量n n的多少。的多少。2.2.总体被探讨标记的变异程度。总体被探讨标记的变异程度。3.3.抽样方法的选择。抽样方法的选择。抽样误差学习目标n1、估计量与估计值的概念、估计量与估计值的概念n2、点估计与区间估计的区分、点估计与区间估计的区分n3、评价估计量优良性的标准、评价估计量优良性的标准n4
6、、一个总体参数的区间估计方法、一个总体参数的区间估计方法n5、两个总体参数的区间估计方法、两个总体参数的区间估计方法n6、样本容量的确定方法、样本容量的确定方法4.1 参数估计的基本原理参数估计的基本原理一、估计量与估计值一、估计量与估计值二、点估计与区间估计二、点估计与区间估计三、评价估计量的标准三、评价估计量的标准参数估计 参数估计,通俗地说,就是依据抽样结果来合理参数估计,通俗地说,就是依据抽样结果来合理参数估计,通俗地说,就是依据抽样结果来合理参数估计,通俗地说,就是依据抽样结果来合理地、科学地估计总体的参数很可能是什么?或者在什地、科学地估计总体的参数很可能是什么?或者在什地、科学地
7、估计总体的参数很可能是什么?或者在什地、科学地估计总体的参数很可能是什么?或者在什么范围。么范围。么范围。么范围。点估计:依据样本数据算出一个单一的估计值,点估计:依据样本数据算出一个单一的估计值,点估计:依据样本数据算出一个单一的估计值,点估计:依据样本数据算出一个单一的估计值,用来估计总体的参数值。用来估计总体的参数值。用来估计总体的参数值。用来估计总体的参数值。区间估计:计算抽样平均误差,指出估计的可信区间估计:计算抽样平均误差,指出估计的可信区间估计:计算抽样平均误差,指出估计的可信区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在程度,进而在点估
8、计的基础上,确定总体参数的所在程度,进而在点估计的基础上,确定总体参数的所在程度,进而在点估计的基础上,确定总体参数的所在范围或区间。范围或区间。范围或区间。范围或区间。n1.估计量:用于估计总体参数的随机变量n如样本均值,样本比率、样本方差等n例如:样本均值就是总体均值 的一个估计量n2.参数用 表示,估计量用 表示n3.估计值:估计参数时计算出来的统计量的具体值n假如样本均值 x=80,则 80就是 的估计值估计量与估计值(estimator&estimated value)在实际问题中,我们常常须要估计一些未知参数,这些参数可能是总体分布中的参数;或者当总体分布未知时,总体的某些数字特征
9、,如:均值、方差等。样本集样本集样本集样本集0 0 1 1 2 20 0 值估计值估计值估计值估计范围估计范围估计范围估计范围估计区间估计区间估计区间估计区间估计点估计点估计点估计点估计其它类型的估计其它类型的估计其它类型的估计其它类型的估计,如如如如 贝叶斯估计贝叶斯估计贝叶斯估计贝叶斯估计点估计(point estimate)n1.用样本的估计量干脆作为总体参数的估计值n例如:用样本均值干脆作为总体均值的估计n例如:用两个样本均值之差干脆作为总体均值之差的估计n2.没有给出估计值接近总体参数程度的信息n3.点估计的方法有矩估计法、依次统计量法、最大似然法、最小二乘法等点估计点估计 点估计,
10、也称定值估计,就是以样本估计量干脆代替总体参数的一种推断方法。点估计常用方法:矩估计法、极大似然估计法。区间估计(interval estimate 在在区区间间估估计计中中,需需要要寻寻找找两两个个统统计计量量 和和 分分别别来来估估计计总总体体参参数数 的的下下限限和和上上限限,使使总总体体参参数数被被包包含含在区间在区间 内的概率为内的概率为 为为显显著著性性水水平平,1-1-就就是是区区间间 包包含含 真真实实值值 的的 概概 率率,称称 为为 置置 信信 水水 平平 或或 置置 信信 度度。所所 以以 区区 间间 也也称称为为参参数数 的的置置信信水水平平为为1-1-的的置置信信区区
11、间间,区区间间的的边边界界称称为为置置信信限限 。比比如如,某某班班级级平平均均分分数数在在75758585之之间间,置置信水平是信水平是95%95%。区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x 区间估计区间估计(Interval estimation)一、有关区间估计的几个概念一、有关区间估计的几个概念一、有关区间估计
12、的几个概念一、有关区间估计的几个概念1.1.置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信念而在点估计两边设置的估计区间。置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信念而在点估计两边设置的估计区间。置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信念而在点估计两边设置的估计区间。置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信念而在点估计两边设置的估计区间。2.2.显著性水平显著性水平显著性水平显著性水平 :用置信区间来估计的不行靠程度。:用置信区间来估计
13、的不行靠程度。:用置信区间来估计的不行靠程度。:用置信区间来估计的不行靠程度。区间估计的任务是,在点估计值的两侧设置一个区区间估计的任务是,在点估计值的两侧设置一个区区间估计的任务是,在点估计值的两侧设置一个区区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。牢靠性和精间,使得总体参数被估计到的概率大大增加。牢靠性和精间,使得总体参数被估计到的概率大大增加。牢靠性和精间,使得总体参数被估计到的概率大大增加。牢靠性和精确性确性确性确性(即信度和效度即信度和效度即信度和效度即信度和效度)在区间估计中是相互冲突的两个方面。在区间估计中是相互冲突的两个方面。在区间估计
14、中是相互冲突的两个方面。在区间估计中是相互冲突的两个方面。3.3.置信度(水平)置信度(水平)置信度(水平)置信度(水平):用置信区间估计的牢靠性:用置信区间估计的牢靠性:用置信区间估计的牢靠性:用置信区间估计的牢靠性(把握度)(把握度)(把握度)(把握度)4.4.抽样平均误差抽样平均误差抽样平均误差抽样平均误差 与概率度与概率度与概率度与概率度 Z Z 抽样平均误差抽样平均误差抽样平均误差抽样平均误差 :样本均值抽样分布的标准:样本均值抽样分布的标准:样本均值抽样分布的标准:样本均值抽样分布的标准差。反映在参数四周抽样平均值的平均变异程度。差。反映在参数四周抽样平均值的平均变异程度。差。反映
15、在参数四周抽样平均值的平均变异程度。差。反映在参数四周抽样平均值的平均变异程度。越大,样本均值越分散。越大,样本均值越分散。越大,样本均值越分散。越大,样本均值越分散。概率度:概率度:概率度:概率度:Z Z在参数估计中被称为概率度,其大在参数估计中被称为概率度,其大在参数估计中被称为概率度,其大在参数估计中被称为概率度,其大 小由小由小由小由 确定确定确定确定.1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平 2 表示为(1-为是总体参数未在区间内的比率3 常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10置信水平置信水平
16、n1.由样本统计量所构造的总体参数的估计区间称为置信区间n2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 n3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值n我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间置信区间(confidence interval)=0.10=0.10时,时,时,时,1-1-=0.90=0.90,Z Z/2/2=1.65=1.65 =0.05=0.05时,时,时,时,1-1-=0.95=0.95,Z Z/2/2=1
17、.96=1.96 =0.01=0.01时,时,时,时,1-1-=0.99=0.99,Z Z/2/2=2.58=2.58 显著性水平、置信水平、概率度显著性水平、置信水平、概率度显著性水平、置信水平、概率度显著性水平、置信水平、概率度 之间的关系:之间的关系:之间的关系:之间的关系:区间估计的做法区间估计的做法区间估计的做法区间估计的做法 从点估计值起先,向两侧绽开确定倍数从点估计值起先,向两侧绽开确定倍数从点估计值起先,向两侧绽开确定倍数从点估计值起先,向两侧绽开确定倍数的抽样平均误差,并估计总体参数很可能就包的抽样平均误差,并估计总体参数很可能就包的抽样平均误差,并估计总体参数很可能就包的抽
18、样平均误差,并估计总体参数很可能就包含在这个区间之内。含在这个区间之内。含在这个区间之内。含在这个区间之内。影响区间宽度的因素影响区间宽度的因素1.总体数据的离散程度,用来测度2.样本容量,3.置信水平(1-),影响 z 的大小置信区间越小,说明估计的精度越高,即我们对未置信区间越小,说明估计的精度越高,即我们对未置信区间越小,说明估计的精度越高,即我们对未置信区间越小,说明估计的精度越高,即我们对未知参数的了解越多、越具体;置信水平越大,估计牢知参数的了解越多、越具体;置信水平越大,估计牢知参数的了解越多、越具体;置信水平越大,估计牢知参数的了解越多、越具体;置信水平越大,估计牢靠性就越大。
19、靠性就越大。靠性就越大。靠性就越大。在样本容量确定的前提下,精度与置信度往往是相在样本容量确定的前提下,精度与置信度往往是相在样本容量确定的前提下,精度与置信度往往是相在样本容量确定的前提下,精度与置信度往往是相互冲突的。若要同时提高置信度和精度,只能增加样互冲突的。若要同时提高置信度和精度,只能增加样互冲突的。若要同时提高置信度和精度,只能增加样互冲突的。若要同时提高置信度和精度,只能增加样本容量。本容量。本容量。本容量。区间估计和假设检验(下章)有着对偶的关系,有区间估计和假设检验(下章)有着对偶的关系,有区间估计和假设检验(下章)有着对偶的关系,有区间估计和假设检验(下章)有着对偶的关系
20、,有一种假设检验就可依据该检验构造相应的置信区间。一种假设检验就可依据该检验构造相应的置信区间。一种假设检验就可依据该检验构造相应的置信区间。一种假设检验就可依据该检验构造相应的置信区间。置信区间的构建往往要借助于未知参数点估计或其置信区间的构建往往要借助于未知参数点估计或其置信区间的构建往往要借助于未知参数点估计或其置信区间的构建往往要借助于未知参数点估计或其函数的抽样分布来进行。函数的抽样分布来进行。函数的抽样分布来进行。函数的抽样分布来进行。区间估计的进一步说明评价估计量的标准评价估计量的标准无偏性无偏性(unbiasedness)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总
21、体参数 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布一样性一样性(consistency)一样性:随着样本容量的增大,估计量的一样性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()置信区间的求法置信区间的
22、求法-枢轴量法枢轴量法构造未知参数 的置信区间的常用方法是枢轴量法,其步骤可以概括为如下三步:1.设法构造一个样本和的函数Z=Z(x1,x2xn,)使得Z的分布不依靠于未知参数,一般称具有这种性质的Z为枢轴量。2.适当地选择两个常数c,d,使对给定的(0 1)有P(c Z d)=1-(1)3.假如能将 c Z d 进行不等式等价变形为 ,则有 (2)这表明 是的1-同等置信区间。上述构造置信区间的关键在于构造枢轴量Z,故把这种方法称为枢轴量法。枢轴量的找寻一般从的点估计动身,而满足(1)的c,d可以有很多,选择的目的是希望(2)中的平均长度 尽可能短。假如可以找到这样的c,d使 达到最短当然是
23、最好的,不过在不少场合很难做到这一点。故常这样选择c和d,使得两个尾部概率各位/2,即这样得到的置信区间称为等尾置信区间,好用的置信区间大都是等尾置信区间 例例例例1 1 设设设设X X1 1,X Xn n是取自是取自是取自是取自N N(,2 2)的样本,的样本,的样本,的样本,2 2已知,已知,已知,已知,求参数求参数求参数求参数 的置信水平为的置信水平为的置信水平为的置信水平为1-1-的置信区间的置信区间的置信区间的置信区间.置信区间的求法置信区间的求法举例举例 O 例例例例1 1 设设设设 X X1 1,X Xn n 是取自是取自是取自是取自N N(,2 2)的样本,的样本,的样本,的样
24、本,2 2已知,已知,已知,已知,求参数求参数求参数求参数 的置信水平为的置信水平为的置信水平为的置信水平为1-1-的置信的置信的置信的置信区间区间区间区间.解:选解:选 的点估计为的点估计为 枢轴量:一个待估参数和枢轴量:一个待估参数和枢轴量:一个待估参数和枢轴量:一个待估参数和统计量的函数统计量的函数统计量的函数统计量的函数 ,要求,要求,要求,要求其分布为已知其分布为已知其分布为已知其分布为已知.找寻未知参数的一个良好估计.有了分布,就可以求出有了分布,就可以求出有了分布,就可以求出有了分布,就可以求出Z Z取值于随意区间的概率取值于随意区间的概率取值于随意区间的概率取值于随意区间的概率
25、.取 对给定的置信水平对给定的置信水平对给定的置信水平对给定的置信水平 1-1-查正态分布表得查正态分布表得查正态分布表得查正态分布表得 对于给定的置信水平对于给定的置信水平对于给定的置信水平对于给定的置信水平,依据依据依据依据Z Z的分布,确定一的分布,确定一的分布,确定一的分布,确定一 个区间个区间个区间个区间,使得使得使得使得Z Z取值于该区间的概率为置信水平取值于该区间的概率为置信水平取值于该区间的概率为置信水平取值于该区间的概率为置信水平.从中解得从中解得从中解得从中解得 也可简记为也可简记为也可简记为也可简记为 于是所求于是所求于是所求于是所求 的的的的 置信区间为置信区间为置信区间为置信区间为