《参数估计ppt课件.ppt》由会员分享,可在线阅读,更多相关《参数估计ppt课件.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九章 参数估计1 一、统计推论 统计推论适用于抽样调查资料的处理。所谓统计推论就是根据局部资料(样本资料)对总体的特征进行推断。它属于归纳推理的范畴。统计推论具有两方面的特点:1、由于局部资料来源于总体,因此局部资料的特性在某种程度上能反映总体的特性;2、由于社会资料的随机性,即抽样的结果不是唯一的,又使得一次抽样结果不能恰好就等于总体的结果。这种“抽样结果与总体参数不一致”是随机现象在推论中所特有的,也是进行推论的难点所在。统计推论的理论基础是概率论。统计推论的内容大体可分两部分:1、通过样本对总体的未知参数进行估计,简称参数估计;2、通过样本对总体的某种假设(例如参数或分布的情况)进行检
2、验,简称假设检验。2二、名词解释1、总体:研究对象的全体,总体是由个体构成的。2、样本:从总体中按一定方式抽出的一部分称作样本。样本也是由个体构成的,其中包含个体数目成为样本大小或样本容量。从样本中抽取的个体,可以看作是个数为的一组数据。它们在未抽出之前可看作是一个随机变量。如果要求抽样这样一些数据,不但是随机变量,而且相互独立,遵从同一分布(即同总体所遵从的分布),那么这样的样本就称作简单随机样本。一般在无限总体(即总体个数是无限的)中的随机抽样;或在有限总体(即总体中个数是有限的)中的重复随机抽样(即每次抽样经观测后将抽到的个体放回,允许再次被抽到,又称回置抽取)所得的样本都是简单随机样本
3、。3、统计量从总体中抽取容量为的样本,可以看作个独立同总体分布的随机变量。那么,随机变量的任何函数叫做统计量。根据随机变量的观测值计算得到的一切统计数字特征(例如均值、方差)可以看作是相应统计量的观测值。统计量的分布又称作抽样分布。三、参数的点估计参数估计可分作两类:、点估计:用样本计算出来的一个数来估计未知参数。、区间估计:通过样本计算出一个范围来对未知参数进行估计。4(一)总体参数(均值与方差)的点估计公式、总体均值的点估计:用样本均值作为总体均值的点估计值:样本均值:、总体方差的点估计:用样本方差作为总体方差的点估计值:样本方差:3、总体标准差的点估计:用样本标准差作为总体标准差的点估计
4、值:样本标准差:5、总体成数的点估计:当表示的是定类变量,其取值有:当观测值为所研究的类 其他表示在样本次观测中,类出现次。用样本成数作为总体成数的点估计值。样本成数:6(二)评价点估计值的标准所谓总体参数的最佳估计值(它是样本值的函数)应当是在某种意义下最近似Q的。衡量估计值好坏有如下几个标准:1.无偏性例如:用样本均值作为总体均值的点估计值时。想象做了m次抽样,得到m个容量为n的样本,计算出m个均值,此时 就是一个随机变量,样本均值的分布即一个抽样分布。7对于好的估计值,的分布应该总是围绕着总体均值 周围的,即 分布的均值,应该恰好就是总体均值。这时,我们称估计值为无偏估计值。因为只有这样
5、,对一次样本来说,估计值可能比真实值大,或者小,但对于多个样本来说,就不会存在平均偏差了。即这样的估计值不存在系统偏差。因此,好的估计值应该是 的均值等于总体均值。8、无偏性如果是总体参数的估计值,且分布的均值有:,则称是的无偏估计。反之,将是的有偏估计。样本方差为时,样本方差为时,所以作为总体方差的估计值比好,它是无偏的。9、有效性有效性标准要求估计值的抽样分布应该具有较小的分散性。如果有两个估计值和它们都满足无偏性。那么,当的方差比的方差小时:则称较有效。10、一致性对于估计值除了要求无偏性和有效性外,一个好的估计值还应当要求随着样本容量的增大以更大的概率去接近被估计参数的值。把样本容量为
6、的估计值记作,如果 时,按概率收敛于总体参数Q,即对于任何正数,有:则称是的一致估计值。1 1四、抽样分布统计量的分布(一)样本均值的分布、总体分布为正态分布,且方差已知:根据正态分布的性质:任意有限个服从正态分布的独立随机变量直线型函数仍然服从正态分布。因此,若服从总体分布为中抽出的一个样本,则是个相互独立,分布为的随机变量。那么,样本均值仍然服从正态分布:12比较:;。可见,随着样本容量的增加,可以有效减少抽样分布的分散程度。称作抽样均值的平均误差或标准误,反映了统计量围绕的分散程度,或者说反映了抽样均值与的平均误差水平,值除了与总体有关外,它还随着样本容量而变化。由于是由抽样引起的,其大
7、小可以反映统计量的可靠程度。如果将标准化:13、总体分布为正态分布,且方差未知:这时用样本方差作为总体方差的估计值。根据数学推算,统计量 自由度k 为n-1 的t 分布。当K 很大时,t 分布图形与标准正态分布差别很小。因此,当K 很大时(n30),就可以用标准正态分布N(0,1)来近似t 分布。143、任意总体,大样本情况:根据中心极限定理,只要样本容量足够大(n=50)即在大样本的情况下,的分布将接近正态分布:若总体的均值为,方差为,是取自该总体的大小为n的样本的均值,S是样本的标准差,则当 时(方差已知)(方差未知)15(二)样本方差 的分布 在总体为正态分布时,的分布与 分布相联系。可
8、以证明:自由度的分布。分布的均值、方差与自由度有如下关系:16(三)大样本总体(二项总体)成数的分布 当表示的是定类变量,其取值有:当观测值为所研究的类 其他表示在样本次观测中,类出现次。样本成数:可以看作是n个满足二点分布(0,1)分布的随机变量 的均值。根据中心极限定理,在大样本情况下(np=5 和nq=5),的分布可近似看作正态分布,17五、参数的区间估计(一)有关区间估计的几个概念 1、名词解释 区间估计:通过样本计算出一个范围来对未知参数进行估计。参数的区间估计在给出区间估计的同时,还必须指出所给区间包含未知参数的概率是多少。例如:用 作为未知参数Q的估计值,那么,区间 包含参数Q之
9、概率为1-,其中区间 称作置信区间。区间大小,反映了估计的准确性或精确性。1-称作置信度、置信概率或置信系数。它表示用置信区间估计的可靠性。称显著性水平它表示置信区间估计不可靠的概率。显然,置信度与显著性水平之和为1。182、置信区间(Confidence interval)与置信度(Confidence coefficient)之间的关系置信区间的一般形式:Q是未知参数,对于确定的总体,它是唯一的。但 和 是统计量,它是随着样本而变的随机变量。所以区间 是一个随机区间,对于一次抽样所形成的样本,区间估计可能包含待估参数Q,也可能不包含待估参数Q。指出包含待估参数的概率是多少;指出不包含待估参
10、数的概率是多少。置信区间除了写作双侧区间:之外;还可以写作单侧区间:或。单侧区间与置信度之间的关系:19 置信度一般是根据实际情况预先给定的。通常置信度的标准有:0.90,0.95,0.99。置信度为0.90,表示如果独立重复地抽取很多样本,每次样本容量n保持不变的话,那么,平均而言,每100个样本,其中有90个样本计算出的区间估计是包含待估参数Q的。在样本容量一定的情况下,置信区间和置信度是相互制约的。置信度越大(即估计的可靠性越大),则相应的置信区间也越宽(估计的越不精确)。3、区间估计与抽样分布 区间估计与置信度之间的关系是用概率公式表达的:其中置信度是预先给定的,接下来只有知道了 或和
11、其有关的统计量的抽样分布,才能把概率1-的大小和区间 的大小联系起来。20(二)总体均值的区间估计、总体分布为正态分布,且方差已知:统计量 总体均值的双侧置信区间有:将统计量代入上式有:经整理有:区间 为待估参数置信度为1-的双侧置信区间。021例:设某工厂妇女从事家务劳动时间服从正态分布。根据36人的随机抽样调查,每天平均从事家务劳动时间 小时,求 的双侧置信区间(置信度取0.95和0.99两种)。022 2、总体分布为正态分布,且方差未知:统计量 总体均值的双侧置信区间有:将统计量 t 代入上式经整理有:区间 为待估参数置信度为1-的双侧置信区间。023 例:设某社区受教育程度服从正态分布
12、 未知。根据25人的随机抽样调查,平均受教育年限和标准差为,求 的双侧置信区间(1-a=0.99)024 3、任意总体,大样本情况:统计量;(1)方差已知时,区间估计公式为:区间 为待估参数置信度为1-的双册置信区间。(2)方差未知时,区间估计公式为:区间 为待估参数置信度为1-的双册置信区间。025 例:设某社区受教育程度的总体分布、方差都不知道。根据50人的抽样调查结果,平均受教育年限和标准差为,求 的双侧置信区间(1-a=0.99)026(三)正态总体方差的区间估计 在总体为正态分布时,统计量 对于给定置信度1-,双侧区间 的临界值应满足:整理后有:其中区间 为待估参数置信度为1-的双侧
13、置信区间。27 例:设某村平均家庭收入服从正态分布。现根据10户平均年收入的抽样调查,得数据:578;572;570;568;572;570;570;596;584;572。求方差和标准差的置信区间(1-a=0.95)28(四)大样本总体(二项总体)成数的区间估计 根据中心极限定理,在大样本情况下(np=5 和nq=5),的分布可近似看作正态分布,因此大样本成数区间估计公式有:区间 为待估参数置信度为1-的双侧置信区间。其中 为总体成数p的点估计值,当p未知时,可用 代替p。029 例:设根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地拥有电冰箱成数p的置信区间(置信度为0.95)。030