《第七章 参数估计.ppt》由会员分享,可在线阅读,更多相关《第七章 参数估计.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 参数估计参数估计李良虎李良虎一、复习一、复习抽样分布抽样分布抽样分布的含义抽样分布的含义总体分布:总体内个体数值的频率分布;总体分布:总体内个体数值的频率分布;样本分布:样本内个体数值的频数分布;样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。抽样分布:某一种统计量的频率分布。平均数样本的几个定理:平均数样本的几个定理:从总体中随机抽出容量为从总体中随机抽出容量为N的一切可能样本的平的一切可能样本的平均数之平均数等于总体的平均数;均数之平均数等于总体的平均数;容量为容量为N的平均数在抽样分布上的标准差的平均数在抽样分布上的标准差(标准误),等于总体标准差除以
2、(标准误),等于总体标准差除以N的平方的平方根根 n从正态总体中,随机抽取的容量为从正态总体中,随机抽取的容量为N的一切可能样本平均数的分布也呈正的一切可能样本平均数的分布也呈正态分布;态分布;q虽然总体不呈正态分布,如果样本虽然总体不呈正态分布,如果样本容量较大,反映总体容量较大,反映总体u和和 的样本平的样本平均数的抽样分布,也接近于正态分均数的抽样分布,也接近于正态分布;布;标准误的含义:某种统计量在抽样分布上的标标准误的含义:某种统计量在抽样分布上的标准差。准差。平均数抽样分布的标准误;平均数抽样分布的标准误;标准差抽样分布的标准误;标准差抽样分布的标准误;相关抽样分布的标准差;相关抽
3、样分布的标准差;q样本平均数与总体平均数离差统计量的样本平均数与总体平均数离差统计量的形态:形态:n当总体方差已知时,当总体方差已知时,当总体方差未知时(多数情况下是这样)当总体方差未知时(多数情况下是这样),一切可能样本平均数与总体平均数的离,一切可能样本平均数与总体平均数的离差统计量呈差统计量呈t分布。分布。关于关于t分布:分布:关于关于Z分布与分布与T分布的区别:分布的区别:当总体方差已知时,当总体方差已知时,Z只随样本平均数而变化;只随样本平均数而变化;当总体方差未知时,当总体方差未知时,T不仅随样本平均数而变化,不仅随样本平均数而变化,而且还随而且还随S而变化。而变化。T分布的特点:
4、分布的特点:T分布的形态随自由度的变化呈一簇分布形态分布的形态随自由度的变化呈一簇分布形态(即自由度不同的(即自由度不同的T分布形态也不同);分布形态也不同);T分布的峰狭窄尖峭,尾长而翘得高;分布的峰狭窄尖峭,尾长而翘得高;自由度越小,分布范围越广;自由度趋于无限自由度越小,分布范围越广;自由度趋于无限大时,大时,T分布接近正态分布;自由度分布接近正态分布;自由度df:指总体指总体参数估计量中变量值自由变化的个数参数估计量中变量值自由变化的个数。二二 总体参数估计的基本原理总体参数估计的基本原理n根据样本统计量对相应总体参数所作的根据样本统计量对相应总体参数所作的n估计叫作总体参数估计。估计
5、叫作总体参数估计。n总体参数估计分为点估计和区间估计。总体参数估计分为点估计和区间估计。n由样本的标准差估计总体的标准差即为由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。均数的取值范围则为区间估计。1.1.良好的点估计量应具备的条件良好的点估计量应具备的条件n n无偏性 如果一切可能个样本统计量的值与总体参数如果一切可能个样本统计量的值与总体参数值偏差的平均值为值偏差的平均值为0,这种统计量就是总体,这种统计量就是总体参数的无偏估计量。参数的无偏估计量。n n有效性 当总体参数不止有一种无偏估计量时,某一当总体
6、参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。有效性高,方差大者为有效性低。良好的点估计量应具备的条件n n一致性当样本容量无限增大时,估计量的值能越来越接当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参近它所估计的总体参数值,这种估计是总体参数一致性估计量。数一致性估计量。n n充分性一个容量为一个容量为n的样本统计量的样本统计量,应能充分地反映全部应能充分地反映全部n个数据所反映的总体的信息。个数据所反映的总体的信息。2.区间估计n以样本统计量的抽样分布(概率分布)为以
7、样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称计量的值估计总体参数值的所在范围,称为总体参数的为总体参数的区间估计。n对总体参数值进行区间估计,就是要在一对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的定可靠度上求出总体参数的置信区间的上的上下限。下限。n要知道与所要估计的参数相对应的样本要知道与所要估计的参数相对应的样本统计统计 量量的值,以及样本统计量的理论分布;的值,以及样本统计量的理论分布;n要求出该种统计量的要求出该种统计量的标准误标准误;n要确定在多大的要确定在多大的可靠度可
8、靠度上对总体参数作估、上对总体参数作估、计,再通过某种理论概率分布表,找出与某种计,再通过某种理论概率分布表,找出与某种n可靠度相对应的该分布横轴上记分的可靠度相对应的该分布横轴上记分的临界值临界值,n才能计算出总体参数的才能计算出总体参数的置信区间置信区间的上下限。的上下限。置信区间n置信度,即置信度,即置信概率,是作出某种推断是作出某种推断时正确的可能性(概率)。时正确的可能性(概率)。n n置信区间,也称置信间距(也称置信间距(confidence interval,CI)是指在某一置信度时,总)是指在某一置信度时,总体参数所在的区域距离或区域长度。体参数所在的区域距离或区域长度。置信区
9、间是带有置信概率的取值区间。置信区间是带有置信概率的取值区间。显著性水平n对总体平均数进行区间估计时,置信概率表对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平会有犯错误的可能。显著性水平(significance level)就是指估计总体参数落就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号在某一区间时,可能犯错误的概率,用符号表示。表示。P-.平均数区间估计的基本原理n通过样本的平均数估计总体的平均数通过样本的平均数估计总体的平均数,首先假首先假定该样本是随机取自一个正态分布的母总体定
10、该样本是随机取自一个正态分布的母总体(或非正态总体中的或非正态总体中的n30的样本的样本),而计算出,而计算出来的实际平均数是无数容量为来的实际平均数是无数容量为n的样本平均数的样本平均数中的一个。中的一个。n根据样本平均数的分布理论,可以对总体平均根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。数进行估计,并以概率说明其正确的可能性。三总体平均数的区间估计1总体平均数区间估计的基本步骤根据样本的数据,计算样本的平均数和标准差;根据样本的数据,计算样本的平均数和标准差;计算平均数抽样分布的标准误;计算平均数抽样分布的标准误;确定置信概率或显著性水平;确定置信概率
11、或显著性水平;根据样本平均数的抽样分布确定查何种统计表;根据样本平均数的抽样分布确定查何种统计表;计算置信区间;计算置信区间;解释总体平均数的置信区间。解释总体平均数的置信区间。2总体平均数区间估计的计算总体正态,总体正态,已知(不管样本容量大小)已知(不管样本容量大小),或总体非正态,或总体非正态,已知,大样本已知,大样本平均数离差的的抽样分布呈正态,平均数平均数离差的的抽样分布呈正态,平均数的置信区间为:的置信区间为:(91)n例题例题1:某小学:某小学10岁全体女童岁全体女童身高历年来标准差为身高历年来标准差为6.25厘米,厘米,现从该校随机抽现从该校随机抽27名名10岁女童,岁女童,测
12、得平均身高为测得平均身高为134.2厘米,试厘米,试估计该校估计该校10岁全体女童平均身岁全体女童平均身高的高的95和和99置信区间。置信区间。n解:解:1010岁女童的身高假定是从正态总岁女童的身高假定是从正态总体中抽出的随机样本,并已知总体标体中抽出的随机样本,并已知总体标准差为准差为=6.25=6.25。无论样本容量大小,。无论样本容量大小,一切样本平均数的标准分数呈正态分一切样本平均数的标准分数呈正态分布。于是可用正态分布来估计该校布。于是可用正态分布来估计该校1010岁女童身高总体平均数岁女童身高总体平均数9595和和9999的的置信区间。置信区间。其标准误为其标准误为当当0.95时
13、,时,1.96因此,该校因此,该校10岁女童平均身高岁女童平均身高95的置信区间为:的置信区间为:当当0.99时,时,2.58因此,该校因此,该校10岁女童平均身高岁女童平均身高99的置信区间为:的置信区间为:总体正态,总体正态,未知(不管样本容量大小),未知(不管样本容量大小),或总体非正态,或总体非正态,未知,大样本未知,大样本n平均数离差的抽样分布为平均数离差的抽样分布为t分布,平均分布,平均数的置信区间为:数的置信区间为:(92)n例题例题2:从某小学三年级随:从某小学三年级随机抽取机抽取12名学生,其阅读能力名学生,其阅读能力得分为得分为28,32,36,22,34,30,33,25
14、,31,33,29,26。试估计该校三年级学生阅读能力试估计该校三年级学生阅读能力总体平均数总体平均数95和和99的置信的置信区间。区间。n解:解:1212名学生阅读能力的得分假定是从正名学生阅读能力的得分假定是从正态总体中抽出的随机样本,而总体标准差态总体中抽出的随机样本,而总体标准差未知,样本的容量较小(未知,样本的容量较小(=1230=1230n=12030),),t t分布接近于正态分布接近于正态分布,因此可用正态分布近似处理。分布,因此可用正态分布近似处理。其标准误为其标准误为当0.95时,1.96因此,该年全部考生作文成绩因此,该年全部考生作文成绩95的置信区间为:的置信区间为:当0.99时,2.58因此,该年全部考生作文成绩因此,该年全部考生作文成绩99的置信区间的置信区间为:为:总体非正态,小样本 n n不能进行参数估计,即参数估计,即不能根据样本分布对总不能根据样本分布对总体平均数进行估计体平均数进行估计。n思考题思考题:n怎样由样本平均数对总体平均数进行区怎样由样本平均数对总体平均数进行区间估计?可分为几种类型?间估计?可分为几种类型?