《心理与教育统计学课件张厚粲版ch7参数估计.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学课件张厚粲版ch7参数估计.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 参数估计参数估计 当在研究中从样本获得一组数据后,如何通过这组数据信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。参数估计可分为点估计和区间估计两种。1第一节第一节 点估计、区间估计与标准误点估计、区间估计与标准误一、点估计的定义一、点估计的定义点估计是指在进行参数估计时,直接用一个特定点值作为总体参数的估计值。二、良好估计量的标准二、良好估计量的标准无偏性:无偏性:即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。有效性:有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。一致性一
2、致性:当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。充分性:充分性:指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息。2三、区间估计与标准误三、区间估计与标准误区间估计的定义区间估计的定义是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数轴上的一段距离表示未知参数可能落入的范围。置信区间与显著性水平置信区间与显著性水平置信区间:置信区间:也称置信间距,指在一定可靠程度上,总体参数所在的区域距离或区域长度。置信界限(临界值):置信界限(临界值):置信区间的上下两端点值。显著性水平显
3、著性水平:指估计总体参数落在某一区间时,可能犯错误的概率,用符号 表示。有时也称为意义阶段、信任系数等。置信度(置信水平):置信度(置信水平):。3三、区间估计与标准误三、区间估计与标准误区间估计的原理与标准误区间估计的原理与标准误区间估计是根据样本分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率。区间估计存在成功估计的概率大小成功估计的概率大小及估计范围大小估计范围大小两个问题。妥协办法:在保证置信度的前提下,尽可能提高精确度。规定正确估计的概率即置信度为0.95和0.99,则显著性水平为0.05和0.01。小概率事件在一次抽样中不可能出现。区间估计的原理是样本
4、分布理论。区间估计的原理是样本分布理论。在计算区间估计值解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。4一、参数估计的原理区间估计的原理和方法置信区间和显著性水平 区间估计时,某一概率下,总体参数所在的区间称为置信区间,区间的端点值称为临界值,这个概率称为置信度,以概率 表示,又称显著性水平,表示该区间估计的不可靠程度。区间估计的原理和方法 56第二节 总体平均数的估计一、总体平均数估计的计算步骤:利用抽样的方法抽取样本,计算出样本的平均值 和标准差S。计算样本平均数的标
5、准误 :当总体方差已知时,样本平均数的标准误的计算为:当总体方差未知时,样本平均数的标准误的计算为:7一、总体平均数估计的计算步骤:确定显著性水平和置信水平根据样本平均数的抽样分布确定查何种分布表,确定理论值。确定置信区间:解释总体平均数的置信区间。8二、总体方差已知时,对总体平均数的估计二、总体方差已知时,对总体平均数的估计当当总体分布为正态分布时,(无论样本容量总体分布为正态分布时,(无论样本容量n的大的大小,从该总体抽取的样本分布均成正态分布。)对小,从该总体抽取的样本分布均成正态分布。)对总体平均数的估计可以依正态分布进行估计。总体平均数的估计可以依正态分布进行估计。例1 已知某市6岁
6、正常男童体重的总体方差为6.55公斤,从该市随机抽取15 名6岁男童,其平均体重为20.4公斤,试求该市6 岁男童平均体重的95%和99%的置信区间。例2 已知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取40 名6岁男童,其平均体重为20.4公斤,试求该市6 岁男童平均体重的95%和99%的置信区间。9例1的计算解:95%的置信区间的显著性水平=0.05,因此,的95%的置信区间为:即:的99%的置信区间为:即:故该市6岁男童平均体重的95%的置信区间为19.11,21.69;99%的置信区间为18.7,22.1。10二、总体方差已知时,对总体平均数的估计二、总体方差已知时,对
7、总体平均数的估计当当总体为非正态分布时(只有当样本容量总体为非正态分布时(只有当样本容量n30时时,此时样本抽样分布渐近正态分布。这时可此时样本抽样分布渐近正态分布。这时可依正态分布进行估计,否则不能对总体平均数依正态分布进行估计,否则不能对总体平均数进行估计。)进行估计。)例3 已知某区15 岁男生立定跳远的方差为 ,现从该区抽取58名15岁男生,测得该组男生立定跳远的平均数为198.4cm,试求该区15岁男生立定跳远平均成绩的95%和99%的置信区间。11例3解:由题意知:由于样本容量(n=58)大于30,该样本的抽样分布为渐进正态分布。因此,的95%的置信区间为:198.41.962.7
8、5198.41.962.75即 193.01203.79的99%的置信区间为:198.42.582.75198.42.582.75即 191.3205.5故该区15岁男生立定跳远的平均成绩有95%的可能落入193.01,203.79内,有99%的可能落入191.3,205.5内。12三、总体方差未知,对总体平均数的估计三、总体方差未知,对总体平均数的估计当当总体分布为正态分布时(无论样本容量总体分布为正态分布时(无论样本容量n的的大小,从该总体抽取的样本所形成的分布均服大小,从该总体抽取的样本所形成的分布均服从自由度为从自由度为n-1的的t分布,对总体平均数的估计分布,对总体平均数的估计可依可
9、依t分布进行估计)分布进行估计)例4 从某市抽取20 名7 岁女童,经测量,这20 名女童的平均身高为116cm,标准差为5cm,试求该市7岁女童总平均身高的95%和99%的置信区间。例5 从某市抽取36 名7 岁女童,经测量,这36 名女童的平均身高为115.8cm,标准差为4.8cm,试求该市7岁女童总平均身高的95%和99%的置信区间。13例4解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布,可以依t分布对总平均身高进行估计。14例5解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布,可以依t分布对总平均身高进行估计。15
10、三、总体方差未知,对总体平均数的估计三、总体方差未知,对总体平均数的估计当当总体为非正态分布时(只有当样本容量总体为非正态分布时(只有当样本容量n30时,此时样本抽样分布服从自由度为时,此时样本抽样分布服从自由度为n-1的的t分分布,这时可依布,这时可依t 分布对总体平均数进行估计,分布对总体平均数进行估计,否则不能对总体否则不能对总体 平均数进行估计。)平均数进行估计。)例6 某校进行一次数学考试,从中抽取40名考生,经计算,这40 名考生的平均成绩为82分,标准差为7 分,试求全体考生平均成绩的95%和99%的置信区间。16例6解:由题意知,其总体方差未知,其总体分布也未知,但n=4030
11、,因此可以依t分布对全体考生平均成绩进行估计。17第三节第三节 总体标准差与总体方差的估计总体标准差与总体方差的估计一、总体标准差的区间估计 估计总体标准差的步骤与估计总体平均数的步骤大致相同。但有两点需要说明:从抽样分布的讨论已知,样本标准差的抽样分布在n30时为渐近正态分布,总体标准差可依正态分布来估计。当n30,可依正态分布估计。19二、总体方差的估计 根据对抽样分布的讨论可知,分布的特征之一是从正态分布总体中,随机抽取容量为n的样本,其样本方差与总体方差比值的分布为 分布。即:20二、总体方差的估计例8 在某市进行的一次智力测验中,随机抽取20名12岁学生,经计算其智力测验的方差为72
12、.25,试求该市12岁学生智力测验分数总体方差的95%和99%的置信区间。解:由于智力测验分数一般认为服从正态分布,由该总体中抽出的样本在估计总体方差时符合 分布。21例9 根据例7的资料,用估计总体方差的办法来估计该区英语统考成绩的总标准差的95%和99%的置信区间。解:已知n=40,S=15.6,df=n-1=39,查 值表得:22例9(续)由例9的结果来看,与例7的结果相近。但值得注意的是,用总体方差的估计方法的一个前提条件是总体应服从正态分布,若总体不服从正态分布,则不适用此方法。因此,当总体为正态,样本容量n30时,且总体分布未知,则仍采用总体标准差的估计方法较为合适。23三、两总体
13、方差之比的区间估计 24三、两总体方差之比的区间估计例10 某区对该区所辖三年级小学生进行身体检查,在检查时,从中随机抽取了男生50名,女生40名,经测量,50名男生体重的标准差为1.8公斤,40名女生体重的标准差为1.7公斤,试求该区三年级小学生男女体重的方差之比的95%和99%的置信区间。25例10解:由题意和抽样分布的理论,两样本方差之比应服从F分布。26例10(续)则得两方差之比的95%的置信区间:同理可得两方差之比的99%的置信区间:故该区三年级小学生男女体重的方差之比有95%的可能在区间0.6,2.05之中,有99%的可能落在区间0.5,2.5之中。在估计两总体方差之比时,如果两方
14、差相等,则 .那么从这两总体抽取的两样本方差之比值大多数在1上下波动,此时就可以通过判定两总体方差的比值是否在1 的上下波动来判定两总体方差是否相等。因此两总体方差之比的区间估计了可作为检验两总体方差是否相等的另一种方法。27第四节 总体相关系数的估计一、积差相关系数的估计积差相关系数的抽样分布当总体相关系数=0时,样本相关系数的分布一般服从自由度为n-2的 t 分布,随着样本容量的增大,样本相关系数的分布渐近正态分布。当总体相关系数 时,其样本相关系数的抽样分布情况较为复杂,当样本容量小于500时,相关系数为正值,其分布为正偏态,相关系数为负值,其分布为负偏态。当样本容量足够大(即n500)
15、,样本相关系数的抽样分布才渐近正态分布。28一、积差相关系数的估计积差相关系数的区间估计当总体相关系数 时,可依 t 分布估计总体相关系数。利用下列公式求其标准误:当总体相关系数 、且n500时,可依正态分布估计总体相关系数。其标准误可按上面公式(8-8)计算,总体相关系数的置信区间为:29一、积差相关系数的估计积差相关系数的区间估计当总体相关系数 时,且容量小于500时,其样本相关系数的抽样分布极不稳定,人们常用费舍法。费舍利用下面公式将 r 转换为Z值,而Z值渐近正态分布。一般不使用公式(8-9)来计算Z值,统计学家已经根据公式编制出 r 与Z的转换表,见附表。30利用费舍Z函数估计总体相
16、关系数的步骤查附表8把 r 转换为Zr值;利用公式(8-10)计算Zr的标准误;在不同的显著性水平下确定Z的置信区间:将Z的置信上下限查附表8,从而得到的置信区间。31利用费舍Z函数估计总体相关系数的例题例11 某校给学生进行体验时,抽取40名作样本,计算得到他们的身高、体重的相关系数为0.55,试求该学校学生身高与体重的相关系数的置信区间。解:由题意知,该学校学生身高,体重的相关情况未知,且样本容量n20时,样本相关系数的抽样分布服从正态分布。等级相关系数的区间估计根据样本容量的不同选择不同的抽样分布进行估计,其方法现与总体平均数的方法相似。在计算标准误时,两种情况的标准误计算公式均为:34
17、二、等级相关系数的估计例12 某市进行数学与物理统考,从中各抽取15名和60名学生作为样本,经计算这两个样本的等级相关系数分别为0.42和0.45,试分别求出该市数学与物理成绩的相关系数的置信区间。解:当n=15时,该样本相关系数的抽样分布服从自由度为13的t分布,可依t分布对总体相关系数进行估计。样本相关系数的标准误:35例12(解续)因此,的95%的置信区间为:的99%的置信区间为:当n=60时,该样本相关系数的抽样分布服从正态分布,可依正态分布对总体相关系数进行估计。其标准误为:36例12(解续)因此,的95%的置信区间为:的95%的置信区间为:37第五节 比率及比率差异的区间估计一、比率的区间估计比率的样本分布38比率的区间估计39二、比率差异区间估计二、比率差异区间估计40(二)比率差异的区间估计(二)比率差异的区间估计41