《第七讲推论统计与区间估计.ppt》由会员分享,可在线阅读,更多相关《第七讲推论统计与区间估计.ppt(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七讲推论统计与区间估计第七讲推论统计与区间估计1现在学习的是第1页,共31页知识点:知识点:参数的区间估计参数的区间估计2.1概念辨析概念辨析2.2总体均值的区间估计总体均值的区间估计2.3总体成数(比例)的区间估计总体成数(比例)的区间估计2现在学习的是第2页,共31页一、参数的区间估计一、参数的区间估计n由于真正的参数我们并不知道,无法知道由样由于真正的参数我们并不知道,无法知道由样本所计算的点估计值到底距离真值有多少,也本所计算的点估计值到底距离真值有多少,也就是说我们无法知道点估计值的精确度如何?就是说我们无法知道点估计值的精确度如何?n因此我们改用一个范围或一个区间来对未知因此我们
2、改用一个范围或一个区间来对未知参数进行估计,如估计某城市居民的平均月参数进行估计,如估计某城市居民的平均月收入在收入在8001000元之间。元之间。3现在学习的是第3页,共31页区间估计区间估计(intervalestimation)的实质的实质是在一定的可信度是在一定的可信度(置信度置信度/置信概率置信概率)下,用样本统计值的某个范围下,用样本统计值的某个范围(置信置信区间区间)来来“框框”住总体的参数值住总体的参数值4现在学习的是第4页,共31页1.1概念辨析概念辨析有关区间估计的几个概念:有关区间估计的几个概念:n置信区间置信区间(confidenceinterval)总体参数的估计范围
3、;总体参数的估计范围;n置信度置信度(confidencecoefficient)置信区间估计的可靠性;置信区间估计的可靠性;n显著性水平显著性水平(significancelevel)置信区间估计的不可靠的概率。置信区间估计的不可靠的概率。5现在学习的是第5页,共31页1.2区间估计的一般表达式区间估计的一般表达式其中区间其中区间 称作置信区间;称作置信区间;1 称作置信度;称作置信度;称作显著性水平;称作显著性水平;6现在学习的是第6页,共31页017现在学习的是第7页,共31页1.3置信区间与置信度的关系置信区间与置信度的关系n置信区间置信区间(范围范围)的大小反映的是这种估计的精确性问
4、的大小反映的是这种估计的精确性问题,而置信度的高低反映的是这种估计的可靠性或把题,而置信度的高低反映的是这种估计的可靠性或把握性问题握性问题.n区间估计的结果通常用下述方式表达:区间估计的结果通常用下述方式表达:“我们有我们有95%的把握认为,全市职工的月工资收入为的把握认为,全市职工的月工资收入为182元至元至218元元之间之间”或者或者“全省人口中,女性占全省人口中,女性占50%至至52%的可能性的可能性为为99%”8现在学习的是第8页,共31页1、在样本容量一定的情况下,置信区间和置信度是互相、在样本容量一定的情况下,置信区间和置信度是互相制约的,表现为:制约的,表现为:置信度越高,置信
5、区间越宽,估计精度越低;置信度越高,置信区间越宽,估计精度越低;置信度越低,置信区间越窄,估计精度越高。置信度越低,置信区间越窄,估计精度越高。(例子:(例子:“某班的数学考试成绩在某班的数学考试成绩在0-100之间之间”,和,和“某班考试的某班考试的成绩在成绩在75-85之间之间”-75-85之间的人数只有之间的人数只有80人,那么置信度只有人,那么置信度只有0.8。)。)从准确度来看,区间越大越好;从精确度来看,区间越小越好从准确度来看,区间越大越好;从精确度来看,区间越小越好2、参数区间估计时,置信区间和置信度缺一不可,必须、参数区间估计时,置信区间和置信度缺一不可,必须同时给出置信区间
6、和置信度。同时给出置信区间和置信度。9现在学习的是第9页,共31页1.4置信度(置信度(1)与显著性水平)与显著性水平的关的关系系1、对立统一的两个概念。置信度是估计可靠、对立统一的两个概念。置信度是估计可靠的概率,而显著性水平是不可靠的概率。的概率,而显著性水平是不可靠的概率。2、置信度显著性水平、置信度显著性水平1;如果提出置信度;如果提出置信度要求为要求为0.95,那么意味着显著性水平为,那么意味着显著性水平为0.05;3、置信度往往用在参数估计中,显著性水平、置信度往往用在参数估计中,显著性水平一般用于假设检验中;一般用于假设检验中;10现在学习的是第10页,共31页2区间估计的公式区
7、间估计的公式2.1总体均值的区间估计总体均值的区间估计估计公式为:估计公式为:或者置信度为或者置信度为1 的区间的区间估计为:估计为:11现在学习的是第11页,共31页2.2参数估计公式理解的第一种思路参数估计公式理解的第一种思路知识连线知识连线“均值抽样分布的基本特征均值抽样分布的基本特征”12现在学习的是第12页,共31页均值抽样分布的基本特征均值抽样分布的基本特征1、大样本(通常指、大样本(通常指n50,当然越大越好,当然越大越好),均值抽均值抽样分布服从正态分布;样分布服从正态分布;2、均值抽样分布之均值就是总体均值、均值抽样分布之均值就是总体均值;3、均值抽样分布的标准差,称为标准误
8、差、均值抽样分布的标准差,称为标准误差(standarderror),计算公式为,计算公式为13现在学习的是第13页,共31页均值抽样分布的基本特征(续均值抽样分布的基本特征(续1)4、如果将均值标准化,就可得到标准正态、如果将均值标准化,就可得到标准正态分布:分布:N(0,1)此表达式是此表达式是参数估计和参数估计和假设检验的假设检验的基础基础14现在学习的是第14页,共31页均值抽样分布的基本特征(续均值抽样分布的基本特征(续2)5、通过标准化转化,均值抽样分布中任意两值、通过标准化转化,均值抽样分布中任意两值之间的样本均值次数所占的比例是可以知道之间的样本均值次数所占的比例是可以知道的。
9、通过查标准正态分布表,社会学常用的的。通过查标准正态分布表,社会学常用的有:有:90的面积在的面积在1.65(SE);1.65(SE);95的面积在的面积在1.96(SE);1.96(SE);99的面积在的面积在2.58(SE);2.58(SE);15现在学习的是第15页,共31页由此推出:由此推出:总体均值区间估计的常用公式总体均值区间估计的常用公式置信度为置信度为90:置信度为置信度为95:置信度为置信度为99:16现在学习的是第16页,共31页2.3参数估计公式理解的第二种思路参数估计公式理解的第二种思路17现在学习的是第17页,共31页0118现在学习的是第18页,共31页19现在学习
10、的是第19页,共31页式中:式中:X为总体均值为总体均值的点估计值,即样本均值;的点估计值,即样本均值;1为置信度;为置信度;为标准误差(为标准误差(SE),其中),其中为总体标准差,为总体标准差,当当未知时,用样本标准差未知时,用样本标准差S代替;代替;n为样本量,一般为样本量,一般n50;为正态分布双侧区间的分位点;为正态分布双侧区间的分位点;20现在学习的是第20页,共31页置信度为置信度为90,1.65置信度为置信度为95,1.96置信度为置信度为99,2.58的常用取值:的常用取值:(参考附表四)参考附表四)21现在学习的是第21页,共31页同样推出:同样推出:总体均值区间估计的常用
11、公式总体均值区间估计的常用公式置信度为置信度为90:置信度为置信度为95:置信度为置信度为99:22现在学习的是第22页,共31页例例1:均值的区间估计:均值的区间估计n调查某工厂工人的工资状况,随机抽取了调查某工厂工人的工资状况,随机抽取了900名工名工人做样本,调查得到他们的平均工资为人做样本,调查得到他们的平均工资为186元,标元,标准差为准差为42元元.求求95%的置信度下,全厂职工的月平均的置信度下,全厂职工的月平均工资是多少工资是多少?解:将调查资料代入均值的区间估计公式得解:将调查资料代入均值的区间估计公式得n查附录得查附录得Z检验表中,检验表中,n故,总体的置信区间为,即故,总
12、体的置信区间为,即183.26-188.7423现在学习的是第23页,共31页2.4大样本总体成数的区间估计大样本总体成数的区间估计成数估计主要是对定类变量成数估计主要是对定类变量。比如产品的合格率、某项电视节目的比如产品的合格率、某项电视节目的收视率等等。收视率等等。24现在学习的是第24页,共31页总体成数的估计公式:总体成数的估计公式:或置信度为或置信度为1 的区间的区间估计为:估计为:25现在学习的是第25页,共31页式中,式中,为总体成数的点估计值,即样本成数;为总体成数的点估计值,即样本成数;为标准误差,为标准误差,P往往用往往用 代替;代替;为正态分布双侧区间的分位点;为正态分布
13、双侧区间的分位点;26现在学习的是第26页,共31页置信度为置信度为90,1.65置信度为置信度为95,1.96置信度为置信度为99,2.58的常用取值:的常用取值:(参考附表四)参考附表四)27现在学习的是第27页,共31页同理,总体成数区间估计的常用公式:同理,总体成数区间估计的常用公式:置信度为置信度为90:置信度为置信度为95:置信度为置信度为99:28现在学习的是第28页,共31页例例2:总体百分数:总体百分数(比例比例)的区间估计的区间估计n从某工厂随机抽取从某工厂随机抽取400名工人进行调查,结果表明女名工人进行调查,结果表明女工的百分比位工的百分比位20%,现在要求在,现在要求
14、在90%的置信度下,的置信度下,估计全厂工人中女工比例的置信区间估计全厂工人中女工比例的置信区间n解:代入公式得,解:代入公式得,即置信区间为即置信区间为16.7%-23.9%29现在学习的是第29页,共31页2.5总体参数区间估计的计算步骤:总体参数区间估计的计算步骤:1、判断是均值估计还是成数估计,根、判断是均值估计还是成数估计,根据置信度选择相应的公式;据置信度选择相应的公式;2、从题中找出公式中统计量对应的取、从题中找出公式中统计量对应的取值,罗列出来;值,罗列出来;3、一一带入公式计算;、一一带入公式计算;4、对结果进行简单的说明。、对结果进行简单的说明。30现在学习的是第30页,共
15、31页补充练习题补充练习题1、在某地区抽样调查、在某地区抽样调查7500名进城农民工,有稳定收入名进城农民工,有稳定收入的有的有1875人,在人,在90的置信度下,请估计该地区进城农民的置信度下,请估计该地区进城农民工有稳定收入的比例的置信区间?(要求结果精确到小数工有稳定收入的比例的置信区间?(要求结果精确到小数点后点后3位数)位数)2、调查某厂职工的工资状况,随机抽取、调查某厂职工的工资状况,随机抽取100名工人,调查名工人,调查得到他们的月平均工资为得到他们的月平均工资为1200元,标准差为元,标准差为200元。元。求在求在95的置信度下,全厂职工的月平均工资的置信区的置信度下,全厂职工的月平均工资的置信区间是多少?间是多少?31现在学习的是第31页,共31页