《均数的抽样误差和总体均数估计.ppt》由会员分享,可在线阅读,更多相关《均数的抽样误差和总体均数估计.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、均数的抽样误差和总均数的抽样误差和总体均数估计体均数估计现在学习的是第1页,共44页1.参数估计参数估计 包括:点估计与区间估计包括:点估计与区间估计2.假设检验假设检验统计推断的两部分内容:统计推断的两部分内容:现在学习的是第2页,共44页总体总体样本样本随机抽取部分观察单位随机抽取部分观察单位?推断推断inferenceinference参数估计参数估计现在学习的是第3页,共44页一、抽样误差与标准误一、抽样误差与标准误现在学习的是第4页,共44页2009年某市年某市18岁男生身高岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图 现在学习的是第5页,共44页将将此此100个个样
2、样本本均均数数看看成成新新变变量量值值,则则这这100个个样样本本均数构成一均数构成一新分布新分布,绘制频数图,绘制频数图从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布随机抽样所得样本均数分布现在学习的是第6页,共44页 ,各样本均数各样本均数未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本对称。样本均数的分布为中间多,两边少,左右基本对称。样样本本均均数数的的变变异异范范围围较较之之原原变变量量的的变变异异范范围围大大大大缩缩小。小。可可算算得得这这100个个样样本本均均数数的的均均数数为
3、为167.69cm、标标准准差差为为1.69cm。样本均数分布具有如下样本均数分布具有如下特点:特点:现在学习的是第7页,共44页1、抽样误差:、抽样误差:由个体变异产生的、抽样造成的样本统计由个体变异产生的、抽样造成的样本统计量与总体参数的差别量与总体参数的差别 原因:原因:1 1)抽样)抽样 2 2)个体差异)个体差异现在学习的是第8页,共44页表示表示样本统计量样本统计量抽样误差大小的统计指标。抽样误差大小的统计指标。标标准准误误:说说明明抽抽样样误误差差的的大大小小,总总体体计算公式计算公式(7-27)2、标准误、标准误(standarderror,SE)实质:样本均数的标准差实质:样
4、本均数的标准差现在学习的是第9页,共44页若用样本标准差若用样本标准差s 来估计来估计,(7-28)n当样本例数当样本例数n一定时,标准误与标准差呈正比一定时,标准误与标准差呈正比n当标准差一定时,标准误与样本含量当标准差一定时,标准误与样本含量n的平方根呈反的平方根呈反比。比。通过增加样本含量通过增加样本含量n来降低抽样误差。来降低抽样误差。现在学习的是第10页,共44页随随机机抽抽样样调调查查7岁岁男男孩孩120名名,的的身身高高均均数数为为120.88,标标准准差差为为5.23,则则其其标标准准误误是是多多少?少?例子例子:现在学习的是第11页,共44页指标意义应用标准差(s)衡量变量值
5、变异程度,s越大表示变量值变异程度越大,s越小表示变量值变异程度越小描述正态分布(近似正态分布)资料的频数分布;医学参考值范围的估计标准误()样本均数的变异程度,表示抽样误差的大小。标准误越大表示抽样误差越大,样本均数的可靠性越小;标准误越小表示抽样误差越小,样本均数的可靠性越大总体均数区间估计;两个或多个总体均数间比较标准差和标准误的区别标准差和标准误的区别现在学习的是第12页,共44页二、二、t 分布分布(一)(一)t分布概念分布概念 现在学习的是第13页,共44页随机变量随机变量X XN N(m m,2 2)标准正态分布标准正态分布N N(0 0,1 12 2)z变换现在学习的是第14页
6、,共44页现在学习的是第15页,共44页式中式中为自由度为自由度(degreeoffreedom,df)3实际工作中,由于实际工作中,由于 未知,用未知,用 代替,则代替,则 不再服从标准正态分布,而服从不再服从标准正态分布,而服从t t 分布。分布。现在学习的是第16页,共44页均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1现在学习的是第17页,共44页(二)(二)t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度现在学习的是第18页,共44页图图不同自由度下的不同自由度下的t 分布图分
7、布图现在学习的是第19页,共44页1特征:特征:现在学习的是第20页,共44页2、t界值表:界值表:详见附表详见附表2,可反映,可反映t分布曲线下的面积。分布曲线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用表示。表示。现在学习的是第21页,共44页-tt0现在学习的是第22页,共44页举例:举例:现在学习的是第23页,共44页三、参数估计三、参数估计用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数(和标准差)推断用样本均数(和标准差)推断总体均数。总体均数。现在学习的是第24页,共44页
8、1.点估计点估计(pointestimation):n用相应样本统计量直接作为其总体参数的估用相应样本统计量直接作为其总体参数的估计值。如用计值。如用估计估计、s估计估计 等。其方法虽简等。其方法虽简单,但未考虑抽样误差的大小。单,但未考虑抽样误差的大小。现在学习的是第25页,共44页按按预预先先给给定定的的概概率率(1 )所所确确定定的的包包含含未未知知总总体体参参数的一个范围。数的一个范围。总总体体均均数数的的区区间间估估计计:按按预预先先给给定定的的概概率率(1 )所所确定的包含未知总体均数的一个范围。确定的包含未知总体均数的一个范围。n如如给给定定=0.05,该该范范围围称称为为参参数
9、数的的95%可可信信区区间间或或置置信区间;信区间;n如如给给定定=0.01,该该范范围围称称为为参参数数的的99%可可信信区区间间或或置信区间。置信区间。2区间估计区间估计(intervalestimation):现在学习的是第26页,共44页计算总体均数可信区间计算总体均数可信区间n需考虑:需考虑:(1)总体标准差)总体标准差 是否已知,是否已知,(2)样本含量)样本含量n的大小的大小n通常有两类方法:通常有两类方法:(1)t分布法分布法 (2)z分布法分布法现在学习的是第27页,共44页(1)未知且未知且n比较小:按比较小:按t分布分布现在学习的是第28页,共44页现在学习的是第29页,
10、共44页现在学习的是第30页,共44页(2)按按z分布分布现在学习的是第31页,共44页某地抽取正常成年人某地抽取正常成年人200名,测得其血清胆固醇名,测得其血清胆固醇的均数为的均数为3.64mmol/L,标准差为,标准差为1.20mmol/L,估,估计该地正常成年人血清胆固醇均数的计该地正常成年人血清胆固醇均数的95%可信可信区间。区间。举例举例现在学习的是第32页,共44页故故该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的双双侧侧95%可可信区间为信区间为(3.47,3.81)mmol L。现在学习的是第33页,共44页四、四、假设检验的基本概念和步骤假设检验的基本概念和步
11、骤现在学习的是第34页,共44页例例大规模调查表明,健康成年男子血红蛋白的均数为136.0g/L,今随机调查某单位食堂成年男性炊事员25名,测得其血红蛋白均数121g/L,标准差48.8g/L。问题:根据资料推论食堂炊事员血红蛋白均数是否与健康成年男子血红蛋白均数有无差别(一)(一)假设检验的基本思想假设检验的基本思想现在学习的是第35页,共44页假设检验目的假设检验目的判断差别是由哪种原因造成的判断差别是由哪种原因造成的。抽样误差造成的;抽样误差造成的;本质差异造成的。本质差异造成的。造成造成的可能原因有二:的可能原因有二:案例案例现在学习的是第36页,共44页炊事员血红蛋白总体均数炊事员血
12、红蛋白总体均数136.0g/L121g/L炊事员血红蛋白总体均数炊事员血红蛋白总体均数 138.0g/L138.0g/L一种假设一种假设H0另一种假设另一种假设H1抽样误差抽样误差总体不同总体不同现在学习的是第37页,共44页 假定假如炊事员均数为假定假如炊事员均数为136.0g/L136.0g/L,即,即 则则 ,服从服从t t 分分布布,绝大多数绝大多数t t应该分布在主要区域应该分布在主要区域 根据根据 t 分布能够计算出有如此大差异的概率分布能够计算出有如此大差异的概率P P,如果,如果P P 值很小,值很小,即计算出的即计算出的t t 值超出了给定的界限,则倾向于拒绝值超出了给定的界
13、限,则倾向于拒绝H0 0,认为山区血认为山区血红蛋白均数不是红蛋白均数不是136.0136.0g/Lg/L 现在学习的是第38页,共44页假设检验的基本思想假设检验的基本思想利用小概率反证法的思想利用小概率反证法的思想利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于或等于预先规定的概率值,就是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设H0,认为其对立面H1成立现在学习的是第39页,共44页1.建立检验假设,确定检验水准(选用单侧
14、或双侧检验)(1)无效假设,记为H0;(2)备择假设,记为H1。对于检验假设,须注意:1)检验假设是针对总体而言,而不是针对样本;2)H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可二、假设检验的基本步骤二、假设检验的基本步骤现在学习的是第40页,共44页3)H1的内容直接反映了检验单双侧。若H1中只是 0 或只是 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。4)单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。现在学习的是第41页,共44页(3)检验水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取 =0.05。可根据不同研究目的给予不同设置。例如本题:=0.05现在学习的是第42页,共44页2.计算检验统计量根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。如 t 检验、z检验、F检验和 检验等。现在学习的是第43页,共44页本例采用t检验方法本例t值为1.54现在学习的是第44页,共44页