《抽样误差(PPT34页)18443.ppt》由会员分享,可在线阅读,更多相关《抽样误差(PPT34页)18443.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Department of Epidemiology and BiostatisticsSchool of Public Health,Nanjing Medical University卫生统计学抽样误差和抽样分布Sampling Error and Sampling Distribution主要内容o抽样误差n抽样误差的重要性n抽样误差的定义n抽样误差的规律性o标准误n标准误的定义n标准误的计算n标准误的意义n标准误的作用ot分布nt分布的演化nt分布的图形nt分布的性质oF分布o2分布1.1 抽样误差的重要性o既然有误差,为什么还要抽样?n无限总体的客观存在n试验研究的成本效益问题(co
2、st effect)抽样误差的重要性总体同质个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险1.2 抽样误差的定义o假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了五次。119.41cm=4.38cm抽样误差的定义o五次抽样得到了不同的结果,原因何在?个体变异随机抽样不同男童的身高不同每次抽到的人几乎不同抽样误差抽样误差的定义【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。各种参数都
3、有抽样误差,这里我们以均数为研究对象抽样误差的表现抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间的差别抽样误差o定义。o只要有个体变异和随机抽样研究,抽样误差就是不可避免的。o抽样误差有自己的客观规律,统计学就是拨开抽样误差之雾来洞察客观规律的利器。1.3 抽样误差的规律性 既然抽样误差是有规律的,那么到底它的分布规律到底是怎样的?Lets Enjoy Our Experiments!中心极限定理(central limit theorem)的表现o从正态总体中随机抽样,其样本均数服从正态分布;o从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;o样本均
4、数之均数的位置始终在总体均数的附近;o随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。2.1 标准误的定义o样本统计量(如均数)也服从一定的分布;o与描述观测值离散趋势的指标类似,我们使用样本统计量的标准差来反映抽样误差的大小。又称标准误(standard error)。标准误(standard error)oo样本统计量的标准差称为标准误。oo样本均数的标准差称为均数的标准误。oo样本均数的标准误表示样本均数的变异度。2.2 标准误的计算o计算公式为其中,为总体标准差,n为抽样的样本例数o在研究工作时,由于总体标准差常常未知,可以利用样本标准
5、差近似估计标准误的计算【例】根据7岁男童的身高资料,在已知总体标准差时,标准误为4.38/10=0.438cm而若以第一次抽样的样本标准差来代替总体标准差,则标准误为4.45/10=0.445cm2.3 标准误的意义o标准误的意义n反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。n标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。n标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。2.4
6、 标准误的作用o标准误的用途n衡量样本统计量代表总体参数的可靠性;n估计总体参数的可信区间;n进行假设检验。2.5 标准差和标准误的联系与区别标准差标准误对象个体变异抽样误差计算方法定义定义性质n越大,标准差越稳定n越大,标准误越小用途参考值范围衡量离散程度可信区间,假设检验3.1 样本均数的抽样分布规律o中心极限定理u从均数为,标准差为的正态总体中随机抽样,样本均数服从均数为,标准差为 的正态分布。u从均数为,标准差为的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为,标准差为 的正态分布。3.2 t分布的演化o根据中心极限定理的内容,当样本含量足够大时,对从均数为,标准差为的
7、任意总体中随机抽样所得的样本均数进行标准化变换,有t分布的演化o由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差,这里,为自由度(degree of freedom,df),取值为n-1o由W.S.Gosset提出 f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3自由度分别为1、5、时的 t 分布3.3 t分布的图形由Gosset提出3.4 t分布的性质ot分布为一簇单峰分布曲线。ot分布以0为中心,左右对称。o分布的高峰位置比 u 分布低,尾部高。即相同的尾部面积对应的界值,比 u 分布大。例如:P=0.05,u=1.64,而,而自由度为10的 t
8、分布界值,t=1.812。ot分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。o每一自由度下的t分布曲线都有其自身分布规律。t界值表。t界值表单侧:P(t=t,)=双侧:P(t=t,)=即:P(-t,t t,)=1-例 查t界值表得t值表达式 t 0.05,10=2.228 (双侧)t 0.05,10=1.812 (单侧)-tt04 2分布o设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设:o则2值服从自由度为n-1的2分布(2-distribution)
9、,是小写希腊字母,读作chi。可见,2分布是方差的抽样分布。2分布的特征o2分布为一簇单峰正偏态分布曲线,o自由度为的2分布,其均数为,方差为2。o1时2分布实际上是标准正态分布变量之平方。自由度为的2分布实际上是个标准正态分布变量之平方和。可表示为:2=u12+u22+uv2 o每一自由度下的2分布曲线都有其自身分布规律=4=3=520246810120.00.10.20.30.40.5f(2)=1=2=62分布的作用o方差的抽样分布研究 o样本分布与理论分布的拟合优度检验o率或构成比的比较 5 F分布o设从两个方差相等的正态分布N(1,2)和N(2,2)总体中随机抽取含量分别为n1和n2的
10、样本,样本均数和标准差分别为 、s1和 、s2。设:o则F值服从自由度为(n1-1,n2-1)的F分布(F-distribution)。F分布的特征oF分布为一簇单峰正偏态分布曲线,与两个自由度有关。o若F服从自由度为(1,2)的F分布,则其倒数1/F服从自由度为(2,1)的F分布。o自由度为(1,2)的F分布,其均数为2/(2-2),与第一自由度无关。o第一自由度11时,F分布实际上是t分布之平方;第二自由度2时,F分布实际上等于2分布。o每一对自由度下的F分布曲线下的面积分布规律。0123450.00.20.40.60.81.0 012345 0.00.20.40.60.81.015 21011 210110 2110 21F分布的应用o方差齐性检验o方差分析小结o抽样误差的定义和表现o抽样误差的规律:中心极限定理o标准误的定义及其意义ot分布的演化、图形、特征及意义Contact:86862744Email:谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH