《医学统计学第三章抽样误差和t分布.ppt》由会员分享,可在线阅读,更多相关《医学统计学第三章抽样误差和t分布.ppt(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、3.抽样误差和 t 分布 Sampling error and t distribution 抽样误差的概念抽样误差的概念 由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异 两种表现形式两种表现形式 样本统计量与总体参数间的差异样本统计量与总体参数间的差异样本统计量间的差异样本统计量间的差异 抽样研究抽样研究 个体变异个体变异抽样误差产生的条件抽样误差产生的条件 均数的抽样误差及标准误均数的抽样误差及标准误 表现一:样本均数与总体均数之差值表现一:样本均数与总体均数之差值表现二:多个样本均数间的离散度表现二:多个样本均数间的离散度中心极限定理中心极限定理(cen
2、tral limit theorem)从均数为从均数为、标准差为标准差为 的总体中独立随机抽样,的总体中独立随机抽样,当样本含量当样本含量n增加时,样本均数的分布将趋于正态增加时,样本均数的分布将趋于正态分布,此分布的均数为分布,此分布的均数为,标准差为,标准差为标准误标准误(standard error,SE)样本统计量的标准差称为标准误,用来衡量抽样样本统计量的标准差称为标准误,用来衡量抽样误差的大小。误差的大小。样本均数的标准差称为标准误。此标准误与个体样本均数的标准差称为标准误。此标准误与个体变异变异 成正比,与样本含量成正比,与样本含量n n的平方根成反比。的平方根成反比。实际工作中
3、,实际工作中,往往是未知的,一般可用样本标准差往往是未知的,一般可用样本标准差s s代替代替 :因为标准差因为标准差s s随样本含量的增加而趋于稳定,故增加样随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。本含量可以降低抽样误差。中心极限定理表明,即使从非正态总体中随中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布分布也趋于正态分布,见图,见图3.1。四个非正态分布的总体抽样结果四个非正态分布的总体抽样结果(A偏三角分布、偏三角分布、B均匀分布、均匀分布、C指数分布、指数分布、D双峰分布)双峰分布)
4、图图3.13.1描述了来自不同总体的样本均数之抽样误差和描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上,任何一个样本统计量均有其抽样分布规律。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论分布。统计量的抽样分布规律是进行统计推断的理论基础。基础。标准差与标准误的联系和区别 联系联系都都是是变变异异指指标标。S S反反映映个个体体观观察察值值的的变变异异;反映统计量的变异。反映统计量的变异。当当n n不变时,标准差不变时,标准差,标准误,标准误 t分布分布设从正态分布设从正态分布N(,)中随机抽取含量为中随机抽取含量为n的样本,样本均数的样本,样本均
5、数和标准差分别为和标准差分别为 和和s,设:,设:则则t值服从自由度为值服从自由度为n-1的的t分布分布(t-distribution)。Gosset于于1908年在生物统计杂志上发表该论文时用的是笔名年在生物统计杂志上发表该论文时用的是笔名“Student”,故,故t分布又称分布又称Student t分布。分布。f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3图3.2 自由度分别为1、5、时的t分布 t分布的特征分布的特征 t分布为一簇单峰分布曲线分布为一簇单峰分布曲线t分布以分布以0为中心,左右对称为中心,左右对称t分分布布与与自自由由度度 有有关关,自自由由
6、度度越越小小,t分分布布的的峰峰越越低低,而而两两侧侧尾尾部部翘翘得得越越高高,;自自由由度度逐逐渐渐增增大大时时,t分分布布逐逐渐渐逼逼近近标标准准正正态态分分布布;当当自自由由度度为为无无穷穷大大时,时,t分布就是标准正态分布。分布就是标准正态分布。t分布的特征分布的特征每一自由度下的每一自由度下的t分布曲线都有其自身分布规律分布曲线都有其自身分布规律t t分布表明,从正态分布总体中随机抽取的样本,由样本计算的分布表明,从正态分布总体中随机抽取的样本,由样本计算的t t值接值接近近0 0的可能性较大,远离的可能性较大,远离0 0的可能性较小。的可能性较小。t t0.05,100.05,102.2282.228,表明,从正,表明,从正态分布总体中抽取样本含量为态分布总体中抽取样本含量为n n=11=11的样本,则由该样本计算的的样本,则由该样本计算的t t值大值大于等于于等于2.2282.228的概率为的概率为0.0250.025,小于等于,小于等于-2.228-2.228的概率亦为的概率亦为0.0250.025。P P(t t-2.228)+-2.228)+P P(t t2.228)2.228)0.05 0.05 或:或:P P(-2.228(-2.228tt2.228)=1-0.05=0.952.228)=1-0.05=0.95。-2.228 2.228