正态分布参考值抽样误差学习教案.pptx

上传人:莉*** 文档编号:91538394 上传时间:2023-05-27 格式:PPTX 页数:61 大小:1.26MB
返回 下载 相关 举报
正态分布参考值抽样误差学习教案.pptx_第1页
第1页 / 共61页
正态分布参考值抽样误差学习教案.pptx_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《正态分布参考值抽样误差学习教案.pptx》由会员分享,可在线阅读,更多相关《正态分布参考值抽样误差学习教案.pptx(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学 1正态分布参考值抽样误差第一页,共61 页。例 某地用随机抽样方法检查(jinch)了140名成年男子的红细胞数,检测结果如表215.953.82正态分布和医学 正态分布和医学(yxu)(yxu)参考值范围 参考值范围第1 页/共61 页第二页,共61 页。红细胞数 红细胞数 组中值 组中值 频数 频数 频率()频率()3.80 3.80 3.90 3.90 2 2 1.4 1.44.00 4.00 4.10 4.10 6 6 4.3 4.34.20 4.20 4.30 4.30 11 11 7.9 7.94.40 4.40 4.50 4.50 25 25 17.9 17.94.60

2、4.60 4.70 4.70 32 32 22.9 22.94.80 4.80 4.90 4.90 27 27 19.3 19.35.00 5.00 5.10 5.10 17 17 12.1 12.15.20 5.20 5.30 5.30 13 13 9.3 9.35.40 5.40 5.50 5.50 4 4 2.9 2.95.60 5.60 5.70 5.70 2 2 1.4 1.45.80 5.80 6.00 6.00 5.90 5.90 1 1 0.7 0.7某地 某地140 140名正常 名正常(zhngchng)(zhngchng)男子红细胞数频数表 男子红细胞数频数表第2 页/共

3、61 页第三页,共61 页。直方图第3 页/共61 页第四页,共61 页。f(x)=(fi/n)以频率 以频率(pnl)(pnl)为纵坐标 为纵坐标第4 页/共61 页第五页,共61 页。随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光滑的曲线,如下图。这条曲线称为频率密度曲线,呈中间高、两边低、左右对称,形状 随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光滑的曲线,如下图。这条曲线称为频率密度曲线,呈中间高、两边低、左右对称,形状(xngzhun)(xngzhun)似座钟。类似于数学上的正态分布曲线。似座钟。类似于数学上的正态分布曲线。因为频率的总和等于 因为频率的

4、总和等于1 1,故横轴上曲线下的面积等于,故横轴上曲线下的面积等于1 1。频率(pnl)密度 f(x)=(fi/n)/i(i 0.1)第5 页/共61 页第六页,共61 页。第6 页/共61 页第七页,共61 页。这条所描述的分布,便近似于我们通常所说 这条所描述的分布,便近似于我们通常所说(su(su shu)shu)的正态概率分布,简称正态分布。的正态概率分布,简称正态分布。正态分布是自然界最常见的一 正态分布是自然界最常见的一种分布,例如,测量的误差、种分布,例如,测量的误差、人体的身高、体重、许多生化 人体的身高、体重、许多生化指标的值(例如血压、血红蛋 指标的值(例如血压、血红蛋白含

5、量、红细胞数等等 白含量、红细胞数等等(dn(dn dn)dn))等都属于正态分布或近)等都属于正态分布或近似正态分布。还有些偏态资料 似正态分布。还有些偏态资料可经数据转换成正态或近似正 可经数据转换成正态或近似正态分布,例如抗体滴度、血铅 态分布,例如抗体滴度、血铅值等。值等。第7 页/共61 页第八页,共61 页。n n 一、正态分布的密度(md)函数式中为总体均数,为总体标准差,为圆周率,e为自然对数的底,x为变量(binling),当、已知,以x为横轴,f(x)为纵轴,即可给出正态分布曲线的图形。第8 页/共61 页第九页,共61 页。n n 二、正态分布(fnb)的特征n n 1.

6、正态分布(fnb)在横轴上方,均数处最高,以均数为中心,左右对称。n n 2.正态分布(fnb)的X取值范围理论上没有边界,X离越远,f(X)值越接近0,但不会等于0。n n 3.正态分布(fnb)曲线下的面积分布(fnb)有一定的规律。所有的正态分布曲线,所有的正态分布曲线,在 在 左右任意个标准 左右任意个标准差范围 差范围(fnwi)(fnwi)内面 内面积相同。积相同。第9 页/共61 页第十页,共61 页。4.4.正态分布完全由两个参数 正态分布完全由两个参数(cnsh)(cnsh)即均数 即均数 与 与标准差 标准差 决定,其中 决定,其中 是位置参数 是位置参数(cnsh)(cn

7、sh),是变异参数 是变异参数(cnsh)(cnsh)。常用。常用N(,2)N(,2)来表示。来表示。第10 页/共61 页第十一页,共61 页。0、1的标准(biozhn)正态分布第11 页/共61 页第十二页,共61 页。标准正态分布曲线及其面积(min j)分布第12 页/共61 页第十三页,共61 页。三、正态分布的应用 三、正态分布的应用不少医学现象 不少医学现象(xinxing)(xinxing)服从正态分布 服从正态分布或近似正态分布 或近似正态分布确定医学参考值范围 确定医学参考值范围质量控制图 质量控制图正态分布是很多统计方法的理论基础 正态分布是很多统计方法的理论基础第13

8、 页/共61 页第十四页,共61 页。医学参考值范围(fnwi)的估计n n 1.1.医学参考值范围的概念 医学参考值范围的概念n n 指特定的 指特定的“正常 正常”人群的解剖、生理、生化指标及组 人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范 织代谢产物含量等数据中大多数个体的取值所在的范围。围。n n 2.2.医学参考值范围的确定要求 医学参考值范围的确定要求n n 确定研究总体,例如 确定研究总体,例如“正常人 正常人”。n n 选择足够数量 选择足够数量(shling)(shling)的观察对象。的观察对象。n n 统一测定方法,控制实验误差,保证数据的

9、可靠性。统一测定方法,控制实验误差,保证数据的可靠性。n n 决定取单侧范围还是双侧范围值 决定取单侧范围还是双侧范围值n n 选择恰当的百分范围 选择恰当的百分范围第14 页/共61 页第十五页,共61 页。医学(yxu)参考值范围的估计n n 3.医学(yxu)参考值范围的计算方法 正态分布法百分位数法第15 页/共61 页第十六页,共61 页。正态分布(fnb)法 适用于正态或近似分布(fnb)资料 式中 为均数,s为标准差,u值可根据要求查表。公式(gngsh)为:第16 页/共61 页第十七页,共61 页。常用(chn yn)的u界值参考值范围(%)单侧 双侧 90 95 99 1.

10、282 1.645 2.326 1.645 1.960 2.576第17 页/共61 页第十八页,共61 页。第18 页/共61 页第十九页,共61 页。例某地调查正常成年男子 某地调查正常成年男子(nnz)144(nnz)144人的红细胞数 人的红细胞数近似正态分布,得均数为 近似正态分布,得均数为5.38 5.38(1012/L 1012/L),标准差 标准差为 为0.44 0.44(1012/L 1012/L),试估计该地成年男子),试估计该地成年男子(nnz)(nnz)红细胞数的 红细胞数的95%95%参考值范围。参考值范围。第19 页/共61 页第二十页,共61 页。百分位数法:适用

11、于偏态分布(fnb)资料 例如白细胞数的 例如白细胞数的95 95参考值范围 参考值范围:因为白细胞数无论过 因为白细胞数无论过高或过低均属异常,则分别 高或过低均属异常,则分别(fnbi)(fnbi)计算 计算P2.5 P2.5和 和P97.5 P97.5,这是双侧,这是双侧95 95参考值范围。参考值范围。百分范围 百分范围(%)单侧 单侧 双侧 双侧下限 下限 上限 上限 下限 下限 上限 上限95 95 P P5 5P P95 95P P2.5 2.5P P97.5 97.599 99 P P1 1P P99 99P P0.5 0.5P P99.5 99.5第20 页/共61 页第二十

12、一页,共61 页。例 某年某市调查了200例正常成人血铅含量(g/100g)如下,试估计(gj)该市成人血铅含量95医学参考值范围(用百分位数法计算)。第21 页/共61 页第二十二页,共61 页。第22 页/共61 页第二十三页,共61 页。练习1:调查某地120 名健康女性血红蛋白,直方图显示,其分布(fnb)近似于正态分布(fnb),其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95 医学参考值范围。血红蛋白(xuhng dnbi)过高、过低均为异常,应按双侧计算:第23 页/共61 页第二十四页,共61 页。一、均数的抽样(chu yn

13、)分布与抽样(chu yn)误差n n 抽样研究的目的就是要用样本信息来推断总体特征。由于存在个体变异,样本均数(X)往往不等于总体均数(),因此抽样后各个样本均数也往往不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样造成(zo chn)的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。数值(shz)变量的参数估计第24 页/共61 页第二十五页,共61 页。第25 页/共61 页第二十六页,共61 页。第26 页/共61 页第二十七页,共61 页。110 110名 名20 20岁健康 岁健康(jinkng)(jinkng)男大学生的身高均数为 男大

14、学生的身高均数为172.73cm 172.73cm。第27 页/共61 页第二十八页,共61 页。n n 已知 已知f f 110 110,fX fX 19000 19000,需要,需要(xyo)(xyo)在该表中 在该表中增加 增加fx2 fx2栏,由第 栏,由第(3)(3)、(4)(4)栏相乘,再将该栏数据相 栏相乘,再将该栏数据相加,将 加,将fX2 fX2 3283646 3283646代入公式 代入公式第28 页/共61 页第二十九页,共61 页。110名20岁男大学生的平均(pngjn)身高X172.73cm,标准差s4.09cm。假设 假设(jish)(jish)该 该110 1

15、10个身高数值作为假设 个身高数值作为假设(jish)(jish)的有限总体,的有限总体,即:即:172.73cm 172.73cm,4.09cm 4.09cm现在从该总体中随机抽10个学生身高(shn o)为1号样本。计算得:X1=173.22cms1=4.05cm第29 页/共61 页第三十页,共61 页。第30 页/共61 页第三十一页,共61 页。重复 重复 100 100次刚才的抽样,得到 次刚才的抽样,得到 100 100个样本 个样本(yngbn)(yngbn)(每个样(每个样本 本(yngbn)(yngbn)含量均为 含量均为 10 10个),可算得 个),可算得 100 10

16、0个样本 个样本(yngbn)(yngbn)均数 均数 X X。第31 页/共61 页第三十二页,共61 页。各样本(yngbn)均数的均数X172.66 cm 172.73cm 172.73cm第32 页/共61 页第三十三页,共61 页。第33 页/共61 页第三十四页,共61 页。样本均数的抽样分布具有以下特点:样本均数的抽样分布具有以下特点:各样本均数未必等于总体均数;各样本均数未必等于总体均数;样本均数之间存在差异;样本均数之间存在差异;样本均数的分布很有规律,围绕着总体均数,中 样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态 间多、两边少,左右基本

17、对称,也服从正态分布;分布;样本均数的变异 样本均数的变异(biny)(biny)较之原变量的变异 较之原变量的变异(biny)(biny)大大缩小。大大缩小。第34 页/共61 页第三十五页,共61 页。总体(zngt)均数为,标准差样本1(,s)样本2(,s)样本3(,s)样本m(,s)抽样(chu yn),样本量为n第35 页/共61 页第三十六页,共61 页。根据正态分布原理,若随机变量(su j bin lin)X服从正态分布,则样本均数X也服从正态分布。随机变量(su j bin lin)X:N(,2)样本均数:N(,)第36 页/共61 页第三十七页,共61 页。均数的标准误及计

18、算反映均数抽样误差大小的指标是样本均数 X 的标准差简称标准误(理论值),用 表示,或SE、SEM。由于在实际抽样研究中往往(wngwng)未知,通常用某一样本标准差s来替代,得标准误的估计值(通常也简称为标准误),其计算公式为:第37 页/共61 页第三十八页,共61 页。以1号样本(yngbn)=173.22cm,s1=4.05cm为例:均数的标准(biozhn)误及计算第38 页/共61 页第三十九页,共61 页。一般情况下 未知,常用 估计(gj)抽样误差的大小,也即 的估计(gj)值。例 例 2000 2000年某研究者随机调查某地健康 年某研究者随机调查某地健康(jinkng)(j

19、inkng)成年男子 成年男子27 27人,得到血红蛋白量 人,得到血红蛋白量的均数为 的均数为125g/L 125g/L,标准差为,标准差为15g/L 15g/L。试估计。试估计该样本均数的抽样误差。该样本均数的抽样误差。将 将X=125g/L,s=15g/L X=125g/L,s=15g/L,n=27 n=27代入 代入第39 页/共61 页第四十页,共61 页。例:已知 s6.85,n100则样本(yngbn)均数的抽样误差 为多少?第40 页/共61 页第四十一页,共61 页。标准误的应用 标准误的应用1.1.反映样本均数的可靠性;反映样本均数的可靠性;标 标准 准误 误反 反映 映抽

20、 抽样 样误 误差 差的 的大 大小 小。标 标准 准误 误大 大,表 表示 示抽 抽样 样误 误差 差大 大,则 则样 样本 本均 均数 数估 估计 计总 总体 体(zngt)(zngt)均 均数 数的 的可 可靠 靠性 性差 差。反 反之 之,标 标准 准误 误小 小,抽 抽样 样误 误差 差小 小,样 样本 本均 均数 数估 估计 计总 总体 体(zngt)(zngt)均 均数的可靠性好。数的可靠性好。2.2.估计总体 估计总体(zngt)(zngt)均数的可信区间;均数的可信区间;3.3.用于均数的假设检验。用于均数的假设检验。第41 页/共61 页第四十二页,共61 页。二、总体(z

21、ngt)均数的可信区间估计即用样本指标(统计量)估计总体(zngt)指标(参数)有两种常用方法:点估计和区间估计(一)点估计:样本均数()就是总体(zngt)均数的点估计值()该法简单,但未考虑抽样误差,而抽样误差在抽样研究中是不可忽视的。第42 页/共61 页第四十三页,共61 页。(二)区间(二)区间(q jin)(q jin)估计:估计:结合样本统计量和标准误可以确定一个具有一定 结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间 可信度的包含总体参数的区间(q jin)(q jin),该区,该区间 间(q jin)(q jin)称为总体参数的 称为总体参数的1 1 可

22、信区间 可信区间(q(q jin)jin)(confidence interval,CI confidence interval,CI)第43 页/共61 页第四十四页,共61 页。即按一定的概率估计未知总体均数的所在范围。即按一定的概率估计未知总体均数的所在范围。习惯上用总体均数的 习惯上用总体均数的95%(95%(或 或99%)99%)可信区间,可信区间,表示该区间包含 表示该区间包含(bohn)(bohn)总体均数 总体均数 的概率为 的概率为95%(95%(或 或99%)99%),用此范围估计总体平均数,表示,用此范围估计总体平均数,表示100 100次抽样中,有 次抽样中,有 95(

23、99)95(99)次包含 次包含(bohn)(bohn)总体均 总体均数。数。例如(lr):总体均数的可信区间第44 页/共61 页第四十五页,共61 页。(11)未知,但样本例数未知,但样本例数nn足够大(如足够大(如n n 5050),总体),总体(zngt)(zngt)均数的均数的11双侧双侧可信区间为可信区间为总体 总体(zngt)(zngt)均数 均数95%95%的双侧可信区间为:的双侧可信区间为:总体均数可信区间(q jin)的计算总体均数 总体均数99%99%的双侧可信区间为:的双侧可信区间为:第45 页/共61 页第四十六页,共61 页。例 例 某市 某市2000 2000年随

24、机测量了 年随机测量了90 90名 名19 19岁健康男大学 岁健康男大学生的身高,其均数为 生的身高,其均数为172.2cm 172.2cm,标准差为,标准差为4.5cm 4.5cm,试估计该市,试估计该市2000 2000年 年19 19岁健康男大学生平均 岁健康男大学生平均(pngjn)(pngjn)身高的 身高的95 95可信区间。可信区间。本例n90,可按正态分布近似(jn s)法计算故该市 故该市2000 2000年 年19 19岁健康 岁健康(jinkng)(jinkng)男大学 男大学生平均身高的 生平均身高的95 95可信区间为(可信区间为(171.3 171.3,173.1

25、 173.1)cm cm。第46 页/共61 页第四十七页,共61 页。t 分 布第47 页/共61 页第四十八页,共61 页。前面讲过,通过u变换,可将正态分布N(,2)转换成标准正态分布N(0,1)。同样(tngyng),若从正态分布N(,2)总体中随机抽样并算得多个样本均数,它们仍服从总体均数为,总体标准差为 的正态分布N(,),则 服从第48 页/共61 页第四十九页,共61 页。标准(biozhn)正态分布N(0,1)。在实际工作中,往往是未知,常用 替代,即 这时,对正态变量X采取的不是u变换而是t变换了,t值的分布(fnb)称为t分布(fnb)。第49 页/共61 页第五十页,共

26、61 页。第50 页/共61 页第五十一页,共61 页。1.1.单峰分布,以 单峰分布,以0 0为中心,左右对称 为中心,左右对称(duchn)(duchn);2.t 2.t分布是一簇曲线,其形态变化与自由度 分布是一簇曲线,其形态变化与自由度 的大小有关 的大小有关 n-1 n-1。越小,越小,与 与 的差 的差别越大,别越大,t t值越分散,曲线的峰部越矮,尾部 值越分散,曲线的峰部越矮,尾部越粗。越粗。越大,越大,t t分布越接近于标准正态分布。分布越接近于标准正态分布。t分布(fnb)的特征:第51 页/共61 页第五十二页,共61 页。自由度分别(fnbi)为1、5、的t分布第52

27、页/共61 页第五十三页,共61 页。由于 由于t t分布不是一条曲线,而是一簇曲线。因 分布不是一条曲线,而是一簇曲线。因此 此(ync)(ync),t t分布曲线下面积的 分布曲线下面积的95%95%或 或99%99%界值不 界值不是一个常量,而是随着自由度大小而变化的。为 是一个常量,而是随着自由度大小而变化的。为便于使用,可根据 便于使用,可根据t t界值表查找。界值表查找。第53 页/共61 页第五十四页,共61 页。第54 页/共61 页第五十五页,共61 页。(22)未知,且未知,且nn较小时较小时(xiosh)(xiosh),总体(zngt)均数可信区间的计算或简写(jinxi

28、)为:第55 页/共61 页第五十六页,共61 页。df5时,若“砍去”t 分布(fnb)双侧尾部面积 0.05 5,则有 95 的 t 值满足:第56 页/共61 页第五十七页,共61 页。例 例 已知某地 已知某地27 27名健康成年男子的血红蛋白量 名健康成年男子的血红蛋白量的均数为 的均数为125g/L 125g/L,标准差为,标准差为15g/L 15g/L。试问。试问(shwn)(shwn)该地健康成年男子的血红蛋白平均含 该地健康成年男子的血红蛋白平均含量的 量的95 95可信区间和 可信区间和99 99可信区间各是多少?可信区间各是多少?将 将X=125g/L,s=15g/L X

29、=125g/L,s=15g/L,n=27 n=27代入 代入同时 同时(tngsh)(tngsh)查 查t t界值表:界值表:t0.05/2,26=2.056,t0.05/2,26=2.056,t0.01/2,26=2.779 t0.01/2,26=2.779第57 页/共61 页第五十八页,共61 页。练习1要减小抽样误差,最切实可行的方法是。(1)增加样本(yngbn)例数(2)控制个体变异(3)遵循随机化原则(4)严格挑选观察对象第58 页/共61 页第五十九页,共61 页。练习2 某地调查正常成年(chngnin)男子144人的红细胞数近似正态分布,得均数为5.381012/L,标准差

30、为0.441012/L,试估计该该样本均数的抽样误差。将 将s=0.4410 s=0.441012 12,n=144 n=144代入 代入第59 页/共61 页第六十页,共61 页。练习 练习(linx)3(linx)3 某地抽得正常成人 某地抽得正常成人200 200名,测得其血 名,测得其血清胆固醇的均数为 清胆固醇的均数为3.64mmol/L 3.64mmol/L,标准差为,标准差为1.20mmol/L 1.20mmol/L,试估计该地正常成人血清胆固醇均数的,试估计该地正常成人血清胆固醇均数的95 95 CI CI。本例 本例 虽未知,但 虽未知,但n n较大 较大(jio d)(jio d)该 该地 地正 正常 常成 成人 人(chng(chng rn)rn)血 血清 清胆 胆固 固醇 醇均 均数 数的 的95 95 CI CI为 为3.47 3.47 3.81mmol/L 3.81mmol/L。第60 页/共61 页第六十一页,共61 页。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁