正态分布参考值抽样误差精选PPT.ppt

上传人:石*** 文档编号:47795039 上传时间:2022-10-03 格式:PPT 页数:61 大小:1.70MB
返回 下载 相关 举报
正态分布参考值抽样误差精选PPT.ppt_第1页
第1页 / 共61页
正态分布参考值抽样误差精选PPT.ppt_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《正态分布参考值抽样误差精选PPT.ppt》由会员分享,可在线阅读,更多相关《正态分布参考值抽样误差精选PPT.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于正态分布参考值抽样误差第1页,讲稿共61张,创作于星期二例例 某地用随机抽样方法检查了某地用随机抽样方法检查了140140名成年男子的红细胞数,名成年男子的红细胞数,检测结果如表检测结果如表2 21 15.953.82正态分布和医学参考值范围正态分布和医学参考值范围第2页,讲稿共61张,创作于星期二红细胞数红细胞数组中值组中值频数频数频率()频率()3.80 3.80 3.903.902 2 1.4 1.44.00 4.00 4.104.106 6 4.3 4.34.20 4.20 4.304.301111 7.9 7.94.40 4.40 4.504.50252517.917.94.60

2、 4.60 4.704.70323222.922.94.80 4.80 4.904.90272719.319.35.00 5.00 5.105.10171712.112.15.20 5.20 5.305.301313 9.3 9.35.40 5.40 5.505.504 4 2.9 2.95.60 5.60 5.705.702 2 1.4 1.45.805.806.006.005.905.901 1 0.7 0.7某地某地140140名正常男子红细胞数频数表名正常男子红细胞数频数表第3页,讲稿共61张,创作于星期二直方图第4页,讲稿共61张,创作于星期二f(x)=(fi/n)以频率为纵坐标以频

3、率为纵坐标以频率为纵坐标以频率为纵坐标第5页,讲稿共61张,创作于星期二随随着着组组段段不不断断分分细细和和观观察察人人数数的的增增多多,直直条条顶顶端端将将逐逐渐渐接接近近于于一一条条光光滑滑的的曲曲线线,如如下下图图。这这条条曲曲线线称称为为频频率率密密度度曲曲线线,呈呈中中间间高高、两两边边低低、左右对称,形状似座钟。类似于数学上的正态分布曲线。左右对称,形状似座钟。类似于数学上的正态分布曲线。因为频率的总和等于因为频率的总和等于因为频率的总和等于因为频率的总和等于1 1 1 1,故横轴上曲线下的面积等于,故横轴上曲线下的面积等于,故横轴上曲线下的面积等于,故横轴上曲线下的面积等于1 1

4、 1 1。频率密度 f(x)=(fi/n)/i(i0.1)第6页,讲稿共61张,创作于星期二第7页,讲稿共61张,创作于星期二这条所描述的分布,便近似于我们通常所说的正态概率分布,简称正态分布。正态分布是自然界最常见的一种分正态分布是自然界最常见的一种分布,例如,测量的误差、人体的身布,例如,测量的误差、人体的身高、体重、许多生化指标的值(例高、体重、许多生化指标的值(例如血压、血红蛋白含量、红细胞数如血压、血红蛋白含量、红细胞数等等)等都属于正态分布或近似正等等)等都属于正态分布或近似正态分布。还有些偏态资料可经数据态分布。还有些偏态资料可经数据转换成正态或近似正态分布,例如转换成正态或近似

5、正态分布,例如抗体滴度、血铅值等。抗体滴度、血铅值等。第8页,讲稿共61张,创作于星期二l l一、正态分布的密度函数式中式中为总体均数,为总体均数,为总体标准差,为总体标准差,为圆周率,为圆周率,e e为自然对数的底,为自然对数的底,x x为变量,当为变量,当、已知,以已知,以x x为横为横轴,轴,f f(x)(x)为纵轴,即可给出正态分布曲线的图形。为纵轴,即可给出正态分布曲线的图形。第9页,讲稿共61张,创作于星期二l l二、正态分布的特征1.正态分布在横轴上方,均数处最高,以均数为中心,左右对称。2.2.正态分布的正态分布的X X取值范围理论上没有边界,取值范围理论上没有边界,X离越远,

6、越远,f(X)f(X)值越接近0 0,但不会等于,但不会等于0 0。3.3.正态分布曲线下的面积分布有一定的规律。正态分布曲线下的面积分布有一定的规律。所有的正态分布曲线,所有的正态分布曲线,所有的正态分布曲线,所有的正态分布曲线,在在在在左右任意个标准左右任意个标准差范围内面积相同。差范围内面积相同。第10页,讲稿共61张,创作于星期二4.4.正态分布完全由两个参数即均数与标准差决定,其中是位置参数,是位置参数,是变异参数。常用N(,N(,2)来表示。来表示。第11页,讲稿共61张,创作于星期二0 0、1 1的标准正态分布的标准正态分布第12页,讲稿共61张,创作于星期二标准正态分布曲线及其

7、面积分布标准正态分布曲线及其面积分布第13页,讲稿共61张,创作于星期二三、正态分布的应用 不少医学现象服从正态分布或近似正态分布l l确定医学参考值范围确定医学参考值范围l l质量控制图质量控制图 正态分布是很多统计方法的理论基础第14页,讲稿共61张,创作于星期二医学参考值范围的估计医学参考值范围的估计l l1.1.医学参考值范围的概念 指特定的指特定的指特定的指特定的“正常正常正常正常”人群的解剖、生理、生化指标及组人群的解剖、生理、生化指标及组人群的解剖、生理、生化指标及组人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范织代谢产物含量等数据中大多数个体的取值

8、所在的范织代谢产物含量等数据中大多数个体的取值所在的范织代谢产物含量等数据中大多数个体的取值所在的范围。围。围。围。l l2.2.医学参考值范围的确定要求医学参考值范围的确定要求 确定研究总体,例如确定研究总体,例如 “正常人正常人”。选择足够数量的观察对象。选择足够数量的观察对象。统一测定方法,控制实验误差,保证数据的可靠性。统一测定方法,控制实验误差,保证数据的可靠性。决定取单侧范围还是双侧范围值决定取单侧范围还是双侧范围值 选择恰当的百分范围选择恰当的百分范围第15页,讲稿共61张,创作于星期二医学参考值范围的估计医学参考值范围的估计l l3.医学参考值范围的计算方法正态分布法百分位数法

9、第16页,讲稿共61张,创作于星期二正态分布法 适用于正态或近似分布资料适用于正态或近似分布资料 式中 为均数,s为标准差,u值可根据要求查表。公式为:第17页,讲稿共61张,创作于星期二常用的u界值参考值范围参考值范围(%)单侧单侧双侧双侧 90 95 99 1.282 1.645 2.326 1.645 1.960 2.576第18页,讲稿共61张,创作于星期二第19页,讲稿共61张,创作于星期二例某地调查正常成年男子144人的红细胞数近似正态分布,得均数为5.385.38(10101212/L/L),标准差为0.440.44(101212/L),试估计该地成年男子红细胞数的),试估计该地

10、成年男子红细胞数的95%参考值范围。第20页,讲稿共61张,创作于星期二百分位数法:适用于偏态分布资料适用于偏态分布资料 例如白细胞数的95参考值范围:因为白细胞数无论过高或过低均属异常,则分别计算P2.5和P97.5,这是双侧95参考值范围。百分范围百分范围(%)单侧单侧双侧双侧下限下限上限上限下限下限上限上限9595P P5 5P P9595P P2.52.5P P97.597.59999P P1 1P P9999P P0.50.5P P99.599.5第21页,讲稿共61张,创作于星期二例 某年某市调查了200例正常成人血铅含量(g/100g)如下,试估计该市成人血铅含量95医学参考值范

11、围(用百分位数法计算)。第22页,讲稿共61张,创作于星期二第23页,讲稿共61张,创作于星期二练习1:调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95医学参考值范围。血红蛋白过高、过低均为异常,应按双侧计算:血红蛋白过高、过低均为异常,应按双侧计算:第24页,讲稿共61张,创作于星期二一、均数的抽样分布与抽样误差一、均数的抽样分布与抽样误差l l抽样研究的目的就是要用样本信息来推断总体特征。由于存在个体变异,样本均数(X)往往不等于总体均数(),因此抽样后各个样本均数也往往

12、不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。数值变量的参数估计数值变量的参数估计第25页,讲稿共61张,创作于星期二第26页,讲稿共61张,创作于星期二第27页,讲稿共61张,创作于星期二110110名名2020岁健康男大学生的身高均数为岁健康男大学生的身高均数为172.73cm172.73cm。第28页,讲稿共61张,创作于星期二l l已知f110110,fXfX19000,需要在该表中增加,需要在该表中增加fxfx2 2栏,栏,由第由第(3)、(4)栏相乘,再将该栏数据相加,将栏相乘,再将

13、该栏数据相加,将fX232836463283646代入公式第29页,讲稿共61张,创作于星期二110名20岁男大学生的平均身高X172.73cm,标准差s4.09cm。假设该假设该110个身高数值作为假设的有限总体,即:172.73cm172.73cm,4.09cm现在从该总体中现在从该总体中随机抽随机抽1010个学生个学生身高为身高为1 1号样本。号样本。计算得:X1=173.22cms1=4.05cm第30页,讲稿共61张,创作于星期二第31页,讲稿共61张,创作于星期二重复重复100100次刚才的抽样,得到次刚才的抽样,得到次刚才的抽样,得到次刚才的抽样,得到100个样本(每个样本含量均

14、个样本(每个样本含量均为为10个),可算得个),可算得个),可算得个),可算得100个样本均数个样本均数X。第32页,讲稿共61张,创作于星期二各样本均数的均数各样本均数的均数X172.66 cm172.73cm172.73cm第33页,讲稿共61张,创作于星期二第34页,讲稿共61张,创作于星期二样本均数的抽样分布具有以下特点:1.各样本均数未必等于总体均数;2.样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;4.样本均数的变异较之原变量的变异大大缩小。第35页,讲稿共61张,创作于星期二总体均数为,标准差样本1(,s)样本2(

15、,s)样本3(,s)样本m(,s)抽样,样本量为n第36页,讲稿共61张,创作于星期二根据正态分布原理,若随机变量根据正态分布原理,若随机变量X服从正服从正态分布,则样本均数态分布,则样本均数X也服从正态分布。也服从正态分布。随机变量 X:N(,2)样本均数 :N(,)第37页,讲稿共61张,创作于星期二均数的标准误及计算均数的标准误及计算反映均数抽样误差大小的指标是样本均数 X 的标准差简称标准误(理论值),用 表示,或SE、SEM。由于在实际抽样研究中往往未知,通常用某一样本标准差s来替代,得标准误的估计值 (通常也简称为标准误),其计算公式为:第38页,讲稿共61张,创作于星期二以以1

16、1号样本号样本 =173.22cm=173.22cm,s s1 1=4.05cm=4.05cm为例:为例:均数的标准误及计算均数的标准误及计算第39页,讲稿共61张,创作于星期二 一般情况下未知,常用 估计抽样误差的大小,也即 的估计值。例 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。将X=125g/L,s=15g/L,n=27代入第40页,讲稿共61张,创作于星期二例:已知 s6.85,n100则样本均数的抽样误差 为多少?第41页,讲稿共61张,创作于星期二标准误的应用1.反映样本均数的可靠性;标准误

17、反映抽样误差的大小。标准误反映抽样误差的大小。标准误大,表示抽样标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差。反之,标误差大,则样本均数估计总体均数的可靠性差。反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。准误小,抽样误差小,样本均数估计总体均数的可靠性好。2.估计总体均数的可信区间;3.用于均数的假设检验。第42页,讲稿共61张,创作于星期二二、总体均数的可信区间估计即用样本指标(统计量)估计总体指标(参数)有两种常用方法:点估计和区间估计(一)点估计:样本均数()就是总体均数的点估计值()该法简单,但未考虑抽样误差,而抽样误差在抽样研究中是不可忽视的。第43页,

18、讲稿共61张,创作于星期二(二)区间估计:结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1可信区间(confidence interval,CI)第44页,讲稿共61张,创作于星期二即按一定的概率估计未知总体均数的所在范围。习惯上用总体均数的95%(或99%)可信区间,表示该区间包含总体均数的概率为95%(或99%),用此范围估计总体平均数,表示100次抽样中,有 95(99)次包含总体均数。例如:总体均数的可信区间例如:总体均数的可信区间第45页,讲稿共61张,创作于星期二(1)未知,但样本例数n足够大(如n 50),总体均数的1双侧可信区间为总体

19、均数95%的双侧可信区间为:总体均数可信区间的计算总体均数99%的双侧可信区间为:第46页,讲稿共61张,创作于星期二例 某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95可信区间。本例本例n n9090,可按正态分布近似法计算,可按正态分布近似法计算故该市2000年19岁健康男大学生平均身高的95可信区间为(171.3,173.1)cm。第47页,讲稿共61张,创作于星期二t t 分分 布布第48页,讲稿共61张,创作于星期二 前面讲过,通过u变换,可将正态分布N(,2)转换成标准正态分布N

20、(0,1)。同样,若从正态分布N(,2)总体中随机抽样并算得多个样本均数 ,它们仍服从总体均数为,总体标准差为 的正态分布N(,),则 服从第49页,讲稿共61张,创作于星期二标准正态分布N(0,1)。在实际工作中,往往是未知,常用 替代 ,即 这时,对正态变量X采取的不是u变换而是t变换了,t值的分布称为t分布。第50页,讲稿共61张,创作于星期二第51页,讲稿共61张,创作于星期二1.单峰分布,以0为中心,左右对称;2.t分布是一簇曲线,其形态变化与自由度的大小有关 n-1。越小,与 的差别越大,t值越分散,曲线的峰部越矮,尾部越粗。越大,t分布越接近于标准正态分布。t分布的特征:第52页

21、,讲稿共61张,创作于星期二自由度分别为自由度分别为1 1、5 5、的的t t分布分布第53页,讲稿共61张,创作于星期二 由于t分布不是一条曲线,而是一簇曲线。因此,t分布曲线下面积的95%或99%界值不是一个常量,而是随着自由度大小而变化的。为便于使用,可根据t界值表查找。第54页,讲稿共61张,创作于星期二第55页,讲稿共61张,创作于星期二(2)未知,且n较小时,总体均数可信区间的计算或简写为:第56页,讲稿共61张,创作于星期二df5时,时,若“砍去”t分布双侧尾部面积0.055,则有95的t值满足:第57页,讲稿共61张,创作于星期二例 已知某地27名健康成年男子的血红蛋白量的均数

22、为125g/L,标准差为15g/L。试问该地健康成年男子的血红蛋白平均含量的95可信区间和99可信区间各是多少?将X=125g/L,s=15g/LX=125g/L,s=15g/L,n=27代入同时查t t界值表:t t0.05/2,260.05/2,26=2.056,t=2.056,t0.01/2,260.01/2,26=2.779=2.779第58页,讲稿共61张,创作于星期二练习练习1 1要减小抽样误差,最切实可行的方法是要减小抽样误差,最切实可行的方法是。(1 1)增加样本例数)增加样本例数 (2 2)控制个体变异)控制个体变异(3 3)遵循随机化原则)遵循随机化原则 (4 4)严格挑选观察对象)严格挑选观察对象第59页,讲稿共61张,创作于星期二练习练习2 2 某地调查正常成年男子144144人的红细胞数近似正态分布,人的红细胞数近似正态分布,得均数为得均数为5.38105.38101212/L,标准差为标准差为0.440.441012/L/L,试估计该该样本均数的抽样误差。将s=0.441012,n=144代入第60页,讲稿共61张,创作于星期二感感谢谢大大家家观观看看第61页,讲稿共61张,创作于星期二

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁