《正态分布与值 .ppt》由会员分享,可在线阅读,更多相关《正态分布与值 .ppt(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、正态分布与医学参考值范围 Normal Distribution&Medical Reference RangeNormal Distribution&Medical Reference Range67.3 75.4 73.1 70.9 75.1 72.6 78.2 68.8 73.8 71.5 66.5 75.167.3 75.4 73.1 70.9 75.1 72.6 78.2 68.8 73.8 71.5 66.5 75.170.7 68.9 73.3 72.3 76.5 74.3 75.9 75.4 67.2 71.8 76.2 70.670.7 68.9 73.3 72.3 76.5
2、 74.3 75.9 75.4 67.2 71.8 76.2 70.670.7 75.6 73.3 72.4 76.6 67.3 80.8 74.3 73.9 71.6 79.9 69.370.7 75.6 73.3 72.4 76.6 67.3 80.8 74.3 73.9 71.6 79.9 69.380.3 75.7 73.5 81.2 74.4 72.5 77.1 67.3 74.1 68.0 76.4 70.480.3 75.7 73.5 81.2 74.4 72.5 77.1 67.3 74.1 68.0 76.4 70.471.0 75.8 73.6 78.1 68.7 72.6
3、 77.6 72.2 74.2 72.1 76.3 69.771.0 75.8 73.6 78.1 68.7 72.6 77.6 72.2 74.2 72.1 76.3 69.771.1 75.7 73.5 72.7 78.3 72.5 77.2 68.2 74.2 72.3 76.5 70.571.1 75.7 73.5 72.7 78.3 72.5 77.2 68.2 74.2 72.3 76.5 70.571.2 83.7 73.7 75.8 74.7 72.6 69.5 66.0 76.1 77.7 80.5 83.171.2 83.7 73.7 75.8 74.7 72.6 69.5
4、 66.0 76.1 77.7 80.5 83.164.1 75.1 76.3 77.8 65.2 75.0 72.7 78.8 71.1 71.8 72.9 76.164.1 75.1 76.3 77.8 65.2 75.0 72.7 78.8 71.1 71.8 72.9 76.171.2 75.2 72.9 79.5 73.9 75.2 73.1 79.5 81.8 74.5 81.6 74.571.2 75.2 72.9 79.5 73.9 75.2 73.1 79.5 81.8 74.5 81.6 74.5表表1 某地某地108名正常成年女子血清总蛋白名正常成年女子血清总蛋白(g/L
5、)含量含量组组段段 频频数数,f 组组中数中数,X fX=fX2=264.066.068.070.072.074.076.078.080.082.084.0 合合 计计 2 6 815252314 7 6 210865.067.069.071.073.075.077.079.081.083.0 130.0 402.0 552.01065.01825.01725.01078.0 553.0 486.0 166.0 7982.0 8450.0 26934.0 38088.0 75615.0133225.0 129375.0 83006.0 43687.0 39366.0 13778.0591524
6、.0 表表2 108名正常成年女子血清总蛋白名正常成年女子血清总蛋白(g/L)频数分布频数分布图图*某地某地1 10808名正常成年女子血清名正常成年女子血清 总蛋白总蛋白(g/L)含量直方图含量直方图红细胞数红细胞数/(1012/L)图图 某地某地1 15 50 0名正常成年男子红细胞数名正常成年男子红细胞数(1012/L)频数分布图频数分布图.0.1.2.30 0246810 xf(x).0.1.2.30 02 24 46 68 81010 xf(x)f(x)正态分布 正态分布正态分布(normal distribution)也叫高斯分布也叫高斯分布(Gaussian distributi
7、on),),是最常见、最重要的一种是最常见、最重要的一种连续型分布。连续型分布。一、正态分布的数学形式一、正态分布的数学形式 二、标准正态分布二、标准正态分布 三、曲线下面积三、曲线下面积 四、正态性检验四、正态性检验 五、正态分布的应用五、正态分布的应用 x xf f(x x)一一.正态分布的数学形式正态分布的数学形式x xf f(x x)m m f(X)=随机变量随机变量 X 的频数的频数,称为概率密度函数称为概率密度函数(probability density function)=总体方差总体方差,=总体均值总体均值 XN(,)以以X为横坐标,为横坐标,f(X)为纵坐标,绘制的曲线就是为
8、纵坐标,绘制的曲线就是 正态曲线正态曲线(normal curve)正态分布的特征正态分布的特征x xf f(x x)二二.标准正态分布标准正态分布(standard normal distribution)两个参数:两个参数:,11,记为记为 N(0,1)x 1 1u 标准正态分布标准正态分布N(0,1)一般正态分布一般正态分布N(m,)(m,)正态曲线下的面积分布有一定的规律。正态曲线下的面积分布有一定的规律。求其一区间的面积,可通过求其一区间的面积,可通过下面下面积分积分公式公式得到。得到。概率是曲线概率是曲线下的面积下的面积!Xf(X)XXf(X)abXf(X)a-a0三三.曲线下面积
9、曲线下面积 附表附表10-11-1.961.96-2.582.5868.27%95.00%99.00%曲线下面积分布规律曲线下面积分布规律N(0,1)m mm-m-m+m+m-1.96m-1.96m+1.96m+1.96m-.58m-.58m+.58m+.5868.27%95.00%99.00%N(m,m,)例例1 某地某地108名正常成年女子的血清总蛋白名正常成年女子的血清总蛋白(g/L)如表如表6-1,试估计该地正常女子血清总蛋白,试估计该地正常女子血清总蛋白68.0g/L,78.0g/L,78.0g/L所占正常女子总所占正常女子总人数的百分比。人数的百分比。67.3 75.4 73.1
10、70.9 75.1 72.6 78.2 68.8 73.8 71.5 66.5 75.167.3 75.4 73.1 70.9 75.1 72.6 78.2 68.8 73.8 71.5 66.5 75.170.7 68.9 73.3 72.3 76.5 74.3 75.9 75.4 67.2 71.8 76.2 70.670.7 68.9 73.3 72.3 76.5 74.3 75.9 75.4 67.2 71.8 76.2 70.670.7 75.6 73.3 72.4 76.6 67.3 80.8 74.3 73.9 71.6 79.9 69.370.7 75.6 73.3 72.4
11、76.6 67.3 80.8 74.3 73.9 71.6 79.9 69.380.3 75.7 73.5 81.2 74.4 72.5 77.1 67.3 74.1 68.0 76.4 70.480.3 75.7 73.5 81.2 74.4 72.5 77.1 67.3 74.1 68.0 76.4 70.471.0 75.8 73.6 78.1 68.7 72.6 77.6 72.2 74.2 72.1 76.3 69.771.0 75.8 73.6 78.1 68.7 72.6 77.6 72.2 74.2 72.1 76.3 69.771.1 75.7 73.5 72.7 78.3
12、72.5 77.2 68.2 74.2 72.3 76.5 70.571.1 75.7 73.5 72.7 78.3 72.5 77.2 68.2 74.2 72.3 76.5 70.571.2 83.7 73.7 75.8 74.7 72.6 69.5 66.0 76.1 77.7 80.5 83.171.2 83.7 73.7 75.8 74.7 72.6 69.5 66.0 76.1 77.7 80.5 83.164.1 75.1 76.3 77.8 65.2 75.0 72.7 78.8 71.1 71.8 72.9 76.164.1 75.1 76.3 77.8 65.2 75.0
13、72.7 78.8 71.1 71.8 72.9 76.171.2 75.2 72.9 79.5 73.9 75.2 73.1 79.5 81.8 74.5 81.6 74.571.2 75.2 72.9 79.5 73.9 75.2 73.1 79.5 81.8 74.5 81.6 74.5表表1 某地某地108名正常成年女子血清总蛋白名正常成年女子血清总蛋白(g/L)含量含量组组段段 频频数数,f 组组中数中数,X fX=fX2=264.066.068.070.072.074.076.078.080.082.084.0 合合 计计2681525231476210865.067.069.07
14、1.073.075.077.079.081.083.0 130.0 402.0 552.01065.01825.01725.01078.0 553.0 486.0 166.07982.0 8450.0 26934.0 38088.0 75615.0133225.0 129375.0 83006.0 43687.0 39366.0 13778.0591524.0 表表2 108名正常成年女子血清总蛋白名正常成年女子血清总蛋白(g/L)频数分布频数分布解:解:1.由频数分布判断,基本符合正态分布规律。由频数分布判断,基本符合正态分布规律。2.计算均数、标准差,计算均数、标准差,3.3.进行进行u变
15、换,样本量变换,样本量较大较大,故故用样本均数用样本均数 代替代替,S代替代替。4.4.估计估计u1 1和和u2 2的分布函数,查附表的分布函数,查附表1 1,得,得5.5.下结论。下结论。四四.正态性检验正态性检验(normality test)正态分布的两个特征:正态分布的两个特征:1.1.正态对称性正态对称性 2.2.正态峰:偏度、峰度正态峰:偏度、峰度 方法:方法:1.1.图示法图示法 Q-QQ-Q图,图,P-PP-P图图 2.2.计算法计算法 x xf f(x x)图图3 1083 108个原始数据的个原始数据的Q-QQ-Q图图为什么学习正态分布为什么学习正态分布1.正态分布是最常见
16、的一种分布,大量随机现正态分布是最常见的一种分布,大量随机现象都可以用正态分布来描述,如人体身高、体重、象都可以用正态分布来描述,如人体身高、体重、血压、红细胞数、随机误差等。血压、红细胞数、随机误差等。2.正态分布具有良好的性质,如对称性、正态正态分布具有良好的性质,如对称性、正态峰等。峰等。3.正态分布是许多统计方法的理论基础,常用正态分布是许多统计方法的理论基础,常用正态分布近似其他一些分布。正态分布近似其他一些分布。正态分布的应用正态分布的应用 1.估计医学参考值范围:利用正态曲线面积分布估计医学参考值范围:利用正态曲线面积分布规律;规律;2.质量控制:如控制实验中的随机误差;质量控制
17、:如控制实验中的随机误差;3.正态分布正态分布是许多统计方法的理论基础:如是许多统计方法的理论基础:如t t分分布、布、c c 分布、分布、F分布等都是在正态分布的基础上推分布等都是在正态分布的基础上推导出来的。导出来的。医学参考值范围Medical reference range 参考值参考值(reference value)范围范围 (传统叫法传统叫法“正正常值范围常值范围”)指个体观察值的散布范围。指个体观察值的散布范围。如成人红细胞的总数如成人红细胞的总数 400010000400010000个个/mm/mm3 3 概念扩展概念扩展:规定食品、空气、水、土壤等卫生:规定食品、空气、水、
18、土壤等卫生标准;标准;流行病学:据潜伏期确定接触者的留验期限。流行病学:据潜伏期确定接触者的留验期限。参考值范围参考值范围 步骤:步骤:1.1.从从“正常人正常人”总体中抽样:明确研究总体;总体中抽样:明确研究总体;2.2.统一测定方法以控制系统误差;统一测定方法以控制系统误差;3.3.判断是否需要分组(如性别、年龄)确定;判断是否需要分组(如性别、年龄)确定;4.4.根据专业知识决定根据专业知识决定单侧单侧还是还是双侧双侧。单侧上限单侧上限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常单侧下限单侧下限异常异常正常正常参考值范围的计算参考值范围的计算 方法:方法:1.
19、1.正态分布法正态分布法 2.2.百分位数法百分位数法 m mm-m-m+m+m-1.96m-1.96m+1.96m+1.96m-.58m-.58m+.58m+.5868.27%95.00%99.00%N(m,m,)1.1.正态分布法正态分布法适用于适用于正态正态分布资料分布资料双侧双侧(1-a a)正常值范围:正常值范围:单侧单侧(1-a a)正常值范围:正常值范围:双侧双侧95%正常值范围:正常值范围:单侧单侧95%正常值范围:正常值范围:例例2 估计例估计例6-1某地某地108名成年女子血清总蛋白名成年女子血清总蛋白(均数为均数为73.9g/L,标准差为,标准差为3.9g/L)95%参考
20、值范围。参考值范围。故该地正常成年女子血清总蛋白的故该地正常成年女子血清总蛋白的95参考值参考值范围是范围是 66.381.5g/L。解:因血清总蛋白过多或过少均为异常,故按双侧解:因血清总蛋白过多或过少均为异常,故按双侧估计正常成年女子血清总蛋白的估计正常成年女子血清总蛋白的95参考值范围。参考值范围。2.2.百分位数法百分位数法 适用于适用于偏态偏态分布资料分布资料双侧双侧95%95%正常值范围:正常值范围:P P2.52.5P P97.597.5单侧单侧95%95%正常值范围:正常值范围:P P5 5(下限)(下限)1.1.直接计算直接计算 2.2.频数表法频数表法例例3 某地某地130
21、名正常成年人的血清肌红蛋白含量名正常成年人的血清肌红蛋白含量(m mg/mL)频数分布表如下,试估计其频数分布表如下,试估计其95%的医学参考值的医学参考值范围。范围。表表5 130名正常人的血清肌红蛋白含量频数表名正常人的血清肌红蛋白含量频数表解:由表解:由表5,该资料为偏态,该资料为偏态分布,且血清肌红蛋白含分布,且血清肌红蛋白含量过高或过低均为异常,故需采用双侧量过高或过低均为异常,故需采用双侧95%正常值正常值范围:范围:P2.5P97.51.直接计算:直接计算:n=130,1302.5%=3.25,13097.5%=126.75,P2.5=X4=6.9(m mg/mL)P97.5=X
22、127=44.2(m mg/mL)故该地正常成人血清肌红蛋白含量故该地正常成人血清肌红蛋白含量95的医学的医学参考值范围为参考值范围为6.944.2m mg/mL2.频数表法频数表法 n=130,1302.5%=3.25,13097.5%=126.75,例例4 某地调查正常成年男子某地调查正常成年男子144人的红细胞数,近似正人的红细胞数,近似正态分布,得均数态分布,得均数537.8万万/mm3,标准差为标准差为43.9万万/mm3。估估计该地计该地正常正常成年男子红细胞成年男子红细胞计数计数的的95%参考值范围。参考值范围。故该地正常成年男子红细胞的计数的故该地正常成年男子红细胞的计数的95
23、参考值范围参考值范围是是 451.8623.8万万/mm3例例5:某地:某地200例健康成人的血汞值得频数分布如例健康成人的血汞值得频数分布如 下,试估计下,试估计95%的参考值范围的参考值范围。(微克(微克/100克)克)频数表法计算:频数表法计算:常常 用用 概概 率率 分分 布布 正态分布正态分布 二项分布二项分布 Poisson分布分布二二 项项 分分 布布(binomial distribution)v二分类资料,观察对象的结局只有二分类资料,观察对象的结局只有相互对立的两种结果。相互对立的两种结果。例如:例如:生存、死亡生存、死亡 阳性、阴性阳性、阴性 发病、不发病发病、不发病 治
24、愈、未愈治愈、未愈例子例子已知:小白鼠接受某种毒物一定剂量时,已知:小白鼠接受某种毒物一定剂量时,死亡率死亡率=80%生存率生存率=20%每只鼠独立做实验,相互不受影响每只鼠独立做实验,相互不受影响若每组各用若每组各用3只小白鼠(甲、乙、丙)只小白鼠(甲、乙、丙)3只小白鼠的存亡方式符合二项分布只小白鼠的存亡方式符合二项分布概率的乘法法则概率的乘法法则:几个独立事件同时发生的概率,等于各独立事几个独立事件同时发生的概率,等于各独立事件的概率之件的概率之积积 概率的加法法则概率的加法法则:互不相容事件互不相容事件和和的概率等于各事件的概率之的概率等于各事件的概率之和和3只小白鼠均生存的概率:只小
25、白鼠均生存的概率:P=0.2 0.2 0.2=0.0083只小白鼠只小白鼠2生生1死的概率:死的概率:P1=0.2 0.2 0.8=0.032P2=0.2 0.8 0.2=0.032 P=0.096P3=0.8 0.2 0.2=0.0323只小白鼠只小白鼠1生生2死的概率:死的概率:vP1=0.2 0.8 0.8=0.128vP2=0.8 0.8 0.2=0.128 P=0.384vP3=0.8 0.2 0.8=0.1283只小白鼠均死亡的概率:只小白鼠均死亡的概率:vP=0.8 0.8 0.8=0.512x00.50.40.30.20.10.0123(0.2+0.8)3 二项分布示意图二项分
26、布示意图二项分布的定义二项分布的定义从从阳阳性性率率为为的的总总体体中中随随机机抽抽取取含含量量为为n的样本,恰有的样本,恰有X例阳性的概率为:例阳性的概率为:X=0,1,2,n 则则称称X服服从从参参数数为为n和和 的的二二项项分分布布,记记为为:XB(n,)。其其中中参参数数 n由由实实验验者者确确定定,而而 常常是未知的。常常是未知的。如已知如已知n=3,=0.8,则恰有例阳性的概率,则恰有例阳性的概率P(1)为:为:二项分布的性质(一)二项分布的性质(一)均数与标准差均数与标准差二项分布的性质(二)二项分布的性质(二)累计概率累计概率(cumulative probability)从阳
27、性率为从阳性率为 的总体中随机抽取的总体中随机抽取n个个体个个体 最多有最多有k例阳性的概率:例阳性的概率:最少有最少有k例阳性的概率:例阳性的概率:递推公式:递推公式:二项分布的例子二项分布的例子据据以以往往经经验验,用用某某药药治治疗疗小小儿儿上上呼呼吸吸道道感感染染、支支气气管管炎炎,有有效效率率为为85,今今有有5个个患患者者用用该该药药治治疗疗,问问:至至少少3人人有有效效的的概概率率为为多多少?少?最多最多1人有效的概率为多少?人有效的概率为多少?至少至少3人有效的概率:人有效的概率:P(X3)=P(3)+P(4)+P(5)则则 P(X3)=0.1381781250.3915046
28、880.443705313=0.973388126 最多最多1人有效的概率为:人有效的概率为:P(X 1)=P(0)+P(1)二项分布的图形特征二项分布的图形特征偏态分布偏态分布N逐步增大且逐步增大且 不要太小或太大(不要太小或太大(和和 ),二项分布趋向于正态),二项分布趋向于正态分布。分布。二项分布的应用条件二项分布的应用条件各观察单位只能有互相对立的一种结果,属于二各观察单位只能有互相对立的一种结果,属于二分类资料分类资料 已知发生某一结果已知发生某一结果(如阴性如阴性)的概率的概率 不变,其对立不变,其对立结果结果(如阳性如阳性)的概率则为的概率则为1-n次试验在相同条件下进行,且各观
29、察单位的结果次试验在相同条件下进行,且各观察单位的结果互相独立互相独立 Poisson 分布的概念分布的概念单位时间、单位空间内某事件的发生数单位时间、单位空间内某事件的发生数单位人群(较大)中某稀有事件的发生数单位人群(较大)中某稀有事件的发生数放射性物质每分钟放射的脉冲数放射性物质每分钟放射的脉冲数每每ml水中大肠菌群数、每升空气中粉尘数、每水中大肠菌群数、每升空气中粉尘数、每1万个细胞中有多少个发万个细胞中有多少个发生突变生突变某地每天的交通事故数、某工矿企业每天的工伤人数某地每天的交通事故数、某工矿企业每天的工伤人数足球比赛每场的进球数足球比赛每场的进球数生物:每平方公里有多少植物生物
30、:每平方公里有多少植物如如果果某某事事件件的的发发生生是是完完全全随随机机的的,则则单单位位时时间间或或单单位空间内,事件发生位空间内,事件发生0次、次、l次、次、2次次的概率为:的概率为:X=0,1,2,则则称称该该事事件件的的发发生生服服从从参参数数为为 的的Poisson分分布布,记记为为XPoisson()。X为为单单位位时时间间或或空空间间内内某某事事件件的的发发生生数数,P(X)为为事事件件数数为为X时时的的概概率率,e为为自自然然对对数数的底。的底。Poisson分布的性质(一)分布的性质(一)均数与方差均数与方差 Poisson分布的方差分布的方差 2与均数与均数 相等,均为相
31、等,均为 ,即:,即:2=其中参数其中参数 即为均数,表示单位空间或时间内事即为均数,表示单位空间或时间内事件平均发生的次数,又称强度参数。件平均发生的次数,又称强度参数。Poisson分布的性质(二)分布的性质(二)累计概率累计概率最多为最多为k次的概率:次的概率:最少为最少为k次的概率:次的概率:递推公式:递推公式:Poisson分布的形状取决于分布的形状取决于 的大小。的大小。Poisson分布为正偏态分布,且分布为正偏态分布,且 愈小分布愈偏;愈小分布愈偏;随着随着 的增大,分布逐渐趋于对称的增大,分布逐渐趋于对称当当 =20时已基本接近对称分布;时已基本接近对称分布;当当 =50时,
32、时,Poisson分布近似正态分布,分布近似正态分布,50时可按正态分布原理处理之。时可按正态分布原理处理之。Poisson分布的性质(三)分布的性质(三)图图 Poisson分布示意分布示意可加性可加性 以较小的度量单位,观察某一现象的发生以较小的度量单位,观察某一现象的发生数时,如果它呈数时,如果它呈Poisson分布,那么把若干分布,那么把若干个小单位合并为一个大单位后,其总计数个小单位合并为一个大单位后,其总计数亦呈亦呈Poisson分布。分布。Poisson分布的性质(四)分布的性质(四)例如,已知某放射性物质每例如,已知某放射性物质每10分钟放射脉分钟放射脉冲数呈冲数呈Poisso
33、n分布,分布,5次测量的结果,分次测量的结果,分别为别为35、34、36、38、34次,那么次,那么50分钟分钟放射脉冲数放射脉冲数(总计为总计为177次次)亦呈一亦呈一Poisson分分布。因此布。因此 Poisson分布资料可利用可加性原分布资料可利用可加性原理使理使 50,然后用正态近似法处理之。,然后用正态近似法处理之。v可加性示例可加性示例Poisson分布的性质(五)分布的性质(五)Poisson分布是二项分布的极限形式分布是二项分布的极限形式 二二项项分分布布中中,当当 很很小小,比比如如 0.05,而而n很很大大,二项分布逼近二项分布逼近Poisson分布。且:分布。且:其中其
34、中=n。n愈大,近似程度愈好。如果某些现象的愈大,近似程度愈好。如果某些现象的发生率发生率 甚少,而样本例数甚少,而样本例数n甚多时,二项分布常用甚多时,二项分布常用Poisson分布来简化运算。分布来简化运算。一个实例:一个实例:v 据以往经验,新生儿染色体异常率为据以往经验,新生儿染色体异常率为1,试分别用二项分布及试分别用二项分布及Poisson分布原理,求分布原理,求100名新生儿中发生名新生儿中发生X例例(X=0,l,2)染色染色体异常的概率。体异常的概率。Poisson分布的应用条件分布的应用条件 v事件的发生是相互独立的事件的发生是相互独立的v事件发生的概率相等,事件发生的概率相等,v事件结果是二分类的事件结果是二分类的(发生或不发生发生或不发生)。小 结1.正态分布的特征和标准化变换正态分布的特征和标准化变换 2.正态分布曲线下面积分布规律正态分布曲线下面积分布规律3.参考值范围的概念及计算参考值范围的概念及计算4.二项分布和二项分布和Poisson分布分布