《正态分布+参考值.ppt》由会员分享,可在线阅读,更多相关《正态分布+参考值.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、正态分布及其应用 :张旭辉 顾逸霏Normal distribution and its applications Department of Epidemiology&Biostatistics,School of Public Health Nanjing Medical University1 正态分布在十九世纪前叶由正态分布在十九世纪前叶由高斯加以推广,所以通常称为高高斯加以推广,所以通常称为高斯分布斯分布.德莫佛德莫佛 德莫佛最早发现了二项概德莫佛最早发现了二项概率的一个近似公式,这一公式率的一个近似公式,这一公式被认为是被认为是正态分布的首次露面正态分布的首次露面.正态分布2正态分
2、布o德国数学家Gauss发现o最早用于物理学、天文学oGaussian distributiono1889年是高尔顿(Francis Galton,1822-1911)创先把该曲线称作正态曲线。3o其一,医学研究中的某些观察指标服从或近似服从正态分布;o其二,很多统计方法是建立在正态分布的基础之上的;o其三,很多其他分布的极限为正态分布。正态分布重要性4身高的分布(a)(b)(d)(c)5正态分布的概率密度函数 o如果随机变量X的概率密度函数 则称X服从正态分布,记作XN(,2),其中,为总体均数,为总体标准差。(e表示常数表示常数2.71828,-X+)6正态分布图示x0.1.2.3.4f(
3、x)7方差相等、均数不等的正态分布图示3128均数相等、方差不等的正态分布图示2139正态分布的特征o正态分布有两个参数(parameter),即位置位置参数参数(均数均数)和和变异度参数变异度参数(标准差标准差)。o高峰在均数处;o均数两侧完全对称。o正态曲线下的面积分布有一定的规律。10正态曲线下的面积规律oX轴与正态曲线所夹面积恒等于1。o对称区域面积相等。S(-,-X)S(X,)S(-,-X)11正态曲线下的面积规律o对称区域面积相等。S(-x1,-x2)-x1 -x2 x2 x1S(x1,x2)=S(-x2,-x1)12正态曲线下的面积规律-1.96+1.962.5%2.5%95%1
4、3正态曲线下的面积规律-1.64+1.645%5%90%14正态曲线下的面积规律-2.58+2.580.5%0.5%99%15正态曲线下的面积规律o正态曲线下面积总和为1;o正态曲线关于均数对称;对称的区域内面积相等;o对任意正态曲线,按标准差为单位,对应的面积相等;o-1.64+1.64内面积为90%;o-1.96+1.96内面积为95%;o-2.58+2.58内面积为99%。16标准正态分布o标准正态分布(standard normal distribution)是均数为0,标准差为1的正态分布。o记为N(0,1)。o标准正态分布是一条曲线。o概率密度函数:(-u+)17正态分布转换为标准
5、正态分布o若 XN(,2),作变换:则u服从标准正态分布。ou称为标准正态离差(standard normal deviate)18 实际应用中,经u变换后,就可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分布曲线下相应的面积问题。正态分布转换为标准正态分布19标准正态分布曲线下面积(u)u 0.00-0.02-0.04-0.06-0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287
6、 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4840 0.4761 0.46810u20总结总结o正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;o正态分布是一簇分布,由两个参数决定:均数和标准差;o正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。21正态分布
7、的应用估计频数分布质量控制确定临床参考值范围22 正态变量正态变量x x转化为标准正态变转化为标准正态变量u u,(公式,(公式 )再用)再用u u值查表,得所求区间面积值查表,得所求区间面积占总面积的比例占总面积的比例。估计频数分布23o某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。n首先计算标准离差:n查标准正态分布表:(-1.86)=0.0314n结果:估计低体重儿的比例为3.14%.24o例 已知某市120名岁男童身高均数为=142.67cm,标准差为s=6.00cm。设该资料服从正态分布,试求 该地12岁
8、男童身高在132cm以下者占该地12岁男童总数的比例,分别求 1s、1.96s和 2.58s范围内12岁男童占该组儿童总数的实际百分数,并与理论百分数比较。估计频数分布25o首先计算标准离差:o查标准正态分布表:(-1.78)=0.0375(3.75)o结果:该地12岁男童身高在132cm以下者,估计约占3.75。估计频数分布26估计频数分布27质量控制o质量控制的意义n监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。28质量控制图(quality control chart)UCL(上控制限)UWL(上警戒限)CL
9、(中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+3SDM+2SD MM-2SDM-3SD29质量控制图(quality control chart)UCL(上控制限)UWL(上警戒限)CL (中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+2.58SDM+1.96SD MM-1.96SDM-2.58SD30质量控制图(quality control chart)123456789101112131415取样时间M+3SDM+2SD MM-2SDM-3SD31参考值范围(reference interval)o参考值范围又称正常值范围(normal rang
10、e)。o什么是参考值范围:n是绝大多数正常人的某观察指标所在的范围。n绝大多数:90%,95%,99%等等。o确定参考值范围的意义:n用于判断正常与异常。o“正常人”的定义:n排除了影响所研究的指标的疾病和有关因素的同质的人群。32参考值范围确定的原则o选定同质的正常人作为研究对象 o控制检测误差o判断是否分组(性别,年龄组)o单、双侧问题 o选择百分界值(90%,95%)o确定可疑范围33单侧与双侧参考值范围o根据医学专业知识确定!n双侧:白细胞计数,血清总胆固醇,n单侧:上限:转氨酶,尿铅,发汞 下限:肺活量,IQ,单侧下限单侧下限-过低异常过低异常 单侧上限单侧上限-过高异常过高异常 双
11、侧双侧-过高、过低均异常过高、过低均异常 单侧下限单侧下限异常异常正常正常单侧上限单侧上限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常34正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)35正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)36正常人病人假阳性率假阴性率病人正常人与病人的数据分布重叠示意图(双侧)37参考值范围的估计方法方法双侧 单侧下限单侧上限正态分布法百分位数法 P2.5P97.5 P5 P9538百分比(百分比(%)单侧单侧双侧双侧800.84241.2816901.28161.6449951.64491.96
12、00992.32632.5758标准正态分布的标准正态分布的u界值表界值表参考值范围的估计方法39例题o例例 某地抽查了样本含量较大的部分成年男女的红细胞数,数据见表,试制定临床参考值范围。40 表表 某地正常成年男、女红细胞数(某地正常成年男、女红细胞数(1012/L)性别 S 男5 0.25女 4.5 0.22例题41 因正常成年男、女红细胞数有差别,故需分别制定男、女红细胞数参考值范围红细胞数呈正态分布,红细胞数过高过低都不正常。因此制定双侧95%参考值范围。42(5.00-1.960.25,5.00+1.960.25)=(4.51,5.49)故该地正常成年男子红细胞数95%参考值范围可制定为 (4.51,5.49)1012/L43(4.50-1.960.22,4.50+1.960.22)=(4.07,4.93)o故该地正常成年女子红细胞数95%参考值范围可制定为(4.07,4.93)1012/L4445频数表资料百分位数计算公式频数表资料百分位数计算公式:fx为为Px所在组频数所在组频数i为组距为组距fl 为为小于小于L各组段各组段的累计的累计频数频数464748