《医学统计学.正态分布及应用【统计学】知识分享.ppt》由会员分享,可在线阅读,更多相关《医学统计学.正态分布及应用【统计学】知识分享.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章 正态分布及其应用(yngyng)主讲人:余小金公共卫生(n n wi shn)学院流行病与卫生统计学系第一页,共46页。1一个(y)问题p一个1.72米的男生和一个1.72米的女生(nshng)哪个高?第二页,共46页。2频 数108110112114116118 1221241261281301320510152025120该直方图给了我们什么(shn me)信息?p120名7岁男童的身高分布(fnb)的频率分布(fnb)图n身高低于116厘米的儿童(r tng)累计频率为多少?身高(cm)n身高大于1 24厘米的儿童累计频率 为多少?第三页,共46页。3表2.1 120名7岁男童身
2、高(shn o)的频数(率)分布组段组段(1)频数频数(2)频频率率(%)(%)(3)累累计频计频数数(4 4)累累计频计频率率(%)(%)(5 5)10820.01720.16711030.02550.41711270.058120.100114140.117260.217116190.158450.375118240.20690.575120180.15870.725122150.1251020.85012490.0751110.92312650.0421160.96712830.0251190.99213013210.0081201合合计计120第四页,共46页。4如果观察(gunch)
3、的是远大于120的研究总体呢?p关于总体的概率分布p第五章 正态分布与二项分布p正态分布是最基础的一种(y zhn)理论分布第五页,共46页。5主要(zhyo)内容p正态分布历史-关于误差的分布p正态分布的特征(tzhng)p正态分布在生物医学中的应用第六页,共46页。6正态分布的历史(lsh)p德国数学家Gaussp法国数学家Laplace误差(wch)函数p最早用于物理学、天文学pGaussian distribution第七页,共46页。7从频率(pnl)分布到概率分布(a)(b)(d)(c)第八页,共46页。8正态分布的概率密度函数 p如果随机变量X的概率密度函数p p 则 称 X服
4、从(fcng)正 态 分 布,记 作 XN(,2),其中,为分布的均数,为分布的标准差。(-X+)第九页,共46页。9正态分布的特征(tzhng)p正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。p充分统计量p高峰在均数处;p均数两侧完全对称(duchn)。p正态曲线下的面积分布有一定的规律。第十页,共46页。10正态分布图示 bell-shaped curvex0.1.2.3.4f(x)第十一页,共46页。11方差(fn ch)相等、均数不等的正态分布图示312第十二页,共46页。12均数相等(xingdng)、方差不等的正态分布图示213第十三页,共46
5、页。13正态曲线下的面积(min j)规律pX轴与正态曲线所夹面积(min j)恒等于1。p对称区域面积(min j)相等。S(-,-X)S(X,)S(-,-X)第十四页,共46页。14正态曲线下的面积(min j)规律p对称区域面积(min j)相等。S(-x1,-x2)-x1 -x2 x2 x1S(x1,x2)=S(-x2,-x1)第十五页,共46页。15正态曲线下的面积(min j)规律 -4 -3 -2 -1 0 1 2 3 4-3 -2 -+2 +3 S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(
6、-,+2)=0.9772S(-,+1)=0.6587S(-,)=1第十六页,共46页。16正态曲线下的面积(min j)规律 -4 -3 -2 -1 0 1 2 3 4-3 -2 -+2 +3 1-S(-3 ,+3)=0.00261-S(-2 ,+2)=0.04561-S(-,+)=0.3174第十七页,共46页。17正态曲线下的面积(min j)规律 -4 -3 -2 -1 0 1 2 3 4-3 -2 -+2 +3 S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0
7、.6587S(-,)=1第十八页,共46页。18正态曲线下的面积(min j)规律-3 -2 -+2 +3 S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413 -4 -3 -2 -1 0 1 2 3 4 第十九页,共46页。19正态曲线下的面积(min j)规律-3 -2 -+2 +3 S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0115S(-2,-1)=0.1359S(
8、-1,)=0.3413 -3 -2 -1 0 1 2 3第二十页,共46页。20正态曲线下的面积(min j)规律 -3 -+3 -2 +2 S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5第二十一页,共46页。21正态曲线下的面积(min j)规律-1.96+1.962.5%2.5%95%第二十二页,共46页。22正态曲线下的面积(min j)规律-1.64+1.645%5%90%第二十三页,共46页。23正态曲线下的面积(min j)规律-2.58
9、+2.580.5%0.5%99%第二十四页,共46页。24正态曲线下的面积(min j)规律小结p正态曲线下面积总和(zngh)为1;p正态曲线关于均数对称;对称的区域内面积相等;p对任意正态曲线,按标准差为单位,对应的面积相等;p-1.64+1.64内面积为90%;p-1.96+1.96内面积为95%;p-2.58+2.58内面积为99%。p小于-3的面积为 0.13%;p小于-2的面积为 2.28%;p小于-的面积为15.87%。第二十五页,共46页。25标准(biozhn)正态分布p标准(biozhn)正态分布(standard normal distribution)是均数为0,标准(
10、biozhn)差为1的正态分布。p记为N(0,1)。p标准(biozhn)正态分布是一条曲线。p概率密度函数:(-u+)第二十六页,共46页。26正态分布转换(zhunhun)为标准正态分布p若 XN(,2),作变换:p 则u服从标准(biozhn)正态分布。pu称为标准(biozhn)正态离差(standard normal deviate)第二十七页,共46页。27标准正态分布曲线(qxin)下面积(u)u 0.00-0.02-0.04-0.06-0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049
11、-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.30850.30150.29460.28770.2810 00.5000 0.4920 0.4840 0.4761 0.46810u第二十八页,共46页。28关于(guny)正态分布总结p正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;p正态分布的优良性质-函数的分布p正态分布
12、是由两个参数决定(judng)的一簇分布p正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。第二十九页,共46页。29正态分布的应用(yngyng)p二次大战期间们,英国生物学家peter blackett 向海军部建议组建科研(k yn)小组协助解决战略,战术问题运筹学(operational research)诞生p应用到企业管理,制造业等p统计模型和科学思维的应用当条件满足时用正态分布去解决问题第三十页,共46页。30正态分布的应用(yngyng)p估计频数分布p正态分布的假定(jidng)简化了数据处理p质量控制p确定临床参考值范围第三十一页,共
13、46页。31估计(gj)频数分布p例2.1 120名7岁男童的身高,计算得均数为119.41cmg,标准差为4.38cm.试估计(gj)该7岁男童110cm以下的比例。p首先计算标准离差:p查标准正态分布表:(-2.15)=0.0158p估计(gj)低体重儿的比例为1.58%.第三十二页,共46页。32质量(zhling)管理quality managementp质量控制的意义p监控日常(rchng)工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。p医院质量管理p实验室质量管理p六西格玛管理(6)p参考阅读:周纪芗茆诗松质量管
14、理统计方法中国统计出版社第三十三页,共46页。33关于(guny)六西格玛管理 p拯救摩托罗拉的开始(kish)70-80年代pGE公司p六西格玛水平为99.99966%的合格率,也就是每百万次出错机会中只出现3.4个错误。第三十四页,共46页。34质量(zhling)控制图(quality control chart)UCL(上控制限)UWL(上警戒限)CL (中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+3SDM+2SD MM-2SDM-3SD第三十五页,共46页。35质量(zhling)控制图(quality control chart)UCL(上控制限)UWL(上警
15、戒(jngji)限)CL (中心线)LWL(下警戒(jngji)限)LCL(下控制限)样本(yngbn)编号、取样时间M+2.58SDM+1.96SD MM-1.96SDM-2.58SD第三十六页,共46页。36质量(zhling)控制图(quality control chart)123456789101112131415取样取样(qyng)时间时间M+3SDM+2SD MM-2SDM-3SD第三十七页,共46页。37医学(yxu)参考值范围p问题p医学诊断检验中所用的正常范围是什么意思(y s)?p如何得到的?第三十八页,共46页。38参考值范围(fnwi)的定义(reference in
16、terval)p又称正常值范围(normal range)。p参考值范围的经典定义:p绝大多数正常人的某解剖,生理,生化等指标观察值所在的范围。p绝大多数:90%,95%,99%等等。p参考值范围的扩展(extension)p用于分类判别与综合评价的所有相关领域p环境(hunjng)媒介中化学物含量标准(容许区间);标准动物指标;医院管理等.p“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。第三十九页,共46页。39参考值范围(fnwi)确定的原则与步骤p抽取(chu q)足够例数的正常人样本p同质定义明确(性别年龄等)p准确而统一的测量-控制检测误差p决定单、双侧问题
17、p选择适当的百分界值(90%,95%)p估计界值第四十页,共46页。40单侧与双侧参考值范围(fnwi)p双侧p(在界值范围(fnwi)内为正常):白细胞计数,血清总胆固醇p单侧p上限(低于界值为正常):尿铅,发汞,牛奶中的三聚氰胺p下限(高于界值为正常):肺活量,IQ,p根据医学专业知识确定!第四十一页,共46页。41正常人病人(bngrn)假阳性率假阴性(ynxng)率正常人与病人(bngrn)的数据分布重叠(单侧)第四十二页,共46页。42正常人病人(bngrn)假阳性率假阴性(ynxng)率正常人与病人(bngrn)的数据分布重叠(单侧)第四十三页,共46页。43正常人病人(bngrn)假阳性率假阴性(ynxng)率病人(bngrn)正常人与病人的数据分布重叠(双侧)第四十四页,共46页。44参考值范围的估计(gj)方法方法双侧单侧下限上限正态分布法百分位数法P2.5P97.5P5P95第四十五页,共46页。45谢谢您的专心(zhunxn)听讲!第四十六页,共46页。46