正态分布及其应用 (2).ppt

上传人:wuy****n92 文档编号:88365659 上传时间:2023-04-25 格式:PPT 页数:41 大小:882.50KB
返回 下载 相关 举报
正态分布及其应用 (2).ppt_第1页
第1页 / 共41页
正态分布及其应用 (2).ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《正态分布及其应用 (2).ppt》由会员分享,可在线阅读,更多相关《正态分布及其应用 (2).ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、医学统计学医学统计学 王友洁王友洁 email email 正态分布及其应用Normal distribution主要内容主要内容l正态分布的概念及其特征正态分布的概念及其特征l标准正态分布标准正态分布l医学参考值范围及其制定医学参考值范围及其制定 一一 正态分布正态分布(normal distribution)某地某地140名正常男子红细胞数的频数表名正常男子红细胞数的频数表 红细胞数红细胞数频频 数数 频频 率率(%)(%)累积频率累积频率(%)(%)3.80 2 1.4 1.41.44.00 6 4.3 5.75.74.20 11 7.913.613.64.40 25 17.9 31.5

2、31.54.60 32 22.9 54.454.44.80 27 19.3 73.773.75.00 17 12.1 85.885.85.20 13 9.3 95.195.15.40 4 2.9 98.098.05.60 2 1.4 99.499.45.80 6.00 1 0.7 100.0100.0合计合计140 -100.0100.0 140名正常男子红细胞计数的直方图名正常男子红细胞计数的直方图 频数f红细胞数红细胞数X频率密度频率/组距直方图形状相同,使各直方的面积相应于频率,其和为直方图形状相同,使各直方的面积相应于频率,其和为1(100%)某地成年男子红细胞数的分布逐渐接近正态分布

3、示意图某地成年男子红细胞数的分布逐渐接近正态分布示意图 一、正态分布一、正态分布(Normal Distribution)(Normal Distribution)频率密度频率密度正态分布的概念正态分布的概念又称为又称为Gauss分布(分布(Gaussian distribution)。)。当原始数据的频数当原始数据的频数分布图的观察人数逐渐增加且组段分布图的观察人数逐渐增加且组段不断分细时,图中的直条就不断变不断分细时,图中的直条就不断变窄,其顶端则逐渐接近于一条光滑窄,其顶端则逐渐接近于一条光滑的曲线。的曲线。这条曲线形态呈钟形,两这条曲线形态呈钟形,两头低、中间高,左右对称,近似于头低、

4、中间高,左右对称,近似于数学上的正态分布数学上的正态分布。在处理资料时,。在处理资料时,我们就把它看成是我们就把它看成是正态分布。正态分布。正态分布曲线的数学函数表达式正态分布曲线的数学函数表达式l如果随机变量如果随机变量X的分布服从概率密度函数的分布服从概率密度函数l则称则称X服从正态分布,记作服从正态分布,记作XN(,2),为为X的的总体均数,总体均数,2为总体方差为总体方差正态分布有两个参数:正态分布有两个参数:和和 ,分别表示均数和标准差。分别表示均数和标准差。二、正态分布的特征二、正态分布的特征l钟型曲线,以钟型曲线,以为中心,左右完全对称,为中心,左右完全对称,两端与两端与X轴永不

5、相交轴永不相交l在在X=处,处,f(X)取最大值,取最大值,X越远离越远离,f(X)越小。越小。l曲线下面积分布有规律曲线下面积分布有规律lX轴与正态曲线所夹面积恒等于轴与正态曲线所夹面积恒等于1或或100%;l区间区间的面积为的面积为68.3%,区间区间1.96的面积为的面积为95%,区间区间2.58的面积为的面积为99%.l两个参数决定位置和变异:两个参数决定位置和变异:和和 图图3-2 正态分布曲线下的面积正态分布曲线下的面积 图图3-3 三种不同均值的正态分布三种不同均值的正态分布 两个参数决定位置和变异两个参数决定位置和变异是位置(即平均水平)是位置(即平均水平)参数,决定分布曲线在

6、横参数,决定分布曲线在横轴的偏倚位置轴的偏倚位置l是变异参数,决定分布是变异参数,决定分布曲线的形态曲线的形态图图3-4 三种不同标准差的正态分布三种不同标准差的正态分布 正态分布是一个分布族,对应于不同的参数正态分布是一个分布族,对应于不同的参数 和和 会产生不同位置、不同形状的正态分布。会产生不同位置、不同形状的正态分布。s sm m为了应用方便,为了应用方便,令:令:二、标准正态分布二、标准正态分布(Standard Normal Distribution)对对任何参数的正任何参数的正态态分布,都可以通分布,都可以通过过一个一个简单简单的的变变量量变换变换 化成化成 和和 的的标标准正准

7、正态态分布分布。通常,通常,可以利用可以利用标标准正准正态态分布表求出与原始分布表求出与原始变变量量X X 有有关的概率关的概率值值。此。此变换变换也称也称为标为标准化准化变换变换,或称,或称 Z Z或或u u变变换换 图图3-5 标准正态分布及曲线下面积标准正态分布及曲线下面积 l标准正态分布标准正态分布Z的概率密度函数为的概率密度函数为l即将即将XN(,2)的正态分布转化为的正态分布转化为Z N(0,12)的标的标准正态分布,准正态分布,Z称为标准正态变量,其分布函数为称为标准正态变量,其分布函数为 l根据上述公式制成附表根据上述公式制成附表1,欲求一定区间标准,欲求一定区间标准正态分布曲

8、线下的面积只需查表即可,且正态分布曲线下的面积只需查表即可,且l (z)=1-(-z)(z)例:已知X服从均数为标准差为的正态分布,试估计:(1)X取值在区间1.96内的概率;(2)X取值在区间2.58内的概率。l求求X取值在相应区间内的概率,首先要确定区间两端点取值在相应区间内的概率,首先要确定区间两端点所对应的所对应的Z值值查表,得查表,得(-1.96)=0.025,则则Z取值在(取值在(-1.96,1.96)的概率为)的概率为0.95,即,即X取值在区间取值在区间1.96内的概内的概率为率为0.95。95%99%例3-1:正常成年男子的红细胞计数近似服从正态分布,假设均值为4.78101

9、2/L,标准差为0.381012/L,试估计红细胞数在41012/L以下所占的比例。l先将先将4(1012/L)变换为相应的)变换为相应的值,即值,即l于是问题就转化成为求标准正态分布于是问题就转化成为求标准正态分布Z值小于值小于-2.05概概率。查附表率。查附表1得得(-2.05)=0.202,表明成年男子的红细,表明成年男子的红细胞数低于胞数低于4 1012/L的人约占总体的的人约占总体的2%。l求出在求出在4 1012/L5.5 1012/L范围内所占的范围内所占的比例比例l即求即求P(4.0X5.5)l例例3-2 上节课的例题中已计算出上节课的例题中已计算出101名正常成年女子名正常成

10、年女子的血清总胆固醇均数为的血清总胆固醇均数为4.03mmol/L,标准差为,标准差为0.659mmol/L。试估计该单位:正常成年女子血清。试估计该单位:正常成年女子血清总胆固醇在总胆固醇在4.00mmol/L以下者占正常女子总人数的以下者占正常女子总人数的百分比;在百分比;在4.005.00mmol/L之间者占正常女子总之间者占正常女子总人数的百分比;在人数的百分比;在5.00mmol/L以上者占正常女子总以上者占正常女子总人数的百分比。人数的百分比。由于此例样本含量较大,可用样本均数、标准差代替总体均数和标准差查附表查附表1得得(-0.05)=?,如何求?,如何求(1.47)?三、正态分

11、布的应用l正态分布除了可估计频数分布外,还是正态分布除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量许多统计方法的基础,并可应用于质量控制及制定医学参考值范围。控制及制定医学参考值范围。一、基本概念一、基本概念l医学参考值:医学参考值:通常指包括绝大多数正常人的解剖、生理、生化、免疫通常指包括绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种生理生化指标常数。及组织代谢产物的含量等各种生理生化指标常数。l医学参考值范围:医学参考值范围:由于存在个体差异,生物医学数据并非常数而在一由于存在个体差异,生物医学数据并非常数而在一定范围内波动,故采用医学参考值范围作为判定正常

12、和异常的参考标定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。准。l主要目的:用于临床疾病诊断。主要目的:用于临床疾病诊断。第三节第三节 医学参考值范围医学参考值范围 (Reference Value Range)(Reference Value Range)通常使用的医学参考值范畴有:通常使用的医学参考值范畴有:90%90%,95%95%和和99%99%。最常用的是最常用的是95%95%参考值范围。参考值范围。确定确定95%95%参考值范围示意图参考值范围示意图 二、医学参考值范围的制定方法二、医学参考值范围的制定方法 (一)选择一定数量的参照样本一)选择一定数量的参照样本

13、选择参照样本必须要考虑可能影响所要制定参考值选择参照样本必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。范围指标的各种疾病及干扰因素,将这些人排除在外。例如在制定血清谷丙转氨酶活性正常值时,选取正常例如在制定血清谷丙转氨酶活性正常值时,选取正常人的条件为肝、肾、心、脑、肌肉等无器质性疾患,近人的条件为肝、肾、心、脑、肌肉等无器质性疾患,近期无特殊用药史等。同时可能需要考虑性别、年龄、民期无特殊用药史等。同时可能需要考虑性别、年龄、民族、地理位置等因素。样本含量一般要较大,如族、地理位置等因素。样本含量一般要较大,如n120120。(二)(二)对选定的参照样本进行

14、准确的测定对选定的参照样本进行准确的测定 为为保保证证原原始始数数据据可可靠靠,要要严严格格控控制制检检测测误误差差,包包括括分分析析仪仪器器的的灵灵敏敏度度、试试剂剂的的纯纯度度、操操作作技技术术及及标标准准的的掌掌握握等等,同同时时必必须须对对测测量量条条件件做做出出统统一一的的规规定定和和说说明明,如如临临床床化化验验参参考考值值范范围围的的制制定定,应应对对收收集集样样本本时时的的环环境境和和生生理理条条件件(温温度度、季季节节、体体育育活活动动强强度度、饮饮食食、妊妊娠娠等等),收集、转运和储藏样品的方法及时间有明确的规定。,收集、转运和储藏样品的方法及时间有明确的规定。(三)(三)

15、决定取决定取单侧单侧范范围还围还是双是双侧侧范范围值围值 有有些些指指标标如如白白细细胞胞数数过过高高或或过过低低均均属属异异常常(a)(a),故故其其参参考考值值范范围围需需要要分分别别确确定定下下限限和和上上限限,称称作作双双侧侧。有有些些指指标标如如2424小小时时尿尿糖糖含含量量仅仅在在过过高高(b)(b)、肺肺活活量量仅仅在在过过低低时时为为异异常常(c)(c),只只需需确确定定其其上上限限或或下下限限,称称作作单单侧侧参参考值范围。考值范围。(a)a)白细胞数参考值范围白细胞数参考值范围(b)24(b)24小时尿糖参考值范围小时尿糖参考值范围(c)(c)肺活量参考值范围肺活量参考值

16、范围(四)(四)选择选择适当的百分范适当的百分范围围 参考参考值值的百分的百分范范围围应根据应根据资资料的性料的性质质和研究目的和研究目的选择,它与诊断阈值有确定的关系。百分选择,它与诊断阈值有确定的关系。百分范范围围的不同的不同将导致不同的假阳性率和假阴性率。将导致不同的假阳性率和假阴性率。正常人和病人数据分布重叠正常人和病人数据分布重叠(五)(五)估估计计参考参考值值范范围围的界限的界限 参考参考值值范范围围估估计计主要主要有百分位数法和正有百分位数法和正态态分布法。分布法。1.百分位数法:适用于任何分布类型的资料,尤其是偏态分布资料,要百分位数法:适用于任何分布类型的资料,尤其是偏态分布

17、资料,要求样本含量比正态分布法要多(不低于求样本含量比正态分布法要多(不低于100)。)。l计算公式:计算公式:双侧双侧1-参考值范围:参考值范围:P/2 P100-/2 单侧单侧1-参考值范围:参考值范围:P 或或P100-l双侧双侧95%医学参考值范围是(医学参考值范围是(P2.5,P97.5),单侧范围是),单侧范围是P95以下以下(如人体有害物质如血铅)或(如人体有害物质如血铅)或P5以上(如肺活量)以上(如肺活量)百分范围百分范围(%)单单 侧侧 双双 侧侧 下限下限 上限上限 下限下限 上限上限 95 95 P5 5 P9595 P2.52.5 P97.597.5 99 99 P1

18、 1 P9999 P0.50.5 P99.599.5 参考值范围所对应的百分位数参考值范围所对应的百分位数 为该地区50岁60岁女性高血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的95%单侧参考值范围。甘油三脂甘油三脂频数频数 累积频数累积频数累积频率累积频率(%)0.10 27 27 4.30.40169196 31.10.70167363 57.61.00 94457 72.51.30 81538 85.41.60 42580 92.11.90 28608 96.52.20 14622 98.72.50 4626 99.42.80 3629 99.83.10 1630100.0 合计

19、合计630-百分范围(百分范围(%)单单 侧侧 双双 侧侧 下限下限 上限上限 下限下限 上限上限 95 95 P5 5 P9595 P2.52.5 P97.597.5 99 99 P1 1 P9999 P0.50.5 P99.599.5即即95%95%单侧参考值范围为小于单侧参考值范围为小于2.098mmol/L2.098mmol/L。2.正态分布法l首先要对资料进行正态性检验,且要求样本含量足够大首先要对资料进行正态性检验,且要求样本含量足够大(n100)。计算公式如下:)。计算公式如下:l双侧双侧1-参考值范围:参考值范围:l单侧单侧1-参考值范围:参考值范围:百分范围(百分范围(%)单

20、单 侧侧 双双 侧侧 下限下限 上限上限 下限下限 上限上限 95 95 99 99 参考值范围所对应的正态分布区间参考值范围所对应的正态分布区间 参考值范围(参考值范围(%)单侧单侧双侧双侧800.841.28901.281.64951.641.96992.332.58 Z界值表界值表 若已算得某地正常成年男子红细胞数的均数为若已算得某地正常成年男子红细胞数的均数为4.781012/L,标准差为标准差为0.381012/L,试估计该地试估计该地成年男子红细胞数的成年男子红细胞数的95%参考值范围。参考值范围。下限:下限:上限:上限:小小 结结 1.1.标标准准差差与与均均数数结结合合能能够够

21、完完整整地地描描述述一一个个正正态态分分布布。对对任任何何参参数数的的正正态态分分布布,都都可可以以通通过过一一个个简简单的变量变换化成标准正态分布。单的变量变换化成标准正态分布。2.2.利利用用正正态态分分布布可可以以很很容容易易地地确确定定其其数数值值出出现现在任意指定范在任意指定范围围内的概率内的概率。3.3.医学参考医学参考值值范范围围指指“正常正常参照人群参照人群”的解剖、生理、生化、免的解剖、生理、生化、免疫及疫及组织组织代代谢产谢产物的含量等各种数据的波物的含量等各种数据的波动动范范围围。主要用主要用作划分正作划分正常人与异常人的界常人与异常人的界线线。4 4.医学参考医学参考值

22、值范范围围的制定的制定需要按照一定步骤进行需要按照一定步骤进行。实际实际中最好中最好结结合正常人和病人的数据分布特点,合正常人和病人的数据分布特点,权权衡假阳性和假阴性的比例,衡假阳性和假阴性的比例,选选择择一个适当的百分范一个适当的百分范围围,最常用的百分界限是最常用的百分界限是95%95%。5.5.参考参考值值范范围围估估计计的方法有多种,其中最基本的有百分位数法和的方法有多种,其中最基本的有百分位数法和正正态态分布法。分布法。正态法的优点是结果较稳定,但对资料要求严格;正态法的优点是结果较稳定,但对资料要求严格;百百分位数法分位数法适合于任何分布类型的资料,但要求大样本。适合于任何分布类型的资料,但要求大样本。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁