《祝晓明医学统计学医统正态分布与医学参考值范围.pptx》由会员分享,可在线阅读,更多相关《祝晓明医学统计学医统正态分布与医学参考值范围.pptx(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节 正态分布卡尔弗里德里希高斯(C.F.Gauss,1777-1855)正态分布(normal distribution)又称为高斯分布。首先由德国数学家和天文学家德莫阿弗尔提出,高斯虽然发现稍晚,但他迅速将正态分布应用于天文学,并对其性质作了进一步的研究,使正态分布的应用价值广为人知。第1页/共51页例2-1某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示:4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.7
2、14.444.945.054.784.524.635.024.76第2页/共51页红细胞数频 数 频 率(%)累积频率(%)3.80 2 1.4 1.44.00 6 4.3 5.74.20 11 7.9 13.64.40 25 17.9 31.54.60 32 22.9 54.44.80 27 19.3 73.75.00 17 12.1 85.85.20 13 9.3 95.15.40 4 2.9 98.05.60 2 1.4 99.45.80 6.00 1 0.7 100.0合计 140-100.0表2-2 某地140名正常男子红细胞数的频数表第3页/共51页第4页/共51页正态分布有两个参
3、数:和 ,分别表示均数和标准差。图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图 第一节正态分布(NormalDistribution)一、正态曲线第5页/共51页二、正态分布的特征则称连续型随机变量X服从正态分布,记为XX的取值范围理论上没有边界概率分布函数概率密度函数如果随机变量X的分布服从以下函数第6页/共51页正态分布的主要特征:1.单峰分布,以为中心,左右完全对称。以X轴为渐近线,两端与X轴永不相交。2.在处有最大值,其值为;X越远离对称轴,y越小。正态曲线在处有拐点,呈现为钟型第7页/共51页3.正态分布由两个参数和决定是位置参数,决定着正态曲线在X轴上的位置是形状参数,
4、决定着正态曲线的分布形状 图3-3 三种不同均值的正态分布 图3-4 三种不同标准差的正态分布 第8页/共51页4.正态曲线下的面积分布有一定的规律图3-5图3-6问题:曲线下面积的含义?如何计算?第9页/共51页正态曲线下某一区间的面积占总面积的百分数有何意义?1.该区间的例数占总例数的百分数(频数分布)2.观察值落在该区间的概率 3.从此总体随机抽得该区间观察值的概率第10页/共51页图正态曲线面积分布示意图第11页/共51页三、标准正态分布对任何参数的正态分布,都可以通过一个简单的变量变换化成和的标准正态分布。Z变换也称随机变量的标准化变换。可以利用标准正态分布表求出与原始变量X 有关的
5、概率值。图 标准正态分布及曲线下面积 第12页/共51页概率分布函数概率密度函数正态分布标准正态分布第13页/共51页如何根据概率分布函数去求阴影部分面积?Z转换的目的?第14页/共51页第15页/共51页第16页/共51页问题:s=?=?那当和已知时z=?第17页/共51页例3-1 若X ,试计算X 取值在区间 上的概率。第18页/共51页例3-2 已知某地140名正常成年男子红细胞计数近似服从正态分布,=4.781012/L,=0.381012/L。该地正常成年男子红细胞计数在4.01012/L以下者占该地正常成年男子总数的百分比;查附表1 ,表明该地成年男子红细胞计数低于 4102/L
6、者约占该地正常成年男子总数的2.02%第19页/共51页 红细胞计数在4.01012/L5.51012/L者占该地正常成年男子总数的百分比=表明红细胞计数在4.01012/L5.51012/L者约占该地正常成年男子总数的95.04%。第20页/共51页课后习题:P25 计算题2第21页/共51页第二节 医学参考值范围 第22页/共51页一、基本概念通常指“正常人”的解剖、生理、生化、免疫及组织代谢产物的含量等数据大多数个体值的波动范围。含义:从选择的参照总体上获得的所有个体观察值,用统计方法建立百分位数界限,由此得到个体观察值的波动区间。最常用的是95%参考值范围第23页/共51页主要目的:1
7、.基于临床实践。作为划分正常人与异常人的界限。2.基于预防医学实践。例如制定儿童发育指标的等级标准。确定95%参考值范围示意图第24页/共51页二、制定医学参考值范围的注意事项1.确定同质的参照总体一般选择“正常”人,主要是排除了对研究指标有影响的疾病或有关因素的同质人群。例如在制定血清谷丙转氨酶活性正常值时,选取正常人的条件为:肝、肾、心、脑、肌肉等无器质性疾患近期无特殊用药史等检测前未做剧烈运此外同时可能需要考虑性别、年龄、民族、地理位置等因素第25页/共51页2.选择足够例数的参照样本通常情况下,确定参考值范围需要大样本,如果例数过少,确定的参考值范围往往不够准确。若接近正态分布,变异度
8、不大,样本含量可以少一些若明显偏态,变异度大,样本含量要多一些。第26页/共51页3.控制检测误差为保证原始数据可靠,检测过程中要严格控制随机误差,避免系统误差和过失误差。包括分析仪器的灵敏度、试剂的纯度、操作技术及标准的掌握等,同时必须对测量条件做出统一的规定和说明,如临床化验参考值范围的制定,应对收集样本时的环境和生理条件(温度、季节、体育活动强度、饮食、妊娠等),收集、转运和储藏样品的方法及时间有明确的规定。人员培训控制条件重复测定第27页/共51页4.选择单、双侧界值有些指标如白细胞数过高或过低均属异常(a),故其参考值范围需要分别确定下限和上限,称作双侧。有些指标如24小时尿糖含量仅
9、在过高(b)、肺活量仅在过低时为异常(c),只需确定其上限或下限,称作单侧参考值范围。(a)白细胞数参考值范围(b)24小时尿糖参考值范围(c)肺活量参考值范围第28页/共51页5.选择适当的百分数范围参考值的百分范围应根据资料的性质和研究目的选择,它与诊断阈值有确定的关系。百分范围的不同将导致不同的假阳性率和假阴性率。图3-9 正常人和病人数据分布重叠问题:确诊病人和初筛病人参考值范围定大还是定小?第29页/共51页6.选择计算参考值范围的方法正态分布法百分位数法如何选择?第30页/共51页三、医学参考值范围的计算方法百分位数法适合于任何分布类型的资料,在实际中最为常用。由于参考值范围所涉及
10、的常常是波动较大的两端数据,使用百分位数法必须要有较大的样本含量,否则结果不稳定。正态分布法要求资料服从或近似服从正态分布,优点是结果比较稳定,在样本含量不是很大的情况下仍然能够进行处理;若偏态分布资料经变量变换能转换为正态分布或近似正态分布,仍可用正态分布法。第31页/共51页Medicalreferencerange第32页/共51页例3-3已知某地140名正常成年男子红细胞计数近似服从正态分布,=4.781012/L,=0.381012/L,估计该地正常成年男子红细胞计数95%参考值范围。近似正态分布资料可按正态分布法处理,因红细胞计数值过大或过小均为异常,故应估计双侧95%参考值范围:
11、即该地正常成年男子红细胞计数的95%参考值范围为4.041012/L5.521012/L。Medicalreferencerange第33页/共51页例3-4某年某地测得100名正常成年人的血铅含量值(g/dl),试确定该地正常成年人血铅含量的95%参考值范围。根据经验已知正常成年人的血铅含量近似对数正态分布,因此首先对原始数据作对数变换,经正态性检验可知对数值服从正态分布(P0.50),故编制对数值频数表,再利用正态分布法求95%参考值范围。MedicalreferencerangeG第34页/共51页对数组段频数累计频数0.6440.7260.85110.99201.012321.1154
12、71.218651.314791.412911.55961.63991.71.81100合计100445566777778888888991010101010101010111111121313131313131313131314141415151616161616161616171717171718181818192020202021212222222324242525262626272728282930303131323232333541445051表3-2 某年某地100名正常成年人血铅含量(g/dl)对数值频数表 第35页/共51页依据表3-2,设X为对数组段的组中值,则对数值的均数和
13、标准差为:(g/dl)(g/dl)Medicalreferencerange第36页/共51页因为血铅含量仅过大异常,故参考值范围应为单侧,求单侧95%上限值:即该地正常成年人血铅含量95%参考值范围为小于39.3173g/dl。(g/dl)Medicalreferencerange第37页/共51页例3-5依据表2-4(P11)某地630名50岁60岁正常女性血清甘油三酯含量(mmol/L)的资料,估计其血清甘油三脂含量的单侧95%参考值范围,为该地5060岁女性高血脂诊断与治疗提供参考依据。资料显现出血清甘油三脂含量数值偏小的人数较多,呈正偏态分布,故选用百分位数法计算参考值范围;依据专业
14、知识,为该地5060岁女性高血脂诊断与治疗提供参考依据应计算单侧95%界值P95。Medicalreferencerange第38页/共51页(mmol/L)即该地5060岁正常女性血清甘油三脂含量的单侧95%参考值范围为小于2.098mmol/L。甘油三脂频数累积频数累积频率(%)0.1027274.30.4016919631.10.7016736357.61.009445772.51.308153885.41.604258092.11.902860896.52.201462298.72.50462699.42.80362999.83.101630100.0合计630表2-4 某地630名正
15、常女性血清甘油三酯含量(mmol/L)的频数表 第39页/共51页许多统计方法都要求资料服从正态分布或者近似正态分布,在使用这些方法之前需对资料进行正态性判定。如有充足的专业知识和经验得知某些医学指标服从正态分布,或样本含量足够大时,可不必再作正态性判定。正态性判定的方法有两类:一是图示法,二是计算法,图示法简单易行但比较粗糙,计算法检验效率较高,可利用统计软件获得计算结果。Medicalreferencerange第40页/共51页小 结 1.正态分布是许多统计分析方法的理论基础,是医学研究应用中重要的一种连续型分布。2.正态分布受到两个参数影响,总体均数 是位置参数,决定着正态曲线在横轴上
16、的位置;总体标准差 是形状参数,决定着正态曲线的分布形状。不同的 与 对应不同的正态分布,记为X 。正态曲线下的面积即为概率,利用其面积分布规律 可估计频数分布和确定医学参考值范围。第41页/共51页 4.医学参考值范围指同质总体中某医学指标大多数个体值的波动范围。计算参考值范围常用的方法有正态近似法和百分位数法,当资料服从正态分布或转换值服从正态分布,可用正态近似法;若资料不服从正态分布或未知分布类型,可用百分位数法。3.=0、=1的正态分布称作标准正态分布,即 对服从 的任意随机变量x,都可经 变换转化成标准正态分布,第42页/共51页THEEND!第43页/共51页课后习题:P27 计算题1-4P27计算题2第44页/共51页P271.正态分布及医学参考值范围的计算第45页/共51页第46页/共51页第47页/共51页返回1返回2第48页/共51页P272.偏态分布医学参考值范围的计算返回第49页/共51页满1个月时体重/kg满2个月时体重/kg满3个月时体重/kg标准体重5.16.166.98正常范围4.45.85.36.66.07.4月增加量1.02.00.71.40.51.0营养不良小于4.34小于5.24小于5.93肥胖症大于6.12大于7.39大于8.371-3个月男孩体重判断第50页/共51页感谢您的观看!第51页/共51页