《第03章离散程度的统计描述精选文档.ppt》由会员分享,可在线阅读,更多相关《第03章离散程度的统计描述精选文档.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第03章离散程度的统计描述本讲稿第一页,共二十一页例例3.1对对甲甲乙乙两两名名高高血血压压患患者者连连续续观观察察5天天,测测得得的的收缩压收缩压(mmHg)mmHg)结果结果如下:如下:可可以以看看出出:两两患患者者收收缩缩压压的的均均数数十十分分接接近近,但但甲甲患患者者的的血血压压波波动动较较大大,而而乙乙患患者者相相对对稳稳定定。通通常常,描描述述一一组组观观察察值值,除除需需要要表表示示其其平平均均水水平平外外,还还要要说说明明它它的的离离散或变异的情况。散或变异的情况。患者患者第第1天天第第2天天第第3天天第第4天天第第5天天均数均数甲患者甲患者 1621451781421861
2、62.6乙患者乙患者 164160163159166162.4本讲稿第二页,共二十一页第一节第一节衡量变异程度的指标衡量变异程度的指标 一、间距指标一、间距指标(一)极差(一)极差(Range)Range)也也称称作作全全距距,即即观观察察值值中中最最大大值值和和最最小小值值之之差差,用用符符号号R R 表示表示。如前例甲乙两患者收缩压的极差分别为。如前例甲乙两患者收缩压的极差分别为 该该法法简单简单明了、容易使用,如用于明了、容易使用,如用于说说明明传传染病、食物中毒染病、食物中毒等的最短、最等的最短、最长长潜伏期等;缺点是潜伏期等;缺点是结结果不果不稳稳定。定。本讲稿第三页,共二十一页(二
3、)四分位数间距(二)四分位数间距(Quartile)如由上一章例如由上一章例2.4 2.4 算出,算出,5050岁岁6060岁正常女性血清甘油三岁正常女性血清甘油三脂含量的百分位数脂含量的百分位数P P7575和和P P2525的位置分别为的位置分别为63.2 63.2 mg/dlmg/dl和和135.7 135.7 mg/dlmg/dl,则则 四分位数间距主要用于衡量明显偏态分布资料的变异四分位数间距主要用于衡量明显偏态分布资料的变异程度。程度。本讲稿第四页,共二十一页二、平均差距指标二、平均差距指标(一)平均偏差(一)平均偏差(M Mean ean D Differenceifferenc
4、e)如对于例如对于例3.1:甲患者:甲患者:乙患者:乙患者:特点特点:直观直观,易理解;但由于用了绝对值,不便于数学易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。处理,实际中很少使用。本讲稿第五页,共二十一页(二)离均差平方和(二)离均差平方和(Sum of SquareSum of Square,SS)为为了了克克服服平平均均偏偏差差的的缺缺点点,可可以以不不通通过过取取绝绝对对值值,而而是是通通过过取取平平方方来来避避免免正正负负抵抵消消,即即使使用用离离均均差差平平方方和和,其计算公式为其计算公式为 SS 通常作为一个中间统计量使用。通常作为一个中间统计量使用。本讲稿第六页,
5、共二十一页(三)方差(三)方差(Variance)Variance)方差是将离均差平方和再取平均,方差是将离均差平方和再取平均,即即注意:注意:对于样本资料,分母用的是对于样本资料,分母用的是n-1-1,称为自称为自由度由度(degree of freedomdegree of freedom,dfdf )。方差的特点:便于数学上的处理,但由于有平方,方差的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。度量衡发生变化,不便于实际应用。本讲稿第七页,共二十一页(四)标准差(四)标准差(Standard Deviation)将方差取平方根,还原成与原始观察值单位相同将方差取
6、平方根,还原成与原始观察值单位相同的变异量度即为标准差:的变异量度即为标准差:例如例如对对于例于例3.13.1经计算经计算有有 甲患者:甲患者:同理乙患者同理乙患者:本讲稿第八页,共二十一页(五)变异系数五)变异系数(Coefficient of VariationCoefficient of Variation)主要用于主要用于对对均数相差均数相差较较大或大或单单位不同的几位不同的几组观组观察察值值的的变变异程度异程度进进行比行比较较。例例3.3 3.3 测测得得某某地地成成年年人人舒舒张张压压均均数数为为77.577.5mmHg,mmHg,标标准准差差 为为 10.710.7mmHgmmH
7、g;收收 缩缩 压压 均均 数数 为为 122.9122.9mmHg,mmHg,标标 准准 差差 为为17.117.1mmHgmmHg。试比较舒张压和收缩压的变异程度。试比较舒张压和收缩压的变异程度。本讲稿第九页,共二十一页正态分布有两个参数:正态分布有两个参数:和和,分别表示均数和标准差。分别表示均数和标准差。第二节第二节正态分布及应用正态分布及应用图图3-1某地成年男子红细胞数的分布逐渐接近正态分布示意图某地成年男子红细胞数的分布逐渐接近正态分布示意图一、正态分布正态分布(Normal Distribution)Normal Distribution)本讲稿第十页,共二十一页主要特征:主要
8、特征:1.以以为中心的对称分布为中心的对称分布2.钟型曲线钟型曲线3.曲线下面积分布有规律曲线下面积分布有规律4.两个参数决定位置和变异两个参数决定位置和变异 图图3-23-2正态分布曲线下的面积正态分布曲线下的面积 图图3-3 3-3 三种不同均值的正态分布三种不同均值的正态分布 图图3-4 3-4 三种不同标准差的正态分布三种不同标准差的正态分布 本讲稿第十一页,共二十一页二、标准正态分布二、标准正态分布(Standard Normal Distribution)Standard Normal Distribution)对对任何参数的正任何参数的正态态分布,都可以通分布,都可以通过过一个一
9、个简单简单的的变变量量变变换换 化成化成 和和 的的标标准正准正态态分布分布。通常,。通常,可以可以利用利用标标准正准正态态分布表求出与原始分布表求出与原始变变量量X X 有关的概率有关的概率值值。图图3-5标准正态分布及曲线下面积标准正态分布及曲线下面积 参见书中计算实例参见书中计算实例本讲稿第十二页,共二十一页一、基本概念一、基本概念 通常指正常人的解剖、生理、生化、免疫及组织代谢产通常指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。主要目的:用于临床疾病物的含量等各种数据的波动范围。主要目的:用于临床疾病诊断。最常用的是诊断。最常用的是95%95%参考值范围。参
10、考值范围。第三节第三节 医学参考值范围医学参考值范围 (Reference Value Range)Reference Value Range)确定确定95%95%参考值范围示意图参考值范围示意图本讲稿第十三页,共二十一页 二、医学参考值范围的制定方法二、医学参考值范围的制定方法 (一)选择一定数量的参照样本一)选择一定数量的参照样本 选择参照样本必须要考虑可能影响所要制定参考值选择参照样本必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。范围指标的各种疾病及干扰因素,将这些人排除在外。例如在制定血清谷丙转氨酶活性正常值时,选取正例如在制定血清谷丙转氨酶活性正常值
11、时,选取正常人的条件为肝、肾、心、脑、肌肉等无器质性疾患,常人的条件为肝、肾、心、脑、肌肉等无器质性疾患,近期无特殊用药史等。同时可能需要考虑性别、年龄、近期无特殊用药史等。同时可能需要考虑性别、年龄、民族、地理位置等因素。样本含量一般要较大,如民族、地理位置等因素。样本含量一般要较大,如n120120。本讲稿第十四页,共二十一页(二)(二)对选定的参照样本进行准确的测定对选定的参照样本进行准确的测定 为为保保证证原原始始数数据据可可靠靠,要要严严格格控控制制检检测测误误差差,包包括括分分析析仪仪器器的的灵灵敏敏度度、试试剂剂的的纯纯度度、操操作作技技术术及及标标准准的的掌掌握握等等,同同时时
12、必必须须对对测测量量条条件件做做出出统统一一的的规规定定和和说说明明,如如临临床床化化验验参参考考值值范范围围的的制制定定,应应对对收收集集样样本本时时的的环环境境和和生生理理条条件件(温温度度、季季节节、体体育育活活动动强强度度、饮饮食食、妊妊娠娠等等),收收集集、转转运运和和储储藏藏样样品品的的方方法法及及时时间间有明确的规定。有明确的规定。本讲稿第十五页,共二十一页(三)(三)决定取决定取单侧单侧范范围还围还是双是双侧侧范范围值围值 有有些些指指标标如如白白细细胞胞数数过过高高或或过过低低均均属属异异常常(a)a),故故其其参参考考值值范范围围需需要要分分别别确确定定下下限限和和上上限限
13、,称称作作双双侧侧。有有些些指指标标如如2424小小时时尿尿糖糖含含量量仅仅在在过过高高(b)b)、肺肺活活量量仅仅在在过过低低时时为为异异常常(c)c),只只需需确确定定其其上上限限或或下下限限,称称作作单单侧侧参参考考值范围。值范围。(a)a)白细胞数参考值范围白细胞数参考值范围(b)24b)24小时尿糖参考值范围小时尿糖参考值范围(c)c)肺活量参考值范围肺活量参考值范围本讲稿第十六页,共二十一页(四)(四)选择选择适当的百分范适当的百分范围围 参考参考值值的百分的百分范范围围应根据应根据资资料的性料的性质质和研究目的和研究目的选选择,它与诊断阈值有确定的关系。百分择,它与诊断阈值有确定
14、的关系。百分范范围围的不同将的不同将导致不同的假阳性率和假阴性率。导致不同的假阳性率和假阴性率。图图3-6 3-6 正常人和病人数据分布重叠正常人和病人数据分布重叠本讲稿第十七页,共二十一页(五)(五)估估计计参考参考值值范范围围的界限的界限 参考参考值值范范围围估估计计主要主要有百分位数法和正有百分位数法和正态态分布法。分布法。百分范围(百分范围(%)单单 侧侧 双双 侧侧 下限下限 上限上限 下限下限 上限上限 95 95 P5 5 P9595 P2.52.5 P97.597.5 99 99 P1 1 P9999 P0.50.5 P99.599.5百分范围(百分范围(%)单单 侧侧 双双
15、侧侧 下限下限 上限上限 下限下限 上限上限 95 95 99 99 表表3-2 3-2 参考值范围所对应的百分位数参考值范围所对应的百分位数表表3-3 3-3 参考值范围所对应的正态分布区间参考值范围所对应的正态分布区间 本讲稿第十八页,共二十一页 例例3.4 3.4 若已算得某地正常成年男子红细胞数的均数为若已算得某地正常成年男子红细胞数的均数为4.78104.78101212/L,L,标准差为标准差为0.38100.38101212/L,L,试估计该地成年男子红细试估计该地成年男子红细胞数的胞数的95%95%参考值范围。参考值范围。例例3.5 3.5 见第二章表见第二章表2-42-4资料
16、。资料。为该为该地区地区5050岁岁6060岁岁女性高女性高血脂血脂诊诊断与治断与治疗疗提供参考依据,提供参考依据,试估计血清甘油三脂含量的试估计血清甘油三脂含量的95%95%单侧参考值范围。单侧参考值范围。下限:下限:上限:上限:即即95%95%单侧参考值范围为小于单侧参考值范围为小于2.0982.098mmol/Lmmol/L。本讲稿第十九页,共二十一页 小小结结 1.1.描描述述一一组组观观察察值值,除除需需要要表表示示其其平平均均水水平平外外,还还要要说明它的离散或变异的情况。说明它的离散或变异的情况。2.2.衡衡量量变变异异程程度度大大小小的的指指标标有有多多种种:极极差差、四四分分
17、位位数数间间距距、方方差差、标标准准差差和和变变异异系系数数。其其中中应应用用最最多多的是标准差和变异系数。的是标准差和变异系数。3.3.标标准准差差与与均均数数结结合合能能够够完完整整地地描描述述一一个个正正态态分分布布。对对任任何何参参数数的的正正态态分分布布,都都可可以以通通过过一一个个简简单单的的变变量量变变换换化化成成标标准准正正态态分分布布。利利用用正正态态分分布布可可以以很很容容易易地地确确定其数定其数值值出出现现在任意指定范在任意指定范围围内的概率内的概率。本讲稿第二十页,共二十一页 4.4.医学参考医学参考值值范范围围指指“正常正常参照人群参照人群”的解剖、生理、生化、免疫的
18、解剖、生理、生化、免疫及及组织组织代代谢产谢产物的含量等各种数据的波物的含量等各种数据的波动动范范围围。主要用主要用作划分正常作划分正常人与异常人的界人与异常人的界线线。5 5.医学参考医学参考值值范范围围的制定的制定需要按照一定步骤进行需要按照一定步骤进行。实际实际中最中最好好结结合正常人和病人的数据分布特点,合正常人和病人的数据分布特点,权权衡假阳性和假阴性的比衡假阳性和假阴性的比例,例,选择选择一个适当的百分范一个适当的百分范围围,最常用的百分界限是最常用的百分界限是95%95%。6.6.参考参考值值范范围围估估计计的方法有多种,其中最基本的有百分位数法的方法有多种,其中最基本的有百分位数法和正和正态态分布法。分布法。正态法的优点是结果较稳定,但对资料要求严格;正态法的优点是结果较稳定,但对资料要求严格;百百分位数法分位数法适合于任何分布类型的资料,但要求大样本。适合于任何分布类型的资料,但要求大样本。本讲稿第二十一页,共二十一页