《正态分布 (2).ppt》由会员分享,可在线阅读,更多相关《正态分布 (2).ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、正态分布的概念正态分布的概念正态分布的特征正态分布的特征标准正态分布标准正态分布正态曲线下的面积分布规律正态曲线下的面积分布规律正态分布的应用正态分布的应用1.制定医学参考值范围制定医学参考值范围 2.正态分布是许多统计方法的理论基础正态分布是许多统计方法的理论基础 1、定义: 若随机变量若随机变量 x 的概率密度函数可以表示为的概率密度函数可以表示为: :则称则称x服从正态分布,记为服从正态分布,记为 x N N( ( , , 2 2) ),其其中中 。 2)(21_21)(xexf,xxf(x)(1 1)正态曲线()正态曲线(normal curvenormal curve)在横轴上方均数
2、处最高。)在横轴上方均数处最高。(2 2)正态分布以均数为中心,左右对称。)正态分布以均数为中心,左右对称。(3 3)正态分布有)正态分布有2 2个参数,即均数个参数,即均数 和标准差和标准差 。 是位置是位置参数,当参数,当 固定不变时,固定不变时, 越大,曲线沿横轴越向右移动;越大,曲线沿横轴越向右移动;反之,反之, 越小,则曲线沿横轴越向左移动。越小,则曲线沿横轴越向左移动。 是形状参数是形状参数(亦称变异度参数),当(亦称变异度参数),当 固定不变时,固定不变时, 越大,曲线越越大,曲线越平阔;平阔; 越小,曲线越尖峭。通常用越小,曲线越尖峭。通常用N(N( , , 2 2) )表示均
3、数为表示均数为 ,方差为,方差为 的正态分布。的正态分布。(4 4)正态分布在)正态分布在 处各有一个拐点。处各有一个拐点。(5 5)正态曲线下面积的分布有一定规律。)正态曲线下面积的分布有一定规律。正态分布的特征(3)正态分布有正态分布有2 2个参数,即均数个参数,即均数 和标准差和标准差 。 是位置参是位置参数,当数,当 固定不变时,固定不变时, 越大,曲线沿横轴越向右移动;反之,越大,曲线沿横轴越向右移动;反之, 越小,则曲线沿横轴越向左移动。越小,则曲线沿横轴越向左移动。 是形状参数(亦称变异是形状参数(亦称变异度参数),当度参数),当 固定不变时,固定不变时, 越大,曲线越平阔;越大
4、,曲线越平阔; 越小,越小,曲线越尖峭。通常用曲线越尖峭。通常用N(N( , , 2 2) )表示均数为表示均数为 ,方差为,方差为 的正态的正态分布。分布。 不变,不变, 发生变化发生变化 不变,不变, 发生变化发生变化正态分布的特征 +凸凹凹(5 5)正态曲线下的面积分布有一定规律。(见下文)正态曲线下的面积分布有一定规律。(见下文)正态分布的特征1.1. 概念:均数为概念:均数为 0 0,方差为,方差为1 1的正态分布称为标准正态分布,的正态分布称为标准正态分布,记为记为 N ( 0, 1 )。2. 2. 概率密度函数概率密度函数: : 3.3.标准正态分布与一般正态分布的关系标准正态分
5、布与一般正态分布的关系: : 若若 x N ( , 2),对,对x进行如下变换:进行如下变换: 则可证明,则可证明,u服从标准正态分布,即服从标准正态分布,即 u N (0 ,1)。xu标准正态变换标准正态变换标准正态离差标准正态离差x N ( , 2)u N (0 ,1)标准正态变换标准正态分布(一)正态曲线下面积的计算:(一)正态曲线下面积的计算: 图图1中阴影部分(中阴影部分(- ,x)的面积称)的面积称为正态分布的分布函数,记为为正态分布的分布函数,记为 图图2中阴影部分(代表任意区间)的中阴影部分(代表任意区间)的面积,理论上可以如下计算:面积,理论上可以如下计算:xab(二)标准正
6、态曲线下的面积:(二)标准正态曲线下的面积:对于标准正态分布,其分布函数记为对于标准正态分布,其分布函数记为即标准正态曲线下(即标准正态曲线下(- , u)的面积随)的面积随u变化而变化。统变化而变化。统计学家编制了标准正态曲线下的面积分布表(见教材计学家编制了标准正态曲线下的面积分布表(见教材P245,附表附表1 标准正态曲线下的面积标准正态曲线下的面积),可以根据),可以根据u值查表得到值查表得到区间区间(- , u)的面积。)的面积。(三)一般正态曲线下的面积:(三)一般正态曲线下的面积:对于一般的正态分布对于一般的正态分布N( , 2),其曲线下(,其曲线下(- , x)区)区间的面积
7、除与间的面积除与x有关外有关外,还与还与 和和 有关。即不同的正态曲线,有关。即不同的正态曲线,由于其位置和形状不同,同一区间内的面积是不同的。由于其位置和形状不同,同一区间内的面积是不同的。但可利用标准正态变换但可利用标准正态变换 ,将,将N( , 2)转化转化为标准正态分布,再根据标准正态曲线下的面积分布表推为标准正态分布,再根据标准正态曲线下的面积分布表推算。算。(四)常用的正态曲线下面积及其对应的分位数:(四)常用的正态曲线下面积及其对应的分位数:xux = + u-+-1.645+1.645-1.96+1.96 -2.58+2.5815.866%15.866%68.27%5%5%90
8、%2.5%2.5%95%99%0.5%0.5%0-11-1.961.96-2.582.5868.27%95.00%99.00%-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%标准正态分布N(0,1)正态分布N(,2) 许多医学现象服从正态分布或近似正态分布,如同性别、同年龄的儿童的身高;同性别健康成年人的红细胞数、血红蛋白含量、胆固醇、心率等生理生化指标;医学实验中的随机误差等,一般都呈现正态或近似正态分布,故可按正态分布规律处理。 有些医学资料虽然本身呈偏态分布,但经数据变换后可成为正态或近似正态分布,如疾病的潜伏期、医院病人的住院天数等,在施加对数变换后,转
9、化成正态分布或近似正态分布,也可以按正态分布规律处理。(一)制定医学参考值范围(一)制定医学参考值范围 (二)正态分布是许多统计方法的理论基础(二)正态分布是许多统计方法的理论基础 1、医学参考值范围(、医学参考值范围(reference ranges)的概念:)的概念:指特定健康状况人群的解剖、生理、生化、免疫学指标及组织代谢产指特定健康状况人群的解剖、生理、生化、免疫学指标及组织代谢产物等数据中绝大多数个体取值的波动范围,亦称正常值范围。物等数据中绝大多数个体取值的波动范围,亦称正常值范围。2、医学参考值范围的用途:、医学参考值范围的用途:作为诊断标准,划分正常与异常的界限;作为诊断标准,
10、划分正常与异常的界限;根据传染病传染期的长短确定该病患者的隔离期限,或根据潜伏期根据传染病传染期的长短确定该病患者的隔离期限,或根据潜伏期长短确定接触者的留验期限。长短确定接触者的留验期限。制订卫生标准及有害物质的容许浓度,作为保护健康的安全界限。制订卫生标准及有害物质的容许浓度,作为保护健康的安全界限。制订不同性别、年龄儿童某项生长发育指标的等级标准。制订不同性别、年龄儿童某项生长发育指标的等级标准。在质量控制中制订各种控制限。在质量控制中制订各种控制限。单侧下限单侧下限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常单侧上限单侧上限异常异常正常正常3、确定医学参考值
11、范围的步骤和要求:、确定医学参考值范围的步骤和要求:(1) 选取一批正常人作为研究对象。选取一批正常人作为研究对象。 要保证研究对象的同质性;要保证研究对象的同质性; 样本含量必须足够大,通常要求样本含量必须足够大,通常要求n 100。(2) 测定每一个观察单位的指标取值。要求按统一规定的测量标准,严测定每一个观察单位的指标取值。要求按统一规定的测量标准,严格控制误差。格控制误差。(3) 确定分组。若该指标在不同人群的分布特征不同,如男、女性别间确定分组。若该指标在不同人群的分布特征不同,如男、女性别间有差异,应分组分别制订各人群的医学参考值范围。有差异,应分组分别制订各人群的医学参考值范围。
12、(4) 确定单、双侧。根据指标的用途确定制订双侧界限、单侧下限还是确定单、双侧。根据指标的用途确定制订双侧界限、单侧下限还是单侧上限。单侧上限。(5) 确定适当的百分界限,如确定适当的百分界限,如80%、90%、95%等。通常取等。通常取95%“正常正常”人指标值的波动范围作为医学参考值范围。人指标值的波动范围作为医学参考值范围。(6) 根据资料的分布特点,选用适当的统计方法。根据资料的分布特点,选用适当的统计方法。4、确定医学参考值范围的方法:、确定医学参考值范围的方法:(1) 正态分布法:正态分布法:适用于正态或近似正态分布的资料。适用于正态或近似正态分布的资料。 双侧界值:双侧界值: 单
13、侧上界:单侧上界: 单侧下界:单侧下界: 95 %95 %参考值范围,取参考值范围,取 u /2=1.96 , u =1.645。(2) 对数正态分布法:对数正态分布法:适用于对数正态分布资料。适用于对数正态分布资料。 (3) 百分位数法:百分位数法:用于偏态分布资料用于偏态分布资料 双侧界值:双侧界值:P2.5 和和 P97.5; 单侧上界:单侧上界: P95 ,或单侧下界:,或单侧下界: P5 。如如 t 分布分布、F 分布分布、 2 分布分布都是在正态分布的都是在正态分布的基础上推导出来的,检验也是以正态分布为基础的。基础上推导出来的,检验也是以正态分布为基础的。此外,此外,t 分布分布、二项分布二项分布、Possion分布分布的极限为正的极限为正态分布,在一定条件下,可以按正态分布原理来处态分布,在一定条件下,可以按正态分布原理来处理。理。