《平均数标准差优秀PPT.ppt》由会员分享,可在线阅读,更多相关《平均数标准差优秀PPT.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、平均数标准差平均数标准差你现在浏览的是第一页,共91页本次课内容本次课内容一、计量资料的频数分布一、计量资料的频数分布二、集中趋势指标二、集中趋势指标三、离散趋势指标三、离散趋势指标四、正态分布四、正态分布你现在浏览的是第二页,共91页计量资料计量资料(复习)(复习)统计描述统计描述(statistical description):对资料的属性、特点进行的有关叙述、显示、计对资料的属性、特点进行的有关叙述、显示、计算等,是统计推断的基础。算等,是统计推断的基础。描述必须基于资料的描述必须基于资料的分布分布(distribution)类型,主类型,主要是资料的分布特征。分布类型不同,统计指要是
2、资料的分布特征。分布类型不同,统计指标不同。标不同。你现在浏览的是第三页,共91页分布分布:数值在所研究样本(或总体)中的:数值在所研究样本(或总体)中的存在状态,通常用频数存在状态,通常用频数(frequency)来表来表示。示。频数频数:某变量值出现的次数(某现象发生:某变量值出现的次数(某现象发生的次数)。的次数)。你现在浏览的是第四页,共91页某市某市19951995年年110110名名7 7岁男童的身高岁男童的身高(cm(cm)频数表)频数表你现在浏览的是第五页,共91页 身高身高(cm)(cm)某市某市19951995年年110110名名7 7岁男童的身高分布直方图岁男童的身高分布
3、直方图你现在浏览的是第六页,共91页频数表揭示频数的两个重要特征:频数表揭示频数的两个重要特征:集中趋势集中趋势(central tendency):数值高低不数值高低不等,但中等水平的人数最多。等,但中等水平的人数最多。离散趋势离散趋势(tendency of dispersion):数值之数值之间参差不齐;逐渐变大(或变小)的人数间参差不齐;逐渐变大(或变小)的人数渐少。向两端分散。渐少。向两端分散。两方面含义:两方面含义:数值大小数值大小和和位置位置。你现在浏览的是第七页,共91页集中趋势集中趋势central tendency平均数(平均数(average):用于描述数值变量资料:用于
4、描述数值变量资料的集中趋势(平均水平)。的集中趋势(平均水平)。特点:简明概括,便于比较。特点:简明概括,便于比较。包括:算术平均数,几何平均数,中位数,百包括:算术平均数,几何平均数,中位数,百分位数分位数你现在浏览的是第八页,共91页1、算术平均数(、算术平均数(arithmetic mean)一组变量值之和除以变量值个数所得的商一组变量值之和除以变量值个数所得的商,简称均数。简称均数。总体均数总体均数,样本均数,样本均数 表示。表示。适用条件:资料成正态分布(或近似正态,适用条件:资料成正态分布(或近似正态,或对称分布)。或对称分布)。计算方法:直接法,加权法计算方法:直接法,加权法你现
5、在浏览的是第九页,共91页直接法:当样本的观察值个数不多时,将各直接法:当样本的观察值个数不多时,将各观察值观察值X1,X2,Xn相加再除以观相加再除以观察值的个数察值的个数n(样本含量)即得均数。(样本含量)即得均数。公式:公式:你现在浏览的是第十页,共91页加加权权法法weighted method当观察值个数较多时,可先将各观察当观察值个数较多时,可先将各观察值分组归纳成值分组归纳成频数表频数表,用加权法求均数。,用加权法求均数。利用频数表,计算组中值(为本组段的下利用频数表,计算组中值(为本组段的下限与相邻较大组段的下限的均值),各限与相邻较大组段的下限的均值),各组段频数与组中值的乘
6、积,近似等于该组段频数与组中值的乘积,近似等于该组变量值之和,各乘积之和除以总频数,组变量值之和,各乘积之和除以总频数,所得的商,就是均数。所得的商,就是均数。你现在浏览的是第十一页,共91页加加权权法法计计算算数均数的公式算算数均数的公式你现在浏览的是第十二页,共91页例题:计算算术均数例题:计算算术均数直接法:略直接法:略你现在浏览的是第十三页,共91页加权法加权法你现在浏览的是第十四页,共91页均数的两个重要属性:均数的两个重要属性:(1)各离均差(各观察值与均数之差)的总)各离均差(各观察值与均数之差)的总和等于零。和等于零。(2)离均差的平方和小于各个观察值)离均差的平方和小于各个观
7、察值X与任与任何数何数a()之差的平方和。之差的平方和。均数是一组观察值理想的代表值。均数是一组观察值理想的代表值。你现在浏览的是第十五页,共91页均数的应用:均数的应用:(1)只能在合理分布的基础上,对同质事)只能在合理分布的基础上,对同质事物求均数才有意义,才能反映事物的特性。物求均数才有意义,才能反映事物的特性。(2)均数最适用于对称分布,尤其是正态)均数最适用于对称分布,尤其是正态分布资料。此时,均数位于分布的中央,分布资料。此时,均数位于分布的中央,能反映观察值的集中趋势。能反映观察值的集中趋势。你现在浏览的是第十六页,共91页2、几何均数、几何均数geometric mean G将
8、将n个个观观察察值值的的乘乘积积再再开开n次次方方的的方方根根(或或各观察值对数值均值的反对数)。各观察值对数值均值的反对数)。适用条件:适用条件:(1)观观察察值值为为非非对对称称分分布布,差差距距较较大大,用用算算术术均均数数表表示示其其平平均均水水平平会会受受少少数数特特大大或或特特小值影响;小值影响;你现在浏览的是第十七页,共91页(2)数数值值按按大大小小顺顺序序排排列列后后,各各观观察察值呈倍数关系或近似倍数关系。值呈倍数关系或近似倍数关系。如:抗体滴度,药物效价等如:抗体滴度,药物效价等几何均数是算数均数的近似值。几何均数是算数均数的近似值。你现在浏览的是第十八页,共91页直接法
9、直接法:当观察例数不多时采用。当观察例数不多时采用。加权法:观察例数多时采用。加权法:观察例数多时采用。你现在浏览的是第十九页,共91页为什么滴度资料的几何均数需校正?为什么滴度资料的几何均数需校正?假设有假设有13人接种疫苗后抗体滴度为:人接种疫苗后抗体滴度为:1/20,1/20,1/40,1/40,1/40,1/80,1/80,1/80,1/80,1/80,1/80,1/160,1/320可以证明,这种取下限值的计算,会使得到可以证明,这种取下限值的计算,会使得到的几何均数偏小,即:几何均数在取反对的几何均数偏小,即:几何均数在取反对数之前偏小半个组距(在作数之前偏小半个组距(在作d倍稀释
10、时就倍稀释时就是是1/2lgd)。)。你现在浏览的是第二十页,共91页几何均数的应用几何均数的应用:(1)常用于等比级数资料,滴度,效价,)常用于等比级数资料,滴度,效价,卫生事业平均发展速度,人口几何增长,卫生事业平均发展速度,人口几何增长,对数正态分布资料;对数正态分布资料;(2)观察值不能有)观察值不能有0;(3)观察值不能同时有正值和负值。)观察值不能同时有正值和负值。(4)同一组资料求得的几何均数小于算术)同一组资料求得的几何均数小于算术均数。均数。你现在浏览的是第二十一页,共91页几何均数的计算几何均数的计算3,4,5,6,17,算数均数:算数均数:几何均数:几何均数:你现在浏览的
11、是第二十二页,共91页3、中位数(、中位数(median,M):位于中间位置上的数值。位于中间位置上的数值。把一组观察值,按大小顺序排列,位置居把一组观察值,按大小顺序排列,位置居中的变量值(奇数个)或位置居中的两中的变量值(奇数个)或位置居中的两个变量值的均值(偶数个)。是位置指个变量值的均值(偶数个)。是位置指标,以中位数为界,将观察值分为两半,标,以中位数为界,将观察值分为两半,有一半比它大,一般比它小。有一半比它大,一般比它小。你现在浏览的是第二十三页,共91页中位数适用于:中位数适用于:(1)资料偏态分布;)资料偏态分布;(2)两端无确定数值;)两端无确定数值;(3)资料分布不清楚;
12、)资料分布不清楚;潜伏期,毒物测定值等用中位数表示其集潜伏期,毒物测定值等用中位数表示其集中趋势。中趋势。你现在浏览的是第二十四页,共91页中位数的算法:未分组资料,依变量个数中位数的算法:未分组资料,依变量个数定。定。你现在浏览的是第二十五页,共91页分组资料,用下公式。分组资料,用下公式。L:L:中位数所在组的下限中位数所在组的下限W:W:中位数所在组的宽度中位数所在组的宽度f:f:中位数所在组的频数(例数)中位数所在组的频数(例数)n:n:总频数总频数C:C:中位数所在组的前一组的累计频数中位数所在组的前一组的累计频数你现在浏览的是第二十六页,共91页 中位数常用于描述中位数常用于描述偏
13、态分布资料的集中偏态分布资料的集中趋势趋势,它反映居中位置的变量值的大小。,它反映居中位置的变量值的大小。不受特大,特小值的影响,只受位置居不受特大,特小值的影响,只受位置居中的观察值的影响,因而不够敏感。中的观察值的影响,因而不够敏感。而均数,几何均数是由全部观察值综合而均数,几何均数是由全部观察值综合计算出的,敏感性好。计算出的,敏感性好。理论上,中位数等于算术均数。理论上,中位数等于算术均数。你现在浏览的是第二十七页,共91页例题:例题:中位数的计算中位数的计算 P24你现在浏览的是第二十八页,共91页4、百分位数、百分位数(percentile,P):位于某个百分位置上的数值位于某个百
14、分位置上的数值。把一组数据从小到大排列,分成把一组数据从小到大排列,分成100等份,等份,各等份含各等份含1%的观察值,处在分割界线上的观察值,处在分割界线上的数值,就是百分位数,的数值,就是百分位数,Pr 表示。表示。你现在浏览的是第二十九页,共91页百分位数将总体或样本的全部观察值百分位数将总体或样本的全部观察值分为两部分,理论上有分为两部分,理论上有r%的观察值的观察值比它小,有(比它小,有(100-r)%的观察值比它的观察值比它大。大。如含量为如含量为n的样本,的样本,P5即表示:理论上即表示:理论上有有n5%个观察值比个观察值比P5小,有小,有n95%个个观察值比观察值比P5大。大。
15、常用的百分位数:常用的百分位数:5,25,75,95 分位分位数。数。你现在浏览的是第三十页,共91页百分位数频数表法计算:百分位数频数表法计算:Pr:百分位数;百分位数;L:该百分位数所在组段的下限;该百分位数所在组段的下限;W:组距;组距;f:该百分位数所在组段的频数;该百分位数所在组段的频数;C:小于小于L的各组段的累积频数;的各组段的累积频数;n:样本数样本数中位数是特殊的百分位数。中位数是特殊的百分位数。你现在浏览的是第三十一页,共91页你现在浏览的是第三十二页,共91页图解法计算百分位数图解法计算百分位数也可用图解法也可用图解法:横轴横轴:变量值变量值;纵轴纵轴:累计百分数累计百分
16、数 p25 p25你现在浏览的是第三十三页,共91页 百分位数常用于描述一组资料在某百分百分位数常用于描述一组资料在某百分位置上的水平和分布特征。多个百分位位置上的水平和分布特征。多个百分位数结合使用,可更全面地描述总体或样数结合使用,可更全面地描述总体或样本的分布特征,包括位置大小和变异度。本的分布特征,包括位置大小和变异度。你现在浏览的是第三十四页,共91页例题:百分位数的计算,例题:百分位数的计算,P25你现在浏览的是第三十五页,共91页百分位数常用于确定医学正常值范围百分位数常用于确定医学正常值范围(normal range)。医学正常值范围,不用样本观察值的极差,医学正常值范围,不用
17、样本观察值的极差,习惯上用包括习惯上用包括95%正常人的界值,百分位正常人的界值,百分位数是数列的百分界值。数是数列的百分界值。如:白细胞数的确定,过高,过低都属如:白细胞数的确定,过高,过低都属异常,故计算异常,故计算P2.5,P97.5,为双侧的正常为双侧的正常值范围。值范围。你现在浏览的是第三十六页,共91页如:肺活量如:肺活量95%正常值范围,只有过低正常值范围,只有过低算异常,故计算算异常,故计算P5.如:尿铅如:尿铅,过高为异常,故计算过高为异常,故计算P95.你现在浏览的是第三十七页,共91页 一般地说,分布中部的百分位数相当稳一般地说,分布中部的百分位数相当稳定,具有较好代表性
18、,靠近两端的百分定,具有较好代表性,靠近两端的百分位数,只在样本含量足够大时,才稳定,位数,只在样本含量足够大时,才稳定,故样本量不够大时,不应取太近两端的故样本量不够大时,不应取太近两端的百分位数。百分位数。以上是集中趋势指标。以上是集中趋势指标。你现在浏览的是第三十八页,共91页脑筋急转弯:脑筋急转弯:请看下面数据,有问题吗?请看下面数据,有问题吗?A:8 9 10 11 12B:3 7 10 13 17 两组均数都为两组均数都为1010,但离散程度不同,但离散程度不同,B B组较组较大。大。均数只反映平均水平,不能反映离散度。均数只反映平均水平,不能反映离散度。你现在浏览的是第三十九页,
19、共91页离散趋势离散趋势tendency of dispersion全距,四分位数间距,方差,标准差,全距,四分位数间距,方差,标准差,变异系数。变异系数。全距(全距(Range):极大与极小值之差。全距大,:极大与极小值之差。全距大,资料离散程度大,但易受极端值大小的影资料离散程度大,但易受极端值大小的影响。样本量越大,抽到极端值的可能性越响。样本量越大,抽到极端值的可能性越大,全距可能会越大。大,全距可能会越大。故:全距不宜单独使用。故:全距不宜单独使用。你现在浏览的是第四十页,共91页四分位数间距(四分位数间距(quartile interval Q):将一组资料分为四等份,上四分位数将
20、一组资料分为四等份,上四分位数P75和和下四分位数下四分位数P25之差,叫四分位数间距。之差,叫四分位数间距。意义:意义:Q越大,离散程度越大,通常用于越大,离散程度越大,通常用于描述偏态分布资料的离散程度。描述偏态分布资料的离散程度。你现在浏览的是第四十一页,共91页优点:比全距稳定;若资料一端或两端优点:比全距稳定;若资料一端或两端无确切数值,只能选择无确切数值,只能选择Q作为离散指标。作为离散指标。缺点:未考虑全部观察值,不能全面反映缺点:未考虑全部观察值,不能全面反映资料离散趋势。资料离散趋势。你现在浏览的是第四十二页,共91页方差(方差(variance)和标准差和标准差(stand
21、ard deviation SD)对总体而言,为了克服极差和四分位数间距对总体而言,为了克服极差和四分位数间距的缺点,要描述资料的离散趋势,必须考虑的缺点,要描述资料的离散趋势,必须考虑到各个观察值,到各个观察值,离均差的平方和离均差的平方和是最好的是最好的指标,指标,你现在浏览的是第四十三页,共91页总体方差:总体方差:样本方差:样本方差:为了消除例数的影响,其取均值,就是方为了消除例数的影响,其取均值,就是方差。差。你现在浏览的是第四十四页,共91页标准差:方差的平方根的正值。标准差:方差的平方根的正值。总体的标准差:总体的标准差:样本的标准差:样本的标准差:自由度自由度=n-1你现在浏览
22、的是第四十五页,共91页自自由由度度:一一组数数据据中中可可以以自自由由取取值的的数数据据的个数。的个数。当当样本本数数据据的的个个数数为 n n 时,若若样本本均均值x x 确确定定后后,只只有有n n-1-1个个数数据据可可以以自自由由取取值,其中必有一个数据其中必有一个数据则不能自由取不能自由取值。你现在浏览的是第四十六页,共91页 样本本方方差差除除以以自自由由度度,从从实际应用用角角度度看看,在在抽抽样估估计中中,当当用用样本本方方差差去去估估计总体体方方差差2 2时,它它是是2 2的的无无偏偏估估计量量.你现在浏览的是第四十七页,共91页样本的标准差:样本的标准差:你现在浏览的是第
23、四十八页,共91页你现在浏览的是第四十九页,共91页xx21181392412214884989604104108161221488412214884686(合计)78996(合计)血红蛋白数据标准差的计算:血红蛋白数据标准差的计算:你现在浏览的是第五十页,共91页分组资料的标准差计算分组资料的标准差计算你现在浏览的是第五十一页,共91页方差,标准差意义:方差,标准差意义:方差,标准差越大,变异程度越大。其方差,标准差越大,变异程度越大。其值越小,观察值的离散度越小,用均数值越小,观察值的离散度越小,用均数反映平均水平的代表性越好。反映平均水平的代表性越好。你现在浏览的是第五十二页,共91页了
24、解一下:离均差平方和了解一下:离均差平方和是表示某变量总变异的一种形式,即:是表示某变量总变异的一种形式,即:你现在浏览的是第五十三页,共91页关于离均差平方和的三条规则关于离均差平方和的三条规则1、原始数据加(减)一个数,离均差平方和或积和、原始数据加(减)一个数,离均差平方和或积和不变。不变。2、原始数据除以一个数,则简化计算出的离均、原始数据除以一个数,则简化计算出的离均差平方和要乘上该数的平方。差平方和要乘上该数的平方。3、如将两变量之一除以一个数,则离均差积和要乘、如将两变量之一除以一个数,则离均差积和要乘以该数;如同时另一变量也除以一个数,则离均差以该数;如同时另一变量也除以一个数
25、,则离均差积和要同时乘上该两数。积和要同时乘上该两数。你现在浏览的是第五十四页,共91页标准差应用标准差应用(1)反映一组观察值的离散程度:)反映一组观察值的离散程度:直接比较标准差:数值单位相同直接比较标准差:数值单位相同;计算变异系数:数值单位不同计算变异系数:数值单位不同;你现在浏览的是第五十五页,共91页变异系数(变异系数(coefficient of variation,CV)也称离也称离散系数(散系数(coefficient of dispersion)标准差与均数之比用百分数表示。标准差与均数之比用百分数表示。公式:公式:你现在浏览的是第五十六页,共91页常用于比较常用于比较度量
26、单位不同或均数相差悬度量单位不同或均数相差悬殊殊的资料的变异。同时考虑了均数和的资料的变异。同时考虑了均数和标准差,更客观。标准差,更客观。比如:身高,体重的变异比较;比如:身高,体重的变异比较;你现在浏览的是第五十七页,共91页(2 2)估计变量值的频数分布)估计变量值的频数分布正态曲线,正态分布正态曲线,正态分布normal distribution正态分布标准正态分布面积(或概率)-1+1-1+168.27%1.96+1.96-1.96+1.9695.00%2.58+2.58-2.58+2.5899.00%你现在浏览的是第五十八页,共91页(3)计算标准误)计算标准误(4)估计医学正常值
27、范围:)估计医学正常值范围:双侧:均数双侧:均数 1.96倍标准差倍标准差单侧:均数单侧:均数 1.645倍标准差倍标准差你现在浏览的是第五十九页,共91页概念:概念:又称高斯分布。又称高斯分布。频数分布以均数为中心,左右两侧基本频数分布以均数为中心,左右两侧基本对称,靠近均数两侧频数较多,离均数对称,靠近均数两侧频数较多,离均数愈远,频数愈少,形成一个中间多,两愈远,频数愈少,形成一个中间多,两侧逐渐减少,基本对称的分布。是一种侧逐渐减少,基本对称的分布。是一种连续型分布。连续型分布。正态分布正态分布(normaldistribution)你现在浏览的是第六十页,共91页当样本量扩大,组段分
28、细,频数分布图中的当样本量扩大,组段分细,频数分布图中的直条变窄,表现出中间高,两侧逐渐降低,直条变窄,表现出中间高,两侧逐渐降低,并完全对称的特点;如果将各直条顶端的并完全对称的特点;如果将各直条顶端的中点连线,就接近于一条光滑的曲线,称中点连线,就接近于一条光滑的曲线,称为正态曲线。为正态曲线。用用N(,)表示,其位置与均数有关,形状与表示,其位置与均数有关,形状与标准差有关。标准差有关。你现在浏览的是第六十一页,共91页医学现象许多呈正态分布,或近似正医学现象许多呈正态分布,或近似正态分布。态分布。如:正常人的生理,生化指标变量,如:正常人的生理,生化指标变量,等。等。你现在浏览的是第六
29、十二页,共91页高斯高斯(Johann Carl Friedrich Gauss)生于生于1777年年4月月30日于不伦瑞克,卒于日于不伦瑞克,卒于1855年年2月月23日于哥廷根,德国著名数日于哥廷根,德国著名数学家、天文学家、大地测量学家、物学家、天文学家、大地测量学家、物理学家。被认为是最重要的数学家,理学家。被认为是最重要的数学家,并有数学王子的美誉。并有数学王子的美誉。你现在浏览的是第六十三页,共91页你现在浏览的是第六十四页,共91页对称分布对称分布对称分布对称分布对称分布对称分布正(右)偏分布正(右)偏分布正(右)偏分布正(右)偏分布正(右)偏分布正(右)偏分布负(左)偏分布负(
30、左)偏分布负(左)偏分布负(左)偏分布负(左)偏分布负(左)偏分布几种常见的频数分布几种常见的频数分布你现在浏览的是第六十五页,共91页正态分布之所以重要正态分布之所以重要,原因很多原因很多,三个主要的原因三个主要的原因:1.正态分布在分析上较易处理。正态分布在分析上较易处理。2.正态分布之正态分布之p.d.f.的图形为钟形曲线的图形为钟形曲线(bell-shaped curve),再加上对称性再加上对称性,使得很适合当做不少事件之机率模式。使得很适合当做不少事件之机率模式。3.正态分布可当做不少大样本的近似分布。正态分布可当做不少大样本的近似分布。概率密度函数(概率密度函数(p.d.f.,p
31、robability density function)描述)描述了随机变量的机率分布,为累积分布函数的导函数。了随机变量的机率分布,为累积分布函数的导函数。你现在浏览的是第六十六页,共91页概率密度函数(概率密度函数(p.d.f.,probability density function)对于一维实随机变量对于一维实随机变量X,任何一个满足下列条件的函数,任何一个满足下列条件的函数fX(x)都可以被定义为其概率密度函数:都可以被定义为其概率密度函数:随机变量随机变量X在区间上的概率可以由其概率密度函数的定积在区间上的概率可以由其概率密度函数的定积分表示:分表示:而而 是是X的累积分布函数,显
32、然概的累积分布函数,显然概率密度函数是它的导函数。率密度函数是它的导函数。你现在浏览的是第六十七页,共91页从直方图到正态曲线的过渡从直方图到正态曲线的过渡你现在浏览的是第六十八页,共91页正态分布的两个参数:,决定了曲线的形状和位置你现在浏览的是第六十九页,共91页你现在浏览的是第七十页,共91页正态分布的密度函数(概率密度函数正态分布的密度函数(概率密度函数 probability density function,p.d.f):):式中式中为均数;为均数;为标准差;为标准差;为圆周率;为圆周率;为自然对数的底,即为自然对数的底,即2.71828。以上均为。以上均为常数,仅常数,仅x为变量
33、。为变量。你现在浏览的是第七十一页,共91页标准正态分布标准正态分布:为了应用方便,常将式进行变量变换,为了应用方便,常将式进行变量变换,u变换变换,u变换后,变换后,=0,=1,使原来的正态分布变换为标准正态,使原来的正态分布变换为标准正态分布(分布(SND,standard normal distribution)亦称)亦称u分布。分布。你现在浏览的是第七十二页,共91页标准正态分布的概率密度函数:标准正态分布的概率密度函数:正态分布曲线的模拟正态分布曲线的模拟你现在浏览的是第七十三页,共91页正态分布的特征和分布规律:正态分布的特征和分布规律:(1)曲曲线线在在x轴轴的的上上方方,与与x
34、轴轴不不相相交交,当当x=时时,曲曲线线位于最高点。位于最高点。(2)曲线关于直线)曲线关于直线x=左右对称。左右对称。(3)正正态态分分布布有有两两个个参参数数:均均数数,标标准准差差;标标准准正正态态的的参参数数分别为分别为:0,1(4)正正态态曲曲线线在在 1,标标准准正正态态曲曲线线在在 1处处各各有有一一个个拐拐点点,(5)正态分布的面积分布有一定规律。)正态分布的面积分布有一定规律。你现在浏览的是第七十四页,共91页正态曲线下面积的分布规律正态曲线下面积的分布规律正态曲线下,正态曲线下,横轴上一定区间的面积横轴上一定区间的面积,等于该区间的频数发等于该区间的频数发生的概率生的概率。
35、面积可用积分求得。面积可用积分求得。F(x)为正态变量为正态变量X 的累计分布函数,反映正态曲线下,的累计分布函数,反映正态曲线下,自自-到到x的面积,即左侧累计面积的面积,即左侧累计面积。你现在浏览的是第七十五页,共91页你现在浏览的是第七十六页,共91页统计学家已经按(统计学家已经按(4)编成了附表,标准正态分布曲线下)编成了附表,标准正态分布曲线下的面积。应用时注意:的面积。应用时注意:(1)当总体)当总体,已知时,先计算已知时,先计算u值,再用值,再用u值查表,值查表,得出所求区间面积占总面积的比例。如果未知,常分别得出所求区间面积占总面积的比例。如果未知,常分别用样本均数和样本标准差
36、来估计。用样本均数和样本标准差来估计。(2)曲线下对称于)曲线下对称于0的区间,面积相等。如:区间(的区间,面积相等。如:区间(,-2.58)与区间()与区间(2.58,)的面积相等。)的面积相等。(3)曲线下横轴上的总面积为)曲线下横轴上的总面积为100%或为或为1。根据后两个特征,可计算右侧累计面积。根据后两个特征,可计算右侧累计面积。正态分布表的用法正态分布表的用法 P545你现在浏览的是第七十七页,共91页单侧,双侧的概念:以均数为对称轴,只考虑低于单侧,双侧的概念:以均数为对称轴,只考虑低于(或高于)某值,为单侧;若关心数值可高,可低,(或高于)某值,为单侧;若关心数值可高,可低,为
37、双侧。为双侧。你现在浏览的是第七十八页,共91页正态分布标准正态分布面积(或概率)-1_+1-1_+168.27%1.96_+1.96-1.96_+1.9695.00%2.58_+2.58-2.58_+2.5899.00%正态分布和标准正态分布曲线下面积分布规律正态分布和标准正态分布曲线下面积分布规律你现在浏览的是第七十九页,共91页标准正态曲线下任意区间的面积有规律标准正态曲线下任意区间的面积有规律你现在浏览的是第八十页,共91页(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%双侧概率双侧概率你现在浏览的是第八十一页,共91页单侧概率单侧概率你现在浏
38、览的是第八十二页,共91页正态曲线下面积的分布规律的应用:正态曲线下面积的分布规律的应用:一、确定医学参考值范围一、确定医学参考值范围意义意义:是正常人指标测定值的波动范围,可用于划是正常人指标测定值的波动范围,可用于划分正常,或异常。分正常,或异常。步骤:步骤:1、抽样、抽样 2、控制测量误差、控制测量误差 3、取单侧或双侧、取单侧或双侧 4、选定合适的百分界限、选定合适的百分界限 5、资料正态性检验、资料正态性检验 6、进行参考值估计、进行参考值估计你现在浏览的是第八十三页,共91页确定医学参考值范围常用方法:确定医学参考值范围常用方法:正态分布法正态分布法对数正态分布法对数正态分布法百分
39、位数法百分位数法你现在浏览的是第八十四页,共91页95%正常值范围的估计正常值范围的估计适用对象双侧界限单侧上界单侧下界正态分布法正态、近似正态对数正态法对数正态、近似正态百分位数法偏态你现在浏览的是第八十五页,共91页正正常常值值范范围围的的上上下下限限单侧下限单侧下限单侧上限单侧上限你现在浏览的是第八十六页,共91页双侧界限双侧界限你现在浏览的是第八十七页,共91页例:用正态分布法求血糖值例:用正态分布法求血糖值95%的参考值的参考值范围。范围。解:解:1、求样本的、求样本的均数均数4.653、标准差、标准差0.401。2、按照、按照双侧双侧95%范围,确定参考值范围范围,确定参考值范围为
40、:为:3、将样本的均数、标准差数值代入计算,、将样本的均数、标准差数值代入计算,得出范围。得出范围。你现在浏览的是第八十八页,共91页二、确定概率分布:二、确定概率分布:例:某市例:某市2000年年110名名7岁男童身高,已知均数岁男童身高,已知均数 =119.95厘米,标准差厘米,标准差S=4.72厘米,估计:该地厘米,估计:该地7岁男童岁男童身高在身高在110厘米以下者占该地厘米以下者占该地7岁男童总数的百分数。岁男童总数的百分数。按:求按:求u值,值,查表(查表(p545):找到:找到-2.1,上方找到,上方找到0.01,二者相交处为,二者相交处为0.0174,概率为,概率为0.0174=1.74%,即该地,即该地7岁男童身高在岁男童身高在110厘米以下者,估计占厘米以下者,估计占1.74%,不到,不到2%。你现在浏览的是第八十九页,共91页三、质量控制:三、质量控制:实实验验中中,常常以以 作作为为上上下下警警戒戒值,值,以以 作为上下控制值。作为上下控制值。正态分布是很多统计方法的理论基础正态分布是很多统计方法的理论基础 你现在浏览的是第九十页,共91页本次课程结束,谢谢!本次课程结束,谢谢!你现在浏览的是第九十一页,共91页