《最新卫生统计学-潘海燕 卫统4 定量资料的统计描述PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新卫生统计学-潘海燕 卫统4 定量资料的统计描述PPT课件.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热怎么这么热”,于是三,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑五成群,聚在大树下,或站着
2、,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑强子,别跑了,快来我给你扇扇了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你你看热的,跑什么?看热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在我国
3、已有三千年多年的历史。取材的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过
4、了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅道,袅定量资料2【例【例4-1】2006年某市120名10岁男孩的身高(cm)资料如下。135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2
5、139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6
6、 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5 定量资料3定量资料4定量资料5定量资料6定量资料7定量资料8定量资料93. 确定组段确定组段 即确定每一组的起点(下限)和终点(上限)即确定每一组的
7、起点(下限)和终点(上限) 。 起点称为下限起点称为下限(lower limit)终点称为上限终点称为上限(upper limit) 上限上限= =下限下限+ +组距组距 频数表和频数图频数表和频数图 定量资料104. 归组计数,整理成表归组计数,整理成表 确定组段界限后,采用计算机或用划记法将确定组段界限后,采用计算机或用划记法将各原始数据归入各组汇总,得出各组段的观各原始数据归入各组汇总,得出各组段的观察例数,也就是频数察例数,也就是频数 。 频数表和频数图频数表和频数图 定量资料11表表4-1 2006年某市年某市120名名10岁男孩身高(岁男孩身高(cm)的频数表)的频数表身高身高(1
8、)频数频数(2)频率(频率(%)(3)累计频数累计频数(4)累计频率(累计频率(%)(5)130132134136138140142144146148150152154156 1 3 4 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.78.35.02.50.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.713.323.337.555.071.783.391.796.799.2100.0合计合计 120 100.0 频数表和频数图频数表和频数图 定量资料12 频数表的用途频数表的用途
9、揭示资料的频数分布特征和频数分布类型揭示资料的频数分布特征和频数分布类型 频数分布的特征:频数分布的特征: 集中趋势(集中趋势(central tendency) 离散趋势(离散趋势(dispersion) 频数分布的类型:频数分布的类型: 对称分布对称分布 偏态分布偏态分布 频数表和频数图频数表和频数图 定量资料13肌红蛋白47.545.042.540.037.535.032.530.027.525.022.520.017.515.012.510.07.55.02.50.0人数121086420Std. Dev = 10.75 Mean = 27.1N = 91.00血清总胆固醇(mmol/
10、L)5.755.505.255.004.754.504.254.003.753.503.253.002.752.502.2520100抗体滴度1250.01000.0750.0500.0250.00.03020100频 数频 数频 数图图1 1011 101名正常女子血清总胆固醇的频数分布名正常女子血清总胆固醇的频数分布图2 69例RA患者血清EBV-VCA-IgG 抗体滴度的频数分布图3 101名正常人血清肌红蛋白的频数分布血清肌红蛋白(g/ml)正(右)偏态正(右)偏态负(左)偏态负(左)偏态对称分布对称分布定量资料142.便于进一步计算指标和统计处理便于进一步计算指标和统计处理 可利用频
11、数表计算百分位数、中位数、标准差等可利用频数表计算百分位数、中位数、标准差等 频数表和频数图频数表和频数图 3. 便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。定量资料15 频数图(频数图(graph of frequency)是以变量值为横)是以变量值为横坐标、频数(频率)为纵坐标(不等距分组时以坐标、频数(频率)为纵坐标(不等距分组时以频率频率/组距组距=频率密度为纵坐标),以每个等宽的频率密度为纵坐标),以每个等宽的距形面积表示每组的频数(或频率)。距形面积表示每组的频数(或频率)。 频数表和频数图频数表和频数图 频数图频数图定量资料16连续型定量资料:频数图中各距形是
12、相连续型定量资料:频数图中各距形是相连的,又称连的,又称直方图直方图(histogram););离散型定量资料:频数图中各距形是间离散型定量资料:频数图中各距形是间隔的,又称隔的,又称直条图直条图(bar graph)。)。 频数表和频数图频数表和频数图 定量资料17图4-1 2006年某市120名10岁男孩身高的频数图 频数表和频数图频数表和频数图 定量资料18第二节第二节 集中趋势的描述集中趋势的描述定量资料19定量资料集中趋势的描述,常用平均数(定量资料集中趋势的描述,常用平均数(average)表达一组同质定量数据的平均水平或集中位置。表达一组同质定量数据的平均水平或集中位置。 集中趋
13、势的描述集中趋势的描述 算术均数算术均数 几何均数几何均数 中位数中位数 众数众数 调和均数调和均数定量资料20u又称均数(又称均数(mean),是用一组观察值相),是用一组观察值相加除以观察值的个数所得。样本均数用加除以观察值的个数所得。样本均数用 ,总体均数用,总体均数用 。 算术均数(算术均数(arithmetic mean) x 集中趋势的描述集中趋势的描述 定量资料211. 计算方法计算方法直接法:样本含量较少直接法:样本含量较少 加权法:相同观察值较多或频数表资料加权法:相同观察值较多或频数表资料12nxxxxxnn1 12212iikkkif xf xf xf xxffff 集中
14、趋势的描述集中趋势的描述 定量资料22【例【例4-2】 某医生测量了某医生测量了10名脑出血患者的血尿素氮(名脑出血患者的血尿素氮(mmol/L)分别是:分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试,试计算该组数据的均数。计算该组数据的均数。 集中趋势的描述集中趋势的描述 )/(3 . 7106 . 69 . 67 . 64 . 7Lmmolnxx定量资料23ifiif x【例【例4-3】根据表】根据表4-1资料,用加权法求120名10岁男孩身高的均数。身高(1)频数fi(2)组中值xi(3)fixi(4)130132134136138140142
15、144146148150152154156 1 3 48121721201410 6 3 1131133135137139141143145147149151153155 131 399 5401096166823973003290020581490906459155合计120( )17202( )表表4-2 2006年某市年某市120名名10岁男孩身高(岁男孩身高(cm)的均数计算表)的均数计算表 集中趋势的描述集中趋势的描述 定量资料24121 131 3 133 4 1351 155 17202143.35 cm120i iikf xxffff 2. 应用应用 均数适用于均数适用于对称分
16、布对称分布特别是特别是正态分布正态分布资料。资料。 集中趋势的描述集中趋势的描述 定量资料25u是是n个观察值乘积的个观察值乘积的n次方根,又称倍数次方根,又称倍数均数,用均数,用G表示表示 。 几何均数(几何均数(geometric mean) 集中趋势的描述集中趋势的描述 定量资料261. 计算方法计算方法直接法:样本含量较少直接法:样本含量较少 加权法:相同观察值较多或频数表资料加权法:相同观察值较多或频数表资料 集中趋势的描述集中趋势的描述 1112lglglglglg ()lg ()nxxxxGnn11112212lglglglglg (lg ()iikkkifxfxfxfxGfff
17、f定量资料27 【例【例4-4】 某实验室测得某实验室测得7人血清中某种抗体的人血清中某种抗体的滴度分别为滴度分别为1/4,1/8,1/16,1/32,1/64,1/128,1/256,试求平均滴度。试求平均滴度。 集中趋势的描述集中趋势的描述 111lg4 lg8lg25610.5361lg () lg () lg 1.5052 3277G 定量资料28 集中趋势的描述集中趋势的描述 ifixlgixlgiifxiflgiifx【例【例4-6】50名麻疹易感儿接种麻疹疫苗后,测得血凝名麻疹易感儿接种麻疹疫苗后,测得血凝抑制抗体滴度资料见表抑制抗体滴度资料见表4-3,求抗体的平均滴度。,求抗体
18、的平均滴度。86.9977抗体滴度抗体滴度(1)频数频数 (2)滴度倒数滴度倒数(3)(4)(5)1/41/8 1/16 1/32 1/64 1/128 1/2561361013107 4 8 16 32 641282560.60210.90311.20411.50511.80622.10722.4082 0.6021 2.7093 7.224615.505123.480621.072016.8574合计合计50表表4-3 50名麻疹易感儿血凝抑制抗体滴度名麻疹易感儿血凝抑制抗体滴度定量资料29 集中趋势的描述集中趋势的描述 1111 lg43 lg87lg25686.9977lg (lg (
19、)lg 1.73995413750G 50名麻疹易感儿接种麻疹疫苗后血凝抑制抗体的平均滴度为1/54。 定量资料302. 应用及注意事项应用及注意事项几何均数适用几何均数适用 对数正态分布对数正态分布 等比级数资料等比级数资料观察值中不能有观察值中不能有0 实验设计的基本要素实验设计的基本要素 定量资料31 中位数与百分位数中位数与百分位数 集中趋势的描述集中趋势的描述 【例【例4-7】200名食物中毒患者潜伏期资料如表名食物中毒患者潜伏期资料如表4-4, 研究人员据此采用加权法计算均数得平均潜伏期研究人员据此采用加权法计算均数得平均潜伏期 为为27小时。小时。 (1)该组数据在分布上有何特点
20、?该组数据在分布上有何特点? (2)用均数描述该资料的平均水平是否用均数描述该资料的平均水平是否合适?合适? 定量资料32 集中趋势的描述集中趋势的描述 表表4-4 200名食物中毒患者的潜伏期名食物中毒患者的潜伏期潜伏期(小时)潜伏期(小时)(1)频数频数(2)累计频数累计频数(3)累计频率(累计频率(%)(4)=(3)/n030 3015.0127110150.5244914974.5362817889.0481419296.060 719999.57284 1200 100.0合计合计 200定量资料33u中位数(中位数(median):):将一组观察值由小将一组观察值由小到大排序后,居
21、于中间位置的数值即为中到大排序后,居于中间位置的数值即为中位数位数 ,用,用 表示。表示。M 中位数是一种位置平均数,它将全部数据排列中位数是一种位置平均数,它将全部数据排列成的有序数列平均分为两部分,小于和大于中成的有序数列平均分为两部分,小于和大于中位数的观察值个数相等,各占位数的观察值个数相等,各占50%。 集中趋势的描述集中趋势的描述 定量资料341. 中位数的计算中位数的计算(1)直接法:观察值个数较少)直接法:观察值个数较少 集中趋势的描述集中趋势的描述 (1)2nMx1221()2nnMxx定量资料35 【例【例4-8】某实验师对】某实验师对10只小白鼠染毒后观察各小鼠的生只小白
22、鼠染毒后观察各小鼠的生存时间(分钟),得数据为:存时间(分钟),得数据为:35,60,62,63,63,65,66,68,69,69,试计算小白鼠的平均生存时间。,试计算小白鼠的平均生存时间。 集中趋势的描述集中趋势的描述 61265nxx12211()(6365)6422nnMxx6352 xxn定量资料36(2)频数表法)频数表法 :频数表资料:频数表资料LM 中位数所在组段下限中位数所在组段下限 Mf Lfi组距组距 中位数所在组段的频数中位数所在组段的频数 中位数所在组段前一组的累计频数中位数所在组段前一组的累计频数)2(LMMfnfiLM定量资料37 集中趋势的描述集中趋势的描述 求
23、:下表求:下表200名食物中毒患者的平均潜伏期名食物中毒患者的平均潜伏期潜伏期(小时)潜伏期(小时)(1)频数频数(2)累计频数累计频数(3)累计频率(累计频率(%)(4)=(3)/n030 3015.0127110150.5244914974.5362817889.0481419296.060 719999.57284 1200 100.0合计合计 200定量资料38 集中趋势的描述集中趋势的描述 (小时) 8 .23)302200(711212)2(LMMfnfiLM定量资料39u百分位数(百分位数(percentile):):是指将一组观是指将一组观察值由小到大排序后,将其平均分成察值由
24、小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称等份,对应于每一分割位置上的数值就称为一个百分位数,用为一个百分位数,用 表示表示 。 集中趋势的描述集中趋势的描述 xP定量资料40 是一种位置指标,一个百分位数将一组观是一种位置指标,一个百分位数将一组观察值分为两部分,理论上有察值分为两部分,理论上有x%的观察值比它小,的观察值比它小,有(有(100-x)%的观察值比它大。的观察值比它大。 集中趋势的描述集中趋势的描述 xP(%)xLxiPLn xff定量资料41【例【例4-10】根据表】根据表4-4,计算,计算P25、P75。 集中趋势的描述集中趋势的描述 38.15)
25、30%25200(711212)%(25LxfxnfiLP0 .36)150%75200(281236)%(75LxfxnfiLP定量资料422. 中位数与百分位数的应用中位数与百分位数的应用中中 位位 数:数: 偏态分布资料偏态分布资料 一端或两端无确切值一端或两端无确切值 总体分布不明总体分布不明百分位数:百分位数:非正态分布资料非正态分布资料 集中趋势的描述集中趋势的描述 定量资料43第三节第三节 离散趋势的描述离散趋势的描述 定量资料44 【例【例4-11】分别观察两组各分别观察两组各9只动物的每日进只动物的每日进食量(食量(mg/g),结果如下:),结果如下: A组组 24 25 2
26、6 27 28 29 30 31 32 B组组 20 21 22 23 24 25 26 27 64两组动物每日进食量的平均数,均为两组动物每日进食量的平均数,均为28mg/g。 定量资料45离散趋势是频数分布的另一特征,反映离散趋势是频数分布的另一特征,反映了观察值之间的变异情况,只有将了观察值之间的变异情况,只有将集中集中趋势趋势与与离散趋势离散趋势结合起来描述才能全面结合起来描述才能全面反映定量资料的数量特征。反映定量资料的数量特征。 定量资料46描述离散描述离散趋势指标趋势指标 极差极差 四分位间距四分位间距 标准差标准差 变异系数变异系数定量资料47极差(极差(range,R):亦称
27、全距,是一组同质观):亦称全距,是一组同质观察值中最大值(察值中最大值( )与最小值()与最小值( )之差。)之差。 极极 差差 概念概念maxxminxmaxmin Rxx定量资料48只考虑最大值与最小值之差异,不能只考虑最大值与最小值之差异,不能 反映组内其它观察值的变异度反映组内其它观察值的变异度样本含量越大,极差可能越大样本含量越大,极差可能越大 极极 差差 不足之处不足之处定量资料49四分位数间距(四分位数间距(inter-quartile range,Q):):为上四分位数为上四分位数QU(即(即P75)与下四分位数)与下四分位数QL (即(即P25)之差。)之差。 四分位数间距四
28、分位数间距 概念概念 ULQQQ定量资料50 【例【例4-12】根据例】根据例4-7资料,计算四分位数间距。资料,计算四分位数间距。 小时小时 小时小时 四分位数间距:四分位数间距: (小时)(小时) 38.1525 PQL00.3675 PQU62.20LUQQQ定量资料51每个观察值每个观察值x与与 间的变异称为离均差间的变异称为离均差由于由于变异程度用离均差平方和反应变异程度用离均差平方和反应 方方 差差 0 x2x考虑观察值个数考虑观察值个数N N的影响的影响 22()xN定量资料52在实际工作中在实际工作中 方方 差差 22()1xxSnn-1称为自由度称为自由度( degree o
29、f freedom)方差适用:方差适用:描述对称分布特别是正态分布资料的离散程度。描述对称分布特别是正态分布资料的离散程度。 定量资料53方差的度量单位是原度量单位的平方方差的度量单位是原度量单位的平方 方差开方后即与原数据的度量单位相同,这就是方差开方后即与原数据的度量单位相同,这就是标准差标准差(standard deviation) 标准差标准差 2()xN定量资料54在实际工作中在实际工作中 n-1称为自由度称为自由度( degree of freedom)标准差适用:标准差适用:描述对称分布特别是正态分布资料的离散程度。描述对称分布特别是正态分布资料的离散程度。 2()1xxSn 标
30、准差标准差 定量资料55数学上可以证明 222()()xxxSSlxxxn22()1xxnSn22()1iiiiiif xf xfSf 标准差标准差 定量资料56【例【例4-13】 某医生测量了某医生测量了10名脑出血患者的血尿素氮名脑出血患者的血尿素氮(mmol/L)分别是:)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的标准差。,试计算该组数据的标准差。2222222()(7.46.76.96.6 ) (7.4 6.7 6.96.6) /100.61(mmol/L)110 1xxnSn 标准差标准差 定量资料57身高身高(1)频数频
31、数(2)频率(频率(%)(3)累计频数累计频数(4)累计频率(累计频率(%)(5)130132134136138140142144146148150152154156 1 3 4 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.78.35.02.50.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.713.323.337.555.071.783.391.796.799.2100.0合计合计 120 100.0【例【例4-14】根据下表资料,计算】根据下表资料,计算120名名10岁男孩身高
32、的标准差。岁男孩身高的标准差。 标准差标准差 定量资料58222()(17202)24686321204.79(cm)1120 1iiiiiif xf xfSf 标准差标准差 定量资料59 【例【例4-15】某医院预防保健科,对一组】某医院预防保健科,对一组5岁男孩进岁男孩进行体检,测量身高、体重等指标。得身高均数与行体检,测量身高、体重等指标。得身高均数与标准差为标准差为115.8 cm和和4.5 cm,体重均数与标准差为,体重均数与标准差为20.2kg和和0.56 kg,得出结论:身高的变异程度比,得出结论:身高的变异程度比体重大。体重大。 变异系数变异系数 上述结论是否正确?上述结论是否
33、正确? 定量资料60变异系数(变异系数(coefficient of variation,简记为简记为CV):):是一组观察值的标准差与其均数的比值,是一组观察值的标准差与其均数的比值, 概念概念 变异系数变异系数 100%SCVx 度量衡单位不同的资料度量衡单位不同的资料 单位相同但均数相差悬殊的两组或多组资料单位相同但均数相差悬殊的两组或多组资料 适用于适用于定量资料61 变异系数变异系数 根据例根据例4-15资料分别计算身高与体重的变异系数。资料分别计算身高与体重的变异系数。身高:身高:4.5100%100%3.89%115.8SCVx体重:体重: 0.56100%100%2.77%20
34、.2SCVx定量资料62描述数值变量资料集中趋势的指标描述数值变量资料集中趋势的指标定量资料63描述数值变量资料离散趋势的指标描述数值变量资料离散趋势的指标定量资料64第四节第四节 正态分布及其应用正态分布及其应用定量资料65 正态分布的概念与特征正态分布的概念与特征 图图4-1 120名名10岁男孩身高资料的频数图岁男孩身高资料的频数图 定量资料66 正态分布的概念与特征正态分布的概念与特征 定量资料67正态分布(正态分布(normal distribution)称为高斯分)称为高斯分布(布(Gauss distribution),如果连续型随机),如果连续型随机变量变量X的概率密度函数为:
35、的概率密度函数为: 概念概念 正态分布的概念与特征正态分布的概念与特征 则称随机变量则称随机变量X服从参数为服从参数为 和和 的正态分布,的正态分布,记作:记作: 22()21( )2xf xex ,XN 定量资料68正态曲线(正态曲线(normal curve)在横轴上方均数)在横轴上方均数处最高;并以均数为中心,左右对称;两端处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。与横轴永不相交,呈钟形的曲线。 正态分布特征正态分布特征 正态分布的概念与特征正态分布的概念与特征 正态曲线正态曲线定量资料69正态分布有两个参数,即位置参数正态分布有两个参数,即位置参数 和形状和形
36、状参数参数 正态分布的概念与特征正态分布的概念与特征 -6-5-4-3-2-10123456321123位置参数定量资料70-3-2-10123332121形态参数 正态分布的概念与特征正态分布的概念与特征 定量资料71 正态分布的概念与特征正态分布的概念与特征 正态曲线下面积的分布有一定的规律。正态曲线下面积的分布有一定的规律。 正态曲线与横轴之间的面积恒等于正态曲线与横轴之间的面积恒等于1或或100%;对称分布,对称轴两侧的面积各为对称分布,对称轴两侧的面积各为50;在在 区间的面积为区间的面积为68.27 在在 区间的面积为区间的面积为95.00 在在 区间的面积为区间的面积为99.00
37、 ,1.96 ,1.96 2.58 ,2.58 定量资料72 正态分布的概念与特征正态分布的概念与特征 -2.58 -1.96 - + +1.96 +2.58 68.27% 95.00% 99.00% -3-2-10123定量资料73思考:能否编制正态曲线下面积的分布表,然思考:能否编制正态曲线下面积的分布表,然 后通过查表来确定某区间对应的面积呢?后通过查表来确定某区间对应的面积呢? 标准正态分布标准正态分布 统计学家发现,可以使所有的正态分布转化为统统计学家发现,可以使所有的正态分布转化为统一的一的 的正态分布,该正态分布称为的正态分布,该正态分布称为标准正态分布标准正态分布(standa
38、rd normal distribution)。)。 01定量资料74 标准正态分布标准正态分布 这种变换称为标准化变换或这种变换称为标准化变换或Z变换。若变换。若X服从正服从正态分布态分布 ,则,则Z就服从就服从 。 ,N 0,1NXZ01定量资料75标准正态分布曲线下面积分布规律定量资料76 【例【例4-18】 已知某地已知某地2003年年18岁男大学生身高的岁男大学生身高的均数均数 cm,标准差,标准差 cm,且,且18岁岁男大学生的身高服从正态分布。问该地男大学生的身高服从正态分布。问该地18岁男大岁男大学生中身高在学生中身高在166.8 cm及其以下者占多大的比例?及其以下者占多大的
39、比例? 标准正态分布标准正态分布 173.503.42先将先将x转换为转换为z ()/(166.8 173.5)/3.421.96zx 查附表查附表3 3 表的左侧找表的左侧找-1.9,表的上方找,表的上方找0.06,相交处为,相交处为0.025 定量资料77 【例【例4-19】某地】某地2003年抽样调查了年抽样调查了100名名18岁男大学岁男大学生身高,算得均数为生身高,算得均数为172.70cm,标准差为,标准差为4.01cm。 正态分布的应用正态分布的应用 估计正态分布资料的频数分布估计正态分布资料的频数分布 【问题】【问题】该地该地18岁男大学生中身高在岁男大学生中身高在162.35
40、cm183.05cm范范围内者所占的比例是多少?围内者所占的比例是多少?定量资料78查附表查附表3, 左侧的面积为左侧的面积为0.005,由正态分布曲,由正态分布曲线的对称性可知,线的对称性可知, 右侧的面积也为右侧的面积也为0.005,又,又由正态分布曲线下的总面积为由正态分布曲线下的总面积为1,可得,可得-2.58与与2.58之间之间的面积为的面积为1-20.005=0.99=99% 。11()/(162.35 172.0)/4.012.58zxxS 22()/(183.05 172.7)/4.012.58zxxS58. 22Z58. 21Z定量资料79 正态分布的应用正态分布的应用 制定
41、医学参考值范围制定医学参考值范围 医学参考值范围:亦称正常值范围,指绝大多医学参考值范围:亦称正常值范围,指绝大多数数“正常人正常人”的解剖、生理、生化等指标的波的解剖、生理、生化等指标的波动范围。动范围。 所谓所谓“正常人正常人”不是指绝对的不是指绝对的“健康人健康人”,而,而是指排除了影响所研究指标的疾病和有关因素是指排除了影响所研究指标的疾病和有关因素的同质人群。的同质人群。定量资料80 正态分布的应用正态分布的应用 制定医学参考值范围的注意事项制定医学参考值范围的注意事项要确定一批样本含量足够大的要确定一批样本含量足够大的“正常人正常人”根据研究目的和使用要求选定适当的百分界值根据研究
42、目的和使用要求选定适当的百分界值根据专业知识确定单侧或双侧界值根据专业知识确定单侧或双侧界值根据资料的分布选用恰当的计算方法根据资料的分布选用恰当的计算方法 定量资料81 正态分布的应用正态分布的应用 制定医学参考值范围常用方法制定医学参考值范围常用方法正态分布法:适用于正态或近似正态分布的资料正态分布法:适用于正态或近似正态分布的资料 /2xzSxz Sxz S双侧界值 单侧界值 定量资料82表表4-6 常用常用z值表值表参考值范围(%)单侧双侧800.8421.282901.2821.645951.6451.960992.3262.576定量资料83【例【例4-19】某地某地2003年抽样
43、调查了年抽样调查了100名名18岁男岁男大学生身高(大学生身高(cm),算得均数为),算得均数为172.70cm,标准,标准差为差为4.01cm。 【例【例4-20】利用例利用例4-19资料估计该地资料估计该地18岁男大学岁男大学生身高的生身高的95参考值范围。参考值范围。定量资料84身高服从正态分布,其参考值范围应为双侧。身高服从正态分布,其参考值范围应为双侧。 采用公式采用公式 计算,百分数取计算,百分数取95%, /2xzS21.96z172.7 1.96 4.01xz S得得164.84180.56,故该地,故该地18岁男大学生身高的岁男大学生身高的95参考值范围是(参考值范围是(16
44、4.84180.56)cm 。定量资料85 正态分布的应用正态分布的应用 制定医学参考值范围常用方法制定医学参考值范围常用方法百分位数法:偏态分布资料以及资料中一端或两百分位数法:偏态分布资料以及资料中一端或两端无确切数值端无确切数值 双侧界值 单侧界值 P2.5P97.5 上界为:上界为:P95 下界为:下界为:P5 定量资料86 【例【例4-21】测得某地测得某地200名正常人尿汞值(名正常人尿汞值( ),求该地正常人尿汞值的,求该地正常人尿汞值的95参考值范围?参考值范围? g/L表表4-7 某地某地200名正常人尿汞值(名正常人尿汞值( )g/L尿汞值尿汞值04812162024283
45、2364044485256例例 数数302133272522148653321定量资料87由表由表4-7可以看出,正常人尿汞值的分布为偏态可以看出,正常人尿汞值的分布为偏态分布,不适宜采用正态分布法,应采用百分位数分布,不适宜采用正态分布法,应采用百分位数法;且尿汞的参考值范围应为单侧上界法;且尿汞的参考值范围应为单侧上界 954(%)36(200 95% 186)39.2 g/L 5LxiPLn xff定量资料88 正态分布的应用正态分布的应用 质量控制质量控制 XSX 2SX 2SX 3SX3 正态分布是许多统计方法的理论基础正态分布是许多统计方法的理论基础 定量资料8990 结束语结束语