《2定量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《2定量资料的统计描述.ppt(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 定量资料的统计描述定量资料的统计描述第一节第一节频数与频数分布频数与频数分布第二节第二节定量变量的特征数定量变量的特征数第三节第三节常用统计图表常用统计图表 频数频数(frequency)(frequency):对一个随机变量做重复观察,其中某对一个随机变量做重复观察,其中某变量值出现的次数。变量值出现的次数。频数分布表频数分布表(frequency distribution table)(frequency distribution table):将各变量将各变量值及其相应的频数列成表格的形式。值及其相应的频数列成表格的形式。一一、离散型定量变量的频数分布、离散型定量变量的频数
2、分布 离散型变量的频数分布图离散型变量的频数分布图 直条图直条图 横坐标为产前检查次数;纵坐标为横坐标为产前检查次数;纵坐标为 频率,即产前检频率,即产前检查查K K次的妇女在被统计妇女中所占的比例次的妇女在被统计妇女中所占的比例%。图中等宽矩。图中等宽矩形长条的高度与相应检查次数的频率呈正比。形长条的高度与相应检查次数的频率呈正比。二、连续型定量变量的频数分布二、连续型定量变量的频数分布例例2-2 2-2 抽样调查某地抽样调查某地120120名名1818岁岁3535岁健康男性居民血清铁含岁健康男性居民血清铁含量量(mol/L)(mol/L)见见P P1212,试编制频数分布表。试编制频数分布
3、表。(一一)频数分布表的编制步骤:频数分布表的编制步骤:(1)求全距:(极差)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距)定组段数与组距:815个组段,组距个组段,组距i=全距全距/组段数组段数(3)划组段:以一个稍小于或等于最小值的整数作为第划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。一个组段的起点数据。下限:每个组段的起点下限:每个组段的起点(最小值最小值)。上限:每个组段的终点上限:每个组段的终点(近似最大值)。近似最大值)。注:最后一个组段应同时写出上限和下限来。注:最后一个组段应同时写出上限和下限来。两两端端的的组组段段应应分分别别包
4、包含含最最小小值值或或最最大大值;值;尽尽量量取取较较整整齐齐的的数数值值作作为为组组段段的的端端点点,便于对数据进行表述;便于对数据进行表述;组距以相等为宜。组距以相等为宜。(4)归组划记:频数、频率、累积频数、累积频率。归组划记:频数、频率、累积频数、累积频率。注:各组段的频数之和应等于总的观察例数。注:各组段的频数之和应等于总的观察例数。频率:各组频数除以总例数频率:各组频数除以总例数n所得的比值。所得的比值。累计频数:本组段的频数与以前各组段的累计频数:本组段的频数与以前各组段的频数相加;频数相加;累计频率:每组段的累计频数除以总例数。累计频率:每组段的累计频数除以总例数。合计合计68
5、1012141618202224262830一一上上正一正一正上正上正正丅正正丅正正正正正正正正正正正正正丅正正正正正丅正正正上正正正上正正丅正正丅正上正上止止一一13681220271812841组段组段划记划记频数频数120 表2 120名正常成年男子血清铁含量的频数分布表(二二)连续型变量的频数分布图连续型变量的频数分布图 直方图直方图 连续型变量的频数分布图,以直方的面积大小表示频率连续型变量的频数分布图,以直方的面积大小表示频率的多少。的多少。以横轴表示被观察变量,纵轴表示频率密度,以各矩形以横轴表示被观察变量,纵轴表示频率密度,以各矩形(宽度为组距)的面积代表各组段的频率。(宽度为
6、组距)的面积代表各组段的频率。图中横轴为血清铁含量,纵轴为频率密度,直条面图中横轴为血清铁含量,纵轴为频率密度,直条面积等于相应组段的频率。积等于相应组段的频率。三、三、频数分布的两个特征频数分布的两个特征集中趋势:血清铁含量向中央部分集中,即中等含集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在量者居多,集中在18 18 这个组段,这种现象这个组段,这种现象为集中趋势。为集中趋势。离散趋势:从中央部分到两侧的频数分布逐渐减少,离散趋势:从中央部分到两侧的频数分布逐渐减少,而且血清铁含量的值参差不齐,最低的接近而且血清铁含量的值参差不齐,最低的接近6 6 ,最高的接近,最高的接近3
7、0 30 ,这种现象称为离散趋势。这种现象称为离散趋势。由由于于同同质质性性,所所有有实实测测值值趋趋向向同同一一数值的趋势称为集中趋势。数值的趋势称为集中趋势。离离散散趋趋势势或或变变异异程程度度是是指指观观察察值值之之间参差不齐的程度。间参差不齐的程度。四、频数分布的类型四、频数分布的类型频数分布频数分布偏态分布型偏态分布型对称分布型对称分布型正偏态分布正偏态分布负偏态分布负偏态分布 频数表的用途频数表的用途 1 1.文献中常将频数表作为陈述资料的形式。揭示频数分文献中常将频数表作为陈述资料的形式。揭示频数分布的分布特征和分布类型。布的分布特征和分布类型。2 2.便于进一步计算统计指标和进
8、行统计分析处理。便于进一步计算统计指标和进行统计分析处理。3 3.便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。第二章第二章 定量资料的统计描述定量资料的统计描述第一节第一节频数与频数分布频数与频数分布第二节第二节定量变量的特征数定量变量的特征数第三节第三节常用统计图表常用统计图表 总体中的某些个体总是具有某些同质性,同一地区、同总体中的某些个体总是具有某些同质性,同一地区、同一年度、同一民族、同一年龄段、相同的性别与类似的健康一年度、同一民族、同一年龄段、相同的性别与类似的健康状况,这些共同点使得该人群的血清铁含量应趋向同一数值,状况,这些共同点使得该人群的血清铁含量应趋向
9、同一数值,即即集中趋势集中趋势集中趋势集中趋势。不同总体间比较的方式之一就是对他们的集中。不同总体间比较的方式之一就是对他们的集中趋势进行比较。另一方面,同一总体中的个体之间又普遍存趋势进行比较。另一方面,同一总体中的个体之间又普遍存在着各种差别,也就是说由于遗传、营养、行为、发育、心在着各种差别,也就是说由于遗传、营养、行为、发育、心理的各种因素在个体之间都不会完全相同,即个体间存在差理的各种因素在个体之间都不会完全相同,即个体间存在差异,因此导致某地异,因此导致某地18-3518-35岁健康男性居民血清铁含量不会完全岁健康男性居民血清铁含量不会完全相同,而是呈现或大或小的相同,而是呈现或大
10、或小的离散趋势离散趋势离散趋势离散趋势。一、描述集中趋势的统计指标一、描述集中趋势的统计指标平均数:描述一组同质计量资料的集中趋势;反映一组平均数:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。观察值的平均水平。常用的平均数有算术均数,几何均数和中位数。常用的平均数有算术均数,几何均数和中位数。(一)算术均数(一)算术均数(mean)(mean):简称均数,总体均数用希腊字母:简称均数,总体均数用希腊字母表表示,样本均数用拉丁字母示,样本均数用拉丁字母 表示。表示。1.1.计算方法计算方法 1 1)直接法:适用于样本例数)直接法:适用于样本例数n n较少的资料。较少的资料。其中其中
11、X1X1,X2X2XnXn为各变量值,为各变量值,n n为样本例数。为样本例数。2 2)加权法:适用于变量值较多的资料。)加权法:适用于变量值较多的资料。f f1 1,f f2 2f fn n分别为各组段的频数,分别为各组段的频数,X X1 1,X X2 2X X0 0 为各组段的组中为各组段的组中值值,组中值组中值=(=(本组段下限本组段下限+下组段下限下组段下限)/)/2 2。即频数多,权数大,作用也大;频数小,权数小,作用也小。即频数多,权数大,作用也大;频数小,权数小,作用也小。例例2-3 2-3 测得测得8 8只正常大白鼠总酸性磷酸酶(只正常大白鼠总酸性磷酸酶(TACPTACP)含量
12、含量(U/LU/L)为为4.204.20,6.436.43,2.082.08,3.453.45,2.262.26,4.044.04,5.425.42,3.383.38。试求其算术均数。试求其算术均数。求求例例2-22-2中某地中某地120120名正常成年男子的血清铁含量的均数。名正常成年男子的血清铁含量的均数。合计合计120(f)2228(fX0)43640()681012141618202224262830组段组段频数(频数(f)组中值(组中值(X0)fX013681220271210841727661041803405133782762001082979111315171921232527
13、2949243726135227005780974779386348500029168412.2.均数的两个重要特性均数的两个重要特性1).1).各离均差的总和等于各离均差的总和等于0 0。(总体中各变量值总体中各变量值X X与均数之与均数之差称为离均差差称为离均差)2).2).离均差的平方和小于各观察值离均差的平方和小于各观察值X X与任何数与任何数a a之差的平方之差的平方和。和。3 3.均数的应用均数的应用 最适用于最适用于对称分布资料对称分布资料对称分布资料对称分布资料,尤其是,尤其是正态分布资料正态分布资料正态分布资料正态分布资料。因为这。因为这时均数位于分布的中心,最能反映资料的集
14、中趋势。时均数位于分布的中心,最能反映资料的集中趋势。(二)几何均数(二)几何均数(geometric mean)(geometric mean):几何均数也称为倍数均数,用几何均数也称为倍数均数,用G G表示。表示。1.1.几何均数的计算方法几何均数的计算方法 1 1)直接法:适用于样本例数)直接法:适用于样本例数n n较少的资料。将较少的资料。将n n个观察值个观察值X X1 1,X X2 2,X X3 3X Xn n的乘积的乘积开开n n次方次方对数形式:对数形式:G=lgG=lg-1-1(lgX(lgX1 1+lgX+lgX2 2+lgX+lgX3 3+lgXlgXn n)/)/n=n
15、=lglg-1-1(lgX/n)(lgX/n)例例2-5 2-5 7 7名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAgHBsAg滴度资料为滴度资料为1 1:1616,1 1:3232,1 1:3232,1 1:6464,1 1:6464,1 1:128128,1 1:512512。求其平均。求其平均效价。效价。7 7份份HBsAgHBsAg的平均滴度为的平均滴度为1 1:64642 2)加权法:适用于样本例数加权法:适用于样本例数n n较多的资料。较多的资料。X X1 1,X X2 2X Xn n 为各组段的滴度或滴度倒数。为各组段的滴度或滴度倒数。f f1 1,f f2 2f fn
16、n分别为各组段的频数。分别为各组段的频数。例例2-6 2-6 5252例慢性迁延性肝炎患者的例慢性迁延性肝炎患者的HBsAgHBsAg滴度数据见表滴度数据见表2-42-4,求其平均滴度。,求其平均滴度。52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度的几何均数为滴度的几何均数为1:119.74705 2.2.几何均数应用的注意事项:几何均数应用的注意事项:1 1)几何均数常用于)几何均数常用于等比级数资料等比级数资料等比级数资料等比级数资料或或对数正态分布资料对数正态分布资料对数正态分布资料对数正态分布资料。2 2)观察值中不能有)观察值中不能有0 0。3 3)观察值中不能同时有正值和负值。
17、)观察值中不能同时有正值和负值。(三)中位数和百分位数(三)中位数和百分位数 中位数(中位数(median,Mmedian,M):):将一组变量值从小到大按顺序排列,将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。位次居中的那个变量值就是中位数。百分位数(百分位数(percentile,percentile,P Px x):):指把数据从小到大排列后位指把数据从小到大排列后位于于第第X%X%位置的数值。位置的数值。有有n n个观察值个观察值X X1 1,X X2 2X Xn n,把他们由小到大把他们由小到大按顺序排列成按顺序排列成X X1 1XX2 2XX3 3X Xn n,将
18、这将这n n个观察值平均的分为个观察值平均的分为100100等份,对应于每一等份的数值就是一个百分位数,对应于前面等份,对应于每一等份的数值就是一个百分位数,对应于前面X%X%个位置的数值称为第个位置的数值称为第X X百分位数,用百分位数,用P Px x表示。表示。1 1.中位数和百分位数的计算中位数和百分位数的计算 1 1)直接法:适用于样本例数直接法:适用于样本例数n n较少的资料。较少的资料。将观察值按大小顺序排列,当将观察值按大小顺序排列,当n n为奇数时,中间那为奇数时,中间那个数就是中位数个数就是中位数。当。当n n为偶数时,中间两个数的平均数为偶数时,中间两个数的平均数就是中位数
19、。就是中位数。例例2-7 2-7 某药厂观察某药厂观察9 9只小鼠口服高山红景天醇提物只小鼠口服高山红景天醇提物(RSAERSAE)后在乏氧条件下的生存时间(分钟)如下:后在乏氧条件下的生存时间(分钟)如下:49.149.1,60.860.8,63.363.3,63.663.6,63.663.6,65.665.6,65.865.8,68.668.6,69.069.0。n n为奇数,为奇数,M=63.6 M=63.6(cmcm)2 2)频数表法计算中位数和百分位数:适用于样本例数)频数表法计算中位数和百分位数:适用于样本例数n n较较多的资料。多的资料。累计频数累计频数累计频数累计频数:本组段的
20、频数与以前各组段的频数相加;:本组段的频数与以前各组段的频数相加;累计频率累计频率累计频率累计频率:每组段的累计频数除以总例数。:每组段的累计频数除以总例数。公式为公式为 L L为百分位数所在组段的下限,为百分位数所在组段的下限,i i为该组段的组距为该组段的组距,f fx x为该为该组段的频数,组段的频数,f fL L为百分位数所在组段的为百分位数所在组段的前一组段前一组段前一组段前一组段的累计频数,的累计频数,n n为总例数。为总例数。例例2-8 2-8 利用表利用表2-22-2的频数表求血清铁含量的中位数。的频数表求血清铁含量的中位数。合计合计 120120 68101214161818
21、202224262830 组组段段 频数频数 累计频数累计频数 累计频率累计频率 110.83343.336108.3381815.00123025.0020505041.6727277764.17189579.171210789.17811595.83411999.171120100.00 例例 某市大气中某市大气中SOSO2 2的日平均浓度见表的日平均浓度见表2.52.5,求,求P P2525,P P5050,P P7575。2 2.中位数和百分位数的应用中位数和百分位数的应用 1 1)中位数常用于描述)中位数常用于描述偏态分布资料偏态分布资料偏态分布资料偏态分布资料的集中趋势,反映位的集
22、中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数次居中的观察值的平均水平。在对称分布的资料中,中位数和均数在理论上是相同的。和均数在理论上是相同的。2 2)百分位数可用于确定医学参考值范围(详后)。)百分位数可用于确定医学参考值范围(详后)。3 3)分布在中部的百分位数相当稳定,具有较好的代表性,)分布在中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数,只有在样本例数足够多时才比较稳但靠近两端的百分位数,只有在样本例数足够多时才比较稳定。定。应用平均数的注意事项应用平均数的注意事项 1 1.平均数的计算和应用必须具备平均数的计算和应用必须具备同质同质同质同质基础
23、,必须先合理基础,必须先合理分分分分组组组组。不同质的事物要分别求平均数,以便分析比较。不同质的事物要分别求平均数,以便分析比较。2 2.根据资料的分布选用适当的平均数。对称分布资料,尤根据资料的分布选用适当的平均数。对称分布资料,尤其是其是正态分布资料正态分布资料正态分布资料正态分布资料,宜用均数,也可用中位数,而,宜用均数,也可用中位数,而偏态分布偏态分布偏态分布偏态分布资料资料资料资料则中位数的代表性较好,则中位数的代表性较好,对数正态分布及等比级数资料对数正态分布及等比级数资料对数正态分布及等比级数资料对数正态分布及等比级数资料宜用几何均数。宜用几何均数。二、描述离散趋势的特征数二、描
24、述离散趋势的特征数例例2-11 2-11 试观察试观察3 3组数据的离散情况。组数据的离散情况。A A组组 2626 28 30 32 34 28 30 32 34 B B组组 2424 27 30 33 36 27 30 33 36 C C组组 2626 29 30 31 34 29 30 31 341 1.极差极差(range,R)(range,R)也称为全距,用也称为全距,用R R表示,一组资料中最大值与最小值之差。表示,一组资料中最大值与最小值之差。缺点:缺点:1 1)除了最大、最小值外,不能反映组内其他数据的变异度。)除了最大、最小值外,不能反映组内其他数据的变异度。2 2)样本例数
25、越多,抽到较大或较小变量值的可能性越大,)样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越大。因而极差可能越大。3 3)即使样本含量相同,极差也不够稳定。)即使样本含量相同,极差也不够稳定。2 2.四分位数间距四分位数间距(quartile range,Q)(quartile range,Q)P P2525表示全部观察值中有表示全部观察值中有25%25%(1/41/4)的观察值比它小,)的观察值比它小,记为下四分位数记为下四分位数Q QL L,P P7575表示全部观察值中有表示全部观察值中有25%25%(1/41/4)的)的观察值比它大,记为上四分位数观察值比它大,记为上四分位
26、数Q QU U。Q Q=P=P7575-P-P2525=Q=QU U-Q-QL L Q Q适用于适用于各种类型的连续型变量各种类型的连续型变量各种类型的连续型变量各种类型的连续型变量,特别是偏态分布的资,特别是偏态分布的资料。料。例例 据表据表2.52.5资料求某市大气中资料求某市大气中SOSO2 2日平均浓度分布日平均浓度分布 的四的四份位数间距。份位数间距。3.3.方差方差(variance)(variance)A A组组 26 26 2828 30 30 3232 34 34 C C组组 26 26 2929 30 30 3131 34 34(X-)总体方差总体方差l 方差只取正值。同类
27、资料比较时,方差越大意味着数据间变异越大。4.4.标准差标准差(standard deviation,S)(standard deviation,S)式中式中n-1n-1是是自由度自由度,为随机变量能自由取值的个数。它描述,为随机变量能自由取值的个数。它描述了当了当 选定时选定时n n个变量值中能自由变动的变量值的个数。个变量值中能自由变动的变量值的个数。1 1.直接法:适用于直接法:适用于n n较小的资料较小的资料求求例题中例题中A A组数据的标准差。组数据的标准差。2.2.加权法:适用于加权法:适用于n n较大的资料较大的资料合计合计120(f)2228(fX0)43640()681012
28、141618202224262830组段组段频数(频数(f)组中值(组中值(X0)fX013681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841120120名成年男子血清铁含量均数、标准差计算表(加权法)名成年男子血清铁含量均数、标准差计算表(加权法)标准差的应用:标准差的应用:1 1)表示变量分布的离散程度。表示变量分布的离散程度。2 2)结合均数计算变异系数。结合均数计算变异系数。3 3)结合样本含量计算标准误。结合样本含
29、量计算标准误。4 4)结合均数描述正态分布特征。)结合均数描述正态分布特征。5.5.变异系数变异系数(coefficient of variation,CV)(coefficient of variation,CV)公式为:公式为:常用于:常用于:1 1)比较度量衡单位不同的多组资料的变异度。)比较度量衡单位不同的多组资料的变异度。例例2-16 2-16 1985 1985年通过年通过1010省调查得知,农村刚满周岁的女童体重省调查得知,农村刚满周岁的女童体重均数为均数为8.42kg 8.42kg,标准差为标准差为0.98kg 0.98kg;身高均数为身高均数为72.4cm72.4cm,标准标
30、准差为差为3.0cm3.0cm,试比较二者变异度。试比较二者变异度。体重体重 CV=0.98/8.42CV=0.98/8.42100%=11.64%100%=11.64%身高身高 CV=3.0/72.4CV=3.0/72.4100%=100%=4.14%4.14%2 2)比较均数相差悬殊的几组资料的变异度。)比较均数相差悬殊的几组资料的变异度。3-3.53-3.5岁岁 100100 96.196.1 3.13.1 3.233.2330-3530-35岁岁 100100 170.2170.2 4.0 2.35 4.0 2.35 年龄组年龄组 人数人数 均数均数 标准差标准差 变异系数(变异系数(
31、%)某地不同年龄段男子身高的变异度某地不同年龄段男子身高的变异度 三三、描述分布形态的特征数描述分布形态的特征数 偏度系数偏度系数(coefficient of(coefficient of skewness,SKEWskewness,SKEW)理论上,总体偏度系数为理论上,总体偏度系数为0 0时,分布是时,分布是对称分布对称分布对称分布对称分布;取正值时,;取正值时,分布为分布为正偏峰正偏峰正偏峰正偏峰;取负值时,分布为;取负值时,分布为负偏峰负偏峰负偏峰负偏峰。峰度系数峰度系数(coefficient of kurtosis,KURT)(coefficient of kurtosis,KU
32、RT)理论上,理论上,正态分布正态分布正态分布正态分布的总体峰度系数为的总体峰度系数为0 0;取负值时,其分布;取负值时,其分布较正态分布的较正态分布的峰平阔峰平阔峰平阔峰平阔;取正值时,其分布较正态分布的;取正值时,其分布较正态分布的峰峰峰峰尖峭尖峭尖峭尖峭。第二章第二章 定量资料的统计描述定量资料的统计描述第一节第一节频数与频数分布频数与频数分布第二节第二节定量变量的特征数定量变量的特征数第三节第三节常用统计图表常用统计图表第三节第三节常用统计图表常用统计图表 统计表(统计表(statistical tablestatistical table)和统计图和统计图(statistical c
33、hartstatistical chart)是统计描述的重要工具。医学是统计描述的重要工具。医学科学研究资料经过整理和计算各种必要的统计指标后,科学研究资料经过整理和计算各种必要的统计指标后,所得结果除了用适当文字说明以外,常用统计表和统计所得结果除了用适当文字说明以外,常用统计表和统计图表达分析结果。统计图表可以对于数据进行概括、对图表达分析结果。统计图表可以对于数据进行概括、对比或做直观的表达。统计表和统计图不仅便于阅读,而比或做直观的表达。统计表和统计图不仅便于阅读,而且便于分析比较且便于分析比较。一、统计表一、统计表1概念:概念:指在科技报告中,常将统计分析的事物及其指标指在科技报告中
34、,常将统计分析的事物及其指标用表格列出,以反映事物的内在规律性和关联性。用表格列出,以反映事物的内在规律性和关联性。2作用:作用:1)避免繁杂的文字叙述)避免繁杂的文字叙述2)便于计算)便于计算3)便于事物间的比较分析)便于事物间的比较分析3.统计表的结构统计表的结构 从外形上看,统计表由标题、标目(包括横标目、纵标目)从外形上看,统计表由标题、标目(包括横标目、纵标目)、线条、数字及必要的文字说明和备注、线条、数字及必要的文字说明和备注5 5部分构成。其基本格部分构成。其基本格式如表式如表1 1:1)标题:概括说明表的中心内容,要求用词简练、)标题:概括说明表的中心内容,要求用词简练、确切。
35、必要时注明资料的时间、地点,写在表的上端中央。确切。必要时注明资料的时间、地点,写在表的上端中央。注意:防止标题过于简略或过于繁杂,有的甚至不写注意:防止标题过于简略或过于繁杂,有的甚至不写标题。标题。2)标目:要求文字简明,有单位的标目要注明单位。)标目:要求文字简明,有单位的标目要注明单位。横标目位于表的左侧,说明各横行数字的含义。纵标目位横标目位于表的左侧,说明各横行数字的含义。纵标目位于表的右侧,向下说明各纵行数字的含义。于表的右侧,向下说明各纵行数字的含义。注意:防止标目过多,层次不清。注意:防止标目过多,层次不清。从内容上看,每张表都有主语和谓语。主语指被研究的从内容上看,每张表都
36、有主语和谓语。主语指被研究的事物,如表事物,如表2-12-1中的药物分组,一般置于表的左侧;谓语指中的药物分组,一般置于表的左侧;谓语指说明主语的各项统计指标,如表说明主语的各项统计指标,如表2-12-1中的中的“治愈治愈”和和“未愈未愈”、“合计合计”,一般置于表的右侧,主语和谓语结合起来构,一般置于表的右侧,主语和谓语结合起来构成一个完整的句子。如表成一个完整的句子。如表2-12-1可读成可读成用替硝唑治疗组治愈用替硝唑治疗组治愈2525例,未愈例,未愈4 4例,合计例,合计2929例。例。611843合计合计321418甲硝唑甲硝唑29425替硝唑替硝唑合计合计未愈未愈治愈治愈分组分组表
37、表2-1不同药物治疗急性冠周炎效果比较不同药物治疗急性冠周炎效果比较3)线条:只需要顶线、底线及纵标目下面与合计上)线条:只需要顶线、底线及纵标目下面与合计上面的横线。面的横线。注意:线条不宜过多,表的左上角不宜有斜线,表注意:线条不宜过多,表的左上角不宜有斜线,表内不能有纵线。内不能有纵线。4)数字:表内数字一律用阿拉伯数字表示,同一个)数字:表内数字一律用阿拉伯数字表示,同一个指标的数字精确度应当一致,表内不宜有空格,不祥数指标的数字精确度应当一致,表内不宜有空格,不祥数据用据用“”表示,不存在数据用表示,不存在数据用“”表示,数字为表示,数字为0,则填写则填写0。5)备注:表格一般不列备
38、注或其他文字说明,如有)备注:表格一般不列备注或其他文字说明,如有特殊情况需要说明时可用特殊情况需要说明时可用“*”标出,将文字说明写在表标出,将文字说明写在表格的下面。格的下面。4.4.统计表的种类统计表的种类 根据说明事物的主要标志(主语)的复杂程度,统根据说明事物的主要标志(主语)的复杂程度,统计表可以分成简单表和复合表。计表可以分成简单表和复合表。l l)简单表:只有一种主要标志,即主语按一个标志)简单表:只有一种主要标志,即主语按一个标志分组。分组。2 2)复合表:有两种或两种以上的标志,即主语按多)复合表:有两种或两种以上的标志,即主语按多个标志分组。在安排上可以将部分主语放在表的
39、上方与个标志分组。在安排上可以将部分主语放在表的上方与谓语配合起来。谓语配合起来。611843合计合计321418甲硝唑甲硝唑29425替硝唑替硝唑合计合计未愈未愈治愈治愈分组分组表表2-1不同药物治疗急性冠周炎效果比较不同药物治疗急性冠周炎效果比较20010025751002575合计合计100501733501535B10050842501040A合计合计无效无效有效有效合计合计无效无效有效有效合计合计乙医院乙医院甲医院甲医院药物药物表表2-2A、B两种药物在甲、乙两医院的疗效两种药物在甲、乙两医院的疗效5.5.编制统计表的基本要求编制统计表的基本要求 1 1)重点突出,简单明了。)重点突
40、出,简单明了。即一张表只包括一个中心内即一张表只包括一个中心内容,表达一个主题。容,表达一个主题。2 2)主谓分明,层次清楚。)主谓分明,层次清楚。即主谓语的位置准确,标目即主谓语的位置准确,标目的安排及分组要层次清楚,符合专业逻辑。的安排及分组要层次清楚,符合专业逻辑。简单表只有一个分简单表只有一个分组标志,一般作为横标目,而纵标目就是统计指标名称。复合组标志,一般作为横标目,而纵标目就是统计指标名称。复合表有两个以上分组标志,一般把其中主要的和分项较多的一个表有两个以上分组标志,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目上。作为横标目,而其余的则安排在纵标目上。3
41、3)数据准确、可靠。)数据准确、可靠。6.6.统计表的审查与修改统计表的审查与修改 统计表制作是否良好,可以从以下几方面检查:统计表制作是否良好,可以从以下几方面检查:1 1)标题是否正确。)标题是否正确。2 2)主谓语的排列是否合适,标目是否组合重复。)主谓语的排列是否合适,标目是否组合重复。3 3)表线是否过多过密。)表线是否过多过密。某地某地1974年年111例钩端螺旋体病患者发病季节、年龄和职业例钩端螺旋体病患者发病季节、年龄和职业构成资料如表构成资料如表124所示,请按照编制统计表的基本要求,检查所示,请按照编制统计表的基本要求,检查此表编制的是否合适,如不合适,请指出并修改成正确表
42、。此表编制的是否合适,如不合适,请指出并修改成正确表。表表12-4的缺点是:的缺点是:1)标题不确切,并且未注明时间与地点。)标题不确切,并且未注明时间与地点。2)发病季节、年龄、职业三项指标放在一起,内容繁杂,不)发病季节、年龄、职业三项指标放在一起,内容繁杂,不能突出重点。能突出重点。3)标目设计不合理。人数、)标目设计不合理。人数、%多次重复,不便于比较分析。多次重复,不便于比较分析。4)表内文字和线条过多。)表内文字和线条过多。100.0111合计合计5.469月上旬月上旬25.2288月下旬月下旬63.1708月中旬月中旬6.378月上旬月上旬%人数人数季节季节表表12-5 12-5
43、 某地某地19741974年钩端螺旋体病患者发病季节分布(修改表)年钩端螺旋体病患者发病季节分布(修改表)100.0111合计合计3.6445及以上及以上85.6951510.81215以下以下%人数人数年龄(岁)年龄(岁)表表12-6某地某地1974年钩端螺旋体病患者发病年龄分布(修改表)年钩端螺旋体病患者发病年龄分布(修改表)100.0111合计合计0.91其他其他2.73待业青年待业青年0.91学生学生95.5106农民农民%人数人数职业职业表表12-7某地某地1974年钩端螺旋体病患者发病职业分布(修改表)年钩端螺旋体病患者发病职业分布(修改表)某医院对麦牙根糖浆治疗急性慢性肝炎某医院
44、对麦牙根糖浆治疗急性慢性肝炎161例的疗效,资例的疗效,资料如表料如表12-8,指出缺点并加以改进。,指出缺点并加以改进。32.95323.63843.57067.1108%例例%例例%例例%例例好转好转近期痊愈近期痊愈小计小计无效无效有效有效效果效果总例数总例数缺点是:缺点是:1)无标题。)无标题。2)标目组合重复。)标目组合重复。3)主谓语排列不当。)主谓语排列不当。100.0161合计合计43.570近期痊愈近期痊愈23.638好转好转32.953无效无效百分比(百分比(%)例数例数疗效疗效表表12-8某年某医院麦芽根糖浆治疗急慢性肝炎的疗效观察某年某医院麦芽根糖浆治疗急慢性肝炎的疗效观
45、察二、统计图二、统计图1.1.概念:概念:利用点的位置、线段的升降、直条的长短和面积利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料和指标的大小等各种几何图形来表达统计资料和指标.2.2.作用:作用:它将研究对象的特征、内部构成、相互关系、对它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象而生动地表达出来,更直观地比情况、频数分布等情况形象而生动地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。但对数量的反映出事物间的数量关系,更易于比较和理解。但对数量的表达较粗略,从图中不能获得确切数字。表达较粗略,从图中不能获得确切数字。医学中常
46、用的统计图有:医学中常用的统计图有:直条图、百分条图、圆图、直条图、百分条图、圆图、普通线图、半对数线图、普通线图、半对数线图、直方图、箱式图、散点图。直方图、箱式图、散点图。3.3.制图的基本要求制图的基本要求 统计图通常由标题、标目、刻度、图域和图例统计图通常由标题、标目、刻度、图域和图例5 5部分组成。部分组成。1 1)标题:简明扼要地说明资料的内容、时间和地点)标题:简明扼要地说明资料的内容、时间和地点.一般一般写在图的下方中央。写在图的下方中央。2 2)图域:即制图空间。除圆图外,一般用直角坐标系第)图域:即制图空间。除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框
47、架表示。不同事物一象限的位置表示图域,或者用长方形的框架表示。不同事物用不同线条(实线、虚线、点线)或颜色表示。用不同线条(实线、虚线、点线)或颜色表示。图域的高图域的高:宽比例习惯上为宽比例习惯上为5:75:7。3 3)标目:分为纵标目和横标目,表示纵轴和横轴数字的意)标目:分为纵标目和横标目,表示纵轴和横轴数字的意义,一般有度量衡单位。义,一般有度量衡单位。4 4)图例:在对比关系较为复杂的统计图中,为使读者易于)图例:在对比关系较为复杂的统计图中,为使读者易于分辨各种图形的意义,可以设置图例。图例通常放在横轴与标分辨各种图形的意义,可以设置图例。图例通常放在横轴与标题之间。题之间。5 5
48、)刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系)刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右,一律用等距表明。轴由左向右,一律用等距表明。4.常用统计图的绘制方法及要求常用统计图的绘制方法及要求绘制统计图时要根据资料的性质和分析绘制统计图时要根据资料的性质和分析的目的选择适当的图形。的目的选择适当的图形。1)直条图)直条图直条图(直条图(bargraph):):适用于性质相似而不适用于性质相似而不连续的资料。连续的资料。用等宽的直条的长短来表示各独立指标数用等宽的直条的
49、长短来表示各独立指标数值大小和它们之间的对比关系。指标既可以是绝对数,也值大小和它们之间的对比关系。指标既可以是绝对数,也可以是相对数。为便于比较,被比较的指标一般按大小顺可以是相对数。为便于比较,被比较的指标一般按大小顺序排列。序排列。A)单式直条图单式直条图只有一个统计指标,一个分组因素只有一个统计指标,一个分组因素。如。如根据表根据表2-6绘制成图绘制成图2-6。B)复式条图复式条图具有两个统计指标,两个及以上分组因素。具有两个统计指标,两个及以上分组因素。如根据表如根据表2-7绘制成的图绘制成的图2-7。绘制直条图时应注意以下几点:绘制直条图时应注意以下几点:1坐标:一般以横轴为基线,
50、表示各个调查项目。纵轴坐标:一般以横轴为基线,表示各个调查项目。纵轴尺度必须从尺度必须从0开始,表示各个项目相应的数据,而且要等距,开始,表示各个项目相应的数据,而且要等距,否则会改变各对比组间的比例关系。否则会改变各对比组间的比例关系。2宽度:各直条的宽度应相等,各直条的间隔也应一致。宽度:各直条的宽度应相等,各直条的间隔也应一致。条间隔应为条宽的一半或等宽。条间隔应为条宽的一半或等宽。3排列:直条一般可按高低顺序排列,以便于比较。但排列:直条一般可按高低顺序排列,以便于比较。但如果各指标间需要有一定的顺序时,也可按规定的顺序排列。如果各指标间需要有一定的顺序时,也可按规定的顺序排列。注意: