《试论数值变量资料的统计描述.pptx》由会员分享,可在线阅读,更多相关《试论数值变量资料的统计描述.pptx(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、二、数值变量资料的统计描述二、数值变量资料的统计描述(一)集中趋势的描述(一)集中趋势的描述 集中趋势指标反映一组同质观察值的平均水平或中心位置。常用指标有均数、几何均数、中位数、众数、调和均数等。(二)离散程度的描述(二)离散程度的描述 离散程度指标反映一组同质观察值的变异程度。常用的指标有全距、四分位数间距、方差、标准差和变异系数。1、集中趋势的描述指标-均数均数 均数(mean,average)是算术均数(arithmetic mean)的简称,反映一组同质观察值的平均水平,适用于正态或近似正态分布的数值变量资料。通常样本均数用 表示,总体均数用 表示。(1)直接法直接法 用于样本含量较
2、小时,公式为:(2)加权法加权法(weighting method)用于频数表资料或样本中相同观察值较多时,公式为:对于例1:均数的特性:各观察值与均数之差总和为零,即离均差之和等于零。各观察值的离均差平方和最小。均数的应用:均数反映了一组同质观察值的平均水平,并可作为样本代表值与其它样本比较;均数适用于描述单峰对称分布特别是正态分布或近似正态分布资料的集中趋势;均数在描述正态分布的分布特征方面有重要应用,是正态分布的参数之一。2、集中趋势的描述指标-几何均数几何均数 几何均数(geometric mean)用 表示,适用于 数据经过对数变换后呈正态分布的(对数正态分布)资料;观察值之间呈倍数
3、或近似倍数变化(等比关系)的资料。如医学实践中的抗体滴度、平均效价、某些疾病的潜伏期等。(1)直接法)直接法例例2.4 有有6份血清的抗体效价为份血清的抗体效价为1:10,1:20,1:40,1:80,1:80,1:160,求其平均效价。求其平均效价。该6份血清的平均抗体效价为1:45。(2)加权法)加权法对于上例:对于上例:注意事项:计算几何均数时观察值中不能有0;一组观察值中不能同时有正值和负值。对于同一组资料,几何均数小于均数,即 。3、集中趋势的描述指标-中位数中位数 中位数(median)是一种位置指标位置指标,用 表示。应用:应用:中位数可用于描述任何分布,特别是偏态分布资料以及频
4、数分布的一端或两端无确切数据资料的中心位置。它是一组观察值按由小到大的顺序排列后位次居中的数值,小于和大于中位数的观察值个数相等。1.直接法直接法 用于样本含量较小的资料。将观察值由小到大排列,按下式计算:2频数表法频数表法 用于频数表资料。计算步骤:按所分组段由小到大计算累计频数和累计频 率;确定中位数所在组段;下式求中位数。(1)全距全距(range,简记为R)亦称极差极差,为一组同质观察值中最大值与最小值之差。(2)它反映了个体差异的范围,全距大,说明变全距大,说明变异度大;反之,全距小,说明变异度小。异度大;反之,全距小,说明变异度小。(3)不足 仅考虑了最大值与最小值之差,不能反映组
5、内其它观察值的变异度;样本含量越大,抽到较大或较小观察值的可能性越大,故全距可能越大。因此,样本含量相差悬殊时不宜用全距进行比较。1、离散程度的描述指标-全距全距2、离散程度的描述指标-四份位数间距四份位数间距3、离散程度的描述指标-方差和标准差方差和标准差(1)计算公式)计算公式:(2)意义)意义:标准差大,表示观察值的变异度大;反 之,标准差小,表示观察值的变异度小。(3)应用范围:)应用范围:适用于对称分布资料尤其是正态分 布资料(4)应用:)应用:描述变量分布的离散程度;结合均数,描述正态分布的分布特征;结合均数,计算变异系数;结合样本含量,计算标准误。4、离散程度的描述指标-变异系数变异系数应用:应用:常用于比较度量单位不同或均数相差悬 殊的两组(或多组)资料的变异度。