《23 描述变异程度和分布形态的统计指标.pdf》由会员分享,可在线阅读,更多相关《23 描述变异程度和分布形态的统计指标.pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 第二章 定量资料的统计描述定量资料的统计描述 三、描述变异程度和分布形态的统计指标主要内容?描述变异程度变异程度统计指标?极差(range,R)?四分位数间距(interquartilerange)?方差(variance)?标准差(standarddeviation)?变异系数(coefficientof variation,CV)?描述分布形态分布形态统计指标?偏度系数(coefficientof skewness,SKEW)?峰度系数(coefficientof kurtosis,KURT)?小结2同一总体中不同个体间存在的差异称为变异变异(variation)。例例210 试观
2、察三组数据的离散状况。(均数都是30)A组:24,27,30,33,36B组:26,28,30,32,34C组:26,29,30,31,343(一)描述变异程度统计指标1、极差极差(range,R)R=最大值最大值最小值最小值 计算简便,但仅利用了两个两个数据的信息 一般,样本量n越大R也往往会越大,不够稳定 不够稳定 例例211 计算上述三组数据的极差A组 R=3624=12B组 R=3426=8C组 R=3426=842、四分位间距四分位间距(interquartilerange,Q)?Q=P75P25P25与P75之间恰好包含50%的个体?四分位数间距Q是总体中数值居中的50%个体散布的
3、范围?Q越大越大意味着数据间变异越变异越大 大?常把中位数和四分位数间距中位数和四分位数间距结合起来描述变量的平均水平和变异 程度。5例例 利用表25中的数据,计算50例链球菌咽颊炎患者潜伏期(h)的四分位数间距。表25 50例链球菌咽颊炎患者潜伏期(h)频率分布表 组段 组中值(X0)频数(f)频率/%累计频数(F)累计频率/%(1)(2)(3)(4)(5)(6)12181212243071481636421122193848541122306060667143774727851042848490484692961022448961081201142450100合计50()(91.408%2
4、55011123625hP=+=()(20.7337%75505127275hP=+=四分位数间距Q=73.2040.91=32.29(h)63、方差方差(variance)又称均方差均方差(meansquaredeviation)方差越大越大意味着数据间变异越变异越大大。总体方差:样本方差:或1)(122 =nXXSnii1/)(222 =nnXXSNXNii =122)(74、标准差标准差(standarddeviation,S)?标准差是方差的算术平方根。?标准差的量纲量纲与原变量一致一致。?标准差越大标准差越大意味着个体间变异越大变异越大。?标准差适合用来表达对称分布对称分布的离散趋势
5、。?对于对称分布资料,常把均数和标准差均数和标准差结合起来,描述资料的集 中趋势和离散趋势。85、变异系数变异系数(CV)应用场合:(1)量纲不同的变量间变异程度的比较(2)均数差别较大的变量间变异程度的比较 计算公式:%100 =XSCV9例例 某年通过十省调查得知,农村刚满周岁的女童体重均数 为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm。体重的变异大还是身高的变异大?体重的变异系数:身高的变异系数:结果结果显示显示,十省农村周岁女童体重的相对变异大于身高的相对变异。%100 =XSCV%64.11%10042.898.0%100=XSCV%14.4%10
6、04.720.3%100=XSCV10(二)描述分布形态统计指标 用偏度系数偏度系数和峰度系数峰度系数来描述分布形态。1.偏度系数(coefficientof skewness,SKEW)其中n为样本含量,为样本均数,S为样本标准差。?总体偏度系数为0时,分布是对称对称分布;?取正值正值时,分布为正偏峰正偏峰;?取负值负值时,分布为负偏峰负偏峰。=3)2)(1(SXXnnnSKEWX112.峰度系数峰度系数(coefficientofkurtosis,KURT)其中n为样本含量,为样本均数,S为样本标准差?正态分布正态分布的总体峰度系数为0;?取负值负值时,其分布较正态分布的峰平阔峰平阔;?取正值正值时,其分布较正态分布的峰尖峭峰尖峭。)3)(2()1(3)3)(2)(1()1(24 +=nnnSXXnnnnnKURTX12(三)小 结?描述变异程度的指标描述变异程度的指标:?极差,仅利用2个数据,同时不够稳定。?四分位间距,对于偏峰资料,常和中位数结合使用。?标准差,是方差算数平方根,对于对称分布资料,常和均数结合 使用。?变异系数,用于量纲不同或均数差距过大的指标。?描述分布形态指标:描述分布形态指标:?偏度系数?峰度系数13