《第三章数据分布特征描述.doc》由会员分享,可在线阅读,更多相关《第三章数据分布特征描述.doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章数据分布特征描述第三章 数据分布特征描述学习目的通过本章的学习,1.理解统计数据分布的集中趋势和离散程度的概念;2.掌握描述统计数据分布的集中趋势和离散程度的各代表值的测定、计算与分析方法;3.能够应用各种指标分析实际问题;4.了解分布偏度与峰度的描述。课程内容要点第一节 统计变量集中趋势的测定一、测定集中趋势的意义统计数据的集中趋势(或中心位置)是指数据向其中心值靠拢或集中的程度。测定集中趋势是为了表示社会经济现象总体各单位某一标志在一定时间、地点条件下所达到的一般水平。测定集中趋势的作用有四:首先,反映总体各单位变量分布的集中趋势和一般水平;其次,比较同类现象在不同单位的发展水平;再
2、次,比较同类现象在不同时期的发展变化趋势或规律;最后,分析现象之间的依存关系。二、位置代表值 测定集中趋势常用的位置代表值有众数和中位数。众数是总体中最普遍出现的标志值。中位数是总体各单位按大小顺序序列化后,处在数列中点位置上那个单位的标志值。对分组或未分组的资料和组距式变量数列,众数和中位数各有不同的确定方法。三、数值平均数数值平均数就是均值,它是对总体中的所有数据计算平均值,用以反映所有数据的一般水平。1、算术平均数的基本公式是总体标志总量除以总体单位总量。其有简单式和加权式两种。加权算术平均数中权数的权衡轻重的作用体现在各标志值对平均数的影响上,权数大的标志值对平均数的影响也大,权数小的
3、标志值对平均数的影响也小。 权数必须是标志值的直接承担者,权数与标志值的乘积要具有标志总量的意义。只有当三个量之间存在着客观的数量对等关系时,各组单位数才是加权算术平均数的合适权数。 当各组频数都相等时,权数不起作用。是非标志的算术平均数。算术平均数有四个数学性质。2、调和平均数是总体中各单位标志值倒数的算术平均数的倒数,又称“倒数平均数”。也有简单调和平均数和加权调和平均数两种。在统计实践中,调和平均数常常被作为算术平均数的变形来使用:当因为数据的原因不能采用算术平均数的方法计算均值时,可以考虑采用调和平均数的形式。3、几何平均数是个变量值(比率)连乘积的次方根,通常用于时间上有联系或有先后
4、顺序关系的比率求平均,凡是度量值的连乘积等于总比率或总速度的现象都必须使用几何平均法计算均值。几何平均数根据所掌握数据资料不同,有简单几何平均数和加权几何平均数两种方法。4、幂平均数是标志值K次方的平均数的K 次方根。5、计算和应用集中趋势测定指标应注意三个问题:(1)集中趋势的测定指标只能应用于同质总体。(2)用组平均数和分配数列补充说明总平均数。(3)集中趋势指标与离散程度指标相结合。四、集中趋势测定指标的关系1、众数、中位数和算术平均数各自的含义、计算方法不同,但三者之间存在一定的数量联系。对称分布时,三者相等;适度正偏斜时,;适度负偏斜时则相反。适度偏斜情形下,可采用皮尔生经验公式进行
5、推算:。2、在相同的数据中,算术平均数、调和平均数和几何平均数在数值是的关系如下:。第二节 统计变量离散程度的测定一、离散程度测定的意义在实践中,测定离散程度的主要作用在于:1、反映现象总体各单位的标志值的差异程度。 2、衡量均值的代表性。3、测定现象变动的均匀性或稳定性程度。一、极差、四分位差和平均差1、 极差又称全距,是最大和最小观测值之间的距离。2、四分位差是在数列中剔除最大和最小各四分之一的数据,是第一和第三个四分位数之间距离的二分之一。3、平均差是分配数列中各单位标志值与其算术平均数之间离差绝对值的平均数。三、方差与标准差方差是总体各单位标志值与其算术平均数离差的平方的算术平均数。标
6、准差是方差的平方根,总方差等于组间方差和组内方差平均数之和。方差和标准差有5个数学性质。是非标志的方差即0-1分布的方差,当时,非标志的方差达到最大可能值。方差和标准差有五个数学性质。极差、分位差和标准差都是绝对量指标,它们的计量单位与标志值相同。它们的大小不仅取决于总体的变异情况,也和标志值水平的高低、计量水平的不同有关。四、离散系数与异众比率离散系数是数量数据的各离散程度指标与其算术平均数的比值。最常用的离散系数是标准差系数:。离散系数是一个无量纲的量。它适于比较不同现象或具有不同水平数据的变异程度的情况。异众比率是指非众数的次数与全部变量值总次数的比率。第三节 变量分布偏度与峰度的描述一
7、、矩矩也称为动差。它是总体中所有变量值与任意常数离差K次方的算术平均数。矩有原点矩和中心矩两种。一阶原点矩就是变量的算术平均数,二阶原点矩就是变量平方的算术平均数。一阶中心矩为0,二阶中心矩就是方差。二、偏度偏度指分布不对称的方向和程度,它可用三阶中心动差除以标准差三次方来度量。三、峰度峰度又称峭度,是指分布图形的尖峭程度或峰凸程度。峰度指标可用四阶中心动差除以标准差四次方再减去3,来度量。 .考核知识点与考核要求(一)识记:1算术平均数、调和平均数、几何平均数、幂平均数、众数、中位数指标的定义、特点与计算方法。2权数的定义、形式和作用。3极差、四分位差、方差和标准差的定义、特点与计算方法。4
8、变异系数尤其是标准差系数的定义、特点与计算方法。5、偏度和峰度的定义、特点与计算方法。(二)领会1权数的意义及其选择;2算术平均数的数学性质;3众数、中位数和算术平均数三者之间存在的数量联系; 算术平均数、调和平均数和几何平均数之间存在的数量关系。(三)应用1对客观数据进行统计综合描述,利用集中趋势和离中趋势说明数据的特征。2.利用偏度和峰度分析数据的分布形状。.习题详解 一、选择题1C 2.D 3.B 4.C 5.B 6.ABCDE 7.ADE 8.BC 9.BCE 10.ADE二、计算题1.解:(1)(元/斤) (2)(元/斤)2解: (1); (2); (3) ; (4); (5); (
9、6); (7)异众比率=0.65; (8),3解:平均商品销售价值(元/公斤)4解:计算表如下: 月工资组中值各组工人比重(%)450550650750850202530151090.0137.5195.0112.585.0合 计100620.0 该工业集团公司工人平均工资620元。5解:成交额单位:万元,成交量单位:万斤。品种价格(元)甲市场乙市场成交额成交量成交量成交额甲乙丙1.21.41.51.22.81.51212112.41.41.5合计5.5445.3甲市场平均价格(元/斤) 乙市场平均价格(元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。26 / 11 26