《3统计描述.ppt》由会员分享,可在线阅读,更多相关《3统计描述.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 统计描述Descriptive statistics 第一节 统计表与统计图 统计表的概念:对统计调查所获得的原始资料统计表的概念:对统计调查所获得的原始资料进行整理,得到的数据,把这些数据按一定的顺利进行整理,得到的数据,把这些数据按一定的顺利排列在表格上,就形成了统计表。广义的统计表包排列在表格上,就形成了统计表。广义的统计表包括统计工作各个阶段中所用的一切表格,如调查表、括统计工作各个阶段中所用的一切表格,如调查表、汇总表或整理表等。本节所讲的统计表是狭义的汇总表或整理表等。本节所讲的统计表是狭义的统计表,即将汇总结果按一定顺序排列在由横行、统计表,即将汇总结果按一定顺序排列在由
2、横行、纵列交叉结合而成的表格中,这种表现统计资料纵列交叉结合而成的表格中,这种表现统计资料的表格称为统计表的表格称为统计表一、统计表(一)统计表的定义和结构 1、从表式上看,统计表是由纵横交叉的线条、从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总表题、横行标题、组成的一种表格,表格包括总表题、横行标题、纵栏标题和指标数值四个部分。总表题是统计表纵栏标题和指标数值四个部分。总表题是统计表的名称,它扼要地说明该表的基本内容。它置于的名称,它扼要地说明该表的基本内容。它置于统计表格的正上方。横行标题是横行的名称,一统计表格的正上方。横行标题是横行的名称,一般放在表格的左方。纵栏标题是
3、纵栏的名称,一般放在表格的左方。纵栏标题是纵栏的名称,一般放在表格的上方。指标数值列在横行和纵栏的般放在表格的上方。指标数值列在横行和纵栏的交叉处,用来说明总体及其组成部分的数量特征,交叉处,用来说明总体及其组成部分的数量特征,它是统计表格的核心部分。它是统计表格的核心部分。统计表的结构:2 2、从内容上看,统计表由主词栏和宾词、从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。用来说明总体数量特征的各个统计指标。我国我国200220
4、02年国内生产总值年国内生产总值按三次产业分按三次产业分国内生产总值国内生产总值(亿元)(亿元)比上年增长率比上年增长率(%(%)第一产业第一产业 14883 14883 2.9 2.9 第二产业第二产业 52982 52982 9.9 9.9 第三产业第三产业 34522 34522 7.37.3 合合 计计 102398 102398 8.0 8.0纵纵标标题题数数字字资资料料主词主词宾词宾词横横 标标 题题 (3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。1 1 1 1、按主词的结构分类,根据主词是否分组和分组的、按主词的结构分类,根据主词是否分组和分组的、按主词
5、的结构分类,根据主词是否分组和分组的、按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。程度,分为简单表、分组表和复合表。程度,分为简单表、分组表和复合表。程度,分为简单表、分组表和复合表。(1 1)简单表:主词未经任何分组的统计表称)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。为简单表,也称一览表。主词罗列各单位的名称。(2 2)分组表:主词只按一个标志进行分组形)分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表。成的统计表,也称简单分组表。(二)统计表的分类 1/2 2、按宾词设计分类,可分为宾词简单排列、分组平行排列
6、和分组层叠排列等。(1 1)宾词简单排列。宾词不进行任何分组,按)宾词简单排列。宾词不进行任何分组,按一定顺序排列在统计表上。一定顺序排列在统计表上。(2 2)宾词分组平行排列。宾词栏中各分组标志)宾词分组平行排列。宾词栏中各分组标志彼此分开,平行排列。彼此分开,平行排列。(3 3)宾词分组层叠排列。统计指标同时有层次地)宾词分组层叠排列。统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积。宾词的栏数等于各种分组的组数连乘积。(二)统计表的分类 2/2 统计表设计总的要求是:简练、明确、实用、统计表
7、设计总的要求是:简练、明确、实用、统计表设计总的要求是:简练、明确、实用、统计表设计总的要求是:简练、明确、实用、美观、便于比较。美观、便于比较。美观、便于比较。美观、便于比较。(1 1)线条的绘制。表的上下端应以粗线绘制,线条的绘制。表的上下端应以粗线绘制,线条的绘制。表的上下端应以粗线绘制,线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。两端一般不划线,采用表内纵横线以细线绘制。两端一般不划线,采用表内纵横线以细线绘制。两端一般不划线,采用表内纵横线以细线绘制。两端一般不划线,采用“开口式开口式开口式开口式”。(2 2)合计栏的设置。统计表各纵列若需合计合计栏的设置。统计表各纵列
8、若需合计合计栏的设置。统计表各纵列若需合计合计栏的设置。统计表各纵列若需合计时,一般应将合计列在最后一行,各横行若需要时,一般应将合计列在最后一行,各横行若需要时,一般应将合计列在最后一行,各横行若需要时,一般应将合计列在最后一行,各横行若需要合计时,可将合计列在最前一栏或最后一栏。合计时,可将合计列在最前一栏或最后一栏。合计时,可将合计列在最前一栏或最后一栏。合计时,可将合计列在最前一栏或最后一栏。(三)统计表的设计 1/3 (3)标题设计。统计表的总标题,横栏、纵栏)标题设计。统计表的总标题,横栏、纵栏标题应简明扼要,以简练而又准确的文字表述统标题应简明扼要,以简练而又准确的文字表述统计资
9、料的内容、资料所属的空间和时间范围。计资料的内容、资料所属的空间和时间范围。(4 4)指标数值。表中数字应该填写整齐,对)指标数值。表中数字应该填写整齐,对)指标数值。表中数字应该填写整齐,对)指标数值。表中数字应该填写整齐,对准位数。当数字小且可略而不计时,可写上准位数。当数字小且可略而不计时,可写上准位数。当数字小且可略而不计时,可写上准位数。当数字小且可略而不计时,可写上“0”0”;当缺某项数字资料时,可用符号;当缺某项数字资料时,可用符号;当缺某项数字资料时,可用符号;当缺某项数字资料时,可用符号“”“”;不;不;不;不应有数字时用符号应有数字时用符号应有数字时用符号应有数字时用符号“
10、”表示。表示。表示。表示。(三)统计表的设计 2/3 (5)计量单位。统计表必须注明数字资料的计量)计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在单位。当全表只有一种计量单位时,可以把它写在表头的上方。如果表中各格的指标数值计量单位不表头的上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。同,可在横行标题后添一列计量单位。(6 6)注解或资料来源。必要时,在统计表下应)注解或资料来源。必要时,在统计表下应)注解或资料来源。必要时,在统计表下应)注解或资料来源。必要时,在统计表下应加注解或说明,以便查考。加注解或说明,以便查考。加注解或说
11、明,以便查考。加注解或说明,以便查考。(三)统计表的设计 3/3 首先建立直首先建立直角坐标系,横轴角坐标系,横轴代表分组变量,代表分组变量,纵轴表示频数或纵轴表示频数或频率。以各组距频率。以各组距为宽,各组的频为宽,各组的频数或频率为高,数或频率为高,绘制代表各组的绘制代表各组的直方块,便形成直方块,便形成直方图。直方图。151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140 统计图:统计图是借助几何图形或具体形象来统计图:统计图是借助几何图形或具体形象来统计图:统计图是借助几何图形或具体形象来统计图:
12、统计图是借助几何图形或具体形象来显示统计数据的一种形式。显示统计数据的一种形式。显示统计数据的一种形式。显示统计数据的一种形式。(一)直方图二、统计图 折线图:也称多边形图,是在直方图的基础上绘制的。折线图:也称多边形图,是在直方图的基础上绘制的。151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140频频频频频频数数数数数数(人人人人人人)将每个直方块的顶端中点,即组中值画一个小圆点,然后将这些小圆点用直线相连,即形成折线图。起点通常放在距左边最低组半个组距的横轴上,终点通常放在距右边最高组半个组距的横轴
13、上。(二)折线图当变量数列的组数无限时,折线便表现为一条平滑曲线。曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。频频频频频频数数数数数数(人人人人人人)151512129 96 63 3(三)曲线图累计曲线图的绘制。累计频数(频率)分布图分为累计曲线图的绘制。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数向上累计频数(频率)分布图和向下累计频数(频率)分布图。不论是向上累计还是向下累计(频率)分布图。不论是向上累计还是向下累计均以分组变量为横轴,以累计频数(频率)为纵均以分组变量为横轴,以累计频数(频率)为纵轴。在直角坐标系上将各组组距的上限与
14、其相应轴。在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向上累计曲线。对于(或光滑曲线)相连,即是向上累计曲线。对于向下累计频数分布图,在直角坐标系上将各组组向下累计频数分布图,在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向下累计依次用折线(或光滑曲线)相连,即是向下累计分布曲线图。分布曲线图。(四)累计曲线图 钟形分布的特征是钟形分布的特征是“两头小,中间大两头小,中间大”,即中,即中间的变量值分布的次
15、数多,靠近两边的变量分布间的变量值分布的次数多,靠近两边的变量分布的次数少,其曲线图宛如一口古钟。的次数少,其曲线图宛如一口古钟。对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布主要有以下三种类型:(一)钟形分布三、频(次)数分布图的类型 U型分布的形状与钟形分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。U UU型分布型分布型分布(二)U型分布 J型分布有两种类型,一种是次数随着变量的增大而增多,另一种是成反J型分布,其次数随着变量的增大而减少。正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布(三
16、)J型分布 (一)(一)平均指标含义平均指标含义 指概括地描述统计分布的一般水平或集中指概括地描述统计分布的一般水平或集中趋势的数值。趋势的数值。一、描述一、描述分布集中趋势的主要指标及其分类分布集中趋势的主要指标及其分类 (二)平均指标的特点(二)平均指标的特点具有代表性和抽象性。具有代表性和抽象性。第二节第二节 分布的集中趋势分布的集中趋势4 4、分析现象之间的依存关系。、分析现象之间的依存关系。统计平均数具有重要作用,主要体现在统计平均数具有重要作用,主要体现在以下几点:以下几点:1 1 1 1、反映总体各变量分布的集中趋势和一般水平。、反映总体各变量分布的集中趋势和一般水平。、反映总体
17、各变量分布的集中趋势和一般水平。、反映总体各变量分布的集中趋势和一般水平。2 2 2 2、便于比较同类现象在不同单位间的发展水平。、便于比较同类现象在不同单位间的发展水平。、便于比较同类现象在不同单位间的发展水平。、便于比较同类现象在不同单位间的发展水平。3 3 3 3、能够比较同类现象在不同时间的发展变化趋势、能够比较同类现象在不同时间的发展变化趋势、能够比较同类现象在不同时间的发展变化趋势、能够比较同类现象在不同时间的发展变化趋势或规律。或规律。或规律。或规律。(三)平均指标的作用(三)平均指标的作用 2、位置平均数:根据标志值某一特点位置来确定、位置平均数:根据标志值某一特点位置来确定的
18、平均数。它不是对统计数列中所有各项数据进行计的平均数。它不是对统计数列中所有各项数据进行计算所得的结果,而是根据数列中处于特殊位置上的个算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。别单位或部分单位的标志值来确定的。平均数根据其具体的代表意义和计算方式不同,平均数根据其具体的代表意义和计算方式不同,平均数根据其具体的代表意义和计算方式不同,平均数根据其具体的代表意义和计算方式不同,可分为:可分为:可分为:可分为:1 1、数值平均数:是以统计数列的所有各项数据来、数值平均数:是以统计数列的所有各项数据来、数值平均数:是以统计数列的所有各项数据来、数值平均数:是以
19、统计数列的所有各项数据来计算的平均数。其特点是统计数列中任何一项数据的计算的平均数。其特点是统计数列中任何一项数据的计算的平均数。其特点是统计数列中任何一项数据的计算的平均数。其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果。变动,都会在一定程度上影响数值平均数的计算结果。变动,都会在一定程度上影响数值平均数的计算结果。变动,都会在一定程度上影响数值平均数的计算结果。(四)平均数的分类(四)平均数的分类 1/2众数众数中位数中位数 平均数平均数平均数平均数位置平均数位置平均数位置平均数位置平均数 数值平均数数值平均数数值平均数数值平均数 算术平均数算术平均数算术平
20、均数算术平均数调和平均数调和平均数调和平均数调和平均数几何平均数几何平均数几何平均数几何平均数幂平均数幂平均数幂平均数幂平均数 (四)平均数的分类(四)平均数的分类 2/2总体单位数:总体单位数:表示的是一个总体内所包含的总体单位数。表示的是一个总体内所包含的总体单位数。在上面计算公式中,总体标志总量必须是总体在上面计算公式中,总体标志总量必须是总体各单位标志值的总和,标志值和单位之间存在一一各单位标志值的总和,标志值和单位之间存在一一对应关系。对应关系。数值平均数是对总体各单位某一标志值的平均,表数值平均数是对总体各单位某一标志值的平均,表数值平均数是对总体各单位某一标志值的平均,表数值平均
21、数是对总体各单位某一标志值的平均,表明总体单位标志值的一般水平。明总体单位标志值的一般水平。明总体单位标志值的一般水平。明总体单位标志值的一般水平。基本计算公式是:基本计算公式是:基本计算公式是:基本计算公式是:总体标志总量总体标志总量总体标志总量总体标志总量/总体单位数。总体单位数。总体单位数。总体单位数。总体标志总量:总体标志总量:总体标志总量:总体标志总量:总体各单位某种数量标志值的总和。总体各单位某种数量标志值的总和。总体各单位某种数量标志值的总和。总体各单位某种数量标志值的总和。二、数值平均数二、数值平均数(一)算术平均数(一)算术平均数1 1 1 1、算术、算术、算术、算术平均数平
22、均数的计算的计算的计算的计算计算算术平均数有两种式:计算算术平均数有两种式:计算算术平均数有两种式:计算算术平均数有两种式:(1 1)简单算术平均数)简单算术平均数 适用于未分组资料,用总体各单位标志值适用于未分组资料,用总体各单位标志值适用于未分组资料,用总体各单位标志值适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。加总得到标志总量除以总体单位总量而得。加总得到标志总量除以总体单位总量而得。加总得到标志总量除以总体单位总量而得。计算公式为:计算公式为:计算公式为:计算公式为:代表算术平代表算术平代表算术平代表算术平均数。均数。均数。均数。表示各单位表示各单位表示各
23、单位表示各单位标志值。标志值。标志值。标志值。表示总体单位数。表示总体单位数。表示总体单位数。表示总体单位数。公公式式中中 例1:应用条件:资料未分组,各组出现的次数应用条件:资料未分组,各组出现的次数都是都是1 1。5 5名学生的学习成绩分别为名学生的学习成绩分别为:7575、9191、6464、5353、8282。则平均成绩为:。则平均成绩为:(2 2)加权算术平均数)加权算术平均数计算公式:计算公式:应用条件:单项式分组,各组次数不同。应用条件:单项式分组,各组次数不同。应用条件:单项式分组,各组次数不同。应用条件:单项式分组,各组次数不同。根据单项数列计算加权算术平均数根据单项数列计算
24、加权算术平均数例例:某车间某车间2020名工人加工某种零件资料:名工人加工某种零件资料:按日产量分组(件)按日产量分组(件)x x工人数(人)工人数(人)f f 日产总量日产总量 xfxf 14 14 2 2 28 28 15 15 4 4 60 60 16 16 8 8 128 128 17 17 5 5 85 85 18 18 1 1 18 18 合计合计 20 20 319 319根据组距数列计算加权算术平均数根据组距数列计算加权算术平均数应用条件:组距式分组,各组次数不同。应用条件:组距式分组,各组次数不同。按按日产量分组日产量分组(公斤)(公斤)工人数工人数f f组中值组中值x x日
25、产总量日产总量xfxf20302030 10 10 25 25 25025030403040 70 70 35 35 2450 245040504050 90 90 45 45 4150 415050605060 30 30 55 55 1650 1650合合 计计 200 200 8400 8400例:某车间例:某车间例:某车间例:某车间200200200200名工人日产量资料:名工人日产量资料:名工人日产量资料:名工人日产量资料:权数在平均数中的权衡轻重的作用,是直接通过各组单位数占总体单位数的比重,也就是各组的频率相对数的大小体现出来的。频率的大(1)概念 对平均数的大小起着权衡轻重的作
26、用。平均数对平均数的大小起着权衡轻重的作用。平均数总是趋向于出现次数最多的哪个标志值。总是趋向于出现次数最多的哪个标志值。(2)权数的表现形式绝对数形式 相对数形式(3)权数的作用2、权数 当各组的次数都相同时,各标志值对平均数的影响都相同时,那就无所谓权数的“权衡轻重”了。在这种情况下,加权算术平均数就等小体现出来的。频率的大小就直接表明了该组标志小体现出来的。频率的大小就直接表明了该组标志值在平均数中占据的地位,频率越大,该标志值计值在平均数中占据的地位,频率越大,该标志值计入平均数的份额也越大,对平均数的影响就越大;入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,该标志值计入
27、平均数的份额就越反之,频率越小,该标志值计入平均数的份额就越小,对平均数的影响就越小,这就是权数权衡轻重小,对平均数的影响就越小,这就是权数权衡轻重作用的实质。作用的实质。(4)权数不起作用的场合可以说,简单算术平均数实际上是加权算术平均数的特例。于简单算术平均数。于简单算术平均数。即当即当时,时,一般说来,次数就是权数,但在计算相对指标一般说来,次数就是权数,但在计算相对指标的平均数时,经常遇到次数不是权数的情况。故的平均数时,经常遇到次数不是权数的情况。故在求相对指标的平均数时,应根据相对指标的含在求相对指标的平均数时,应根据相对指标的含义选择适当的权数。义选择适当的权数。(5)权数的选择
28、(6)由比重权数计算加权算术平均数)由比重权数计算加权算术平均数例例1:按按日产量分组(公日产量分组(公斤)斤)人数比重(人数比重(%)组中值组中值x x20302030 5 5 25 2530403040 35 35 35 3540504050 45 45 45 4550605060 15 15 55 55应用条件:已知的是比重权数(次数是比重)应用条件:已知的是比重权数(次数是比重)应用条件:已知的是比重权数(次数是比重)应用条件:已知的是比重权数(次数是比重)公式:公式:公式:公式:4 4、根据相对数(平均数)计算的加权、根据相对数(平均数)计算的加权 某局某局所属的三个企业的资料:所属
29、的三个企业的资料:企业企业产值计划完产值计划完成成%x%x计划产值计划产值(万元)(万元)f f实际产值实际产值(万元)(万元)xfxf 甲甲 95 95 300 300 285 285 乙乙 105 105 900 900 945 945 丙丙 115 115 300 300 345 345 合合 计计 15001500 1575 1575(1 1)根据相对数计算的)根据相对数计算的(2 2)根据平均数计算的)根据平均数计算的某某企业各班组工人劳动生产率资料企业各班组工人劳动生产率资料:班班 组组平均劳动生平均劳动生产率产率 x x实际工时实际工时 f f产品产量产品产量(件件)xfxf 一
30、一 10 10 100 100 1000 1000 二二 12 12 200 200 2400 2400 三三 15 15 300 300 4500 4500 四四 20 20 300 30060006000 五五 30 30 200 20060006000合计合计 11001100 19900 19900 3 3、是非标志的平均数、是非标志的平均数 是非标志是非标志:也称交替标志,当总体单位某种品也称交替标志,当总体单位某种品质标志的具体表现为质标志的具体表现为“是是”与与“非非”或或“有有”与与“无无”两种情况时,这种品质标志就称为是非标两种情况时,这种品质标志就称为是非标志。志。是非标志
31、是非标志 x x单位数单位数 f f比重比重 1 1 0 0 合合 计计 N N 1 1 平均数的计算:把具有某种特征的用平均数的计算:把具有某种特征的用平均数的计算:把具有某种特征的用平均数的计算:把具有某种特征的用“1”1”1”1”表表表表示,不具有该种特征的用示,不具有该种特征的用示,不具有该种特征的用示,不具有该种特征的用“0”0”0”0”表示。表示。表示。表示。例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志平均数。4、算术平均数的数学性质、算术平均数的数学性质(2 2)各个变量值与其平均数离差平方之和为最小值)各个变量值与其平均数离差平方之和为最小值(1 1 1 1
32、)各个变量值与其平均数离差之和等于零)各个变量值与其平均数离差之和等于零)各个变量值与其平均数离差之和等于零)各个变量值与其平均数离差之和等于零 (3 3)给每个变量值增加或减少一个任意)给每个变量值增加或减少一个任意数数A A,则则算术平均数也相应增增加或减少这个任意数算术平均数也相应增增加或减少这个任意数A A。(4 4 4 4)给每个变量值乘以或除以一个任意数)给每个变量值乘以或除以一个任意数)给每个变量值乘以或除以一个任意数)给每个变量值乘以或除以一个任意数A A A A,则算,则算,则算,则算术平均数也相应扩大或缩小术平均数也相应扩大或缩小术平均数也相应扩大或缩小术平均数也相应扩大或
33、缩小A A A A倍。倍。倍。倍。(二)调和平均数(二)调和平均数(H)是社会经济统计中常用的另一种平均指标,它是是社会经济统计中常用的另一种平均指标,它是根据标志值的倒数计算的,所以又称倒数平均数。根据标志值的倒数计算的,所以又称倒数平均数。与算术平均数一样,调和平均数有简单调和平均数与算术平均数一样,调和平均数有简单调和平均数和加权调和平均数两种。和加权调和平均数两种。例例例例:一个人步行两里,走第一里时速度为每小时候一个人步行两里,走第一里时速度为每小时候一个人步行两里,走第一里时速度为每小时候一个人步行两里,走第一里时速度为每小时候1010里,走第二里时为每小时里,走第二里时为每小时里
34、,走第二里时为每小时里,走第二里时为每小时2020里,则平均速度为:里,则平均速度为:里,则平均速度为:里,则平均速度为:应用条件:资料未分组,各个变量值次数都是应用条件:资料未分组,各个变量值次数都是应用条件:资料未分组,各个变量值次数都是应用条件:资料未分组,各个变量值次数都是1 1。计算公式计算公式计算公式计算公式:1 1、简单调和平均数、简单调和平均数、简单调和平均数、简单调和平均数2、加权调和平均数、加权调和平均数计算公式:计算公式:速度速度 x x行走里程行走里程 m m所需所需时间时间 20 20 1 1 15 15 2 2 10 10 3 3 合计合计 6 6 例例例例1 1:
35、应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次数不同。例例2班班 组组平均劳动生平均劳动生产率产率 x x实际工时实际工时 产品产量产品产量(件件)m m 一一 1010 100 100 1000 1000 二二 12 12 200 200 24002400 三三 15 15 300 300 45004500 四四 20 20 300 300 6000 6000 五五 3030 200 200 6000 6000合计合计 11001100 19900 19900 是另一种形式的平均数,是N 个变量
36、值乘积的 N 次方根。主要用于计算平均比率和平均速度。几何平均数也有简单几何平均数和加权几何平均数两种。(三)几何平均数(三)几何平均数(G)车间车间投入量投入量产出量产出量合格率合格率%x%x 一一 1000 1000 800 800 80 80 二二 800 800 720 720 90 90 三三 720 720 504 504 70 70例:某企业生产某种产品需经过三个连续作业车例:某企业生产某种产品需经过三个连续作业车例:某企业生产某种产品需经过三个连续作业车例:某企业生产某种产品需经过三个连续作业车间才能完成。间才能完成。间才能完成。间才能完成。应用条件:资料未分组(各变量值次数都
37、是应用条件:资料未分组(各变量值次数都是应用条件:资料未分组(各变量值次数都是应用条件:资料未分组(各变量值次数都是1 1)。)。)。)。计算公式:计算公式:计算公式:计算公式:1、简单几何平均数、简单几何平均数2、加权几何平均数、加权几何平均数计算公式:计算公式:年份年份累计存款额累计存款额本利率本利率%第第1 1年年105%105%第第2 2年年105%105%第第3 3年年108%108%第第1010年年112%112%例:将一笔钱存入银行,存期例:将一笔钱存入银行,存期例:将一笔钱存入银行,存期例:将一笔钱存入银行,存期1010年,以复利计息,年,以复利计息,年,以复利计息,年,以复利
38、计息,1010年的利率分配是第年的利率分配是第年的利率分配是第年的利率分配是第1 1年至第年至第年至第年至第2 2年为年为年为年为5%5%、第、第、第、第3 3年至年至年至年至5 5年为年为年为年为8%8%、第、第、第、第6 6年至第年至第年至第年至第8 8年为年为年为年为10%10%、第、第、第、第9 9年至第年至第年至第年至第1010年年年年12%12%,计算平均年利率,计算平均年利率,计算平均年利率,计算平均年利率设本金为设本金为设本金为设本金为应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次
39、数不同。本利率本利率x x年数年数f f 105%105%2 2 108%108%3 3 110%110%3 3 112%112%2 2 合合 计计 10 10平均年利率平均年利率=8.77%=8.77%三、位置平均数三、位置平均数(一)众数(一)众数 1、众数的含义:、众数的含义:总体中出现次数最多、频率总体中出现次数最多、频率最高的标志值。最高的标志值。2、确定众数的方法。、确定众数的方法。(1)单项数列确定众数)单项数列确定众数按按日产量分组(件)日产量分组(件)工人数(人)工人数(人)20201515212130302222202023231010(2)由组距数列确定众)由组距数列确定
40、众数数1 1、计算公式:、计算公式:例:例:年年人均纯收入(千元)人均纯收入(千元)农户数(户)农户数(户)5 5以下以下2402405656480480676711001100787870070089893203209 9以上以上160160合计合计30003000农户年人均收入众数计算表农户年人均收入众数计算表(二)中位数(二)中位数 1、中位数的含义:将总体各单位按其标志值、中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数就是中大小顺序排列起来居于中间位置的那个数就是中位数。位数。2、确定中位数的方法、确定中位数的方法 标志值的个数是奇数标志值的个数是奇数(1)由
41、未分组资料确定中位数)由未分组资料确定中位数 例:例:7名工人生产某种产品,日产量(件)分别为名工人生产某种产品,日产量(件)分别为4、6、6、8、9、12、14。位于中间位置的第四名工。位于中间位置的第四名工人的日产量人的日产量8件为中位数。件为中位数。上例增加上例增加为为8名工人,日产量名工人,日产量为为4、6、6、8、9、12、13、14。中位数为。中位数为)。)。其位置在第四和第五名中间其位置在第四和第五名中间其位置在第四和第五名中间其位置在第四和第五名中间 (,标志值的个数是偶数标志值的个数是偶数(2)由单项数列确定中位数)由单项数列确定中位数例:例:中位数中位数为第为第40 名和名
42、和41名日产量的平均值名日产量的平均值 按按日产量分日产量分组(件)组(件)x x工人数(人)工人数(人)f f累计次数累计次数向上累计向上累计向下累计向下累计2020101010108080222215152525707024243030555555552626252580802525合计合计8080(3)由组距数列确定中位数)由组距数列确定中位数计算公式计算公式例例年年人均纯收人均纯收入(千元)入(千元)农户数(户)农户数(户)向上累计向上累计次数次数5 5以下以下240240240240565648048072072067671100110018201820787870070025202
43、5208989320320284028409 9以上以上16016030003000合计合计30003000(1)(1)计算累计次数计算累计次数(2)(2)确定中位数组确定中位数组(6(67)7)(3)(3)根据中位数计算公式根据中位数计算公式计算中位数计算中位数中位数位次:中位数位次:(三)众数、中位数、和算术平均数和的关系(三)众数、中位数、和算术平均数和的关系对称分布对称分布左偏左偏分布分布右偏右偏分布分布 众数、中位数和算术平均数数量关系的众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等经验公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:于算术
44、平均数与中位数距离的三倍:第三节第三节 分布的离中趋势分布的离中趋势一、描述分布离中趋势的主要变异指标及其作用一、描述分布离中趋势的主要变异指标及其作用 常见的变异指标有:极差、分位差、标准差、方常见的变异指标有:极差、分位差、标准差、方常见的变异指标有:极差、分位差、标准差、方常见的变异指标有:极差、分位差、标准差、方差和变异系数。差和变异系数。差和变异系数。差和变异系数。变异指标是用来刻画总体分布的离散程度或变变异指标是用来刻画总体分布的离散程度或变变异指标是用来刻画总体分布的离散程度或变变异指标是用来刻画总体分布的离散程度或变异状况,变异指标越大,表明总体各单位标志值的异状况,变异指标越
45、大,表明总体各单位标志值的异状况,变异指标越大,表明总体各单位标志值的异状况,变异指标越大,表明总体各单位标志值的变异程度越大。它是反映总体各标志值间差异程度变异程度越大。它是反映总体各标志值间差异程度变异程度越大。它是反映总体各标志值间差异程度变异程度越大。它是反映总体各标志值间差异程度的的的的,且能衡量总体平均数的代表性。且能衡量总体平均数的代表性。且能衡量总体平均数的代表性。且能衡量总体平均数的代表性。(一)变异指标的含义(一)变异指标的含义(一)变异指标的含义(一)变异指标的含义2、反映社会经济活动的均衡性。1、用于衡量平均指标的代表性。3、研究总体标志值分布偏离正态的情况。(二)变异
46、指标的作用极差也称全距,用R表示。(一)极差例:例:5名学生的成绩为名学生的成绩为50、69、76、88、97 则则R=97-50=47优点:计算简便优点:计算简便公式:公式:R=最大值最大值最小值最小值缺点:易受极端值的影响缺点:易受极端值的影响二、极差与四分位差 四分位差是从变量数列中剔除最大和最小各1/4的单位,用3/4位次与1/4位次的标志值之差除以2来表示。公式:公式:(二)四分位差方差:各变量值与其均值离差平方的平均数。方差:各变量值与其均值离差平方的平均数。(一)数量标志的方差与标准差(一)数量标志的方差与标准差标准差:方差的平方根,也称均方差。标准差:方差的平方根,也称均方差。
47、1、数量标志的方差与标准差计算,其计算、数量标志的方差与标准差计算,其计算公式为:公式为:资料未分组:资料未分组:资料已分组:资料已分组:三、方差与标准差例例1:日产量(件)日产量(件)20209 922221 123230 024241 126269 9合计合计2020例2:日产量(公斤)日产量(公斤)工人数工人数f f组中值组中值x x2030203010102525288028803040304070703535343034304050405090904545810810506050603030555550705070合合 计计2002001219012190 组内方差反映组内标志值对组
48、平均数的方差,组间方差反映组平均数对总平均数的方差。它们之间的关系为:它们之间的关系为:2、总方差、组间方差和组内方差。(1)变量的方差等于变量平方的平均数减去变量平均数的平方。即:即:(2)变量对算术平均数的方差小于对任何常数的方差。(3)n个同性质独立变量和的方差等于各个变量方差的和3、方差与标准差的数学性质 (4)n个同性质独立变量平均数的方差等于各变量方差平均数的1/n。(5)变量线性变换的方差等于变量的方差乘以变量系数的平方。如前:是非标志的平均数为如前:是非标志的平均数为P。标志值标志值x x单位数单位数f f1 10 0合计合计N N由于标准差有良好的数学性质,相比较而言,由于标
49、准差有良好的数学性质,相比较而言,它的应用最为广泛。它的应用最为广泛。(二)是非标志的方差与标准差 例:某工厂生产某种产品合格率为95,不合格率为5,求是非标志的方差及标准差。第四节第四节 分布的偏度和峰度分布的偏度和峰度(一)动差的概念(一)动差的概念(一)动差的概念(一)动差的概念一、统计动差一、统计动差一、统计动差一、统计动差 动差原是物理学中的概念:矩,表示力和力臂对动差原是物理学中的概念:矩,表示力和力臂对动差原是物理学中的概念:矩,表示力和力臂对动差原是物理学中的概念:矩,表示力和力臂对重心的关系。这种关系,与统计学中变量和权数对平重心的关系。这种关系,与统计学中变量和权数对平重心
50、的关系。这种关系,与统计学中变量和权数对平重心的关系。这种关系,与统计学中变量和权数对平均数的关系很相似。故统计学中也用动差来说明次数均数的关系很相似。故统计学中也用动差来说明次数均数的关系很相似。故统计学中也用动差来说明次数均数的关系很相似。故统计学中也用动差来说明次数分配的性质。分配的性质。分配的性质。分配的性质。原点矩:是原点矩:是原点矩:是原点矩:是K K K K阶动差的一般形式,公式为:阶动差的一般形式,公式为:阶动差的一般形式,公式为:阶动差的一般形式,公式为:(二)原点矩和中心矩(二)原点矩和中心矩(二)原点矩和中心矩(二)原点矩和中心矩 中点矩:如果把原点移动到算术平均数的位置