《统计学原理与技能训练 第5章平均指标和变异指标.ppt》由会员分享,可在线阅读,更多相关《统计学原理与技能训练 第5章平均指标和变异指标.ppt(96页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章 平均指标和变异指标平均指标和变异指标学习目标:学习目标:1.1.理解平均指标的概念和作用;理解平均指标的概念和作用;2.2.掌握各种平均数的计算原则、方法与掌握各种平均数的计算原则、方法与应用条件,学会计算主要的平均指标;应用条件,学会计算主要的平均指标;3.3.理解变异指标的作用、计算方法和运理解变异指标的作用、计算方法和运用条件;用条件;4.4.掌握主要的变异指标。掌握主要的变异指标。第一节平均指标第一节平均指标一、平均指标的概念一、平均指标的概念 平均指标又称平均数,是同类社会经济现象平均指标又称平均数,是同类社会经济现象总体内各单位某一数量标志在一定时间、地点条总体内各单
2、位某一数量标志在一定时间、地点条件下所达到的一般水平,是对同质总体各单位某件下所达到的一般水平,是对同质总体各单位某种数量标志的差异抽象化,从而反映同质总体一种数量标志的差异抽象化,从而反映同质总体一般水平的综合指标。它是某一变量数列分布的集般水平的综合指标。它是某一变量数列分布的集中趋势的代表值。中趋势的代表值。例如,我们要研究一个企业工人的工资情例如,我们要研究一个企业工人的工资情况,企业中每个工人的工资是不同的,彼此之间况,企业中每个工人的工资是不同的,彼此之间存在着差异,我们不能以其中任意一个工人的工存在着差异,我们不能以其中任意一个工人的工资来代表整个企业工人工资的水平,应该用工人资
3、来代表整个企业工人工资的水平,应该用工人的平均工资来代表。的平均工资来代表。平均指标具有三个显著特点:平均指标具有三个显著特点:(1 1)它是一个代表值,可以代表总体的一)它是一个代表值,可以代表总体的一般水平;般水平;(2 2)它将总体单位之间的数量差异抽象化)它将总体单位之间的数量差异抽象化了;了;(3 3)它反映了总体分布的集中趋势。)它反映了总体分布的集中趋势。二、平均指标的作用二、平均指标的作用(一)利用平均指标,可以了解总体的一般水平(一)利用平均指标,可以了解总体的一般水平(二)利用平均指标,可以对若干同类现象在不同空间(二)利用平均指标,可以对若干同类现象在不同空间进行比较分析
4、进行比较分析(三)利用平均指标,可以研究某一总体数值的平均水(三)利用平均指标,可以研究某一总体数值的平均水平在时间上的变化,说明总体的发展过程和趋势平在时间上的变化,说明总体的发展过程和趋势(四)利用平均指标,可以分析现象之间的依存关系(四)利用平均指标,可以分析现象之间的依存关系(五)平均指标可作为某些科学预测、决策和某些推算(五)平均指标可作为某些科学预测、决策和某些推算的依据的依据三、平均指标的分类三、平均指标的分类 (一)静态平均数和动态平均数(一)静态平均数和动态平均数 根据平均指标反映内容的不同,可以把平均根据平均指标反映内容的不同,可以把平均数分为静态平均数和动态平均数。数分为
5、静态平均数和动态平均数。静态平均数:反映在同一时间范围内总体各静态平均数:反映在同一时间范围内总体各单位某一数量标志一般水平的平均数。单位某一数量标志一般水平的平均数。动态平均数:反映不同时间、同一空间范围动态平均数:反映不同时间、同一空间范围内总体某一指标一般水平的平均数。内总体某一指标一般水平的平均数。(二)数值平均数与位置平均数(二)数值平均数与位置平均数 根据平均指标计算方法的不同,可以把平均根据平均指标计算方法的不同,可以把平均数数值平均数和位置平均数。数数值平均数和位置平均数。数值平均数:根据总体各单位标志值计算的数值平均数:根据总体各单位标志值计算的平均数,称为数值平均数。如算术
6、平均数、调和平均数,称为数值平均数。如算术平均数、调和平均数、几何平均数。平均数、几何平均数。位置平均数:根据总体各单位标志值在变量位置平均数:根据总体各单位标志值在变量数列中的位置计算的平均数,如众数和中位数。数列中的位置计算的平均数,如众数和中位数。第二节第二节 算术平均数算术平均数一、算术平均数的基本形式一、算术平均数的基本形式 算术平均数是分析社会经济现象一般水平算术平均数是分析社会经济现象一般水平和典型特征的最基本、最常用的一种平均指标。和典型特征的最基本、最常用的一种平均指标。基本定义为:总体标志总量与总体单位总量之比。基本定义为:总体标志总量与总体单位总量之比。算术平均数算术平均
7、数 例如,某企业某月职工工资总额为例如,某企业某月职工工资总额为180 000180 000元,元,职工总人数为职工总人数为200200人,则该企业该月职工的平均工人,则该企业该月职工的平均工资为:资为:平均工资平均工资180 000180 000200200900900(元)(元)算术平均数基本公式中的子项(总体标志总算术平均数基本公式中的子项(总体标志总量)与母项(总体单位总数)的口径必须一致,量)与母项(总体单位总数)的口径必须一致,各标志与各单位之间必须具有一一对应的关系,各标志与各单位之间必须具有一一对应的关系,属于同一总体。它区别于强度相对指标。属于同一总体。它区别于强度相对指标。
8、练习:练习:分别指出以下指标属于平均指标还分别指出以下指标属于平均指标还是强度相对指标。是强度相对指标。1.1.每百户居民拥有电话机的数量每百户居民拥有电话机的数量2.2.人均粮食产量人均粮食产量3.3.人口密度人口密度4.4.粮食平均亩产量粮食平均亩产量5.5.从业人员平均劳动报酬从业人员平均劳动报酬6.6.人均粮食消费量人均粮食消费量二、算术平均数的计算方法二、算术平均数的计算方法 计算算术平均数时,根据所掌握资料的不同,计算算术平均数时,根据所掌握资料的不同,可分为简单算术平均数和加权算术平均数两种形式。可分为简单算术平均数和加权算术平均数两种形式。(一)简单算术平均数(一)简单算术平均
9、数 掌握了总体单位标志值及单位总数资料时,可掌握了总体单位标志值及单位总数资料时,可直接利用上述公式计算算术平均数。直接利用上述公式计算算术平均数。【例例5-15-1】某车间某车间7 7名工人,日生产零件分别为名工人,日生产零件分别为1616、1414、1818、2121、2323、1919、1818件,试问该车间零件日均件,试问该车间零件日均产量?产量?平均日产量平均日产量18.418.4(件)(件)该车间日平均生产零件该车间日平均生产零件18.418.4件,它代表这件,它代表这个车间日生产零件的一般水平。个车间日生产零件的一般水平。简单算术平均数是总体标志总量与总体单位总简单算术平均数是总
10、体标志总量与总体单位总量相比求出的平均数。其计算公式为:量相比求出的平均数。其计算公式为:式中:式中:表示简单算术平均数;表示简单算术平均数;表示总体标志总量;表示总体标志总量;表示各单位标志值;表示各单位标志值;表示总体单位总量。表示总体单位总量。简单算术平均数计算方法简便,但其应用的前简单算术平均数计算方法简便,但其应用的前提是:变量数列中各个变量出现的次数相同。提是:变量数列中各个变量出现的次数相同。(二)加权算术平均数(二)加权算术平均数 当变量值已经分组,且各个标志值出现的次当变量值已经分组,且各个标志值出现的次数不同时,就必须计算加权算术平均。数不同时,就必须计算加权算术平均。【例
11、例5-25-2】某商场鞋帽部有某商场鞋帽部有1616名职工,按日销售名职工,按日销售额分组,得到的变量数列资料见表额分组,得到的变量数列资料见表5-15-1,试计算职,试计算职工平均日销售额。工平均日销售额。3 3按日销售额分组(元按日销售额分组(元/人)人)职工人数(人)职工人数(人)日销售额日销售额 (元)(元)2 2002 200 2 600 2 600 2 800 2 800 3 000 3 000 3 200 3 200 2 2 3 3 4 4 5 5 2 2 4 4004 400 7 800 7 800 11 20011 200 15 000 15 000 6 400 6 400
12、合合 计计 1616 44 800 44 800表表5-1 某商场鞋帽部职工销售额资料及计算表某商场鞋帽部职工销售额资料及计算表 根据表根据表5-15-1的资料,计算平均日销售额如下:的资料,计算平均日销售额如下:平均日销售额平均日销售额 =2800(2800(元元)在该平均数的计算中,不仅涉及到变量值在该平均数的计算中,不仅涉及到变量值x,还涉及到另一个反映变量值出现次数的量,用,还涉及到另一个反映变量值出现次数的量,用“f”表示。则有:表示。则有:=该计算公式表明,平均数的大小,不仅取决该计算公式表明,平均数的大小,不仅取决于总体各单位标志值的大小,而且还受到各单位于总体各单位标志值的大小
13、,而且还受到各单位标志值出现次数的影响。所以,式中的标志值出现次数的影响。所以,式中的“f”在在此起着此起着“权衡轻重权衡轻重”的作用,故统计学中将其称的作用,故统计学中将其称为权数,将以上的计算方法称为加权算术平均法。为权数,将以上的计算方法称为加权算术平均法。【例例5-25-2】已知某职工人数及工资总额资料,见已知某职工人数及工资总额资料,见表表5-25-2,计算该饭店职工的平均工资。,计算该饭店职工的平均工资。表表5-2 5-2 某职工人数及工资总额资料某职工人数及工资总额资料 部部 门门工工 资资 额额(元元/人人)职工人数职工人数(人人)工资总额工资总额客房部客房部餐饮部餐饮部商品部
14、商品部 830 910 1 026 56 43 9 46 480 39 130 9 234合合 计计 108 94 844 解:解:平均工资平均工资=(元元)练习:练习:某车间资料如表某车间资料如表5-35-3,试计算该车间人均日产量。,试计算该车间人均日产量。表表5-35-3 某车间工人日产量资料表某车间工人日产量资料表日产量(日产量(件件)x工人人数工人人数(人)人)f各组日总产量xf202302408506602合计合计20该车间人均日产量为:该车间人均日产量为:42(42(件件)如果我们掌握了组距式变量数列资料,如果我们掌握了组距式变量数列资料,也可以计算加权算术平均数。这时可用各组也
15、可以计算加权算术平均数。这时可用各组的组中值来代替各组标志值的实际水平。但的组中值来代替各组标志值的实际水平。但应用这种方法需要有一个假定条件,即假定应用这种方法需要有一个假定条件,即假定各单位标志值在各组内是均匀分布或对称分各单位标志值在各组内是均匀分布或对称分布的。布的。【例例5-35-3】某企业工人工资情况如表某企业工人工资情况如表5-45-4所所示。示。表表5-4 5-4 某企业工人平均工资计算表某企业工人平均工资计算表按工人平均工资分组按工人平均工资分组(元元)各组工人数各组工人数 f 组中值组中值 x各组各组工资额工资额 xf500 600 10550 5 500600 700 2
16、0650 13 000700 800 50750 37 500800 900 40850 34 000900 以以 上上 10950 9 500合计合计 130 99 500 该该企业工人平均工资为:企业工人平均工资为:=765.4(=765.4(元元)计算加权算术平均需要注意:计算加权算术平均需要注意:(1)(1)权数的引入。通过前面的计算不难发现,简单权数的引入。通过前面的计算不难发现,简单算术平均数的大小,只受一个因素即变量值本身的算术平均数的大小,只受一个因素即变量值本身的影响,当变量值的水平较高时,平均数就较大;反影响,当变量值的水平较高时,平均数就较大;反之,平均数就较小。加权算术
17、平均数的大小,却要之,平均数就较小。加权算术平均数的大小,却要同时受两个因素的影响;一是变量值本身,二是各同时受两个因素的影响;一是变量值本身,二是各个变量值出现的次数。个变量值出现的次数。(2)(2)权数的性质。平均数往往靠近次数最多的那个权数的性质。平均数往往靠近次数最多的那个变量值。权数大的变量值对平均数的影响就大,权变量值。权数大的变量值对平均数的影响就大,权数小的变量值对平均数的影响就小。数小的变量值对平均数的影响就小。(3)(3)权数的实质。权数对算术平均数的影响,不权数的实质。权数对算术平均数的影响,不是决定于权数本身数值的大小,而是决定于权数比是决定于权数本身数值的大小,而是决
18、定于权数比重的大小。权数比重重的大小。权数比重 作为权数的各组单位数占总作为权数的各组单位数占总体单位数的比重,也叫权数系数。单位数所占比重体单位数的比重,也叫权数系数。单位数所占比重大的组,其变量值对平均数的影响就越大,反之影大的组,其变量值对平均数的影响就越大,反之影响就小。响就小。=式中,式中,为权数比重为权数比重推导过程如下:推导过程如下:=练习练习1 1:有关资料如下,计算平均工资。:有关资料如下,计算平均工资。工资工资(元元)人数人数(人人)350以下以下3350 4504450 5507550 6503650以上以上3合合 计计20 练习练习2 2:有关资料如下,计算工人平均日产
19、量。:有关资料如下,计算工人平均日产量。日产量日产量(件件)x各组工人所占比重各组工人所占比重(%)6510702575408018857合计合计100 练习练习3 3:某局所属各企业按工人人数分组资料如:某局所属各企业按工人人数分组资料如下,计算该局各企业平均工人人数。下,计算该局各企业平均工人人数。企业按工人数企业按工人数分组分组(人人)各组企业占企业总数比重各组企业占企业总数比重(%)组中值组中值x50 1002100 2508250 50015500 75020750 1 000251 000 1 500201 500 2 00010合合 计计100 思考:思考:加权算术平均数与简单算
20、术平均数的加权算术平均数与简单算术平均数的关系。关系。在社会经济统计中,往往由于缺少总体在社会经济统计中,往往由于缺少总体单位数资料,不能直接采用算术平均数的方单位数资料,不能直接采用算术平均数的方法计算平均数,这时就需要将算术平均数的法计算平均数,这时就需要将算术平均数的形式加以改变。例如:市场上某种蔬菜价格形式加以改变。例如:市场上某种蔬菜价格早市为早市为0.800.80元元/公斤、中午为公斤、中午为0.750.75元元/公斤、晚公斤、晚市为市为0.600.60元元/公斤。要计算该种蔬菜一天中公斤。要计算该种蔬菜一天中的平均价格是多少,有如下两种情况。的平均价格是多少,有如下两种情况。(1
21、)(1)早、中、晚各买一公斤蔬菜,则平均价早、中、晚各买一公斤蔬菜,则平均价格为:格为:0.720.72(元(元/公斤)公斤)(2 2)如果早、午、晚各买一元钱的蔬)如果早、午、晚各买一元钱的蔬菜,则一天中所买蔬菜平均价格是用一天菜,则一天中所买蔬菜平均价格是用一天中所买蔬菜所花的金额中所买蔬菜所花的金额3 3元钱除以该种数量元钱除以该种数量4.254.25公斤公斤,即(即()公斤,因公斤,因此此0.71(0.71(元公斤元公斤)第二节第二节 调和平均数调和平均数 一、调和平均数的概念一、调和平均数的概念 调和平均数是各单位标志值倒数的算调和平均数是各单位标志值倒数的算术平均数的倒数,又称倒数
22、平均数。一般术平均数的倒数,又称倒数平均数。一般有简单调和平均数和加权调和平均数两种。有简单调和平均数和加权调和平均数两种。二、简单调和平均数二、简单调和平均数 简单调和平均数是各个标志值倒数的简单调和平均数是各个标志值倒数的简单算术平均的倒数。在各标志值相应的简单算术平均的倒数。在各标志值相应的标志总量均为一个单位的情况下求平均数标志总量均为一个单位的情况下求平均数时,应计算简单调和平均数。时,应计算简单调和平均数。其计算公式为:其计算公式为:=式中:式中:调和平均数;调和平均数;x 各变量值各变量值(即标志值即标志值);n 变量值的个数。变量值的个数。【例例5-45-4】某商品在淡季、平季
23、、旺季的价格分某商品在淡季、平季、旺季的价格分别是别是100100元、元、116116元、元、140140元,假设分别以淡季、平元,假设分别以淡季、平季、旺季的价格购买金额相等的这种商品,求该商季、旺季的价格购买金额相等的这种商品,求该商品的平均价格。品的平均价格。=116.46(=116.46(元元)三、加权调和平均数三、加权调和平均数 加权调和平均数是各个标志值倒数的加权算加权调和平均数是各个标志值倒数的加权算术平均数的倒数。在实际工作中各标志值相应的术平均数的倒数。在实际工作中各标志值相应的标志总量往往是不等的,在这种情况下求平均数标志总量往往是不等的,在这种情况下求平均数时,应计算加权
24、调和平均数。其计算公式为:时,应计算加权调和平均数。其计算公式为:=式中:式中:m 总体各组标志总量;总体各组标志总量;x 总体各组标志值;总体各组标志值;总体标志总量。总体标志总量。在前面的例子中,如果每种蔬菜不是各买在前面的例子中,如果每种蔬菜不是各买1 1元,元,而是早市买而是早市买4 4元钱的蔬菜,午市买元钱的蔬菜,午市买3 3元钱的、晚市买元钱的、晚市买2 2元钱的蔬菜,则平均每公斤的价格为:元钱的蔬菜,则平均每公斤的价格为:0.730.73(元)(元)事实上,加权调和平均数与加权算术平事实上,加权调和平均数与加权算术平均数并无本质的区别,只是由于掌握资料的均数并无本质的区别,只是由
25、于掌握资料的不同,而采用了不同的计算形式而已。当已不同,而采用了不同的计算形式而已。当已知各组标志值之和知各组标志值之和 xf 和各组标志值(或组中和各组标志值(或组中值)值)x,而不知道各组的次数,而不知道各组的次数f时,设时,设mxf,则加权算术平均数的公式可做如下变形:则加权算术平均数的公式可做如下变形:练习:某车间资料如表练习:某车间资料如表5-55-5所示,计算平所示,计算平均日产量。均日产量。表表5-5 5-5 某车间资料某车间资料日产量(件)日产量(件)x各组日产量各组日产量m=xf 2040 23060 240320 850300 660120 2合计合计840 20 调和平均
26、数的特点:调和平均数的特点:(1 1)调和平均数是根据总体的全部变量值计)调和平均数是根据总体的全部变量值计算的结果。当资料不完整时,无法计算。算的结果。当资料不完整时,无法计算。(2 2)调和平均数易受极端值的影响,而且受)调和平均数易受极端值的影响,而且受极小值的影响大于受极大值的影响。这是因为调极小值的影响大于受极大值的影响。这是因为调和平均数中变量值采用的是倒数,小数字的倒数和平均数中变量值采用的是倒数,小数字的倒数值大于大数字的倒数值。值大于大数字的倒数值。(3 3)调和平均数的应用范围较小。如果在变)调和平均数的应用范围较小。如果在变量值中有一项为量值中有一项为0 0,则无法求其确
27、定的调和平均数。,则无法求其确定的调和平均数。第四节第四节 几何平均数几何平均数一、几何平均数的概念一、几何平均数的概念 几何平均数就是几何平均数就是n个变量连乘积的个变量连乘积的n次方根。次方根。二、几何平均数的计算方法二、几何平均数的计算方法 由于掌握资料差异,几何平均数也分为简单由于掌握资料差异,几何平均数也分为简单几何平均数和加权几何平均数。几何平均数和加权几何平均数。(一)简单几何数(一)简单几何数 设有设有n个变量值,个变量值,x1,x2,xn,由几何平由几何平均数定义可得出简单几何平均数的计算公式为:均数定义可得出简单几何平均数的计算公式为:式中式中:G 几何平均数;几何平均数;
28、连乘符号。连乘符号。【例例5-55-5】某机械厂生产机器某机械厂生产机器,设有毛坯、粗加工、设有毛坯、粗加工、精加工、装配四个连续作业的车间,各车间某批产精加工、装配四个连续作业的车间,各车间某批产品的合格率分别为品的合格率分别为96%96%,93%93%,95%95%,97%97%。求各车间。求各车间制品平均合格率。制品平均合格率。分析:由于全厂产品的总合格率并不等于各车间分析:由于全厂产品的总合格率并不等于各车间制品的合格率总和,后续车间的合格率是在前一车制品的合格率总和,后续车间的合格率是在前一车间制品全部合格的基础上计算的。全厂产品的总合间制品全部合格的基础上计算的。全厂产品的总合格率
29、应等于各车间制品合格率的连乘积,所以不能格率应等于各车间制品合格率的连乘积,所以不能采用算术平均数和调和平均数公式计算平均合格率,采用算术平均数和调和平均数公式计算平均合格率,而应用几何平均法来求。而应用几何平均法来求。车间制品平均合格率车间制品平均合格率 95.24%95.24%第五节第五节 众数和中位数众数和中位数一、众数一、众数(一)众数的概念(一)众数的概念 众数是指总体中出现次数最多的标志众数是指总体中出现次数最多的标志值。它是总体中最常用遇到的标志值,是值。它是总体中最常用遇到的标志值,是最普遍的最一般的标志值。最普遍的最一般的标志值。(二)众数的确定(二)众数的确定 确定众数,首
30、先要将数据资料进行分确定众数,首先要将数据资料进行分组,编制变量数列;然后,根据变量数列组,编制变量数列;然后,根据变量数列的不同种类采用不同的方法。的不同种类采用不同的方法。(1)(1)根据单项式数列确定众数根据单项式数列确定众数 在单项式数列情况下,确定众数比较简在单项式数列情况下,确定众数比较简单,只需要观察找出次数出现最多的那个标单,只需要观察找出次数出现最多的那个标志值即可。志值即可。(2)(2)根据组距式数列确定众数根据组距式数列确定众数 根据组距式数列确定众数,需采用插补根据组距式数列确定众数,需采用插补法。一般步骤是先确定众数组,然后计算众法。一般步骤是先确定众数组,然后计算众
31、数的近似值。数的近似值。【例例5-65-6】2003 2003年某地区职工家庭人均月年某地区职工家庭人均月收入资料见表收入资料见表5-55-5。表表5-55-5 20032003年某地职工家庭人均月收入资料表年某地职工家庭人均月收入资料表人均月收入(元)人均月收入(元)家庭户数(户)家庭户数(户)300300以下以下3003004004004004005005005005006006006006007007007007008008008008009009009009001 1 000 00010001000以上以上 260 260 660 6601 8001 8003 2003 2002 00
32、02 0001 0001 000 800 800 600 600 400 400合计合计 10 72010 720 从表从表5-55-5中的家庭户数列可知,家庭户数中的家庭户数列可知,家庭户数最多的是最多的是32003200户,它所对应的人均月收入为户,它所对应的人均月收入为500500600600元。因此,元。因此,500500600600元这一人均月元这一人均月收入组就是众数组,它反映了人均收入的一收入组就是众数组,它反映了人均收入的一般水平。然后利用下限公式或上限公式计算般水平。然后利用下限公式或上限公式计算众数的近似值:众数的近似值:下限公式:下限公式:上限公式:上限公式:式中,式中,
33、M0 0 众数;众数;U 众数组的上限;众数组的上限;L 众数组的下限;众数组的下限;1 1 众数组次数与下一组次数之差;众数组次数与下一组次数之差;2 2 众数组次数与上一组次数之差;众数组次数与上一组次数之差;i 组距。组距。根据表中的资料,将有关数字代入下限公式,根据表中的资料,将有关数字代入下限公式,得到众数的近似值:得到众数的近似值:众数具有以下几个特点:众数具有以下几个特点:第一,由于众数是根据变量值出现的次数确第一,由于众数是根据变量值出现的次数确定的,不需要通过全部变量值来计算,因此它不定的,不需要通过全部变量值来计算,因此它不受极端值的影响。受极端值的影响。第二,在组距数列中
34、,各组颁布的次数组距第二,在组距数列中,各组颁布的次数组距大小的影响,所以根据组距数列确定数列时,要大小的影响,所以根据组距数列确定数列时,要保证各组组距相等。保证各组组距相等。第三,在一个次数分布中有几个众数,称为第三,在一个次数分布中有几个众数,称为多众数;有两个众数,称为双重众数,说明总体多众数;有两个众数,称为双重众数,说明总体内存在不同性质的事物。内存在不同性质的事物。二、中位数二、中位数 (一)中位数的概念(一)中位数的概念 中位数是指将总体各单位标志值按大小顺序排中位数是指将总体各单位标志值按大小顺序排列后,处于中间位置的那个标志值。由于它的位置列后,处于中间位置的那个标志值。由
35、于它的位置居中,其数值不受极端数值的影响,也能表明总体居中,其数值不受极端数值的影响,也能表明总体各单位标志值的一般水平。各单位标志值的一般水平。(二)中位数的确定(二)中位数的确定 根据所掌握资料的不同,中位数的确定方法有根据所掌握资料的不同,中位数的确定方法有两种,即根据未分组资料确定中位数和根据分组资两种,即根据未分组资料确定中位数和根据分组资料确定中位数。料确定中位数。1.1.根据未分组资料确定中位数根据未分组资料确定中位数 将标志值按大小排序将标志值按大小排序 确定中位数所在的位置确定中位数所在的位置 与中位数所在位置相对应的标志值即为中位数。与中位数所在位置相对应的标志值即为中位数
36、。中位数位置中位数位置=如果标志值的基数是奇数,那么中间位置的那个如果标志值的基数是奇数,那么中间位置的那个标志值,就是中位数。标志值,就是中位数。例如:某班组有例如:某班组有7 7名工人,日生产零件数分别为名工人,日生产零件数分别为1616,1717,1818,2020,2121,2222,2323件,则中位数所在位件,则中位数所在位置为第置为第4 4位位(7+1)/2(7+1)/2,第,第4 4位所对应的标志值,即位所对应的标志值,即2020件就是中位数,它代表了这件就是中位数,它代表了这7 7名工人日生产零件数的名工人日生产零件数的一般水平。一般水平。以上是标志值的项数是奇数的情况。以上
37、是标志值的项数是奇数的情况。如果标志值的项数是偶数,那么处于中间位置如果标志值的项数是偶数,那么处于中间位置左右两边的标志值的算术平均数,就是中位数。假左右两边的标志值的算术平均数,就是中位数。假如上述班组还有如上述班组还有1 1名学徒工人,日生产零件为名学徒工人,日生产零件为1414件,件,那么他们生产零件数按顺序排列为那么他们生产零件数按顺序排列为1414,1616,1717,1818,2020,2121,2222,2323件。此时中位数的位置为第件。此时中位数的位置为第4.54.5位位(8+1)/2(8+1)/2,则中位数为,则中位数为1919件件(18+20)/2(18+20)/2,即
38、第,即第4 4位位和第和第5 5位所对应的标志值的算术平均数。位所对应的标志值的算术平均数。2.2.根据分组资料确定中位数根据分组资料确定中位数 根据单项数列确定中位数根据单项数列确定中位数 这时要考虑标志值的分布情况,按一这时要考虑标志值的分布情况,按一定方法计算累计次数(向上累计和向下累定方法计算累计次数(向上累计和向下累计)。计)。【例例5-75-7】某学院某学院2002200220032003学年共有学年共有3030名同学获得奖学金,其分布情况见表名同学获得奖学金,其分布情况见表5-65-6。表表5-6 5-6 学生奖学金分布情况计算表学生奖学金分布情况计算表 由上表资料计算得中位数位
39、置为由上表资料计算得中位数位置为30302=152=15,即,即中位数在第中位数在第1515人位置上。人位置上。奖学金金额(元/人)人数(人)人 数 累 计向上累计(人)向下累计(人)300 500 8001 0001 5003687639172430302721136 合 计30 无论是向上累计还是向下累计法,所选择的累无论是向上累计还是向下累计法,所选择的累计人数数值都应是不小于计人数数值都应是不小于1515的最小数值。上表中的的最小数值。上表中的1717和和2121符合这一要求,它们对应的都是第三组,即符合这一要求,它们对应的都是第三组,即800800元元/人就是中位数。人就是中位数。根
40、据组距式数列确定中位数根据组距式数列确定中位数 以表以表5-75-7为例。为例。表表5-7 5-7 按餐饮收入分组按餐饮收入分组(万元万元)城市数城市数(个个)累计城市数累计城市数(个个)向上累计向上累计向下累计向下累计5 0005 000以下以下5 0005 00015 00015 00015 00015 00025 00025 00025 00025 00035 00035 00035 00035 000以上以上4 49 98 85 54 44 413132121262630303030262617179 94 4合计30 确定中位数的基本步骤如下:确定中位数的基本步骤如下:第一步,确定中
41、位数所在的组。第一步,确定中位数所在的组。中位数位置中位数位置=15=15 由此可知,中位数在餐饮收入为由此可知,中位数在餐饮收入为15 00015 000万万25 00025 000万元的这一组里。万元的这一组里。第二步,结合向上第二步,结合向上(向下向下)累计次数确定了中累计次数确定了中位数所在的组。位数所在的组。第三步,运用下限或上限公式进行计算,以第三步,运用下限或上限公式进行计算,以求得近似的中位数数值。求得近似的中位数数值。一般用以下两个公式估算中位数值:一般用以下两个公式估算中位数值:下限公式:下限公式:上限公式:上限公式:式中,式中,Me 中位数;中位数;L 中位数所在组的下限
42、;中位数所在组的下限;U 中位数所在组的上限;中位数所在组的上限;Sm-1-1中位数所在组下一组的向上中位数所在组下一组的向上 累计次数;累计次数;Sm+1+1中位数所在组上一组的向下中位数所在组上一组的向下 累计次数;累计次数;fm 中位数所在的次数;中位数所在的次数;i 中位数所在组的组距;中位数所在组的组距;f 总次数。总次数。按下限公式可得中位数:按下限公式可得中位数:(万元万元)练习:某企业职工月工资资料如下表所示,试练习:某企业职工月工资资料如下表所示,试确定其中位数。确定其中位数。月工资月工资(元元)人数人数(人人)向上累计向上累计向下累计向下累计500 600110600 70
43、0180700 800320800 900460900 10008501 000 1 1002501 100 1 2001301 200 1 300701 300 1 400201 400 1 50010 合 计2 400第六节第六节 应用平均指标需要应用平均指标需要 注意的问题注意的问题 一、注意社会经济现象的同质性一、注意社会经济现象的同质性 二、注意用组平均数补充说明总平均数二、注意用组平均数补充说明总平均数 三、注意用分配数列补充说明平均数三、注意用分配数列补充说明平均数第七节第七节 标志变异指标标志变异指标一、标志变异指标的概念和作用一、标志变异指标的概念和作用(一)标志变异指标的概
44、念(一)标志变异指标的概念 标志变异指标是指反映总体中各单位标志变异指标是指反映总体中各单位志值差异程度的综合指标,又称标志变动。志值差异程度的综合指标,又称标志变动。平均指标表现为总体各单位标志值的平均指标表现为总体各单位标志值的一般水平,反映各单位标志值的集中趋势。一般水平,反映各单位标志值的集中趋势。标志变异指标则表现为总体各单位标标志变异指标则表现为总体各单位标志值的变异程度,反映各单位标志值的离志值的变异程度,反映各单位标志值的离中趋势。中趋势。(二)标志变异指标的作用(二)标志变异指标的作用1.1.标志变异指标可以衡量平均数代表性的标志变异指标可以衡量平均数代表性的大小大小 平均指
45、标作为总体各单位标志值一般水平均指标作为总体各单位标志值一般水平的代表性指标,其代表性大小与标志变异平的代表性指标,其代表性大小与标志变异指标的大小成反比关系,即标志变异指标越指标的大小成反比关系,即标志变异指标越大大,平均指标的代表性越小平均指标的代表性越小,反之则平均指标反之则平均指标的代表性越大。的代表性越大。【例例5-75-7】有三组工人的年龄(单位:岁)有三组工人的年龄(单位:岁)如下:如下:甲组:甲组:2020,2020,2020,2020,20 =2020 =20乙组:乙组:1919,1919,2020,2020,22 =2022 =20丙组:丙组:1717,1818,1919,
46、2121,25 =2025 =20 三组工人的平均年龄都是三组工人的平均年龄都是2020岁,但各组岁,但各组年龄差异程度不一样,甲组年龄无差异,即年龄差异程度不一样,甲组年龄无差异,即变动度为变动度为0 0岁。乙组的变动度为岁。乙组的变动度为3 3岁岁(22(2219)19)。丙组的变动最大为丙组的变动最大为8 8岁岁(25(2517)17)。因此,用平。因此,用平均年龄均年龄2020岁去代表各组工人的年龄,其代表岁去代表各组工人的年龄,其代表性是不一样的。性是不一样的。2.2.标志变异指标可以反映社会经济活动过标志变异指标可以反映社会经济活动过程的均衡性、节奏性和稳定性程的均衡性、节奏性和稳
47、定性 计算同类总体的标志变异指标,并进行计算同类总体的标志变异指标,并进行比较,可以观察标志值变动的稳定程度或均比较,可以观察标志值变动的稳定程度或均衡状态。如我们往往需要利用标志变异指标衡状态。如我们往往需要利用标志变异指标来测定产品质量的稳定性。来测定产品质量的稳定性。3.3.标志变异指标是科学地确定必要的抽样标志变异指标是科学地确定必要的抽样单位数应考虑的重要因素单位数应考虑的重要因素二、标志变异指标的计算与分析二、标志变异指标的计算与分析 标志变异指标主要有全距、平均差、标志变异指标主要有全距、平均差、标准差、变异系数等。标准差、变异系数等。(一)全距(一)全距 全距是指总体各单位标志
48、值中两个极全距是指总体各单位标志值中两个极端数值,即最大值与最小值之差,用端数值,即最大值与最小值之差,用“R”来表示。来表示。未分组资料或单项式数列中全距的计算未分组资料或单项式数列中全距的计算公式为:公式为:R最大标志值最小标志值最大标志值最小标志值 分组资料中全距的计算公式为:分组资料中全距的计算公式为:R最高组的上限最低组的下限最高组的上限最低组的下限 以例以例5-75-7的资料为例,计算全距如下:的资料为例,计算全距如下:甲组:甲组:R R202020200 0(岁)(岁)乙组:乙组:R R222219193 3(岁)(岁)丙组:丙组:R R252517178 8(岁)(岁)三组平均
49、年龄均为三组平均年龄均为2020岁,但从全距来看岁,但从全距来看丙组的变异程度大,甲组的变异程度最小。丙组的变异程度大,甲组的变异程度最小。全距的特点:全距的特点:反映了总体各单位标志值的变动范围。它反映了总体各单位标志值的变动范围。它的优点是计算简便,意义明确、能准确地反的优点是计算简便,意义明确、能准确地反映总体中两极的差距。在日常如证券市场的映总体中两极的差距。在日常如证券市场的行情分析中应用很广泛。行情分析中应用很广泛。缺点:全距仅表示总体各单位标志值的变缺点:全距仅表示总体各单位标志值的变动范围,没有包括中间各标志值的变异情况,动范围,没有包括中间各标志值的变异情况,也无法反映变量数
50、列的次数分布情况,是对也无法反映变量数列的次数分布情况,是对变异程度较为粗略的反映。因此,它不能反变异程度较为粗略的反映。因此,它不能反映总体未必会变异程度,也不能很好地反映映总体未必会变异程度,也不能很好地反映平均指标的代表性。平均指标的代表性。(二)平均差(二)平均差 平均差是总体各单位标志值与其算术平均差是总体各单位标志值与其算术平均数离差的绝对值的算术平均数,用符平均数离差的绝对值的算术平均数,用符号号“AD”来表示。来表示。计算平均差的目的是测算各单位标志计算平均差的目的是测算各单位标志值与其算术平均数离差的大小。因为离差值与其算术平均数离差的大小。因为离差有正、有负,还可能有零,所