《《ch综合指标》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《ch综合指标》PPT课件.ppt(126页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章综合指标 1第一节总量指标和相对指标第二节集中趋势的度量平均指标第三节离散程度的度量变异指标第四节成数指标2指指标标(亦称统计指标亦称统计指标)说明总说明总体的综合数量特征体的综合数量特征按按内容分:数量指标、质量指标。内容分:数量指标、质量指标。第一节第一节 总量指标和相对指标总量指标和相对指标知识点回顾知识点回顾3数量指标数量指标如:人口数、工业增加值、货运量等如:人口数、工业增加值、货运量等用绝对数表示用绝对数表示质量指标质量指标如:人口的性别比例、单位产品成本等如:人口的性别比例、单位产品成本等用相对数或平均数表示用相对数或平均数表示4综合指标按标志值的表现形式分:总量指标总量指
2、标相对指标相对指标平均指标平均指标5(一)概念和作用(一)概念和作用一、总量指标(绝对数)一、总量指标(绝对数)总量指标是反映社会经济现象的总规模、总水平或工作总量的统计指标。总量指标表现形式是绝对数,也可表现为绝对差数例如:例如:例如:例如:2007200720072007年我国财政收入年我国财政收入年我国财政收入年我国财政收入51321.7851321.7851321.7851321.78亿元,财亿元,财亿元,财亿元,财政支出政支出政支出政支出49781.3549781.3549781.3549781.35亿元,财政盈余亿元,财政盈余亿元,财政盈余亿元,财政盈余1540.281540.28
3、1540.281540.28亿元。亿元。亿元。亿元。6作用:总量指标能反映一个国家的基本国情和总量指标能反映一个国家的基本国情和国力,反映某部门、单位等人、财、国力,反映某部门、单位等人、财、物的基本数据,是认识社会经济现象的起点。物的基本数据,是认识社会经济现象的起点。总总量指标是进行决策和科学管理的依据量指标是进行决策和科学管理的依据之一之一 。总总量指标是计算相对指标和平均指标的量指标是计算相对指标和平均指标的基础。基础。71、按其反映的内容不同可分为:-总总体单位总量体单位总量 总体单位数(注:指统计单总体单位数(注:指统计单位)的总和位)的总和-总总体标志总量体标志总量 总体单位某种
4、标志值的总和总体单位某种标志值的总和(二)总量指标的分类 8例例总体标志总量总体标志总量总体单位总量总体单位总量总体标志总量总体标志总量总体单位总量总体单位总量92、按其反映的时间状况不同可分为:时时期指标期指标 反映现象在某一时期发展过程反映现象在某一时期发展过程的总数量。的总数量。(连续登记,与时间长短有关,连续登记,与时间长短有关,具有可加性具有可加性)时时点指标点指标 反映现象在某一时刻的数量状反映现象在某一时刻的数量状况。况。(一次性登记,与时间间隔无关,一次性登记,与时间间隔无关,不不具有可加性具有可加性)钢产量,工资总额,学生人数,商品钢产量,工资总额,学生人数,商品零售额,出生
5、人数,年末库存零售额,出生人数,年末库存10国内生产总值GDP国内生产总值是20世纪最伟大的发明之一。GDP(GrossDomesticProduct)是指一个国家(或地区)在一定时期内所有常住单位生产经营活动的全部最终成果。GNP(GrossNationalProduct)国民生产总值是指一个国家(或地区)所有国民在一定时期内新生产的产品和服务价值的总和。GNP与GDP的关系是:GNP等于GDP加上本国投在国外的资本和劳务的收入再减去外国投在本国的资本和劳务的收入。11GDP核算的三种方法生产法GDP=各行业增加值总和增加值=总产出-中间消耗收入法GDP=劳动者报酬+生产税净额+固定资产折旧
6、+营业盈余使用法GDP=总消费+总投资+净出口12GDP的作用一、国内生产总值与宏观经济运行状况的判断1、经济增长率国内生产总值增长率2、通货膨胀率国内生产总值缩减指数3、失业率/就业13二、国内生产总值在宏观经济管理中的作用1、战略目标2、规划、计划3、财政金融政策十七大:人均到年翻两番目标14三、国内生产总值在对外交往中的重要作用1、在一定程度上决定了我国承担的国际义务152、在一定程度上决定了我国享受的优惠待遇世界银行确定的一些优惠政策(1999):人均GNP755美元以下:享受软贷款和7.5%的土建工程招标优惠政策人均GNP756至1445美元之间:享受软贷款和20年期的硬贷款人均GN
7、P1446至2995美元:享受17年期的硬贷款人均GNP2996至5225美元:享受15年期的硬贷款人均GNP5226美元以上:不再享受硬贷款16二、相对指标(相对数)是两个有联系指标数值对比而成的。是两个有联系指标数值对比而成的。居民消费价格比上年上涨居民消费价格比上年上涨4.8%4.8%,其中食品,其中食品价格上涨价格上涨12.3%12.3%。商品零售价格上涨。商品零售价格上涨3.8%3.8%。例例(一)相对指标的概念(一)相对指标的概念 17企业7月份劳动生产率(万元)8月份劳动生产率(万元)8月比7月发展速度(%)甲1.942103.09+600元乙0.520.56107.69+400
8、元 从上表中看来,好象甲厂比乙厂劳动生产从上表中看来,好象甲厂比乙厂劳动生产率高率高 (600400 600400);而将其换算成相对指);而将其换算成相对指标,实际发展速度是乙厂大于甲厂。由此可看标,实际发展速度是乙厂大于甲厂。由此可看出相对指标可以弥补总量指标的不足。出相对指标可以弥补总量指标的不足。例例18-人口密度:人口密度:人人/平方公里平方公里-平均每人分摊的粮食产量:平均每人分摊的粮食产量:千克千克/人人-系数、倍数和番数:系数、倍数和番数:对比基数抽象化为对比基数抽象化为1 1;-成数:成数:对比基数为对比基数为1010;-百分数和百分点:百分数和百分点:对比基数为对比基数为1
9、00100;-千分数:千分数:对比基数对比基数10001000。相对指标的数值有两种表现形式:相对指标的数值有两种表现形式:无无名数,分以下几种名数,分以下几种:有有名数名数191、结构相对指标 (二)相对指标的种类及其计算(二)相对指标的种类及其计算某班某班5050名学生,男生名学生,男生2727名,女生名,女生2323名,则男生比名,则男生比重为重为54%54%,女生比重为,女生比重为46%46%;20072007年第三产业比重为年第三产业比重为39.1%39.1%;恩格尔系数:食品支出金额恩格尔系数:食品支出金额/总支出金额总支出金额100%100%表明总体内各组成部分的分配比重表明总体
10、内各组成部分的分配比重202、比例相对指标 总体内不同部分的对比,反映现象各组之间的关总体内不同部分的对比,反映现象各组之间的关系,分析现象是否协调一致,比例是否适应。系,分析现象是否协调一致,比例是否适应。某班某班5050名学生,男生名学生,男生2727名,女生名,女生2323名,则男女性别比名,则男女性别比为为117.39117.39:100100,或男生人数为女生人数的,或男生人数为女生人数的117.39%117.39%20072007年我国三次产业结构为年我国三次产业结构为1212:4949:3939;21常用的比例形式有两种:1.1.将作为比较基础的数值抽象化为将作为比较基础的数值抽
11、象化为1 1、1010、100100或或10001000,看被比较的数值是多少。,看被比较的数值是多少。我国我国20002000年第五次人口普查结果,男女年第五次人口普查结果,男女性别比例为性别比例为106.74:100106.74:100,这说明以女性为,这说明以女性为100100,男性人口是女性人口数的,男性人口是女性人口数的106.74106.74倍。倍。简称性比例简称性比例106.74106.74。目前已上升到。目前已上升到116.86116.86:100100。例例222.2.首先将总体全部数值抽象化为首先将总体全部数值抽象化为100100,求得,求得各部分数值在总体中所占百分数,然
12、后将各各部分数值在总体中所占百分数,然后将各部分的百分数连比得比例相对数。部分的百分数连比得比例相对数。20072007年全国年全国GDPGDP抽象化为抽象化为100100,第一产,第一产业、第二产业、第三产业的比例为:业、第二产业、第三产业的比例为:11.711.7:49.249.2:39.139.1;而浙江省的三次产业结构为而浙江省的三次产业结构为5.554.140.45.554.140.4 例例233、比较相对指标同一时间同类指标在不同空间上的对比,反同一时间同类指标在不同空间上的对比,反映它们之间的差距和发展不平衡程度。映它们之间的差距和发展不平衡程度。20042004年我国的人口密度
13、为年我国的人口密度为136136人人/平方公里,日本平方公里,日本为为351351人人/平方公里,日本为我国的平方公里,日本为我国的2.62.6倍;倍;20072007年工行的营业收入为年工行的营业收入为515.26515.26亿美元,建行的亿美元,建行的营业收入为营业收入为413.07413.07亿美元,则工行营业收入是建亿美元,则工行营业收入是建行的行的1.251.25倍;倍;244、强度相对指标 两个性质不同而又有联系的总量指标之间的两个性质不同而又有联系的总量指标之间的对比,说明现象的强度、密度和普遍程度。对比,说明现象的强度、密度和普遍程度。25作用(1)说明社会经济现象的强弱程度,
14、反映一个)说明社会经济现象的强弱程度,反映一个国家的经济发展水平高低和经济实力强弱。国家的经济发展水平高低和经济实力强弱。20052005年我国年平均人口数为年我国年平均人口数为130372130372万人,万人,国内生产总值为国内生产总值为183084.8183084.8亿元,钢产量为亿元,钢产量为7309573095万吨,粮食产量为万吨,粮食产量为48402.248402.2万吨。万吨。例例26人口密度商业网点数(2)反映现象的密度或普遍程度。)反映现象的密度或普遍程度。某城市人口某城市人口100100万人,有零售商业机构万人,有零售商业机构50005000个,则:个,则:例例27每公顷耕
15、地拥有的拖拉机台数每万元资金实现的利税额每万元产值创造的利润(3)反映社会生产活动的效果,一般指各种技术)反映社会生产活动的效果,一般指各种技术经济指标。经济指标。28强度相对指标与平均指标的区别()指标的含义不同。强度相对指标说明的是某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。()计算方法不同。强度相对指标分子与分母的联系,只表现为一种经济关系,而平均指标是在一个同质总体内标志总量和单位总量的比例关系。分子与分母的联系是一种内在的联系,即分子是分母(总体单位)所具有的标志,对比结果是对总体各单位某一标志值的平均。295、动态相对指标(发展速度)基基期
16、期 作为对比标准的时间作为对比标准的时间报报告期告期 同基期比较的时期,也称计算期同基期比较的时期,也称计算期某一指标在不同时间上的数值对比,用来反某一指标在不同时间上的数值对比,用来反映事物在时间上的发展变化情况。映事物在时间上的发展变化情况。302005年和2006年城镇居民人均可支配收入分别为10493.0元和11759.5元316 6、计划完成程度相对指标、计划完成程度相对指标 用于表明预期目的的实现程度。用于表明预期目的的实现程度。32(1)计划任务为绝对数某洗衣机厂某洗衣机厂20072007年计划生产洗衣机年计划生产洗衣机6 6万台,实万台,实际生产了际生产了6.66.6万台,试计
17、算该厂洗衣机产量计万台,试计算该厂洗衣机产量计划完成情况。划完成情况。33(2)计划任务为相对数某企业计划资金利润率为某企业计划资金利润率为20%20%,实际资金利润,实际资金利润率为率为18%18%,试计算资金利润率的完成程度。,试计算资金利润率的完成程度。某企业劳动生产率计划提高某企业劳动生产率计划提高10%10%,实际劳动生,实际劳动生产率提高了产率提高了15%15%,试计算劳动生产率提高的计,试计算劳动生产率提高的计划完成程度。划完成程度。34(3)中长期计划完成情况的检查A.水平法。水平法。根据规划期最末一年实际达到的水平与规划水平相比,来确定全期是否完成了规划。采用水平法检查规划完
18、成情况,只要有连续采用水平法检查规划完成情况,只要有连续一年时间,实际完成的水平达到计划要求的一年时间,实际完成的水平达到计划要求的最后一年的水平,就算完成了计划,剩余的最后一年的水平,就算完成了计划,剩余的时间即为提前完成计划的时间。时间即为提前完成计划的时间。35指标 第一年第二年第三年 第四年第五年上半年下半年第一季度第二季度第三季度第四季度第一季度第二季度第三季度第四季度产量 30 32 17 191010 11 12 12 12 13 13某产品按照五年规划,最后一年产量应达到某产品按照五年规划,最后一年产量应达到4545万吨,规划执行情况如下表,问该产品五年规万吨,规划执行情况如下
19、表,问该产品五年规划完成情况以及提前完成时间。划完成情况以及提前完成时间。该产品在第四年的第二季度到第五年的第一该产品在第四年的第二季度到第五年的第一季度的连续一年中达到了规划末年的水平季度的连续一年中达到了规划末年的水平4545万吨,故提前三个季度完成了五年规划。万吨,故提前三个季度完成了五年规划。36B.累计法。累计法。在中长期计划中,实际完成的累计数和规划的累计数对比,反映累计规划的完成程度。从中长期计划期开始到某一时期为止,所累从中长期计划期开始到某一时期为止,所累计完成的实际数达到了计划规定的累计数,计完成的实际数达到了计划规定的累计数,就算完成了计划。就算完成了计划。37某市“十五
20、规划”规定五年造林总面积达到500万亩,如下表,试问该市造林完成情况与以及提前完成时间。年份20012002200320042005造林面积100120130150160该市从该市从20012001年到年到20042004年累计完成了年累计完成了500500万亩,万亩,提前一年五成了提前一年五成了“十五十五”规划。规划。382.2.相相对指标要和总量指标结合起来运用。对指标要和总量指标结合起来运用。1.1.注注意二个对比指标的可比性。意二个对比指标的可比性。(三)正确运用相对指标的原则3.3.多多种相对数结合运用种相对数结合运用39如如:检查一个企业的发展情况,我们可以从计:检查一个企业的发展
21、情况,我们可以从计划完成程度,动态相对数,结构相对数和比例划完成程度,动态相对数,结构相对数和比例相对数等等综合反映。相对数等等综合反映。例:例:某工厂某工厂20082008年产量计划完成程度为年产量计划完成程度为110110,20082008年的产量计划比上年增长年的产量计划比上年增长8 8,试问,试问20082008年年的实际产量比上年实际产量增长了多少?的实际产量比上年实际产量增长了多少?40第二节集中趋势的度量平均指标41看看你的薪水当你领到第一个月工资2500元时,会有什么样的感受?你的收入比浙林毕业生平均收入高出近500元(舒服?)其实,你的收入只是浙林毕业生中最常见的情形(汗)说
22、实话,你这收入充其量就是中间水平,比你更会赚钱的浙林学生多如牛毛(郁闷?)平均数平均数众数众数中位数中位数422007毕业生薪水排行榜根据一份网上流传的“2007毕业生薪水排行榜”的榜单大连外国语学院以5050元位居榜首,电子科技大学以4900元紧随其后,最低的为海南大学,仅为1017元;清华、北大则跌出十名之外,名列第19和第27名;厦大则以2233元位居第40位。通过一组简单的数据对比,我们可以知道所关注对通过一组简单的数据对比,我们可以知道所关注对象的一般状况,也可以了解自己所处什么样的位置。象的一般状况,也可以了解自己所处什么样的位置。43如果我告诉你,你这2500元的工资还行,是不是
23、过于抽象?换个角度,如果我再告诉你:浙林毕业生平均工资为2133元;浙林毕业生工资大多是2500元;浙林毕业生工资中间水平是2300元;全国高校毕业生平均工资是1800元;全国高校毕业生工资大多不到2000元;44在这一节,我们将学习:分布集中趋势的度量(1)数值平均数算术平均数调和平均数几何平均数(2)位置平均数众数中位数45一、平均指标的定义和作用1.定义平均指标是同类社会经济现象在一定时间、地点条件下所达到的一般水平,是度量分布集中趋势或中心位置的指标。46数据分布的集中趋势(Centraltendency)一组数据向其中心值靠拢的倾向和程度度量集中趋势就是寻找数据水平的代表值或中心值4
24、72、平均指标的作用(1)反映总体各单位变量分布的集中趋势和一般水平;例:2006级财务管理专业统计学考试平均成绩为82分。从这个数据,我们可以知道多数同学的成绩集中在82分附近集中趋势;并且我们也知道该门成绩的一般水平为82分。48(2)同类现象在不同空间的对比;比较不同单位的发展水平,一般不能用总量指标做对比,它容易受到规模大小不同的影响,应当采用平均指标来对比。例:按班级分,1班和2班的平均成绩分别为84和82分。49(3)同一总体在不同时间上的比较;例:2006级经管系,统计学期中考和期末考成绩分别是79分和82分。50(4)用于分析现象之间的依存关系。例:某乡某种农作物的耕作深度与收
25、获率的关系耕作深度分组(cm)地块数平均收获率(斤/亩)10-12740012-141046014-161654016-1818-2012562068051(5)可以进行数量上的推算。例:一家拥有1000名员工的公司,抽取200名调查得平均每月工资为3000元,那这家公司每年要支付多少工资给员工呢?52 算术平均数算术平均数数值平均数数值平均数调和平均数调和平均数 几何平均数几何平均数 众数众数位置平均数位置平均数中位数中位数3.平均指标的种类53二、算术平均数(Arithmeticmean)基本公式要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。54(一)简单算术平
26、均数主要用于未分组资料例:在某城市中随机抽取9个家庭,调查每个家庭的人均月收入数据如下(元):1500、750、780、1080、850、960、2000、1250、163055(二)加权算术平均数主要用于分组数据并已知各组的次数为第i组的标志值或组中值;为第i组的次数(即权数)。561、单项式数列例:某机械厂工人日产零件数的分配数列。102020213022200合计302550242004206604610750120013806023日总产量xf工人数f日产量(件)x权数权数加权加权572、组距式数列的加权算术平均数120合计9220-24018200-22037180-20043160
27、-1802214020703780703073101950-23021019017015013140-160 xf销售量(x)频数(f)按销售量分组(台)例:某电脑公司前4个月每天销售量数据如下:58(三)加权算术平均数的特点以组中值作为各组的代表值,假定各组标志值在组内分布是均匀的。求得的平均数只是其真值的近似值。如果各组次数完全相同,加权算数平均数等于简单算术平均数,即当时,59权数既可以用绝对数表示,如次数、频数、单位数,也可以用相对数来表示,如频率、比重,其计算结果完全一样。频率频率60-230210190170150销售量(x)120合计9220-24018200-22037180-
28、20043160-180184.5017.2531.5058.5860.9216.251.000.080.150.310.360.1113140-160频率频数(f)按销售量分组(台)例:某电脑公司前4个月每天销售量数据如下:61 各各个变量值与算术平均数离差之和等于零个变量值与算术平均数离差之和等于零简单平均数简单平均数:加权平均数:加权平均数:(四)算术平均数的数学性质62各个变量值与算术平均数离差平方之和等于最小值63三、调和平均数(Harmonicmean)(一)简单调和平均数(二)加权调和平均数两者关系:当个组的标志总量m恰好相等时64市场上有三种桃子,甲种每斤2元,乙种每斤3元,丙
29、种每斤4元。问:a.甲种买3斤,乙种买2斤,丙种买1斤,求平均价格?b.三种桃子各买1元,求平均价格?c.甲种买3元钱,乙种买2元,丙种买1元,求平均价格?加权算术平均数加权算术平均数简单调和平均数简单调和平均数加权调和平均数加权调和平均数65已知x,f加权算术平均数已知x,m加权调和平均数令令m=xf算数平均数与调和平均数的关系算数平均数与调和平均数的关系66例:例:某公司有四个工厂,已知其计划完成程度某公司有四个工厂,已知其计划完成程度(%)(%)及实际产值资料如下:及实际产值资料如下:330110丙1100-合计480120丁200100乙9090甲3001000400200100计划产
30、值(万元)实际产值(万元)m计划完成程度(%)x工厂67例:例:某公司有四个工厂,已知其计划完成程度某公司有四个工厂,已知其计划完成程度(%)(%)及实际产值资料如下:及实际产值资料如下:110丙-合计120丁100乙300100040020010090甲计划产值(万元)330110048020090实际产值(万元)m计划完成程度(%)x工厂68四、几何平均数(Geometricmean)1.简单几何平均数是n个标志值xi 连乘积的n次方根,用于计算时间上相互衔接的比率的平均数。69例例 某机械厂有铸造车间、机加工车间、装配某机械厂有铸造车间、机加工车间、装配车间三个连续流水作业车间。本月份这
31、三个车间三个连续流水作业车间。本月份这三个车间产品合格率分别为车间产品合格率分别为95%95%、92%92%、90%90%,求平,求平均车间产品合格率。均车间产品合格率。解:解:这说明该厂车间产品平均合格率为这说明该厂车间产品平均合格率为92.31%92.31%702.2.加加权几何平均数权几何平均数71 某银行以复利计算利息,近某银行以复利计算利息,近1212年来的年利率年来的年利率有有4 4年为年为3%3%,2 2年为年为5%5%,2 2年为年为8%8%,3 3年为年为10%10%,1 1年为年为15%15%,求平均年利率。,求平均年利率。例例72案例1:平均收入一块遮羞布中国国家统计局发
32、言人:“中国人均国民收入2000美元,步入中等收入国家行列。”至2006年,中国需要帮扶的人口在1亿左右,绝对贫困人口是2148万人,收入水平不到683元。二者矛盾吗?为什么?73贫富差距国家统计局最富裕的10%的人口占了全国财富的45%;而最贫穷的10%的人口所占有的财富仅为1.4%;财政部银行60%的存款掌握在10%的存户手里;联合国在中国,占总人口20%的最贫困人口只占总收入或消费份额的4.7%,占总人口20%的最富裕人口占收入或消费的份额则高达50%以上;于是,平均收入成为一块掩盖贫富差距的遮羞布!741.1.概概念:众数是在总体中出现次数最多的那念:众数是在总体中出现次数最多的那个标
33、志值,即个标志值,即“最多的最多的”的宿主的宿主。五、众数(Mode)M0今年服装的流行款式?流行色?今年服装的流行款式?流行色?服装、鞋帽的尺寸、规格和型号等服装、鞋帽的尺寸、规格和型号等75 众数的特点众数的特点:是一组数据分布的峰值,不受极端值影是一组数据分布的峰值,不受极端值影响。缺点是不唯一性,一组数据可能有响。缺点是不唯一性,一组数据可能有一个或多个甚至没有众数。一个或多个甚至没有众数。76 单项式数列单项式数列价格(元)销售数量(千克)2.00202.40603.001404.0080合计300某种商品的价格情况某种商品的价格情况众数众数M M0 0=3.00(=3.00(元元)
34、2.2.众众数的计算方法数的计算方法例例77组距式数列 利利用公式(比例插值法)推算众数的用公式(比例插值法)推算众数的近似值。近似值。由由最多次数来确定众数所在组;最多次数来确定众数所在组;782004年某市80个中型工业企业资料79练习:求众数按月收入额分组(元)调查户数(户)500以下500-800800-11001100-14001400-17001700-20002000以上4090110105705035合计50080 未分组资料未分组资料2.2.计算方法计算方法1.1.概概念:将总体中各单位标志值按大小顺序排念:将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位
35、数,列,居于中间位置的那个标志值就是中位数,即即数到中间的那一个数到中间的那一个。六、中位数(Median)MeMMe e50%50%81a.n为奇数时,则居于中间位置的那个标志值就是中位数。例例82b.n为偶数时,则中间位置的两个标志值的算术平均数为中位数。83单项数列某企业按日产零件分组如下某企业按日产零件分组如下:日产零件(件)工人数(人)向上累计263331101332142734275436187241880合计80-例例84组距数列按日产量分组(千克)工人数(人)向上累计5060101060701929708050798090361159010027142100-110141561
36、10以上8164合计164-本组的累计频数本组的累计频数-上一组的累计频数上一组的累计频数=本组的频数本组的频数本组的频数本组的频数85按日产量分组工人数向上累计70805079809036115828279798080向上累计频数向上累计频数(位置)(位置)9090115115ABCDE86练习:求中位数按月收入额分组(元)调查户数(户)向上累计500以下500-800800-11001100-14001400-17001700-20002000以上409011010570503540130240345415465500合计500-87小结一、众数、中位数、平均数的大小关系对称分布对称分布左
37、偏分布左偏分布右偏分布右偏分布88众数是一组数据分布的峰值,不受极端之影响;其缺点是不唯一性;众数值有在数据量较多时才有意义,当数据量少时不宜使用;众数主要适合作为品质数据的集中趋势的度量;中位数是一组数据中间位置的代表值,不受数据极端值的影响;当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择;平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势的度量值;当数据是对称分布或近似于对称分布时,平均数是一个很好的度量指标,但其缺点是极易受极端值的影响,对于偏态分布,其代表性较差;二、众数、中位数、平均数的特点和应用场合二、众数、中位数、平均数的特点和应用场
38、合89二、众数、中位数、平均数的特点和应用场合利用全部数据进行计算一组数据中间位置的代表值一组数据分布的峰值含义众数中位数平均数主要用于品质数据的度量已知分布的中间点或者分布是有偏的时候非常有用对称分布时非常有用,是实际中应用最广泛的集中趋势的度量值适用情况不受极端值影响,数据量少时不宜使用不受极端值影响极易受极端值的影响,对于有偏分布,其代表性较差优缺点度量指标90第三节离散程度的度量变异指标如果一个当地人告诉你一条河的平均深度是1.5米,你会在没有其他任何信息的条件下过河吗?91929394第三节离散程度的度量变异指标一、变异指标概述1.概念离散程度:指总体中各单位标志值差别大小的程度。变
39、异指标是用来描述总体分布的离中趋势或离散程度的指标,也称标志变动度。95甲、乙两学生某次考试成绩列表甲、乙两学生某次考试成绩列表语文 数学 物理 化学 政治 英语甲959065707585乙1107095508075(1)(1)甲、乙两学生的平均成绩为甲、乙两学生的平均成绩为8080分,集中趋势分,集中趋势一样,但是他们偏离平均数的程度却不一样。一样,但是他们偏离平均数的程度却不一样。(2)(2)乙组数据的离散程度大,数据分布越分散,乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大小,数
40、据分布越集中,平均数的代表性越大。例例 2.2.作用:作用:(1 1)用于衡量平均指标的代表性程度)用于衡量平均指标的代表性程度。96在产品质量控制中常常应用这类指标。在产品质量控制中常常应用这类指标。(2)反映社会经济现象变动的均匀性和稳定性例例供货计划完成百分比(%)季度总供货计划执行结果一月二月三月钢厂甲100323434乙10020305097(3 3)利用变异指标可研究总体标志值分布偏离正)利用变异指标可研究总体标志值分布偏离正态的情况。态的情况。标志值分布越集中,频数分布的形态越尖峭;标志值分布越集中,频数分布的形态越尖峭;标志值分布越分散,频数分布的形态越平坦。标志值分布越分散,
41、频数分布的形态越平坦。(4 4)标志变异指标是统计分析的一个基本指标,)标志变异指标是统计分析的一个基本指标,可用于衡量统计推断效果(第五章和第六章)。可用于衡量统计推断效果(第五章和第六章)。98(一)全距(一)全距(二)平均差(二)平均差(三)方差和标准差(三)方差和标准差 (四)变异系数(四)变异系数二、变异指标的种类及计算991 1、概念及计算、概念及计算全距也称极差,是总体各单位标志值最大全距也称极差,是总体各单位标志值最大值和最小值之差。值和最小值之差。(一)全距(一)全距 Range Range100中国男篮身高美国男篮身高姚明2.26贾森-基德1.93易建联2.12科比-布莱恩
42、特1.98王治郅2.16迈克尔-雷德1.98朱芳雨2.01普林斯2.06王仕鹏1.96德怀恩-韦德1.93杜锋2.07詹姆斯2.03李楠1.98安东尼2.03孙悦2.05克里斯-保罗1.83刘炜1.90克里斯-波什2.08陈江华1.88卡洛斯-布泽尔2.06王磊2.02德隆-威廉姆斯1.91张庆鹏1.87德怀特-霍华德2.111012、特点优点:计算简单、涵义直观、运用方便缺点:仅取决与两个极端值,不能反映数列中各个标志值差异程度的大小。极易受极端值影响意义:全距值越小,反映标志值越集中,平均数的代表性越大。102 平均差是数列中各单位标志值与平均数之间绝对离平均差是数列中各单位标志值与平均数
43、之间绝对离差的平均数。差的平均数。1 1、概念和计算、概念和计算:(二)平均差(二)平均差 Average Deviation Average Deviation1031.87张庆鹏0-0.150.00-0.14-0.120.03-0.040.05-0.06-0.010.140.100.2424.282.021.881.902.051.982.071.962.012.162.122.26身高1.08合计王磊陈江华刘炜孙悦李楠杜锋王仕鹏朱芳雨王治郅0.150.000.140.120.030.040.050.060.010.140.10易建联0.24姚明中国男篮104 优点:优点:分析意义完整分析
44、意义完整,能够反映各标志值的差能够反映各标志值的差异大小;异大小;缺点:缺点:不便于数学处理,而且平均差在数学不便于数学处理,而且平均差在数学性质上也不是最优的,因而实际应用较少。性质上也不是最优的,因而实际应用较少。2 2、平、平均差的特点均差的特点 意义:意义:平均差越大,表明标志变异程度越大,平均差越大,表明标志变异程度越大,平均值代表性越差。平均值代表性越差。10540-50求某车间100个工人日产量的平均差100合 计1550-6045660195135245-5545353530-4085-13371725520-30组中值x工人数f工人按日产量分组(千克)分组数据分组数据106(
45、三)方差Variance与标准差StandardDeviation1、概念及计算、概念及计算标准差是离差平方平均数的平方根,故又称“均方差”。未分组资料计算公式:方差:标准差:107分组资料计算公式方差:标准差:1081.87张庆鹏0-0.150.00-0.14-0.120.03-0.040.05-0.06-0.010.140.100.2424.282.021.881.902.051.982.071.962.012.162.122.26身高0.1524合计王磊陈江华刘炜孙悦李楠杜锋王仕鹏朱芳雨王治郅0.02250.00000.01960.01440.00090.00160.00250.0036
46、0.00010.01960.0100易建联0.0576姚明中国男篮求身高的方差求身高的方差1092、方差和标准差的特点优点:全面准确的反映一组数据的离散程度,具有无偏性,有效性等数学特征,是测量标志变动程度最主要的指标。缺点:受计量单位和平均水平影响,不便于比较应用:标准差越大,表明标志值变动程度越大,平均数的代表性越差。1103、方差的数学性质x的方差等于x平方的平均数减去x平均数的平方根据这个关系式,可以进行方差或标准差的简化计算。1111.87张庆鹏49.283.504.083.533.614.203.924.283.844.044.674.495.1124.282.021.881.90
47、2.051.982.071.962.012.162.122.26身高合计王磊陈江华刘炜孙悦李楠杜锋王仕鹏朱芳雨王治郅易建联姚明中国男篮112 变变异系数,也称离散系数,是各种变异异系数,也称离散系数,是各种变异指标与平均数的比率,它反映了总体各单位指标与平均数的比率,它反映了总体各单位标志值的相对离散程度。常见的有:标志值的相对离散程度。常见的有:标准差系数标准差系数平均差系数平均差系数极差系数极差系数(四四)变异系数变异系数 Coefficient of Variation Coefficient of Variation113变异系数的作用排除不同计量单位的影响;便于不同平均水平的总体之间
48、变异状况的对比只有当两个平均水平相等或相近时,可以不用变异系数,而直接用标准差等变异来反映离散程度。114202.33332.0200平均数11.26450.1126标准差126.88890.0127方差0.05580.0558变异系数身高(米)2012.01朱芳雨2162.16王治郅2122.12易建联2262.26姚明身高(厘米)中国男篮排除不同计量单位的影响115便于不同平均水平的总体之间变异状况的对比0.0396变异系数0.0558变异系数身高身高0.0789标准差0.1126标准差0.0062方差0.0127方差1.9942平均数2.0200平均数2.06普林斯2.01朱芳雨1.98
49、迈克尔-雷德2.16王治郅1.98科比-布莱恩特2.12易建联1.93贾森-基德2.26姚明美国男篮中国男篮116小结如果一个当地人告诉你一条河的平均深度是1.5米,你会在没有其他任何信息的条件下过河吗?117要了解数据分布情况,要考虑一下两个方面:分布的集中趋势分布的离散程度118第四节成数指标1、“是非”标志:将总体分成具有某种性质和不具有某种性质两部分,我们所关心标志表现称为“是”,另一标志表现称为“非”。例如,产品分为合格品与不合格品;人口按性别分为男与女两组。119第四节成数指标2、成数定义:总体中,是非标志只有两种表现,我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比
50、重称为成数。例如,考试及格率、产品合格率、男生比重等。1203、设总体的n个单位中,具有某种特征的单位数是n1个,不具有某种特征的单位数是n0个,n1+n0=n。则有 具有某种特征的单位的成数为:不具有某种特征的单位的成数为:121例如:设某批电子元件100件产品,经检验有92件合格,8件不合格。则有:1224、是非标志数量化1(当单位具有某种特征)(当单位具有某种特征)0(当单位不具有某种特征)(当单位不具有某种特征)“01“01分布分布”例如,上例中,以例如,上例中,以“1”代表产品合格,以代表产品合格,以“0”代表产品不合格。代表产品不合格。1235、“01”分布的数值特征均值均值124