《分布的集中趋势第二部分分布的离散程度教学.ppt》由会员分享,可在线阅读,更多相关《分布的集中趋势第二部分分布的离散程度教学.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节第一节 分布的集中趋势分布的集中趋势第二节第二节 分布的离散程度分布的离散程度 第三章第三章 统计分布的数值特征统计分布的数值特征本章主要内容本章主要内容 本章包括平均指标和变异指标两部分内本章包括平均指标和变异指标两部分内容,阐述了平均指标的概念和作用;各种平容,阐述了平均指标的概念和作用;各种平均数的计算原则、方法与应用条件;主要的均数的计算原则、方法与应用条件;主要的平均指标平均指标(算术平均数、调和平均数、几何算术平均数、调和平均数、几何平均数、众数和中位数平均数、众数和中位数);变异指标的作用、;变异指标的作用、计算方法和运用条件;主要的变异指标计算方法和运用条件;主要的变异指
2、标(极极差、平均差、标准差及其系数差、平均差、标准差及其系数)。第一节第一节 分布的集中趋势分布的集中趋势vv一、统计平均数的概述一、统计平均数的概述vv二、数值平均数二、数值平均数vv三、位置平均数三、位置平均数vv四、各种平均数比较四、各种平均数比较一、统计平均数的概述一、统计平均数的概述(一)平均数的概念(一)平均数的概念同类同类社会经济现象社会经济现象总体内,总体内,各单位各单位某一数某一数量标志的量标志的差异抽象化差异抽象化,用以反映总体在具,用以反映总体在具体条件下的一般水平。体条件下的一般水平。它是度量总体某一数量标志在一定条件下的一它是度量总体某一数量标志在一定条件下的一般水平
3、或分布集中趋势的综合指标。般水平或分布集中趋势的综合指标。一一名名统统计计学学家家遇遇到到一一位位数数学学家家,统统计计学学家家调调侃侃数数学学家家说说道道:“你你们们不不是是说说若若且且,则则吗吗!那那么么想想必必你你若若是是喜喜欢欢一一个个女女孩孩,那么那个女孩喜欢的男孩你也会喜欢喽!?那么那个女孩喜欢的男孩你也会喜欢喽!?”数数学学家家想想了了一一下下反反问问道道:“那那么么你你把把左左手手放放到到一一锅锅一一百百度度的的开开水水中中,右右手手放放到到一一锅锅零零度度的的冰冰水水里里想想来来也也没没事事吧吧!因因为为它它们们平平均均的的温温度度不不过过是是五十度而已!五十度而已!”统计学
4、家与数学家统计学家与数学家 如果你的腳已經踩在爐如果你的腳已經踩在爐子上,而頭卻在冰箱裡,統子上,而頭卻在冰箱裡,統計學家會告訴你計學家會告訴你,平均而言平均而言,你相當舒服。你相當舒服。调侃统计学家(二)平均数的种类(二)平均数的种类根据各种平均数的具体代表意义和计算方根据各种平均数的具体代表意义和计算方式的不同,统计平均数分为两大类:式的不同,统计平均数分为两大类:算术平均数算术平均数调和平均数调和平均数 数值平均数数值平均数几何平均数几何平均数众数众数 中位数中位数 位置平均数位置平均数分位数分位数(三)平均数的特点(三)平均数的特点vv1.将数量差异抽象化将数量差异抽象化vv2.只能就
5、同类现象计算只能就同类现象计算vv3.能反映总体变量值的集中趋势能反映总体变量值的集中趋势二、数值平均数二、数值平均数(一)概述(一)概述1.定义定义数值平均数是由统计数据集合中的所有数据参与数值平均数是由统计数据集合中的所有数据参与计算所得的平均数。计算所得的平均数。2.常用的数值平均数有:常用的数值平均数有:算术平均数、调和平均数和几何平均数算术平均数、调和平均数和几何平均数(二)算术平均数(二)算术平均数1.概念概念算术平均数是全部数据的算术平均数是全部数据的算术算术平均。平均。基本公式:基本公式:e.g.2.2.算术平均数的计算方法算术平均数的计算方法(1)(1)简单算术平均数简单算术
6、平均数如如果果掌掌握握的的资资料料没没有有经经过过分分组组,则则先先将将各各单单位位的的标标志志值值相相加加得得出出标标志志总总量量,然然后后再再除除以以总总体体单单位位数数,得得到到的的平平均均数数称称为为简简单单算算术术平平均均数数。简单算术平均数的计算公式:简单算术平均数的计算公式:例例例例31313131某某某某机机机机械械械械厂厂厂厂某某某某生生生生产产产产班班班班组组组组有有有有10101010名名名名工工工工人人人人,生生生生产产产产某某某某种种种种零零零零件件件件,每每每每个个个个工工工工人人人人的的的的日日日日产产产产量量量量分分分分别别别别为为为为45454545件件件件,
7、48484848件件件件,52525252件件件件,62626262件件件件,69696969件件件件,44444444件件件件,52525252件件件件,58585858件件件件,38383838件件件件,64646464件件件件。试试试试用用用用简单算术平均数法计算工人平均日产量。简单算术平均数法计算工人平均日产量。简单算术平均数法计算工人平均日产量。简单算术平均数法计算工人平均日产量。(2)(2)加权算术平均数加权算术平均数如如果果掌掌握握的的资资料料是是经经过过分分组组整整理理编编成成了了分分布布数数列列,并并且且每每组组频频数数不不同同时时,用用频频数数(率率)进进行行加权加权计算的
8、算术平均数称为加权算术平均数。计算的算术平均数称为加权算术平均数。a.a.加权算术平均数计算加权算术平均数计算公式公式1 1:vv例:某机械厂工人日产零件例:某机械厂工人日产零件例:某机械厂工人日产零件例:某机械厂工人日产零件数的分配数列。数的分配数列。数的分配数列。数的分配数列。权数权数权数权数加权加权加权加权公式:公式:单项式数列的算术平均数单项式数列的算术平均数单项式数列的算术平均数单项式数列的算术平均数组距式加权算术平均数组距式加权算术平均数例:某年我国例:某年我国80个产棉个产棉大县的分配数列如表。大县的分配数列如表。以组中值作为各组的代表值以组中值作为各组的代表值以组中值作为各组的
9、代表值以组中值作为各组的代表值,假定各组标志值在组内分布各组标志值在组内分布是均匀的。是均匀的。此时求得的算术平均数只是其真值的近似值。公式公式2 2例例 3 33 3某企业工人操作机床的情况见下表,计算平均每位工人操作机床数。注意比重转化为小数再计算b.b.权数及作用权数及作用vv权数:加权算术平均数中的权数,是标志值权数:加权算术平均数中的权数,是标志值出现的频数(次数)出现的频数(次数)f 或各组次数占总次数或各组次数占总次数的比重(频率)的比重(频率)。vv权数的作用:权衡平均数大小。权数的作用:权衡平均数大小。vv某一组的次数或频率越大,则该组的标志值某一组的次数或频率越大,则该组的
10、标志值对平均数的影响就越大,反之越小。对平均数的影响就越大,反之越小。c.c.影响加权算术平均数大小的因素影响加权算术平均数大小的因素加权算术平均数的大小受两个因素影响加权算术平均数的大小受两个因素影响 受受单位标志值单位标志值大小的影响。大小的影响。受各标志值受各标志值频数频数的影响,更准确的讲的影响,更准确的讲是受各组频数占总频数比重即是受各组频数占总频数比重即频率频率的影的影响。响。d.d.加权算术平均数适用加权算术平均数适用v分组的统计资料,如果已知各组的分组的统计资料,如果已知各组的代表变量值和频数(频率),则可代表变量值和频数(频率),则可采用加权算术平均数计算。采用加权算术平均数
11、计算。v已知频数用公式已知频数用公式1 1。v已知频率用公式已知频率用公式2 2。e.e.简单与加权算术平均数相等的条件简单与加权算术平均数相等的条件vv在在分组分组的条件下,的条件下,当各组频数所占比重当各组频数所占比重均相等时,均相等时,权数就失去了权衡轻重的作权数就失去了权衡轻重的作用,这时用加权算术平均数计算的结果用,这时用加权算术平均数计算的结果与用简单算术平均数计算的结果相同。与用简单算术平均数计算的结果相同。vv当分布数列完全对称时,当分布数列完全对称时,加权算术平均加权算术平均数的计算结果与简单算术平均数计算结数的计算结果与简单算术平均数计算结果相同。果相同。3.算术平均数的数
12、学性质算术平均数的数学性质vv各个变量值与算术平均数的离差总和等于零。各个变量值与算术平均数的离差总和等于零。vv各个变量值与算术平均数的离差平方总和为最各个变量值与算术平均数的离差平方总和为最小值。小值。vv两个独立的同性质变量代数和的平均数等于各两个独立的同性质变量代数和的平均数等于各变量平均数的代数和。变量平均数的代数和。vv两个独立的同性质变量乘积的平均数等于各变两个独立的同性质变量乘积的平均数等于各变量平均数的乘积。量平均数的乘积。1.1.概念概念调调和和平平均均数数是是变变量量值值倒倒数数的的算算术术平平均均数数的的倒倒数数,故故又又称称倒倒数数平均数。平均数。调调和和平平均均数数
13、是是算算术术平平均均数数的的一一种种,它它是是根根据据变变量量值值的的倒倒数数计计算的。算的。(二)调和平均数(二)调和平均数原来只是计算原来只是计算原来只是计算原来只是计算时使用了不同时使用了不同时使用了不同时使用了不同的数据!的数据!的数据!的数据!(1 1)简单调和平均数)简单调和平均数2.调和平均数的计算调和平均数的计算(2 2)加权调和平均数)加权调和平均数 例:某工厂工人日产零件数资料例:某工厂工人日产零件数资料作为算术平均数的变形使作为算术平均数的变形使用。用。已知分配数列各组已知分配数列各组已知分配数列各组已知分配数列各组标志值标志值标志值标志值及及及及其其其其标志总量标志总量
14、标志总量标志总量时,计算平均数时,计算平均数时,计算平均数时,计算平均数可用加权调和平均法,可用加权调和平均法,可用加权调和平均法,可用加权调和平均法,权数权数权数权数mm为各组的标志总量为各组的标志总量为各组的标志总量为各组的标志总量。即:即:即:即:3.3.应用场合应用场合4.调和平均数的特点调和平均数的特点vv如果数列中有一个标志值等于如果数列中有一个标志值等于零零,则无法计,则无法计算调和平均数。算调和平均数。vv它作为一种数值平均数受所有标志值的影它作为一种数值平均数受所有标志值的影 响,且受极小值的影响大于受极大值的影响,响,且受极小值的影响大于受极大值的影响,但较之算术平均数,调
15、和平均数受极端值的但较之算术平均数,调和平均数受极端值的影响较小。影响较小。说明:说明:算术平均数和调和平均数不仅可以用于计算术平均数和调和平均数不仅可以用于计算严格意义上的单位标志平均数,而且还算严格意义上的单位标志平均数,而且还可以用于计算平均指标和相对指标的平均可以用于计算平均指标和相对指标的平均数,算的时候并不要求符合平均数的基本数,算的时候并不要求符合平均数的基本公式。公式。下面仅举例子说明!下面仅举例子说明!1.由平均数计算平均数由平均数计算平均数e.g.已知某商品在三个已知某商品在三个集贸市场上的平均价集贸市场上的平均价格及销售量资料如格及销售量资料如右表:右表:求三个市场的平均
16、价求三个市场的平均价格。格。市场市场市场市场平均价格平均价格平均价格平均价格x x销售量销售量销售量销售量f f销售额销售额销售额销售额mm甲甲甲甲2.003000060000乙乙乙乙2.502000050000丙丙丙丙2.402500060000合计合计合计合计750001700002.由相对数计算平均数由相对数计算平均数e.g.e.g.某工业公司有三个某工业公司有三个某工业公司有三个某工业公司有三个工厂,已知其计划完工厂,已知其计划完工厂,已知其计划完工厂,已知其计划完成程度()以及计成程度()以及计成程度()以及计成程度()以及计划产值资料如划产值资料如划产值资料如划产值资料如右表:右表
17、:右表:右表:求该公司平均计划完求该公司平均计划完求该公司平均计划完求该公司平均计划完成程度。成程度。成程度。成程度。工厂工厂工厂工厂计划完成程计划完成程计划完成程计划完成程度()度()度()度()x x计划产值计划产值计划产值计划产值f f实际产值实际产值实际产值实际产值mm甲甲甲甲9512001140乙乙乙乙1051280013440丙丙丙丙11520002300合计合计合计合计1600016880计算相对指标(或平均指标)的平均数的计算相对指标(或平均指标)的平均数的一般方法可以概括如下:一般方法可以概括如下:(1)若已知的是相对指标(或平均指标)若已知的是相对指标(或平均指标)的分母资
18、料时,可将其作为权数,采用的分母资料时,可将其作为权数,采用加权算术平均法计算;加权算术平均法计算;(2)若已知的是相对指标(或平均指标)若已知的是相对指标(或平均指标)的分子资料时,可将其作为权数,采用的分子资料时,可将其作为权数,采用加权调和平均数法计算。加权调和平均数法计算。小小 结结某日三种蔬菜的销售数据某日三种蔬菜的销售数据某日三种蔬菜的销售数据某日三种蔬菜的销售数据蔬菜蔬菜蔬菜蔬菜名称名称名称名称平均价格平均价格平均价格平均价格(元元元元/kg)/kg)x xi i销售额销售额销售额销售额(元元元元)mmi i销售量销售量销售量销售量(公斤公斤公斤公斤)x xi i/m/mi i甲
19、甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合计合计36900480001.1.某某某某蔬蔬蔬蔬菜菜菜菜市市市市场场场场三三三三种种种种蔬蔬蔬蔬菜菜菜菜的的的的日日日日销销销销售售售售数数数数据据据据如如如如表表表表,计计计计算算算算三三三三种种种种蔬蔬蔬蔬菜菜菜菜该日的平均价格。该日的平均价格。该日的平均价格。该日的平均价格。某公司下属三个部门销售情况某公司下属三个部门销售情况某公司下属三个部门销售情况某公司下属三个部门销售情况部门部门部门部门销售利润率销售利润率销售利润率销售利润率(%)销售额(万元)销售额(万元)销售额(万元)销售额(万元
20、)x xf fA AB BC C121210107 7100010002000200015001500合计合计合计合计450045002.2.设某公司下属三个部门的销售资料如下表,求公司设某公司下属三个部门的销售资料如下表,求公司设某公司下属三个部门的销售资料如下表,求公司设某公司下属三个部门的销售资料如下表,求公司的平均销售利润率。的平均销售利润率。的平均销售利润率。的平均销售利润率。vv三个部门的平均利润率即是公司的销售利润三个部门的平均利润率即是公司的销售利润率。所以可用各部门的利润率乘以销售额得率。所以可用各部门的利润率乘以销售额得到各部门的利润额,然后用各部门利润总额到各部门的利润额
21、,然后用各部门利润总额除以总销售额便可得到平均利润率。其计算除以总销售额便可得到平均利润率。其计算公式为:公式为:如果上例若缺少销售额资料而有利润额资料,如果上例若缺少销售额资料而有利润额资料,如下表如下表某公司下属三个部门销售情况某公司下属三个部门销售情况某公司下属三个部门销售情况某公司下属三个部门销售情况部门部门部门部门销售利润率销售利润率销售利润率销售利润率(%)利润额(万元)利润额(万元)利润额(万元)利润额(万元)x xmmA AB BC C121210107 7120120200200105105合计合计合计合计425425则三个部门的平均利润率可以用各部门利润则三个部门的平均利润
22、率可以用各部门利润额除以销售利润率得到销售额,然后用各部额除以销售利润率得到销售额,然后用各部门利润之和除以总销售额,便可得到平均利门利润之和除以总销售额,便可得到平均利润率。其计算公式:润率。其计算公式:3.3.某管理局所属某管理局所属某管理局所属某管理局所属1515个企业销售计划完成情况资料如下表:个企业销售计划完成情况资料如下表:个企业销售计划完成情况资料如下表:个企业销售计划完成情况资料如下表:权数的正确选择很重要权数的正确选择很重要【例【例【例【例3 34 4】水果甲级每元水果甲级每元水果甲级每元水果甲级每元1 1公斤,乙级每元公斤,乙级每元公斤,乙级每元公斤,乙级每元1.51.5公
23、斤,丙级公斤,丙级公斤,丙级公斤,丙级每元每元每元每元2 2公斤。问:公斤。问:公斤。问:公斤。问:(1 1)若各买)若各买)若各买)若各买1 1公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤?(2 2)各买)各买)各买)各买6.56.5公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤?(3 3)甲级)甲级)甲级)甲级3 3公斤,乙级公斤,乙级公斤,乙级公斤,乙级2 2公斤,丙级公斤,丙级公斤,丙级公斤,丙级1 1公斤,平均每元可公斤,平均每元可公斤,平均每元可公斤,平
24、均每元可买多少公斤?买多少公斤?买多少公斤?买多少公斤?(4 4)甲乙丙三级各买)甲乙丙三级各买)甲乙丙三级各买)甲乙丙三级各买1 1元,每元可买几公斤?元,每元可买几公斤?元,每元可买几公斤?元,每元可买几公斤?【例【例【例【例3 35 5】自行车赛时速:甲自行车赛时速:甲自行车赛时速:甲自行车赛时速:甲3030公里公里公里公里/小时,乙小时,乙小时,乙小时,乙2828公里公里公里公里/小时,丙小时,丙小时,丙小时,丙2020公里公里公里公里/小时,全程小时,全程小时,全程小时,全程200200公里,问三人平均时公里,问三人平均时公里,问三人平均时公里,问三人平均时速是多少?若甲乙丙三人各骑
25、车速是多少?若甲乙丙三人各骑车速是多少?若甲乙丙三人各骑车速是多少?若甲乙丙三人各骑车2 2小时,平均时速是小时,平均时速是小时,平均时速是小时,平均时速是多少?多少?多少?多少?调和平均数调和平均数(例题分析例题分析)【例【例34】解】解(1)(2)(3)(4)【例【例35】解】解1.1.概念概念几何平均数又称为对数平均数,它是几何平均数又称为对数平均数,它是n n个变个变量值连乘积的量值连乘积的n n次算术根。次算术根。2.2.适用范围适用范围它是计算平均比率和平均速度时比较适用的它是计算平均比率和平均速度时比较适用的一种方法。一种方法。(三)几何平均数(三)几何平均数3.3.几何平均数的
26、计算方法几何平均数的计算方法 (1)(1)简单几何平均数简单几何平均数【例例3-63-6】谋谋生生产产车车间间生生产产某某产产品品合合格格率率分分别别为为:9797、9393、9191和和8787,则则该该车车间间制品平均合格率为:制品平均合格率为:(2)(2)加权几何平均数加权几何平均数【例【例3-73-7】投资银行某笔投资是按复利计算的,投资银行某笔投资是按复利计算的,投资银行某笔投资是按复利计算的,投资银行某笔投资是按复利计算的,2525年间年间年间年间年利率的分配情况是:有年利率的分配情况是:有年利率的分配情况是:有年利率的分配情况是:有1 1年为年为年为年为3 3,有,有,有,有4
27、4年为年为年为年为5 5,有,有,有,有8 8年为年为年为年为8 8,有,有,有,有1010年为年为年为年为1010,有,有,有,有2 2年为年为年为年为1515。求平均年。求平均年。求平均年。求平均年利率。利率。利率。利率。计算平均年利率,必须先将各年的利率加上计算平均年利率,必须先将各年的利率加上计算平均年利率,必须先将各年的利率加上计算平均年利率,必须先将各年的利率加上100100,换,换,换,换算为各年的本利率;然后按加权几何平均数的方法,算为各年的本利率;然后按加权几何平均数的方法,算为各年的本利率;然后按加权几何平均数的方法,算为各年的本利率;然后按加权几何平均数的方法,计算平均年
28、本利率;再减去计算平均年本利率;再减去计算平均年本利率;再减去计算平均年本利率;再减去100100,得出平均年利率。,得出平均年利率。,得出平均年利率。,得出平均年利率。计算如下:计算如下:计算如下:计算如下:这就是说,这就是说,这就是说,这就是说,2525年间年平均本利率为年间年平均本利率为年间年平均本利率为年间年平均本利率为108.6108.6。因而,年。因而,年。因而,年。因而,年平均利率为平均利率为平均利率为平均利率为8.68.6。(四)几何平均数、算术平均数(四)几何平均数、算术平均数和调和平均数的关系和调和平均数的关系vv几何平均数、算术平均数和调和平均数之间存几何平均数、算术平均
29、数和调和平均数之间存在着一定的数量关系。这种数量关系表现在:在着一定的数量关系。这种数量关系表现在:根据同一资料根据同一资料所计算的三种平均数,几何平均所计算的三种平均数,几何平均数大于调和平均数而小于算术平均数,只有当数大于调和平均数而小于算术平均数,只有当所有变量值都相同时,三种平均数才相等。用所有变量值都相同时,三种平均数才相等。用数学公式表示,它们之间的关系为:数学公式表示,它们之间的关系为:三、位置平均数三、位置平均数(一)概述(一)概述1.概念概念位置平均数是根据总体中处于特殊位置上的位置平均数是根据总体中处于特殊位置上的个个别单位或部分单位别单位或部分单位的标志值来确定的代表值。
30、的标志值来确定的代表值。2.常用的位置平均数常用的位置平均数众数、中位数众数、中位数(二)众数(二)众数1.概念概念总体中出现次数最多的变量值称为众数。总体中出现次数最多的变量值称为众数。2.特点特点uu适于数据较多时使用,主要用于定类数据;适于数据较多时使用,主要用于定类数据;uu不受极端值和开口组数列的影响;不受极端值和开口组数列的影响;uu众数是一个不容易确定的平均指标,当数列众数是一个不容易确定的平均指标,当数列没有明显的集中趋势而趋向集中均匀分布时,则没有明显的集中趋势而趋向集中均匀分布时,则无众数可言;当变量数列是异距分组时,众数的无众数可言;当变量数列是异距分组时,众数的位置也不
31、好确定。位置也不好确定。众数众数(不惟一性不惟一性)无众数无众数原始数据原始数据:10 5 9 12 6 8一个众数一个众数原始数据原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据原始数据:25 28 28 36 42 42(1)定类数据的众数)定类数据的众数不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100
32、解解解解:这这这这里里里里的的的的变变变变量量量量为为为为“饮饮饮饮料料料料品品品品牌牌牌牌”,这这这这是是是是个个个个分分分分类类类类变变变变量量量量,不不不不同同同同类类类类型型型型的的的的饮饮饮饮料料料料就是变量值就是变量值就是变量值就是变量值 所所所所调调调调查查查查的的的的5050人人人人中中中中,购购购购买买买买可可可可口口口口可可可可乐乐乐乐的的的的人人人人数数数数最最最最多多多多,为为为为1515人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的30%30%,因因因因此此此此众众众众数数数数为为为为“可可可可口口口口可可可可乐乐乐乐”这这这这一一一一品品
33、品品牌牌牌牌,即即即即 MMo o可口可乐可口可乐可口可乐可口可乐(2)定序数据的众数)定序数据的众数解解解解:这这这这里里里里的的的的数数数数据据据据为为为为顺顺顺顺序序序序数数数数据据据据。变变变变量量量量为为为为“回回回回答类别答类别答类别答类别”甲甲甲甲城城城城市市市市中中中中对对对对住住住住房房房房表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最多多多多,为为为为108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这这这这一类别,即一类别,即一类别,即一类别,即 MMo o不满意不满意不满意不满意甲城市家庭对住房状况评价的
34、频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0 (3 3)数值型数据的众数)数值型数据的众数下限公式下限公式:上限公式上限公式:某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 1
35、62 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 身高身高 人数人数 比重比重 (CM)(人)(人)(%)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100某年级某年级83名女生身高资料名女生身高资料(三)中位数(三)中位数1.1.概念概念中位数是将总体各单位标志值按大小顺序排列中位数是将总体各单位标志值按大小顺序排
36、列后,处于中间位置的那个数值。后,处于中间位置的那个数值。2.2.意义意义中位数是处于统计数列中间位置的数值。由于中位数是处于统计数列中间位置的数值。由于其位置居中,不受其位置居中,不受极端数值极端数值大小的影响,因而大小的影响,因而有时直接利用它来代表现象的有时直接利用它来代表现象的一般水平一般水平。3.中位数的特点中位数的特点(1)与众数一样,也是一种位置平均数,不受)与众数一样,也是一种位置平均数,不受极端值及开口组的影响,具有稳健性;极端值及开口组的影响,具有稳健性;(2)各单位标志值与中位数离差的绝对值之和)各单位标志值与中位数离差的绝对值之和为最小。即为最小。即(3)对某些不具有数
37、学特点或不能用数字测定)对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。的现象,可用中位数求其一般水平。(1)由未分组资料确定中位数)由未分组资料确定中位数vv在资料未经分组时,确定中位数的方法是:在资料未经分组时,确定中位数的方法是:在资料未经分组时,确定中位数的方法是:在资料未经分组时,确定中位数的方法是:首先将首先将首先将首先将各总体单位的标志值或变量值,按照各总体单位的标志值或变量值,按照各总体单位的标志值或变量值,按照各总体单位的标志值或变量值,按照大小顺序排列大小顺序排列大小顺序排列大小顺序排列;然后确定中位数的位置,处于中位数位置的标志值然后确定中位数的位置,
38、处于中位数位置的标志值然后确定中位数的位置,处于中位数位置的标志值然后确定中位数的位置,处于中位数位置的标志值或变量值就是中位数。或变量值就是中位数。或变量值就是中位数。或变量值就是中位数。v由未分组资料确定中位数,中位数的位置是:由未分组资料确定中位数,中位数的位置是:v 如果总体单位的项数(如果总体单位的项数(如果总体单位的项数(如果总体单位的项数(n n)是)是)是)是奇数奇数奇数奇数,则处于中间位置,则处于中间位置,则处于中间位置,则处于中间位置的标志值就是中位数。如果总体单位的项数是的标志值就是中位数。如果总体单位的项数是的标志值就是中位数。如果总体单位的项数是的标志值就是中位数。如
39、果总体单位的项数是偶数偶数偶数偶数,则处于中间位置的两个标志值的算术平均数就是中则处于中间位置的两个标志值的算术平均数就是中则处于中间位置的两个标志值的算术平均数就是中则处于中间位置的两个标志值的算术平均数就是中位数。位数。位数。位数。vve.g1e.g1,某年我国饮料制造业按利税总额排序,前,某年我国饮料制造业按利税总额排序,前,某年我国饮料制造业按利税总额排序,前,某年我国饮料制造业按利税总额排序,前1010名名名名企业的利税总额资料如下,企业的利税总额资料如下,企业的利税总额资料如下,企业的利税总额资料如下,vv根据上列资料,如果确定这根据上列资料,如果确定这10名企业利税总额名企业利税
40、总额的中位数,则:的中位数,则:vv就是说,中位数处于第就是说,中位数处于第5个企业和第个企业和第6个企业的个企业的中间位置。第中间位置。第5个企业的利税总额为个企业的利税总额为66百万元,百万元,第第6个企业的利税总额为个企业的利税总额为65百万元,故百万元,故10名企名企业利税总额的中位数为:业利税总额的中位数为:ne.g2,9个家庭的人均月收入数据个家庭的人均月收入数据n n原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1500 750 780 1080 850 960 2000 1250 16301250 1630n n排排排排 序序序
41、序:750 780 850 960 1080 1250 750 780 850 960 1080 1250 1500 1630 20001500 1630 2000n n位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 6 n n 7 8 9 7 8 9中位数中位数 1080n10个家庭的人均月收入数据个家庭的人均月收入数据n n排排 序序:660660 750 780 850 960 1080 1250 750 780 850 960 1080 1250 1500 1630 20001500 1630 2000n n位位 置置:1 2 3 4 1 2 3 4 5 65 6 7
42、7 n n 8 9 10 8 9 10 (2)单项式数列确定中位数)单项式数列确定中位数对于单项式数列资料,由于变量值已经序列化,故对于单项式数列资料,由于变量值已经序列化,故中位数的确定也很简单。中位数的确定也很简单。步骤:步骤:第一,求中位数位置第一,求中位数位置 (为总体单位数之为总体单位数之和);和);第二,计算各组的累计次数(向上或向下累计皆第二,计算各组的累计次数(向上或向下累计皆可);可);第三,根据中位数的位置找出中位数。第三,根据中位数的位置找出中位数。(3)由组距分组数列确定中位数)由组距分组数列确定中位数a.步骤步骤由组距数列确定中位数,应先计算累计次数,然由组距数列确定
43、中位数,应先计算累计次数,然后确定中位数所在组的位置,最后再按比例推算后确定中位数所在组的位置,最后再按比例推算中位数的具体数值。中位数的具体数值。b.由分组资料确定中位数,中位数的位置是:由分组资料确定中位数,中位数的位置是:c.由组距数列计算中位数由组距数列计算中位数v下限公式:下限公式:(向上累计时用向上累计时用):v(向下累计时用)(向下累计时用)身高身高 人数人数 累计累计 (CM)(人)(人)人数人数 150-155 3 3 155-160 11 14 160-165 34 48 165-170 24 72 170以上以上 11 83 总计总计 83 e.g,某年级,某年级83名名
44、女生身高资料女生身高资料vve.g,某年某市,某年某市80个中型工业企业按照工业总个中型工业企业按照工业总产值(按产值(按1980年不变价格计算)的分组资料年不变价格计算)的分组资料如下:如下:由上表中的资料计算中位数由上表中的资料计算中位数:首先,应确定中位数的位置。首先,应确定中位数的位置。f80,f/240,即中位数的位置是第,即中位数的位置是第40个个企业。企业。其次,应确定中位数的所在组。其次,应确定中位数的所在组。第二组的累计次数为第二组的累计次数为35,距离中位数的位置还差,距离中位数的位置还差5个企业;第三组的累计次数已达个企业;第三组的累计次数已达55,显然中位,显然中位数在
45、第三组内。数在第三组内。第三,按比例推算中位数在组内的具体位置。第三,按比例推算中位数在组内的具体位置。v因而,某市因而,某市80个中型工业企业工业总产值的中位数,按个中型工业企业工业总产值的中位数,按下限公式计算为:下限公式计算为:(四)分位数(四)分位数(简介)(简介)(简介)(简介)1.概念概念能够将全部总体单位按标志值大小等分为能够将全部总体单位按标志值大小等分为k个个部分的数值称为部分的数值称为“k分位数分位数”。2.常用的分位数常用的分位数四分位数、十分位数和百分位数。四分位数、十分位数和百分位数。中位数实际上是一个两分位数中位数实际上是一个两分位数四、各种平均数的比较四、各种平均
46、数的比较(一)算术平均数、几何平均数和调和平均数三者的(一)算术平均数、几何平均数和调和平均数三者的(一)算术平均数、几何平均数和调和平均数三者的(一)算术平均数、几何平均数和调和平均数三者的关系。(证明略)关系。(证明略)关系。(证明略)关系。(证明略)(二)数值平均数和位置平均数的比较(二)数值平均数和位置平均数的比较(二)数值平均数和位置平均数的比较(二)数值平均数和位置平均数的比较(1 1)数值平均数对于数据的概括能力比位置平均数)数值平均数对于数据的概括能力比位置平均数)数值平均数对于数据的概括能力比位置平均数)数值平均数对于数据的概括能力比位置平均数强。强。强。强。(2 2)数值平
47、均数和位置平均数对数据变化的)数值平均数和位置平均数对数据变化的)数值平均数和位置平均数对数据变化的)数值平均数和位置平均数对数据变化的“灵敏灵敏灵敏灵敏度度度度”“”“耐抗性耐抗性耐抗性耐抗性”不同。不同。不同。不同。(3 3)数值平均数和位置平均数使用的数据类型不同。)数值平均数和位置平均数使用的数据类型不同。)数值平均数和位置平均数使用的数据类型不同。)数值平均数和位置平均数使用的数据类型不同。众数、中位数、平均数的众数、中位数、平均数的特点和应用特点和应用1.1.众数众数众数众数n n不受极端值影响不受极端值影响不受极端值影响不受极端值影响n n具有不惟一性具有不惟一性具有不惟一性具有
48、不惟一性n n数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.2.中位数中位数中位数中位数n n不受极端值影响不受极端值影响不受极端值影响不受极端值影响n n数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.3.平均数平均数平均数平均数n n易受极端值影响易受极端值影响易受极端值影响易受极端值影响n n数学性质优良数学性质优良数学性质优良数学性质优良n n数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时
49、应用(三)算术平均数与众数、中位数在钟形分布时三种(三)算术平均数与众数、中位数在钟形分布时三种(三)算术平均数与众数、中位数在钟形分布时三种(三)算术平均数与众数、中位数在钟形分布时三种集中趋势的关系集中趋势的关系集中趋势的关系集中趋势的关系(1 1)当总体分布呈对称状态时,三者合而为一,即)当总体分布呈对称状态时,三者合而为一,即)当总体分布呈对称状态时,三者合而为一,即)当总体分布呈对称状态时,三者合而为一,即三者相等。三者相等。三者相等。三者相等。(2 2)当总体分布呈右偏,则中位数大于众数,小于)当总体分布呈右偏,则中位数大于众数,小于)当总体分布呈右偏,则中位数大于众数,小于)当总
50、体分布呈右偏,则中位数大于众数,小于算术平均数。算术平均数。算术平均数。算术平均数。(3 3)当总体分布呈左偏,则中位数大于算术平均数,)当总体分布呈左偏,则中位数大于算术平均数,)当总体分布呈左偏,则中位数大于算术平均数,)当总体分布呈左偏,则中位数大于算术平均数,小于众数。小于众数。小于众数。小于众数。以上第以上第以上第以上第2 2、3 3种情况均为总体分布呈非对称状态,这时种情况均为总体分布呈非对称状态,这时种情况均为总体分布呈非对称状态,这时种情况均为总体分布呈非对称状态,这时三者之间就存在着一定的差别,愈不对称,差别越三者之间就存在着一定的差别,愈不对称,差别越三者之间就存在着一定的