《第3章-数据的描述性分析分解优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第3章-数据的描述性分析分解优秀PPT.ppt(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 数据的描述性分析数据的描述性分析 本章将探本章将探讨讨的是数据的的是数据的总总量和相量和相对对关系的关系的测测度,数据的度,数据的集中集中趋势趋势、离散、离散趋势趋势及其形及其形态态的的测测度。度。第一节第一节 确定数和相对数确定数和相对数其次节其次节 集中趋势的测定集中趋势的测定第三节第三节 离散趋势的测定离散趋势的测定第四节第四节 数据的形态测定数据的形态测定主主要要内内容容一、确定数一、确定数 确定数(亦称总量指标)是统计资料经过汇总整理后得到的反映总确定数(亦称总量指标)是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标。体规模和水平的总和指标。(二)作用(二)作
2、用(一)概念(一)概念例如,企业的销售收入、社会总产值、国内生产总值等。例如,企业的销售收入、社会总产值、国内生产总值等。(1 1)反映一个国家的国情和国力,一个地区或一个企业的人力、物)反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力力、财力 。(2 2)是进行经济核算和经济活动分析的基础。)是进行经济核算和经济活动分析的基础。(3 3)是计算相对指标和平均指标的基础。)是计算相对指标和平均指标的基础。第一节第一节 确定数和相对数确定数和相对数(三)分类(三)分类 1 1、按反映总体的内容分、按反映总体的内容分2 2、按反映的时间状态分、按反映的时间状态分 3 3、按计量单位分
3、:、按计量单位分:实物量;价值量;劳动量。实物量;价值量;劳动量。n变量总值变量总值 n单位总数单位总数n时期总量:说明现象在一段时间内累积的总量。(如诞生人数)时期总量:说明现象在一段时间内累积的总量。(如诞生人数)n 特点:指标数值随时间长短而变更;指标各期数值可加总。特点:指标数值随时间长短而变更;指标各期数值可加总。n时点总量:说明现象在某一时刻的数量状态。(如年末人口数)时点总量:说明现象在某一时刻的数量状态。(如年末人口数)n 特点:不同时点的指标数值加总后,没有意义。特点:不同时点的指标数值加总后,没有意义。相相对对数数是是用用两两个个有有联联系系的的指指标标进进行行对对比比的的
4、比比值值,可可以以反反映映现现象象的的数数量量特特征征和和数数量量关关系系,并并可可将将现现象象的的确确定定差差异异抽抽象象化化,使使原原来来不不能能干干脆脆相相比的确定数可以进行比较。比的确定数可以进行比较。二、相对数二、相对数(一)相对数的概念及(一)相对数的概念及表现形式:表现形式:n无名数:倍数、系数、成数、百分数等无名数:倍数、系数、成数、百分数等n出名数(如:人出名数(如:人/每平方公里)每平方公里)种类种类支配完成相对数支配完成相对数结构相对数结构相对数比较相对数比较相对数强度相对数强度相对数动态相对数动态相对数(二)相对指标的计算(二)相对指标的计算1 1、支配完成相对数、支配
5、完成相对数 是用来检查、监督支配执行状况的相对指标。通常用百分数表示,是用来检查、监督支配执行状况的相对指标。通常用百分数表示,又称支配完成百分比。又称支配完成百分比。1 1)支配数为确定数)支配数为确定数例:某工厂某年支配工业增加值为例:某工厂某年支配工业增加值为200万元,实际完成万元,实际完成220万元,则:万元,则:n指标数值越大,完成程度越高的指标为指标数值越大,完成程度越高的指标为正指标正指标n指标数值越大,完成程度越低的指标为指标数值越大,完成程度越低的指标为逆指标逆指标n分子与分母差值称为分子与分母差值称为百分点百分点2 2)支配数为相对数)支配数为相对数 例:某企业某种产品的
6、产值支配要求增长例:某企业某种产品的产值支配要求增长10%10%,该产品的单位成本支,该产品的单位成本支配要求下降配要求下降5%5%。实际产值增长了。实际产值增长了15%15%,单位成本下降了,单位成本下降了3%3%,则:,则:实际比支配多完成了实际比支配多完成了5个百分点个百分点实际比支配少完成了实际比支配少完成了2个百分点个百分点正指标正指标逆指标逆指标有正指标和逆指标有正指标和逆指标3 3)支配数为平均数)支配数为平均数 例:某企业支配要求劳动生产率达到例:某企业支配要求劳动生产率达到50005000元元/人,产品的支配单位成人,产品的支配单位成本为本为100100元,该企业的实际劳动生
7、产率达到元,该企业的实际劳动生产率达到60006000元元/人,产品的实际单位人,产品的实际单位成本为成本为8080元。则:元。则:(正指标)(正指标)(逆指标)(逆指标)2 2、结构相对数、结构相对数 总体内某一部分数值与总体全部数值对比的比值,反映总体内部的总体内某一部分数值与总体全部数值对比的比值,反映总体内部的构成和类型特征,一般用百分数或系数表示。构成和类型特征,一般用百分数或系数表示。计算公式计算公式特点:特点:各部分比重总和等于各部分比重总和等于100%100%。分子分母可以同是总体单位数,也可以是总体标记数量。分子分母可以同是总体单位数,也可以是总体标记数量。3 3、比较相对数
8、、比较相对数 将某一总体的指标与另一总体同类指标对比的比值,反映同类事物在将某一总体的指标与另一总体同类指标对比的比值,反映同类事物在不同国家、不同地区或不同单位之间的差异程度。一般用百分数或倍数表不同国家、不同地区或不同单位之间的差异程度。一般用百分数或倍数表示。示。n对比的指标可以是总量指标也可以是相对指标或平均指标。对比的指标可以是总量指标也可以是相对指标或平均指标。n依据探讨目的不同,分子分母可以互换。依据探讨目的不同,分子分母可以互换。计算公式计算公式特点:特点:4 4、强度相对数、强度相对数 将两个有联系但不同的指标对比而得到的比值,反映现象的强度、将两个有联系但不同的指标对比而得
9、到的比值,反映现象的强度、密度和普及程度。密度和普及程度。n部分强度相对数分子分母可互换,有正指标和逆指标;部分强度相对数分子分母可互换,有正指标和逆指标;n部分强度相对数以出名数表示;部分强度相对数以出名数表示;n有平均的含义,但与平均指标有本质区分。有平均的含义,但与平均指标有本质区分。计算公式计算公式特点:特点:5、动态相对数、动态相对数 将总体不同时期的同一类指标对比而计算的比值,说明事物发展将总体不同时期的同一类指标对比而计算的比值,说明事物发展变更的程度,一般用百分数表示。变更的程度,一般用百分数表示。计算公式计算公式作为比较基础的时期为作为比较基础的时期为基期基期与基期对比的时期
10、为报告期与基期对比的时期为报告期不同时期不同时期比比 较较动态动态相对数相对数注:注:又称发又称发展速度展速度 强度强度相对数相对数注:注:复名数复名数有正逆指有正逆指标标不同现象不同现象比较比较不同总体不同总体比较或者比较或者同一总体同一总体的两个不的两个不同部分同部分比较相对数比较相对数同一总体中同一总体中部分与总体部分与总体比较比较实际与支配实际与支配比较比较结构相对数结构相对数支配完成相对数支配完成相对数注:注:有正逆指标有正逆指标同一时期比较同一时期比较同类现象比较同类现象比较1 1、必需留意统计的可比性;、必需留意统计的可比性;2 2、正确选择对比的基数;、正确选择对比的基数;3
11、3、相对指标要与确定数指标相结合。、相对指标要与确定数指标相结合。(三)相对指标的应用原则(三)相对指标的应用原则其次节其次节 集中趋势测定集中趋势测定平均数平均数 平平均均指指标标是是反反映映同同类类现现象象在在确确定定时时间间、地地点点条条件件下下的的一一般般水水平平,是是总总体体内内各各单单位位参参差差不不齐齐的的标标记记值值的的代代表表值值,也也是是对对变变量量分分布布集集中中趋趋势势的的测定。测定。数据集中区数据集中区变量变量变量一般水平、代表性数值变量一般水平、代表性数值算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数中位数中位数众数众数数值平均数数值平均数位置平均数位
12、置平均数种类:种类:(一)基本形式:(一)基本形式:一、算术一、算术平均数(平均数()与强度相对数的区分:与强度相对数的区分:算术平均数中的变量值总和必需是总体内各单位变量值的总和,分子算术平均数中的变量值总和必需是总体内各单位变量值的总和,分子与分母存在一一对应关系。与分母存在一一对应关系。1、简洁算术平均数简洁算术平均数适用于总体资料未经分组整理、尚为原始资料的状况适用于总体资料未经分组整理、尚为原始资料的状况【例】【例】【例】【例】某售货小组某售货小组5个人,某天的销售额分别为个人,某天的销售额分别为520元、元、600元、元、480元、元、750元、元、440元,则元,则算术平均数算术
13、平均数总体单位总数总体单位总数第第i 个单位的标志值个单位的标志值平均每人日销售额为:平均每人日销售额为:(二)计算方法(二)计算方法(二)加权算术平均数(二)加权算术平均数两个影响因素:两个影响因素:标志值(组中值)标志值(组中值),决定平均数的变动范围;,决定平均数的变动范围;权数权数 或或 ,决定平均数的位置。,决定平均数的位置。适用于总体资料经过分组整理形成变量数列的状况适用于总体资料经过分组整理形成变量数列的状况频率分布变了,均值也变。因此,严格地说,权数应指频率。频率分布变了,均值也变。因此,严格地说,权数应指频率。(1)(1)(2)(2)(3)(3)X X4 45 56 6合计合
14、计频数频数频率频率(%)(%)1010202010102525505025254040100100X X4 45 56 6合计合计频数频数频率频率(%)(%)2020404020202525505025258080100.0100.0X X4 45 56 6合计合计频数频数频率频率(%)(%)2020101010105050252525258080100100变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差平方和为最小,即:变量值与其算术平均数的离差平方和为最小,即:优点:优点:简洁理便于计算;简洁理便于计算;灵敏度高;灵敏度高
15、;稳定性好。稳定性好。缺点:缺点:易受极值影响(受极大值影响大)。易受极值影响(受极大值影响大)。在偏斜分布和在偏斜分布和U形分布中,不具有代表性。形分布中,不具有代表性。(三)主要数学性质(三)主要数学性质(四)特点(四)特点算术平均数的变形算术平均数的变形数数学学上上称称其其为为调调和和平平均均数数,实实际际作作为为计计算算平平均均数数的的调和平均法调和平均法。用这种形式时,变量的取值不能为。用这种形式时,变量的取值不能为0 0。即在计算平均数时,以即在计算平均数时,以 为权数计算的调和平均数就是算术平均数。为权数计算的调和平均数就是算术平均数。实际应用时:以平均数的基本公式为依据,已知分
16、子资料用调和平均法,实际应用时:以平均数的基本公式为依据,已知分子资料用调和平均法,已知分母资料用算术平均法。已知分母资料用算术平均法。三、几何平均数三、几何平均数()(一)概念:(一)概念:是是N项变量值连乘积的开项变量值连乘积的开N次方根次方根。也称。也称。也称。也称对数平均数对数平均数(二)计算方法(二)计算方法1、简洁几何平均数简洁几何平均数适用于总体资料未经分组整理尚为原始资料的状况适用于总体资料未经分组整理尚为原始资料的状况几何平均数几何平均数变量值的个数变量值的个数第第 个变量值个变量值2、加权几何平均数加权几何平均数适用于总体资料经过分组整理形成变量数列的状况适用于总体资料经过
17、分组整理形成变量数列的状况(三三)应用:应用:u用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度u各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;u相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。1、未分组资料、未分组资料2、单项数列、单项数列3、组距数列、组距数列【例】【例】【例】【例】排序排序计算中位数位次计算中位数位次确定确定计算中位数位次计算中位数位次确定中位数组确定中位数组公式计算公式计算三、中位数三、中位数()(二二)中位数的确定中位数的确定 (一一)概念概念:将总体各变量值按大小顺序排列后,处于中间位置的变量
18、值,用将总体各变量值按大小顺序排列后,处于中间位置的变量值,用 表示。表示。确定确定是用插值法对中位是用插值法对中位数组分割的结果数组分割的结果累计频数累计频数上限公式:上限公式:下限公式:下限公式:【例】【例】(三三)中位数的特点中位数的特点中位数的取值只与中间位置的数值有关,利用信息不充分,中位数的取值只与中间位置的数值有关,利用信息不充分,忽视了其它数据的大小,灵敏度和计算功能差忽视了其它数据的大小,灵敏度和计算功能差优点:优点:简洁理解;简洁理解;不受极值影响;不受极值影响;可用于定序数据(不行用于定类数据);可用于定序数据(不行用于定类数据);在偏斜分布中代表性比算术平均数高。在偏斜
19、分布中代表性比算术平均数高。缺点:缺点:例例1、单项数列、单项数列干脆确定干脆确定四、众数(四、众数()(二)众数的确定(二)众数的确定(一)概念(一)概念指总体中出现次数最多的变量值,用指总体中出现次数最多的变量值,用 表示,用来说明总体表示,用来说明总体中大多数单位所达到的一般水平。中大多数单位所达到的一般水平。2、组距数列:、组距数列:确定众数组确定众数组公式计算公式计算【例】【例】上限公式:上限公式:下限公式:下限公式:d1 d2是以频数之差计算的比例是以频数之差计算的比例分割众数组组距的结果。分割众数组组距的结果。【例】【例】(三)众数的特点(三)众数的特点具有不唯一性具有不唯一性优
20、点:优点:简洁理解;简洁理解;不受极值影响;不受极值影响;可用于定类数据可用于定类数据在偏斜分布中代表性比算术平均数高。在偏斜分布中代表性比算术平均数高。缺点:缺点:灵敏度和计算功能差灵敏度和计算功能差稳定性差稳定性差位置平均数与算术平均数的关系位置平均数与算术平均数的关系对称分布对称分布正偏态分布正偏态分布(右)右)负偏态分布负偏态分布(左)左)在偏斜不大时在偏斜不大时1212第三节第三节 离散趋势的测定离散趋势的测定标记变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。标记变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。(1)反映变量分布的离散趋势;)反映变量分布的离散趋势;
21、(3)是对事物发展均衡性的量度。)是对事物发展均衡性的量度。(2)是对平均数的代表性程度的量度;)是对平均数的代表性程度的量度;作用:作用:一、异众比率一、异众比率二、极差、四分位差和平均差二、极差、四分位差和平均差三、标准差和方差三、标准差和方差四、离散系数四、离散系数主要内容:主要内容:一、异众比率一、异众比率概念:指非众数组所占比重概念:指非众数组所占比重 异众比率是反映异众比率是反映定名数据定名数据离散趋势的唯一指标,这个指标越小,说离散趋势的唯一指标,这个指标越小,说明数据的离散程度越小,集中程度越大明数据的离散程度越小,集中程度越大 特点:特点:二、极差、四分位差和平均差二、极差、
22、四分位差和平均差(一)极差:(一)极差:数列中最大值与最小值之差数列中最大值与最小值之差R=最大值最大值最小值最小值特点:特点:简洁理解,计算便利,但易受极值影响,不能反映全部简洁理解,计算便利,但易受极值影响,不能反映全部数据分布状况数据分布状况7 7 8 8 9 910107 7 8 8 9 9 1010(二)四分位差(二)四分位差是四分位数中间两个分位数之差的一半。是四分位数中间两个分位数之差的一半。特点:消退极值影响,但反映现象的差异程度仍较粗略和不全面。特点:消退极值影响,但反映现象的差异程度仍较粗略和不全面。【例】【例】全距和四分位差均只运用全距和四分位差均只运用部分数据进行计算。
23、部分数据进行计算。(三)平均差(三)平均差各变量值与算术平均数离差确定值的算术平均各变量值与算术平均数离差确定值的算术平均p优点:反映全部数据分布状况优点:反映全部数据分布状况。【例】【例】p缺点:受计量单位和总体平均水平影响;取确定值缺点:受计量单位和总体平均水平影响;取确定值,不便数学处理。,不便数学处理。三、标准差和方差三、标准差和方差1 1、总体标准差和方差、总体标准差和方差方差是各变量值与算术平均数离差平方的平均数;方差是各变量值与算术平均数离差平方的平均数;标准差是标准差是方差的平方根(取正根)。方差的平方根(取正根)。简捷算法:简捷算法:【例】【例】p优点:反映全部数据分布状况,
24、便于数学处理。应用最广的离散指标。优点:反映全部数据分布状况,便于数学处理。应用最广的离散指标。p缺点:受计量单位和平均水平影响,不便于比较。缺点:受计量单位和平均水平影响,不便于比较。2 2、样本方差、样本方差四、离散系数四、离散系数 离散系数是指消退平均数影响后的标记变异指标,其形式为相对离散系数是指消退平均数影响后的标记变异指标,其形式为相对数,又称标记变异相对指标。数,又称标记变异相对指标。标准差系数标准差系数 ()p缺点:对数据结构变更反应不灵敏缺点:对数据结构变更反应不灵敏平均差与均值之商平均差与均值之商平均差系数(平均差系数()【例】【例】一、偏度和峰度一、偏度和峰度1.偏度系数
25、偏度系数SKSK=0SK0SK0对称分布对称分布正偏态分布(右)正偏态分布(右)负偏态分布负偏态分布(左)左)SK(0,3)第四节第四节 数据的形态测定数据的形态测定 (m3三阶中心矩三阶中心矩)当当A=0,即以原点为中心,上式称为即以原点为中心,上式称为“K 阶原点矩阶原点矩”。K=1,2,3时,有:时,有:矩的概念矩的概念:定义定义 为变量为变量X关于关于A的的 k 阶矩。阶矩。一阶原点矩:一阶原点矩:二阶原点矩:二阶原点矩:三阶原点矩:三阶原点矩:2.偏度系数偏度系数K=1,2,3时,有:时,有:一阶中心矩:一阶中心矩:二阶中心矩:二阶中心矩:三阶中心矩:三阶中心矩:所以,所以,m3可以
26、测定偏度。为消退量纲,转变为系数,再除以可以测定偏度。为消退量纲,转变为系数,再除以3。0正偏态正偏态 当当A=,即以即以 为中心,上式称为为中心,上式称为“K 阶中心矩阶中心矩”。3、峰度系数、峰度系数:其中:其中:=3 正态曲线正态曲线 3 平顶曲线平顶曲线 3 尖顶曲线尖顶曲线1.8 U形曲线形曲线 1.8 一条水平线一条水平线 试验探讨表明,偶阶中心矩的大小与图形分布的峰度有关。方差在确试验探讨表明,偶阶中心矩的大小与图形分布的峰度有关。方差在确定程度上可以反映分布的峰度,但有时方差相同的数据却有不同的峰度,定程度上可以反映分布的峰度,但有时方差相同的数据却有不同的峰度,因此就利用四阶
27、中心矩来反映分布的尖峭程度。因此就利用四阶中心矩来反映分布的尖峭程度。五数:五数:即最小即最小值值x xmin min、最大、最大值值x xmax max 、第一四分位数、第一四分位数M M1 1、中位数、中位数MeMe和第三四分位数和第三四分位数M M3 3 五个数之间的关系,确定数据分布形态的方法:五个数之间的关系,确定数据分布形态的方法:二、五数概括二、五数概括1 1、数据是完全对称、数据是完全对称 :最小最小值值x xminmin到中位数的距离等于中位数到最大到中位数的距离等于中位数到最大值值x xmaxmax的距离的距离 。从从x xminmin到到M M1 1的距离等于的距离等于M
28、 M3 3到到x xmaxmax的距离。的距离。2 2、数据是不、数据是不对对称称 :从从x xmaxmax到中位数的距离大于中位数到到中位数的距离大于中位数到x xminmin的距离。的距离。从从M M3 3到到x xmaxmax的距离大于从从的距离大于从从x xminmin到到M M1 1的距离。的距离。右右偏偏分分布布从从xmin到中位数的距离大于中位数到到中位数的距离大于中位数到xmax的距离。的距离。从从xmin到到M M1 1的距离大于的距离大于M M3 3到到xmax的距离。的距离。左左偏偏分分布布 三、箱三、箱线图线图 是基于五数概括的是基于五数概括的图图示方式,使得集中示方式
29、,使得集中趋势趋势、离散、离散趋势趋势和偏和偏态态更更为为直直观观。数据的特征和测度数据的特征和测度分布的形态分布的形态集中趋势集中趋势离散程度离散程度众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰 度度极差、四分位差和平均差极差、四分位差和平均差偏偏 度度数据分布的特征和测度数据分布的特征和测度异众比率异众比率【例】【例】【例】【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:该企业该日全部工人的平均日产量:该企业该日全部工人的平均日产量:返回返回日产量(件)x各组工人日总产量(件)m10111213147001100456019501400
30、合计9710下页下页【例【例1 1】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为为9595、9292、9090、8585、8080,求整个流水生产线产品的平均合格率。,求整个流水生产线产品的平均合格率。分析:设最初投产分析:设最初投产100A100A个单位个单位 ,各车间按实际合格率生产的结果如下,各车间按实际合格率生产的结果如下p第一道工序的合格品为:第一道工序的合格品为:100A0.95100A0.95;p第二道工序的合格品为:第二道工序的合格品为:100A0.950.92100A0.950.92;p p第五道
31、工序的合格品为:第五道工序的合格品为:100A0.950.920.900.850.80100A0.950.920.900.850.80。以平均合格率(以平均合格率()替代各车间实际合格率,则)替代各车间实际合格率,则 第五道工序的合格品为:第五道工序的合格品为:各车间按平均合格率生产的结果应与按实际合格率生产的结果相同。则各车间按平均合格率生产的结果应与按实际合格率生产的结果相同。则即各车间实际合格率连乘积(即各车间实际合格率连乘积(0.950.920.900.850.80)是该流水线产)是该流水线产品总的合格率品总的合格率或:或:返回返回【例【例2】某金融机构以复利计息。近】某金融机构以复利
32、计息。近12年来的年利率有年来的年利率有4年为年为3,2年为年为5,2年为年为8,3年为年为10,1年为年为15。求平均年利率。求平均年利率。设本金为设本金为V,则至各年末的本利和应为:,则至各年末的本利和应为:第第1年末的本利和为:年末的本利和为:第第2年末的本利和为:年末的本利和为:第第12年末的本利和为:年末的本利和为:分析:分析:下页下页即即1212年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应接受几何平均法。故计算平均年本利率应接受几何平均法。返回返回则该笔本金则该笔本金12年总的本利率为:
33、年总的本利率为:中位数的位次为:中位数的位次为:即第即第3个单位的标记值就是中位数个单位的标记值就是中位数【例【例【例【例A A A A】某售货小组某售货小组5 5个人某天的销售额为个人某天的销售额为440440元、元、600 600元、元、520520元、元、480 480元、元、750750元元返回返回中位数的位次为中位数的位次为中位数应为第中位数应为第3和第和第4个单位标记值的算术平均数,即个单位标记值的算术平均数,即【例【例【例【例B B B B】若上述售货小组为】若上述售货小组为】若上述售货小组为】若上述售货小组为6 6 6 6个人,某天的销售额按从小到大的依次排列为个人,某天的销售
34、额按从小到大的依次排列为个人,某天的销售额按从小到大的依次排列为个人,某天的销售额按从小到大的依次排列为440440440440元、元、元、元、480480480480元、元、元、元、520520520520元、元、元、元、600600600600元、元、元、元、750750750750元、元、元、元、760760760760元,则元,则元,则元,则排排 序序:440440元元 480 480元元 520 520元元 600 600元元 750 750元元【例【例C C】某企业某日工人的日产量资料如下:】某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累
35、计次数(人)向上累计次数(人)1010111112121313141470701001003803801501501001007070170170550550700700800800合计合计800800返回返回中位数的位次:中位数的位次:按月收入额分组按月收入额分组(元)(元)x调查户数(户)调查户数(户)f累计次数累计次数由小到大累计由小到大累计由大到小累计由大到小累计500以下以下50080080011001100140014001700170020002000以上以上4090110105705035401302403454154655005004603702601558535合计合计50
36、0中位中位数组数组上限公式:上限公式:下限公式:下限公式:返回返回按月收入额分组按月收入额分组(元)(元)x调查户数调查户数(户)(户)f累计次数累计次数由小到大累计由小到大累计由大到小累计由大到小累计500以下以下50080080011001100140014001700170020002000以上以上4090110105705035401302403454154655005004603702601558535合计合计500众数组众数组上限公式:上限公式:下限公式:下限公式:返回返回日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计8
37、00【例】已知【例】已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:返回返回 【例【例【例【例A A A A】某售货小组某售货小组5 5人某天的销售额分别为人某天的销售额分别为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则返回返回R2825 2210615(美元)(美元)【例】【例】【例】【例】12个商学院的毕业生每月起薪的数据如下:个商学院的毕业生每月起薪的数据如下:2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825 M1(2350+2380)/22
38、365(美元)(美元)M3(2450+2550)/22500(美元)(美元)M1M3M2返回返回【例【例A】某售货小组】某售货小组5个人,某天的销售额分别为个人,某天的销售额分别为440元、元、480元、元、520元、元、600元、元、750元。则该售货小组销售额的平均差:元。则该售货小组销售额的平均差:即该售货小组即该售货小组5个人销售额的平均差为个人销售额的平均差为93.6元元返回返回下页下页【例【例【例【例B B】某公司职工月工资】某公司职工月工资】某公司职工月工资】某公司职工月工资月工资(元)月工资(元)组中值(元)组中值(元)x职工人数(人)职工人数(人)f300以下以下300400
39、400500500600600700700800800900900以上以上2503504505506507508509502083143824563052377820合计合计2000返回返回上页上页【例【例【例【例A A】某售货小组某售货小组5个人,某天的销售额分别为个人,某天的销售额分别为440元、元、480元、元、520元、元、600元、元、750元,求该售货小组销售额的标准差。元,求该售货小组销售额的标准差。(比较:其销售额的平均差为(比较:其销售额的平均差为93.6元)元)即该售货小组销售额的标准差为即该售货小组销售额的标准差为109.62元。元。返回返回下页下页【例【例B】某公司职工
40、月工资】某公司职工月工资月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上2503504505506507508509502083143824563052377820合计合计2000即该公司职工月工资的标准差为即该公司职工月工资的标准差为167.9元。元。返回返回上页上页【例】某年级一、二两班某门课的平均成果分别为【例】某年级一、二两班某门课的平均成果分别为【例】某年级一、二两班某门课的平均成果分别为【例】某年级一、二两班某门课的平均成果分别为8282分和分和分和分和7
41、676分,其成果的标分,其成果的标分,其成果的标分,其成果的标准差分别为准差分别为准差分别为准差分别为15.615.6分和分和分和分和14.814.8分,比较两班平均成果代表性的大小。分,比较两班平均成果代表性的大小。分,比较两班平均成果代表性的大小。分,比较两班平均成果代表性的大小。一班成果的标准差系数为:一班成果的标准差系数为:二班成果的标准差系数为:二班成果的标准差系数为:因为因为 ,所以一班平均成绩的代表性比二班大。,所以一班平均成绩的代表性比二班大。返回返回某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布回答类别回答类别户数户数 (户户)由小到大累计由小到大累计
42、非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300中位中位数组数组返回返回某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布回答类别回答类别户数户数 (户户)由小到大累计由小到大累计 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300众数众数组组返回返回n原始数据原始数据:24 22 21 26 20n排排 序序:20 21 22 24 26n位位 置置:1 2 3 4 5返回返回无众数无众数原始数据原始数据:10 5 9 12 6 8一个众数一个众数原始数据原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据原始数据:25 28 28 36 42 42返回返回众数的不唯一性众数的不唯一性