《第四章集中趋势的测量精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章集中趋势的测量精选PPT.ppt(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章集中趋势的测量第1页,此课件共87页哦一、集中趋势的含义一、集中趋势的含义 指一组数据向某一个典型值或代表值集中的情况。如指一组数据向某一个典型值或代表值集中的情况。如“大大部分学生是女生部分学生是女生”、“平均年龄为平均年龄为2424岁岁”等。主要形式有:等。主要形式有:平均数、中位数、众数。平均数、中位数、众数。vv一组数据向其中心值靠拢的倾向和程度。一组数据向其中心值靠拢的倾向和程度。一组数据向其中心值靠拢的倾向和程度。一组数据向其中心值靠拢的倾向和程度。vv测度集中趋势就是寻找数据一般水平的代表值或中心值。测度集中趋势就是寻找数据一般水平的代表值或中心值。测度集中趋势就是寻找数据
2、一般水平的代表值或中心值。测度集中趋势就是寻找数据一般水平的代表值或中心值。vv不同类型的数据用不同的集中趋势测度值。不同类型的数据用不同的集中趋势测度值。不同类型的数据用不同的集中趋势测度值。不同类型的数据用不同的集中趋势测度值。vv低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。高层次数据的集中趋势测度值并不适用于低层次的测量数据。高层次数据的集中趋势测度
3、值并不适用于低层次的测量数据。高层次数据的集中趋势测度值并不适用于低层次的测量数据。vv选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。握的数据的类型来确定。握的数据的类型来确定。握的数据的类型来确定。第一节第一节 集中趋势的含义及作用集中趋势的含义及作用第2页,此课件共87页哦v二、作用二、作用v 1、反映总体各单位变量分布的集中趋势和一般水平,说、反映总体各单位变量分布的集中趋势和一般水平,说明社会现象在一定历史条件下的共同性
4、质。如用家庭户平明社会现象在一定历史条件下的共同性质。如用家庭户平均人数说明家庭结构的一般性质。均人数说明家庭结构的一般性质。v 2、便于比较同类现象在不同单位间的发展水平,对社、便于比较同类现象在不同单位间的发展水平,对社会现象的特征能够从数量方面在空间上进行比较。如不会现象的特征能够从数量方面在空间上进行比较。如不同省份家庭户平均人数不同,说明不同省份家庭观念不同省份家庭户平均人数不同,说明不同省份家庭观念不同。同。v 3、对社会现象的特征能够从数量方面在时间上进行比、对社会现象的特征能够从数量方面在时间上进行比较,能够比较同类现象在不同时期的发展变化趋势或规较,能够比较同类现象在不同时期
5、的发展变化趋势或规律。律。v 4、分析社会现象之间的相互依存关系。如生活水平的高低、分析社会现象之间的相互依存关系。如生活水平的高低与家庭人口数的多少成反方向变化。与家庭人口数的多少成反方向变化。第3页,此课件共87页哦v第二节第二节 平均数平均数v一、算术平均数一、算术平均数v(一)、定义:算术平均数(一)、定义:算术平均数(Arithmetic mean)也称为均值也称为均值(Mean),是全部数据算术平均的结果。算术平均法是计算平均指标最,是全部数据算术平均的结果。算术平均法是计算平均指标最基本、最常用的方法。计算公式为:基本、最常用的方法。计算公式为:v 算术平均数算术平均数=总体标志
6、总量总体标志总量/总体单位总量总体单位总量v =(X1+X2+X3+Xn)/N v =Xi/Nv 其中:其中:为连加符号;为连加符号;N为总体单位数。为总体单位数。第4页,此课件共87页哦v很多社会经济现象,总体标志总量常常是总体单位变量值的很多社会经济现象,总体标志总量常常是总体单位变量值的算术总和。例如,工人工资总额是总体中每个工人工资的总算术总和。例如,工人工资总额是总体中每个工人工资的总和,某地区小麦总产量是所有耕地小麦产量的总和。在总体和,某地区小麦总产量是所有耕地小麦产量的总和。在总体标志总量和总体单位总量的基础上,就可以计算平均指标。标志总量和总体单位总量的基础上,就可以计算平均
7、指标。v算术平均数在统计学中具有重要的地位,是集中趋势的算术平均数在统计学中具有重要的地位,是集中趋势的最主要度量值,通常用(读作最主要度量值,通常用(读作 )表示。根据所掌握)表示。根据所掌握数据形式的不同,算术平均数有简单算术平均数和加权数据形式的不同,算术平均数有简单算术平均数和加权算术平均数。算术平均数。第5页,此课件共87页哦v(二)简单算术平均数(二)简单算术平均数(Simple arithmetic mean)v未经分组整理的原始数据,其算术平均数的未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除计算就是直接将一组数据的各个数值相加除以数值个数。设统计
8、数据为以数值个数。设统计数据为,则算术平均,则算术平均数的计算公式为:数的计算公式为:v 第6页,此课件共87页哦例例3.3 某班级某班级40名同学统计学的考试成绩原始资料名同学统计学的考试成绩原始资料如表如表3.12所示。所示。v表表3.2 40名同学统计学原始成绩名同学统计学原始成绩第7页,此课件共87页哦v该班该班40名同学统计学的平均成绩为:名同学统计学的平均成绩为:第8页,此课件共87页哦v(三)、加权算术平均数(三)、加权算术平均数(Weighted arithmetic mean)v 当数据资料比较多,且已编制成变量数列的当数据资料比较多,且已编制成变量数列的情况下,就要计算加权
9、算术平均数,以反映情况下,就要计算加权算术平均数,以反映总体中各总体单位某一数量的情况。总体中各总体单位某一数量的情况。第9页,此课件共87页哦v 公式为:公式为:vX=(X1f1+X2f2+Xnfn)/(f1+f2+fn)=Xifi/fiv 其中:其中:f为权数,即变量在总体中出现的次为权数,即变量在总体中出现的次数。数。第10页,此课件共87页哦v由于变量数列可分为单项数列(单项分组)和组距数列由于变量数列可分为单项数列(单项分组)和组距数列(组距分组),(组距分组),v计算加权算术平均值的方法也有两种:计算加权算术平均值的方法也有两种:v由单项分组资料求算术平均值由单项分组资料求算术平均
10、值v 计算公式为:计算公式为:v X=Xifi/fiv 例如:例如:P48 例例2v 由组距分组资料求算术平均值由组距分组资料求算术平均值v 计算公式为:计算公式为:v X=Xmid*f/fv 其中:其中:Xmid表示各组组中值,表示各组组中值,f表示每组次数。表示每组次数。v注意:组中值是假定值(近似值),与实际有差距,但误注意:组中值是假定值(近似值),与实际有差距,但误差很小。差很小。第11页,此课件共87页哦v根据分组整理的数据计算算术平均数,就要根据分组整理的数据计算算术平均数,就要以各组变量值出现的次数或频数为权数计算以各组变量值出现的次数或频数为权数计算加权的算术平均数。设原始数
11、据被分成组,加权的算术平均数。设原始数据被分成组,各组的变量值为各组的变量值为,各组变量值的次数或频,各组变量值的次数或频数分别为数分别为,则加权的算术平均数为:,则加权的算术平均数为:第12页,此课件共87页哦v例例3.4 根据例根据例3.3提供的提供的40名同学的统计学名同学的统计学成绩原始资料分组整理如表成绩原始资料分组整理如表3.13,根据此,根据此表资料计算平均成绩。表资料计算平均成绩。v表表3.3 40名同学统计学成绩汇总表名同学统计学成绩汇总表第13页,此课件共87页哦v根据(根据(3.12)式得)式得第14页,此课件共87页哦v根据(根据(3.12)式计算的平均成绩是)式计算的
12、平均成绩是76.5分,分,而与根据(而与根据(3.11)式计算的平均成绩)式计算的平均成绩77.23分分相比,相差相比,相差0.73分,显然分,显然77.23分是准确的平分是准确的平均成绩,因为(均成绩,因为(3.11)式所用的是原始数据)式所用的是原始数据的全部信息。而(的全部信息。而(3.12)式是用各组的组中)式是用各组的组中值代表各组的实际数据,使用代表值时是假值代表各组的实际数据,使用代表值时是假定各组数据在各组中是均匀分布的,但实际定各组数据在各组中是均匀分布的,但实际情况与这一假定会有一定的偏差,使得利用情况与这一假定会有一定的偏差,使得利用分组资料计算的平均数与实际的平均值会产
13、分组资料计算的平均数与实际的平均值会产生误差,它是实际平均值的近似值。生误差,它是实际平均值的近似值。第15页,此课件共87页哦v加权算术平均数其数值的大小,不仅受各组加权算术平均数其数值的大小,不仅受各组变量值()大小的影响,而且受各组变量值变量值()大小的影响,而且受各组变量值出现的频数即权数()大小的影响。如果某出现的频数即权数()大小的影响。如果某一组的权数大,说明该组的数据较多,那么一组的权数大,说明该组的数据较多,那么该组数据的大小对算术平均数的影响就越大,该组数据的大小对算术平均数的影响就越大,反之,则越小。实际上,我们将(反之,则越小。实际上,我们将(3.12)式)式变形为下面
14、的形式,就更能清楚地看出这一变形为下面的形式,就更能清楚地看出这一点。点。第16页,此课件共87页哦第17页,此课件共87页哦v由(由(3.13)式可以清楚地看出,加权算术平均数受)式可以清楚地看出,加权算术平均数受各组变量值()和各组权数即频率大小的影响。频各组变量值()和各组权数即频率大小的影响。频率越大,相应的变量值计入平均数的份额也越大,率越大,相应的变量值计入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,相应的对平均数的影响就越大;反之,频率越小,相应的变量值计入平均数的份额也越小,对平均数的影响变量值计入平均数的份额也越小,对平均数的影响就越小。这就是权数权衡轻重作用的
15、实质。就越小。这就是权数权衡轻重作用的实质。第18页,此课件共87页哦v当我们掌握的权数不是各组变量值出现的频数,当我们掌握的权数不是各组变量值出现的频数,而是频率时,可直接根据(而是频率时,可直接根据(4.3.3)式计算算术平)式计算算术平均数。均数。第19页,此课件共87页哦v如例如例3.2,根据各组的频数计算的频率分别为:,根据各组的频数计算的频率分别为:0.05、0.2、0.4、0.25、0.1,各组频率之和,各组频率之和为为1,则用频率计算的加权算术平均数为:,则用频率计算的加权算术平均数为:第20页,此课件共87页哦第21页,此课件共87页哦v从计算结果看,用频率加权计算的结果与用
16、从计算结果看,用频率加权计算的结果与用频数加权计算的结果是一致的。频数加权计算的结果是一致的。第22页,此课件共87页哦v在实际生活中,我们也会经常遇到由相对数在实际生活中,我们也会经常遇到由相对数计算平均数的情况。一般地说,求相对数的计算平均数的情况。一般地说,求相对数的平均数应采用加权平均的方法,此时,用于平均数应采用加权平均的方法,此时,用于加权平均的权数不再是频数或频率,而应根加权平均的权数不再是频数或频率,而应根据相对数的含义,选择适当的权数。下面举据相对数的含义,选择适当的权数。下面举一个实例说明。一个实例说明。第23页,此课件共87页哦v例例3.5 某公司所属某公司所属10个企业
17、资金利润率分组个企业资金利润率分组资料如表资料如表3.4,要求计算该公司,要求计算该公司10个企业的平个企业的平均利润率。均利润率。v表表3.4 某公司所属某公司所属10个企业资金利润率分个企业资金利润率分组资料组资料第24页,此课件共87页哦v该例子的平均对象是各企业的资金利润率,该例子的平均对象是各企业的资金利润率,表中的企业数虽然是次数或频数,但却不是表中的企业数虽然是次数或频数,但却不是合适的权数。要正确计算公司合适的权数。要正确计算公司10个企业的平个企业的平均资金利润率,因为资金利润率均资金利润率,因为资金利润率=利润总额利润总额/资金总额,所以计算平均资金利润率需要以资金总额,所
18、以计算平均资金利润率需要以资金总额为权数,才能符合该指标的性质。资金总额为权数,才能符合该指标的性质。因此,该公司因此,该公司10个企业的平均利润率为:个企业的平均利润率为:第25页,此课件共87页哦v(四)算数平均数的数学性质(四)算数平均数的数学性质v算术平均数在统计学中具有重要的地位,它是进行统计分析和统计算术平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。从统计思想上看,算术平均数是一组数据的重心所在,推断的基础。从统计思想上看,算术平均数是一组数据的重心所在,它是消除了一些随机因素影响后或者数据误差相互抵消后的必然性它是消除了一些随机因素影响后或者数据误差相互抵消后
19、的必然性的结果。例如每年分季度的观测数据,各年同季的数据由于受一些的结果。例如每年分季度的观测数据,各年同季的数据由于受一些偶然性随机因素的影响,其数值表现出一定的差异性,但将各年同偶然性随机因素的影响,其数值表现出一定的差异性,但将各年同季的数据加以平均,计算的算术平均数,就消除了一些随机因素的季的数据加以平均,计算的算术平均数,就消除了一些随机因素的影响,反映出季节变动必然性的数量特征。再如,对同一事物进行影响,反映出季节变动必然性的数量特征。再如,对同一事物进行多次测量,由于测量误差所致,或者其它因素的偶然影响,使得测多次测量,由于测量误差所致,或者其它因素的偶然影响,使得测量结果不一致
20、,但利用算术平均数作为其代表值,则可以使误差相量结果不一致,但利用算术平均数作为其代表值,则可以使误差相互抵消,反映出事物固有的数量特征。另外,算术平均数具有下面互抵消,反映出事物固有的数量特征。另外,算术平均数具有下面一些重要的数学性质,这些数学性质在实际中有着广泛的应用,同一些重要的数学性质,这些数学性质在实际中有着广泛的应用,同时也体现了算术平均数的统计思想。时也体现了算术平均数的统计思想。第26页,此课件共87页哦第27页,此课件共87页哦v二、调和平均数(二、调和平均数(Harmonic mean)v在实际工作中,经常会遇到只有各组变量值在实际工作中,经常会遇到只有各组变量值和各组标
21、志总量而缺少总体单位数的情况,和各组标志总量而缺少总体单位数的情况,这时就要用调和平均数法计算平均指标。这时就要用调和平均数法计算平均指标。v为了方便调和平均数的概念和计算方法的说为了方便调和平均数的概念和计算方法的说明,我们先看一个简单的例子。明,我们先看一个简单的例子。第28页,此课件共87页哦v例例3.6 市场上早、中、晚蔬菜的价格分别是市场上早、中、晚蔬菜的价格分别是早晨:早晨:0.67元元/公斤,中午公斤,中午0.5元元/公斤,晚上公斤,晚上0.4元元/公斤。现在,我们分别按四种方法在购公斤。现在,我们分别按四种方法在购买蔬菜,分别计算平均价格(不管按什么方买蔬菜,分别计算平均价格(
22、不管按什么方法购买,平均价格都应该等于花费的现金除法购买,平均价格都应该等于花费的现金除所买蔬菜的数量):所买蔬菜的数量):第29页,此课件共87页哦第30页,此课件共87页哦第31页,此课件共87页哦v第三种买法:早、中、晚各买一元第三种买法:早、中、晚各买一元v在这种情况下,计算蔬菜平均价格比上述两在这种情况下,计算蔬菜平均价格比上述两种方法稍微复杂一些,我们得先计算出一元种方法稍微复杂一些,我们得先计算出一元钱所购买蔬菜的数量,然后再计算蔬菜的平钱所购买蔬菜的数量,然后再计算蔬菜的平均价格。均价格。v要计算蔬菜的平均价格,首先应该计算出早、要计算蔬菜的平均价格,首先应该计算出早、中、晚各
23、花费中、晚各花费1元钱所购买蔬菜的数量:元钱所购买蔬菜的数量:第32页,此课件共87页哦第33页,此课件共87页哦v这种计算平均指标的方法同算术平均法有很这种计算平均指标的方法同算术平均法有很大的不同,由于资料中缺乏总体单位总量,大的不同,由于资料中缺乏总体单位总量,所以,就不可能直接用算术平均的方法计算所以,就不可能直接用算术平均的方法计算平均指标。为了达到计算目的,首先要用变平均指标。为了达到计算目的,首先要用变量值的倒数计算出总体单位总量来,然后再量值的倒数计算出总体单位总量来,然后再计算平均指标,调和平均数法因此而得名,计算平均指标,调和平均数法因此而得名,也正是由于这个原因,调和平均
24、数又称为倒也正是由于这个原因,调和平均数又称为倒数平均数。数平均数。第34页,此课件共87页哦第35页,此课件共87页哦v在上述计算平均价格的过程中,早、中、晚在上述计算平均价格的过程中,早、中、晚三个时段购买蔬菜所花费的现金是计算平均三个时段购买蔬菜所花费的现金是计算平均价格的权数,这种方法我们称为加权调和平价格的权数,这种方法我们称为加权调和平均法。均法。v由以上分析过程得出调和平均数的定义:由以上分析过程得出调和平均数的定义:v调和平均数是各个变量值倒数的算术平均数调和平均数是各个变量值倒数的算术平均数的倒数,习惯上用的倒数,习惯上用(H)表示。表示。第36页,此课件共87页哦第37页,
25、此课件共87页哦v在实际工作中,调和平均数通常是作为算术在实际工作中,调和平均数通常是作为算术平均数的变形使用的,也就是由于受所掌握平均数的变形使用的,也就是由于受所掌握资料的限制,有时不能直接采用算术平均数资料的限制,有时不能直接采用算术平均数的计算公式计算平均数,这就需要使用调和的计算公式计算平均数,这就需要使用调和平均数的形式进行计算。为了更好地理解调平均数的形式进行计算。为了更好地理解调和平均数的应用场合,我们看下面的例子。和平均数的应用场合,我们看下面的例子。第38页,此课件共87页哦v例例3.6 某商品有三种不同的规格,销售单价某商品有三种不同的规格,销售单价与销售量如表与销售量如
26、表3.5所示,求这三种不同规格商所示,求这三种不同规格商品的平均销售单价。品的平均销售单价。v表表3.5 某商品三种规格的销售数据某商品三种规格的销售数据第39页,此课件共87页哦第40页,此课件共87页哦v如果已知的不是销售量数据,而是销售额,如果已知的不是销售量数据,而是销售额,如表如表3.16所示,就应改变计算方法。所示,就应改变计算方法。v表表3.6 某商品三种规格的销售数据某商品三种规格的销售数据第41页,此课件共87页哦第42页,此课件共87页哦第43页,此课件共87页哦v由此可见,调和平均数和算术平均数在本质由此可见,调和平均数和算术平均数在本质上是一致的,惟一的区别是计算时使用
27、了不上是一致的,惟一的区别是计算时使用了不同的数据。在实际应用时,可掌握这样的原同的数据。在实际应用时,可掌握这样的原则,当计算算术平均数其分子资料未知时,则,当计算算术平均数其分子资料未知时,就采用加权算术平均数计算平均数,分母资就采用加权算术平均数计算平均数,分母资料未知时,就采用加权调和平均数计算平均料未知时,就采用加权调和平均数计算平均数。数。第44页,此课件共87页哦v三、几何平均数三、几何平均数(Geometric mean)v几何平均数是个变量值乘积的次方根。可分几何平均数是个变量值乘积的次方根。可分为简单几何平均数和加权几何平均数,计算为简单几何平均数和加权几何平均数,计算公式
28、分别为:公式分别为:第45页,此课件共87页哦第46页,此课件共87页哦v几何平均数是适应于特殊数据的一种平均数,几何平均数是适应于特殊数据的一种平均数,在实际生活中,通常用来计算平均比率和平在实际生活中,通常用来计算平均比率和平均速度。当所掌握的变量值本身是比率的形均速度。当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,就式,而且各比率的乘积等于总的比率时,就应采用几何平均法计算平均比率。应采用几何平均法计算平均比率。第47页,此课件共87页哦v例例3.7 某产品需经三个车间连续加工,已知某产品需经三个车间连续加工,已知三个车间制品的合格率分别为三个车间制品的合格率分别为9
29、5%、90%、98%,求三个车间平均合格率。,求三个车间平均合格率。第48页,此课件共87页哦第49页,此课件共87页哦v例例3.8 某地区某地区GDP 19911995年平均发展年平均发展速度为速度为107.2%,19961998年平均发展速年平均发展速度为度为108.7%,19992000年平均发展速度年平均发展速度为为110%,求该地区,求该地区19912000年间的平均年间的平均发展速度。发展速度。第50页,此课件共87页哦第51页,此课件共87页哦第三节、中位数和分位数第三节、中位数和分位数v一、概念要点一、概念要点v中位数是将总体各单位标志值按大小顺序排中位数是将总体各单位标志值按
30、大小顺序排列后,处于中间位置的那个数值。列后,处于中间位置的那个数值。第52页,此课件共87页哦第53页,此课件共87页哦第54页,此课件共87页哦第55页,此课件共87页哦第56页,此课件共87页哦第57页,此课件共87页哦v四、分位数四、分位数v中位数是从中间点将全部数据等分为两部分。与中位数中位数是从中间点将全部数据等分为两部分。与中位数类似的还有四分位数(类似的还有四分位数(quartile)、十分位数()、十分位数(decile)和百分位数()和百分位数(percentile)等。它们分别是用)等。它们分别是用3个点、个点、9个点和个点和99个点将数据四等分、个点将数据四等分、10等
31、分和等分和100等分后各等分后各分位点上的值。这里只介绍四分位数的计算,其他分分位点上的值。这里只介绍四分位数的计算,其他分位数与之类似。位数与之类似。v一组数据排序后处于一组数据排序后处于25和和75位置上的值,称为四分位置上的值,称为四分位数,也称四分位点。位数,也称四分位点。第58页,此课件共87页哦v四分位数是通过三个点将全部数据等分为四部分,其中每四分位数是通过三个点将全部数据等分为四部分,其中每部分包含部分包含25的数据。很显然,中间的四分位数就是中位的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在数,因此通常所说的四分位数是指处在25位置上的数值位置上的数
32、值(下四分位数)和处在(下四分位数)和处在75位置上的数值(上四分位数)位置上的数值(上四分位数)。与中位数的计算方法类似,根据未分组数据计算四。与中位数的计算方法类似,根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数分位数时,首先对数据进行排序,然后确定四分位数所在的位置。所在的位置。第59页,此课件共87页哦第60页,此课件共87页哦v例例3.2在某城市中随机抽取在某城市中随机抽取9个家庭,调查得个家庭,调查得到每个家庭的人均月收入数据如下(单位到每个家庭的人均月收入数据如下(单位:元)元),1500、750、780、1080、850、960、2000、1250、1630
33、,计算人均月收入的四分,计算人均月收入的四分位数。位数。第61页,此课件共87页哦第62页,此课件共87页哦第63页,此课件共87页哦第四节、众数第四节、众数(Mode)v一、一、概念要点概念要点v众数是指一组数据中出现次数最多的变量值,众数是指一组数据中出现次数最多的变量值,用表示。从变量分布的角度看,众数是具有用表示。从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果高峰点所对应的数值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,数据的分布没有明显的集中趋势或最高峰点,众数也可以不存
34、在;如果有多个高峰点,也众数也可以不存在;如果有多个高峰点,也就有多个众数。就有多个众数。第64页,此课件共87页哦v1.集中趋势的测度值之一集中趋势的测度值之一v2.出现次数最多的变量值出现次数最多的变量值v3.不受极端值的影响不受极端值的影响v4.可能没有众数或有几个众数可能没有众数或有几个众数v5.主要用于定类数据,也可用于定序数据和主要用于定类数据,也可用于定序数据和数值型数据数值型数据第65页,此课件共87页哦v众数的不唯一性:众数的不唯一性:v无众数原始数据无众数原始数据:10 5 9 12 6 8v一个众数原始数据一个众数原始数据:6 5 9 8 5 5v多于一个众数原始数据多于
35、一个众数原始数据:25 28 28 36 42 42第66页,此课件共87页哦v二、众数的计算二、众数的计算v根据未分组数据或单变量值分组数据计算众根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值数时,我们只需找出出现次数最多的变量值即为众数。对于组距分组数据,众数的数值即为众数。对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:种关系可作如下的理解:第67页,此课件共87页哦第68页,此课件共87页哦第69页,此课件共87页哦第70页,此课件共87页哦第71页,此课件共87页哦v利用上述公
36、式计算众数时是假定数据分布具利用上述公式计算众数时是假定数据分布具有明显的集中趋势,且众数组的频数在该组有明显的集中趋势,且众数组的频数在该组内是均匀分布的,若这些假定不成立,则众内是均匀分布的,若这些假定不成立,则众数的代表性就会很差。从众数的计算公式可数的代表性就会很差。从众数的计算公式可以看出,众数是根据众数组及相邻组的频率以看出,众数是根据众数组及相邻组的频率分布信息来确定数据中心点位置的,因此,分布信息来确定数据中心点位置的,因此,众数是一个位置代表值,它不受数据中极端众数是一个位置代表值,它不受数据中极端值的影响。值的影响。第72页,此课件共87页哦第五节、平均数之间的关系第五节、
37、平均数之间的关系v一、算术平均数、调和平均数和几何平均数一、算术平均数、调和平均数和几何平均数的关系的关系v算术平均数、调和平均数和几何平均数都是算术平均数、调和平均数和几何平均数都是数值平均数,即都是根据所有数据计算的。数值平均数,即都是根据所有数据计算的。如果从纯数量关系上考察,这三种平均数的如果从纯数量关系上考察,这三种平均数的关系如下:关系如下:第73页,此课件共87页哦第74页,此课件共87页哦第75页,此课件共87页哦v三种数值平均数的这种关系是纯数学意义上的。当然,三种数值平均数的这种关系是纯数学意义上的。当然,在实际应用中,采用何种平均数应取决于现象的客观在实际应用中,采用何种
38、平均数应取决于现象的客观性质和研究目的。就是说,适宜用算术平均数计算的,性质和研究目的。就是说,适宜用算术平均数计算的,就不能用调和平均数或几何平均数计算,反之亦然。就不能用调和平均数或几何平均数计算,反之亦然。算术平均数是应用最为广泛的一种平均数,因为其计算术平均数是应用最为广泛的一种平均数,因为其计算方法是与许多社会经济现象的数量关系相符合的,算方法是与许多社会经济现象的数量关系相符合的,即许多社会经济现象总体各单位的标志值之和等于总即许多社会经济现象总体各单位的标志值之和等于总体的标志总量,且这种方法易理解并具有优良的数学体的标志总量,且这种方法易理解并具有优良的数学性质。调和平均数在实
39、际应用中,通常是作为算术平性质。调和平均数在实际应用中,通常是作为算术平均数的变形使用的,即利用调和平均数的形式来计算均数的变形使用的,即利用调和平均数的形式来计算算术平均数。几何平均数适合于对一些特殊数据如比算术平均数。几何平均数适合于对一些特殊数据如比率、速度等的平均。率、速度等的平均。第76页,此课件共87页哦v二、算术平均数与众数、中位数的关系二、算术平均数与众数、中位数的关系v算术平均数与众数、中位数的关系取决于频算术平均数与众数、中位数的关系取决于频数分布的状况。它们的关系如下:数分布的状况。它们的关系如下:第77页,此课件共87页哦第78页,此课件共87页哦第79页,此课件共87
40、页哦第80页,此课件共87页哦v从上面的分析我们可以看出,当频数分布出从上面的分析我们可以看出,当频数分布出现偏态时,极端值对算术平均数产生很大的现偏态时,极端值对算术平均数产生很大的影响,而对众数、中位数没有影响,此时,影响,而对众数、中位数没有影响,此时,用众数、中位数作为一组数据的中心值比算用众数、中位数作为一组数据的中心值比算术平均数有较高的代表性。术平均数有较高的代表性。第81页,此课件共87页哦第82页,此课件共87页哦v 例例3.9 根据某城市住户家庭月收入的抽样调根据某城市住户家庭月收入的抽样调查资料算得众数为查资料算得众数为2043元,中位数为元,中位数为2271元,元,问算
41、术平均数为多少?其分布呈何形态?问算术平均数为多少?其分布呈何形态?第83页,此课件共87页哦第84页,此课件共87页哦v三、众数、中位数和均值的特点和应用场合三、众数、中位数和均值的特点和应用场合v众数、中位数和均值的应用场合根据三者各众数、中位数和均值的应用场合根据三者各自的特点和分布情况去确定其应用的场合。自的特点和分布情况去确定其应用的场合。第85页,此课件共87页哦第86页,此课件共87页哦v评价集中量数的优劣有一个标准,即:哪一种集中量评价集中量数的优劣有一个标准,即:哪一种集中量数能最准确、最稳定地反映数据整体的集中趋势,哪数能最准确、最稳定地反映数据整体的集中趋势,哪一种集中量
42、数就是最好的集中量数。从这个标准看,一种集中量数就是最好的集中量数。从这个标准看,三者各有其优缺点。其中平均数是公认的最好的一种,三者各有其优缺点。其中平均数是公认的最好的一种,也是使用的最多的一种。由于计算平均数时每个数据也是使用的最多的一种。由于计算平均数时每个数据均参与了计算,因而它能最全面、最准确地反映数据均参与了计算,因而它能最全面、最准确地反映数据整体的集中趋势。但是它往往受少数几个极端数据的整体的集中趋势。但是它往往受少数几个极端数据的影响,因此当存在着极端数据、或数据整体中有个别影响,因此当存在着极端数据、或数据整体中有个别数据不准确、不清楚的情况下,中位数比平均数更准数据不准确、不清楚的情况下,中位数比平均数更准确、更稳定地反映数据的整体集中趋势。相比之下,确、更稳定地反映数据的整体集中趋势。相比之下,众数是最差的一种,但它的优点是,在需要快速而又众数是最差的一种,但它的优点是,在需要快速而又粗略地找出一组数据的代表值时,众数就表现出它的粗略地找出一组数据的代表值时,众数就表现出它的优越性。优越性。第87页,此课件共87页哦