《统计数据分布特征的度量.ppt》由会员分享,可在线阅读,更多相关《统计数据分布特征的度量.ppt(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第4章统计数据分布特征的度量章统计数据分布特征的度量 4.1 绝对数与相对数绝对数与相对数4.2集中趋势的测度集中趋势的测度4.3离散程度的测度离散程度的测度4.4偏态与峰度的测度偏态与峰度的测度4.1绝对数和相对数绝对数和相对数 n n绝对数绝对数n n1.绝对数的概念与作用绝对数的概念与作用n n绝对数又称总量指标、数量指标、绝对指标,绝对数又称总量指标、数量指标、绝对指标,它是反映社会经济现象总体在一定时间、地它是反映社会经济现象总体在一定时间、地点和条件下的总规模、总水平或工作总量的点和条件下的总规模、总水平或工作总量的一个综合概念。一个综合概念。n n绝对数的作用主要有:绝对数的作
2、用主要有:(1)通过绝对数可以了解社会经济现象总体的)通过绝对数可以了解社会经济现象总体的基本情况基本情况(2)绝对数是编制计划,实行管理的主要)绝对数是编制计划,实行管理的主要(3)绝对数是计算相对数和平均数的基础)绝对数是计算相对数和平均数的基础n n2.绝对数的种类绝对数的种类n n(1 1)按其反映总体内容的不同,可分)按其反映总体内容的不同,可分为总体单位总量和总体标志总量为总体单位总量和总体标志总量n n(2 2)按其反映时间状况的不同,分为)按其反映时间状况的不同,分为时期数和时点数时期数和时点数n n3.3.绝对数的计量单位绝对数的计量单位绝对数的计量单位绝对数的计量单位n n
3、(1 1)实物单位)实物单位)实物单位)实物单位n n实物单位是根据事物的自然属性和特点而采用实物单位是根据事物的自然属性和特点而采用实物单位是根据事物的自然属性和特点而采用实物单位是根据事物的自然属性和特点而采用的计量单位,包括自然单位、度量衡单位、标准的计量单位,包括自然单位、度量衡单位、标准的计量单位,包括自然单位、度量衡单位、标准的计量单位,包括自然单位、度量衡单位、标准实物单位、多重单位与复合单位。实物单位、多重单位与复合单位。实物单位、多重单位与复合单位。实物单位、多重单位与复合单位。n n(2 2)货币单位)货币单位)货币单位)货币单位n n货币单位是以货币作为价值尺度来计量的绝
4、对货币单位是以货币作为价值尺度来计量的绝对货币单位是以货币作为价值尺度来计量的绝对货币单位是以货币作为价值尺度来计量的绝对数,如国民生产总值、国民收入、商品销售额、数,如国民生产总值、国民收入、商品销售额、数,如国民生产总值、国民收入、商品销售额、数,如国民生产总值、国民收入、商品销售额、工资总额等都是以货币单位(工资总额等都是以货币单位(工资总额等都是以货币单位(工资总额等都是以货币单位(“元元元元”、“万元万元万元万元”、“亿元亿元亿元亿元”等)计量的。等)计量的。等)计量的。等)计量的。n n(3 3)劳动量单位)劳动量单位)劳动量单位)劳动量单位n n劳动量单位是用劳动时间表示的计量单
5、位,也劳动量单位是用劳动时间表示的计量单位,也劳动量单位是用劳动时间表示的计量单位,也劳动量单位是用劳动时间表示的计量单位,也是一种复合单位,是工人数与劳动时间的乘积,是一种复合单位,是工人数与劳动时间的乘积,是一种复合单位,是工人数与劳动时间的乘积,是一种复合单位,是工人数与劳动时间的乘积,如如如如“工时工时工时工时”、“工日工日工日工日”等。等。等。等。n n4.绝对数的计算及应用绝对数的计算及应用n n绝对数的计算及应用应注意以下几点:绝对数的计算及应用应注意以下几点:n n(1)正确确定绝对数的含义、构成内)正确确定绝对数的含义、构成内容、计算范围容、计算范围n n(2)使用统一计量单
6、位)使用统一计量单位n n(3)选择恰当的计算方法)选择恰当的计算方法n n绝对数的计算方法主要有两种:直接绝对数的计算方法主要有两种:直接计量法、推算和估算法。计量法、推算和估算法。n n相对数相对数相对数相对数n n1.1.相对数的概念和作用相对数的概念和作用相对数的概念和作用相对数的概念和作用 n n相对数又称相对指标,它是指两个有联系的现象相对数又称相对指标,它是指两个有联系的现象相对数又称相对指标,它是指两个有联系的现象相对数又称相对指标,它是指两个有联系的现象数值的比率,用以反映社会经济现象发展的程度、数值的比率,用以反映社会经济现象发展的程度、数值的比率,用以反映社会经济现象发展
7、的程度、数值的比率,用以反映社会经济现象发展的程度、结构、强度、普遍程度或比例关系。其数值有两结构、强度、普遍程度或比例关系。其数值有两结构、强度、普遍程度或比例关系。其数值有两结构、强度、普遍程度或比例关系。其数值有两种表现形式:无名数和有名数。种表现形式:无名数和有名数。种表现形式:无名数和有名数。种表现形式:无名数和有名数。n n相对数的作用主要有:相对数的作用主要有:相对数的作用主要有:相对数的作用主要有:n n(1 1)相对数可以使人们清楚了解现象的相对水)相对数可以使人们清楚了解现象的相对水)相对数可以使人们清楚了解现象的相对水)相对数可以使人们清楚了解现象的相对水平和普遍程度平和
8、普遍程度平和普遍程度平和普遍程度n n(2 2)相对数可以使无法直接对比的现象找到可)相对数可以使无法直接对比的现象找到可)相对数可以使无法直接对比的现象找到可)相对数可以使无法直接对比的现象找到可以对比的基础以对比的基础以对比的基础以对比的基础n n(3 3)说明总体内在的结构特征,为深入分析事)说明总体内在的结构特征,为深入分析事)说明总体内在的结构特征,为深入分析事)说明总体内在的结构特征,为深入分析事物的性质提供依据物的性质提供依据物的性质提供依据物的性质提供依据n n2.相对数的种类及其计算方法相对数的种类及其计算方法n n(1)结构相对数)结构相对数n n结构相对数是在对总体分组的
9、基础上,以结构相对数是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情总体总量的比重,来反映总体内部组成情况的综合指标。况的综合指标。用公式表示如下:用公式表示如下:n n n n(2)比例相对数)比例相对数n n比例相对数是反映总体内部各个组成比例相对数是反映总体内部各个组成部分之间的比例关系和均衡状况的综部分之间的比例关系和均衡状况的综合指标。计算公式为:合指标。计算公式为:n n(3)比较相对数)比较相对数n n比较相对数是将不同地区、单位或企业比较相对数是将不同地区、单位或企业之间的同类指标数值作静态对
10、比而得出的之间的同类指标数值作静态对比而得出的综合指标,表明同类事物在不同空间条件综合指标,表明同类事物在不同空间条件下的差异程度或相对状态,用以说明某一下的差异程度或相对状态,用以说明某一同类现象在同一时间内不同空间发展的不同类现象在同一时间内不同空间发展的不平衡程度,以表明同类实物在不同条件下平衡程度,以表明同类实物在不同条件下的数量对比关系。其计算公式为:的数量对比关系。其计算公式为:n n(4)强度相对数)强度相对数n n强度相对数是指在同一地区或单位内,两强度相对数是指在同一地区或单位内,两个性质不同但有一定联系的绝对数对比得个性质不同但有一定联系的绝对数对比得出的相对数,用来分析不
11、同事物之间的数出的相对数,用来分析不同事物之间的数量对比关系,表明某一现象在另一现象中量对比关系,表明某一现象在另一现象中发展的强度、密度和普遍程度。发展的强度、密度和普遍程度。其计算公其计算公式为:式为:n n强度相对数有正指标、逆指标之分。强度相对数有正指标、逆指标之分。n n(5)动态相对数)动态相对数n n动态相对数又称发展速度,是同一空间同动态相对数又称发展速度,是同一空间同类现象数值在不同时间状态下对比的结果,类现象数值在不同时间状态下对比的结果,表明同类事物的报告期(被研究的时期,表明同类事物的报告期(被研究的时期,又称本期、现期、计算期)水平与基期又称本期、现期、计算期)水平与
12、基期(作为比较基准的时期)水平对比发展变(作为比较基准的时期)水平对比发展变化的相对程度。其计算公式如下:化的相对程度。其计算公式如下:n n(6)计划完成程度相对数)计划完成程度相对数n n计划完成程度相对数是用来检查、监督计划完成程度相对数是用来检查、监督计划执行情况的一个分析指标,它是以现计划执行情况的一个分析指标,它是以现象在某一段时间内的实际完成数与计划数象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度,一般用百分对比,来观察计划完成程度,一般用百分数来表示计划完成程度相对数基本计算公数来表示计划完成程度相对数基本计算公式为:式为:n n3.正确计算相对数的原则正确计算相
13、对数的原则n n(1)可比性原则)可比性原则n n(2)多种相对数综合应用的原则)多种相对数综合应用的原则n n(3)相对数与绝对数结合应用的原则)相对数与绝对数结合应用的原则4.2集中趋势的测度集中趋势的测度 n n集中趋势的含义集中趋势的含义n n集中趋势(集中趋势(集中趋势(集中趋势(centraltendencycentraltendency)是指一组数据)是指一组数据)是指一组数据)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是向某一中心值靠拢的倾向,测度集中趋势也就是向某一中心值靠拢的倾向,测度集中趋势也就是向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值
14、或中心值。寻找数据一般水平的代表值或中心值。寻找数据一般水平的代表值或中心值。寻找数据一般水平的代表值或中心值。n n集中趋势的测度,主要是计算各种平均数,平均集中趋势的测度,主要是计算各种平均数,平均集中趋势的测度,主要是计算各种平均数,平均集中趋势的测度,主要是计算各种平均数,平均数,也称平均指标,是表示同类社会经济现象在数,也称平均指标,是表示同类社会经济现象在数,也称平均指标,是表示同类社会经济现象在数,也称平均指标,是表示同类社会经济现象在一定的时间、地点、条件下所达到的一般水平的一定的时间、地点、条件下所达到的一般水平的一定的时间、地点、条件下所达到的一般水平的一定的时间、地点、条
15、件下所达到的一般水平的代表值,如平均工资、平均价格、平均单位成本、代表值,如平均工资、平均价格、平均单位成本、代表值,如平均工资、平均价格、平均单位成本、代表值,如平均工资、平均价格、平均单位成本、平均亩产量等。平均亩产量等。平均亩产量等。平均亩产量等。n n1.平均数的特点平均数的特点n n(1)反映集中趋势)反映集中趋势n n(2)平均数是抽象值平均数是抽象值n n(3)平均数是代表值)平均数是代表值n n(4)所计算总体的同质性)所计算总体的同质性n n2.平均数的作用平均数的作用n n(1)利用平均数可以比较同类现象在不同)利用平均数可以比较同类现象在不同单位的发展水平单位的发展水平n
16、 n(2)利用平均数可分析研究事物之间的利用平均数可分析研究事物之间的依存关系依存关系n n(3)利用平均数可以比较同类现象在不利用平均数可以比较同类现象在不同时间上的发展变化趋势同时间上的发展变化趋势n n(4)利用平均数作为企业管理的依据,并)利用平均数作为企业管理的依据,并可进行数量上的推算可进行数量上的推算n n数值平均数数值平均数n n1.算术平均数算术平均数n n算术平均数,也称均值,是对全部数据进算术平均数,也称均值,是对全部数据进行算术平均,是集中趋势的最主要测度值,行算术平均,是集中趋势的最主要测度值,是计算平均数的最常用方法,它的基本计是计算平均数的最常用方法,它的基本计算
17、形式是用总体标志总量除以总体单位总算形式是用总体标志总量除以总体单位总量。量。n n在实际数据的分析中,根据掌握的数据资在实际数据的分析中,根据掌握的数据资料的不同,算术平均数有两种计算形式:料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数。即简单算术平均数和加权算术平均数。n n(1 1)简单算术平均数)简单算术平均数)简单算术平均数)简单算术平均数n n简单算术平均数适用于未分组的统计资料,如果简单算术平均数适用于未分组的统计资料,如果简单算术平均数适用于未分组的统计资料,如果简单算术平均数适用于未分组的统计资料,如果已知各单位标志值和总体单位数,可采用简单算已知各单位
18、标志值和总体单位数,可采用简单算已知各单位标志值和总体单位数,可采用简单算已知各单位标志值和总体单位数,可采用简单算术平均数方法计算,其计算公式为:术平均数方法计算,其计算公式为:术平均数方法计算,其计算公式为:术平均数方法计算,其计算公式为:n n由于算术平均数受极端数值的影响很明显,为了由于算术平均数受极端数值的影响很明显,为了由于算术平均数受极端数值的影响很明显,为了由于算术平均数受极端数值的影响很明显,为了消除极端数值的影响,在实际应用中还可以计算消除极端数值的影响,在实际应用中还可以计算消除极端数值的影响,在实际应用中还可以计算消除极端数值的影响,在实际应用中还可以计算截尾平均数。截
19、尾平均数的计算公式可以表示为:截尾平均数。截尾平均数的计算公式可以表示为:截尾平均数。截尾平均数的计算公式可以表示为:截尾平均数。截尾平均数的计算公式可以表示为:n n(2)(2)(2)(2)加权算术平均数加权算术平均数加权算术平均数加权算术平均数n n如果数据资料经过统计整理环节,形成了变量数如果数据资料经过统计整理环节,形成了变量数如果数据资料经过统计整理环节,形成了变量数如果数据资料经过统计整理环节,形成了变量数列,如果在已知各组的变量值和变量值出现的次列,如果在已知各组的变量值和变量值出现的次列,如果在已知各组的变量值和变量值出现的次列,如果在已知各组的变量值和变量值出现的次数,则可采
20、用加权算术平均数计算。其计算公式数,则可采用加权算术平均数计算。其计算公式数,则可采用加权算术平均数计算。其计算公式数,则可采用加权算术平均数计算。其计算公式为:为:为:为:在加权算术平均数的计算公式中,权数除了用绝对在加权算术平均数的计算公式中,权数除了用绝对在加权算术平均数的计算公式中,权数除了用绝对在加权算术平均数的计算公式中,权数除了用绝对数形式(即各组次数、也称频数)表示外,还可数形式(即各组次数、也称频数)表示外,还可数形式(即各组次数、也称频数)表示外,还可数形式(即各组次数、也称频数)表示外,还可以用相对数形式即频率表示,此时加权算术平均以用相对数形式即频率表示,此时加权算术平
21、均以用相对数形式即频率表示,此时加权算术平均以用相对数形式即频率表示,此时加权算术平均数可以变形成如下形式:数可以变形成如下形式:数可以变形成如下形式:数可以变形成如下形式:n n(3)(3)(3)(3)算术平均数的数学性质算术平均数的数学性质n n算术平均数有两个重要数学性质:算术平均数有两个重要数学性质:n n各变量值与其算术平均数的离差之代数各变量值与其算术平均数的离差之代数和等于零和等于零n n各变量值与其算术平均数的离差平方之各变量值与其算术平均数的离差平方之和为最小值和为最小值n n2.2.2.2.调和平均数调和平均数调和平均数调和平均数n n调和平均数是各个变量值倒数的算术平均数
22、的倒调和平均数是各个变量值倒数的算术平均数的倒调和平均数是各个变量值倒数的算术平均数的倒调和平均数是各个变量值倒数的算术平均数的倒数,又称为倒数平均数。调和平均数有独立的计数,又称为倒数平均数。调和平均数有独立的计数,又称为倒数平均数。调和平均数有独立的计数,又称为倒数平均数。调和平均数有独立的计算形式,但在实际应用中,调和平均数常常被作算形式,但在实际应用中,调和平均数常常被作算形式,但在实际应用中,调和平均数常常被作算形式,但在实际应用中,调和平均数常常被作为算术平均数的变形来使用。为算术平均数的变形来使用。为算术平均数的变形来使用。为算术平均数的变形来使用。n n(1)(1)(1)(1)
23、简单调和平均数简单调和平均数简单调和平均数简单调和平均数 n n(2)(2)(2)(2)加权调和平均数加权调和平均数加权调和平均数加权调和平均数 n n3.3.3.3.几何平均数几何平均数几何平均数几何平均数n n几何平均数是变量值的连乘积开变量值的项数次方。几何平均数是变量值的连乘积开变量值的项数次方。几何平均数是变量值的连乘积开变量值的项数次方。几何平均数是变量值的连乘积开变量值的项数次方。n n(1 1 1 1)简单几何平均数)简单几何平均数)简单几何平均数)简单几何平均数n n简单几何平均数是个变量值乘积的简单几何平均数是个变量值乘积的简单几何平均数是个变量值乘积的简单几何平均数是个变
24、量值乘积的n n n n次方根。次方根。次方根。次方根。n n(2 2 2 2)加权几何平均数)加权几何平均数)加权几何平均数)加权几何平均数n n如果各个变量值出现的次数不等,则可采用加权几如果各个变量值出现的次数不等,则可采用加权几如果各个变量值出现的次数不等,则可采用加权几如果各个变量值出现的次数不等,则可采用加权几何数公式进行计算。何数公式进行计算。何数公式进行计算。何数公式进行计算。n n位置平均数位置平均数位置平均数位置平均数n n数值平均数是根据所有变量值计算的平均数,而数值平均数是根据所有变量值计算的平均数,而数值平均数是根据所有变量值计算的平均数,而数值平均数是根据所有变量值
25、计算的平均数,而位置平均数是根据变量值所处的特殊位置确定平位置平均数是根据变量值所处的特殊位置确定平位置平均数是根据变量值所处的特殊位置确定平位置平均数是根据变量值所处的特殊位置确定平均数的,具体有众数与中位数两种。均数的,具体有众数与中位数两种。均数的,具体有众数与中位数两种。均数的,具体有众数与中位数两种。n n1.1.1.1.众数众数众数众数n n众数是指一组数据中出现次数最多的变量值,用众数是指一组数据中出现次数最多的变量值,用众数是指一组数据中出现次数最多的变量值,用众数是指一组数据中出现次数最多的变量值,用MoMoMoMo表示。众数的确定分两种情况:表示。众数的确定分两种情况:表示
26、。众数的确定分两种情况:表示。众数的确定分两种情况:n n(1 1 1 1)资料未经整理或单项式数列)资料未经整理或单项式数列)资料未经整理或单项式数列)资料未经整理或单项式数列n n如果数据资料未经整理或者是单项式数列确定众如果数据资料未经整理或者是单项式数列确定众如果数据资料未经整理或者是单项式数列确定众如果数据资料未经整理或者是单项式数列确定众数比较简单,只需找到数据中哪个变量值出现的数比较简单,只需找到数据中哪个变量值出现的数比较简单,只需找到数据中哪个变量值出现的数比较简单,只需找到数据中哪个变量值出现的次数最多即可确定众数了。次数最多即可确定众数了。次数最多即可确定众数了。次数最多
27、即可确定众数了。n n(2 2 2 2)组距数列)组距数列)组距数列)组距数列n n由组距式数列确定众数,是先根据出现次数确定由组距式数列确定众数,是先根据出现次数确定由组距式数列确定众数,是先根据出现次数确定由组距式数列确定众数,是先根据出现次数确定众数所在组,然后利用下限或上限公式计算众数众数所在组,然后利用下限或上限公式计算众数众数所在组,然后利用下限或上限公式计算众数众数所在组,然后利用下限或上限公式计算众数的近似值。的近似值。的近似值。的近似值。上限公式:上限公式:下限公式:下限公式:n n2.2.2.2.中位数中位数中位数中位数n n中位数是指一组数据按大小顺序排列后,处于中中位数
28、是指一组数据按大小顺序排列后,处于中中位数是指一组数据按大小顺序排列后,处于中中位数是指一组数据按大小顺序排列后,处于中间位置的那个变量值,用间位置的那个变量值,用间位置的那个变量值,用间位置的那个变量值,用MeMeMeMe表示。中位数的确定表示。中位数的确定表示。中位数的确定表示。中位数的确定分两种情况:分两种情况:分两种情况:分两种情况:n n(1 1 1 1)资料未经整理)资料未经整理)资料未经整理)资料未经整理n n对未分组数据计算中位数时,可先对数据进行排对未分组数据计算中位数时,可先对数据进行排对未分组数据计算中位数时,可先对数据进行排对未分组数据计算中位数时,可先对数据进行排序,
29、然后确定中位数的位置。序,然后确定中位数的位置。序,然后确定中位数的位置。序,然后确定中位数的位置。n n具体确定中位数的方法是:具体确定中位数的方法是:具体确定中位数的方法是:具体确定中位数的方法是:n n设有设有设有设有n n n n个数据,进行有序排列后,中位数的位置为个数据,进行有序排列后,中位数的位置为个数据,进行有序排列后,中位数的位置为个数据,进行有序排列后,中位数的位置为(n+1)/2n+1)/2n+1)/2n+1)/2,如果数据为奇数项,则中位数为中间,如果数据为奇数项,则中位数为中间,如果数据为奇数项,则中位数为中间,如果数据为奇数项,则中位数为中间一项的数据;如果数据为偶
30、数项,中位数为中间一项的数据;如果数据为偶数项,中位数为中间一项的数据;如果数据为偶数项,中位数为中间一项的数据;如果数据为偶数项,中位数为中间两项数据的简单算术平均数。两项数据的简单算术平均数。两项数据的简单算术平均数。两项数据的简单算术平均数。n n(2)(2)资料经过整理资料经过整理n n 数据资料经过统计整理后通常形成单项数据资料经过统计整理后通常形成单项式数列或者组距数列,如果是单项式数列,式数列或者组距数列,如果是单项式数列,可先根据公式可先根据公式n n确定中位数所在的位置,然后用累计频数确定中位数所在的位置,然后用累计频数(向下累计)确定中位数所在组后即可确(向下累计)确定中位
31、数所在组后即可确定中位数的具体值了。定中位数的具体值了。n n对对对对于于于于组组组组距距距距数数数数列列列列计计计计算算算算中中中中位位位位数数数数时时时时,先先先先根根根根据据据据前前前前述述述述公公公公式式式式确确确确定定定定中中中中位位位位数数数数所所所所在在在在的的的的位位位位置置置置,然然然然后后后后用用用用累累累累计计计计频频频频数数数数(向向向向下下下下累累累累计计计计)确确确确定定定定中中中中位位位位数数数数所所所所在在在在组组组组后后后后采采采采用用用用下下下下列列列列下下下下限限限限或或或或上上上上限限限限公公公公式计算中位数的近似值。式计算中位数的近似值。式计算中位数的
32、近似值。式计算中位数的近似值。下限公式:上限公式:n n几种平均数的比较几种平均数的比较几种平均数的比较几种平均数的比较n n1.1.1.1.算术平均数、调和平均数与几何平均数的数量算术平均数、调和平均数与几何平均数的数量算术平均数、调和平均数与几何平均数的数量算术平均数、调和平均数与几何平均数的数量关系关系关系关系n n如果不研究算术平均数、调和平均数与几何平均如果不研究算术平均数、调和平均数与几何平均如果不研究算术平均数、调和平均数与几何平均如果不研究算术平均数、调和平均数与几何平均数的实际应用条件,仅仅从数学角度去分析三者数的实际应用条件,仅仅从数学角度去分析三者数的实际应用条件,仅仅从
33、数学角度去分析三者数的实际应用条件,仅仅从数学角度去分析三者之间的数量关系,针对同样的数据资料,同时采之间的数量关系,针对同样的数据资料,同时采之间的数量关系,针对同样的数据资料,同时采之间的数量关系,针对同样的数据资料,同时采用这三种算法计算平均数,可以证明,三者之间用这三种算法计算平均数,可以证明,三者之间用这三种算法计算平均数,可以证明,三者之间用这三种算法计算平均数,可以证明,三者之间的数量关系为:的数量关系为:的数量关系为:的数量关系为:n n当且仅当所有变量值都相等时三者相等。当且仅当所有变量值都相等时三者相等。当且仅当所有变量值都相等时三者相等。当且仅当所有变量值都相等时三者相等
34、。n n2.2.算术平均数、众数和中位数的比较算术平均数、众数和中位数的比较n n 算术平均数是根据所有变量值计算算术平均数是根据所有变量值计算的集中趋势值,众数与中位数是根据的集中趋势值,众数与中位数是根据数据分布形状以及变量值所处的位置数据分布形状以及变量值所处的位置确定的集中趋势值,作为集中趋势的确定的集中趋势值,作为集中趋势的代表值,这三种平均数的不同计算特代表值,这三种平均数的不同计算特点决定了在实际应用中应根据研究目点决定了在实际应用中应根据研究目的与数据特征来选择恰当的集中趋势的与数据特征来选择恰当的集中趋势测度值。在实际应用中可以把这三种测度值。在实际应用中可以把这三种平均数结
35、合起来,通过比较三者之间平均数结合起来,通过比较三者之间的数量关系分析变量分布的特征。的数量关系分析变量分布的特征。f如图:(1 1)当)当总体分布呈体分布呈对称状称状态时,三者合而,三者合而为一一,如图:fX(2 2)当当总体分布呈非体分布呈非对称状称状态时右偏分布时:如图:fX左偏分布时:所以所以所以所以4.3离散程度的测度n n n n离散程度的含义n n所谓离散程度是指各变量值离开中心值的程度。n n 离散程度的测度方法离散程度的测度方法n n变量离散程度的测度主要可通过全距、四变量离散程度的测度主要可通过全距、四分位差、异众比率、平均差、标准差、离分位差、异众比率、平均差、标准差、离
36、散系数等进行测度。散系数等进行测度。n n1.1.全距全距n n也称极差,是一组数据的最大值与最小值也称极差,是一组数据的最大值与最小值之差。全距是测度变量值离散程度最简单之差。全距是测度变量值离散程度最简单的方法,其计算公式为:的方法,其计算公式为:n n2.2.四分位差四分位差n n 将总体各单位的标志值按大小顺序排列,将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点然后将数列分为四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位这三个分割点称为四分位数,数,(其中第二个四分位数其中第二个四分位数Q2就是数列的中就是数列的中位数位数Me)。n n 四
37、分位差四分位差 Q.D.=Q3-Q1 3.3.异众比率异众比率 又称离异比率或变差比,是指非众数组的次又称离异比率或变差比,是指非众数组的次数占总次数的比率,异众比率主要用于衡量数占总次数的比率,异众比率主要用于衡量众数对一组数据代表程度大小的,异众比率众数对一组数据代表程度大小的,异众比率越大,说明非众数组的频数占总频数的比重越大,说明非众数组的频数占总频数的比重越大,数据分布的集中趋势越不明显,离散越大,数据分布的集中趋势越不明显,离散程度越大,众数的代表性就越差;反之则相程度越大,众数的代表性就越差;反之则相反。反。n n4.4.平均差平均差n n平均差是数列中各单位标志值与平均数之平均
38、差是数列中各单位标志值与平均数之间绝对离差的平均数。间绝对离差的平均数。5.5.5.5.标准差标准差标准差标准差 标准差是离差平方平均数的平方根,故又称标准差是离差平方平均数的平方根,故又称标准差是离差平方平均数的平方根,故又称标准差是离差平方平均数的平方根,故又称“均均均均方差方差方差方差”。其意义与平均差基本相同。其意义与平均差基本相同。其意义与平均差基本相同。其意义与平均差基本相同。在实际计算中,有时可将上述标准差公式进行变在实际计算中,有时可将上述标准差公式进行变在实际计算中,有时可将上述标准差公式进行变在实际计算中,有时可将上述标准差公式进行变形,这样会更简便些,例如:形,这样会更简
39、便些,例如:形,这样会更简便些,例如:形,这样会更简便些,例如:n n对于末分组的资料:对于末分组的资料:对于末分组的资料:对于末分组的资料:n n对对于分于分于分于分组组的的的的资资料:料:料:料:6.6.离散系数离散系数 离散系数是各种变异指标与平均数的比率。离散系数是各种变异指标与平均数的比率。反映总体反映总体各单位标志值的相对离散程度,各单位标志值的相对离散程度,最常用的是标准差系数。最常用的是标准差系数。4.4偏态与峰度的测度n n偏态与峰度测度的目的偏态与峰度测度的目的n n全面了解数据分布的形状与特点,不仅需全面了解数据分布的形状与特点,不仅需要通过均值与方差等反映数据分布的集中
40、要通过均值与方差等反映数据分布的集中趋势与离散程度,还需要测度数据分布是趋势与离散程度,还需要测度数据分布是否对称、偏斜程度以及分布的扁平程度等,否对称、偏斜程度以及分布的扁平程度等,这就需要测度偏态与峰度。这就需要测度偏态与峰度。偏态的测度偏态的测度偏态的测度偏态的测度 偏态是测度数据分布的偏斜方向和程度的偏态是测度数据分布的偏斜方向和程度的偏态是测度数据分布的偏斜方向和程度的偏态是测度数据分布的偏斜方向和程度的 。可。可。可。可通过算术平均数、众数和中位数分析测度分布的通过算术平均数、众数和中位数分析测度分布的通过算术平均数、众数和中位数分析测度分布的通过算术平均数、众数和中位数分析测度分
41、布的偏斜方向,如果要进一步定量测度数据分布的偏偏斜方向,如果要进一步定量测度数据分布的偏偏斜方向,如果要进一步定量测度数据分布的偏偏斜方向,如果要进一步定量测度数据分布的偏斜方向和程度,则主要是用偏态系数斜方向和程度,则主要是用偏态系数斜方向和程度,则主要是用偏态系数斜方向和程度,则主要是用偏态系数(skewnessskewnessskewnessskewness)来测定,偏态系数的计算方法又多)来测定,偏态系数的计算方法又多)来测定,偏态系数的计算方法又多)来测定,偏态系数的计算方法又多种,常用的有以下两种:种,常用的有以下两种:种,常用的有以下两种:种,常用的有以下两种:n n1.1.算术
42、平均数与众数比较法算术平均数与众数比较法算术平均数与众数比较法算术平均数与众数比较法 n n2.2.2.2.动差法动差法动差法动差法n n动差又称矩,可用来说明数据次数分布的特征。一般取数动差又称矩,可用来说明数据次数分布的特征。一般取数动差又称矩,可用来说明数据次数分布的特征。一般取数动差又称矩,可用来说明数据次数分布的特征。一般取数据中的据中的据中的据中的a a a a点为中心,所有数据与点为中心,所有数据与点为中心,所有数据与点为中心,所有数据与a a a a之差的之差的之差的之差的k k k k次方的平均数次方的平均数次方的平均数次方的平均数 称称称称为数据关于为数据关于为数据关于为数
43、据关于a a a a的的的的k k k k阶动差(阶动差(阶动差(阶动差(k k k k阶矩)。阶矩)。阶矩)。阶矩)。n n简单形式与加权形式:简单形式与加权形式:简单形式与加权形式:简单形式与加权形式:n n可以根据计算出的偏态系数的大小、符号可以根据计算出的偏态系数的大小、符号方向判断数据分布的偏态情况,具体判断方向判断数据分布的偏态情况,具体判断如下:如下:SK=0SK=0时为对称分布;时为对称分布;SKSK0 0时为右偏时为右偏分布;分布;SKSK0 0时为左偏分布。时为左偏分布。n n峰度的测度峰度的测度n n峰度峰度(kurtosis)(kurtosis)是分布集中趋势高峰的形是
44、分布集中趋势高峰的形状,通常是与正态分布相比较来测度数据状,通常是与正态分布相比较来测度数据分布曲线顶端的平峰或尖峰程度。即峰度分布曲线顶端的平峰或尖峰程度。即峰度是用来测度数据分布的曲线与正态分布曲是用来测度数据分布的曲线与正态分布曲线相比,是尖顶,还是平顶,其尖顶以及线相比,是尖顶,还是平顶,其尖顶以及平顶的程度如何平顶的程度如何 。n n动差法动差法动差法动差法n n 峰度测度,往往以中心峰度测度,往往以中心峰度测度,往往以中心峰度测度,往往以中心4 4 4 4阶动差为基础进行,阶动差为基础进行,阶动差为基础进行,阶动差为基础进行,将将将将4 4 4 4阶动差的数值,除以标准差的阶动差的
45、数值,除以标准差的阶动差的数值,除以标准差的阶动差的数值,除以标准差的4 4 4 4次方,化为相次方,化为相次方,化为相次方,化为相对数,就是峰度的测度值,即峰度系数,根据数对数,就是峰度的测度值,即峰度系数,根据数对数,就是峰度的测度值,即峰度系数,根据数对数,就是峰度的测度值,即峰度系数,根据数据资料是否经过整理,其计算公式有简单与加权据资料是否经过整理,其计算公式有简单与加权据资料是否经过整理,其计算公式有简单与加权据资料是否经过整理,其计算公式有简单与加权两种形式两种形式两种形式两种形式。n n由于正态分布的峰度系数为由于正态分布的峰度系数为3 3,因此当,因此当3 3时为尖峰分布,当时为尖峰分布,当3 3时为平峰分布。时为平峰分布。n n经验表明,当峰度系数接近于经验表明,当峰度系数接近于1.81.8时,则数时,则数据分布曲线趋向于一条水平线;据分布曲线趋向于一条水平线;当峰度系当峰度系数小于数小于1.81.8时,为时,为U U型曲线。型曲线。