《《统计学》第三章---统计分布的数值特征解读课件.ppt》由会员分享,可在线阅读,更多相关《《统计学》第三章---统计分布的数值特征解读课件.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 统计分布的数值统计分布的数值特征特征第一节第一节 分布的平均水平、集中趋势和分布的平均水平、集中趋势和位置的度量位置的度量第二节第二节 分布的离散趋势分布的离散趋势第三节第三节 分布的偏度和峰度分布的偏度和峰度第一节第一节 分布的平均水平、分布的平均水平、集中趋势和位置的度量集中趋势和位置的度量一、统计平均数的含义与作用一、统计平均数的含义与作用1.统计平均数统计平均数average:表示现象总体各单位某一标志值在一定时间、地点条件下所达到的一般水平。2.作用:作用:1)反反映映总总体体各各单单位位变变量量分分布布的的集集中中趋趋势势和一般水平。和一般水平。2)比较同类现象在不同
2、单位的发展水平)比较同类现象在不同单位的发展水平 3)比比较较同同类类现现象象在在不不同同时时期期的的发发展展变变化化趋势或规律。趋势或规律。4)分析现象之间的依存关系。)分析现象之间的依存关系。3.分类:分类:按其具体代表的含义和计算方式的不按其具体代表的含义和计算方式的不同,分为同,分为数值数值平均数和平均数和位置位置平均数。平均数。1)数值平均数:)数值平均数:A)定义 B)特点 C)种类 按计算方法不同,分为:算术平均数、调和平均数、几何平均数和幂平均数。2)位置平均数:)位置平均数:A)定定义义:用处于数列中特殊位置上的个别单位或部分单位的标志值来确定的代表值。B)特特点点:对数据的
3、概括能力不如数值平均数的强,但是不易受数列中极端值的影响。C)种类:种类:常用的位置平均数有众数和中位数两种。二、数值平均数二、数值平均数(一一)算算 术术 平平 均均 数数 arithmetic mean1.计算平均数的要求:计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间存在一一对应关系。2.计算方法,均值计算方法,均值Mean value1)简简单单算算术术平平均均数数。简单算术平均数主要用于未分组资料,计算公式:式中,代表算术平均数,xi表各单位标志值,N 代表总体单位数。2)加权算术平均数)加权算术平均数Weighted average A)加权算术平均数
4、主要用于原始资料已经分组,并得出次数分布的条件。计算公式:fi为各组标志值出现的次数B)权数的选择问题权数的选择问题 相对指标计算平均数,要根据指标的经济涵义,选泽合适的权数。并非所有的频数都可以作为权数。3.是非标志的平均数是非标志的平均数percentage具有某种性质的单位占总体的比率为p,不具有该种性质的单位占总体的比率为 q,以1作为“是”,具有某种性质的单位的标志值,以0作为“非”,不具有某种性质的单位的标志值。按加权算术平均数公式计算,得到:p为总体中具有某种属性的单位成数,N为总体单位数。成数是是非标志的平均数。4.算术平均数的数学性质算术平均数的数学性质 1)算术平均数与标志
5、值个数的乘积等于各标志值的总和。2)各个标志值与其算术平均数的离差之和等于零。3)各标志值与算术平均数离差的平方和为最小值。4)对被平均的变量实施某种线性变换后,新变量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果。(二二)调和平均数调和平均数Harmonic mean1.简单调和平均数简单调和平均数定定义义:标志值的倒数的算术平均数的倒数。计算公式:计算公式:2.加权调和平均数加权调和平均数计算公式:计算公式:3)调和平均数与算术平均数的关系)调和平均数与算术平均数的关系适用的资料条件不同。算术平均数:已知变量值及频数(频率)调和平均数:已知各组的变量值及标志总量。(三三)几何
6、平均数几何平均数Geometric mean1.几几何何平平均均数数:是N项标志值连乘积的N 次方根。2.分类:分类:1)简简单单几几何何平平均均数数:是N个标志值xi连乘积的N次方根。计算公式为:G=式中G表示几何平均数,xi表示各项标志值。2)加权几何平均数)加权几何平均数 加权几何平均数是各标志值fi次方的连乘积的N次方根,计算公式为:G=3.适适用用场场合合:用于计算动态数列或时间上相互衔接的比率的平均数。(四四)幂平均数幂平均数 power mean设有一组变量求各变量k次方的和:称为k阶幂平均数,当k 取不同的整数值时,幂平均数就给出不同的数值平均数计算公式。例如:例如:当k=1时
7、,幂平均数为算术平均数计算公式。当k=-1时,幂平均数为调和平均数计算公式。当k 0 时,为几何平均数计算公式。设有幂平均数的是关于幂平均数的是关于k阶的阶的递增函数递增函数当当k1k2时,就有:时,就有:算算术术平平均均数数、几几何何平平均均数数、调调和和平平均均数数是是幂幂平平均均数数的的k阶阶数数由由1递递减减为为0又又减减为为-1的特例。的特例。三、位置平均数三、位置平均数(一一)ModeMode众数众数 M Mo o1.定定义义:众数是指总体中最普遍出现的标志值。从分布的角度看,众数是具有明显集中趋势的数值。在分配曲线图上,众数就是曲线的最高峰所对应的标志值。在分配数列中,具有最多次
8、数的标志值就是众数值。2.众数的确定众数的确定 1)单单项项式式分分配配数数列列确确定定众众数数:出现次数最多的标志值就是众数。2)组距式分配数列确定众数:)组距式分配数列确定众数:组距式数列确定众数的公式组距式数列确定众数的公式:下限公式:下限公式:上限公式:上限公式:公式中,公式中,Mo代表众数;代表众数;代表众数组的下限;代表众数组的上限;代表众数组的次数;代表众数组前一组的次数;代表众数组后一组的次数;代表众数组的组距。(二二)MedianMedian中位数中位数1.定义:定义:中位数中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值。在总体中,标志值小于中
9、位数的单位占一半;标志值大于中位数的单位也占一半。2.中位数的确定中位数的确定 1)未分组资料确定中位数。)未分组资料确定中位数。确确定定中中位位数数的方法是:先将总体各单位的标志值按照大小顺序排列,当总体单位数N为奇数时:当总体单位数N为偶数时:2)单项式分组资料确定中位数)单项式分组资料确定中位数当 为奇数时,当 为偶数时,3)组距式分组资料确定中位数)组距式分组资料确定中位数下限公式:上限公式:式中:式中:表示中位数;表示中位数所在组的下限;表示中位数所在组的上限;表示向上累计至中位数所在组前一组的次数;表示向下累计至中位数所在组后一组的次数;表示中位数所在组的次数;表示中位数所在组的组
10、距。(三三)众众数数、中中位位数数和和算算术术平平均均数数的的关系关系1.区别:区别:1)三者的含义不相同;2)三者的计算(确定)方法不同;3)对资料的要求不同,4)数据的“灵敏度”、“抗耐性”和“概括能力”不同。2.联系:联系:1)三者都是作为反映总体一般水平(或集中趋势)的平均指标:2)三者之间存在着一定的数量关系,A)在对称的正态分布条件下:算术平均数等于众数等于中位数:B)在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。当次数分配呈右偏当次数分配呈右偏(正偏正偏)时时算术平均数受极大值的影响,当次数分配呈左偏(负偏)时,算术
11、平均数受极小值的影响,中位数则总是介于众数和平均数之间。3.皮尔生皮尔生Pearson经验法则经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为第二节第二节 分布的离散趋势分布的离散趋势一、变异指标的含义与作用一、变异指标的含义与作用1.定义定义2.作用:作用:1)衡量平均指标的代表性。2)反映现象变动的均衡性。3)研究总体标志值分布偏离正态的情况。4)进行抽样推断等统计分析的一个基本指标。二、极差与四分位差二、极差与四分位差1.极差极差Range:1)极极差差也也称称全全距距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。2)计算公式:)计算公式:(
12、未分组)(分 组)式中:Umax代表最高组的上限;Lmin代表最低组的下限。3)特点:)特点:计算简便,直观易于理解。但不考虑总体内部的分配状况,不能充分反映标志值变动的一般程度。2.四分位差四分位差 1)计计算算公公式式:数列的3/4位次与1/4位次的标志值之差除以2。2)特点:)特点:四分位差避免了数列中极端值的影响,但去头弃尾,丢失大量的原始数据。三、平均差(三、平均差(A.D)average deviation1.定义:定义:平均绝对偏差,总体所有单位的标志值与其平均数的离差绝对值的算术平均数。2.计算公式:计算公式:3.特点特点四、方差四、方差variancevariance与标准差
13、与标准差standard deviationstandard deviation(一一)数量标志的方差与标准差数量标志的方差与标准差 1.数量标志方差与标准差的计算。数量标志方差与标准差的计算。未 分组的资料其计算公式为:方差:标准差:用分组的资料计算用分组的资料计算 方差:2.总方差的分解总方差的分解analysis of variance 在资料分组的条件下,总体各标志值对平均数的方差可以分解为组内方差和组间方差。式中:代表总体方差;代表组间方差;代表组内方差的平均数。3.方差与标准差的数学性质:方差与标准差的数学性质:1)变量的方差等于变量平方的平均数减去变量平均数的平方。2)变量对算术
14、平均数的方差小于对任意常数的方差。3)个同性质独立变量和的方差等于各个变量方差的和。4)个同性质独立变量平均数的方差等于各个变量方差平均数的 。5)变量线性变换的方差等于变量的方差乘以变量系数的平方。(二二)是非标志的方差与标准差是非标志的方差与标准差 是非标志的平均数为p四、变异系数四、变异系数coefficient of variation1.变异系数:变异系数:变异系数也称离散系数,是各变异指标与其算术平均数的比值。标准差系数:标准差系数:标准差与其平均数的比值。2.作用:作用:能准确地比较不同现象或具有不同水平的单位之间的差异程度。第三节第三节 分布的偏度分布的偏度和峰度和峰度1.统计动差:统计动差:也称为矩moment,反映分布偏斜或离散程度的指标。2.原点动差:原点动差:变量x关于原点的k阶矩,一般形式:一、统计动差一、统计动差3.中心动差:中心动差:变量x关于分布中心(平均数)的k阶矩。一般形式:二、偏度二、偏度 skewness1.偏度:偏度:衡量频数分配不对称程度,或偏斜程度的指标。2.计算公式:(用计算公式:(用矩法测定)法测定)偏度指标:三、峰度三、峰度kurtosis1.峰度:峰度:用以衡量频数分配的集中程度,即分布曲线的尖峭程度的指标。2.计算公式:(用计算公式:(用矩法测定)法测定)