《统计分布的数值特征.ppt》由会员分享,可在线阅读,更多相关《统计分布的数值特征.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 统统 计计 分分 布布 的的 数数 值值 特特 征征 第一节第一节 分布的集中趋势分布的集中趋势 第二节第二节 分布的离中趋势分布的离中趋势 第三节第三节 分布的偏度和峰度分布的偏度和峰度1 第一节 分布的集中趋势n一、主要的统计平均数n(一)统计平均数的含义n(二)统计平均数的作用n(三)统计平均数的分类2二、算术平均数n1.算术平均数的基本公式n计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。32.计算方法n(1)简单算术平均数。简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总量而得。计算公式:4(2)
2、加权算术平均数。nA.加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式:fi 为各组标志值出现的次数。5 B.权数的意义和作用n权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。n当各组的次数都相同时,即当f1=f2=f3=fn时:n加权算术平均数就等于简单算术平均数。63.是非标志的平均数 n在总体中,具有某种性质的单位占总体的比率为在总体中,具有某种性质的单位占总体的比率为p p,不具,不具有该种性质的单位占总体的比率为有该种性质的单位占总体的比率为 q q,以,以1 1作为具有某种作为具有某种性质的单位的标志值,以性质的单位的标志值,以0
3、0作为不具有该种性质的单位的作为不具有该种性质的单位的标志值:标志值:np p也称为总体中具有某种属性的单位成数,是非标志也称为总体中具有某种属性的单位成数,是非标志的平均数。的平均数。74.算术平均数的数学性质 n(1 1)算术平均数与标志值个数的乘积等于各标志)算术平均数与标志值个数的乘积等于各标志值的总和。值的总和。n简单算术平均数:n加权算术平均数:8n(2 2)各个标志值与其算术平均数的离差之和等于零。)各个标志值与其算术平均数的离差之和等于零。n简单算术平均数:n加权算术平均数:9n(3)各标志值与算术平均数离差的平方和为最各标志值与算术平均数离差的平方和为最小值。小值。n(4 4
4、)对被平均的变量实施某种线性变换后,新变)对被平均的变量实施某种线性变换后,新变量的算术平均数等于对原变量的算术平均数实施量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果。同样的线性变换的结果。n(5 5)对于任意两个变量)对于任意两个变量x x和和y y,它们的代数和的算,它们的代数和的算术平均数等于两个变量的算术平均数的代数和。术平均数等于两个变量的算术平均数的代数和。10 三 调和平均数n1.简单调和平均数:标志值的倒数的算术平均数的倒数。112.加权调和平均数n计算公式:n在权数选择合适时,加权调和平均数实际上是加权算术平在权数选择合适时,加权调和平均数实际上是加权算术平
5、均数的变形:均数的变形:12n当各组标志总量相等,当各组标志总量相等,m m1 1=m=m2 2=m=mn n时,加权调和时,加权调和平均数可化简成为简单调和平均数形式。平均数可化简成为简单调和平均数形式。13四、几何平均数n1.1.几何平均数:是几何平均数:是n n项标志值连乘积的项标志值连乘积的n n次方根。次方根。n2.2.分类:分类:n(1 1)简单几何平均数:是)简单几何平均数:是n n个标志值个标志值x xi i连乘积的连乘积的n n次方根。计算公式为:次方根。计算公式为:G=式中式中G G表示几何平均数,表示几何平均数,x xi i表示各项标志值表示各项标志值。14(2)加权几何
6、平均数n加权几何平均数是各标志值加权几何平均数是各标志值f fi i次方的连乘积的次次方的连乘积的次方根,计算公式为:方根,计算公式为:G=15五、众数 Mo n1.1.定义:众数是指社会现象总体中最普遍出现的定义:众数是指社会现象总体中最普遍出现的标志值。标志值。n2.2.众数的确定众数的确定n1)1)单项式分配数列确定众数:出现次数最多的标单项式分配数列确定众数:出现次数最多的标志值就是众数。志值就是众数。n2)2)组距式分配数列确定众数:由组距数列确定众组距式分配数列确定众数:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数数,先确定众数组,再通过一定的公式计算众数的近似值。的
7、近似值。163.众数的几何意义 174.组距式数列确定众数的公式n下限公式:n上限公式:18六、中位数 n1.定义:n中位数是将总体各个单位按其标志值的大小顺序中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值,在总排列,处于数列中点的那个单位的标志值,在总体中,标志值小于中位数的单位占一半;标志值体中,标志值小于中位数的单位占一半;标志值大于中位数的单位也占一半。大于中位数的单位也占一半。19 2.中位数的确定 n1)未分组资料确定中位数。n将总体各单位的标志值按照大小顺序排列,将总体各单位的标志值按照大小顺序排列,n当总体单位数n为奇数时:n当总体单位数n为偶数
8、时,:202)单项式分组资料确定中位数n当 为奇数时:,n当 为偶数时,213)组距式分组资料确定中位数n下限公式:n上限公式:223.众数、中位数和算术平均数的关系n 区别:区别:n1 1)三者的含义不相同;三者的含义不相同;n2 2)三者的计算(确定)方法不同;三者的计算(确定)方法不同;n3 3)对资料的要求不同,对资料的要求不同,n4)4)对数据的对数据的“灵敏度灵敏度”、“抗耐性抗耐性”和和“概括概括能力能力”不同。不同。23n联系:n(1 1)三者都是作为反映总体一般水平(或集中趋三者都是作为反映总体一般水平(或集中趋势)的平均指标:势)的平均指标:n(2 2)三者之间存在着一定的
9、数量关系,三者之间存在着一定的数量关系,qA.A.在对称的正态分布条件下:算术平均数等于众数在对称的正态分布条件下:算术平均数等于众数等于中位数:等于中位数:qB.B.在非对称正态分布的情况下,众数、中位数和平在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。大,它们之间的差别越大。24n当次数分配呈右偏当次数分配呈右偏(正偏正偏)时:算术平均数受极大时:算术平均数受极大值的影响值的影响 n当次数分配呈左偏当次数分配呈左偏(负偏负偏)时,算术平均数受极小时,算术平均数受极小值的影响值的影响
10、n中位数则总是介于众数和平均数之间。中位数则总是介于众数和平均数之间。253、皮尔生经验法则n分布在轻微偏斜的情况下,众数、中位数和算分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:术平均数数量关系的经验公式为:26 第二节第二节 分布的离中趋势分布的离中趋势n一、变异指标的含义与作用一、变异指标的含义与作用n1.1.定义:变异指标反映总体内部的离中趋势或变异状定义:变异指标反映总体内部的离中趋势或变异状况。变异指标值越大,表明总体各单位标志的变异程况。变异指标值越大,表明总体各单位标志的变异程度越大。度越大。n2.2.作用:作用:q(1 1)衡量平均指标的代表性。)衡量
11、平均指标的代表性。q(2 2)反映现象变动的均衡性。)反映现象变动的均衡性。q(3 3)研究总体标志值分布偏离正态的情况。)研究总体标志值分布偏离正态的情况。q(4 4)进行抽样推断等统计分析的一个基本指标。)进行抽样推断等统计分析的一个基本指标。27二、极差与四分位差二、极差与四分位差n1 1、极差:、极差:n1 1)极差也称全距,它是统计总体中两个极端标志)极差也称全距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。值之差,表明总体中标志值变动的范围。n2 2)计算公式:)计算公式:(未分组)(未分组)(分(分 组)组)式中:式中:UmaxUmax代表最高组的上限;代表最高
12、组的上限;Lmin Lmin代表最低组的下限。代表最低组的下限。n3 3)特点:计算简便,直观易于理解。)特点:计算简便,直观易于理解。28n2 2、四分位差、四分位差n1 1)计算公式:数列的)计算公式:数列的3/43/4位次与位次与1/41/4位次的标志值位次的标志值之差除以之差除以2 2。n2 2)特点:四分位差避免了数列中极端值的影响,)特点:四分位差避免了数列中极端值的影响,但去头弃尾,丢失大量的原始数据。但去头弃尾,丢失大量的原始数据。29三、平均差(A.D)n1、定义:平均绝对偏差,总体所有单位的标志值与其平均数的离差绝对值的算术平均数。n2、计算公式:n3、特点:概括地反映了所
13、有单位标志值的变异程度,但因取绝对值,数学性质不理想,实际中较少用。30四、方差与标准差n(一)数量标志的方差与标准差n1、数量标志方差与标准差的计算。其计算公式为:n未分组的资料:方差:n标准差:31用分组资料计算n方差:n标准差 322、总方差、组间方差和组内方差。n在资料分组的条件下,总体各标志值对平均数的方差可以分解为组内方差和组间方差。其关系式:式中:代表总体方差;代表组内方差的平均数;代表组间方差。333、方差与标准差的数学性质:n1)变量的方差等于变量平方的平均数减去变量平均数的平方。即:34n2)变量对其算术平均数的方差小于对任意常数的方差。n3)n 个同性质独立变量和的方差等
14、于各个变量方差的和。35n4)n个同性质独立变量平均数的方差等于各变量方差平均数的1/n。n5)变量线性变换的方差等于变量的方差乘以变量系数的平方。36n(二)是非标志的方差与标准差37四、变异系数n1、变异系数:变异系数也称离散系数,是各变异指标与其算术平均数的比值。q极差系数:极差与其平均数的比值。q标准差系数:标准差与其平均数的比值。n2、作用:消除现象由于不同计量单位、不同平均水平所产生的影响。38 第三节第三节 分布的偏度和峰度分布的偏度和峰度n一、统计动差n1、统计动差:也称为距,反映分布偏斜或离散程度的指标。n2、原点动差:变量x关于原点的k阶距,一般形式:(未分组)n (分组)nk=1时,即1阶的原点动差就是算术平均数。nk=2时,即2阶的原点动差就是平方平均数。393、中心动差:n变量x关于分布中心(平均数)的k阶距。一般形式:(未分组)n (分组)n当k=0时,即零阶中心动差 =1;n当k=1时,即一阶中心动差 =0;n当k=2时,即二阶中心动差 =。40二、偏度n1、偏度:衡量频数分配不对称程度,或偏斜程度的指标。n2、计算公式:(用距法测定)41n当 =0时,左右完全对称,为正态分布;当 0时为正偏斜;当 0)(0时,表示频数分布比正态分布更集中,分布呈尖峰状态,0)(=0)(0)44