《统计学综合指标与数据分布特征讲解.pptx》由会员分享,可在线阅读,更多相关《统计学综合指标与数据分布特征讲解.pptx(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计学综合指标与数据分布特征讲解统计学综合指标与数据分布特征讲解第一节第一节第一节第一节 总量指标总量指标总量指标总量指标一、总量指标的概念、作用和种类一、总量指标的概念、作用和种类1 1、总量指标:是反映社会经济现象在一定时间、地点、总量指标:是反映社会经济现象在一定时间、地点、条件下的总体规模或水平的统计指标。也称绝对数条件下的总体规模或水平的统计指标。也称绝对数指标,其表现形式是绝对数。指标,其表现形式是绝对数。2 2、总量指标的作用、总量指标的作用3 3、总量指标的种类、总量指标的种类n n按反映总体内容不同:总体单位总量和总体标志总按反映总体内容不同:总体单位总量和总体标志总
2、量量n n按反映时间状态不同:时期指标和时点指标按反映时间状态不同:时期指标和时点指标 时期指标和时点指标的区别:是否连续登记、是否具时期指标和时点指标的区别:是否连续登记、是否具有累加性、指标数值大小是否受时间长短制约。有累加性、指标数值大小是否受时间长短制约。第1页/共42页第一节第一节第一节第一节 总量指标总量指标总量指标总量指标二、总量指标的计量单位二、总量指标的计量单位1 1、实物单位、实物单位n n自然单位自然单位n n度量衡单位度量衡单位n n标准实物单位标准实物单位2 2、货币单位、货币单位3 3、劳动单位、劳动单位指标类型登记方式累加性时间制约时期指标连续登记具备受时间长短制
3、约时点指标间断登记不具备 与时间间隔长短无关第2页/共42页第二节第二节第二节第二节 相对指标相对指标相对指标相对指标一、相对指标的概念和作用一、相对指标的概念和作用1 1、相对指标:是两个有联系的指标对比计算的比率,、相对指标:是两个有联系的指标对比计算的比率,反映事物在时间、空间、事物本身内部及不同事物反映事物在时间、空间、事物本身内部及不同事物之间的联系程度和对比关系,也称相对数。之间的联系程度和对比关系,也称相对数。2 2、相对指标的作用、相对指标的作用二、相对指标的种类及计算方法二、相对指标的种类及计算方法1 1、结构相对指标、结构相对指标 结构相对数结构相对数结构相对数结构相对数=
4、(总体部分数值(总体部分数值(总体部分数值(总体部分数值 总体全部数值)总体全部数值)总体全部数值)总体全部数值)100%100%2 2、比例相对指标、比例相对指标 比例相对数比例相对数比例相对数比例相对数=总体中某部分数值总体中某部分数值总体中某部分数值总体中某部分数值 总体中另一部分数值总体中另一部分数值总体中另一部分数值总体中另一部分数值第3页/共42页第二节第二节第二节第二节 相对指标相对指标相对指标相对指标3 3、比较相对指标:同类事物不同空间的静态比较、比较相对指标:同类事物不同空间的静态比较比较相对数比较相对数比较相对数比较相对数=甲地区某一现象的水平甲地区某一现象的水平甲地区某
5、一现象的水平甲地区某一现象的水平 乙地区同类现象的水平乙地区同类现象的水平乙地区同类现象的水平乙地区同类现象的水平4 4、计划完成程度相对指标、计划完成程度相对指标计划完成相对数计划完成相对数计划完成相对数计划完成相对数=(实际完成数(实际完成数(实际完成数(实际完成数 计划任务数)计划任务数)计划任务数)计划任务数)100%100%5 5、强度相对指标:性质不同但有联系的指标对比、强度相对指标:性质不同但有联系的指标对比强度相对数强度相对数强度相对数强度相对数=某一总量指标数值某一总量指标数值某一总量指标数值某一总量指标数值 另一有联系而性质不同另一有联系而性质不同另一有联系而性质不同另一有
6、联系而性质不同的总量指标数值的总量指标数值的总量指标数值的总量指标数值6 6、动态相对指标、动态相对指标动态相对数动态相对数动态相对数动态相对数=报告期指标数值报告期指标数值报告期指标数值报告期指标数值 基期指标数值基期指标数值基期指标数值基期指标数值第4页/共42页第二节第二节第二节第二节 相对指标相对指标相对指标相对指标三、计算和运用相对指标的原则1、可比原则 要求分子、分母在:内容、范围、计算方法、计算价格、计量单位等可比。2、相对指标和总量指标结合运用的原则3、相对指标和多个指标结合运用原则第5页/共42页第三节第三节第三节第三节 数据分布集中趋势的测定数据分布集中趋势的测定数据分布集
7、中趋势的测定数据分布集中趋势的测定平均指标平均指标平均指标平均指标一、平均指标的概念及特点一、平均指标的概念及特点一、平均指标的概念及特点一、平均指标的概念及特点1 1、平均指标:又称平均数,指同类现象在一定时间、平均指标:又称平均数,指同类现象在一定时间、地点、条件下达到的一般水平。地点、条件下达到的一般水平。2 2、平均指标的特点、平均指标的特点n n将数量差异抽象化将数量差异抽象化n n只能就同类现象计算只能就同类现象计算n n能反映总体变量的集中趋势能反映总体变量的集中趋势3 3、平均数有数值平均数和位置平均数两种、平均数有数值平均数和位置平均数两种n n数值平均数是根据数据分布中的全
8、部标志值计算得数值平均数是根据数据分布中的全部标志值计算得到的,有算术平均数、调和平均数、几何平均数。到的,有算术平均数、调和平均数、几何平均数。n n位置平均数是根据数据分布中的某些标志值在总体位置平均数是根据数据分布中的某些标志值在总体中所处的位置来确定的,有众数、中位数。中所处的位置来确定的,有众数、中位数。第6页/共42页二、算术平均数二、算术平均数二、算术平均数二、算术平均数 算术平均数也称均值,是全部数据的算术平均。算术平均数也称均值,是全部数据的算术平均。1 1、简单算术平均数、简单算术平均数 (适用于未分组情况)适用于未分组情况)例:某企业的一个生产班组有例:某企业的一个生产班
9、组有5 5名工人,其月工资分别名工人,其月工资分别为为700700元、元、750750元、元、800800元、元、850850元、元、900900元。则这元。则这5 5名工人名工人的月平均工资为:的月平均工资为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第7页/共42页 2.加权算术平均数(适用于已分组情况)例:某车间有50名工人,日生产某种零件如表1所示,试求工人平均日产零件数。解:工人平均日产零件数:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第8页/共42页表1:日产零件加权平均数计算表 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第9页/共4
10、2页n n 权数除用次数(频数)表示外,还可以用比重权数除用次数(频数)表示外,还可以用比重(频率)表示。公式如下:(频率)表示。公式如下:例:仍以表1资料为例,采用比重计算加权算术平均数,平均每个工人日产零件数为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第10页/共42页三、调和平均数三、调和平均数三、调和平均数三、调和平均数 调和平均数是总体各单位变量值倒数的算术调和平均数是总体各单位变量值倒数的算术平均数的倒数,又称倒数平均数。平均数的倒数,又称倒数平均数。1.1.简单调和平均数简单调和平均数 第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第11页/共42页
11、 例:设某组5个学生的考试分数为70、80、85、90、92,则5个学生成绩的调和平均数为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第12页/共42页 2.加权调和平均数例:某厂工人工资资料如表2所示,据此资料工人平均工资为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第13页/共42页表2 某工厂工人工资情况及平均工资计算表第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第14页/共42页例:例:已知某公司各企业产值计划完成程度及实际完已知某公司各企业产值计划完成程度及实际完成数如表成数如表3 3所示,则全公司计划完成程度(即各企业所示,则全公司计划
12、完成程度(即各企业平均计划完成程度)为:平均计划完成程度)为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第15页/共42页表3 某公司所属企业产值计划完成情况及平均数计算表第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第16页/共42页四、几何平均数四、几何平均数四、几何平均数四、几何平均数1.1.简单几何平均数简单几何平均数 例:例:某地区某地区2002200620022006年国内生产总值环比发展年国内生产总值环比发展速度分别为速度分别为108.0%108.0%、107.5%107.5%、108.3%108.3%、109.3%109.3%、109.5%109.5
13、%,则其平均发展速度为:,则其平均发展速度为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第17页/共42页2.2.加权几何平均数加权几何平均数例:某银行对企业的一笔十年期的投资年利率是:例:某银行对企业的一笔十年期的投资年利率是:第第1 1至至3 3年是年是7%7%,第,第4 4至至6 6年是年是8 8,第,第7 7至至9 9年是年是9 9,第第1010年是年是1010。则平均年利率是:。则平均年利率是:即平均年利率为即平均年利率为 8.28.2。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第18页/共42页五、众数五、众数 众数指总体或分布数列中,出现频数最多或
14、出现频率最高的那个标志值。如下图:v单项式数列和组距式数列的众数计算方法不同。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第19页/共42页1.单项式数列的众数确定:统计分组以后找出出现次数最多的标志值即可。某村农民按家庭儿童人数分组 家庭按儿童数分组(个/户)家庭数(户)0123440 65125 90 40合 计360 l在这个 例子中,众数就是两个儿童。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第20页/共42页2.2.组距式数列众数的确定:先确定众数所在的组组距式数列众数的确定:先确定众数所在的组(标志值出现最多的组),然后计算以求得近似(标志值出现最多的
15、组),然后计算以求得近似的众数值。的众数值。或为:或为:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第21页/共42页 例:某县农民家庭按人均纯收入分组资料如表4所示,求众数。解:表4表明,人均纯收入30004000元组户数最多,故该组为众数组。其中,XL=3000、XU=4000、d=1000,260-236=24,260-223=37。按下限公式计算:按上限公式计算:即农民家庭人均收入众数为3393.44元。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第22页/共42页 按人均纯收入额分组(元)农 户 数累 计 次 数向 上 累 计向 下 累 计1000以下10
16、0020002000300030004000400050005000以上44792362602231584412335961984210001000956877641381158合 计1000表4 某县农民家庭人均纯收入中位数计算表第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第23页/共42页3 3、众数的特点:、众数的特点:不受极端值的影响不受极端值的影响 一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数无众数无众数原始数据原始数据:10 5 9 12 6 8:10 5 9 12 6 8一个众数一个众数原始数据原始数据:6 :6 5 5 5 5 9 8 9 8
17、5 55 55 55 5多于一个众数多于一个众数原始数据原始数据:25 :25 28 28 28 28 28 28 28 28 36 36 42 4242 4242 4242 42第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第24页/共42页六、中位数六、中位数六、中位数六、中位数 把总体各单位的标志值按大小顺序排列后,处把总体各单位的标志值按大小顺序排列后,处于中点位置的标志值就是中位数。如:于中点位置的标志值就是中位数。如:n n未分组数列和分组数列中位数的求法不同未分组数列和分组数列中位数的求法不同第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第25页/共42页
18、 1.1.未分组数列的中位数未分组数列的中位数l l把总体各单位的标志值从小到大顺序排列。把总体各单位的标志值从小到大顺序排列。l l若数列有奇数项,中位数就是数列中间位次上的那若数列有奇数项,中位数就是数列中间位次上的那个标志值。个标志值。l l若数列有偶数项,中位数就是数列中间两个位次上若数列有偶数项,中位数就是数列中间两个位次上标志值的平均数。标志值的平均数。例:某组有例:某组有5 5名工人,年龄(岁)分别为名工人,年龄(岁)分别为3434、3535、3636、3737、3838,则中点位置为,则中点位置为 ,中位数为第三,中位数为第三个工人的年龄个工人的年龄3636(岁)。如果有(岁)
19、。如果有6 6名工人,年龄(岁)名工人,年龄(岁)分别为分别为3434、3535、3636、3737、3838、3939,则中点位置,则中点位置为为 ,中位数为第三个工人和第四个工,中位数为第三个工人和第四个工人年龄的简单算术平均数人年龄的简单算术平均数36.536.5(岁)。(岁)。第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第26页/共42页2.2.分组数列的中位数分组数列的中位数l l单项式分组:首先确定中位数所在的组,即累计单项式分组:首先确定中位数所在的组,即累计频数达到频数达到 f/2f/2,然后确定中位数的具体值。,然后确定中位数的具体值。某村农民按家庭儿童人数分组
20、某村农民按家庭儿童人数分组f/2=360/2=180和 f/2+1=360/2+1=181中位数的位置是在第180和181家庭之间。从第一组家庭户数开始向后累加至180181户,即中位数是两个儿童。家庭按儿童数分组(个/户)家庭数(户)0123440 65125 90 40 合 计 360第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第27页/共42页l组距式分组数列的中位数求法(1)先确定中位数所在的组:求f/2,从第一组的总体单位数开始向后累加至f/2止(2)计算中位数的近似值:下限公式:上限公式:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第28页/共42页例:
21、根据表4的资料确定中位数。解:据表中资料计算:,第四组为中位数组。XL=3000 XU=4000 d=10 359 381按上限公式计算中位数:第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第29页/共42页众数、中位数、均值的关系众数、中位数、均值的关系众数、中位数、均值的关系众数、中位数、均值的关系1 1、对称分布:众数、对称分布:众数、对称分布:众数、对称分布:众数=中位数中位数中位数中位数=均值均值均值均值2 2、右偏分布、右偏分布、右偏分布、右偏分布:众数众数众数众数 中位数中位数中位数中位数 中位数中位数中位数中位数 均值均值均值均值 左偏分布左偏分布左偏分布左偏分布左
22、偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值第三节第三节 数据分布集中趋势的测度数据分布集中趋势的测度第30页/共42页第四节第四节第四节第四节 数据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定标志变异指标标志变异指标标志变异指标
23、标志变异指标一、标志变异指标一、标志变异指标一、标志变异指标一、标志变异指标1 1、概念:是反映同质总体各单位标志值的差异程度,、概念:是反映同质总体各单位标志值的差异程度,即数列的离散趋势的指标,又称标志变动度。即数列的离散趋势的指标,又称标志变动度。2 2、作用:、作用:n n衡量平均指标的代表性衡量平均指标的代表性n n反映社会经济活动过程的均衡性反映社会经济活动过程的均衡性n n标志变异指标是统计分析的一个基本指标标志变异指标是统计分析的一个基本指标3 3、种类:、种类:全距、四分位差、平均差、标准差、离散系数全距、四分位差、平均差、标准差、离散系数第31页/共42页二、全距二、全距二
24、、全距二、全距R R1 1、定义:、定义:全距也称极差,是一组数据的最大值与最小值之全距也称极差,是一组数据的最大值与最小值之差,是离散程度的最简单测度值。差,是离散程度的最简单测度值。2 2、计算:、计算:n n未分组数据:未分组数据:R=R=最大值最大值-最小值最小值n n分组数据:分组数据:R=R=最大组上限最大组上限-最小组下限最小组下限3 3、特点:、特点:n n计算方便,便于理解计算方便,便于理解n n易受极端值影响易受极端值影响n n未考虑数据的分布未考虑数据的分布第四节第四节第四节第四节 数据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定第
25、32页/共42页三、三、三、三、四分位差四分位差四分位差四分位差IQRIQR1 1、定义:、定义:四分位差也称四分位差也称内距或修正极差内距或修正极差,是是上四分位数与下上四分位数与下四分位数之差。四分位数之差。2 2、计算:、计算:内距内距内距内距=上四分位数上四分位数上四分位数上四分位数 下四分位数下四分位数下四分位数下四分位数=Q Q3 3 Q Q1 13 3、特点:、特点:n n反映了中间反映了中间50%50%数据的离散程度数据的离散程度n n不值受极端的影响,不值受极端的影响,n n可以衡量中位数的代表性高低可以衡量中位数的代表性高低第四节第四节第四节第四节 数据分布离散程度的测定数
26、据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定第33页/共42页第四节第四节第四节第四节 数据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定数据分布离散程度的测定四、平均差四、平均差四、平均差四、平均差A.D.A.D.1 1、定义:、定义:平均差是数列中各单位标志值与平均数之差绝对值平均差是数列中各单位标志值与平均数之差绝对值的平均数。的平均数。2 2、计算:、计算:n n未分组数据:未分组数据:n n分组数据:分组数据:3 3、特点:、特点:n n全面反映标志值的差异程度全面反映标志值的差异程度n n不适合代数方法的演算使其使用受到限制不适合代数方法的演算使
27、其使用受到限制第34页/共42页五、方差和标准差五、方差和标准差五、方差和标准差五、方差和标准差1 1、定义:、定义:方差是总体各单位某一数量标志的标志值与其算术方差是总体各单位某一数量标志的标志值与其算术平均数的离差平方的平均数。平均数的离差平方的平均数。方差的平方根为标准差,又称均方差。方差的平方根为标准差,又称均方差。2 2、计算:、计算:n n总体方差与标准差总体方差与标准差n n样本方差与标准差样本方差与标准差3 3、特点:、特点:n n离散程度的最常用的测度值之一离散程度的最常用的测度值之一n n反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异第四节第四节 数据分布离散
28、程度的测定数据分布离散程度的测定第35页/共42页总体方差和标准差总体方差和标准差(Population(Population variancevariance and and Standard deviationStandard deviation)未分组数据:未分组数据:分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式第36页/共42页样本方差和标准差样本方差和标准差(simple(simple variancevariance and and stand
29、ard deviationstandard deviation)未分组数据:未分组数据:分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用样本方差用样本方差用自由度自由度自由度n nn-1-1-1去去去除除除!第37页/共42页六、六、六、六、离散系数离散系数离散系数离散系数1 1、定义:、定义:离散系数也称标准差系数,是一组数据的标准差离散系数也称标准差系数,是一组数据的标准差与其相应的均值之比与其相应的均值之比2 2、计算:、计算
30、:3 3、特点:、特点:n n对数据相对离散程度的测度对数据相对离散程度的测度n n消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响n n用于对不同组别数据离散程度的比较用于对不同组别数据离散程度的比较第四节第四节 数据分布离散程度的测定数据分布离散程度的测定第38页/共42页七、属性总体的概念及特征值的计算七、属性总体的概念及特征值的计算七、属性总体的概念及特征值的计算七、属性总体的概念及特征值的计算1 1、概念:、概念:属性总体属性总体属性总体属性总体就是将可以将总体单位分为具有某种标志就是将可以将总体单位分为具有某种标志的单位和不具有某种标志的单位的总体。的单位和不具
31、有某种标志的单位的总体。可以用可以用“是是”或或“否否”来表示的标志称为来表示的标志称为是非标志是非标志是非标志是非标志,一般用一般用“1”1”表示具有某种标志,表示具有某种标志,“0”0”表示不具表示不具有某种标志。有某种标志。总体中两部分单位占全部单位的比重称为总体中两部分单位占全部单位的比重称为成数成数成数成数,用,用p p或或q q 表示。表示。2 2、属性总体的特征值、属性总体的特征值第四节第四节 数据分布离散程度的测定数据分布离散程度的测定第39页/共42页一、偏态及其测度:一、偏态及其测度:一、偏态及其测度:一、偏态及其测度:n n偏态是对分布偏斜方向及程度的测度。偏态是对分布偏斜方向及程度的测度。n n偏态系数偏态系数SKSKn n判别:判别:1 1、SK=0SK=0,对称分布,对称分布 2 2、SK0SK0,正偏或右偏分布,正偏或右偏分布 3 3、SK0SK0K0,尖峰分布,尖峰分布 3 3、K0K0,平峰分布,平峰分布第五节第五节 分布偏态与峰度分布偏态与峰度第41页/共42页