《统计指标与统计分析技术.ppt》由会员分享,可在线阅读,更多相关《统计指标与统计分析技术.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、企业经济统计指标及统计分析技术n主讲:朱平辉n厦门大学管理学院MBA教育中心教授n中国商业统计学会市场调查研究会理事企业经济指标体系n一、统计指标:n企业经济活动数量方面的科学范畴,也是企业经济统计认识企业经济现象的主要手段。n二、指标体系:n企业经济活动是许多因素相互作用、相互影响的复杂过程;需要设置相互关联的一系列指标,组成科学指标体系。n三、企业经济统计指标体系框架企业统计数据n一、外部信息n1、间接n2、直接(调查)n二、内部信息n1、会计核算资料n2、业务核算资料n3、统计核算资料(企业统计部门直接收集)n三、管理与开发n通过原始记录统计台帐统计报表收集整理后需要科学管理与开发n管理
2、:编码、录入,统计数据库建设与共享n开发:描述统计与推断统计n时间序列;回归建模;多元分析企业工业产值指标n1、总产值:企业全部生产成果的价值指标,由物质转移价值和劳动新创价值组成;n企业工业总产值=产品销售收入+现价产成品期末期初差额+现价在产品期末期初差额+企业加工费用+全部产品应缴增值税n全部产品应缴增值税=会计账面应缴增值税+(现价产成品期末期初差额+现价半成品期末期初差额)应缴增值调整系数n应缴增值调整系数=n2、工业增加值n企业一定时期内生产的以货币表现的工业最终产品总量。n(1)生产法:n企业工业增加值=企业工业总产出-企业工业中间投入n=企业工业总产出-(企业工业中间物质投入+
3、企业工业中间劳务投入)n(2)分配法:n企业工业增加值=n折旧+工资+福利基金+劳动及待业保险+产品销售税金及附加+应交增值税+应得产品销售利润+其它n某企业的产品产值,该厂销售资料如下:指标金额(万元)指标金额(万元)产品销售收入300产成品期末期初差额100产品销售成本200半成品期末期初差额50企业其他业务收入50会计账面应缴增值税10统计分析技术n一、因素分析法n企业资材消耗变动的因素分析报告期基期产品产量Q1单耗M1单价P1产量Q0单耗M0单价P0A125522200520B4308504507.555C350440350545n二、回归分析一元线性回归分析一元线性回归分析模型的假定
4、参数的最小二乘估计假设检验方差分析与相关性分析预测实证研究例子模型的假定 在实际中,对于经济问题的研究,不仅要分析该问题的基本性质,也需要对经济变量之间的数量关系数量关系进行具体分析(回归分析、相关分析、方差分析等)。其中回归分析回归分析是最常用的数量分析方法。但是,大多数情况下,用其它方法与回归分析相结合进行综合性分析,会使分析更加系统全面。关于这一点请大家在在学习一元线性回归分析时注意体会。一、一元线性回归模型一、一元线性回归模型n 各种经济变量之间的关系大体可分为两种类型:一类是函数关系;另一类是统计相关关系。n例如:家庭消费支出Y与家庭收入X之间的关系;支出Y还要受多种因素的影响(家庭
5、人口、消费习惯、存款利率、商品价格等),收入只是主要影响因素之一。n 变量Y与X1,X2,Xk统计相关关系可以表示成:或者 这里的u是随机影响。一元线性回归模型在各个给定的 值条件下因变量的期望值轨迹称为回归直线,相应的方程为 随机扰动项 是与总体值与条件期望之差,即最简单的相关形式是一元线性模型:总体模型二、随机扰动项的性质二、随机扰动项的性质扰动项 包含了丰富的内容,产生的原因主要有以下几个方面:1、忽略掉的影响因素造成的误差2、模型关系不准确造成的误差3、变量观测值的计量误差4、随机误差注意:注意:扰动项的存在是计量经济学的特点。计量经济学中的多种估计、检验、预测等分析方法,是针对不同性
6、质的扰动项引入的。经典的一元线性回归模型通常满足五个假定条件经典的一元线性回归模型通常满足五个假定条件三、经典假设条件三、经典假设条件22 参数的最小二乘估计 一、参数的估计n 从上面的散点图可以看出,所有的样本点大致都落在一条直线附近,说明家庭收入X与家庭消费支出Y之间有明显的线性关系。一条直线与散点拟合在一起,但不重合。这说明两变量间只存在相关关系。这条拟合的直线:n称为一元线性经验回归直线(方程)。对于拟合直线,则称下式是估计模型:称作残差,它是随机误差的估计值。有时也记作et。是的估计量。估计模型系数估计 (1)用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵
7、消的问题。(2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性。(这种方法对异常值非常敏感)解方程得到:二、最小二乘估计量的特性 几个结论:几个结论:223 3 假设检验假设检验 -t(T-2)0 t(T-2)方差分析与相关性方差分析与相关性检验回归方程检验回归方程预测实证分析实证分析 案例:用回归模型预测木材剩余物 伊春林区位于黑龙江省东北部。全区有森林面积2189732公顷,木材蓄积量为23246.02万m3。森林覆盖率为62.5%,是我国主要的木材
8、工业基地之一。1999年伊春林区木材采伐量为532万m3。按此速度44年之后,1999年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划与方式,保护森林生态环境。为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。下面,利用简单线性回归模型预测林区每年的木材剩余物。显然引起木材剩余物变化的关键因素是年木材采伐量。给出伊春林区16个林业局1999年木材剩余物和年木材采伐量数据如表三三、多元统计分析多元统计分析n从一元到多元,认识主题发生了变化n多元分析常用
9、方示:n1、聚类分析;2、判别分析;3、主成分析;n4、因子分析;5、多维标度分析;6、对应分析;7、联合分析n这里介绍因子分析与多维标度分析 因子分析n(一)什么是因子分析什么是因子分析n 因子分析(factor analysis)也是一种降维的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。因子分析就是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。n在研究区域社会经济发展中
10、,描述社会与经济现象的指标很多,过多的指标容易导致分析过程复杂化。一个合适的做法就是从这些关系错综复杂的社会经济指标中提取少数几个主要因子,每一个主要因子都能反映相互依赖的社会经济指标间共同作用,抓住这些主要因素就可以帮助我们对复杂的社会经济发展问题进行深入分析、合理解释和正确评价。n因子分析的数学模型 n通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小,至多达到中等大小。这时对于每个公共因子而言(即载荷矩阵的每一列),它在部分变量上的载荷较大,在其它变量上的载荷较小,使同一列上的载荷尽可能地向靠近1和靠近0两极分离。n这时就突出了每个公共因子和其
11、载荷较大的那些变量的联系,矛盾的主要方面的显现出来了,该公共因子的含义也就能通过这些载荷较大变量作出合理的说明。n因子提取的步骤是:n1、判别有待分析的数据是否适宜因子分析n数据背后的变量独立性越强,越不适宜进行因子分析。探索原始变量相关性的方法主要有Bartletts球形检验及KMO检验,分别是:n(1)Bartletts球形检验。该检验目的是检验相关系数矩阵是否为单位矩阵。当检验统计量的伴随概率小于给定的显著性水平时,认为相关系数矩阵不为单位阵,可以进行因子分析;否则,伴随概率大于时,不宜进行因子分析。n(2)KMO检验。KMO(Kaiser-Meyer-Olkin)检验用于分析变量间的偏
12、相关性,其取值在01之间。通常认为KMO的值越接近1越好,说明所有变量的偏相关系数远小于简单相关系数,此时数据宜于进行因子分析;当KMO小于0.6时,一般认为数据不宜进行因子分析。n2、提取因子。首先是要确定提取因子数,可以依据以往的知识事先确定,也可以根据特征值大于一个标准(通常取1)条件确定,或者根据解释方差比例大小等多种方法确定因子数。其次是根据因子可解释情况进行必要的因子旋转。n3、解释因子的具体含义。n4、计算因子得分并应用。根据实际需要综合因子总分,利用总分进行排序或进行综合评价,并进行深层次的影响因素分析。n因子分析的应用多维标度法 n在实际中我们会经常遇到这些的问题:给你一组城
13、市,你总能从地图上测出任何一对城市之间的距离。但若给你若干城市的距离,你能否确定这些城市之间的相对位置呢?n假定通过调查了解了10种饮料产品在消费者心中的相似程度,你能否确定这些产品在消费者心理空间中的相对位置呢?在实际中我们常常会遇到类似这样的问题。n多维标度法(Multidimensional Scaling)就是解决这类问题的一种方法,它是一种在低维空间展示“距离”数据结构的多元数据分析技术,简称MDS。n多维标度法解决的问题是:当个对象(object)中各对对象之间的相似性(或距离)给定时,确定这些对象在低维空间中的表示(感知图Perceptual Mapping),并使其尽可能与原先
14、的相似性(或距离)“大体匹配”,使得由降维所引起的任何变形达到最小。n多维标度法内容丰富、方法较多。n按相似性(距离)数据测量尺度的不同MDS可分为:度量MDS和非度量MDS。当原始数值为间隔尺度和比率尺度时称为度量MDS(metric MDS),当原始数据的等级顺序(即有序尺度)时称为非度量MDS(nonmetric MDS)。n用以测度偏离完美匹配程度的量度STRESS,称之为应力。定义为n n与之间差异越大,STRESS值越大,表明匹配性也就越差。n当STRESS0时,表示拟合完美;n当0STRESS2.5%时,表示非常好;n当2.5STRESS5%时,表示好;n当5STRESS10%时,表示一般;n当10STRESS20%时,表示差。n多维标度法的实际应用n谢谢大家!n推荐书目:n1、曾五一、朱平辉主编,统计学统计学在在经济管理领域的应用经济管理领域的应用,机器工业出版社;n2、邵建利主编,企业管理与经济统计企业管理与经济统计学学,格致出版社,上海人民出版社。