《现代企业常用的统计分析方法课件.ppt》由会员分享,可在线阅读,更多相关《现代企业常用的统计分析方法课件.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节 对比分析法一.对比分析法的种类二.用企业的实际数据可以进行各种不同的对比,不同的对比三.说明的问题不同。四.(一)按时间状况不同,可以分为静态对比和动态对比五.1.静态对比:也叫横向对比,指同一时间不同指标值的对比六.*如实际数与计划数对比,通常称“计划完成程度”。企业统计分析方法*本企业实际数与同期先进水平(本行业先进水平、国内先进 水平、国际先进水平)对比。*本企业实际数据与同期经验数据、理论数据对比。经验数据、理论数据具有相对稳定性,通过对比说明企业某现象是否正常。静态对比是外向型的,通过对比发现本企业与其他企业、与先进水平的差距,达到开阔眼界,树立目标,改进管理的目的。2.动态
2、对比:也叫纵向对比,是同一指标不同时间数值的对比。如,本期数与前期数,与去年同期数,与历史最好数相比。通过对比,反映企业自身的变化和进步,增强信心。实际分析时可以将横向、纵向对比结合起来。如本企业二季度实现利润980万元,是一季度的103.2%,是去年同期的98%,一、二季度累计实现利润1931万元,完 成全年计划48%,二季度实现利润是同行业另一相同企业的90%。通过多种对比,说明该企业二季度和上半年生产经营有成效,但并不十分理想(如完成全年计划48%,是其他企业的90%),下半年必须更加努力,才能取得更好成绩。(二)单指标对比和多指标对比1.单指标对比:某个统计指标与标准水平(或对比水平)
3、的对比,如企业产品合格率实现的情况。2.多指标对比:以企业生产经营某一方面为总体,如就企业经济效益所做的多指标对比,就企业生产、销售、利润、设备利用状况等方面的对比分析。进一步发展就成为多指标的综合评价问题。对这个问题后面将专门讨论。二.对比分析中注意的问题 1.指标的内海和外延可比内涵指指标的概念、含义,外延指指标的计算口径。2.指标的计算方法和计量单位可比。3.总体性质可比。这是指对比企业的同类性。列联分析是把两个(或两个以上)的指标结合起来,通常以列联表的形式表现。下面就是一个列联表 上面的数据说明了什么?第二节第二节 列联分析法列联分析法青少年行为家庭状况合计(人)完整家庭离异家庭犯罪
4、未犯罪389237875100合计(人)13045175离异家庭青少年的犯罪率远远高于完整家庭青少年犯罪率。列联分析建立在数据分组(分类)基础上,通过分组或分类,反映不同类别的数量特征。再看一个例子泰坦尼克号相关数据(全船共2208 人)The Titanic Data Age By SurvivedAge By SurvivedCountCountCol%Col%Row%Row%DDSSAA1438143896.5196.5168.5168.5166166192.0692.0631.4931.4920992099CC52523.493.4947.7147.7157577.947.9452.2
5、952.291091091490149071871822082208DeVeauxCountCountCol%Col%Row Row%DDSSFF1261268.468.4626.8126.8134434447.9147.9173.1973.19470470MM1364136491.5491.5478.4878.4837437452.0952.0921.5221.52173817381490149071871822082208CountCountCol%Col%Row%Row%DDSS111221228.198.1937.5437.5420320328.2728.2762.4662.46325
6、3252216716711.2111.2158.6058.6011811816.4316.4341.4041.402852853352852835.4435.4474.7974.7917817824.7924.7925.2125.21706706CrewCrew67367345.1745.1775.4575.4521921930.5030.5024.5524.558928921490149071871822082208Gender By SurvivedClass By SurvivedSurvival by gender按性别划分按性别划分按性别划分按性别划分CountCountCol%Co
7、l%Row%Row%死死死死活活活活女女女女1261268.468.4626.8126.8134434447.9147.9173.1973.19470470男男男男1364136491.5491.5478.4878.4837437452.0952.0921.5221.52173817381490149071871822082208 c2 Test Odd Ratio TestTree model 存存活活率率平均反映集中趋势变异反映离散趋势 平均数的计算公式 或 方差计算公式 或 方差开方称标准差第三节 平均结合变异分析法1.不同总体中平均指标的对比如:人力资源方面 职工平均年龄,平均文化程度
8、,平均工资等;生产方面 单位产品平均成本,原材料平均单耗,平均劳动生产率等;平均指标不受总体规模大小的影响,可以进行不同车间、不同企业间的比较。2.平均指标与变异指标结合起来分析 平均指标说明总体的一般水平,变异指标说明总体内部的差异程度。差异大是不平衡、不稳定的表现。如某个车间两个班组生产同一种产品,数据如下 甲、乙组日产量均值差不多,但乙组标准差大大小于甲组,表明乙组生产的稳定性好于甲组。日期日期12345678910合计合计平均值平均值标准差标准差甲组甲组乙组乙组81281291210131113121012101314171420131201231212.33.681.353.总平均数
9、与组平均数结合分析 总平均数由两个因素决定,一个是组平均数,一个是组在总体中的比重(结构)。分析时考虑到不同的影响因素,会使分析更为全面。例:人员分组甲分厂乙分厂工人人数(人)生产量(件)劳生率(件/人)工人人数(人)生产量(件)劳生率(件/人)熟练工人非熟练工人合计40020060024000600030000603050200400600130001280025800653243分析:1.从总劳生率看,甲厂(50件/人)高于乙厂(43件/人),但还不能确切说明甲厂生产效率高于乙厂。2.就分组情况看,熟练工人和非熟练工人劳生率都是乙厂高。3.(见前表,熟练工人:甲厂60,乙厂654.非熟练工
10、人:甲厂30,乙厂32 )5.3.产生上述不同的原因是职工结构不同。甲厂熟练工人比重大。6.提高总劳生率,一方面要提高各组劳生率,一方面通过改7.变结构也可以实现。第四节 量、本、利分析法 量、本、利分析法是业务量量、本、利分析法是业务量成本成本利润分析法的简称。利润分析法的简称。“量量”可以表示产品销售量或产品销售收入;可以表示产品销售量或产品销售收入;“本本”表示产品销表示产品销售成售成本;本;“利利”表示产品销售利润。量、本、利分析法是根据业务量、表示产品销售利润。量、本、利分析法是根据业务量、成本、利润三者的相互关系,测算某项业务盈亏平衡点,对利润成本、利润三者的相互关系,测算某项业务
11、盈亏平衡点,对利润做出预测和决策的方法。做出预测和决策的方法。分析的基本原理:分析的基本原理:总成本由固定成本和变动成本组成。在一定限度内,产量总成本由固定成本和变动成本组成。在一定限度内,产量(销量)增加,固定成本不变,则单位产品中的固定成本下降,(销量)增加,固定成本不变,则单位产品中的固定成本下降,产量(销量)增加,变动成本增加,单位产品中变动成本可能会有不同幅度提高(如分摊广告费)。当销量增加时,销售收入也会增加,且增幅会高于总成本增幅(否则销售越多越亏损,不合常理)。于是用量、本、利分析法可以找到销售收入等于销售成本的盈亏平衡点。在盈亏平衡点:产品销售收入=产品销售成本 而 产品销售
12、收入=产品销售单价 x 销售量 产品销售成本=固定成本+(单位变动成本 x 销售量)于是,于是,固定成本总额固定成本总额 盈亏平衡点销量盈亏平衡点销量=单位产品销售价格单位产品销售价格 -单位产品变动成本单位产品变动成本据此可以计算出盈亏平衡点的销量和销售收入。据此可以计算出盈亏平衡点的销量和销售收入。例:例:根据过去经验,某企业生产甲产品每台销售价为根据过去经验,某企业生产甲产品每台销售价为100100元,每台元,每台产品变动成本为产品变动成本为8080元,固定总成本为元,固定总成本为6000060000元,则甲产品盈亏平衡元,则甲产品盈亏平衡点销量为多少?此时的销售收入为多少?点销量为多少
13、?此时的销售收入为多少?盈亏平衡点的销量=6000/(100-80)=3000(台)此时的销售收入=100(元)X 3000=300000元 进一步,上面分析只是企业保本的数量标准,若希望得到一定利润,在其他条件不变情况下,产品的销量应为:固定成本总额+销售利润额 一定利润额的销量=单位产品销售价格 单位产品变动成本 仍以前例,该企业在计划期希望获利润1万元,其他条件不变,则甲产品销量应达到多少?一定利润额的销量一定利润额的销量=(60000+1000060000+10000)/(100-80100-80)=3500=3500(台)(台)此外将上面公式变换一下,还可以测算在利润目标已经确定条此
14、外将上面公式变换一下,还可以测算在利润目标已经确定条件下,产品销售价格、单位产品变动成本、固定成本总额应达到件下,产品销售价格、单位产品变动成本、固定成本总额应达到的水平,为企业决策提供参考。的水平,为企业决策提供参考。再进一步,预测企业达到一定销量时,在其他条件不变下所能再进一步,预测企业达到一定销量时,在其他条件不变下所能获得的销售利润。获得的销售利润。销售利润销售利润=销量销量 X X (单位产品销价(单位产品销价-单位产品变动成本)单位产品变动成本)-固定固定 成本总额成本总额 上例中,若该企业如果计划将产品销量提高到上例中,若该企业如果计划将产品销量提高到40004000台,企业台,
15、企业可获多少利润?可获多少利润?企业可获利润=4000 X(100-80)-60000=20000元同理,将前式变换,还可以预测提高产品销价,降低单位产品变动成本,减少固定成本总额,以及各因素同时变动时对销售利润的影响。分析时需注意的问题:1.量、本、利分析法的假定条件是量、本、利为线性关系,依 一定比例变动,所以假设只在一定条件下成立。2.为简化公式,上面没包括销售税金等因素,实际分析时应予 以考虑。第五节 综合评价分析法 多指标比较中可能会出现互有高低的情况,如两个企业经济效多指标比较中可能会出现互有高低的情况,如两个企业经济效益的情况进行对比,反映经济效益的指标有若干,两个企业各有益的情
16、况进行对比,反映经济效益的指标有若干,两个企业各有一些指标值高,一些指标值低。一些指标值高,一些指标值低。综合评价分析法就是针对这种情况产生的。综合评价分析法就是针对这种情况产生的。一一一一.综合评价分析法的步骤综合评价分析法的步骤综合评价分析法的步骤综合评价分析法的步骤 1.1.根据评价分析目的,选择若干指标,建立综合评价指标体系根据评价分析目的,选择若干指标,建立综合评价指标体系 2.2.搜集数据,对不同计量单位的指标值进行同度量处理搜集数据,对不同计量单位的指标值进行同度量处理 3.3.确定指标体系中各指标权数确定指标体系中各指标权数 4.4.对指标进行汇总,计算综合评价值,并由此得到结
17、论对指标进行汇总,计算综合评价值,并由此得到结论二.建立综合评价指标体系 建立指标体系时应遵循的原则:科学性:反映研究对象本身的性质和特点,指标之间具有逻辑关系等。全面性:从各角度反映研究对象的全貌。敏感性:比较敏感地反映研究对象变化,不受政策因素制约 精简:体系中各指标的相关度越低越好 实用性:数据可搜集 对指标进行筛选的方法主要有:对指标进行筛选的方法主要有:1.1.经验判断法经验判断法 2.2.统计分析法,如聚类分析,因子分析方法等统计分析法,如聚类分析,因子分析方法等 3.3.专家讨论法专家讨论法 实际工作中,应充分运用已有的研究成果,已有定论的指标体实际工作中,应充分运用已有的研究成
18、果,已有定论的指标体系,如进行工业企业经济效益评价,系,如进行工业企业经济效益评价,19981998年年2 2月国家统计局公布月国家统计局公布了评价体系,包括了评价体系,包括7 7项指标,分别是:总资产贡献率,资产保值增项指标,分别是:总资产贡献率,资产保值增值率,资产负债率,流动资金周转率,成本费用利润率,全员劳值率,资产负债率,流动资金周转率,成本费用利润率,全员劳生率,工业产品销售率。生率,工业产品销售率。三.确定评价标准 用指标实际值与标准值进行比较。标准值的确定应根据评价分析的目的,常用的几类标准有:1.计划标准 评价目的是说明计划完成情况 2.平均标准 将参与测评几个企业的平均值作
19、为标准 3.行业标准或国家标准 4.动态标准 本企业前期或历史最好水平四四.确定分析指标的权数确定分析指标的权数 权数的作用:说明指标的重要程度,反映出研究人员关注什权数的作用:说明指标的重要程度,反映出研究人员关注什么,提倡什么,强调什么。么,提倡什么,强调什么。确定权数的主要方法有:确定权数的主要方法有:1.1.经验判断法,经验判断法,2.2.专家咨询法,专家咨询法,如德尔菲法(反复轮回征询意见)如德尔菲法(反复轮回征询意见)3.3.相应的数理统计法,如因子分析中的因子负荷作为确定权数相应的数理统计法,如因子分析中的因子负荷作为确定权数依据。依据。在综合评价中,一般规定各指标权数之和等于在
20、综合评价中,一般规定各指标权数之和等于100%100%五.综合值计算方法 实践中有不同方法。1.打分综合法(1)将每项指标实际值与标准值进行比较,凡实际值好于标准值计100分(也可计其他分,如80分),两者相同计50分,实际值差于标准值计0分(也可计其他分,如20分)。(2)计算某类指标平均得分,计算公式为 (3 3)计算总体总得分,计算公式为)计算总体总得分,计算公式为(4 4)按总体总得分多少排序,确定各评价总体名次。)按总体总得分多少排序,确定各评价总体名次。该方法特点:计算简单,但不够精确。赋分方法过于简单,如该方法特点:计算简单,但不够精确。赋分方法过于简单,如改进改进10%10%计
21、计100100分,改进分,改进20%20%也计也计100100分,不够合理。分,不够合理。2.打分排队法 与打分综合法基本相同,最后都是根据评价总体得分多少排名次,不同之处是将指标体系中各指标按实际值优劣排序,其中正指标(如劳生率)从大到小排列,逆指标(如单位产品成本)从小到大排列。指标排在第一名得100分,排在最后一名得0分,居于中间的按下式计算各总体的得分:其中 为某企业第 项指标的得分,n为该企业第 项指标的排列名次位数,N为参与评估的企业总数。3.3.综合指数法综合指数法 以国家统计局以国家统计局19981998年年2 2月实施的工业企业经济效益评价指标体月实施的工业企业经济效益评价指
22、标体系为例,说明此种方法的具体步骤:系为例,说明此种方法的具体步骤:(1 1)建立评价指标体系。)建立评价指标体系。(见见wordword文档文档)该指标体系从企业赢利能该指标体系从企业赢利能力、发展能力、偿债能力、营运能力、产出效率和产销衔接等方力、发展能力、偿债能力、营运能力、产出效率和产销衔接等方面,较全面地反映了企业综合经济效益状况。面,较全面地反映了企业综合经济效益状况。(2 2)确定各指标权数。)确定各指标权数。(见见wordword文档文档)(3 3)确定对比标准值。)确定对比标准值。(见见wordword文档文档)该标准值是参考全国工业该标准值是参考全国工业企业经济效益的实际水
23、平和一般标准确定的。企业经济效益的实际水平和一般标准确定的。(4)计算各指标个体指数 报告期该指标企业实际值 某指标个体指数=该指标全国标准值 (见word文档)(5)计算综合效益指数 由于各项指标权数等于100%,所以也可以只写成分子形式。(6 6)对经济效益进行评价)对经济效益进行评价 计算结果表明,计算结果表明,A A企业效益指数为企业效益指数为103.16%103.16%,说明,说明A A 企业经济企业经济效益水平不仅高于效益水平不仅高于B B企业,而且高于全国平均水平。企业,而且高于全国平均水平。A A企业是盈利企业是盈利企业,其资产负债率低于标准值(企业,其资产负债率低于标准值(5
24、5%60%55%60%),对于),对于A A企业来说,企业来说,应考虑如何发挥资金杠杆作用,适当提高企业负债比率。而应考虑如何发挥资金杠杆作用,适当提高企业负债比率。而B B企业企业效益指数为效益指数为96.41%96.41%,没有达到全国平均水平。,没有达到全国平均水平。经济效益综合指数采用全国标准为标准值,不仅可以进行本经济效益综合指数采用全国标准为标准值,不仅可以进行本企业动态对比,而且能进行不同企业之间的综合比较,同时找到企业动态对比,而且能进行不同企业之间的综合比较,同时找到与全国平均水平的差距,是一套操作性强的综合评价体系和方法。与全国平均水平的差距,是一套操作性强的综合评价体系和
25、方法。由于企业情况千差万别,使用该评价体系时应注意:(1)若企业亏损,利润为负值,该体系1、2、5指标均为负值,可按个体指数为负数计入总指数。(2)资产负债率。国际公认标准,资产负债率一般以50%为宜,我国企业资产负债率一般都比较高,故标准值定为60%。对资产负债率应辨证看,如果资产收益大于借款利息时,资产负债率可以高些,当企业亏损或利润率小于利息率时,负债率越高,企业风险越大。但资产负债率也不是越低越好,当盈利率大于利息率时,负债率低,会使企业失去负债杠杆作用,说明企业经营保守,不利于企业提高资本收益率。4.4.功效系数法。这种方法是将每一个指标的实际值转化为用百分功效系数法。这种方法是将每
26、一个指标的实际值转化为用百分制表示的分数,再汇总计算综合评价值。具体步骤为:制表示的分数,再汇总计算综合评价值。具体步骤为:(1 1)根据经验和评价目的,对每个指标确定一个上限值(或称满)根据经验和评价目的,对每个指标确定一个上限值(或称满意值),一个下限值(或称不允许值)。上限值可以是参评单位意值),一个下限值(或称不允许值)。上限值可以是参评单位的最优值,也可以是行业,全国的先进水平,或某个时期的奋斗的最优值,也可以是行业,全国的先进水平,或某个时期的奋斗目标。下限值可以是参评单位的最差值,或行业最低水平。目标。下限值可以是参评单位的最差值,或行业最低水平。(2 2)计算每项指标的功效系数
27、。计算公式为)计算每项指标的功效系数。计算公式为式中 为第 个指标的功效系数,为第 个指标的实际值,为第 个指标的上限值,为第 个指标的下限值,x 40+60是为了使计算结果不为0,并转化为人们习惯的百分制分数。3.3.将各指标的功效得分,用各指标的权数加权平均,求得各类将各指标的功效得分,用各指标的权数加权平均,求得各类指标功效系数综合得分和总体功效系数总得分。指标功效系数综合得分和总体功效系数总得分。4.4.根据功效系数总得分进行排序和评价。根据功效系数总得分进行排序和评价。例题见例题见wordword文档文档又称时间序列分析。可以分为描述和探询规律两个方面。一.动态描述二.主要通过一些动
28、态分析指标,描述现象发展变化的特征。三.步骤:四.1.编制时间序列,注意指标的可比性。五.2.计算分析指标。常用的分析指标有六.增减量:报告期水平与基期水平之差。七.发展速度:报告期水平比基期水平,分定基发展速度和环比八.发展速度。第六节 动态分析法增长速度:发展速度增长速度:发展速度 -100%-100%平均发展速度:水平法计算公式平均发展速度:水平法计算公式二二.测定长期趋势测定长期趋势 从历史数据中发现规律。从历史数据中发现规律。对历史数据进行拟合有不同统计方法:这里介绍移动平均和线对历史数据进行拟合有不同统计方法:这里介绍移动平均和线性模型。性模型。1.移动平均法2.*测定长期趋势的一
29、种较简单的常用方法3.*将历史数据按一定的间隔长度逐期移动,分别计算出一4.系列移动平均数5.*由这些平均数形成的新的时间序列对原时间序列的波动起到一定的修匀作用,削弱了原序列中短期偶然因素的影响,从而呈现出现象发展的变动趋势 移动的间隔时期长度为K(1K n)的移动平均序列移动平均法移动平均法(实例实例)19811998年我国汽车产量数据年我国汽车产量数据年年 份份产量产量(万辆万辆)年份年份产量产量(万辆万辆)19811982198319841985198619871988198917.5619.6323.9831.6443.7236.9847.1864.4758.351990199119
30、9219931994199519961997199851.4071.42106.67129.85136.69145.27147.52158.25163.00【例例例例】已已知知1981198119981998年年我我汽汽车车产产量量数数据据如如表表。分分别别计计算算三三年年和和五五年年移移动动平平均均趋趋势势值值,以以及及三三项项和和五五项项移移动动中中位位数数,并并作作图图与与原原序列比较序列比较 移动平均法移动平均法(趋势图趋势图)05010015020019811985198919931997产量五项移动平均趋势值五项移动中位数汽车产量(万辆)汽车产量移动平均趋势图汽车产量移动平均趋势图
31、(年份)2.线性模型 现象的发展按线性趋势变化时,可用线性模型表示。线性模型的形式为$Yt=a+b t$Y Yt t 代表时间序列的趋势值代表时间序列的趋势值 t t 代表时间标号代表时间标号 a a 为趋势线在为趋势线在Y Y 轴上的截距轴上的截距 b b 是是趋趋势势线线的的斜斜率率,表表示示时时间间 t t 变变动动一一个个单单位位时时观察值的平均变动数量观察值的平均变动数量趋势方程中的两个未知常数 a 和 b 按最小二乘法(Least-square Method)求得n根据回归分析中的最小二乘法原理n使各实际观察值与趋势值的离差平方和为最小根据趋势线计算出各个时期的趋势值根据最小二乘法
32、得到求解根据最小二乘法得到求解 a a 和和 b b 的标准方程为的标准方程为解得解得解得线性模型法线性模型法(实例及计算过程实例及计算过程)表表11-8 汽车产量直线趋势计算表汽车产量直线趋势计算表年份年份时间标号时间标号 t产量产量(万辆万辆)YitYtt2趋势值趋势值19811982198319841985198619871988198919901991199219931994199519961997199812345678910111213141516171817.5619.6323.9831.6443.7236.9847.1864.4758.3551.4071.42106.67129
33、.85136.69145.27147.52158.25163.0017.5639.2671.94126.56218.60221.88330.26515.76525.15514.00785.621280.041688.051913.662179.052360.322690.252934.001491625364964811001211441691962252562893240.009.5019.0028.5038.0047.5057.0066.5076.0085.5095.00104.51114.01123.51133.01142.51152.01161.51合计合计1711453.581841
34、1.9621091453.58【例例例例】利利用用前前表表中中的的数数据据,根根据据最最小小二二乘乘法法确确定定汽汽车车产产量量的的直直线线趋趋势势方方程程,计计算算出出 19811981 19981998年年各各年年汽汽车车产产量量的的趋趋势势值值,并并预预测测20002000年年 的的 汽汽 车车 产产量量,作作图图与与原原序序列比较列比较线性模型法线性模型法(计算结果)(计算结果)根据上表得根据上表得 a a 和和 b b 结果如下结果如下汽车产量的直线趋势方程为汽车产量的直线趋势方程为$Yt=-9.4995+9.5004 t$Y Y20002000=-9.4995+9.5004=-9.
35、4995+9.5004 20=20=180.51180.51(万辆万辆万辆万辆 )20002000年汽车产量的预测值为年汽车产量的预测值为线性模型法线性模型法(趋势趋势图图)05010015020019811985198919931997汽车产量趋势值 汽车产量直线趋势汽车产量直线趋势(年份)汽车产量(万辆)本节包括两个方面的分析:相关分析:分析不同事物相互联系的密切程度。回归分析:如果两事物关系密切,我们希望通过一个事物的变化,估计和预测另一个事物变化的程度。相关分析是分析的起点,回归分析是相关分析逻辑上的继续一.相关分析二.函数关系与相关关系:什么是函数关系三.第七节 相关回归分析法函数关
36、系是:函数关系是:*是一一对应的确定关系*设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y y =f f(x x),其中 x 称为自变量,y 称为因变量*各观测点落在一条线上 函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关关系可表示为系可表示为 y y=p p x x(p p 为单价为单价)圆圆的的面面积积(S S)与与半半径径之之间间非非关关系系可可表表示示为为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)
37、与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系系可可表示为表示为y y=x x1 1 x x2 2 x x3 3 相关关系是:*变量间关系不能用函数关系 精确表达*一个变量的取值不能由另一 个变量唯一确定*当变量 x 取某个值时,变量 y 的取值可能有几个*各观测点分布在直线周围 相关关系的例子商品的消费量商品的消费量(y y)与居民收入与居民收入(x x)之间的关系之间的关系商品销售额商品销售额(y y)与广告费支出与广告费支出(x x)之间的关系之间的关系粮粮食食亩亩产产量量(y y)与与施施肥肥量量(x x1
38、 1)、降降雨雨量量(x x2 2)、温度温度(x x3 3)之间的关系之间的关系收入水平收入水平(y y)与受教育程度之间的关系与受教育程度之间的关系(x x)父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系之间的关系相关关系的图示相关关系的图示完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 不相关不相关不相关不相关不相关不相关
39、非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关相关系数的计算公式或化简为相关系数的说明:*r 的取值范围是-1,1*|r|=1,为完全相关nr=1,为完全正相关nr=-1,为完全负正相关*r=0,不存在线性相关关系相关*-1r 0,为负相关*0r 1,为正相关*|r|越趋于1表示关系越密切;|r|越趋于1表示关系越不密切 我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位:元元年份年份人均国民人均国民收入收入人均消费人均消费金额金额年份年份人均国民人均国民收入收入人均消费人均消费金额金额1981198219831984198519861987393.8
40、419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148(相关系数计算例)(相关系数计算例)【例例例例】在在研研究究我我国国人人均均消消费费水水平平的的问问题题中中,把把全全国国人人均均消消费费额额记记为为y y,把把人人均均国国民民收收入入记记为为x x。我我们们收收集集到到1981198119931993年年的的样样本本数据数据(x xi i ,y yi i),i i=1,2,
41、=1,2,,1313。数据见下表,计算相关系数。数据见下表,计算相关系数。相关关系的测度相关关系的测度(计算结果)(计算结果)解:解:根据相关系数的计算公式 人均国民收入与人均消费金额之间的相关系 数为 0.9987二.回归分析 *从一组数据出发,确定变量之间的数学关系式 *利用所求的关系式,根据一个或几个变量的取值来预测或 控制另一个特定变量的取值,并给出这种预测或控制的精 确程度回归分析与相关分析的区别:相关分析描述两个变量之间线性关系的密切程度;回归分析揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测。回归模型的类型回归模型的类型一个自一个自一个自一个自变量变量变量变量两个
42、及两个两个及两个两个及两个两个及两个以上自变量以上自变量以上自变量以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归一元线性回归模型(1)当只涉及一个自变量时称为一元回归一元回归,若因变量 y 与自 变量 x 之间为线性关系时称为一元线性回归一元线性回归(2)对于具有线性关系的两个变量,可以用一条线性方程来 表示它们之间的关系(3)描述因变量 y 如何依赖于自变量 x 和误差项 的方程 称为回归模型回归模型 对于只涉及一个自变量的简单线性回归模型可表示为 y=0 0+1 1 x+e en模型中,y 是 x 的线性函
43、数(部分)加上误差项n线性部分反映了由于 x 的变化而引起的 y 的变化n误差项 是随机变量l反映了除 x 和 y 之间的线性关系之外的随机因素对y 的影响l是不能由 x 和 y 之间的线性关系所解释的变异性n0 和 1 称为模型的参数。一元线性回归模型一元线性回归模型(基本假定)(基本假定)1.误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=0+1 x2.对于所有的 x 值,的方差2 都相同3.误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)回归方程回归方程 描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程 简
44、单线性回归方程的形式如下 E(y)=0+1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0 0是是回回归归直直线线在在 y y 轴轴上上的的截截距距,是是当当 x x=0=0 时时 y y 的的期期望值望值 1 1是是直直线线的的斜斜率率,表表示示当当 x x 每每变变动动一一个个单单位位时时,y y 的平均平均变动值的平均平均变动值回归回归方程参数的估计方程参数的估计y=y=0 0+1 1x x$3.简单线性回归中的估计的回归方程为简单线性回归中的估计的回归方程为 1 1 0 0$2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中
45、的的未未知知参参数数 0 0和和 1 1 ,这时我们就得到了,这时我们就得到了估计的回归方程估计的回归方程估计的回归方程估计的回归方程其其中中:是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x x 的的值值,是是 y y 的的估估计计值值,也表示也表示 x x 每变动一个单位时,每变动一个单位时,y y 的平均平均变动值的平均平均变动值 y y$0 0$1 1$1.总总体体回回归归参参数数 0 0和和 1 1是是未未知知的的,我我们们必必需需利利用用样样本数据去估计它们本数据去估计它们参数参数 0和和 1
46、的最小二乘估计的最小二乘估计最小二乘法最小二乘法(概念要点(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 0和 1的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小最小二乘法最小二乘法(图示)(图示)x xy y(x x2 2,y y2 2)(x x1 1,y y1 1)(x xi i,y yi i)(x xn n,y yn n)e ei i =y yi i-y yi iy=y=0 0+1 1x x$最小二乘法最小二乘法(0 和和 1 的计算公式的计算公式)根据最小二乘法的要求,可得求解0 和 1 的标准方程如下估计方程的求法估
47、计方程的求法(实例)(实例)【例例】根据前例中的数据,配合人均消费金额对人均国民收入的回归方程 根据0和1的求解公式得 估计估计(经验经验)方程方程 人均消费金额对人均国民收入的回归方程为y=54.22286+0.52638 x估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)01预测及应用预测及应用利用回归方程进行估计和预测利用回归方程进行估计和预测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型n点估计n区间估计(点估计)(点估计)y 值的点估计值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个估计值y0 2.
48、在前面的例子中,假如我们要估计人均国民收入为1250.7元时人均消费金额,就是点估计。根据估计的回归方程得:y0=54.22286+0.52638 1250.7=712.57(元)(区间估计)(区间估计)1.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此还可以进行区间估计2.对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间(置信区间估计(置信区间估计)y 的置信区间估计的置信区间估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的估计区间,这一估计区间称为置信区间置信区间2.在1-置信水平下的置信区间为式式中中:S
49、Sy y为为估估计标准误差计标准误差(置信区间估计(置信区间估计:算例算例)【例】【例】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间 解:根据前面的计算结果 712.57,Sy=14.95(见Excel计算表),t(13-2)2.201,n=13 置信区间为y0 712.57712.57 10.26510.265人人 均均 消消 费费 金金 额额 95%95%的的 置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间(第14讲)考场作文开拓文路能力分解层次(网友来稿)江苏省镇江中学 陈乃香说明:本系列稿共24讲,
50、20XX年1月6日开始在资源上连载【要义解说】文章主旨确立以后,就应该恰当地分解层次,使几个层次构成一个有机的整体,形成一篇完整的文章。如何分解层次主要取决于表现主旨的需要。【策略解读】一般说来,记人叙事的文章常按时间顺序分解层次,写景状物的文章常按时间顺序、空间顺序分解层次;说明文根据说明对象的特点,可按时间顺序、空间顺序或逻辑顺序分解层次;议论文主要根据“提出问题分析问题解决问题”顺序来分解层次。当然,分解层次不是一层不变的固定模式,而应该富于变化。文章的层次,也常常有些外在的形式:1小标题式。即围绕话题把一篇文章划分为几个相对独立的部分,再给它们加上一个简洁、恰当的小标题。如世界改变了模