《EXCEL与数据分析课件(4).ppt》由会员分享,可在线阅读,更多相关《EXCEL与数据分析课件(4).ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、授课教师:马银戌授课教师:马银戌第第四四章章 数据间的相关性数据间的相关性分析分析1 第一节第一节 数据间的相关性数据间的相关性 第二节第二节 相关图表与相关关系相关图表与相关关系 的初步判断的初步判断本章主要教学内容 第三节第三节 相关系数的计算和分析相关系数的计算和分析 第四节第四节 线性回归分析线性回归分析2第一节第一节 数据间的相关性数据间的相关性 一、一、函数关系和相关关系函数关系和相关关系 二、二、线性相关和非线性相关线性相关和非线性相关 三、三、正线性相关和负线性相关正线性相关和负线性相关 3一、一、函数关系和相关关系函数关系和相关关系 任何事物都不是孤立存在的,总会与其他事物有
2、或任何事物都不是孤立存在的,总会与其他事物有或多或少的联系,其运行轨迹会受到其他事物的影响,同多或少的联系,其运行轨迹会受到其他事物的影响,同时也影响着其他事物的发展。因此,仅从事物本身出发时也影响着其他事物的发展。因此,仅从事物本身出发研究其特征和规律是不全面的,还应对事物之间的相关研究其特征和规律是不全面的,还应对事物之间的相关性进行分析。性进行分析。在自然界和社会现象中,客观现象之间的数量关系在自然界和社会现象中,客观现象之间的数量关系其通常有两种类型其通常有两种类型,即:即:现象之间的数量关系现象之间的数量关系 函数关系函数关系 相关关系相关关系 4 函数关系函数关系是是现象(变量)之
3、间客观存在现象(变量)之间客观存在的的确定性确定性的的数量对应关系。数量对应关系。如:如:圆面积与半径的关系。圆面积与半径的关系。相关关系相关关系即即现象(变量)之间客观存在的现象(变量)之间客观存在的非确定性非确定性的数量依存关系。的数量依存关系。即当一个现象取一定值时,与其相对应的另一个现即当一个现象取一定值时,与其相对应的另一个现象的值不完全确定,而是有多个值与其对应。象的值不完全确定,而是有多个值与其对应。例如:例如:消费支出与消费收入的关系、学习成绩与学习消费支出与消费收入的关系、学习成绩与学习时间的关系、亩产量和浇水量之间的关系、企业生产规时间的关系、亩产量和浇水量之间的关系、企业
4、生产规模和综合单位成本之间的关系等。模和综合单位成本之间的关系等。5二、二、线性相关和非线性相关线性相关和非线性相关 事物间的相关性又可以从相关的表现形式划分为线性事物间的相关性又可以从相关的表现形式划分为线性相关和非线性相关。相关和非线性相关。线性相关:线性相关:相关的两个事物的对应值画在直角坐标图相关的两个事物的对应值画在直角坐标图上,其数据散布点趋向直线形式,则称为上,其数据散布点趋向直线形式,则称为线性相关。线性相关。如商品的销售量与销售额之间就是一种线性相关关系。如商品的销售量与销售额之间就是一种线性相关关系。非线性相关:非线性相关:如果其散布点分布趋向某种曲线形式,如果其散布点分布
5、趋向某种曲线形式,则称为则称为非线性(曲线)相关。非线性(曲线)相关。例如,随着家庭年收入的增长,购买轿车的可能性也会增例如,随着家庭年收入的增长,购买轿车的可能性也会增加。但当年收入处在较低水平时,年收入增加,轿车的购买量加。但当年收入处在较低水平时,年收入增加,轿车的购买量增长幅度不会很大;当年收入达到一定水平时,购买量的增长增长幅度不会很大;当年收入达到一定水平时,购买量的增长幅度会较大;而当年收入达到一个较高水平时,购买量的增长幅度会较大;而当年收入达到一个较高水平时,购买量的增长幅度将会再次保持平稳。这就是一个典型的非线性相关关系。幅度将会再次保持平稳。这就是一个典型的非线性相关关系
6、。6 线性相关关系是有方向性的,按照相关的方向不同可线性相关关系是有方向性的,按照相关的方向不同可以分为正线性相关和负线性相关。以分为正线性相关和负线性相关。负相关:负相关:如果自变量如果自变量x的数值增加的数值增加(或减少或减少),因变量,因变量y的数的数值则随之减少值则随之减少(或增加或增加),即自变量与因变量的变动方向是,即自变量与因变量的变动方向是相反的,这种相关关系相反的,这种相关关系称为负相关称为负相关。如商品的价格和销售量之间的关系。如商品的价格和销售量之间的关系。三、正线性相关和负线性相关三、正线性相关和负线性相关 正相关:正相关:当自变量当自变量x数值增加数值增加(或减少或减
7、少)时时,因变量因变量y的数值也的数值也将随之相应的增加将随之相应的增加(或减少或减少),这种相关关系称为,这种相关关系称为正相关。正相关。如学习时间和学习成绩之间的关系。如学习时间和学习成绩之间的关系。7第二节第二节 相关表、相关表、相关图与相关关相关图与相关关系的初步判断系的初步判断 一、相关表的制作一、相关表的制作 二、相关图的制作二、相关图的制作 三、相关关系的初步判断三、相关关系的初步判断8(一(一)定性分析定性分析(二(二)定量分析定量分析 相关表相关表相关图相关图 相关系数相关系数 分析和判断两数值型数据间的相关性,可采用理论分析和判断两数值型数据间的相关性,可采用理论分析(定性
8、分析)方法和定量分析方法两大类。定量分分析(定性分析)方法和定量分析方法两大类。定量分析方法又包括图表分析方法和数值分析方法。析方法又包括图表分析方法和数值分析方法。数据间相关性的初步判断可通过定性分析及定量分析数据间相关性的初步判断可通过定性分析及定量分析中的图表分析方法。中的图表分析方法。9一、相关一、相关表的制作表的制作 相关表是用来观察两个现象之间是否具有相关相关表是用来观察两个现象之间是否具有相关关系的数据表格,它是将数据表格中的其中一个现关系的数据表格,它是将数据表格中的其中一个现象进行排序(降序或升序均可),然后观察另一个象进行排序(降序或升序均可),然后观察另一个数据随着前一个
9、数据的增加或减少是否呈现出有规数据随着前一个数据的增加或减少是否呈现出有规律的变化,从而初步判断两个现象之间是否具有相律的变化,从而初步判断两个现象之间是否具有相关关系。关关系。相关表的制作很简单,将两个现象的数据分别相关表的制作很简单,将两个现象的数据分别两列录入两列录入ExcelExcel,然后将其中一列排序即可。,然后将其中一列排序即可。10学号学号学习时间(小时)学习时间(小时)学习成绩(分)学习成绩(分)020305080604090110075.05.56.06.07.07.58.08.08.59.061606577788285929296表表4-1 4-1 学习时间与学习成绩相关
10、表学习时间与学习成绩相关表11二、相关二、相关图的制作图的制作 相关图又称散点图,它是将相关表中的数值在平面直相关图又称散点图,它是将相关表中的数值在平面直角坐标系中用坐标点描绘出来,以表明相关数据点的分布角坐标系中用坐标点描绘出来,以表明相关数据点的分布状况。通过相关图可观察两个现象之间关系的总体模式,状况。通过相关图可观察两个现象之间关系的总体模式,初步判断它们之间是否具有相关关系以及相关关系的强弱初步判断它们之间是否具有相关关系以及相关关系的强弱程度和相关的方向。程度和相关的方向。相关图的制作步骤:相关图的制作步骤:(1 1)将搜集的两个现象的数据分两列录入)将搜集的两个现象的数据分两列
11、录入ExcelExcel表;表;(2 2)选中制作图表的数据区域;)选中制作图表的数据区域;12(3 3)点击)点击“插入插入”点击点击“图表图表”,出现,出现“图表向图表向导导”的复选框;或直接在的复选框;或直接在ExcelExcel表上方的工具栏中表上方的工具栏中点击图表向导:点击图表向导:(4 4)在)在“图表类型图表类型”中选择中选择“XYXY散点图散点图”,并选择,并选择“子图表类型子图表类型”中的第一类;中的第一类;(5 5)单击)单击“下一步下一步”“下一步下一步”,填写图表标题及,填写图表标题及X X轴和轴和Y Y轴的标题轴的标题;(6 6)单击单击“下一步下一步”单击单击“完
12、成完成”。案例案例:分析我国固定资产投资与:分析我国固定资产投资与GDP的相关性。的相关性。13 相关图描述了两个现象之间的大致关系,比较典型相关图描述了两个现象之间的大致关系,比较典型的形态有以下几种:的形态有以下几种:(1 1)所有点均落在左下右上的一条直线上,表明数)所有点均落在左下右上的一条直线上,表明数据间为完全正相关;据间为完全正相关;(2 2)所有点均落在左上右下的一条直线上,表明数)所有点均落在左上右下的一条直线上,表明数据间为完全负相关;据间为完全负相关;上述两种情况表明两个事物之间是函数关系,而不上述两种情况表明两个事物之间是函数关系,而不是相关关系。是相关关系。(3 3)
13、数据点杂乱无章,从形态上看不出任何特征和)数据点杂乱无章,从形态上看不出任何特征和规律,表明现象之间不相关。规律,表明现象之间不相关。14 (1 1)数据点大致落在左下右上的一条直线周围,)数据点大致落在左下右上的一条直线周围,表明数据间存在正线性相关关系;表明数据间存在正线性相关关系;(2 2)数据点大致落在左上右下的一条直线周围,)数据点大致落在左上右下的一条直线周围,表明数据间存在负线性相关关系;表明数据间存在负线性相关关系;(3 3)数据点大致呈现某种曲线形态,如抛物线)数据点大致呈现某种曲线形态,如抛物线等,表明现象之间不存在线性相关关系,但存在非等,表明现象之间不存在线性相关关系,
14、但存在非线性相关关系。线性相关关系。几种主要的相关图形如下:几种主要的相关图形如下:15 完全正相关完全正相关不相关不相关几种主要的相关图几种主要的相关图yyxx完全负相关完全负相关yx16 直线相关直线相关曲线相关曲线相关学习时间学习时间学学习习成成绩绩商品价格商品价格购购买买量量 正正相相关关负负相相关关几种主要的相关图几种主要的相关图yyyyxxxx17第三节第三节 相关系数的计算和分析相关系数的计算和分析一、相关系数的含义一、相关系数的含义二、相关系数的计算二、相关系数的计算三、案例分析三、案例分析18一、相关系数的含义一、相关系数的含义 (一)相关系数的概念(一)相关系数的概念 相关
15、表和相关图虽然能够直观展现数据之间的相相关表和相关图虽然能够直观展现数据之间的相关关系,但只是大概,不精确。关关系,但只是大概,不精确。(简单)相关系数(简单)相关系数是是线性相关条件下,线性相关条件下,用来说明用来说明两个变量之间相关关系密切程度两个变量之间相关关系密切程度和相关方向的统计指和相关方向的统计指标。它通过数字的方式准确描述了数据间线性相关的标。它通过数字的方式准确描述了数据间线性相关的方向和强弱程度。方向和强弱程度。相关系数是一个用来度量数值型数据间的线性相关关相关系数是一个用来度量数值型数据间的线性相关关系的系数,不受变量值计量单位的影响,一般记为系的系数,不受变量值计量单位
16、的影响,一般记为 r r。其数学定义为:其数学定义为:1920(二(二)相关系数相关系数r 的取值范围的取值范围 1 1r+1 1(三(三)相关系数相关系数r 的取值含义的取值含义 或或0r1 12122二、二、相关系数的计算相关系数的计算 在在EXCEL中,相关系数的计算可通过中,相关系数的计算可通过“数据分析数据分析”命令计算。基本操作步骤如下:命令计算。基本操作步骤如下:(1 1)选择)选择“工具工具”菜单中的菜单中的“数据分析数据分析”命令,出命令,出现如下对话框:现如下对话框:(2 2)选择)选择“相关系数相关系数”,单击,单击“确定确定”,出现,出现“相相关系数关系数”的复选框:的
17、复选框:23 (3 3)在)在“输入区域输入区域”框中输入待分析数据所在的单框中输入待分析数据所在的单元格地址,并在元格地址,并在“输出选项输出选项”中进行选择中进行选择 ,单击,单击“确定确定”,即可出现相关系数的计算结果。,即可出现相关系数的计算结果。24三、案例分析三、案例分析 根据我国根据我国20102010年各地区年各地区GDPGDP和固定资产投资、居民和固定资产投资、居民消费水平的数据资料,分析消费水平的数据资料,分析固定资产投资、居民消费水固定资产投资、居民消费水平与各地区平与各地区GDP之间的相关性。之间的相关性。利用利用EXCEL计算的相关系数结果为:计算的相关系数结果为:地
18、区生产总值地区生产总值 固定资产投资固定资产投资 居民消费水平居民消费水平地区生产总值地区生产总值1 1固定资产投资固定资产投资0.8881 0.8881 1 1居民消费水平居民消费水平0.4058 0.4058 0.1543 0.1543 1 125 计算结果表明,各地区固定资产投资与地区生产总值计算结果表明,各地区固定资产投资与地区生产总值的相关系数为的相关系数为0.88810.8881,说明固定资产投资与地区生产总值,说明固定资产投资与地区生产总值之间为高度正相关;各地区居民消费水平与地区生产总值之间为高度正相关;各地区居民消费水平与地区生产总值的相关系数为的相关系数为0.40580.4
19、058,说明居民消费水平与地区生产总值,说明居民消费水平与地区生产总值之间为低度正相关。之间为低度正相关。上述数据分析结果显示,我国的经济增长方式主要为上述数据分析结果显示,我国的经济增长方式主要为投资拉动型,固定资产投资是拉动经济增长的主要因素,投资拉动型,固定资产投资是拉动经济增长的主要因素,而居民消费对经济增长的拉动不力。从长远的意义来看,而居民消费对经济增长的拉动不力。从长远的意义来看,这种状态不利于国民经济的可持续发展,因此,政府应通这种状态不利于国民经济的可持续发展,因此,政府应通过制定相应的政策转变经济增长方式,约束投资的数量,过制定相应的政策转变经济增长方式,约束投资的数量,提
20、高投资的质量;并进一步采取有效政策,引导和鼓励居提高投资的质量;并进一步采取有效政策,引导和鼓励居民消费,提高居民消费水平和消费质量。民消费,提高居民消费水平和消费质量。26第四节第四节 线性回归分析线性回归分析 一、一、相关分析与回归分析的关系相关分析与回归分析的关系 二二、简单线性回归分析、简单线性回归分析 三、三、回归分析的回归分析的EXCEL实现实现27一、相关分析与回归分析的关系一、相关分析与回归分析的关系 回归分析回归分析就是对具有就是对具有相关关系相关关系的多个变量之间的数量的多个变量之间的数量变化进行数量测定,配合一定的数学方程(模型),以便变化进行数量测定,配合一定的数学方程
21、(模型),以便由由自变量自变量的数值对的数值对因变量因变量的可能值进行估计或预测的一种的可能值进行估计或预测的一种统计方法。统计方法。相关分析相关分析(相关系数相关系数)能够确定变量之间相关方向和相关能够确定变量之间相关方向和相关的密切程度的密切程度,但它不能指出两个变量之间相互关系的具体形但它不能指出两个变量之间相互关系的具体形式式,也无法从一个变量的数量变化来推测另一个变量的变化也无法从一个变量的数量变化来推测另一个变量的变化情况。(另外,在相关分析中,一般不必区分自变量和因情况。(另外,在相关分析中,一般不必区分自变量和因变量,它不能说明两个变量是主从关系还是因果关系。)变量,它不能说明
22、两个变量是主从关系还是因果关系。)(一)回归分析的概念(一)回归分析的概念28(二)相关分析和回归分析的关系(二)相关分析和回归分析的关系n相关分析和回归分析既有联系,也有区别。相关分析和回归分析既有联系,也有区别。n联系:联系:1 1、相关分析是回归分析的前提和基础;、相关分析是回归分析的前提和基础;2 2、回归分析是相关分析的继续和深入。、回归分析是相关分析的继续和深入。n区别:区别:1 1、相关分析中两变量都是随机的,不必确定自变量、相关分析中两变量都是随机的,不必确定自变量与因变量;而回归分析中只有因变量是随机的与因变量;而回归分析中只有因变量是随机的,必须事先确必须事先确定自变量和因
23、变量。定自变量和因变量。2 2、相关分析中只能算出一个相关系数,而回归分析、相关分析中只能算出一个相关系数,而回归分析中可有两个回归方程。中可有两个回归方程。3 3、相关分析的内容是判断事物之间是否具有相关关、相关分析的内容是判断事物之间是否具有相关关系及相关的方向和密切程度;而回归分析则是要分析当自系及相关的方向和密切程度;而回归分析则是要分析当自变量发生变化时,因变量平均发生怎样的变动。变量发生变化时,因变量平均发生怎样的变动。29二、简单线性回归分析二、简单线性回归分析回归分析的种类回归分析的种类按照回归按照回归线的形状线的形状按自变量按自变量的个数的个数多元回归多元回归一元回归一元回归
24、非线性(曲线)回归非线性(曲线)回归线性(直线)回归线性(直线)回归 根据回归分析的方法,得出的数学表达式称为回归根据回归分析的方法,得出的数学表达式称为回归方程(回归模型),它有多种形式,可以是直线方程,方程(回归模型),它有多种形式,可以是直线方程,也可以是曲线方程。也可以是曲线方程。用用回归方程回归方程来表明两个变量之间线性相互关系的方来表明两个变量之间线性相互关系的方程式,称为程式,称为简单线性回归方程(模型)简单线性回归方程(模型)。这种分析方法。这种分析方法称为称为简单线性回归分析。简单线性回归分析。30 实际中,多数现象的调查采用抽样调查,因此,通实际中,多数现象的调查采用抽样调
25、查,因此,通常使用样本直线回归方程作为总体回归方程的估计值。常使用样本直线回归方程作为总体回归方程的估计值。a:直线起点值,数学上称为直线的截距;直线起点值,数学上称为直线的截距;b:数学上称为直线的斜率;统计学上称为回归系数。数学上称为直线的斜率;统计学上称为回归系数。它表示自变量它表示自变量x每变动一个单位时,因变量每变动一个单位时,因变量y平均平均变动的数值。变动的数值。式中:式中:(一)简单直线回归方程(样本方程)(一)简单直线回归方程(样本方程)31 简单线性回归分析简单线性回归分析的任务的任务 就就是如何根据实际样本资料来是如何根据实际样本资料来 确确定参数定参数a、b,即即从从各
26、个相关点中配合一条合适的直线,各个相关点中配合一条合适的直线,使其能代表相关点的变动趋势(即用其表明两变量使其能代表相关点的变动趋势(即用其表明两变量x与与y在在线性相关条件下的具体变动关系)线性相关条件下的具体变动关系)。数学证明,数学证明,符合符合“离差平方和最小离差平方和最小”的直线是最合的直线是最合适的。适的。这种决定直线这种决定直线方程的方法,称为方程的方法,称为最小二乘法(最最小二乘法(最小平方法)。小平方法)。(二)直线回归方程的求解(二)直线回归方程的求解xy32根据根据“离差平方和最小离差平方和最小”的原则,的原则,a、b 的求解公式为:的求解公式为:(三)利用回归方程进行预
27、测(三)利用回归方程进行预测 回归方程描述了当自变量发生变化时,因变量的平均回归方程描述了当自变量发生变化时,因变量的平均变化情况。因此,可用回归方程预测当自变量为某个特定变化情况。因此,可用回归方程预测当自变量为某个特定值时的因变量的取值。即,建立了回归方程并通过了统计值时的因变量的取值。即,建立了回归方程并通过了统计检验之后,回归方程的一个重要应用就是根据给定的自变检验之后,回归方程的一个重要应用就是根据给定的自变量量x的值,对因变量的值,对因变量y 作出相应的预测估计。作出相应的预测估计。33 回归方程的预测包括定值预测和区间预测。回归方程的预测包括定值预测和区间预测。利用回归方程,对自
28、变量利用回归方程,对自变量x的一个特定值的一个特定值 x0 0 ,求出因,求出因变量变量y 的一个估计值的一个估计值y0 0 ,这就是点估计,也称定值预测。,这就是点估计,也称定值预测。利用回归方程,对自变量利用回归方程,对自变量x的一个特定值的一个特定值 x0 0 ,以一定,以一定的把握程度,计算出因变量的把握程度,计算出因变量y 的一个估计值的一个估计值y0 0 的置信区间,的置信区间,这就是区间估计,也称区间预测。当把握程度为这就是区间估计,也称区间预测。当把握程度为95%95%时(实时(实际中常用),际中常用),y0 0 的置信区间(简单算法)为:的置信区间(简单算法)为:其中,其中,
29、Sy 称为称为估计标准误差,估计标准误差,是衡量是衡量因变量因变量y的实际值和的实际值和估计值离差一般水平的分析指标,估计值离差一般水平的分析指标,sy的大小与回归方程的代的大小与回归方程的代表性成反比。表性成反比。34三、回归分析的三、回归分析的EXCEL实现实现 (1 1)选择选择“工具工具”菜单中的菜单中的“数据分析数据分析”子菜单,在子菜单,在“分析工具分析工具”中选择中选择“回归回归”;(2 2)单击)单击“确定确定”,出现如下对话框:,出现如下对话框:利用利用EXCEL进行回归分析,是通过进行回归分析,是通过“数据分析数据分析”命令实现的。具体操作如下:命令实现的。具体操作如下:3
30、5 (3 3)给出因变量给出因变量Y Y和自变量和自变量X X的数据所在的单元格区域,的数据所在的单元格区域,在在“输出选项输出选项”中选择输出的位置,同时选择中选择输出的位置,同时选择“线性拟合线性拟合图图”;(4 4)单击)单击“确定确定”,输出回归结果。,输出回归结果。36 对输出结果的解释:对输出结果的解释:(结合固定资产投资与地区(结合固定资产投资与地区GDP的关系的关系案例案例)输出结果包括输出结果包括“SUMMARY OUTPUT”(摘要输出)和(摘要输出)和“RESIDUAL OUTPUT”(残差输出)两部分以及线性拟(残差输出)两部分以及线性拟合图。合图。37 (1 1)“M
31、ultiple R”是自变量是自变量X和因变量和因变量Y之间的简单相之间的简单相关系数关系数 r,等于,等于0.88810.8881,表明两者间高度正相关;,表明两者间高度正相关;(2 2)“R Square”是判定系数是判定系数R2,等于等于0.78870.7887。判定系判定系数数R2是测定直线回归模型拟合优度的一个重要指标,其意是测定直线回归模型拟合优度的一个重要指标,其意义同相关系数义同相关系数 r具有一致性具有一致性。计算结果表明,。计算结果表明,GDP的总误的总误差中有差中有78.87%可以由固定资产投资与可以由固定资产投资与GDP的依存关系来解的依存关系来解释,只有释,只有21.
32、13%属于随机因素的影响,因此这条回归线是属于随机因素的影响,因此这条回归线是比较合适的;比较合适的;(3)“Adjusted R Square”是调整的是调整的R2,在简单线性回在简单线性回归分析中没有特别意义;归分析中没有特别意义;(4)“标准误差标准误差”是回归方程的估计标准差是回归方程的估计标准差Sy,此例中此例中的估计标准差为的估计标准差为5330,很大,表明回归方程的拟合度不高;,很大,表明回归方程的拟合度不高;38 (5 5)“方方差差分分析析”中中的的“SS”下下面面的的三三个个数数分分别别是是回回归归平平方方和和SSR、剩剩余余平平方方和和SSE和和总总离离差差平平方方和和S
33、ST;其其中中SSR反反映映了了自自变变量量的的变变化化所所引引起起的的因因变变量量y值值的的波波动动,其其大大小小反反映映了了自自变变量量x的的重重要要程程度度;SSE是是 y 的的实实际际值值与与估估计计值值之之差差的的平平方方和和,它它主主要要反反映映随随机机因因素素对对因因变变量量的的影影响响程程度度。在在总总离离差差平平方方和和中中,SSR占占的的比比例例越越大大,说说明明自自变变量量对对因因变变量量的的影影响响越越大大,即即x与与y线线性性相相关关的的程程度度越越高高,回回归归方方程程的的质质量量越越高高;反反之之,SSE所所占占的的比比例例越越大大,说说明明随随机机因因素素对对因
34、因变变量量的的影影响响越越大大,而而自自变变量量与与因因变变量量的的关关系系越越不不密密切切,回回归归方方程程的的质质量量越越低低。F 统统计计量量就就是是反反映映SSR与与SSE比比例例关关系系、并并用用于于对对回回归归 方程进行显著性检验的统计量。方程进行显著性检验的统计量。(6 6)F下下面面的的数数是是回回归归方方程程显显著著性性检检验验中中的的F统统计计量量的的值值,等等于于108.27;其其右右侧侧单单元元格格中中的的数数是是F统统计计量量在在原原假假设设(X与与Y线线性性相相关关不不显显著著)成成立立时时发发生生的的概概率率,为为2.6610-11,当当把把握握程程度度为为95%
35、时时,由由于于2.6610-5(1-0.95),所所以以拒拒绝绝原原假假设设,认认为为两两个个变变量量之之间间的的线线性性相相关关是是显显著著的的,线线性性回回归归模模型型检检验验通通过过;(7)“t Stat”下下面面的的数数是是回回归归方方程程显显著著性性检检验验中中的的 t 统统计计量量的的值值,等等于于10.41;其其右右侧侧单单元元格格中中的的数数是是t 统统计计量量在在原原假假设设(回回归归系系数数为为0)成成立立时时发发生生的的概概率率,为为2.6610-11,当当把把握握程程度度为为95%时时,由由于于2.6610-11(1-0.95),所所以以拒拒绝绝原原假假设设,认认为为回
36、回归归系系数数显显著著不不为为0,自自变变量量对对因因变变量量的的线线性性解解释释有有贡贡献献,应应保保留留在在 回归方程中;回归方程中;40 (8 8)“Coefficients”下面的两个数是回归方程的两下面的两个数是回归方程的两个参数值,其中,截距个参数值,其中,截距 a=-856.07=-856.07,回归系数,回归系数 b=1.71=1.71;据此,可写出样本回归方程:;据此,可写出样本回归方程:表明固定资产投资每增加表明固定资产投资每增加1 1亿元,亿元,GDP平均增加平均增加1.711.71亿元。亿元。(9)“标准误差标准误差”下面的两个数是参数下面的两个数是参数a和和b的标准差
37、;的标准差;(10)“下限下限 95%和上限和上限95%”下面的数字是在下面的数字是在95%的的把握下把握下a和和b的置信区间;的置信区间;(11)“RESIDUAL OUTPUT”下面的数字是下面的数字是GDP的预测的预测值及预测值和实际值之间的误差值及预测值和实际值之间的误差(残差)。残差)。41 *利用回归方程进行预测,在利用回归方程进行预测,在EXCELEXCEL中可通过编辑公式中可通过编辑公式进行计算。进行计算。例,若某省固定资产投资为例,若某省固定资产投资为80008000亿元,利用回归方程亿元,利用回归方程对该省对该省GDP进行预测:进行预测:定值预测:定值预测:区间预测:区间预
38、测:在在95%95%的把握程度下,该省的把握程度下,该省GDPGDP预测值的置信区间为:预测值的置信区间为:即:当某省固定资产投资为即:当某省固定资产投资为80008000亿元,以亿元,以95%95%的把握程的把握程度预测该省度预测该省GDP在在21642164亿元亿元2348423484亿元之间。亿元之间。置信区间过大,通过固定资产预测置信区间过大,通过固定资产预测GDPGDP是不合适的。是不合适的。42 案例案例分析:根据对分析:根据对3535家家电生产企业进行产量和家家电生产企业进行产量和单位产品成本的调查资料进行相关和回归分析,并预单位产品成本的调查资料进行相关和回归分析,并预测:当某
39、企业计划将年产量调整为测:当某企业计划将年产量调整为120120万台时,单位成万台时,单位成本估计值是多少?本估计值是多少?利用利用ExcelExcel对数据处理的结果显示:产量和单位成对数据处理的结果显示:产量和单位成本之间的相关系数为本之间的相关系数为-0.9568-0.9568,表明两者之间呈现线性,表明两者之间呈现线性高度负相关。即,年产量越大,单位产品成本越低。高度负相关。即,年产量越大,单位产品成本越低。进一步进行产量和单位产品成本的回归分析,获得进一步进行产量和单位产品成本的回归分析,获得回归方程为:回归方程为:43 方程显著性检验(方程显著性检验(F F检验、检验、t t检验)
40、通过,估计标准检验)通过,估计标准差为差为61.6761.67,较小,说明回归方程质量较高。,较小,说明回归方程质量较高。当某企业计划将年产量调整为当某企业计划将年产量调整为120120万台时,单位成本万台时,单位成本的定值预测:的定值预测:在在95%95%的把握程度下,该企业单位产品成本预测值的置的把握程度下,该企业单位产品成本预测值的置信区间为:信区间为:即:当某企业即:当某企业将年产量调整为将年产量调整为120万台时,单位成本万台时,单位成本的点估计值为的点估计值为889.58元,元,在在95%的把握程度下,该企业的把握程度下,该企业单位产品成本预测值的置信区间单位产品成本预测值的置信区间在在766.24766.24元元1012.921012.92元元之间。之间。44