《应用经济学课件第8章相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《应用经济学课件第8章相关与回归分析.ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章相关与回归分析 相关分析与回归分析是研究现象的相互关相关分析与回归分析是研究现象的相互关系、测定它们联系的密切程度,揭示其变化的系、测定它们联系的密切程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经具体形式和规律性的统计方法,是构造各种经济模型、进行经济分析、政策评价、预测和控济模型、进行经济分析、政策评价、预测和控制的重要工具。制的重要工具。主要内容和学习目标主要内容和学习目标 相关与回归的基本问题相关与回归的基本问题(理解)(理解)简单线性相关分析简单线性相关分析(掌握)(掌握)一元线性回归分析一元线性回归分析(掌握)(掌握)一、相关与回归的基本问题一、相关与回归的基本问题
2、变量之间的关系变量之间的关系 相关关系的分类相关关系的分类 相关分析和回归分析的内容与方法相关分析和回归分析的内容与方法 相关分析和回归分析的联系与区别相关分析和回归分析的联系与区别函数关系函数关系:变量间的:变量间的确定性确定性数量依存关系数量依存关系相关关系相关关系:变量间的:变量间的非确定性非确定性数量依存关系数量依存关系变量之间的关系变量之间的关系 银银银银行行行行存存存存款款款款中中中中,本本本本利利利利和和和和(S)S)S)S)与与与与本本本本金金金金(A)(A)(A)(A)之之之之间间间间的的的的关关关关系系系系可可可可表示为表示为表示为表示为S=A(1+r)S=A(1+r)S=
3、A(1+r)S=A(1+r)n n n n 某种商品的销售额某种商品的销售额某种商品的销售额某种商品的销售额(y)(y)(y)(y)与销售量与销售量与销售量与销售量(x)(x)(x)(x)之间的之间的之间的之间的 关系可表示为关系可表示为关系可表示为关系可表示为 y=px(p y=px(p y=px(p y=px(p 为单价为单价为单价为单价)企企企企业业业业的的的的原原原原材材材材料料料料消消消消耗耗耗耗额额额额(y y y y)与与与与产产产产量量量量(x x x x1 1 1 1)、单单单单位位位位产产产产量量量量消耗消耗消耗消耗(x x x x2 2 2 2)、原材料价格、原材料价格、
4、原材料价格、原材料价格(x x x x3 3 3 3)之间的关系可表示为之间的关系可表示为之间的关系可表示为之间的关系可表示为 y y y y=x x x x1 1 1 1 x x x x2 2 2 2 x x x x3 3 3 3 函数关系的例子函数关系的例子函数关系的特点函数关系的特点l当变量当变量x x取某个数值时,变量取某个数值时,变量y y 依确定的对应关系取相应的值依确定的对应关系取相应的值l表现形式:表现形式:y=f(x)y=f(x)l各观测点落在一条线上各观测点落在一条线上 x xy y 相关关系的例子相关关系的例子 父亲身高父亲身高父亲身高父亲身高(y y y y)与子女身高
5、与子女身高与子女身高与子女身高(x x x x)之间的关系之间的关系之间的关系之间的关系 收入水平收入水平收入水平收入水平(y y y y)与受教育程度与受教育程度与受教育程度与受教育程度(x x x x)之间的关系之间的关系之间的关系之间的关系 商品的消费量商品的消费量商品的消费量商品的消费量(y y y y)与居民收入与居民收入与居民收入与居民收入(x x x x)之间的关系之间的关系之间的关系之间的关系 商品销售额商品销售额商品销售额商品销售额(y y y y)与广告费支出与广告费支出与广告费支出与广告费支出(x x x x)之间的关系之间的关系之间的关系之间的关系 粮食亩产量粮食亩产量
6、粮食亩产量粮食亩产量(y y y y)与施肥量与施肥量与施肥量与施肥量(x x x x1 1 1 1)、降雨量、降雨量、降雨量、降雨量(x x x x2 2 2 2)、温度温度温度温度(x x x x3 3 3 3)之间的关系之间的关系之间的关系之间的关系相关关系的特点相关关系的特点l当变量当变量x x取某个值时,取某个值时,变量变量y y 的取值可能有几个的取值可能有几个l表现形式:表现形式:y=f(x)+y=f(x)+l各观测点在一条线的周围各观测点在一条线的周围 x xy y相关关系相关关系的种类的种类按变量个数按变量个数按表现形式按表现形式按密切程度按密切程度单单相相关关复复相相关关线
7、线性性相相关关非非线线性性相相关关完完全全相相关关不不完完全全相相关关不不相相关关相关关系的分类相关关系的分类 线性相关线性相关:按其变化方向可分为正相关与负相关按其变化方向可分为正相关与负相关 相关分析的概念:相关分析的概念:是研究两个或两个以上的变量是研究两个或两个以上的变量之间相关关系的形态和程度的一种统计方法。之间相关关系的形态和程度的一种统计方法。回归分析的概念回归分析的概念:是寻找具有相关关系变量间的是寻找具有相关关系变量间的数学模型数学模型回归方程,并进行统计推断和控制回归方程,并进行统计推断和控制的一种统计方法。的一种统计方法。相关分析和回归分析的内容与方法相关分析和回归分析的
8、内容与方法 相关分析的主要内容与方法相关分析的主要内容与方法l判断变量之间是否存在相关关系(定性分析法)判断变量之间是否存在相关关系(定性分析法)l分析变量间相关关系的形态特征(制作散点图)分析变量间相关关系的形态特征(制作散点图)l分析变量间相关关系的密切程度(计算相关系数)分析变量间相关关系的密切程度(计算相关系数)l对总体相关关系进行显著性检验(假设检验法)对总体相关关系进行显著性检验(假设检验法)回归分析的主要内容和方法回归分析的主要内容和方法l选择回归模型(根据相关关系的形态)选择回归模型(根据相关关系的形态)l进行参数估计(利用最小二乘法的原理)进行参数估计(利用最小二乘法的原理)
9、l进行拟合优度检验(利用判定系数等指标)进行拟合优度检验(利用判定系数等指标)l进行显著性检验进行显著性检验(利用假设检验的方法)(利用假设检验的方法)l进行预测和控制(利用回归方程进行)进行预测和控制(利用回归方程进行)联系:联系:它们具有共同的研究对象它们具有共同的研究对象 它们需要相互补充它们需要相互补充 相关分析是回归分析的前提相关分析是回归分析的前提 回归分析是相关分析的拓展回归分析是相关分析的拓展 相关分析和回归分析的联系与区别相关分析和回归分析的联系与区别区别:区别:变量的地位不同变量的地位不同 变量的性质不同变量的性质不同 研究的目的不同研究的目的不同 研究的方法不同研究的方法
10、不同 所起的作用不同所起的作用不同返回返回二、简单线性相关关系二、简单线性相关关系 定性分析定性分析 相关图分析相关图分析 相关系数分析相关系数分析 相关分析相关分析的方法的方法定性分析定性分析相关系数分析相关系数分析相关图分析相关图分析计算计算相关相关系数系数绘制绘制相关相关图图进行进行定性定性分析分析相关相关系数系数检验检验简单线性相关分析的基本程序简单线性相关分析的基本程序 定性分析定性分析 l 是指对事物的质的规定性的认识和分析是指对事物的质的规定性的认识和分析l 要借助相关的社会经济理论、专业知识、要借助相关的社会经济理论、专业知识、实践经验和判断能力实践经验和判断能力l 如果定性分
11、析判断现象之间没有相关关系,如果定性分析判断现象之间没有相关关系,就不需要进行定量的描述和测度了就不需要进行定量的描述和测度了 美国印第安纳州的地区教会想要筹款兴建新教堂,提出美国印第安纳州的地区教会想要筹款兴建新教堂,提出教堂能洁净人们的心灵,减少犯罪,降低监狱服刑人数的口教堂能洁净人们的心灵,减少犯罪,降低监狱服刑人数的口号。为了增进民众参与的热诚和信心,教会的神父收集了近号。为了增进民众参与的热诚和信心,教会的神父收集了近1515年的教堂数与在监狱服刑的人数进行统计分析。结果却令年的教堂数与在监狱服刑的人数进行统计分析。结果却令教会大吃一惊。最近教会大吃一惊。最近1515年教堂数与监狱服
12、刑人数呈显著的正年教堂数与监狱服刑人数呈显著的正相关。那么是否可以由此得出,教堂建得越多,就可能带来相关。那么是否可以由此得出,教堂建得越多,就可能带来更多的犯罪呢?经过统计学家和教会神父深入讨论,发现监更多的犯罪呢?经过统计学家和教会神父深入讨论,发现监狱服刑人数的增加和教堂数的增加都与人口的增加有关。教狱服刑人数的增加和教堂数的增加都与人口的增加有关。教堂数的增加并非监狱服刑人数增加的原因。至此,教会人士堂数的增加并非监狱服刑人数增加的原因。至此,教会人士总算松了一口气。总算松了一口气。案例:教堂数与监狱服刑人数同步增长案例:教堂数与监狱服刑人数同步增长 不相关不相关不相关不相关不相关不相
13、关 不完全线性不完全线性不完全线性不完全线性不完全线性不完全线性负相关负相关负相关负相关负相关负相关 不完全线性不完全线性不完全线性不完全线性不完全线性不完全线性正相关正相关正相关正相关正相关正相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全线性负相关完全线性负相关完全线性负相关完全线性负相关完全线性负相关完全线性负相关完全线性正相关完全线性正相关完全线性正相关完全线性正相关完全线性正相关完全线性正相关 相关图分析相关图分析 l相关系数相关系数是对变量之间相关关系密切程度的度量是对变量之间相关关系密切程度的度量l对两个变量之间线性相关程度的度量对两个变量之间线性相关程度
14、的度量 称为称为简单相关系数简单相关系数l若相关系数是根据总体全部数据计算的,若相关系数是根据总体全部数据计算的,则称为则称为总体相关系数,记为总体相关系数,记为 l若相关系数是根据样本数据计算的,若相关系数是根据样本数据计算的,则称为则称为样本相关系数,记为样本相关系数,记为 r r 相关系数分析相关系数分析 样本相关系数的计算公式样本相关系数的计算公式ExcelExcel在相关系数计算中的应用在相关系数计算中的应用方法一:利用统计函数中的方法一:利用统计函数中的“CORRELCORREL”函数计算;函数计算;方法二:利用统计函数中的方法二:利用统计函数中的“PEARSONPEARSON”函
15、数计算;函数计算;方法三:利用分析工具库中的方法三:利用分析工具库中的“相关系数相关系数”工具计算。工具计算。取值取值意义意义线性正相关关系线性正相关关系线性负相关关系线性负相关关系完全线性正相关关系完全线性正相关关系完全线性负相关关系完全线性负相关关系没有线性相关关系没有线性相关关系线性相关程度越高线性相关程度越高线性相关程度越低线性相关程度越低相关系数的性质相关系数的性质相关系数的性质相关系数的性质-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增
16、加负相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加取值范围取值范围相关程度相关程度高度相关高度相关中度相关中度相关低度相关低度相关弱度相关弱度相关相关程度的划分相关程度的划分 1 1、提出假设:、提出假设:H H0 0:;H H1 1:0 02 2 2 2、构造检验统计量:构造检验统计量:构造检验统计量:构造检验统计量:3 3、确定临界值:确定临界值:确定临界值:确定临界值:t tTINV(TINV(,n-2),n-2)4 4 4 4、进行决策:进行决策:进行决策:进行决策:若若若若 t t t t t t t t,拒绝,拒绝,拒绝,拒绝H H H H0 0 0 0 若
17、若若若 t t t t =79.28537694=79.28537694=79.28537694t t t t(13-2)=2.20098559(13-2)=2.20098559(13-2)=2.20098559(13-2)=2.20098559,拒绝,拒绝,拒绝,拒绝H H H H0 0 0 0即我国城镇居民人均年消费性支出与人均年可支配性收入即我国城镇居民人均年消费性支出与人均年可支配性收入即我国城镇居民人均年消费性支出与人均年可支配性收入即我国城镇居民人均年消费性支出与人均年可支配性收入之间存在着显著的线性正相关关系之间存在着显著的线性正相关关系之间存在着显著的线性正相关关系之间存在着显
18、著的线性正相关关系 返回返回三、一元线性回归分析三、一元线性回归分析 一元线性回归模型的建立一元线性回归模型的建立 一元线性回归模型的参数估计一元线性回归模型的参数估计 一元线性回归模型的检验一元线性回归模型的检验 利用一元线性回归方程进行预测利用一元线性回归方程进行预测 拟合拟合优度优度检验检验估计估计模型模型参数参数建立建立回归回归模型模型显著显著性检性检验验一元线性回归分析的程序一元线性回归分析的程序 一元线性回归模型:一元线性回归模型:n 0 0 和和 1 1 称为模型的参数称为模型的参数n 0+1x x 称为模型的线性部分称为模型的线性部分它反映了由于它反映了由于 x x 的变化而引
19、起的的变化而引起的 y y 的变化的变化 一元线性回归模型的建立一元线性回归模型的建立 n称为模型的称为模型的误差项误差项它是随机变量它是随机变量它反映了除它反映了除x x 和和y y 之间的线性关系之外的随机因素之间的线性关系之外的随机因素 对对 y y 的影响的影响它是不能由它是不能由x x和和y y 之间的线性关系所解释的变异之间的线性关系所解释的变异在回归分析中通常假定误差项在回归分析中通常假定误差项服从正态分布,服从正态分布,即即 N N(0,(0,2 2)一元线性回归模型:一元线性回归模型:一元线性回归方程:一元线性回归方程:直线回归方程直线回归方程n 0 0是回归直线在是回归直线
20、在 y y 轴上的截距,称为回归常数轴上的截距,称为回归常数 它表示当它表示当 x x=0=0 时时 ,y y 的期望值的期望值n 1 1是回归直线的斜率,称为回归系数是回归直线的斜率,称为回归系数它表示当它表示当x x 每变动一个单位时,每变动一个单位时,y y 的平均变动值的平均变动值估计回归方程:估计回归方程:n n 是样本回归直线在是样本回归直线在是样本回归直线在是样本回归直线在 y y y y 轴上的截距,也称为回归常数轴上的截距,也称为回归常数轴上的截距,也称为回归常数轴上的截距,也称为回归常数 它表示它表示它表示它表示x=x=0 0时,时,时,时,y y y y的期望值的估计值的
21、期望值的估计值的期望值的估计值的期望值的估计值 n n 是样本回归直线的斜率,也称为回归系数是样本回归直线的斜率,也称为回归系数是样本回归直线的斜率,也称为回归系数是样本回归直线的斜率,也称为回归系数 表示表示表示表示x x x x 每变动一个单位时,每变动一个单位时,每变动一个单位时,每变动一个单位时,y y y y 的平均变动值的估计值的平均变动值的估计值的平均变动值的估计值的平均变动值的估计值样本回归直线样本回归直线 最小二乘法最小二乘法 使因变量的观察值与估计值之间的离差平方和最小使因变量的观察值与估计值之间的离差平方和最小 一元线性回归模型的参数估计一元线性回归模型的参数估计最小二乘
22、法原理的图示最小二乘法原理的图示x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i样本回归方程:样本回归方程:回归参数计算公式:回归参数计算公式:经过平均值点:经过平均值点:ExcelExcel在回归方程参数计算中的应用在回归方程参数计算中的应用v方法一:利用分析工具库中的方法一:利用分析工具库中的“回归回归”工具工具得到截距和斜得到截距和斜率。率。v方法二:利用统计函数中的方法二:利用统计函数中的“INTERCEPTINTERCEPT”和和“SLOPESLOPE”分分别计
23、算出截距和斜率的值。别计算出截距和斜率的值。v方法三:利用方法三:利用ExcelExcel的统计函数中的的统计函数中的“LINESTLINEST”同时得到同时得到截距和斜率的值。截距和斜率的值。v方法四:在方法四:在ExcelExcel中通过为散点图中通过为散点图添加趋势线添加趋势线的方法得到的方法得到截距和斜率的值。截距和斜率的值。一元线性回归模型的检验一元线性回归模型的检验 回归直线的拟合优度检验回归直线的拟合优度检验回归关系的显著性检验回归关系的显著性检验回归系数的显著性检验回归系数的显著性检验回归直线的拟合优度检验回归直线的拟合优度检验拟合优度:拟合优度:是指样本观测值聚集在样本回归直
24、线是指样本观测值聚集在样本回归直线 周围的紧密程度周围的紧密程度测度指标:测度指标:判定系数、相关系数、估计标准差判定系数、相关系数、估计标准差指标公式:指标公式:(判定系数)(判定系数)(相关系数)(相关系数)(估计标准差)(估计标准差)总离差分解图总离差分解图x xy yy y 总离差平方和的分解总离差平方和的分解SST=SSR+SSE总离差平方和总离差平方和总离差平方和总离差平方和(SSTSST)回归平方和回归平方和回归平方和回归平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)三个平方和的意义三个平方和的意义总离差平方和总离差平方和(SSTSST)反映因变量
25、的所有观察值与其均值的总离差反映因变量的所有观察值与其均值的总离差回归平方和回归平方和(SSRSSR)反映自变量反映自变量 x x 的变化对因变量的变化对因变量 y y 取值变化的影响,取值变化的影响,或者说,是由于或者说,是由于 x x 与与 y y 之间的线性关系引起的之间的线性关系引起的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和残差平方和残差平方和(SSESSE)反映除反映除 x x 以外的其他因素对以外的其他因素对 y y 取值的影响,取值的影响,也称为不可解释的平方和。也称为不可解释的平方和。判定系数判定系数R R2 2的意义的意义 反映在因变量反映在
26、因变量反映在因变量反映在因变量y y y y的总变差中有多少的总变差中有多少的总变差中有多少的总变差中有多少 是由于自变量是由于自变量是由于自变量是由于自变量x x x x的变化引起的的变化引起的的变化引起的的变化引起的 反映在因变量反映在因变量反映在因变量反映在因变量y y y y的总变差中有多少的总变差中有多少的总变差中有多少的总变差中有多少 可以用自变量和因变量的线性关系解释的可以用自变量和因变量的线性关系解释的可以用自变量和因变量的线性关系解释的可以用自变量和因变量的线性关系解释的 取值范围在取值范围在取值范围在取值范围在 0,1 0,1 0,1 0,1 之间之间之间之间 R R R
27、R2 2 2 2 1 1 1 1,说明回归方程拟合的越好,说明回归方程拟合的越好,说明回归方程拟合的越好,说明回归方程拟合的越好 R R R R2 2 2 2 0 0 0 0,说明回归方程拟合的越差,说明回归方程拟合的越差,说明回归方程拟合的越差,说明回归方程拟合的越差ExcelExcel在回归直线的拟合优度检验中的应用在回归直线的拟合优度检验中的应用v方法一:利用分析工具库中的方法一:利用分析工具库中的“回归回归”工具得到判定系数。工具得到判定系数。注意:回归分析结果的注意:回归分析结果的“回归统计回归统计”表表中的中的“R SquareR Square”表表示判定系数示判定系数 。v方法二
28、:利用统计函数中的方法二:利用统计函数中的“RSQRSQ”函数计算出判定系数。函数计算出判定系数。v方法三:通过为散点图添加趋势线的方法得到判定系数。方法三:通过为散点图添加趋势线的方法得到判定系数。注意:在注意:在“添加趋势线添加趋势线”对话框的对话框的“选项选项”卡中勾选卡中勾选“显示显示R R平方值平方值”即可。即可。回归关系的显著性检验回归关系的显著性检验l它是检验自变量和因变量之间的线性关系是否显著它是检验自变量和因变量之间的线性关系是否显著l它是对所有参数感兴趣的显著性检验它是对所有参数感兴趣的显著性检验l假设:假设:H0:0=1=0 H1:010l检验统计量:检验统计量:l检验步
29、骤:教材检验步骤:教材P142ExcelExcel在回归关系的显著性检验中的应用在回归关系的显著性检验中的应用 方法:方法:将回归分析结果的将回归分析结果的“方差分析方差分析”表表中的中的 与给定的显著性水平与给定的显著性水平进行比较进行比较 当当 时,时,拒绝原假设,接受备择拒绝原假设,接受备择假设;假设;当当 时,时,接受原假设。接受原假设。回归系数的显著性检验回归系数的显著性检验l它是检验自变量和因变量之间的线性关系是否显著它是检验自变量和因变量之间的线性关系是否显著l它是对个别参数感兴趣的显著性检验它是对个别参数感兴趣的显著性检验l假设:假设:H0:1=0 H1:10l检验统计量:检验
30、统计量:l检验步骤:教材检验步骤:教材P142ExcelExcel在回归系数的显著性检验中的应用在回归系数的显著性检验中的应用 方法:方法:将回归分析结果的将回归分析结果的“参数估计参数估计”表中的自变量的表中的自变量的 与给定的显著性水平与给定的显著性水平进行比较进行比较 当当 时,拒绝原假设,接受备时,拒绝原假设,接受备择假设;择假设;当当 时,接受原假设。时,接受原假设。利用一元线性回归方程进行预测利用一元线性回归方程进行预测 点预测:点预测:区间预测:区间预测:ExcelExcel在回归预测中的应用在回归预测中的应用v方法一:利用方法一:利用ExcelExcel的统计函数中的的统计函数
31、中的“FORECASTFORECAST”进行;进行;v方法二:利用方法二:利用ExcelExcel的统计函数中的的统计函数中的“TRENDTREND”进行。进行。预测区间与回归方程的关系预测区间与回归方程的关系x0 0yx x预测上限预测上限预测下限预测下限我国城镇居民人均年消费支出和可支配收入情况表(单位:千元)我国城镇居民人均年消费支出和可支配收入情况表(单位:千元)年年 份份人均可支配收入人均可支配收入X X人均消费性支出人均消费性支出Y Y199219922.027 2.027 1.672 1.672 199319932.577 2.577 2.111 2.111 199419943.
32、496 3.496 2.851 2.851 199519954.283 4.283 3.538 3.538 199619964.839 4.839 3.919 3.919 199719975.160 5.160 4.186 4.186 199819985.425 5.425 4.332 4.332 199919995.854 5.854 4.616 4.616 200020006.280 6.280 4.998 4.998 200120016.860 6.860 5.309 5.309 200220027.703 7.703 6.030 6.030 200320038.472 8.472 6.511 6.511 200420049.442 9.442 7.182 7.182 回归分析案例回归分析案例“回归回归”工具的输出结工具的输出结果果返回返回End of Chapter 8