《计量经济学第三节 多重共线性优秀课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学第三节 多重共线性优秀课件.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学第三节 多重共线性第1页,本讲稿共33页假定六:解释变量之间不是完全线性相关的。假定六:解释变量之间不是完全线性相关的。目的与要求目的与要求:1.多重共线性的概念?多重共线性的概念?2.多重共线性产生的主要原因是什么?多重共线性产生的主要原因是什么?3.多重共线性会导致什么后果?多重共线性会导致什么后果?4.多重共线性的检验方法多重共线性的检验方法 5.多重共线性的解决方法多重共线性的解决方法第2页,本讲稿共33页一、多重共线性的概念 对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。其基本假设之一是解释变量是互相独立的
2、。如果某两个或多个解释变量之间出现了完全的线性相关性或接近线性相关,则称该模型出现了多重共线性多重共线性。第3页,本讲稿共33页二、多重共线性产生的主要原因二、多重共线性产生的主要原因q经济变量的内在联系,这是产生多重共线性的根本原因.如:生产函数中资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第4页,本讲稿共33页n 经济变量变化趋势的共线性经济变量变化趋势的共线性 如如:经济繁荣时期,各基本经济变量(收入、经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。同时趋于下降。第5页,本讲稿
3、共33页w 滞后变量的引入 在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。在多元线性回归模型中我们关心的不是多重共线的有无,而是多重共线性的程度。当多重共线性的程度过高时,会给最小二乘估计带来严重的后果第6页,本讲稿共33页三、多重共线性的影响第7页,本讲稿共33页2.难以区分每个解释变量的单独影响3.回归模型缺乏稳定性:OLS估计量不稳定,对样本数据的微小变化非常敏感,也就是说,他们趋于不稳定。第8页,本讲稿共33页四、多重共线性的测定1.1.散点图法或相关系数法散点图法或相关系数法2.2.自变量之间的
4、复决定系数自变量之间的复决定系数多个解释变量多个解释变量X X1 1,X X2 2,XXk k 分别进行回归:分别进行回归:X X1 1=f=f(X X2 2,X X3 3,XXk k)X X2 2=f=f(X X1 1,X X3 3,XXk k).X Xk k=f=f(X X1 1,X X2 2,X X k-1k-1)如果如果,其中某些方程显著成立其中某些方程显著成立,则表明存在多重共线性则表明存在多重共线性.所对应的所对应的解释变量可以近似的用其他解释变量线性表示解释变量可以近似的用其他解释变量线性表示.第9页,本讲稿共33页3.3.考察参数估计值的符号,如果不符合经济理论或考察参数估计值
5、的符号,如果不符合经济理论或实际情况,说明模型中可能存在多重共线性。实际情况,说明模型中可能存在多重共线性。4.4.若多元线性回归的拟合优度若多元线性回归的拟合优度R R2 2和和F F值较大,但回归系数值较大,但回归系数在统计上大多不显著,即在统计上大多不显著,即t t检验值过小,说明模型存在检验值过小,说明模型存在多重共线性。多重共线性。(经典判断法)(经典判断法)第10页,本讲稿共33页5.5.利用不包含某一解释变量利用不包含某一解释变量X Xj j的样本决定系数进行检验的样本决定系数进行检验 对原模型对原模型 Y=f Y=f(X X1 1,X X2 2,X Xk k)估计,计算)估计,
6、计算R R2 2 逐次减少一个解释变量,进行估计计算样本决定系数逐次减少一个解释变量,进行估计计算样本决定系数 Y=f Y=f(X X2 2,X X3 3,X Xk k)R R1 12 2 Y=f Y=f(X X1 1,X X3 3,X Xk k)R R2 22 2 Y=f Y=f(X X1 1,X X2 2,X X k-1k-1)R Rk k2 2 从中选一个最接近从中选一个最接近 R R2 2 的,不妨设为的,不妨设为R Ri i2 2,则说明,则说明X Xi i可能引可能引起多重共线性。起多重共线性。第11页,本讲稿共33页6.方差膨胀因子检验 一般当VIF10时,认为模型存在较严重的多
7、重共线性第12页,本讲稿共33页五、消除多重共线性的方法五、消除多重共线性的方法第13页,本讲稿共33页 引起多重共线性原因是模型中存在高度相关的解释变量,所以消除多重共线性的根本方法只能是从模型中剔除这些变量.但直接剔除可能会产生新的问题.(1)模型的经济意义不合理.(2)如果剔除的是重要解释变量.则这些变量的影响将反映在随机误差项中,使模型产生异方差性或自相关性(3)若剔除不当还会产生设定误差的问题,造成参数估计严重有偏.第14页,本讲稿共33页(一一)直接剔除次要或可替代的变量直接剔除次要或可替代的变量 次要变量可以通过被解释变量与解释变量的相关次要变量可以通过被解释变量与解释变量的相关
8、系数检验、相关图分析等统计分析加以鉴别系数检验、相关图分析等统计分析加以鉴别.利用辅利用辅助回归模型检验多重共线性时助回归模型检验多重共线性时,又可以提供解释变量又可以提供解释变量之间相互替代性的信息之间相互替代性的信息.第15页,本讲稿共33页(二)间接剔除重要的解释变量1.利用附加信息第16页,本讲稿共33页第17页,本讲稿共33页第18页,本讲稿共33页第19页,本讲稿共33页 2 2、改变解释变量的形式、改变解释变量的形式 如果我们建立模型的目的是预测而不需要区分这些相关的解释如果我们建立模型的目的是预测而不需要区分这些相关的解释变量单独对因变量的影响时,我们可以根据需要将模型加以变形
9、变量单独对因变量的影响时,我们可以根据需要将模型加以变形 (1).(1).采用差分法,用增量作为解释变量;采用差分法,用增量作为解释变量;第20页,本讲稿共33页(2).进行变换,采用相对量作为解释变量例如,某产品的销售量Y 取决于其出厂价格X1、市场价格X2和市场总供应量X3。设定模型为第21页,本讲稿共33页由于X1、X2、X3高度相关,我们可以用X1/X2代替X1、X2对y的影响。模型变为:第22页,本讲稿共33页 (三三)逐步回归方法逐步回归方法v利用相关系数从所有解释变量中选取相关性最强的变量建立利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型一元回归模型v在一元回归
10、模型中引入第二个变量在一元回归模型中引入第二个变量,选择要求选择要求:模型模型中每个解释变量影响显著中每个解释变量影响显著,参数符号正确参数符号正确,校正的判定校正的判定系数值系数值 有所提高有所提高.v在选取的二元回归模型中以同样方式引入第三个变量在选取的二元回归模型中以同样方式引入第三个变量第23页,本讲稿共33页(四).增加样本观测值。如果多重共线性只是样本的特征。而在总体中并不存在这一共线性,则通过增加样本容量或者改变样本则可以削弱甚至消除多重共线性。第24页,本讲稿共33页七、案例:中国粮食生产函数七、案例:中国粮食生产函数第25页,本讲稿共33页 根根据据理理论论和和经经验验分分析
11、析,影影响响粮粮食食生生产产(Y)的的主主要要因素有:因素有:农农业业化化肥肥施施用用量量(X1);粮粮食食播播种种面面积积(X2);成成灾灾面面积积(X3);农业机械总动力农业机械总动力(X4);农业劳动力;农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮食生产函数:已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+4 X5+第26页,本讲稿共33页.中国粮食生产与相关投入资料中国粮食生产与相关投入资料年份粮食产量Y(万吨)农业化肥施用量1X(万公斤)粮食播种面积2X(千公顷)受灾面积3X(公顷)农业机械总动力4X(万千瓦)农业劳动力5
12、X(万人)1983387281659.811404716209.31802231645.11984407311739.811288415264.01949731685.01985379111775.810884522705.32091330351.51986391511930.611093323656.02295030467.01987402081999.311126820392.72483630870.01988394082141.511012323944.72657531455.71989407552357.111220524448.72806732440.51990446242590.3
13、11346617819.32870833330.41991435292806.111231427814.02938934186.31992442642930.211056025894.73030834037.01993456493151.911050923133.03181733258.21994445103317.910954431383.03380232690.31995466623593.711006022267.03611832334.51996504543827.911254821233.03854732260.41997494173980.711291230309.04201632
14、434.91998512304083.711378725181.04520832626.41999508394124.311316126731.04899632911.82000462184146.410846334374.05257432797.5第27页,本讲稿共33页Dependent Variable:YMethod:Least SquaresSample:1983 2000Included observations:18VariableCoefficientStd.Errort-Statistic Prob.X16.212562 0.740881 8.385373 0.0000X20
15、.421380 0.126925 3.319919 0.0061X3-0.166260 0.059229-2.807065 0.0158X4-0.0977700.067647-1.4452990.1740X5-0.0284250.202357-0.1404710.8906C-12815.75 14078.90-0.910280 0.3806R-squared 0.982798 Mean dependent var44127.11Adjusted R-squared 0.975630 S.D.dependent var4409.100S.E.of regression 688.2984 Akai
16、ke info criterion16.16752Sum squared resid 5685056.Schwarz criterion16.46431Log likelihood -139.5077 F-statistic137.1164Durbin-Watson stat 1.810512 Prob(F-statistic)0.000000第28页,本讲稿共33页1.用OLS法估计上述模型:R2接近于接近于1;给定给定=5%,得,得F临界值临界值 F0.05(5,12)=3.11 F=137.1 15.19,故认上述粮食生产的总体线性关,故认上述粮食生产的总体线性关系显著成立。但系显著成立
17、。但X4、X5 的参数未通过的参数未通过t检验,且符号不正确,检验,且符号不正确,故故解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)第29页,本讲稿共33页2.检验简单相关系数w发现:X1与与X4间存在高度相关性。间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:第30页,本讲稿共33页3.找出最简单的回归形式w可见,应选第一个式子为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36第31页,本讲稿共33页4.逐步回归 将将其其他他解解释释变变量量分分别别导导入入上上述述初初始始回回归归模模型型,寻寻找找最最佳佳回归方程。回归方程。第32页,本讲稿共33页 回归方程以回归方程以Y=f(X1,X2,X3)为最优为最优:5.5.结论结论第33页,本讲稿共33页