《多重共线性 (3).ppt》由会员分享,可在线阅读,更多相关《多重共线性 (3).ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多重共线性现在学习的是第1页,共42页一、多重共线性的概念一、多重共线性的概念二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性三、多重共线性的后果三、多重共线性的后果四、多重共线性的检验四、多重共线性的检验五、克服多重共线性的方法五、克服多重共线性的方法六、案例六、案例*七、分部回归与多重共线性七、分部回归与多重共线性第第6讲讲 多重共线性多重共线性现在学习的是第2页,共42页 一、多重共线性的概念一、多重共线性的概念 对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关如果某两个或多个解释
2、变量之间出现了相关性,则称为性,则称为多重共线性多重共线性(Multicollinearity)。现在学习的是第3页,共42页 如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中:ci不全为0,则则称称为为解解释释变变量量间间存存在在完完全全共共线线性性(perfect multicollinearity)。如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为 近近似似共共线线性性(approximate multicollinearity)或 交交 互互 相相 关关(intercorrelated)。现在学习的
3、是第4页,共42页 在矩阵表示的线性回归模型 Y=X+中,完全共线性完全共线性指:指:秩秩(X)k+1,即中,至少有一列向量可由其他列向量(不包括第一列)线性表出。如:X2=X1,则X2对Y的作用可由X1代替。现在学习的是第5页,共42页 注意:注意:完全共线性的情况并不多见,一般出现完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线的是在一定程度上的共线性,即近似共线性。性。现在学习的是第6页,共42页 二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三个方面:(1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时
4、间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。现在学习的是第7页,共42页 (2 2)滞后变量的引入)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。现在学习的是第8页,共42页 (3)样本资料的限制样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验一般经验:时间序列数据时间序列数据样
5、本:简单线性模型,往往存在多重共线性。截面数据截面数据样本:问题不那么严重,但多重共线性仍然是存在的。现在学习的是第9页,共42页 二、多重共线性的后果二、多重共线性的后果 1 1、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全共线性完全共线性,则,则(XX)-1不存在,无法得到参数不存在,无法得到参数的估计量。的估计量。的OLS估计量为:现在学习的是第10页,共42页例:例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:现在学习的是第11页,共42页 2 2、近似共线性下、近似共线性下OLS估计量非有效
6、估计量非有效 近似共线性下,可以得到OLS参数估计量,但参数估计量方差方差的表达式为 由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。参数估计量非有效。现在学习的是第12页,共42页仍以二元线性模型 y=1x1+2x2+为例:恰为X1与X2的线性相关系数的平方r2由于 r2 1,故 1/(1-r2)1现在学习的是第13页,共42页多重共线性使参数估计值的方差增大重共线性使参数估计值的方差增大,1/(1-r2)为方方差膨胀因子差膨胀因子(Variance Inflation Factor,VIF)当完全不共线完全不共线时,r2=0 当近似共线近似
7、共线时,0 r2 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解解释变量间可能存在多重共线性释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)现在学习的是第33页,共42页 2 2、检验简单相关系数、检验简单相关系数发现:发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:现在学习的是第34页,共42页 3 3、找出最简单的回归形式、找出最简单的回归形式可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X2
8、,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36现在学习的是第35页,共42页 4 4、逐步回归、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。现在学习的是第36页,共42页 回归方程以回归方程以Y=f(Y=f(X1,X2,X3)为最优:为最优:5 5、结论、结论现在学习的是第37页,共42页*七、
9、分部回归与多重共线性七、分部回归与多重共线性现在学习的是第38页,共42页1 1、分部回归法、分部回归法(Partitioned Regression)(Partitioned Regression)对于模型在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组:将解释变量分为两部分,对应的参数也分为两部分:现在学习的是第39页,共42页如果存在则有同样有这就是仅以这就是仅以X X2 2作为解释变量时的参数估计量作为解释变量时的参数估计量。这就是仅以这就是仅以X X1 1作为解释变量时的参数估计量作为解释变量时的参数估计量现在学习的是第40页,共42页2 2、由分部回归法导出
10、、由分部回归法导出如果一个多元线性模型的解释变量之间完全正交,可以将如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、该多元模型分为多个一元模型、二元模型、进行估计,进行估计,参数估计结果不变;参数估计结果不变;实际模型由于存在或轻或重的共线性,如果将它们分实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、为多个一元模型、二元模型、进行估计,参数估计进行估计,参数估计结果将发生变化;结果将发生变化;现在学习的是第41页,共42页严格地说,实际模型由于总存在一定程严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的真正反映对应变量与被解释变量之间的结构关系。结构关系。当模型存在共线性,将某个共线性变量去掉,剩当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含余变量的参数估计结果将发生变化,而且经济含义有发生变化;义有发生变化;现在学习的是第42页,共42页