《第四章违背经典假设的情况多重共线性精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章违背经典假设的情况多重共线性精选文档.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章违背经典假设第四章违背经典假设的情况多重共线性的情况多重共线性本讲稿第一页,共三十七页1、多重共线性的概念2、实际经济问题中的多重共线性3、多重共线性的后果4、多重共线性的检验5、克服多重共线性的方法6、案例 二、二、多重共线性多重共线性本讲稿第二页,共三十七页 1 1、多重共线性的概念、多重共线性的概念 对于模型 其基本假设之一是解释变量之间是互相独立的。如果某两个或多个解释变量之间出现了相关性,如果某两个或多个解释变量之间出现了相关性,则称为则称为多重共线性多重共线性(Multicollinearity)。本讲稿第三页,共三十七页 如果存在 其中:ci不全为0,则称为解释变量间存在完
2、全共线性(Perfect multicollinearity)。Company Logo 如果存在 其中ci不全为0,vi为随机误差项,则称为 近近似似共共线线性性(approximate multicollinearity)或交交 互互 相相 关关(intercorrelated)。本讲稿第四页,共三十七页 在矩阵表示的线性回归模型在矩阵表示的线性回归模型 中,中,完全共线性指:秩(X)k k+1 1,即,即中,至少有一列向量可由其他列向量(不包括第一列)线性表出。如:X2=X1,则X2对Y的作用可由X1代替。本讲稿第五页,共三十七页 注意:注意:完全共线性的情况并不多见,一般完全共线性的情
3、况并不多见,一般出现的是在一定程度上的共线性,即近出现的是在一定程度上的共线性,即近似共线性。似共线性。本讲稿第六页,共三十七页2 2、实际经济问题中的多重共线性、实际经济问题中的多重共线性 一一般般地地,产产生生多多重重共共线线性性的的主主要要原原因因有有以以下下三三个个方方面:面:(1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。又同时趋于下降。横截面数据:生产函数中,资本投入与劳动横截面
4、数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,力投入往往出现高度相关情况,大企业二者都大,小企业都小。小企业都小。本讲稿第七页,共三十七页 (2 2)滞后变量的引入)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。量来反映真实的经济关系。例如例如,消费,消费=f(=f(当期收入当期收入,前期收入)前期收入)显然,两期收入间有较强的线性相关性显然,两期收入间有较强的线性相关性。本讲稿第八页,共三十七页 (3 3)样本资料的限制)样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,由于完
5、全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。特定样本可能存在某种程度的多重共线性。一般经验:一般经验:时间序列数据样本:简单线性模型,往往存在多重共时间序列数据样本:简单线性模型,往往存在多重共线性。线性。截面数据样本:问题不那么严重,但多重共线性仍然截面数据样本:问题不那么严重,但多重共线性仍然是存在的。是存在的。本讲稿第九页,共三十七页2、多重共线性的后果 1)1)、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全共线性完全共线性,则,则(XX)-1不存在,无法得到参数不存在,无法得到参数的估计量。的估计量。的OLS估计量为:
6、本讲稿第十页,共三十七页例:例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:本讲稿第十一页,共三十七页 2)2)、近似共线性下、近似共线性下OLSOLS估计量非有效估计量非有效 近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为 由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。参数估计量非有效。本讲稿第十二页,共三十七页仍以二元线性模型 y=1x1+2x2+为例:恰为X1与X2的线性相关系数的平方r2由于 r2 1,故 1/(1-r2)1本讲稿第十三页,共三十七页多重共
7、线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor,VIF)当完全不共线完全不共线时,r2=0 当近似共线近似共线时,0 r2 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)本讲稿第三十三页,共三十七页 2)、检验简单相关系数发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:本讲稿第三十四页,共三十七页 3)、找出最简单的回归形式可见,应选
8、第1个式子为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36本讲稿第三十五页,共三十七页4)、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。本讲稿第三十六页,共三十七页 回归方程以 为最优:5)、结论当模型存在共线性,将某个共线性变量去掉,剩余变量的参数当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;估计结果将发生变化,而且经济含义有发生变化;严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的结构关系。本讲稿第三十七页,共三十七页