《计量经济学-课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学-课件.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、多重共线性的概念一、多重共线性的概念一、多重共线性的概念一、多重共线性的概念一、多重共线性的概念一、多重共线性的概念二、多重共线性的后果二、多重共线性的后果二、多重共线性的后果二、多重共线性的后果二、多重共线性的后果二、多重共线性的后果三、多重共线性的检验三、多重共线性的检验三、多重共线性的检验三、多重共线性的检验三、多重共线性的检验三、多重共线性的检验四、克服多重共线性的方法四、克服多重共线性的方法四、克服多重共线性的方法四、克服多重共线性的方法四、克服多重共线性的方法四、克服多重共线性的方法五、案例五、案例五、案例五、案例五、案例五、案例Multi-Collinearity一、多重共线
2、性的概念一、多重共线性的概念1 1、多重共线性、多重共线性 对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n(2.8.1)i=1,2,n(2.8.1)其基本假设之一是解释变量是互相独立的解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,如果某两个或多个解释变量之间出现了相关性,则称为则称为多重共线性多重共线性。如果存在如果存在如果存在如果存在 c c c c1 1 1 1X X X X1i 1i 1i 1i+c+c+c+c2 2 2 2X X X X2i2i2i2i+c+c+c+ck k k kX X X Xki kiki ki=0 =0 =0 =0 i=1,
3、2,n (2.8.2)i=1,2,n (2.8.2)i=1,2,n (2.8.2)i=1,2,n (2.8.2)其其其其中中中中:c c c ci i i i不不不不全全全全为为为为0 0 0 0,即即即即某某某某一一一一个个个个解解解解释释释释变变变变量量量量可可可可以以以以用用用用其其其其它它它它解解解解释释释释变变变变量量量量的的的的线线线线性性性性组组组组合合合合表表表表示示示示,则则则则称称称称为为为为解解解解释释释释变变变变量量量量间间间间存存存存在在在在完完完完全共线性全共线性全共线性全共线性(此时利用最小二乘法推导出的正规方程没有唯一解此时利用最小二乘法推导出的正规方程没有唯一
4、解此时利用最小二乘法推导出的正规方程没有唯一解此时利用最小二乘法推导出的正规方程没有唯一解)。如果存在如果存在 c c1 1X X1i 1i+c+c2 2X X2i2i+c+ck kX Xki ki+v+vi i=0=0 i=1,2,n (2.8.3)i=1,2,n (2.8.3)其其中中c ci i不不全全为为0 0,vi为为随随机机误误差差项项,则则称称为为一一般般共共线线性性(近似共线性近似共线性)或交互相关或交互相关(intercorrelated)(intercorrelated)。完全共线性与一般共线性完全共线性与一般共线性|XX|=0 注意:注意:完全共线性的情况并不多见,一完全
5、共线性的情况并不多见,一般出现的是在一定程度上的共线性,般出现的是在一定程度上的共线性,即近似共线性即近似共线性。例如,例如,X X2 2=X X1 1,这时,这时X X1 1与与X X2 2的相的相关系数为关系数为1 1,解释变量,解释变量X X2 2对因变量的对因变量的作用完全可由作用完全可由X X1 1代替。代替。2 2、产生多重共线性的背景、产生多重共线性的背景 经济变量的共同变化趋势经济变量的共同变化趋势经济变量的共同变化趋势经济变量的共同变化趋势 时间序列样本:时间序列样本:时间序列样本:时间序列样本:经济经济经济经济繁荣时期繁荣时期繁荣时期繁荣时期,各基本,各基本,各基本,各基本
6、经济变量(收入、消费、投资、价格)都趋于经济变量(收入、消费、投资、价格)都趋于经济变量(收入、消费、投资、价格)都趋于经济变量(收入、消费、投资、价格)都趋于增长;增长;增长;增长;衰退时期衰退时期衰退时期衰退时期,又同时趋于下降。,又同时趋于下降。,又同时趋于下降。,又同时趋于下降。横截面数据:横截面数据:横截面数据:横截面数据:生产函数中生产函数中生产函数中生产函数中,资本投入与资本投入与资本投入与资本投入与劳动力投入往往出现高度相关情况,大企业二劳动力投入往往出现高度相关情况,大企业二劳动力投入往往出现高度相关情况,大企业二劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。者
7、都大,小企业都小。者都大,小企业都小。者都大,小企业都小。滞后变量的引入滞后变量的引入滞后变量的引入滞后变量的引入 在计量经济模型中,往往需要引入滞后经济在计量经济模型中,往往需要引入滞后经济在计量经济模型中,往往需要引入滞后经济在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。变量来反映真实的经济关系。变量来反映真实的经济关系。变量来反映真实的经济关系。例如,例如,例如,例如,消费消费消费消费=f(=f(=f(=f(当期收入当期收入当期收入当期收入,前期收入)前期收入)前期收入)前期收入)显然,两期收入间有较强的线性相关性显然,两期收入间有较强的线性相关性显然,两期收入间有较强
8、的线性相关性显然,两期收入间有较强的线性相关性。二、多重共线性的后果二、多重共线性的后果 1 1、完全共线性下参数估计量不存在(不确定)、完全共线性下参数估计量不存在(不确定)如果存在完全共线性,则如果存在完全共线性,则(X(XX)X)-1-1不存在,无法不存在,无法得到参数的估计量。得到参数的估计量。2 2 2 2、近似共线性下普通最小二乘法参数估计量非有效、近似共线性下普通最小二乘法参数估计量非有效、近似共线性下普通最小二乘法参数估计量非有效、近似共线性下普通最小二乘法参数估计量非有效 在在一一般般共共线线性性(或或称称近近似似共共线线性性)下下,虽虽然然可可以以得得到到OLSOLS法法参
9、参数数估估计计量量,但但是是由由参参数数估估计量方差的表达式为计量方差的表达式为 可见,由于此时|XX|0,引起(XX)-1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量非有效。3 3、参数估计量经济含义不合理、参数估计量经济含义不合理 如如如如果果果果模模模模型型型型中中中中两两两两个个个个解解解解释释释释变变变变量量量量具具具具有有有有线线线线性性性性相相相相关关关关性性性性,例例例例如如如如X X X X1 1 1 1和和和和X X X X2 2 2 2,那那那那么么么么它它它它们们们们中中中中的的的的一一一一个个个个变变变变量量量量可可可可以以以以由由由由另另另另一一一
10、一个变量表征。个变量表征。个变量表征。个变量表征。这这这这时时时时,X X X X1 1 1 1和和和和X X X X2 2 2 2前前前前的的的的参参参参数数数数并并并并不不不不反反反反映映映映各各各各自自自自与与与与被被被被解解解解释释释释变变变变量量量量之之之之间间间间的的的的结结结结构构构构关关关关系系系系,而而而而是是是是反反反反映映映映它它它它们们们们对对对对被被被被解解解解释释释释变量的共同影响(变量的共同影响(变量的共同影响(变量的共同影响(局部效应局部效应局部效应局部效应)。)。)。)。所所所所以以以以各各各各自自自自的的的的参参参参数数数数已已已已经经经经失失失失去去去去了
11、了了了应应应应有有有有的的的的经经经经济济济济含含含含义义义义,于于于于是是是是经经经经常常常常表表表表现现现现出出出出似似似似乎乎乎乎反反反反常常常常的的的的现现现现象象象象,例例例例如如如如本本本本来来来来应应应应该该该该是正的,结果恰是负的。是正的,结果恰是负的。是正的,结果恰是负的。是正的,结果恰是负的。4 4、变量的显著性检验失去意义、变量的显著性检验失去意义存在多重共线性时存在多重共线性时参数估计值的方差与标准差变大参数估计值的方差与标准差变大使使t t统计量的拒绝域变小(临界值增大)统计量的拒绝域变小(临界值增大)容易使通过样本计算的容易使通过样本计算的t t值小于临界值,值小于
12、临界值,误导作出参数为误导作出参数为0 0的推断的推断可能将重要的解释变量可能将重要的解释变量排除排除在模型之外在模型之外5 5、模型的预测功能失效、模型的预测功能失效 变大的方差容易使区间预测的变大的方差容易使区间预测的变大的方差容易使区间预测的变大的方差容易使区间预测的“区间区间区间区间”变大,变大,变大,变大,使预测失去意义。使预测失去意义。使预测失去意义。使预测失去意义。三、多重共线性的检验三、多重共线性的检验 由于多重共线性表现为解释变量之间具有相关由于多重共线性表现为解释变量之间具有相关由于多重共线性表现为解释变量之间具有相关由于多重共线性表现为解释变量之间具有相关关系,所以关系,
13、所以关系,所以关系,所以用于多重共线性的检验方法主要是统用于多重共线性的检验方法主要是统用于多重共线性的检验方法主要是统用于多重共线性的检验方法主要是统计方法:如计方法:如计方法:如计方法:如判定系数检验法、逐步回归检验法等。判定系数检验法、逐步回归检验法等。判定系数检验法、逐步回归检验法等。判定系数检验法、逐步回归检验法等。多重共线性检验的任务是多重共线性检验的任务是多重共线性检验的任务是多重共线性检验的任务是:(1 1 1 1)检验多重共线性是否存在;)检验多重共线性是否存在;)检验多重共线性是否存在;)检验多重共线性是否存在;(2 2 2 2)估计多重共线性的范围,即判断哪些变量)估计多
14、重共线性的范围,即判断哪些变量)估计多重共线性的范围,即判断哪些变量)估计多重共线性的范围,即判断哪些变量之间存在共线性。之间存在共线性。之间存在共线性。之间存在共线性。2 2、判明存在多重共线性的范围、判明存在多重共线性的范围(1)(1)(1)(1)判定系数检验法判定系数检验法判定系数检验法判定系数检验法 使使使使模模模模型型型型中中中中每每每每一一一一个个个个解解解解释释释释变变变变量量量量分分分分别别别别以以以以其其其其余余余余解解解解释释释释变变变变量量量量为为为为解解解解释释释释变变变变量量量量进进进进行行行行回回回回归归归归计计计计算算算算,并并并并计计计计算算算算相相相相应应应应
15、的的的的拟拟拟拟合合合合优度,也称为判定系数。如果在某一种形式优度,也称为判定系数。如果在某一种形式优度,也称为判定系数。如果在某一种形式优度,也称为判定系数。如果在某一种形式 X Xji ji=1 1X X1i1i+2 2X X2i2i+L LX XLiLi中中中中判判判判定定定定系系系系数数数数较较较较大大大大,则则则则说说说说明明明明在在在在该该该该形形形形式式式式中中中中作作作作为为为为被被被被解解解解释释释释变变变变量量量量的的的的X X X Xj j j j可可可可以以以以用用用用其其其其他他他他X X X X的的的的线线线线性性性性组组组组合合合合代代代代替替替替,即即即即X X
16、 X Xj j j j与与与与其其其其它它它它X X X X之间存在共线性。之间存在共线性。之间存在共线性。之间存在共线性。式中:式中:式中:式中:R R R Rjjjj2 2 2 2为第为第为第为第j j j j个解释变量对其他解释变量的个解释变量对其他解释变量的个解释变量对其他解释变量的个解释变量对其他解释变量的回归方程的决定系数,回归方程的决定系数,回归方程的决定系数,回归方程的决定系数,若存在较强的共线性,则若存在较强的共线性,则若存在较强的共线性,则若存在较强的共线性,则R R R Rjjjj2 2 2 2较大且接近于较大且接近于较大且接近于较大且接近于1 1 1 1,这时(这时(这
17、时(这时(1-R1-R1-R1-Rjjjj2 2 2 2 )较小,从而)较小,从而)较小,从而)较小,从而F F F Fj j j j的值较大。因此,可的值较大。因此,可的值较大。因此,可的值较大。因此,可以在给定的显著性水平以在给定的显著性水平以在给定的显著性水平以在给定的显著性水平 下下下下,通过计算,通过计算,通过计算,通过计算F F F F值的方法进值的方法进值的方法进值的方法进行检验。行检验。行检验。行检验。等价的检验是对上述回归方程作等价的检验是对上述回归方程作F F检验检验 另一等价的检验另一等价的检验另一等价的检验另一等价的检验:在模型中排除某一个解释变量在模型中排除某一个解释
18、变量在模型中排除某一个解释变量在模型中排除某一个解释变量X X X Xj j j j,估计模型,估计模型,估计模型,估计模型,如果拟合优度与包含如果拟合优度与包含如果拟合优度与包含如果拟合优度与包含X X X Xj j j j时十分接近,则说明时十分接近,则说明时十分接近,则说明时十分接近,则说明X X X Xj j j j与与与与其它解释变量之间存在共线性。其它解释变量之间存在共线性。其它解释变量之间存在共线性。其它解释变量之间存在共线性。四、克服多重共线性的方法四、克服多重共线性的方法 1 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量
19、,将它排除出去,找出引起多重共线性的解释变量,将它排除出去,找出引起多重共线性的解释变量,将它排除出去,找出引起多重共线性的解释变量,将它排除出去,是最为有效的克服多重共线性问题的方法。以逐步回是最为有效的克服多重共线性问题的方法。以逐步回是最为有效的克服多重共线性问题的方法。以逐步回是最为有效的克服多重共线性问题的方法。以逐步回归法得到最广泛的应用。归法得到最广泛的应用。归法得到最广泛的应用。归法得到最广泛的应用。注意:注意:注意:注意:剩余解释变量参数的经济含义和数值都发生了变化。剩余解释变量参数的经济含义和数值都发生了变化。剩余解释变量参数的经济含义和数值都发生了变化。剩余解释变量参数的
20、经济含义和数值都发生了变化。例如:在中国消费模型中的例如:在中国消费模型中的例如:在中国消费模型中的例如:在中国消费模型中的2 2 2 2个变量:个变量:个变量:个变量:进一步分析:进一步分析:Y Y与与C(-1)C(-1)之间的判定系数为:之间的判定系数为:0.98450.98450.98450.9845,Y Y与与C(-1)C(-1)之间的判定系数:之间的判定系数:0.74560.74560.74560.7456。一般认为:一般认为:两个变量之间的判定系数大于两个变量之间的判定系数大于0.80.80.80.8时,二者之间存在线性关系。时,二者之间存在线性关系。所以,原模型经检验地被认为具有
21、多重共线性,所以,原模型经检验地被认为具有多重共线性,而差分模型则可认为不具有多重共线性。而差分模型则可认为不具有多重共线性。由表中的比值可以直观地看到由表中的比值可以直观地看到由表中的比值可以直观地看到由表中的比值可以直观地看到:两变量增量的线性关系弱于总量之间的线性关系两变量增量的线性关系弱于总量之间的线性关系(即有个容易看出的趋势)。(即有个容易看出的趋势)。3 3、第三类方法:减小参数估计量的方差、第三类方法:减小参数估计量的方差 多重共线性的主要后果是参数估计量具有较多重共线性的主要后果是参数估计量具有较多重共线性的主要后果是参数估计量具有较多重共线性的主要后果是参数估计量具有较大的
22、方差,所以采取适当方法减小参数估计量的大的方差,所以采取适当方法减小参数估计量的大的方差,所以采取适当方法减小参数估计量的大的方差,所以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确方差,虽然没有消除模型中的多重共线性,但确方差,虽然没有消除模型中的多重共线性,但确方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。能消除多重共线性造成的后果。能消除多重共线性造成的后果。能消除多重共线性造成的后果。例如,例如,例如,例如,增加样本容量增加样本容量增加样本容量增加样本容量,可使参数估计量的方差,可使参数估计量的方差,可使参数估计量的方差,可使参数估计量的
23、方差减小(见第减小(见第减小(见第减小(见第16161616课件)。课件)。课件)。课件)。岭回归法岭回归法岭回归法岭回归法(Ridge RegressionRidge RegressionRidge RegressionRidge Regression)7070年年代代发发展展的的岭岭回回归归法法,以以以以引引引引入入入入偏偏偏偏误误误误为为为为代代代代价价价价减减减减小小小小参数估计量的方差,参数估计量的方差,参数估计量的方差,参数估计量的方差,受到人们的重视。受到人们的重视。具体方法是:引入矩阵具体方法是:引入矩阵D D D D,使参数估计量为,使参数估计量为 其中矩阵D D一般选择为主
24、对角阵,即 D=LI (2.6.6)L为大于0的常数,L L(0,1)。显然,与未含显然,与未含D D的参数的参数B B的估计量相比,的估计量相比,(2.6.5)(2.6.5)的估计量有较小的方差。的估计量有较小的方差。五、案例:服装市场需求函数五、案例:服装市场需求函数1 1、建立模型、建立模型 根根根根据据据据理理理理论论论论和和和和经经经经验验验验分分分分析析析析,影影影影响响响响居居居居民民民民服服服服装装装装类类类类支支支支出出出出的的的的主主主主要要要要因因因因素素素素有有有有:可可可可支支支支配配配配收收收收入入入入、居居居居民民民民流流流流动动动动资资资资产产产产拥拥拥拥有有有
25、有量量量量、服装价格指数、物价总指数。服装价格指数、物价总指数。服装价格指数、物价总指数。服装价格指数、物价总指数。已已已已知知知知某某某某地地地地区区区区的的的的有有有有关关关关资资资资料料料料,根根根根据据据据散散散散点点点点图图图图判判判判断断断断,建建建建立线性服装消费支出模型:立线性服装消费支出模型:立线性服装消费支出模型:立线性服装消费支出模型:Y=Y=0 0+1 1X+X+2 2K+K+3 3P P1 1+4 4P P0 0+2 2、样本数据、样本数据 由于由于R R R R2 2 2 20.99650.99650.99650.9965较大较大较大较大且接近于且接近于1 1,而且
26、,而且F=638.4F=638.4F=638.4F=638.4,大于临界值:大于临界值:F F 0.050.05(4,5)=15.19(4,5)=15.19,故认为服装支出,故认为服装支出与上述解释变量间总体线性关系显著。与上述解释变量间总体线性关系显著。但由于参数但由于参数K K的估计值的的估计值的t t t t检验值较小检验值较小检验值较小检验值较小(未能通过(未能通过检验),故检验),故解释变量间存在多重共线性解释变量间存在多重共线性解释变量间存在多重共线性解释变量间存在多重共线性。3 3、估计模型、估计模型(2 2)检验简单相关系数)检验简单相关系数各各各各解解解解释释释释变变变变量量
27、量量间间间间存存存存在在在在高高高高度度度度相相相相关关关关性性性性,其其其其中中中中尤尤尤尤其其其其以以以以P1P1P1P1,P0P0P0P0间的相关系数为最高(间的相关系数为最高(间的相关系数为最高(间的相关系数为最高(0.99180.99180.99180.9918)。)。)。)。(3 3)找出最简单的回归形式)找出最简单的回归形式可见,应选可见,应选可见,应选可见,应选为初始的回归模型。为初始的回归模型。为初始的回归模型。为初始的回归模型。(4 4)逐步回归)逐步回归 将将其其他他解解释释变变量量分分别别导导入入上上述述初初始始回回归归模模型型,寻找最佳回归方程。寻找最佳回归方程。4
28、4、讨论:、讨论:在在在在初初初初始始始始模模模模型型型型中中中中引引引引入入入入P P P P1 1 1 1,模模模模型型型型拟拟拟拟合合合合优优优优度度度度提提提提高高高高,且且且且参数符号合理,但参数符号合理,但参数符号合理,但参数符号合理,但P P P P1 1 1 1的的的的t t t t检验未通过;检验未通过;检验未通过;检验未通过;再再再再引引引引入入入入K K K K,拟拟拟拟合合合合优优优优度度度度虽虽虽虽有有有有提提提提高高高高,但但但但K K K K与与与与P P P P1 1 1 1的的的的t t t t检检检检验验验验未未未未能能能能通通通通过过过过,且且且且X X
29、X X与与与与P P P P1 1 1 1的的的的t t t t检检检检验验验验值值值值及及及及F F F F检检检检验验验验值值值值有有有有所所所所下下下下降降降降,表表表表明明明明引引引引入入入入K K K K并并并并未未未未对对对对回回回回归归归归模模模模型型型型带带带带来来来来明明明明显显显显的的的的“好好好好处处处处”,K K K K可能是多余的;可能是多余的;可能是多余的;可能是多余的;去去去去掉掉掉掉K K K K,加加加加入入入入P P P P0 0 0 0,拟拟拟拟合合合合优优优优度度度度有有有有所所所所提提提提高高高高,且且且且各各各各解解解解释释释释变量的变量的变量的变量
30、的t t t t检验全部通过,检验全部通过,检验全部通过,检验全部通过,F F F F值也增大了。值也增大了。值也增大了。值也增大了。将将将将4 4 4 4个个个个解解解解释释释释变变变变量量量量全全全全部部部部包包包包括括括括进进进进模模模模型型型型,拟拟拟拟合合合合优优优优度度度度未未未未有有有有明显改观,明显改观,明显改观,明显改观,K K K K的的的的t t t t检验未能通过,检验未能通过,检验未能通过,检验未能通过,K K K K显然是多余的。显然是多余的。显然是多余的。显然是多余的。5 5、结论、结论 回归方程以回归方程以Y=f(X,P1,P0)Y=f(X,P1,P0)为最优:为最优:Y=-12.45+0.10Y=-12.45+0.10X X-0.19-0.19P1P1+0.31+0.31P0P0