《计量经济学 多重共线性优秀课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学 多重共线性优秀课件.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学 多重共线性第1页,本讲稿共34页 多重共线性及其产生原因多重共线性及其产生原因 多重共线性的影响多重共线性的影响 多重共线性的检验多重共线性的检验第五章第五章 多重共线性多重共线性 多重共线性的修正多重共线性的修正第2页,本讲稿共34页第一节第一节 多重共线性及其产生原因多重共线性及其产生原因、多重共线性的概念、多重共线性的概念指模型解释变量之间存在完全线性或近似线性相关的一类问题。指模型解释变量之间存在完全线性或近似线性相关的一类问题。对模型对模型(5-1)如果存在不全为零的如果存在不全为零的,使得,使得(5-2)成立,则称解释变量之间存在完全共线性(成立,则称解释变量之间存在完
2、全共线性(perfect multicollinearity););第3页,本讲稿共34页第一节第一节 多重共线性及其产生原因多重共线性及其产生原因、多重共线性的概念、多重共线性的概念指模型解释变量之间存在完全线性或近似线性相关的一类问题。指模型解释变量之间存在完全线性或近似线性相关的一类问题。对模型对模型(5-1)成立,则称解释变量之间存在近似共线性(成立,则称解释变量之间存在近似共线性(approximate multicollinearity)。)。如果存在不全为零的如果存在不全为零的,使得,使得(5-3)第4页,本讲稿共34页在矩阵表示的线性回归模型在矩阵表示的线性回归模型完全共线性指
3、矩阵完全共线性指矩阵 X的秩的秩即即近似共线性意味着近似共线性意味着第5页,本讲稿共34页c)情况是不完全相关即解释变量之间的相关系数介于情况是不完全相关即解释变量之间的相关系数介于0和和1之间。之间。需要强调,解释变量之间不存在线性关系,并非不存在非线性需要强调,解释变量之间不存在线性关系,并非不存在非线性关系,当解释变量之间存在非线性关系时,并不违反无多重共线性假定。关系,当解释变量之间存在非线性关系时,并不违反无多重共线性假定。一般来说,解释变量之间的关系可概括为三种情况:一般来说,解释变量之间的关系可概括为三种情况:a)情况是完全相关,即解释变量之间的相关系数为情况是完全相关,即解释变
4、量之间的相关系数为1;b)情况是完全不相关,即解释变量之间的相关系数为情况是完全不相关,即解释变量之间的相关系数为0;在建立计量经济学模型中,大量的问题是属于在建立计量经济学模型中,大量的问题是属于第三种情况第三种情况。第6页,本讲稿共34页二、产生多重共线性的主要原因二、产生多重共线性的主要原因 1经济变量之间的内在联系,是产生多重共线性的经济变量之间的内在联系,是产生多重共线性的根本原因根本原因。2经济变量在时间上有同方向变动的趋势,这也是造成多重共线经济变量在时间上有同方向变动的趋势,这也是造成多重共线 性的性的重要原因重要原因。3模型中滞后变量的引入,也是造成解释变量多重共线的原因之一
5、。模型中滞后变量的引入,也是造成解释变量多重共线的原因之一。4在模型参数的估计过程中,样本之间的相关是不可避免的,这是在模型参数的估计过程中,样本之间的相关是不可避免的,这是 造成多重共线性的造成多重共线性的客观原因客观原因。第7页,本讲稿共34页第二节第二节 多重共线性多重共线性的影响的影响 对存在多重共线性的模型直接用普通最小二乘法估计参数,对存在多重共线性的模型直接用普通最小二乘法估计参数,就会给模型带来严重的不良后果。就会给模型带来严重的不良后果。如果解释变量存在完全共线性,则模型的参数如果解释变量存在完全共线性,则模型的参数 无法估计;无法估计;2如果解释变量之间存在近似共线性,则参
6、数如果解释变量之间存在近似共线性,则参数OLS估计量的方差随估计量的方差随 着多重共线程度的提高而增加;着多重共线程度的提高而增加;3变量的显著性检验和模型的预测功能失去意义;变量的显著性检验和模型的预测功能失去意义;4参数估计量经济意义不合理。参数估计量经济意义不合理。第8页,本讲稿共34页 如果解释变量存在完全共线性,则模型的参数如果解释变量存在完全共线性,则模型的参数 无法估计;无法估计;多元回归模型多元回归模型(5-4)的的OLS估计量为估计量为(5-5)如果出现完全共线性,则如果出现完全共线性,则不存在,无法得到参数不存在,无法得到参数的的估计量。估计量。第9页,本讲稿共34页2如果
7、解释变量之间存在近似共线性,则参数如果解释变量之间存在近似共线性,则参数OLS估计量的方差随估计量的方差随 着多重共线程度的提高而增加;着多重共线程度的提高而增加;在近似共线性下,虽然可以由式(在近似共线性下,虽然可以由式(5-5)得到参数)得到参数OLS估计量,但估计量,但 由于此时由于此时 ,引起,引起 主对角线元素较大,且随着主对角线元素较大,且随着逼近于逼近于0 0而增大。这就使得参数估计量的方差增大,从而不能对总体而增大。这就使得参数估计量的方差增大,从而不能对总体参数做出准确推断。参数做出准确推断。第10页,本讲稿共34页以二元回归模型以二元回归模型为例,为例,的方差为的方差为(5
8、-6)其中其中是是X1与与X2线性相关系数的平方,线性相关系数的平方,11。例:第11页,本讲稿共34页当完全共线性时,当完全共线性时,相关系数平方相关系数平方0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999方差膨胀因子方差膨胀因子1 2 5 10 20 25 33 50 100 1000可以看出,可以看出,越大,越大,越大,多重共线性使得参数估计量越大,多重共线性使得参数估计量为方差膨胀因子。其增大趋势如下表所示。为方差膨胀因子。其增大趋势如下表所示。方差增大,称方差增大,称当当X1与与X2线性无关时,线性无关时,当当X1与与X2 近似共线时,近似共线
9、时,0r1,Var(1)=第12页,本讲稿共34页3变量的显著性检验和模型的预测功能失去意义;变量的显著性检验和模型的预测功能失去意义;存在多重共线性的模型,其参数估计量方差的变大,使得计算的存在多重共线性的模型,其参数估计量方差的变大,使得计算的 t 统统计量变小,从而检验接受原假设计量变小,从而检验接受原假设影响很大影响很大的重要因素误判为不显著,结果使模型失去可靠性。其次,由于的重要因素误判为不显著,结果使模型失去可靠性。其次,由于参数估计量的方差变大,因而对样本值的反映十分敏感,即当样本观测值参数估计量的方差变大,因而对样本值的反映十分敏感,即当样本观测值稍有变化时,模型参数就有很大差
10、异,致使模型难以应用。另外,由于参稍有变化时,模型参数就有很大差异,致使模型难以应用。另外,由于参数估计量的方差增大,使模型的精度大大下降,求出的预测值难以置信。数估计量的方差增大,使模型的精度大大下降,求出的预测值难以置信。的可能性增大,这样会使本来的可能性增大,这样会使本来第13页,本讲稿共34页4参数估计量经济意义不合理。参数估计量经济意义不合理。如果模型中两个解释变量如果模型中两个解释变量X1和和X2具有线性相关性,那么它们中的一具有线性相关性,那么它们中的一个变量就可以由另一个变量表征。这时个变量就可以由另一个变量表征。这时X1和和X2的参数并不反映各自与被的参数并不反映各自与被解释
11、变量之间的结构关系,而是反映它们对被解释变量的共同影响,所解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所以各自的参数已失去了应有的经济意义,于是经常表现出似乎反常的现以各自的参数已失去了应有的经济意义,于是经常表现出似乎反常的现象,例如估计结果本来应该是正的,结果却是负的。经验告诉我们,在象,例如估计结果本来应该是正的,结果却是负的。经验告诉我们,在多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合理的情况,应该首先怀疑是否存在多重共线性。理的情况,应该首先怀疑是否存在多重共线性。第14页,本讲稿共34页
12、 严重的多重共线性常常会导致下列情形出现:使得用普通最小二乘严重的多重共线性常常会导致下列情形出现:使得用普通最小二乘法得到的回归参数估计值很不稳定,回归系数的方差随着多重共线性强法得到的回归参数估计值很不稳定,回归系数的方差随着多重共线性强度的增加而加速增长,对参数难以做出精确的估计;造成回归方程高度度的增加而加速增长,对参数难以做出精确的估计;造成回归方程高度显著的情况下,有些回归系数通不过显著性检验;甚至可能出现回归系显著的情况下,有些回归系数通不过显著性检验;甚至可能出现回归系数的正负号得不到合理的经济解释。但是应注意,如果研究的目的仅在数的正负号得不到合理的经济解释。但是应注意,如果
13、研究的目的仅在于预测被解释变量于预测被解释变量Y,而各个解释变量,而各个解释变量X之间的多重共线性关系的性质在之间的多重共线性关系的性质在未来将继续保持,这时虽然无法精确估计个别的回归系数,但可估计这未来将继续保持,这时虽然无法精确估计个别的回归系数,但可估计这些系数的某些线性组合,因此多重共线性可能并不是严重问题。些系数的某些线性组合,因此多重共线性可能并不是严重问题。综上所述综上所述第15页,本讲稿共34页第三节第三节 多重共线性的检验多重共线性的检验1)检验多重共线性是否存在;)检验多重共线性是否存在;多重共线性检验的任务是:2)估计多重共线性的范围,即判断哪些变量之间存在共线性。)估计
14、多重共线性的范围,即判断哪些变量之间存在共线性。第16页,本讲稿共34页一、一、检验多重共线性是否存在检验多重共线性是否存在 1 1简单相关系数检验法简单相关系数检验法 利用解释变量之间的线性相关程度去判断是否存在严重多重利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。共线性的一种简便方法。一般而言,如果每两个解释变量的简单相关系数比较高,如一般而言,如果每两个解释变量的简单相关系数比较高,如大于大于0.8,则可认为存在着较严重的多重共线性。,则可认为存在着较严重的多重共线性。较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在较高的简单相关系数只
15、是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。因此并不能简单地依据相关系数进行多重共线性的准确判断。注意注意第17页,本讲稿共34页一、一、检验多重共线性是否存在检验多重共线性是否存在 2 2直观判断法直观判断法 根据经验,通常以下情况的出现根据经验,通常以下情况的出现可能提示存在多重共线性的影响可能提示存在多重共线性的影响:(2)从定性分析认为,一些重要的解释变量的回归系数的标准误差较大
16、,在从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在 回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。(1)当增加或删除一个解释变量,或者改变一个观测值时,回归参数的估当增加或删除一个解释变量,或者改变一个观测值时,回归参数的估 计值发生较大变化,回归方程可能存在严重的多重共线性。计值发生较大变化,回归方程可能存在严重的多重共线性。(4)解释变量的相关矩阵中,解释变量之间的相关系数较大时,可能会存在解释变量的相关矩阵中,解释变量之间的相关系数较大时,可能会存在 多重共线性问题。多重共线性问题。
17、(3)有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存 在多重共线性。在多重共线性。第18页,本讲稿共34页一、一、检验多重共线性是否存在检验多重共线性是否存在3 3综合统计检验法综合统计检验法 R2与与 F 值较大,但各参数估计量的值较大,但各参数估计量的 t 检验值较小,说明各解释变检验值较小,说明各解释变量对量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它的联合线性作用显著,但各解释变量间存在共线性而使得它们对们对Y的独立作用不能分辨,故的独立作用不能分辨,故t检验不显著。检验不显著。对于多个解释变量(
18、对于多个解释变量(2个以上)的回归模型个以上)的回归模型 若若 在在OLS法下:法下:第19页,本讲稿共34页二、二、估计多重共线性的范围估计多重共线性的范围 1 1判定系数检验法判定系数检验法 2 2行列式检验法行列式检验法 3 3方差膨胀方差膨胀(扩大扩大)因子法因子法4 4逐步回归法逐步回归法第20页,本讲稿共34页 1 1判定系数检验法判定系数检验法 例例:设多元回归模型的解释变量为设多元回归模型的解释变量为 X X1 1、X X2 2、X Xk k,为分析研究它们之间的,为分析研究它们之间的相关关系,需将每个解释变量与其他解释变量进行回归,可得出相关关系,需将每个解释变量与其他解释变
19、量进行回归,可得出k k个回归方程式个回归方程式并计算相应的拟合优度,即判定系数并计算相应的拟合优度,即判定系数 。如果某一回归方程的判定系数如果某一回归方程的判定系数较大较大(接近于接近于1)1),说明,说明X Xj j与其他解释变与其他解释变量量X X间存在多重共线性。间存在多重共线性。如果求出的判定系数如果求出的判定系数都比较小,没有一个是接近于都比较小,没有一个是接近于1 1的,则可认为的,则可认为模型的解释变量之间不存在严重的多重共线问题。模型的解释变量之间不存在严重的多重共线问题。析析:第21页,本讲稿共34页 可进一步对上述出现较大判定系数可进一步对上述出现较大判定系数 的回归方
20、程作的回归方程作F检验:检验:(5-75-7)若存在较强的共线性,则若存在较强的共线性,则 较大且接近于较大且接近于1 1,这时,这时 较小,从而较小,从而 的值较大。因此,可以给定显著性水平的值较大。因此,可以给定显著性水平,通过计算,通过计算 的值,并与相应的临界的值,并与相应的临界 与其他解释变量与其他解释变量X X间不间不 ,拒绝,拒绝 ,即认为,即认为X Xj j与其他解释与其他解释,即认为即认为X Xj j与其他解释变量与其他解释变量X X间不间不 值比较来进行检验,判定是否存在相关性。此时值比较来进行检验,判定是否存在相关性。此时存在显著的共线性。如果存在显著的共线性。如果 变量
21、变量X X间存在多重共线性,否则,接受间存在多重共线性,否则,接受存在多重共线性。存在多重共线性。第22页,本讲稿共34页 1 1判定系数检验法判定系数检验法 例例:设多元回归模型的解释变量为设多元回归模型的解释变量为 X X1 1、X X2 2、X Xk k,为分析研究它们之间的,为分析研究它们之间的相关关系,需将每个解释变量与其他解释变量进行回归,可得出相关关系,需将每个解释变量与其他解释变量进行回归,可得出k k个回归方程式个回归方程式并计算相应的拟合优度,即判定系数并计算相应的拟合优度,即判定系数 。另一等价的检验是:在模型中排除某一个解释变量在模型中排除某一个解释变量 X Xj j,
22、估计模型,如果拟合优度与包含,估计模型,如果拟合优度与包含X Xj j 时十分接近,则说明时十分接近,则说明XjXj与其它解释变量之间存在共线性与其它解释变量之间存在共线性。第23页,本讲稿共34页2 2行列式检验法行列式检验法由于回归模型参数估计量的方差由于回归模型参数估计量的方差协方差矩阵为协方差矩阵为而所以第24页,本讲稿共34页说明:说明:说明模型的解释变量之间完全相关,因而多重共线性最为说明模型的解释变量之间完全相关,因而多重共线性最为严重,即存在完全多重共线性。严重,即存在完全多重共线性。(1)(1)当当 较大时,较大时,较小较小说明参数估计的精度较高,因而多重共线性不严重。说明参
23、数估计的精度较高,因而多重共线性不严重。(3)(3)当当 =0 =0时,则时,则 (2)(2)当当 较小时,较小时,较大较大说明参数估计的误差较大,因此表明模型的多重共线性严重。说明参数估计的误差较大,因此表明模型的多重共线性严重。第25页,本讲稿共34页 3 3方差膨胀方差膨胀(扩大扩大)因子法因子法 对于多元线性回归模型来说,如果分别以每个解释变量为被解释对于多元线性回归模型来说,如果分别以每个解释变量为被解释变量,做对其他解释变量的回归,这称为变量,做对其他解释变量的回归,这称为辅助回归辅助回归。Var()=以以Xj为被解释变量做对其他解释变量辅助线性回归的可决系数,用为被解释变量做对其
24、他解释变量辅助线性回归的可决系数,用RjJ 的方差可的方差可 表示,则可以证明表示,则可以证明(证明过程从略证明过程从略),解释变量,解释变量XjXj参数估计量参数估计量表示为表示为其中,其中,VIFj是变量是变量Xj的方差膨胀因子,即的方差膨胀因子,即第26页,本讲稿共34页 由于由于RjRj度量了度量了XjXj与其他解释变量的线性相关程度,这种相关程度越强,与其他解释变量的线性相关程度,这种相关程度越强,说明变量间多重共线性越严重,说明变量间多重共线性越严重,VIFjVIFj也就越大。反之,也就越大。反之,XjXj与其他解释变量的与其他解释变量的线性相关程度越弱,说明变量间的多重共线性越弱
25、,线性相关程度越弱,说明变量间的多重共线性越弱,VIFjVIFj也就越接近于也就越接近于1 1。由此可见,由此可见,VIFjVIFj的大小反映了解释变量之间是否存在多重共线性,可用它来的大小反映了解释变量之间是否存在多重共线性,可用它来度量多重共线性的严重程度。经验表明,度量多重共线性的严重程度。经验表明,VIFjVIFj1010时,说明解释变量时,说明解释变量XjXj与其与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。最小二乘估计。第27页,本讲稿共34页4 4逐步回归法逐步回归法 以以为被
26、解释变量,逐个引入解释变量,构成回归模型,进行模型为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否可以用其他变量的线估计。根据拟合优度的变化决定新引入的变量是否可以用其他变量的线性组合代替,而不是作为独立的解释变量。性组合代替,而不是作为独立的解释变量。如果拟合优度变化显著,则说明新引入的变量是一个独立的解释变量;如果拟合优度变化显著,则说明新引入的变量是一个独立的解释变量;如果拟合优度变化很不显著,则说明新引入的变量不是一个独立的解如果拟合优度变化很不显著,则说明新引入的变量不是一个独立的解释变量,它可以用其他变量的线性组合代替,也就是说它与
27、其他变量之间释变量,它可以用其他变量的线性组合代替,也就是说它与其他变量之间存在多重共线性。存在多重共线性。第28页,本讲稿共34页第四节第四节 多重共线性的修正多重共线性的修正常用的几种修正方法常用的几种修正方法 :一、省略变量法二、利用已知信息克服多重共线性三、通过变换模型形式克服多重共线性四、用增加样本容量来克服多重共线性五、逐步回归法第29页,本讲稿共34页一、省略变量法一、省略变量法找出引起多重共线性的解释变量,将其省略掉找出引起多重共线性的解释变量,将其省略掉 最为有效的修正多重共线问题的方法。最为有效的修正多重共线问题的方法。当省略了某个或某些变量后,保留在模型中的变量的系数的估
28、计值当省略了某个或某些变量后,保留在模型中的变量的系数的估计值及其经济意义均将发生变化。及其经济意义均将发生变化。这种方法虽然简单,但是当解释变量较多时,往往很难选准在模型中比较这种方法虽然简单,但是当解释变量较多时,往往很难选准在模型中比较次要的解释变量以便省略。因此,在用这种方法克服多重共线问题时,又可能次要的解释变量以便省略。因此,在用这种方法克服多重共线问题时,又可能会犯遗漏重要解释变量的错误,以致使模型出现新的问题。所以,在从模型中会犯遗漏重要解释变量的错误,以致使模型出现新的问题。所以,在从模型中去掉某一解释变量时,一定要全面考虑、慎重从事,避免顾此失彼。去掉某一解释变量时,一定要
29、全面考虑、慎重从事,避免顾此失彼。定义定义:注意注意:缺点缺点:第30页,本讲稿共34页二、利用已知信息克服多重共线性二、利用已知信息克服多重共线性已知信息已知信息就是指在建模之前根据经济理论、统计资料或经验分析,就是指在建模之前根据经济理论、统计资料或经验分析,已知的解释变量之间存在的某种关系。已知的解释变量之间存在的某种关系。例例:为了克服多重共线性,可将解释变量按已知关系加以为了克服多重共线性,可将解释变量按已知关系加以合并合并。设消费函数设消费函数 (5-8)(5-8)其中,其中,Y Y为消费支出,为消费支出,X X1 1为消费者的年平均收入,为消费者的年平均收入,X X2 2为消费者
30、的年平均储蓄额。为消费者的年平均储蓄额。第31页,本讲稿共34页三、通过变换模型形式克服多重共线性三、通过变换模型形式克服多重共线性不需要分析每个解释变量对被解释变量影响大小模型对象模型对象例例:设需求函数设需求函数 (5-12)(5-12)其中其中Y Y为需求量,为需求量,X X1 1为居民收入,为居民收入,X X2 2为商品价格,为商品价格,X X3 3为代用品价格。为代用品价格。第32页,本讲稿共34页四、用增加样本容量来克服多重共线性四、用增加样本容量来克服多重共线性 多重共线性的主要问题在于使参数估计量的方差变大,随机干扰项的多重共线性的主要问题在于使参数估计量的方差变大,随机干扰项
31、的方差、变量的变异程度与方差膨胀因子一起决定着参数估计量的方差。方差、变量的变异程度与方差膨胀因子一起决定着参数估计量的方差。如果存在多重共线性,但随机干扰项的方差很小,或变量的变异程度很如果存在多重共线性,但随机干扰项的方差很小,或变量的变异程度很大都可能得到较小的参数估计量的方差。这时,即使有较严重的多重共大都可能得到较小的参数估计量的方差。这时,即使有较严重的多重共线性,也不会带来不良后果。因此,只要回归方程估计的参数标准差较线性,也不会带来不良后果。因此,只要回归方程估计的参数标准差较小,小,t t统计值较大,就没有必要过于关心是否存在多重共线性的问题。统计值较大,就没有必要过于关心是
32、否存在多重共线性的问题。第33页,本讲稿共34页五、逐步回归法五、逐步回归法具体步骤具体步骤 1 1)先用被解释变量对每一个所考虑的解释变量做简单回归;)先用被解释变量对每一个所考虑的解释变量做简单回归;2 2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础;)以对被解释变量贡献最大的解释变量所对应的回归方程为基础;3 3)逐个引入其余的解释变量。)逐个引入其余的解释变量。好处 将统计上不显著的解释变量剔除,最后保留在模型中的解释变量之间将统计上不显著的解释变量剔除,最后保留在模型中的解释变量之间多重共线性不明显,而且对被解释变量有较好的解释贡献。多重共线性不明显,而且对被解释变量有较好的解释贡献。第34页,本讲稿共34页