《第六章内生解释变量...ppt》由会员分享,可在线阅读,更多相关《第六章内生解释变量...ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 内生解释变量内生解释变量第一节第一节 解释变量内生性的成因与检验解释变量内生性的成因与检验第二节第二节 解释变量内生性检测解释变量内生性检测第三节第三节 内生性问题的解决办法内生性问题的解决办法第一节解释变量内生性的成因与检验解释变量与随机误差项之间往往存在某种程度的相关性,即:解释变量与随机误差项之间往往存在某种程度的相关性,即:此此时时,就称模型存在,就称模型存在内生性内生性问题问题,与随机,与随机误误差差项项相关的解相关的解释释变变量称量称为为内生解内生解释变释变量量。一、解一、解释变释变量内生性及其影响量内生性及其影响这这称称为为解解释释量的量的外生性假定外生性假定。解解
2、释变释变量与随机量与随机误误差差项项是是线线性无关的(甚至是均性无关的(甚至是均值值独立的),独立的),即要求即要求内生性会对内生性会对OLSE的统计性质产生不良影响的统计性质产生不良影响1、影响无偏性影响无偏性如果假定如果假定SLR.3(不相关假定)不成立,(不相关假定)不成立,则则一定一定违违背古典假背古典假定定SLR.3的均的均值值独立假定,即独立假定,即一定不成立。而假一定不成立。而假定定SLR.3(均(均值值独立)是独立)是OLSE无偏性成立的关无偏性成立的关键键假定。由假定。由(2.22)知:)知:=02、影响一致性影响一致性如果如果0,则则,OLSE不再具有一致性。不再具有一致性
3、。3、其它影响、其它影响其它不良影响还包括,随机误差项的方差估计量是有偏的,其它不良影响还包括,随机误差项的方差估计量是有偏的,由此导致回归系数的方差估计量是有偏的,进而与方差相由此导致回归系数的方差估计量是有偏的,进而与方差相关的假设检验、区间估计容易导出错误的结论。这些影响关的假设检验、区间估计容易导出错误的结论。这些影响需要结合内生性产生的具体的原因进行分析。需要结合内生性产生的具体的原因进行分析。二、内生性二、内生性产产生的原因生的原因横截面回归中解释变量内生性产生的原因主要有遗漏变量、横截面回归中解释变量内生性产生的原因主要有遗漏变量、错误的函数形式、测量误差和联立性。错误的函数形式
4、、测量误差和联立性。1、遗遗漏漏变变量量在建立计量经济模型时,由于人们认识上的偏差,理论分析在建立计量经济模型时,由于人们认识上的偏差,理论分析的缺陷,或者是有关统计数据的影响,导致有意或无意地忽的缺陷,或者是有关统计数据的影响,导致有意或无意地忽略了某些重要变量,未能将其作为解释变量引入模型,这种略了某些重要变量,未能将其作为解释变量引入模型,这种变量就称为变量就称为遗漏变量遗漏变量(Omitted Variable)。被遗漏的变量虽)。被遗漏的变量虽未引入模型,但其对因变量的影响还是存在的,其影响由随未引入模型,但其对因变量的影响还是存在的,其影响由随机误差项体现出来。如果被遗漏变量和模型
5、中现有的解释变机误差项体现出来。如果被遗漏变量和模型中现有的解释变量存在相关,则会造成解释变量与随机误差项的相关,即产量存在相关,则会造成解释变量与随机误差项的相关,即产生内生性问题。生内生性问题。考虑成年劳动者的工资方程中存在未观测到的能力的问题考虑成年劳动者的工资方程中存在未观测到的能力的问题(6.1)其中其中y代表工代表工资资的的对对数,数,x1代表受教育年限,代表受教育年限,x2代表个人能力,代表个人能力,u是随机是随机误误差差项项。(6.2)若若x2无法准确无法准确测测量,将其量,将其归归入随机入随机误误差差项项中,得到如下回中,得到如下回归归模型:模型:其中其中v中包含了中包含了x
6、2。显显然,若是然,若是x2与与x1相关,相关,则则会会导导致致,从而从而产产生内生性生内生性问题问题。将正确模型(将正确模型(6.1)式代入()式代入(6.3)式得)式得对(对(6.2)式进行回归)式进行回归,x1的系数估计量为的系数估计量为:(6.3)(6.3)(1)若遗漏的)若遗漏的 x2与与x1 相关,则(相关,则(6.4)、()、(6.5)式中的第)式中的第二项在小样本的期望与大样本下的概率极限都不会为零,二项在小样本的期望与大样本下的概率极限都不会为零,使得普通最小二乘估计量使得普通最小二乘估计量OLSE是有偏的,在大样本下也是是有偏的,在大样本下也是不一致的。不一致的。(6.5)
7、(2)若)若 x2与与x1不相关,则由(不相关,则由(6.4)、()、(6.5)易知)易知 的估的估计量满足无偏性与一致性,但这时计量满足无偏性与一致性,但这时 的估计却是有偏的。的估计却是有偏的。(3)随机误差项的方差估计随机误差项的方差估计 也是有偏的。也是有偏的。(4)的方差是真实估计量的方差是真实估计量 的方差的有偏估计。的方差的有偏估计。在搜集数据时,如果遇到所搜集的数据不能确实地反映变在搜集数据时,如果遇到所搜集的数据不能确实地反映变量间经济行为的情况,就称模型中包含了量间经济行为的情况,就称模型中包含了测量误差测量误差(Measurement Errors)。具体来说,测量误差是
8、指在收集)。具体来说,测量误差是指在收集数据过程中的数据过程中的登记误差登记误差、在数据加工整理过程中的、在数据加工整理过程中的整理误整理误差差以及其他以及其他统计误差统计误差。测量误差出现的原因是多方面的。测量误差出现的原因是多方面的。首先,调查登记本身就可能产生误差;首先,调查登记本身就可能产生误差;其次,数据的加工处理过程中也可能导致一定的误差;其次,数据的加工处理过程中也可能导致一定的误差;此外,数据的不当使用也会出现误差,此外,数据的不当使用也会出现误差,测量误差可能是被解释变量的测量误差,也可能是解释变测量误差可能是被解释变量的测量误差,也可能是解释变量的测量误差。量的测量误差。2
9、、测测量量误误差差(1)因变量存在测量误差)因变量存在测量误差,且与自变量不相关,且与自变量不相关,则,则OLS估计量具有良好的性质,是估计量具有良好的性质,是无偏和一致的无偏和一致的。(2)因变量存在测量误差)因变量存在测量误差,且与自变量相关,且与自变量相关,则产生,则产生内生性问题,内生性问题,OLSE是是有偏且不一致的有偏且不一致的。测量误差造成的内生性也会影响回归分析的结果。测量误差造成的内生性也会影响回归分析的结果。(3)自变量存在测量误差)自变量存在测量误差,且与自变量测量值不相关、与,且与自变量测量值不相关、与随机误差不相关,则随机误差不相关,则估计值是一致的,但方差会变大估计
10、值是一致的,但方差会变大。(4)自变量存在测量误差,且与自变量测量值相关,则产)自变量存在测量误差,且与自变量测量值相关,则产生内生性问题,生内生性问题,OLSE是不一致的是不一致的。OLSE常常会低估真实的常常会低估真实的回归参数回归参数。注意注意:回归变量的测量误差是数据问题,目前计量经济学家:回归变量的测量误差是数据问题,目前计量经济学家们还们还提不出有效的解决方法提不出有效的解决方法。一般的做法往往是。一般的做法往往是忽略测量误忽略测量误差问题差问题,主观上希望测量误差足够小,从而不破坏回归分析,主观上希望测量误差足够小,从而不破坏回归分析假定的合理性。假定的合理性。例如,如果例如,如
11、果“真实真实”的回归函数为的回归函数为但却将模型设定为但却将模型设定为错误的函数形式错误的函数形式(Wrong Functional Form)是指在设定模)是指在设定模型时,选取了不正确的函数形式。最常见的就是当型时,选取了不正确的函数形式。最常见的就是当“真实真实”的函数形式为非线性时,却选取了线性的函数形式。的函数形式为非线性时,却选取了线性的函数形式。3、错误的函数形式错误的函数形式由错误的函数形式造成了内生性,即使其他假设均成立,由错误的函数形式造成了内生性,即使其他假设均成立,且样本很大,普通且样本很大,普通最小二乘估计量也是不一致的最小二乘估计量也是不一致的。由于经济现象的错综复
12、杂,大多数经济问题中各变量之间由于经济现象的错综复杂,大多数经济问题中各变量之间存在反馈效应。要描述经济现象的这种复杂关系,必须从存在反馈效应。要描述经济现象的这种复杂关系,必须从整体和系统的角度进行,建立由多个相互联系的单一方程整体和系统的角度进行,建立由多个相互联系的单一方程组成的组成的联立方程模型联立方程模型才能完整表达。正如单方程模型会遇才能完整表达。正如单方程模型会遇到内生性问题,联立方程模型更容易遇到内生性问题。因到内生性问题,联立方程模型更容易遇到内生性问题。因为在联立方程模型中,结构式中已包含有其它的内生变量,为在联立方程模型中,结构式中已包含有其它的内生变量,所以在从结构式到
13、简约式的转化中,自然也把误差项带入所以在从结构式到简约式的转化中,自然也把误差项带入了其它的结构式中,产生了其它的结构式中,产生联立性联立性(Simultaneity),进而不),进而不可避免地造成内生性。由于内生性的存在,会使得可避免地造成内生性。由于内生性的存在,会使得OLS估计估计量是有偏的和不一致的量是有偏的和不一致的。4、联立性联立性检验的基本思想检验的基本思想:如果不知道遗漏了哪个变量,可寻找一:如果不知道遗漏了哪个变量,可寻找一个替代变量来进行遗漏变量检验,替代变量通常选用所设个替代变量来进行遗漏变量检验,替代变量通常选用所设定模型被解释变量的拟合值定模型被解释变量的拟合值 的若
14、干次幂的线性组合。若模的若干次幂的线性组合。若模型估计所得的残差包含着遗漏的相关变量,那么这个残差型估计所得的残差包含着遗漏的相关变量,那么这个残差可用被解释变量拟合值若干次幂的线性组合近似表示;若可用被解释变量拟合值若干次幂的线性组合近似表示;若这个线性组合是显著的,则认为原模型设定有误(遗漏变这个线性组合是显著的,则认为原模型设定有误(遗漏变量)。由于可引入若干个替代变量去判断是否有多个变量量)。由于可引入若干个替代变量去判断是否有多个变量被遗漏,所以该方法被称为一般性设定误差检验。被遗漏,所以该方法被称为一般性设定误差检验。拉姆齐拉姆齐(Ramsey,1969)提出了一种提出了一种“回归
15、设定误差检验回归设定误差检验”(Regression Specification Error Test),简称),简称RESET检验。检验。第二节第二节解释变量内生性检测解释变量内生性检测一、一、RESET检验检验第一步:用第一步:用OLS法对模型(法对模型(6.7)进行回归估计)进行回归估计RESET检验的基本步骤为:检验的基本步骤为:(6.7)第二步:用被解释变量的拟合值第二步:用被解释变量的拟合值 的若干次幂的若干次幂 的线性组合,的线性组合,测度残差中是否包含着遗漏的相关变量。测度残差中是否包含着遗漏的相关变量。具体做法为,在第一步的模型(具体做法为,在第一步的模型(6.7)中增加一个
16、包含拟合值)中增加一个包含拟合值 的函数。这个函数通常选择为拟合值的函数。这个函数通常选择为拟合值 的平方、立方和四的平方、立方和四次方的线性组合。例如:次方的线性组合。例如:其中,其中,RSSU为对为对模型模型(6.8)(相当于无(相当于无约约束模型)束模型)进进行回行回归归得到的残差平方和,得到的残差平方和,RSSR 为为模型(模型(6.7)(有)(有约约束模型)束模型)进进行回行回归归得到的残差平方和,得到的残差平方和,dfU和和dfR分分别为别为前二者的自由度。前二者的自由度。针对针对模型(模型(6.8),(),(6.9)式可以写)式可以写为为:其中其中n为样为样本个数,本个数,k为为
17、解解释变释变量个数。量个数。第三步:提出原假设:第三步:提出原假设:。构造。构造F统计量:统计量:(6.9)(6.10)第第四四步步:给给定定显显著著性性水水平平,若若F统统计计值值大大于于等等于于临临界界值值,则则拒拒绝绝原原假假设设,表表明明存存在在设设定定误误差差(遗遗漏漏变变量量),否否则则,说说明明不不存存在在设设定定误误差差(遗遗漏漏变变量量)。类类似似的的,也也可可以以利利用用F统统计计值值对对应应的的概概率率值值来来判判断断:如如果果概概率率值值小小于于等等于于,则则拒拒绝绝原原假假设设,表表明明存存在在设设定定误误差差(遗遗漏漏变变量量),否否则则,说说明明不不存在存在设设定
18、定误误差(差(遗遗漏漏变变量)。量)。表表6-1 城镇居民人均可支配收入和人均消费性支出抽样调查数据(元)城镇居民人均可支配收入和人均消费性支出抽样调查数据(元)例例61关于城镇居民的消费行为,某些研究者认为由关于城镇居民的消费行为,某些研究者认为由于有较高的社会福利保障,以绝对收入假说消费函数模型于有较高的社会福利保障,以绝对收入假说消费函数模型为理论模型,能够得到理想的拟合结果,因而得出为理论模型,能够得到理想的拟合结果,因而得出城镇居城镇居民的消费行为应该服从绝对收入消费理论假说,收入是唯民的消费行为应该服从绝对收入消费理论假说,收入是唯一显著的变量一显著的变量。用表。用表6-1的样本数
19、据验证这一结论是否正确。的样本数据验证这一结论是否正确。家庭序号家庭序号可支配收入可支配收入消消费费性支出性支出y家庭序号家庭序号可支配收入可支配收入消消费费性支出性支出y11510.21278.891162804998.0021700.61554.86126859.65309.0032026.61840.59137702.86030.0042577.42110.81148472.26510.9453496.22852.34159421.67182.00642833537.5716104937943.0074838.93919.471711759.58696.5585160.34186.001
20、813785.89997.4795425.14331.611915780.7611242.85105854.024619.912025410.00模型的参数均通过了模型的参数均通过了0.01水平下的显著性检验,水平下的显著性检验,R2=0.998表表明拟合效果很好。但是由于我们仅用当期收入来解释消费明拟合效果很好。但是由于我们仅用当期收入来解释消费支出的变化,因此,可能遗漏了相关变量。下面进行支出的变化,因此,可能遗漏了相关变量。下面进行RESET检验。检验。利用利用EViews做回归,得样本回归方程:做回归,得样本回归方程:(6.11)由式(由式(6.11)估计出消费性支出)估计出消费性支出
21、 ,在原回归模型中加入新,在原回归模型中加入新的解释变量的解释变量 、后重新估计,发现后重新估计,发现 的系数不显著,因的系数不显著,因此,加入变量此,加入变量 进行估计,得到估计结果:进行估计,得到估计结果:(6.12)F统计量的值大于统计量的值大于0.05显著性水平下自由度为(显著性水平下自由度为(1,16)的)的F分分布的临界值布的临界值4.49,因此拒绝原假设,表明原模型确实存在,因此拒绝原假设,表明原模型确实存在设定误差,遗漏了相关变量,所以我们认为消费与收入之设定误差,遗漏了相关变量,所以我们认为消费与收入之间的关系可能并不像一元线性模型那么简单。间的关系可能并不像一元线性模型那么
22、简单。RESET检验也可以利用检验也可以利用EViews直接来完成。操作方法如下:直接来完成。操作方法如下:作作y关于关于x的回归,然后在输出结果窗口选择的回归,然后在输出结果窗口选择View/Stability Test/Ramsey RESET Test,在弹出的,在弹出的“Number of Fitted”对对话框中,设定代理变量个数为话框中,设定代理变量个数为1。点击。点击“OK”,检验结果如下:,检验结果如下:计算计算F统计量:统计量:=106.4448由于由于F统计量对应的概率为统计量对应的概率为0,显然小于,显然小于 0.05,故拒绝原假,故拒绝原假设,认为遗漏了相关变量。由此可
23、见,我国城镇居民的消设,认为遗漏了相关变量。由此可见,我国城镇居民的消费行为,不能认为服从绝对收入消费理论假说,线性模型费行为,不能认为服从绝对收入消费理论假说,线性模型设定有误。设定有误。表表6-4 EViews输出结果输出结果RamseyRESETTest:F-statistic106.4448Probability0.000000Loglikelihoodratio38.66636Probability0.000000TestEquation:DependentVariable:YVariableCoefficientStd.Errort-StatisticProb.C141.36553
24、9.013553.6234990.0023X0.8219870.01214967.659220.0000YF2-1.42E-051.38E-06-10.317210.0000R-squared0.999723Meandependentvar5165.361AdjustedR-squared0.999689S.D.dependentvar2859.409S.E.ofregression50.43478Akaikeinfocriterion10.82318Sumsquaredresid40698.67Schwarzcriterion10.97230Loglikelihood-99.82019F-s
25、tatistic28921.10Durbin-Watsonstat2.455390Prob(F-statistic)0.000000豪斯曼内生性检验的豪斯曼内生性检验的具体步骤具体步骤为:为:1.对所研究的回归模型,无论是否存在测量误差,先采用对所研究的回归模型,无论是否存在测量误差,先采用OLS法得到参数估计量。法得到参数估计量。关于测量误差存在与否的内生性检验是豪斯曼(关于测量误差存在与否的内生性检验是豪斯曼(J.A.Hausman,1978)提出的,其)提出的,其基本思路基本思路是,把可能存在测是,把可能存在测量误差的解释变量与其工具变量做回归,将得到的残差序量误差的解释变量与其工具变量
26、做回归,将得到的残差序列作为解释变量加入初始的模型,如果残差序列是显著的,列作为解释变量加入初始的模型,如果残差序列是显著的,则说明存在测量误差,否则说明不存在测量误差。则说明存在测量误差,否则说明不存在测量误差。二、二、豪斯曼检验豪斯曼检验2.对可能存在测量误差的解释变量,选择与其相关的工具对可能存在测量误差的解释变量,选择与其相关的工具变量变量(参见本章第参见本章第3节节),将可能存在测量误差的解释变量,将可能存在测量误差的解释变量对选择的工具变量进行回归,并获得回归残差对选择的工具变量进行回归,并获得回归残差 (作为(作为自变量测量误差的代表)。自变量测量误差的代表)。3.将回归残差将回
27、归残差 作为解释变量加入第作为解释变量加入第1步中的回归模型,再步中的回归模型,再次进行次进行OLS估计,得估计,得 的参数估计值的参数估计值 及显著性检验结果。及显著性检验结果。4.若若 显著,则认为解释变量的确存在观测误差,反之,显著,则认为解释变量的确存在观测误差,反之,认为解释变量不存在测量误差。认为解释变量不存在测量误差。其中,其中,ex为为某某贫贫困地区地方政府的支出,困地区地方政府的支出,aid为为中央政府的中央政府的拨拨款量,款量,inc为贫为贫困地区地方政府的困地区地方政府的财财政收入,政收入,pop为该为该地地区的区的总总人口数。人口数。现怀现怀疑中央政府的疑中央政府的拨拨
28、款量款量aid存在存在测测量量误误差。差。我我们选择贫们选择贫困人口数困人口数ps为为工具工具变变量,其量,其原因原因为为扶扶贫贫支出是支出是该该地区地方政府支出中比重最大的支出,其地区地方政府支出中比重最大的支出,其经费经费来源主要来源主要是依是依赖赖中央政府的中央政府的拨拨款,而中央政府的款,而中央政府的拨拨款与款与该该地区地区贫贫困困人口数人口数ps有直接关系有直接关系,因此因此ps与与aid有有较较高相关性。将高相关性。将aid对对ps进进行回行回归归,得:,得:例例62 假设利用观测到的样本数据作回归,已得到假设利用观测到的样本数据作回归,已得到以下结果:以下结果:(6.13)t=(
29、-0.56)(13.64)(8.12)(-5.17)R2=0.993F=2190从上式看出,因从上式看出,因为为系数的系数的t值值是是1.73,小于,小于t的的临临界界值值1.96,在在0.05的的显显著性水平下,双著性水平下,双侧侧t检验检验接受原假接受原假设设(不存在(不存在测测量量误误差),但在差),但在0.1的的显显著性水平上,双著性水平上,双侧侧t检验则检验则拒拒绝绝原假原假设设而而接受接受备择备择假假设设(存在(存在测测量量误误差)。差)。注意注意,引,引进对测进对测量量误误差可能性的修正,使差可能性的修正,使aid变变量的系数量的系数变变小,小,这这从另一个从另一个侧侧面面说说明
30、,明,测测量量误误差夸大了差夸大了aid对对ex的影响。的影响。得到如下的残差变量得到如下的残差变量 :将将 项加入(项加入(6.13),再回归得到以下结果:),再回归得到以下结果:t=(-1.41)(1.94)(7.55)(-1.29)(1.73)工具变量的选择应工具变量的选择应满足以下条件满足以下条件:工具变量必须具有实际:工具变量必须具有实际经济意义;工具变量与内生解释变量高度相关,但与随机经济意义;工具变量与内生解释变量高度相关,但与随机项不相关;工具变量与模型中的其他解释变量也不相关;项不相关;工具变量与模型中的其他解释变量也不相关;模型中多个工具变量之间不相关。模型中多个工具变量之
31、间不相关。注意注意,工具变量对内生解释变量的替代并不是,工具变量对内生解释变量的替代并不是“完全完全”替代,替代,即不是用工具变量代换模型中对应的内生解释变量,而是即不是用工具变量代换模型中对应的内生解释变量,而是在最小二乘法的正规方程组中用工具变量对内生解释变量在最小二乘法的正规方程组中用工具变量对内生解释变量进行部分替代。进行部分替代。工具变量法工具变量法(Instrument Variable,IV)是消除内生性的一)是消除内生性的一种常用方法,应用的种常用方法,应用的基本思路基本思路是,当出现内生解释变量,是,当出现内生解释变量,即解释变量与随机项相关时,则寻找另一个变量,该变量即解释
32、变量与随机项相关时,则寻找另一个变量,该变量与内生解释变量高度相关,但与随机项不相关,称该变量与内生解释变量高度相关,但与随机项不相关,称该变量为为工具变量工具变量,用其替代内生解释变量参与参数的估计过程。,用其替代内生解释变量参与参数的估计过程。第三节第三节内生性问题的解决办法内生性问题的解决办法一、一、工具变量法工具变量法由由OLS推导的正规方程和参数估计值公式为:推导的正规方程和参数估计值公式为:设有一元线性回归模型:设有一元线性回归模型:(6.16)采用矩方法(采用矩方法(Moment Method,MM)也可推导出完全一)也可推导出完全一样的结果:样的结果:(6.17)(6.18)由
33、假定由假定SLR.3,可知,可知 ,对应对应的的样样本矩条件本矩条件为为:即有:即有:,将,将代入,有:代入,有:整理后,得到正规方程组:整理后,得到正规方程组:(6.20)如果解释变量内生,则第二个矩条件不能满足,样本矩条如果解释变量内生,则第二个矩条件不能满足,样本矩条件件 也就无从谈起,所以,无法推导出(也就无从谈起,所以,无法推导出(6.21),),OLSE是不是不一致的。一致的。可可见见(6.20)()(6.17)完全相同,)完全相同,MM估估计计量(量(6.21)与)与OLS估估计计量(量(6.18)也完全一致。)也完全一致。说说明在明在这这种情况下,种情况下,OLS等价于等价于M
34、M。解得:解得:(6.21)此此时时我我们们需要需要寻寻找一工具找一工具变变量量z。满满足足替换(替换(6.19)中的第二个方程,得:)中的第二个方程,得:对应的样本矩条件为对应的样本矩条件为,即,即 ,这种方法称为这种方法称为工具变量法工具变量法。解得:解得:对应的正规方程组为:对应的正规方程组为:当当xj (j=1,2,k)与随机与随机项项ui相关,相关,设设xj 的工具的工具变变量量为为zj(j=1,2,k),即每一个解释变量均对应一个工具变量。即每一个解释变量均对应一个工具变量。这样这样得到方程得到方程组组:将上述一元线性回归模型的工具变量法推广到多元线性回将上述一元线性回归模型的工具
35、变量法推广到多元线性回归模型的情形:归模型的情形:根据工具变量应满足的条件,可得:根据工具变量应满足的条件,可得:将关系式将关系式代入上式,整理得:代入上式,整理得:(6.28)注意注意:工具变量法属于:工具变量法属于矩方法矩方法。可以证明,无论对于一元。可以证明,无论对于一元线性模型还是多元线性模型,参数的线性模型还是多元线性模型,参数的工具变量估计量都是工具变量估计量都是有偏但一致的估计量有偏但一致的估计量。参数的工具变量的估计量为:参数的工具变量的估计量为:(6.29)其矩阵形式为:其矩阵形式为:例例63 以以 代表国内生产总值,以代表国内生产总值,以 代表消费,以代表消费,以 代表代表
36、政府支出。表政府支出。表6-5给出了某地上述三项指标的数据。理论研给出了某地上述三项指标的数据。理论研究证明,国内生产总值与随机项相关,而外生的政府支出究证明,国内生产总值与随机项相关,而外生的政府支出与随机项无关,但与国内生产总值高度相关。试用工具变与随机项无关,但与国内生产总值高度相关。试用工具变量法估计国内生产总值对于消费的边际效应。量法估计国内生产总值对于消费的边际效应。年份年份xyz年份年份xyz17164.34694.52468.6925863.615952.19636.028792.15773.03386.01034500.620182.112998.0310132.86542.
37、03846.01147110.927216.219260.6411784.07451.24322.01258510.533635.023877.0514704.09360.15495.01368330.440003.926867.2616466.010556.56095.01474894.343579.428457.6718319.511365.26444.01579853.346405.930396.0821280.413145.9515.0表表6-5国内生国内生产总值产总值、消、消费费、政府支出数据、政府支出数据(单单位:位:亿亿元)元)由于内生性的国内生由于内生性的国内生产总值产总值x与
38、随机与随机项项u相关,而外生性的政相关,而外生性的政府支出府支出z与随机与随机项项u无关,且与国内生无关,且与国内生产总值产总值x高度相关,故高度相关,故可用可用z作作为为国内生国内生产总值产总值x的工具的工具变变量。参数估量。参数估计计如下:如下:设消费设消费 与国内生产总值与国内生产总值 之间具有线性关系,可建立如下模型:之间具有线性关系,可建立如下模型:=0.568876.01则样则样本回本回归归模型模型为为:即国内生即国内生产总值对产总值对于消于消费费的的边际边际效效应为应为0.568。EViews软软件中,工具件中,工具变变量法操作如下:量法操作如下:点点击击Quick/Estima
39、teEquation,在打开的,在打开的对话对话框中,框中,“EstimationSettings/Method”选择选择“TSLS-Two-StageLeastSquare(TSNLSandARMA)”,在,在“EquationSpecification”栏栏中中输输入方程形式入方程形式“ycx”,在,在“InstrumentList”栏栏中中输输入入“cz”(图图6-1)。)。DependentVariable:YMethod:Two-StageLeastSquaresInstrumentlist:CZVariableCoefficientStd.Errort-StatisticProb.
40、C876.0101123.73837.0795380.0000X0.5680510.003003189.14980.0000R-squared0.999651Meandependentvar19724.20AdjustedR-squared0.999624S.D.dependentvar14652.80S.E.ofregression284.1214Sumsquaredresid1049425.F-statistic35777.64Durbin-Watsonstat1.297665Prob(F-statistic)0.000000表表6-6 EViews输出结果输出结果点击点击“OK”即可得到
41、回归结果如下:即可得到回归结果如下:实际问题分析时往往有不只一个的外生变量被遗漏,排斥在实际问题分析时往往有不只一个的外生变量被遗漏,排斥在模型之外,且可能与内生解释变量相关,这意味着它们都是模型之外,且可能与内生解释变量相关,这意味着它们都是有效的工具变量。这时应该如何选取工具变量来消除内生性有效的工具变量。这时应该如何选取工具变量来消除内生性呢?泰尔呢?泰尔(H.Theil,1953)、贝斯曼、贝斯曼(R.L.Basmann,1957)分别分别提出用提出用两阶段最小二乘法两阶段最小二乘法(Two Stage Least Square,TSLS)来)来处理此类问题。本节只讨论单个内生解释变量
42、的处理此类问题。本节只讨论单个内生解释变量的TSLS。二、二、两阶段最小二乘法两阶段最小二乘法那么,如何选择那么,如何选择“最好最好”的工具变量呢?的工具变量呢?与与y2的相关关系越的相关关系越强强的的变变量,作量,作为为y2的工具的工具变变量越合适,所量越合适,所以将以将y2表述表述为为:其中,其中,y1是被解是被解释变释变量,量,x1是是外生解外生解释变释变量量(ExogenousVariables),),y2是内生解是内生解释变释变量。量。对该对该方程我方程我们们感感兴兴趣的是趣的是系数系数,所以可以称,所以可以称为为结结构方程构方程(StructuralEquation)。如)。如果存
43、在两个外生果存在两个外生变变量量z1、z2,与,与u不相关,与不相关,与y2相关,相关,则则z1与与z2都可以作都可以作为为y2的工具的工具变变量。而且,既然量。而且,既然x1、z1、z2均与均与u不相不相关,那么其任何关,那么其任何线线性性组组合也与合也与u不相关,即不相关,即x1、z1、z2的任意的任意线线性性组组合都可以作合都可以作为为y2的工具的工具变变量。量。假设有二元回归模型:假设有二元回归模型:(6.32)即用内生变量对所有的外生变量和工具变量构造回归模型,即用内生变量对所有的外生变量和工具变量构造回归模型,对应于最初的结构方程,该方程我们称之为对应于最初的结构方程,该方程我们称
44、之为简化方程简化方程(Reduced Equation)。)。即是我们要得到的工具变量。即是我们要得到的工具变量。注意注意:为为避免避免产生多重共线性,这里要求模型产生多重共线性,这里要求模型(6.32)中中 至少有一个不是至少有一个不是0。实际应实际应用中用中,直接用,直接用y2对对所有的外生解所有的外生解释变释变量和工具量和工具变变量量进进行回行回归归,得到的,得到的y2的的拟拟合合值值作作为为y2的工具的工具变变量。量。对对 的检验可以直接利用的检验可以直接利用F检验来完成。检验来完成。接下来便可以利用接下来便可以利用作作为为y2的工具的工具变变量量进进行行OLS估估计计。这这就就是是两
45、两阶阶段最小二乘法段最小二乘法(TwoStageLeastSquare,TSLS)。)。顾顾名思名思义义,所,所谓谓的的TSLS即是即是分两个分两个阶阶段估段估计计模型模型,即,即第一第一阶阶段:利用内生解段:利用内生解释变释变量量y2对对所有外生解所有外生解释变释变量和工具量和工具变变量做回量做回归归,得到其,得到其拟拟合合值值.第二第二阶阶段:将段:将作作为为y2的工具的工具变变量量继续继续做回做回归归,得到最,得到最终终的回的回归归模型。模型。其中,其中,wage表示小表示小时时工工资资,educ表示受教育情况,是内生解表示受教育情况,是内生解释变释变量,量,exper表示表示实际实际工
46、作工作经验经验,是外生解,是外生解释变释变量,量,u与与exper和和 exper2均不相关。假定我均不相关。假定我们还认为们还认为母母亲亲的受教育情的受教育情况(况(meduc)和父)和父亲亲的受教育情况(的受教育情况(feduc)与)与u不相关。那不相关。那么我么我们们可以将它可以将它们们都用作内生解都用作内生解释变释变量量educ的工具的工具变变量。量。educ的的简简化方程可写化方程可写为为:例例64建立回建立回归归模型考模型考查查工工资资和受教育情况、和受教育情况、实际实际工工作作经验经验之之间间的关系,利用的关系,利用TSLS对对模型模型进进行回行回归归分析。分析。设设原原始模型始
47、模型为为:(6.34)(6.35)利用利用Eviews对该对该模型做回模型做回归归,首先建立工作文件,将数据,首先建立工作文件,将数据录录入。点入。点击击Quick/EstimateEquation,在出,在出现现的窗口中的窗口中“EstimationSettings/Method”选择选择“TSLS-Two-StageLeastSquare(TSNLSandARMA)”,在,在“EquationSpecification”栏栏中中输输入方程形式入方程形式“log(wage)ceducexperexper2”,“InstrumentList”栏栏中中输输入入“cexperexper2meduc
48、feduc”,(,(图图6-2)。)。表表6-7 EViews输出结果输出结果点击点击OK,输出结果如表,输出结果如表6-7所示。所示。Method:Two-StageLeastSquaresIncludedobservations:428afteradjustmentsInstrumentlist:CEXPEREXPER2MEDUCFEDUCVariableCoefficientStd.Error t-Statistic Prob.C0.0481000.4003280.120152 0.9044EDUC0.0613970.0314371.953024 0.0515EXPER0.0441700
49、.0134323.288329 0.0011EXPER2-0.0008990.000402-2.237993 0.0257R-squared0.135708Meandependentvar1.190173AdjustedR-squared0.129593S.D.dependentvar0.723198S.E.ofregression0.674712Sumsquaredresid193.0200F-statistic8.140709Durbin-Watsonstat1.945659Prob(F-statistic)0.000028Second-StageSSR212.2096所估所估计计的教育情
50、况的教育情况educ回回归归系数系数为为0.0614,意味着其他条件,意味着其他条件不不变变的前提下,每多接受一年教育工的前提下,每多接受一年教育工资资平均地增加平均地增加6.14%。由于它相由于它相对对大的大的标标准准误误,在,在对应对应着双着双侧对侧对立假立假设设的的0.05的的显显著水平上,著水平上,TSLS估估计值计值几乎不几乎不显显著。著。注意注意:如果回:如果回归归模型中存在多个内生解模型中存在多个内生解释变释变量,那么量,那么对对每个每个内生解内生解释变释变量都要量都要寻寻找工具找工具变变量。量。这这涉及到模型的涉及到模型的识别问题识别问题。关于关于这这个个问题问题,可以参考本,