《计量经济学-模型设定.ppt》由会员分享,可在线阅读,更多相关《计量经济学-模型设定.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、内容回顾:什么是虚拟变量?它有什么作用?引入虚拟变量的方式有几种?各在什么情况下引入?CHOW检验需要首先判断出什么点?如何操作?其检验的原理是什么?第十章第十章 模型设定偏误问题模型设定偏误问题 第一节第一节 模型设定偏误模型设定偏误一、模型设定偏误的类型一、模型设定偏误的类型 二、模型设定偏误的后果二、模型设定偏误的后果 三、模型设定偏误的检验三、模型设定偏误的检验 一、模型设定偏误的类型一、模型设定偏误的类型 模型设定偏误主要有两大类:(1)关于解释变量选取的偏误关于解释变量选取的偏误,主要包括漏漏选相关变量选相关变量和多选无关变量多选无关变量,(2)关于模型函数形式选取的偏误关于模型函
2、数形式选取的偏误。1、相关变量的遗漏、相关变量的遗漏 (omitting relevant variables)例如例如,如果“正确”的模型为而我们将模型设定为 即设定模型时漏掉了一个相关的解释变量。这类错误称为遗漏相关变量遗漏相关变量。动态设定偏误动态设定偏误(dynamic mis-specification):遗漏相关变量表现为对Y或X滞后项的遗漏。2、无关变量的误选、无关变量的误选 (including irrevelant variables)例如例如,如果 Y=0+1X1+2X2+仍为“真”,但我们将模型设定为 Y=0+1X1+2X2+3X3+即设定模型时,多选了一个无关解释变量。
3、3、错误的函数形式、错误的函数形式 (wrong functional form)例如,如果“真实”的回归函数为 但却将模型设定为 二、模型设定偏误的后果二、模型设定偏误的后果 当模型设定出现偏误时,模型估计结果也会与“实际”有偏差。这种偏差的性质与程度与模偏差的性质与程度与模型设定偏误的类型密切相关型设定偏误的类型密切相关。1、遗漏相关变量偏误遗漏相关变量偏误 采用遗漏相关变量的模型进行估计而带来的偏误称为遗漏相关变量偏误遗漏相关变量偏误(omitting relevant variable bias)。设正确的模型为 Y=0+1X1+2X2+却对 Y=0+1X1+v进行回归,得将正确模型
4、Y=0+1X1+2X2+的离差形式 代入得(1)如果漏掉的X2与X1相关,则上式中的第二项在小样本下求期望与大样本下求概率极限都不会为零,从而使得OLSOLS估估计量在小样本下有偏,在大样本下非一致计量在小样本下有偏,在大样本下非一致。(2)如果X2与X1不相关,则1的估计满足无偏性与一致性;但这时0的估计却是有偏的。由 Y=0+1X1+v 得由 Y=0+1X1+2X2+得如果X2与X1相关,显然有如果X2与X1不相关,也有Why?案例分析:收入、财富与消费仍利用消费与收入和财富的关系例子。假定正确的模型是(由12个观察值估计的结果):若估计模型时只包括当期收入,得到的结果为:若估计模型时只包
5、括财富,得到的结果为:由所得系数可以看出,两种情况下均造成高估所保留变量的参数,据此做分析可能导致得出错误的结论。两个参数所处的区间应该分别为 和 关于遗漏必要的解释变量的总结遗漏必要的解释变量是一种严重的错误,必须注意避免。对别人的研究成果做评价时,是否存在遗漏必要解释变量的错误是需要考察的最重要的一个方面。凡存在这种错误,研究结果肯定是不可信的。自己研究中设定模型时,必须注意理论基础是否扎实。纯粹基于经验观察的模型只应看作是一种初步的探索。在遇到较严重的多重共线问题时,不要轻易地剔除变量,特别是重要的解释变量。2、包含无关变量偏误、包含无关变量偏误 采用包含无关解释变量的模型进行估计带来的
6、偏误,称为包含无关变量偏误包含无关变量偏误(including irrelevant variable bias)。设 Y=0+1X1+v (*)为正确模型,但却估计了 Y=0+1X1+2X2+(*)如果2=0,则(*)与(*)相同,因此,可将(*)式视为以2=0为约束的(*)式的特殊形式。由于所有的经典假设都满足,因此对 Y=0+1X1+2X2+(*)式进行OLS估计,可得到无偏且一致的估计量。但是,但是,OLS估计量却不具有最小方差性。估计量却不具有最小方差性。Y=0+1X1+v 中X1的方差:Y=0+1X1+2X2+中X1的方差:当X1与X2完全线性无关时:否则:注意:注意:3、错误函数
7、形式的偏误、错误函数形式的偏误 当选取了错误函数形式并对其进行估计时,带来的偏误称错误函数形式偏误错误函数形式偏误(wrong functional form bias)。容易判断,这种偏误是全方位的偏误是全方位的。例如,如果“真实”的回归函数为却估计线性式 显然,两者的参数具有完全不同的经济含义,且估计结果一般也是不相同的。三、模型设定偏误的检验三、模型设定偏误的检验 1、检验是否含有无关变量、检验是否含有无关变量 可用可用t 检验与检验与F检验完成。检验完成。检验的基本思想检验的基本思想:如果模型中误选了无关变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。t t检验检
8、验:检验某1个变量是否应包括在模型中;F F检验检验:检验若干个变量是否应同时包括在模型中 2、检验是否有相关变量的遗漏或函数、检验是否有相关变量的遗漏或函数形式设定偏误形式设定偏误 (1)残差图示法)残差图示法 残差序列变化图残差序列变化图(a)趋势变化)趋势变化:模型设定时可能遗漏了一随着时间的推移而持续上升的变量(b)循环变化:)循环变化:模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量 模型函数形式设定偏误时残差序列呈现正负模型函数形式设定偏误时残差序列呈现正负交替变化交替变化 图示:图示:一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。(2)一般性设定偏误检
9、验)一般性设定偏误检验 但更准确更常用的判定方法是拉姆齐(Ramsey)于1969年提出的所谓RESET 检验检验(regression error specification test)。基本思想:基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。RESET检验中,采用所设定模型中被解释变量Y的估计值的若干次幂来充当该“替代”变量。例如例如,先估计 Y=0+1X1+v 得 再根据增加解释变量的增加解释变量的F F检验检验来判断是否增加这些“替代”变量。若仅增加一个“替代”变量,也可
10、通过t t检验检验来判断。例如,例如,在一元回归中,假设真实的函数形式是非线性的,用泰勒定理将其近似地表示为多项式:RESET检验也可用来检验函数形式设定偏误的检验也可用来检验函数形式设定偏误的问题。问题。因此,如果设定了线性模型,就意味着遗漏了相关变量X12、X13,等等。因此,在一元回归中,可通过检验(*)式中的各高次幂参数的显著性来判断是否将非线性模型误设成了线性模型。(*)对多元回归多元回归,非线性函数可能是关于若干个或全部解释变量的非线性,这时可按遗漏变量的按遗漏变量的程序进行检验程序进行检验。例如,例如,估计 Y=0+1X1+2X2+但却怀疑真实的函数形式是非线性的。这时,只需以估
11、计出的的若干次幂为“替代”变量,进行类似于如下模型的估计再判断各“替代”变量的参数是否显著地不为零即可。例例:在4.3商品进口的例中,估计了中国商品进口M与GDP的关系,并发现具有强烈的一阶自相关性。然而,由于仅用GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。因此,序列相关性的主要原因可能就是建模时遗漏了重要的相关变量造成的。下面进行RESET检验。用原回归模型估计出商品进口序列 R2=0.9484 (-0.085)(8.274)(-6.457)(6.692)R2=0.9842 在=5%下,查得临界值F0.05(2,20)=3.49判断:拒绝原模型与引入新变量的
12、模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。模型设定检验方法模型设定产生错误的主要原因有:缺乏估计正确模型所需的数据资料。理论认识不完善,无法确定必要的解释变量。对于第一种原因,可以考虑选择适当的替代变量。理想的情况是,替代变量与原变量有尽可能高的相关性,与模型中其它变量有尽可能低的相关性。这种处理可能降低估计参数的有效性,但保证得到无偏估计。模型设定检验方法对于第二种原因,可以采取下列统计检验手段来判断回归模型设定是否正确:第一种情况第一种情况:一个备选方程是其它所有备选方程的一般情况,例如:需求与价格及收入方程:需求与价格方程(需求曲线):需求与收入方程(恩格尔
13、曲线):第一个方程是另两个方程的组合。对于这种情况,可以估计方程1,然后根据得到的t统计值和F统计值,检验哪个模型与数据更一致。模型设定检验方法第二种情况第二种情况:两个备选模型有不同的解释变量(代表相互冲突的两种理论模型)假定相互冲突的两种理论模型分别为:可以构造出一个一般形式的方程如:对第一种理论正确性的检验为:对第二种理论正确性的检验为:模型设定检验方法第二种情况属于非包容(Non-nested)模型,更严谨的检验方法为J检验。假定两个模型分别为:X是第一种理论提出的解释变量,Z是第二种理论提出的解释变量,X和Z可以有部分相同。我们可以将两个模型分别看作是虚假设和备择假设。J检验的思路:
14、如果某个模型设定是正确的,那么若把由另一个模型得到的拟合值也用作该模型的解释变量,其系数不应该具有统计显著性(为什么?)。模型设定检验方法J检验的步骤如下:分别估计两个方程,得到各自的拟合值 和 。将 加入到第一个方程中用作解释变量,将 加入到第二个方程中用作解释变量,分别估计:根据 和 的统计显著性,我们可以得到以下结果:显著,不显著:拒绝第一个模型,接受第二个模型。不显著,显著:接受第一个模型,拒绝第二个模型。显著,显著:两个模型均被拒绝,应提出新的解释。不显著,不显著:无法区分两个模型的优劣。模型设定检验方法对涉及多个系数的虚假设做联合检验可以采用F检验,有关方法前面已经做了介绍。第二节
15、 测度误差自变量有测度误差;因变量有测度误差;自变量、因变量有测度误差;工具变量法。因变量存在测度误差 假定真实方程为 ,实际得到的Y的观测值则为 ,假定 。若忽略因变量的测定误差,实际估计那么将得到:由于假定X与测定误差v相互独立,故用OLS方法估计该方程仍可以得到的无偏和一致性估计。在 时,方程常数项0的估计值不同于真实参数值。因变量测度误差vi的影响反映在回归方程的估计方差s2中。解释变量X含有测度误差假定真实回归模型如 ,X的观测值与真实值关系为 。实际回归:在此情况下,即使假定X的测度误差服从正态分布,E(vi)=0,不存在序列相关,Cov(xi,vi)=0,采用OLS方法估计仍存在
16、 与 相关的问题,有此时用OLS方法得到的参数估计是有偏的和不一致的。偏差的程度取决于测定误差方差的大小。X和Y都含有测度误差假定 ,简化的回归方程为 ;ui与vi相互独立,并且均独立于X;误差项不存在序列相关。实际估计方程为 ,斜率的估计值为:X和Y都含有测度误差对于随机变量有由于u、v和x均为随机变量,因而难以确定估计参数的偏差方向。依据一致性标准评价有:即忽略测定误差时可能出现低估真实参数的情况。对于社会科学研究来说,有相当多的变量是非试验性的,因而不可能重现。因而就样本资料而言,OLS估计结果的无偏性无法得到保证,在应用工作中更为重视的是一致性标准。变量存在测度误差时的估计方法实际工作
17、中,通常的做法是忽略变量测定误差。这种处理方式假定,变量测度误差很小,并且是随机的,从而不会严重影响估计结果的可靠性。如果认为上述假定不成立,那么就应该采用更适合的估计技术。工具变量法(Instrumental variables)就是这样一种技术,从原则上说,它可以解决变量含有测度误差时的模型估计问题。工具变量法用Z表示工具变量,该变量需要具有以下性质:随着样本容量的增大,Z与误差项u和v的相关程度趋近于零;随着样本容量的增大,Z与X的相关程度不会趋近于零(理想的情况是X与Z有尽可能高的相关程度)。工具变量法依赖大样本时估计参数具有的渐近无偏性质。对于小样本情况,该方法无法保证得到参数的无偏
18、估计。若存在若干可以选择的工具变量,应该选择与X相关程度最高的Z。工具变量法以解释变量X含有测度误差的情况为例:估计的方程为方程左右两边乘以Z得到对所有的观察值求和,得到根据古典假定,最后一项随样本容量增大而趋近于零。据此得到工具变量法斜率系数估计量:根据假定条件有工具变量法需要注意的是,OLS为工具变量法的一个特例,即Z=X这一情况。根据古典假定,X不含有误差,与自身的相关系数等于1,因而符合工具变量的性质要求。工具变量可以有多个,在选择工具变量时需要利用常识和经济学理论来判断是否有理由假定Cov(z,u)=0;我们可以用统计方法检验Cov(z,x)0。工具变量法的问题:估计结果对选择的工具变量较为敏感小样本时不能满足一致性要求EVIEWS中的模型设定检验EVIEWS提供了多种模型设定检验功能Test for omitted variables在相应的窗口列出可能遗漏的解释变量;H0:添加变量不显著,即新增变量系数为零。如果F值较小,其对应概率较大,则认可原假设。Test for redundant variables在相应的窗口列出可能多余的解释变量;Chows breakpoint或forecast test(参数稳定性检验)在相应的窗口列出参数可能发生变化的年份;Ramseys RESET Test(模型设定错误)