《计量经济学模型的计量检验.pptx》由会员分享,可在线阅读,更多相关《计量经济学模型的计量检验.pptx(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学与应用5.模型的计量检验模型的计量经济学检验内容提要1.多重共线性问题2.异方差问题3.自相关问题4.模型设定和诊断5.正态性检验6.参数稳定性检验多重共线性 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multi-collinearity)。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。产生多重共线性的主要原因(1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于
2、下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。(2 2)滞后变量的)滞后变量的引入引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。多重共线性(3)样本资料的样本资料的限限制制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。如:在医药研究中,可能只有少数病人,但却要在谈们身上收集大量的变量信息。多重共线性的后果1.1.完全共线的情况下参数估计量失效完全共线的情况下参数估计量失效2.2.近似共线近似共线的情况下,的
3、情况下,OLS参数估计量的方差增大参数估计量的方差增大多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor,VIF)3.3.参数估计参数估计量经济含义不合理量经济含义不合理如果模型中两个解释变量具有线性相关性,例如 X2=X1,这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常表现出似似乎乎反反常常的的现现象象:例如1本来应该是正的,结果恰是负的。多重共线性的后果 4.变量变量的显著性检验失去的显著性检验失去意义意义 5.模型模型的预测
4、功能失效的预测功能失效变大的方差容易使区间预测的“区间”变大,使预测失去意义。存在多重共存在多重共线性性时参数估参数估计值的方差与的方差与标准差准差变大大容易使通容易使通过样本本计算的算的t值小于小于临界界值,误导作出参数作出参数为0的推断的推断可能将重要的解可能将重要的解释变量排除在模型之外量排除在模型之外多重共线性检验 1 1、检验多重共线性是否、检验多重共线性是否存在存在(1(1)简单简单相关系数法相关系数法 两个变量时,求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。多个变量时,如果两两变量的相多个变量时,如果两两变量的相关系数高,则存在多重共线性,如
5、果两两变量的相关系数不高,不关系数高,则存在多重共线性,如果两两变量的相关系数不高,不能说明不存在多重共线性,因为多个解释变量之间可能线性相关。能说明不存在多重共线性,因为多个解释变量之间可能线性相关。(2)2)采用综合采用综合统计检验法统计检验法 若 在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。多重共线性检验 2 2、判明存在多重共线性的、判明存在多重共线性的范围范围 如果存在多重共线性,需进一步确定究竟由哪些变量引起。(1)判定系数检验法判定系数检验法使模型中每一个解释变量分别
6、以其余解释变量为解释变量进行回归,并计算相应的拟合优度。如果某一种回归Xji=1X1i+2X2i+LXLi的判判定定系系数数较大,说明Xj与其他X间存在共线共线性性在模型中排除某一个解释变量Xj,估计模型;如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。多重共线性检验(2)逐步回归逐步回归法法 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。如果如果拟合优度变化显著拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果如果拟合优度变化很不显著拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线
7、性关系。克服多重共线性的方法 第一类方法:排除引起共线性的变量第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去。以逐步回归法逐步回归法得到最广泛的应用。第二第二类方法:类方法:差分法差分法时间序列时间序列数据、线性模型数据、线性模型:将原模型变换为差分模型:Yi=1 X1i+2 X2i+k Xki+i可以有效地消除原模型中的多重共线性。一般讲,增量之间的线性关系远比总量之间的线性关系弱得多一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。克服多重共线性的方法 第三类方法:减小第三类方法:减小参参数估计量的方差数估计量的方差多重共线性多重共线性的主要后果后果是参
8、数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。增加增加样本容量样本容量,可使参数估计量的方差减小可使参数估计量的方差减小。异方差对于不同的样本点对于不同的样本点,随机误差项的方差不再是常数随机误差项的方差不再是常数,而互不相而互不相同同,则认为出现了则认为出现了异方差性异方差性(Heteroskedasticity)。异方差异方差一般可归结为三种类型:(1)单调递增型:i2随X的增大而增大(2)单调递减型:i2随X的增大而减小(3)复杂型:i2与X的变化呈复杂形式例子:截面资料下研
9、究居民家庭的储蓄行为 Yi=0+1Xi+iYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化异方差异方差产生的原因1.由问题的经济背景所产生的异方差截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+iYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入2.由于模型中忽略了某些重要的解释变量所产生的异方差误差项中包含了缺少的自变量对于因变量的解释部分,当该自变量有规律变化时,误差项也会呈现相应的变化,导致异方差现象出现。3.因模型的函数形式设定不当而产生的异方差如:将指数模
10、型误设为线性模型4.经济结构变化所引起的异方差经济情况的变化使经济模型在不同时期存在差异,如计划经济时期和市场经济时期。异方差性的后果 参数估计量非有效参数估计量非有效 OLS估计量仍然具有仍然具有无偏性无偏性,但不具有不具有有效性有效性 变量的显著性检验失去意义变量的显著性检验失去意义T检验是建立在方差不变而正确估计了参数方差的基础上的,如果出现了异方差,那么t检验就失去了意义。模型的预测失效模型的预测失效当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。回顾:BLUE Best Linear Unbiased Estimation
11、 高斯高斯马尔可夫定理马尔可夫定理(Gauss-Markov theorem)在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。(1)线)线 性性,即它是否是另一随机变量的线性函数;(2)无偏性)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性)有效性,即它是否在所有线性无偏估计量中具有最小方差。异方差性的检验 由于异方差性异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检检验验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式形式
12、”。1.1.图解法图解法2.2.帕克帕克(Park)检验与戈里瑟检验与戈里瑟(Gleiser)检验检验3 3.怀特(怀特(White)检验)检验前两种直接输入eviews看p值,p值越小越存在异方差4 4.戈德菲尔德戈德菲尔德-匡特匡特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验将n对样本观察值(Xi,Yi)按观察值Xi的大小排队将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行OLS回归,并计算各自的残差平方和在同方差性假定下,构造如下满足F分布的统计量给定显著性水平,确
13、定临界值F(v1,v2),若F F(v1,v2),则拒绝同方差性假设,表明存在异方差存在异方差。比较两端值得方差是否相同举例 财富500强企业中的447个高管薪水数据.salary表示1999年薪水和奖金;totcomp表示1999年CEO总薪水;tenure表示任职CEO的年数;age表示CEO的年龄;sale表示1998年公司销售收入;profit表示1998年公司利润;assets表示1998年公司总资产。举例 怀特检验:因为p值为,小于显著水平,因而拒绝原假设,模型存在异方差。格里瑟检验:F检验统计量概率为0小于,因此拒绝原假设,模型存在异方差。G-Q检验 先将序列排序,将序列中间的1
14、11个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,对每个子样分别进行OLS回归,并计算各自的残差平方和。计算F分布的统计量:查表得拒绝原假设,存在异方差异方差的修正模型检验出存在异方差性,可用加权最小二乘法来消除异方差。(方差已知方差已知)加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。其思想是:用解释变量或解释变量的算术根(1/x为权重)除原回归式克服异方差也可用怀特异方差校正功能(方差未知方差未知)来消除异方差以上两种都可以通过Eviews实现通过对数据取自然对数消除异方差 异方差的修正序列相关性 自相关定义为:按时间(在时
15、间序列数据中)或空间(在横截面数据中)排序的观测序列个成员之间的相关。经典模型假定,任一次观测的干扰项都不收任何其他观测干扰项的影响。对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 随机项互不相关的基本假设表现为 Cov(i,j)=0 ij,i,j=1,2,n 如果对于不同的样本点,随机误差项之间不再是不相关的,而是存如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了在某种相关性,则认为出现了序列相关性序列相关性。序列相关性产生的原因 1 1、经济变量固有的惯性、经济变量固有的惯性 大多数经济时间数据都有一个明显的特点:惯性惯性,表现在时
16、间序列不同时间的前后关联上。例如GDP、价格、就业等经济数据,都会随经济系统的周期而波动。又如,在经济高涨时期,较高的经济增长率会持续一段时间,而在经济衰退期,较高的失业率也会持续一段时间,这种情况下经济数据很可能表现为自相关。序列相关性产生的原因 2 2、模型设定的偏、模型设定的偏误误 所谓模型设定偏误设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t 但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt 因此,vt=3X3t+t,如
17、果X3确实影响Y,则出现序列相关。序列相关性产生的原因 3 3、数据的、数据的“编造编造”在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。例如:将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动,使季度数据具有平滑性,这种平滑性可能产生序列自相关。对缺失的历史资料,采用特定统计方法进行内插处理,也可能使得数据前后期相关,而产生序列自相关。序列相关性的后果 1 1、参数估计量非、参数估计量非有效有效 参数的ols估计不再具有最小方差性,从而不再是参数的有效估计,这是估计的精度大大降低 2、变量的、变量的显著性检验显著
18、性检验失去失去意义意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。如果存在序列相关,估计的参数方差出现偏误,t检验就失去意义了。其他检验也是如此。3、模型的预测模型的预测失效失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。序列相关性的检验 序列相关性的检验 序列相关性的检验 3.杜宾杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验)检验法法 D-W检验是杜宾()和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法适应于检验随机
19、误差项之间存在一阶自相关的情况。i=i-1+i 杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:得出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。序列相关性的检验 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关 0 dL dU 2 4-dU 4-dL 正相关不能确定无自相关不能确定负相关序列相关性的检验 如果存在如果存在完全一阶正相关完全一阶正相关,即,即=1,则,则 D.W.0 完全一阶负相关完全一
20、阶负相关,即,即=-1,则则 D.W.4 完全不相关完全不相关,即即=0,则,则 D.W.2 简单来说,DW统计量越接近2,序列自相关性就越小,越接近0,序列就越呈现正相关,越接近4;序列就越呈现负相关。缺点:只适用于一阶自相关存在两个不能判定的区域-解决方式:增加样本容量序列相关的补救 模型设定偏误 模型设定偏误主要有两大类:1.关于关于解释变量选取的偏误解释变量选取的偏误,主要包括漏选相关变量漏选相关变量和多选无关多选无关变变量量设定模型时漏掉了一个相关的解释变量设定模型时,多选了一个无关解释变量。Y=0+1X1+2X2+Y=0+1X1+2X2+3X3+动态动态设定偏误设定偏误(dynam
21、ic mis-specification):遗漏相关变量表现为对Y或X滞后项的遗漏。2.关于关于模型函数形式选取的偏误模型函数形式选取的偏误。模型设定偏误的后果 当模型设定出现偏误时,模型估计结果也会与“实际”有偏差。这种偏差的性质与程度与模型设定偏误的类型密切相关偏差的性质与程度与模型设定偏误的类型密切相关。遗漏相关变量偏遗漏相关变量偏误误1.使得OLS估计量在估计量在小样本下有偏,在大样本下非一致小样本下有偏,在大样本下非一致。2.截距项的估计有偏,其方差是系数方差的有偏估计3.残差的方差估计有偏包含无关变量偏包含无关变量偏误误进行OLS估计,可得到无偏且一致的估计量,但是OLS估计量却不
22、具有最小估计量却不具有最小方差性。方差性。错误函数形式偏错误函数形式偏误误偏偏误是全方位的误是全方位的模型设定偏误的检验 模型设定偏误的检验(a)趋势变化)趋势变化 :模型设定时可能遗漏了一随着时间的推移而持续上升的变量(b)循环变化:)循环变化:模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量 一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。模型函数形式设定偏误时残差序列呈现正负交替变化。模型设定偏误的检验 B.一般性一般性设定偏误设定偏误检验检验 更准确更常用的判定方法:拉姆齐(Ramsey)于1969年提出的所谓RESET 检验检验(regression err
23、or specification test)。基本思想:基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。RESET检验中,采用所设定模型中被解释变量Y的估计值的若干次幂来充当该“替代”变量。模型设定偏误的检验 Eviews正态性检验统计检验过程是建立在假设随机误差项服从正态分布的基础上的。由于不能直接观察真实的误差项,但能够得到其近似值即残差,因此可通过对残差残差的研究来研究误差项的正态性。在有限样本中,如果没有正态性假定,通常T和F统计量就不服从t和F分布。正态性检验-残差直方图
24、 残差直方图残差直方图(Histogram of Residuals)。残差直方图是用于了解随机变量的PDF形状的一个简单图示。在水平轴上,我们将所关注变量的值(比如OLS残差)分成适当的区间,在每个区问里,我们做垂直的矩形,并让矩形的高等于落在该区间内的观测次数(即频数)。如果你从心里在直方图上估画一条钟形的正态分布曲线,那你就对正态(PTF)近似是否适当有些认识。用画残差直方图作为检验正态性假定的一种粗略和灵便的方法总是一种好的做法。正态性检验-雅克-贝拉检验 一种常用的正态性检验方法是Jarque-Bera(雅克-贝拉)检验,简称JB检验。雅克贝拉检验,也称为偏度峰度检验,是一种正态性检
25、验检验方法.基本原理是采用观测数据的样本偏度和样本峰度检验样本的总体是否符合正态分布.在正态分布假设下,JB统计量渐进服从自由度为2的卡方分布 许多统计软件可以实现这一检验,Eviews可以实现。P值越大,越服从正态分布参数稳定性检验-邹氏检验 在我们使用一个涉及时间序列数据时间序列数据的回归时,回归子Y和回归元之间的关系可能会出现结构变动(structural change)。结构变动意味着,模型中的参数值在整个期间内不能保持相同模型中的参数值在整个期间内不能保持相同。结构变动有时源于外部力量(如1973年和1979年OPEC石油卡特尔提出的石油涨价或1990-1991年的海湾战争),或源于
26、政策变化,(如1973年期间从固定汇率制向浮动汇率制的转换),或国会所采取的行动(如里根总统在其两任任期内的税收变化或最小工资率的变化),或一系列其他原因。邹至庄参数稳定性检验(Chow test for parameter stability)邹氏检验、邹检验、邹氏转折点检验 邹氏转折点检验的目的是检验在整个样本的各个子样中模型的系数整个样本的各个子样中模型的系数是否相等。是否相等。如果模型在不同子样中的系数不同,则说明模型中存在着转折点。参数稳定性检验-邹氏检验1.分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方:RSS1与RSS22.将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR3.计算F统计量的值,与临界值比较:若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。注意事项注意事项:必须满足古典假定条件邹氏检验的结果仅告诉我们是否存在结构差异,而无法得知导致这种差异的原因,是来自于截距、斜率还是二者都有。邹检验假定知道结构发生变化的时间点。如果不清楚这一信息,则需要采用其它方法。解决解决方法:方法:设定成两个模型Eviews谢谢!下次讲解:模型专题