第五讲多重共线性异方差自相关课件.ppt

上传人:石*** 文档编号:39999180 上传时间:2022-09-08 格式:PPT 页数:67 大小:3.24MB
返回 下载 相关 举报
第五讲多重共线性异方差自相关课件.ppt_第1页
第1页 / 共67页
第五讲多重共线性异方差自相关课件.ppt_第2页
第2页 / 共67页
点击查看更多>>
资源描述

《第五讲多重共线性异方差自相关课件.ppt》由会员分享,可在线阅读,更多相关《第五讲多重共线性异方差自相关课件.ppt(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第五讲多重共线性异方差自相关第1页,此课件共67页哦一、多重共线性的概念一、多重共线性的概念 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。含义:解释变量的样本向量近似线性相关。多重共线性来源:(1)解释变量x受到同一个因素的影响;例如:政治事件对很多变量都产生影响,这些变量同时上升 或同时下降。(2)解释变量x自己的当期和滞后期;(3)错误设定。1212.kkxxxY对于模型其基本假设之一是解释变量是互相独立的。第2页,此课件共67页哦 二、多重共线性的后果的OLS估计量为:YXXX1)(完全共线性指的是解释变量中某个变量是其他变量的线性组

2、合,即c1X1+c2X2+ckXk=0其中ci不全为0,i=1,k1、完全共线性下参数估计量不存在YX如果存在完全共线性,则 不存在,无法得到参数的估计量。1()X X第3页,此课件共67页哦例:对离差形式的二元回归模型2211xxy如果两个解释变量完全相关,如x2=x1,则121)(xy这时,只能确定综合参数1+2的估计值:一个方程确定两个未知数,有无穷多个解。第4页,此课件共67页哦2 2、近似共线性下、近似共线性下OLS估计量非有效估计量非有效12)()(XXCov近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为10()X X 由于 ,引起主对角线元素 较大,使参数估计

3、值的方差增大,OLS参数估计量非有效。近似共线性指的是解释变量中某个变量不完全是其他解释变量的线性组合,还差个扰动项。即c1X1+c2X2+ckXkvi=0,其中ci不全为0,i=1,k1()XX第5页,此课件共67页哦 如果模型中两个解释变量具有线性相关性,例如果模型中两个解释变量具有线性相关性,例如如 X2=X1,这时,这时,X1和和X2前的参数前的参数 1、2并不反映各自与被解并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共释变量之间的结构关系,而是反映它们对被解释变量的共同影响。同影响。1、2已经失去了应有的经济含义,于是经常表已经失去了应有的经济含义,于是经常表现

4、出现出似乎反常的现象似乎反常的现象:例如:例如 1本来应该是正的,结果本来应该是正的,结果恰是负的。恰是负的。3、参数估计量经济含义不合理注:除非是完全共线性,多重共线性并不意味着任何基本假设的违背。第6页,此课件共67页哦 多重共线性诊断的任务多重共线性诊断的任务是:是:(1)检验多重共线性是否存在;)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在共线)估计多重共线性的范围,即判断哪些变量之间存在共线性。性。多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验、方差膨胀因子(VIF)法等。三、多重共线

5、性的诊断第7页,此课件共67页哦 (1)(1)对两个解释变量的模型,采用对两个解释变量的模型,采用简单相关系数法简单相关系数法 求出求出X1与与X2的简单相关系数的简单相关系数r,若,若|r|接近接近1,则说明两变,则说明两变量存在较强的多重共线性。量存在较强的多重共线性。(2)对多个解释变量的模型,采用综合统计检验法 若 在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。1、检验多重共线性是否存在第8页,此课件共67页哦 如果存在多重共线性,需进一步确定究竟由哪些变量如果存在多重共线性

6、,需进一步确定究竟由哪些变量引起。引起。2、判明存在多重共线性的范围(1)判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。如果某一种回归 Xji=1X1i+2X2i+kXki的判定系数较大,说明 X j 与其他X间存在共线性。第9页,此课件共67页哦具体可进一步对上述回归方程作具体可进一步对上述回归方程作F检验:检验:式中:式中:Rj2为第为第j个解释变量对其他解释变量的回归方程的可决系个解释变量对其他解释变量的回归方程的可决系数,数,若存在较强的共线性,则若存在较强的共线性,则Rj2较大且接近于较大且接近于1,这时(,这时(1-Rj2)较)较

7、小,从而小,从而Fj的值较大。的值较大。因此,给定显著性水平因此,给定显著性水平,计算,计算F值,并与相应的临界值比较值,并与相应的临界值比较,来判定是否存在相关性。,来判定是否存在相关性。构造如下F统计量2/2/1(1,)()()1jjjkRF kn kFRn k第10页,此课件共67页哦 在模型中排除某一个解释变量在模型中排除某一个解释变量 X j,估计模型;,估计模型;如果拟合优度与包含如果拟合优度与包含X j时十分接近,则说明时十分接近,则说明X j与其它解释变量之间存在共线性。与其它解释变量之间存在共线性。另一等价的检验是:第11页,此课件共67页哦 (2)逐步回归法逐步回归法 以以

8、Y为被解释变量,逐个引入解释变量,构成回为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。根据拟合优度的变化决定新引入的变量是否独立。如果拟合优度变化显著如果拟合优度变化显著,则说明新引入的变量是一,则说明新引入的变量是一个独立解释变量;个独立解释变量;如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入的变,则说明新引入的变量与其它变量之间存在共线性关系。量与其它变量之间存在共线性关系。第12页,此课件共67页哦(3)方差膨胀因子(VIF:Variance Inflation Factor)VIF指标:2(

9、)1,.,11KKKkVIF bRXk与其余变量回归所得的可决系数VIF范围:+1,+)判断:若VIF5,则认为多重共线性强,不可接受。(4)条件数(Condition Indix)maxmin条件数解释变量的相关矩阵的最大特征值与最小特征值相比调用数据库 neiyun.dta 讲解。条件数大于30,认为多重共线存在。第13页,此课件共67页哦 找出引起多重共线性的解释变量,将它排除出去。以逐步回归法逐步回归法得到最广泛的应用。v 注意:注意:这时,剩余解释变量参数的经济含义和数值都发这时,剩余解释变量参数的经济含义和数值都发生了变化。生了变化。如果模型被检验证明存在多重共线性,则需要发展新的

10、方法估计模型,最常用的方法有三类。四、克服多重共线性的方法 1、第一类方法:排除引起共线性的变量第14页,此课件共67页哦 时间序列数据、线性模型:将原模型变换为差分模型:Yi=1 X1i+2 X2i+k Xki+i可以有效地消除原模型中的多重共线性。一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。2、第二类方法:差分法第15页,此课件共67页哦 多重共线性多重共线性的主要的主要后果后果是参数估计量具有较大的方差,是参数估计量具有较大的方差,所以所以 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没有消除,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成

11、的模型中的多重共线性,但确能消除多重共线性造成的后果。后果。例如:例如:增加样本容量可使参数估计量的方差减小。增加样本容量可使参数估计量的方差减小。3、第三类方法:减小参数估计量的方差第16页,此课件共67页哦 六、案例六、案例中国粮食生产函数中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1);粮食播种面积(X2)成灾面积(X3);农业机械总动力(X4);农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+5 X5+调用数据库E:博士计量课程软件应用multi第17页,此课件共67页哦表表

12、 4.3.3 中国粮食生产与相关投入资料中国粮食生产与相关投入资料年份粮食产量Y(万吨)农业化肥施用量1X(万公斤)粮食播种面积2X(千公顷)受灾面积3X(公顷)农业机械总动力4X(万千瓦)农业劳动力5X(万人)1983387281659.811404716209.31802231645.11984407311739.811288415264.01949731685.01985379111775.810884522705.32091330351.51986391511930.611093323656.02295030467.01987402081999.311126820392.7248363

13、0870.01988394082141.511012323944.72657531455.71989407552357.111220524448.72806732440.51990446242590.311346617819.32870833330.41991435292806.111231427814.02938934186.31992442642930.211056025894.73030834037.01993456493151.911050923133.03181733258.21994445103317.910954431383.03380232690.31995466623593.

14、711006022267.03611832334.51996504543827.911254821233.03854732260.41997494173980.711291230309.04201632434.91998512304083.711378725181.04520832626.41999508394124.311316126731.04899632911.82000462184146.410846334374.05257432797.5第18页,此课件共67页哦 R2接近于1;给定=5%,得F临界值 F0.05(5,12)=3.11 F=137.11 3.11,故认上述粮食生产的总

15、体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解解释变量间可能存在多重共线性释变量间可能存在多重共线性。54321028.0098.0166.0421.0213.644.12816XXXXXY (-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)1、用OLS法估计上述模型:第19页,此课件共67页哦v发现:发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:X1X2X3X4X5X11.000.010.640.960.55X20.011.00-0.45-0.040.18X30.64-0.451.000.690.36

16、X40.96-0.040.691.000.45X50.550.180.360.451.00 2、检验简单相关系数第20页,此课件共67页哦v可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X3,X2,X4,X5间的回归:1576.464.30867XY (25.58)(11.49)R2=0.8919 F=132.12699.018.33821XY (-0.49)(1.14)R2=0.075 F=1.304380.00.31919XY (17.45)(6.68)R2=0.7527 F=48.75240.219.28259XY (-1.04)(2.66

17、)R2=0.3064 F=7.07 3、找出最简单的回归形式 (1.74)(7.25)R2=0.1596 F=3.04337712.860.3549YX第21页,此课件共67页哦 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。CX1X2X3X4X52RDWY=f(X1)308684.230.88521.56 t 值25.5811.49Y=f(X1,X2)-438714.650.670.95582.01t 值-3.0218.475.16Y=f(X1,X2,X3)-119785.260.41-0.190.97521.53t 值0.8519.63.35-3.57Y=f(X1,X2,X3,

18、X4)-130566.170.42-0.17-0.090.97751.80t 值-0.979.613.57-3.09-1.55Y=f(X1,X3,X4,X5)-126905.220.40-0.200.070.97981.55t 值-0.8717.853.02-3.470.37 4、逐步回归第22页,此课件共67页哦 回归方程以回归方程以Y=f(Y=f(X1,X2,X3)为最优:为最优:32119.041.026.511978XXXY5、结论第23页,此课件共67页哦 5.2 异方差(Heteroscedasticity)1、同方差假定及异方差定义模型的假定条件 给出Var()是一个对角矩阵,V

19、ar()=2I=210101 且 的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(无自相关假定),第24页,此课件共67页哦Var()=2 =2TTTTTT.212222111211 2 I.当这个假定不成立时,Var()不再是一个纯量对角矩阵。当误差向量 的方差协方差矩阵主对角线上的元素不相等时,称该随机误差系列存在异方差,即误差向量 中的元素取自不同的分布总体。非主对角线上的元素表示误差项之间的协方差值。比如 中的 i j,(i j)表示与第i组和第j组观测值相对应的 i与 j的协方差。若 非主对角线上的部分或全部

20、元素都不为零,误差项就是自相关的(后面讲自相关)。第25页,此课件共67页哦 2.异方差的表现 异方差通常有三种表现形式,(1)递增型(2)递减型(3)条件自回归型。递增型异方差见图5.21和5.22。图5.23为递减型异方差。图5.24为条件自回归型异方差(复杂性异方差)。图5.21 递增型异方差情形 010020030005000100001500020000XY 图5.22 递增型异方差 随着解释变量值的增大,被解释变量取值的差异性增大 第26页,此课件共67页哦0501001502002500102030YX图5.23 递减型异方差-8-6-4-20246200400600800100

21、012001400DJPY 图5.6 复杂型异方差 注:时间序列数据和截面数据中都有可能存在异方差。经济时间序列中的异方差常为递增型异方差。金融时间序列中的异方差常表现为自回归条件异方差。无论是时间序列数据还是截面数据。递增型异方差的来源 主要是因为随着解释变量值的增大,被解释变量取值的差异 性增大。第27页,此课件共67页哦 3.异方差的后果 下面以简单线性回归模型为例讨论异方差对参数估计的影响。对模型 yt=0+1 xt+ut (1).当Var(ut)=t 2为异方差时(t 2是一个随时间或序数变化的量),回归参数估计量仍具有无偏性和一致性,但是回归参数估计量不再具有有效性。2)()()(

22、xxuExxttt1以 为例12)()(xxyyxxttt21)()()(xxuxxxxtttt E()E()=E()=1+=1第28页,此课件共67页哦2222)()(xxxxttt22)(xxtVar(1)=E(1-1)2 2)()(xxuxxttt222)()(xxuxxttt2222)()(E)(xxuxxtttE()2E()=上式不等号左侧项分子中的t 2不是一个常量,不能从累加式中提出,所以不等号右侧项不等于不等号左侧项。而不等号右侧项是同方差条件下1的最小二乘估计量的方差。因此异方差条件下的失去有效性。第29页,此课件共67页哦4.异方差的诊断(2)参数估计量的方差估计是真实方差

23、的有偏估计11()(varvar(E(3)t 检验失效经济变量规模差别很大时容易出现异方差。如个人收入与支出关系,投入与产出关系。(2)利用散点图做初步判断。OLS(3)White检验White检验的具体步骤如下:第一步:Y Xe1,en检验假设:H0:22i即,同方差第30页,此课件共67页哦第三步:2n R2()1k第四步:2n R2()1k拒绝H0,存在异方差。第二步:ei2原变量、原变量平方、交叉项R2OLS(4)自回归条件异方差(ARCH)检验 异方差的另一种检验方法称作自回归条件异方差(ARCH)检验。这种检验方法不是把原回归模型的随机误差项t 2 看作是xt 的函数,而是把t 2

24、 看作误差滞后项ut-12,ut-22,的函数。ARCH是误差项二阶矩的自回归过程。恩格尔(Engle 1982)针对ARCH过程提出LM 检验法。辅助回归式定义为:222011.ttnt nuuu第31页,此课件共67页哦LM 统计量定义为:ARCH=nR22()1k检验假设:H0:12.0n 5.克服异方差的方法(1)采用GLS估计 Y=X +u 设模型为:其中E(u)=0,Var(u)=E(u u)=2,已知 因为 是一个T 阶正定矩阵,所以必存在一个非退化TT 阶矩阵M使下式成立。M M =I TTM M=-1 M Y=M X +M u取Y*=M Y,X*=M X,u*=M u Y*=

25、X*+u*若对于不全为零的实数x1,x2,xn总有f=f(x1,x2,xn)0,则f称为正定二次型。满秩矩阵第32页,此课件共67页哦 Var(u*)=E(u*u*)=E(M u u M )=M 2 M =2 M M =2 I(GLS)=(X*X*)-1 X*Y*=(X M M X)-1 X M M Y =(X -1X)-1 X -1Y 这种方法成为广义最小二乘法(GLS)(2)通过对数据取对数消除异方差。-400-2000200400600800556065707580859095EXT-IMP-2-1012556065707580859095LNEXT-LNIMP中国进出口贸易额差(195

26、3-1998)对数的中国进出口贸易额之差第33页,此课件共67页哦 5.3 自相关(Autocorrelation)1.非自相关的假定及自相关定义 对于模型 ikikiiiXXXY22110 i=1,2,n随机误差项互不相关的基本假设表现为:Covij(,)0 ij,i,j=1,2,n Cov(ui,uj)0,(i j)即误差项ut的取值在时间上是相互无关的。称误差项ut非自相关。如果则称误差项ut 存在自相关。注:自相关又称序列相关。第34页,此课件共67页哦-4-2024-4-2024U(-1)U图1 非自相关的散点图-6-4-20246-6-4-20246X(-1)X图4 正自相关的散点

27、图-6-4-20246-6-4-20246X(-1)X图3 负自相关的散点图-3-2-10123102030405060708090100U图2 非自相关的序列图 第35页,此课件共67页哦2.2.自相关产生的原因自相关产生的原因 大多数经济时间数据都有一个明显的特点,就是它的惯大多数经济时间数据都有一个明显的特点,就是它的惯性。性。GDPGDP、价格指数、生产、就业与失业等时间序列都呈周、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势期性,如周期中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前一时刻的值,似乎有一种,序列在每一时

28、刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利内在的动力驱使这一势头继续下去,直至某些情况(如利率或课税的升高)出现才把它拖慢下来。率或课税的升高)出现才把它拖慢下来。(1)惯性第36页,此课件共67页哦(2 2)设定偏误)设定偏误1 1:模型中未含应包括的变量:模型中未含应包括的变量 例如例如:如果对牛肉需求的正确模型应为:如果对牛肉需求的正确模型应为Y Yt t=0 0+1 1X X1t1t+2 2X X2t2t+3 3X X3t3t+t t其中:其中:Y=Y=牛肉需求量,牛肉需求量,X X1 1=牛肉价格,牛肉价格,X X2 2=消费者收入,消费者

29、收入,X X3 3=猪肉价格猪肉价格 如果模型设定为:如果模型设定为:Y Yt t=0 0+1 1X X1t1t+2 2X X2t2t+v+vt t 则该式中,则该式中,v vt t=3 3X X3t3t+t,t,于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的偏误往于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素,使其呈序列相关性。往导致随机项中有一个重要的系统性影响因素,使其呈序列相关性。第37页,此课件共67页哦 (3)设定偏误设定偏误2 2:不正确的函数形式:不正确的函数形式 例如例如:如果真实的边际成本回归模型应为:如果真实的边际

30、成本回归模型应为:Y Yt t=0 0+1 1X Xt t+2 2X Xt t2 2+t t其中:其中:Y=Y=边际成本,边际成本,X=X=产出,产出,但建模时设立了如下模型:但建模时设立了如下模型:Y Yt t=0 0+1 1X Xt t+v+vt t 因此,由于因此,由于v vt t=2 2X Xt t2 2+t,t,,包含了产出的平方对随机项的系统性,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。影响,随机项也呈现序列相关性。(4)蛛网现象例如:农产品供给对价格的反映本身存在一个滞后期:供给t=0+1价格t-1+t 意味着,农民由于在年度t的过量生产(使该期价格下降)很可

31、能导致在年度t+1时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。第38页,此课件共67页哦3.自相关性的后果(1)参数估计量非有效 虽然回归系数 仍具有无偏性。111()()()()()()X XEEX YX XXEXX XX E但是 丧失有效性。11111112()()()var()()()()()()()()EX XX XEXXX XX XX EXX XX XX XXX1的方差比 非自相关时大,失去有效性。t第39页,此课件共67页哦 (2)(2)变量的显著性检验失去意义变量的显著性检验失去意义12()X X 用OLS法估计时仍然用 估计,所以会低估 的方差。等于过高估

32、计统计量t的值,从而把不重要的解释变量保留在模型里,使显著性检验失去意义。(3)Var()和su2都变大,都不具有最小方差性。所以用依据普通最小二乘法得到的回归方程去预测,预测是无效的。1关于名词白噪声序列:零期望、同方差、无自相关序列。第40页,此课件共67页哦 然后,通过分析这些然后,通过分析这些“近似估计量近似估计量”之间的相关性,以达到判断随之间的相关性,以达到判断随机误差项是否具有自相关性的目的。机误差项是否具有自相关性的目的。首先首先,采用 OLS法估计模型,以求得随机误差项的“近似估计量近似估计量”,用ei表示:lsiiiYYe0)(基本思路:4.自相关检验第41页,此课件共67

33、页哦(1 1)Durbin-Watson Durbin-Watson 检验法检验法 D-W检验是检验是J.Durbin)和)和G.S.WatsonG.S.Watson于于19511951年提出的一种检验序年提出的一种检验序列自相关的方法,列自相关的方法,该方法的假定条件是该方法的假定条件是:(1)解释变量 X非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i(3)回归模型中不应含有滞后因变量作为解释变量,即不 应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项;第42页,此课件共67页哦 该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很

34、难得到。Durbin 和 Watson 假设:0:0H,即i不存在一阶自回归;0:1H,即i存在一阶自回归并构如下造统计量:D Weeeiiiniin.()12221 (2.5.5)D.W.统计量第43页,此课件共67页哦DW检验步骤如下。给出假设:H0:=0 (不存在自相关)H1:0 (存在一阶自相关)用残差值 et计算统计量DW。ttTttTttteee12221)(DW=TttTtTtTttttteeeee1222212122Ttte22Ttte221Ttte12因为TttTtTtttteeee2212212122 DW=TttTttteee221212(1 )2(1)第44页,此课件共

35、67页哦因为 的取值范围是-1,1,所以DW统计量的取值范围是 0,4。与DW值的对应关系见下表。DW 的表现=0DW=2 非自相关=1DW=0 完全正自相关=-1DW=4 完全负自相关tttt实际中DW=0,2,4 的情形是很少见的。当DW取值在(0,2),(2,4)之间时,怎样判别误差项 是否存在自相关呢?推导统计量DW的精确抽样分布是困难的,因为DW是依据残差et 计算的,而et的值又与xt的形式有关。DW检验与其它统计检验不同,它没有唯一的临界值用来制定判别规则。然而Durbin-Watson根据样本容量和被估参数个数,在给定的显著性水平下,给出了检验用的上、下两个临界值dU和dL。判

36、别规则如下:t第45页,此课件共67页哦若 0D.W.dl 则存在正自相关 dlD.W.du 不能确定 duD.W.4-du 无自相关 4-duD.W.4-dl 不能确定 4-dlD.W.4 存在负自相关 可以看出,当D.W.值在2左右时,模型不存在一阶自相关。第46页,此课件共67页哦当DW值落在“不确定”区域时,有两种处理方法。加大样本容量或重新选取样本,重作DW检验。选用其它检验方法。注意:因为DW统计量是以解释变量非随机为条件得出的,所以当有滞后的内生变量作解释变量时,DW检验无效。不适用于联立方程模型中各方程的序列自相关检验。DW统计量不适用于对高阶自相关的检验。但在实际计量经济学问

37、题中,一阶自相关是出现最多 的一类序列相关;另外,经验表明,如果不存在一阶 自相关,一般也不存在高阶序列相关。第47页,此课件共67页哦 (2 2)图示法)图示法 图示法就是依据残差et 对时间t的序列图作出判断。由于残差et是对误差项ut 的估计,所以尽管误差项ut 观测不到,但可以通过et的变化判断ut 是否存在自相关。图示法的具体步骤是,(1)用给定的样本估计回归模型,计算残差et,(t=1,2,T),绘制残差图;(2)分析残差图。Stata实现语句:reg y xpredict r,residualsgen rlagr_n-1Scatter r rlag 调用水果数据库第48页,此课件

38、共67页哦第49页,此课件共67页哦(3)回归检验法 优点是,(1)适合于任何形式的自相关检验,(2)若结论是存在自相关,则同时能 提供出自相关的具体形式与参数的估计值。缺点是,计算量大。用给定样本估计模型并计算残差et。对残差序列et,(t=1,2,T)用OLS进行不同形式的回归拟合。如 et=et 1+vt et=1 et 1+2 et 2+vt et=et-12+v t et=1te+vt (3)对上述各种拟合形式进行显著性检验,从而确定误差项ut存在哪一种形式的自相关。回归检验法的步骤如下:第50页,此课件共67页哦5.克服自相关如果模型的误差项存在自相关,首先应分析产生自相关的原因。

39、如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。只有当以上两种引起自相关的原因都消除后,才能认为误差项ut“真正”存在自相关。在这种情况下,解决办法是变换原回归模型,使变换后的随机误差项消除自相关,进而利用普通最小二乘法估计回归参数。这种变换方法称作广义最小二乘法(GLS)。第51页,此课件共67页哦广义最小二乘法广义最小二乘法 对于模型对于模型 Y=X +N (1)Y=X +N (1)如果存在序列相关,同时存在异方差,即有如果存在序列相关,同时存在异方

40、差,即有 ECovEwwwwwwwwwnnnnn()()()021121212212第52页,此课件共67页哦可以证明:EE()()*DD11 IDDDDDDDD212112111)(E设 =用D-1左乘上式两边,得到一个新的模型:D-1 Y=D-1 X +D-1 N 即 Y*=X*+N*.(2)该模型具有同方差性和随机误差项互相独立性。DD第53页,此课件共67页哦于是,可以用OLS法估计模型(2),得 ()*XXXY1 YXXXYDDXXDDX11111111)()(这就是原模型(1)的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。如何得到矩阵?仍然是对原模型

41、(1)首先采用普通最小二乘法,得到随机误差项的近似估计量,以此构成矩阵的估计量,即 ee ee ee eee ee ee eennnnn1212121222122第54页,此课件共67页哦 差分法差分法 差分法差分法是一类克服自相关性的有效的方法,被广泛地采是一类克服自相关性的有效的方法,被广泛地采用。用。差分法差分法是将原模型变换为差分模型,分为是将原模型变换为差分模型,分为一阶差分法一阶差分法(first-difference method)和和广义差分法广义差分法(generalized difference method)。下面以下面以一元线性模型一元线性模型为例说明。为例说明。第55

42、页,此课件共67页哦 (1)一阶差分法一阶差分法i011,.iiinYX11()iiiiYX11iiiiiiYYYXXX将原模型变化为其中如果原模型存在完全一阶正自相关,即在 i=i-1+i中,=1。模型可变换为:Yi=1Xi+i由于i不存在序列相关,该差分模型满足应用OLS法的基本假设;因此,用OLS法估计可得到原模型参数的无偏的、有效的估计量。即使对于非完全一阶正相关的情况,只要存在一定程度的一阶正相关,差分模型就可以有效地加以克服。第56页,此课件共67页哦 (2 2)广义差分法)广义差分法 此模型称为此模型称为广义差分模型广义差分模型,该模型不存在序列相关问题。采,该模型不存在序列相关

43、问题。采用用OLS法估计可以得到原模型参数的无偏、有效的估计量。法估计可以得到原模型参数的无偏、有效的估计量。广义差分法广义差分法可以克服所有类型的序列相关带来的问题,一阶差分可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。法是它的一个特例。1122.iiiili l 如果原模型存在1110111.(.)(.)1,2,.1iii lliii lillillnYYYXXX 可以将原模型变为第57页,此课件共67页哦随机误差项相关系数随机误差项相关系数 的估计的估计 应用广义差分法,必须已知不同样本点之间随机误差项的相应用广义差分法,必须已知不同样本点之间随机误差项的相关系数关系数

44、 1 1,2 2,l l。实际上,人们并不知道它们的具体。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。数值,所以必须首先对它们进行估计。常用的方法有:常用的方法有:(1)科克伦-奥科特(Cochrane-Orcutt)迭代法。(2)杜宾(durbin)两步法第58页,此课件共67页哦v(1)科克伦)科克伦-奥科特迭代法。奥科特迭代法。首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下式 i=1i-1+2i-2+Li-L+i得到,12l,作为随机误差项的相关系数 12,l的第第一一次次估估计计值值。第59页,

45、此课件共67页哦其其次次,将上述,12l代入广义差分模型ililiilliliiXXXYYY)()1(1111011 illn12,并对之进行 OLS估计,得到0、1。再次再次,将0、1代回原模型,计算出原模型随机误差项的新的“近拟估计值”,并以之作为模型 iiili li1122的样本观测值,采用 OLS 法估计该方程,得到l,21,作为相关系数 12,l的第二次估计值第二次估计值。第60页,此课件共67页哦 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次一般是

46、事先给出一个精度,当相邻两次 1,2,L的估计的估计值之差小于这一精度时,迭代终止。值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为过程也被称为科克伦科克伦-奥科特两步法奥科特两步法。第61页,此课件共67页哦(2)杜宾(durbin)两步法 该方法仍是先估计1,2,L,再对差分模型进行估计采用 OLS 法估计该方程,得各),2,1(liiijYj前的系数 12,l的估计值l,21。11110(.)(.)111,2,.1iiii lillii llillnYYYXXX 第一步,变换差分模

47、型为下列形式:第62页,此课件共67页哦第第二二步步,将估计的l,21代入差分模型ililiilliliiXXXYYY)()1(1111011 illn12,采用 OLS 法估计,得到参数110),1(l的估计量,记为*0,*1。于是:)1(1*00l,*11第63页,此课件共67页哦单位:万元年份出口Y国内生产总值X年份出口Y国内生产总值X1967 4010224181977 5628290911968 3711223081978 5736294501969 4004233191979 5946307051970 4151241801980 6501323721971 45692489319

48、81 6549331521972 4582253101982 6705337641973 4697257991983 7104344111974 4753258861984 7609354291975 5062268681985 8100362001976 566928134某地区商品出口总值与国内生产总值的关系研究。某地区商品出口总值与国内生产总值的关系研究。五、案例:地区商品出口模型调用数据库E:博士计量课程软件应用export-gdp第64页,此课件共67页哦 1、检验、检验 (1)图示法检验)图示法检验第65页,此课件共67页哦第66页,此课件共67页哦(2)D.W.D.W.检验:检验:在5%在显著性水平下,n=19,k=2(包含常数项),查表得dL=1.18,dU=1.40,由于DW=0.9505dL,故存在正自相关。回归结果:ttXY28.083.2531 (-9.34)(30.11)r2=0.9816,R2=0.9805 D.W.=0.9505第67页,此课件共67页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁