《第十四章 自相关.ppt》由会员分享,可在线阅读,更多相关《第十四章 自相关.ppt(103页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、自相关问题一、自相关的性质一、自相关的性质二、自相关的后果二、自相关的后果三、自相关的检验三、自相关的检验四、自相关的修正四、自相关的修正一、序列相关性的性质一、序列相关性的性质 如果对于不同的样本点,随机误差项之间如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认不再是不相关的,而是存在某种相关性,则认为出现了为出现了序列相关性序列相关性(Serial Correlation)。对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n随机项互不相关的基本假设表现为 Cov(i,j)=0 ij,i,j=1,2,n称为一阶序列相关一阶序列相关,或自相关自相关
2、(autocorrelation)其中:被称为自自协协方方差差系系数数(coefficient of autocovariance)或一一阶阶自自相相关关系系数数(first-order coefficient of autocorrelation)如果仅存在 E(i i+1)0 i=1,2,n 自相关自相关往往可写成如下形式:i=i-1+i -11 如果因变量观测值之间存在自相关,则随机干扰项之间就存在自相关。实际经济问题中的序列相关性实际经济问题中的序列相关性(截面数据中的序列相关性举例)(截面数据中的序列相关性举例)(时间序列数据中的序列相关性举例)(时间序列数据中的序列相关性举例)截面
3、数据中因变量取值之间(或误差项取值之间)自相关的解释 一个家庭收入增加对自己消费支出的影响(比如增加自己消费支出),这种影响会波及其他家庭,很有可能迫使另外的某个家庭增加消费支出(死要面子,相互攀比)。因此这两个家庭的消费支出数额之间就存在相关性。进而各自误差项的取值之间也就存在相关性。这类相关性称为空间相关,是就截面数据而言的。可以从下表中找到解释表表2.1.1 某社区家庭每月收入与消费支出统计表某社区家庭每月收入与消费支出统计表(截面数据)(截面数据)每月家庭可支配收入X(元)800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638
4、869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 25
5、52 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 费 支 出 Y(元)2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 时间序列数据中变量取值之间(或误差项取值之间)自相关的解释 众所周知,GDP等时间序列都呈现
6、出周期性。当经济复苏时,存在某种力量推动序列上移,在GDP序列由谷底向上移动的过程中,序列在某一时点的值会大于其前期值。因此,连续的因变量观察值很可能是相互依赖或相关的。这类相关性是就时间序列数据而言的。可以从下表中找到解释10 时间序列数据时间序列数据:对变量在不同时间所取的观测值。对变量在不同时间所取的观测值。中国中国1978年年2001年的年的GDP数据数据1978197819791979198019801981198119821982198319831984198419851985198619861987198719881988198919893624.13624.14038.2403
7、8.24517.84517.84862.44862.45294.75294.75934.55934.5717171718964.48964.410202.210202.211962.511962.514928.314928.316909.216909.219901990199119911992199219931993199419941995199519961996199719971998199819991999200020002001200118547.918547.921617.821617.826638.126638.134634.434634.446759.446759.458478.1
8、58478.167884.667884.674462.674462.678345.278345.282067.4682067.4689442.289442.295933.395933.3随机干扰项关系图二、自相关的后果1.最小二乘估计量仍然是线性的和无偏的2.但不是有效的。3.计算得到的 不是 的无偏估计量,而是有偏差的.3.因此,OLS估计量的方差(该方差的计算公式中含有 )是有偏(差)的。4.因此,通常所用的t检验和F检验是不可靠的。序列相关性序列相关性检验方法有多种,但基本思路相同:基本思路基本思路:三、序列相关性的检验三、序列相关性的检验 检验自相关性,也就是检验随机误差项的取值之检验
9、自相关性,也就是检验随机误差项的取值之间的相关性。或者是检验被解释变量的取值之间间的相关性。或者是检验被解释变量的取值之间的相关性。的相关性。但是,实际检验中有一个问题,因为无法得到总但是,实际检验中有一个问题,因为无法得到总体回归模型的随机误差项的取值,这些真实的取体回归模型的随机误差项的取值,这些真实的取值是无法观察的。因此,我们只能根据所给定的值是无法观察的。因此,我们只能根据所给定的一个样本,采用一个样本,采用OLS法进行样本回归模型的拟合,法进行样本回归模型的拟合,从而得到样本残差序列从而得到样本残差序列e,再利用,再利用e的取值判断是的取值判断是否存在自相关。否存在自相关。真实的随
10、机扰动项无法得知,只能利用回归残差来做图形判断。缺点:定性判断,无定量结论。方法一:对时间做散点图,对自相关程度作直观判断。该散点图此时称为“时序图”。方法二:对前后期残差作相关图。该法更直观。自相关检验方法之一:图示法图示法(一)做残差关于时间的散点图(时序图),看是否存在可识别的系统模式。若有,则存在自相关。图示法(二)做残差前后期的散点图,如果趋势为“右上”则为正相关,反之,负相关。若平行,则无自相关。图示法案例 影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为 式中,Yt为农村居民人均消费支出,X t为农村人均居民纯收入,ut为随机
11、误差项。下表是从中国统计年鉴收集的中国农村居民1985-2003年的收入与消费数据。年份全年人均纯收入(现价)全年人均消费性支出(现价)消费价格指数(1985=100)人均实际纯收入(1985可比价)人均实际消费性支出(1985可比价)1985198619871988198919901991199219931994199519961997199819992000200120022003397.60423.80462.60544.90601.50686.30708.60784.00921.601221.001577.701923.102090.102162.002214.302253.40236
12、6.402475.602622.24317.42357.00398.30476.70535.40584.63619.80659.80769.701016.811310.361572.101617.151590.331577.421670.001741.001834.001943.30100.0106.1112.7132.4157.9165.1168.9176.8201.0248.0291.4314.4322.3319.1314.3314.0316.5315.2320.2397.60399.43410.47411.56380.94415.69419.54443.44458.51492.34541
13、.42611.67648.50677.53704.52717.64747.68785.41818.86317.40336.48353.42360.05339.08354.11366.96373.19382.94410.00449.69500.03501.77498.28501.75531.85550.08581.85606.81用OLS回归原始模型用OLS回归原始模型用OLS回归原始模型结果作当期残差与前期残差的关系图Workfile中可见到e作当期残差与前期残差的关系图时所用命令得到:当期残差与前期残差的关系图 点击上面Equation输出窗口的按钮Resids可得到残差图,从残差图可见,残
14、差的变动有系统模式,连续为正和连续为负,表明残差项存在一阶正自相关,如下图所示。作残差与时间的关系图得到:残差与时间的关系图检验自相关方法之二:德宾-沃森d检验(D.W检验)(Durbin-Watson Test)诊断自相关最著名的检验针对原假设“无一阶自相关”,构造如下d统计量:构造d统计量的基本假定(要求)1、回归模型包含截距项2、变量X是非随机变量3、随机干扰项的生成方式是“一阶自回归模式”4、模型中不包含因变量的滞后项。附注:自相关的模式 随机干扰项自相关的模式有多种多样,在实际应用中通常要事先假定其自相关模式,或者说事先设定其生成方式,然后在此基础上进行分析。通常考虑的自相关模式为“
15、一阶自回归模式”。一阶自回归模式:AR(1)二阶自回归模式:AR(2)Ut=1ut-1+2 ut-2+vDW检验的粗略判定法则1d=42d=23d=0DW检验步骤1.对原模型进行OLS回归,得到样本残差序列e2.根据d统计量计算公式,得到d值(eviews软件对原始模型回归时自动给出d值)3.根据样本容量和原模型解释变量的个数,查表得到临界的DL和DU(即D的下临界值和上临界值)4.根据d检验的判定规则来判断是否存在自相关。d检验的判定规则零假设:无一阶自相关。具体又分为二:根据原模型OLS回归结果中输出的D值判断有无自相关性 原回归方程可决系数较高(0.9788),回归系数均显著。对样本量为
16、19、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.18,dU=1.40,模型中DW(0.7704)5.99147,因此拒绝原假设,接受备择假设,也就所原模型的残差存在自相关,又因为,工具模型右边的滞后一期残差与滞后二期残差的回归系数均显著地不为0(通过t检验),说明原来的双对数模型存在二阶自相关性。根本大法:广义差分法 但根据对随机扰动项之间的相关系数的估计方法不同,又分成几个分支。四、自相关的补救(修正)关于差分的理解差分就是增量的意思。比如GDP2010=GDP2010-GDP2009上述表达式就是(狭义上)的差分的意思。那么,什么是广义差分的意思呢?GDP2010(广义
17、)=GDP2010-0.8GDP2009GDP2010(更加广义)=GDP2010-0.8GDP2009-0.85GDP2008 以上两个表达式就是广义上差分的意思,简称广义差分。(要注意的是0.8和0.85是为了理解这个概念而随机赋的值)对序列相关进行补救需要事先对随机干扰项的生成方式进行设定。最常见的做法是假定随机干扰项的生成方式为AR(1)或AR(P),然后采取补救措施。关于随机干扰项生成方式的假定先以双变量模型为例来说如何将原模型变换为广义差分模型,以消除自相关原双变量模型:Yt=B1+B2Xt+Ut假设误差项服从一阶自回归过程:Ut=ut-1+vt再把原模型写成滞后一期的形式:Yt-
18、1=B1+B2Xt-1+Ut-1两边同时乘以得到:Yt-1=B1+B2Xt-1+Ut-1将原双变量模型减去“两边乘以的模型”得到:Yt-Yt-1=B1(1-)+B2(Xt-Xt-1)+vt 此时,最后那个模型就是广义差分模型,将Yt-Yt-1 和 Xt-Xt-1 看作两个新的变量Y*和X*,再用OLS法进行估计。第一种方法:利用原始模型的残差估计,进而再使用广义差分法 首先,利用当期残差与前期残差进行回归。注意:没有截距项。0.496086便是当期残差与前期残差之间的相关系数,这就是的估计值 对原模型进行广义差分变换,得到广义差分方程:Yt-0.496086 Yt-1=1(1-0.496086
19、)+2(Xt-0.496086 Xt-1)+vt利用0.496086对原始模型进行广义差分变换对广义差分方程进行OLS估计(首先要生成新序列)对x进行差分变换,生成新序列X1Workfile中见到差分变换后的新序列用OLS法对广义差分模型进行拟合由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL=1.16,dU=1.39,模型中DW=1.397593 dU,说明广义差分模型中已无自相关.用OLS法对广义差分模型进行拟合的结果第二种方法:利用原模型回归结果中的DW值估计,进而再使用广义差分法DW值与的估计值之间有如下近似关系:DW值2*(1-的估计值)的估计
20、值1-(DW值/2)=1-(0.77047/2)=0.6148(注:原模型的DW值为0.77047)对原模型进行广义差分变换,得到广义差分方程:Yt-0.6148Yt-1=1(1-0.6148)+2(Xt-0.6148Xt-1)+vt利用0.6148对原始模型进行广义差分变换对广义差分方程进行OLS估计(首先要生成新序列)对x进行差分变换,生成新序列X2Workfile中可见到新序列Y2,X2用OLS法对广义差分模型进行拟合用OLS法对广义差分模型进行拟合的结果由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL=1.16,dU=1.39,模型中DW=1.4
21、78094 dU,说明广义差分模型中已无自相关.第三种方法:广义差分法 之 杜宾两步法(原)差分方程:Yt-Yt-1=1(1-)+2(Xt-Xt-1)+vt将上述差分方程变形如下:Yt=Yt-1+1(1-)+2(Xt-Xt-1)+vt =Yt-1+1(1-)+2Xt*2Xt-1+vt 采用OLS法估计变换后的差分方程,可以得到Yt-1前面的系数的估计值。再将的估计值代入原差分模型,采用OLS法可以得到原差分模型的估计结果。杜宾两步法案例分析 本例主要分析中国商品进口M与国内生产总值GDP的关系,选取了1978年到2001年的国内生产总值GDP,商品进口量M,以M为被解释变量,GDP作为解释变量
22、进行分析。年份国内生产总值/亿元 商品进品/亿美元19783624.1 108.9 19794038.2 156.7 19804517.8 200.2 19814862.4 220.2 19825294.7 192.9 19835934.5 213.9 19847171.0 274.1 19858964.4 422.5 198610202.2 429.1 198711962.5 432.1 198814928.3 552.7 198916909.2 591.4 199018547.9 533.5 199121617.8 637.9 199226638.1 805.9 199334634.4 1
23、039.6 199446759.4 1156.1 199558478.1 1320.8 199667884.6 1388.3 199774462.6 1423.7 199878345.2 1402.4 199982067.46 1657.0 200089442.2 2250.9 200195933.3 2436.1 表4.2.1 19782001年中国商品进口与国内生产总值DW值为0.6279,证明存在严重的自相关。原模型回归结果(记住:由于有自相关性,最后会对原模型进行调整,注意最终调整后的模型与原模型的比较)原始模型的公式表达构建以下回归得到的估计值的估计值为0.846611利用0.846
24、6生成新序列im利用0.8466生成新序列igdpWorkfile中可见到生成的新序列利用新序列进行OLS估计利用新序列进行OLS估计结果二阶自相关的修正 观察回归后的DW值,我们无法判断是否还存在序列相关,因此我们假定随机误差项存在二阶序列自相关(在无法判断的情况下,宁可信其有,不可信其无),我们再次用杜宾两步法进行修正。在命令栏输入:ls m c m(-1)m(-2)gdp gdp(-1)gdp(-2)利用该辅助回归模型对1和2进行估计得到1和2的估计值分别为0.9382、-0.4687注:记住这两个值,在后面的讨论中会用到。利用0.9382、-0.4687生成新序列利用0.9382、-0
25、.4687生成新序列利用新序列进行OLS估计结果(这就是最终模型)观察DW值=1.5835。样本容量22,解释变量1个,查表得du(上临界值)=1.429,此时序列相关消除。最终模型的公式表达注:记住这里的IIGDP前的系数0.02以及截距项86.08,后面的讨论中会用到这一点。回顾:原始模型的公式表达回顾原始模型后发现一个问题 最终模型与原始模型的变量不一致,为了与原模型进行对比,需要将最终模型的因果变量转化为与原模型的因果变量一致。怎么转化呢?利用一下公式:86.08/【1-0.9382-(-0.4687)】=162.26(用162.26作为调整表达形式后的最终模型的截距项,如下所示)将最
26、终模型的表达形式调整如下:其中,0.02仍然和未调整表达形式的最终模型解释变量前的系数0.02相等。重点关注:进而推广到一般,调整表达形式(以便和原模型对比)后的最终模型的截距项估计值=未调整表达形式的最终模型的截距项估计值/(1-1-2-p),如果只有一阶自回归,分母就只用减去1,如果是二阶自回归,就要减去1和2,依此类推。调整表达形式后的最终模型的解释变量前面的系数和未调整表达形式的最终模型的解释变量前面的相应系数相等。第四种方法:广义差分法 之 科克伦-奥科特迭代法(Cochrane_Qractt)在Eviews中,可以采用很简单的方法来实现广义差分法参数估计。原来的广义差分模型通过改写
27、之后(至于如何改写,可不必追究),可以利用OLS法估计参数,选择常数项,X1,X2,AR(1),AR(2)作为解释变量,即可得到常数项的估计值、X前面系数的估计值以及的估计值【即AR(1),AR(2)前面的系数】。至于选择几阶随机干扰项的自回归项作为解释变量,主要判断依据是DW统计量,逐次引入自回归项,直到满意为止,即没有自相关性为止。科克伦-奥科特迭代法案例分析 本例主要分析中国商品进口M与国内生产总值GDP的关系,选取了1978年到2001年的国内生产总值GDP,商品进口量M,以M为被解释变量,GDP作为解释变量进行分析。年份国内生产总值/亿元 商品进品/亿美元19783624.1 108
28、.9 19794038.2 156.7 19804517.8 200.2 19814862.4 220.2 19825294.7 192.9 19835934.5 213.9 19847171.0 274.1 19858964.4 422.5 198610202.2 429.1 198711962.5 432.1 198814928.3 552.7 198916909.2 591.4 199018547.9 533.5 199121617.8 637.9 199226638.1 805.9 199334634.4 1039.6 199446759.4 1156.1 199558478.1 13
29、20.8 199667884.6 1388.3 199774462.6 1423.7 199878345.2 1402.4 199982067.46 1657.0 200089442.2 2250.9 200195933.3 2436.1 表4.2.1 19782001年中国商品进口与国内生产总值DW值为0.6279,证明存在严重的自相关。原模型回归结果先引入AR(1)进行回归DW值显示,依然存在自相关再引入AR(2)进行回归回归结果显示,DW=1.853。样本容量22,解释变量3个,因此查表得到的Du(上临界值)=1.664,因此已经不存在自相关了因此,经过广义差分变换之后的模型表达式如下由于该模型表达式已经和原模型表达式的因果变量一致,因此没必要进一步调整,就可以直接与原模型进行对比了。与原模型的对比可以发现,截距项有差别,GDP前面的系数(基本)没有差别。