《计量经济学 张晓桐版 第六章 自相关.pptx》由会员分享,可在线阅读,更多相关《计量经济学 张晓桐版 第六章 自相关.pptx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第6 6章章 自相关自相关非自相关假定非自相关假定自相关的来源与后果自相关的来源与后果自相关检验自相关检验自相关的解决方法自相关的解决方法克服自相关的矩阵描述(不讲)克服自相关的矩阵描述(不讲) 自相关系数的估计自相关系数的估计案例分析案例分析6.1非自相关假定非自相关假定:Cov(ui, uj ) = E(ui uj) = 0, (i, j T, i j) )如果如果Cov (ui , uj ) 0, (i, j T, i j) )则称误差项则称误差项ut存在自相关。存在自相关。自相关又称序列相关。也是相关关系的一种。自相关又称序列相关。也是相关关系的一种。自相关按形式可自相关按形式可分为
2、两类分为两类:(1)一阶自回归形式。)一阶自回归形式。ut = f (ut-1)(2)高阶自回归形式。)高阶自回归形式。ut = f (ut 1, u t 2 , )经济计量模型中自相关的最常见形式是经济计量模型中自相关的最常见形式是一阶线性自回归形式一阶线性自回归形式。ut = a a1 ut -1 + vt E(vt ) = 0, t = 1, 2 , T Var(vt) = v2, t = 1, 2 , TCov(vi, vj ) = 0, i j, i, j = 1, 2 , TCov(ut-1, vt) = 0, t = 1, 2 , T序列的自相关特征分析。给出具有正自相关,负自相
3、关和非自相关三个序列。序列的自相关特征分析。给出具有正自相关,负自相关和非自相关三个序列。-4-2024102030405060708090100X-6-4-20246-6-4-20246X(-1)X -6-4-20246102030405060708090100X-6-4-20246-6-4-20246X(-1)X c. 负自相关序列负自相关序列 d. 负自相关序列散点图负自相关序列散点图-3-2-10123102030405060708090100U-4-2024-4-2024U(-1)U e. 非自相关序列非自相关序列 f 非自相关序列散点图非自相关序列散点图a. 正自相关序列正自相关序
4、列 b. 正自相关序列散点图正自相关序列散点图6.2自相关的来源与后果自相关的来源与后果 自相关的来源:自相关的来源:1模型的数学形式不妥。模型的数学形式不妥。2. 惯性。大多数经济时间序列都存在自相关。惯性。大多数经济时间序列都存在自相关。3. 回归模型中略去了带有自相关的重要解释变量。回归模型中略去了带有自相关的重要解释变量。 6.2自相关的来源与后果自相关的来源与后果 6.3 自相关检验自相关检验 当当DW值落在值落在“不确定不确定”区域时,有两种处理方法。(区域时,有两种处理方法。(1)加大样本容量或)加大样本容量或重新选取样本,重作重新选取样本,重作DW检验。有时检验。有时DW值会离
5、开不确定区。(值会离开不确定区。(2)选用其)选用其它检验方法。它检验方法。DW检验临界值与三个参数有关。(检验临界值与三个参数有关。(1)检验水平)检验水平a a,(,(2)样本容量)样本容量T , (3) 原回归模型中解释变量个数原回归模型中解释变量个数k(不包括常数项)。(不包括常数项)。 的取值范围是的取值范围是 -1, 1,所以,所以DW统计量的取值范围是统计量的取值范围是 0, 4。6.3 自相关检验自相关检验 6.3 自相关检验自相关检验 (3)LM检验(亦称检验(亦称BG检验)法检验)法 6.4 自相关的解决方法自相关的解决方法 1. 如果自相关是由于错误地设定模型的数学形式所
6、致,那如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。方法是用残差么就应当修改模型的数学形式。方法是用残差et 对解释变量的对解释变量的较高次幂进行回归。较高次幂进行回归。 2. 如果自相关是由于模型中省略了重要解释变量造成的,如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为重要解释变那么解决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。量列入模型。 怎样查明自相关是由于略去重要解释变量引起的?一种方法怎样查明自相关是由于略去重要解释变量引起的?一种方法是用残差是用残差et对那些可能影响被解释变量,但又未单列入
7、模型的对那些可能影响被解释变量,但又未单列入模型的解释变量回归,并作显著性检验。解释变量回归,并作显著性检验。 只有当以上两种引起自相关的原因都排除后,才能认为误差只有当以上两种引起自相关的原因都排除后,才能认为误差项项ut 真正存在自相关。真正存在自相关。 在这种情况下,解决办法是变换原回归模型,使变换后模型在这种情况下,解决办法是变换原回归模型,使变换后模型的随机误差项消除自相关。这种估计方法称作的随机误差项消除自相关。这种估计方法称作广义最小二乘法广义最小二乘法。6.4 自相关的解决方法自相关的解决方法 Yt = 0 + 1 X1 t + 2 X2 t+ + k X k t + ut (
8、t = 1, 2, , T ) 其中其中ut具有一阶自回归形式具有一阶自回归形式ut = ut-1 + vt 其中其中vt 满足通常的假定条件满足通常的假定条件 Yt = 0 + 1 X1t + 2 X2 t + + k Xk t + ut -1 + vt 用第用第1式求式求(t - 1) 期关系式期关系式,并在两侧同乘,并在两侧同乘 : Yt -1= 0 + 1X1 t -1 + 2 X2 t -1 + + k X k t-1 + ut-1上两式相减上两式相减,得,得 Yt- Yt -1 = 0 (1- ) + 1 (Xt - X1 t-1) + + k (Xk t - Xk t -1) +
9、 vt 作广义差分变换:作广义差分变换: Yt* = Yt - Yt -1 ; Xj t* = X j t - Xj t-1, j = 1, 2 , k ; 0* = 0 (1- ) 则模型如下则模型如下 Yt* = 0*+ 1 X1t* + 2 X2 t* + + k Xk t* + vt ( t = 2, 3, T) vt 满足通常的假定条件,可以用满足通常的假定条件,可以用OLS法估计上式。法估计上式。 6.4 自相关的解决方法自相关的解决方法 6.5 自相关系数的估计自相关系数的估计 6.6 案例分析案例分析 例例6.1 天津市天津市城镇居民人均消费与人均可支配收入的关系。城镇居民人均
10、消费与人均可支配收入的关系。 改革开放以来,天津市改革开放以来,天津市城镇居民人均消费性支出(城镇居民人均消费性支出(CONSUM),人),人均可支配收入(均可支配收入(INCOME)以及消费价格定基指数()以及消费价格定基指数(PRICE)数据)数据(19782000年年)见表见表6.2。现在研究人均消费与人均可支配收入的关系。现在研究人均消费与人均可支配收入的关系。先定义不变价格(先定义不变价格(1978=1)的人均消费性支出()的人均消费性支出(Yt)和人均可支配收入)和人均可支配收入(Xt)。令)。令 Yt = CONSUM / PRICE, Xt = INCOME / PRICE假定
11、所建立的回归模型形式是假定所建立的回归模型形式是Yt = 0 + 1 Xt + ut 2004006008001000120014000500100015002000XY-60-40-20020406080100788082848688909294969800RESID Yt 和和 Xt 散点图散点图 残差图残差图 (1)估计线性回归模型并计算残差。)估计线性回归模型并计算残差。 = 111.44 + 0.7118 Xt (6.5) (42.1) R2 = 0.9883, s.e. = 32.8, DW = 0.60, T = 23(2)分别用)分别用DW、LM统计量检验误差项统计量检验误差项
12、 ut是否存在自相关。是否存在自相关。已知已知DW = 0.60,若给定,若给定a a = 0.05,查附表,查附表4,得,得DW检验临界值检验临界值dL = 1.26,dU = 1.44。因为因为 DW = 0.60 1.26,认为误差项,认为误差项ut存在严重的正自相关。存在严重的正自相关。LM(BG)自相关检验辅助回归式估计结果是)自相关检验辅助回归式估计结果是 et = 0.6790 et -1 + 3.1710 0.0047 Xt + vt (3.9) (0.2) (- 0.4) R2 = 0.43, DW = 2.00LM = T R2 = 23 0.43 = 9.89。因为因为
13、20.05(1) = 3.84,LM = 9.89 3.84,所以,所以LM检验检验结果也说明误差项存在一阶正自相关。结果也说明误差项存在一阶正自相关。EViews的的LM自相关检验操作:点击最小二乘回归窗口中的自相关检验操作:点击最小二乘回归窗口中的View键,选键,选Residual Tests/Serial Correlation LM Test,在随后弹出的滞后期对话框中给出最大滞后期。,在随后弹出的滞后期对话框中给出最大滞后期。点击点击OK键。键。例例6.1 6.1 天津市城镇居民人均消费与人均可支配收入的关系。天津市城镇居民人均消费与人均可支配收入的关系。tY例例6.1 6.1 天
14、津市城镇居民人均消费与人均可支配收入的关系。天津市城镇居民人均消费与人均可支配收入的关系。 -60-40-200204060788082848688909294969800RESID例例6.1 6.1 天津市城镇居民人均消费与人均可支配收入的关系。天津市城镇居民人均消费与人均可支配收入的关系。注意:注意:(1)R2值有所下降。不应该不相信估计结果。原因是两个回归式所用变量值有所下降。不应该不相信估计结果。原因是两个回归式所用变量不同,所以不同,所以不可以直接比较确定系数不可以直接比较确定系数R2的值的值。(2)两种估计方法的回归系数有差别。计量经济理论认为回归系数)两种估计方法的回归系数有差别
15、。计量经济理论认为回归系数广义最广义最小二乘估计量优于误差项存在自相关的小二乘估计量优于误差项存在自相关的OLS估计量估计量。所以。所以0.6782应该比应该比0.7118更可信。特别是最近几年,天津市城镇居民人均收入的人均消费边更可信。特别是最近几年,天津市城镇居民人均收入的人均消费边际系数为际系数为0.6782更可信。更可信。(3)用)用EViews生成新变量的方法生成新变量的方法:从工作文件主菜单中点击从工作文件主菜单中点击Quick键,选择键,选择Generate Series 功能。打开功能。打开生成序列(生成序列(Generate Series by Equation)对话框。在对
16、话框中输入如)对话框。在对话框中输入如下命令(每次只能输入一个命令),下命令(每次只能输入一个命令),Y = CONSUM / PRICEX = INCOME / PRICE按按OK键。变量键。变量Y和和X将自动显示在工作文件中。将自动显示在工作文件中。例例6.1 6.1 天津市城镇居民人均消费与人均可支配收入的关系。天津市城镇居民人均消费与人均可支配收入的关系。例例6.2 6.2 天津市保费收入和人口的回归关系天津市保费收入和人口的回归关系 本案例主要用来展示当模型误差项存在本案例主要用来展示当模型误差项存在2阶自回归形式的自相关时,怎阶自回归形式的自相关时,怎样用广义差分法估计模型参数。样
17、用广义差分法估计模型参数。 19671998年天津市的保险费收入(年天津市的保险费收入(Yt,万元)和人口(,万元)和人口(Xt,万人)数,万人)数据散点图见图。据散点图见图。Yt与与Xt的变化呈指数关系。对的变化呈指数关系。对Yt取自然对数。取自然对数。LnYt与与Xt的散的散点图见图。点图见图。可以在可以在LnYt与与Xt之间建立线性回归模型。之间建立线性回归模型。LnYt = 0 + 1 Xt + ut 0100000200000300000650700750800850900950XY468101214700800900XLnY Yt和和Xt散点图散点图 LnYt和和Xt散点图散点图-
18、0.6-0.4-0.20.00.20.40.60.8707580859095RESID例例6.2 6.2 天津市保费收入和人口的回归关系天津市保费收入和人口的回归关系 例例6.2 6.2 天津市保费收入和人口的回归关系天津市保费收入和人口的回归关系对残差序列的拟合发现,对残差序列的拟合发现,ut存在二阶自相关。回归式如下。存在二阶自相关。回归式如下。 et = 1.186 et -1 - 0.467 et -2 + vt (6.9) (-2.5) R2 = 0.71, s.e. = 0.19, DW = 1.97 (1969-1998)误差项具有二阶自回归形式的自相关。误差项具有二阶自回归形式
19、的自相关。(3)用广义差分法消除自相关。)用广义差分法消除自相关。首先推导二阶自相关首先推导二阶自相关ut = 1ut 1+ 2ut 2 + vt条件下的广义差分变换式。设模型为条件下的广义差分变换式。设模型为 LnYt = 0 + 1 Xt + ut 写出上式的滞后写出上式的滞后1期、期、2期表达式并分别乘以期表达式并分别乘以 1、 2, 1 LnYt-1 = 1 0 + 1 1 Xt-1 + 1ut -1 2 LnYt-2 = 2 0 + 2 1Xt-2 + 2ut -2 用以上用以上3式做如下运算,式做如下运算, LnYt - 1 LnYt-1 - 2 LnYt-2 = 0 - 1 0
20、- 2 0 + 1 Xt - 1 1 Xt-1 - 2 1 Xt-2 + ut - 1ut - 1- 2ut -2将将2阶自相关关系式,阶自相关关系式,ut = 1ut 1+ 2ut 2 + vt,代入上式并整理,得,代入上式并整理,得 (LnYt - 1 LnYt-1 - 2LnYt-2) = 0 (1- 1 - 2) + 1 (Xt - 1 Xt-1- 2Xt-2) + vt 例例6.2 6.2 天津市保费收入和人口的回归关系天津市保费收入和人口的回归关系二阶广义差分变换应该是二阶广义差分变换应该是 GDLnYt = LnYt - 1 LnYt-1 - 2LnYt-2 GDXt = Xt
21、- 1 Xt-1- 2Xt-2 LnYt和和Xt的广义差分变换应该是的广义差分变换应该是 GDLnYt = LnYt -1.186 LnYt-1 +0.467 LnYt-2 GDXt = Xt -1.186 Xt-1 + 0.467 Xt-2广义最小二乘回归结果是广义最小二乘回归结果是 = -3.246 +0.0259 GDXt (-10.0) (17.9) R2 = 0.92, DW = 1.99, (1969-1998) 0 = -3.246/(1- 1 - 2) = -3.246/(1 -1.186 + 0.467) = -11.55原模型的广义最小二乘估计结果是原模型的广义最小二乘估计结果是 LnYt = -11.55 + 0.0259 Xt 广义最小二乘估计值广义最小二乘估计值0.0259比最小二乘估计值比最小二乘估计值0.0254值可信。值可信。经济含义是每增加经济含义是每增加1万人,万人,LnYt增加增加0.0259,即保费增加,即保费增加1.0262万元。万元。tGDLnY-0.4-0.20.00.20.40.6707580859095RESID