《第1章⑵随机时间序列模型.pdf》由会员分享,可在线阅读,更多相关《第1章⑵随机时间序列模型.pdf(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第二节随机时间序列分析模型第二节随机时间序列分析模型一、时间序列模型的基本概念及其适用性二、随机时间序列模型的平稳性条件三、随机时间序列模型的识别四、随机时间序列模型的估计五、随机时间序列模型的检验一、时间序列模型的基本概念及其适用性二、随机时间序列模型的平稳性条件三、随机时间序列模型的识别四、随机时间序列模型的估计五、随机时间序列模型的检验2 经典计量经济学模型与时间序列模型经典计量经济学模型与时间序列模型 确定性时间序列模型与随机性时间序列模型确定性时间序列模型与随机性时间序列模型3一、时间序列模型的基本概念及其适用性一、时间序列模型的基本概念及其适用性41、时间序列模型的基本概念1、时
2、间序列模型的基本概念随机时间序列模型(随机时间序列模型(time series modeling)是指仅用它的过去值及随机扰动项所建立起来的模型,其一般形式为Xt=F(Xt-1,Xt-2,t)建立具体的时间序列模型,需解决如下三个问题建立具体的时间序列模型,需解决如下三个问题:(1)模型的具体形式模型的具体形式(2)时序变量的滞后期时序变量的滞后期(3)随机扰动项的结构随机扰动项的结构例如,取线性方程、一期滞后以及白噪声随机扰动项(t=t),模型将是一个1阶自回归过程阶自回归过程AR(1):Xt=Xt-1+t这里,t特指一白噪声一白噪声。5一般的p阶自回归过程阶自回归过程AR(p)是Xt=1X
3、t-1+2Xt-2+pXt-p+t(*)(1)如果随机扰动项是一个白噪声(t=t),则称(*)式为一纯纯AR(p)过程(过程(pure AR(p)process),记为Xt=1Xt-1+2Xt-2+pXt-p+t(2)如果t不是一个白噪声,通常认为它是一个q阶的移动平均(移动平均(moving average)过程)过程MA(q):t=t-1t-1-2t-2-qt-q该式给出了一个纯纯MA(q)过程(过程(pure MA(p)process)。6将纯AR(p)与纯MA(q)结合,得到一个一般的自回归移动平均(自回归移动平均(autoregressive moving average)过程)过程
4、ARMA(p,q):Xt=1Xt-1+2Xt-2+pXt-p+t-1t-1-2t-2-qt-q该式表明:该式表明:(1)一个随机时间序列可以通过一个自回归移动平均过程生成,)一个随机时间序列可以通过一个自回归移动平均过程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释。(2)如果该序列是平稳的)如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。那么我们就可以通过该序列过去的行为来预测未来。这也正是随机时间序列分析模型的优势所在。7经典回归模型的问题:经典回归模型的问题:迄今为止,迄今为止,对一个时间序列Xt的变动进行解释或预测,
5、是通过某个单方程回归模型或联立方程回归模型进行的,由于它们以因果关系为基础,且具有一定的模型结构,因此也常称为结构式模型(结构式模型(structural model)。然而,然而,如果Xt波动的主要原因可能是我们无法解释的因素,如气候、消费者偏好的变化等,则利用结构式模型来解释Xt的变动就比较困难或不可能,因为要取得相应的量化数据,并建立令人满意的回归模型是很困难的。有时,有时,即使能估计出一个较为满意的因果关系回归方程,但由于对某些解释变量未来值的预测本身就非常困难,甚至比预测被解释变量的未来值更困难,这时因果关系的回归模型及其预测技术就不适用了。2、时间序列分析模型的适用性2、时间序列分
6、析模型的适用性8例如例如,时间序列过去是否有明显的增长趋势时间序列过去是否有明显的增长趋势,如果增长趋势在过去的行为中占主导地位,能否认为它也会在未来的行为里占主导地位呢?或者时间序列显示出循环周期性行为时间序列显示出循环周期性行为,我们能否利用过去的这种行为来外推它的未来走向?随机时间序列分析模型,就是要通过序列过去的变化特征来预测未来的变化趋势随机时间序列分析模型,就是要通过序列过去的变化特征来预测未来的变化趋势。使用时间序列分析模型的另一个原因在于使用时间序列分析模型的另一个原因在于:如果经济理论正确地阐释了现实经济结构,则这一结构可以写成类似于ARMA(p,q)式的时间序列分析模型的形
7、式。在这些情况下,我们采用另一条预测途径在这些情况下,我们采用另一条预测途径:通过时间序列的历史数据,得出关于其过去行为的有关结论,进而对时间序列未来行为进行推断。9例如,例如,对于如下最简单的宏观经济模型:这里,Ct、It、Yt分别表示消费、投资与国民收入。Ct与与Yt作为内生变量,它们的运动是由作为外生变量的投资作为内生变量,它们的运动是由作为外生变量的投资It的运动及随机扰动项的运动及随机扰动项t的变化决定的。的变化决定的。tttCYC+=12110tttICY+=10上述模型可作变形如下:两个方程等式右边除去第一项外的剩余部分可看成一个综合性的随机扰动项,其特征依赖于投资项It的行为。
8、如果如果It是一个白噪声是一个白噪声,则消费序列Ct就成为一个1阶自回归过程阶自回归过程AR(1),而收入序列Yt就成为一个(1,1)阶的自回归移动平均过程阶的自回归移动平均过程ARMA(1,1)。ttttICC1111011211111+=tttttIIYY11121101121111111+=11二、随机时间序列模型的平稳性条件二、随机时间序列模型的平稳性条件12自回归移动平均模型(ARMA)是随机时间序列分析模型的普遍形式,自回归模型(AR)和移动平均模型(MA)是它的特殊情况。关于这几类模型的研究,是时间序列分析的重点内容时间序列分析的重点内容:主要包括主要包括模型的平稳性分析模型的平
9、稳性分析、模型的识别模型的识别和和模型的估计模型的估计。1、AR(p)模型的平稳性条件1、AR(p)模型的平稳性条件随机时间序列模型的平稳性随机时间序列模型的平稳性,可通过它所生成的随机时间可通过它所生成的随机时间序列的平稳性来判断序列的平稳性来判断。如果如果一个p阶自回归模型AR(p)生成的时间序列是平稳的,就说该AR(p)模型是平稳的,否则否则,就说该AR(p)模型是非平稳的。13考虑p阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+t (*)引入滞后算子(滞后算子(lag operator)L:LXt=Xt-1,L2Xt=Xt-2,LpXt=Xt-p(*)式变换为(1-1
10、L-2L2-pLp)Xt=t记(L)=(1-1L-2L2-pLp),则称多项式方程(z)=(1-1z-2z2-pzp)=0为AR(p)的特征方程(characteristic equation)特征方程(characteristic equation)。可以证明,可以证明,如果该特征方程的所有根在单位圆外(根的模大于1),则AR(p)模型是平稳的。如果该特征方程的所有根在单位圆外(根的模大于1),则AR(p)模型是平稳的。14例例9.2.1 AR(1)模型的平稳性条件。对1阶自回归模型AR(1)tttXX+=1方程两边平方再求数学期望,得到Xt的方差)(2)()()(122122tttttXE
11、EXEXE+=由于Xt仅与t相关,因此,E(Xt-1t)=0。如果该模型稳定,则有E(Xt2)=E(Xt-12),从而上式可变换为:22201=X在稳定条件下,该方差是一非负的常数,从而有|1。15而AR(1)的特征方程01)(=zz的根为z=1/AR(1)稳定,即|1,意味着特征根大于1。例例9.2.2 AR(2)模型的平稳性。对AR(2)模型ttttXXX+=2211方程两边同乘以Xt,再取期望得:)(22110ttXE+=16又由于222211)()()()(=+=tttttttEXEXEXE于是222110+=同样地,由原式还可得到0211212011+=+=于是方差为)1)(1)(1
12、()1(21212220+=17由平稳性的定义,该方差必须是一不变的正数,于是有1+21,2-11,|2|1这就是AR(2)的平稳性条件的平稳性条件,或称为平稳域平稳域。它是一顶点分别为(-2,-1),(2,-1),(0,1)的三角形。2 (0,1)1 (-2,-1)(2,-1)图图 9.2.1 AR(2)模型的平稳域模型的平稳域 18对应的特征方程1-1z-2z2=0 的两个根z1、z2满足:z1z2=-1/2 ,z1+z2=-1/2 ttttXXX+=2211AR(2)模型解出1,22121zz=21211zzzz+=由AR(2)的平稳性,|2|=1/|z1|z2|1,有1)11)(11(
13、112121212121zz于是|z2|1。由 2-11可推出同样的结果。19对高阶自回模型对高阶自回模型AR(p)来说来说,多数情况下没有必要直接计算其特征方程的特征根,但有一些有用的规则可用来检验高阶自回归模型的稳定性一些有用的规则可用来检验高阶自回归模型的稳定性:(1)AR(p)模型稳定的必要条件是模型稳定的必要条件是:1+2+p1(2)(2)由于i(i=1,2,p)可正可负,AR(p)模型稳定的充分条件是:模型稳定的充分条件是:|1|+|2|+|p|120对于移动平均模型MR(q):Xt=t-1t-1-2t-2-qt-q其中t是一个白噪声,于是2、MA(q)模型的平稳性模型的平稳性0)
14、()()()(11=qqtttEEEXE?()22111121322111122210),cov()(),cov()(),cov()1(varqqttqqqqttqqqttqtXXXXXXX=+=+=+=+?当滞后期大于q时,Xt的自协方差系数为0。因此:有限阶移动平均模型总是平稳的有限阶移动平均模型总是平稳的。21由于ARMA(p,q)模型是AR(p)模型与MA(q)模型的组合:Xt=1Xt-1+2Xt-2+pXt-p+t-1t-1-2t-2-qt-q3、ARMA(p,q)模型的平稳性模型的平稳性而而MA(q)模型总是平稳的,因此模型总是平稳的,因此ARMA(p,q)模型的平稳性取决于模型的
15、平稳性取决于AR(p)部分的平稳性。部分的平稳性。当当AR(p)部分平稳时,则该部分平稳时,则该ARMA(p,q)模型是平稳的,否则,不是平稳的。模型是平稳的,否则,不是平稳的。22最后最后(1)一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型;(2)一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型。因此,(1)一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型;(2)一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型。因此,如果我们将一个非平
16、稳时间序列通过d次差分,将它变为平稳的,然后用一个平稳的ARMA(p,q)模型作为它的生成模型,则我们就说该原始时间序列是一个如果我们将一个非平稳时间序列通过d次差分,将它变为平稳的,然后用一个平稳的ARMA(p,q)模型作为它的生成模型,则我们就说该原始时间序列是一个自回归单整移动平均(autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)自回归单整移动平均(autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)。例如,例如,一个ARIMA(2,1,2)时间序列
17、在它成为平稳序列之前先得差分一次,然后用一个ARMA(2,2)模型作为它的生成模型的。一个ARIMA(2,1,2)时间序列在它成为平稳序列之前先得差分一次,然后用一个ARMA(2,2)模型作为它的生成模型的。当然,当然,一个ARIMA(p,0,0)过程表示了一个纯AR(p)平稳过程;一个ARIMA(0,0,q)表示一个纯MA(q)平稳过程。一个ARIMA(p,0,0)过程表示了一个纯AR(p)平稳过程;一个ARIMA(0,0,q)表示一个纯MA(q)平稳过程。23三、随机时间序列模型的识别三、随机时间序列模型的识别24所谓随机时间序列模型的识别所谓随机时间序列模型的识别,就是对于一个平稳的随机
18、时间序列,找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。所使用的工具所使用的工具主要是时间序列的自相关函数自相关函数(autocorrelation function,ACF)及偏自相关函数偏自相关函数(partial autocorrelation function,PACF)。251、AR(p)过程1、AR(p)过程(1)自相关函数ACF(1)自相关函数ACF1阶自回归模型阶自回归模型AR(1)Xt=Xt-1+t的k阶滞后自协方差自协方差为:011)(kkttktkXXE=+=1,2,因此,AR(1)模型的自相关函数自相关函数为k
19、kk=0=1,2,由由AR(1)的稳定性知的稳定性知|1,因此,k时,呈指数形衰减,直到零,因此,k时,呈指数形衰减,直到零。这种现象称为拖尾拖尾或称AR(1)有无穷记忆有无穷记忆(infinite memory)。注意注意,0时,呈振荡衰减状。26Xt=1Xt-1+2Xt-2+t该模型的方差0以及滞后1期与2期的自协方差1,2分别为阶自回归模型阶自回归模型AR(2)222110+=0211212011+=+=类似地,可写出一般的一般的k期滞后自协方差期滞后自协方差:22112211)(+=+=kktttktkrXXXE(K=2,3,)于是,AR(2)的k 阶自相关函数阶自相关函数为:2211
20、+=kkk(K=2,3,)其中:1=1/(1-2),0=1如果AR(2)稳定,则由如果AR(2)稳定,则由1 1+2 21知|1知|k k|衰减趋于零,呈拖尾状。|衰减趋于零,呈拖尾状。至于衰减的形式,要看AR(2)特征根的实虚性,至于衰减的形式,要看AR(2)特征根的实虚性,若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。27一般地,p阶自回归模型阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+tk期滞后协方差为:pkpkktptpttKtkXXXXE+=+=?22112211)(从而有自相关函数:pkp
21、kkk+=?2211可见,无论k有多大,无论k有多大,k k的计算均与其到p阶滞后的自相关函数有关的计算均与其到p阶滞后的自相关函数有关,因此呈拖尾状呈拖尾状。如果AR(p)是稳定的,则|如果AR(p)是稳定的,则|k k|递减且趋于零|递减且趋于零。28其中:1/zi是AR(p)特征方程(z)=0的特征根,由AR(p)平稳的条件知,|zi|p,Xt与Xt-k间的偏自相关系数偏自相关系数为零。AR(p)的一个主要特征是的一个主要特征是:kp时,时,k*=Corr(Xt,Xt-k)=0即即 k*在在p以后是截尾的。以后是截尾的。一随机时间序列的识别原则:一随机时间序列的识别原则:若若XtXt的偏
22、自相关函数在的偏自相关函数在p p以后截尾,即以后截尾,即kp时,时,k*=0,而它的自相关函数=0,而它的自相关函数 k是拖尾的,则此序列是自回归AR(p)序列。是拖尾的,则此序列是自回归AR(p)序列。31在实际识别时,由于样本偏自相关函数rk*是总体偏自相关函数k*的一个估计,由于样本的随机性,当kp时,rk*不会全为0,而是在0的上下波动。但可以证明,当kp时,rk*服从如下渐近正态分布:rk*N(0,1/n)式中n表示样本容量。因此,如果计算的rk*满足需指出的是需指出的是,我们就有95.5%的把握判断原时间序列在p之后截尾。nrk2|*32对MA(1)过程2、MA(q)过程MA(q
23、)过程1=tttX可容易地写出它的自协方差系数自协方差系数:0)1(3221220=+=?于是,MA(1)过程的自相关函数自相关函数为:0)1(3221=+=?可见,当当k1时,时,k k0,即,即Xt与与Xt-k不相关,不相关,MA(1)自相关函数是截尾的。MA(1)自相关函数是截尾的。33MA(1)过程可以等价地写成过程可以等价地写成 t t关于无穷序列关于无穷序列X Xt t,X,Xt-1t-1,的线性组合的形式:的线性组合的形式:?+=221ttttXXX或ttttXXX+=?221(*)(*)是一个AR()过程,它的偏自相关函数非截尾但却趋于零,因此MA(1)的偏自相关函数是非截尾但
24、却趋于零的。MA(1)的偏自相关函数是非截尾但却趋于零的。注意:注意:(*)式只有当|1时才有意义,否则意味着距Xt越远的X值,对Xt的影响越大,显然不符合常理。因此,我们把把|1|+=+=+qkqkkXXErqkqkkqkttk当当当01)(0)1()(112222212?相应的自相关函数自相关函数为kkkkq kqqrrkkqkq=+01112210110当当当()/()?可见,当kq时,Xt与与Xt-k不相关,即存在截尾现象,因此,当当kq时,时,k k=0是是MA(q)的一个特征的一个特征。于是:可以根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶。可以根据自相关系数是否
25、从某一点开始一直为0来判断MA(q)模型的阶。35与MA(1)相仿,可以验证MA(q)过程的偏自相关函数是非截尾但趋于零的。MA(q)模型的识别规则:模型的识别规则:若随机序列的自相关函数截尾,即自q以后,若随机序列的自相关函数截尾,即自q以后,k k=0(kq);而它的偏自相关函数是拖尾的,则此序列是滑动平均MA(q)序列。=0(kq);而它的偏自相关函数是拖尾的,则此序列是滑动平均MA(q)序列。同样需要注意的是同样需要注意的是:在实际识别时,由于样本自相关函数rk是总体自相关函数k的一个估计,由于样本的随机性,当kq时,rk不会全为0,而是在0的上下波动。但可以证明,当kq时,rk服从如
26、下渐近正态分布:rkN(0,1/n)式中n表示样本容量。因此,如果计算的如果计算的r rk k满足:满足:nrk2|我们就有95.5%的把握判断原时间序列在就有95.5%的把握判断原时间序列在q q之后截尾之后截尾。36ARMA(p,q)的自相关函数的自相关函数,可以看作MA(q)的自相关函数和AR(p)的自相关函数的混合物。当当p=0时,它具有截尾性质时,它具有截尾性质;当当q=0时,它具有拖尾性质;当时,它具有拖尾性质;当p、q都不为都不为0时,它具有拖尾性质时,它具有拖尾性质从识别上看,通常:从识别上看,通常:ARMA(p,q)过程的偏自相关函数(过程的偏自相关函数(PACF)可能在可能
27、在p阶滞后前有几项明显的尖柱(阶滞后前有几项明显的尖柱(spikes),但从),但从p阶滞后项开始逐渐趋向于零;而阶滞后项开始逐渐趋向于零;而它的自相关函数(它的自相关函数(ACF)则是在则是在q阶滞后前有几项明显的尖柱,从阶滞后前有几项明显的尖柱,从q阶滞后项开始逐渐趋向于零。阶滞后项开始逐渐趋向于零。3、ARMA(p,q)过程3、ARMA(p,q)过程37 表表 9.2.1 ARMA(p,q)模型的模型的 ACF 与与 PACF 理论模式理论模式 模型 ACF PACF 白噪声 0=k 0*=k AR(p)衰减趋于零(几何型或振荡型)P 阶后截尾:0*=k,kp MA(q)q阶后截尾:,0
28、=k,kq 衰减趋于零(几何型或振荡型)ARMA(p,q)q阶后衰减趋于零(几何型或振荡型)p阶后衰减趋于零(几何型或振荡型)38 图图9.2.2 ARMA(p,q)模型的模型的ACF与与PACF理论模式理论模式 ACF PACF 模型模型1:tttXX+=17.00.00.20.40.60.812345678ACF10.00.20.40.60.812345678PACF139 模型 2:tttXX+=17.0 模型 3:17.0=tttX-0.8-0.6-0.4-0.20.00.20.40.612345678ACF2-0.8-0.6-0.4-0.20.012345678PACF2-0.5-0
29、.4-0.3-0.2-0.10.012345678ACF3-0.5-0.4-0.3-0.2-0.10.012345678PACF340 模型 4:ttttXXX+=2149.07.0 模型 5:117.07.0+=ttttXX-0.4-0.20.00.20.40.612345678ACF4-0.4-0.20.00.20.40.612345678PACF4-1.2-0.8-0.40.00.40.812345678ACF5-1.0-0.8-0.6-0.4-0.20.012345678PACF541四、随机时间序列模型的估计四、随机时间序列模型的估计42AR(p)、MA(q)、ARMA(p,q)模型
30、的估计方法较多,大体上分为大体上分为3类:(类:(1)最小二乘估计;()最小二乘估计;(2)矩估计;()矩估计;(3)利用自相关函数的直接估计)利用自相关函数的直接估计。下面有选择地加以介绍。结构阶数模型识别确定估计参数43 AR(p)模型的Yule Walker方程估计 AR(p)模型的Yule Walker方程估计在AR(p)模型的识别中,曾得到pkpkkk+=?2211利用k=-k,得到如下方程组:kppppppppp+=+=+=?12112211211211此方程组被称为此方程组被称为Yule Walker方程组方程组。该方程组建立了AR(p)模型的模型参数该方程组建立了AR(p)模型
31、的模型参数1 1,2 2,p p与自相关函数与自相关函数1 1,2 2,p p的关系,的关系,44利用实际时间序列提供的信息,利用实际时间序列提供的信息,首先首先求得自相关函数的估计值求得自相关函数的估计值然后然后利用利用Yule Walker方程组,求解模型参数的估计值方程组,求解模型参数的估计值?,?,?12?p?,?,?12?p?12011102120112?pppppp=由于ptptttXXX=?11于是=pjiijjitE1,022?从而可得 22的估计值的估计值=pjiijji1,02在具体计算时,k可用样本自相关函数rk替代。45 MA(q)模型的矩估计 MA(q)模型的矩估计将
32、MA(q)模型的自协方差函数中的各个量用估计量代替,得到:+=+=+qkqkkqkqkkqk当当当01)(0)1(112222212?首先首先求得自协方差函数的估计值,(*)是一个包含(q+1)个待估参数(*)221,q?的非线性方程组,可以用直接法直接法或迭代法迭代法求解。常用的迭代方法有常用的迭代方法有线性迭代法线性迭代法和和Newton-Raphsan迭代法迭代法。46(1)MA(1)模型的直接算法(1)MA(1)模型的直接算法对于MA(1)模型,(*)式相应地写成1212120)1(=+=于是211=021204=+或0212410=+有于是有解)411(22102=)411(2211
33、211=由于参数估计有两组解,可根据可逆性条件|1|1的MA(q)模型,一般用迭代算法估计参数:由(*)式得=+=+qkqkkkkq12211222102?第一步第一步,给出的一组初值,比如k,212?02)0(=0)0()0()0(21=k?代入(*)式,计算出第一次迭代值02)1(=0)1(kk=(*)48第二步第二步,将第一次迭代值代入(*)式,计算出第二次迭代值)1()1()1()1()2()1()1(1/()2(11022102qkqkkkq+=+=?按此反复迭代下去,直到第m步的迭代值与第m-1步的迭代值相差不大时(满足一定的精度),便停止迭代,并用第m步的迭代结果作为(*)的近似
34、解。49 ARMA(p,q)模型的矩估计 ARMA(p,q)模型的矩估计在ARMA(p,q)中共有(p+q+1)个待估参数1,2,p与1,2,q以及2,其估计量计算步骤及公式如下:第一步第一步,估计1,2,p?1211112112?pqqqpqqqpqpqpqqqqp=+?k是总体自相关函数的估计值,可用样本自相关函数rk代替。50第二步,第二步,改写模型,求1,2,q以及2的估计值将模型 tptptttXXXX+=?2211qtqtt?2211 改写为:tptptttXXXX=?2211qtqtt?2211令ptpttttXXXXX=2211?于是(*)可以写成:(*)qtqttttX=?2
35、211构成一个MA模型。按照估计MA模型参数的方法,可以得到1,2,q以及2的估计值。51 AR(p)的最小二乘估计 AR(p)的最小二乘估计假设模型AR(p)的参数估计值已经得到,即有tptptttXXXX2211+=?残差的平方和为:21221112)()(+=+=nptptptttnpttXXXXS?(*)根据最小二乘原理,所要求的参数估计值是下列方程组的解:Sj?=0即0)(12211=+=jtnptptptttXXXXX?j=1,2,p(*)解该方程组,就可得到待估参数的估计值。52为了与AR(p)模型的Yule Walker方程估计进行比较,将(*)改写成:+=+=+=+=+npt
36、jttnptjtptpnptjttnptjttXXnXXnXXnXXn111221111?j=1,2,p由自协方差函数的定义,并用自协方差函数的估计值+=+=knpttktkXXn11代入,上式表示的方程组即为:jpjpjj2211=+?或jpjpjjrrrr=+2211?j=1,2,pj=1,2,p53解该方程组,得到:=pppppprrrrrrrrrrrr?21102120111021即为参数的最小二乘估计。Yule Walker方程组的解?12011102120112?pppppp=比较发现,当n足够大时,二者是相似的。2的估计值为:pnSpnnptt=+=122154需要说明的是,需要
37、说明的是,在上述模型的平稳性、识别与估计的讨论中,在上述模型的平稳性、识别与估计的讨论中,ARMA(p,q)模型中均未包含常数项。模型中均未包含常数项。如果包含常数项,该常数项并不影响模型的原有性质如果包含常数项,该常数项并不影响模型的原有性质,因为通过适当的变形,可将包含常数项的模型转换为不含常数项的模型。下面以一般的ARMA(p,q)模型为例说明。对含有常数项的模型qtqttptpttXXX+=?1111方程两边同减/(1-1-p),则可得到qtqttptpttxxx+=?1111其中()piiXx=?11pttti=,1,?55五、模型的检验五、模型的检验56由于ARMA(p,q)模型的
38、识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模型确认正确的话,残差应代表一白噪声序列如果估计的模型确认正确的话,残差应代表一白噪声序列。如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。在实际检验时,主要检验残差序列是否存在自相关在实际检验时,主要检验残差序列是否存在自相关。1、残差项的白噪声检验1、残差项的白噪声检验可用可用QLB的统计量进行的统计量进行 2检验检验:在给定显著性水平下,可计算不同滞后期的QLB值,通过与 2分
39、布表中的相应临界值比较,来检验是否拒绝残差序列为白噪声的假设。若大于相应临界值,则应拒绝所估计的模型,需重新识别与估计。572、AIC与SBC模型选择标准2、AIC与SBC模型选择标准另外一个遇到的问题是,在实际识别ARMA(p,q)模型时,需多次反复偿试,有可能存在不止一组(p,q)值都能通过识别检验。显然,增加增加p与与q的阶数,可增加拟合优度的阶数,可增加拟合优度,但却同时降低了自由度但却同时降低了自由度。因此,对可能的适当的模型,存在着模型的对可能的适当的模型,存在着模型的“简洁性简洁性”与模型的拟合优度的权衡选择问题。与模型的拟合优度的权衡选择问题。58其中,n为待估参数个数(p+q
40、+可能存在的常数项),T为可使用的观测值,RSS为残差平方和(Residual sum of squares)。在选择可能的模型时,在选择可能的模型时,AIC与与SBC越小越好越小越好显然,如果添加的滞后项没有解释能力,则对RSS值的减小没有多大帮助,却增加待估参数的个数,因此使得AIC或SBC的值增加。显然,如果添加的滞后项没有解释能力,则对RSS值的减小没有多大帮助,却增加待估参数的个数,因此使得AIC或SBC的值增加。需注意的是:需注意的是:在不同模型间进行比较时,必须选取相同的时间段。常用的模型选择的判别标准有:常用的模型选择的判别标准有:赤池信息法赤池信息法(Akaikeinform
41、ation criterion,简记为简记为AIC)与施瓦兹贝叶斯法施瓦兹贝叶斯法(Schwartz Bayesian criterion,简记为简记为SBC):)ln()ln(2)ln(TnRSSTSBCnRSSTAIC+=+=59由第一节知:中国支出法GDP是非平稳的,但它的一阶差分是平稳的,即支出法GDP是I(1)时间序列。可以对经过一阶差分后的GDP建立适当的ARMA(p,q)模型。记GDP经一阶差分后的新序列为GDPD1,该新序列的样本自相关函数图与偏自相关函数图如下:-0.4-0.20.00.20.40.60.81.024681012141618GDPD1AC-0.6-0.4-0.
42、20.00.20.40.60.81.024681012141618GDPD1PAC例例9.2.3 中国支出法中国支出法GDP的的ARMA(p,q)模型估计。模型估计。60图形:图形:样本自相关函数图形呈正弦线型衰减波,而偏自相关函数图形则在滞后两期后迅速趋于0。因此可初步判断该序列满足2阶自回归过程AR(2)。可初步判断该序列满足2阶自回归过程AR(2)。表表9.2.2 中国中国GDP一阶差分序列的样本自相关函数与偏自相关函数一阶差分序列的样本自相关函数与偏自相关函数kkr*krkkr*krkkr*kr10.8590.8597-0.034-0.25213-0.361-0.08620.622-0
43、.4418-0.1120.01214-0.3630.07630.378-0.0659-0.1750.0415-0.3080.04340.1910.06610-0.228-0.11716-0.216-0.02250.0870.07711-0.282-0.19217-0.128-0.04860.036-0.05112-0.32-0.0218-0.059-0.002426.0222|*kr自相关函数自相关函数与偏自相关函数偏自相关函数的函数值:函数值:相关函数具有明显的拖尾性;偏自相关函数值在k2以后,可认为:可认为:偏自相关函数是截尾的。再次验证了一阶差分后的GDP满足AR(2)随机过程。偏自相关
44、函数是截尾的。再次验证了一阶差分后的GDP满足AR(2)随机过程。61设序列GDPD1的模型形式为ttttGDPDGDPDGDPD+=2211111有如下Yule Walker 方程:=622.0859.01859.0859.01121解为:442.0,239.121=用OLS法回归的结果为:用OLS法回归的结果为:ttttGDPDGDPDGDPD+=211653.01593.11(7.91)(-3.60)r2=0.8469 R2=0.8385 DW=1.1562有时,在用回归法时,也可加入常数项有时,在用回归法时,也可加入常数项。本例中加入常数项的回归为:ttttGDPDGDPDGDPD+=
45、211678.01495.159.9091(1.99)(7.74)(-3.58)r2=0.8758 R2=0.8612 DW.=1.22 63 模型检验模型检验下表列出三模型的残差项的自相关系数及QLB检验值。模型1与模型3的残差项接近于一白噪声,但模型2存在4阶滞后相关问题,Q统计量的检验也得出模型2拒绝所有自相关系数为零的假设。因此:模型1与3可作为描述中国支出法GDP一阶差分序列的随机生成过程。模型1与3可作为描述中国支出法GDP一阶差分序列的随机生成过程。表表 9.2.3 模型残差项的自相关系数及模型残差项的自相关系数及 Q检验值检验值 模型1 模型2 模型3 KResid-ACFQR
46、esid-ACFQResid-ACFQ10.3823.38460.2581.53770.2571.526320.0143.3893-0.1392.0077-0.0401.56463-0.1323.8427-0.2463.5677-0.0591.65544-0.3417.0391-0.52911.267-0.3284.62105-0.1707.8910-0.30013.908-0.1515.286460.2539.90970.27116.2070.3459.033170.14410.6130.15817.0510.1559.845880.05710.7300.11617.5410.07610.0
47、599-0.01910.7450.09717.9140.01110.06410-0.14611.685-0.03617.969-0.12310.72811-0.23314.329-0.13618.878-0.23013.31912-0.04914.4610.06419.104-0.01213.32864 用建立的用建立的AR(2)模型对中国支出法模型对中国支出法GDP进行外推预测。模型进行外推预测。模型1可作如下展开:)()(3222111+=ttttttGDPGDPGDPGDPGDPGDP3221211)()1(+=ttttGDPGDPGDPGDP于是,当已知t-1、t-2、t-3期的GDP
48、时,就可对第t期的GDP作出外推预测。模型模型3的预测式与此相类似,只不过多出一项常数项。对2001年中国支出法GDP的预测结果(亿元)对2001年中国支出法GDP的预测结果(亿元)预测值实际值误差模型1 95469 95933 -0.48%模型3 97160 95933 1.28%预测值实际值误差模型1 95469 95933 -0.48%模型3 97160 95933 1.28%65由于由于中国人均居民消费(CPC)与人均国内生产总值(GDPPC)这两时间序列是非平稳的,因此不宜直接建立它们的因果关系回归方程。但它们都是I(2)时间序列但它们都是I(2)时间序列,因此可以建立它们的ARIM
49、A(p,d,q)模型。下面只建立下面只建立中国人均居民消费(CPC)中国人均居民消费(CPC)的随机时间序列模型。的随机时间序列模型。中国人均居民消费(CPC)经过二次差分后的新序列记为CPCD2,其自相关函数、偏自相关函数及Q统计量的值列于下表:例例9.2.4 中国人均居民消费的ARMA(p,q)模型中国人均居民消费的ARMA(p,q)模型66在5%的显著性水平下,通过Q统计量容易验证该序列本身就接近于一白噪声,因此可考虑采用零阶MA(0)模型考虑采用零阶MA(0)模型:表 9.2.4 CPCD2 序列的自相关函数、偏自相关函数与 Q 统计量值 表 9.2.4 CPCD2 序列的自相关函数、
50、偏自相关函数与 Q 统计量值 kACF PACFQkACFPACFQ10.125 0.1250.26970.1960.0146.2862-0.294-0.3141.8828-0.218-0.3358.0673-0.034 0.0601.9069-0.0100.0248.0724-0.213-0.3502.919100.102-0.1478.6505-0.258-0.1934.57611-0.0710.0019.02560.131 0.0175.057120.006-0.1199.029 ttCPCD=2由于k=2时,|r2|=|-0.29|14/1因此,也可考虑采用下面的MA模型:222=tt