《2022年随机时间序列 .pdf》由会员分享,可在线阅读,更多相关《2022年随机时间序列 .pdf(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 5 章随机型时间序列预测方法96 第 5章随机型时间序列预测方法本章将讨论随机型时间序列预测技术。此方法的优点在于它能利用一套相当明确规定的准则来处理复杂的模式,预测精度也比较高。 但同时为了达到高的精确性,其计算过程复杂,计算工作量大,花费也大。随机型时间序列预测技术建立预测模型的过程可以分为四个阶段:第一阶段:根据建模的目的和理论分析,确定模型的基本形式。第二阶段:进行模型识别,即从一大类模型中选择出一类试验模型。第三阶段:将所选择的模型应用于所取得的历史数据,求得模型的参数。第四阶段:检验得到的模型是否合适。若合适,则可以用于预测或控制;若不合适,则返回到第二阶段重新选择模型。建模流
2、程图如下:根据随机型时间序列预测技术建模顺序,本章依次讨论随机型时间序列模型,ARMA 模型的相关分析,模型的识别,ARMA 序列的参数估计以及模型的检验和预报。合适不合适确定基本模型形式模型识别 (选择一个试验性模型) 参数估计 (估计试验性模型参数) 诊断检验利用模型预测图 5.1 时间序列分析建模流程名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法97 5.1 随机型时间序列模型本节讨论时
3、间序列的几种常用模型。从实用观点来看,这些模型能够表征任何模式的时间序列数据。这几类模型是: 1) 自回归 (AR) 模型;2) 移动平均 (MA ) 模型;3) 自回归移动平均(ARMA) 模型; 4) 求和自回归移动平均(ARIMA) 模型。5.1.1 时间序列所谓随机时间序列是指|,1,2,nXnoN,这里对每个n,nX都是一个随机变量。以下我们简称为时间序列。定义 5.1时间序列|0,1,2,nXn称为平稳的,如果它满足:(1)对任一 n ,()nEXC,C是与 n 无关的常数;(2)对任意的n和k,()()nknkEXCXC其中k与 n 无关。k称为时间序列nX的自协方差函数,0/k
4、k称为自相关函数。平稳性定义中的两条也就是说时间序列的均值和自协方差函数不随时间的变化而变化。显然,,0kkk,,0kkk。不失一般性,对一个平稳时间序列,0,1,nXn,可以假设它的均值为零。若不然,运用零均值化方法对序列进行一次平移变换,亦即令nnXXC,0,1,.n,则nX是一个零均值的平稳序列。这样做,便于下面进行统一讨论。我们可把所要研究的对象,比如某商品的月销售量,看作为一个随机时间序列nX。将手中所有的观察值12,nxxx,如为最近5 年这种商品的月销售量统计数据, 看作为这个随机时间序列的一个样本。若要想预测未来某一时期这种商品的月销售量,关键的问题是要掌握随机序列nX的统计特
5、性。但是,我们并不了解nX的统计特性,而手中只有nX的一个样本。所以,需要我们做的工作就是根据手中的样本去估计nX的概率特性,也就是建立时间序列nX的统计模型,用它来近似实际时间序列,从而做出对未来的预测。5.1.2 自回归 (AR)模型自回归模型 (Autoregressive model) 的形式为:1122nnnpnpnXXXX(5.1.1) 式中p,1为模型参数;nX为因变量,12,.,nnnpXXX为“自”变量。这里“自”变量是同一(因此称为“自”)变量,但属于以前各个时期的数值,所谓自回归即是此含义。最后,,1,0,nn是白噪声序列,即koknnnEE2)(,0)(,名师资料总结
6、- - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法98 也就是说随机序列n的均值为零,方差为2,且互不相关,它代表不能用模型说明随机因素。假定()0, ()tnE Xtn,即随机影响与数据值无关。p 为模型的阶数。用)( pAR来简记此模型。引入向后推移算子B:knnkB XX,CCBk,,1,0k(C为常数 ) 并记)1()(221pppBBBB则式 (5.1.1)可重写为()pnnB X(5.1.2) 称多
7、项式方程()0p为)( pAR模型的特征方程,它的p个根p,21称为模型的特征根。特征根可能是实数,也可能是复数。如果这p个特征根都在单位圆外,即1,1, 2,.,iip则称)( pAR模型是稳定的或平稳的。称上式为平稳性条件。这里应引起读者注意的是,平稳时间序列nX是指nX的均值为常数 (我们设其为零 )且自相关函数为齐次的随机时间序列;而平稳的()ARp)则指它满足平稳性条件:()0p的根均在单位圆外。这两种“平稳”是两个不同的概念。如,对于)1(AR模型,其特征方程为011x特征根111,从而)1(AR的平稳性条件是11。在条件11下,有111110NkNnnnnknNkXXX01kkn
8、k(5.1.3)由于k表示第k期的预测误差,因此上式表示对平稳的)1(AR模型,nX可由过去各期的误差线性表示。其实可以证明对任意的平稳)( pAR模型,nX都可由过去各期的误差线性表示。平稳性保证)( Bp的逆算子存在,但一般为无穷阶的,即0()npnnBB,从而0()knknkXB。这里只讨论平稳的)( pAR模型。注:式 (5.1.3)中假定了序列nX是负向无穷的。由式 (5.1.1)知,如果我们:(1) 能够证明式 (5.1.1)的确是恰当的方程;(2) 能够确定p的数值; (3) 能够确定模型参数1p,.,,那么在式 (5.1.1)去掉n项后就得到预测公式11211?.nnnpnpX
9、XXX,由此进行预测就很容易了。可惜的是并非所有时间序列都能用式(5.1.1)的)( pAR模型来表示。 因此,我们还要考虑其它模型。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法99 5.1.3 移动平均( MA )模型式 (5.1.3) 说明在平稳的)( pAR模型中,nX可由过去各期误差的线性组合表示,而当)( pAR模型非平稳时,线性表示就难以成立了。移动平均模型就是当nX可由过去有限
10、期的误差线性表示的情形。其公式为:1122nnnnqnqX(5.1.4) 其中n是白噪声序列。称满足上式的模型为q阶移动平均模型(Moving average model of order q),简记为)(qMA。与)( pAR模型类似,式 (5.1.4) 可写成如下的算子形式:()nqnXBqqqBBBB2211)(5.1.5) 称()0q为)(qMA模型的特征方程;它的q个根称为)(qMA的特征根。如果)(qMA的特征根都在单位圆外,则称此)(qMA模型是可逆的。如,对于)1(MA模型,其特征方程为011x于是特征根为11,从而可逆性条件为11。在此条件下,由1(1)nnXB可推得1111
11、00(1)kkknnnnkkkBXB XX(5.1.6) 这是一个无限阶的自回归过程,当然,其中n与nX所扮演的角色须作对换。其实,对于阶数1q,均可证明对可逆的)( qMA模型,n均可表示为过去各期数据nkX的线性组合。 与)( pAR中一样, 可逆性保证了)(Bq的逆算子存在。 因此)( pAR与)( qMA模型是互相对偶的两个模型。我们总假定)( qMA模型是可逆的。5.1.4 自回归移动平均( ARMA )模型在建立一个实际时间序列模型时,可能既有自回归部分,又有移动平均部分,如:1111.nnpnpnnqnqXXX(5.1.7) 或者写成算子形式:()()pnqnBXB简记此模型为)
12、,(qpARMA,括号中的第一个数据p是自回归阶数,第二个数据q是移动平均的阶数,故称之为),(qp阶的自回归移动平均模型。实际应用中名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法100 p、q的值很少超过3。对),(qpARMA模型,我们总假定)( Bp和)( Bq(作为变量为B的多项式)无公共因子,分别满足平稳性条件和可逆性条件。如果)(Bp满足平稳性条件, 称),(qpARMA是平稳的;
13、 如果)( Bq满足可逆性条件,称),(qpARMA是可逆的。对平稳的),(qpARMA模型,nX可表示为过去各期误差,21nnn的线性组合;对可逆的),(qpARMA模型,n可表示为过去各期数据12,.nnnXXX的线性组合。由于自回归模型不存在其它自变量,不受模型变量 “相互独立” 假定条件的约束。因此, 用AR模型及其原理可以构成多种模型以消除或改进普通回归预测中由于自变量选择、 多重共线性、 序列相关等原因所造成的困难。此外,在AR模型中,各种因素对预测目标的影响是通过它们在时间过程中的综合体现被考虑的,是将序列历史观察值作为诸因素影响与作用的结果用于建立其本身的历史序列线性回归模型的
14、,因此,用普通最小二乘法就可以对模型进行估计和求解。这一点,AR模型比其它类型的时间序列模型都优越,应用得也最广泛。5.1.5 求和自回归移动平均(ARIMA) 模型前面介绍的三类模型仅适用于描述平稳的时间序列,而实际应用中遇到的时间序列往往是非平稳的,尤其是在经济管理中碰到的时间序列。尽管从实际应用的角度看,用适当的自回归模型去近似一个稳定或不稳定的时间序列,在理论和方法上都是可行的,但我们常用差分化的方法将非平稳的序列化成平稳序列来求解。有些时间序列常呈现出一种特殊的非平稳性,称之为齐次非平稳性:只要进行一次或多次差分就可以将其化为平稳序列。差分的次数称为齐次化的阶。这样的时间序列可用求和
15、自回归移动平均模型来描述。定义差分1nnnXXX引入差分算子B1。 n 阶差分可定义为nnB)1(,如二阶差分222(1)(12)nnnXBXBBX=122nnnXXX或者2112()2nnnnnnnXXXXXXX),(qdp阶求和自回归移动平均模型为()()dpnqnBXB(5.1.8)亦即dnX是),(qpARMA序列。其中d为求和阶数,p、q分别为dnnYX序列的自回归和移动平均的阶数。式(5.1.8)所示的求和自回归移动平均模型用记号),(qdpARIMA表示。对这类非平稳的序列,我们假定n从 1 开始nX才有定义, 并且假定nX的前d个随机变量12,.,dXXX是均值为零,方差有限且
16、与dnX不相关,因而也与n不相 关。序 列nX可 用它 的 初 值12,.,dXXX及 平稳序列|,1,2dnnnYYXn表达。事实上,由于差分的逆运算是求和,所以名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法101 111101dndndiinjnidddjijXCXCY111101dnknkiinkjdikdkjijCXCY,dkn(5.1.9)其中)!(!/(!ktktCtk。我们不去推
17、导上述公式,仅仅讨论两种最简单的情况。i)1d,此时112211.nnnnnXXXXXXXX1111njjXY1nkkkjjXY,1kn从而式( 5.1.9)成立。ii)2d,此时由上式知11111nnknjkjkjjXXXXX同理有121jkjkkiikXXX,代入整理知11()()(1)nknkkkkjjXXnkXXnkjY,2kn对于),(qdpARIMA序列,它可以通过d阶差分化成平稳的),(qpARMA序列,从而化成了前面三类模型。但这种将ARMA推广到ARIMA的非平稳序列是非本质性的,所以本章也就不再详细讨论了。5.1.6 季节性模型对于含有季节性周期的时间序列,也可用季节差分的
18、方法将之化成平稳序列。例如,对月度波动,可以用月度差分12121B对nX作运算1212nnnXXX对季度波动,可以用季度差分444(1)nnnnXBXXX消除数据中的季节性影响。鲍克斯詹金斯季节模型为12()()dpnqnBXB(5.1.10)若取1qdp,则上述模型可展开为1211(1)(1)(1)(1)nnBBBXB有时随机干扰项n也是与季节相关的。这时,可以用模型1212()()dpnqnBXB名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 33 页 - - - -
19、 - - - - - 第 5 章随机型时间序列预测方法102 来描述。例如121211(1)(1)(1)(1)(1)nnBBBXBB就描述了一个既有线性发展趋向、又含月度周期变动的随机型时间序列模型。如能预测到nX的长期趋势)( nf时,()nXfn就是零均值了。5.2 ARMA 模型的相关分析本节简要介绍ARMA 序列的自相关函数和偏相关函数及其性质,并讨论它们与模型参数间的关系。AR( p)和 MA( q) 序列是ARMA( p,q)序列的特例,但AR(p)和 MA( q) 序列有它们自己独特的性质,本节就 AR(p),MA( q),ARMA( p,q)三类模型分别进行讨论。首先给出自相关
20、函数的定义。设nX是一个零均值的平稳时间序列,定义nX的自协方差函数为:kknnkE XXk0 由此定义nX的自相关函数为:0/kkkk05.2.1 AR(p)序列的自相关函数设nX满足 AR(p)模型,我们称nX为 AR(p)序列。重写式 (5.1.1),1122nnnpnpnXXXX用nkX乘上式两边,再取均值,可得,对任意的0k有1122knnknnknnkpnpnknnkE XXEXXXXXXX1122kkpkp , k0 (5.2.1) 因此又有 (两边同除以0) 0,2211kpkpkkk(5.2.2) 或者写成算子形式(以下为方便起见,省掉)(Bp的下标p) 0,0)(kBk这就
21、是AR( p)的自相关函数所满足的方程。由于()0的根均在单位圆外,由差分方程的理论可知:若()0的根互不相同,为p,21,则式 (5.2.2)的通解为0,2211kccckppkkk(5.2.3) 其中pccc,21为常系数, 对任意的0k,kk,而10,故由式 (5.2.3)知pccc,21由以下方程组确定:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法103 121112221()()(
22、)0,1,2,.,1pkkkkkkpppcccccckp若()0有重根,比如r21,则式 (5.2.3)前r项应改为krrkckcc1121)(一般地,设()0有根12,s,重数分别为srrr,21, (1siirp) ,则式 (5.2.2)的通解为krrkkckcc11,12,11 ,1)(11krrkckcc21,22,21 ,2)(22ksrrssssskckcc)(1,2,1,不管()0有无重根,总可证明存在正常数21, gg使0,21kegkgk亦即k随k的增加按指数形式衰减,呈“拖尾”状。上面介绍了从模型参数p,21求自相关系数k的方法。但实际上,我们 并 不 知 道 时 间 序
23、列nX, 而 只 知 道 其 一 个 样 本 , 从 而 我 们 并 不 知 道p,21。由统计理论,自相关系数k可从样本估计得到,模型参数k则是未知的,因此需要从k来求得p,21。在式 (5.2.2) 中,取pk,2, 1可得如下线性方程组:pppppppp22112211211211(5.2.4) 将p,1的估计值代入式(5.2.4),则可求得参数p,21的估计值。 称式(5.2.4)为 Yule-Walker 方程,它是模型识别的基本方程。为求白噪声的方差2,由式 (5.1.1) 22211(.)nnnpnpEEXXX21,12ppnjnnjijninjji jE XXXXX=pjiij
24、jipjjj1,102而由式 (5.2.1)可知pjiijjipjjj1,1,代入2的表达式得Pjiijjipjjj1,0102(5.2.5) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法104 当从样本求得样本自协方差函数k,并进而求得模型参数i的估计值后,代入上式即得白噪声的方差2的估计值。5.2.3 MA( q)序列的自相关函数当nX为 MA( q)序列时,即110qnnnqnqini
25、iX(其中记10) 则由定义可得,对任意的0k,00()qqknnkijninkjijE XXEqkqkkqkqkkq01)(0)1(112222212(5.2.6) qkqkkqqkqkkk01)1/()(0122111(5.2.7) 上述两式说明,当tX与nX的相距步数qnt时,tX与nX不相关,即MA( q)序列的自协方差(或自相关 )函数k(或k)从qk以后全部为零。称这一性质为“截尾” (对应于AR(p)序列中的拖尾 )的。反过来也可以证明,若一个平稳时间序列的自协方差函数截尾,那么它必定是MA( q)序列。式(5.2.7)已经表明了k与 MA( q)的参数221,q的相互关系。根据
26、这个关系,由模型参数q,21及白噪声序列的方差2可求得自相关系数。反过来,由自相关系数)0(qkk也可以解出221,q。当然k与i之间的关系是非线性关系,而在 AR(p)中k与i之间是线性关系,即已知k时,i是线性方程的解,反之,i已知时,k亦是线性方程的解。5.2.3 ARMA(p,q) 序列的自相关函数当序列nX为ARM A序列时,由于比较复杂,我们下面只给出结论。1)当kq时,()0kB(5.2.8) 此式与式 (5.2.2)类似,但这里的k是从1q开始的。而q,1的结构则比较复杂,我们不再讨论。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - -
27、 - - - - - 名师精心整理 - - - - - - - 第 9 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法105 当()0无重根时,假设其p个根为p,1,则式 (5.2.8)的通解为:pqkcccpkpkkk,2121(5.2.9) 它仍然具有呈“拖尾”性。2)若已知,10,利用式 (5.2.8) ,取pqqqk,2,1,得到关于p,21的线性方程组11211211221122qqqpqpqqqpqpqpqpqppq(5.2.10) 由此可解出自回归参数12,p。为求移动平均参数12,q,令1122nnnnpnpXXXXX,从而11nnnqn
28、qX即nX为 MA( q)序列,其自协方差函数k可通过nX的自协方差函数k求得,即11()()ppknjnjnkinkijjE XXXX11,1pppkikijkjijkjiijij,0pijkjiij其中最后一个求和项中假定01。有了k后,将它代入式(5.2.6)中可解出移动平均参数1,q和白噪声序列的方差2。现在我们将k的性质总结如下:对M A ()q序列,k是截尾的; 对AR ()p序列,k是拖尾的,它们能用式(5.2.3) (当()0无重根时)统一表示;对A R M A (,)p q序列,k是拖尾的,而且当kqp时,k能用式 (5.2.9) (当()0 x无重根时)统一表示,但1,qp
29、(当qp时)不能用式(5.2.9) 表示。这些性质以后将要用到。5.2.4 偏相关函数由上述三小节的讨论知道,k的截尾性是M A序列的特有标志,而拖尾性则名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法106 是A R序列和ARMA序列所共有的特征。那么我们自然要问,A R序列有没有其独自的特征即用来区分A R序列与ARMA序列的标志呢?为此我们先引入偏相关函数的概念。对1k,我们考虑用12,
30、.,nnnkXXX对nX作最小方差估计,亦即考虑回归方程1122nnknknkkkXXXX,最优系数kkkk,21使得21kknkjnjjE XXkjiijkikjkjjkj1,102达到最小。为此只须对(1, 2,.,)kjjk求k的偏导数kjk,并令其为零,即得)1(kjkj满足的方程kkkkkkkkkk2121132121112111(5.2.11) 求解此方程即可得(1, 2,.,)kjjk。称序列kk),2,1(k为nX的偏相关函数。对 AR(p)序列nX,由k的定义知,对任意的pk,211()pkkjnjnkjnjjjEXX211()pknjkjnjkjnjjjpEXX2211()
31、pkjkjnjkjnjjjpEXX显然,对任意的pk,若取kjppjjkj,01 ,则k达到最小值2。由此可见AR ()p序列的偏相关函数kk在pk后等于零,即是截尾的。反过来也成立,亦即偏相关函数的截尾性是A R序列特有的标志。从式 (5.2.11)可得kj的递推算法:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法107 11111,111111,1,1,(1)()(1),1,2,.,kk
32、kkkkjkjjkjjjkjkjkkk kjjk(5.2.12) 对M A序列或ARM A序列,亦可类似的引入偏相关函数。还可以证明, 对M A序列或ARM A序列,其偏相关函数是拖尾的,即存在正常数21, gg使kgkkeg21,kpq表 5.1 对这三类序列的相关性质进行了比较。表 5.1 ARM A序列的分类性质一览表AR ()pMA()qARMA(,)p q模型方程()nnB X()nnXB()()nnB XB平稳条件()0的 根 全 在单位圆外当然平稳()0的根全在单位圆外可逆条件当然可逆()0的 根 在 单位圆外()0的根全在单位圆外传递形式1()nnXB()nnXB1()()nn
33、XBB逆转形式()nnBX1()nnB X1()()nnBBX自相关函数拖尾截尾拖尾偏相关函数截尾拖尾拖尾5.3 模型的识别上一节讨论了A RM A序列的自相关函数和偏相关函数的性质及其与模型参数之间的关系。现在我们需要讨论这样的问题:如果nX是一未知其模型的A R M A序列,现在获得了它的一段样本数据1,.,NXXX,如何根据这N个数据对nX的模型做出估计。或者,更具体些,如何判断和估计出模型的阶数p、q和参数211,pq。通常 ,对p、q的估计称为模 型识别 ,对211,pq的估计称为参数估计。假定所讨论的时间序列是平稳的。对非平稳的情形,假定经过某种处理(如差分、季节差分等)后,可以化
34、为平稳的序列。还假定序列均值为零。我们是从自相关函数识别模型的阶数的,故先讨论自相关函数的估计。表现形式类别模型名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法108 5.3.1 样本自相关函数与样本偏相关函数假设已经得到了时间序列nX的一段样本值1,.,NXXX, 其中N称为样本长度。定义nX的样本自协方差?k和样本自相关函数?k为?k11?,0,1, 2,1NkkttktX XkNN?k=
35、?k=?k0?/,0,1, 2,1kN也有人采用如下定义:*?k11,0 , 1 , 2 ,1NkttktX XkNNk显然,*?k?kNNk,因此,当N远远大于k时,*?k与?k是近似相等的(称为渐近相等 ),而当 n 足够大时,为确定阶只需对并不太大的k估计出k即可。有了样本自相关函数,便可按式(5.1.11)那样定义样本偏相关函数。解方程kkkkkkkkkk?1?1?12121321211121(5.3.1) 得到?(1, 2,)kkk, 这就是nX的样本偏相关函数, 也可按式 (5.2.12) 递推计算,只须将那里的j换为?j即可。如果nX为A RM A序列,?k和?k作为k、k的估计
36、量具有如下性质:性质 1 它们是渐近无偏估计,即?limkNE=k,?limkNE=k,0k;性质2 如nX是M A ()q序列,则对kq,?k的渐近分布为正态分布211?(0,(12)qttNN;性质 3设nX为AR ()p序列,则?kk是kk的渐近无偏估计:,?lim0,kkkkkNkpEkp进而对kp,?kk的渐近分布为正态分布1(0,)NN。5.3.2 模型识别本节根据上一段中讨论的样本自相关和样本偏相关函数的性质来判断nX的名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1
37、3 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法109 模型阶数,即p、q的值。若nX是求和模型,则还要确定d的值。1) 识别的依据:根据5.2 中ARM A序列自相关,偏相关函数的性质,若样本自相关函数?k在kq后截尾,则判断nX是()M A q序列;若?kk在kp以后截尾,则判断是()ARp序列。若?k、?kk都不截尾,且都被负指数型的数列所控制(即拖尾的 ),则应判断为ARM A序列, 但尚不能判定其阶数。在其它情况下需要考虑求和、季节性、非平稳性等。2) ?k和?kk截尾性的判断:自相关和偏相关函数k、kk的截尾性是指它们从某个q或p值后全为零
38、。但由于?k、?kk是k、kk的估计值,它们必然有误差,所以即使nX为()M A q序列,kq后?k也不会全等于零,而只是在零上、下波动。由性质2,对()M A q序列,当kq时,0k,而?k的渐近分布为正态分布,由正态分布的性质知?kP211?(12)68.3%qttN?kP212?(12)95.5%qttN根 据 精 度 要 求 确 定 概 率0.683或0.955, 然 后 对 每 个0k, 逐 个 检 验mkkk?,?,?21, (m一 般 地 取N或10N) , 检 验 其 中 满 足?i211?(12)qttN的?i个 数 的 比 例 是 否 达 到 了68.3 或 者 满 足?i
39、212?(12)qttN的?i比例 是否达 到了95.5%。对某 一*1q,若在*1, 2 ,1kq时均没有达到,而在*kq时达到了,就说?k在*q以后截尾,于是判断序列nX为()M A q序列。 同理, 对于()ARp模型,对每个0k,逐个地检验1 ,1?kk,?,km km,看其中满足?ii1N的?ii比例是否已经达到了68.3%或 者 满 足?ii2N的?ii比 例 是 否 已 经 达 到 了95.5 。 若 在*1,1kp处都没有达到,在*p处达到,则可判断此序列为()ARp序列。3) 混合模型定阶: 若时间序列nX的样本自相关函数和偏自相关函数均不截尾,但较快地收敛到零,则序列很可能
40、是ARM A序列。不过, 这时其中的p、q比较难以判别。识别p、q,可以从低阶到高阶逐个取(,)p q为(1,1),(1,2),(2,1),(2, 2), 等值进行尝试。所谓尝试,就是先认定(,)p q为某值 (如(1,1),然后进行下一步的参数估计,并定出估计模型, 再用后面将要介绍的检验方法检验该估计模型是否可被接受,也就是与实际序列拟合得好不好。若不被接受,就调整名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 33 页 - - - - - - - - - 第 5
41、章随机型时间序列预测方法110 (,)p q的尝试值,重新进行参数估计和检验,直到被接受为止。初看起来,这个方法似乎过于繁琐, 其实, 下面将会看到, 即便是已经判定一个时间序列为AR或M A序列,也要通过诊断检验后才能放心使用。4) 求和阶数d的识别:若?k和?kk都不截尾,而且(至少有一个 )下降趋势很慢,则可认为它们不是拖尾的,即不能被负指数序列所控制,这时可重新计算并按要领1) ,2) ,3)分析差分序列(2,)nXnN的样本自相关和样本偏相关函数 。 若 这 两 个 函 数 仍 不 截 尾 且 至 少 有 一 个 下 降 很 慢 , 则 可 再 考 虑 对2(3, 4,)nXnN进行
42、分析,直到某一次(1,)dnXndN的样本自相关或样本偏相关函数截尾或都为拖尾为止。这时的d即为求和阶数。实际使用中,d一般不超过2,否则必须检查原序列是否存在周期波动或其它影响。若能根据数据的来源直接提供d 的值,则不必对它进行估计。5) 确定周期:如果时间序列nX存在周期波动,例如月度波动,那么序列nX中的数据点就会同那些领先或滞后12 个月的相应数据点存在某种程度的相关。换句话说, 就是在tX与12tX之间存在某种程度的相关。由于tX与12tX的相关和12tX与24tX的相关一样, 故12tX与24tX之间也存在一定的相关。这些相关都应在自相关函数k中表现出来。 因此,若序列存在月度周期
43、波动,那么在k=12,24,36 时,自相关函数k应出现高峰。所以,通过观察样本自相关函数中的峰值可以识别时间序列是否存在周期波动。若存在, 可先进行季度差分,再按上述准则进行识别。对周期为季度的情形是完全类似的。6) 去掉nX的均值项:若nX中包含非随机的均值项nf,那末在计算样本自相关函数和样本偏相关函数以及对序列进行模型识别和参数估计时,一定要先设法将均值去掉。常用的办法是从nX中减去它的样本均值11?NttuXN,即用nnnzXf代替nX进行分析。或者将nf看作为数列1,NXX的长期趋势,用第 3 章介绍的方法求出,然后用nnnzXf代替nX进行分析。上面讲的模型识别方法实际上是以自相
44、关函数和偏相关函数估计为主,以直观检验为辅, 并把两者结合起来进行识别的方法。其一般步骤是首先画出数据依时间变化的图形, 对序列的平稳性,周期性等进行直观性的初步检查和判断,以确定所分析的序列大约是何种类型的序列。如果是求和型或周期型,先对数据进行处理。然后再计算模型的样本自相关函数和样本偏相关函数,以确定模型阶次。在此值得指出的是, 上面虽然给出了详细的模型识别条件和用以判别相关函数截尾特性的判别公式, 但因样本相关函数仅仅是一个参数估计值,所以往往会偏离理论值。尤其当样本比较小时,这种差别就更大。因此,在运用相关函数识别模型时,一般要求时间序列长度N不小于 50,滞后周期k取小于或等于4N
45、。在对一个时间序列识别时,有时可能得到几个不同的结果,由于它们的自协方差函数 (识别的依据 )非常接近,所以这些模型与真实模型都是十分相近的,从而它们的预报、控制等问题的解也是非常接近的。例 51 北京市 1977 年 1 月到 1981 年 12 月新鲜蔬菜销售量(万斤 )如表 5.2 所名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法111 示。从图5.2 中可以看到,由于居民冬季贮藏大白
46、菜的缘故,蔬菜的月销售量呈现很强的季节性。试识别此时间序列的模型。解 :先将原始序列零均值化,再计算其样本自相关函数与偏相关函数,输出结果见图 5.3(已将计算机输出结果作了整理)。从图 5.3 中可见tX的样本自相关函数?k在12, 24k时很高。 这表明该序列具有很强的季节非平稳性。这与对实际情况的分析和图5.2 所示的图形是一致的。为消除月度季节性影响,对原序列进行差分,计算12tX的相关函数,结果如图5.4 所示。从图中可见12tX的自相关函数近似正弦波,且两种相关函数衰减都很缓慢。这说明12tX仍不是平稳序列,故需再进行一次一阶差分12tX,并计算其相关函数,见图5.5。从中看出,随
47、k、m 的增加,?k、?m m迅速下降,故可以认为12tX是平稳序列。此外,从图5.5 中还可看到,当k=12 时,?0.332k,其值仍较高,说明残差序列中可能具有一阶季节相关,故用12(1)tB加以描述。经过以上识别,最后选择的模型结构形式如下:1212(1)(1)ttBXB表 5.2 北京市 1977 年 1 月 1981年 12 月新鲜蔬菜月销售量统计年 .月销售量tX年.月销售量tX年.月销售量tX1977.11977.21977.31977.41977.51977.61977.71977.81977.91977.101977.111977.121978.11978.21978.31
48、978.41978.51978.61978.71978.8 624172758619118592211620191263901905724498250216964378597053710697641381822998210812704320703 1978.91978.101978.111978.121979.11979.21979.31979.41979.51979.61979.71979.81979.91979.101979.111979.121980.11980.21980.31980.4 1536327251695001253674496859952710206186252012227
49、10017865170972965379071106446971769691828543 1980.51980.61980.71980.81980.91980.101980.111980.121981.11981.21981.31981.41981.51981.61981.71981.81981.91981.101981.111981.12 1729319578293572606021897251796919612145815275261055212719177212104928859221472363924313648428487 名师资料总结 - - -精品资料欢迎下载 - - - - -
50、 - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法112 010203040506001000020000300004000050000600007000080000销售量月图 5.2 蔬菜月销售量(横坐标为月的序号,纵坐标为月销售量(万斤) )图 5.3 tX的样本自相关函数和偏自相关函数102030405060-0.20.00.20.40.60.81.0样本的自相关函数k102030405060-0.4-0.20.00.20.40.60.8样本的偏自