《数学平稳时间序列模型建立.pptx》由会员分享,可在线阅读,更多相关《数学平稳时间序列模型建立.pptx(163页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、引言:对平稳时间序列建立模型一般要经过以下几步:1.模型识别:根据系统性质,以及所提供的时序据的概貌,提出一个相适的类型的模型、模型的定阶等。2.模型参数估计:就是根据实际的观测数据具体地确定该数学模型所包含的项数以及各项系数的数值。3.模型的诊断检验:包括模型的适应性检验等。4.模型的应用:如预测。本章主要介绍前三部分的内容。第1页/共163页建模步骤平稳非白噪声序列计算样本相关系数模型识别参数估计模型检验模型优化序列预测YN第2页/共163页第一节 平稳时间序列模型的识别一、模型识别前的说明二、模型识别方法返回本节首页下一页上一页第3页/共163页一、模型识别前的说明(一)关于非平稳序列本
2、章所介绍的是对零均值平稳序列建立ARMA模型,因此,在对实际的序列进行模型识别之前,应首先检验序列是否平稳,若序列非平稳,应先通过适当变换将其化为平稳序列,然后再进行模型识别。返回本节首页下一页上一页第4页/共163页序列的非平稳包括均值非平稳和方差非平稳。均值非平稳序列平稳化的方法:差分变换。方差非平稳序列平稳化的方法:对数变换、平方根变换等。序列平稳性的检验方法和手段主要有:序列趋势图、自相关图、单位根检验、非参数检验方法等等。第5页/共163页单位根检验定义通过检验特征根是在单位圆内还是单位圆上(外),来检验序列的平稳性方法DF检验ADF检验PP检验第6页/共163页DF检验假设条件原假
3、设:序列非平稳备择假设:序列平稳检验统计量 时 时第7页/共163页DF统计量 时 时第8页/共163页DF检验的等价表达等价假设检验统计量第9页/共163页DF检验的三种类型第一种类型第二种类型第三种类型第10页/共163页例1对1978年2002年中国农村居民家庭人均纯收入对数序列 和生活消费支出对数序列 进行检验 第11页/共163页例1 时序图第12页/共163页例1 输入序列的DF检验第13页/共163页例1 输出序列的DF检验第14页/共163页ADF检验DF检验只适用于AR(1)过程的平稳性检验。为了使检验能适用于AR(p)过程的平稳性检验,人们对检验进行了一定的修正,得到增广检
4、验(Augmented DickeyFuller),简记为ADF检验第15页/共163页ADF检验的原理若AR(p)序列有单位根存在,则自回归系数之和恰好等于1 第16页/共163页ADF检验等价假设检验统计量第17页/共163页ADF检验的三种类型第一种类型第二种类型第三种类型第18页/共163页例1续对1978年2002年中国农村居民家庭人均纯收入对数差分后序列 和生活消费支出对数差分后序列 进行检验 第19页/共163页例1 序列的ADF检验第20页/共163页例1 序列的ADF检验第21页/共163页(二)关于非零均值的平稳序列非零均值的平稳序列有两种处理方法:设xt为一非零均值的平稳
5、序列,且有E(xt)=方法一:用样本均值 作为序列均值的估计,建模前先对序列作如下处理:令 然后对零均值平稳序列wt建模。第22页/共163页方法二 在模型识别阶段对序列均值是否为零不予考虑,而在参数估计阶段,将序列均值作为一个参数加以估计。以一般的ARMA(p,q)为例说明如下:将上式展开得:此时,所要估计的未知参数有p+q+1个。第23页/共163页式中:在实际估计模型时,可将0看作一个常数估计,若0显著不为0,则0,此时0、有如上关系。若0显著为0,则可认为=0,在最终模型中将此常数项去掉即可。一般而言,后一种方法拟合的效果较好。第24页/共163页(三)关于平稳序列均值是否为零的检验。
6、一种方法为检验=E(xt)=0可将样本均值 和均值的标准差 进行比较,若样本均值落在 的范围内,则可认为是零均值过程。第25页/共163页Box-Jenkins 的模型识别方法 三类平稳时间序列的自相关函数和偏自相关函数的统计特性:模型(序列)AR(n)MA(m)ARMA(n,m)自相关函数 拖尾 截尾 拖尾偏自相关函数 截尾 拖尾 拖尾二、模型识别方法第26页/共163页(一)平稳序列模型识别要领零均值平稳序列模型识别的主要根据是序列的自相关函数(ACF)和偏自相关函数(PACF)的特征。若序列xt的偏自相关函数 在kp以后截尾,即kp 时,而且它的自相关函数 拖尾,则可判断此序列是AR(p
7、)序列。返回本节首页下一页上一页第27页/共163页若序列xt的自相关函数 在kq以后截尾,即kq 时,而且它的偏自相关函数 拖尾,则可判断此序列是MA(q)序列。若序列xt的自相关函数、偏相关函数都呈拖尾形态,则可断言此序列是ARMA序列。若序列的自相关函数和偏自相关函数不但都不截尾,而且至少有一个下降趋势势缓慢或呈周期性衰减,则可认为它也不是拖尾的,此时序列是非平稳序列,应先将其转化为平稳序列后再进行模型识别。第28页/共163页(二)样本自相关函数(SACF)和偏自相关函数(SPACF)截尾性的判断。前面模型识别方法中有关自相关函数 、偏自相关函数 截尾性的判断仅是理论上的,实际上的样本
8、自相关函数 和样本偏自相关函数 仅是理论上的一个估计值,由于样本的随机性,免不了有误差。因此需要根据SACF和SPACF对ACF和PACF的截尾性作一判断。第29页/共163页计算样本相关系数样本自相关系数样本偏自相关系数第30页/共163页模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的 或 仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数 ,与 都会衰减至零值附近作小值波动?当 或 在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?第
9、31页/共163页1.样本自相关函数截尾性的判断方法理论上证明:若序列xt为MA(q)序列,则kq后,序列的样本自相关函数 渐近服从正态分布,即:第32页/共163页故由正态分布理论可知:此处n是样本容量。对于kq,若 的个数不超过总个数的31.7%,或 的个数不超过总个数的4.5%,就可认为 在kq时是截尾的。第33页/共163页在实际进行检验时,可对每个k0,分别检验 (通常取 )中满足 的个数所占的百分比是否超过31.7%,或满足 的个数是否超过4.5%。若k=1,2,q-1都超过了 而k=q时未超过,就可认为 在kq时是截尾的。第34页/共163页2.样本偏自相关函数截尾性的判断方法可
10、以证明:若序列xt为AR(p)序列,则kp后,序列的样本偏自相关函数 服从渐近正态分布,即近似的有:此处n表示样本容量。于是可得:第35页/共163页在实际进行检验时,可对每个k0,分别检验 (通常取 )中满足 的个数所占的百分比是否超过31.7%,或满足 的个数是否超过4.5%。若k=1,2,p-1都超过了 ,而k=p时未超过,就可认为 在kq时是截尾的。第36页/共163页(三)关于ARMA序列阶数的确定ARMA序列的阶数,直接通过自相关图较难确定,较常用的方法有Pandit-Wu方法或延伸自相关函数(EACF)法。第37页/共163页样本相关系数的近似分布BarlettQuenouill
11、e第38页/共163页模型定阶经验方法95的置信区间模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。第39页/共163页【例4-1】某车站1993-1997年各月的列车运行数量数据共60个,单位:千列公里,一阶差分后的序列共59个数据,如下图所示。第40页/共163页列车运行数量数据差分序列图第41页/共163页列车运行数量数据差分序列的相关函数图第42页/共163页列车运行数量数据差分序列的相关函数图 第43
12、页/共163页 从数据图可初步断定序列是平稳的 为3步截尾,可初步判定差分后的序列适合MA(3)模型。当 时,在 中满足的比例达到 第44页/共163页例2.5续选择合适的模型ARMA拟合1950年1998年北京市城乡居民定期储蓄比例序列。第45页/共163页序列自相关图第46页/共163页序列偏自相关图第47页/共163页拟合模型识别自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相
13、关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾 所以可以考虑拟合模型为AR(1)第48页/共163页例3.8美国科罗拉多州某一加油站连续57天的OVERSHORT序列 第49页/共163页序列自相关图第50页/共163页序列偏自相关图第51页/共163页拟合模型识别自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出典型非截尾的性质。综合该序列自相关系
14、数和偏自相关系数的性质,为拟合模型定阶为MA(1)第52页/共163页例3.91880-1985全球气表平均温度改变值差分序列 第53页/共163页序列自相关图第54页/共163页序列偏自相关图第55页/共163页拟合模型识别自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)模型拟合该序列第56页/共163页第二节 模型的定阶 模型的定阶又称模型的过拟合检验,分两种情况,一是评价模型是否包含过多的参数。二是评价模型是否参数不足,需要拟合额外的参数。模型定阶的准则主要有残差方差图定阶法、F检验定阶法、AIC和SBC
15、定阶准则等等。返回本节首页下一页上一页第57页/共163页第二节 模型的定阶一、残差方差图定阶法二、F检验定阶法三、最佳准则函数定法返回本节首页下一页上一页第58页/共163页一、残差方差图定阶法1.基本思想如果拟合的模型阶数与真正阶数不符合,则模型的残差平方和SSE必然偏大,残差方差 将比真正模型的残差方差大。如果是不足拟合,那么逐渐增加模型阶数,模型的残差方差会渐减少,直到残差方差达到最小。如果是过度拟合,此时逐渐少模型阶数,模型残差方差分逐渐下降,直到残差方差达到最小。返回本节首页下一页上一页第59页/共163页2.残差方差的估计公式注:式中“实际观察值个数”是指拟合模型时实际使用的观察
16、值项数,即经过平稳化后的有效样本容量。设原序列有n个样本,若建立的模型中有含有自回归AR部分,且阶数为p,则实际观察值个数为n-p个。若没有AR部分,则实际观察值个数即为n个。模型的参数个数指模型中所含的参数个数,如:若是不带常数项的ARMA(p,q)模型,参数个数为p+q个,若带有常数项,则参数个数为p+q+1个。第60页/共163页AR(n)模型:MA(m)模型:ARMA(n,m)模型:第61页/共163页从建模的“约简”性原则出发可以初步判断合适的模型阶数为4。例4-1的残差方差图 第62页/共163页用Eviews建立ARMA模型后,可直接得到剩余平方和SSE(Sum squared
17、resid)输出结果中也可直接得到残差标准差:,此项的平方即为残差方差。因此,对不同的模型残差方差进行比较,直接比较此项既可。第63页/共163页例:以zl14.wf1 磨轮剖面数据为例,分别建立适应性模型,输出结果见图示,从中选择最佳模型,第64页/共163页第65页/共163页第66页/共163页第67页/共163页三个模型残差方差比较三个模型残差方差比较第68页/共163页二、F检验定阶法1.基本思想(以一般情形和ARMA(p,q)模型为例)先对数据拟合ARMA(p,q)模型(假设不含常数项),设其残差平方和为Q0,再对数据拟合 较低阶的模型ARMA(p-m,q-s),设其残差平方和为Q
18、1。建立原假设H0:返回本节首页下一页上一页第69页/共163页在原假设成立的条件下有:于是计算统计量F,在给定的显著性水平下。若FF,则拒绝原假设,说明两模型差异是显著的,此时模型阶数存在升高的可能性。若F1)检验统计量检验统计量:Q统计量(Q statistic)其中,n为样本容量,m为滞后长度。Q近似地服从 。第124页/共163页对例4-1拟合MA(1)模型,模型适应性检验的Ljung-Box-Pierce统计量为 相伴概率(p值)6 12.26 0.03 12 6.37 0.13 前6期残差自相关的整体检验的相伴概率(p值)小于0.05,表明MA(1)模型不是适合的。第125页/共1
19、63页 例4-1残差自相关图(MA(1))滞后两期的残差自相关函数大于 残差自相关检验也表明MA(1)模型不是适合的。第126页/共163页对例4-1拟合MA(3)模型,模型适应性检验的Ljung-Box-Pierce统计量为 相伴概率(p值)6 5.62 0.13 12 10.63 0.30 第127页/共163页例4-1残差自相关图(MA(3))第128页/共163页例2.5续检验1950年1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性 残差白噪声序列检验结果延迟阶数LB统计量P值检验结论65.830.3229拟合模型显著有效1210.280.50501811.380.8361第
20、129页/共163页参数显著性检验目的检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简 假设条件检验统计量第130页/共163页例2.5续检验1950年1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著 参数检验结果检验参数t统计量P值结论均值46.120.0001显著6.720.0001显著第131页/共163页例3.8续:对OVERSHORTS序列的拟合模型进行检验 残差白噪声检验参数显著性检验检验参数t统计量P值结论均值3.750.0004显著10.600.0001显著延迟阶数LB统计量P值结论63.150.6772模型显著有效129.050.6171第
21、132页/共163页例3.9续:对1880-19851880-1985全球气表平均温度改变值差分序列拟合模型进行检验 残差白噪声检验参数显著性检验检验参数t统计量P值结论16.340.0001显著3.50.0007显著延迟阶数LB统计量P值结论65.280.2595模型显著有效1210.300.4247第133页/共163页二、模型的平稳性和可逆性分析(一)平稳性分析 若是AR(P)模型或ARMA(p,q)模型,其平稳性条件是自回归部分所对应的差分方程的特征方程的特征根必须都小于。若特征根有大于或等于1的,说明模型是非平稳的。特别是当特征根等于1或非常接近于1时,说明序列为单位根过程,此时需要
22、对原序列进行适当的差分变换(有几个单位根,作几次差分)使其平稳,然后再对变换后的序列建模。返回本节首页下一页上一页第134页/共163页(2)可逆性分析对于MA(q)和ARMA(p,q)模型,模型的可逆性条件是移动平均部分所对应的差分方程的特征都小于1。若有特征根大于1或等于1的,说明模型是非可逆的,此时要对序列作适当的变换,再建模。特别是当特征根有等于1或很接近1,说明此模型有过度差分之误。因此,应适当减少差分阶数再建模,以使模型满足可逆性条件。第135页/共163页Eviews 估计结果直接输出自回归部分所对应的差分方程的特征根:inverted AR root.移动平均部分所对应的差分方
23、程的特征方程的特征根:inverted MA root.第136页/共163页模型优化问题提出当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。优化的目的选择相对最优模型 第137页/共163页例3.13:拟合某一化学序列第138页/共163页序列自相关图第139页/共163页序列偏自相关图第140页/共163页拟合模型一根据自相关系数2阶截尾,拟合MA(2)模型参数估计模型检验模型显著有效 三参数均显著 第141页/共163页拟合模型二根据偏自相关系数1阶截尾,拟合MA(1)模型参数估计模型检验模型显著有效 两参数均显著 第14
24、2页/共163页问题同一个序列可以构造两个拟合模型,两个模型都显著有效,那么到底该选择哪个模型用于统计推断呢?解决办法确定适当的比较准则,构造适当的统计量,确定相对最优第143页/共163页例3.13续用AIC准则和SBC准则评判例3.13中两个拟合模型的相对优劣 结果AR(1)优于MA(2)模型AICSBCMA(2)536.4556543.2011AR(1)535.7896540.2866第144页/共163页第五节 建模的其它方法引:前面介绍的是Box-Jenkins建模法,即主要是以ACF、PACF的统计特性为依据,但由于我们只能根据样本的SACF、SPACF代替理论的ACF、PACF,
25、这样不可避免会产生偏差。本节主要介绍另外一种建模方法Pandit-wu方法。返回本节首页下一页上一页第145页/共163页第五节 建模的其它方法一、Pandit-Wu建模方法的基本思想二、建模步骤三、Pandit-Wu方法建模举例返回本节首页下一页上一页第146页/共163页一、Pandit-Wu建模方法的基本思想Pandit-Wu建模方法以下面认识为依据:即任一平稳序列总可以用一个ARMA(p,p-1)模型来表示,而AR(p),MA(q)以及ARMA(p,q)都可看作是ARMA(p,p-1)模型的特例。Pandit-Wu方法的基本思想为:逐渐增加模型的阶数,拟合较高阶的ARMA(p,p-1)
26、模型,直到再增加模型的阶数而剩余平方和不显著减少为止。返回本节首页下一页上一页第147页/共163页二、建模步骤(1)将序列平稳化、零均值化(也可将均值作为一个参数估计)。(2)从p=1开始,逐渐增加模型阶数,拟合ARMA(2p,2p-1),并进行模型的适性检验。(3)选择最优模型。返回本节首页下一页上一页第148页/共163页对例4-1拟合ARMA(2n,2n-1)模型的相关输出结果参数 ARMA模型阶数ARMA(4,3)ARMA(2,1)ARMA(2,1)0.69(2.31)0.66(1.67)-0.17(-1.22)0.27(1.94)0.34(2.55)0.69(2.31)1.00(3
27、.73)剩余平方和74170.8 71879.6 74841.2残差方差1454.3 1306.9 1336.5第149页/共163页建模的其它方法还有长阶自回归法,其理论依据是任一平稳序列,都可用一个足够高阶的AR模型(其实就是模型的逆转形式)来逼近所要求的精度。建模时,可先估计逆转形式的参数,然后利用逆函数和原模型参数间的关系,近似的求出原模型参数的估计值。第150页/共163页第六节 建模实例【例4-2】对某地区19832005年各季度的实际国内生产总值平稳化后序列建立合适模型。第151页/共163页 例4-2的自相关和偏自相关函数12345678910-.569 .331 -.309
28、.130 -.035 .006 .059 -.214 .251 -.092-.569.010-.172-.172.002-.041.039-.228.045.18611121314151617181920 .041 -.123 -.029 .071 -.030 .055 -.090 .025 .074 .078 -.058 -.157 -.170 -.010 -.031 -.112 -.035 -.058 .049 .199 可初步断定序列适合MA模型 第152页/共163页例4-2准则函数图 第153页/共163页从图中可以看出合适的阶数为m=3 p值6 2.91 0.405412 14.4
29、0 0.1089 第154页/共163页例4-2的残差自相关检验图 第155页/共163页【例4-3】对某地区19902005年各季度的个人实际消费支 出平稳化后数据(共62个)建模。平稳化后的某地区个人实际消费支出 第156页/共163页 例4-3的自相关和偏自相关函数12345678910-.523-.023.217-.189.030-.020.133-.115.101 -.103-.523-.407-.021-.079-.093-.186.092.041.158-.069 11121314151617181920-.041.067-.118.141-.073-.029.170-.269.
30、213-.044-.148-.138-.183-.051-.077-.147.129-.109.101.059 可初步断定序列适合MA模型 第157页/共163页 例4-3准则函数图 第158页/共163页从图中可以看出合适的阶数为m=1 p值 6 4.00 0.550012 10.27 0.5062第159页/共163页例4-3的残差自相关检验图 第160页/共163页 对例4-3拟合ARMA(2n,2n-1)模型的相关输出结果参数ARMA模型阶数ARMA(4,3)ARMA(2,1)ARMA(1,1)MA(1)0.87(0.78)0.86(0.99)0.82(1.23)-0.42(-1.79)-0.17(-1.00)-0.25(-1.29)0.46(2.02)0.72(6.01)0.82(10.46)剩余平方和38353.7 41507.1 42079.0 42573.7残差方差710.3 715.6 713.2 709.6第161页/共163页Thank you very much!第162页/共163页感谢您的观看!第163页/共163页