《非平稳时间序列的随机分析hqv.pptx》由会员分享,可在线阅读,更多相关《非平稳时间序列的随机分析hqv.pptx(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章 非平稳序列的随机分析n 时间序列的分解n 差分运算n ARIMA模型n Auto-Regressive模型n 异方差的性质n 方差齐性变化n 条件异方差模型4.1 时间序列的分解4.1.1Wold分解定理4.1.2Cramer分解定理引例4.1.1、Wold分解定理(1938)n 对于任何一个离散平稳过程它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的,不妨记作其中:为确定性序列,为随机序列,它们需要满足如下条件(1)(2)(3)确定性序列与随机序列的定义n 对任意序列而言,令关于q期之前的序列值作线性回归其中为回归残差序列,。显然,且随着q 的增大而增大,
2、也就是说是非减的有界序列,它的大小可以衡量历史信息对现时值的预测精度。越小,说明预测得越准确,越大,说明预测得越差。对比43 页AR 模型n 确定性序列:若n 即说明序列随着时间的发展有很强的规律性。n 随机序列:若n 即说明序列随着时间的发展随机性很强,预测效果很差,此时称是随机序列。例如:ARMA 模型分解确定性序列随机序列n Wold分解定理说明任何平稳序列都可以分解为确定性平稳序列和随机平稳序列之和。它是现代时间序列分析理论的灵魂,是构造ARMA模型拟合平稳序列的理论基础。4.1.2、Cramer 分解定理(1961)n 任何一个时间序列(可适用于非平稳序列)都可以分解为两部分的叠加:
3、其中一部分是由多项式决定的确定性趋势成分,另一部分是平稳的零均值误差成分,即确定性影响随机性影响例如:平稳ARMA为常数系数为一个零均值白噪声序列为延迟算子对Cramer 分解定理的理解:n Cramer分解定理是Wold分解定理的理论推广,它说明任何一个序列的波动都可以视为同时受到了确定性影响和随机性影响的综合作用。平稳序列要求这两方面的影响都是稳定的,而非平稳序列产生的机理就在于它所受到的这两方面的影响至少有一方面是不稳定的。4.2 差分运算n 差分运算的实质n 差分方式的选择n 过差分4.2.1、差分运算的实质n 得到观察值序列之后,无论采用确定性时序分析方法还是随机时序分析方法,第一步
4、都是要提取序列中的确定性信息。n 确定性时序分析方法:季节指数、长期趋势模型、移动平均(消弱短期随机波动对序列的影响)、指数平滑等(第五章)。差分方法是一种非常简便、有效的确定性信息提取方法(Box和Jenkins)。n Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息。n 离散序列的d阶差分就相当于连续变量的d阶求导,n 在上述分解下,d阶差分就可充分提取时序中的确定性信息。n 展开1阶差分,有n 1阶差分实质上就是一个自回归过程,它是用延迟一期的历史数据 作为自变量来解释当期序列值的变动状况,差分序列 度量的是1阶自回归过程中产生的随机误差的大小。n 差分运算的实
5、质是使用自回归的方式提取确定性信息 随机误差4.2.2 差分方式的选择1)序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳2)序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响3)对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息【例4.1】1964年1999年中国纱年产量序列蕴含着一个近似线性的递增趋势。对该序列进行一阶差分运算 考察差分运算对该序列线性趋势信息的提取作用1)序列蕴含着显著的线性趋势差分前后时序图n 原序列时序图n 差分后序列时序图序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳 2)序列蕴含着曲线趋势n 例4.2
6、尝试提取1950年1999年北京市民用车辆拥有量序列的确定性信息差分后序列时序图n 一阶差分 n 二阶差分序列蕴含着显著的曲线趋势,二阶或三阶差分就可以实现趋势平稳 3)蕴含着固定周期的序列n 例4.3 差分运算提取1962年1月1975年12月平均每头奶牛的月产奶量序列中的确定性信息差分后序列时序图1阶差分:提取线性递增趋势,剩季节波动和随机波动。序列还蕴含着固定周期,如何实现趋势平稳?思考:如果把每一时刻的观察值与上年同期相应的观察值相减,是否能将原序列的周期性变化消除?(或实现平稳化),在经济上,就是考查与前期相比的净增值,用数学语言来描述就是定义季节差分算子。定义:季节差分可以表示为1
7、阶12步差分:提取周期信息。4.3.3、过差分 n 足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息n 但过度的差分会造成有用信息的无谓浪费,从而降低估计的精度。n 假设序列如下n 考察一阶差分后序列和二阶差分序列的平稳性与方差例4.4过差分实质上是因为过多次的差分导致有效信息的无谓浪费而降低了估计的精度。n 一阶差分n 平稳n 二阶差分(过差分)n 平稳4.3ARIMA模型n ARIMA模型结构n ARIMA模型性质n ARIMA模型建模n ARIMA模型预测n 疏系数模型n 季节模型4.3.1、ARIMA 模型结构n 使用场合:差分平稳序列拟合n ARIMA(autoregres
8、siveintegratedmovingaverage求和自回归移动平均)n ARIMA(p,d,q)模型结构为平稳可逆ARMA(p,q)模型的自回归系数多项式(4.1)对比63 页为平稳可逆ARMA(p,q)模型的移动平均系数多项式。(4.1)简记为(4.2)ARIMA模型的实质就是差分运算与ARMA模型的组合。即任何非平稳序列如果能通过适当阶数的差分实现差分后平稳,此时可对差分后序列进行ARMA模型拟合了。ARIMA 模型族n d=0ARIMA(p,d,q)=ARMA(p,q)n P=0ARIMA(P,d,q)=IMA(d,q)n q=0ARIMA(P,d,q)=ARI(p,d)n d=1
9、,P=q=0ARIMA(0,1,0)=randomwalkmodel随机游走模型(random walk)n 模型结构n 模型产生典故n Karl Pearson(1905.07)在自然杂志上提问:假如有个醉汉醉得非常严重,完全丧失方向感,把他放在荒郊野外,一段时间之后再去找他,在什么地方找到他的概率最大呢?n 雷利爵士(1905.08)认为,最好去初始位置找他2、ARIMA 模型的平稳性n 自回归系数多项式的根为特征根的倒数,所以ARIMA(p,d,q)模型共有p+d个特征根,其中p个在单位圆内,d个在单位圆上。n 所以 当 时ARIMA(p,d,q)模 型非平稳。n 例4.5ARIMA(0
10、,1,0)时序图3、ARIMA 模型的方差齐性n 时,原序列方差非齐性n d阶差分后,差分后序列方差齐性问题:平稳AR 模型和可逆MA 模型,它们是否具有方差齐性?回顾:Cramer 分解定理(1961)n 任何一个时间序列(可适用于非平稳序列)都可以分解为两部分的叠加:其中一部分是由多项式决定的确定性趋势成分,另一部分是平稳的零均值误差成分,即确定性影响随机性影响例如:平稳ARMA为常数系数为一个零均值白噪声序列为延迟算子离散序列的d阶差分就相当于连续变量的d阶求导,在上述分解下,d阶差分就可充分提取时序中的确定性信息。注意:防止出现过差分。ARIMA 模型结构ARIMA(p,d,q)模型结
11、构分别为平稳可逆ARMA(p,q)模型的自回归系数多项式和移动平均系数。注意:ARIMA(p,q)的平稳性?方差齐性?ARMA(p,q)呢?ARIMA模型建模步骤获得观察值序列平稳性检验差分运算YN白噪声检验Y分析结束N拟合ARMA模型例4.6n 对1952年1988年中国农业实际国民收入指数序列建模d=read.csv(shouru.csv,head=F)shouru=ts(d,start=1952,end=1988,freq=1)ts.plot(shouru,type=b)chafen=diff(shouru,differences=1)ts.plot(chafen)acf(chafen,
12、10)时序图和一阶差分序列时序图acf(chafen,10)pacf(chafen,10)Box.test(chafen,type=Ljung-Box,lag=6)data:chafenX-squared=15.3304,df=6,p-value=0.01784arima(chafen,order=c(0,0,1),method=ML)arima(x=chafen,order=c(0,0,1),method=ML)Coefficients:ma1intercept0.67104.9947s.e.0.16482.0139sigma2estimatedas53.42:loglikelihood=-
13、122.99,aic=251.97a=arima(chafen,order=c(0,0,1),method=ML)r=a$residualsBox.test(r,type=Ljung-Box,lag=6,fitdf=1)data:rX-squared=3.6649,df=5,p-value=0.5986p=pt(4.0716,df=35,lower.tail=F)*2p10.0002536605(theta1的检验)p=pt(2.4801,df=35,lower.tail=F)*2P10.01809275(截距项的检验)4、ARIMA 模型预测4、ARIMA模型预测预测值:线性最小方差预测原则例4.7n 已知ARIMA(1,1,1)模型为 且n 求 的 95的置信区间(1)计算预测值n 展开原模型,得到等价形式n 计算预测值计算预测误差n 写出广义自相关函数的表达式,求出n 求出n 求出预测误差的方差计算置信区间n 的95置信区间例4.6续:对中国农业实际国民收入指数序列做为期10年的预测