《时间序列分析 第三章平稳时间序列分析(18页).doc》由会员分享,可在线阅读,更多相关《时间序列分析 第三章平稳时间序列分析(18页).doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-应 用 时 间 序 列 分 析 实 验 报 告实验名称 第三章 平稳时间序列分析 一、上机练习data example3_1;input x;time=_n_; cards;0.30 -0.45 0.036 0.00 0.17 0.45 2.154.42 3.48 2.99 1.74 2.40 0.11 0.960.21 -0.10 -1.27 -1.45 -1.19 -1.47 -1.34-1.02 -0.27 0.14 -0.07 0.10 -0.15 -0.36-0.50 -1.93 -1.49 -2.35 -2.28 -0.39 -0.52-2.24 -3.46 -3.97 -4.6
2、0 -3.09 -2.19 -1.210.78 0.88 2.07 1.44 1.50 0.29 -0.36-0.97 -0.30 -0.28 0.80 0.91 1.95 1.771.80 0.56 -0.11 0.10 -0.56 -1.34 -2.470.07 -0.69 -1.96 0.04 1.59 0.20 0.391.06 -0.39 -0.16 2.07 1.35 1.46 1.500.94 -0.08 -0.66 -0.21 -0.77 -0.52 0.05;proc gplot data=example3_1;plot x*time=1;symbol c=red i=joi
3、n v=star;run;建立该数据集,绘制该序列时序图得:根据所得图像,对序列进行平稳性检验。时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。从图上可以看出,数值围绕在0附近随机波动,没有明显或周期,其本可以视为平稳序列,时序图显示该序列波动平稳。proc arima data=example3_1;identif
4、y var=x nlag=8;run; 图一 图二 样本自相关图 图三 样本逆自相关图 图四 样本偏自相关图 图五 纯随机检验图实验结果分析:(1)由图一我们可以知道序列样本的序列均值为-0.06595,标准差为1.561613,观察值个数为84个。(2)根据图二序列样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。我们发现样本自相关图延迟3阶之后,自相关系数都落入2倍标准差范围以内,而且自相关系数向0.03衰减的速度非常快,延迟5阶之后自相关系数即在0.03值附近波动。这是一个短期相关的样本自相关图。所以根据样本自相关图的相关性质,可
5、以认为该序列平稳。(3)根据图五的检验结果我们知道,在各阶延迟下LB检验统计量的P值都非常小(99.999%)断定该序列样本属于非白噪声序列。proc arima data=example3_1;identify var=x nlag=8 minic p= (0:5) q=(0:5);run; IDENTIFY命令输出的最小信息量结果某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。建模的基本步骤如下:A:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。B:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,
6、q)模型进行拟合。C:估计模型中未知参数的值。D:检验模型有效性。如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。E:模型优化。如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。F:利用拟合模型,预测序列的将来走势。为了尽量避免因个人经验不足导致的模型识别问题,SAS系统还提供了相对最优模型识别。最后一条信息显示,在自相关延迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMR(p,q)模型中,BIC信息量相对最小的是ARMR(0,4)模型,即MA(4)模型。需要注意的是,MINIC只给出一定范围内SBC最小的模型定阶结果,但
7、该模型的参数未必都能通过参数检验,即经常会出现MINIC给出的模型阶数依然偏高的情况。estimate q=4;run;本例参数估计输出结果显示均值MU不显著(t的检验统计量的P值为0.9968),其他参数均显著(t检验统计量的P值均小于0.00001),所以选择NOINT选项,除去常数项,再次估计未知参数的结果,即可输入第二条ESTIMATE命令:estimate q=4 noint;run;参数估计部分输出结果如图六所示:图六 ESTIMATE命令消除常数项之后的输出结果显然四个未知参数均显著。拟合统计量的值这部分输出五个统计量的值,由上到下分别是方差估计值、标准差估计值、AIC信息量、S
8、BC信息量及残差个数,如图七所示:图七 ESTIMATE命令输出的拟合统计量的值系数相关阵这部分输出各参数估计值的相关阵,如图八所示:图八 ESTIMATE命令输出的系数相关阵残差自相关检验结果这部分的输出格式(图九)和序列自相关系数白噪声检验部分的输出结果一样。本例中由于延迟各阶的LB统计量的P值均显著大于a(a=0.05),所以该拟合模型显著成立。图九 ESTIMATE命令输出的残差自相关检验结果拟合模型的具体形式ESTIMATE命令输出的拟合模型的形式序列预测forecast lead=5 id=time out=results;run;其中,lead是指定预测期数;id是指定时间变量标
9、识;out是指定预测后的结果存入某个数据集。该命令运行后输出结果如下:FORECAST命令输出的预测结果该输出结果从左到右分别为序列值的序号、预测值、预测值的标准差、95%的置信下限、95%的置信上限。利用存储在临时数据集RESULTS里的数据,我们还可以绘制漂亮的拟合预测图,相关命令如下:proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1 c=black i=none v=start;symbol2 c=red i=join v=none;symbol3 c=g
10、reen i=join v=none l=32;run;输出图像如下: 拟合效果图注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。 所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。目前对平稳序列最常用的预测方法是线性最小方差预测。线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。在预测图上可以看到,数据围绕一个范围内波动,即说明未来的数值变化时平稳的。二、课后习题第十七题:根据某城市过去63年中每年降雪量数据(单位:mm)得:(书本P94)程序:data example17_1;input x;time=
11、_n_; cards;126.4 82.4 78.1 51.1 90.9 76.2 104.5 87.4110.5 25 69.3 53.5 39.8 63.6 46.7 72.979.6 83.6 80.7 60.3 79 74.4 49.6 54.771.8 49.1 103.9 51.6 82.4 83.6 77.8 79.389.6 85.5 58 120.7 110.5 65.4 39.9 40.188.7 71.4 83 55.9 89.9 84.8 105.2 113.7124.7 114.5 115.6 102.4 101.4 89.8 71.5 70.998.3 55.5 6
12、6.1 78.4 120.5 97 110;proc gplot data=example17_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example17_1;identify var=x nlag=15 minic p= (0:5) q=(0:5);run;estimate p=1;run;estimate p=1 noin;run;forecast lead=5 id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*t
13、ime=2 l95*time=3 u95*time=3/overlay;symbol1 c=black i=none v=start;symbol2 c=red i=join v=none;symbol3 c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图a) 图a 由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b) 图b时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本
14、分布特征。根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。 样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。纯随机性检验见下图:(图c) 图c根据图c的检验结果
15、我们知道,在6阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水平95%)断定这个拟合模型的残差序列属于非白噪声序列。(2)如果序列平稳且非白躁声,选择适当模型拟合该序列的发展。模型识别如下图(图d)图d假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。建模的基本步骤如下:1:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。2:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。3:估计模型中未知参数的值。4:检验模型有效性。如果拟合模型不通过检验,转向步骤B
16、,重新选择模型再拟合。5:模型优化。如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。6:利用拟合模型,预测序列的将来走势。最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(1,0)模型,既AR(1)模型。它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质。自相关系数是按负指数单调收敛到零;利用拟合模型,预测该城市未来5年的降雪量.由(2)可以知道该模型是AR(1)模型;预测结果如下图(图e) 由图得未来5(64-68年)的降雪量分别为103.6
17、820mm、97.7270mm、92.1139mm、86.8232mm、81.8365mm。18. 某地区连续74年的谷物产量(单位:千吨)data example18_1;input x;time=_n_; cards;0.97 0.45 1.61 1.26 1.37 1.43 1.32 1.23 0.84 0.89 1.181.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.810.80 0.60 0.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.930.95 0.65 0.98 0.70 0.86 1.
18、32 0.88 0.68 0.78 1.25 0.791.19 0.69 0.92 0.86 0.86 0.85 0.90 0.54 0.32 1.40 1.140.69 0.91 0.68 0.57 0.94 0.35 0.39 0.45 0.99 0.84 0.620.85 0.73 0.66 0.76 0.63 0.32 0.17 0.46;proc gplot data=example18_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example18_1;identify var=x nlag=18 m
19、inic p= (0:5) q=(0:5);run;estimate q=1;run;forecast lead=5 id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1 c=black i=none v=start;symbol2 c=red i=join v=none;symbol3 c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图f) 图f时序
20、图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。 由时序图显示过去74年中每年谷物产量数据围绕早0.8千吨附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图g) 图g 样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。我们发
21、现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。纯随机性检验见下图:(图h) 图h根据图h的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水平95%)断定这个拟合模型的残差序列属于非白噪声序列。选择适当模型拟合该序列的发展。如果序列平稳且非白躁声,选折适当模型拟合序列的发展模型识别如下图(图i) 图i假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA
22、模型对该序列建模。建模的基本步骤如下:A:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。B:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。C:估计模型中未知参数的值。D:检验模型有效性。如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。E:模型优化。如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。F:利用拟合模型,预测序列的将来走势。最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARM
23、A(1,0)模型,既AR(1)模型。它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质。自相关系数是按负指数单调收敛到零;利用拟合模型,预测该地区未来5年的谷物产量,预测结果如下图(图j)由(2)可知,该模型为AR(1)模型; 图j未来5年的谷物产量一次为0.7849,0.8518,0.8518,0.8518。19. 现有201个连续的生产记录data example19_1;input x;time=_n_; cards;81.9 89.4 79.0 81.4 84.8 85.9 88.0 80.3 82.683.5 80.2 85.2 87.2 83.5 84.3 82.9 84.
24、7 82.981.5 83.4 87.7 81.8 79.6 85.8 77.9 89.7 85.486.3 80.7 83.8 90.5 84.5 82.4 86.7 83.0 81.889.3 79.3 82.7 88.0 79.6 87.8 83.6 79.5 83.388.4 86.6 84.6 79.9 86.0 84.2 83.0 84.8 83.681.8 85.9 88.2 83.5 87.2 83.7 87.3 83.0 90.580.7 83.1 86.5 90.0 77.5 84.7 84.6 87.2 80.586.1 82.6 85.4 84.7 82.8 81.9
25、83.6 86.8 84.084.2 82.8 83.0 82.0 84.7 84.4 88.9 82.4 83.085.0 82.2 81.6 86.2 85.4 82.1 81.4 85.0 85.884.2 83.5 86.5 85.0 80.4 85.7 86.7 86.7 82.386.4 82.5 82.0 79.5 86.7 80.5 91.7 81.6 83.985.6 84.8 78.4 89.9 85.0 86.2 83.0 85.4 84.484.5 86.2 85.6 83.2 85.7 83.5 80.1 82.2 88.682.0 85.0 85.2 85.3 84
26、.3 82.3 89.7 84.8 83.180.6 87.4 86.8 83.5 86.2 84.1 82.3 84.8 86.683.5 78.1 88.8 81.9 83.3 80.0 87.2 83.3 86.679.5 84.1 82.2 90.8 86.5 79.7 81.0 87.2 81.684.4 84.4 82.2 88.9 80.9 85.1 87.1 84.0 76.582.7 85.1 83.3 90.4 81.0 80.3 79.8 89.0 83.780.9 87.3 81.1 85.6 86.6 80.0 86.6 83.3 83.182.3 86.7 80.2
27、;proc gplot data=example19_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example19_1;identify var=x nlag=24 minic p= (0:5) q=(0:5);run;estimate q=1;run;forecast lead=5 id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1
28、 c=black i=none v=start;symbol2 c=red i=join v=none;symbol3 c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图k) 图k 由时序图显示过去201个连续的生产记录数据围绕早84附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图l) 图l时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终
29、在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。 样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。我们发现样本自相关图延迟1阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。纯随机性检验见下图:(图m)根据图m的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水
30、平95%)断定这个拟合模型的残差序列属于非白噪声序列。(2)如果序列平稳且非白躁声,选折适当模型拟合序列的发展模型识别如下图(图n) 某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。建模的基本步骤如下:1、求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。2、根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。3、估计模型中未知参数的值。4、检验模型有效性。如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。5、模型优化。如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟
31、合模型,从所有通过检验中选择最优模型。6、利用拟合模型,预测序列的将来走势。 最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(0,1)模型,即MA(1)模型。利用拟合模型,预测该城市下一时刻95%的置信区间。 由(2)可得,该模型为MA(1)模型; 下一时刻95%的置信区间78.2859,89.9738。实验小结:给定一个序列,我们首先应该判断平稳性,如果平稳,再检查是否是纯随机序列,如果序列平稳且非白躁声,选折适当模型拟合序列的发展,选择AR,MA,或ARMA模型,然后可以对该序列进行预测。三、实验体会
32、通过本次实验使我掌握了一些对时间序列的处理,运用不同的语句对一个样本序列的平稳性检验和随机性检验,这对我们处理数据有很大的帮助。在生活中我们往往会遇到这样的现象,当我们所得到的样本信息太少,并且没有其他的辅助信息时,通常这种数据结构式没法进行分析的,但是序列平稳性的概念的提出可以有效地解决这个问题。当然,在操作和分析的过程中我也遇到一些不懂的问题,例如在分析随机性时,为什么我们只检验了前6期、前12期和前18期延迟的Q统计量和LB统计量就能直接判断该序列是否是白噪声序列呢?为什么我们不用全部都进行延迟检验呢?后来,经过网上搜索,知道了如果一个平稳序列短期延迟的序列值之间不存在显著相关关系,通常
33、长期延迟之间就更不会存在显著的相关关系了。在刚做相对最优定价时,我还不知道这个的作用,后来经过多次的练习,需要用到多次之后,我才发现这个是为了避免因个人经验不足导致的模型识别问题,只要我们在IDENTIFY命令中增加一个可选命令MINIC,就可以获得一定范围内的最优模型定阶。通过BIC的信息量,就可以知道选择AR,MA,或ARMA模型,然后可以对该序列进行预测。还有在参数估计的时候,是要确定模型的口径,并对拟合好的模型进行显著性诊断。Eg:SAS的程序语言是estimate q=4;run;如果参数估计输出的结果显示均值MU不显著,其他参数均显著,就需要选择NOINT选项,除去常数项,再次估计
34、未知参数的结果。如果全部显著就不在需要选择NOINT选项。还有了解到一个例子的拟合模型的具体形式,还有进行序列预测,预测该序列未来的趋势走向,还可以通过图像显示出来,方便分析。进一步了解到时间序列分析在生活中多方面的应用。在应用时间序列分析法进行市场预测时应注意市场现象未来发展变化规律和发展水平,不一定与其历史和现在的发展变化规律完全一致。随着市场现象的发展,它还会出现一些新的特点。因此,在时间序列分析预测中,决不能机械地按市场现象过去和现在的规律向外延伸。必须要研究分析市场现象变化的新特点,新表现,并且将这些新特点和新表现充分考虑在预测值内。这样才能对市场现象做出既延续其历史变化规律,又符合
35、其现实表现的可靠的预测结果。时间序列分析预测法突出了时间因素在预测中的作用,暂不考虑外界具体因素的影响。时间序列在时间序列分析预测法处于核心位置,没有时间序列,就没有这一方法的存在。虽然,预测对象的发展变化是受很多因素影响的。但是,运用时间序列分析进行量的预测,实际上将所有的影响因素归结到时间这一因素上,只承认所有影响因素的综合作用,并在未来对预测对象仍然起作用,并未去分析探讨预测对象和影响因素之间的因果关系。因此,为了求得能反映市场未来发展变化的精确预测值,在运用时间序列分析法进行预测时,必须将量的分析方法和质的分析方法结合起来,从质的方面充分研究各种因素与市场的关系,在充分分析研究影响市场变化的各种因素的基础上确定预测值。-第 17 页-