《《应用时间序列分析》实验手册1537.docx》由会员分享,可在线阅读,更多相关《《应用时间序列分析》实验手册1537.docx(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用时间序列分析实验手册目 录目 录. 22第二章 时时间序列列的预处处理. 33一、平稳性性检验. 3二、纯随机机性检验验. 9第三章章 平稳时时间序列列建模实实验教程程. 100一、模型识识别. 110二、模模型参数数估计(如如何判断断拟合的的模型以以及结果果写法). 13三、模型的的显著性性检验. 17四、模模型优化化. 188第四章 非非平稳时时间序列列的确定定性分析析. 199一、趋趋势分析析. 199二、季节效效应分析析. 344三、综综合分析析. 388第五章 非非平稳序序列的随随机分析析. 444一、差差分法提提取确定定性信息息. 444二、ARIIMA模模型. 558三、季季
2、节模型型. 622第二章 时时间序列列的预处处理一、平稳性性检验时序图检验验和自相相关图检检验(一)时序序图检验验 根据平稳时时间序列列均值、方方差为常常数的性性质,平平稳序列列的时序序图应该该显示出出该序列列始终在在一个常常数值附附近随机机波动,而而且波动动的范围围有界、无无明显趋趋势及周周期特征征例2.1检验19664年119999年中国国纱年产产量序列列的平稳稳性1.在Evviewws软件件中打开开案例数数据图1:打开开外来数数据图2:打开开数据文文件夹中中案例数数据文件件夹中数数据文件中序列列的名称称可以在在打开的的时候输输入,或或者在打打开的数数据中输输入图3:打开开过程中中给序列列
3、命名图4:打开开数据2.绘制时时序图可以如下图图所示选选择序列列然后点点Quiick选选择Sccattter或或者XYYlinne;绘制好后可可以双击击图片对对其进行行修饰,如如颜色、线线条、点点等图1:绘制制散点图图图2:年份份和产出出的散点点图图3:年份份和产出出的散点点图(二)自相相关图检检验例2.3导入数据,方方式同上上;在Quicck菜单单下选择择自相关关图,对对Qiwwen原原列进行行分析;可以看出自自相关系系数始终终在零周周围波动动,判定定该序列列为平稳稳时间序序列。图1:序列列的相关关分析图2:输入入序列名名称图2:选择择相关分分析的对对象图3:序列列的相关关分析结结果:11.
4、 可可以看出出自相关关系数始始终在零零周围波波动,判判定该序序列为平平稳时间间序列22.看Q统计量量的P值:该该统计量量的原假假设为XX的1期,2期k期的自自相关系系数均等等于0,备择择假设为为自相关关系数中中至少有有一个不不等于00,因此此如图知知,该PP值都55%的显显著性水水平,所以接接受原假假设,即序列列是纯随随机序列列,即白噪噪声序列列(因为序序列值之之间彼此此之间没没有任何何关联,所以说说过去的的行为对对将来的的发展没没有丝毫毫影响,因此为为纯随机机序列,即白噪噪声序列列.) 有的题题目平稳稳性描述述可以模模仿书本本33页最最后一段段.(三)平稳稳性检验验还可以以用:单位根检验验:
5、ADDF,PPP检验验等;非参数检验验:游程程检验图1:序列列的单位位根检验验表示不包含截距项图2:单位位根检验验的方法法选择图3:ADDF检验验的结果果:如图图,单位位根统计计量ADDF=-0.00163384都都大于EEVIEEWS给给出的显显著性水水平1%-100%的ADFF临界值值,所以以接受原原假设,该该序列是是非平稳稳的。二、纯随机机性检验验计算Q统计计量,根根据其取取值判定定是否为为纯随机机序列。例2.3的的自相关关图中有有Q统计量量,其PP值在K=6、12的时时候均比比较大,不不能拒绝绝原假设设,认为为 该序列列是白噪噪声序列列。另外,小样样本情况况下,LLB统计计量检验验纯随
6、机机性更准准确。第三章 平平稳时间间序列建建模实验验教程一、模型识识别1.打开数数据图1:打开开数据2.绘制趋趋势图并并大致判判断序列列的特征征图2:绘制制序列散散点图图3:输入入散点图图的两个个变量图4:序列列的散点点图3.绘制自自相关和和偏自相相关图图1:在数数据窗口口下选择择相关分分析图2:选择择变量图3:选择择对象图4:序列列相关图图4.根据自自相关图图和偏自自相关图图的性质质确定模模型类型型和阶数数如果样本(偏)自相关关系数在在最初的的d阶明显显大于两两倍标准准差范围围,而后后几乎995的的自相关关系数都都落在22倍标准准差的范范围以内内,而且且通常由由非零自自相关系系数衰减减为小值
7、值波动的的过程非非常突然然。这时时,通常常视为(偏)自相关关系数截截尾。截截尾阶数数为d。本例:n 自相关图图显示延延迟3阶之后后,自相相关系数数全部衰衰减到22倍标准准差范围围内波动动,这表表明序列列明显地地短期相相关。但但序列由由显著非非零的相相关系数数衰减为为小值波波动的过过程相当当连续,相相当缓慢慢,该自自相关系系数可视视为不截截尾 n 偏自相关关图显示示除了延延迟1阶的偏偏自相关关系数显显著大于于2倍标准准差之外外,其它它的偏自自相关系系数都在在2倍标准准差范围围内作小小值随机机波动,而而且由非非零相关关系数衰衰减为小小值波动动的过程程非常突突然,所所以该偏偏自相关关系数可可视为一一
8、阶截尾尾 n 所以可以以考虑拟拟合模型型为ARR(1)自相关系数数偏相关系数数模型定阶拖尾P阶截尾AR(p)模型Q阶截尾拖尾MA(q)模模型拖尾拖尾ARMA(P,QQ)模型型具体判别什什么模型型看书558到62的图图例。:二、模型参参数估计计根据相关图图模型确确定为AAR(11),建建立模型型估计参参数在ESTIIMATTE中按按顺序输输入变量量cx c ccx(-1)或或者cxx c ar(1) 选择LSS参数估估计方法法,查看看输出结结果,看看参数显显著性,该该例中两两个参数数都显著著。细心的同学学可能发发现两个个模型的的C取值不不同,这这是因为为前一个个模型的的C为截距距项;后后者的CC
9、则为序列列期望值值,两个个常数的的含义不不同。图1:建立立模型图2:输入入模型中中变量,选选择参数数估计方方法图3:参数数估计结结果图4:建立立模型图5:输入入模型中中变量,选选择参数数估计方方法图6:参数数估计结结果三、模型的的显著性性检验检验内容:整个模型对对信息的的提取是是否充分分;参数的显著著性检验验,模型型结构是是否最简简。图1:模型型残差图2:残差差的平稳稳性和纯纯随机性性检验对残差序列列进行白白噪声检检验,可可以看出出ACFF和PACCF都没没有显著著异于零零,Q统计量量的P值都远远远大于于0.005,因因此可以以认为残残差序列列为白噪噪声序列列,模型型信息提提取比较较充分。常数
10、和滞后后一阶参参数的PP值都很很小,参参数显著著;因此此整个模模型比较较精简,模模型较优优。四、模型优优化当一个拟合合模型通通过了检检验,说说明在一一定的置置信水平平下,该该模型能能有效地地拟合观观察值序序列的波波动,但但这种有有效模型型并不是是唯一的的。当几个模型型都是模模型有效效参数显显著的,此此时需要要选择一一个更好好的模型型,即进进行优化化。优化的目的的,选择择相对最最优模型型。优化准则:最小信息量量准则(An Information Criterion) n 指导思想想n 似然函数数值越大大越好 n 未知参数数的个数数越少越越好 n AIC准准则的缺缺陷在样本容量量趋于无无穷大时时,
11、由AAIC准准则选择择的模型型不收敛敛于真实实模型,它它通常比比真实模模型所含含的未知知参数个个数要多多 但是本例中中滞后二二阶的参参数不显显著,不不符合精精简原则则,不必必进行深深入判断断。第四章 非非平稳时时间序列列的确定定性分析析第三章介绍绍了平稳稳时间序序列的分分析方法法,但是是自然界界中绝大大多数序序列都是是非平稳稳的,因因而对非非平稳时时间序列列的分析析跟普遍遍跟重要要,人们们创造的的分析方方法也更更多。这这些方法法分为确确定性时时序分析析和随机机时序分分析两大大类,本本章主要要介绍确确定性时时序分析析方法。一个序列在在任意时时刻的值值能够被被精确确确定(或或被预测测),则则该序列
12、列为确定定性序列列,如正正弦序列列、周期期脉冲序序列等。而而某序列列在某时时刻的取取值是随随机的,不不能给以以精确预预测,只只知道取取某一数数值的概概率,如如白噪声声序列等等。Crrameer分解解定理说说明每个个序列都都可以分分成一个个确定序序列加一一个随机机序列,平平稳序列列的两个个构成序序列均平平稳,非非平稳时时间序列列则至少少有一部部分不平平稳。本本章先分分析确定定性序列列不平稳稳的非平平稳时间间时间序序列的分分析方法法。确定性序列列不平稳稳通常显显示出非非常明显显的规律律性,如如显著趋趋势或者者固定变变化周期期,这种种规律性性信息比比较容易易提取,因因而传统统时间序序列分析析的重点点
13、在确定定性信息息的提取取上。常用的确定定性分析析方法为为因素分分解。分分析目的的为:克服其其他因素素的影响响,单纯纯测度某某一个确确定性因因素的影影响;推断出出各种因因素彼此此之间作作用关系系及它们们对序列列的综合合影响。一、趋势分分析绘制序列的的线图,观观测序列列的特征征,如果果有明显显的长期期趋势,我我们就要要测度其其长期趋趋势,测测度方法法有:趋趋势拟合合法、平平滑法。(一) 趋趋势拟合合法1.线性趋趋势拟合合例1:以澳澳大利亚亚政府119811-19990年年每季度度消费支支出数据据为例进进行分析析。图1:导入入数据图2:绘制制线图,序序列有明明显的上上升趋势势长期趋势具具备线性性上升
14、的的趋势,所所以进行行序列对对时间的的线性回回归分析析。图3:序列列支出(zc)对时间(t)进行线性回归分析图4:回归归参数估估计和回回归效果果评价可以看出回回归参数数显著,模模型显著著,回归归效果良良好,序序列具有有明显线线性趋势势。图5:运用用模型进进行预测测图6:预测测效果(偏偏差率、方方差率等等)图7:绘制制原序列列和预测测序列的的线图图8:原序序列和预预测序列列的线图图图9:残差差序列的的曲线图图可以看出残残差序列列具有平平稳时间间序列的的特征,我我们可以以进一步步检验剔剔除了长长期趋势势后的残残差序列列的平稳稳性,第第三章知知识这里里不在叙叙述。2.曲线趋趋势拟合合例2:对上上海证
15、券券交易所所19991.11-20001.10每每月月末末上正指指数序列列进行拟拟合。图1:导入入数据图2:绘制制曲线图图可以看出序序列不是是线性上上升,而而是曲线线上升,尝尝试用二二次模型型拟合序序列的发发展。图3:模型型参数估估计和回回归效果果评价因为该模型型中T的系数数不显著著,我们们去掉该该项再进进行回归归分析。图4:新模模型参数数估计和和回归效效果评价价图5:新模模型的预预测效果果分析图6:原序序列和预预测序列列值图7:原序序列和预预测序列列值曲线线图图8:计算算预测误误差图9:对预预测误差差序列进进行单位位根检验验拒绝原假设设,认为为序列没没有单位位根,为为平稳序序列,说说明模型型
16、对长期期趋势拟拟合的效效果还不不错。同样,序列列与时间间之间的的关系还还有很多多中,比比如指数数曲线、生生命曲线线、龚柏柏茨曲线线等等,其其回归模模型的建建立、参参数估计计等方法法与回归归分析同同,这里里不再详详细叙述述。(二) 平平滑法除了趋势拟拟合外,平平滑法也也是消除除短期随随机波动动反应长长期趋势势的方法法,而其其平滑法法可以追追踪数据据的新变变化。平平滑法主主要有移移动平均均方法和和指数平平滑法两两种,这这里主要要介绍指指数平滑滑方法。例3:对北北京市119500-19998年年城乡居居民定期期储蓄所所占比例例序列进进行平滑滑。图1:打开开序列,进进行指数数平滑分分析图2:系统统自动
17、给给定平滑滑系数趋趋势给定方法为为选择使使残差平平方和最最小的平平滑系数数,该例例中平滑滑系数去去0.553,超超过0.5用一一次平滑滑效果不不太好图3:平滑滑前后序序列曲线线图图4:用二二次平滑滑修匀原原序列可以看出,平平滑系数数为0.1344,平均均差为44.06677008,修修匀或者者趋势预预测效果果不错。图5:二次次平滑效效果图例4:对于于有明显显线性趋趋势的序序列,我我们可以以采用HHoltt两参数数法进行行指数平平滑对北京市119788-20000年年报纸发发行量序序列进行行Hollt两参参数指数数平滑图1:报纸纸发行量量的曲线线图图2:Hoolt两两参数指指数平滑滑(指定定平滑
18、系系数)图3:预测测效果检检验图4:系统统自动给给定平滑滑系数时时平滑效效果图5:原序序列与预预测序列列曲线图图(其中FXXSM为为自己给给定系数数时的平平滑值,FXSM2为系统给定系数时的平滑值)二、季节效效应分析析许多序列有有季节效效应,比比如:气气温、商商品零售售额、某某景点旅旅游人数数等都会会呈现明明显的季季节变动动规律。例5:以北北京市119955-20000年年月平均均气温序序列为例例,介绍绍季节效效应分析析操作。图1:建立立月度数数据新工工作表图2:新工工作表中中添加数数据图3:五年年的月度度气温数数据图4:进行行季节调调整(移移动平均均法)图5:移动动平均季季节加法法图6:12
19、2个月的的加法调调整因子子图7:打开开三个序序列(季季节调整整序列、原原序列、调调整后序序列)图8:三个个序列(季季节调整整序列、原原序列、调调整后序序列)取取值图9:三个个序列(季季节调整整序列、原原序列、调调整后序序列)曲曲线图另外季节调调整还可可以用XX11,X122等方法法进行调调整。三、综合分分析 前面两部分分介绍了了单独测测度长期期趋势和和季节效效应的分分析方法法,这里里介绍既既有长期期趋势又又有季节节效应的的复杂序序列的分分析方法法。附录1.111 对1999320000年中中国社会会消费品品零售总总额序列列进行确确定性分分析图1:绘制制1999320000年中中国社会会消费品品
20、零售总总额时序序图可以看出序序列中既既有长期期趋势又又有季节节波动图2:进行行季节调调整图3:122个月的的季节因因子图4:经季季节调整整后的序序列SSSA图5:对经经季节调调整后序序列进行行趋势拟拟合图6:趋势势拟合序序列SSSAF与与序列SSSA的的时序图图图7:扩展展时间区区间后预预测长期期趋势值值SSAAF图8:经季季节调整整预测220011年12个月月的零售售总额值值图9:预测测20001年12个月月的零售售总额值值图10:预预测序列列与原序序列的时时序图第五章 非非平稳序序列的随随机分析析非平稳序列列的确定定性分析析原理简简单操作作方便易易于解释释,但是是只提取取确定性性信息,对对
21、随机信信息浪费费严重;且各因因素之间间确切的的作用关关系没有有明确有有效的判判断方法法。随机机分析方方法的发发展弥补补了这些些不足,为为人们提提供更加加丰富、更更加精确确的时序序分析工工具。对非平稳时时间序列列的分析析,要先先提取确确定性信信息再研研究随机机信息。一、差分法法提取确确定性信信息确定性信息息的提取取方法有有第四章章学习的的趋势拟拟合、指指数平滑滑、季节节指数、季季节多元元回归等等,本章章主要介介绍差分分法提取取确定性性信息。差分实质:自回归归差分方式:对线性性趋势序序列进行行1阶差分分、对曲曲线趋势势序列进进行低阶阶差分、对对固定周周期序列列进行周周期差分分附录1.22 线性性趋
22、势:对产出出序列进进行一阶阶差分详细分析过过程如下下:图1:导入入数据图2:绘制制线性图图,观察察序列的的特征观察发现序序列具有有较明显显的线性性趋势图3:进行行一阶差差分运算算图4:一阶阶差分运运算公式式图5:一阶阶差分序序列图6:一阶阶差分曲曲线图观察一阶差差分序列列均值方方差稳定定,进一一步进行行平稳性性分析。图7:绘制制一阶差差分序列列的相关关图图8:自相相关图均均不显著著,Q统计量量不显著著因此,差分分后序列列问白噪噪声序列列,一阶阶差分将将序列的的信息提提取充分分。附录1.112 曲曲线序列列:北京京市民用用车拥有有量序列列差分分分析图1:导入入数据图2:绘制制原序列列曲线图图可以
23、看出,1950年到1999年北京市居民民用车拥有量序列具有曲线趋势,现用低阶差分法提取确定性信息。图3:绘制制一阶差差分序列列的曲线线图图4:一阶阶差分序序列曲线线图可以看出一一阶差分分序列仍仍然具有有趋势,继继续进行行差分分分析;二二阶差分分的命令令的D(QC,2),低低阶差分分的命令令为D(QC,K)。图5:对原原序列进进行二阶阶差分图6:二阶阶差分序序列曲线线图从二阶差分分序列曲曲线图可可以看出出二阶差差分序列列中没有有中长期期趋势,二二阶差分分提取了了长期趋趋势。图7:自相相关分析析图8:对序序列的二二阶差分分序列进进行自相相关分析析图9:二阶阶差分序序列相关关图可以看出二二阶差分分序
24、列具具有短期期相关性性的特征征,无确确定性信信息,为为平稳序序列。附录1.113 固固定周期期序列:奶牛月月产奶量量序列差差分分析析图1:导入入数据(月月度数据据)图2:绘制制序列曲曲线图可以看出本本序列既既有长期期趋势又又有周期期性因素素,因此此我们首首先进行行一阶差差分提取取趋势特特征,再再进行112步周周期差分分提取周周期信息息。图3:一阶阶差分序序列曲线线图可以看出序序列不再再具有趋趋势特征征,一阶阶差分提提取了线线性趋势势图4:对序序列进行行一阶差差分图5:对一一阶差分分序列进进行122步周期期差分图6:绘制制周期差差分后序序列上述操作也也可以用用D(OOP,11,122)命令令来实
25、现现,即一一阶12步步差分,因因此直接接绘制序序列D(OP,1,112)的的时序图图结果如如图6。图7:周期期差分后后序列的的相关图图可以看出序序列自相相关系数数12阶阶显著,说说明还是是有一定定的周期期性图8:对上上面的序序列再进进行122步差分分,绘制制曲线图图图9:序列列的相关关图可以看出112阶相相关系数数仍然显显著,且且相关系系数比DD12DD1序列列的相关关系数还还大,因因此我们们就进行行到上一一步骤即即可。差分的方式式小结对线性趋势势的序列列,一阶阶差分即即可提取取确定性性信息,命命令为DD(X);对曲线趋势势的序列列,低阶阶差分即即可提取取序列的的确定性性信息,命命令为DD(X
26、,a);对具有周期期性特点点的序列列,k步步差分即即可提取取序列的的周期性性信息,命命令为DD(X,0,kk)。对既有长期期趋势又又有周期期性波动动的序列列,可以以采用低低阶k步差差分的操操作提取取确定性性信息,操操作方法法为D(X,aa,k)。非平稳序列列如果经经过差分分变成平平稳序列列,则我我们称这这类序列列为差分分平稳序序列,差差分平稳稳序列可可以使用用ARIIMA模模型进行行拟合。二、ARIIMA模模型差分平稳序序列在经经过差分分后变成成平稳时时间序列列,之后后的分析析可以用用ARMMA模型型进行,差差分过程程加上AARMAA模型对对差分平平稳序列列进行的的分析称称为ARRIMAA模型
27、。附录1.114 分分析19952-19888年中中国农业业实际国国民收入入指数序序列先观测序列列的时序序图,可可知序列列具有线线性长期期趋势,需需要进行行1阶差差分。图1:19952-19888年中中国农业业实际国国民收入入指数时时序图再观测差分分序列的的时序图图图2:中国国农业实实际国民民收入指指数1阶阶差分后后序列的的时序图图图3:国农农业实际际国民收收入指数数1阶差差分后序序列的相相关分析析由图可知,序序列1阶阶自相关关显著,序序列平稳稳;Q统统计量PP值小于于0.005,非非白噪声声;同时时,偏自自相关拖拖尾、自自相关一一步截尾尾,建立立ARIIMA(00,1,11)模型型。(建建立
28、ARRIMAA(0,11,1)模模型,是是因为偏偏自相关关拖尾,所所以第一一个数值值为0,然然后因为为序列进进行了一一阶差分分,所以以中间数数值为11,又自自相关图图一阶截截尾,所所以最后后一个数数值为11.)图4:中国国农业实实际国民民收入指指数的AARIMMA(00,1,11)模型型图5:模型型残差的的相关性性分析从图4和图图5分析析可知,残残差为白白噪声,模模型信息息提取充充分;模模型参数数显著,模模型精简简,因此此建立的的ARIIMA(00,1,11)模型型合格,模型具具体情况况如下式式:(1-B)SS=5.01556+(1-00.70082BB)图6:预测测19889-220000年
29、农业业实际国国民收入入指数图7:19989-20000年农农业实际际国民收收入指数数预测图图三、季节模模型1.简单季季节模型型附录1.113 对对 19962.119775.112平均均每头奶奶牛月产产奶量序序列进行行分析根据前面的的分析可可知,经经过1122步差分分后, op变变成平稳稳时间序序列。图1:序列列D(OOP,11,122)的相相关分析析图经过相关分分析看出出自相关关图具有有短期相相关性,是是平稳时时间序列列;Q统统计量的的P值有有小于00.055的情况况,因此此序列为为平稳非非白噪声声序列。又又观测自自相关和和偏自相相关图,识识别方程程为一阶阶自回归归方程图2:序列列D(OOP
30、,11,122)的AAR(11)模型型图3:模型型残差的的相关分分析分析可知残残差为白白噪声,因因而模型型提取信信息充分分;观测测图2可可知模型型参数显显著,因因而ARR(1)模模型可以以提取平平稳序列列D(OOP,11,122)的信信息。模型的具体体信息为为(1-B)(1-BBOP=2.乘积季季节模型型当序列中长长期趋势势、季节节效应、随随机波动动可以很很容易分分开,我我们用简简单季节节模型进进行分析析;但更更为常见见的是序序列的三三个部分分不能简简单分开开,而是是相互关关联,这这时要用用乘积季季节模型型。附录1.117 试试分析119488-19981年年美国女女性(大大于200岁)月月度
31、失业业率序列列首先观测序序列的时时序图图1:19948-19881年美美国女性性(大于于20岁岁)月度度失业率率序列时时序图由时序图可可知,序序列既有有长期趋趋势又有有周期性性,因此此进行11阶12步步差分图2:进行行1阶122步差分分图3:D(S,11,122)的时时序图从时序图可可以看出出D(SS,1,12)均值稳稳定,也也没有明明显的周周期性,方方差有界界;通过过相关分分析,具具体分析析序列的的平稳性性,如图图4。图图4中可可以看出出自相关关两阶显显著,但但是122阶也是是显著的的,因此此在趋势势平稳中中又包含含了周期期性因素素。图4:D(S,11,122)的相相关分析析用ARMAA模型
32、拟拟合序列列D(SS,1,12)尝试如如下:图5:ARR(1,12)模型拟拟合序列列D(SS,1,12)图6:ARR(1,12)模型拟拟合序列列D(SS,1,12)的残差差相关图图可以看出模模型残差差非白噪噪声,模模型提取取信息不不充分。图7:MAA(1,12)模型拟拟合序列列D(SS,1,12)图8:MAA(1,12)模型拟拟合序列列D(SS,1,12)残差相相关图可以看出模模型残差差也非白白噪声,模模型提取取信息不不充分。这种情况下下我们尝尝试乘积积季节模模型图9:ARRMA(1,11)(1,0,11)拟合合序列DD(S,1,112)图10:AARMAA(1,1)(1,0,11)模型型的参数数可以看出SSAR(12)的参数数并不显显著,因因此删除除该项。图11:AARMAA(1,1)(0,00,1)拟合序序列D(S,11,122)图12:AARMAA(1,1)(0,0,11)模型型的参数数图13:乘乘积模型型的残差差相关图图可以看出乘乘积模型型的残差差为白噪噪声序列列,该模模型提取取序列的的信息充充分;参参数都显显著,因因此模型型精简;模型的的具体形形式为:(1-B)(1-BB)S=