《《应用时间序列分析》实验手册3550.docx》由会员分享,可在线阅读,更多相关《《应用时间序列分析》实验手册3550.docx(82页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用时间序列分析实验手册目 录目 录. 2第二章 时时间序列的的预处理. 33一、平稳性性检验. 3二、纯随机机性检验. 99第三章 平稳时间间序列建模模实验教程程. 10一、模型识识别. 10二、模型型参数估计计(如何判判断拟合的的模型以及及结果写法法). 13三、模型的的显著性检检验. 17四、模型型优化. 188第四章 非非平稳时间间序列的确确定性分析析. 19一、趋势势分析. 199二、季节效效应分析. 334三、综合合分析. 388第五章 非非平稳序列列的随机分分析. 44一、差分分法提取确确定性信息息. 44二、ARIIMA模型型. 58三、季节节模型. 622第二章 时时间序列的
2、的预处理一、平稳性性检验时序图检验验和自相关关图检验(一)时序序图检验 根据平稳时时间序列均均值、方差差为常数的的性质,平平稳序列的的时序图应应该显示出出该序列始始终在一个个常数值附附近随机波波动,而且且波动的范范围有界、无无明显趋势势及周期特特征例2.1检验19664年19999年中中国纱年产产量序列的的平稳性1.在Evviewss软件中打打开案例数数据图1:打开开外来数据据图2:打开开数据文件件夹中案例例数据文件件夹中数据据文件中序列列的名称可可以在打开开的时候输输入,或者者在打开的的数据中输输入图3:打开开过程中给给序列命名名图4:打开开数据2.绘制时时序图可以如下图图所示选择择序列然后
3、后点Quiick选择择Scattter或或者XYlline;绘制好后可可以双击图图片对其进进行修饰,如如颜色、线线条、点等等图1:绘制制散点图图2:年份份和产出的的散点图图3:年份份和产出的的散点图(二)自相相关图检验验例2.3导入数据,方方式同上;在Quicck菜单下下选择自相相关图,对对Qiween原列进进行分析;可以看出自自相关系数数始终在零零周围波动动,判定该该序列为平平稳时间序序列。图1:序列列的相关分分析图2:输入入序列名称称图2:选择择相关分析析的对象图3:序列列的相关分分析结果:1. 可可以看出自自相关系数数始终在零零周围波动动,判定该该序列为平平稳时间序序列2.看Q统计量的的
4、P值:该统统计量的原原假设为XX的1期,2期k期的自相相关系数均均等于0,备择假假设为自相相关系数中中至少有一一个不等于于0,因此如如图知,该该P值都5%的显著性性水平,所以接受受原假设,即序列是是纯随机序序列,即白噪声声序列(因为序列列值之间彼彼此之间没没有任何关关联,所以说过过去的行为为对将来的的发展没有有丝毫影响响,因此为纯纯随机序列列,即白噪声声序列.) 有的题题目平稳性性描述可以以模仿书本本33页最后后一段.(三)平稳稳性检验还还可以用:单位根检验验:ADFF,PP检检验等;非参数检验验:游程检检验图1:序列列的单位根根检验表示不包含截距项图2:单位位根检验的的方法选择择图3:ADD
5、F检验的的结果:如如图,单位位根统计量量ADF=-0.00163884都大于于EVIEEWS给出出的显著性性水平1%-10%的ADF临界界值,所以以接受原假假设,该序序列是非平平稳的。二、纯随机机性检验计算Q统计计量,根据据其取值判判定是否为为纯随机序序列。例2.3的的自相关图图中有Q统计量,其其P值在K=66、12的时候候均比较大大,不能拒拒绝原假设设,认为 该序列是是白噪声序序列。另外,小样样本情况下下,LB统计量量检验纯随随机性更准准确。第三章 平平稳时间序序列建模实实验教程一、模型识识别1.打开数数据图1:打开开数据2.绘制趋趋势图并大大致判断序序列的特征征图2:绘制制序列散点点图图3
6、:输入入散点图的的两个变量量图4:序列列的散点图图3.绘制自自相关和偏偏自相关图图图1:在数数据窗口下下选择相关关分析图2:选择择变量图3:选择择对象图4:序列列相关图4.根据自自相关图和和偏自相关关图的性质质确定模型型类型和阶阶数如果样本(偏)自相关系系数在最初初的d阶明显大大于两倍标标准差范围围,而后几几乎95的自自相关系数数都落在22倍标准差差的范围以以内,而且且通常由非非零自相关关系数衰减减为小值波波动的过程程非常突然然。这时,通通常视为(偏)自相关系系数截尾。截截尾阶数为为d。本例:n 自相关图图显示延迟迟3阶之后,自自相关系数数全部衰减减到2倍标准差差范围内波波动,这表表明序列明明
7、显地短期期相关。但但序列由显显著非零的的相关系数数衰减为小小值波动的的过程相当当连续,相相当缓慢,该该自相关系系数可视为为不截尾 n 偏自相关关图显示除除了延迟11阶的偏自自相关系数数显著大于于2倍标准差差之外,其其它的偏自自相关系数数都在2倍标准差差范围内作作小值随机机波动,而而且由非零零相关系数数衰减为小小值波动的的过程非常常突然,所所以该偏自自相关系数数可视为一一阶截尾 n 所以可以以考虑拟合合模型为AAR(1)自相关系数数偏相关系数数模型定阶拖尾P阶截尾AR(p)模型Q阶截尾拖尾MA(q)模模型拖尾拖尾ARMA(P,Q)模型具体判别什什么模型看看书58到62的图例例。:二、模型参参数估
8、计根据相关图图模型确定定为AR(1),建建立模型估估计参数在ESTIIMATEE中按顺序序输入变量量cx cc cx(-1)或或者cx c arr(1) 选择LS参数估估计方法,查查看输出结结果,看参参数显著性性,该例中中两个参数数都显著。细心的同学学可能发现现两个模型型的C取值不同同,这是因因为前一个个模型的CC为截距项项;后者的的C则为序列期期望值,两两个常数的的含义不同同。图1:建立立模型图2:输入入模型中变变量,选择择参数估计计方法图3:参数数估计结果果图4:建立立模型图5:输入入模型中变变量,选择择参数估计计方法图6:参数数估计结果果三、模型的的显著性检检验检验内容:整个模型对对信息
9、的提提取是否充充分;参数的显著著性检验,模模型结构是是否最简。图1:模型型残差图2:残差差的平稳性性和纯随机机性检验对残差序列列进行白噪噪声检验,可可以看出AACF和PACFF都没有显显著异于零零,Q统计量的的P值都远远远大于0.05,因因此可以认认为残差序序列为白噪噪声序列,模模型信息提提取比较充充分。常数和滞后后一阶参数数的P值都很小小,参数显显著;因此此整个模型型比较精简简,模型较较优。四、模型优优化当一个拟合合模型通过过了检验,说说明在一定定的置信水水平下,该该模型能有有效地拟合合观察值序序列的波动动,但这种种有效模型型并不是唯唯一的。当几个模型型都是模型型有效参数数显著的,此此时需要
10、选选择一个更更好的模型型,即进行行优化。优化的目的的,选择相相对最优模模型。优化准则:最小信息量量准则(AAn Innformmatioon Crriterrion) n 指导思想想n 似然函数数值越大越越好 n 未知参数数的个数越越少越好 n AIC准准则的缺陷陷在样本容量量趋于无穷穷大时,由由AIC准则则选择的模模型不收敛敛于真实模模型,它通通常比真实实模型所含含的未知参参数个数要要多 但是本例中中滞后二阶阶的参数不不显著,不不符合精简简原则,不不必进行深深入判断。第四章 非非平稳时间间序列的确确定性分析析第三章介绍绍了平稳时时间序列的的分析方法法,但是自自然界中绝绝大多数序序列都是非非平
11、稳的,因因而对非平平稳时间序序列的分析析跟普遍跟跟重要,人人们创造的的分析方法法也更多。这这些方法分分为确定性性时序分析析和随机时时序分析两两大类,本本章主要介介绍确定性性时序分析析方法。一个序列在在任意时刻刻的值能够够被精确确确定(或被被预测),则则该序列为为确定性序序列,如正正弦序列、周周期脉冲序序列等。而而某序列在在某时刻的的取值是随随机的,不不能给以精精确预测,只只知道取某某一数值的的概率,如如白噪声序序列等。CCrameer分解定定理说明每每个序列都都可以分成成一个确定定序列加一一个随机序序列,平稳稳序列的两两个构成序序列均平稳稳,非平稳稳时间序列列则至少有有一部分不不平稳。本本章先
12、分析析确定性序序列不平稳稳的非平稳稳时间时间间序列的分分析方法。确定性序列列不平稳通通常显示出出非常明显显的规律性性,如显著著趋势或者者固定变化化周期,这这种规律性性信息比较较容易提取取,因而传传统时间序序列分析的的重点在确确定性信息息的提取上上。常用的确定定性分析方方法为因素素分解。分分析目的为为:克服其他他因素的影影响,单纯纯测度某一一个确定性性因素的影影响;推断出各各种因素彼彼此之间作作用关系及及它们对序序列的综合合影响。一、趋势分分析绘制序列的的线图,观观测序列的的特征,如如果有明显显的长期趋趋势,我们们就要测度度其长期趋趋势,测度度方法有:趋势拟合合法、平滑滑法。(一) 趋趋势拟合法
13、法1.线性趋趋势拟合例1:以澳澳大利亚政政府19881-19990年每每季度消费费支出数据据为例进行行分析。图1:导入入数据图2:绘制制线图,序序列有明显显的上升趋趋势长期趋势具具备线性上上升的趋势势,所以进进行序列对对时间的线线性回归分分析。图3:序列列支出(zzc)对时时间(t)进行线线性回归分分析图4:回归归参数估计计和回归效效果评价可以看出回回归参数显显著,模型型显著,回回归效果良良好,序列列具有明显显线性趋势势。图5:运用用模型进行行预测图6:预测测效果(偏偏差率、方方差率等)图7:绘制制原序列和和预测序列列的线图图8:原序序列和预测测序列的线线图图9:残差差序列的曲曲线图可以看出残
14、残差序列具具有平稳时时间序列的的特征,我我们可以进进一步检验验剔除了长长期趋势后后的残差序序列的平稳稳性,第三三章知识这这里不在叙叙述。2.曲线趋趋势拟合例2:对上上海证券交交易所19991.11-20001.100每月月末末上正指数数序列进行行拟合。图1:导入入数据图2:绘制制曲线图可以看出序序列不是线线性上升,而而是曲线上上升,尝试试用二次模模型拟合序序列的发展展。图3:模型型参数估计计和回归效效果评价因为该模型型中T的系数不不显著,我我们去掉该该项再进行行回归分析析。图4:新模模型参数估估计和回归归效果评价价图5:新模模型的预测测效果分析析图6:原序序列和预测测序列值图7:原序序列和预测
15、测序列值曲曲线图图8:计算算预测误差差图9:对预预测误差序序列进行单单位根检验验拒绝原假设设,认为序序列没有单单位根,为为平稳序列列,说明模模型对长期期趋势拟合合的效果还还不错。同样,序列列与时间之之间的关系系还有很多多中,比如如指数曲线线、生命曲曲线、龚柏柏茨曲线等等等,其回回归模型的的建立、参参数估计等等方法与回回归分析同同,这里不不再详细叙叙述。(二) 平平滑法除了趋势拟拟合外,平平滑法也是是消除短期期随机波动动反应长期期趋势的方方法,而其其平滑法可可以追踪数数据的新变变化。平滑滑法主要有有移动平均均方法和指指数平滑法法两种,这这里主要介介绍指数平平滑方法。例3:对北北京市19950-1
16、1998年年城乡居民民定期储蓄蓄所占比例例序列进行行平滑。图1:打开开序列,进进行指数平平滑分析图2:系统统自动给定定平滑系数数趋势给定方法为为选择使残残差平方和和最小的平平滑系数,该该例中平滑滑系数去00.53,超超过0.55用一次平平滑效果不不太好图3:平滑滑前后序列列曲线图图4:用二二次平滑修修匀原序列列可以看出,平平滑系数为为0.1334,平均均差为4.0677708,修修匀或者趋趋势预测效效果不错。图5:二次次平滑效果果图例4:对于于有明显线线性趋势的的序列,我我们可以采采用Hollt两参数数法进行指指数平滑对北京市11978-20000年报纸发发行量序列列进行Hoolt两参参数指数
17、平平滑图1:报纸纸发行量的的曲线图图2:Hoolt两参参数指数平平滑(指定定平滑系数数)图3:预测测效果检验验图4:系统统自动给定定平滑系数数时平滑效效果图5:原序序列与预测测序列曲线线图(其中FXXSM为自自己给定系系数时的平平滑值,FFXSM22为系统给给定系数时时的平滑值值)二、季节效效应分析许多序列有有季节效应应,比如:气温、商商品零售额额、某景点点旅游人数数等都会呈呈现明显的的季节变动动规律。例5:以北北京市19995-22000年年月平均气气温序列为为例,介绍绍季节效应应分析操作作。图1:建立立月度数据据新工作表表图2:新工工作表中添添加数据图3:五年年的月度气气温数据图4:进行行
18、季节调整整(移动平平均法)图5:移动动平均季节节加法图6:122个月的加加法调整因因子图7:打开开三个序列列(季节调调整序列、原原序列、调调整后序列列)图8:三个个序列(季季节调整序序列、原序序列、调整整后序列)取取值图9:三个个序列(季季节调整序序列、原序序列、调整整后序列)曲曲线图另外季节调调整还可以以用X111,X12等方方法进行调调整。三、综合分分析 前面两部分分介绍了单单独测度长长期趋势和和季节效应应的分析方方法,这里里介绍既有有长期趋势势又有季节节效应的复复杂序列的的分析方法法。附录1.111 对1993320000年中国国社会消费费品零售总总额序列进进行确定性性分析图1:绘制制1
19、993320000年中国国社会消费费品零售总总额时序图图可以看出序序列中既有有长期趋势势又有季节节波动图2:进行行季节调整整图3:122个月的季季节因子图4:经季季节调整后后的序列SSSA图5:对经经季节调整整后序列进进行趋势拟拟合图6:趋势势拟合序列列SSAFF与序列SSSA的时序序图图7:扩展展时间区间间后预测长长期趋势值值SSAFF图8:经季季节调整预预测20001年12个月的的零售总额额值图9:预测测20011年12个月的的零售总额额值图10:预预测序列与与原序列的的时序图第五章 非非平稳序列列的随机分分析非平稳序列列的确定性性分析原理理简单操作作方便易于于解释,但但是只提取取确定性信
20、信息,对随随机信息浪浪费严重;且各因素素之间确切切的作用关关系没有明明确有效的的判断方法法。随机分分析方法的的发展弥补补了这些不不足,为人人们提供更更加丰富、更更加精确的的时序分析析工具。对非平稳时时间序列的的分析,要要先提取确确定性信息息再研究随随机信息。一、差分法法提取确定定性信息确定性信息息的提取方方法有第四四章学习的的趋势拟合合、指数平平滑、季节节指数、季季节多元回回归等,本本章主要介介绍差分法法提取确定定性信息。差分实质:自回归差分方式:对线性趋趋势序列进进行1阶差分、对对曲线趋势势序列进行行低阶差分分、对固定定周期序列列进行周期期差分附录1.22 线性趋趋势:对产产出序列进进行一阶
21、差差分详细分析过过程如下:图1:导入入数据图2:绘制制线性图,观观察序列的的特征观察发现序序列具有较较明显的线线性趋势图3:进行行一阶差分分运算图4:一阶阶差分运算算公式图5:一阶阶差分序列列图6:一阶阶差分曲线线图观察一阶差差分序列均均值方差稳稳定,进一一步进行平平稳性分析析。图7:绘制制一阶差分分序列的相相关图图8:自相相关图均不不显著,QQ统计量不不显著因此,差分分后序列问问白噪声序序列,一阶阶差分将序序列的信息息提取充分分。附录1.112 曲线线序列:北北京市民用用车拥有量量序列差分分分析图1:导入入数据图2:绘制制原序列曲曲线图可以看出,1950年到1999年北京市居民民用车拥有量序
22、列具有曲线趋势,现用低阶差分法提取确定性信息。图3:绘制制一阶差分分序列的曲曲线图图4:一阶阶差分序列列曲线图可以看出一一阶差分序序列仍然具具有趋势,继继续进行差差分分析;二阶差分分的命令的的D(QCC,2),低低阶差分的的命令为DD(QC,K)。图5:对原原序列进行行二阶差分分图6:二阶阶差分序列列曲线图从二阶差分分序列曲线线图可以看看出二阶差差分序列中中没有中长长期趋势,二二阶差分提提取了长期期趋势。图7:自相相关分析图8:对序序列的二阶阶差分序列列进行自相相关分析图9:二阶阶差分序列列相关图可以看出二二阶差分序序列具有短短期相关性性的特征,无无确定性信信息,为平平稳序列。附录1.113
23、固定定周期序列列:奶牛月月产奶量序序列差分分分析图1:导入入数据(月月度数据)图2:绘制制序列曲线线图可以看出本本序列既有有长期趋势势又有周期期性因素,因因此我们首首先进行一一阶差分提提取趋势特特征,再进进行12步步周期差分分提取周期期信息。图3:一阶阶差分序列列曲线图可以看出序序列不再具具有趋势特特征,一阶阶差分提取取了线性趋趋势图4:对序序列进行一一阶差分图5:对一一阶差分序序列进行112步周期期差分图6:绘制制周期差分分后序列上述操作也也可以用DD(OP,1,122)命令来来实现,即即一阶12步差差分,因此此直接绘制制序列D(OP,11,12)的时序图图结果如图图6。图7:周期期差分后序
24、序列的相关关图可以看出序序列自相关关系数122阶显著,说说明还是有有一定的周周期性图8:对上上面的序列列再进行112步差分分,绘制曲曲线图图9:序列列的相关图图可以看出112阶相关关系数仍然然显著,且且相关系数数比D122D1序列列的相关系系数还大,因因此我们就就进行到上上一步骤即即可。差分的方式式小结对线性趋势势的序列,一一阶差分即即可提取确确定性信息息,命令为为D(X);对曲线趋势势的序列,低低阶差分即即可提取序序列的确定定性信息,命命令为D(X,a);对具有周期期性特点的的序列,kk步差分即即可提取序序列的周期期性信息,命命令为D(X,0,k)。对既有长期期趋势又有有周期性波波动的序列列
25、,可以采采用低阶k步差差分的操作作提取确定定性信息,操操作方法为为D(X,a,k)。非平稳序列列如果经过过差分变成成平稳序列列,则我们们称这类序序列为差分分平稳序列列,差分平平稳序列可可以使用AARIMAA模型进行行拟合。二、ARIIMA模型型差分平稳序序列在经过过差分后变变成平稳时时间序列,之之后的分析析可以用AARMA模模型进行,差差分过程加加上ARMMA模型对对差分平稳稳序列进行行的分析称称为ARIIMA模型型。附录1.114 分析析19522-19888年中国国农业实际际国民收入入指数序列列先观测序列列的时序图图,可知序序列具有线线性长期趋趋势,需要要进行1阶阶差分。图1:19952-
26、11988年年中国农业业实际国民民收入指数数时序图再观测差分分序列的时时序图图2:中国国农业实际际国民收入入指数1阶阶差分后序序列的时序序图图3:国农农业实际国国民收入指指数1阶差差分后序列列的相关分分析由图可知,序序列1阶自自相关显著著,序列平平稳;Q统统计量P值值小于0.05,非非白噪声;同时,偏偏自相关拖拖尾、自相相关一步截截尾,建立立ARIMMA(0,11,1)模模型。(建建立ARIIMA(00,1,11)模型,是是因为偏自自相关拖尾尾,所以第第一个数值值为0,然然后因为序序列进行了了一阶差分分,所以中中间数值为为1,又自自相关图一一阶截尾,所所以最后一一个数值为为1.)图4:中国国农
27、业实际际国民收入入指数的AARIMAA(0,11,1)模模型图5:模型型残差的相相关性分析析从图4和图图5分析可可知,残差差为白噪声声,模型信信息提取充充分;模型型参数显著著,模型精精简,因此此建立的AARIMAA(0,11,1)模模型合格,模型具体体情况如下下式:(1-B)SS=5.00156+(1-00.70882B)图6:预测测19899-20000年农业业实际国民民收入指数数图7:19989-22000年年农业实际际国民收入入指数预测测图三、季节模模型1.简单季季节模型附录1.113 对 19622.119755.12平平均每头奶奶牛月产奶奶量序列进进行分析根据前面的的分析可知知,经过
28、1112步步差分后, op变成成平稳时间间序列。图1:序列列D(OPP,1,112)的相相关分析图图经过相关分分析看出自自相关图具具有短期相相关性,是是平稳时间间序列;QQ统计量的的P值有小小于0.005的情况况,因此序序列为平稳稳非白噪声声序列。又又观测自相相关和偏自自相关图,识识别方程为为一阶自回回归方程图2:序列列D(OPP,1,112)的AAR(1)模型图3:模型型残差的相相关分析分析可知残残差为白噪噪声,因而而模型提取取信息充分分;观测图图2可知模模型参数显显著,因而而AR(11)模型可可以提取平平稳序列DD(OP,1,122)的信息息。模型的具体体信息为(1-B)(1-BOOP=2
29、.乘积季季节模型当序列中长长期趋势、季季节效应、随随机波动可可以很容易易分开,我我们用简单单季节模型型进行分析析;但更为为常见的是是序列的三三个部分不不能简单分分开,而是是相互关联联,这时要要用乘积季季节模型。附录1.117 试分分析19448-19981年美美国女性(大大于20岁岁)月度失失业率序列列首先观测序序列的时序序图图1:19948-11981年年美国女性性(大于220岁)月月度失业率率序列时序序图由时序图可可知,序列列既有长期期趋势又有有周期性,因因此进行11阶12步步差分图2:进行行1阶12步差差分图3:D(S,1,12)的的时序图从时序图可可以看出DD(S,11,12)均值稳定
30、定,也没有有明显的周周期性,方方差有界;通过相关关分析,具具体分析序序列的平稳稳性,如图图4。图44中可以看看出自相关关两阶显著著,但是112阶也是是显著的,因因此在趋势势平稳中又又包含了周周期性因素素。图4:D(S,1,12)的的相关分析析用ARMAA模型拟合合序列D(S,1,12)尝尝试如下:图5:ARR(1,112)模型型拟合序列列D(S,1,122)图6:ARR(1,112)模型型拟合序列列D(S,1,122)的残差差相关图可以看出模模型残差非非白噪声,模模型提取信信息不充分分。图7:MAA(1,112)模型型拟合序列列D(S,1,122)图8:MAA(1,112)模型型拟合序列列D(
31、S,1,122)残差相相关图可以看出模模型残差也也非白噪声声,模型提提取信息不不充分。这种情况下下我们尝试试乘积季节节模型图9:ARRMA(11,1)(1,00,1)拟拟合序列DD(S,11,12)图10:AARMA(1,1)(1,00,1)模模型的参数数可以看出SSAR(112)的参参数并不显显著,因此此删除该项项。图11:AARMA(1,1)(0,00,1)拟拟合序列DD(S,11,12)图12:AARMA(1,1)(0,00,1)模模型的参数数图13:乘乘积模型的的残差相关关图可以看出乘乘积模型的的残差为白白噪声序列列,该模型型提取序列列的信息充充分;参数数都显著,因因此模型精精简;模型型的具体形形式为:(1-B)(1-B)S=