《时间序列分析及相空间重构课件.ppt》由会员分享,可在线阅读,更多相关《时间序列分析及相空间重构课件.ppt(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 时间序列的定义 n按照时间的顺序把事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。时间序列例1n德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期时间序列例2上证指数相空间重构如果把一个时间序列看成是由一个确定性的非线性动力系统产生的,要考虑的是以下反问题:如何由时间序列来恢复并刻划原动力系统?由时间序列恢复原系统最常用的方法利用Takens 的延迟嵌入定理对于一个非线性系统,通过观测,可以得到一组测量值x(n),n=1,2,N利用此测量值可以构造一组m 维向量X(n)=(x(n),x(n-),x(n
2、-(m-1)n=(m-1)+1,N如果参数,m 选择恰当,则X(n)可描述原系统。称为延迟时间,m称为嵌入维数。由x(n)构造X(n)称为相空间重构。相空间重构法基本思想是:系统中任一分量的演化都是由与之相互作用着的其它分量所决定的,因此这些相关分量的信息就隐含在任一分量的发展过程中。为了重构一个等价的状态空间,只需考察一个分量,并将它在某些固定的时间延迟点上的测量作为新维处理,它们确定了某个多维状态空间中的一点.重复这一过程并测量相对于不同时间的各延迟量,就可以产生出许多这样的点,它可以将原系统的许多性质保存下来,即用系统的一个观察量可以重构出原动力系统模型,可以初步确定原系统的真实信息。相
3、空间重构例nHenon 映射该系统虽然有两个状态变量,但如果观测到状态变量Xn的信息,我们可以从Xn建立原系统的模型对状态变量Xn进行相空间重构:Zn=(Xn,Xn-1)由Zn 可以重构原来的系统Lorenz系统Lorenz系统的吸引子(x-y-z)Lorenz系统的吸引子(x,y相图)Lorenz系统的吸引子(y,z相图)Lorenz系统的吸引子(x,z相图)n如果只观测到变量x的值,利用x作相空间重构n取延迟时间为9,嵌入维数为3n即令(x(1),y(1),z(1)=(x(19),x(10),x(1)(x(2),y(2),z(2)=(x(20),x(11),x(2)(x(3),y(3),z
4、(3)=(x(21),x(12),x(3)重构后的相图(x-y-z)原始系统相图(x-y-z)重构后的相图(x-y)原系统的相图(x-y)重构后的相图(y-z)原系统的相图(y-z)重构后的相图(x-z)原系统的相图(x-z)如何确定延迟时间和嵌入维数?延迟时间间隔延迟时间间隔的选取的选取主要方法n 线性自相关函数法n平均互信息法线性自相关函数法定义自相关函数为 选择使得自相关函数C()第一次为零时的的值为延迟时间平均互信息法选择使I()为第一个局部极小的为延迟时间间隔。嵌入维数嵌入维数m的选取的选取主要方法虚假邻点法关联积分法奇异值分解法虚假邻点法n虚假邻点的定义 上面的距离差由于和时间序列
5、数据的大小有关,不太容易确定虚假邻点。实际采用相对度量法虚假邻点法确定嵌入维数n对实测时间序列,m 从2 开始,取R=30,计算虚假最近邻点的比例,然后增加m,直到虚假最近邻点的比例小于5%或虚假最近邻点不再随着m 的增加而减少时,可以认为此时的m 为合适的嵌入维数。非线性时间序列预测基本思想设时间序列来自确定性系统X(n)=F(X(n-1),F(.)为连续函数。若 X(n)和X(j)距离很小,则F(X(n)和F(X(j)距离也应很小,即X(n+1)和X(j+1)间的距离很小,从而 可以用X(j+1)作为X(n+1)的预测值。基本方法局域预测法 局部平均预测法 局部线性预测法 局部多项式预测法
6、全域预测法 神经网络 小波网络 遗传算法 局部平均预测法设时刻T的状态向量为X(T)=(X(T)=(x(T),x(T-x(T),x(T-),x(T-(m-1),x(T-(m-1)找找X(T)的最近邻点X(T1),X(TK),以X(T1+1),X(TK+1)的平均值作为X(T+1)的预测值这是向量表达式,取第一个分量得局部线性预测法 局部线性预测模型为仍设X(T1),X(TK)为X(T)的K个邻近点,确定Ci的方法:最小二乘法即 求Ci使得局部多项式预测法 局部多项式预测模型为(以二次多项式为例)仍以最小二乘法确定系数预测效果评价为了检验预测的精确性,可以比较预测值与实际观测值之间的差。一次预测
7、可能较好或较差,偶然性较大。为了克服这种偶然性,可以取多个点的预测误差的平均。如果RMSE比较大,则说明预测效果不好。但是RMSE和观测序列的数值大小有关,为克服这一问题,我们定义正规化均方根误差NRMSE若NRMSE接近于1,则预测效果不好若NRMSE接近于0,则预测效果较好n预测效果的另一个评价标准是相关系数若r接近于1,则预测效果较好上证指数预测n数据文件000001.day 1990.12.19-2008.06.19 共4292个记录每一条记录的长度为40字节:1-4字节为日期 5-8字节=开盘指数*10009-12字节=最高指数*100013-16字节=最低指数*100017-20字
8、节=收盘指数*100021-24字节=成交金额(元)/100025-28字节=成交量(手)其余12字节未使用读取数据matlab文件为readdata.m n上证指数预测文件为shangzhen1.mn相关文件为readdata.m juli.m dataconstruct1.m reconstruct1.m多变量时间序列以两个变量为例说明多变量情形设给定时间序列x(n),y(n)x(n)的嵌入维数为m1,延迟时间为1 y(n)的嵌入维数为m2,延迟时间为2 多变量时间序列的相空间重构nX(n)=(x(n),x(n-1),x(n-(m1-1)1,y(n),y(n-2),y(n-(m2-1)2)重构后时间序列的维数为m1+m2 多变量时间序列预测设时刻T的状态向量为X(T)=(x(T),x(T-1),x(T-(m1-1)1,y(T),y(T-2),y(T-(m2-1)2)预测x(T+1)的值以局部多项式(二次)预测为例预测模型为设X(T)的K个最近邻点为X(T1),X(TK)如果系统是确定的,则当X(T)靠近X(Ti)时,X(T+1)应靠近X(Ti+1)以最小二乘估计参数用成交量,收盘指数预测上证指数的文件为shanzhen2.m相关文件为 readdata.m juli.m dataconstruct.m reconstruct.m