《时间序列分析的理论与应用 - 北京师范大学·珠海.docx》由会员分享,可在线阅读,更多相关《时间序列分析的理论与应用 - 北京师范大学·珠海.docx(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、时间序列分析的理论与应用报告人:王利霞指导老师:吴春松北京师范大学珠海分校应用数学学院广东珠海519085摘要:本文是对上学期学过的应用时间序列分析这门课程的综述,主要是对时间 序列基本内容的总结,并且通过应用问题的列举说明时间序列在实际生活中的重 要作用。关键词:时间序列;理论总结;实际应用一、 前言上学期,跟着吴春松老师学了一个学期的时间序列分析后,我对时间序列分 析有了初步的了解和认识,老师教授的过程中注重理论与实践的结合,我们也做 了一些上机实践和理论内容探究,结合老师所讲的内容以及学习过程中的探讨成 果,本文是我对这门课程做的一个汇总报告。报告主要分为三大部分,即理论内 容总结,探究
2、式学习以及时间序列分析的应用。时间序列分析是概率统计学中的一个重要分支,它用概率统计的方法分析随 时间变化的随机数据序列的统计规律性。我们学习的内容主要包括时间序列分析 的基本原理、方法、模型,并且学习了运用相关软件包(主要是SAS软件)进行 经济定量实证分析等。时间序列分析不仅可以从数量上揭示某一现象的发展变 化规律或从动态的角度来刻画某一现象与其他现象之间的内在数量关系及其变 化规律性,达到认识客观世界之目的,而且运用时间序列模型还可以预测和控制 现象的未来行为。许多经济、金融、商业等方面的数据都是时间序列数据,对这 些数据进行分析、处理和研究,从中挖掘有用信息。二、正文(一)时间序列分析
3、产生的背景7000年前的古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时 间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。像古6.时间序列分析在空气污染分析中的应用许多数学方法和计算机技术已应用于大气环境质量评价中,如模糊数学、GTS 技术、灰色系统等。这些方法大多是针对某一时刻或某一时间段内的大气污染物 进行评价,而大气污染物的浓度和分布具有时间变化特性。因此,数学方法中的时 间序列能够反映大气污染物随时间的推移而呈现的变动,为大气环境质量评价提 供了有力的支持,并且得到了广泛的应用。(五)SAS软件上机实践a. ARIMA 模型题目:18671938年英国绵羊数量如
4、下表所示:220323602254216520242078221422922207211921192137213219551785174718181909195818921919185318681991211121191991185918561924189219161968192818981850184118241823184318801968202919961933180517131726175217951717164815121338138313441384148415971686170716401611163217751850180916531648166516271791(1)确定该序
5、列的平稳性;(2)选择适当模型,拟合该序列的发展;(3)利用拟合模型预测19391945年英国绵羊的数量。. SAS程序如下: data example5_l; input x;difx=dif(x);t=_n_; cards;220323602254216520242078221422922207211921192137213219551785174718181909195818921919185318681991211121191991185918561924189219161968192818981850184118241823184318801968202919961933180517
6、131726175217951717164815121338138313441384148415971686170716401611163217751850180916531648166516271791proc gplot;plot x*t difx*t;symbol v=star c=black i=join;run;.由观察值得到序列的时序图如下:由以上时序图可以看出,该序列是非平稳序列,考虑对该序列进行1阶差分 运算,同时考察差分后序列的平稳性,在原程序的基础上添加如下命令: proc arima;identify var=x(1);estimate p=l;forecast lead
7、=5 id=t out=out;其中“estimate p=l; 是对一阶差分后序列拟合AR (1)模型。1 .对原序列进行查分运算得到如下时序图:时序图显示差分后序列difx没有明显的非平稳特征,认为经过1阶差分后 先行递减信息被提取,1阶差分后序列具有较稳定的随机波动,为了进一步确定 平稳性,考察差分后序列的自相关图,如下图所示:-ovar ianccCorrelat ion-1 9 8 7 6 5J4321012345G78916999.0031.000001,*2458.8150.35131i a;*M*-1011.876-.14457i l. *; .-2860.057-.40864
8、l i*;-1887.923-.26974a I.*; .501.7000.071681. 11141.6300.16311a i”*本534.1720.076321-211.549-.030231 I. * | .-433.646-.06196J*1.-427.412-.061071 1.* j.-283.149-.040461 1* 1-559.100-.07988!*! -766.439109511 1. *! .-610.874-.087281-83.415673-.011921 1Autocorrelat ions0123456789012345Std Error0 0.118678
9、 0.132518 0.134721 0.151174 0.157808 0.158266 0.160616 0.161126 0.161206 0.161541 0.161866 0.1G20080.1625620.1635970.164252总体上看,自相关图显示序列有很强的短期相关性,所以可以初步认为1 阶差分后序列平稳,接下来对平稳的一阶差分进行白噪声检验:2 .对平稳的一阶差分序列进行白噪声检验:AutocorrelationCheck forUhite NoiseTo-agChi-Pr SquareDFCh iSq -Autocorrelat ions-631.596 :t!Lag
10、MU-2.2320514.90755-0.150.88140ARI ,10.375700.115623.250.00181Constant 1Estimate-1.39346Mar iance 1Estimate6253.106Std ErrorEst imate79.07G58AIC824.0597SBC828.5851Number ofRes iduals71* AIC and SBC donot inc1udelog determ inant.输出拟合记过显示常数项不显著,添加或修改估计命令:estimate p=l noint; 即命令系统不要常数项拟合AR (1)模型,拟合结果如下:
11、Cond i t i ona1 Least Squares EstimationParameterEstimateStandard Errort ValueApproxPr :t;LagMA1 ,1-0.443340.11193-3.960.00021Var iance Est imate Std Error Estimate AICSBCNumber of Res i dua1s5901.23276.81948818.9692 821.231971剔除常数项后,拟合AR (1)拟合结果显著且参数显著,输出结果显示序列为的拟合模型为ARIMA (1, 1, 0)模型,拟合口径为:4o1+0.4
12、43348.利用拟合模型对序列七做5期预测,结果如下:Forecasts for variable xObsForecastStd Error957 Conf idence Limits731851.221779.07661696.23442006.2089741872.4536134.48961608.85882136.0484751879.0370180.20791525.83602232.2380761880.1169218.82851451.22092309.0129771879.1292252.37001384.49322373.7652b. REG回归:题目:爱荷华州1948-19
13、79年非农业产品季度收入数据如下表所示。表4-8选择适当模型拟合该序列长期趋势。60160462062664164264565568267869270773675376377577578379481382382682983183083885487288290391993792796297599510011013102110281027104810701095111311431154117311781183120512081209122312381245125812781294131413231336135513771416143014551480151415451589163416691715
14、176018121809182818711892194619832013204520482097214021712208227223112349236224422479252825712634268427902890296430853159323733583489358836243719382139344028412942054349446345984725482749395067523154085492565358285965. SAS程序:观察图像,猜想该模型应为二次型或者指数型,经过试拟合模型:拟合结果发现七=abf拟合效果最xt = abt + ct2 9 xt = a + be1,
15、xt = ab, 好,拟合程序如下:data exercise4_6; input x;t=_n_;cards;6016046206266416426456556826786927077367537637757757837948138238268298318308388548728829039199379279629759951001101310211028102710481070109511131143115411731178118312051208120912231238124512581278129413141323133613551377141614301455148015141545
16、1589163416691715176018121809182818711892194619832013204520482097214021712208227223112349236224422479252825712634268427902890296430853159323733583489358836243719382139344028412942054349446345984725482749395067523154085492565358285965proc nlin;model x=a*(b*t);parameters a=0.1 b=0.1 c=0.1;der.a=b*t;der
17、.b=a*t*(b*(t-1);output predicted=xhat out=result;proc gplot data=result;plot x*t=l xhat*t=2/overlay; symboll c=black i=none v=star; symbol2 c=red i=join v=none;run;.拟合结果如下图所示:说明:图中星号为原序列观察值,曲线为拟合值。通过该图可以看出拟合效 果还是不错的。1 .输出结果分析(1)迭代过程如下:fS 8888888888888888888888 0 e EEEEEEEEEEEEEEEEEEEEEE 厂 9999999992
18、887529s8455g m a 7777777778777776655302 uu 888888888747777777771177777777777b 0897762600216873712231 0551490209863074070111 0136970235555544433222 1111124790000000000000 OOOOOOOOO1111111111111a 0632647501021197408529 0520910582700153672356 0876432864468112352644 1000000000000000001397 oooooo ooooooo
19、000000019ooooooL 0123456789012345678901 e 111111111122 t(2)收敛状况:(结果显示本次迭代式收敛的)NOTE: Convergence criterion met.(3)估计信息摘要:Est imat ion Summary MethodGauss-New tonAverage Sub i terat i ons1.7931031terat ions Sub i terat i ons2952R2.262E-6PPC(a)8.289E-7RPC(a)7.469E-6(4)主要统计量:NOTE: An intercept was not s
20、pec i f ied for th is model.Sum ofMeanSourceDFSquaresSquareModel27.4438E83.7219E8Error126440710734977.0Uncorrected Total1287.4879E8Approx F ValuePr F10641.0.0001由于P0.0001,说明该模型显著有效。(5)参数信息摘要:ApproxParameter Estimate Std Error Approximate 95彳 Confidence Limitsa375.612.5320350.8b1.02130.0003171.020640
21、0.41.0219由以上信息可知,得到的拟合模型为:七=375.6x1.0213,(6)近似相关阵:ApproxParameter Est imate Std Error Approximate 95彳 Conf idence Limitsa375.612.5320350.8b1.02130.0003171.0206400.41.0219通过以上分析可知,可以用指数型七=375.6x1.0213拟合该序列的 长期趋势。拟合效果如拟合图中的曲线所示。参考文献1王燕.应用时间序列分析M.北京:中国人民大学出版社,20052李锐,向书坚.我国时间序列分析研究工作综述J.统计教育,20063姚懿,李小
22、平.时间序列分析方法在心理学中的应用J.徐州师范大学学报,20074刘劲松.数据挖掘中的现代时间序列分析方法J.信息技术,20075朱光,张保钢.时间序列分析在数字化误差处理中的应用JL北京建筑工程 学院学报,1996The Theories and Applications of Time Series AnalysisWang Lixia Wu ChunsongSchool of Applied Mathematics, Beijing Normal University Zhuhai CampusGuangdong 519085Abstract This article is a sum
23、mary about time series analysis that we have learned last semester. It mainly focuses on the summary of the basic content obout time series, and by listing the applications it shows that time series has play an important role in our real life .Keywords time series; theoretical summary; practical app
24、lication埃及人一样按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个 时间序列,对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走 势就是时间序列分析。早期的时间序列分析通常都是通过直观的数据比较或绘图 观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析。古埃及 人发现尼罗河泛滥的规律就是依靠这种分析方法。但随着研究领域的不断拓广, 在很多研究领域中随机变量的发展通常会呈现出非常强的随机性,人们发现依靠 单纯的描述性时序分析已不能准确地寻找出随机变量发展变化的规律,为了更准 确地估计随机序列发展变化的规律,从20世纪20年代开始,学术界利用数理统 计学
25、原理分析时间序列,研究的重心从表面现象的总结转移到分析序列值内在的 相关关系上,由此开辟了一门应用统计学科一时间序列分析。时间序列分析方法最早起源于1927年数学家Yule提出建立自回归模型(AR 模型)来预测市场变化的规律。1931年,另一位数学家在AR模型的启发下,建立 了移动平均模型(MA模型),初步奠定了时间序列分析方法的基础。20世纪60 年代后,时间序列分析方法迈上了一个新的台阶,在工程领域方面的应用非常广 泛。近几年,随着计算机技术和信号处理技术的迅速发展,时间序列分析理论和方 法更加趋于完善。(二)时间序列分析的基本理论.时间序列分析的定义:H回浏:按照时间的顺序把随机事件变化
26、发展的过程记录下来就构成了一 个时间序列。随机事件的时间序列,简记为X,小为,序列长度为n的观察 值序列,4/ = 12,时间序列分析:对时间序列进行观察、研究,找寻它变化发展的规律,预测 它将来的走势就是时间序列分析。时间序列分析分数理统计学的关系及时间序列分析特点:作为数理统计学的 一个专业分支,时间序列分析遵循数理统计学的基本原理,都是利用观察信息估 计总体的性质。但是由于时间的不可重复性,使得我们在任意一个时刻只能获得 惟一的一个序列观察值,这种特殊的数据结构导致时间序列分析有它非常特殊 的、自成体系的一套分析方法。1 .时间序列分析的基本思想:不论是经济领域中每年的产值、国民收入、某
27、一商品在某一市场上的销量、 价格变动等,或是社会领域中某一地区的人口数、医院患者人数、铁路客流量 等,还是自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序 列。根据这些时间序列,较精确地找出相应系统的内在统计特性和发展规律性, 从中提取人类所需要的准确信息的方法就是时间序列分析。它是一种根据动态数 据揭示系统动态结构和规律的统计方法。其基本思想是根据系统的有限长度的运 行记录(观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关 系的数学模型,并借以对系统的未来行为进行预测。2 .时间序列分析的基本特征:(1)时间序列分析法是根据过去的变化趋势预测未来的发展,它的前提
28、是假定事 物的过去延续到未来。时间序列分析,正是根据客观事物发展的连续规律性,运用过去的历史数据, 通过统计分析,进一步推测未来的发展趋势。事物的过去会延续到未来这个假设 前提包含两层含义:一是不会发生突然的跳跃变化,是以相对小的步伐前进;二是 过去和当前的现象可能表明现在和将来活动的发展变化趋向。这就决定了在一般 情况下,时间序列分析法对于短、近期预测比较显著,但如延伸到更远的将来,就 会出现很大的局限性,导致预测值偏离实际较大而使决策失误。(2)时间序列数据变动存在着规律性与不规律性时间序列中的每个观察值大小,是影响变化的各种不同因素在同一时刻发生 作用的综合结果。从这些影响因素发生作用的
29、大小和方向变化的时间特性来看, 这些因素造成的时间序列数据的变动分为四种类型。趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的 持续上升、下降、停留的同性质变动趋向,但变动幅度可能不相等。周期性:某种因素由于外部影响随着自然季节的交替出现高峰与低谷的规 律。随机性:个别为随机变动,整体呈现统计规律。综合性:实际变化情况是几种变动的叠加或组合。预测时设法过滤除去不规 则变动,突出反映趋势性和周期性变动。4 .时间序列的主要模型:乜=0。+ 6X.i +。2a-2 + + 0 一 十 J(1)自回归AR(p)模型/,一E, ) = 0,) = b) K( ) = 0, s 工,E
30、x、% = 0, Vs pK.p +,-夕_|仇产1小工0,八E(%) = 0, Var(t) =(jE(户$) = 0,s w fExs, = 0, V.v tARMAj),q)简记为8=/+ Mi + 4)pxt_p +,-仇明0qt_qARMA(p ,q)模型的传递形式与逆转形式(以ARMA(1 ,1)为例说明):(1) ARMA (1, 1)模型x4xt=%-。凤的传递形式:(1 一必B) xt =(1-,B) %=77=(1-8)(1 +血B + 0JB2+)X =l+( _Q)B+(4: -q)B + (. -OjOJB,+ +(: -0: jjb + 彳ARMA (1, 1)模型
31、x必Xp =g,力的逆转形式:(1-.B) x( =(1 一B) %G=xl(1 RB) (1 +,B + 6Jb2+)x(、=1 + (9, -l)B+(9I2-/9ll)B2+(913-1Vi)B34-+(9lk-9lk_|l)Bk+-xt 前两种模型分别是自回归移动平均模型的特例。一个ARMA过程可能是AR与 MA过程、几个AR过程、AR与ARMA过程的迭加,也可能是测度误差较大的AR过 程。(4)自回归综合移动平均ARIMA(p ,d ,q)模型(8)为=。(8)弓 (,) = 0, Var(/) = (T:,七() = 0, s 工 f Exsct = 0, Xfs t特别地,当d=
32、l, p=q=O时,ARIMA(p, d, q)=random walk model (随机游走模型)模型产生典故典arl Pearson(1905)在自然杂志上提问:假如有个醉汉 醉得非常严重,完全丧失方向感,把他放在荒郊野外,一段时间之后再去找他, 在什么地方找到他的概率最大呢?考虑到他完全尚失方向感,那么他第t步的位 置将是他tT步的位置再加一个完全随机的位移。用数学模型来描述任意时刻这 个醉汉可能的位置,即为一个随即游走模型。作为一个最简单的ARIMA模型,随机游走模型目前广泛应用于计量经济学领 域。传统的经济学家普遍认为投机价格的走势类似于随机游走模型,随机游走也 是有效市场理论的核
33、心。模型形式类似ARMA (p ,q)模型,但数据必须经过特殊处理“特别是当线性 时间序列非平稳时,就不能直接利用ARMA(p ,q)模型,但可以利用有限阶差分使 非平稳时间序列平稳化,实际应用中d 一般不超过2 o若时间序列存在周期性波 动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅 有暂时影响的时间序列。即差分处理后新序列符合ARMA(p,q)模型,原序列符合 ARIMA(p ,d ,q)模型。(5)小结:以上四个模型是时间序列中常见的模型,也是我们学习的重点,除此之外还 有自回归条件异方差(ARCH)模型,广义自回归条件异方差(GARCH)模型,指 数广义自回归条
34、件异方差(EGARCH)模型,方差无穷广义自回归条件异方差 (I EG ARCH)模型,依均值广义自回归条件异方差(EGARCH-M)模型等。5 .时间序列建模:(1)时间序列建模基本步骤:观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。 根据动态数据作相关图,进行相关分析,计算自相关系数,偏自相 关系数,求自相关函数。选择合适的随机模型,进行曲线拟合,即用 常用的随机模型去拟合时间序列的观测数据。对于数据较少的或简单 的时间序列,可用趋势模型和季节模型加上误差来进行拟合。对于平 稳时间序列,可用通用ARMA模型(自回归移动平均模型)及其特殊情 况的自回归模型、移动平均模型或组合A
35、RMA模型等来进行拟合。当 观测值多于50个时一般都采用ARMA模型。(2)主要模型的建模流程:ARMA模型的建模流程:序列预测模型优化ARIMA模型的建模流程:其中,ARMA模型定阶的基本原则如下表所示:A 0人 如选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA (p, q)(三)探究学习成果学习的过程中,我们发现课本中Holt两参数指数平滑的一个例题整个的计算 过程都是错误的,本着严谨认真的态度,通过探讨发现,课本中计算结果出现错 误的原因主要是公式运用的错误,经过大家亲自动手,最终得到了一个公认的正 确结果如下:年份报纸发行量(万份/ 年)Holt两参数指数平滑值(
36、a=0.15, r=0.1)随机序列512594324. 36363619785125954934. 709094259. 49818219796356559849. 826184325. 06007319807509565812. 903324488. 86177919817837171512. 150334609. 90030219827898476551.343044652. 82954319838649981998. 396694732.25195419849862888515. 251354910.71222519859994194403.219045008.437771198610
37、3630100044. 40835071.7129191987109547105780. 7535138.1761011988113375111287. 33985175.017164198982999111442.85344673. 06681199087489111821.88224243. 663007(四)时间序列分析的应用199194339112806. 56343917. 7648291992114824116439. 2793889. 2599061993127791121447. 90814001. 1968231994114373123787. 68923835. 05524
38、91995112577125365. 88273609. 3690831996136308130075. 16413719. 3603061997130754133338. 44573673. 7524411998140870137590. 86843731.6194681999148039142329. 96473832. 367152000146395146197. 23213835. 857172统计学的一个重要任务就是从不定的数据中找出事物的内在本质和运动规 律,并最终进行预测和控制。由于现实中各种因素错综复杂,运用多元回归等静态 因果结构型模型进行分析预测,往往比较困难,而根据事物自
39、身变动情况建立动 态模型一一时间序列分析,则是一种行之有效的方法。近些年来,时间序列分析己 广泛应用于心理学、数据挖掘、数字化误差等各个方面。1 .时间序列分析方法在心理学中的应用20世纪末时间序列分析的方法开始引入到心理学领域,目前应用最多的主 要集中在心理治疗领域、心理动力学的研究、管理心理学的研究、社会心理和家 庭心理的研究等研究领域。时间序列分析方法应用在心里学中的重要价值在于它 不仅能比较个体间心理量发生发展的趋势,确定动态变化变量间的因果关系,而 且可以实现对人类心理和行为的预测和控制。它既是一种研究思想也是一种新的 数据分析方法,比较贴近人类心理的真实情境,有利于心理学工作者对心
40、理学问 题开展更加深入的研究。常用的模式从单变量的时间序列分析,到两变量的时间 序列分析,再到更复杂的多变量的时间序列分析。对时间序列分析的应用也从定 性的现象描述到定量的建立模型,从分析简单的问题到复杂的问题。因此,我们可 以预见时间序列分析方法在心理学中的研究领域将越来越广,影响将越来越大, 心理学也将逐渐与科学发展的总体趋势保持一致,尤其是在借鉴了新的研究方法 后,将使我们的研究越来越接近真实的人的心理。2 .时间序列分析方法在数据挖掘中的应用各种类型的数据都可以作为数据挖掘的对象,时间序列在数据集中十分普 遍,对时间序列进行数据挖掘已成为当前研究的焦点之一。近年来,时间序列分析 方法在数据挖掘中的应用也取得了一定的进展。对大型数据库的海量数据分析提 出了进行时间序列模式挖掘的算法,为人们的决策支持和趋势预测提供了依据。 解决时变参数系统的自适应预测问题,目前最理想、最有效、最适合的工具就是 现代时间序列分析方法。3 .时间序列分析在数字化误差处理中的应用通常数字化数据的获取是按某种时间顺序或空间顺序来实现的,而这些数据 的采集不是完全随机的,而是始终围绕着某目标线段进行的,因此得到的数据误 差序列具有序列相关的性质,可以采用时间序列分析方法来处理。由于AR(p)模 型的参数可以调整,具有简单的解析表达形式,应用灵活,因此也适用于对各种图 形的误差模