《青岛港货运吞吐量的时间序列模型-精品文档资料整理.pdf》由会员分享,可在线阅读,更多相关《青岛港货运吞吐量的时间序列模型-精品文档资料整理.pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 文章编号:1002 - 1566(2004)04 - 0028 - 05青岛港货运吞吐量的时间序列模型周 惠(中国农业大学理学院,北京 100083)摘要:运用时间序列分析方法对时间序列建立ARMA , ARIMA模型.搜集了青岛港1999年1月2003年5月的货运吞吐量数据,对进行分析,建立了青岛港货运吞吐量的模型.通过预留的部分数据对模型进行检验,并对模型的残差进行检验,得出模型比较合理.关键词:吞吐量;时间序列;ARMA模型;ARIMA模型中图分类号:O212文献标识码:ATime Series Model of H arbor H andling CapacityZHOU Hui(c
2、ollege of science , China Agriculture University , Beijing 100083 , China)Abstract :The paper applies time series analysis method to set up ARMA model and ARIMA model. We collect and analysis thedata of qingdao port of volume of throughput fromJanuary 1999 to May 2003 , set up a model. We also test
3、the model and thinkthat the model is appropriate.Key word :Harbor handling capacity; Time series; ARMA model ; ARIMA model影响港口货运量的因素很多,有些因素是定性的,有些因素是可以量化的,时间序列模型,是根据变量过去的变化规律来预测其未来的变化。本文以青岛港1999 - 2003年的货运吞吐量的月数据为时间序列,借助于eview软件计算,建立并确定合适的时序模型。在进行吞吐量预测时,最常用的定量预测方法有时间序列测试法、 回归分析预测法和弹性系数法等。本文主要介绍时间预测法
4、。一、 时间序列模型1、1 随机时间序列分析的基本思想是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构来对时间序列进行预测。本文讨论的时间序列预测法指的是随机型中的BJ时间序列模型方法。1、2BJ时间序列模型方法:平稳时间序列和非平稳时间序列平稳时间序列模型定义 如果随机序列Xt ,t = 0 ,1 ,满足Xt-?1Xt-1-?pXt- p=t-1t-1-qt- q,(1) 或算子形式 ?( B) Xt=( B)t,其中t, t= 0,1为平稳白噪声序列,Et= 0 ,E2t=2,?p( B)与Q( B)无公因子,且满足系数多项式 ?p( B)= 0以及Q( B)= 0的根全
5、在单位圆外,则称 Xt服从平稳可逆(p ,q)阶自回归滑动平均模型,记作ARMA(p ,q) ,也称 Xt为平稳可逆的ARMA(p ,q)序列。收稿日期:2003 - 03 - 0682中文核心期刊 数理统计与管理 23卷 4期 2003年7月 ARMA(p ,q)模型中,当q = 0时,称为平稳可逆p阶自回归模型,记作AR(p) ;当p = 0时,AR(p)称为平稳可逆q阶滑动平均模型,记作MA(q)。ARMA(p ,q)是AR(p) ,MA(q)的混合模型。非平稳时间序列模型定义设Xt, t= 0,1是一随机序列,如果dN ,使得dXt= Wt( =1-B为差分算子)(2)是平稳可逆ARM
6、A(p ,q)序列,则称 Xt为自回归求和滑动平均序列,记作ARIMS(p ,d ,q)。也称 Xt服从ARIMA(p ,d ,q)模型,称(2)式为求和模型,d为求和阶数。二、 时间序列模型建立的步骤以下是青岛港1999年1月 2003年5月的货运吞吐量月数据,是一个时间序列,对其建立BJ时序模型的整个过程由数据预处理、 模型识别、 参数估计和模型检验四个阶段组成。具体步骤是:表1 青岛港1999年1月2003年5月的货运吞吐量1999:01610.0000566.0000603.0000609.0000615.0000632.00001999:07606.0000637.0000616.0
7、000631.0000604.0000573.00002000:01725.0000655.0000727.0000714.0000695.0000748.00002000:07733.0000761.0000770.0000753.0000712.0000727.00002001:01863.0000811.0000871.0000885.0000901.0000943.00002001:07857.0000911.0000857.0000867.0000849.0000785.00002002:011032.000970.0000986.00001015.0001054.0001014.0
8、002002:071005.0001058.0001006.0001093.0001034.000933.00002003:011154.0001041.0001190.0001163.0001138.000(一)数据的预处理图1时序方法是以平稳随机时间序列为前提的。因此,在得到一组样本数据后,应首先检验该数据的零均值性及平稳性。1、 零均值化。如果样本均值?X=1nnt= 1xt不为零,则应以Xt-?X代替原来的Xt平稳性判断和处理。2、 判断随机时间序列的平稳性。(1)直观上可以利用散点图进行判断序列的平稳性。即将所得的样本序列数据绘成散点图,如果各观察点在样本均值水平直线 ?X上下波动,
9、则可认为是平稳序列。(2)利用样本自相关分析图进行判断。如果序列的自相关系数很快地(之后阶数k大于2或3时)趋于0 ,即落入随机区间,时序是平稳的,反之是非平稳的。下图为根据青岛港的货运吞吐量所作出的自相关分析图,可见,此序列是非平稳的。92青岛港货运吞吐量的时间序列模型非平稳序列的平稳化处理一般是利用差分和季节差分来消除趋势波动和季节波动的影响,以达到平稳化的要求。可以从图1自相关系数图中看出,序列是非平稳的。因此对序列做一阶趋势差分。图2 图3从图2、 图3我们看到,对原序列做了一阶趋势差分,趋势基本消除,但当K= 12时,样本自相关系数和偏相关系数显著不为0 ,表明季节性存在。因此再对序
10、列做季节差分,得到图4和图5。图4 图5可见样本的自相关与偏相关系数很快落入随机区间,因此序列的趋势已基本消除,表明可以建立模型。(二)模型识别经过一阶逐期差分,序列的趋势消除,故d = 1 ;经过一阶季节差分,季节性基本消除,故D =03中文核心期刊 数理统计与管理 23卷 4期 2003年7月 1。所以选用ARIMA(p , d , q) ( P, D , Q)s模型。记货物吞吐量序列为qd ,做完一阶季节和一阶趋势成分后的序列为sdqd。观察sdqd的偏自相关图(图5)p = 4较为合适;自相关图(图4) q = 1或q = 4 ,由于k = 12时,样本自相关和偏自相关函数系数都显著不
11、为0 ,所以,p =D = 1。(三)模型建立用eviews软件建立ARIMA(4 ,1 ,1) (1 ,1 ,1)12模型,结果如表2所示。表2VariableCoefficientStd. Errort - StatisticProb.AR(1)- 1.0097090.207952- 4.8555020.0001AR(2)- 1.0233190.267119- 3.8309570.0013AR(3)- 0.6428390.253637- 2.5344860.0214AR(4)- 0.6604680.198842- 3.3215720.0040SAR(12)- 0.7606420.19120
12、4- 3.9781590.0010MA(1)0.0550980.1157130.4761620.6400SMA(12)0.8857520.0001844810.0880.0000R - squared0.885294Mean dependent var- 5.083333Adjusted R - squared0.844810S.D. dependent var59.57525S1E1of regression23.46919Akaike info criterion9.387747Sum squared resid9363.651Schwarz criterion9.731346Log li
13、kelihood- 105.6530Durbin - Watson stat2.202584lnverted AR roots.94 + .25i.94 - .25i.69 - .69i.69 - .69i.25 + .94i.25 - .94i.21 + .82i.21 - .82i.25 - .94i- .25 + .94i- .69 + .69i- .69 + .69i.72 - .63i- .72 + .63i- .94 - .25i- .94 + .25ilnverted MA Roots.96 + .26i.96 - .26i.70 - .70i.70 + .70i.26 - .9
14、6i.26 + .96i- .06- .26 + .96i- .26 - .96i.7.0 - .70i- .7.0 - .70i- .96 - .26i- .96 + .26i图6(四)模型检验参数估计后,应对建立的模型的合适性进行检验,即对模型的残差序列进行白噪声检验。若残差序列不是白噪声序列,意味着残差序列还存在有用信息没被提取,需进一步改进模型。通常侧重与残差序列的随机性,即滞后期k1时,残差序列的样本自相关系数应近似为0。判断残差序列是否纯随机,可采用较直观的方法即,看残差的自相关分析图,图6。可看出残差序列基本落入随机区间,可认为残差序列是白噪声序列。此外,我们从53个数字中预留出
15、5个数据用来检验模型,作出下列拟合图,如图6(红色表示预测值)并做出拟合模型的残差图,其基本都在范围之内,表示模型拟合较好。用同样的操作计算发现ARIMA(4 ,1 ,1) (1 ,1 ,1)12模型拟合程度没有前一个模型好。13青岛港货运吞吐量的时间序列模型 QD QDFA4M1图7 预测值与实际观测值对比图(五)模型选择与评价经计算,这两个都满足AR2MA过程的平稳条件及可逆条件,模型设定合理。另外,模型残差图显示ARIMA(4 ,1 ,1) (1 ,1 ,1)12的模型较好,并且调整后的样本决定系数(Adjusted R2)比另一个模型大,AIC系数和SC系数比其小,所以选用第一个模型。
16、其展开式为( qdt+ 1.0097qdt- 1+ 1.0233qdt- 2+.6428qdt- 3+.6604qdt- 4) (1 +.7606qdt- 12) (1 -qdt- 1)(1 -qdt- 12)=(1 -1055qdt- 1) (1 -.8858qdt- 12) ut三、 结束语根据上面的分析,证明了我们建立的模型的正确性,它说明的青岛港的货运吞吐量是ARI2MA(4 ,1 ,1) (1 ,1 ,1)12模型,此模型为作好港口规划工作提供了一些参考建议。参考文献1 易丹辉.数据分析与Eviews应用M.北京:中国统计出版社,2002.2 王振龙,时间序列分析M.北京:中国统计出版社,2000.3 中国统计年鉴M.北京:中国统计出版社,2003.4 汪荣鑫.随机过程M.西安:西安交通大学出版社,1987.(上接第19页)参考文献1 李子奈,鲁传一,管理创新在经济增长中贡献的定量分析,数量经济学前沿,社会科学文献出版社.2 赵焕臣,层次分析法,科学出版社.3 柯林,克里普逊,管理创新 萨奇出版社.(上接第15页)参考文献1 茆诗松 王静龙.数理统计M.上海:华东师范大学出版社,1990.2 姜启源.数学模型M.北京:高等教育出版社,1993.23中文核心期刊 数理统计与管理 23卷 4期 2003年7月