《SPSS随机时间序列分析技巧教材oak.pptx》由会员分享,可在线阅读,更多相关《SPSS随机时间序列分析技巧教材oak.pptx(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSS随机时间序列分析技巧Random Time Series Analytical Skills For SPSS一、时间序列分析概述时间序列是按时间顺序排列的、随时间变化且相时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序列的方法构成数据互关联的数据序列。分析时间序列的方法构成数据分析的一个重要领域,即时间序列分析分析的一个重要领域,即时间序列分析.时间序列根据所研究的依据不同,可有不同的分类时间序列根据所研究的依据不同,可有不同的分类1按研究对象多少分按研究对象多少分:一元时间序列和多元时间序列一元时间序列和多元时间序列;2按时间连续性分按时间连续性分:离散时间序
2、列和连续时间序列离散时间序列和连续时间序列;3按序列的统计特性分按序列的统计特性分:平稳时间序列和非平稳时间序列平稳时间序列和非平稳时间序列;4按时间序列分布规律分按时间序列分布规律分:高斯型和非高斯型时间序列高斯型和非高斯型时间序列.国内生产总值等时间序列年 份国内生产总值(亿元)年末总人口(万人)人口自然增长率()居民消费水平(元)19901991199219931994199519961997199818547.921617.826638.134634.446759.458478.167884.674772.479552.811433311582311717111851711985012
3、1121122389123626124810 14.3912.9811.6011.4511.2110.5510.4210.069.538038961070133117812311272629443094时间序列时间序列时间序列分析发展的两个阶段主要内容:主要内容:平稳时间序列分析平稳时间序列分析Box-Jenkins(1976)非平稳时间序列分析非平稳时间序列分析Engle-Granger(1987)时间序列模型不同于经济计量模型的两个特点是:时间序列模型不同于经济计量模型的两个特点是:-这这种种建建模模方方法法不不以以经经济济理理论论为为依依据据,而而是是依依据据变变量量自自身身的变化规律,
4、利用外推机制描述时间序列的变化。的变化规律,利用外推机制描述时间序列的变化。-明明确确考考虑虑时时间间序序列列的的平平稳稳性性。如如果果时时间间序序列列非非平平稳稳,建建立立模模型型之之前前应应先先通通过过差差分分或或者者协协整整把把它它变变换换成成平平稳稳的的时时间序列,再考虑建模问题。间序列,再考虑建模问题。2如果一个时间序列的概率分布与时间如果一个时间序列的概率分布与时间 t 无关,则称该序列为无关,则称该序列为严格的(狭义严格的(狭义的)平稳时间序列。的)平稳时间序列。如果序列的一、二阶矩存在,且对任意时刻如果序列的一、二阶矩存在,且对任意时刻 t 满足:满足:(1)均值为常数)均值为
5、常数(2)方差为常数)方差为常数(3)协方差为时间间隔)协方差为时间间隔k的函数的函数则称该序列为宽平稳时间序列,也叫广义平稳时间序列。以则称该序列为宽平稳时间序列,也叫广义平稳时间序列。以后所研究的时间序列主要是宽平稳时间序列后所研究的时间序列主要是宽平稳时间序列.平稳时间序列平稳时间序列平稳过程例1i.i.d序列一一个个最最简简单单的的随随机机时时间间序序列列是是独独立立同同分分布布标标准准正正态分布序列:态分布序列:平稳过程例2自回归过程AR(1)31 确确定性时间序列分析方法概述定性时间序列分析方法概述时间序列预测技术就是通过对预测目标自身时间序列的时间序列预测技术就是通过对预测目标自
6、身时间序列的处理,来研究其变化趋势的。一个时间序列往往是以下几类处理,来研究其变化趋势的。一个时间序列往往是以下几类变化形式的叠加或耦合。变化形式的叠加或耦合。(1)长期趋势变动长期趋势变动。是指时间序列朝着一定的方向持续上。是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。的主要变化趋势。(2)季节变动季节变动。(3)循环变动循环变动。通常是指周期为一年以上,由非季节因素。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似的波动。引起的涨落起伏波形相似的波动。(4)不规则变动不规则变
7、动。通常它分为突然变动和随机变动。通常它分为突然变动和随机变动。时间序列数据的分解趋势随机循环或者季节性Xttime通常用通常用 Tt 表示长期趋势项,表示长期趋势项,St 表示季节变动趋势项,表示季节变动趋势项,Ct表示循环变动趋势项,表示循环变动趋势项,Rt 表示随机干扰项。常见的确定性表示随机干扰项。常见的确定性时时间序列模型有以下几种类型间序列模型有以下几种类型:加法模型加法模型乘法模型乘法模型混合模型混合模型yt =Tt +St +Ct +Rtyt =Tt St Ct Rtyt =Tt St+Rt ,yt =St+Tt Ct Rtt其中其中 yt 是观测目标的观测记录,是观测目标的观
8、测记录,E(R t)=0,E(R 2)=2如果在预测时间范围以内,无突然变动且随机变动的方差如果在预测时间范围以内,无突然变动且随机变动的方差2较小,并且有理由认为过去和现在的演变趋势将继续发展较小,并且有理由认为过去和现在的演变趋势将继续发展到到未来时,可用一些经验方法进行预测,具体方法如下未来时,可用一些经验方法进行预测,具体方法如下:45设观测序列为设观测序列为y1,yT,取移动平均的项数,取移动平均的项数 NT一次移动平均值计算公式一次移动平均值计算公式1.移动平均法移动平均法6 当预测目标的基本趋势是在某一水平上下波动时,可用当预测目标的基本趋势是在某一水平上下波动时,可用一次移动平
9、均方法建立预测模型一次移动平均方法建立预测模型:二次移动平均二次移动平均其预测标准误差为其预测标准误差为7最近最近N期序期序列值的平均值作为未来各期的预测结果列值的平均值作为未来各期的预测结果。一般。一般N取值范围:取值范围:5N200。当历史序列的基本趋势变化不大。当历史序列的基本趋势变化不大且且序列中随机变动成分较多时,序列中随机变动成分较多时,N的取值应较大一些。否则的取值应较大一些。否则N的的取值应小一些。在有确定的季节变动周期的资料中,移动平均取值应小一些。在有确定的季节变动周期的资料中,移动平均的项数应取周期长度。选的项数应取周期长度。选择最佳择最佳N值的一个有效方法是,比较值的一
10、个有效方法是,比较若干模型的预测误差。若干模型的预测误差。均方均方预测误差最小者为好预测误差最小者为好.当预测目标的基本趋势与某一线性模型相吻合时,常用二当预测目标的基本趋势与某一线性模型相吻合时,常用二次移动平均法,但序列同时存在线性趋势与周期波动时,可用次移动平均法,但序列同时存在线性趋势与周期波动时,可用趋势移动平均法建立预测模型:趋势移动平均法建立预测模型:y T+m =a T +b T m,m=1,2,其中)(1)T(2)T(1)T(2)T(Ma T =2M M,bT =M2N 1月份月份 t123456销售收入销售收入yt533.8574.6606.9649.8705.1772.0
11、月份月份 t789101112销售收入销售收入yt816.4892.7963.91015.1 1102.7例例1 某企业某企业1月月11月份的销售收入时间序列如下表所示。月份的销售收入时间序列如下表所示。取取N=4,试用简单一次滑动平均法预测第,试用简单一次滑动平均法预测第12月份的销售月份的销售收入,并计算预测的标准误差收入,并计算预测的标准误差.Matlab程序y=533.8 574.6 606.9 649.8 705.1 772.0 816.4892.7 963.9 1015.1 1102.7;temp=cumsum(y);%求累积和mt=(temp(4:11)-0 temp(1:7)/
12、4;y12=mt(end)ythat=mt(1:end-1);fangcha=mean(y(5:11)-ythat).2);sigma=sqrt(fangcha)结果结果temp=1.0e+003*0.5338 1.1084 1.7153 2.3651 3.0702 3.84224.6586 5.5513 6.5152 7.53038.6330mt=591.2750 634.1000 683.4500 735.8250 796.5500861.2500 922.0250 993.6000y12=993.6000ythat=591.2750 634.1000 683.4500 735.8250
13、796.5500861.2500 922.0250fangcha=2.2654e+004sigma=150.512110112.指数平滑法指数平滑法一次移动平均实际上认为最近一次移动平均实际上认为最近N期数据对未来值影响相期数据对未来值影响相同同,都加权,都加权1/N;而;而N期以前的数据对未来值没有影响,加权期以前的数据对未来值没有影响,加权为为0。但二次及更高次移动平均数的权数却不是。但二次及更高次移动平均数的权数却不是1/N,且次数,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小,中间项项权数小,中间项权数大,不符合
14、一般系统的动态性权数大,不符合一般系统的动态性。一般一般说来历史数据对未来值的影响是随时间间隔的增长而递减说来历史数据对未来值的影响是随时间间隔的增长而递减的的。所以更切合实际的方法应是对各期观测值依时间顺序进。所以更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。指数平滑法可满足这一要求,而且行加权平均作为预测值。指数平滑法可满足这一要求,而且具有简单的递推形式具有简单的递推形式.指数平滑的基本公式指数平滑的基本公式 ,(1),(1)2,设观测序列为设观测序列为y1,yT,为加权系数,为加权系数,01,一次指数,一次指数平滑公式为平滑公式为:假定历史序列无限长,则有假定历史序
15、列无限长,则有由于加权系数序列呈指数函数衰减,加权平均又能消除或由于加权系数序列呈指数函数衰减,加权平均又能消除或减弱随机干扰的影响,所以称为一次指数平滑减弱随机干扰的影响,所以称为一次指数平滑.一次指数平滑预测:一次指数平滑预测:12表明表明St(1)是全部是全部历史数据的加权平均,加权系数分别为历史数据的加权平均,加权系数分别为一次指数平滑一次指数平滑13类似地有类似地有二次指数平滑公式二次指数平滑公式三次指数平滑公式三次指数平滑公式P 次指数平滑公式次指数平滑公式利用指数平滑公式可以建立指数平滑预测模型。原则上利用指数平滑公式可以建立指数平滑预测模型。原则上说,不管序列的基本趋势多么复杂
16、,总可以利用高次指数平说,不管序列的基本趋势多么复杂,总可以利用高次指数平滑公式建立一个逼近很好的模型,但计算量很大。因此用的滑公式建立一个逼近很好的模型,但计算量很大。因此用的较多的是几个低阶指数平滑预测模型。较多的是几个低阶指数平滑预测模型。1)一次指数平滑预测一次指数平滑预测2)二次指数平滑预测:二次指数平滑预测:(适用线性趋势数列适用线性趋势数列)Brown单系数线性平滑预测单系数线性平滑预测指数平滑预测指数平滑预测3)三次指数平滑预测三次指数平滑预测:(适用于:(适用于二次曲线趋势数列)二次曲线趋势数列)Brown单系数二次式平滑预测单系数二次式平滑预测由于指数平滑公式是递推计算公式
17、,必须确定初始值由于指数平滑公式是递推计算公式,必须确定初始值可以取前可以取前35个数据的算术平均值作为初始值。个数据的算术平均值作为初始值。.16指数平滑预测模型以时刻指数平滑预测模型以时刻 t 为起点,综合历史序列信息,对未来进行预测。为起点,综合历史序列信息,对未来进行预测。选择合适的加权系数选择合适的加权系数是提高预测精度的关键环节。是提高预测精度的关键环节。据经验,据经验,的取值范围一般以的取值范围一般以0.10.3为宜。为宜。值愈大,加权系数序列衰减速度愈快,所以值愈大,加权系数序列衰减速度愈快,所以取值大小起着控制参加平取值大小起着控制参加平均的历史数据个数的作用。均的历史数据个
18、数的作用。值愈大意味着采用的数据愈少。因此可得值愈大意味着采用的数据愈少。因此可得到选择到选择值的一些基本准则。值的一些基本准则。(1)如果序列的基本趋势比较稳,预测偏差由随机因素造成,则)如果序列的基本趋势比较稳,预测偏差由随机因素造成,则值应值应取小一些,以减少修正幅度,使预测模型能包含更多历史数据的信息。取小一些,以减少修正幅度,使预测模型能包含更多历史数据的信息。(2)如果预测目标的基本趋势已发生系统地变化,则)如果预测目标的基本趋势已发生系统地变化,则值应取得大一些。值应取得大一些。这样,可以偏重新数据的信息对原模型进行大幅度修正,以使预测模型这样,可以偏重新数据的信息对原模型进行大
19、幅度修正,以使预测模型适应预测目标的新变化适应预测目标的新变化.时间时间 t1 2 3 4 5 6 7 8价格价格 yt16.41 17.62 16.15 15.54 17.24 16.83 18.14 17.05例例2 下表数据是某股票在下表数据是某股票在8个连续交易日的收盘价,试个连续交易日的收盘价,试用一次指数平滑法预测第用一次指数平滑法预测第9个交易日的收盘价(初个交易日的收盘价(初始值始值S0(1)=y1,=0.4)19Matlab 程序alpha=0.4;y=16.41 17.62 16.15 15.54 17.24 16.83 18.14 17.05;s1(1)=y(1);for
20、 i=2:8s1(i)=alpha*y(i)+(1-alpha)*s1(i-1);endyhat9=s1(end)sigma=sqrt(mean(s1(1:end-1)-y(2:end).2)运行结果s1=16.4100yhat9=17.1828sigma=0.9613Matlab 程序clc,clearalpha=0.4;y=16.41 17.62 16.15 15.54 17.24 16.83 18.14 17.05;s1(1)=y(1);for i=2:8s1(i)=alpha*y(i)+(1-alpha)*s1(i-1);ends2=y(1);for i=2:8s2(i)=alpha*
21、s1(i)+(1-alpha)*s2(i-1);enda8=2*s1(8)-s2(8)b8=alpha/(1-alpha)*(s1(8)-s2(8)yhat9=a8+b8yhat(1)=y(1)for i=2:8yhat(i)=s1(i-1)+1/(1-alpha)*(s1(i-1)-s2(i-1);endtemp=sum(yhat-y).2);sigma=sqrt(temp/6)运行结果:a8=17.3801b8=0.1315yhat9=17.5116yhat=16.4100sigma=1.2054预测结果不如一次指数平滑法预测的预测结果。2146二、平二、平稳时间序列模型稳时间序列模型这里
22、的平稳是指宽平稳,其特性是序列的统计特性不随这里的平稳是指宽平稳,其特性是序列的统计特性不随时间平移而变化,即时间平移而变化,即均值和协方差不随时间的平移而变化均值和协方差不随时间的平移而变化。主要有下面几种模型:主要有下面几种模型:1.自回归模型(自回归模型(Auto Regressive Model),简称),简称AR模型模型 2.移动平均模型(移动平均模型(Moving Average Model),简称),简称MA模型模型 3.自回归移动平均模型(自回归移动平均模型(Auto RegressiveMoving Average Model)简称)简称ARMA模型模型 假设时间序列假设时间
23、序列 Xt 仅与仅与 Xt-1,Xt-2,Xt-n有线性关系,而在有线性关系,而在Xt-1,Xt-2,Xt-n已知条件下,已知条件下,Xt与与Xt-j(j=n+1,n+2,)无关,无关,t 是一个独立于是一个独立于Xt-1,Xt-2,Xt-n的白噪声序列,的白噪声序列,可见可见AR(n)系统的响应系统的响应 Xt 具有具有n阶动态性。阶动态性。AR(n)模型模型通过把通过把 Xt 中的依赖于中的依赖于Xt-1,Xt-2,Xt-n 的部分消除掉后,使的部分消除掉后,使得具有得具有 n 阶动态性的序列阶动态性的序列 Xt 转化为独立的序列转化为独立的序列 t。因此拟。因此拟合合AR(n)模型的过程
24、也就是使相关序列独立化的过程模型的过程也就是使相关序列独立化的过程.(1 1)一般自回归模型)一般自回归模型ARAR(n n)48如果一个系统在如果一个系统在 t 时刻的响应时刻的响应 Xt,与其以前,与其以前时刻时刻 t-1,t-2,的响应的响应 Xt-1,Xt-2,无关,而与其以无关,而与其以前时刻前时刻 t-1,t-2,t-m 进入系统的扰动进入系统的扰动 t-1,t-2,t-m 存在着一定的相关关系,那么这一类系统为存在着一定的相关关系,那么这一类系统为MA(m)系统系统.(2)移动平均模型)移动平均模型MA(m)如:如:MA(1)模型:)模型:Yt=0.1+t0.3 t1其中其中 t
25、是白噪声过程是白噪声过程49一个系统,如果它在时刻一个系统,如果它在时刻 t 的响应的响应 Xt,不仅与,不仅与其以前时刻的自身值有关,而且还与其以前时刻进其以前时刻的自身值有关,而且还与其以前时刻进入系统的扰动存在一定的依存关系,那么,这个系入系统的扰动存在一定的依存关系,那么,这个系统就是自回归移动平均系统统就是自回归移动平均系统.ARMA(n,m)模型模型:对于平稳系统来说,由于对于平稳系统来说,由于AR、MA、ARMA(n,m)模型都是模型都是ARMA(n,n-1)模型的特例,我们以模型的特例,我们以ARMA(n,n-1)模型为一般形式来建立时序模型模型为一般形式来建立时序模型.(3
26、3)自回归移动平均模型)自回归移动平均模型MA过程过程例下面是一个例下面是一个MA(2)模型模型,计算它的自相关函数,并画图计算它的自相关函数,并画图 t=t+0.2 t10.1 t2 1(1 2 1)/(1 12 22)(0.2+0.2*0.1)/(1+0.12+0.22)=0.2 2(2)/(1 12 22)0.1/(1+0.12+0.22)=0.095ARMA的模型设定与识别的模型设定与识别ACF图图(识别阶数识别阶数q)基本结论基本结论MA(q)过程的自相关函数q步截尾根据自相关函数与偏自相关函数定阶根据样本自相关函数和样本偏相关函数定阶一般要求样本长度大于一般要求样本长度大于50,才
27、能有一定的精确程度才能有一定的精确程度自相关函数和样本偏相关函数定阶的准则 MA(q)AR(p)ARMA(p,q)自相关函数自相关函数 q步截尾步截尾 拖尾拖尾 拖尾拖尾偏相关函数偏相关函数 拖尾拖尾 p步截尾步截尾 拖尾拖尾ARMA的模型设定与识别的模型设定与识别ARIMA(p,d,q)过程和模型过程和模型随机过程不平稳:从图形看不重复穿越一条水平随机过程不平稳:从图形看不重复穿越一条水平线,样本自相关函数收敛速度慢。线,样本自相关函数收敛速度慢。差分以后是一个差分以后是一个ARMA过程过程注意不要过度差分注意不要过度差分d表示差分的次数表示差分的次数ARMA的模型设定与识别的模型设定与识别
28、MA(1)Yt t 0.5 t1ARMA的模型设定与识别的模型设定与识别 MA(q)AR(p)ARMA(p,q)自相关函数自相关函数 q步截尾步截尾 拖尾拖尾 拖尾拖尾偏相关函数偏相关函数 拖尾拖尾 p步截尾步截尾 拖尾拖尾AR(1)Yt=0.6Yt-1+tARMA的模型设定与识别的模型设定与识别 MA(q)AR(p)ARMA(p,q)自相关函数自相关函数 q步截尾步截尾 拖尾拖尾 拖尾拖尾偏相关函数偏相关函数 拖尾拖尾 p步截尾步截尾 拖尾拖尾ARMA(1,1)Yt=-0.7Yt-1+t-0.7 t-1三、三、ARMA的模型设定与识别的模型设定与识别ARMA模型的其他识别方法采用采用ACF和
29、和PACF定阶定阶AIC或者或者BIC准则选择,越小越好准则选择,越小越好一般到特殊,最后显著法(一般到特殊,最后显著法(Last significant)Remark:在高频时间序列中(日内数据),条件均在高频时间序列中(日内数据),条件均值模型可能是值模型可能是MA(1)模型模型ARMA的模型设定与识别的模型设定与识别ARMA模型的其他识别方法模型的其他识别方法ACF和和PACF定阶定阶-对纯粹的对纯粹的AR模型或者模型或者MA模型可以定阶模型可以定阶-可以判别某个过程为可以判别某个过程为ARMA过程,但不能定阶过程,但不能定阶-由于估计误差的存在,很难判断拖尾和截尾,这种方法在实由于估计
30、误差的存在,很难判断拖尾和截尾,这种方法在实际应用中存在缺陷际应用中存在缺陷AIC或者或者BIC准则选择,越小越好准则选择,越小越好-特别适用于特别适用于ARMA模型,当然也适用于模型,当然也适用于AR模型或者模型或者MA模型模型一般到特殊,最后显著法(一般到特殊,最后显著法(Last significant)-选择一个高阶的选择一个高阶的AR模型,逐渐递减,直到最后一个变量显著,模型,逐渐递减,直到最后一个变量显著,这与这与AR模型模型PACF定阶异曲同工定阶异曲同工.ARMA的模型设定与识别的模型设定与识别ARMA模型的估计模型的估计AR模型采用模型采用OLS法估计法估计AR模型可采用自相
31、关函数的直接估计模型可采用自相关函数的直接估计MA模型采用最大似然法估计模型采用最大似然法估计ARMA模型采用最大似然法估计模型采用最大似然法估计四、ARMA的模型估计与检验建模步骤平稳化,采用差分的方法得到平稳的序列平稳化,采用差分的方法得到平稳的序列定阶,确定定阶,确定p,q的大小的大小估计,估计未知参数估计,估计未知参数检验,检验残差是否是白噪声过程检验,检验残差是否是白噪声过程预测,最后利用模型预测预测,最后利用模型预测ARMA模型的建模步骤模型的建模步骤三、非平稳时间序列模型三、非平三、非平稳时间序列模型稳时间序列模型本章结构差分运算差分运算ARIMA模型模型 方差齐性变化方差齐性变
32、化主要内容:主要内容:实际上我们经常会遇到一些非平稳时间序列,往往会呈现明实际上我们经常会遇到一些非平稳时间序列,往往会呈现明显的趋势性或周期性,可以通过适当差分等手段,将它化为显的趋势性或周期性,可以通过适当差分等手段,将它化为平稳时间序列,在采用用平稳时间序列,在采用用ARMA(n,m)模型建模。模型建模。1.差分运算差分运算差分方法是一种非常简便、有效的确定性信息提取方法差分方法是一种非常简便、有效的确定性信息提取方法Cramer分解定理在理论上保证了适当阶数的差分一定可分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息以充分提取确定性信息差分运算的实质是使用自回归的方式提取
33、确定性信息差分运算的实质是使用自回归的方式提取确定性信息 一阶差分:一阶差分:二阶差分:二阶差分:d阶差分阶差分:差分方式的选择序列蕴含着显著的序列蕴含着显著的线性趋势线性趋势,一阶差分就可以实现,一阶差分就可以实现趋势平稳趋势平稳 序列蕴含着序列蕴含着曲线趋势曲线趋势,通常低阶(二阶或三阶)差,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响分就可以提取出曲线趋势的影响 对于蕴含着固定周期的序列进行步长为对于蕴含着固定周期的序列进行步长为周期长度周期长度s s的差分运算(季节差分),的差分运算(季节差分),通常可以较好地提取周通常可以较好地提取周期信息期信息,如:如:季节差分:季节差分:
34、D阶季节差分:阶季节差分:例5.1 【例【例1.1】1964年年1999年中国纱年产量序列年中国纱年产量序列蕴含着一个近似线性的递增趋势。对该序列进行一蕴含着一个近似线性的递增趋势。对该序列进行一阶差分运算阶差分运算 考察差分运算对该序列线性趋势信息的提取作用考察差分运算对该序列线性趋势信息的提取作用 差分前后时序图原序列时序图原序列时序图差分后序列时序图差分后序列时序图例5.2尝试提取尝试提取1950年年1999年北京市民用车辆拥年北京市民用车辆拥有量序列有量序列的确定性信息的确定性信息差分后序列时序图一阶差分一阶差分二阶差分二阶差分例5.3差分运算提取差分运算提取1962年年1月月1975
35、年年12月平均每头奶牛月平均每头奶牛的月产奶量序列中的确定性信息的月产奶量序列中的确定性信息 差分后序列时序图一阶差分一阶差分1阶阶12步差分步差分过差分 足够多次的差分运算可以充分地提取原序列中的非足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息平稳确定性信息但过度的差分会造成有用信息的浪费但过度的差分会造成有用信息的浪费 2.ARIMA模型模型ARIMA模型结构模型结构ARIMA模型性质模型性质ARIMA模型建模模型建模ARIMA模型预测模型预测ARIMA模型结构使用场合使用场合n差分平稳序列拟合模型结构模型结构ARIMA 模型族d=0ARIMA(p,d,q)=ARMA(p,q)
36、P=0ARIMA(P,d,q)=IMA(d,q)q=0ARIMA(P,d,q)=ARI(p,d)预测值等价形式等价形式计算预测值计算预测值SPSS时间序列分析的特点时间序列分析的特点 SPSS的时间序列分析没有自成一体的单独模块,而是的时间序列分析没有自成一体的单独模块,而是分散在分散在Data、Transform、Analyze、Graph四个功能四个功能菜单当中。在菜单当中。在Data和和Transform中实现对时间序列数据中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在的定义和必要处理,以适应各种分析方法的要求;在Analyze的的Time Series中主要提供了四
37、种时间序列的分中主要提供了四种时间序列的分析方法,包括指数平滑法、自回归法、析方法,包括指数平滑法、自回归法、ARIMA模型和季节模型和季节调整方法;在调整方法;在Graph中提供了时间序列分析的图形工具,中提供了时间序列分析的图形工具,包括序列图(包括序列图(Sequence)、自相关函数和偏自相关函数)、自相关函数和偏自相关函数图等图等,SPSS16.0将时间序列的图形工具放在将时间序列的图形工具放在Analyze-time series中。另外,也可利用中。另外,也可利用SPSS的谱分析图等模块的谱分析图等模块进行简单的谱分析。进行简单的谱分析。四、时间序列的四、时间序列的SPSSSPS
38、S操作操作1.数据准备数据准备 SPSS的数据准备包括数据文件的建立、时间定义和的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般数据期间的指定。其中数据文件的建立与一般SPSS数据文数据文件的建立方法相同,每一个变量将对应一个时间序列数据,件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。点讨论时间定义的操作步骤。SPSS的时间定义功能用来将数据编辑窗口中的一个或的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,
39、并给它们赋予相应的时间标多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:志,具体操作步骤是:(1)选择菜单:)选择菜单:DateDefine Dates,出现窗口:,出现窗口:(2)Cases Are框提供了多种时间形式,可根据数据框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。的实际情况选择与其匹配的时间格式和参数。至此,完成了至此,完成了SPSS的时间定义操作。的时间定义操作。SPSS将在当前数据编辑窗口中自动生成标志时间的变量。将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明同时,在输出窗口中将输出
40、一个简要的日志,说明时间标志变量及其格式和包含的周期等。时间标志变量及其格式和包含的周期等。数据期间的选取可通过数据期间的选取可通过SPSS的样本选取的样本选取(Select Cases)功能实现。)功能实现。时间序列的图形化观察及检验时间序列的图形化观察及检验 时间序列的图形化及检验目的时间序列的图形化及检验目的 通过图形化观察和检验能够把握时间序列的诸通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的
41、变化规律;时间序列性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的中是否存在异常点,时间序列不同时间点上数据的关系等。关系等。时间序列的图形化观察工具时间序列的图形化观察工具 序列图(序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。及这些特征的交错混杂等。序
42、列图还可用于对序列异常值的探索,以及体现序列序列图还可用于对序列异常值的探索,以及体现序列的的“簇集性簇集性”,异常值是那些由于外界因素的干扰而导致的,异常值是那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。与序列的正常数值范围偏差巨大的数据点。“簇集性簇集性”是指是指数据在一段时间内具有相似的水平。在不同的水平间跳跃性数据在一段时间内具有相似的水平。在不同的水平间跳跃性变化,而非平缓性变化。变化,而非平缓性变化。直方图(直方图(Histogram)直方图是体现序列数据分布特征的一种图形,通过直方图可以了解直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳
43、性、正态性等特征。序列的平稳性、正态性等特征。自相关函数图和偏自相关函数图(自相关函数图和偏自相关函数图(ACFPACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。量函数。自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数图和偏自相关函数图将时间序列各
44、阶滞后的自相关和偏自相关函数值以及在一定置信水平下的置信区间直观的展现出来。自相关函数值以及在一定置信水平下的置信区间直观的展现出来。各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:和规律:1、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。有明显的变化规律。2、具有趋势性的非平稳时间序列,序列的各阶自相关函
45、数值显著不为、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。则呈明显的下降趋势,很快落入置信区间。3、异方差的非平稳时间序列,其各阶自相关函数显著不为零,、异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。正负交错的形式,且下降趋势明显。4、具有周期性的非平稳时间序列,其自相关函数呈明显
46、的周、具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。自相关函数值均显著不为零。5、非周期的波动性时间序列,自相关函数值会在一定的阶数、非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。区间内。互相关图互相关图 对两个互相对应的时间序列进行相关性分析的实用图形对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同
47、时间工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。序列间不同时期滞后序列的相关性。时间序列的检验方法时间序列的检验方法 参数检验法参数检验法 参数检验的基本思路是,将序列分成若干子序参数检验的基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差值大计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。于检验值,则认为序列具有非平稳性。时间序列
48、的时间序列的图形化图形化观察和检验的基本操作观察和检验的基本操作 1 绘制序列图的基本操作绘制序列图的基本操作(1)选择菜单)选择菜单GraphSequence。(2)将需绘图的序列变量选入)将需绘图的序列变量选入Variables框中。框中。(3)在)在Time Axis Labels框中指定横轴(时间轴)标志变量。该框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。标志变量默认的是日期型变量。(4)在)在Transform框中指定对变量进行怎样的变化处理。其中框中指定对变量进行怎样的变化处理。其中Natural log transform表示对数据取自然对数,表示对数据取自然对
49、数,Difference表示对数据进行表示对数据进行n阶(默认阶(默认1阶)差分,阶)差分,Seasonally difference表示对数据进行季节差分。表示对数据进行季节差分。(5)单击)单击Time Lines 按钮定义序列图中需要特别标注的时间点,给按钮定义序列图中需要特别标注的时间点,给出了无标注(出了无标注(No reference Lines)、在某变量变化时标注)、在某变量变化时标注(Line at each change of)、在某个日期标注()、在某个日期标注(Line at date)三项供选择。)三项供选择。(6)单击)单击Format 按钮定义图形的格式,可选择横
50、向或纵向序列图;对按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。用直线连接起来。l 2绘制自相关函数图和偏自相关函数图的基本操作绘制自相关函数图和偏自相关函数图的基本操作(1)选择菜单选择菜单GraphTimeSeriesAutocorrelations。(2)将需绘制的序列变量选入)将需绘制的序列变量选入Variables框。框。(