《SPSS的时间序列分析复习过程.ppt》由会员分享,可在线阅读,更多相关《SPSS的时间序列分析复习过程.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSS的时间序列分析11.1 时间序列分析概述11.1.1时间序列的相关概念时间序列的相关概念 通常研究时间序列问题时会涉及到以下记号和概念:通常研究时间序列问题时会涉及到以下记号和概念:1.指标集指标集T 指标集指标集T可理解为时间可理解为时间t的取值范围。的取值范围。2.采样间隔采样间隔t 采样间隔采样间隔t可理解为时间序列中相邻两个数的时间间隔。可理解为时间序列中相邻两个数的时间间隔。3.平稳随机过程和平稳时间序列平稳随机过程和平稳时间序列 时间序列的平稳性是指时间序列的统计规律不会随着时间的推移而时间序列的平稳性是指时间序列的统计规律不会随着时间的推移而发生变化。直观上,一个平稳的时
2、间序列可以看作是一条围绕其均值上发生变化。直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。平稳,一个是宽平稳或广义平稳。严平稳:如果对严平稳:如果对 t1,t2,tn,h T和任意整数和任意整数n,都使(,都使(yt1,yt2,ytn)与()与(yt1+h,yt2+h,ytn+h)同分布,则概率空间)同分布,则概率空间(W,F,P)上随机过程)上随机过程y(t),),t T称为平稳过程。具有时间称为平稳过程。具有时间上的平稳不变性。实践当
3、中是非常困难甚至是不可能的。上的平稳不变性。实践当中是非常困难甚至是不可能的。11.2 数据准备数据准备 SPSS的数据准备包括数据文件的建立、时间定义和的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般数据期间的指定。其中数据文件的建立与一般SPSS数据文数据文件的建立方法相同,每一个变量将对应一个时间序列数据,件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。点讨论时间定义的操作步骤。SPSS的时间定义功能用来将数据编辑窗口中的一
4、个或的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:志,具体操作步骤是:(1)选择菜单:)选择菜单:DateDefine Dates,出现窗口:,出现窗口:(2)Cases Are框提供了多种时间形式,可根据数据框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。的实际情况选择与其匹配的时间格式和参数。至此,完成了至此,完成了SPSS的时间定义操作。的时间定义操作。SPSS将在当前数据编辑窗口中自动生成标志时间的变量。将在当前数据编辑窗口中自动生成标志时间的
5、变量。同时,在输出窗口中将输出一个简要的日志,说明同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。时间标志变量及其格式和包含的周期等。数据期间的选取可通过数据期间的选取可通过SPSS的样本选取的样本选取(Select Cases)功能实现。)功能实现。11.3 时间序列的图形化观察及检验时间序列的图形化观察及检验 11.3.1时间序列的图形化及检验目的时间序列的图形化及检验目的 通过图形化观察和检验能够把握时间序列的诸通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下
6、波动;时间序列的变化的周期还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的中是否存在异常点,时间序列不同时间点上数据的关系等。关系等。11.3.2 时间序列的图形化观察工具时间序列的图形化观察工具 序列图(序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季
7、节性、以特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。及这些特征的交错混杂等。序列图还可用于对序列异常值的探索,以及体现序列序列图还可用于对序列异常值的探索,以及体现序列的的“簇集性簇集性”,异常值是那些由于外界因素的干扰而导致的,异常值是那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。与序列的正常数值范围偏差巨大的数据点。“簇集性簇集性”是指是指数据在一段时间内具有相似的水平。在不同的水平间跳跃性数据在一段时间内具有相似的水平。在不同的水平间跳跃性变化,而非平缓性变化。变化,而非平缓性变化。直方图(直方图(Histogram)直方图是体现序列
8、数据分布特征的一种图形,通过直方图可以了解直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。序列的平稳性、正态性等特征。自相关函数图和偏自相关函数图(自相关函数图和偏自相关函数图(ACFPACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函
9、数。量函数。自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数值以及在一定置信水平下的置信区间直观的展现出来。自相关函数值以及在一定置信水平下的置信区间直观的展现出来。各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:和规律:1、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没实际当中序列多少会有一些相关性,但一般
10、会落在置信区间内,同时没有明显的变化规律。有明显的变化规律。2、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。则呈明显的下降趋势,很快落入置信区间。3、异方差的非平稳时间序列,其各阶自相关函数显著不为零,、异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负
11、交错的形式,且下降趋势明显。正负交错的形式,且下降趋势明显。4、具有周期性的非平稳时间序列,其自相关函数呈明显的周、具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。自相关函数值均显著不为零。5、非周期的波动性时间序列,自相关函数值会在一定的阶数、非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。区间内。互相关图互相关图 对两个互相对应的时间序列进行相关性
12、分析的实用图形对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。序列间不同时期滞后序列的相关性。11.3.3 时间序列的检验方法时间序列的检验方法 参数检验法参数检验法 参数检验的基本思路是,将序列分成若干子序参数检验的基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差
13、值大计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。于检验值,则认为序列具有非平稳性。11.3.4 时间序列的时间序列的图形化图形化观察和检验的基本操作观察和检验的基本操作 11.3.4.1 绘制序列图的基本操作绘制序列图的基本操作(1)选择菜单)选择菜单GraphSequence。(2)将需绘图的序列变量选入)将需绘图的序列变量选入Variables框中。框中。(3)在)在Time Axis Labels框中指定横轴(时间轴)标志变量。该框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。标志变量默认的是日期型变量。(4)在)在Transform框中指
14、定对变量进行怎样的变化处理。其中框中指定对变量进行怎样的变化处理。其中Natural log transform表示对数据取自然对数,表示对数据取自然对数,Difference表示对数据进行表示对数据进行n阶(默认阶(默认1阶)差分,阶)差分,Seasonally difference表示对数据进行季节差分。表示对数据进行季节差分。(5)单击)单击Time Lines 按钮定义序列图中需要特别标注的时间点,给按钮定义序列图中需要特别标注的时间点,给出了无标注(出了无标注(No reference Lines)、在某变量变化时标注)、在某变量变化时标注(Line at each change o
15、f)、在某个日期标注()、在某个日期标注(Line at date)三项供选择。)三项供选择。(6)单击)单击Format 按钮定义图形的格式,可选择横向或纵向序列图;对按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。用直线连接起来。l11.3.4.2 绘制自相关函数图和偏自相关函数图的绘制自相关函数图和偏自相关函数图的基本操作基本操作
16、(1)选择菜单选择菜单GraphTimeSeriesAutocorrelations。(2)将需绘制的序列变量选入)将需绘制的序列变量选入Variables框。框。(3)在)在Display框选择框选择绘制绘制哪种图形,其中哪种图形,其中Autocorrelations表示绘制自相关函数图;表示绘制自相关函数图;Partial autocorrelations表示绘制表示绘制偏自相关函数图。一般可同时绘制两种图形。偏自相关函数图。一般可同时绘制两种图形。(4)单击)单击Options按钮定义相关参数,其中按钮定义相关参数,其中Maximum Number of Lags表示表示相关函数值包含的
17、最大滞后期,即时间间相关函数值包含的最大滞后期,即时间间隔隔h。一般情况下可选择两个最大周期以上的数据。在。一般情况下可选择两个最大周期以上的数据。在Standard Error Method框中指定计算相关系数标准差的方法,它将影响到框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间。其中相关函数图形中的置信区间。其中Independence model表示表示假设序列是白噪声的过程;假设序列是白噪声的过程;Bartletts approximation表示,表示,根据根据Bartlett给出的估计自相关系数和偏自相关系数方差的近似式计算给出的估计自相关系数和偏自相关系数方
18、差的近似式计算方差。该方法适合当序列是一个方差。该方法适合当序列是一个k-1阶的移动平均过程,且标准差随阶阶的移动平均过程,且标准差随阶数的增大而增大的情况。数的增大而增大的情况。(5)选中)选中Display autocorrelation at periodic lags表表示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中的周期因素可选中该项。否则该步可略去。的周期因素可选中该项。否则该步可略去。l11.3.4.3 绘制互相关图的基本操作绘制互相关图的基本操作(1)选择菜单)选择菜单GraphTime Series
19、Cross correlations。(2)把需绘图的序列变量选择到)把需绘图的序列变量选择到Variables框中。框中。绘制互相关图时要求两个序列均具有平稳性。绘制互相关图时要求两个序列均具有平稳性。11.3.5 时间序列图形化观察应用举例时间序列图形化观察应用举例1、利用模拟序列数据:、利用模拟序列数据:(1)以趋势序列绘制序列图;)以趋势序列绘制序列图;(2)以各种序列绘制自相关函数图和偏自相关函数)以各种序列绘制自相关函数图和偏自相关函数图。图。2、利用海关总出口额数据,绘制出口总额和外汇储、利用海关总出口额数据,绘制出口总额和外汇储备的一阶逐期差分后的序列互相关图。备的一阶逐期差分
20、后的序列互相关图。11.4 时间序列的预处理时间序列的预处理 11.4.1 时间序列预处理的目的和主要方法时间序列预处理的目的和主要方法 预处理的目的可大致归纳为两个方面:第一,预处理的目的可大致归纳为两个方面:第一,使序列的特征体现得更加明显,利于分析模型的选使序列的特征体现得更加明显,利于分析模型的选择;第二,使数据满足于某些特定模型的要求。择;第二,使数据满足于某些特定模型的要求。序列的预处理主要包括以下几个方面:序列的预处理主要包括以下几个方面:序列缺失数据的处理序列缺失数据的处理序列数据的变换处理序列数据的变换处理 主要包括序列的平稳化处理和序列的平滑处理主要包括序列的平稳化处理和序
21、列的平滑处理等。均值平稳化一般采用差分(等。均值平稳化一般采用差分(Difference)处)处理,方差平稳化一般用理,方差平稳化一般用Box-Cox变换处理。变换处理。差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。季节差分(间进行。季节差分(Seasonal difference)就是一个典型的代)就是一个典型的代表。对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处表。对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处理。时间序列的平滑处理目的是为了消除序列中随机波动性影响。理。时间序列的平滑处理
22、目的是为了消除序列中随机波动性影响。平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种组合等。些方法的各种组合等。中心移动平均法(中心移动平均法(Centered moving average)计算以当前为中心的时间跨度计算以当前为中心的时间跨度k范围内数据的移动平均数。范围内数据的移动平均数。向前移动平均法(向前移动平均法(Prior moving average)若指定时间跨度为若指定时间跨度为k,则用当前值前面,则用当前值前面k个数据(注意:不包括当前值)个数据(注意:不包括当前值)的平均值代替当前值。的平均值
23、代替当前值。移动中位数(移动中位数(Runing medians)它以当前时间点为中心,根据指定的时间跨度它以当前时间点为中心,根据指定的时间跨度k计算中位数。计算中位数。11.4.2 时间序列预处理的基本操作时间序列预处理的基本操作 11.4.2.1 序列缺失数据处理的基本操作序列缺失数据处理的基本操作 11.4.2.2 序列数据变换的基本操作序列数据变换的基本操作(1)选择菜单)选择菜单TransformCreate Time Series(2)把待处理的变量选择到)把待处理的变量选择到New Variable(s)框。框。(3)在)在Name and Function框中选择数据变换法。
24、在框中选择数据变换法。在Name后输入处理后新生成的变量名,在后输入处理后新生成的变量名,在Function中选择中选择处理方法,在处理方法,在Order后输入相应的阶数,并单击后输入相应的阶数,并单击Change按钮。其中的方法除前面介绍的几种外,还包括:按钮。其中的方法除前面介绍的几种外,还包括:Cumulative sum:累加求和,即对当前值和当前值之间的:累加求和,即对当前值和当前值之间的所有数据进行求和,生成原序列的累计值序列。所有数据进行求和,生成原序列的累计值序列。Lag:数据滞后,即对指定的阶数:数据滞后,即对指定的阶数k,用从当前值向前数到第,用从当前值向前数到第k个数值来
25、代替当前值。这样形成的新序列将损失前个数值来代替当前值。这样形成的新序列将损失前k个数个数据。据。Lead:数据前引。与数据滞后正好相反,即指定的阶数:数据前引。与数据滞后正好相反,即指定的阶数k,从当前值向后数以第从当前值向后数以第k个数值来代替当前值。这样形成的新个数值来代替当前值。这样形成的新序列将损失后序列将损失后k个数据。个数据。11.5 指数平滑法指数平滑法 11.5.1指数平滑法的基本操作指数平滑法的基本操作 由于指数平滑法要求数据中不能存在缺失值,因此在用由于指数平滑法要求数据中不能存在缺失值,因此在用SPSS进行指数平滑法分析前,应对数据序列进行缺失值填进行指数平滑法分析前,
26、应对数据序列进行缺失值填补。补。SPSS指数平滑法的基本操作步骤如下:指数平滑法的基本操作步骤如下:(1)选择菜单)选择菜单AnalyzeTime SeriesExponential Smoothing。(2)把待分析的变量选择到)把待分析的变量选择到Variables框中。框中。(3)从)从Model栏中选择合适的模型。包括简单指数平滑模型、霍特模型、栏中选择合适的模型。包括简单指数平滑模型、霍特模型、温特模型及用户自定义模型。温特模型及用户自定义模型。(4)单击)单击Parameters按钮进行模型参数设置,在按钮进行模型参数设置,在Initial Values框中选择初始值的方式,其中框
27、中选择初始值的方式,其中Automatic表示系统自动设表示系统自动设置,置,Custom表示用户手工设置。表示用户手工设置。在在General(Alpha)框中设置简单指数平滑模型的常数框中设置简单指数平滑模型的常数。可直接输。可直接输入入的值,也可设定初值和终值以及步长,这样的值,也可设定初值和终值以及步长,这样SPSS会通过格点法对会通过格点法对多个值逐个建模,得到最优模型;多个值逐个建模,得到最优模型;在在General(Alpha)和和Trend(Gamma)框中设置框中设置Holt双参数双参数模型当中的普通、趋势平滑常数模型当中的普通、趋势平滑常数,;在在General(Alpha
28、)、Trend(Gamma)、Seasonal(Delta)框中设置温特模型中的普通、趋势和季框中设置温特模型中的普通、趋势和季节平滑参数节平滑参数,;选择选择Display only 10 best models for grid search选项表示:在平滑常数的格点选择完成后仅显示最佳的选项表示:在平滑常数的格点选择完成后仅显示最佳的10个模型。不选择该选项,则每个格点处常数值对应的模型都个模型。不选择该选项,则每个格点处常数值对应的模型都会被输出。会被输出。11.5.2指数平滑法的应用举例指数平滑法的应用举例 利用利用1992年初年初2002年底共年底共11年彩电出口量(单位:年彩电出
29、口量(单位:“台台”)的月度数据,建立几种指数平滑模型,对彩电出口量的变化趋势进)的月度数据,建立几种指数平滑模型,对彩电出口量的变化趋势进行分析和预测。行分析和预测。首先绘制和观察彩电出口量的序列图首先绘制和观察彩电出口量的序列图模型一:简单指数平滑模型(适用于比较平稳的序列)模型一:简单指数平滑模型(适用于比较平稳的序列)首先建立简单指数平滑模型。对平滑参数的选择采用格点(首先建立简单指数平滑模型。对平滑参数的选择采用格点(Grid Search)方法,以找出相对最优模型;对于初始值选择自动选择)方法,以找出相对最优模型;对于初始值选择自动选择(Automatic)。)。模型二:霍特二次平
30、滑模型(适用于有线性趋势的序列)模型二:霍特二次平滑模型(适用于有线性趋势的序列)仍然用格点法选择参数,步长为仍然用格点法选择参数,步长为0.01。模型三:温特线性和季节性指数平滑模型(适用于同时具有趋势性和季节模型三:温特线性和季节性指数平滑模型(适用于同时具有趋势性和季节性的序列)性的序列)同样用格点法选择参数。同样用格点法选择参数。模型四:自定义三次指数平滑模型(适用于有非线性趋势的序列)模型四:自定义三次指数平滑模型(适用于有非线性趋势的序列)11.6 自回归法11.6.1 自回归法的基本思想自回归法的基本思想 利用简单回归分析法进行时间序列分析时,模型要求利用简单回归分析法进行时间序
31、列分析时,模型要求各期的随机误差项之间是不相关的。在前文的平稳随机过程各期的随机误差项之间是不相关的。在前文的平稳随机过程的定义中也介绍过,只有误差项中不存在任何可利用的信息的定义中也介绍过,只有误差项中不存在任何可利用的信息时,才能够认为模型已经达到了最优。而当误差项之间存在时,才能够认为模型已经达到了最优。而当误差项之间存在相关性时,一方面常用的估计方法不再具有优良性,普通的相关性时,一方面常用的估计方法不再具有优良性,普通的简单回归模型存在着较大的缺陷;另一方面也说明模型对序简单回归模型存在着较大的缺陷;另一方面也说明模型对序列中的信息没有充分地提取。列中的信息没有充分地提取。自回归模型
32、,简写为自回归模型,简写为AR模型,正是针对模型误差项存模型,正是针对模型误差项存在相关性的情况而设计的一种改进方法。由于自回归模型只在相关性的情况而设计的一种改进方法。由于自回归模型只考虑了误差项中的一阶相关性,因此也称为一阶自回归考虑了误差项中的一阶相关性,因此也称为一阶自回归AR(1)模型。)模型。AR(1)模型的一般形式为:)模型的一般形式为:其中,其中,模型的主体部分与一般的回归模型完全相同,但是其模型的主体部分与一般的回归模型完全相同,但是其残差序列不满足一般回归模型要求的残差项之间不存在相残差序列不满足一般回归模型要求的残差项之间不存在相关性的关性的Gauss-Markov假设,
33、而是存在着系数为假设,而是存在着系数为的一的一阶自相关。阶自相关。11.6.2 自回归法的基本操作自回归法的基本操作(1)选择菜单)选择菜单AnalyzeTime SeriesAutoregression。(2)把被解释变量选择到)把被解释变量选择到Dependent框中,选择解释框中,选择解释变量到变量到Independent(s)框中。框中。(3)在)在Method框中选择参数框中选择参数估计的方法,其中:估计的方法,其中:Exact maximum-likelihood为精确极大似然法、为精确极大似然法、它是一种建立在极大似然估计准则基础上的参数估计方法。它是一种建立在极大似然估计准则基
34、础上的参数估计方法。一般在大样本下(样本数大于一般在大样本下(样本数大于50)有比较优良的参数估计。)有比较优良的参数估计。Cochrane-Orcutt法是一种在误差序列具有一阶自法是一种在误差序列具有一阶自相关情况下较常用的参数估计方法,它不适用于序列存在缺相关情况下较常用的参数估计方法,它不适用于序列存在缺失值的情况。失值的情况。Prais-Winsten法是一种适用在一阶自相关情况下的法是一种适用在一阶自相关情况下的广义最小二乘法,也不适用于存在缺失值的情况。这种方法广义最小二乘法,也不适用于存在缺失值的情况。这种方法一般优于一般优于Cochrance-Orcutt方法。方法。(4)单
35、击)单击Option按钮对模型算法进行设置:按钮对模型算法进行设置:在在Initial value of autoregressive parameter框后输入自回归模型迭代初始值框后输入自回归模型迭代初始值。在在Convergence Criteria中指定迭代收敛条件:在中指定迭代收敛条件:在Maximum iterations后指定最大跌代次数;在后指定最大跌代次数;在Sum of squares change后指定误差平方和减少达到什么程度时后指定误差平方和减少达到什么程度时终止迭代。终止迭代。在在Display框中指定输出哪些分析结果框中指定输出哪些分析结果 请注意,请注意,SPS
36、S的自回归分析是针对误差项存在一阶自的自回归分析是针对误差项存在一阶自相关的情况设计的。当序列中存在更高阶的自相关时,就需相关的情况设计的。当序列中存在更高阶的自相关时,就需要使用要使用ARIMA模型。模型。11.6.3 自回归法的应用举例自回归法的应用举例 利用利用1992年初至年初至2002年底共年底共11年我国激光唱机出年我国激光唱机出口量月度数据,对激光唱机出口量进行分析预测。主要分析口量月度数据,对激光唱机出口量进行分析预测。主要分析过程如下:过程如下:首先绘制和观察序列图首先绘制和观察序列图 模型一:利用趋势外推法建立趋势模型模型一:利用趋势外推法建立趋势模型 由于序列的趋势并非直
37、线上升,而呈加速上升的态势。由于序列的趋势并非直线上升,而呈加速上升的态势。因此可首先利用二次曲线进行趋势拟合。以时间及其二次项因此可首先利用二次曲线进行趋势拟合。以时间及其二次项作为解释变量,并计算作为解释变量,并计算DW统计量和预测值以及残差序列。统计量和预测值以及残差序列。模型二:一阶自回归模型(极大似然法)模型二:一阶自回归模型(极大似然法)观察该模型的拟合效果是否较趋势外推模型有所改进。观察该模型的拟合效果是否较趋势外推模型有所改进。模型三:对数序列自回归模型模型三:对数序列自回归模型 观察图激光唱机出口量序列图发现,序列除了具有曲观察图激光唱机出口量序列图发现,序列除了具有曲线趋势
38、、明显的季节性特征之外,还有一个特征就是序列的线趋势、明显的季节性特征之外,还有一个特征就是序列的波动幅度随时间的推移越来越大。这种波动必然会影响到模波动幅度随时间的推移越来越大。这种波动必然会影响到模型的误差序列,进而使其出现方差不平稳性。从前面讲过的型的误差序列,进而使其出现方差不平稳性。从前面讲过的方差非平稳性的处理中我们知道,可通过对序列取对数的方方差非平稳性的处理中我们知道,可通过对序列取对数的方法来消除这种波动性逐渐增大的现象。法来消除这种波动性逐渐增大的现象。11.7 ARIMA模型分析11.7.1ARIMA分析的基本思想和模型分析的基本思想和模型 ARIMA是自回归移动平均结合
39、(是自回归移动平均结合(AutoRegressive Integrated Moving Average)模型的简写形式,用于)模型的简写形式,用于平稳序列或通过差分而平稳的序列分析。平稳序列或通过差分而平稳的序列分析。ARMA模型也称模型也称B-J方法,是一种时间序列预测方法。方法,是一种时间序列预测方法。从字面上可以知道,从字面上可以知道,ARMA模型是自回归模型(模型是自回归模型(AR)和移)和移动平均模型(动平均模型(MA)有效组合和搭配的结果,称为自回归移)有效组合和搭配的结果,称为自回归移动平均模型。动平均模型。ARMA其一般形式为:其一般形式为:yt1yt-12yt-2pyt-p
40、et+1et-1+2et-2+qet-q 其中,等式左边是模型的自回归部分,非负整数其中,等式左边是模型的自回归部分,非负整数p称为称为自回归阶数,自回归阶数,1,2,p称为自回归系数;等式称为自回归系数;等式右边是模型的移动平均部分,非负整数右边是模型的移动平均部分,非负整数q称为移动平均阶数,称为移动平均阶数,1,2,q称为移动平均系数。称为移动平均系数。p,q分别是偏自分别是偏自相关函数值和自相关函数值显著不为零的最高阶数。可以看相关函数值和自相关函数值显著不为零的最高阶数。可以看出,当出,当p0时,模型是纯移动平均模型,记为时,模型是纯移动平均模型,记为ARMA(0,q);当);当q0
41、时,模型是纯自回归模型,记为时,模型是纯自回归模型,记为ARMA(p,0)。)。ARMA(p,q)模型可用较少的参数对序列进行)模型可用较少的参数对序列进行较好地拟合,其自相关和偏自相关函数均呈现拖尾性。较好地拟合,其自相关和偏自相关函数均呈现拖尾性。ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列模型只适合于对平稳序列的分析。实际应用中的时间序列并非平稳序列,不能直接采用并非平稳序列,不能直接采用ARMA模型。但通常这些序列可通过变换模型。但通常这些序列可通过变换处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合
42、ARIMA模型。模型。ARIMA模型又分为模型又分为ARIMA(p,d,q)模型和)模型和ARIMA(p,d,q)()(P,D,Q)s模型。模型。ARIMA(p,d,q)模型)模型 当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。这样的序列被称为是一种准平稳的序列,而相应的分析模型被概括为这样的序列被称为是一种准平稳的序列,而相应的分析模型被概括为ARIMA(p,d,q),其中,),其中,d表示平稳化过程中差分的阶数。表示平稳化过程中差分的阶数。ARIMA(p,d,q)()(P,D,Q)s模型模型 当序列中同时存在趋势性和
43、季节性的周期和趋势时,序列中存在着当序列中同时存在趋势性和季节性的周期和趋势时,序列中存在着以季节周期的整数倍为长度的相关性,需要经过某些阶数的逐期差分和以季节周期的整数倍为长度的相关性,需要经过某些阶数的逐期差分和季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为ARIMA(p,d,q)()(P,D,Q)s模型,其中,模型,其中,P,Q为季节性的自回归和移为季节性的自回归和移动平均阶数,动平均阶数,D为季节差分的阶数,为季节差分的阶数,s为季节周期。为季节周期。11.7.2ARIMA分析的基本操作分析的基本操作(1)选择菜
44、单)选择菜单AnalyzeTimeSeriesARIMA,出现窗,出现窗口口(2)把被解释变量选择到)把被解释变量选择到Dependent框中。框中。(3)如果要对序列进行变换后再进行建模,可在)如果要对序列进行变换后再进行建模,可在Transform框中选择变换方式。这里提供了自然对数和以框中选择变换方式。这里提供了自然对数和以10为底的对数两种变换形式。为底的对数两种变换形式。(4)在)在Independent(s)框中可选入其他的解释变量,这框中可选入其他的解释变量,这和前一节的自回归模型相似。但一般情况下和前一节的自回归模型相似。但一般情况下ARIMA模型不模型不再引入其他解释变量。再
45、引入其他解释变量。(5)在)在Model框中对模型的框中对模型的6个参数进行设置,它们分别是个参数进行设置,它们分别是ARIMA模型中的模型中的p,d,q,P,D,Q,还可以选择模型,还可以选择模型当中是否包含常数项。当中是否包含常数项。(6)单击)单击Option按钮对模型的算法和输出等进行设置。按钮对模型的算法和输出等进行设置。在在Convergence Criteria框中指定收敛准则,包括框中指定收敛准则,包括最大迭代次数、参数变化量、平方和变化量。它们共同决定最大迭代次数、参数变化量、平方和变化量。它们共同决定了迭代的步数。一般情况迭代步数越大,或者参数及平方和了迭代的步数。一般情况
46、迭代步数越大,或者参数及平方和变化量越小,模型的精度就越高;在变化量越小,模型的精度就越高;在Initial Values for Estimation中指定初始值的估计策略,包括自动选择和利中指定初始值的估计策略,包括自动选择和利用上一模型的估计值两个选择。对于大数据量的序列,初始用上一模型的估计值两个选择。对于大数据量的序列,初始值对结果的影响几乎没有,因此一般情况下选择自动设置;值对结果的影响几乎没有,因此一般情况下选择自动设置;在在Forecasting Method框中选择预测方法,包括无条件框中选择预测方法,包括无条件最小二乘法和有条件最小二乘法两种方法。最小二乘法和有条件最小二乘
47、法两种方法。至此完成了建立至此完成了建立ARIMA模型的基本操作,模型的基本操作,SPSS将根将根据用户指定自动建立模型,并将结果输出到数据编辑窗口中。据用户指定自动建立模型,并将结果输出到数据编辑窗口中。11.7.3 ARIMA分析的应用举例分析的应用举例 利用上节激光唱机出口量的数据进行利用上节激光唱机出口量的数据进行ARIMA模型分析。模型分析。1图形观察,确定初步模型图形观察,确定初步模型 自相关函数图(自相关函数图(ACF)和偏自相关函数图()和偏自相关函数图(PACF)是)是ARIMA模模型识别中非常有用且非常直观的工具。型识别中非常有用且非常直观的工具。对序列首先进行取自然对数的
48、数据变换,其次进行一阶逐期差分和对序列首先进行取自然对数的数据变换,其次进行一阶逐期差分和一阶季节差分,得到一个基本平稳的序列。于是,模型中的一阶季节差分,得到一个基本平稳的序列。于是,模型中的d和和D应同时应同时取取1;从自相关图看,在;从自相关图看,在1阶以后函数值明显趋于阶以后函数值明显趋于0,呈拖尾性,因此可,呈拖尾性,因此可将将q取取1,而第,而第12阶的函数值显著不为阶的函数值显著不为0,因此可将,因此可将Q取为取为1;再看偏自;再看偏自相关图,前三阶函数值均显著不为相关图,前三阶函数值均显著不为0,滞后趋于,滞后趋于0并呈拖尾性,因此可将并呈拖尾性,因此可将p取为取为2或或3,而第,而第12阶也显著不为阶也显著不为0,因此可考虑将,因此可考虑将P取为取为1。2模型一:模型一:ARIMA(3,1,1)()(1,1,1)s3模型二:模型二:ARIMA(3,1,0)()(1,1,1)s4模型三:模型三:ARIMA(2,1,3)()(1,1,1)s5模型四:模型四:ARIMA(2,1,1)()(0,1,1)s Thank you结束语结束语谢谢大家聆听!谢谢大家聆听!41