spss(时间序列分析)精讲.ppt

上传人:豆**** 文档编号:25014955 上传时间:2022-07-09 格式:PPT 页数:72 大小:861KB
返回 下载 相关 举报
spss(时间序列分析)精讲.ppt_第1页
第1页 / 共72页
spss(时间序列分析)精讲.ppt_第2页
第2页 / 共72页
点击查看更多>>
资源描述

《spss(时间序列分析)精讲.ppt》由会员分享,可在线阅读,更多相关《spss(时间序列分析)精讲.ppt(72页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第一节第一节 简介简介一、横截面数据与时间序列数据一、横截面数据与时间序列数据 人们对统计数据往往可以根据其特点从两个方面来切入,以人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。一个是研究所谓简化分析过程。一个是研究所谓横截面横截面(cross section)数数据据,也就是对大体上同时,或者和时间无关的,也就是对大体上同时,或者和时间无关的不同对象的观不同对象的观测值测值组成的数据。组成的数据。 另一个称为另一个称为时间序列时间序列(time series)数据数据,也就是由,也就是由同一对象同一对象在不同时间的观测值在不同时间的观测值形成的数据。如形成的数据。如 前面

2、讨论的模型多是和横截面数据有关。本章将讨论时间序前面讨论的模型多是和横截面数据有关。本章将讨论时间序列数据的统计分析。列数据的统计分析。 横截面数据也常称为变量的一个横截面数据也常称为变量的一个简单随机样本简单随机样本,也即假设每,也即假设每个数据都是来自于总体分布的一个取值,且它们之间是相互个数据都是来自于总体分布的一个取值,且它们之间是相互独立的独立的(独立同分布独立同分布)。 而时间序列的最大特点是而时间序列的最大特点是观测值并不独立观测值并不独立。时间序列的一个。时间序列的一个目的是用变量过去的观测值来预测同一变量的未来值目的是用变量过去的观测值来预测同一变量的未来值。 下面看一个时间

3、序列的数据例子。下面看一个时间序列的数据例子。 例例1. 某企业从某企业从1990年年1月到月到2002年年12月的月销售数据月的月销售数据(单位:单位:百万元百万元)储存于储存于SPSS数据文件数据文件tssales.sav中。中。 在该数据文件中,除了销售额变量在该数据文件中,除了销售额变量“sales”以外,还有三个以外,还有三个时间变量时间变量“year”、“month”和和“date”。事实上这三个变。事实上这三个变量是我们后期通过量是我们后期通过SPSS操作自动加上去的。操作自动加上去的。 选择选择SPSS菜单中的菜单中的“Data = Define Dates”选项,在弹选项,在

4、弹出窗口的出窗口的“Cases Are”下方选择下方选择“Years, months”,再在,再在右侧右侧“First Case Is”下的空格输入下的空格输入起始时间起始时间,即可自动生,即可自动生成该例中的三个时间变量。成该例中的三个时间变量。 当然,根据数据记录的背景不同和不同的需要,我们也可以当然,根据数据记录的背景不同和不同的需要,我们也可以选择选择“Days”、“Weeks” 等其他形式的时间变量。等其他形式的时间变量。 作为时间序列数据的一个基本要求,其数据都是作为时间序列数据的一个基本要求,其数据都是等间隔记录等间隔记录的,比如每天或每月记录一个数据。的,比如每天或每月记录一个

5、数据。 在金融时间序列在金融时间序列(比如股票价格比如股票价格),每周的记录时间只有,每周的记录时间只有5天天(周一至周五周一至周五),此时我们也把它当成是等间隔记录的,此时,此时我们也把它当成是等间隔记录的,此时记录的时间间隔是记录的时间间隔是“每个工作日每个工作日”。 我们接下来看看例我们接下来看看例1的销售数据的的销售数据的时间序列图时间序列图(TSplot)。YEAR20032002200120001999199819971996199519941993199219911990SALES12010080604020图图1 销售数据的时间序列图销售数据的时间序列图(返回返回27页页) 从

6、图从图1可以看出:该企业销售额总的趋势是可以看出:该企业销售额总的趋势是增长增长的;但增长的;但增长并不是单调上升的,有涨有落。并不是单调上升的,有涨有落。 更进一步,这种升降不是杂乱无章的,和季节或月份的更进一步,这种升降不是杂乱无章的,和季节或月份的周期周期有关系。有关系。 当然,除了增长的趋势和季节影响之外,还有些无规律的当然,除了增长的趋势和季节影响之外,还有些无规律的随随机因素机因素的作用。的作用。 这些都说明了这个数据前后之间不是独立而是这些都说明了这个数据前后之间不是独立而是相关的相关的。 上述图形是选择上述图形是选择SPSS菜单中的菜单中的“Graphs = Sequences

7、”选项,在窗口中把选项,在窗口中把“sales”作为画图变量作为画图变量“Variables”,而,而把把“year”作为横坐标作为横坐标“Time Axis Labels”而得到的。而得到的。在在成图后我们还把时间标值的间隔和格式做了修改。成图后我们还把时间标值的间隔和格式做了修改。二、时间序列分析的目的二、时间序列分析的目的 在例在例1中,我们希望能够从这些历史销售数据出发,找出其中,我们希望能够从这些历史销售数据出发,找出其中的一些中的一些规律规律,并且建立可以对未来的销售额进行,并且建立可以对未来的销售额进行预测预测的时的时间序列模型,这一统计过程就是时间序列分析。间序列模型,这一统计

8、过程就是时间序列分析。 事实上,事实上,时间序列分析也是一种回归时间序列分析也是一种回归。 回归分析的目的是回归分析的目的是建立建立应变量和自变量之间关系的应变量和自变量之间关系的模型模型;并;并且可以且可以用自变量来对应变量进行用自变量来对应变量进行预测预测。 而在时间序列分析中,应变量为变量而在时间序列分析中,应变量为变量未来的可能值未来的可能值,而用来,而用来预测的自变量中就包含该变量的一系列预测的自变量中就包含该变量的一系列历史观测值历史观测值。 时间序列的时间序列的自变量也可能包含随着时间度量的独立变量自变量也可能包含随着时间度量的独立变量。三、指数平滑模型三、指数平滑模型 时间序列

9、分析的一个简单和常用的预测模型叫做时间序列分析的一个简单和常用的预测模型叫做指数平滑指数平滑(exponential smoothing)模型模型。 指数平滑只能用于指数平滑只能用于纯粹时间序列纯粹时间序列的情况,而不能用于含有独的情况,而不能用于含有独立变量时间序列的因果关系的研究。立变量时间序列的因果关系的研究。 指数平滑的指数平滑的原理原理为:为:利用过去观测值的利用过去观测值的加权平均加权平均来预测未来来预测未来的观测值的观测值(这个过程称为这个过程称为平滑平滑),且,且离现在越近的观测值要给离现在越近的观测值要给以越重的权以越重的权。 而而“指数指数”意味着:按历史观测值记录时间离现

10、在的距离远意味着:按历史观测值记录时间离现在的距离远近,其上的近,其上的权数按指数速度递减权数按指数速度递减。 这一距离通常用这一距离通常用数据间隔位置差数据间隔位置差,也称,也称步数步数(lag)来表示。来表示。 若记时刻若记时刻 t 的观测值为的观测值为 Xt 时刻时刻 t 的指数平滑记为的指数平滑记为 Yt 。 指数平滑的数学模型为指数平滑的数学模型为Yt = a aXt+a a(1- -a a)Xt -1+a a(1- -a a)2Xt -2+ +a a(1- -a a)t-1X1, (1) 其中其中0a aN 。见图。见图2,其中取,其中取a a = 0.4。YEAR20032002

11、20012000199919981997199619951994199319921991199012010080604020SALESXSMOOTH图图2 销售数据的简单指数平滑销售数据的简单指数平滑 指数平滑的指数平滑的SPSS操作操作 选择菜单中的选择菜单中的“Analyze = Time Series = Exponential Smoothing”选项,在弹出的选项,在弹出的窗口中把变量窗口中把变量“sales”选入选入“Variables”空格。空格。 点击右下方点击右下方“Parameter”按钮,在新弹出窗口改变权按钮,在新弹出窗口改变权重指数重指数a a 的取值;点击的取值;点

12、击“Continue”返回。返回。 点击点击“Save”按钮,在新窗口选择按钮,在新窗口选择“Predict through”,并在下方并在下方“Year”后输入后输入“2003”,表示将预测,表示将预测2003年的销年的销售额;点击售额;点击“Continue”返回一级窗口,点返回一级窗口,点“OK”即可。即可。 指数平滑的结果储存在原数据文件后新增的两个变量中,它指数平滑的结果储存在原数据文件后新增的两个变量中,它们分别是们分别是指数平滑数据指数平滑数据Yt 以及以及Yt 与与 Xt 之间的之间的误差误差。 图图2即为即为Xt 与与 Yt 叠合在一起的共同的时间序列图。叠合在一起的共同的时

13、间序列图。从图从图2可以看出一下几点:可以看出一下几点:指数平滑曲线比原有观测值曲线来得指数平滑曲线比原有观测值曲线来得平整光滑平整光滑些,其波动些,其波动没有原来那么强了,这也是平滑一词的来意。没有原来那么强了,这也是平滑一词的来意。不考虑最初几个指数平滑值,当不考虑最初几个指数平滑值,当 t N 时时,指数平滑曲线很快得呈一条直线状,指数平滑曲线很快得呈一条直线状,没没有体现出原有观测值的上升趋势和周期性规律有体现出原有观测值的上升趋势和周期性规律。可见用这。可见用这一指数平滑作为原销售数据的预测效果不理想。一指数平滑作为原销售数据的预测效果不理想。1.上述第三点的原因是我们在做指数平滑时

14、没有考虑原数据上述第三点的原因是我们在做指数平滑时没有考虑原数据的任何趋势或周期规律,我们在下一节再对此做弥补。的任何趋势或周期规律,我们在下一节再对此做弥补。第二节第二节 时间序列的分解时间序列的分解一、成分的分离一、成分的分离 从图从图1可以看出,该销售数据序列由三部分组成:指数向上可以看出,该销售数据序列由三部分组成:指数向上的的趋势趋势(trend)、周期性变化的、周期性变化的季节季节成分成分(seasonal component) 和无法用趋势和季节模式解释的和无法用趋势和季节模式解释的随机干扰随机干扰(disturbance)。 一般的时间序列还可能有一般的时间序列还可能有循环循环

15、或或波动成分波动成分(Cyclic, or fluctuations)。 循环模式和有规律的季节模式不同,其周期长短不一定固定。循环模式和有规律的季节模式不同,其周期长短不一定固定。比如经济危机周期,金融危机周期等等。比如经济危机周期,金融危机周期等等。 一般地来讲,一个时间序列可能有一般地来讲,一个时间序列可能有趋势趋势、季节季节、循环循环这三个这三个成分中的成分中的某些或全部某些或全部再加上再加上随机成分随机成分组成。组成。 时间序列的分解时间序列的分解就是要把一个时间序列中可能包含的各种成就是要把一个时间序列中可能包含的各种成分分解开来,以便于有针对性的进一步分析讨论。分分解开来,以便于

16、有针对性的进一步分析讨论。 就例就例1中的时间序列的分解,通过中的时间序列的分解,通过SPSS软件,可以很轻而软件,可以很轻而易举地得到该序列的趋势、季节和误差成分。易举地得到该序列的趋势、季节和误差成分。 SPSS操作操作 选择菜单中的选择菜单中的“Analyze = Time Series = Seasonal Decomposition”选项,把变量选项,把变量“sales”选入选入“Variables”空格,再在空格,再在“Model”下选择下选择“Additive”,点,点击击“OK”即可得到分解结果。即可得到分解结果。上述上述SPSS对时间序列做分解的结果自动储存在原有数据对时间序

17、列做分解的结果自动储存在原有数据文件中新增的几个变量中,它们分别是:文件中新增的几个变量中,它们分别是:err_1:误差误差(error)项,也即原序列的随机扰动成分,记项,也即原序列的随机扰动成分,记为为ERt ;sas_1:季节调整后的序列季节调整后的序列(seasonal adjusted series) ,记为记为SAt ;saf_1:季节因素季节因素(seasonal factor) ,记为,记为SFt ;1.stc_1:去掉季节及随机扰动后的:去掉季节及随机扰动后的趋势及循环因素趋势及循环因素(trend-cycle series),记为,记为TCt 。 这些分解出来的序列或成分与

18、原有时间序列这些分解出来的序列或成分与原有时间序列之间有如下的简单和差关系:之间有如下的简单和差关系:Xt = SFt + SAt , (3)Xt = SFt + TCt + ERt . (4)YEAR2002200120001999199819971996199519941993199219911990120100806040200-20Seanal adjustedseries SASeas factors SF图图3 销售数据的季节因素分离销售数据的季节因素分离可以看出,这一销可以看出,这一销售数据序列大致上售数据序列大致上是以一年是以一年(12个月个月)为周期的。为周期的。 YEAR2

19、002200120001999199819971996199519941993199219911990120100806040200-20Trend-cycleseries TCError series ER图图4 销售数据的趋势与扰动分离销售数据的趋势与扰动分离可以看出,逐月的销可以看出,逐月的销售额大致沿一个指数售额大致沿一个指数曲线呈增长趋势。曲线呈增长趋势。 YEAR2002200120001999199819971996199519941993199219911990Error from Seasonal decomposition3210-1-2-3-4图图5 分离季节和趋势后的扰

20、动序列分离季节和趋势后的扰动序列 (返回返回27页页)可以看到,扰动项不再带有明显的周期或趋势。可以看到,扰动项不再带有明显的周期或趋势。二、带季节与趋势的指数平滑二、带季节与趋势的指数平滑 如果我们不仅仅满足于分解现有的时间序列,而且想利用该如果我们不仅仅满足于分解现有的时间序列,而且想利用该分解对未来进行更好的预测,就可以建立分解对未来进行更好的预测,就可以建立带季节成分和趋势带季节成分和趋势的指数平滑模型的指数平滑模型。 作这样的指数平滑,必须事先作这样的指数平滑,必须事先估计估计出季节成分和趋势,其估出季节成分和趋势,其估计结果就是这两条曲线的函数关系式计结果就是这两条曲线的函数关系式

21、(参数参数),也即时间指标,也即时间指标 t 的两个确定的的两个确定的(非随机的非随机的)函数。函数。 分别记季节因素和趋势分别记季节因素和趋势(及循环及循环)的估计为的估计为 和和 ,而剩,而剩余的扰动余的扰动(自然也是估计自然也是估计)记为记为 。 带季节和趋势的指数平滑就是先计算带季节和趋势的指数平滑就是先计算扰动序列的指数平滑扰动序列的指数平滑,然后再然后再加上估计加上估计(预测预测)的季节和趋势成分的季节和趋势成分,作为最终的指数,作为最终的指数平滑数据。平滑数据。SFtTCtERt我们不介绍上述指数平滑背后的数学,而直接来看它的我们不介绍上述指数平滑背后的数学,而直接来看它的SPS

22、S操作,该操作要分步来完成。操作,该操作要分步来完成。选择菜单中的选择菜单中的“Analyze = Time Series = Exponential Smoothing”选项,在弹出的窗口中把变量选项,在弹出的窗口中把变量“sales”选入选入“Variables”空格。空格。在该窗口的在该窗口的“Model”下选择下选择“Custom”,并点击其下的,并点击其下的“Custom”按钮进入二级窗口按钮进入二级窗口(进行模型选择进行模型选择)。1.在在“Trend Component”下选择下选择“Exponential”(因为本因为本例中的趋势近似一条指数曲线例中的趋势近似一条指数曲线),在

23、,在“Seasonal Component”下选择下选择“Additive”,点击,点击“Continue”返返回一级窗口。回一级窗口。4. 点击点击“Parameters”来进行参数选择和估计。在弹出的二来进行参数选择和估计。在弹出的二级窗口中的级窗口中的“General”、“Trend”和和“Seasonal”下方下方都选择都选择“Grid Search”,表示留给程序自己去搜索,表示留给程序自己去搜索(估计估计),其下的搜索范围其下的搜索范围(“Start”和和“Stop”)和搜索步长和搜索步长(“By”)可可不作修改。这三个参数中的第一项,也即权重指数不作修改。这三个参数中的第一项,也

24、即权重指数 a a ,一,一般可作人为选择。选好参数后,点击般可作人为选择。选好参数后,点击“Continue”返回一返回一级窗口。级窗口。点击点击“Save”按钮作预测选择后,此操作同上一节的简单按钮作预测选择后,此操作同上一节的简单指数平滑。指数平滑。再在一级窗口点击再在一级窗口点击“OK”,即可得到所需要的结果了。,即可得到所需要的结果了。5.我们来看看此时的指数平滑结果,见图我们来看看此时的指数平滑结果,见图6。YEAR2003200220012000199919981997199619951994199319921991199012010080604020SALESSMOOTH图图6

25、 销售数据的带季节和趋势的指数平滑销售数据的带季节和趋势的指数平滑我们看到,此时的我们看到,此时的估计效果比上一节估计效果比上一节的简单指数平滑要的简单指数平滑要好得多,当然其预好得多,当然其预测也更可信。测也更可信。第三节第三节 基本基本概念与相关图概念与相关图 如果要对比较复杂的纯粹时间序列如果要对比较复杂的纯粹时间序列(一般指已分离了一般指已分离了确定性确定性的的季节成分和趋势后的扰动序列季节成分和趋势后的扰动序列)进行细致的分析,指数平进行细致的分析,指数平滑往往是无法满足要求的。滑往往是无法满足要求的。 而若想对有独立变量的时间序列进行预测,指数平滑更是无而若想对有独立变量的时间序列

26、进行预测,指数平滑更是无能为力。能为力。 于是需要更加强有力的模型。于是需要更加强有力的模型。 在介绍具体的模型之前,我们先介绍一下所要用到的时间序在介绍具体的模型之前,我们先介绍一下所要用到的时间序列的一些列的一些基本概念基本概念,以及,以及相关图相关图这一重要的工具。这一重要的工具。一、基本概念一、基本概念 接下来我们只考虑接下来我们只考虑纯粹时间序列纯粹时间序列(pure time series),也即,也即不带有季节成分和不带有季节成分和确定性确定性趋势趋势的时间序列或扰动序列。的时间序列或扰动序列。 记要考虑的时间序列为记要考虑的时间序列为Xt ,为讨论方便,我们允许时间指,为讨论方

27、便,我们允许时间指标标 t 取全体整数值。但涉及到具体的观测值时,取全体整数值。但涉及到具体的观测值时, t 只能只能取有取有限个值,常取为限个值,常取为 t = 1, 2, , N,其中,其中 N 为某个正整数,代为某个正整数,代表样本容量或样本长度。表样本容量或样本长度。 对于每个固定的时间对于每个固定的时间 t, Xt 是一个随机变量是一个随机变量,都有着自己的都有着自己的均值和方差;不同的均值和方差;不同的Xt 之间还存在着协方差和相关系数,分之间还存在着协方差和相关系数,分别称为别称为Xt 的的自协方差函数自协方差函数(auto-covariance function, ACVF)和

28、和自相关函数自相关函数(auto-correlation function, ACF)。定义定义1. 时间序列时间序列Xt 称为称为平稳的平稳的(stationary),如果,如果Xt 的的均值和方差为常数均值和方差为常数,不随着时间,不随着时间 t 的的变化而变化;变化而变化;1. Xt 的的相关性也关于时间平移不变相关性也关于时间平移不变,也对,也对任意整数任意整数 t 和和 k, Xt 和和 Xt+k 之间的相关性之间的相关性(自协方差函数和自相关函数自协方差函数和自相关函数)只跟时间间只跟时间间隔隔 k 有关,而跟具体的时间点有关,而跟具体的时间点 t 无关。无关。由定义知,若时间序列

29、由定义知,若时间序列Xt 是平稳的,则是平稳的,则X1和和X2、 X2和和X3、甚至、甚至X99和和X100之间都具有之间都具有相同的相关性相同的相关性;同理,;同理, X1和和X3、 X2和和X4、以及以及X99和和X101之间也具有之间也具有相同的相关性相同的相关性。记号记号:若时间序列:若时间序列Xt 是平稳的,常记它的是平稳的,常记它的均值为均值为 m m,自协方差函数为,自协方差函数为 g g k,自相关函数,自相关函数为为 r r k,其中,其中 k 为时间间隔,也称为为时间间隔,也称为间隔步间隔步数数(lag)。 一个时间序列的均值和方差是否为常数,通常可以一个时间序列的均值和方

30、差是否为常数,通常可以从它的时从它的时间序列图上间序列图上看出来看出来。 例如前面提到的销售数据分离了季节和趋势后的扰动序列,例如前面提到的销售数据分离了季节和趋势后的扰动序列,见图见图5。 从图中我们看到,这些从图中我们看到,这些数据都围绕着某个水平线数据都围绕着某个水平线(均值均值)上下上下波动波动,没有出现前高后低或中间高两头低等变化,这说明该,没有出现前高后低或中间高两头低等变化,这说明该时间序列的时间序列的均值大致上是一个常数均值大致上是一个常数。而原始的销售数据的均。而原始的销售数据的均值就不是一个常数了,见图值就不是一个常数了,见图1,因为数据不是围绕一个水平,因为数据不是围绕一

31、个水平线,而是一条前低后高的指数型曲线在波动。线,而是一条前低后高的指数型曲线在波动。 同时,图同时,图5中中前后数据的波动范围也基本一致前后数据的波动范围也基本一致,这说明该序,这说明该序列的列的方差大致上是一个常数方差大致上是一个常数。二、时间序列的相关性估计与相关图二、时间序列的相关性估计与相关图一个时间序列的相关性是否关于时间平移不变,一般需要一个时间序列的相关性是否关于时间平移不变,一般需要先先估计估计其自相关函数,再其自相关函数,再加加上一定的上一定的经验经验来加以判断。来加以判断。时间序列自相关函数的估计称为时间序列自相关函数的估计称为样本自相关函数样本自相关函数(sample

32、ACF),记为,记为 rk,其,其SPSS的计算操作如下:的计算操作如下:选择菜单中的选择菜单中的“Graphs = Time Series = Autocorrelations”选项,把需要计算样本自相关函数的选项,把需要计算样本自相关函数的变量名选入变量名选入“Variables”空格空格(可以同时选多个变量可以同时选多个变量);1.点击点击“Options”按钮,在二级窗口选择需要计算的样本按钮,在二级窗口选择需要计算的样本自相关函数的最大间隔步数自相关函数的最大间隔步数“Maximum numbers of lags”,在其下方则选择,在其下方则选择“Bartletts approxi

33、mation”。点点“Continue”返回一级菜单,再点击返回一级菜单,再点击“OK”即可。即可。 由于销售数据的样本自相关函数形状比较复杂,我们换以几由于销售数据的样本自相关函数形状比较复杂,我们换以几个个模拟的时间序列数据模拟的时间序列数据为例来说明上述操作的结果。这些模为例来说明上述操作的结果。这些模拟数据储存在拟数据储存在SPSS数据文件数据文件tssimulation.sav中。中。 我们先看其中变量名为我们先看其中变量名为“ar1”和和“arima”这两个序列,它这两个序列,它们的样本长度都是们的样本长度都是150。在估计时,我们都估计了。在估计时,我们都估计了前前24步步间间隔

34、的样本自相关函数隔的样本自相关函数 rk 。 SPSS的输出结果分为的输出结果分为两部分两部分。第一部分由。第一部分由4组组数据数据和夹在和夹在数据中间的数据中间的“茎叶图茎叶图”组成,它们分别为这两个序列的组成,它们分别为这两个序列的自相自相关函数关函数和和偏相关函数偏相关函数(partial autocorrelation)的估计的估计及相及相应的统计量。后一部分为四个图,分别是这些样本相关系数应的统计量。后一部分为四个图,分别是这些样本相关系数的条形图,统称为时间序列的的条形图,统称为时间序列的相关图相关图(correlogram)。 我们先来看第一项输出结果我们先来看第一项输出结果 序

35、列序列“ar1”的的样本自相关样本自相关函数估计函数估计。为便于描述,我们省略了夹在文字中间部分的茎。为便于描述,我们省略了夹在文字中间部分的茎叶图,且文字与数值部分也只取了前几项结果,见表叶图,且文字与数值部分也只取了前几项结果,见表1。 Lag Auto-Corr. Stand. Err.Box-LjungProb. 1 .742 .082 84.160 .000 2 .516 .118 125.218 .000 3 -.332 .132 142.293 .000 4 .207 .138 148.973 .000 5 -.122 .140 151.316 .000 6 .084 .141

36、152.442 .000 7 -.094 .141 153.852 .000 表表1 时间序列时间序列AR1的样本自相关估计的样本自相关估计 表表1中共有中共有5列数据,分别为样本自相关函数的列数据,分别为样本自相关函数的间隔步数间隔步数(Lag)、样本自相关函数样本自相关函数(Auto-Corr.)、样本自相关函数的、样本自相关函数的标标准误差准误差(Stand. Err.)、检验统计量检验统计量(Box-Ljung)和相应的和相应的 p-值值(Prob.)。 对于前三列内容我们不再作过多解释。对于前三列内容我们不再作过多解释。 第四列数值为该步数间隔前第四列数值为该步数间隔前(包含这一步包

37、含这一步)所有样本自相关函所有样本自相关函数数总体显著性总体显著性的一个的一个多变量检验多变量检验(Portmanteau Test)统计量,统计量,检验的原假设是检验的原假设是H0:该步数间隔前所有样本自相关函数:该步数间隔前所有样本自相关函数总体不显著总体不显著。 而最后一列则是第四列统计量数值相应的而最后一列则是第四列统计量数值相应的 p-值。由这些值。由这些p-值值看,看,前前k(k7)步的样本相关自相关函数是总体显著的步的样本相关自相关函数是总体显著的。 第一部分的第二项输出结果是序列第一部分的第二项输出结果是序列“ar1”的偏相关函数的的偏相关函数的估计或称估计或称样本偏相关函数样

38、本偏相关函数,它同样给出了前,它同样给出了前24步的样本偏步的样本偏相关函数估计值和相应估计的标准误差。但此时相关函数估计值和相应估计的标准误差。但此时没有总体没有总体显著性的多变量检验显著性的多变量检验。 时间序列时间序列Xt 的偏相关函数,记为的偏相关函数,记为f fkk,k0,它被定义为,它被定义为 Xt 和和 Xt+k 之间,去除了中间变量之间,去除了中间变量 Xt+1、Xt+2、Xt+k-1 等的影等的影响后的响后的条件相关系数条件相关系数。 样本偏相关函数常记为样本偏相关函数常记为 。 偏相关函数也是刻画时间序列相关性的一个指标偏相关函数也是刻画时间序列相关性的一个指标。 第一部分

39、的后两项内容分别为序列第一部分的后两项内容分别为序列“arima”的样本自相关的样本自相关函数和样本偏相关函数,此处不再赘述。函数和样本偏相关函数,此处不再赘述。f fkk 关于时间序列的自相关函数和偏相关函数,我们再提一下它关于时间序列的自相关函数和偏相关函数,我们再提一下它们的们的个体显著性检验个体显著性检验,即检验单个某步自相关函数,即检验单个某步自相关函数r rk 或偏相或偏相关函数关函数f fkk是否为是否为0,原假设为,原假设为H0:r rk =0 或或 H0:f fkk =0。 上述检验问题的检验统计量在形式上是一致的,都取为上述检验问题的检验统计量在形式上是一致的,都取为估计估

40、计值与相应的标准误差的比值值与相应的标准误差的比值,称为,称为T值值(T Value),即,即T值值 = rk /S.E.(rk) 或或 T值值 = /S.E.( )。 在在 a a =0.05 的显著性水平下,两者的的显著性水平下,两者的临界值临界值都可近似取为都可近似取为2。也即当也即当|T值值|2 时,就拒绝原假设;否则不拒绝时,就拒绝原假设;否则不拒绝。 例如,序列例如,序列“AR1”的第四步样本自相关函数值为的第四步样本自相关函数值为r4=0.207,标准误差为标准误差为0.138,|T值值|=|0.207/0.138|0为为at 的共同方差。的共同方差。 由定义知,白噪声序列的自相

41、关函数和偏相关函数具有如下由定义知,白噪声序列的自相关函数和偏相关函数具有如下性质:性质:r r0=1, r rk = 0, 任意任意 k 0, (6)f fkk = 0, 任意任意 k 0. (7) 因此,因此,白噪声序列是平稳的白噪声序列是平稳的。 定义定义3. 若若时间序列时间序列Xt 满足满足下列模型,则称下列模型,则称其为一个其为一个p阶自回归序列阶自回归序列,简记为,简记为Xt AR(p):Xt =j j 0+ j j1Xt-1 + j j 2Xt-2 + + j j pXt-p + at , (8) 其中其中 p 为一为一非负整数非负整数,称为自回归模型的,称为自回归模型的阶数阶

42、数(order); j j i, i = 0, 1, , p, 为模型的为模型的 p1 个参数,且个参数,且最后一个参数最后一个参数 j j p 0 ;at WN(0, s sa2)为一白噪声序列。为一白噪声序列。 自回归模型自回归模型(8)形式上也是一个回归模型形式上也是一个回归模型,其,其中的白噪声序列中的白噪声序列at 相当于模型的误差。只相当于模型的误差。只不过现在应变量为序列的现值或未来取值,不过现在应变量为序列的现值或未来取值,而自变量为模型的历史取值。这也是自回归而自变量为模型的历史取值。这也是自回归模型名词的由来。模型名词的由来。 自回归序列不总是平稳的自回归序列不总是平稳的,

43、只有当其参数,只有当其参数j j i 满足一定的满足一定的平稳性条件平稳性条件时它才平稳。时它才平稳。 定义定义4. 若若时间序列时间序列Xt 满足满足下列模型,则称下列模型,则称其为一个其为一个q阶滑动平均序列阶滑动平均序列,简记为,简记为Xt MA(q): Xt =q q 0 + at - q q 1at-1 - q q 2at-2 - - q q qat-q, (9) 其中其中 q 为一为一非负整数非负整数,称为滑动平均模型的,称为滑动平均模型的阶数阶数(order); q q i, i = 0, 1, , q, 为模型的参数,且为模型的参数,且最后一个参数最后一个参数 q q q 0

44、;at WN(0, s sa2)为一白噪声序列。为一白噪声序列。 一个一个0阶的滑动平均序列阶的滑动平均序列(或自回归序列或自回归序列)就相就相当于是一个白噪声序列再加上一个常数。当于是一个白噪声序列再加上一个常数。 滑动平均序列总是平稳的滑动平均序列总是平稳的。 定义定义5. 若若时间序列时间序列Xt 满足满足下列模型,则称其为一个下列模型,则称其为一个p阶自阶自回归回归q阶滑动平均序列阶滑动平均序列,简记为,简记为Xt ARMA(p, q):Xt =q q 0 + j j1Xt-1 + + j j pXt-p + at - q q 1at-1 - - q q qat-q, (10) 其中其

45、中 p 和和 q 为两个非负整数,称为自回归滑动平均模型的为两个非负整数,称为自回归滑动平均模型的阶数阶数(order); j j i, i = 1, , p, 和和q q j, j = 0, 1, , q, 为模型的为模型的 参数,参数,且且j j pq q q 0 ;at WN(0, s sa2)为一白噪声序列。为一白噪声序列。 其中其中 p 和和 q 为两个非负整数,称为自回归滑动平均为两个非负整数,称为自回归滑动平均模型的模型的阶数阶数(order); j j i, i = 1, , p, 和和q q j, j = 0, 1, , q, 为模型的为模型的 参数,且参数,且j j pq

46、q q 0 ;at WN(0, s sa2)为一白噪声序列。为一白噪声序列。 一个一个ARMA(p, 0)事实上就是一个事实上就是一个AR(p)序列;同理,序列;同理,一个一个 ARMA(0, q)序列就是一个序列就是一个MA(q)序列。序列。 ARMA(p, q)序列序列不总是平稳的不总是平稳的,也,也不总是可逆的不总是可逆的。 定义定义6. 设设Xt 为一为一时间序列,称新的序列时间序列,称新的序列Wt = Xt Xt-1 (11) 为原序列为原序列Xt 的的一次差分一次差分(first difference)序列序列. 若再对一次差分序列若再对一次差分序列Wt 作一次差分,记为作一次差分

47、,记为Vt ,则,则Vt 称称为为Xt 的的二次差分二次差分(second difference)序列,。序列,。 类似地可以定义类似地可以定义Xt 的的 d 次差分序列次差分序列,其中,其中d 为为非负整数非负整数。 定义定义7. 若若Xt 的某个的某个d(d0)次差分序列满足次差分序列满足一个平稳一个平稳ARMA(p, q)模型,则称模型,则称Xt 为一个为一个d 阶求和阶求和ARMA(p, q)序列序列,简记为,简记为Xt ARIMA(p, d, q)。 ARIMA(p, d, q)序列序列(d0)总是非平稳的总是非平稳的。二、二、ARIMA模型的相关特征模型的相关特征不同的模型不同的模

48、型(序列序列)具有不同的特征,这些特征主要体现在具有不同的特征,这些特征主要体现在它们的自相关函数和偏相关函数具有不同的性状。它们的自相关函数和偏相关函数具有不同的性状。这些性状主要包括以下几个方面:这些性状主要包括以下几个方面:平稳时间序列的平稳时间序列的自相关函数自相关函数会随着步数的增加会随着步数的增加很快很快(以指以指数速度数速度)下降收敛到下降收敛到0。而非平滑序列的。而非平滑序列的样本自相关函数样本自相关函数通通常常下降速度很慢下降速度很慢。特别地,特别地,MA(q)序列的自相关函数在序列的自相关函数在 q 步以后就全为步以后就全为0,这一性质称为这一性质称为q 步截尾性步截尾性(

49、cut-off property)。1.AR(p)的偏相关函数的偏相关函数p步以后截尾步以后截尾。表表2 ARIMA模型的性质和相关性状模型的性质和相关性状模型类型模型类型平稳性平稳性可逆性可逆性自相关函数自相关函数偏相关函数偏相关函数AR(p)有条件有条件总是总是指数速度下降指数速度下降p步截尾步截尾MA(q)总是总是有条件有条件q步截尾步截尾指数速度下降指数速度下降ARMA有条件有条件有条件有条件指数速度下降指数速度下降指数速度下降指数速度下降ARIMA非平稳非平稳有条件有条件下降速度很慢下降速度很慢近似近似一步截尾一步截尾第一步值很大第一步值很大(返回返回2)(返回返回1)第五节第五节

50、ARIMA模型拟合模型拟合用用ARIMA模型去拟合一个时间序列数据,一般要分三步模型去拟合一个时间序列数据,一般要分三步来完成:来完成:模型的识别模型的识别选择适当的选择适当的ARIMA(p,d,q)模型,也即定出模型,也即定出模型的阶数模型的阶数 p, d 和和 q,因此这一步也常称为模型的,因此这一步也常称为模型的定阶定阶;参数估计参数估计估计模型中所含的各参数;估计模型中所含的各参数;模型的诊断模型的诊断检验估计出来的模型,并作必要的修改。检验估计出来的模型,并作必要的修改。1.完成了上述三步以后,才能利用所得的模型来,对时间序完成了上述三步以后,才能利用所得的模型来,对时间序列未来的取

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁