《时间序列分析word版.pdf》由会员分享,可在线阅读,更多相关《时间序列分析word版.pdf(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第2章 时间序列的预处理拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。2.1 平稳性检验2.1.1 特征统计量平稳性是某些时间序列具有的一种统计特征。要描述清楚这个特征,我们必须借助如下统计工具。一、概率分布数理统计的基础知识告诉我们分布函数或密度函数能够完整地描述一个随 机变量的统计特征。同样,一个随机 变量族的统计特性也完全由它们的联 合分布函数或联合密度函数决定。对于时间序列Xt,tT,这样来定义它的概率分布:任取正整数 m,任取t1,t2,tmT,则m 维
2、随机向量Xt1,Xt2,Xtm 的联合概率分布记为Ft1,t2,t(,由这些有限维分布函数构成的全体。x1,x2,xm)mFt1,t2,t(,m正整数,t1,t2,tmT 就称为序列Xtx1,x2,xm)m的概率分布族。概率分布族是极其重要的统计特征描述工具,因为序列的所有统计性质理论上都可以通过 概率分布推测出来,但是概率分布族的重要 性也就停留在这样的理论意义上。在实际应用中,要得到序列的联合概率分布几乎是不 可能的,而且联合概率分布通常涉及非常复 杂的数学运算,这些原因使我们很少直接使 用联合概率分布进行时间序列分析。二、特征统计量一个更简单、更实用的描述时间序列统计特征的方法是研究该序
3、列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机 序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些统计量的统计特性,推断出随机序列的性质。1.均值对时间序列Xt,tT而言,任意时刻的序列值Xt都是一个随机变量,都有它自己的概率分布,不妨记为Ft(x)。只要满足条件-xdFt(x)就一定存在着某个常数t,使得随机变量Xt总是围绕在常数值t附近做随机波动。我们称t为序列Xt在 t 时刻的均值函数。xdFt(x)t=EXt=-当 t 取遍所有的观察时刻
4、时,就得到一个均值函数序列t,tT。它反映的是时间序列Xt,tT每时每刻的平均水平。2.方差当-xdF可以定义时间序列的方差函数用以描述序列值围绕其均值t(x)时,做随机波动时的平均波动程度。2t2 DXt E(Xtt)2(xt)dFt(x)同样,当 t 取遍所有的观察时刻时,我们得到一个方差函数序列t2,tT。类似于协方差函数和相关系数的定义,在时间序列分析中我们定义自协方差函数autocovariance function和自相关系数autocorrelation coefficient的概念。对于时间序列Xt,tT,任取t,sT,定义t,s为序列Xt的自协方差函数:(t,s)E(Xtt)
5、(Xss)定义(t,s)为时间序列Xt的自相关系数,简记为ACF。(t,s)(t,s)DXtDXs之所以称它们为自协方差函数和自相关系数,是因为通常的协方差函数和相关系数度量的是两个不同事件彼此之间的相互影响程度,而自协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。2.1.2平稳时间序列的定义平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。一、严平稳所谓严平稳strictly stationary就是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质不会随时间的推移而发生变化时,该
6、序列才能被认为平稳。而我们知道,随机变量族的统计性质完全由它们的联合概率分布族决定。所以严平稳时间序列的定义如下:定义 2.1 设Xt为一时间序列,对任意正整数m,任取t1,t2,tmT,对任意整数,有Ft1,t2,t(x1,x2,xm)=Ftm1,t2,tm(x1,x2,xm)则称时间序列Xt为严平稳时间序列。前面说过,在实践中要获得随机序列的联合分布是一件非常困难的事,而且即使知道随机序列的联合分布,计算和应用也非常不便。所以严平稳时间序列通常只具有理论意义,在实践中用得更多的是条件比较宽松的宽平稳时间序列。二、宽平稳宽平稳weak stationary是使用序列的特征统计量来定义的一种平
7、稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证效率低阶矩平稳二阶,就能保证序列的主要性质近似稳定。定义 2.2 如果Xt满足如下三个条件:2(1)任取 tT,有EXT(2)任取 tT,有EXt,为常数;(3)任取 t,s,kT,且 k+s-tT,有(t,s)=(k,k+s-t)则称Xt为宽平稳时间序列。宽平稳也称为弱平稳或二阶平稳second-order stationary。显然,严平稳比宽平稳的条件严格。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序
8、列不能反推严平稳成立。但这不是绝对的,两种情况都有特例。比方服从柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶矩,所以无法验证它二阶平稳。严格地讲,只要存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。宽平稳一般推不出严平稳,但当序列服从多元正态分布时,则二阶平稳可以推出严平稳。定义2.3 时间序列Xt称为正态时间序列,如果任取正整数n,任取t1,t2,tnT,相对应的有限维随机变量X1,X2,.,Xn服从 n 维正态分布,密度函数为:1 1ft1,t2,.,tn(Xn)(2)2|n|2exp(Xn)nn(Xnn)2n1其中,Xn,EX2,EXn);n为协方差阵:(X1,X2,X
9、n);n(EX1(t1,t1)(t1,t1)(t2,t1)(t2,t1)n.(t,t)(t,t)n1n1.(t1,tn).(t2,tn).(tn,tn)从正态随机序列的密度函数可以看出,它的 n 维分布仅由均值向量和协方差阵决定,即对正 态随机序列而言,只要二阶矩平稳了,就等于分布 平稳了,所以宽平稳的正态序列一定是严平稳时间序列。对于非正态过程,就没有这个性质了在实际应用中,研究最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特别注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为非平稳序列。2.1.3平稳时间序列的统计性质根据平稳时间序列的定义,可以推断出它一定具有如下两个重
10、要的统计性质。一、常数均值EXt,tT二、自协方差函数和自相关系数只依赖于时间的平移长度而与时间的起止点无关(t,s)(k,k st),t,s,k T根据这个性质,可以将自协方差函数由二维函数(t,s)简化为一维函数(s t):(st)(t,s),t,sT由此引出延迟 k 自协方差函数的概念。定义 2.4对于平稳时间序列Xt,tT,任取 t(t+kT),定义(k)为时间序列Xt的延迟 k 自协方差函数:(k)(t,t k)根据平稳序列的这个性质,容易推断出平稳随机序列一定具有常数方差:DXt(t,t)(0),tT由延迟 k 自协方差函数的概念可以等价得到延迟k 自相关系数的概念:k(t,t k
11、)DXtDXtk(k)(0)容易验证和相关系数一样,自相关系数具有如下三个性质:(1)标准性01且k1,kkk(2)对称性(3)非负定性对任意正整数 m,相关阵m为对称非负定阵。01mm110m2m1m20值得注意的是,k除了具有上述三个性质外,还具有一个特别的性质:对应模型的非唯一性。一个平稳时间序列一定唯一决定了它的自相关函数,但它的自相关函数未必唯一对应着一个平稳的时间序列。我们在后面的章节中将证明这一点。这个性质就给我们根据样本的自相关系数的特点来确定模型增加了一定的难度。2.1.4平稳时间序列的意义时间序列分析方法作为数理统计学的一个分支,遵循数理统计学的基本原理,都是利用样本信息来
12、推测总体信息。传统的统计分析通常都拥有如下数据结构,见表2-1。表 2-1随机变量样本12.n根据数理统计学常识,显然要分析的随机变量越少越好m 越小越好,而每个变量获得的样本信息越多越好n 越大越好。因为随机变量越少,分析的过程越简单,而样本容量越大,分析的结果就会越可靠。但是时间序列分析的数据结构有它的特殊性。对随机序列.,X1,X2,.,Xt,.而言,它在任意时刻 t 的序列值Xt都是一个随机变量,而且由于时间的不可重复性,该变量在任意一个时刻只能获得唯一的样本观察值。因为时间序列分析的数据结构如下,见表 2-2。表 2-2随机变量样本1由于样本信息太少,如果没有其他的辅助信息,通常这种
13、数据结构是没有方法进行分析的。而序列平稳性概念的提出可以有效地解决这个问题。在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值数列.X1x11x12.Xmxm1xm2.x1nxnmX1x1.Xtxt.t,tT,tT变成了一个常数序列原本每个随机变量的均值t(tT)只能依靠唯一的一个样本观察值xt去估计t xt现在由于t(tT),于是每一个样本观察值xt(tT),都变成了常数均值的样本观察值 x xi1nin这极大地减少了随机变量的个数,并增加了待估参数的样本容量。换句话说,这大大降低了时序分析的难度,同时也提高了对均值函数的估计精度。同理,根据平稳序列二阶矩平稳的性质,可以
14、得到基于全体观察样本计算出来的延迟k自协方差函数的估计值(k)n(xt1nkt x)(xtk x)nk,0 k n并进一步推导出总体方差的估计值2(x x)tt10n1和延迟 k 自相关系数的估计值k(k),0 k n(0)当延迟阶数 k 远远小于样本容量 n 时,k(xt1nkt x)(xtk x)t(xt1n x)2,0 k n2.1.5平稳性的检验对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。图检验方法是一种操作简便、运用广泛的平稳性判别方法,它的缺点是判别结论带有很强的主观色彩。所以最好能用统计检验方法加
15、以辅助判断。目前最常用的平稳性统计检验方法是单位根检验unit root test。由于目前知识的局限性,本章将主要介绍平稳性的图检验方法,单位根检验将在第6 章详细介绍。一、时序图检验所谓时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。根据这个性质,对于很多非平稳序列,可以通过查看它的时序图将其识别出来。例 2-1
16、绘制 1964-1999 年中国纱年产量序列时序图数据见表A1-4。时序图如图 2-1 所示。图 2-1中国纱年产量时序图时序图给我们提供的信息非常明确,中国纱年产量序列有明显的递增趋势,所以它不一定不是平稳序列。例 2-2绘制 1962 年 1 月至 1975 年 12 月平均每头奶牛月产奶量序列时序图数据见表A1-5时序图如图 2-2 所示。图 2-2平均每头奶牛月产奶量序列时序图时序图清晰地显示平均每头奶牛的月产奶量以年为周期呈现出规则的周期性,除此之外,还有明显的逐年递增的趋势。显然该序列也不一定不是平稳序列。例 2-3绘制 1949-1998 年北京市每年最高气温序列时序图数据见表A
17、1-6时序图如图 2-3 所示。图 2-3北京市每年的最高气温时序图时序图显示北京市每年的最高气温始终围绕在 37附近随机波动,没有明显趋势或周期,基本可以视为平稳序列。为了稳妥起见,我们还需要利用自相关图进一步辅助识别。二、自相关图检验自相关图是一个平面二维坐标悬垂线图,一个坐标轴表示延迟时期数,另一个坐标轴表示自相关系数,通常以悬垂线表示自相关系数的大小。在后面的章节里我们会证明平稳序列通常具有短期相关性。该性质用自相关系数来描述k会很快地衰减向零。反之,非平稳就是随着延迟期数 k 的增加,平稳序列的自相关系数k衰减向零的速度通常比较慢,这就是我们利用自相关图进行平稳性判序列的自相关系数断
18、的标准。例 2-1 续绘制 1964-1999 年中国纱年产量序列自相关图。自相关图如图 2-4 所示。图 2-4中国纱年产量序列自相关图该图横轴表示自相关系数,纵轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。从图中我们发现序列的自相关系数递减到零的速度相当缓慢,在很长的延迟时期里,自相关系数一直为正,而后,又一直为负,在自相关图上显示出明显的三角对称性,这是具有单调趋势的非平稳序列的一种典型的自相关图形式。这和该序列时序图图2-1显示的显著的单调递增性是一致的。例 2-2 续绘制 1962 年 1 月至 1975 年 12 月平均每头奶牛的月产奶量序列自相关图。自相关图如图 2-5
19、 所示。图 2-5平均每头奶牛的月产奶量序列自相关图自相关图显示序列自相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征,同时自相关图呈现出明显的正弦波动规律,这是具有周期变化规律的非平稳序列的典型特征。自相关图显示出来的这两个性质和该序列时序图图2-2显示出的带长期递增趋势的周期性质是非常吻合的。例 2-3 续1绘制 1949-1998 年北京市每年最高气温序列自相关图。自相关图如图 2-6 所示。自相关图显示该序列的自相关系数一直都比较小,始终控制在2 倍的标准差范围以内,可以认为该序列自始至终都在零轴附近波动,这是随机性非常强的平稳时间序列通常具有的自相关图特征。2.2纯随机性检
20、验拿到一个观察值序列之后,首先是判断它的平稳性。通过平稳性检验,序列可以分为平稳序列和非平稳序列两大类。对于非平稳序列,由于它不具有二阶矩平稳的性质,所以对它的统计分析要周折一些,通常要进行进一步的检验、变换或处理之后,才能确定适当的拟合模型。如果序列平稳,情况就简单多了,我们有一套非常成熟的平稳序列建模方法。但是,并不是所有的平稳序列都值得建模。只有那些序列值之间具有密切的相关关系,历史数据对未来的发展有一定影响的序列,菜值得我们花时间去挖掘历史数据中的有效信息,用来预测序列未来的发展。如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响
21、,这种序列称为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。为了确定平稳序列还值不值得继续分析下去,我们需要对平稳序列进行纯随机性检验。2.2.1纯随机序列的定义定义 2.5 如果时间序列Xt满足如下性质:(1)任取 tT,有EXt(2)任取 t,sT,有(t,s)2,t s,t s0称序列Xt为纯随机序列,也称为白噪声white noise序列,简记为XtWN(,2)。之所以称之为白噪声序列,是因为人们最初发现白光具有这种特性。容易证明白噪声序列一定是平稳序列,而且是最简单的平稳序列。例 2-4随机产生 1000 个服从标准正态分布的白噪声序列观察值,并绘制时序图。时
22、序图如图 2-7 所示。图 2-7标准正态白噪声序列时序图2.2.2白噪声序列的性质白噪声序列虽然很简单,但它在我们进行时间序列分析时所起的作用却非常大。它的两个重要性质在后面的分析过程中要经常用到。一、纯随机性由于白噪声序列具有如下性质:(k)0,k 0这说明白噪声序列的各项之间没有任何相关关系,这种“没有记忆”的序列就是纯随机序列。纯随机序列各项之间没有任何关联,序列在进行完全无序的随机波动。一旦某个随机事件呈现出纯随机波动的特征,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析了。如果序列值之间呈现出某种显著的相关关系:(k)0,k 0就说明该序列不是纯随机序列,该序列
23、间隔 k 期的序列值之间存在着一定程度的相互影响关系,这种相互影响关系,统计上称为相关信息。我 们分析的目的就是要想方设法把这种相关信息 从观察值序列中提取出来。一旦观察值序列中 蕴含的相关信息被我们充分提取出来了,那么 剩下的残差序列就应该呈现出纯随机的性质。所以纯随机性还是我们判断相关信息是否提取 充分的一个判别标准。二、方差齐性所谓方差齐性,就是指序列中每个变量的方差都相等,即DXt(0)2如果序列不满足方差齐性,就称该序列具有异方差性质。在时间序列分析中,方差齐性是一个非常重要的限制条件。因为根据马尔可夫定理,只有方差齐 性假定成立时,用最小二乘法得到的未知参数估 计值才是准确的、有效
24、的。如果假定不成立,最 小二乘估计值就不是方差最小线性无偏估计,拟合模型的预测精度会受到很大影响。所以我们在进行模型拟合时,检验内容之一就是要检验拟合模型的残差是否满 足方差齐性假定。如果不满足,那就说 明残差序列还不是白噪声序列,即拟合模型没有充分提取随机序列中的相关信 息,这时拟合模型的精度是值得疑心的。在这种场合下,我们通常需要使用适当的条件异方差模型来处理异方差信息。2.2.3纯随机性检验纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的一 种方法。我们知道如果一个序列是纯随机序列,那它的序列值之间应该没有任何相关关系,即满足(k)0,k 0这是一种理论上才会出现的理想
25、状态。实际上,由于观测值序列的有限性,导致纯随机序列的样本自相关系数不会绝对为零。例 2-4 续1绘制例 2-4 标准正态白噪声序列的样本自相关图。自相关图如图 2-8 所示。图 2-8白噪声序列样本自相关图样本自相关图显示这个纯随机序列没有一个样本自相关系数严格等于零。但这些自相关系数确实都非常小,都在零值附近以一个很小的幅度做着随机波动。这就提醒我们应该考虑样本自相关系数的分布性质,从统计意义上来判断序列的纯随机性质。Barlett 证明,如果一个时间序列是纯随机的,得到一个观察期数为n 的观察序列xt,t 1,2,.,n,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序
26、列观察期数倒数的正态分布,即k N(0,),k 0式中,n 为序列观察期数。根据 Barlett 定理,我们可以构造检验统计量来检验序列的纯随机性。一、假设条件由于序列值之间的变异性是绝对的,而相关性是偶然的,所以假设条件如下确定。原假设:延迟期数小于或等于期的序列值之间相互独立。备择假设:延迟期数小于或等于期的序列 值之间有相关性。该假设条件用数学语言描述即为:H0:12.m 0,m 1H1:至少存在某个k 0,m 1,k m二、检验统计量为了检验这个联合假设,Box 和 Pierce 推导出了 Q 统计量:Q n1nk1m2k式中,n 为序列观察期数;m 为指定延迟期数。根据正态分布和卡方
27、分布之间的关系,我们很容易推导出 Q 统计量近似服从自由度为m 的卡方分布:Q nk1m2k2(m)当 Q 统计量大于12-(m)分位点,或该统计量的 P 值小于时,则可以以1-的置信水平拒绝原假设,认为序列为白噪声序列;否则,接受原假设,认为该序列为纯随机序列。2.LB 统计量在实际应用中人们发现Q 统计量在大样本场合n 很大的场合检验效果很好,但在小样本场合就不太精确。为了弥补这一缺陷,Box 和 Ljung 又推导出 LBLjung-Box统计量:k2LB n(n2)nkk1m式中,n 为序列观测期数;m 为指定延迟期数。Box 和 Ljung 证明 LB 统计量同样近似服从自由度为m
28、的卡方分布。实际上 LB 统计量就是 Box 和 Pierce 的 Q 统计量的修正,所以人们习惯把它们统称为Q统计量,分别记作QBP统计量和QLB统计量,在各种检验场合普遍采用的 Q 统计量通常指的都是 LB 统计量。例 2-4 续2计算例 2-4 中白噪声序列延迟 6 期、延迟 12 期的QLB统计量的值,并判断该序列的随机性 0.05。由图 2-8 微米可以得到该序列延迟12 期样本自相关系数,数据如下,见表2-3.表 2-3延迟期数 k172839410511612k延迟期数 kk根据上述数据,很容易计算出表2-4 的结果。表 2-4QLB统计量检验延迟QLB统计量值延迟 6 期延迟
29、12 期P 值由于 P 值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。换言之,我们可以认为该序列的波动没有任何统计规律可循,因而可以停止对该序列的统计分析。还需要解释的一点是,为什么在本例中只检验了前 6 期和前 12 期延迟的 Q 统计量和LB 统计量就直接判断该序列是白噪声序列呢?为什么不进行全部999 期延迟呢?这是因为平稳序列通常具有短期相关性,如果序列值之间存在显著的相关关系,通常只存在于延迟时期比较短的序检验结果列值之间。所以,如果一个平稳序列短期延迟的序列值之间都不存在显著的相关关系,通常长期延迟之间就更不会存在显著的相关关系。另一方面,假设一个平稳序列显示出显著的短期
30、相关性,那么该序列就一定不是白噪声序列,我们就可以对序列值之间存在的相关性进行分析。假设此时考虑的延迟期数太长,反而可能 淹没了该序列的短期相关性。因为平稳序列只要延迟期足够长,自相关系数都会收敛于零。例 2-3 续2对 1949-1998 年北京市最高气温序列做白噪声检验 0.05。检验结果见表 2-5。表 2-5延迟延迟 6 期延迟 12 期LB 统计量检验LB 统计量值P 值根据这个检验结果,不能拒绝序列纯随机的原假设。因而可以认为北京市最高气温的变动属于纯随机波动。这说明我们很难根据历史信息预测未来年份的最高气温。至此,对该序列的分析也就结束了。例 2-5对 1950-1998 年北京
31、市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验数据见表 A1-7。(1)绘制该序列时序图。时序图如图 2-9 所示。图 2-9北京市城乡居民定期储蓄所占比例序列时序图该时序图显示北京市城乡居民定期储蓄始终占储蓄存款余额的 80%左右,波动比较平稳。2自相关图检验。考察该序列的样本自相关图,进一步检验该序列的平稳性。自相关图如图 2-10 所示。样本自相关图显示延迟 3 阶之后,自相关系数都落入 2 倍标准差范围之内,而且自相关系数向零衰减的速度非常快,延迟 8 阶之后自相关系数即在零值附近波动。这是一个非常典型的短期相关的样本自相关图。由时序图的样本自相关图的性质,可以认为该序列平稳
32、。(3)纯随机性检验 0.05。检验结果见表 2-6.图 2-10北京市城乡居民定期储蓄所占比例序列自相关图表 2-6延迟期数LB 统计量检验LB 检验统计量的值P 值612检验结果显示,在各阶延迟下 LB 统计量的 P 值都非常小99.999%断定北京市城乡居民定期储蓄所占比例序列属于非白噪声序列。结合前面的平稳性检验结果,说明该序列不仅可以视为是平稳的,而且还蕴含着值得提取的信息。这种平稳非白噪声序列是目前最容易分析的一种心理,下一章我们就要详细介绍对这种平稳非白噪声序列的建模及预测方法。2.3习题1.考虑序列1,2,3,4,5,20:(1)判断该序列是否平稳;(2)计算该序列的样本自相关
33、系数k(k=1,2,6);(3)绘制该样本自相关图,并解释该图形。2.1975-1980 年夏威夷岛莫那罗亚火山 Mauna Loa 每月释放的CO2数据如下 单位:ppm见表 2-7(行数据)。表 2-7330.45330.97331.64332.87333.61333.55331.90330.05328.58328.31329.41330.63331.63332.46333.36334.45334.82334.32333.05330.87329.24328.87330.18331.50332.81333.23334.55335.82336.44335.99334.65332.41331.3
34、2330.73332.05333.53334.66335.07336.33337.39337.65337.57336.25334.39332.44332.25333.59334.76335.89336.44337.63338.54339.06338.95337.41335.71333.68333.69335.05336.53337.81338.16339.88340.57341.19340.871绘制该序列时序图,并判断该序列是否平稳。k(k=1,2,24)。2计算该序列的样本自相关系数3绘制该样本自相关图,并解释该图形。3.1945-1950 年费城月度降雨量数据如下单位:mm,见表 2-8
35、行数据表 2-869.380.040.974.984.6101.1225.095.3100.648.3144.5128.338.452.368.637.1148.6218.7131.6112.881.831.047.570.196.861.555.6171.7220.5119.463.2181.673.964.8166.948.0137.780.5105.289.9174.8124.086.4136.931.535.3112.3143.0160.897.080.562.5158.27.6165.9106.792.263.226.277.0k(k=1,2,24)。(1)计算该序列的样本自相关系数
36、(2)判断该序列的平稳性。(3)判断该序列的纯随机性。4.假设序列长度为 100,前 12 个样本自相关系数如下:1=0.022=0.053=0.104=-0.025=0.0567=0.128=-0.069=0.0810=-0.0511=0.0212该序列能否视为纯随机序列 0.05?5.表 2-9 数据是某公司在 2000-2003 年期间每月的销售量。表 2-9月份123452000 年1531872342123002001 年1341752432272982002 年1452031892142952003 年1171781491782486789101112221201175123104
37、85782562371651241068774220231174119856774202162135120969063(1)绘制该序列时序图及样本自相关图。(2)判断该序列的平稳性。(3)判断该序列的纯随机性。6.1969 年 1 月至 1973 年 9 月在芝加哥海德公园内每 28 天发生的抢包案件数见表 2-10行数据。表 2-101014332691615183332118103121717810919191271211161381210101920146761924141071212121281014346510141015148582536610172929123(1)判断该序列xt
38、的平稳性及纯随机性。(2)对该序列进行函数运算:yt xt xt1并判断序列yt的平稳性及纯随机性。2.4上机指导2.4.1绘制时序图在 SAS 系统中,使用 GPLOT 程序可以绘制多种精美的时序图,以表2-11 数据为例,介绍 GPLOT 程序的基本命令。表 2-1Time2004 年 7 月2004 年 8 月2004 年 9 月2004 年 10 月2004 年 11 月2004 年 12 月data example2_1input price1 price2time=intnx(month,01jul2004d,_n_-1);format time date.;cards;Price
39、1Price2;proc gplot data=example2_1;plot price1*time=1 price2*time=2/overlay;symbol1 c=black v=star i=join;symbol2 c=red v=circle i=spline;run;语句说明:1“proc gplot data=example2_1;”是告诉系统,下面将准备对临时数据集example2_1中的数据绘图。(2)“plot price1*time=1 price2*time=2/overlay;”是要求系统要绘制两条时序曲线,第一条是以 price1 为纵坐标,time 为横坐标,
40、以 symbol1 语句所规定的格式绘制。第二条是以price2 为纵坐标,time 为横坐标,以 symbol2 语句所规定的格式绘制。Overlay 选项指令系统将这两条时序线绘制在同一张图中,同时显示。如果没有overlay 选项,系统将这两条时序线分页输出。(3)“symbol1 c=black v=star i=join;”,symbol语句是专门指令绘制的格式,一个GPLOT程序中允许使用多个 symbol 语句,所以就有了 symbol 1,symbol2,。Symbol 语句中有许多项选择项,最常用的三大选项是:C图线颜色,可以自由选择red红色,black黑色,green绿色,blue蓝色,pink粉红色等各种颜色。V表示观察值的图形,可自由选择 star星号,dot点,circle圆圈,diamond菱形等各种形状,也可选择none不使用特别图形标注观察值。I观察值之间的连线方式,可自由选择 join 线性连接,spline 光滑连接,needle作观察值到横轴的悬垂线等各种连线方式,也可选择none不作任何连接。本例出书的时序图见图 2-11。