《第八章时间序列分析课件.pptx》由会员分享,可在线阅读,更多相关《第八章时间序列分析课件.pptx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章时间序列分析第1页,此课件共29页哦第八章1 随机过程随机时间序列与随机过程由一串不同时刻的随机变量x1,x2,所构成的序列称为随机时间序列,用xt(t=1,2,)来表示。当随机时间序列中的时间t是连续变化时,就称为随机过程,记为X(t),是时间t的函数。自然界的变化过程可分为两大类:确定过程确定过程和随机过程随机过程。如果每次试验所得到观测过程都相同,且都是时间t的一个确定的函数,具有确定的变化规律,这种过程就称为“确定过程确定过程”。如果每次实验所得到的观测的过程都不同,是时间t的不同的函数,实验前无法预知这次实验会随时间呈现怎样的过程,这种过程就称为:“随机过程随机过程”。即:“随
2、机时间序列”是“随机过程”的离散形式。第2页,此课件共29页哦 月月年年一一二二三三四四五五六六七七八八九九十十十一十一十二十二1951-2.2-0.54.39.716.020.723.625.421.917.78.44.519520.4-1.43.710.416.220.524.224.121.415.68.8-0.41953-2.30.04.710.716.120.624.725.822.418.58.42.519540.30.53.69.714.619.022.024.621.315.111.1-1例表8.1:青岛市逐年年各月平均气温表格中的任一行表示气温在一年中的变化,可认为是在相同条
3、件下所做的一次独立实验。气温随时间的演变过程是连续的,虽存在春夏秋冬的周期性规律,但是每年的过程都不完全相同。每次实验结果都是t的不同的函数,具有随机性,所以气温的变化过程就是一种“随机过程”。固定表中的某一列(同一个月份),可以视为是在一定条件下的随机变量序列,称为“静态时间序列”(具有相同的期望,冬天低,夏天高)。第3页,此课件共29页哦截口截口截口截口而对于某一时刻tj来说,随机过程就表现为一个随机变量随机变量,记为X(tj),称为随机过程的一个“截口”。名词:现实:现实:现实:现实:针对随机过程X(t)的某一次观测过程,称为随机过程X(t)中的一个观测“现实”(realization)
4、,或称“样本函数”,用小写字母表示,记为x(t)。月月年年一一二二三三四四五五六六七七八八九九十十十一十一十二十二1951-2.2-0.54.39.716.020.723.625.421.917.78.44.519520.4-1.43.710.416.220.524.224.121.415.68.8-0.41953-2.30.04.710.716.120.624.725.822.418.58.42.519540.30.53.69.714.619.022.024.621.315.111.1-1第4页,此课件共29页哦随机时间序列的统计特征随机时间序列的统计特征1 均值函数均值函数随机时间序列X在
5、任一指定时刻t表现为一个随机变量,它的期望记为:E(X(t),该随机变量可以随机地取任意值,设它的各种取值的概率密度函数为:f(x,t),则有:各个观测现实(样本函数)都围绕着均值函数摆动;均值函数反映了各个时刻X(t)的摆动中心,它是X(t)的所有现实在t时刻的总平均。因此,(t)是个确定性的t函数。对表8.1来说,对每列求平均就得到了(t)的估计。(t)称为随机过程X(t)的数学期望。由于(t)是t的函数,因此被称为“期望函数期望函数”或“均值函数均值函数”。第5页,此课件共29页哦2 方差函数方差函数随机过程的某一个截口处,为一个随机变量X(t),该随机变量取值的变化程度,可用方差来衡量
6、,这就是随机过程的方差函数。方差函数也是时间t 的确定性的函数,反映了每个截口处取值的变动情况,即相对于均值函数的离散程度。注意:即使两个随机过程的均值函数和方差函数都完全一样,那么他们仍可能具有完全不同的特点,如下图A与B中两个随机过程(每条曲线为一个现实)。(A)(A)(B)(B)A与B具有几乎相同的均值和方差函数,但内部结构却是完全不同的。A中每个现实的变化较为缓慢,在t1和t2时刻具有相关性;B则是无规则的大幅波动。这种内部结构的描述可通过协方差(或相关)函数来实现。第6页,此课件共29页哦3.协方差函数和相关函数协方差函数和相关函数随机过程在任两个时刻(截口)t1和t2表现为两个随机
7、变量,这两个随机变量可以存在相关性,即存在协方差协方差和相关系数相关系数。K(t1,t2)称为自协方差函数,简称为协方差函数。当t1=t2=t时,自协方差函数就是随机过程在第t时刻的方差。t1和t2时刻的相关系数相关系数为:(t1,t2)称为自相关函数,简称为相关函数,表示随机过程X(t)在不同时刻t1和t2之间线性相关的程度。它们的协方差协方差为:第7页,此课件共29页哦第八章2 平稳时间序列及其遍历性平稳随机过程平稳随机过程如果随机过程的统计特性不随时间的推移而变化,即其均函数是与t无关的常数:并且,协方差函数仅仅与时间间隔有关,而与t的起始点位置无关,即:这种随机过程称为:“广义平稳随机
8、过程广义平稳随机过程”或“宽平稳随机过程宽平稳随机过程”。相应的时间序列资料称为:“宽平稳时间序列”。有“广义平稳”或“宽平稳”序列,相应地也就有“狭义平稳”或“严平稳”序列。严平稳序列的“严格之处”是指:它要求随机过程的全部概率特性(包括概率密度f(x,t)在任意t时刻都要相同。对气象要素的变化过程而言,严平稳过程的条件难以满足。从实际意义的角度来说,我们并不需要考虑全部概率特性的平稳,只要求宽平稳就足够了。以后谈到“平稳时间序列”时,主要是指“宽平稳时间序列”而言。第8页,此课件共29页哦平稳随机过程中有一个较广的应用白噪声过程白噪声过程对于一个零均值零均值的随机过程a,若其方差满足:则称
9、此随机过程为:白噪声过程白噪声过程。白噪声表示不含有任何规律性波动的纯随机过程,可认为白噪声没有“记忆”。常用白噪声过程来表示“随机误差”。当资料为离散的时间序列资料时,称为“白噪声序列”。“白噪声”名字的来源:类似物理上的白色光,白色光是由强度相同的各种波长的颜色谐波共同组成;白噪声就是由强度相同的各种频率的振动共同组成的随机序列。第9页,此课件共29页哦平稳随机过程的基本统计特征不随时间改变,如何来估计这些统计特征?根据定义,若对随机过程进行观测,获得了n个观测现实,以xj(ti)表示第j个观测现实在ti截口的取值,则可对随机过程的统计特征作出如下估计:以上统计量的计算要依赖于n个现实,但
10、在很多实际问题中,我们能观测到的只有一个一个一个一个现实,于是产生一个想法:能否用一个一个现实来代替多个多个现实,以估计随机过程的统计特征?注意此处的n代表现实的个数;第10页,此课件共29页哦要想用一个一个现实来估计随机过程的统计特征,该现实需要满足条件条件:该现实要能经历(遍历)随机过程各种可能的状态。图图A图图B比较图A与图B所示的两种平稳随机过程。图中每条曲线代表一个现实。q平稳随机过程A:每个现实都围绕着随机过程的均值波动,且他们的平均振幅都差不多,该随机过程的一个现实就可以近似代表整个随机过程的属性。q平稳随机过程B:每个现实都围绕不同的数学期望波动,且振幅也不一致,仅仅靠一个现实
11、无法代表整个随机过程的特性。类似平稳随机过程A这样,对于任意一个现实,只要观测时间足够长,就可把该现实的时间平均作为整个随机过程总体均值的近似值,具有这种性质的平稳随机过程就称其具有“各态历经性各态历经性”(或“各各态遍历性态遍历性”)。第11页,此课件共29页哦对于具有各态遍历性的平稳过程,用“一个现实”来确定其统计特征时,求平均的时间区间取得越长,其估计误差就越小。因此,对气象问题来说,凡是具备各态历经性的平稳过程,就可以用一个充分长的现用一个充分长的现实来代替多个现实实来代替多个现实。由这一个一个现实的时间平均来代替多个多个现实的总平均来估算期望函数或协方差函数等统计特征。设某具有各态遍
12、历性的平稳时间序列,若有一个充分长的观测现实,x1,x2,xn,则其均值函数的估计值为:对“各态历经性(遍历性)”的理解各态历经性是建立在平稳随机过程的每一个现实几乎可以代表所有可能现实的基础上的,或者说,一个充分长的现实能近似代替短时间内各现实的总体。各态遍历性的应用各态遍历性的应用第12页,此课件共29页哦时滞为的自协方差函数的估计值为:自相关函数的估计值为:特别地,当=0时,协方差变为方差s2:自相关函数还可写为标准化数据的自协方差函数:要验证某随机过程是否为“各态历经性”,比较困难;通常假设所研究的平稳过程具有各态历经性,然后从这个假设出发,计算时间序列的各种统计特征。注意此处的n代表
13、一个现实(时间序列)的长度,而非现实的个数;第13页,此课件共29页哦第8章3 平稳时间序列预报如何对平稳时间序列做预报?时间序列某个时刻的取值,可能与前一时刻的取值有关,于是可建立回归模型,寻找变量在不同时刻的联系,因此这种回归模型称为自回归模型自回归模型(Autoregressive(AR)Model)。一阶自回归模型一阶自回归模型表示要素在某一时刻与前一时刻之间的线性回归模型,称为一阶自回归模型,记为AR(1)。对随机时间序列xt(设已中心化),有:用前一时刻的xt-1乘以上式两边,然后取数学期望,得:Xt-1只与前一时刻的白噪音有关,而与后面(t)时刻的白噪音无关。第14页,此课件共2
14、9页哦于是,一阶自回归模型可写为:由以上递推公式知,第t-1时刻可写为:将xt-1的表达式代入xt的表达式:依此类推,第t时刻的xt与第t-时刻的xt-的关系可表示为:这表征了落后时刻与落后1时刻的自相关函数的关系。这表明:某时刻的气象要素还可看成是前期无穷多白噪声共同影响的结果。第15页,此课件共29页哦符合一阶自回归模型一阶自回归模型一阶自回归模型一阶自回归模型的随机过程,被称为:红噪声红噪声过程过程(又称为“马尔可马尔可夫过程夫过程”),第t时刻的xt仅与前一时刻的xt-1有关。红噪声就是指:过程在tt0时刻所处的状态与过程在t0之前(tt0)所处的状态无关,只与第t0时刻的状态有关。通
15、俗地说,在已经知道“现在”的条件下,要想推测“未来”无需依赖“过去”。红噪声没有任何周期性。反映了信号的时间延续性。红噪声红噪声红噪声红噪声过程过程第16页,此课件共29页哦设具有各态历经性的标准化标准化标准化标准化平稳时间序列为:x1,x2,x3,,xn 要预报第t时刻的值,利用前期第t-1,t-2,t-p,共p个时刻的值作为因子变量,建立多元回归方程,即:以上多元自回归模型称为:p阶自回归模型,记为AR(p)。p阶自回归模型第17页,此课件共29页哦p阶自回归系数的估计为求解回归系数,类似AR(1)模型,用xt-1,xt-2,xt-p依次乘以上式的两端,并取数学期望,可以得到 p个方程。首
16、先考察第1个方程,即用xt-1乘以上式两端,并取期望,得:通过以上分析可知,第一个方程可以写为:第18页,此课件共29页哦可得方程组:写成矩阵形式,并利用0=1:以上求解自回归系数的多元回归方程正规方程组称为:尤拉-沃尔克(Yule-Walker)方程。同理,对第二个方程两边同乘以xt-2,然后取期望,可写为:同理,第p个方程两边同乘以xt-p,然后取期望,可写为:与多元回归的正规方程组本质上相同。第19页,此课件共29页哦在实际中,我们要利用平稳时间序列的一个样本现实一个样本现实,求解自回归系数。自回归方程的经验形式,可写成:实际计算时,利用标准化序列计算自相关函数,得到自相关函数的估计值,
17、记为:于是,把换成r,求解自回归系数的尤拉-沃尔克方程写为:第20页,此课件共29页哦不同形式的自回归方程前面推导的自回归预报方程是标准化标准化变量的,若将上式两端乘以序列的标准差s,即得到自回归的距平形式距平形式:将上式加上时间序列的均值,即为自回归的原值形式原值形式(为方便记符,等号右侧采用与距平变量相同的符号):可见,自回归预报方程,无论是原值形式、距平形式、还是标准化形式,自回归系数都是相同的。多元回归的标准化变量与距平变量形式的回归方程具有不同的回归系数,而自回归具有相同的回归系数,本质上是因为:xt、xt-1 等具有相同的标准差。回忆:不同形式的多元回归的回归系数是怎样的?第21页
18、,此课件共29页哦例:某台站有15年(1978-1992)的年降水资料,并假设是具有各态遍历性的平稳时间序列,试建立AR(3)模型,并外推下一年的值。因为要建立AR(3)模型,所以需要用到的自相关系数是r1,r2,r3,算得r1=-0.041,r2=-0.438,r3=-0.286;代入AR(3)模型:得:解以上方程组得:因此,距平(或标准化)形式的3阶自回归预报方程为:第22页,此课件共29页哦显著性检验显著性检验因此,该自回归方程不能通过显著性水平为0.05的检验。本例为AR(3),m=3,x序列的总长度为15,但用于实际回归方程计算的样本长度n=15-3=12第23页,此课件共29页哦利
19、用AR(3)模型,根据前三年的降水距平值可以预测下一年的距平值。例如,要估计1993年的降水距平值,就将1992、1991、1990年的降水距平值代入AR(3)模型:若要对原始值而非距平值进行预测,需在距平值的预报结果的基础上加上原始变量的均值588.57:对于该问题,1978-1992 年15年的年降水资料的均值为588.57;1990、1991、1992年的降水原始原始数据为:928.2,573.2,407.0;1990、1991、1992年的降水距平距平数据为:339.63,-15.37,-181.57;自回归递推预报第24页,此课件共29页哦递推多步的预报例如,根据AR(3)模型,如果
20、已经有了第t-1,t-2,t-3这三个时刻的观测值xt-1,xt-2,xt-3,现要预测第t+2时刻的值,应如何计算?采用自回归递推递推预报!通过递推3步,最终获得了第t+2时刻的估计值。注意:递推预报xt+2时,由于xt和xt+1的值也是通过递推预报估计出来的,带有误差,因此,最终预报的xt+2累积了误差,递推步数越多,累积的误差越大,影响预报效果。为了避免误差过度积累,递推的步数不宜太多,应该小于自回归模型的阶数。第25页,此课件共29页哦自回归递推预报举例利用前例AR(3)模型预报的1993年的降水量,进一步递推预报1994年的降水量所以,递推预报1994年降水距平的结果为92.8(mm
21、)。第26页,此课件共29页哦跳过跳过g g间隔的自回归预报模型间隔的自回归预报模型以上介绍的对时间序列递推多步递推多步进行预报,是一种间接的计算方案;除此之外,还可以通过直接建立跳过多步间隔的跳过多步间隔的自回归预报方程来进行预报。例如,现有 xt-1,xt-2,xt-3,xt-p共p个时刻的观测值,要跳过g=2个间隔进行预测,估计出第t+2时刻的值;可以仿照AR(p),直接建立xt-1与前期p个时刻的自回归模型。第27页,此课件共29页哦原AR(p)模型的正规方程组(g=0)为:跳过g间隔时,多元回归方程变为:等号两边同乘以xt-1,然后取期望,得第1个多元回归方程:所以,这时正规方程组变为:与原正规方程组相比,只是等号右边有所不同,等号左边不变。第28页,此课件共29页哦自回归选点预报有时候与xt关系最好的可能并非是与之临近的xt-1、xt-2等;如果发现xt与xt-k,xt-l,xt-m三个时刻的关系较好,则可用这三个前期值作为预报因子,建立xt的自回归预报方程,即:求解自回归系数的正规方程组为:参看例4(教材P201-202)关于时间序列分析与预报的线性回归模型,除了自回归模型AR(p)外,还有滑动平均模型MA(q),自回归滑动平均模型ARMA(p,q)等。第29页,此课件共29页哦