《数学建模——时间序列分析PPT课件.ppt》由会员分享,可在线阅读,更多相关《数学建模——时间序列分析PPT课件.ppt(187页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于数学建模关于数学建模时时间序列分析间序列分析第一张,PPT共一百八十七页,创作于2022年6月7000年前的古埃及人把年前的古埃及人把 尼罗尼罗河涨落的情况逐天记录下来,河涨落的情况逐天记录下来,就构成所谓的时间序列。对这就构成所谓的时间序列。对这个时间序列长期的观察使他们个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文从而创建了埃及灿烂的史前文明。明。引例引例第二张,PPT共一百八十七页,创作于2022年6月引例引例第三张
2、,PPT共一百八十七页,创作于2022年6月时间序列:序列:某一系某一系统在不同的在不同的时间(地点或其他条件等)的(地点或其他条件等)的响响应(数据)。(数据)。时间序列是按序列是按一定的一定的顺序序排列而成,排列而成,“一定一定顺序序”既可以既可以是是时间顺序,也可以是具有不同意序,也可以是具有不同意义的物理量。的物理量。如:如:研究高度与气研究高度与气压的关系,的关系,这里的高度就可以看作里的高度就可以看作“时间”总而言之,而言之,时间序列只是序列只是强调顺序的重要性,因此又被称序的重要性,因此又被称为“纵向数据向数据”,相,相对于于“横向数据横向数据”而言的。而言的。什么是时间序列什么
3、是时间序列第四张,PPT共一百八十七页,创作于2022年6月时间序列数据的序列数据的预处理理 平平稳性性检验 纯随机性随机性检验 平平稳时间序列数据分析序列数据分析非平非平稳时间序列数据分析序列数据分析内容提要内容提要第五张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理时间序列数据的预处理时间序列数据的预处理基本概念基本概念平稳性检验平稳性检验纯随机性检验纯随机性检验第六张,PPT共一百八十七页,创作于2022年6月概率分布概率分布的意义的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函随机变量族的统计特性完全由它们的联合分布函数或联合密度函数
4、决定数决定 时间序列时间序列概率分布族概率分布族的定义的定义几个重要几个重要数字特征数字特征:均值:均值 、方差、自协方差、自相关系数、方差、自协方差、自相关系数时间序列数据的预处理时间序列数据的预处理1 基本概念基本概念1.1 基本的数字特征基本的数字特征第七张,PPT共一百八十七页,创作于2022年6月特征统计量特征统计量均值均值 方差方差自协方差自协方差自相关系数自相关系数时间序列数据的预处理时间序列数据的预处理第八张,PPT共一百八十七页,创作于2022年6月1.2 平稳时间序列的定义平稳时间序列的定义严平稳严平稳严平稳是一种条件比较苛刻的平稳性定义,它认严平稳是一种条件比较苛刻的平稳
5、性定义,它认为只有当序列所有的统计性质都不会随着时间的为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。主要性质近似稳定。时间序列数据的预处理时间序列数据的预处理第九张,PPT共一百八十七页,创作于2022年6月满足如
6、下条件的序列称为满足如下条件的序列称为宽平稳序列宽平稳序列时间序列数据的预处理时间序列数据的预处理第十张,PPT共一百八十七页,创作于2022年6月常数均值和方差常数均值和方差 自协方差函数和自相关函数只依赖于时间的平移长度,自协方差函数和自相关函数只依赖于时间的平移长度,而与时间的起止点无关而与时间的起止点无关 延迟延迟k自协方差函数自协方差函数 延迟延迟k自相关系数自相关系数平稳时间序列的统计性质平稳时间序列的统计性质 时间序列数据的预处理时间序列数据的预处理第十一张,PPT共一百八十七页,创作于2022年6月平稳时间序列的意义平稳时间序列的意义 时间序列数据结构的特殊性时间序列数据结构的
7、特殊性可列多个随机变量,而每个变量只有一个样本观察可列多个随机变量,而每个变量只有一个样本观察值值平稳性的重大意义平稳性的重大意义极极大大地地减减少少了了随随机机变变量量的的个个数数,并并增增加加了了待待估估变变量量的的样本容量样本容量极极大大地地简简化化了了时时序序分分析析的的难难度度,同同时时也也提提高高了了对对特征统计量的估计精度特征统计量的估计精度时间序列数据的预处理时间序列数据的预处理第十二张,PPT共一百八十七页,创作于2022年6月平稳性检验主要有平稳性检验主要有两种两种方法:方法:根据时序图和自相关图显示的特征做出判断的根据时序图和自相关图显示的特征做出判断的图检验图检验方方法
8、法构造检验统计量进行构造检验统计量进行假设检验假设检验的方法。的方法。时间序列数据的预处理时间序列数据的预处理2 平稳性检验平稳性检验第十三张,PPT共一百八十七页,创作于2022年6月时序图检验时序图检验 根据平稳时间序列均值、方差为常数的性质,平稳根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势附近随机波动,而且波动的范围有界、无明显趋势及周期特征。及周期特征。自相关图检验自相关图检验 平稳序列通常具有短期相关性。该性质用自相关系数平稳序列通常具有短期相关性。该性
9、质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。数会很快地衰减向零。2.1 平稳性的图检验平稳性的图检验时间序列数据的预处理时间序列数据的预处理第十四张,PPT共一百八十七页,创作于2022年6月例例1检验检验1964年年1999年中国纱年产量序列的平稳性年中国纱年产量序列的平稳性例例2检验检验1962年年1月月1975年年12月平均每头奶牛月产奶量月平均每头奶牛月产奶量序列的平稳性序列的平稳性例例3检验检验1949年年1998年北京市每年最高气温序列的平年北京市每年最高气温序列的平稳性稳性平稳性检验平稳性检验时
10、间序列数据的预处理时间序列数据的预处理第十五张,PPT共一百八十七页,创作于2022年6月例例1 平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第十六张,PPT共一百八十七页,创作于2022年6月平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第十七张,PPT共一百八十七页,创作于2022年6月平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第十八张,PPT共一百八十七页,创作于2022年6月例例2 自相关图自相关图时间序列数据的预处理时间序列数据的预处理第十九张,PPT共一百八十七页,创作于2022年6月例例3 时序图时序图时间序列数据的预处理时间序列数
11、据的预处理第二十张,PPT共一百八十七页,创作于2022年6月例例3 自相关图自相关图时间序列数据的预处理时间序列数据的预处理第二十一张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理等间隔时间数据的录入等间隔时间数据的录入程序说明(数据的录入)程序说明(数据的录入)第二十二张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理等间隔时间数据的录入等间隔时间数据的录入程序说明(数据的录入)程序说明(数据的录入)第二十三张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理数据的变换数据的变换程序
12、说明(数据的录入)程序说明(数据的录入)第二十四张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理取数据中的子集取数据中的子集程序说明(数据的录入)程序说明(数据的录入)第二十五张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理缺失数据的插入缺失数据的插入程序说明(数据的录入)程序说明(数据的录入)第二十六张,PPT共一百八十七页,创作于2022年6月data a;input sha;year=intnx(year,1964,_n_-1);format year year4.;dif=dif(sha);cards;97 1
13、30 156.5 135.2 137.7 180.5 205.2 190 188.6 196.7180.3 210.8 196 223 238.2 263.5 292.6 317 335.4 327321.9 353.5 397.8 436.8 465.7 476.7 462.6 460.8501.8 501.5 489.5 542.3 512.2 559.8 542 567;proc gplot;plot sha*year=1 dif*year=2;symbol1 v=circle i=join c=black;symbol2 v=star i=join c=red;proc arima d
14、ata=a;identify var=sha nlag=22;run;时间序列数据的预处理时间序列数据的预处理1964年年1999年中国纱年产量年中国纱年产量SAS程序程序第二十七张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理1962年年1月月1975年年12月平均每头奶牛月产奶量月平均每头奶牛月产奶量SAS程序程序第二十八张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理1949年年1998年北京市每年最高气温年北京市每年最高气温SAS程序程序第二十九张,PPT共一百八十七页,创作于2022年6月纯随机序列的纯随机序
15、列的定义定义纯随机性的纯随机性的性质性质纯随机性纯随机性检验检验时间序列数据的预处理时间序列数据的预处理3 纯随机性检验纯随机性检验第三十张,PPT共一百八十七页,创作于2022年6月3.1 纯随机序列的定义纯随机序列的定义纯随机序列也称为纯随机序列也称为白噪声序列白噪声序列,它满足如下两条性质,它满足如下两条性质 时间序列数据的预处理时间序列数据的预处理第三十一张,PPT共一百八十七页,创作于2022年6月标准正态白噪声序列时序图标准正态白噪声序列时序图 时间序列数据的预处理时间序列数据的预处理第三十二张,PPT共一百八十七页,创作于2022年6月3.2 白噪声序列的性质白噪声序列的性质 纯
16、随机性纯随机性 各序列值之间没有任何相关关系,即为各序列值之间没有任何相关关系,即为“没有记忆没有记忆”的序列的序列 方差齐性方差齐性 根据马尔可夫定理,只有方差齐性假定成立时,用根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有最小二乘法得到的未知参数估计值才是准确的、有效的线性无偏估计效的线性无偏估计时间序列数据的预处理时间序列数据的预处理第三十三张,PPT共一百八十七页,创作于2022年6月3.3 纯随机性检验纯随机性检验 检验原理检验原理假设条件假设条件检验统计量检验统计量 判别原则判别原则时间序列数据的预处理时间序列数据的预处理第三十四张,PPT
17、共一百八十七页,创作于2022年6月Barlett定理定理 如果一个时间序列是纯随机的,得到一个观察期数为如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,那么该序列的延迟非零期的样本自相关系的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正数将近似服从均值为零,方差为序列观察期数倒数的正态分布态分布时间序列数据的预处理时间序列数据的预处理第三十五张,PPT共一百八十七页,创作于2022年6月假设条件假设条件原假设:延迟期数小于或等于原假设:延迟期数小于或等于 期的序列值之间相互独立期的序列值之间相互独立备择假设:延迟期数小于或等于备择假
18、设:延迟期数小于或等于 期的序列值之间有相关性期的序列值之间有相关性 时间序列数据的预处理时间序列数据的预处理第三十六张,PPT共一百八十七页,创作于2022年6月检验统计量检验统计量Q统计量统计量 LB统计量统计量 时间序列数据的预处理时间序列数据的预处理第三十七张,PPT共一百八十七页,创作于2022年6月判别原则判别原则拒绝原假设拒绝原假设当检验统计量大于当检验统计量大于 分位点,或该统计量的分位点,或该统计量的P值小于值小于 时,则可以以时,则可以以 的置信水平拒绝原假的置信水平拒绝原假设,认为该序列为非白噪声序列设,认为该序列为非白噪声序列接受原假设接受原假设当检验统计量小于当检验统
19、计量小于 分位点,或该统计量分位点,或该统计量的的P值大于值大于 时,则认为在时,则认为在 的置信水平下的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定机序列的假定 时间序列数据的预处理时间序列数据的预处理第三十八张,PPT共一百八十七页,创作于2022年6月样本自相关图样本自相关图例例4 随机生成的随机生成的100个服从标准正态的白噪声序列纯随机性个服从标准正态的白噪声序列纯随机性检验检验时间序列数据的预处理时间序列数据的预处理第三十九张,PPT共一百八十七页,创作于2022年6月检验结果检验结果延迟延迟统计量检验统计量检验统计量值统计
20、量值P值值延迟延迟6期期2.360.8838延迟延迟12期期5.350.9454由于由于P值显著大于显著性水平值显著大于显著性水平 ,所以该序列不能,所以该序列不能拒绝纯随机的原假设。换句话说可以认为该序列的拒绝纯随机的原假设。换句话说可以认为该序列的波动没有任何统计规律可循,因此可以停止对该序波动没有任何统计规律可循,因此可以停止对该序列的统计分析。列的统计分析。时间序列数据的预处理时间序列数据的预处理第四十张,PPT共一百八十七页,创作于2022年6月数据预处理部分的小结:数据预处理部分的小结:序列平序列平稳性与性与纯随机性随机性检验的基本步的基本步骤:1.绘绘制制该该序列序列时时序序图图
21、;2.自相关自相关图检验图检验;3.该该序列若是平序列若是平稳稳序列,序列,进进行行纯纯随机性随机性检验检验.实实例:例:对对1950年年1998年北京市城年北京市城乡乡居民定期居民定期储储蓄所占蓄所占比例序列的平比例序列的平稳稳性与性与纯纯随机性随机性进进行行检验检验。时间序列数据的预处理时间序列数据的预处理第四十一张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理data a;input year prop;cards;/*数据省略*/;proc gplot;plot prop*year=1;/*所画的图记为图1*/symbol1 v=diamond i
22、=join c=red;proc arima data=a;identify var=prop;run;相应的相应的SAS程序程序第四十二张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理1.绘制时序图绘制时序图该序列显示北京市城乡居民定期储蓄所占比例序列波动该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似貌似”比较平稳比较平稳 第四十三张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理2.自相关图进一步检验平稳性自相关图进一步检验平稳性样本自相关图延迟样本自相关图延迟3阶后,自相关系数都落在阶后,自相关系数都落在2
23、倍标准差范围以内,而且自相关系数向零倍标准差范围以内,而且自相关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列 第四十四张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理3.序列纯随机性检验序列纯随机性检验第四十五张,PPT共一百八十七页,创作于2022年6月结论:结论:由于由于统计量的量的P值0.0001,远远小于小于 0.05,即拒,即拒绝序列序列为纯随机序列的假定。因而随机序列的假定。因而认为京市城京市城乡居民定期居民定期储蓄所占比蓄所
24、占比例的例的变动不属于不属于纯随机波随机波动,各序列,各序列值之之间有相关关系。有相关关系。这说明我明我们可以根据可以根据历史信息史信息预测未来年份的北京市未来年份的北京市城城乡居民定期居民定期储蓄所占比例,蓄所占比例,该平平稳序列属于非白噪序列属于非白噪声序列,可以声序列,可以对其其继续进行研究。行研究。时间序列数据的预处理时间序列数据的预处理第四十六张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析平稳时间序列数据分析方法性工具与两种相关系数方法性工具与两种相关系数自回归自回归(AutoRegression,AR)模型模型移动平均移动平均(Moving Average,MA
25、)模型模型ARMA模型模型平稳序列建模平稳序列建模 平稳时间序列数据分析平稳时间序列数据分析第四十七张,PPT共一百八十七页,创作于2022年6月1.1 方法性工具方法性工具 差分运算差分运算一阶差分一阶差分 阶差分阶差分 步差分步差分平稳时间序列数据分析平稳时间序列数据分析1.方法性工具与两种相关系数方法性工具与两种相关系数第四十八张,PPT共一百八十七页,创作于2022年6月延迟算子延迟算子延迟算子类似于一个时间指针,当前序列值乘以一个延延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个迟算子,就相当于把当前序列值的时间向过去拨了一个时刻时刻
26、记记 B为延迟算子,有为延迟算子,有 平稳时间序列数据分析平稳时间序列数据分析第四十九张,PPT共一百八十七页,创作于2022年6月延迟算子的性质延迟算子的性质平稳时间序列数据分析平稳时间序列数据分析则有(用延迟算子表示差分):则有(用延迟算子表示差分):第五十张,PPT共一百八十七页,创作于2022年6月1.2 两种样本相关系数的基本概念与计算两种样本相关系数的基本概念与计算样本自相关系数样本自相关系数样本偏自相关系数样本偏自相关系数平稳时间序列数据分析平稳时间序列数据分析所谓滞后所谓滞后k阶偏自相关系数就是阶偏自相关系数就是指在给定中间指在给定中间k-1个随机变量个随机变量 xt-1,xt
27、-2,xt-k+1的条件下,或者说,的条件下,或者说,在剔除了中间在剔除了中间k-1个随机变量的个随机变量的干扰之后,干扰之后,xt-k对对xt影响的相关度影响的相关度量。量。第五十一张,PPT共一百八十七页,创作于2022年6月样本偏自相关系数的计算样本偏自相关系数的计算平稳时间序列数据分析平稳时间序列数据分析第五十二张,PPT共一百八十七页,创作于2022年6月2.AR模型的定义模型的定义具有如下结构的模型称为具有如下结构的模型称为 阶阶自回归模型自回归模型,简记为,简记为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析第五十三张,PPT共一百八
28、十七页,创作于2022年6月均均 值值 如果如果AR(p)模型满足平稳性条件,则有模型满足平稳性条件,则有根据平稳序列均值为常数,且根据平稳序列均值为常数,且 为白噪声序列,为白噪声序列,有有推导出推导出平稳时间序列数据分析平稳时间序列数据分析第五十四张,PPT共一百八十七页,创作于2022年6月 AR(P)序列中心化变换序列中心化变换称称 为为 的中心化序列的中心化序列 ,令,令平稳时间序列数据分析平稳时间序列数据分析第五十五张,PPT共一百八十七页,创作于2022年6月中心化中心化AR(P)模型模型引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记为模型又可以简记为 自回归系数多项式
29、自回归系数多项式平稳时间序列数据分析平稳时间序列数据分析第五十六张,PPT共一百八十七页,创作于2022年6月AR模型自相关系数的性质模型自相关系数的性质拖尾性拖尾性呈负指数衰减呈负指数衰减平稳时间序列数据分析平稳时间序列数据分析第五十七张,PPT共一百八十七页,创作于2022年6月例例5 考察如下考察如下AR模型的自相关图模型的自相关图平稳时间序列数据分析平稳时间序列数据分析第五十八张,PPT共一百八十七页,创作于2022年6月自相关系数按复指数单调收敛到零自相关系数按复指数单调收敛到零平稳时间序列数据分析平稳时间序列数据分析第五十九张,PPT共一百八十七页,创作于2022年6月自相关系数正
30、负相间的衰减自相关系数正负相间的衰减平稳时间序列数据分析平稳时间序列数据分析第六十张,PPT共一百八十七页,创作于2022年6月自相关系数呈现出自相关系数呈现出“伪周期伪周期”性性平稳时间序列数据分析平稳时间序列数据分析第六十一张,PPT共一百八十七页,创作于2022年6月自相关系数不规则衰减自相关系数不规则衰减平稳时间序列数据分析平稳时间序列数据分析第六十二张,PPT共一百八十七页,创作于2022年6月偏自相关系数的截尾性偏自相关系数的截尾性AR(p)模型偏自相关系数模型偏自相关系数P阶截尾阶截尾平稳时间序列数据分析平稳时间序列数据分析第六十三张,PPT共一百八十七页,创作于2022年6月例
31、例5续续 考察如下考察如下AR模型的偏自相关图模型的偏自相关图平稳时间序列数据分析平稳时间序列数据分析第六十四张,PPT共一百八十七页,创作于2022年6月理论偏自相关系数理论偏自相关系数样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析第六十五张,PPT共一百八十七页,创作于2022年6月理论偏自相关系数理论偏自相关系数样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析第六十六张,PPT共一百八十七页,创作于2022年6月理论偏自相关系数理论偏自相关系数样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析第六十七张,PPT共一百八十七页,创
32、作于2022年6月理论偏自相关系数理论偏自相关系数样本偏自相关系数图样本偏自相关系数图平稳时间序列数据分析平稳时间序列数据分析第六十八张,PPT共一百八十七页,创作于2022年6月3.MA模型的定义模型的定义具有如下结构的模型称为具有如下结构的模型称为 阶阶移动平均模型移动平均模型,简记为,简记为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析第六十九张,PPT共一百八十七页,创作于2022年6月移动平均系数多项式移动平均系数多项式引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记为模型又可以简记为 阶移动平均系数多项式阶移动平均系数多项式平稳
33、时间序列数据分析平稳时间序列数据分析第七十张,PPT共一百八十七页,创作于2022年6月MA模型的统计性质模型的统计性质常数均值常数均值常数方差常数方差平稳时间序列数据分析平稳时间序列数据分析第七十一张,PPT共一百八十七页,创作于2022年6月MA模型的统计性质模型的统计性质MA模型的偏自相关系数拖尾模型的偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第七十二张,PPT共一百八十七页,创作于2022年6月例例6 考察如下考察如下MA模型的相关性质模型的相关性质平稳时间序列数据分析平稳时间序列数据分析第七十三张,PPT共一百八十七页,创作于2022年6月MA模型的自相关系数截尾模型的
34、自相关系数截尾平稳时间序列数据分析平稳时间序列数据分析第七十四张,PPT共一百八十七页,创作于2022年6月MA模型的自相关系数截尾模型的自相关系数截尾平稳时间序列数据分析平稳时间序列数据分析第七十五张,PPT共一百八十七页,创作于2022年6月MA模型的偏自相关系数拖尾模型的偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第七十六张,PPT共一百八十七页,创作于2022年6月MA模型的偏自相关系数拖尾模型的偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第七十七张,PPT共一百八十七页,创作于2022年6月4.ARMA模型的定义模型的定义具有如下结构的模型称为具有如下结构的模
35、型称为自回归移动平均模型自回归移动平均模型,简记,简记为为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析第七十八张,PPT共一百八十七页,创作于2022年6月系数多项式系数多项式引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记为模型又可以简记为 阶自回归系数多项式阶自回归系数多项式 阶移动平均系数多项式阶移动平均系数多项式平稳时间序列数据分析平稳时间序列数据分析第七十九张,PPT共一百八十七页,创作于2022年6月ARMA(p,q)模型的统计性质模型的统计性质均值均值协方差协方差自相关系数自相关系数平稳时间序列数据分析平稳时间序列数据分析第
36、八十张,PPT共一百八十七页,创作于2022年6月ARMA模型的相关性模型的相关性自相关系数拖尾自相关系数拖尾偏自相关系数拖尾偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第八十一张,PPT共一百八十七页,创作于2022年6月例例7 考察考察ARMA模型的相关性模型的相关性 拟合模型拟合模型ARMA(1,1):并直观地考察该模型自相关系数和偏自相关系数的并直观地考察该模型自相关系数和偏自相关系数的性质。性质。平稳时间序列数据分析平稳时间序列数据分析第八十二张,PPT共一百八十七页,创作于2022年6月自相关系数和偏自相关系数拖尾性自相关系数和偏自相关系数拖尾性样本自相关图样本自相关图
37、样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析自相关系数和偏自相关系数拖尾 第八十三张,PPT共一百八十七页,创作于2022年6月ARMA模型相关性特征模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾平稳时间序列数据分析平稳时间序列数据分析第八十四张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析平稳时间序列数据分析平稳时间序列的理论基础平稳时间序列的理论基础对于任何一个离散平于任何一个离散平稳过程程 它都可以分解它都可以分解为两个不相关的平两个不相关的平稳序列之和,其中一个序列之和,其中一个为
38、确确定性的,另一个定性的,另一个为随机性的,不妨随机性的,不妨记作作 其中:其中:为确定性序列,确定性序列,为随机序列,随机序列,它它们需要需要满足如下条件足如下条件(1)(2)(3)Wold分解定理(分解定理(1938):):第八十五张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析平稳时间序列数据分析ARMA模型分解模型分解确定性序列确定性序列随机序列随机序列第八十六张,PPT共一百八十七页,创作于2022年6月5.5.平稳序列建模平稳序列建模 建模步骤建模步骤模型识别模型识别参数估计参数估计模型检验模型检验模型优化模型优化序列预测序列预测平稳时间序列数据分析平稳时间序列数
39、据分析第八十七张,PPT共一百八十七页,创作于2022年6月建模步骤建模步骤平平稳稳非非白白噪噪声声序序列列计计算算样样本本相相关关系系数数模型模型识别识别参数参数估计估计模型模型检验检验模模型型优优化化序序列列预预测测YN平稳时间序列数据分析平稳时间序列数据分析第八十八张,PPT共一百八十七页,创作于2022年6月模型定阶的困难模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的理论截尾的完美情况,本应截尾的 或或 仍会呈现出仍会呈现出小值振荡的情况小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟
40、由于平稳时间序列通常都具有短期相关性,随着延迟阶数阶数 ,与与 都会衰减至零值附近作小值波动都会衰减至零值附近作小值波动当当 或或 在延迟若干阶之后衰减为小值波动时,什么情在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?呢?平稳时间序列数据分析平稳时间序列数据分析第八十九张,PPT共一百八十七页,创作于2022年6月样本相关系数的近似分布样本相关系数的近似分布BarlettQuenouille平稳时间序列数据
41、分析平稳时间序列数据分析第九十张,PPT共一百八十七页,创作于2022年6月模型定阶经验方法模型定阶经验方法95的置信区间的置信区间模型定阶的经验方法模型定阶的经验方法如如果果样样本本(偏偏)自自相相关关系系数数在在最最初初的的d阶阶明明显显大大于于两两倍倍标标准准差差范范围围,而而后后几几乎乎95的的自自相相关关系系数数都都落落在在2倍倍标标准准差差的的范范围围以以内内,而而且且通通常常由由非非零零自自相相关关系系数数衰衰减减为为小小值值波波动动的的过过程程非非常常突突然然。这这时时,通通常常视视为为(偏偏)自自相关系数截尾。截尾阶数为相关系数截尾。截尾阶数为d。平稳时间序列数据分析平稳时间
42、序列数据分析第九十一张,PPT共一百八十七页,创作于2022年6月例例8 选择合适的模型选择合适的模型ARMA拟合拟合1950年年1998年北年北京市城乡居民定期储蓄比例序列。京市城乡居民定期储蓄比例序列。平稳时间序列数据分析平稳时间序列数据分析第九十二张,PPT共一百八十七页,创作于2022年6月序列偏自相关图序列偏自相关图平稳时间序列数据分析平稳时间序列数据分析第九十三张,PPT共一百八十七页,创作于2022年6月拟合模型识别拟合模型识别自相关图显示延迟自相关图显示延迟3阶之后,自相关系数全部衰减到阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但倍标准差范围内
43、波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟偏自相关图显示除了延迟1阶的偏自相关系数显著大于阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在倍标准差之外,其它的偏自相关系数都在2倍标准差范倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾动的过程非常突然,所以该偏自相关系数可视为一阶截
44、尾 所以可以考虑拟合模型为所以可以考虑拟合模型为AR(1)平稳时间序列数据分析平稳时间序列数据分析第九十四张,PPT共一百八十七页,创作于2022年6月例例9 美国科罗拉多州某一加油站连续美国科罗拉多州某一加油站连续57天的天的OVERSHORT序列序列 平稳时间序列数据分析平稳时间序列数据分析第九十五张,PPT共一百八十七页,创作于2022年6月序列自相关图序列自相关图平稳时间序列数据分析平稳时间序列数据分析第九十六张,PPT共一百八十七页,创作于2022年6月序列偏自相关图序列偏自相关图平稳时间序列数据分析平稳时间序列数据分析第九十七张,PPT共一百八十七页,创作于2022年6月拟合模型识
45、别拟合模型识别自相关图显示除了延迟自相关图显示除了延迟1阶的自相关系数在阶的自相关系数在2倍标准差倍标准差范围之外,其它阶数的自相关系数都在范围之外,其它阶数的自相关系数都在2倍标准差倍标准差范围内波动。根据这个特点可以判断该序列具有短范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数该序列自相关系数1阶截尾阶截尾偏自相关系数显示出典型非截尾的性质。偏自相关系数显示出典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟合综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为模型定阶
46、为MA(1)平稳时间序列数据分析平稳时间序列数据分析第九十八张,PPT共一百八十七页,创作于2022年6月例例10 1880-1985年全球气表平均温度改变值差分序列年全球气表平均温度改变值差分序列 平稳时间序列数据分析平稳时间序列数据分析第九十九张,PPT共一百八十七页,创作于2022年6月序列自相关图序列自相关图平稳时间序列数据分析平稳时间序列数据分析第一百张,PPT共一百八十七页,创作于2022年6月序列偏自相关图序列偏自相关图平稳时间序列数据分析平稳时间序列数据分析第一百零一张,PPT共一百八十七页,创作于2022年6月拟合模型识别拟合模型识别自相关系数显示出不截尾的性质自相关系数显示
47、出不截尾的性质偏自相关系数也显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可综合该序列自相关系数和偏自相关系数的性质,可以尝试使用以尝试使用ARMA(1,1)模型拟合该序列模型拟合该序列平稳时间序列数据分析平稳时间序列数据分析第一百零二张,PPT共一百八十七页,创作于2022年6月参数估计参数估计待估参数待估参数 个未知参数个未知参数常用估计方法常用估计方法矩估计矩估计极大似然估计极大似然估计最小二乘估计最小二乘估计平稳时间序列数据分析平稳时间序列数据分析第一百零三张,PPT共一百八十七页,创作于2022年6月例例8续续 确定确定1950年年199
48、8年北京市城乡居民定期储蓄年北京市城乡居民定期储蓄比例序列拟合模型的口径比例序列拟合模型的口径 拟合模型:拟合模型:AR(1)估计方法:极大似然估计估计方法:极大似然估计模型口径模型口径平稳时间序列数据分析平稳时间序列数据分析第一百零四张,PPT共一百八十七页,创作于2022年6月例例9续续 确定美国科罗拉多州某一加油站连续确定美国科罗拉多州某一加油站连续57天的天的OVERSHORTS序列拟合模型的口径序列拟合模型的口径 拟合模型:拟合模型:MA(1)估计方法:条件最小二乘估计估计方法:条件最小二乘估计模型口径模型口径平稳时间序列数据分析平稳时间序列数据分析第一百零五张,PPT共一百八十七页
49、,创作于2022年6月例例10续续 确定确定1880-1985全球气表平均温度改变值差分序全球气表平均温度改变值差分序列拟合模型的口径列拟合模型的口径 拟合模型:拟合模型:ARMA(1,1)估计方法:条件最小二乘估计估计方法:条件最小二乘估计模型口径模型口径平稳时间序列数据分析平稳时间序列数据分析第一百零六张,PPT共一百八十七页,创作于2022年6月模型检验模型检验模型的显著性检验模型的显著性检验整个模型对信息的提取是否充分整个模型对信息的提取是否充分参数的显著性检验参数的显著性检验模型结构是否最简模型结构是否最简平稳时间序列数据分析平稳时间序列数据分析第一百零七张,PPT共一百八十七页,创
50、作于2022年6月模型的显著性检验模型的显著性检验目的目的检验模型的有效性(对信息的提取是否充分)检验模型的有效性(对信息的提取是否充分)检验对象检验对象残差序列残差序列判定原则判定原则一个好的拟合模型应该能够提取观察值序列中几乎一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序所有的样本相关信息,即残差序列应该为白噪声序列列 反之,如果残差序列为非白噪声序列,那就意味反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效说明拟合模型不够有效.平稳时间序列数据分析平