《时间序列分析[打印版].pdf》由会员分享,可在线阅读,更多相关《时间序列分析[打印版].pdf(84页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1六西格玛管理黑带大师时间序列分析研修班时间序列分析研修班时间序列分析研修班时间序列分析研修班现代实用统计之三现代实用统计之三天津大学 马逢时天津大学 马逢时天津大学 马逢时2012年9月时间序列分析(2天)?1.时间序列分析基本概念(13.1)序列分析本概?2.趋势分析与分解模型(13.2)?3.时间序列光滑化方法(14章)?4.自相关函数与偏自相关函数(15.1)?5.ARIMA(p,d,q)模型(15.2-5)5.15.1 AR(p)模型5.25.2MA(q)模型5.35.3ARMA(p,q)模型()模型(非季节)1天1天天津大学马逢时25.45.4 ARIMA(p,d,q)模型(非季节
2、)5.55.5 ARIMA(p,d,q)模型(含季节)?6.多元时间序列(15.6)?7.时间序列分析的应用(15.7)1天21.时间序列分析基本概念?统计学中常用概念:均值、标准差、相关系数、中心极限定理、过程能力、控制图等都有很广泛的应用。?一般要求数据是相互独立的;大多要求数据是正态的。?实际工作中,“数据是相互独立的”常常不能满足。?观察到的数据常常是一个序列,这些数据除了呈现出随机性外,观测值之间还存在着依赖关系。?我们希望能从过去观测数据中,找出产生这些数据的根天津大学马逢时3本原因,发现它们的规律性,通过随机分析的方法,归纳出相应的信息,对未来值进行某种预测或控制。?这种依赖性或
3、规律性使得由过去的数据预测未来是有可能的、有价值的。其数学模型就是时间序列。1.时间序列分析基本概念?本公司5年来每月的销售记录,这就构成了一个时间序本公司 年来每月的销售录就构成了个时间序列。我们希望找到其中的规律性,例如,这里是否有按年度的增长趋势?一年内是否有什么按月度变化的规律性?我们希望能对下3个月的销售量进行些预测。?在自来水厂中,对于每日水源入口处的活性氮含量汇集了连续三年的记录,能否找出规律性,进而绘制出控制图,以便对其活性氮的含量进行控制??气象学领域中有很多序列,例如实时温度、气压、月均温年均温等如何预报?天津大学马逢时4均温、年均温、等。如何预报??地震时的水平、垂直、旋
4、转的加速度;股市行情;机床振动;连续生产过程(化工、制药、冶炼等)的过程分析;等。这些过程的控制图该怎样建立?31.时间序列分析基本概念?任何时间序列经过合理的函数变换后都可以被认为是由下列三部分叠加而成(以LA臭氧为例)部分叠加而成(以LA臭氧为例)。1)趋势项部分2)周期项部分随机信号3)随机项部分随机噪声?从时间序列中把这三部分分解出来是时间序列分析的主要任务天津大学马逢时5?从时间序列中把这三部分分解出来是时间序列分析的主要任务。?第13章:提取趋势项和周期项的分解问题?第14章:时间序列的光滑化方法用来提取本质变化规律;?第15章(核心内容),介绍时间序列分析中最常见的几种模型,从更
5、深入的角度分析随机信号,以提取时间序列的变化规律性。2.趋势分析与分解模型趋势模型概念趋势模型概念?2.1 趋势模型概念趋势模型概念?2.2 趋势分析后的残差诊断趋势分析后的残差诊断?2.3 趋势分析后的预测趋势分析后的预测天津大学马逢时6?2.4 分解模型分解模型42.趋势分析与分解模型?任何时间序列经过合理的函数变换后都可以被认为是?任何时间序列经过合理的函数变换后都可以被认为是由*趋势项部分、*周期项部分和*随机项部分(又包含随机信号与随机噪声)三部分叠加而成。?例:手机销售的月记录。按年增长(趋势项);按季节周期波动(周期项);随机信号和随机噪声。?时间序列分析的最重要任务是研究平稳随
6、机过程的变化规律,建立特定的 ARIMA 模型(要求大体平稳、可能含有周期但不能有规则性的线性指数等类型趋天津大学马逢时7能含有周期,但不能有规则性的线性、指数等类型趋势项)。?从时间序列中把这三部分分解出来是时间序列分析的首要任务。2.1 趋势模型概念趋势模型概念YTR=+?时间序列可由一个随时间变化的平均水平加上一个平稳:ttttttYTRYtTRtt=+表示在时刻 的时间序列的值时刻 的趋势时刻 的误差项天津大学马逢时8时间序列可由个随时间变化的平均水平加上个平稳变化的误差项表示。误差项表示序列值偏离长期变化的平均趋势后的波动项(可能含有周期变化项)。?MINITAB给出了4种可选择的趋
7、势模型:线性(缺省)、二次、指数增长曲线或S型曲线。54 种可选择的趋势模型?线性趋势Yt=+?线性趋势:?二次趋势?指数增长 0 1ttYt=+2 0 1 2 ttYtt=+0 10 tttkttYe=+天津大学马逢时9?S型趋势()()0 12 10atttY=+4 种可选择的趋势模型天津大学马逢时106MINITAB 中实现趋势分析计算?例例13-1 销售型号为 X-12的新型的计算器。(销售数据见例例销售型号为的新型的计算器销售数据见数据文件:TS_计算器.MTW)。要安排一个存货方案,试图保证本公司有足够满足市场需求同时又可保证本公司无需占用资金订购多于合理预期销售的计算器。为此需要
8、得到计算器的月需求量的估计。?一般应先绘图确定趋势:从“统计 时间序列时间序列图”入口,选定“简单”的时间序列图,选择“序列”,即可绘制出时间序列图形。看出大体上有线性增加的趋势天津大学马逢时11势。?从“统计时间序列 趋势分析”入口,在“变量”中,输入包含时间序列的列,在“模型类型”中,选择4种之一(如“线性”)。点击“存储”;点击“拟合值”及“残差(去除趋势后的数据)”;点击“结果”;选中“汇总表及结果表”。在每个对话框点击“确定”。模型的准确度度量销售量 的趋势分析图销售量 的趋势分析图线性趋势模型平均百分误差450400350300250销售量销售量平均百分误差(MAPE)7.390平
9、均绝对误差(MAD)23.087平均偏差平方和919.442准确度度量实际拟合值变量线性趋势模型Yt=198.0+8.07*t1-100%1nttttyyMAPEyn=11-ntttMADyyn=平均绝对误差平均百分天津大学马逢时1224222018161412108642250200指数指数21|-|1ntttMSDyyn=平均偏差平方和72.2 趋势分析后的残差诊断趋势分析后的残差诊断?在趋势分析时,在选择“存储”及“结果”的同时,再增加选择“图形”,从中再选择“四合一”即可。?对于残差分析中的重点是观察残差对于观测值顺序的图中是否仍有不稳定、不正常的弯曲,或明显的规律性变化,则说明趋势项
10、提取得还不够充分(至于在此图中显示的周期性或非独立性,则要在后面学习到的时间序列分析中解决)。在残差对于拟合值的图如果呈现“喇叭口”则可以天津大学马逢时13?在残差对于拟合值的图如果呈现喇叭口,则可以尝试用乘法模型或对于观测值进行Box-Cox变换来解决。?一切从实际出发,观察时间序列本身所具有的规律性,对症下药才是最重要的。2.2 趋势分析后的残差诊断趋势分析后的残差诊断销售量 残差图销售量 残差图80400-40-80999050101残差百分比残差百分比40035030025020080400-40-80拟合值残差拟合值残差880正态概率图与拟合值直方图与顺序正态概率图与拟合值直方图与顺
11、序天津大学马逢时14806040200-20-40-606420残差频率残差频率24222018161412108642400-40-80观测值顺序残差观测值顺序残差82.3 趋势分析后的预测趋势分析后的预测?如果觉得趋势分析很有效,则我们可以对于平均值进行预测行预测。?希望进行预测时,在趋势分析时,在选择“存储”及“结果”的同时,再增加选择“生成预测”,填写好“预测点数”及“预测起始点”就可以了。本例在预测点数中键入“6”,“预测起始点”留为空白(默认从最后一点开始)。?这里的预测结果。只是对于平均值趋势按线性趋势延长进行预测罢了(不考虑周期变化规律)天津大学马逢时15长进行预测罢了(不考虑
12、周期变化规律)。?如果真正状况是有周期变化趋势(季节模型)时,其预测方法要到“分解模型”时中才能给出。如果还要进一步讨论数据之间的相关性,则我们要到最后一般的时间序列分析模型中才能给出。不同的分析方法将给出不同类型的预报来。线性趋势序列及预测曲线天津大学马逢时169指数模型的趋势分析计算?例例13-2 一家经营快餐的连锁店,15年间每年都例例13 2 家经营快餐的连锁店,15年间每年都逐步发展连锁店的数量(数据文件:TS_快餐连锁店.MTW)。希望预测未来3年连锁店的数量。?可以看出连锁店的数量是以指数形式增长的,因此应该用指数模型。?对于指数模型,MINITAB有专门窗口可以直接计算。从“统
13、计 时间序列 趋势分析”入口,在“模型类型”中,选择“指数增长”。拟合较好时则同样可以进行预报天津大学马逢时17时则同样可以进行预报。?不用再进行对残差分析。残差的正态性等假设只是针对线性回归给出的,我们一般只能对于线性模型进行残差分析,对于拟合二次模型、指数模型、S型曲线模型进行残差分析一般没有价值。指数模型的趋势分析天津大学马逢时18指数模型拟合的趋势分析与预测效果10指数趋势分析后的预测指数趋势分析后的预测态态概概率率图图与与拟拟合合值值数量 残差图数量 残差图40200-20999050101残差百分比残差百分比400300200100040200-20拟合值残差拟合值残差84020正
14、正态态概概率率图图与与拟拟合合值值直方图与顺序直方图与顺序天津大学马逢时193020100-10-206420残差频率残差频率151413121110987654321200-20观测值顺序残差观测值顺序残差指数模型直接进行残差分析看来并不好,但这没关系。这主要是因为指数增长时,越后期增长绝对值越急剧增大指数趋势分析后的预测指数趋势分析后的预测正正 态态 概概 率率 图图与与 拟拟 合合 值值L n Y 残 差 图L n Y 残 差 图0.20.10.0-0.1-0.2999050101残 差百分比残 差百分比654320.10.0-0.1拟 合 值残差拟 合 值残差430.1正正 态态 概概
15、 率率 图图与与 拟拟 合合 值值直 方 图与 顺 序直 方 图与 顺 序天津大学马逢时200.150.100.050.00-0.05-0.10210残 差频率残 差频率1514131211109876543210.0-0.1观 测 值 顺 序残差观 测 值 顺 序残差取对数后再进行线性模型的残差分析就有意义了。112.4 分解模型分解模型?考虑季节性变动(年内的变化规律)。?时间序列的构造通常由两方面组成:?1)数据显现出逐年增长的趋势;?2)每年之内又有周期性(年内的变化归纳为季节性变动)。?季节性变动本身又有两种类型。?1)常季节性变动:常季节性变动:振荡幅度不依赖于时间序列本身的取值水
16、平;振荡幅度几乎是常量(常用加法模型)。+YTrendSeasonalError=天津大学马逢时21?2)变季节性变动变季节性变动(或增长的季节性变动增长的季节性变动):季节性变动振荡幅度随时间序列取值水平的增长而变大(常用乘法分解模型或 Box-Cox 变换法)。+tYTrendSeasonalError=tYTrendSeasonalError=2.4.1加法和乘法两种分解模型加法和乘法两种分解模型?趋势分析的目的是发现趋势、去除趋势,得到随?趋势分析的目的是发现趋势、去除趋势,得到随机模型。因此要将全部数据的变化予以分解。?常季节变动多用加法模型,变季节变动多首选用乘法模型?例例13-3
17、 公司的10个饮料商店正在卖“创意可乐”。有前三年创意可乐月销量的记录(数据文件名为:TS_可乐.MTW),希望对于未来12个月可乐的销量给出预测。天津大学马逢时22?除有年增长的线性趋势外,还有明显的季节变动(夏季和早秋销量达最大,冬天最少),应该提取周期项称为季节项(Seasonal)。而且这里应该是变季节变动。?比较加法和乘法两种模型,显然乘法好得多。12分解模型的计算操作分解模型的计算操作?从“统计时间序列分解”入口,在“变量”中,填从统计时间序列分解入口,在变量 中,填写该变量列名;在“季节长度”中输入“12”;在“模型类型”中,选择“加法”或“乘法”(本例两者皆选以便加以比较);在
18、“模型分量”中,选择“趋势加季节”或“仅季节”,本例选“趋势加季节”;一般先不选择“生成预测”。打开“存储”,将“拟合值”和“残差”存储以便分析。打开“图形”,选择“四合一”。打开“结果”,选中“汇总表及结果表”在每个对话框“确定”就可以得到拟合图及天津大学马逢时23表,在每个对话框确定,就可以得到拟合图及计算结果。?残差图及计算结果的汇总可以帮助选定模型。?选定乘法或加法模型后,又能确认效果较好(能满足使用的精度需求),则可以进行预报。乘法模型计算结果销销量量 的的时时间间序序列列分分解解图图140012001000800600销量销量平均百分误差(MAPE)1.8941平均绝对误差(MAD
19、)8.2449平均偏差平方和91.5782准确度度量实际拟合值趋势变量销销量量 的的时时间间序序列列分分解解图图乘法模型天津大学马逢时243632282420161284600400200指数指数13加法模型计算结果销量 的时间序列分解图销量 的时间序列分解图140012001000800600销量销量平均百分误差(MAPE)8.71平均绝对误差(MAD)40.70平均偏差平方和2672.35准确度度量实际拟合值趋势变量可加性模型天津大学马逢时2536322824201612844002000指数指数加法模型残差图正正态态概概率率图图与与拟拟合合值值销量 残差图销量 残差图2001000-10
20、0999050101残差百分比残差百分比120090060030002001000-100拟合值残差拟合值残差1612200100正正态态概概率率图图与与拟拟合合值值直方图与顺序直方图与顺序天津大学马逢时2616012080400-40-80840残差频率残差频率353025201510511000-100观测值顺序残差观测值顺序残差加法不但误差大而且右上图弯曲,证明加法数据与模型拟合不好。14乘法模型残差图销量 残差图销量 残差图20100-10-20999050101残差百分比残差百分比1500100050020100-10-20拟合值残差拟合值残差820正态概率图与拟合值直方图与顺序正态
21、概率图与拟合值直方图与顺序天津大学马逢时2720100-10-206420残差频率残差频率35302520151051100-10-20观测值顺序残差观测值顺序残差残差已基本正常(右上无“喇叭口”,右下呈随机变化趋势)。乘法模型季节性分析结果销量 的季节性分析销量 的季节性分析乘法模型1211109876543212.01.51.00.51211109876543212.01.51.00.5乘法模型季节性指数季节性指数按按季季节节百百分分比比变变异异按季节去除趋势后的数据按季节去除趋势后的数据按按季季节节残残差差天津大学马逢时2812111098765432120100121110987654
22、321200-20按按季季节节百百分分比比变变异异按按季季节节残残差差15分解模型的预报分解模型的预报销量 的时间序列分解图销量 的时间序列分解图1600140012001000800600销量销量平均百分误差(MAPE)1.8941平均绝对误差(MAD)8.2449平均偏差平方和91.5782准确度度量实际拟合值趋势预测变量乘法模型天津大学马逢时294540353025201510514002000指数指数综合趋势变化及季节变化的规律性,已有粗略的预报意义。2.4.2 变季节变动的变换方法变季节变动的变换方法?变季节变动分解模型可以使用乘法模型(简单得?变季节变动分解模型可以使用乘法模型(简
23、单得多),也可以考虑使用Box-Cox变换法。?例13-3属于变季节变动,但用乘法模型其残差图已基本正常,不必再进行Box-Cox变换。?例例13-4 旅店客房占用数据的分析与预测。现在有14年的按月的客房占用数(单位:房天)的历史数据想要得到下年的全年预测数数据文件TS天津大学马逢时30据,想要得到下年的全年预测数。数据文件:TS_旅店客房.MTW。?绘制出时间序列图,图中清楚显示月度客房数具有很强的按年增长的趋势性,而且主峰和次峰依次出现有明显季节性。16变季节变动用乘法模型变季节变动用乘法模型按乘法模型分解后,残差似乎有喇叭型趋势50250-25-5099.99990501010.1残
24、差百分比残 差百分比1200100080060040050250-25-50拟 合 值残差拟 合 值残差正 态 概 率 图与 拟 合 值正 态 概 率 图与 拟 合 值客房占用量 残差图客房占用量 残差图天津大学马逢时314530150-15-303020100残 差频率残 差频率16014012010080604020150250-25-50观 测 值 顺 序残差观 测 值 顺 序残差直 方 图与 顺 序直 方 图与 顺 序变季节变动用变季节变动用Box-Cox变换变换?将原数据取对数,再按乘法模型计算,则残差正常0.0500.0250.000-0.025-0.05099.999905010
25、10.1残差百分比残差百分比7.06.86.66.46.20.0500.0250.000-0.025-0.050拟合值残差拟合值残差正态概率图与拟合值正态概率图与拟合值直直方方图图与与顺顺序序LnY 残差图LnY 残差图天津大学马逢时320.040.020.00-0.02-0.04-0.06403020100残差频率残差频率1601401201008060402010.0500.0250.000-0.025-0.050观测值顺序残差观测值顺序残差直直方方图图与与顺顺序序173.时间序列光滑化方法3 1 移动平均光滑法移动平均光滑法3.1 移动平均光滑法移动平均光滑法3.2 单参数指数移动平均光
26、滑法单参数指数移动平均光滑法3.3 双参数指数移动平均光滑法双参数指数移动平均光滑法(即即ARIMA(0,1,1)模型模型)天津大学马逢时333.3 双参数指数移动平均光滑法双参数指数移动平均光滑法(即即ARIMA(0,2,2)模型模型)3.4 Winter移动平均光滑法移动平均光滑法3.时间序列光滑化方法?观测时间序列目的之一就是要寻找客观事物的规律性。?观测时间序列目的之就是要寻找客观事物的规律性。但是在实际生活中,观测所得的数据无不受到误差的干扰,有时这种干扰还相当的大,这该如何处理呢?例:气温判定季节的问题。用日均温度波动较大;气候学上是将连续5天的日均温求算术平均得到“候均温”,再用
27、候均温判断季节。例:海域上重力探矿,目的是测出重力加速度的微小变化,以探明海底是否蕴藏着重金属矿。实测的重力加速度值波动太大,要对数据进行光滑化处理才能得到信息。光滑化就是“去粗取精去伪存真”的工作将序列天津大学马逢时34光滑化就是“去粗取精,去伪存真”的工作,将序列中包含的真实信息提取出来,获得具有规律性的结论。最简单的是移动平均移动平均,更复杂些的有单参数指数移动平均单参数指数移动平均,双参数指数移动平均双参数指数移动平均,Winter移动平均移动平均,更一般的是ARIMA模型。183.1 移动平均光滑法移动平均光滑法?移动平均,就是对于序列中连续的观测值按一定的?移动平均,就是对于序列中
28、连续的观测值按定的长度分段求其算术平均。?关键是求平均的时间区间选择(长短意义很不同)?当项数较小时,平滑的效果较差(即保真的效果较好);反之,当项数较大时,平滑效果较好(即短期保真效果较差,但能分析出长期规律)。?周期性强而又不强调分析其周期变化规律,则取周期长为求参加平均的项数。天津大学马逢时35期长为求参加平均的项数?平均后此数据归属哪点的问题:可列在最后一项;也可归属于中心的位置上(即中心的平均移动)。默认为放在周期的末尾位置上(也可以要求把移动平均存放在中部位置)。3.1 移动平均光滑法移动平均光滑法?移动平均长度对于是奇数或偶数稍有差别?移动平均长度对于是奇数或偶数稍有差别。?移动
29、平均长度是奇数的情况,以 n=5 为例来说明。?移动平均长度是偶数的情况,以 n=4 为例来说明,1120.250.250.250.25kkkkkzyyyy+=+21120.20.20.20.20.2kkkkkkzyyyyy+=+2110.250.250.250.25kkkkkzyyyy+=+天津大学马逢时36112kkkkk+21120.1250.250.250.250.125kkkkkkzyyyyy+=+两式再平均,得到最终结果:总之,移动平均使用的是均匀权或梯形权。193.1 移动平均光滑法移动平均光滑法?例例14-1 就业数据分析。文件TS 就业.MTW中记录了 60 例例就数据分析文
30、件_就中录了个月内各行业的就业数据(包含贸易行业、食品行业及金属行业),现在希望分析金属行业就业人数的变化规律。?特点:1)有长期变化趋势(不平稳);2)几乎没有明显的周期变化规律;3)小的波动(“毛刺”)很多。?我们进行长度为3 的移动平均。?从“统计时间序列移动平均”入口,在“变量”中,输入包含时间序列的列(本例为:“金属”),在“移均度中输均中天津大学马逢时37输含序列列本例为在移动平均长度”中输入“3”,且选择“移动平均居中”。打开“图形”,选中“平滑图与实际图”。打开“存储”,选择“移动平均”、“拟合值(提前一个周期预测)”及“残差”。打开“结果”,选择“汇总表和结果表”。各话框点击
31、“确定”。3.1 移动平均光滑法移动平均光滑法当取长度为n=3的移动平均后,数据中一些不光滑(有“毛刺”)处被光滑天津大学马逢时38(有“毛刺”)处被光滑化,规律性大大改善了。203.1 移动平均光滑法移动平均光滑法当平均长度取为n=5时,光滑的效果似乎更好但与此同时很天津大学马逢时39更好,但与此同时很多细节被光滑掉了,因此各项拟合误差相应增大。3.1 移动平均光滑法移动平均光滑法?使用简单移动平均来使数据光滑化几乎不需要假定什?使用简单移动平均来使数据光滑化几乎不需要假定什么条件(是否平稳、有无周期都可用)。?长度的选择则很重要,但通常只取短期的移动平均,平均后对于识别长期趋势及季节性变化
32、规律都是有好处的;长度的选择当然也与取样间隔时间有关。?长度太短则可能光滑效果不明显;长度太长则可能光滑过度,使保真效果变差,损失掉原来数据中包含的重要信息长度的选择定要与光滑的目的相配合天津大学马逢时40重要信息。长度的选择一定要与光滑的目的相配合。?慎重选择参加平均的序列长度。通常先取n=3或 n=5,如果数据中不光滑处仍很多(光滑效果仍不好),则再稍增大些。213.1 移动平均光滑法移动平均光滑法?移动平均除了可以光滑化之外,也可以进行预测。移动平均除了可以光滑化之外可以进行预测?只要在“移动平均”窗中加选“生成预测”,在“预测数”中键入预测长度(如在例14-1中将“预测数”中键入“6”
33、),就可以得到预测结果的三条线:中心值;预测的上下95%置信区间的值。?不难看出,这里所谓的“预测”,其实只是将最后结果的值沿其变化趋势方向稍加延长并沿水平方向前进。?SPC中使用的控制图内有一种“时间加权控制图”类天津大学马逢时41型,其中有移动平均、指数加权移动平均(EWMA)和累积和控制图。简单移动平均构造出的控制图对于微小的均值漂移比常规控制图更敏感。3.2 单参数指数移动平均光滑法单参数指数移动平均光滑法?移动平均光滑的系数还可以有很多种。?均匀权(含梯形权)最简单。?也可以选用二项权或其它权(见下页示意图)。?以上对于光滑长度和权重的讨论通常属于“数字滤波”学科,即依赖于光滑目的而
34、专门考虑的“谱窗设计”。?取简单的等比数列作为权则属于“单参数指数移动平均”光滑法。天津大学马逢时42?使用单参数指数移动平均来使数据光滑化一般适用于无周期的数据,平稳或非平稳的增长都可用。但实际上它只适用于差分后的序列是平稳的。若差分后的序列仍不平稳,则需要用双参数指数移动平均。223.2 单参数指数移动平均光滑法单参数指数移动平均光滑法?移动平均权的分析移动平均权的分析n=5的均匀权n=4的均匀权3210-1-2-30.40.30.20.10.0X概率X概率分 布 图分 布 图整 数,最 小=-2,最 大=23210-1-2-30.40.30.20.10.0X概率X概率分 布 图分 布 图
35、离散,值=x,概率=W4天津大学马逢时43n=5的二项权n=9的二项权(近似正态)3210-1-2-30.40.30.20.10.0X概率X概率分布图分布图离散,值=x,概率=WN3.2 等比级数移动平均权分分布布图图分分布布图图0-1-2-3-4-5-6-70.90.80.70.60.50.40.30.20.10.0X概率X概率分分布布图图离散,值=z,概率=e0.50-1-2-3-4-5-6-70.90.80.70.60.50.40.30.20.10.0X概率X概率分分布布图图离散,值=z,概率=e0.33天津大学马逢时44公比为0.5的等比级数移动平均权公比为0.3333的等比级数权移动
36、平均权以等比级数为权重的移动平均是很常用方法。公比越小,则权重下降越慢,光滑效果更好(保真效果就差)。233.2 单参数指数平滑法概念?单参数指数平滑法是用指数加权平均来平滑给定的数据,并产生短期预测。此程序通常只是适于无季节性趋势的数据。1-2(1-)nnYL+-1(1-)nnnLYL+=依此类推逐个代入后可得这里公式中是原始数据,是光滑后结果。?单参数指数平滑公式:nYnL天津大学马逢时452312310(1-)(1-)(1-).(1-)(1-)nnnnnnnLYYYYYL+=依此类推,逐个代入后可得这里公式中是的均值。0LnY3.2 单参数指数平滑法概念?此式所提供的权是一个以 为首项,
37、以1-为公比的?此式所提供的权是个以 为首项,以1 为公比的等比级数。?取值可以在(0,2)内。一般建议取=0.2可以兼顾光滑和保真两方面需要。?实际上常先以此值试验之,然后再根据光滑结果调整的取值。?公比 1-越大(即 越小),则权重下降越慢,光滑天津大学马逢时46效果越好(保真效果就越差)。?光滑效果的评估还要仔细考查残差图。残差图不正常说明的取值可能有问题。?单参数指数移动平均有等价的ARIMA(0,1,1)模型。243.2 单参数指数平滑操作方法?例例14-1 对于收集到的 60 个月金属行业就业人数的数据,用单参数指数权光滑的方法得到其变化规律(数据文件用单参数指数权光滑的方法得到其
38、变化规律(数据文件:TS_就业.MTW)。?操作如下:从“统计时间序列单指数平滑”入口?在“变量”中,输入序列名(“金属”)。在“平滑中使用的权重”中选择“0.2”,在“生成预测”中,在“预测点数”中键入“6”。打开“存储”窗,选中全部6项:“修匀数据”,“拟合值(提前一个周期预测)”,“残差”和“预测值”以及“95%预测上限”和“95%预测下限”。打开“结果”窗在“控制结果显示”栏中选择“汇总天津大学马逢时47打开“结果”窗,在“控制结果显示”栏中,选择“汇总表和结果表”。在每个对话框点击“确定(OK)”。?当=0.2时,光滑过度,说明取值偏小,应适当增大之值。?在“平滑中使用的权重”中改用
39、“最优综合自回归移动平均(ARIMA)”,这时计算机将自动选取 的“最优值”,本例将会选择=1.0417。3.2 单参数指数平滑(选参数)在=0 2的残差图中32101残差残差与顺序与顺序(响应为 金属)在=0.2的残差图中有连片数据皆为正数,这不正常。当换为最佳参数=1.04时,则残差基本正常(略)天津大学马逢时48605550454035302520151051-1-2-3观测值顺序观测值顺序基本正常略253.2 单参数指数平滑(预测)?实际上,预测其实只是最后数据的水平延伸。天津大学马逢时493.2 单参数指数平滑使用条件金属差分1 的时间序列图金属差分1 的时间序列图210-1金属差分
40、1金属差分1天津大学马逢时5060544842363024181261-2指数指数金属就业的数据本身并不平稳,但其一阶差分基本上是平稳的,因此单参数指数光滑法已足够。平滑参数如果选择合适,则残差能达到正常。263.2 单参数指数平滑?例例14-3 美国商业的零售指数。这里含18年中每月平均?例例14 3 美国商业的零售指数。这里含18年中每月平均物价零售指数记录(文件:TS_美国商业.MTW)。希望分析零售指数的变化规律。140130120数数零售指数 的时间序列图零售指数 的时间序列图按自然规律,人口增长、经济量增长等指标有指数增加的趋势,其规律性明显。一般可能只要一阶差分就天津大学马逢时5
41、119817615413211088664422111010090指数零售指指数零售指数数可能只要阶差分就能达到平稳,这就可以试用单参数移动平均光滑法(与规律类型是线性、二次或指数无关)。3.2 单参数指数平滑与预报取最佳参数=1.35,拟合似乎很好。预测其实只是最后数据的水平延伸天津大学马逢时52评价效果还需要同时评估残差图。(下页)据的水平延伸。273.2 单参数指数平滑使用条件?取最佳参数=1.35,与与顺顺序序粗略地看,拟合似乎很好,与趋势吻合。?残差图提供出更细致信息:残差尾部有上扬的趋势。由于参数已经选为最优,证明单参数单指数平滑方法本身拟合仍有问题。1.51.00.50.0残差残
42、差与与顺顺序序(响 应 为 零 售 指 数)天津大学马逢时53?应绘制一阶差分序列图(见下页),用来进一步判断适用条件。200180160140120100806040201-0.5-1.0观测值顺序观测值顺序3.2 单参数指数平滑使用条件1 5零售指数差分1 的时间序列图零售指数差分1 的时间序列图1.51.00.50.0-0.5零售指数差分1零售指数差分1天津大学马逢时54198176154132110886644221-1.0指数指数“一阶差分序列基本平稳”是使用单参数指数平滑的必要条件。若一阶差分序列有不平稳趋势,则应考虑使用双参数指数平滑方法。用差分序列来建模及分析时间序列特征是最一
43、般的分析方法。详见时间序列ARIMA模型。283.3 双参数指数移动平均光滑法双参数指数移动平均光滑法?双指数平滑法是用Holt-Winters双指数方法来平滑数双指数平滑法是用Holt Winters双指数方法来平滑数据并产生短期的预测,相当于在使用指数平滑时随时改变平滑常数。?这个程序也适合于没有季节周期趋势但有非平稳趋势存在且一阶差分仍不平稳趋势的数据没有季节周期趋势。它不取固定的指数平滑常数,而是对水平和趋势两个方面分别计算其动态估计。?这里有两个常数:位置平滑参数值斜率值平滑参数,来更新每个周期的位置和斜率般地说及 取值天津大学马逢时55来更新每个周期的位置和斜率。一般地说,及取值较
44、小,则导致光滑权重更慢地降低,因而参加滑动平均的序列越长、数据量越多,光滑效果越好。?双参数指数移动平均有等价的ARIMA(0,2,2)模型,即要求二阶差分后有平稳趋势。3.3 双参数指数移动平均光滑法双参数指数移动平均光滑法?例例14-3 美国商业的零售指数。这里含18年中?例例14 3 美国商业的零售指数。这里含18年中每月平均物价零售指数记录(文件:TS_美国商业.MTW)。希望分析零售指数的变化规律。?原序列及一阶差分序列都无周期趋势而有不平稳趋势,使用单参数指数平滑方法效果不好,因此应考虑使用双参数指数平滑方法。?二阶差分序列已有平稳趋势(下页)。天津大学马逢时56阶差分序列有平稳趋
45、势下页?使用单参数指数平滑方法效果不好,因此应考虑使用双参数指数平滑方法。293.3 双参数指数移动平均光滑法双参数指数移动平均光滑法零售指数差分2 的时间序列图零售指数差分2 的时间序列图2.01.51.00.50.0-0.5零售指数差分2零售指数差分2天津大学马逢时57198176154132110886644221-1.0指数指数二阶差分序列已基本平稳,可以使用双参数指数平滑。如何根据差分序列趋势来建模及分析时间序列特征见ARIMA模型。3.3 双参数指数移动平均光滑操作双参数指数移动平均光滑操作?从“统计时间序列双指数平滑”入口,在“变量”从统计 时间序列 双指数平滑入口,在变量中,输
46、入包含时间序列的列(“零售指数”)。在“平滑中使用的权重”中选择“最优综合自回归移动平均(ARIMA)”,这时计算机将自动选取及 的“最优值”。?在“生成预测”中,在“预测点数”中键入“12”。打开“图形”窗,选择输出“残差图”中的“残差与顺序”。打开“存储”窗选中上部的5项“修匀数据”天津大学马逢时58?打开“存储”窗,选中上部的5项:“修匀数据”,“水平估计”、“趋势估计”、“拟合值(提前一个周期预测)”及“残差”。?打开“结果”窗,在“控制结果显示”栏中,选择“汇总表和结果表”。?在每个对话框点击“确定(OK)”。303.3 双参数指数移动平均光滑操作双参数指数移动平均光滑操作零零售指数
47、 的平滑图售指数 的平滑图150140130120110零售指数零售指数Alpha(水平)0.888885Gamma(趋势)0.131966平滑常量平均百分误差(MAPE)0.162525平均绝对误差(MAD)0.170837平均偏差平方和0 055930准确度度量实际拟合值预测95.0%预测区间变量零零双指数法天津大学马逢时5922019817615413211088664422110090指数指数平均偏差平方和0.055930预测已经按趋势继续增长,双指数平滑比单指数平滑已有很大改建。残差也基本正常(略)。3.4 Winter光滑法光滑法?无论单参数指数平滑或双参数指数平滑都不能处理带有季
48、节周期性变化的数据。?Winters方法是一种用于解决含有季节性的数据的平滑方法。?Winters法用Holt-Winters指数平滑法对于存在可加的或是可乘的趋势和季节性成份时皆适用。?Winters法要同时计算三个成分的动态估计:水平,趋势和季节性。天津大学马逢时60季节性。?Winters方法一般没有与之相应的ARIMA模型。ARIMA模型对于有趋势又有周期变化的数据也有解决办法。?当水平和季节因素是乘在一起的,Winters模型就是乘法的;如果当它们是加在一起的,那么模型就是加法的。313.4 Winter光滑法光滑法?使用Winters平滑数据的关键是选择好三个待定参数。?MINIT
49、AB不能直接计算出一组“最优权重参数”,只能根据各参数的具体含义用手工方式不断调整,但由于光滑结果对于权重值不敏感,不必苛求权重参数精确。?一般可以直接输入水平、趋势和季节这三项因素的权重参数(或称平滑参数)、和,三个权重参数的默认值皆为0.2,当然也可以取0和1之间的其它值。般地说三个权重参数取值较小时则导致权重更慢地降低天津大学马逢时61?一般地说,三个权重参数取值较小时,则导致权重更慢地降低,因而参加滑动平均的序列越长、数据量越多,光滑效果越好。?如果数据中含有的噪音较大,相应的权重参数应取小些;反之,如果噪音较小,容易得到规律性的描述,可将相应的参数取大,使用较少的数据以更“保真”。3
50、.4 Winter光滑法光滑法?例例14-5 60 个月内食品行业就业数据,现在希望分析其变化?例例14 5 60 个月内食品行业就业数据,现在希望分析其变化规律并预报12个月的状况。数据见文件:TS_就业.MTW。757065食品食品食品 的时间序列图食品 的时间序列图这是带有趋势兼有季节周期性变化的数据天津大学马逢时6260544842363024181261605550指数指数323.4 Winter光滑法操作光滑法操作?“统计时间序列Winters方法”入口,在“变量”中,序食度输入包含时间序列的列(“食品”),在“季节长度”中,输入此数据的周期长度(如:“12”)。?在“方法类型”中