《信息分析与预测时间序列精选PPT.ppt》由会员分享,可在线阅读,更多相关《信息分析与预测时间序列精选PPT.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息分析与预测时间序列第1页,此课件共64页哦时间序列分析法时间序列分析法第2页,此课件共64页哦10 概述概述 所谓时间序列(所谓时间序列(time series),就是),就是 具有均匀时间间隔的各种社会、自然现象的具有均匀时间间隔的各种社会、自然现象的数量指标依时间次序排列起来的统计数据。数量指标依时间次序排列起来的统计数据。时间序列分析法是通过对历史数据变化的分时间序列分析法是通过对历史数据变化的分析,来评价事物的现状和估计事物的未来变析,来评价事物的现状和估计事物的未来变化。这种方法在科学决策、化。这种方法在科学决策、R&D和市场开和市场开拓活动中的许多场合有广泛的应用,如市场拓活动
2、中的许多场合有广泛的应用,如市场行情分析、产品销售预测等。行情分析、产品销售预测等。第3页,此课件共64页哦10 概述概述 从回归分析法的角度看,时间序列分从回归分析法的角度看,时间序列分析法实际上是一种特殊的回归分析法,因为析法实际上是一种特殊的回归分析法,因为此时不再考虑事物之间的因果关系或其他相此时不再考虑事物之间的因果关系或其他相关关系,而仅考虑研究对象与时间之间的相关关系,而仅考虑研究对象与时间之间的相关关系,即将时间作为自变量来看待。关关系,即将时间作为自变量来看待。第4页,此课件共64页哦10 概述概述 为了保证时间序列分析的准确性,时间为了保证时间序列分析的准确性,时间序列数据
3、的编制应该遵循以下一些原则:序列数据的编制应该遵循以下一些原则:时间序列中的各项数据所代表的时期长短时间序列中的各项数据所代表的时期长短(或间隔时间)应该一致且连续。(或间隔时间)应该一致且连续。时间序列中的各项数据所代表的质的内容应时间序列中的各项数据所代表的质的内容应该前后一致。该前后一致。统计指标数据的计量单位应该一致。统计指标数据的计量单位应该一致。第5页,此课件共64页哦10 概述概述时间序列数据随时间推移而变动包括四种类型:时间序列数据随时间推移而变动包括四种类型:倾向变动倾向变动/趋势变动(趋势变动(trend variation)即在整个预)即在整个预测内研究对象呈现出渐增或渐
4、减的总倾向。测内研究对象呈现出渐增或渐减的总倾向。周期变动(周期变动(cyclical variation)即以某一时间间隔为)即以某一时间间隔为周期的周期性变动,如危机和复苏的交替。周期的周期性变动,如危机和复苏的交替。季节变动(季节变动(seasonal variation)。即以一年为周)。即以一年为周期的周期变动,如服装行业销售额的季节性波动。期的周期变动,如服装行业销售额的季节性波动。不规则变动不规则变动/随机变动(随机变动(irregular/random variation)是指除以上三种变动之外的变动。是指除以上三种变动之外的变动。第6页,此课件共64页哦第7页,此课件共64页
5、哦10 概述概述 倾向线的拟合方法,实质上是一种时间序列回归分析倾向线的拟合方法,实质上是一种时间序列回归分析法,它是通过数学模型的建立和求解来进行分析的。这种法,它是通过数学模型的建立和求解来进行分析的。这种方法的优点是精确度比较高方法的优点是精确度比较高。倾向线的逐步修正方法则是与倾向线拟合方法倾向线的逐步修正方法则是与倾向线拟合方法性质完全不同的另一种方法。它是通过时间序列数性质完全不同的另一种方法。它是通过时间序列数据的平滑来进行分析的。所谓据的平滑来进行分析的。所谓“平滑平滑”,就是将原,就是将原始时间序列数据不规则的,有突变的轨迹大致地修始时间序列数据不规则的,有突变的轨迹大致地修
6、匀,形成平滑的倾向线,以把握事物的发展趋势。匀,形成平滑的倾向线,以把握事物的发展趋势。第8页,此课件共64页哦10 概述概述 需要说明的是,人们研究的事物往往受到诸多因素需要说明的是,人们研究的事物往往受到诸多因素的复杂影响,而在倾向变动预测中,我们都只考虑其中的复杂影响,而在倾向变动预测中,我们都只考虑其中的时间因素,即把事物的特征值仅仅作为时间的函数来的时间因素,即把事物的特征值仅仅作为时间的函数来表现,求出函数表达式,并在假定这种函数关系在要预表现,求出函数表达式,并在假定这种函数关系在要预测的期间内无结构性突变的情况下,预测其未来值。因测的期间内无结构性突变的情况下,预测其未来值。因
7、此在所研究事物的客观环境(条件)发生突变的情况下,此在所研究事物的客观环境(条件)发生突变的情况下,切不可机械地套用时间序列分析方法,而应该对研究对切不可机械地套用时间序列分析方法,而应该对研究对象进行全面的条件和环境分析,才能得出比较象进行全面的条件和环境分析,才能得出比较 符合事物发展的客观预测结果。符合事物发展的客观预测结果。第9页,此课件共64页哦10.1多项式曲线法多项式曲线法 当进行时间序列分析时,应先将研究当进行时间序列分析时,应先将研究对象的动态数据与所对应的时间序列反映到对象的动态数据与所对应的时间序列反映到直角坐标系中,得到一散点图,然后对散点直角坐标系中,得到一散点图,然
8、后对散点图进行分析。当可用时间图进行分析。当可用时间t的的k次多项式曲线次多项式曲线(multinomial curve)较好地拟合散点时,)较好地拟合散点时,我们就可以用时间我们就可以用时间t的的k次多项式来描述时间次多项式来描述时间序列数据,并据以推测研究对象的未来状况。序列数据,并据以推测研究对象的未来状况。第10页,此课件共64页哦10.1.1 一次曲线(一次曲线(直线)当时间序列数据的散点图可以用直线拟当时间序列数据的散点图可以用直线拟合时,则可用直线回归方程来描述研究对象合时,则可用直线回归方程来描述研究对象y与时间与时间t的关系,并可据此预测研究对象的的关系,并可据此预测研究对象
9、的未来情况。未来情况。回归系数回归系数a,b可根据最小二乘法求得可根据最小二乘法求得第11页,此课件共64页哦10.1.1 一次曲线一次曲线 经过转换经过转换第12页,此课件共64页哦10.1.1 一次曲线一次曲线 当时间点当时间点 为连续等间隔时,为连续等间隔时,若把原点取在时间序列的中间,若把原点取在时间序列的中间,即在数据项数为奇数(即在数据项数为奇数(N=2n+1)时,取)时,取ti的的系列为:系列为:-n,-(n-1),-2,-1,0,1,2,(n-1),n在数据项数为偶数(在数据项数为偶数(N=2n)时,取)时,取ti的系列的系列为:为:-(2n-1),-(2n-3),-3,-1,
10、1,3,(2n-3),(2n-1)第13页,此课件共64页哦10.1.1 一次曲线一次曲线则在此两种情况下都有则在此两种情况下都有因此有因此有第14页,此课件共64页哦10.1.1 一次曲线一次曲线例:江苏省例:江苏省1985年到年到2002年专利申请量的数年专利申请量的数据如下:据如下:第15页,此课件共64页哦10.1.1 一次曲线一次曲线第16页,此课件共64页哦第17页,此课件共64页哦10.1.1 一次曲线一次曲线所以得到直线回归方程为所以得到直线回归方程为y=7370.5+593.2t第18页,此课件共64页哦10.1.1 一次曲线一次曲线 预测预测2010年专利申请量,对于年专利
11、申请量,对于2010年年ti=23,可得预测值为,可得预测值为第19页,此课件共64页哦10.1.1 一次曲线一次曲线 为了衡量所得的回归方程与实际值的偏为了衡量所得的回归方程与实际值的偏离程度,引入不一致系数离程度,引入不一致系数u。不一致系数不一致系数u值越小,说明所得的拟合值越小,说明所得的拟合曲线(回归方程)与实际值倾向线的偏差越曲线(回归方程)与实际值倾向线的偏差越小,即拟合得越好。小,即拟合得越好。第20页,此课件共64页哦10.1.1 一次曲线一次曲线第21页,此课件共64页哦10.1.2二次曲线二次曲线 在时间序列数据在时间序列数据yi散点图的倾向线呈散点图的倾向线呈二次多项式
12、曲线时,可以用二次多项式去描二次多项式曲线时,可以用二次多项式去描述它,其一般表达式为:述它,其一般表达式为:第22页,此课件共64页哦第23页,此课件共64页哦10.1.3三次曲线三次曲线 在时间序列数据在时间序列数据yi散点图的倾向线呈三散点图的倾向线呈三次多项式曲线时,可以用三次多项式去描述次多项式曲线时,可以用三次多项式去描述它,其一般表达式为:它,其一般表达式为:第24页,此课件共64页哦10.2.3三次曲线三次曲线第25页,此课件共64页哦10.3 指数曲线法指数曲线法 研究对象呈现指数增长是时间序列数据研究对象呈现指数增长是时间序列数据分析中比较常见的一种形式,特别是研究对分析中
13、比较常见的一种形式,特别是研究对象在初期发展阶段其时间序列数据的倾向线象在初期发展阶段其时间序列数据的倾向线往往呈指数曲线(往往呈指数曲线(exponenial curve)上升上升的趋势。如我国网络用户数量增长曲线就是的趋势。如我国网络用户数量增长曲线就是呈指数曲线形式。呈指数曲线形式。第26页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 在时间序列数据散点图的倾向线大致在时间序列数据散点图的倾向线大致是一次指数曲线时可用一次指数曲线去拟合是一次指数曲线时可用一次指数曲线去拟合它。它。第27页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 一次指数曲线的一般形式为一
14、次指数曲线的一般形式为第28页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 两边取对数,有两边取对数,有第29页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 即将指数曲线化成了直线。下面我们来求回即将指数曲线化成了直线。下面我们来求回归系数归系数a和和b。直线式的剩余平方和为直线式的剩余平方和为第30页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 根据微积分的极值原理,有根据微积分的极值原理,有第31页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 解此联立方程,可以得到解此联立方程,可以得到第32页,此课件共64页哦10.3.1一次指数曲
15、线法一次指数曲线法第33页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 由此即可得到由此即可得到a和和b。对于时间。对于时间t的原点的原点设在时间序列中间的情况,有设在时间序列中间的情况,有第34页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 例:某市例:某市1998-2003年的灯具商品销售年的灯具商品销售量分别为量分别为8.7,10.6,13.3,16.5,20.6,26.0万架,万架,用一次指数曲线法预测用一次指数曲线法预测2004年销售量。年销售量。第35页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法第36页,此课件共64页哦10.3.1一次指
16、数曲线法一次指数曲线法 根据表中的数据,求得根据表中的数据,求得所以,指数曲线回归方程为所以,指数曲线回归方程为 第37页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法 不一致系数为:不一致系数为:第38页,此课件共64页哦10.3.1一次指数曲线法一次指数曲线法当当t=7时,可预测时,可预测2004年的销售量为年的销售量为32.07万万架。架。第39页,此课件共64页哦移动平均法移动平均法第40页,此课件共64页哦10.4.1概述概述 倾向线的逐步修正方法是通过时间序列倾向线的逐步修正方法是通过时间序列数据平滑来进行分析的。最简单的平滑方法数据平滑来进行分析的。最简单的平滑方法就
17、是取时间序列数据的算术平均值,它能有就是取时间序列数据的算术平均值,它能有效地排除随机变动的影响。例如,时间序列效地排除随机变动的影响。例如,时间序列数据为数据为 ,对应于时间对应于时间t=1,2,,N,其算术平均值为其算术平均值为第41页,此课件共64页哦10.4.1概述概述t-时间下标变量,表示时期序号时间下标变量,表示时期序号N-时间序列的时期个数,也即时间序列时间序列的时期个数,也即时间序列数据个数数据个数第42页,此课件共64页哦10.4.1概述概述 不过,使用算术平均值作为时间序列数不过,使用算术平均值作为时间序列数据平滑的数学模型和它的预测值,虽然能够据平滑的数学模型和它的预测值
18、,虽然能够排除随机变动,但它有着严重的缺点;它只排除随机变动,但它有着严重的缺点;它只能反映时间序列数据的一般情况(平均水平)能反映时间序列数据的一般情况(平均水平),而不能反映出数据中的高值和低值,更不,而不能反映出数据中的高值和低值,更不能反映时间序列数据的演变过程和发展趋势,能反映时间序列数据的演变过程和发展趋势,掩盖了它的可能存在的倾向变动;它对时间掩盖了它的可能存在的倾向变动;它对时间序列的近期数据和早期数据同样看待,缺乏序列的近期数据和早期数据同样看待,缺乏对当前数据变动的适应能力。对当前数据变动的适应能力。第43页,此课件共64页哦10.4.1概述概述 对算术平均法的改进,最初得
19、到的是对算术平均法的改进,最初得到的是一种分段平均法,分段平均法是按时期序号一种分段平均法,分段平均法是按时期序号将时间序列数据分成都含有将时间序列数据分成都含有n个时期的段,个时期的段,再取各段数据平均值。例如,将江苏省专利再取各段数据平均值。例如,将江苏省专利申请量申请量18年来的数据划分为各包含年来的数据划分为各包含6年的年的3段,分别求出各段平均值。段,分别求出各段平均值。第44页,此课件共64页哦10.4.1概述概述 分段平均法能够反映出研究对象的总的分段平均法能够反映出研究对象的总的变化趋势和各时期大致变化幅度,并且通过变化趋势和各时期大致变化幅度,并且通过取平均值可以减弱随机因素
20、的影响。但是,取平均值可以减弱随机因素的影响。但是,这样的分段平均使得数据点大为减少,只为这样的分段平均使得数据点大为减少,只为原来数据点的原来数据点的1/n,使各段平均值呈阶梯状,使各段平均值呈阶梯状,不能连续反映变量的变化过程;而且,当时不能连续反映变量的变化过程;而且,当时期总数不为期总数不为n的整数倍时不便分段。的整数倍时不便分段。第45页,此课件共64页哦10.4.2 一次移动平均一次移动平均 对分段平均法改进得到移动平均法(对分段平均法改进得到移动平均法(moving-average method),又称为滑动平均法,移动平均法又称为滑动平均法,移动平均法是利用平均过程所具有的平滑
21、作用,从时间序列数据是利用平均过程所具有的平滑作用,从时间序列数据中去除局部的不规则性,排除随机影响,从而找出时中去除局部的不规则性,排除随机影响,从而找出时间序列数据变动趋势的方法。它对时间序列数据分段间序列数据变动趋势的方法。它对时间序列数据分段求出算术平均值,但这时的分段平均并不是截然分开求出算术平均值,但这时的分段平均并不是截然分开的段进行,而是按根据时期的顺序不断移动得到的段的段进行,而是按根据时期的顺序不断移动得到的段进行,即它的平均值的计算区段部分的重叠和逐渐移进行,即它的平均值的计算区段部分的重叠和逐渐移动,因而能够在一定程度上客观地描述实际的时间序动,因而能够在一定程度上客观
22、地描述实际的时间序列数据及其变化趋势。列数据及其变化趋势。第46页,此课件共64页哦10.4.2 一次移动平均一次移动平均 一次移动平均值的计算公式为一次移动平均值的计算公式为 -为第为第t时期及其以前(时期及其以前(n-1)各时期的数据)各时期的数据的移动平均值的移动平均值t-时期序号时期序号yt-第第t时期变量的数值时期变量的数值n-每段跨越的时期个数,即所包含的数据个数每段跨越的时期个数,即所包含的数据个数第47页,此课件共64页哦10.4.2 一次移动平均一次移动平均 也可以用递推公式表示也可以用递推公式表示:如果时间序列数据很长,如果时间序列数据很长,n的取值又较的取值又较大,用递推
23、公式可以大大减少计算量。同时,大,用递推公式可以大大减少计算量。同时,当获得新数据时,无需像回归分析那样重新当获得新数据时,无需像回归分析那样重新估算方程,而可以根据先期计算出来的移动估算方程,而可以根据先期计算出来的移动平均值,很容易求出新的移动平均值。平均值,很容易求出新的移动平均值。第48页,此课件共64页哦1985-2002年江苏省专利申请量移动平均法预测数据表年江苏省专利申请量移动平均法预测数据表第49页,此课件共64页哦10.4.2 一次移动平均一次移动平均 合理地选择每段时期个数合理地选择每段时期个数n是用好移是用好移动平均法的关键。在动平均法的关键。在n取较大值时,移动平取较大
24、值时,移动平均值对于随机影响的敏感性弱些,平滑作用均值对于随机影响的敏感性弱些,平滑作用强,但适应新数据水平的时间要长些,容易强,但适应新数据水平的时间要长些,容易落后于可能的发展趋势;而当落后于可能的发展趋势;而当n 取较小值时,取较小值时,移动平均值对于随机影响的敏感性较强,平移动平均值对于随机影响的敏感性较强,平滑作用差,适应数据新水平的时间短,因而滑作用差,适应数据新水平的时间短,因而容易对随机干扰反映过度灵敏而造成错觉。容易对随机干扰反映过度灵敏而造成错觉。一般可以根据实际时间序列数据的特征和经一般可以根据实际时间序列数据的特征和经验选择参数验选择参数n。第50页,此课件共64页哦1
25、0.4.2 一次移动平均一次移动平均第51页,此课件共64页哦10.4.3 二次移动平均二次移动平均 -为第为第t时期的一次移动平均值时期的一次移动平均值-为第为第t时期的二次移动平均值时期的二次移动平均值第52页,此课件共64页哦第53页,此课件共64页哦10.4.3 二次移动平均二次移动平均 一次移动平均只适用于平滑时间序列数一次移动平均只适用于平滑时间序列数据,而不适用于有线性变动趋势的时间序列据,而不适用于有线性变动趋势的时间序列数据预测。这是因为一次移动平均值是数据预测。这是因为一次移动平均值是 每时间段每时间段 的平均值,当的平均值,当 为线性增为线性增长趋势时,长趋势时,必然小于
26、必然小于 值;反之,当为线值;反之,当为线性下降趋势时,性下降趋势时,必然大于必然大于 值。值。第54页,此课件共64页哦10.4.3 二次移动平均二次移动平均 同理,二次移动平均是在一次移动平均同理,二次移动平均是在一次移动平均值的基础上进行的,二次移动平均也与一次值的基础上进行的,二次移动平均也与一次移动平均数序列存在滞后偏差。移动平均数序列存在滞后偏差。因此因此 和和 只能用于简易预测。为只能用于简易预测。为了改善预测效果,我们可以利用了改善预测效果,我们可以利用 和和 求求出平滑系数,建立线性移动平均模型进行预出平滑系数,建立线性移动平均模型进行预测。测。第55页,此课件共64页哦10
27、.4.3 二次移动平均二次移动平均 线性移动平均模型的一般形式为:线性移动平均模型的一般形式为:t-时期的序号时期的序号l-由当前时期由当前时期t到需要预测的时期之间的时期个数到需要预测的时期之间的时期个数yt+l-第(第(t+l)时期的预测值;)时期的预测值;bt-斜率,即单位时期的变化量斜率,即单位时期的变化量at-截距,即当前时期截距,即当前时期t的数据水平,的数据水平,at=yt第56页,此课件共64页哦10.4.3 二次移动平均二次移动平均 对于线性时间序列数据,每一时期的增对于线性时间序列数据,每一时期的增量总是相同的,即在一次移动平均中有量总是相同的,即在一次移动平均中有 一次移
28、动平均值比原时间序列数据滞一次移动平均值比原时间序列数据滞后(后(n-1)/2个时期,所以个时期,所以第57页,此课件共64页哦10.4.3 二次移动平均二次移动平均 当原时间序列数据具有线性变动趋势时,当原时间序列数据具有线性变动趋势时,其一次移动平均值一定也具有线性变动趋势。其一次移动平均值一定也具有线性变动趋势。根据同样的道理有根据同样的道理有进而有进而有第58页,此课件共64页哦10.4.3 二次移动平均二次移动平均第59页,此课件共64页哦10.4.3 二次移动平均二次移动平均 现在可以建立江苏省专利申请量移动平现在可以建立江苏省专利申请量移动平均线性预测模型。现均线性预测模型。现t
29、=18第60页,此课件共64页哦第61页,此课件共64页哦10.4.3 二次移动平均二次移动平均 现用来预测现用来预测2008年的专利申请量,此时,年的专利申请量,此时,l=6,代入上述模型,代入上述模型第62页,此课件共64页哦10.4.3 二次移动平均二次移动平均 应用二次移动平均进行预测应注意以下应用二次移动平均进行预测应注意以下几个问题:几个问题:时间序列数据的倾向线为线性趋势时,才时间序列数据的倾向线为线性趋势时,才能用二次移动平均进行预测。能用二次移动平均进行预测。计算计算 和和 的的n值应取同一数值。值应取同一数值。和和 不能直接用于预测不能直接用于预测 预测模型,只有当预测模型,只有当l0时才有意义,时才有意义,其预测发展线也只用在第其预测发展线也只用在第t时期及其以后才时期及其以后才存在。存在。第63页,此课件共64页哦思考题思考题1、举例说明一次曲线时间序列分析法的计算举例说明一次曲线时间序列分析法的计算过程。过程。2、请简述一次移动平均和二次移动平均的计、请简述一次移动平均和二次移动平均的计算过程。算过程。3、请从统计年鉴中实际抽取数据,利用时间、请从统计年鉴中实际抽取数据,利用时间序列分析法预测序列分析法预测2020年某省的某项指标增年某省的某项指标增长情况。长情况。第64页,此课件共64页哦