《时间序列第二章.ppt》由会员分享,可在线阅读,更多相关《时间序列第二章.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、时间序列分析的基本概念时间序列分析的基本概念n平稳过程的特征及检验平稳过程的特征及检验 n特殊数据点处理特殊数据点处理 平稳性检验平稳性检验 n特征统计量特征统计量n平稳时间序列的定义平稳时间序列的定义n平稳时间序列的统计性质平稳时间序列的统计性质n平稳时间序列的意义平稳时间序列的意义n平稳性的检验平稳性的检验 特征统计量特征统计量n均值均值 n方差方差n自协方差自协方差n自相关系数自相关系数平稳时间序列的定义平稳时间序列的定义n严平稳严平稳严平稳是一种条件比较苛刻的平稳性定义,它严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时认为只有当序列所有的统计性质都不会
2、随着时间的推移而发生变化时,该序列才能被认为平间的推移而发生变化时,该序列才能被认为平稳。稳。n宽平稳宽平稳宽平稳是使用序列的特征统计量来定义的一种宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。阶),就能保证序列的主要性质近似稳定。平稳时间序列的统计定义平稳时间序列的统计定义 n满足如下条件的序列称为严平稳序列满足如下条件的序列称为严平稳序列n满足如下条件的序列称为宽平稳序列满足如下条件的序列称为宽平稳序
3、列严平稳与宽平稳的关系严平稳与宽平稳的关系n一般关系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立宽平稳序列不能反推严平稳成立n特例特例不存在低阶矩的严平稳序列不满足宽平稳条件不存在低阶矩的严平稳序列不满足宽平稳条件当序列服从多元正态分布时,宽平稳可以推出当序列服从多元正态分布时,宽平稳可以推出严平稳严平稳平稳时间序列的统计性质平稳时间序列的统计性质 n常数均值常数均值 n自协方差函数和自相关函数只依赖于时间自协方差函数和自相关函数只依赖于时间的
4、平移长度而与时间的起止点无关的平移长度而与时间的起止点无关 延迟延迟k k自协方差函数自协方差函数 延迟延迟k k自相关系数自相关系数若若Xt为平稳序列,假定为平稳序列,假定EXt=0,由于,由于令令s=t-k,于是我们就可以用以下记号表示平稳序列的自,于是我们就可以用以下记号表示平稳序列的自协方差函数,即:协方差函数,即:相应的,自相关函数记为:相应的,自相关函数记为:自相关系数的性质自相关系数的性质n规范性规范性 n对称性对称性 n非负定性非负定性 n非唯一性非唯一性 平稳时间序列的意义平稳时间序列的意义 n时间序列数据结构的特殊性时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一
5、个样本可列多个随机变量,而每个变量只有一个样本观察值观察值n平稳性的重大意义平稳性的重大意义极极大大地地减减少少了了随随机机变变量量的的个个数数,并并增增加加了了待待估估变量的样本容量变量的样本容量极极大大地地简简化化了了时时序序分分析析的的难难度度,同同时时也也提提高高了了对特征统计量的估计精度对特征统计量的估计精度平稳性的检验(图检验方法)平稳性的检验(图检验方法)n时序图检验时序图检验 根据平稳时间序列均值、方差为常数的性质,根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、个
6、常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征无明显趋势及周期特征n自相关图检验自相关图检验 平平稳稳序序列列通通常常具具有有短短期期相相关关性性。该该性性质质用用自自相相关关系系数数来来描描述述就就是是随随着着延延迟迟期期数数的的增增加加,平平稳稳序列的自相关系数会很快地衰减向零序列的自相关系数会很快地衰减向零例题例题n例例2.1检验检验1964年年1999年中国纱年产量序列年中国纱年产量序列的平稳性的平稳性n例例2.2检验检验1962年年1月月1975年年12月平均每头奶牛月产奶月平均每头奶牛月产奶量序列量序列的平稳性的平稳性n例例2.3检验检验19491949年年19981
7、998年北京市每年最高气温序列的平年北京市每年最高气温序列的平稳性稳性例例2.1时序图时序图例例2.1自相关图自相关图例例2.2时序图时序图例例2.2 自相关图自相关图例例2.3时序图时序图例例2.3自相关图自相关图非参数检验法:游程检验非参数检验法:游程检验(1)什么是游程什么是游程一个游程定义为一个具有相同符号的连续串,在一个游程定义为一个具有相同符号的连续串,在它前后相接的是与其不同的符号或完全无符号。它前后相接的是与其不同的符号或完全无符号。例如,观察的结果用加、减标志表示,得到一组例如,观察的结果用加、减标志表示,得到一组这样的记录顺序:这样的记录顺序:+-+-+-+这个样本的观察结
8、果共有这个样本的观察结果共有7个游程。个游程。(2)用游程检验方法检验时间序列平稳性)用游程检验方法检验时间序列平稳性 的基本思想的基本思想如果符号序列是随机的,那么如果符号序列是随机的,那么“+”和和“-”将随将随机机出现,因此它的游程数既不会太多,又不会太出现,因此它的游程数既不会太多,又不会太少;反过来说如果符号序列的游程总数太少或少;反过来说如果符号序列的游程总数太少或太多,我们就可以认为时间序列存在某种趋势太多,我们就可以认为时间序列存在某种趋势性或周期性。性或周期性。(3)检验方法检验方法a.小样本情况小样本情况零假设:零假设:H0:加号和减号以随机的方式出现:加号和减号以随机的方
9、式出现检验方法:取显著性水平检验方法:取显著性水平(一般取一般取0.05),查单样本游程检验表,得出抽样分布的临查单样本游程检验表,得出抽样分布的临界值界值rL、rU判定:若判定:若rL r rU 或或r rL则拒绝零假设,序列是非平稳的。则拒绝零假设,序列是非平稳的。b.大样本情况大样本情况零假设:零假设:H0:加号和减号以随机的方式出现:加号和减号以随机的方式出现检验方法:给定显著性水平检验方法:给定显著性水平(一般取一般取0.05)查标准正态分布表,得出抽样分布查标准正态分布表,得出抽样分布的临界值的临界值-z,+z。并计算统计量。并计算统计量:判定:若判定:若-z z+z,则不能拒绝零
10、假设,即则不能拒绝零假设,即不能拒绝序列是平稳的不能拒绝序列是平稳的;否则拒绝零假设,否则拒绝零假设,序列是非平稳的。序列是非平稳的。非参数检验可以很方便的通过非参数检验可以很方便的通过SPSS软件进行,软件进行,实例:用游程检验实例:用游程检验S&T数据的平稳性;数据的平稳性;步骤如下:步骤如下:1.打开打开SPSS输入数据输入数据2.依次单击依次单击AnalyzeNonparmetric TestsRuns;打开打开Runs对话框。对话框。3.在源变量对话框中选择变量进入在源变量对话框中选择变量进入“Test Variable list”栏内栏内4.选中选中“cut point”栏中栏中“
11、mean”选项选项5.单击单击“OK”按纽,开始进行统计分析。按纽,开始进行统计分析。输出结果分析:因为P值(sig.)极小,所以拒绝零假设,故原序列是非平稳的。纯随机性检验纯随机性检验 n纯随机序列的定义纯随机序列的定义n纯随机性的性质纯随机性的性质n纯随机性检验纯随机性检验纯随机序列的定义纯随机序列的定义n纯随机序列也称为白噪声序列,它满足如纯随机序列也称为白噪声序列,它满足如下两条性质下两条性质 标准正态白噪声序列时序图标准正态白噪声序列时序图 白噪声序列的性质白噪声序列的性质 n纯随机性纯随机性方差齐性方差齐性各序列值之间没有任何相关关系,即为各序列值之间没有任何相关关系,即为“没没有
12、记忆有记忆”的序列的序列 n方差齐性方差齐性 根据马尔可夫定理,只有方差齐性假定成立时,根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确用最小二乘法得到的未知参数估计值才是准确的、有效的的、有效的纯随机性检验纯随机性检验 n检验原理检验原理n假设条件假设条件n检验统计量检验统计量 n判别原则判别原则Barlett定理定理 n如果一个时间序列是纯随机的,得到一个如果一个时间序列是纯随机的,得到一个观察期数为观察期数为 的观察序列,那么该序列的延的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察
13、期数倒数的正态值为零,方差为序列观察期数倒数的正态分布分布假设条件假设条件n原假设:延迟期数小于或等于原假设:延迟期数小于或等于 期的序列值期的序列值之间相互独立之间相互独立n备择假设:延迟期数小于或等于备择假设:延迟期数小于或等于 期的序期的序列值之间有相关性列值之间有相关性 检验统计量检验统计量nQ统计量统计量 nLB统计量统计量 判别原则判别原则n拒绝原假设拒绝原假设当检验统计量大于当检验统计量大于 分位点,或该统计分位点,或该统计量的量的P值小于值小于 时,则可以以时,则可以以 的置信水的置信水平拒绝原假设,认为该序列为非白噪声序列平拒绝原假设,认为该序列为非白噪声序列n接受原假设接受
14、原假设当检验统计量小于当检验统计量小于 分位点,或该统计分位点,或该统计量的量的P值大于值大于 时,则认为在时,则认为在 的置信水的置信水平下无法拒绝原假设,即不能显著拒绝序列平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定为纯随机序列的假定 例例2.4:标准正态白噪声序列纯随机性检验标准正态白噪声序列纯随机性检验样本自相关图样本自相关图检验结果检验结果延迟延迟统计量检验统计量检验统计量值统计量值P值值延迟延迟6期期2.360.8838延迟延迟12期期5.350.9454由于由于P值显著大于显著性水平值显著大于显著性水平 ,所以该序列,所以该序列不能拒绝纯随机的原假设。不能拒绝纯随机的
15、原假设。例例2.5n对对1950年年1998年北京市城乡居民定期年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进储蓄所占比例序列的平稳性与纯随机性进行检验行检验 例例2.5时序图时序图例例2.5自相关图自相关图例例2.5白噪声检验结果白噪声检验结果延迟阶数延迟阶数LB统计量检验统计量检验LB检验统计检验统计量的值量的值P值值675.460.00011282.570.0001上机指导(平稳性与纯随机性检验)上机指导(平稳性与纯随机性检验)1.绘制时序图绘制时序图2.平稳性检验平稳性检验3.纯随机性检验纯随机性检验平稳性检验平稳性检验(1)时序图)时序图n判断(检验)标准判断(检验)标准
16、根据平稳时间序列均值、方差为常数的性质,平根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋值附近随机波动,而且波动的范围有界、无明显趋势及周期特征势及周期特征(2)自相关图自相关图n判断(检验)标准判断(检验)标准平平稳稳序序列列通通常常具具有有短短期期相相关关性性。该该性性质质用用自自相相关关系系数数来来描描述述就就是是随随着着延延迟迟期期数数的的增增加加,平平稳稳序序列列的的自相关系数会很快地衰减向零自相关系数会很快地衰减向零纯随机性检验(判别原则)纯随机性检验(判
17、别原则)n拒绝原假设拒绝原假设当检验统计量大于当检验统计量大于 分位点,或该统计量的分位点,或该统计量的P值小于值小于 时,则可以以时,则可以以 的置信水平拒绝原假的置信水平拒绝原假设,认为该序列为非白噪声序列设,认为该序列为非白噪声序列n接受原假设接受原假设当检验统计量小于当检验统计量小于 分位点,或该统计量的分位点,或该统计量的P值值大于大于 时,则认为在时,则认为在 的置信水平下无法拒的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假绝原假设,即不能显著拒绝序列为纯随机序列的假定定 2.3 特殊数据点处理特殊数据点处理n离群点是指一个时间序列中,远离序列一般离群点是指一个时间
18、序列中,远离序列一般水平的极端大值和极端小值,也成为奇异值水平的极端大值和极端小值,也成为奇异值或野值。或野值。n形成离群点的原因是多种多样的,例如由于形成离群点的原因是多种多样的,例如由于数据传输过程、采样及记录过程中发生信号数据传输过程、采样及记录过程中发生信号失真或丢失等而产生,又如研究现象本身由失真或丢失等而产生,又如研究现象本身由于受各种偶然非正常的因素影响而形成离群于受各种偶然非正常的因素影响而形成离群点等等。点等等。离群点的主要影响:离群点的主要影响:1、对于、对于 系数的估计值将不准确。系数的估计值将不准确。2、会使得、会使得 的预测值不准确的预测值不准确 3、比真实的要大比真
19、实的要大 离群点的判断:离群点的判断:比较两个数值的差异:比较两个数值的差异:代表先对序列值取平方然后平滑得到的数值代表先对序列值取平方然后平滑得到的数值代表先平滑序列值然后取平方得到的数值代表先平滑序列值然后取平方得到的数值若两个序列不存在差异即不是离群点,否则为离群点。若两个序列不存在差异即不是离群点,否则为离群点。n例如:最简单平滑法例如:最简单平滑法n适用条件适用条件:适用大体呈水平变动趋势的时间序列:适用大体呈水平变动趋势的时间序列n平滑公式平滑公式:移动平均项数移动平均项数N的确定:的确定:若序列的随机性若序列的随机性较大,较大,N取较大;否则,取较大;否则,N应取较小。若应取较小
20、。若存在周期变动,存在周期变动,N应取周期长度。应取周期长度。如果想得到长期趋势,就做期数较大的如果想得到长期趋势,就做期数较大的移动平均,如果想密切关注序列的短期移动平均,如果想密切关注序列的短期趋势,就应该做期数较小的移动平均。趋势,就应该做期数较小的移动平均。离群点的分类离群点的分类 1、加性离群点、加性离群点 2、更新离群点、更新离群点 3、水平移位离群点、水平移位离群点 4、暂时变更离群点、暂时变更离群点阅读文献:在统计分析中如何识别极端值阅读文献:在统计分析中如何识别极端值 江苏统计江苏统计1999、11 郭莉郭莉 1、四分展步法、四分展步法 2、3 法法 3、茎叶图法、茎叶图法缺损值的补足缺损值的补足缺失值填充方法缺失值填充方法:1、series mean 全体序列的均数,默认值全体序列的均数,默认值2、mean of nearby points 相邻若干点的均数相邻若干点的均数3、median of nearby points:相邻若干点的中位数相邻若干点的中位数4、linear trend at point.该点的线性趋势,将记录号作为该点的线性趋势,将记录号作为 自变量,序列值作为应变量回归,求得该点的估计值。自变量,序列值作为应变量回归,求得该点的估计值。