《逐步回归与自回归模型在水文预报中的应用.pdf》由会员分享,可在线阅读,更多相关《逐步回归与自回归模型在水文预报中的应用.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、http:/-1-中国中国科技论文在线科技论文在线逐步回归与自回归模型在水文预报中的应用逐步回归与自回归模型在水文预报中的应用 1 1曹琨 河海大学 水文水资源学院,南京(210098)Email: 摘摘 要要:根据洪家渡水电站 1952-2009 年实测径流资料及 1951-2008 年 74 项气象因子,分别建立逐步回归与自回归模型对月径流量进行拟合预报,结果均通过精度检验,可用作预报。比较两种模型预报成果,发现逐步回归方程精度更高,更可信,但在资料有限的情况下,自回归方法可作为补充。关键词关键词:洪家渡;径流量;逐步回归;自回归 中图分类号:中图分类号:p33 文献标识码:文献标识码:A
2、 1 引言引言 中长期水文预报是根据前期水文气象要素,用成因分析与数理统计的方法,对未来较长时间的水文要素进行科学的预测。该学科是介于水文学、气象学与其他学科之间的一门边缘学科。随着社会的不断发展,国民经济各个部门对水文预报提出的要求越来越高,如防汛抗旱的指挥,大中型水利、水电、水运工程的兴建及管理运行等,都要求水文部门能提供预见期长、准确性高的中期与长期预报。由于影响因素的复杂与目前科学水平的限制,中长期水文预报还处于探索、发展阶段1-4 。洪家渡水电站位于贵州省黔西县与织金县交界的乌江支流北源六冲河下游河段,是乌江干流梯级开发的龙头水电站,也是国家西电东送首批电源项目启动工程。充分利用气象
3、因子资料对其流量进行准确预报意义重大。2 基本资料基本资料(1)流量资料:1952-2009 年洪家渡年径流量。用 1952-2006 年资料拟合预报,2007-2009年资料试预报。(2)1952-2008 年 74 项气象环流因子,见表 1:1基金项目:公益性行业(气象)科研专项项目(GYHY200706005)http:/-2-中国中国科技论文在线科技论文在线表 1 气象因子 1-北半球副高面积指数(5E-360)38-西太平洋副高北界 2-北非副高面积指数(20W-60E)39-东太平洋副高北界 3-北非大西洋北美副高面积指数(110W-60E)40-北美副高北界 4-印度副高面积指数
4、(65E-95E)41-大西洋副高北界 5-西太平洋副高面积指数(110E-180)42-南海副高北界 6-东太平洋副高面积指数(175W-115W)43-北美大西洋副高北界 7-北美副高面积指数(110W-60W)44-太平洋副高北界 8-大西洋副高面积指数(55W-25W)45-西太平洋副高西伸脊点 9-南海副高面积指数(100E-120E)46-亚洲区极涡面积指数(1 区,60E-150E)10-北美大西洋副高面积指数(110W-20W)47-太平洋区极涡面积指数(2 区,150E-120W)11-太平洋副高面积指数(110E-115E)48-北美区极涡面积指数(3 区,120W-30W
5、)12-北半球副高强度指数(5E-360)49-大西洋欧洲区极涡面积指数(4 区,30W-60)13-北非副高强度指数 50-北半球极涡面积指数(5 区,0-360)14-北非大西洋北美副高强度指数 51-亚洲区极涡强度指数 15-印度副高面积强度指数 52-太平洋区极涡强度指数 16-西太平洋副高强度指数 53-北美区极涡强度指数 17-东太平洋副高强度指数 54-大西洋欧洲区极涡强度指数 18-北美副高强度指数 55-北半球极涡强度指数 19-大西洋副高强度指数 56-北半球极涡中心位置 20-南海副高强度指数 57-北半球极涡中心强度 21-北美大西洋副高强度指数 58-大西洋欧洲环流型
6、 W 天数 22-太平洋副高强度指数 59-大西洋欧洲环流型 C 天数 23-北半球副高脊线 60-大西洋欧洲环流型 E 天数 24-北非副高脊线 61-欧亚纬向环流指数(0-150E)25-北非大西洋北美副高脊线 62-欧亚经向环流指数(0-150E)26-印度副高脊线 63-亚洲纬向环流指数(60-150E)27-西太平洋副高脊线 64-亚洲经向环流指数(60-150E)28-东太平洋副高脊线 65-东亚槽位置 29-北美副高脊线 66-东亚槽强度 30-大西洋副高脊线 67-西藏高原(25N-35N,80E-100E)31-南海副高脊线 68-西藏高原指数 B(30-40N,75E-10
7、5E)32-北美大西洋副高脊线 69-印缅槽(15N-20N,80E-100E)33-太平洋副高脊线 70-冷空气 34-北半球副高北界 71-编号台风 35-北非副高北界 72-登陆台风 36-北非大西洋北美副高北界 73-太阳黑子 37-印度副高北界 74-南方涛动指数 3 基本原理基本原理 3.1 逐步回归基本思路逐步回归基本思路 逐步回归法不是一下子把全部预报因子都引入回归方程,而是按对预报对象影响显著的程度逐步挑选因子。它用方差贡献作为衡量因子对预报对象重要性的指标,从中挑选出对预报对象影响最显著的因子。在建立回归方程的过程中,因子的挑选是逐步进行的,每一步只挑选出一个因子,要求当步
8、挑选出的因子是所有可供筛选的因子之中能使残差平方和下降最多的一个,并且通过指定信度的显著性检验F 检验。假设第一步根据方差贡献的大小挑选出的因子为 x1,组成第一步过渡方程5:http:/-3-中国中国科技论文在线科技论文在线1)1(1)1(0 xbby+=其中 b0(1)、b1(1)表示第一步方程的回归系数。再根据剩余因子的方差贡献大小挑选出第二个因子,设为 x2,组成第二步过渡方程5:2)2(21)2(1)2(0 xbxbby+=用同样的方程可选出第三、四个因子进入方程,随着因子的逐个引入,由于因子之间的互相配合关系,可能产生当后面的因子引入后会引起前面因子对预报对象的显著作用减小,甚至不
9、显著起来。若发生这种情况,则要在已建立的过渡方程中把这一不显著的因子剔除掉,并且每引入或剔除一个因子都要作相应的 F 检验,直至方程既不能引入也不能剔除即F 检验通不过为止,则最终的方程应是预报效果最佳的方程。3.2 自回归基本思路自回归基本思路 分析水文要素前后期演变情况的统计规律,应用这一规律由前期水文要素的数值作出后期要素的预报。AR(P)自回归模型就是用已知的前期水文数据,作出当前时刻的预报。它表示变量自身在不同时刻之间的相关关系。对于一中心化的水文平稳序列 21:ntXXXX ,可把Xt表示为自身前 1 个时间间隔到前 P 个时间间隔的数据与相应的加权系数乘积之和。其拟合误差为白噪声
10、5。数学模型为:tPiititaXX+=1 其中:假定 at 与以往的观测数据 Xn(nt)不相关。即0=ntXa 在其数学模型的基础上,作一定的统计运算,经推导得到如下方程组5:=+=+=+)p(R)0(R)2p(R)1p(R)2(R)2p(R)0(R)1(R)1(R)1p(R)1(R)0(Rp21p21p21 在实际工作中,我们是以样本函数 X(t)来分析的,因此用样本函数计算的 r(t)作为相关函数 R(t)的估计值代入方程,得到自回归系数 i 的估计值 bi 满足的 P 阶线性代数方程组5。=+=+=+)p(r)0(rb)2p(r*b)1p(rb)2(r)2p(rb)0(r*b)1(r
11、b)1(r)1p(rb)1(r*b)0(rbp21p21p21 对此方程组可用递推解法求解,求出 P 阶模型的回归系数,回代到模型,即可作出 t 时刻的预报。在水文要素随时间变化过程中,某一时刻要素值不一定与它前几个时刻有密切关系,因而要建立预报效果好的自回归预报方程,有时需要选择那些与 t 时刻要素变化的前期某几个线形关系较好的要素值建立方程。在确定自回归预报方程的阶数时通常有两种方法:顺点法和选点法。顺点法即对联立方程组求解自回归系数过程中,利用逐步回归的消去求逆紧凑方案求解,并作逐步选入或剔除变量,从而建立最佳阶数的自回归预报方程。选点法是普遍计http:/-4-中国中国科技论文在线科技
12、论文在线算所有落后 时间的自相关函数 r(),然后选择那些自相关函数绝对值较大的间隔点来建立自回归预报方程,这样可以减少回归预报方程的阶数和计算工作量。例如通过显著性检验,选择绝对值较大的三个相关系数 r(i),r(j),r(k),则相应阶数的自回归预报方程为5:ktkjtjititxbxbxbx+=求解自回归系数 bi,bj,bk 的标准方程组为5=+=+=+)k(rb)kk(rb)kj(rk)b-r(i)j(rb)jk(rb)jj(rj)b-r(i)i(rb)ik(rb)ij(ri)b-r(ikjikjikji 从联立方程组中解出 bi,bj,bk,即可得到自回归方程。4 拟合、预报结果拟
13、合、预报结果 定义:相对误差(预报值-实测值)实测值;相对误差30%为通过;通过率为相对误差30%的个数比总个数。4.1 逐步回归逐步回归(1)拟合预报 12 月报次年月报次年 1-12 月月径流量,相关系数通过信度月月径流量,相关系数通过信度05.0=的的 t 检验,回归效果通过信度检验,回归效果通过信度01.0=的的 F 检验。检验。误差统计:表 2 洪家渡逐步回归月预报拟合误差及通过率统计 预报项目 误差30%的年数 通过率(%)1 月 50 100 2 月 49 98 3 月 50 100 4 月 47 94 5 月 43 86 6 月 41 82 7 月 45 90 8 月 40 8
14、0 9 月 42 84 10 月 44 88 11 月 48 96 12 月 50 100 根据上表统计,所有月份的预报模型均已达到设计要求。图例:12 月预报次年 2 月月径流量拟合预报见图 1:http:/-5-中国中国科技论文在线科技论文在线020406080100120195519601965197019751980198519901995200020052010年份流量(m3/s)实测值模拟值 图 1 12 月预报次年 2 月月径流量拟合预报 12 月预报次年 8 月以径流量拟合预报见图 2 0100200300400500600700195519601965197019751980
15、198519901995200020052010年份流量(m3/s)实测值模拟值 图 2 12 月预报次年 8 月以径流量拟合预报 (2)试验预报:12 月报未来各月预报效果见表 3、4 表 3 洪家渡未来各月预报误差分布(%)2006 年 12 月报 2007 年 12 月报 2008 年 12 月报 次年 1 月-21.34-13.06-8.03 次年 2 月-4.33-27.16-27.99 次年 3 月 27.84-14.52-19.07 次年 4 月 295.37 36.29-1.25 次年 5 月 17.33-20.94 134.04 次年 6 月 6.92-24.69 20.46
16、 次年 7 月-15.44-56.71 218.43 次年 8 月-20.73-25.24 127.38 次年 9 月-4.92-14.44 49.83 次年 10 月 72.70-26.06 17.17 次年 11 月 21.49-71.13 6.29 次年 12 月 11.80-5.31-25.78 在被预报的 3 年中,除 4、7 月份精度较差外,其他大多数月份都可有 2 年甚至 3 年报准。而据资料分析表明,4、7 月流量的年际变化很大,非常容易出现异常情况,如 2007 年4 月流量 33.71 m3/s,多年平均流量 64.7m3/s,偏少 48%,所以预报误差相对较大。4.2 自
17、回归自回归(1)拟合预报 http:/-6-中国中国科技论文在线科技论文在线12 月报次年 1-12 月月径流量 5、11 月模型中的相关系数通过信度05.0=的 t 检验,其余月份相关系数通过信度10.0=的 t 检验,回归效果通过信度01.0=的 F 检验。拟合预报误差统计见表 4。表 4 洪家渡自回归月预报拟合误差及通过率统计 预报项目 误差30%的年数 通过率(%)1 月 49 98 2 月 48 96 3 月 48 96 4 月 36 72 5 月 35 70 6 月 39 78 7 月 38 76 8 月 34 68 9 月 31 62 10 月 47 94 11 月 47 94
18、12 月 49 98 按误差30%为合格,根据上表统计,除 9 月稍差外,其他月份的预报模型均已达到设计要求。图例:12 月报未来第 2 月拟合预报效果见图 3。020406080100120195519601965197019751980198519901995200020052010年份流量(m3/s)实测值模拟值 图 3 12 月报未来第 2 月拟合预报效果 12 月报未来第 8 月拟合预报效果见图 4。http:/-7-中国中国科技论文在线科技论文在线01002003004005006007001955196019651970197519801985199019952000200520
19、10年份流量(m3/s)实测值模拟值 图 4 12 月报未来第 8 月拟合预报效果 (2)试验预报:12 月报未来各月预报效果分析发现,没有报准的月份和逐步回归相似,基本都是异常偏多或偏少的月份。5 拟合和预报合格率拟合和预报合格率 5.1 逐步回归逐步回归 表 5 洪家渡逐步回归拟合、预报误差分布 拟合项目 平均通过率(%)预报项目 平均通过率(%)月 91.5 月 75.0 由于 2008、2009 均为异常年,3 年预报中,2007 年预报准确率最高。5.2 自回归自回归 拟合和预报合格率分布见表 7。表 6 洪家渡自回归拟合、预报误差分布 拟合项目 平均通过率(%)预报项目 平均通过率
20、(%)月 83.5 月 66.7 区间流量资料只到 2006 年,为保证模型的精度,自回归模型拟合到 2006 年,没有预报。6 小结小结(1)按照相对误差30%为合格,方案的合格率70的预报精度,逐步回归和自回归模型均达到要求。将两种预报方案的模拟结果进行比较,结果表明,选用 74 项环流因子的逐步回归方案的预报精度普遍好于自回归模型。(2)考虑气象因子逐步回归模型预报效果最好,说明了洪家渡的水文中长期过程与整个大气环流有着密切的联系,准确的中长期水文预报必须要考虑气象因子的作用。反映预报对象自身演变规律的自回归模型相对预报精度差些,但由于资料容易收集,可以作为前种模型的替补。(3)自回归模
21、型预报需要站点流量数据完整,必须及时补充流量资料,以保证自回归模型的预报精度。(4)逐步回归方案的正常运行需要大气环流的资料,资料在精度和时间上要有保证。http:/-8-中国中国科技论文在线科技论文在线参考文献参考文献 1鹿坤.浅谈中长期水文预报方法J .贵州水力发电,2004,18(2):17-19.2王钦钊,向奇志.中长期水文预报方法的探讨J .江西水利科技,2006,32(2):87-90.3范钟秀.中长期水文预报M.南京:河海大学出版社,1999.4汤成友,官学文,张世明.现代中长期水文预报方法及其应用M.北京:中国水利水电出版社,2008.5汤友成,官学文,张世明。现代中长期水文预
22、报方法及其应用M.北京:中国水利水电出版社,2008.Application of Stepwise regression and autoregressive in hydrological forecasting Cao Kun Water Resources and Hydrology,Hohai University,Nanjing(210098)Abstract Based on the runoff data of Hongjiadu Hydropower Station in 1952-2009 and 74 meteorological factors in 1951-2008
23、,the paper establishes stepwise regression and autoregressive models to predict monthly runoff of Hongjiadu Hydropower Station.The results have been through the precision test,so the models can be used in prediction.Comparing the two models,it is found stepwise regression equation is more precise and more reliable,but in the case of limited information,the autoregression model can be used as a supplement.Keywords:Hongjiadu;runoff;stepwise regression;autoregressive