气象观测站调整.ppt-淘文阁

资源描述

《气象观测站调整.ppt》由会员分享，可在线阅读，更多相关《气象观测站调整.ppt（24页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、气象观测站的调整某地区内有12个气象观测站，位置如下图。x1x2x3x4x5x6x7x8x9x10 x11x12十年来各站测得的年降水量如下表所示：地点地点年年x x1 1x x2 2x x3 3x x1010 x x1111x x121219811981276.2276.2324.5324.5158.6158.6 243.2243.2159.7159.7331.2331.219821982251.6251.6455.1455.119831983198819881989198919901990324.8324.8406.5406.5235.7235.7 281.2281.2243.7243.7

2、411.1411.1 为了节省开支，想要适当减少气象观测站。问减少哪些观测站可以使所得到的降水量的信息量仍然足够大？欲解决的问题是方差、相关性和回归分析相结合；主成分分析或因子分析；信息熵函数；方法概述：欲达到的目的是站数较少，同时得到的信息量仍足够大。在站数与信息量之间，信息量是主要因素。1、问题分析：由于不同站之间年降水量的相关性不仅取决于地理位置的远近，而且取决于地理气象环境的相似性。而该问题的主要依据是降水量信息，而各站的地理位置信息仅作为参考信息。问题分解成以下几个问题：1）删除哪几个站？2）如何预测被删除站的降水量信息？3）如何度量上述预测值中所包含的降水量信息是否足够大？假设：

3、1）降水量信息反映了各观测站地理气象环境之间的相似性；2）各站每年的降水量视为一个围绕其均值上下波动的正态随机变量；模型建立与求解：首先考虑相关系数矩阵。(xgxs.m)A=;R=corrcoef(A)具体计算R=x1 x2 x3 x4 x5 x6 x71 1.0000 -0.2456 -0.2206 -0.1082 -0.3312 0.3481 -0.26222 -0.2456 1.0000 0.0777 -0.3965 0.1085 0.0103 0.17753 -0.2206 0.0777 1.0000 -0.5031 -0.2676 0.4077 0.81264 -0.1082 -0.

4、3965 -0.5031 1.0000 0.3158 -0.5567 -0.15235 -0.3312 0.1085 -0.2676 0.3158 1.0000 -0.6136 -0.09776 0.3481 0.0103 0.4077 -0.5567 -0.6136 1.0000 0.22367 -0.2622 0.1775 0.8126 -0.1523 -0.0977 0.2236 1.00008 0.0836 -0.1697 -0.0858 0.1384 -0.3156 0.0417 -0.32419 0.2928 0.1943 0.1915 -0.2029 -0.2524 0.4918

5、 0.053110 -0.3098 0.2421 -0.0175 -0.2501 0.5817 -0.0106 -0.067411 0.1587 0.0563 0.3278 -0.4201 0.0844 0.6544 0.063512 0.2786 -0.3460 0.0111 -0.2597 -0.2037 0.3631 -0.5152续上表 x8 x9 x10 x11 x121 0.0836 0.2928 -0.3098 0.1587 0.27862 -0.1697 0.1943 0.2421 0.0563 -0.34603 -0.0858 0.1915 -0.0175 0.3278 0.

6、01114 0.1384 -0.2029 -0.2501 -0.4201 -0.25975 -0.3156 -0.2524 0.5817 0.0844 -0.20376 0.0417 0.4918 -0.0106 0.6544 0.36317 -0.3241 0.0531 -0.0674 0.0635 -0.51528 1.0000 0.6348 -0.5946 -0.0762 0.53929 0.6348 1.0000 -0.4225 0.4272 0.425910 -0.5946 -0.4225 1.0000 0.4969 0.002611 -0.0762 0.4272 0.4969 1.

7、0000 0.565212 0.5392 0.4259 0.0026 0.5652 1.0000强相关变量：x3,x7(0.750.81)中度相关变量：当0.5|ij|0.7时，称xi,xj中度相关。中度相关的变量有：x4,x6,x8,x9,x10,x11,x12轻度相关变量：x1,x2,x5显然，强相关变量与中度相关变量应优先考虑被删除。总结其次考虑标准差。将各站降水量的标准差列表：x xx1x1x2x2x3x3x4x4x5x5x6x6x7x7x8x8x9x9x10 x10 x11x11x12x12100.2100.281.881.8108.2108.264.064.094.194.194.

8、294.238.138.185.185.1109.4109.457.357.386.586.536.836.8对于标准差较大的站，认为它们包含的信息量比较大。所以应优先考虑删除标准差较小的观测站。因此，考虑删除的站有：D=x4,x6,x7,x8,x10,x11,x12b=std(A)排序：4 7 1 5 3 6 2 用线性回归方法根据保留站观测数据去预测被删除站的观测值。估计应该在集合D中删除35个变量。其组合数有对每一种组合用回归方法进行线性拟合，根据剩余方差最小，每一个回归自变量显著为标准选出最佳组合。假定欲删除4个变量。思考：究竟考虑删除几个观测站呢？1)考虑删除观测站x4,x7,x10

9、,x12进行回归拟合：x4=f1(x1,x2,x3,x5,x6,x8,x9,x11)x7=f2(x1,x2,x3,x5,x6,x8,x9,x11)x10=f3(x1,x2,x3,x5,x6,x8,x9,x11)x12=f4(x1,x2,x3,x5,x6,x8,x9,x11)其结果见huig2.m例2)考虑删除观测站x6,x7,x8,x10进行回归拟合：x6=f1(x1,x2,x3,x4,x5,x9,x11,x12)x7=f2(x1,x2,x3,x4,x5,x9,x11,x12)x8=f3(x1,x2,x3,x4,x5,x9,x11,x12)x10=f4(x1,x2,x3,x4,x5,x9,x1

10、1,x12)其结果见huig1.mb1,bint1,r1,rint1,stats1=regress(Y1,X);两种情况对比：删除情况删除情况删除情况删除情况 1 12 2 2 22 2 3 32 2 4 42 2xx6 6,x,x7 7,x,x8 8,x,x1010160.36160.36 0.58550.5855 6217.96217.9 702.11702.11x x4 4,x,x7 7,x,x1010,x,x12121275412754 1421.11421.1 114.82114.82 1340.91340.9情情形形一一Stats1Stats10.9880.98862.12962.

11、1290.09780.0978Stats2Stats21 12781.42781.40 0Stats3Stats30.90450.90451.18451.18450.6150.615Stats4Stats40.97620.97625.12625.12620.32960.3296情情形形二二Stats1Stats10.65380.65380.23600.23600.92650.9265Stats2Stats20.89090.89091.0211.0210.64870.6487Stats3Stats30.99610.996131.98631.9860.13600.1360Stats4Stats40

12、.89020.89021.01311.01310.65050.6505 当确定删除变量x6，x7，x8，x10的方案后，还可以通过逐步回归方法确定最佳回归方程。stepwise(X,y,inmodel,alfha)（huig11.m)例如输入：例如输入：X=x1,x2,x3,x4;stepwise(X,y,1,2,3)注意：将得到一个交互式的界面注意：将得到一个交互式的界面模型中均方差历模型中均方差历史数据记载表史数据记载表参参变量数变量数据分析表据分析表输出结果：输出结果：通过各种情况的比较，得到如下的结果：删除观测站x6,x7,x8,x10，得到四个相对应的回归方程（如前面所示）。四个回归

13、方程的剩余方差分别为：结果分析：定义信息损失比率：计算出删除6，7，8，10四站的信息损失比率分别为：dert=4.02%0.22%25.96%8.85%平均信息损失为：9.76%删除4个站的降水量信息仍保留了约90%，结果比较令人满意。除了以上分析方法以外是否还有其它统计方法可以分析呢？如主成分分析法、定义信息熵函数等。思考：熵(Entropy)是分子热力学中的一个概念，用以描述分子随机运动的无序程度。分子运动越是无序，则熵越大。在信息论中，此概念被用以衡量随机试验得到的信息量的大小。熵越大，信息量越大。最大熵原理定义其中c是常数，pi=PX=xi,i=1,2,n,一般取 c=1.不加任何限制，当pi=1/n时，熵最大。定义假设X是连续型随机变量，X的密度函数是p(x)，则熵函数定义为：1、在方差一定的连续型概率分布中，以正态分布的熵最大；2、对于任何一个基本对称系统，其状态的概率分布应在表征这个系统状态的约束条件下，使这个分布所定义的熵最大；性质例将系统状态限制在有限区间之内时，使熵最大的分布是该区间上的均匀分布。对气象观测站问题，可以计算在各观测站下的标准差i的值，定义pi=i/j,或可以计算当删除某个观测站，信息熵的变化值。即

展开阅读全文