《北京市水资源短缺综合评价.doc》由会员分享,可在线阅读,更多相关《北京市水资源短缺综合评价.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、水资源短缺风险综合评价摘要针对北京市水资源短缺的农业用水等九大主要因素,用熵权法得出人口数量和降水量 的影响因素较大。本文选取区域水资源短缺风险程度的风险率、脆弱性、可恢复性、重现期 和风险度作为评价指标,构建了模糊综合评价模型,结论表明北京市水资源短缺现处于高风 险状态,并建立多元线性回归和灰色系统 GM 模型,预测北京市未来两年水资源短缺仍将持续 处于高风险状态。 根据所建模型及预测结果向相关部门提出控制在京人口以及合理分配农业、 工业、生态用水量来缓解北京水资源短缺现状。 一、问题重述 1.1 问题的提出 水资源,是指可供人类直接利用,能够不断更新的天然水体。主要包括陆地上的地表水 和地
2、下水。 风险,是指某一特定危险情况发生的可能性和后果的组合。 水资源短缺风险,泛指在特定的时空环境条件下,由于来水和用水两方面存在不确定性, 使区域水资源系统发生供水短缺的可能性以及由此产生的损失。 近年来,我国、特别是北方地区水资源短缺问题日趋严重,水资源成为焦点话题。 以北京市为例,北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足 3 300m , 为全国人均的 1/8, 世界人均的 1/30, 属重度缺水地区, 附表中所列的数据给出了 1979 年至 2000 年北京市水资源短缺的状况。 北京市水资源短缺已经成为影响和制约首都社会和经 济发展的主要因素。 政府采取了一系列措
3、施, 如南水北调工程建设, 建立污水处理厂,产业结 构调整等。但是,气候变化和经济社会不断发展,水资源短缺风险始终存在。如何对水资源 风险的主要因子进行识别,对风险造成的危害等级进行划分,对不同风险因子采取相应的有 效措施规避风险或减少其造成的危害,这对社会经济的稳定、可持续发展战略的实施具有重 要的意义。 北京 2009 统计年鉴及市政统计资料提供了北京市水资源的有关信息。利用这些资料 和你自己可获得的其他资料,讨论以下问题: 1 评价判定北京市水资源短缺风险的主要风险因子是什么? 影响水资源的因素很多,例如:气候条件、水利工程设施、工业污染、农业用水、管理制度, 人口规模等。 2 建立一个
4、数学模型对北京市水资源短缺风险进行综合评价, 作出风险等级划分并陈述 理由。对主要风险因子,如何进行调控,使得风险降低? 3 对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。 4 以北京市水行政主管部门为报告对象,写一份建议报告。 1.2 问题简要分析 为了能客观准确评价判定北京市水资源短缺风险的主要风险因子, 首先找出可能造成北 京水资源短缺的多个平行因素,依据历年的耗水指标,根据熵值法确定各因素的权重系数, 找出熵值最小(即权重最大)的指标就是水资源短缺风险最主要的风险因子。在实际解决北 京水资源短缺的问题时就可以从该主要因素入手。 要在风险识别和风险分析的基础上进行水资源短缺风
5、险做综合评价和风险等级划分,把 损失概率、损失程度以及其它因素综合起来考虑,分析该风险的影响,寻求风险对策并分析 该对策的影响,为风险决策创造条件。通过对定义的风险率、脆弱性、可恢复性、重现期、 风险度作为水资源短缺风险的评价指标的计算,采用模糊综合评判方法对水资源短缺风险进 行评价,判断风险等级。接着用层次分析法作出评价指标的权重,通过加权平均型模型的建立,计算出风险性的综合评分。 对北京市未来两年水资源的短缺风险进行预测,建立灰色系统理论模型和多元线性回归 模型两种不同的模型对水资源短缺风险分别进行预测,在假设数据相同计算无误的基础上, 该两种模型对未来两年北京水资源的短缺风险的预测结果应
6、该是相同的。 二、基本假设1、影响北京水资源短缺的多个因素在未来没有突变情况发生(政府政策的干预,自然灾害的 影响等);2、假设影响北京水资源短缺的多个因素相互独立,即这个指标对风险的影响与其他指标对风 险的影响没有关系; 3、假设没有重大的自然灾害发生如干旱等;4、假设北京地区人口流动正常;5、假设南水北调及其它工程正常运行; 三、符号说明 序号 符号 w 含义 1 r 评价指标的熵权 2 风险率性能衡量指标 3 脆弱性性能衡量指标 4 重现期性能衡量指标 5 Cv 可恢复性性能衡量指标 6 maxbij 风险度性能衡量指标 7 x (0) 风险性的综合评分值 8 (k ) 水资源差值时间序
7、列 9 (k ) 水资源差值时间序列级比 10 模糊关系矩阵 11 相对于因素 ui 而言属于 vi 的程度 12 (k ) 残差 13 (k ) 级比偏差值wi Ru /vi (ij ) 三 、模型建立与求解 3.1 问题一 问题一要求我们寻找到影响北京水资源严重短缺的主要风险因子。由于某一指标的权重 是指该指标在整体评价中的相对重要程度。显然,可以通过计算每个因子的权重来判断其对 水资源短缺的影响程度,从而得到主要风险因子。在本题中,我们在提供的气候条件、水利 工程设施、工业用水、农业用水、第三产业及其他用水、人口规模几个影响因子基础上还增 加了生态用水量、降水量、园林绿化覆盖率、废水治理
8、设施数、工业排放总量等影响因素。 通过对 1979 年至 2009 年各个因素数据的分析,构建模糊物元,我们采用了运用熵值法来确 定权重系数。由于熵值越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价 中所起的作用越大,其权重也越大,故我们最后可以通过各个因素的熵值大小,比较得出各 个因子的权重大小,从而得到影响北京水资源短缺的主要风险因子 ,在信息论中,熵值反映了信息无序化程度, 其值越小,系统无序度越小,故可用信息熵评价所获系统信息的有序度及其效用,即由评价 指标值构成的判断矩阵来确定指标权重,它能尽量消除各指标权重计算的人为干扰,使评价 结果更符合实际。其计算步骤如下: (1)
9、构建 m 个事物 n 个评价指标的判 R=( x i j )nm(i=1,2,n;j=1,2,m)。 bij=rij-rmin/rmax-rmin: rmax 、 rmin 分别为同指标下不同事物中最满意者或最不满意者(越小越满意或越大越满意)。 (3)根据熵的定义,m 个评价事物 n 个评价指标,可以确定评价指标的熵为: Hi=为使 ln fij 有意义,当 f ij =0时,根据风险评价的实际意义,可以理解 ln fij 为一较大的 数值,与 fij 相乘趋于0,故可认为。但当 fij =1, 映的信息无序化程度相悖,不切合实际,故需对也等于0,这显然与熵所反 fij 加以修正,将其定义为
10、: f ij = (4)计算评价指标的熵权W=(wi) 1n wi= 式中i=1,2,3n,且满足,且满足 =1 权重的求解及主要风险因子的确定 我们通过3.1.2中涉及的熵值求权重的方法,运用MATLAB编程得到了各个因素的熵值,通 过比较可以得到影响北京市水资源短缺的主要风险因子。熵值法的主要运算结果见下表:表一: 各个风险因子归一化后的年份2000200120022003200420052006200720082009农业用水0.36370.39350.33130.27550.26560.25580.24270.22960.21640.1968生态用水0.25350.25260.260.
11、26190.26190.27130.31810.4210.46780.5051工业用水0.4110.360.29430.3310.30210.26730.24410.22870.20550.2055其他用水0.24040.193280.15260.22720.22040.24080.25090.25770.28480.3052降水量0.19910.25680.2390.2190.23740.26040.28210.30850.340.3442园林覆盖率0.14360.14760.19310.25640.29770.31910.27880.22740.31930.3982治理设施0.37180.
12、31980.30380.22880.23480.25550.25730.26730.27720.2872工业污染0.30680.29640.2850.28040.26790.26380.21790.25580.18590.2059人口数量0.17210.18290.20220.28090.26670.27230.19560.16560.15790.1534表二: 各个风险因子的熵H以及熵权W农业用水生态用水工业用水其他用水人口数量降水量园林覆盖率治理设施工业污染H0.13890.14980.14120.15730.15940.15920.15560.14130.1249W0.11220.110
13、80.11190.10980.10960.10960.11010.11190.1141由上表可知:农业用水、生态用水,工业用水、其他用水,人口数量、降水量、园林覆盖 率、治理设施、工业污染的熵权值分别为:0.1122、0.1108、0.1119、0.1098、0.1096、0.1096、 0.1101、0.1119、0.1141。由于熵值越小影响越大,其权重也越大的原则,我们可以很清楚的 知道:在影响北京水资源短缺的众多因素中,北京市人口总数以及北京市降雨量对其影响程 度较大。 3.2 问题二 在问题二中我们要对北京市水资源短缺风险进行综合分析评价,并作出风险等级划分。水 资源的短缺取决于供水
14、和需水两方面影响,而这两方面都具有随机性和不确定性。因此水资 源短缺风险也具有随机性和不确定性。我们在进行风险评价时,充分考虑风险特点以及水资 源的复杂性,把存在风险的概率、风险出现的时间、风险造成的损失多少、风险解除时间、 缺水量的分布等一系列因素考虑在内。故我们从多方面的指标综合考虑评价北京市现水资源 短缺风险等级。我们在评价指标选择中坚持的原则:(1)能集中反映缺水的风险程度;(2) 能集中反映水资源短缺风险发生后水资源系统的承受能力;(3)代表性好,针对性强,易于 量化。依据上述原则,我们选取水资源的风险率、脆弱性、可恢复性、事故周期、风险度作 为水资源系统水资源短缺风险的评价指标。
15、在水资源短缺风险评价等级模型建立过程中,我们采用模糊概率理论,建立了模糊概率 模型,通过模型我们可以清晰地看到北京市现水资源风险等级。 3.2.1 水资源短缺风险评价指标 1. 风险率 根据风险理论,荷载是使系统“失事”的驱动力,而抗力则是对象抵御“失事”的能力。 如果把水资源系统的失事状态记为 F(),正常状态记为 S( )=P X t F 式中: X t为水资源系统状态变量 如果水资源系统的工作状态有长期的记录,风险率也可以定义为水资源系统不能正常工 作的时间与整个工作历时之比,即 a = 式中:NS为水资源系统工作的总历时;It 是水资源系统的状态变量。 It =0(系统工作正常) It
16、 =1(系统失事) 2脆弱性 脆弱性是描述水资源系统失事损失平均严重程度的重要指标。 为了定量表示系统的脆弱 性,假定系统第 i 次失事的损失程度为 Si,其相应的发生概率为 Pi,那么系统的脆弱性可 表达为: = E(S)=式中:NF为系统失事的总次数。 例如,在供水系统的风险分析中,可以用缺水量来描述系统缺水失事的损失程度。类似 洪水分析,假定 P1=P2=PNF=1/NF,即不同缺水量的缺水事件是同频率的,这样上式可写 为: = 式中: V E i 为第 i 次缺水的缺水量。 上式说明干旱的期望缺水量可以用来表示供水系统的脆弱性。为了消除需水量不同的影响, 一般采用相对值,即 = 式中:
17、 VDi 是第 i 次干旱缺水期的需水量。 3重现期 事故周期是两次进入失事模式 F之间的时间间隔, 也叫平均重现期。 d ( u , n ) 表示第 用 n间隔时间的历时,则平均重现期为 W=式中:N=N(u)是 0 到 t 时段内属于模式 F 的事故数目。 4可恢复性 恢复性是描述系统从事故状态返回到正常状态的可能性。系统的恢复性越高,表明该系 统能更快地从事故状态转变为正常运行状态。它可以由如下的条件概率来定义: =p( Xt S | Xt -1 F) 上式亦可用全概率公式改写为 = 引入整数变量 当Xt则Yt=1 ; 当XtS则Yt=0及 Zt=1(Xt-1F,XtS); Zt=0(其
18、它)这样,由全概率公式可得 = 记 TFS=,TF=则有: =TFS / TF ( TF 0 ); =0(TF = 0) 从上式可以看出,当 TF=0,即水资源系统在整个历时一直处于正常工作状态,则=1; 而当 TFS=0,即水资源系统一直处于失事状态(TF=NS),则=。一般来讲,01。这表 明水资源系统有时会处于失事状态,但有可能恢复正常状态,而且失事的历时越长,恢复性 越小,也就是说水资源系统在经历了一个较长时期的失事之后,转为正常状态是比较困难的。 5风险度 用概率分布的数学特征,如标准差或半标准差-,可以说明风险的大小。和-越 大, 则风险越大, 反之越小。 这是因为概率分布越分散,
19、 实际结果远离期望值的概率就越大 。 = ( D ( X ) 1/ 2 = ( X i - E ( X ) 2 / ( n - 1)1/ 2 用、-比较风险大小虽简单,概念明确,但-为某一物理量的绝对量,当两个比较 方案的期望值相差很大时,则可比性差,同时比较结果可能不准确。为了克服用-可比性差 的不足,可用其相对量作为比较参数,该相对量定义为风险度 FDi ,即标准差与期望值的比 值(也称变差系数)。 Cv = / E ( X ) =i / ui 这里值得说明的是: 风险度不同于风险率, 前者的值可大于 1, 而后者只能小于或等于 1。 水资源短缺风险的模糊综合评判模型的建立 3.2.2 水
20、资源短缺风险的模糊综合评判模型的建立 风险评价是在风险识别和风险分析的基础上,把损失概率、损失程度以及其它因素综合 起来考虑,分析该风险的影响,寻求风险对策并分析该对策的影响,为风险决策创造条件。 本文采用上述定义的风险率、脆弱性、可恢复性、重现期、风险度作为水资源短缺风险的评 价指标,采用模糊综合评判方法对水资源短缺风险进行评价。 我们将评语级分为 5 个级别,各评价因素分级指标见表 1。 表1 各评价因素分级指标 水资源短缺风险 V1 (低) V2 (较低) i i = 1, (i = 1, 2,L , m) ;同时,模糊变换 AR 也即退 ij * r ), i = 1, 2,L, m;
21、 j = 1, 2,L, n 上述权系数的确定可 u1 率) ( 风 险 u2 (脆弱性) 0.200 0.200 0.400 u3 (可 u4 (重现期) 9.000 6.001 9.000 恢复性) 0.800 0.601 0.800 u5 (风险度) 0.200 0.2010.600 0.200 0.200 0.400 V3 (中) V4 (较高) V5 (高) 0.401 0.600 0.601 0.800 0.800 0.401 0.600 0.601 0.800 0.800 0.401 0.600 0.200 0.400 0.200 3.001 6.000 1.000 3.000
22、1 0.6011.000 1.0012.000 2.000 为了比较直观的说明风险程度,我们将其分成 5 级,分别叫做低风险、较低风险、中 风险、较高风险和高风险,风险各级别按综合分值评判,其评判标准和各级别风险的特征见 下表2。 表 2 水资源系统水资源短缺风险级别评价 水资源短缺风险评价等级 风险级别 水资源系统的风险特征 V1 V2 V3 V4 V5 低风险 较低风险 中风险 较高风险 高风险 可以忽略的风险 可以接受的风险 边缘风险 不可接受风险 灾变风险, 系统受到严重破坏 模糊综合 综合评价模型的求解 3.2.3 模糊综合评价模型的求解 根据五种评价因素各自的定义,我们对北京市水资
23、源总量和总用水量从1979年到2009 年的数据进行分析,得到北京市这31年水资源综合的风险率、脆弱性、可恢复性、重现性、 风险度的综合性能数值,具体见下表4: 表4:北京市1979年至2009年水资源评价因素综合性能数值 风险率 脆弱性 可恢复性 重现性 风险度 87.1% 0.336 0.1071 0.1539 5.05 从表中数据可知道: 1 =0.871, 2 =0.336, 3 =0.1071,4 =0.1539,5 =5.05,从而 得到测定指标向量 Y = (0.871,0.336,0.1071,0.1539,5.05) 。 根据各个因素的隶属函数得到因素 ui 对应等级 v j
24、 的隶属度,从而得到模糊关系矩阵: ? 0 ?0.32 ? Ru = ? 0 ? ? 0 ? 0 ? 0 0 1 0.84 0 0 0 0 0 0 1 ? 0.56? ? 0.5355 1 ? ? 0.1539 1 ? 3.05 1 ? ? 0.355 0 在计算水资源短缺风险评价各因素的权重时,我们采用层次分析法(AHP),权重计算结 果为: A = (1 , 2 , 3 , 4 , 5 ) = (0.331,0.210,0.129,0.105,0.225) 。 由模糊关系矩阵和风险评价各因素的权重,我们可以得到综合评价向量: B = 0.0672, 0.2100, 0.1084, 0.88
25、82, 0.9076 我们再根据“加权平均型”的 M ( ? , ) 模型,即 b j = min1, i rij ,选取与 , i =1 n maxbij 对应的评语为区域水资源短缺风险的评判结果,具体评判结果见下表:表6:北京市水资源短缺风险综合评价分值 V1 V2 V3 V4 V5 综合评价 北京市 0.06272 0.2100 0.1084 0.8882 0.9076 高风险 由北京市水资源短缺风险综合评价分值可知道: 北京市水资源短缺风险已经达到了高风 险程度,需要采取及时有效的方法进行改善。 3.2 3.2.4 对主要风险因子的调控 由熵值法判断权重知影响北京水资源短缺的主要因素为
26、北京市人口, 北京市降水量。 人口因素为人为可控因素,降水量为自然因素为非可控因素,下面主要讨论改变可控因素 的措施。 人口因素: 从历史和今后的走向看,虽然 2002-2009 一期南水北调等水利工程对京供水量的增加, 但随着北京市人口的快速增加,2010 年调查显示常驻人口十年内增加 600 余万远高于全国平 均水平,加之高流动人口。水的承载力并不高,人口对水资源的承载压力是十分巨大,水利 工程只能解决一时的问题,难以从根本上解决水资源紧张的问题。 解决方法一:适当控制人口增长 1调整功能,北京是政治中心和文化中心,北京的多项城市功能高度叠加在这些节点和 区域,由此造成北京地区人口高度集中
27、, 要调控北京人口,一个重要的手段,就是要调整北 京的功能定位,至少在人口规模上不能够进一步扩充,使市人口得到控制。 2区域互动,推动北京周边城市和区域的均衡发展,将会在很大程度上分担区域流动 人口的压力,通过自身功能作用的发挥,影响和辐射周边城市和区域,进而缩小与周边城市 在经济发展上的差距,形成有区域经济特点的发展模式,减弱周边地区人口进京的动力。 3高端发展,就是走科技创新之路,大力发展高端产业。通过调整经济结构和经济规 模改变人口结构和人口规模,加大对高端人才引进力度的同时,减少对低端劳动力的需求, 达到减少进京人口的目的。 4产业转移,经济的高度密集是人口高度集中的根本原因。通过产业
28、转移,调整经济 结构在空间上的分布,引导人口形成合理的空间分布,是调控人口的重要手段。 解决方法二:采用资源集约型的经济增长方式和结构,提高水的利用率,大力推行节约 用水,减少人均用水量。 降水量因素: 通过人类活动如植树造林、修建水库、人工造湖等,一般都是通过改变人为条件而间接 增加降水, 以及必要时进行人工降水作业增加北京市的降雨量。 3.3 问题三 在对北京市未来两年水资源的短缺风险进行预测, 我们建立了两个模型来进行预测 多元线性回归模型和灰色系统GM(1,1)模型。多元线性回归从多个方面考虑各种因素对水资 源短缺风险的影响, 通过线性拟合得到各个因素影响下供求差值的走势图, 灰色系统
29、GM(1,1) ; 模型直接通过水资源供求差值入手,对数据进行相关处理,从而得到我们所需的预测模型。 最后还通过残差和级比偏差来对建立的模型进行检验。通过检验,所建模型均可用来对北京 市未来两年水资源短缺风险进行预测。 多元线性回归模型 (一)多元线性回归模型的概念 在许多实际问题重中,我们所研究的因变量的变动可能不仅与一个解释变量有关。因此, 有 必要考虑线性模型的更一般形式,即多元线性回归模型: Yt = 0 + 1 X 1t + 2 X 2 t + L + k X kt + ut t = 1, 2,K , n K 在这个模型中,Y 由 X1,X2,X3,XK 所解释,有 K+1 个未知参
30、数 0、1、 2、 k 。这里, “斜率”j 含义是其他变量不变的情况下,Xj 改变一个单位对因变量所产生的影响。 回到一般模型 Yt = 0 + 1 X 1t + 2 X 2 t + L + k X kt + ut 即对于 n 组观测值,有 Y1 = 0 + 1 X 11 + 2 X 21 + 3 X 31 + K + k X k1 + u1 Y2 = 0 + 1 X 12 + 2 X 22 + 3 X 32 + K + k X k 2 + u2 . Yn = 0 + 1 X 1n + 2 X 2 n + 3 X 33 + K + k X kn + un 其矩阵形式为: Y = X + u
31、其中 t = 1, 2,K , n ? Y1 ? ? ? Y Y =? 2? ?K ? ? ? ? Yn ? ? 1 X 11 ?1 X 12 X =? ?K K ? ? 1 X 1n X K1 ? K XK2 ? ? K K ? ? K X Kn ? K ? 0 ? ? ? ? 1 ? = ? 2 ? ? ? ?K? ? ? ? K? ? u1 ? ? ? u u =? 2? ?K ? ? ? ? un ? 二多元线性回归模型的估计 多元线性回归模型的估计与双变量线性模型类似,仍采用最小二乘法。当然,计算要复 杂得多,通常要借助计算机。理论推导需借助矩阵代数。下面给出最小二乘法应用于多元线
32、性回归模型的假设条件、估计结果及所得到的估计量的性质。 1. 假设条件 (1) E(ut)=0, t=1,2,n (2) E(uiuj)=0, ij (3) E(ut2)= 2 ,t=1,2,n (4) Xjt 是非随机量,j=1,2,k t=1,2,n 除上面 4 条外,在多个解释变量的情况下,还有两个条件需要满足: (5) (K+1)n; 即观测值的数目要大于带估计的参数的个数(要有足够数量的数据来拟合回归 线) 。 (6)各解释变量之间不存在严格的线性关系。 上述假设条件可用矩阵表示为一下四个条件: (1) E (u ) = 0 (2) E (uu ) = 2 I n 由于 ? u12
33、u1u2 ? u1 ? ? ? ? 2 u uu u2 uu = ? 2 ? ( u1 u2 K un ) = ? 2 1 ?KK KK ?K ? ? ? ? ? un u1 un u2 ? un ? ? 显然, E (uu ) = 2 I n E(uiuj)=0, 仅当 ij KK u1un ? ? KK u2un ? KK KK? 2 ? KK un ? ? E(ut2)= 2 ,t=1,2,n 这两个条件成立时才成立,因此,此条件相当前面条件(2)(3)两条,即各期扰动项互不 , 相关,并具有常数方差。 (3) X 是一个非随机元素矩阵。 (4)Rank( X )=(K+1)n.-相当于
34、前面(5)(6)两条即矩阵 X 的秩=(K+1)n 、 当然,为了后面区间估计和假设检验的需要,还要加上一条: 2 (5) ut N (0, ), t = 1, 2,., n 2.最小二乘估计 我们的模型是: Yt = 0 + 1 X 1t + 2 X 2 t + L + k X kt + ut t = 1, 2,K , n ? ? ? 问题是选择 0 , 1 ,KK , k ,使得残差平方和最小。残差为: ? et = Yt ? Yt ? ? ? = Yt ? 0 ? 1 X 1t ? K ? K X Kt 要使残差平方和 ? ? ? S = et2 = Yt ? 0 ? 1 X 1t ?
35、K ? K X Kt 为最小,则应有: ( ) 2 ?S ?S ?S =0 , = 0 ,., =0 ? ? ? ? 0 ?1 ? K 我们得到如下 K+1 个方程(即正规方程) : ? ? ? 0 n + 1 X 1t + KK + K X Kt = Yt ? 0 ? 0 ? 0 X 2t 1t ? ? + 1 X 1t 2 + KK + K X 1t X Kt = X 1tYt X ? ? + 1 X 2t X 1t + KK + K X 2t X Kt = X 2tYt LL LL LL LL X kt ? ? + 1 X kt X 1t + KK + K X kt X Kt = X k
36、tYt 按矩阵形式,上述方程组可表示为: ? n ? ? X 1t ? L ? ? ? X Kt X X 1t 2 1t L L X X X L L X Kt X 1t L (X X ) ? ? ? 0 ? ? 1 ? ? ? ? 1t Kt ? ? 1 ? ? X 11 ?L ? = ? L ? L ? ? ? X Kt 2 ? ? ? ? X K 1 ? ? ?K ? Kt 1 X 12 L XK2 X 1 ? ? Y1 ? L X 1n ? ?Y2 ? ? ? L L ? ?L? ? ? L X Kn ? ?Yn ? L Y ? ? 即 ( X X ) = X Y 上述结果,亦可从矩阵表
37、示的模型 Y = X +u 出发, 完全用矩阵代数推导出来。 残差可用矩阵表示为: ? e1 ? ? ? e ? e = ? 2 ? = Y ?Y ?L ? ? ? ? en ? 残差平方和 ? ? 其中: Y = X S = et2 = e e ? ? = (Y ? Y ) (Y ? Y ) ? ? = (Y ? X ) (Y ? X ) ? ? = (Y ? X )(Y ? X ) ? ? ? ? = Y Y ? X Y ? Y X + X X 注意到上式中所有项都是标量,且 ? ? ( X Y ) = Y X 故 ? ? ? S = Y Y ? 2 X Y + X X 令 ?(S ) =
38、0 ? ? 用矩阵微分法,我们可得到 ? X X = X Y 与采用标量式推导所得结果相同。由上述结果,我们有 ? = ( X X ) ?1 X Y 三多元线性拟合 由 20002009 年北京农业用水,生态用水,工业用水,其他用水,人后数量,降水量,园林 覆盖率,治理设施,工业污染九个影响因子的数据。 如下表 1: 农业用水 生态用水 工业用水 其他用水 园林覆 (亿立方 (亿立方 (亿立方 (亿立方 人口数量 降水量 盖率 治理设 工业污染 米) 米) 米) 米) (万人) (毫米) (%) 施 (套)(万吨) 16.49 0.91 10.52 13.39 1363.8 266.9 36.
39、30 607 14001 17.4 0.9 9.2 12.0 1385.1 371.1 36.50 581 13643.0 15.5 0.98 7.5 10.8 1423.2 338.9 38.78 573 13250 1456.4 370.4 40.57 568 13.8 1 8.4 13 13107 13.5 1 7.7 12.8 1492.7 444.9 40.87 555 12617 1538.0 483.5 41.91 553 13.2 1.1 6.8 13.4 12813 12.8 1.6 6.2 13.7 1581.0 410.7 42.00 530 10170 1633.0 3
40、18.0 42.50 549 12.4 2.7 5.8 13.9 9134 12 3.2 5.2 14.7 1695.0 483.9 43.00 514 8867 626.3 43.50 524 11.4 3.6 5.2 15.3 1703.2 8713 如下表 2: 2000 水资源总 量(亿立方 米) 总用水量 (亿立方 米) 16.8 6 40.4 2001 2002 19.2 16.1 2003 18.4 2004 21.4 2005 23.2 2006 24.5 2007 23.8 2008 34.2 200 9 21. 8 35. 5 年份 2000 2001 2002 2003
41、2004 2005 2006 2007 2008 2009 39.8 34.6 35.8 34.6 34.5 34.3 34.8 35.1 以以上 9 个因素为自变量,以北京市“总用水量”和“水资源总量”的差 Y 作为因变量,建 立一个多元线性回归模型。 由表 2 得到因变量 Y 的数组: y=23.54 20.6 18.5 17.4 13.2 11.3 9.8 11 0.9 13.7 由表 1 得到自变量 x1,x2,x3,x4,x5,x6,x7,x8,x9 的 9 个数组: x1=16.49,17.4,15.5,13.8,13.5,13.2,12.8,12.4,12,11.4 x2=0.9
42、1,0.9,0.98,1,1,1.1,1.6,2.7,3.2,3.6 x3=10.52,9.2,7.5,8.4,7.7,6.8,6.2,5.8,5.2,5.2 x4=13.39,12.0,10.8,13,12.8,13.4,13.7,13.9,14.7,15.3 x5=1363.6,1385.1,1423.2,1456.4,1492.7,1538.0,1581.0,1633.0,1695.0,1703.2 x6=266.9,371.1,338.9,370.4,444.9,483.5,410.7,318.0,483.9,626.3 x7=36.30,36.50,38.78,40.57,40.87
43、,41.91,42.00,42.50,43.00,43.50 x8=607,581,573,568,555,553,530,549,514,524 x9=14001,13643,13250,13107,12617,12813,10170,9134,8867,8713 ? 23.5400 ? ? ? ? 20.6000 ? ? 18.5000 ? ? ? ? 17.4000 ? ? 13.2000 ? y =? ? ? 11.3000 ? ? 9.8000 ? ? ? ? 11.0000 ? ? 0.9000 ? ? ? ? 13.7000 ? ? ? 将 y 矩阵进行转置得到 增添一组常数项
44、x0=0,0,0,0,0,0,0,0,0,0 将 x=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9转置得到 ? 0.0001 ? ? 0.0016 ? 0.0001 ? ? 0.0011 ? 0.0013 x=? ? 0.1364 ? 0.0267 ? ? 0.0036 ? 0.0607 ? ? 1.4001 ? 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 ? ? 0.0017 0.0015 0.0014 0.0014 0.0013 0.0013 0.0012 0.0012 0.0011 ? 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0003 0.0003 0.0004 ? ? 0.0009 0.0008 0.0008 0.0008 0.0007 0.0006 0.0006 0.0005 0.0005 ? 0.0012 0.0011 0.0013 0.0013 0.0013 0.0014 0.0014 0.0015 0.0015 ? ? 104 0.1385 0.1423 0.1456 0.1493 0.