《城市表层土壤重金属污染特点分析毕业论文.doc》由会员分享,可在线阅读,更多相关《城市表层土壤重金属污染特点分析毕业论文.doc(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学号:本 科 生 毕 业 论 文论 文 题 目:城市表层土壤重金属污染特点分析作 者: 院 系: 专 业: 班 级: 指 导 教 师: 2013年 5月22日NO.:200921140204 Thesis GraduatesTopic:Analysis on characteristics of soil heavy metal pollution in urban surface Author: College: Specialty: Class: Tutor: May 22th, 2013郑重声明本人所呈交的毕业论文(设计)是本人在指导教师 的指导下独立研究并完成的。除了文中特别加以标注引
2、用的内容外,没有剽窃、抄袭、造假等违反学术道德、学术规范和侵权行为,本人完全意识到本声明的法律后果由本人承担。特此郑重声明!指导老师(签名):论文作者(签名): 2013年5月22日摘 要随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日益突出. 本文包含五个方面的内容:第1章给出了给出了课题的研究背景,指出了重金属污染的危害性以及发展趋势的严重性;第2章用克里克插值方法绘制了八种重金属污染物的空间分布,并详细论述了各种重金属污染物空间分布的特点.另外给出了重金属污染程度评价的地累积指数法,评价了各重金属在各功能区的污染情况,结果与实际吻合;第3章讨论了重金属污染的主要
3、原因,把该城区的八种重金属污染物基本上分成了三类:与交通污染源相关的元素有Pb、Cu、Zn;与燃煤源有关的元素有As、Cr、Ni;与工业生产有关的元素有Hg和Cd等.另外还讨论了重金属污染传播的特征,得出主要是扩散形式的传播;第4章是本文的核心内容,文中建立了“基于BP神经网络的遗传算法寻优模型”,最终绘制了各重金属的污染源的分布图,它们与之前的分析吻合.第5章进行了总结和展望,首先对全文进行了总结,其次分析了模型的优缺点,最后给出了需要考虑的一些其他数据信息,指出了分析的可能方法.关键词:等值线图,地累积指数法,BP神经网络,遗传算法AbstractWith the rapid develo
4、pment of city economy and city population continues to increase, the impact of human activities on the environmental quality of the city is increasingly prominent. This article contains five aspects:The first chapter introduces the research background on the subject, points out the seriousness of th
5、e harm of heavy metal pollution and development trend; the second chapter by Crick interpolation method of drawing the distribution of eight kinds of heavy metal pollutants in the space, and discusses in detail the characteristics of various heavy metal spatial distribution of pollutants. Evaluation
6、 of heavy metal pollution degree is given the geo-accumulation index method, evaluation of the pollution of heavy metals in the each function area, the results are consistent with the fact; the third chapter discusses the main reasons of heavy metal pollution, eight of heavy metal pollutants in the
7、city basically divided into three categories: associated with traffic pollution source elements are Pb, Cu, Zn; related to coal source elements have As, Cr, Ni; associated with industrial production elements are Hg and Cd. In addition, the characteristics of heavy metal pollution of communication ar
8、e discussed in this paper, it is mainly diffusion forms of communication; the fourth chapter is the core content of this article, this paper established the genetic algorithm BP neural network optimization model based on, the final draw the distribution map of the heavy metals pollution source, anal
9、yze them and before anatomists. The fifth chapter is a summary and outlook, firstly summarizes the whole thesis, followed by the analysis of the disadvantages of the model and finally gives the need to consider some other data, the method of analysis.Keywords: contour map, geo-accumulation index met
10、hod, BP neural network, genetic algorithmI目 录第1章 问题描述11.1 课题来源11.2 选题背景及意义11.3 论文的研究框架3第2章 重金属元素的空间分布及污染程度分析42.1 模型的基本假设和符号说明42.2 重金属元素的空间分布42.2.1 问题分析42.2.2 各重金属元素的空间分布52.2.2 不同区域重金属污染程度分析12第3章 重金属污染的主要原因及传播特征153.1 重金属污染的主要原因153.2 金属污染物的传播特征16第4章 污染源位置的确定184.1 问题分析184.2 BP神经网络184.2.1 BP神经网络概述184.2.
11、2 BP神经网络的MATLAB实现204.2.3 BP神经网络结果分析224.3 基于神经网络的遗传算法求解模型264.3.1 遗传算法概述264.3.2 基本遗传算法的描述274.3.3遗传算法的MATLAB实现29第5章 总结和展望335.1 全文内容总结335.2 模型的优缺点分析335.3 城市地质环境演变模式的进一步分析34致 谢35参考文献35附 录37III 第1章 问题描述1.1 课题来源本论文题目及数据来源于“2011高教社杯全国大学生数学建模竞赛题A题城市表层土壤重金属污染分析”,下面是建模原题.按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,不
12、同的区域环境受人类活动影响的程度不同.现对某城市城区土壤地质环境进行调查.为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(010厘米深度)进行取样、编号,并用GPS记录采样点的位置.应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据.另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值.通过数学建模来完成以下任务:(1) 给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度.(2) 通过数据分析,说明重金属污染的主要原因.(3) 分析重金属污染物的传播特征,由此建立
13、模型,确定污染源的位置.(4) 分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?问题的数据较占篇幅,这里省略,也不列在附录,需要的话在网上很容易获取.1.2 选题背景及意义从2005年12月开始,一个由中国、美国、加拿大三国研究人员组成的团队,在北京、上海等7个城市购买了78种“当地销量最好的香烟”,经过检测,除了铬含量持平外,中国香烟中的铅、镉、砷等3种物质都远远高于加拿大香烟。 研究者认为,叶绿素对重金属非常敏感,烟草可以从土壤中吸收重金属,先进入根部,再被传送到茎和叶,就像那些富集了重金属的蔬菜一样。不少媒体把我国香烟重
14、金属超标这一结果,比作烟草界的“三聚氰胺事件”,因为它暴露了我国土壤的安全问题。 (1)重金属污染的危害首先,随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出. 重金属污染降低了土壤中有益菌含量,使土壤自净能力减弱.据估算,全国每年因重金属污染的粮食达1200万吨,造成的直接经济损失超过200亿元.同时工业、城市污染的加剧和农用化学物质种类、数量的增加,也使土壤重金属污染日益严重.土壤中有害重金属积累到一定程度,不仅会导致土壤退化,农作物产量和品质下降,而且还能直接毒害动物或通过食物链途径进入人体,引发各种疾病,最终危害人体健康. 其次,重金属超标的土地,肉眼看
15、不出来,往往需要通过检测土壤质量及其对人畜健康状况的影响才能确定。土壤的污染也不会自动解除,即使过千百万年,它仍然稳定地存在,这正是重金属污染的特殊之处。(2)我国土壤重金属污染现状我们知道土壤与大气和水并列为人类环境的三大要素,而几乎所有的污染都会进入土壤.我国土壤污染状况已经影响到耕地质量、食品安全甚至人体健康,其中最严重的就是重金属污染. 人们通常将密度大于4.5克/立方厘米、原子量大于55的金属,称为重金属,而从环境污染方面所讲的重金属,通常是指汞(Hg)、镉(Cd)、铅(Pb)、铬(Cr)、砷(As)等有毒有害物质.目前我国受污染的耕地约有1.5亿亩,污水灌溉污染耕地3250万亩,固
16、体废弃物堆存占地和毁田200万亩,合计约占耕地总面积的1/10以上,其中多数集中在经济较发达的地区. “不仅污染加重,而且还在转移扩散。”土壤学专家,南京农业大学教授潘根兴说,当前,我国土壤污染还出现了有毒化工和重金属污染由工业向农业转移、由城区向农村转移、由地表向地下转移、由上游向下游转移、由水土污染向食品链转移的趋势,逐步积累的污染正在演变成污染事故的频繁爆发。(3)研究土壤重金属污染的意义如何大面积修复重金属污染农田,一直是个世界难题。目前,科学家们只有两种方法来对付隐藏在土壤中的重金属:一是在田地中播撒化学调理剂;二是种植易吸收重金属的富集植物。但无论采用哪种方案,都无法做到快速降解土
17、壤里的重金属污染物,使土壤恢复到清洁土壤的水平.因此,准确确定土壤污染源,以便相关部门有针对性的从根本上采取应对措施,对受污染土地的治理上有着重要意义.基于以上分析,我们对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究在人类活动影响下城市地质环境的演变模式,以及如何利用某地区的相关数据快速确定城市污染源,并提出相应的改善方案,对于我们来说变得尤为重要.1.3 论文的研究框架本文共分为五章,其中第1章给出了给出了课题的研究背景,指出了重金属污染的危害性以及发展趋势的严重性;第2章用克里格插值方法绘制了八种重金属污染物的空间分布,并详细论述了各种重金属污染
18、物空间分布的特点.另外给出了重金属污染程度评价的地累积指数法,评价了各重金属在各功能区的污染情况,结果与实际吻合;第3章讨论了重金属污染的主要原因,把该城区的八种重金属污染物基本上分成了三类:与交通污染源相关的元素有Pb、Cu、Zn;与燃煤源有关的元素有As、Cr、Ni;与工业生产有关的元素有Hg和Cd等.另外还讨论了重金属污染传播的特征,得出主要是扩散形式的传播;第4章是本文的核心内容,文中建立了“基于BP神经网络的遗传算法寻优模型”,最终绘制了各重金属的污染源的分布图,它们与之前的分析吻合.第5章进行了总结和展望,首先对全文进行了总结,其次分析了模型的优缺点,最后给出了需要考虑的一些其他数
19、据信息,指出了分析的可能方法.第2章 重金属元素的空间分布及污染程度分析2.1 模型的基本假设和符号说明(1)模型的基本假设l 忽略重金属的化学过程,如降解等.l 污染源可以看成是点源.l 一段时间内,重金属的总含量是一个定值.(2)符号说明元素实测质量分数元素的背景质量分数地累积指数BP神经网络权值MSE均方误差2.2 重金属元素的空间分布2.2.1问题分析金属元素的空间分布指的是金属元素浓度的空间分布特征,题目只给了319组数据,对于了解空间分布特征以及后续的讨论来说,数据量都过少.为了获得整个城区的空间分布特征,可以采用插值法.对于污染程度的评价应该选择合理的评价标准.为此,本文首先利用
20、克里格插值方法在surfer软件中绘制出了8种重金属的空间等值线图和平面等值线图. 其次,我们还用MATLAB软件画出了该城区的各功能区的剖面图,并绘制出了各金属元素浓度随海拔高度的变化曲线,来分析其特征. 最后,我们对于污染程度的评价,采用常用的地累积指数法来进行等级划分.2.2.2 各重金属元素的空间分布(1)城区各功能区分布根据附录1表1所给的数据,我们使用MATLAB数学软件将五个区(生活区、工业区、山区、公园绿地区及交通区)以不同的符号绘制了各功能区的剖面图及空间分布图(如下图1、图2所示).从两幅图中我们不难发现:该城区中工业区和生活区占较大的面积,并集中于平原或地势较低的区域,而
21、公园绿地区的范围则明显少于以上两区,因此就环境而言,该城区存在着严重的环境问题隐患.图2-1 各功能区的区域分布剖面图图2-2 各功能区的空间分布图由于表2中所给的8种元素数据过大,如果再加上该城区的五个区域分布情况的话,将会使区域图更加混乱,无法直观的看出8大重金属元素的空间分布情况.因此,我们将逐一考虑各种重金属的空间分别情况.下面我们讨论8种重金属的空间等值线图和平面等值线图,首先重点讨论As的空间分布图形.(2)As的空间分布图形利用surfer软件易得出As的空间等值线图和平面等值线图分别如下:图2-3 As的空间等值线图图2-4 As的平面等值线图 (3) 对As的空间分布的分析为
22、了方便说明,我们按城区功能区分布图定义城区方向为上北、下南、左西、右东. 由此,我们可以看出生活区分布得较为零散,在西南部有个与交通区交汇的密集区,南部也有个稍密集点的生活区,在北部的工业区旁边也有部分生活区,而且生活区基本上都分布于交通区旁;工业区主要分布于西部;山区主要分布于北部、东北部、东部;交通区贯穿整个城区,在中部及西南部尤为密集;公园绿地区分布得相对稀疏,西南部、南部、北部都有(依靠生活区).从As的空间分布图形可以看出, As的浓度有三个明显的富集区(这里的富集区定义为金属浓度相对很大的区域),对比功能区分布图可知: 一个位于西部的工厂、西南部的生活区和周边交通区的交汇处,一个位
23、于南部的生活区和其旁的交通区的交汇处、一个位于中部但偏向东北部的交通区山区的交汇处. (4) 对其他各种重金属元素的空间分布的分析方法同上,我们可以得出其他7种元素的分布特征.图2-5 Cd的空间等值线图和平面等值线图Cd:浓度变化很大,在中部、西南部、偏东北部有一个很大范围的相对密集区,所以Cd主要分布于交通区、交通生活交叉区、交通山脚交汇区以及交通工业交汇处.图2-6 Cr的空间等值线图和平面等值线图Cr:浓度变化不大,位于生活、交通、工业区的交汇处.图2-7 Cu的空间等值线图和平面等值线图Cu:和Cr的分布基本一致.图2-8 Hg的空间等值线图和平面等值线图Hg: 浓度变化不是很大,有
24、三个明显富集区,西南部和南部的生活交通交汇处、中部的交通区.图2-9 Ni的空间等值线图和平面等值线图Ni:浓度变化较大,主要密集于生活、交通、工业的交汇处.图2-10 Pb的空间等值线图和平面等值线图Pb:很明显的富集区为生活、交通、工业交汇处.图2-11 Zn的空间等值线图和平面等值线图Zn:最为明显的是中部的交通区,其次在生活、交通、工业区的交汇处、南部的生活交通交汇处也有明显的富集.其次,我们再用matlab软件绘制各金属元素浓度随海拔高度的变化曲线.在MATLAB中我们绘出了8种重金属的浓度随海拔高度的变化散点图.下面是As的浓度随海拔高度的变化散点图:图2-12 As的浓度随海拔高
25、度的变化散点图 从图中可以看出,As主要集中于海拔0-100m的范围,且浓度变化范围集中于0-10g/g. 用以上方法,易求出其他7种重金属的分布分别为:Cd 主要集中于海拔0-100m的范围,且浓度变化范围集中于0-600ng/g.Cr: 主要集中于海拔0-50m的范围,且浓度变化范围集中于0-100g/g.Cu: 主要集中于海拔0-50m的范围,且浓度变化范围集中于0-100g/g.Hg: 主要集中于海拔0-50m的范围,且浓度变化范围集中于0-200ng/g.Ni: 主要集中于海拔0-50m的范围,且浓度变化范围集中于10-30g/g.Pb: 主要集中于海拔0-50m的范围,且浓度变化范
26、围集中于30-100g/g.Zn: 主要集中于海拔0-50m的范围,且浓度变化范围集中于100-300g/g.最后,使用EXCEL将附件1和附件2的数据统计分析绘制成各区域8大重金属元素分布直方图(图),这样又将8种金属元素和5个区域统一结合,使得该城区8大金属的区域分布情况更为直观,并给后面的数据分析带来方便.图2-13 各区域8大重金属元素分布直方图2.2.2 不同区域重金属污染程度分析(1)污染程度的量化地累积指数法:Muller将土壤重金属污染程度分为7级(表1),国内不少学者分别采用了该方法对土壤污染程度进行研究,取得了满意的结果,其计算公式如下: (2.1)式中:为元素实测质量分数
27、,mg/kg;该元素的背景质量分数mg/kg.表2-1 Muller污染指数分级污染指数()分级污染程度00无污染0-11轻污染中等污染续表2-1 Muller污染指数分级1-22中等污染2-33中等污染强污染3-44强污染4-55强污染极严重污染5-106极严重污染(2)不同区域各种重金属的污染指数我们以各区域的重金属的平均值作为该金属的实测值,背景值按题目附件的给出值.对于综合污染指数采用如下综合污染指数计算方程:,其中P表示地累积指数.由于对全部为负值时,用这个公式会有综合指数大于0,这样会落于轻污染中等污染等级,不符合实际,因此我们约定:当最大指数小于或等于0时,综合指数为0,即无污染
28、.表2-2 土壤中重金属的地累积指数元素生活区工业区山区交通区公园绿地区As0.220.43-0.420.080.21Cd0.571.01-0.360.880.52Cr0.570.20-0.260.32-0.09Cu1.322.69-0.191.650.61Hg0.833.61-0.363.091.13Ni-0.010.10-0.26-0.07-0.27Pb0.571.00-0.350.450.38Zn1.201.43-0.501.230.58综合1.042.7202.290.84从上面的表格可以看出各区域的每种重金属污染程度.表2-3 各区的污染程度元素生活区工业区山区交通区公园绿地区As轻
29、-中等轻-中等无轻-中等轻-中等Cd轻-中等中等无轻-中等轻-中等Cr轻-中等轻-中等无轻-中等无Cu中等中等强无中等轻-中等Hg轻-中等强无强中等Ni无轻-中等无无无Pb轻-中等中等无轻-中等轻-中等Zn中等中等无中等轻-中等综合中等中等-强无中等-强轻-中等如果用我们常用的四个等级:清洁、轻度污染、中度污染、严重污染来描述各个功能区的污染状况有:在山区重金属污染程度为“清洁”,生活区和公园绿地区重金属污染呈现“轻度污染”(生活区的综合指数非常接近1,可认为是轻度污染),而工业区和交通区呈现“中度污染”的状态.我们发现越接近工业区和交通区及人口密集地,重金属污染的程度越严重,由此我们断定重金
30、属的污染主要来自于工业生产和人类活动.第3章 重金属污染的主要原因及传播特征3.1 重金属污染的主要原因问题2要求我们通过分析数据,来说明重金属污染产生的主要原因.根据问题1中的各区域8大重金属元素分布直方图(图2-13),可以发现重金属污染主要分布在工业生产区,这种现象与我们生活中的常识完全相符.因此可以断定工业生产产生的重金属污染是原因之一.根据题目背景说明“将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(010 厘米深度)进行取样、编号,并用GPS记录采样点的位置” ,再加上对附件1中的采样点以功能区分组如下表4所示,我们可以发现该区域除山区(按照2公里
31、的间距自然取样)外,所占空间面积最大的应属“交通区” ,而且根据网上搜索,汽车轮胎及排放的废气中含有Pb、Zn、Cu等多种重金属元素,进入周围的土壤环境,容易造成土壤重金属污染.汽车轮胎添加剂中的Zn是城市土壤中Zn的重要来源.随着城市化发展,交通工具的数量急剧增加,向周围环境中释放的污染物也逐年增多,造成城市土壤中的重金属不断累积.因此,交通区过大也是该地区重金属污染的原因之一.表3-1 功能区分组功能区生活区工业区山区交通区公园绿地区采样点个数44366613835根据数据统计,我们发现该地区Hg和镉Cd的浓度与其他金属元素比较,其含量远大于其他金属元素,且根据图2-5、图2-8发现这两种
32、元素主要出现在工业区一带,以此推断该地区含有大量的Hg和Cd的矿产资源,使得工业区主要生产这两种元素的金属化合物,因此,因为处理不当导致污染较为严重也是极为可能的. 通过观察图2-3、图2-6和图2-9,我们发现As、Cr和Ni这三种元素覆盖面积较广,但含量极低,远不如其他几种金属元素,而且据调查这三种金属元素污染主要来源是燃煤所引起的,因此可以推断该地区主要是以燃煤为主要原料工业生产,并通过大气沉降进入土壤.综上所述,该城区表层土壤中重金属元素基本可以分为3个类别:与交通污染源相关的元素有Pb、Cu、Zn;与燃煤源有关的元素有As、Cr、Ni;与工业生产有关的元素有Hg和Cd等.从空间分布上
33、来看, 这些元素的分布与其来源有很好的一致性,工业区土壤重金属污染较为严重.Pb、Zn、Cu、Cd、Hg等5种重金属元素在居民密集的区域都超过土壤背景值,且城市土壤重金属污染分布不均匀.以工业区含量最高, 依次为交通区主干道附近、生活区、公园绿地区、山区, 且各个区域内分布也不均衡, 同一区内不同样点重金属含量相差可达1倍以上,潜在性危害极大,如不及早处理,将带来严重的后果.3.2 金属污染物的传播特征(1) 重金属的传播方式 水体传播重金属元素一般以阳离子的形式存在,和其他阴离子结合成水溶性或非水溶性的物质,它们可以通过水体的传播,包括河流、湖泊以及地下水等.如工厂排放的污水中就含有大量的重
34、金属元素. 大气传播工厂排放的废气、汽车的尾气等都含有大量的重金属元素,它们随大气的流动,又经过气体沉降或雨水的冲刷产生重金属污染. 土壤的吸附渗透作用土壤对重金属元素具有吸附渗透作用,例如废旧电池就可以通过这种方式,产生土壤的大范围污染.重金属污染的传播多种多样,主要就是以上面三种形式传播,在传播过程中往往是这多种方式的组合.不管怎样,上面的传播都是一种扩散形式.(2) 重金属元素的扩散特点前面我们绘制了8种重金属元素的浓度随海拔高度的变化特点,我们发现每种元素都有共同的海拔高度特征:海拔高度越高,重金属浓度越低,而且在低海拔处浓度十分密集.下面是该城市的海拔高度的空间等值线图:图3-1 城
35、市海拔高度的空间等值线图在前面我们也曾绘制过类似的图形,它们是各种重金属的浓度空间等值线图,我们得到的重金属富集区主要位于三个地区:西部的生活、交通、工业交汇处,南部的生活、交通交汇处以及北部的交通、山区交汇处,这与上面的结果一致.由此我们得到,重金属元素的一个扩散规律是:由高海拔到低海拔.另外,由物理学或化学知识我们知道,扩散的一个明显特征就是从高浓度到低浓度. 前面我们得到的重金属富集区主要位于三个地区:西部的生活、交通、工业交汇处,西南部的生活、交通交汇处以及中北部的交通、山区交汇处.这里很明显的是重金属污染严重的地区都是位于一些交叉地区,这正符合由高浓度到低浓度扩散的特点.由此我们得到
36、重金属污染物的传播特征:以扩散形式为主,扩散过程中遵循“高浓度到低浓度、高海拔到低海拔”的原则.第4章 污染源位置的确定4.1 问题分析在前面重金属污染物传播的特征分析中,我们已经知道重金属污染物传播具有扩散特点.事实上,在物理学中,理想的情况下可以建立重金属污染物传播的偏微分方程.但是定性的分析需要较强的专业背景,同时对于实际问题而言,它要比理想情况复杂得多,有时候往往并不符合偏微分方程.另外所给数据的变量不多(仅坐标、高度与功能区),这使得统计学方法不足以完全揭示变量与污染物传播特征的关系.尽管建立偏微分方程可能不是很好,但这并不是说我们不能利用重金属污染物的传播特点了.相反,正因为重金属
37、污染物具有这种传播特点,我们就可以模拟这种特点,或者说是学习这种传播特点.注意到,人工神经网络具有较强的自组织、自适应与自学习能力,能够在未完全了解重金属污染物传播机理的情况下,完成各变量与重金属污染物浓度之间的非线性映射;另一方面, 将重金属污染传播过程看作网络输入与输出的一类非线性映射,仅通过网络的输入输出数据难以准确寻找重金属污染物浓度的极值(即污染源),而遗传算法具有全局的非线性寻优能力.因此,我们可以建立重金属污染物的神经网络,利用遗传算法搜索污染源的位置,从而建立“基于神经网络的遗传算法寻优模型”.4.2 BP神经网络 人工神经网络的模型现在有数十种之多,本文采用应用较多的典型的神
38、经网络模型BP神经网络.4.2.1 BP神经网络概述BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传播.在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层.每一层的神经元状态只影响下一层神经元状态.如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出.BP神经网络的拓扑结构如图:图4-1 BP神经网络拓扑结构图21图中是BP神经网络的输入值,是神经网络的预测值,和为BP神经网络权值.从图4-1可以看出,BP神经网络可以看成一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量.当输入节
39、点数为,输出节点数为时,BP神经网络就表达了从个自变量到个因变量的函数映射关系.BP神经网络预测前首先要训练网格,通过训练使网络具有联想记忆和预测能力.BP神经网络的训练过程包括以下几个步骤:Step 1:网络初始化.根据系统输入输出序列确定输入层节点数、隐含层节点数,输出层节点数,初始化输入层、隐含层和输出层神经元之间的连接权值、,初始化隐含层阈值,输出层阈值,给定学习速率和神经元激励函数.Step 2:隐含层输出计算.根据输入向量,输入层和隐含层间连接权值以及隐含层阈值,计算隐含层输出. (4.1)Step 3:输出层输出计算.根据隐含层输出,连接权值和阈值,计算BP神经网络预测输出. (
40、4.2)Step 4:误差计算.根据网络预测输出和期望输出,计算网络预测误差. (4.3)Step 5:权值更新.根据网络预测误差更新网络连接权值、. (4.4)Step 6:阈值更新.根据网络预测误差更新网络节点阈值. (4.5) (4.6)Step 7:判断算法迭代是否结束,若没有结束,返回Step 2.4.2.2 BP神经网络的MATLAB实现BP神经网络的算法可以在MATLAB中得以实现,但程序比较复杂,见附录1,这里简单介绍一下文中处理数据的关键步骤.(1)构建训练数据集与检验数据集题目附录中的原始数据只有319组,显然它不能满足神经网络的训练要求.不过我们可以从从问题一中插值过后的
41、60501个数据中随机选择10000组数据.前9900组作为BP网络的训练数据集,后100组数据作为BP网络的检验数据集.(2)数据归一化数据归一化方法是神经网络预测前对数据常做的一种处理方法.数据归一化处理把所有数据都转化为0,1之间的数,其目的是取消各维数据间数量级差别,避免因为输入输出数据的数量级差别较大造成网络预测误差较大.数据归一化的方法主要有一下两种:最大最小法.函数形式如下:式中,为数据序列中的最小数;为序列中的最大数.平均数方差法,函数形式如下:式中,为数据序列的均值;为数据的方差.本文采用第一种数据归一化方法,归一化函数采用MATLAB自带函数mapminmax,命令为:in
42、putn,inputps=mapminmax(input_train);其中,inputn为归一化后的数据集,inputps为原始数据集信息,input_train为原始数据集.(3)构建BP网络问题一中将原有数据经过插值可以比较准确的反应重金属浓度随地理位置的变化,但是插值过程中并没有考虑地形对重金属污染物传播的影响.所以,我们建立3N1的BP网络结构,其中,3表示输入项(分别为坐标x,坐标y,高度z);N为隐藏层神经元个数;1表示输出项(重金属污染物浓度).隐藏层传输函数选择双曲正切S形函数: 输出层传输函数采用线性函数:BP神经网络的隐含层节点数对BP神经网络预测精度有较大的影响,节点数
43、太少,网络不能很好地学习,需要增加训练次数,训练的精度也受影响;节点数太多,训练时间增加,网络容易过拟合.最佳隐含层节点数选择可以参考以下公式: (4.7)式中, 为输入层节点数;为隐含层节点数;为输出层节点数;a 为010之间的常数.在实际问题中,隐含层节点数的选择首先是参考公式来确定节点数的大概范围,然后用试凑法确定最佳的节点数.经过多次试验,本文选择N=100,此时BP神经网络达到了较高的精度.学习速度同样对BP神经网络具有重要影响作用,学习速度太小,网络学习缓慢,需要增加训练次数;学习速度太大,网络学习迅速,但是容易导致网络不收敛,影响训练的精度.本文最终决定学习速度为0.01,训练次数为300.BP神经网络采用梯度修正法作为权值和阈值的学习算法,从网络预测误差的负梯度方向修正权值和阈值,没有考虑以前经验的积累,学习过程收敛缓慢.对于这个问题,可以采用附加动量方法来解决,带附加动量的权值学习公式为: (4.8)MATLAB神经网络工具箱中函数“traingdm”可以实现上述学