《2011年高教社杯全国大学生数学建模竞赛优秀论文.pdf》由会员分享,可在线阅读,更多相关《2011年高教社杯全国大学生数学建模竞赛优秀论文.pdf(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2011高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D 中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话
2、):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2011高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1 城市表层土壤重金属污染分析摘要本文利用克里格插值法,多因子综合指数评价法,相关分析,因子分析,聚类分析,Grid data插值模型分别进行了空间分析,污染程度分析,污染原因的分析以及确定污染
3、源的位置。针对问题一,本文利用 Sufer 软件,通过克里格插值法画出8 种重金属元素的等值图,并利用单污染指数评价法和多因子综合指数评价法对分别对同功能区不同采集点和不同功能区重金属综合污染程度进行分析,得出1.不同的人类活动造成城市土壤中不同类型的重金属积累2.工业区,交通区,生活区,公园绿地区属于重污染区,山区属于轻度污染区3.不同功能区污染指数的排序为:工业区交通区 生活区 公园绿地区 山区。针对问题二,本文首先对8 种重金属元素进行相关分析,得出Cd与 Pb,Cr 与 Cu,Cr 与 Ni,Cu与 Pb之间相关性显著,可能具有同源关系或复合关系。然后对 8种重金属元素进行因子分析,得
4、出Cr Ni Cu 在因子 1 有较高的载荷,As Cd Pb Zn在因子 2 上有较高的载荷,可能主要来自类似的一个源,Hg在因子 3 上远远高于在其他元素在该因子的载荷,可能由单一污染源产生。最后通过对两个模型综合分析,得出Cr Cu Ni 在两种分析方法中都具有很强的关联性,分析污染产生的原因可能与电镀,合金制造等重工业有关,As Cd Pb Zn Cu在两种分析方法中呈现出一些差异,因此其污染来源情况比较复杂,可能与尾气排放,人类活动丢弃物以及农用废物有关,Hg在两种分析方法中均表现出独立性,因此伴随Hg 产生的其他重金属元素则相对较少,主要来源可能是科学仪器制造,医学仪器制造工厂等对
5、Hg有特定需求的工厂。针对问题三,本文通过对污染传播特征的研究,发现污染源的重金属浓度最高,并向周围呈递减趋势扩散。本文利用聚类分析找出8种重金属元素浓度的所有极大异常点,通过其传播特性可以预见这些极大异常点距离污染源是非常接近,从而对污染源的确定提供依据。然后我们又采用 Grid data插值模型,运用局部搜索方法,成功地搜索出了每种重金属元素的污染源位置并与极大异常点坐标接近,证明了该方法的可行性。最后统一各元素污染源坐标得出综合污染源有8 处,单一污染源有 9处,并用逐步多元回归模型对部分点进行了检验,验证了解的准确性。针对问题四,本文采用的Grid data插值法优点在于能够快速定位污
6、染源,但是由于在搜索过程中考虑到计算量巨大,所以搜索步长为100,由此产生的误差较大。为更好地研究城市地质环境的演变模式,还应考虑土壤类型、土地利用、道路等因素对重金属的影响。关键词:克里格插值;综合指数评价;相关分析;因子分析;GridData 插值2 目录一、问题的重述与分析.3 二、模型的假设.3 三、符号说明.4 四、模型的建立与求解.4 4.1 重金属元素的空间分布及污染程度.4 4.1.1 重金属元素的空间分布.4 4.1.2 不同区域重金属的污染程度的分析.5 4.2 重金属污染的原因分析.7 4.2.1 Pearson相关系数.7 4.2.2 相关系数的求解与分析.8 4.2.
7、3 因子分析.8 4.2.4 因子分析的求解与结论.8 4.3 污染源位置的确定.9 4.3.1 聚类分析.9 4.3.2 Grid data插值模型.10 4.3.3 插值模型的建立与求解.10 4.4 模型的检验.12 4.5 模型优缺点分析及讨论.13 五、结论.14 六、参考文献.143 一、问题的重述与分析1.问题的重述随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。按照功能划分,城区一般可分为生活区
8、、工业区、山区、主干道路区及公园绿地区等,分别记为1 类区、2 类区、5 类区,不同的区域环境受人类活动影响的程度不同。现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1 公里左右的网格子区域,按照每平方公里1 个采样点对表层土(010 厘米深度)进行取样、编号,并用GPS 记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2 公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。附件 1 列出了采样点的位置、海拔高度及其所属功能区等信息,附件2 列出了 8 种主要重金属元素在采样点处的浓度,附件
9、3 列出了 8 种主要重金属元素的背景值。现要求你们通过数学建模来完成以下任务:(1)给出 8 种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。(2)通过数据分析,说明重金属污染的主要原因。(3)分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。(4)分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?2.问题的分析本文将所有问题细化为一下几个步骤:(1)利用软件画出 8 种重金属污染元素的空间分布图;(2)建立综合评价指标对污染程度进行评价;(3)对数据进行统计分析,研究各元素之间的相关性,
10、从而分析污染原因;(4)运用插值法解出污染源坐标,并用逐步回归进行检验;二、模型的假设1.提供的数据真实有效;2.8 种重金属元素能够全面反映某一区域污染程度,不受其他元素影响;3.插值方法所产生的模型误差在可承受范围之内。4 三、符号说明符号意义单位iP第i种污染物的污染分指数-iC实测浓度-iS评价标准-PN土壤污染综合指数-iPmax土壤污染物中最大的污染分指数-iP各污染分指数的算术平均数-其余未说明的符号会在文章中进行说明四、模型的建立与求解4.1 重金属元素的空间分布及污染程度4.1.1 重金属元素的空间分布本文利用 Surfer 软件,通过克里格插值法画出8 种重金属元素的标准化
11、数据的等值图。(a)As 浓度等值图(b)Cd 浓度等值图(c)Cr 浓度等值图 (d)Cu浓度等值图5(e)Hg 浓度等值图 (f)Ni浓度等值图(g)Pb 浓度等值图 (h)Zn浓度等值图图 1 8 种重金属元素浓度等值图4.1.2 不同区域重金属的污染程度的分析4.1.2.1评价方法与分级标准1.单污染指数评价法以土壤单项污染物的实测值与评价标准相比,用以表示土壤中该污染物的污染程度。iiiSCP/(1)式中,iP 为第i种污染物的污染分指数;iC 为其实测浓度;iS 为其评价标准。2.多因子综合指数评价法各类土壤一般为多种重金属所污染,因而土壤污染评价多应用综合指数法进行污染综合评价。
12、2max22iiPPPN(2)式中,PN为土壤污染综合指数;iPmax为土壤污染物中最大的污染分指数;iP 为各污染分指数的算术平均数。3.分级标准下表是国内现行的PN指数分级标准6 表 1 土壤综合污染指数分级标准污染指数分级污染等级污染水平PN 0.7 1 安全清洁0.7PN1 2 警戒线尚清洁1PN23 轻污染土壤作物已受污染23 5 重污染土壤作物已受严重污染4.1.2.2结论与分析(1)同一功能区不同元素污染分析将数据代入公式(1)得到各个功能区的8 种污染物的污染分指数和综合指数。表 2 8 种元素污染分指数和综合指数功能区AsPCdPCrPCuPHgPNiPPbPZnP1 1.7
13、41792 2.230472 2.226407 3.742677 2.65829 1.491241 2.229229 3.4349 2 2.014272 3.023937 1.722883 9.661778 18.35291 1.610702 3.001319 4.027969 3 1.12336 1.17169 1.256763 1.311918 1.170172 1.256406 1.179225 1.062236 4 1.585566 2.769346 1.872709 4.713277 12.76635 1.432285 2.049492 3.519643 5 1.739919 2.1
14、58034 1.407615 2.287261 3.285467 1.243075 1.958337 2.235389 结论:1.从污染程度上说,山区的污染指数明显低于其他4 个区,说明人类活动对城市土壤重金属分布有重要影响2.从污染类型上说,工业区以Hg Cu的积累为特征,而生活区和公园绿地区则以Cu Zn的积累为特征,交通区以 Hg Cu Zn 的积累为特征,即不同的人类活动造成城市土壤中不同类型的重金属积累(2)不同功能区的综合污染分析将数据代入公式(2)算得 5 种功能区的综合污染指数得到表 3表 3 5 种功能区的综合污染指数功能区生活区工业区山区交通区公园绿地区PN 4.55862
15、1 14.68159 1.652858 11.87411 3.744166 将计算得到的 5 种功能区的综合污染指数用SIGMAPLOT 软件绘出,以形象直观的反应各污染区的综合污染指数大小。7 图 2 5 种功能区的综合污染指数通过对比 表 1,不同功能区的污染程度具有一下特点:1工业区,交通区,生活区,公园绿地区属于重污染区,其中,工业区和交通区的污染非常严重,PN值分别高达 14.68159 和 11.87411,而山区的人类活动相对较弱,PN值为 1.652858,属于轻度污染。2对不同区域 PN值对比发现,其不同区域污染程度呈现如下特点:工业区交通区生活区 公园绿地区 山区4.2 重
16、金属污染的原因分析为了研究重金属污染的原因,首先要分析8 种元素之间的相关性,对其进行分类,找到污染产生的共同点,进而确定污染源的类型,不同污染物的产生就是因为不同类型的污染源的存在。4.2.1 Pearson相关系数当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson 简单相关系数。计算公式为:niiniiniiiyyxxyyxxr12121(3)或2222yynxxnyxxynr(4)其中,r表示相关系数,n表示样本数,ix 和iy 分别表示两变量的变量值,x和y分别为表示变量的平均值。还可用下式表示:8 yinixiSyyS
17、xxnr11(5)其中,xS 和yS分别表示两变量的样本标准差4.2.2 相关系数的求解与分析为了研究 8 种元素可能的同源关系或是复合关系,本文通过SPSS对各元素浓度进行相关分析。表 4 8 种重金属元素的相关性元素As Cd Cr Cu Hg Ni Pb Zn As 1 Cd 0.225*1 Cr 0.189*0.352*1 Cu 0.160*0.397*0.532*1 Hg 0.064 0.265*0.103 0.417*1 Ni 0.317*0.329*0.716*0.495*0.103 1 Pb 0.290*0.660*0.383*0.520*0.298*0.307*1 Zn 0.
18、247*0.431*0.424*0.387*0.196*0.436*0.436*1 由上表可知,8 种元素中,Cd与 Pb,Cr 与 Cu,Cr 与 Ni,Cu与 Pb之间相关性显著,说明这些元素可能具有同源关系或复合关系。4.2.3 因子分析因子分析是指研究从变量群中提取共性因子的统计技术,本文为了进一步研究8种重金属元素之间的同源关系,利用因子分析对公因子的各个元素载荷进行分析,找出同类污染源产生的重金属。其基本步骤可分为:1.建立原始变量间的相关系数矩阵。2.求该系数矩阵的特征值、累计贡献率,并确定公因子个数。3.建立因子载荷阵。4.将因子载荷阵实行方差最大正交旋转,使得能对公因子给出合
19、理的解释。4.2.4 因子分析的求解与结论利用 SPSS软件对 8 种重金属元素浓度进行因子分析,获得表 5 和表 6结果。表 5 方差贡献率成分初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%1 3.560 44.500 44.500 3.560 44.500 44.500 2.228 27.849 27.849 2 1.150 14.377 58.877 1.150 14.377 58.877 1.776 22.204 50.053 3 0.965 12.063 70.941 0.965 12.063 70.941 1.671 20.888 70
20、.94 4 0.768 9.596 80.537 9 5 0.578 7.220 87.756 6 0.432 5.399 93.156 7 0.301 3.769 96.924 8 0.246 3.076 100.000 表 6 因子载荷元素旋转前旋转后因子 1 因子 2 因子 3 因子 1 因子 2 因子 3 As 0.426-0.200 0.681 0.115 0.794-0.202 Cd 0.711 0.281 0.282 0.194 0.642 0.463 Cr 0.735-0.444-0.303 0.894 0.142 0.102 Cu 0.756 0.125-0.365 0.59
21、7 0.125 0.591 Hg 0.408 0.673-0.297 0.005 0.008 0.842 Ni 0.723-0.515-0.190 0.879 0.227-0.002 Pb 0.764 0.314 0.237 0.230 0.636 0.531 Zn 0.699-0.037 0.123 0.444 0.491 0.258 因子分析方法可以用来判别土壤中重金属的来源,在本文的因子分析中Bartlett球度检验相伴概率为0,小于显著性水平 0.05,因此本研究中的数据适合于作因子分析。本研究中提取前3 个主成分可以解释总变量的70.941%,即对前 3 个主成分进行分析已经能够反映
22、全部数据的大部分信息。Cr Ni Cu 在因子 1 有较高的载荷,As Cd Pb Zn 在因子 2 上有较高的载荷,这说明Cr Ni Cu和 As Cd Pb可能主要分别来自类似的一个源。Hg在因子 3 上远远高于在其他元素在该因子的载荷,这说Hg可能由单一污染源产生。综合以上两种方法分析污染原因:Cr Cu Ni在两种分析方法中都具有很强的关联性,根据其共同特性,分析产生的原因可能与电镀,合金制造等重工业有关,As Cd Pb Zn Cu在两种分析方法中呈现出一些差异,因此其污染来源情况比较复杂,可能与尾气排放,人类活动丢弃物以及农用废物有关,Hg在两种分析方法中均表现出独立性,因此伴随H
23、g产生的其他重金属元素则相对较少,可能主要来源可能是科学仪器制造,医学仪器制造工厂等对Hg 有特定需求的工厂。4.3 污染源位置的确定通过对污染传播特征的研究,发现污染源的重金属浓度最高,并向周围呈递减趋势扩散,在计算污染源时,只要找到重金属浓度的极大值点,便能确定污染源的位置。4.3.1 聚类分析聚类分析是研究分类问题的一种多元分析方法,根据一组样品的多个观测值定出能度量样品相似程度的统计量,把相似程度大的归为一类。由于现实的分类往往伴随着模糊性,聚类问题采用模糊数学语言描述有其方便之处,这便是模糊聚类方法。根据实际问题的需要模糊聚类过程可以常采用两种方式:一种是通过建立模糊等价关系进行聚类
24、10 分析的方法,另一种是基于模糊划分的模糊聚类方法,即模糊C一划分。本文采用前一种方式。本文利用聚类分析找出8 种重金属元素浓度的所有极大异常点,通过其传播特性可以预见这些极大异常点距离污染源是比较近的,这样便能为之后污染源的确定提供依据。以 8 种重金属元素浓度为基础,进行聚类,找出每种重金属元素分类较少点,即为极大异常点。得到各种元素异常点如下:表 7 各元素异常点元素取样点编号As 178,84,41,29,30,6 Cd 95,22 Cr 20,22 Cu 8,22 Hg 257,182,8,9 Ni 135,22 Pb 16,8,6 Zn 61,36,22 4.3.2 Grid d
25、ata插值模型分析图 1,我们可以看出每种重金属的污染源分布较散,在此我们采用Grid data插值模型,运用局部搜索方法,搜索出每种重金属元素的污染源位置。4.3.3 插值模型的建立与求解将所有取样点位置的横坐标(x)、纵坐标(y)、以及 8 重元素的浓度作为变量,对横坐标(x)、纵坐标(y)进行插值搜索,搜索出每种元素的污染源的横坐标(x)、纵坐标(y),和污染源浓度。运用Grid data插值法,选择步长100进行搜索,求出每种元素的污染源位置如下:表 8 As 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度3300 7500 62.2527 5100 9900 91.4590
26、5600 9900 24.6058 12600 3000 23.9247 7900 15100 50.9202 18400 10100 32.2364 表 9 Cu 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度1700 4700 13268.84 3300 7500 18603.92 11 表 10 Hg 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度2300 2300 21328.77 13800 2300 15142.43 15100 9300 18473.18 表 11 Ni 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度700 2900 268.795 330
27、0 7500 1769.52 13900 9600 40.1550 15200 5900 43.8626 表 12 Pb 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度1900 3900 866.766 3300 7500 2024.49 5100 5100 425.021 表 13 Zn 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度9500 4500 4131.83 11900 2900 976.187 13900 9600 3767.79 表 14 Cr 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度2900 6800 11295.06 3300 7500 112
28、79.07 表 15 Cd 元素污染源位置横坐标 x(m)纵坐标 y(m)污染程度1700 4700 10200.43 3600 5600 3616.79 5300 5100 794.381 6000 11600 13560.08 6000 7900 779.263 8100 3200 884.649 9100 15900 863.521 12500 1900 900.407 17700 2700 1006.16 12 17900 10000 728.601 结果分析:1.通过聚类分析与Grid data 插值模型搜索出的结果可以看出,异常点的取样位置与各污染源的污染程度最大值的位置相接近,且
29、都是从污染程度都是从最大值的位置向四周逐步衰减,从而可以看出Grid data 插值模型搜索出的各种元素污染源的位置是可靠的。2.根据插值模拟出的污染源坐标,可以找到坐标非常相近的不同污染源,考虑到模型误差,本文将相距2Km之内的污染源看作是同一污染源,坐标取其平均值。表 16 综合污染源含污染源元素种类平均值坐标As Cu Ni Pb Cr(3300,7500)As Cd(5800,10750)As Hg Zn Cd(12700,2525)As Cd(18150,10050)Cu Pb Cd(1767,4433)Hg Zn Ni(14300,9500)Pb Cd(5200,5100)Cr C
30、d(3250,6200)经过上述方法,仍旧有一部分污染源呈现独立性。表 17 单一污染源污染源元素坐标As(7900,15100)Hg(2300,2300)Ni(700,2900)Ni(15200,5900)Zn(9500,4500)Cd(6000,7900)Cd(8100,3200)Cd(9100,15900)Cd(17700,2700)4.4 模型的检验为了进一步检验插值法的有效性,本文通过逐步多元回归对其中一些点进行检验。1、功能区属性变量的量化处理如下表:表 18 五种功能区量化处理表功能区生活区工业区山区交通区公园绿化区量化处理1 0 0 0 0 0 1 0 0 0 0 0 1 0
31、0 0 0 0 1 0 0 0 0 0 1 2、以 8 种重金属浓度分别为因变量,每个取样点的坐标,以及功能区为自变量,建立多元回归模型,我们以As 元素为例,用 SAS编程,求的结果如下表:13 表 19 回归方程检验Variable Parameter Estimate Standard Error Type|ss F Value PrF intercept 7.77594 0.50202 1875.73329 239.92 交通区 生活区公园绿地区 山区;2.Cr Cu Ni在两种分析方法中都具有很强的关联性,根据其共同特性,分析产生的原因可能与电镀,合金制造等重工业有关,As Cd P
32、b Zn Cu在两种分析方法中呈现出一些差异,因此其污染来源情况比较复杂,可能与尾气排放,人类活动丢弃物以及农用废物有关,Hg在两种分析方法中均表现出独立性,因此伴随Hg产生的其他重金属元素则相对较少,可能主要来源可能是科学仪器制造,医学仪器制造工厂等对Hg有特定需求的工厂。3.通过对污染传播特征的研究,发现污染源的重金属浓度最高,并向周围呈递减趋势扩散。本文利用聚类分析找出8 种重金属元素浓度的所有极大异常点,通过其传播特性可以预见这些极大异常点距离污染源是非常接近,从而对污染源的确定提供依据。然后我们又采用 Grid data插值模型,运用局部搜索方法,成功地搜索出了每种重金属元素的污染源
33、位置并与极大异常点坐标接近,证明了该方法的可行性。最后统一各元素污染源坐标得出综合污染源有8 处,单一污染源有 9 处,并用逐步多元回归模型对部分点进行了检验,验证了解的准确性。六、参考文献1 朱道元 吴诚鸥 秦伟良.多元统计分析与软件SAS.南京:东南大学出版社,1999.2 邬学军 周凯 宋军全.数学建模竞赛辅导教程.杭州:浙江大学出版社,2009.3 朱长青 史文中.空间分析建模与原理.北京:科学出版社,2006 .4 李卫东.应用多元统计分析.北京:北京大学出版社,2008.5 汪远征 徐雅静.SAS软件与统计应用教程.北京:机械工业出版社,2007.6 冯力.回归分析方法原理及SPSS 实际操作.北京:中国金融出版社,2004.7 罗伯特海宁.空间数据分析理论与实践.武汉:武汉大学出版社,2009.8 赵秀峰王强盛 石宁宁丁艳峰.石化园区周边农田土壤重金属污染分析与评价J.15 环境科学学报,30(1):133-141,2010.9 曲蛟 马振宇 丛俏 袁星.钼矿区交通运输干线周边菜地土壤重金属污染分析与评价.农业环境科学学报,27(1):0178-0181,2008.