《数学建模大赛一等奖作品Word 文档.pdf》由会员分享,可在线阅读,更多相关《数学建模大赛一等奖作品Word 文档.pdf(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数学建模论文队伍名称姓名队伍成员三人行院、系、专业交通与物流工程交通与物流工程交通与物流工程联系方式整理为 word 格式高速公路道路交通事故分析预测高速公路道路交通事故分析预测摘 要我国目前的道路交通安全状况相对于世界水平要差得多, 高速公路道路交通事故所造成的损失非常高。因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。针对这样的现状,我们必须进行高速公路交通事故的预测,从而及早采取措施进行预防工作,从而减少事故发生次数及损失程度。针对此次建模的要求,在对此问题的深入研究下,我们提出了合理的假设,将本问题归结为一个预测分析的问题,其基本思想是通过聚类分析、SPSS 软件
2、求解、GM(1,1)灰色预测模型、多元线性回归分析,组合模型等方法的运用得到最优的预测结果。针对问题一, 我们首先运用了聚类分析的思想,建立了基于聚类分析的模型,通过聚类分析方法对给定的信息的筛选、加工、延伸和扩展,从而将评价对象确定在某一范围内,通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。针对问题二, 本文选取受伤人数这一单项指标作为预测的对象,首先运用了GM(1,1)灰色预测模型,建立模型,通过对给定的事故原始数据,通过MATLAB软件预测了五年内的交通事故受伤人数;运用多元线性回归方法建立模型,在模型和模型的基础之上,通过基于组合模型思想的模型,求解得出了交通
3、事故受伤人数在五年内的预测。关键词:SPSS 聚类分析 GM(1,1)灰色预测模型组合预测模型 MATLAB整理为 word 格式目录目录一问题重述.3二问题的分析.4三模型假设与符号系统.53.1 模型假设.53.2 符号系统.6四模型的建立及求解.74.1 问题一.74.1.1 建立模型.74.1.2 模型的求解及结果.84.1.3 实验结果的分析说明.94.2 问题二.124.2.1 建立 GM(1,1)模型 .124.2.2 用 MATLAB求解模型 .164.2.3 建立模型.194.2.4 建立优化模型.204.2.5 最优组合模型的求解.21五模型的评价.22参考文献.23附录
4、.24整理为 word 格式一问题重述一问题重述随着道路交通事业的发展,高速公路交通事故也在不断增加,对人类的生命和财产安全构成了极大的威胁。 我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。高速公路交通事故往往造成人员伤亡,车辆损毁、道路堵塞等严重后果,为探索高速公路道路交通事故发生的规律, 分析现有道路交通条件下未来高速公路交通事故的发展趋势,以便及早采取措施进行预防,减少事故发生次数及损失程度,必须进行高速公路交通事故预测。另外,高速公路道路交通事故分析预测是道路交通安全规划,
5、决策及高速公路交通工程项目效益评价中的一个关键性问题, 分析预测正确与否直接关系到高速公路交通设施的建设,高速公路交通管理政策的制定和高速公路交通建设资金的投资分配,具有重要的现实意义。为了解决此问题, 现利用已收集到的 A 省高速公路交通事故数据 (见附件) 、建立针对该省具体情况的数学模型,预测该省未来的交通事故情况,解决下面几个问题:1、 目前国内外用于统计道路交通事故状况的四项绝对指标为交通事故次数、死亡人数、 受伤人数以及直接经济损失,这四项统计指标既是认识交通事故的起点, 又是构造其它交通事故统计指标的基础,基本涵盖了道路交通事故所造成各种损害的主要方面,因此选用这四项指标, 试探
6、讨以聚类分析作为理论基础的高速公路公路交通事故统计分析方法, 然后从附件中所给 A 省高速公路交通事故四项指标的历史统计数据出发,对该省公路交通事故进行聚类分析研究,以期该省获得该省高速公路交通事故基于四项指标的时间、空间分布规律。 2、高速公路交通事故预测是高速公路安全评价、规划及决策的基础,国内外关于道路交通事故的预测有多种方法,鉴于高速公路交通事故具有复杂性、随机性和灰色性的基本特征,对高速公路公路交通事故预测时选用时间序列分析,灰色分析、神经网络等分析方法。根据高速公路交通事故的分布规律,构建高速公路交通事故发生次数、死亡人数、受伤人数、直接经济损失的预测模型。以整理为 word 格式
7、A 省公路交通事故的历史统计数据为基础,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对 A 省公路交通事故未来五年的发展趋势做出科学预测, 为高速公路交通安全管理部门提前预防和控制交通事故提供决策依据。二问题的分析二问题的分析2.12.1(问题一)(问题一)本小问主要解决对该省公路交通事故四项指标进行的聚类分析。 此小问属于统计问题,因此由附件的相关数据信息,我们首先将附件中高速公路事故 24 时分布、月统计、辖区统计进行整理,得出四项指标在六年中小时段、月份、辖区分布总量。本问题主要解决该省高速公路交通事故基于四项指标的时间、空间分布
8、规律。 本问题为聚类分析的思想,由题目可以知道对于 A 省高速公路交通事故分布规律需要分别对四项指标进行聚类分析,找出各个指标内的能够度量不同小时段、不同月份、不同辖区之间的相似度的统计量。并将其聚合到不同类中。因此, 用 SPSS 的 K-means Cluster 过程即逐步聚类法, 按照预定的分类数量,按照既定的原则选择凝聚点,得到一个初始分类方案,并计算出各个初始分类的中心位置(均值) ;最后,使用计算出的中心位置重新进行聚类,因此在该方法中, 各指标的分类情况会在运算中不断改变,分类完毕后再次计算各类的中心位置。如此反复循环,直到凝聚点位置改变很小为止。2.22.2 (问题二)(问题
9、二)由对题目的第二问分析,可知第二问分为两小问。第一小问: 选用灰色分析、 多元线性回归分析等分析方法构建高速公路交通事故受伤人数预测模型。交通事故作为一个随机事件,其本身具有相当大的偶然性和模糊性 ;具有明显的不确定性特征。因此可以认为一个地区的道路交通安全系统是一个灰色系统,可以应用灰色系统的理论进行研究。用 G(1,1)灰色建立受伤人数指标的预测模型,在 GM(1,1)模型及相关模型灰色预测过程中要大量进行数列和矩阵运算将 MATLAB 软件和 GM(1,1)结合,实现灰色预测算法;建立多元线性回归模型。第二小问:本小问为优化问题,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建
10、立组合模型或提高预测准确性的其它解决方案,最后对A省 公 路 交 通 事 故 未 来 五 年 的 发 展 趋 势 做 出 科 学 预 测 。整理为 word 格式对四项指标分别用灰色分析和多元线性回归模型结果进行精确度比较, 并且构建最优组合预测模型。 利用以上两种不同的单项预测法对受伤人数指标进行预测, 然后对各个单独的预测结果做适当的加权平均,最后取其加权平均值作为最终的预测结果。本文采用简单实用的求方差极小值法,获得组合预测模型。三模型假设与符号系统三模型假设与符号系统3.13.1 模型假设模型假设(1)假设在受伤人数统计时,以伤残等级三级以上归为受伤。(2)假设在财产损失统计时,所损失
11、的物资、费用等均按现社会流通价值或社会人力服务成本的平均值进行统计。(3)根据其同一指标中的个体有较大的相似性,不同类中的个体差异较大,用聚类方法聚合时,将其聚合在 3 类中。(4)假设高速路上行驶的车辆状况、驾驶员心理状态良好。3.23.2 符号系统符号系统Xij表示第 i 个指标在第 j 年的给定值;x(0)(k)实际给定的第 k 年的死亡人数:其中 k=1,2,6;X(1)的一次累加生成序列;为X(1)的紧邻均值生成序列待定参数列;z(1) B 为数据矩阵,为待估参数;Y 为数据向量;a为待定参数列;qk为生成残差;q为残值均值;s12为原始数据的方差;2s2为残值的方差;C为后验差比值
12、;P为小误差概率;整理为 word 格式f3为组合模型使用;f2为多元线性回归预测值;f1为灰色理论预测值;2为多元线性回归预测的预测误差;1为灰色理论预测的预测误差;2多元线性回归的相应权系数;1灰色理论模型的相应权系数; MSPE 为均方百分比误差;四模型的建立及求解四模型的建立及求解4.14.1 问题一问题一4.1.14.1.1 建立模型建立模型聚类分析法是根据实物本身的特性来定量研究分析问题的一种统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是更具一批样品的多个观测指标,找出能够度量样品(或变量)之间相似度的统计量,并以此为依据,采用聚类发将所有的样
13、品(或变量)分别聚合到不同的类中。将分析评价中的 n 个待评样本作为聚类对象(Xi)(i=1,2,n);m 个;评价指标作为聚类指标( Uj)(j=1,2,m),s 个评价标准作为评价等级(Zk)(k=1,2,s).则根据第 i 个聚类独享对于第 j 个聚类指标的样本值 Xij,确定聚类样本矩阵为 X :X11X21X31X41X51X12X22X32X42X52X13X23X33X43X53X14X24X34X44X54X15X25X35X45X55以一年十二个月的数据分析为例: 在对给定的原始收据通过 Excel 整理的基础上我们建立了针对交通事故每月的聚类分析模型。将分析评价中的 12
14、个待评样本作为聚类对象 (Xi)(i=1,2,12);4 个;评价指标作为聚类指标(Uj)(j=1,2 , 3,4), 我 们 设 定 为 三 类 分 类 标 准 , 则 聚 类 样 本 矩 阵 为 :整理为 word 格式4541404546495553514136414.1.24.1.2 模型的求解及结果模型的求解及结果2641 1012394275111301262243752580 35501263204305797787432601086974365812571013761946124405510527582643900581 27367382043146767496在建立了聚类分析
15、的模型的基础上,我们采用了 SPSS 软件来对模型进行求解,SPSS 的优点是计算量较小,从而可以有效的处理多变量、大样本数据而不会占用过多的内存空间和计算时间; 同时在分析时用户可以人为地制定初始中心位置, 或者将曾做过的聚类分析结果作为初始位置引入分析。通过计算得得出下面的实验数据结果:表 4.1 初始聚类中心聚类123次数45.0045.0036.00死亡人数26.0035.0027.00受伤人数41.0050.0036.00经济损失 1012394.00 1263204.00 738204.00表 4.2 最终聚类结果案例号月份1一月2二月3三月4四月5五月6六月7七月聚类距离1286
16、7.6001 114864.4293180.06823051.507137387.572171712.42923051.507整理为 word 格式表 4.1 初始聚类中心聚类123次数45.0045.0036.00死亡人数26.0035.0027.00受伤人数41.0050.0036.00表 4.2 最终聚类结果案例号月份聚类距离1一月12867.6002二月1 114864.4293三月3180.0684四月23051.5075五月137387.5726六月171712.4297七月23051.5078八月169137.5729九月137496.43010十月1 114680.57211十
17、一月314556.0018八月169137.5729九月137496.43010十月1 114680.57211十一月314556.00112十二月314736.001表4.4每个聚类中的案例数聚类17.00022.00033.000有效12.000缺失.0004.1.34.1.3 实验结果的分析说明实验结果的分析说明(1)表2.2 显示的是将样品分为三类的聚类结果,这三类分别是:一月、四月、十一月。(2)表 2.3 表示的是最终的聚类分析结果。(3)表 2.4 反映了聚类分析中的有效样品数为 12 个,没有样品数的缺失。综上得出聚类分析的结论(三月、十一月、十二月)为交通事故最轻的,(一月、
18、二月、五月、八月、九月、十月)为交通事故一般的, (四月、七月)为交通事整理为 word 格式故最为严重的。同理我们得出了一天中二十四小时以及每个辖区的数据分析结果如下表所示:表 4.5 以辖区为单位的数据结果分析案例号 辖区1辖区2辖区3辖区4辖区5辖区6辖区7辖区8辖区9辖区10辖区聚类距离3128890.4692344284.505396888.4623214476.540339959.5393201362.5393234361.5402150913.5023258343.4663233859.540整理为 word 格式案例号 辖区1234567891011121314151617表
19、4.6 最终聚类中心次数聚类1137.00248.2527.2546.5032333321316.3111.6218.38辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区聚类32333332333233332距离128890.469344284.50596888.462214476.54039959.539201362.539234361.540150913.502258343.466233859.540112157.462100373.508149838.462286803.46266440.462175342.54092997.504死亡人数 110.00受伤人数 17
20、6.001112131415161718辖区辖区辖区辖区辖区辖区辖区辖区112157.462100373.508149838.462286803.46266440.462175342.54092997.504.000整理为 word 格式表 4.6 最终聚类中心次数聚类1137.00248.2527.2546.50316.3111.6218.38死亡人数 110.00受伤人数 176.00得出分析结果:经济损失 4721128.00 1015373.50 238676.54(1)表 2.6 显示将分类对象区域分为三个等级。(2)表 2.5(一区、三区、四区、五区、六区、七区、九区、十区、十一区
21、、十三区、十四区、十五区、十六区)为所辖区范围内交通事故最轻的、 (二区、八区、十二区、十七去)为辖区范围内交通事故一般的区域、 (十八区)是辖区范围内交通事故最为严重的。(3)表 2.5 显示有效数据位十八个,没有数据缺失。表 4.7 以小时为单位的最终聚类结果案例号小时聚类距离10-1 时1 41531.12521-2 时1 52677.12632-3 时1 55879.87643-4 时1 81456.12554-5 时2 47286.00065-6 时2 47286.00076-7 时1 62299.87587-8 时1 57623.12598-9 时3 74947.072109-10
22、 时1 102944.876整理为 word 格式案例号小时聚类距离10-1 时21-2 时32-3 时43-4 时54-5 时65-6 时76-7 时87-8 时98-9 时109-10 时1110-11时1211-12时1312-13时1413-14时1514-15时1615-16时1716-17时1817-18时1918-19时2019-20时2120-21时2221-22时2322-23时1110-11时1211-12时1 41531.1251 52677.1261 55879.8761 81456.1252 47286.0002 47286.0001 62299.8751 57623
23、.1253 74947.0721 102944.8763 101939.0733 22358.92934205.0743 89233.9293 12656.0733 98614.0723 25122.9293 71976.9293 77094.9293 103017.9293 54255.9293 114598.0723 36102.0723 101939.0733 22358.929整理为 word 格式13141516171819202122232412-13时13-14时14-15时15-16时16-17时17-18时18-19时19-20时20-21时21-22时22-23时23-24
24、时34205.0743 89233.9293 12656.0733 98614.0723 25122.9293 71976.9293 77094.9293 103017.9293 54255.9293 114598.0723 36102.0721 12162.875表 4.8 以小时为聚类对象的最终聚类中心聚类123事 故 次26.5033.0018.93数死 亡 人20.6323.5011.29数受 伤 人28.5031.0022.14数经 济 损661234.8892427.0343619.9失803分析可得, 在对以小时为聚类对象的分析中:表 2.8 显示以小时为分类对象划分为三个等级。
25、表 2.7 显示在(08:00-09:00、10:00-23:00、 )为交通事故发生最轻整理为 word 格式的小时段(04:00-06:00)为交通事故发生程度最为严重的小时段;(00:00-04:00、06:00-08:00、09:00-10:00、23:00-24:00)为交通事故发生程度一般的小时段。4.24.2 问题二问题二4.2.14.2.1 建立建立 GM(1,1)GM(1,1)模型模型交通事故作为一个随机事件, 其本身具有相当大的偶然性和模糊性;如果把某地区的道路交通作为一个系统来看,则此系统中存在着一些确定因素(灰色系统称为白色信息),如道路状况、信号标志等;同时也存在一些
26、不确定因素(灰色系统称为灰色信息),如车辆状况、气候因素、驾驶员心理状态等等,具有明显的不确定性特征。因此可以认为一个地区的道路交通安全系统是一个灰色系统,可以应用灰色系统的理论进行研究。高速公路交通事故灰色预测的特点分析高速公路交通事故灰色预测的原理、方法及所具有的特点表现在:(1)灰色预测方法认为,某一地区在某一时间区间内的交通事故指标值,是在一定范围内变化的且与时间坐标有关的灰色量。 该方法将原始数据整理成较有规律的生成数列后再进行研究、处理,避免了概率统计方法的大样本、大工作量而其结果不理想的状况。(2)数学模型 GM(1,1)是一阶单变量微分方程;这与以往的概率统计方法利用高散数据所
27、建立的按时间作逐段分析、递推、高散的模型有本质的区别。(3)GM(1,1)灰色预测模型不是交通事故原始数学模型, 而是生成数据序列模型;通过对生成数列的处理,使杂乱无章的原始数据呈现出一定的规律性。 MATLAB 的基本数据单位是矩阵,其核心也是矩阵,它可直接进行矩阵的乘积、矩阵的乘方、矩阵的除法、稀疏矩阵等运掣” 。在MATLAB 语言系统中,几乎所有的操作都是以矩阵操作为基础, 用户可以用类似于数学公式的方法编写程序实现算法,大大降低了编程所需的难度并节省了时间。而在 GM(1,1)模型及相关模型的灰色预测过程中,要大量进行数列和矩阵运算嘲,这晗好使 MATLAB 派上了用场。将 MATL
28、AB 和 GM(1,1)模型结合,实现灰色预测算法,恰到好处。灰色预测模型 GM(1,1)的建立过程 GM(1,1) 的一般形式设有变量 X(0)X(0)(i),i=1,2,.,n(1)为某一预测对象的非负单调原始数据列,为建立灰色预测模型: 首先对X(0)进行一次累加 (1AGO, Acumulated Generating Operator) 生成一次累加序列: X(1)X(1)(k),k1,2,n(2)其中 X(k)X(0)(i) (k=1,2,3 n)(1)ki1%作1AGO生成序列x1整理为 word 格式 For i=1:n X1(i)=sum(x0(1:i); End对X(1)可
29、建立下述白化形式的微分方程:dX(1)十aX(1)u ,式中a,u是待定系数。(3)dt灰微分方程动态模型为:111 k 1zk 0.5xk 0.5x01 k u(4)xk az1式中zk为x1k的紧邻均生成,即z1k 0.5x1k0.5x1k 1%紧邻均生成 For k=2:n %紧邻均生成zz(k)=0.5*x1(k)+0.5*x1(k-1);end(2)构造矩阵 B和数据向量Ynx1和x0满足关系Yn Ba,其中:1(1)(1)(X(1) X(2)12(0)(0)(0)T1B= Y (X(2), X(3), X()n(1)(1)(X(2) X(3)12.1(1 )(X(n -1) X(1
30、)(n)12a (BTB)1BTY (,)T(3)计系数a和u算整理为 word 格式x02 z12101 x3 z31a (5)ux0n z1n1Yn Ba可用(5)式表示,由此计算出系数a和u for i=1:n-1 b(i,1)=-z(i+1); y(i)=x0(i+1);end b(:,2)=1; y=y ; % 转置为列向量 au=by; % 作矩阵除法,计算 a u累加模型预测结果X(1)(k)(X(0)(1)u)ea(k1)uaa%计算GM(1,1)模型X(1)(k)值 Yc1(1)=x0(1); For k=1:n C=x0(1)-au(2)/au(1); Yc1(k+1)=c
31、*exp(-au(1)*k)+au(2)/au(1);End(5)还原后的预测结果(作 IAGO) (7)xk 10 x1k 1 x1k%计算x0k 1值,显示预测结果 Yc0(1)=x0(1); For k=1:n Yc0(k+1)=yc1(k+1)-yc1(k);整理为 word 格式6)(4)(End Disp(uint16(yc0(2:1:n+1);2、检验和判断GM(1,1)模型的精度为确保所建灰色模型有较高的精度能应用于预测实际,按灰色理论一般采用三种方法检验判断 GM(1,1) 模型的精度 ,它们是 ,残差大小检验 ;关联度检验和后验差检验。通常关联度要大于0.6,残差Pk、方差
32、c越小,模型精度P越好。(1)残差检验0残差检验: e(k)=xk xk0ek0相对误差:xk(2)关联度检验因分辨系数毛是在 (0,1)中取定的实数,一般取=0.5。关联度是各关联系数(k)累加后在 n维空间的平均值。当分辨系数 =0.5,认为关联度大于0.6时可以接受,即通过关联度检验,否则关联程度差些。计算关联度Max1=max(abs(e0);r=1;for k=2:nr=r+0.5*max1/(abs(e0(k)+0.5*max1);endr=r/n; % r 表示关联度(2)方差比和小误差概率检验方差和小误差概率检验属后验差检验,计算公式分别如下:1n预测误差均值e eini1x原
33、始数据均值01n0 xini1整理为 word 格式原始数据标准差:S110 xi xni1n021nS e i e预测数据标准差2ni12S2C 方差比:S1 小误差概率:P p e k e 0.6745S1表 4.9 P、C 预测精度表精度等级精度等级一一二二三三四四P0.950.80.70.7C0.350.450.95&c0.8&0.7&0.65 Disp( 预测勉强合格 ); else Disp( 预测不合格 ); End EndEnd4.2.24.2.2 用用 MATLABMATLAB 求解模型求解模型根据题目给定四项指标要求, 我们选择采用灰色预测模型来预测交通事故受伤人数,其中交
34、通事故死亡人数在 2006 年到 2011 年的数据如下表 2 所示:整理为 word 格式4.10 为 2006 年到 2011 年交事故受伤人数年份20062007200820092010死亡人数7386956605635042006-2011 年的 A 省高速道路事故受伤人数的原始序列为:X07386956605635044312011431由此可得生成数列为:X173814332093265631603591其数据矩阵 B 为:在 MATLAB 中计算可得:1085.51763B 2374.529083375.5数据向量为:Y 69511111563504431660可得待定参数列为:
35、a B BB则预测模型为:1Y ,u0.12,844.42TT10.12kXk 1 7036.837774.83最后需要进行还原处理,作“生成数列”的逆运算,即进行还原处理得到交通事故受伤人数的预测模型。整理为 word 格式因为X1kxm1k0 x0mx0k X1k1 X0k,k 1,2,nm1k1011 k 1,k 1,2,nXk Xk X所以利用 MATLAB 软件得出X1(k)和X0(k)的取值:年份年份k kX1kX0k即即20062006738表 4.11 GM(1,1)预测模型计算一览表2007200720082008200920092010201011450.7712.1222
36、083.8633.1132642.6562.443145.8499.582011201153589.6443.78预测序列预测序列原始值原始值738预测值预测值年份年份k kX1kX0k即即 预预 测测6952012201263983.8394.216602013201374334350.185632014201484625311.075042015201594921.4276.3243120162016105166.8245.46序列序列原始值原始值预测值预测值MATLAB436.701387.319433.523304.675270.244软件的出预测分析图,如下表所示:整理为 word
37、格式图 4.1 MATLAB 预测分析图残差检验和后验差检验,其结果为:方差比 C=0.4350.95好上述结果说明建立的灰色预测模型通过检验,且模型的精度为 I 级,精度好。 (参照表 1)4.2.34.2.3 建立模型建立模型多元线性回归模型可以用于预测对象Y受多个因素X1, X2,X3,XP影响的情况。P 元线性回归模型:yi01xi1pxip,i 1,2,n2i N0,且相互独立,用最小二乘估计法求未知参数0,1,p的最小二乘估计。记Q Q0,1,Pyi01xi1pxip2令 Q 2yi01xi1pxip 00Q 2yi01xi1pxip 0,j整理为 word 格式j 1,2,3,
38、p整理的正规方程组(3) :n0 xi11xippyi2xi10 xi11xi1xippxi1yi22xip0 xipxippxipyi1(3), ,p, ,p的最小二乘估计。从而 P其解记为01,即为01元线性回归方程(4) :y 01x1pxp4.2.44.2.4 建立优化模型建立优化模型基于以上两种预测模型建立优化组合模型组合预测就是利用以上两种不同的单项预测法对同一预测对象进行预测, 然后对各个单独的预测结果做适当的加权平均, 最后取其加权平均值作为最终的预测结果。目前关于权系数的计算方法很多,主要分为主观赋值法、客观赋值法、试算比较法, 客观赋值法就是根据一定的理论或标准通过代数计算
39、等确定权值,例如误差绝对值之加权和最小法、误差平方和最小法、方差极小值法等,本文采用求方差极小值法,该方法简单实用,掌握起来也不难。设f1是灰色 GM(1,1)的预测值,f2是多元回归预测值,f3是最优组合预测值,预测误差分别为1,2,3,取1和2是相应权系数,且121,有f31f12f2则误差及方差 D 分别为312122D(3) 1D(1)22D(2) 212cov(1,2)关于1对D(3)求极小值,可得1D(2)cov(1,2)D(1) D(2)2cov(1,2)显然可取,cov(1,2) 0,记D(1) 1,D(2) 2,则组合模型的权系数分别为:112,2, 由 此 我 们 可 得
40、最 优 组 合 预 测 模 型 。1212整理为 word 格式4.2.54.2.5 最优组合模型的求解最优组合模型的求解二元回归模型的自变量取x1,x2分别为序号和交通事故次数,通过计算,它的预测模型为y71.3623.75x11.53x2GM(1.1)模型中的辨识算式0.11844,843.16。预测结果如表 4.12表 4.12 两种预测模型的受伤人数预测结果两种预测模型的受伤人数预测结果单位:人年份200620072008200920102011实际受伤人数738695660563504431GM(1,1)灰色预测738712.72633.11562.40499.58443.78误差(
41、%)02.463%-4.074%0.106%-0.877%2.965%二元回归模型预测729.28686.33673.25583.29511.42416.92误差(%)-1.220%-1.247%2.007%3.603%1.389%-3.267%根据最优组合方法计算:4584.67 69.38%灰色模型的权重系数:14584.67 2023.392023.39 30.62%二元线性回归模型权重系数:24584.672023.39所以组合预测模型为式:f31f12f2 0.6938 f1 0.3062 f2得组合模型的预测结果,与其他两种预测模型结果做比较三种预测模型的预测结果单位:人年份实际受
42、GM(1,1)误差 (%) 二元回误差 (%) 组合模误差 (%)伤人数灰色预归模型型预测测预测20067387380729.28-1.220%735.32-0.363%2007695712.722.463%686.33-1.247%704.641.387%2008660633.11-4.074%673.252.007%645.402.212%2009563562.400.106%583.293.603%568.801.030%2010504499.58-0.877%511.421.389%503.210.157%2011431443.782.965%416.92-3.267%435.561.
43、058%我 们 采 用 如 下 的 均 方 百 分 比 误 差 来 检 验 组 合 模 型 :整理为 word 格式1MSPE nytyt2()yti1n其中:MSPE 是均方百分比误差,yt是实际值,yt是预测值。通过计算可得:二元回归模型预测的均方百分比误差为1.14290%,GM(1,1)灰色模型的均方百分比误差为 1.13552%,组合预测的均方百分比误差为 0. 60509%。根据组合模型可预测出 2012-2016 年某高速公路因交通事故的受伤人数。如下表:2012-2016 年某高速公路因交通事故的受伤人数年份20122013201420152016组合预测值3913513102
44、76244五模型的评价五模型的评价优点:(1)聚类分析 K-means 模型对给定的信息的筛选、加工、延伸和扩展,从而将评价对象确定在某一范围内, 通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。(2)聚类分析 K-means 模型与 SPSS 统计软件结合简单方便且实用。(3)从前面对组合模型的百分比误差分析中可以看出:二元线性回归模型预测的预测精度相对比较低,模型预测精度相对较好,组合预测模型的预测精度大于任一单项预测模型,它避免了单项预测模型的片面性,综合利用各种预测提供的信息,具有更好的预测效果。(4)建立了二元回归预测与灰色预测组合的预测模型,研究了其在交通事
45、故四项指标中受伤人数预测的应用,并得出了好的结论,为交通事故四项指标的预测提供了一种新的,可靠的方法。(5)对于灰信息处理技术与多元线性回归模型融合得到有机组合体。实现功能互补,能够使预测数据精度大大提高。用灰色系统理论的思想、方法对原始数据进行处理,很大程度上改善了统计模型性能。与多元线性规划模型进行组合,深化对系统演化规律的认识。缺点:(1)聚类分析 K-means 模型的算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。(2)从 K-means 算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,需要与 SPSS 等统计软
46、件作辅助工作。( 3 ) 组 合 模 型 计 算 量 相 对 于 单 项 预 测 模 型 较 大 。整理为 word 格式参考文献参考文献1邓聚龙.灰色系统基本方法M.武汉:华中理工大学出版社,19962李云贵等.灰色GM(1,1)预测模型的改进J.系统工程,1992(6):42433何能,鲍一丹.灰色马尔可夫预测模型及其应用J系统工程理论及实践,1992(4):22244肖新平等 灰色系统分析理论及其应用M 大连: 大连海事大学出版社, 19975吴维扬.经济预测及案例分析M北京:中国经济出版社,19956庄楚强,吴亚森.应用数理统计基础(第二版)M.广州: 华南理工大学出版社,2003,
47、12.7马骥, 张卫峰.组合预测方法在磷肥需求预测中的应用J.统计与决策,2005, (6):8 周爱民.基于偏最小二乘法的情报组合预测法J.统计与决策,2004,176(8):9 江西省统计局编.江西统计年鉴2005M.北京: 中国统计出版社,2005.10 杨明媚,李华林.主成分分析在证券组合投资中的应用J.统计与信息论坛,2004,11姚祖康.道路与交通工程系统分析.北京:人民交通出版社,199612邓聚龙.灰色控制系统.武汉:华中工学院出版社,198513Bates,J.M.and Granger,C.W.J.combination of Forecast, OperationsRes
48、earch Quarterly,20(4),1969,451-46814国家统计局编.中国统计年鉴.北京:中国统计出版社,200415牛东晓,陈志业,谢宏.组合灰色神经网络模型及其季节性负荷预测.华北电力大学学报,2000,27(4):1-616王应明,傅国伟.基于不同误差准则和范数的组合预测方法研究J.控制决策, 1994整理为 word 格式附录附录附表一:原始数据的处理附表一:原始数据的处理月份的原始数据:月份次数一月二月三月四月五月六月七月八月九月十月十一月十二月年份的原始数据处理:辖区次数辖区一35辖区二76辖区三17辖区四1辖区五17辖区六8辖区七0辖区八27辖区九44辖区十2辖区
49、十一9辖区十二66辖区十三25辖区十四37辖区十五13辖区十六4辖区十七24辖区十八137小时的原始数据处理:小时次数死亡人数454140454649555351413641死亡人数受伤人数262722353032363740262731受伤人数415143505760586155433646经济损失101239411301267525801263204977874108697412571019461241052758900581738204767496经济损失2155131810028302115231811321110死亡人数整理为 word 格式589021115803954111182
50、72315539176受伤人数3675671359658335565242001987173731443158644604970204817350834915000388515525480305117633349223764721128经济损失0-1 时251-2 时 312-3 时243-4 时314-5 时345-6 时326-7 时267-8 时278-9 时239-10 时2110-11 时2611-12 时1712-13 时1713-14 时1414-15 时2115-16 时2416-17 时2217-18 时1918-19 时1619-20 时1620-21 时1521-22 时