《数学建模大赛一等奖作品之欧阳美创编.pdf》由会员分享,可在线阅读,更多相关《数学建模大赛一等奖作品之欧阳美创编.pdf(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数学建模论文时间:2021队伍成员姓名院、系、专业交通与物流工程交通与物流工程交通与物流工程联系方式高速公路道路交通事故分析预测高速公路道路交通事故分析预测摘要我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。针对这样的现状,我们必须进行高速公路交通事故的预测,从而及早采取措施进行预防工作,从而减少事故发生次数及损失程度。针对此次建模的要求,在对此问题的深入研究下,我们提出了合理的假设,将本问题归结为一个预测分析的问题,其基本思想是通过聚类分析、 SPSS 软件求解、GM(1,1)灰色
2、预测模型、多元线性回归分析,组合模型等方法的运用得到最优的预测结果。针对问题一,我们首先运用了聚类分析的思想,建立了基于聚类分析的模型,通过聚类分析方法对给定的信息的筛欧阳美创编 2021.01.01欧阳美创编 2021.01.01选、加工、延伸和扩展,从而将评价对象确定在某一范围内,通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。针对问题二,本文选取受伤人数这一单项指标作为预测的对象,首先运用了 GM(1,1)灰色预测模型,建立模型,通过对给定的事故原始数据,通过 MATLAB 软件预测了五年内的交通事故受伤人数;运用多元线性回归方法建立模型,在模型和模型的基础之上,
3、通过基于组合模型思想的模型,求解得出了交通事故受伤人数在五年内的预测。关键词: SPSS 聚类分析 GM(1,1)灰色预测模型组合预测模型MATLAB目录目录一问题重述错误错误! !未定义书签。未定义书签。二问题的分析 3三模型假设与符号系统 53.1 模型假设 53.2 符号系统 6四模型的建立及求解 74.1 问题一 74.1.1 建立模型74.1.2 模型的求解及结果 74.1.3 实验结果的分析说明 84.2 问题二 114.2.1 建立 GM(1,1)模型114.2.2 用 MATLAB 求解模型184.2.3 建立模型194.2.4 建立优化模型204.2.5 最优组合模型的求解
4、21五模型的评价 22欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01参考文献 23附录 24一问题重述一问题重述随着道路交通事业的发展,高速公路交通事故也在不断增加,对人类的生命和财产安全构成了极大的威胁。我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。高速公路交通事故往往造成人员伤亡,车辆损毁、道路堵塞等严重后果,为探索高速公路道路交通事故发生的规律,分析现有道路交通条件下未来高速公路交通事故的发展趋
5、势,以便及早采取措施进行预防,减少事故发生次数及损失程度,必须进行高速公路交通事故预测。另外,高速公路道路交通事故分析预测是道路交通安全规划,决策及高速公路交通工程项目效益评价中的一个关键性问题,分析预测正确与否直接关系到高速公路交通设施的建设,高速公路交通管理政策的制定和高速公路交通建设资金的投资分配,具有重要的现实意义。为了解决此问题,现利用已收集到的 A 省高速公路交通事故数据(见附件)、建立针对该省具体情况的数学模型,预测该省未来的交通事故情况,解决下面几个问题:1、目前国内外用于统计道路交通事故状况的四项绝对指标为交通事故次数、死亡人数、受伤人数以及直接经济损失,这四项统计指标既是认
6、识交通事故的起点,又是构造其它交通事欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01故统计指标的基础,基本涵盖了道路交通事故所造成各种损害的主要方面,因此选用这四项指标,试探讨以聚类分析作为理论基础的高速公路公路交通事故统计分析方法,然后从附件中所给 A 省高速公路交通事故四项指标的历史统计数据出发,对该省公路交通事故进行聚类分析研究,以期该省获得该省高速公路交通事故基于四项指标的时间、空间分布规律。 2、高速公路交通事故预测是高速公路安全评价、规划及决策的基础,国内外关于道路交通事故的预测有多种方法,鉴于高速公路
7、交通事故具有复杂性、随机性和灰色性的基本特征,对高速公路公路交通事故预测时选用时间序列分析,灰色分析、神经网络等分析方法。根据高速公路交通事故的分布规律,构建高速公路交通事故发生次数、死亡人数、受伤人数、直接经济损失的预测模型。以 A 省公路交通事故的历史统计数据为基础,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对 A 省公路交通事故未来五年的发展趋势做出科学预测,为高速公路交通安全管理部门提前预防和控制交通事故提供决策依据。二问题的分析二问题的分析2.12.1(问题一)(问题一)本小问主要解决对该省公路交通事故四项指标进行的聚类分析
8、。此小问属于统计问题,因此由附件的相关数据信息,我欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01们首先将附件中高速公路事故 24 时分布、月统计、辖区统计进行整理,得出四项指标在六年中小时段、月份、辖区分布总量。本问题主要解决该省高速公路交通事故基于四项指标的时间、空间分布规律。本问题为聚类分析的思想,由题目可以知道对于 A 省高速公路交通事故分布规律需要分别对四项指标进行聚类分析,找出各个指标内的能够度量不同小时段、不同月份、不同辖区之间的相似度的统计量。并将其聚合到不同类中。因此,用 SPSS 的 K-mea
9、ns Cluster 过程即逐步聚类法,按照预定的分类数量,按照既定的原则选择凝聚点,得到一个初始分类方案,并计算出各个初始分类的中心位置(均值);最后,使用计算出的中心位置重新进行聚类,因此在该方法中,各指标的分类情况会在运算中不断改变,分类完毕后再次计算各类的中心位置。如此反复循环,直到凝聚点位置改变很小为止。2.22.2 (问题二)(问题二)由对题目的第二问分析,可知第二问分为两小问。第一小问:选用灰色分析、多元线性回归分析等分析方法构建高速公路交通事故受伤人数预测模型。交通事故作为一个随机事件,其本身具有相当大的偶然性和模糊性;具有明显的不确定性特征。因此可以认为一个地区的道路交通安全
10、系统是欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01一个灰色系统,可以应用灰色系统的理论进行研究。用 G(1,1)灰色建立受伤人数指标的预测模型,在 GM(1,1)模型及相关模型灰色预测过程中要大量进行数列和矩阵运算将 MATLAB 软件和GM(1,1)结合,实现灰色预测算法;建立多元线性回归模型。第二小问:本小问为优化问题,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对 A 省公路交通事故未来五年的发展趋势做出科学预测。对四项指标分别用灰色分析和多元线性
11、回归模型结果进行精确度比较,并且构建最优组合预测模型。利用以上两种不同的单项预测法对受伤人数指标进行预测,然后对各个单独的预测结果做适当的加权平均,最后取其加权平均值作为最终的预测结果。本文采用简单实用的求方差极小值法,获得组合预测模型。三模型假设与符号系统三模型假设与符号系统3.13.1 模型假设模型假设(1)假设在受伤人数统计时,以伤残等级三级以上归为受伤。(2)假设在财产损失统计时,所损失的物资、费用等均按现社会流通价值或社会人力服务成本的平均值进行统计。(3)根据其同一指标中的个体有较大的相似性,不同类中的个体差异较大,用聚类方法聚合时,将其聚合在 3 类中。(4)假设高速路上行驶的车
12、辆状况、驾驶员心理状态良好。欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.013.23.2 符号系统符号系统Xij表示第 i 个指标在第 j 年的给定值;x(0)(k)实际给定的第X(1)k 年的死亡人数:其中 k=1,2,6;的一次累加生成序列;(1)z为X的紧邻均值生成序列待定参数列;(1)B 为数据矩阵,为待估参数;Y 为数据向量;a为待定参数列;qk为生成残差;q为残值均值;s21为原始数据的方差;s22为残值的方差;C为后验差比值;P为小误差概率;f3为组合模型使用;f2为多元线性回归预测值;f1为灰色理论
13、预测值;2为多元线性回归预测的预测误差;1为灰色理论预测的预测误差;2多元线性回归的相应权系数;1灰色理论模型的相应权系数;欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01 MSPE 为均方百分比误差;四模型的建立及求解四模型的建立及求解4.14.1 问题一问题一4.1.14.1.1 建立模型建立模型聚类分析法是根据实物本身的特性来定量研究分析问题的一种统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是更具一批样品的多个观测指标,找出能够度量样品(或变量)之间相似度的统计量,并以此
14、为依据,采用聚类发将所有的样品(或变量)分别聚合到不同的类中。将 分 析 评 价 中 的n个 待 评 样 本 作 为 聚 类 对 象(Xi)(i=1,2,n);m 个;评价指标作为聚类指标( Uj)(j=1,2,m),s 个评价标准作为评价等级(Zk)(k=1,2,s).则根据第 i 个聚类独享对于第 j 个聚类指标的样本值 Xij,确定聚类样本矩阵为 X :以一年十二个月的数据分析为例:在对给定的原始收据通过 Excel 整理的基础上我们建立了针对交通事故每月的聚类分析模型。将分析评价中的 12 个待评样本作为聚类对象(Xi)(i=1,2,12);4 个;评价指标作为聚类指标(Uj)(j=1
15、,2,3,4),我们设定为三类分类标准,则聚类样本矩阵为:4.1.24.1.2 模型的求解及结果模型的求解及结果在建立了聚类分析的模型的基础上,我们采用了 SPSS 软件来对模型进行求解,SPSS 的优点是计算量较小,从而可以有效的处理多变量、大样本数据而不会占用过多的内存空间和计算欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01时间;同时在分析时用户可以人为地制定初始中心位置,或者将曾做过的聚类分析结果作为初始位置引入分析。通过计算得得出下面的实验数据结果:表 4.1 初始聚类中心聚类123次数45.0045.0
16、036.00死亡人数26.0035.0027.00受伤人数41.0050.0036.00经济损失 1012394.00 1263204.00738204.00表 4.2 最终聚类结果案例号月份聚类距离一月1二月2三月3四月4五月5六月6七月7八月8九月9十月10十一月11十二月12表 4.4 每个聚类中的案例数聚类17.00023有效缺失2.0003.00012.000.0001132112111332867.600114864.429180.0683051.50737387.57271712.4293051.50769137.57237496.430114680.57214556.00114
17、736.0014.1.34.1.3 实验结果的分析说明实验结果的分析说明(1)表 2.2 显示的是将样品分为三类的聚类结果,这三类分别是:一月、四月、十一月。(2)表 2.3 表示的是最终的聚类分析结果。欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01(3)表 2.4 反映了聚类分析中的有效样品数为 12 个,没有样品数的缺失。综上得出聚类分析的结论(三月、十一月、十二月)为交通事故最轻的,(一月、二月、五月、八月、九月、十月)为交通事故一般的,(四月、七月)为交通事故最为严重的。同理我们得出了一天中二十四小时以及
18、每个辖区的数据分析结果如下表所示:表 4.5 以辖区为单位的数据结果分析案例号 辖区123456789101112131415161718表 4.6最终聚类中心欧阳美创编 2021.01.01欧阳美创编 2021.01.01辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区辖区聚类323333323332333321距离128890.469344284.50596888.462214476.54039959.539201362.539234361.540150913.502258343.466233859.540112157.462100373.508149838.46228
19、6803.46266440.462175342.54092997.504.000欧阳美创编 2021.01.01欧阳美创编 2021.01.01聚类1137.00248.2527.2546.50316.3111.6218.38次数死亡人数 110.00受伤人数 176.00经济损失 4721128.00 1015373.50 238676.54得出分析结果:(1)表 2.6 显示将分类对象区域分为三个等级。(2)表 2.5(一区、三区、四区、五区、六区、七区、九区、十区、十一区、十三区、十四区、十五区、十六区)为所辖区范围内交通事故最轻的、(二区、八区、十二区、十七去)为辖区范围内交通事故一般
20、的区域、(十八区)是辖区范围内交通事故最为严重的。(3)表 2.5 显示有效数据位十八个,没有数据缺失。表 4.7 以小时为单位的最终聚类结果案例号1234567891011121314小时0-1 时1-2 时2-3 时3-4 时4-5 时5-6 时6-7 时7-8 时8-9 时9-10 时10-11 时11-12 时12-13 时13-14 时聚类11112211313333距离41531.12552677.12655879.87681456.12547286.00047286.00062299.87557623.12574947.072102944.876101939.07322358.9
21、294205.07489233.929欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.011516171819202122232414-15 时15-16 时16-17 时17-18 时18-19 时19-20 时20-21 时21-22 时22-23 时23-24 时333333333112656.07398614.07225122.92971976.92977094.929103017.92954255.929114598.07236102.07212162.875表 4.8 以小时为聚类对象的最终聚类中心聚类12
22、3事 故 次26.5033.0018.93数死 亡 人20.6323.5011.29数受 伤 人28.5031.0022.14数经 济 损 661234.88 892427.00 343619.93失分析可得,在对以小时为聚类对象的分析中:表 2.8 显示以小时为分类对象划分为三个等级。表2.7 显示在( 08:00-09:00 、 10:00-23:00 、 ) 为 交 通 事 故 发 生 最 轻 的 小 时 段(04:00-06:00)为交通事故发生程度最为严重的小时段;(00:00-04:00、06:00-08:00、09:00-10:00、23:00-24:00)为交通事故发生程度一般
23、的小时段。4.24.2 问题二问题二4.2.14.2.1 建立建立 GM(1,1)GM(1,1)模型模型交通事故作为一个随机事件,其本身具有相当大的偶然性和模糊性;如果把某地区的道路交通作为一个系统来看,则此系统中存在着一些确定因素 (灰色系统称为白色信息 ),如道路欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01状况、信号标志等;同时也存在一些不确定因素(灰色系统称为灰色信息),如车辆状况、气候因素、驾驶员心理状态等等,具有明显的不确定性特征。因此可以认为一个地区的道路交通安全系统是一个灰色系统,可以应用灰色系统
24、的理论进行研究。高速公路交通事故灰色预测的特点分析高速公路交通事故灰色预测的原理、方法及所具有的特点表现在:(1)灰色预测方法认为,某一地区在某一时间区间内的交通事故指标值,是在一定范围内变化的且与时间坐标有关的灰色量。该方法将原始数据整理成较有规律的生成数列后再进行研究、处理,避免了概率统计方法的大样本、大工作量而其结果不理想的状况。(2)数学模型 GM(1,1)是一阶单变量微分方程;这与以往的概率统计方法利用高散数据所建立的按时间作逐段分析、递推、高散的模型有本质的区别。(3)GM(1,1)灰色预测模型不是交通事故原始数学模型,而是生成数据序列模型;通过对生成数列的处理,使杂乱无章的原始数
25、据呈现出一定的规律性。 MATLAB 的基本数据单位是矩阵,其核心也是矩阵,它可直接进行矩阵的乘积、矩阵的乘方、矩阵的除法、稀疏矩阵等运掣”。在 MATLAB 语言系统中,几乎所有的操作都是以矩阵操作为基础,用户可以用类似于数学公式的方法编写程序实现算欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01法,大大降低了编程所需的难度并节省了时间。而在 GM(1,1)模型及相关模型的灰色预测过程中,要大量进行数列和矩阵运算嘲,这晗好使 MATLAB 派上了用场。将 MATLAB 和 GM(1,1)模型结合,实现灰色预测算法
26、,恰到好处。灰色预测模型 GM(1,1)的建立过程GM(1,1)的一般形式设 有 变 量 X(1)为某一预测对象的非负单调原始数据列,为建立灰色预测模 型 : 首 先 对 X(0)(0)(0) X(i) , i=1,2 , . , n进 行 一 次 累 加 (1AGO,AcumulatedGenerating Operator)生成一次累加序列:XX(k),k1,2,n(2)其中 X(k)X(i) (k=1,2,3n)i1(1)(1)(1)k(0)%作1AGO生成序列x1For i=1:nX1(i)=sum(x0(1:i);End对X可建立下述白化形式的微分方程:dX(1)dt(1)十aX(1
27、)u ,式中a,u是待定系数。 (3)灰微分方程动态模型为:欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01x0k azk u(4)11式中zk为x1k的紧邻均生成,即%紧邻均生成For k=2:n %紧邻均生成zz(k)=0.5*x1(k)+0.5*x1(k-1);end(2)构造矩阵B和数据向量Ynx和x满足关系Yn Ba,其中:01B=1(1)(1)2(X(1) X(2)11(1)(1)(X(2) X(3)12.1(1 )(1)(X(n -1) X(n)12TYn (X(2),X(3),(0)(0)X()(3
28、)计算系数a和ux02 z12101 x3 z31a (5)ux0n z1n1(0)Yn Ba可用(5)式表示,由此计算出系数a和u for i=1:n-1 b(i,1)=-z(i+1); y(i)=x0(i+1);end欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01 b(:,2)=1; y=y; %转置为列向量 au=by; % 作矩阵除法,计算a u(4) 累加模型预测结果X(1)(k)(X(1)ea(k1)(6)(1)(0)uaua%计算GM(1,1)模型XYc1(1)=x0(1);For k=1:n(k)
29、值C=x0(1)-au(2)/au(1);Yc1(k+1)=c*exp(-au(1)*k)+au(2)/au(1);End(5)还原后的预测结果(作 IAGO) (7)%计算xk 1值,显示预测结果Yc0(1)=x0(1);For k=1:nYc0(k+1)=yc1(k+1)-yc1(k);EndDisp(uint16(yc0(2:1:n+1);2、检验和判断GM(1,1)模型的精度为确保所建灰色模型有较高的精度能应用于预测实际,按灰色理论一般采用三种方法检验判断GM(1,1) 模型的精度 ,它们是,残差大小检验;关联度检验和后验差检验。通常关联度要大于0.6,残差Pk、方差c越小,模型精度P
30、越好。欧阳美创编 2021.01.01欧阳美创编 2021.01.010欧阳美创编 2021.01.01欧阳美创编 2021.01.01(1)残差检验0残差检验:e(k)=xk xk0ek相对误差:x0k(2)关联度检验因分辨系数毛是在 (0,1)中取定的实数,一般取=0.5。关联度是各关联系数 (k)累加后在n维空间的平均值。当分辨系数=0.5,认为关联度大于 0.6时可以接受,即通过关联度检验,否则关联程度差些。计算关联度Max1=max(abs(e0);r=1;for k=2:nr=r+0.5*max1/(abs(e0(k)+0.5*max1);endr=r/n; % r 表示关联度(2
31、)方差比和小误差概率检验方差和小误差概率检验属后验差检验,计算公式分别如下:1n预测误差均值e eini1x0原始数据均值1n0 xini1欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01原始数据标准差:S110 xi xni1n021nS e i e预测数据标准差2ni12S2方差比:C S1小误差概率:P p eke 0.6745S1表 4.9 P、C 预测精度表精度等级精度等级PC一一0.950.80.70.95&c0.8&0.7&0.65Disp( 预测勉强合格); elseDisp( 预测不合格);End
32、欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01EndEnd4.2.24.2.2 用用 MATLABMATLAB 求解模型求解模型根据题目给定四项指标要求,我们选择采用灰色预测模型来预测交通事故受伤人数,其中交通事故死亡人数在2006 年到2011 年的数据如下表 2 所示:4.10 为 2006 年到 2011 年交事故受伤人数年份2006死亡人数738200769520086602009563201050420114312006-2011 年的 A 省高速道路事故受伤人数的原始序列为:由此可得生成数列为:其数据
33、矩阵 B 为:在 MATLAB 中计算可得:数据向量为:可得待定参数列为:则预测模型为:最后需要进行还原处理,作“生成数列”的逆运算,即进行还原处理得到交通事故受伤人数的预测模型。因为011 k 1,k 1,2,nXk Xk X所以利用 MATLAB 软件得出X1(k)和X0(k)的取值:表 4.11 GM(1,1)预测模型计算一览表年份年份k k20062006200720071200820082200920093201020104201120115欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01X1k73814
34、50.7712.126952012201263983.82083.8633.116602013201374334350.18387.3192642.6562.45632014201484625311.07433.5233145.8499.585042015201594921.4276.32304.6753589.6443.7843120162016105166.8245.46270.244X0k即即预测序列预测序列原始值原始值738预测值预测值年份年份k kX1kX0k即即 预预 测测394.21序列序列原始值原始值预测值预测值436.701MATLAB 软件的出预测分析图,如下表所示:图 4
35、.1 MATLAB 预测分析图残差检验和后验差检验,其结果为:方差比 C=0.4350.95好上述结果说明建立的灰色预测模型通过检验,且模型的精度为 I 级,精度好。(参照表 1)4.2.34.2.3 建立模型建立模型多元线性回归模型可以用于预测对象 Y 受多个因素X1, X2,X3,XP影响的情况。P 元线性回归模型:用最小二乘估计法求未知参数0,1,p的最小二乘估计。记Q Q0,1,Pyi01xi1pxip2 Q 2yi01xi1pxip 00j 1,2,3, p令Q 2yi01xi1pxip 0,j欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01
36、.01欧阳美创编 2021.01.01整理的正规方程组(3):n0 xi11xippyi2xi10 xi11xi1xippxi1yi(3)22xip0 xipxippxipyi1其解记为0,1, ,p,即为0,1, ,p的最小二乘估计。从而 P 元线性回归方程(4):4.2.44.2.4 建立优化模型建立优化模型基于以上两种预测模型建立优化组合模型组合预测就是利用以上两种不同的单项预测法对同一预测对象进行预测,然后对各个单独的预测结果做适当的加权平均,最后取其加权平均值作为最终的预测结果。目前关于权系数的计算方法很多,主要分为主观赋值法、客观赋值法、试算比较法,客观赋值法就是根据一定的理论或标
37、准通过代数计算等确定权值,例如误差绝对值之加权和最小法、误差平方和最小法、方差极小值法等,本文采用求方差极小值法,该方法简单实用,掌握起来也不难。设f1是灰色 GM(1,1)的预测值,f2是多元回归预测值,f3是最优组合预测值,预测误差分别为1,2,3,取1和是相应权2系数,且121,有f31f12f2则误差及方差 D 分别为关于对D(3)求极小值,可得11D(2)cov(1,2)D(1) D(2)2cov(1,2)欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01显然可取,cov(1,2) 0,记D(1) 1,D(
38、2) 2,则组合模型的权系数分别为:1112,2212,由此我们可得最优组合预测模型。4.2.54.2.5 最优组合模型的求解最优组合模型的求解二元回归模型的自变量取x1,x2分别为序号和交通事故次数,通过计算,它的预测模型为y71.3623.75x11.53x2GM(1.1)模型中的辨识算式0.11844,843.16。预测结果如表 4.12表 4.12 两种预测模型的受伤人数预测结果年份200620072008200920102011两种预测模型的受伤人数预测结果单位:人实际受伤人GM(1,1)灰色误差(%)二元回归模数预测型预测7387380729.28695712.722.463%68
39、6.33660633.11-4.074%673.25563562.400.106%583.29504499.58-0.877%511.42431443.782.965%416.92误差(%)-1.220%-1.247%2.007%3.603%1.389%-3.267%根据最优组合方法计算:灰色模型的权重系数:4584.671 69.38%4584.67 2023.39二元线性回归模型权重系数:2023.392 30.62%4584.672023.39所以组合预测模型为式:得组合模型的预测结果,与其他两种预测模型结果做比较年份实际受三种预测模型的预测结果单位:人GM(1,1)误差二元回误差组合模
40、误差欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01伤人数200620072008200920102011738695660563504431灰色预测738712.72633.11562.40499.58443.78(%)02.463%-4.074%0.106%-0.877%2.965%归模型预测729.28686.33673.25583.29511.42416.92(%)-1.220%-1.247%2.007%3.603%1.389%-3.267%型预测735.32704.64645.40568.80503.21
41、435.56(%)-0.363%1.387%2.212%1.030%0.157%1.058%我们采用如下的均方百分比误差来检验组合模型:其中:MSPE 是均方百分比误差,yt是实际值,yt是预测值。通过计算可得:二元回归模型预测的均方百分比误差为1.14290%,GM(1,1)灰色模型的均方百分比误差为1.13552%,组合预测的均方百分比误差为 0. 60509%。根据组合模型可预测出 2012-2016 年某高速公路因交通事故的受伤人数。如下表:2012-2016 年某高速公路因交通事故的受伤人数2012201320142015年份351310276组合预测值3912016244五模型的评
42、价五模型的评价优点:(3)聚类分析 K-means 模型对给定的信息的筛选、加工、延伸和扩展,从而将评价对象确定在某一范围内,通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。(4)聚类分析 K-means 模型与 SPSS 统计软件结合简单方便且实用。(3)从前面对组合模型的百分比误差分析中可以看出:二元线性回归模型预测的预测精度相对比较低,模型预测精度相对较好,组合预测模型的预测精度大于任一单项预测模型,它避免了单项预测模型的片面性,综合利用各种预测提供的信息,具有更好的预测效果。(4)建立了二元回归预测与灰色预测组合的预测模型,研究了其在交通事故四项指标中受伤人数预
43、测的应用,并得出了好的结论,为交通事故四项指标的预测提供了一种新的,可靠的方欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01法。(5)对于灰信息处理技术与多元线性回归模型融合得到有机组合体。实现功能互补,能够使预测数据精度大大提高。用灰色系统理论的思想、方法对原始数据进行处理,很大程度上改善了统计模型性能。与多元线性规划模型进行组合,深化对系统演化规律的认识。缺点:(1)聚类分析 K-means 模型的算法中 K 是事先给定的,这个K 值的选定是非常难以估计的。(2)从 K-means 算法框架可以看出,该算法需要
44、不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,需要与 SPSS 等统计软件作辅助工作。(3)组合模型计算量相对于单项预测模型较大。参考文献参考文献1邓聚龙.灰色系统基本方法M.武汉:华中理工大学出版社,19962李云贵等.灰色GM(1,1)预测模型的改进J.系统工程,1992(6):42433何能,鲍一丹.灰色马尔可夫预测模型及其应用J系统工程理论及实践,1992(4):22244肖新平等灰色系统分析理论及其应用M大连:大连海事大学出版社,19975吴维扬.经济预测及案例分析M北京:中国经济出版社,19956庄楚强,吴亚森.应用数理统计基础(第二版)M.广州:
45、华南理工大学出版社, 2003, 12.7马骥, 张卫峰.组合预测方法在磷肥需求预测中的应用J.统计与决策, 2005, (6):欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.018 周爱民.基于偏最小二乘法的情报组合预测法J.统计与决策,2004, 176(8):9 江西省统计局编.江西统计年鉴2005M.北京: 中国统计出版社,2005.10 杨明媚,李华林.主成分分析在证券组合投资中的应用J.统计与信息论坛, 2004,11姚祖康.道路与交通工程系统分析.北京:人民交通出版社,199612邓聚龙.灰色控制系统.
46、武汉:华中工学院出版社,198513Bates,J.M.and Granger,C.W.J.combination of Forecast,Operations Research Quarterly,20(4),1969,451-46814国家统计局编.中国统计年鉴.北京:中国统计出版社,200415牛东晓,陈志业,谢宏.组合灰色神经网络模型及其季节性负荷预测.华北电力大学学报,2000,27(4):1-616王应明,傅国伟.基于不同误差准则和范数的组合预测方法研究J.控制决策, 1994附录附录附表一:原始数据的处理附表一:原始数据的处理月份的原始数据:月份一月二月三月四月五月六月次数454
47、140454649死亡人数262722353032受伤人数415143505760经济损失1012394113012675258012632049778741086974欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01七月八月九月十月十一月十二月55535141364136374026273158615543364612571019461241052758900581738204767496年份的原始数据处理:辖区辖区一辖区二辖区三辖区四辖区五辖区六辖区七辖区八辖区九辖区十辖区十一辖区十二辖区十三辖区十四辖区十五辖
48、区十六辖区十七辖区十八次数3576171178027442966253713424137死亡人数2155131810028302115231811321110受伤人数58902111580395411118272315539176经济损失3675671359658335565242001987173731443158644604970204817350834915000388515525480305117633349223764721128小时的原始数据处理:小时0-1 时次数死亡人数受伤人数经济损失70276625 22 30 31 27 30713912241821605355312534
49、7426913426328451413221309397132618265989352720317188582313264185672112305582902618354455591782432126117926347825148162543862112273562762413304422341-2 时2-3 时3-4 时4-5 时5-6 时6-7 时7-8 时8-9 时9-10 时10-11 时11-12 时12-13 时13-14 时14-15 时15-16 时欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.01欧阳美创编 2021.01.011
50、6-17 时17-18 时18-19 时19-20 时20-21 时21-22 时22-23 时23-24 时2219161615161927111191191115232429161416121526318497271643266525240602289364458218379722649072每一年的数据处理:项目200620072008200920102011次数数量800665611417382377死亡人数数量389380415383333307受伤人数数量738695660563504431财产损失数量1535933215005740130234488731845984236193