基于灰色关联分析的LS.pdf

上传人:qwe****56 文档编号:69629031 上传时间:2023-01-07 格式:PDF 页数:6 大小:339.56KB
返回 下载 相关 举报
基于灰色关联分析的LS.pdf_第1页
第1页 / 共6页
基于灰色关联分析的LS.pdf_第2页
第2页 / 共6页
点击查看更多>>
资源描述

《基于灰色关联分析的LS.pdf》由会员分享,可在线阅读,更多相关《基于灰色关联分析的LS.pdf(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、书书书第 卷第期铁道学报 年月 文章编号:()基于灰色关联分析的 铁路货运量预测耿立艳,张天伟,赵鹏(石家庄铁道大学经济管理学院,河北 石家庄 ;石家庄铁道大学 交通运输学院,河北 石家庄 ;河北科技师范学院 欧美学院,河北 秦皇岛 )摘要:为提高对铁路货运量的预测精度及建模速度,在分析货运量影响因素基础上,提出基于灰色关联分析的 铁路货运量预测方法。将货运量影响因素分为社会需求与铁路供给两方面因素,采用灰色关联分析法对两方面因素与货运量进行相关性分析,根据灰色关联度值,结合定性分析筛选 输入变量,简化 结构,再通过随机权重粒子群()算法优化选择 模型参数。通过对我国 年铁路货运量实例分析表明

2、:该方法具有较快的收敛速度和较高的预测精度。关键词:铁路货运量;预测;灰色关联分析;最小二乘支持向量机中图分类号:文献标志码:,(,;,;,):,():;铁路运输系统是一个受多种因素共同作用的复杂动态系统,具有的不确定性、随机性和模糊性导致铁路货运量预测的复杂性。铁路货运量不仅受国民经济因素,如国民经济发展水平、工业发展规模等影响,还受经济结构因素,如产业结构比重、工业结构等影响,收稿日期:;修回日期:基金项目:河北省交通运输厅科技计划项目();国家软科学研究计划项目();教 育 部 人 文 社 会 科 学 研 究 青 年 基 金 项 目()作者简价:耿立艳(),女,天津人,讲师,博士研究生。

3、:同时与自身供给因素,如日开行货物列车对数、列车牵引质量等有关。各因素对铁路货运量影响程度不同且随时间发生变化,这种错综复杂的内在关系决定铁路货运量与影响因素之间存在复杂的非线性关系,难以用精确的数学模型描述。传统的回归预测模型和时间序列预测模型通常以数学理论和假设为基础,通过演绎推理建立数学模型,很难全面、本质地揭示动态数据的内在结构和复杂特性。神经网络作为一种非线性非参数模型,能够较好地解释铁路货运量与影响因素之间的复杂非线性关系,具有的自学习、自适应能力可有效降低因假定有误而引起的预测误差,因而被引入到铁路货运量预测中。由于神经网路本身固有的缺陷,在实际应用中经常遇到过拟合、局部极小值和

4、“维数灾难”等问题。支持向量机()以统计学理论为基础,遵循结构风险最小化原则,综合考虑经验风险和置信风险,适用于小样本、非线性、高维数、局部极小等问题,在有限数据样本情况下,可以较好地描述铁路货运量与影响因素之间的非线性关系,在铁路货运量预测中取得较好效果。最小二乘支持向量机()是对标准 的改进,以正则化理论为基础,将标准 中求解二次规划问题转化为求解线性方程组,提高收敛速度,因而适合于预测铁路货运量这种复杂系统。但 的性能依赖于参数的选择,合理确定最优参数是提高 性能的关键。由于影响铁路货运量的因素较多,若全面考虑所有影响因素,模型输入变量过多,势必导致模型结构复杂,学习速度下降,最终影响推

5、广应用。为降低建模复杂程度,文献 和 从不同角度分别选取项和项不同主要影响因素作为铁路货运量预测模型的输入变量。这种仅依靠定性分析确定模型输入变量的方法不仅缺乏理论依据,而且可靠性不高。灰色关联分析作为一种系统分析方法,用于定量研究系统内多因素之间复杂的相互作用、相互影响,是各因素发展态势的量化比较,具有数理统计方法(回归分析、方差分析、主成分分析)不可比拟的优点,在变量筛选方面得到了应用。基本原理 灰色关联分析灰色关联分析是灰色系统理论的主要分析方法之一,其基本原理是通过数据序列曲线发展态势(几何形状)的相似程度来判断序列联系是否紧密,其紧密程度用关联度量化,曲线越接近,相应序列之间的关联度

6、越大,反之就越小。灰色关联分析过程如下:设系统特征序列为(,),并且存在个相关因素序列,第个相关因素序列为(,),。利用初值化算子对系统特征序列和相关因素序列进行初始化,得到初值像分别为(,)和(,),。求出与的关联系数()()式中:,为分辨系数,一般取。计算与的关联度()式中:(,越大,表明对的作用越大,若,那么因素优于因素。因此,由关联度可导出各相关因素序列对系统特征行为序列关联程度的相对次序,即关联序。最小二乘支持向量机设训练样本集(,珋),其中,为维输入变量,;珋为一维输出变量,珋。通过某一非线性映射函数()将输入数据映射到高维特征空间,在此高维特征空间中构造最优决策函数,并通过结构风

7、险最小化原则构造下列优化模型:,(,)珋(),式中:为权重矩阵;为误差变量,;为调整参数;为偏差值。通过建立 函数,将优化模型转化为求解下列线性方程组:熿燀燄燅珔()式 中:,为 拉 格 朗 日 乘 子;珔珋,珋;,()()(,),;为单位矩阵。由此,得到 回归函数:珋,(,)()式中:(,)为满足 条件的核函数。铁路货运量影响因素的灰色关联分析选取 年全国铁路货运量()为系统特征行为序列,并选取同时段铁路货运量影响因素(,)为相关因素序列,进行灰色关联分析。影响铁路货运量的因素复杂而广泛,除国家政治体制及宏观调控政策等难以定量化因素外,可以分为社会需求和铁路供给两方面。社会需求因素主要指铁路

8、系统外部与国民经济总量、产业结构比重、能源冶金工业规模等有关的指标。综合现有相关文献,初步选铁道学报第 卷取 项指标:国内生产总值()、第一产业生产总值()、第二产业生产总值()、全国煤炭产量()、全国钢铁产量()、全国原油产量()、全国粮食产量()、公路货运量()、等级公路里程比重()、水路货运量()、固定资产投资总额()、货物进出口总额()。社会需求能否实现及实现程度取决于铁路供给。铁路货运量供给因素主要指铁路系统内部自身限制性因素,这里初步选取项指标:铁路营业里程(),铁路电气化里程(),复线里程比重(),铁路货车拥有量(),铁路从业人员数量()、货车平均静载重()、列车平均编成辆数()

9、、货物列车开行对数()。因此,本文初步选取上述 项指标(,)作为相关因素序列进行灰色关联分析。铁路货运量及影响因素的数量级别差异较大,先通过灰色序列算子对数据序列进行适当预处理,将其转化为数量级别大体相近的无量纲数据。这里选择初值化算子进行数据预处理,分别得到铁路货运量及其影响因素初值像,如和(,)。然后根据式()和式()计算铁路货运量()与各影响因素()之间的关联度,并在此基础上导出灰色关联序。计算关联度及关联序时,需确定分辩系数。取为,分别计算关联度及关联序。结果表明,值的变化仅改变关联度数值大小,不改变关联序,故选取 。铁路货运量及其影响因素灰色关联分析结果见表、表。表社会需求因素的灰色

10、关联分析结果关联度关联序关联度关联序 货物进出口总额 水路货运量 固定资产投资总额 公路货运量 国内生产总值 等级公路里程比重 第二产业生产总值 全国煤炭产量 第一产业生产总值 全国粮食产量 全国钢铁产量 全国原油产量由表可知,在社会需求因素中,货物进出口总额和固定资产投资总额两项指标变化趋势与铁路货运量变化趋势相似度较小,将其剔出。剩余指标的变化趋势与铁路货运量变化趋势相似度较大,说明与铁路货运量发展变化态势联系比较紧密。根据灰色关联度值和指标本身对铁路货运量的影响将剩余指标分为个子类,结果见表。表社会需求因素的子类划分结果子类划分社会需求因素第子类国内生产总值、第一产业生产总值、第二产业生

11、产总值第子类全国钢铁产量第子类全国煤炭产量、全国原油产量、全国粮食产量第子类公路货运量、等级公路里程比重、水路货运量表中,第子类为影响铁路货运量的国民经济规模及结构类指标;第、第子类为影响铁路货运量的运输品类指标,分为个子类,主要是因为全国钢铁产量关联度明显小于其他项指标;第子类为影响铁路货运量的其他交通运输方式相关指标。然后从各子类中分别选取代表性指标作为铁路货运量的主要影响因素。第子类中选取第二产业生产总值作为主要影响因素,这是由于该因素包括工业与建筑业生产总值,而工业及建筑业产品为铁路货运的主要品类之一。第子类选取全国煤炭产量作为主要影响因素,因为煤炭运量在铁路运输的货物中占有绝对比重。

12、第子类中与铁路货运存在竞争关系主要为公路货运,其他因素影响不大,选取公路货运量作为主要影响因素。综上分析,最终选取第二产业生产总值、全国煤炭产量、全国钢铁产量、公路货运量作为影响铁路货物运输的社会需求指标。表铁路供给因素的灰色关联分析结果关联度关联序关联度关联序 铁路电气化里程 铁路营业里程 货物列车开行对数 复线里程比重 铁路从业人员数量 列车平均编成辆数 货车平均静载重 铁路货车拥有量表给出铁路货运量供给因素灰色关联分析结果。对供给因素分析与社会需求因素不同,不再进行子类划分,通过分析直接给出影响铁路货运供给因素。铁路营业里程、电气化里程、复线里程比重均属于基础设施范畴,与铁路货运量具有正

13、相关关系,但同样指标数值,铁路线路经过地区的经济状况不同,货运办理站数量不同,则会产生不同货运量,故很难将该项指标与铁路货运量之间建立明确的函数关系。铁路从业人员数量是为保证计划顺利实施而配备的职工数量,一般情况下,数量越多,越能保证计划实现。但随着科学技术发展,各种管理系统运用于生产运输中,从业人员数量对货运量变化不再起着决定作用,年以后与铁路货运量关联度呈下降趋势也从侧面得到证明。铁路货车拥有量对货运量有直接影响,关联度最高,说明第期基于灰色关联分析的 铁路货运量预测货车数量变化趋势与铁路货运量变化趋势极为相近,但即使货车拥有量相同,若车辆标记载重不同,最终货运量也不同。故与该指标相比,货

14、车平均静载重对货运量的影响更为紧密。在货车平均静载重确定后,列车平均编成辆数便成为影响铁路货运量的另一重要因素。这两项因素决定了列货物列车所能运输的货物量,货物列车开行数量就成为决定一定时期内实现货运量的重要因素。另外,随着我国高速铁路或客运专线投入运营,既有线路将开行更多的货物列车,将呈现货运量快速增长的态势。根据上述分析,最终选取货车平均静载重、列车平均编成辆数、货物列车开行对数作为影响铁路货运供给指标。基于 的铁路货运量预测 铁路货运量的 模型利用 描述铁路货运量与其影响因素之间的非线性关系。基于上述灰色关联分析结果,输入变量为项影响因素组成的向量(,),;输出变量为铁路货运量。预测精度

15、主要取决于核函数的构造及参数的选取,可选择的核函数有:线性函数、多项式函数、函数、函数等。本研究选取泛化能力较强的 函数作为核函数,则铁路货运量的 模型形式如下:()()式中,为核函数的宽度。综合式()式(),需确定的参数为和。这两个参数及其相互作用对 的性能有重要影响。能够有效平衡模型的复杂度与误差精度,越大,的拟合程度越好,但泛化能力降低;决定数据样本的分布特性,越大,数据样本的分布范围越大,越容易产生欠拟合现象。目前普遍采用交叉验证法确定 参数,但交叉验证法存在人为选择的随机性、计算工作量大、费时等,很难得到最优解。为获得较好的预测性能,有 必 要 对 参数和进行优化选择。优化选择模型参

16、数粒子群算法()是一种随机全局优化算法,通过对随机粒子群的迭代运算寻找最优解,根据各粒子的适应度值确定粒子经过的个体最优位置和全局最优位置。惯性权重是控制 算法行为和性能的关键参数,随机惯性权重粒子群算法()的惯性权重为服从某种随机分布的随机数,能够在一定程度上提高收敛速度和求解精度。为此,本文采用 算法选择 参数和,具体步骤如下:数据预处理。将数据样本归一化到,区间,然后将其分成两部分:前 组数据作为训练样本集,后组数据作为验证样本集。初始化粒子群。群体规模取,两个学习因子都取,最大、最小惯性权重分别取 和,最大迭代次数取。随机产生一组参数(,)作为粒子的初始位置和速度。定义适应度函数。采用

17、适应度函数指导最优参数的搜索,从训练样本集(共组数据)中选出组数据形成训练样本子集建立并训练 模型,中其他数据作为检验样本子集检验模型。适应度函数定义如下:()()()式中:第和第部分分别为 的训练误差和检验误差;和()分别为第组训练样本的实际值和预测值;和()分别为第组检验样本的实际值和预测值。通过式()可有效平衡 的经验误差与检验误差。更新粒子最优位置。取(),按式()计算各粒子的适应度值,更新粒子的个体最优位置为最优适应度值所对应的位置,更新粒子的全局最优位置为所有粒子最优适应度值所对应的位置,惯性权重按下式自动更新:(,)()()式中:、分别为的平均值和方差;(,)为服从标准正态分布的

18、随机数;为,之间的随机数。判断终止条件。若所有粒子的迭代次数满足要求,则停止计算,此时全局最优位置即为 最优参数和;否则转 。建立 预测模型。利用最优参数计算出和后,建立铁路货运量的 模型,最后将计算出的预测结果反归一化为实际预测值。结果分析与比较通过 算法优化选择应用灰色关联分析确定输入变量后的 参数,仿真 次获得的最优参数和,用于建立 模型并预测 年铁路货运量。同时将铁路货运量的全铁道学报第 卷部 项影响因素直接作为 输入变量,并利用 算法仿真 次优化选择 参数。分别以 和 表示应用灰色关联分析确定输入变量前、后的模型,两模型的预测结果见表和图。表确定输入变量前、后 预测结果比较年份实际货

19、运量万 预测值万相对误差预测值万相对误差 VolumesLS-SVMGCA-LS-SVM242628303234铁路货运量/亿 t样本个数123456图 1确定输入变量前、后 LSSVM 预测值由表可知,在预测期内,的最大相对预测误差为 ,最小相对预测误差为 ;的最大相对预测误差为 ,最小相对预测误差仅为 ;图也显示 的预测结果更接近于实际铁路货运量。的预测性能评价指标 和 明显小于 的对应值,说明通过灰色关联分析确定输入变量能够提高 预测性能。此外,建模及训练时间约为,少于 的。这表明灰色关联分析可以较准确地指导 输入变量的选择,在提高预测精度的同时,简化了模型结构,加快了建模速度。为比较本

20、文方法的有效性,将文献 和文献选取的影响因素作为输入变量,分别建立铁路货运量的 预测模型,预测结果与本文方法比较见表和图,其中 以文献 选取的指标作为输入变量;以文献 选取的指标作为输入变量。表不同输入变量 预测结果比较年份实际货运量万 预测值万相对误差预测值万相对误差预测值万相对误差 242628303234铁路货运量/亿 t样本个数123456图 2不同输入变量的 LSSVM 预测值VolumesLS-SVM2GCA-LS-SVMLS-SVM4由表可知,的预测相对误差明显小于 和 的对应值,其 和 在三模型中也是最小的。图中 的预测值明显比 和 更接近于铁路实际货运量。因此,从提高预测精度

21、角度出发,将定量计算(灰色关联分析)与定性分析相结合选择铁路货运量影响因素在一定程度上较单一定性分析合理,是一种选取模型输入变量的有效方法。结论本文基于灰色关联分析与 模型提出预测铁路货运量的方法,利用灰色关联分析结合定性分析选择铁路货运量主要影响因素,作为 的输入变量,并通过 算法对参数进行优化选择。实例表明:基于灰色关联分析确定 输入变量合理可行,有效减少 输入变量数目,简化 结构,加快建模速度,在一定程度上提高铁路货运量预测精度。该方法提供一种有效简化模型结构的途径,具有一定应用价值。第期基于灰色关联分析的 铁路货运量预测参考文献:匡敏,胡思继,邢培昱,等基于国民经济大系统下的铁路货物运

22、输量预测方法的研究北方交通大学学报:社会科学版,():,:,():赵闯,刘凯,李电生基于广义回归神经网络的货运量预测 铁道学报,():,():刘志杰,季令,叶玉玲,等基于径向基神经网络的铁路货运量预测铁道学报,():,():郭玉华,陈治亚,冯芬玲,等 基于经济周期的铁路货运量神经网络预测研究铁道学报,():,():,():赵闯,刘凯,李电生支持向量机在货运量预测中的应用研究铁道学报,():,():王治 基于遗传算法支持向量机的铁路货运量预测 计算机仿真,():,():,():王伟,吴敏,雷琪,等 炼焦生产过程综合生产指标的改进神经网络预测方法控制理论与应用,():,():苏博,刘鲁,杨方廷基于灰色关联分析的神经网络模型系统工程理论与实践,():,():刘思峰,谢乃明灰色系统理论及其应用第版北京:科学出版社,胡建秀,曾建潮具有随机惯性权重的 算法计算机仿真,():,():(责任编辑刘梅林陶丽)铁道学报第 卷

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁