《2022年遗传算法优化回声状态网络的网络流量预测_田中大 .pdf》由会员分享,可在线阅读,更多相关《2022年遗传算法优化回声状态网络的网络流量预测_田中大 .pdf(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计 算 机 研 究 与 发 展 :?():,收稿日期:;修回日期:基金项目:国家自然科学基金重点项目();辽宁省博士科研启动基金项目()遗传算法优化回声状态网络的网络流量预测田中大高宪文李树江王艳红(沈阳工业大学信息科学与工程学院 沈阳 )(东北大学信息科学与工程学院 沈阳 )(),(,)(,),(),(),(),;();()摘要网络流量预测是网络拥塞控制与网络管理的一个重要问题网络流量时间序列具有时变、非线性特征,导致传统时间序列预测方法预测精度比较低,无法建立精确的预测模型回声状态网络(,)在非线性混沌系统预测与建模方面有着良好的性能,非常适合网络流量的预测为了提高网络流量的预测精度,提出
2、一种基于遗传算法(,)优化回声状态网络的网络流量非线性预测方法首先利用回声状态网络对网络流量进行预测;然后利用遗传算法对回声状态网络预测模型中的储备池参数进行优化,提高预测模型的预测精度通过中国联合网络通信公司辽宁分公司采集的实际网络流量数据进行了仿真验证与差分自回归滑动平均模型(名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 9 页 -,)、神 经 网 络 以 及 最 小 二 乘 支 持 向 量 机(,)这 种常见预测模型进行了对比,仿真结果表明提出的方法具有更高的预测精度与更小的预测误差,更能刻画网络流量复杂的变化特点关键词网络流量;非线性;预测;遗传算法;回声状态网络中图法
3、分类号 网络流量是目前网络管理的一个重要参数,在设计网络的拥塞控制策略时,网络 流量的准确预测是非常重要的,通过网络流量预测可使网络管理者在网络性能恶劣之前采取有效的措施避免网络拥塞或者网络崩溃很多学者将网络流量看作线性模型,分别采用自回归 滑 动 平 均(,)模型 、差分自回归滑动平均(,)模型 、差分自回归求和滑动平均模型 (,)等线性模型进行预测文献 针对以上各个模型,研究了各个模型在不同时间尺度下的预测精度,通过仿真指出每个模型适应的时间尺度,但是随 着网络复杂度的增加,网络流量特性已经超 出 传 统 意义上认为的泊松或者 分 布 了,因 此 利 用 线 性 模 型 进 行 预测存在理
4、论上的不足,很难保证预测的精确性 而非线性模型的预测主要包括支持向 量机 (,)、最 小 二 乘 支 持 向 量 机(,)、人工神经网络 以及灰色模型 等,虽然非线性模型的预测精度较线性模型有了一定程度的提高,但是神经网络容易陷入局部最小点,网络结构难以确定 支持向量机虽然需要样本数小,但是其关键参数很难确定而灰色模型只 适 合 数 据 变化不是剧烈的情况下,因此网络流量的 精 确 预 测 目前依然是一个亟待解决的问题由 和 在 年 所 提 出 的 回 声状态网络(,)是一种新型的递归神经网络,在非线 性 混 沌 系 统 预测建模方面与传统的递归神经网络相比有了较大改进)通过预设 网络内部连接
5、权值矩阵 的 谱半径来保证储备池内部递归网络的稳定性;)利 用线性回归算法训练唯一要求计算的输出权值学 习算法本身属于凸优化,因此避免了陷入局部极小值的问题 回声状态网络一经提出便成为学术界的研究热点,并应用到各种不同领域,尤其是时间序列的预测问题 本文首先对网络流量时间序列进行自相似性分析,确定网络流量时间序列的非线性特点 在此基础上,针对具有非线性特点的网络流量的预测问题,提出一种利用回 声 状 态 网 络 进 行 网 络 流 量 预 测 的 方法,同时为了解决储备池参数影响回声状态网络预测精度 的问题,利用遗传算法(,)进行储备池参数的优化 对中国联合网络通信公司辽宁分公司的接入网某路由
6、器的实际网络流量数据进行了仿真,仿真结果对比表明本文的方法具有较高的预测精度网络流量的自相似性分析 年 等人 指出网络流量具有自相似特征,相似性可用 指数 来衡量 当 时说明网络流量序列是随机游动的,事件之 间不相关;当 ,)时说明序列是反持久性的;当(,)时 表 示 序 列 是 持 久 性 的,也 即 具 有自相 似 性,越 大 则 序 列 的 自 相 似 性 越 大因 此 指数越大说明网络的自相似(长相关)也即非线性程度越 高。目 前 典 型 的 指 数 计算方法为?类分析方法(),其方法可描述为(?),()其中,为样本个数;为重新标度的极差,也即 (,),;为 标 准 差;为 指 数;为
7、 一 常 数作 出(?)关 于 的关系图,利 用 最 小 二 乘 法 求 取 数 据 点 斜 率 即 指数 本文仿真中对网络流量序列进行了自相似性分析,可知网络流量具有强非线性的特点回声状态网络回声状态网络将网络隐层设计成一个具有很多神经元组成的稀疏网络,通过调整网络内部权值的特性达 到 记 忆 数 据 的 功 能 其 内 部 的 动 态 储 备 池(,)包含了大量稀疏连接的神计算机研究与发展 ,()名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 9 页 -经元,蕴含系统的运行状态,并 具 有短期记忆功能,而非线性系统的动态特性即由 产生图为 网络结构图:图 网络结构 学习算法设
8、系统具有 个 输 入 单 元、个 内 部 处 理 单元,同时 具 有个 输 出 单 元输 入 单 元、内 部 状 态、输出单元在时刻的值分别为()(),(),(),()(),(),(),()()(),(),()与传统神经网络相比,的隐层由较多神经元构成的循环网络形成动态储备池为使 内部具有动态记 忆 能 力,权 值通 常 保 持 连 接 度 为,谱半径(,)小于训练样本通过 完成对内部单元的连接并实现训练数据的 采 集,使 记 忆 相 应 的 信 息,通 过 状态向量与目标输出的线性回归过程最小化平均误差得到 ,的学习步骤为()()(),()()(),(),()其中,分别为 内部神经元、输出层
9、神经元激活函数;,分别为输入层到储备池的 阶、储备池的 阶、储 备 池 到 输 出 层的()阶、输出层反馈到储备池的 连接权值矩阵 权值计算利用网络实际输出(),逼近期望输出():()()()()也就是希望计算权值矩阵满足系统均方误差最小,即求解如下目标:()(),()进而可归结形式为:(),()其中,为 输 入(),(),(),构成的()的矩阵;为输出()构成的()的列矩阵 储备池的关键参数 的性能由储备池的 个参数决定,简要介绍储备池的个参数:)储备池内部连 接 权 谱 半 径其 为 连 接 权矩阵的 绝 对 值 最 大 的 特 征 值,记 为 ,是保证网络稳定的必要条件)储备 池 规 模
10、 其 为 储 备 池 中 神 经 元 的 个数,储备池的规模选择与样本个数有关,对网络性能影响很大,储备池规模越大 对给定动态系统的描述越准确,但是会带来过拟合问题)储备池 输 入 单 元 尺 度(,)其为储备池的输入信号连接到储备池内部神经元之前需要相乘的一个尺度因子,即对输入信号进行一定的缩放一般需要处理的对象非线性越强,越大)储备池稀疏程度(,)其表示储备池中神经元之间的连接情况,储备池中并不是所有神经元 之 间 都 存 在 连 接 表 示 储 备 池 中相互连接的神经元占总的神经元 的百分比,其值越大,非线性逼近能力越强 在本文第 节 将 会 给 出 储 备 池 参 数 对 于 预测精
11、度的影响效果 基于 的网络流量预测假设时刻 的网络流量为(),时刻 之前的网络 流 量 历 史 数 据 可 表 示 为 一 个 网 络 流 量 序 列(),其可表示为()(),(),(),()其中,为嵌入维数设当前时刻 为预测原点,预测时域长度为,网络流量序列 的 预 测 问 题 可 表 述 为 给 定()以及时刻之前的网络流量值来预测时刻的网络流量值按照 算法,()作为输入、()作为输出对 网络进行训练,确定输入输出的映射关系田中大等:遗传算法优化回声状态网络的网络流量预测名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 9 页 -即可对网络流量进行预测,具体预测过程描述如下:确
12、定训练 样 本 长 度、预 测 时 域 长 度以及输入数据嵌入维数,建立输入训练集(),输 出 训练集(),初始化 参数 ,等 按照式()、式()进 行 网 络 训 练,计 算输出权矩阵 将网络流量序列按 转换,通过式()、式()预测未来时刻 的网络流量 将下一 采 样 时 刻 测 得 的 网 络 流 量 实 际值放入网络流量序列,利用滑动窗口法去除最旧的网络流量数据,返回 ,直至预测结束从以上相关描述可知,的储备池参数以及网络流量时间序列历史数据嵌入维数 对于 预测模型的非线性预测精度有着重要的影响,为了找到最合适的储备池参数与,本 文采用遗传算法对参数寻优,提高预测的精度遗传算法优化 遗传
13、算法利用生物遗传学的观点,通过自然选择、交换和变异等机制实现种群的进化,具有强大的全局搜索能力,可以在 较 短 时 间 内 搜索到全局最优解 个体编码 进行网络流量预测需要的参数,其个体设计如图所示,前位代表,后面的 位代表 ,后面的 位代表,再后面 的位代表,最后面的位代表 图 参数个体结构个体的各位二级制串通过式()转化为十进制来表示模型的实际参数:,()其中,为 参 数 十 进 制 值,为 参 数 的 最 小 值,为参数的最 大值,为参数 二进制 串 长 度,为参数二进制串的十进制值 种群初始化标准的 算法其初始种群为随机产生,具 有很大地不确定性和不均匀性,不能 很好地包含全局最优解信
14、息,出现局部最优问题,因此本文中采用均匀设计产生初始种群,确保初始种群的多样性与个体分步的均匀性 适应度函数的搜索目标为找到最合适的,从而提高网络流量的预 测 精 度,因 此 适 应 度 函数应与预测模型的精度相关设第 次迭代优化中,网络流量预测值与实际值的均方根误差(,)为 ()()槡,()其中,为网络流量序列长度,与分别为时刻网络流量的实际值与 的输出预测值为计算方便,第 次迭代优化个体的 适 应 度 函 数 直 接 取 为 预测误差的误差均方根,即为 ()()()遗传算子设计)选择算子计算 个 体 适 应 度值,按照适应度大小排序,适应度越小说明误差越小则为最优的个体,利用个体保持策略选
15、择个最优个体进入下一代,其余 个个体交叉、变异操作产生新的个体进入下一代)交叉算子 在个体上,分别选择 个交叉点,然后与另外一个个体的相应部分进行交叉操作,操作执行完毕后对生成个体进行检验,验证其是否在参数选择范围内,若不在则重新交叉操作)变异算子对个体的部分采用传统翻转变异方法进行变异操作,随机选取个体上的 位,按照变为、变为的规 则 进 行 变 异操作,随之检 验变异后个体是否在参数取值范围内,若不在则重新进行变异基于优化 的网络流量预测模型优化的 网络流量预测模型流程如图所示从图 可知,本文的 优化 的网络流量预测步骤可描述如下:参数编码与 参数设置 将网络流量 预 测 模 型 待 优
16、化 参 数,进行染色体基因编码;进行参数设置,如交叉概率、变异概率等;随机产生一组 预测模型参数值的染色体 按照 节描述,对网络流量序列进行计算机研究与发展 ,()名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 9 页 -图 基于 优化 网络流量预测模型流程图预测 采用式()的适应度函数,计算种群中各个个体的适应度,通过适应度函数衡量优化参数的优劣 根据个 体 适 应 度,通 过 轮 盘 赌 法,具 有较高适应度值的染色体被复制;通 过单点交叉法按照交叉概率将 条染色体中的基因进行随机交换,按照变异概率将染色体中的基因编码“”与“”互换 重复 到 ,使 初 始 确 定 的 一组待
17、优化参数不断进化,直到满足结束条件 对得到的最优解译码,得到优化的参数,仿真本文采集了 组中国联合网络通信公司辽宁分公司 接入网某路由器的网络流量数据,数据采集尺度为 ,通过前 组数据对 预测模型进行训练,后 组数据进行预测模型预测精度的验证图为 组网络流量数据,从图中可看出网络流量数据具有时变与非线性的特征 本文仿真中预测时域长度设为,也即单步预测 图 网络流量序列利用?类 分 析 方 法 对 网 络 流 量 序 列 进 行 分析,如图 所示,用直线拟合这些(?)关于 的数据点,直线斜率即为 指数,其 ,显然满足,可知网络流量序列具有自相似性同时具有强烈的非线性特征 这也从侧面说明等线性模型
18、无法完 成 对 网 络 流 量 时 间 序 列的精确预测 图 网络流量序列的 指数储备池的参数对于 网络流量预 测 模 型 的预测精度有着重要的作用,为了说明这些参数对预测精度的影响,图给 出 了 谱 半 径 的 变 化 范 围为 ,),变化步长为 ,储备池规模的变化范围为 ,),变化 步 长 为,嵌入维数 ,输入单元尺度 ,储备池稀疏程度,网络流量预测值与实际流量值之间均方根误差 的分布图 给出了谱半径 ,储备池规模 ,输入单元尺度 ,储备池稀疏程度田中大等:遗传算法优化回声状态网络的网络流量预测名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 9 页 -时,嵌入维数 为 时预测
19、误差的分布 图 与 变化时预测误差的 分布 图 变化时预测误差 分布 图 与 变化时预测误差的 分布图给出了谱半径 ,储备池规模 ,嵌入维数,输入单元尺度 的变化范围为 ,),变化步长为 ,储备池稀疏程度的变化范围为 ,),变化步长为 时预测误差 的分布 从图、图 与图 可以看出,嵌入维数 和储备池参数对于预测精度会造成不同的影响,因此如何根据网络流量训练集选择合适的模型参数是一个重要的问题,直接影响最后 预测的精度本文利用 算法进行预测模型参数的 寻 优,预测模型中待优化的参数,都采用十进制编码,编码位数都为、种群数量为,进化迭代次数为 、变 量 变 化 范 围:,交叉概率为,变异概率为,同
20、样利用上面的 组网络流量数据,适应度函数取为网络流量预测值与实际值的均方根误差,经过优化后得到的预测模型参数:嵌入维数,适应度变化曲线如图 所示:图 遗传算法适应度变化曲线利用遗传算法寻优得到的参数,对 组网络流量数据进行了预测精度的验证,图 为本文方法网络流量预测值与实际值的对比图为了进行本文方法预测精度的对比,与文献 中的 、文献 中 的 、文 献 中的 神经网 络 这 种 典 型 的 预 测 方 法 进 行 了对比其中,方法采用赤池信息准则()确定参数为:,;方法利用网格法交叉验证得到参数:,嵌入维数为;神经网络的参数:输入层为,中间层为 ,输出层为,最大迭代次数为 图 至图 为这种预测
21、方法网络流量预测值与实际值的对比曲线表 与表 分别为本文方法与其他种方法预测误 差 的 以 及 平 均 绝 对 误 差(,)的对比 计算机研究与发展 ,()名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 9 页 -图 本文方法网络流量预测值与实际值对比 图 神经网络方法网络流量预测值与实际值对比 图 方法网络流量预测值与实际值对比 图 方法网络流量预测值与实际值对比 的定义为()表 种方法预测误差的 对比 表种方法预测误差 对比 从图 至图 以及表、表中对比可发现,本文提出的基于 优化 的网络流量预测方法较其他几种方法具有更高的预测精度和更小的预测误差 预测精度提高的原因:)回声
22、状态网络本身具有较好的非线性预测能力;)通过遗传算法进行回声状态网络预测模型参数的寻优,避免了参数选择的盲目性,因此提高了预测的精度田中大等:遗传算法优化回声状态网络的网络流量预测名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 9 页 -结论针对网络流量的非线性预测问题而提出一种利用 进行网络流量预测的方法,采用遗传算法完成 预测模型中参数的选择优化,通过对实际网络中获得的网络流量数据进行了预测效果的仿真,仿真结果表明提出的基于 优化 的网络流量预测方法具有很好的预测效果,可以精确地刻画非线性网络流量的变化对于未来进行拥塞控制、网络管理优化等问题提供了良好的基础未来的研究工作是在
23、预测模型中引入相空间重构方法,相空间重构方法 可 通 过 考 察系统的一个或多个分量来确定多维状态空间的另一点,结合回声状态网络可进一步提高预测精度致谢中国联合网络通信公司辽宁省分公司集团客户响应中心的顾斌工程师为本文提供了网络流量数据,在此表示感谢!参考文献 ,:,():,():()(高波,张钦宇,梁永生,等基于及的自相似网络流量预测通信学报,():),():,():()(袁小坊,陈楠 楠,王 东,等城 域 网 应 用 层 流 量 预 测 模 型 计算机研究与发展,():)?,:,:,():()(董春玲一种结合和 的网络拥塞控制机制小型微型计算机系统,():),():,():()(姜明,吴春明,张旻,等网络流量预测中的时间序列模型比较研究电子学报,():),():,?,:,:,?,:,:,():,(,)?,:,:,:,():,():,():,():,():,()?,():,?,:,:计算机研究与发展 ,()名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 9 页 -,():,()?,:,:,():,田中大等:遗传算法优化回声状态网络的网络流量预测名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共 9 页 -