《2023年人工智能在城市交通信号控制中的应用.docx》由会员分享,可在线阅读,更多相关《2023年人工智能在城市交通信号控制中的应用.docx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023年人工智能在城市交通信号控制中的应用 五邑大学智能交通读书报告 人工智能在城市交通信号控制中的应用 五邑大学信息工程学院 2023年4月 目录 摘要 Abstract 第一章绪论 1.1研究背景 1.2智能交通系统简介 1.3城市交通信号控制概述 1.4国内外城市交通信号控制的发展历程 1.5城市交通信号灯控制的发展方向 第二章 城市智能交通控制的基本理论 2.1模糊逻辑(Fuzzy Logic) 2.2人工神经网络(Artificial Neural Networks) 2.3遗传算法(Genetic Algorithm) 2.4蚁群算法(Ant Colony Optimizatio
2、n) 2.5粒子群算法(Particle Swarm Optimization) 2.6多智能体技术(Multi-agent) 第三章 多智能体技术介绍 3.1智能体(Agent) 3.2 Agent的结构 3.3 Agent的分类 3.4多智能体系统在交通控制领域的优越性 第四章 基于RBF神经网络的单交叉口自学习控制系统 4.1引言 4.2问题描述 4.3控制器的设计及其算法 4.3.1基于神经网络的单交叉口模型 4.3.2 RBF神经网络 4.3.3神经网络自学习方案 4.4仿真分析 第五章结论与展望 5.1 总结 5.2 展望 摘要 随着社会的进步,城市化进程加快,城市人口和车辆日益增
3、多,城市交通问题日益突出,严重影响城市发展。先进的城市交通信号控制系统能提高现有道路的通行能力,改善交通状况,达到疏导交通、保证交通安全、畅通,智能交通系统就是其中之一,智能交通系统的发展,城市交通信号控制己成为最重要的研究方向。由于城市交通的复杂性,采用传统的控制方法己无法有效地解决交通信号控制问题,本文研究人工智能控制的方法在城市交通信号控制中的应用。 关键词: 交通信号控制,人工智能,ITS,神经网络,模糊理论,相序优化 第一章 绪论 1.1研究背景 城市交通是城市经济活动的命脉,对城市经济的发展,人民生活水平的提高起着十分重要的作用。从1886年第一辆小汽车在德国问世,增加了人类在交通
4、领域的机动性,便捷性,同时促进了城市道路和高速公路的发展。随着汽车工业的迅速发展,汽车己经成为人们日常生活中必不可少的交通工具。现在,人类社会的科学技术和经济力己经发展到了相当高的水平,机动车辆迅速增加,有关资料表明:1978年至1995年全国城市机动车的保有量的增长速度是道路增长速度的80倍。从70年代末起,我国城市汽车拥有量以每年平均12%-14%的速度增长。1978年,我国民用汽车总量仅有135.84万辆,到2023年超过1845万辆,机动车总数达到6852万辆。其中,私人汽车由1985年的28.45万辆增加到770万辆,这些民用汽车特别是私人汽车,多集中在我国的城市地区,而且增长趋势迅
5、猛。 汽车工业虽然给人们带来各种便利,但是也给城市交通带来了沉重负担,城市道路交通供需的严重不平衡已经成为各大中城市所共同面对的严重问题,特别是在大城市,交通堵塞现象时有发生,这不仅影响城市的正常运转,而且明显降低了人们的日常工作效率。据统计,现在全国32个百万人口以上的城市中,有27个城市的人均道路面积低于全国平均水平。每年由交通堵塞造成的直接经济损失大约1600亿元;相当于国内生产总值的3.2%121.由此产生了一系列的问题,如环境污染、交通拥挤、交通事故频发等,给人们的生命和财产带来了很大的损失。 2023年,全国共发生交通事故70多万起,10万多人死亡,受伤人数50万人,直接经济损失达
6、30亿元。近五年,全国道路交通事故起数上升了32.5%,死亡人数上升了85%,受伤人数上升了42%。目前,机动车污染己经上升为我国城市大气和噪声的主要污染源。例如, 北京市汽车排放的一氧化碳、碳氢化合物、氮氧化物已占总排放的40%-75%。广州市与交通有关的排放占一氧化碳总排放的87%和二氧化氮的67%。据国际卫生组织1998年公布的调查报告,在全球空气污染最严重的10个城市中,我国就占了7个,包括太原、北京、乌鲁木齐、兰州、重庆、济南、石家庄. 为了解决上述交通问题,修建更多的道路是最直接和最有效的方法。然而,修建新路的巨额资金和城市有限空间的严格限制,使这一方法的有效性大打折扣。近年来,世
7、界各国都非常重视日益严重的交通问题,投入大量人力物力对道路交通运输系统的管理与控制技术进行开发,相继出现了许多不同的交通控制手段和系统,为缓解交通拥挤发挥了巨大的作用。 在以上诸多交通问题中,城市交通问题是困扰城市发展、制约城市经济建设的重要因素。随着城市中的交通线承担了更大量的交通负荷,现有的设施、道路,特别是交通线中承受着高负荷的交叉口,已经很难适应这种发展速度,变得越来越拥挤,成为道路交通的瓶颈,因此采用先进的科学技术手段对城市交叉路口的交通灯实施合理优化控制,对改善城市交通状况有很大的作用。 1.2智能交通系统简介 近年来,迅速发展起来的智能交通系统(Intelligent Trans
8、portation Systems,简称I ONTSj有别于传统的交通改善技术,它是国际上对运用当代高新科技(计算机、信息、通信、自动控制、电子、系统工程等)提高交通运输效率、增强交通安全性的一系列先进技术或技术集成(交通控制与线路导行系统、车辆行驶安全控制系统、交通运输信息服务系统等)的一个统称。 作为基础设施,道路交通运输支撑着人们的日常生活和经济活动,对社会发展起着十分重要的作用;然而不断发生的交通事故、持续的交通拥挤以及交通发展所引起的空气污染、环境破坏也逐渐成为倍受关注的严重社会问题。智能交通系统被认为是缓解这一问题的极具潜力的方法。发达国家从20世纪60年代就开始从事这一领域的研究
9、和开发,并取得了不少有价值的成果。据统计,智能交通运输系统技术的应用可以减少10%的废气排量,20%的交通延时,30%的停车次数。美国Los Angels地区和Texas州在智能交通系统方面投资的效益一成本比率分别是16:1和22:1,收益非常显著。而这一切,都是在基本上没有进行道路改建和引入新的高速车道的情况下取得的。投资ITS所带来的收益可见一斑。 智能交通系统开发的领域主要包括:居民出行与货物运输需求智能诱导系统、交通流优化与运输组织智能化方案生成系统、综合交通枢纽协调疏导信息系统、先进的交通管理系统、车辆运营智能调度管理系统、智能公共交通系统、智能大城市公共交通运输服务系统、货物运输智
10、能型配载运输服务等 我国在20世纪70年代末就已经开始在交通运输和管理中应用电子信息技术。此后的20多年里,在政府的支持与坚持自主开发的基础上通过广泛的国际交流与合作,在ITS领域进行了初步的理论研究、产品开发和示范应用,并取得了一定的成果。一批从事ITS研究 开发的研究中心和生产企业通过理论与实践相结合正在成长。国家科技部1999年批准建立了国家ITS工程技术研究中心(ITSC)2000年又批准建立了国家铁路智能运输系统工程技术研究中心。许多大学和研究机构也纷纷组建ITS研究中心,从事ITS的理论研究和产品研发, 例如东南大学ITS研究中心、武汉理工大学ITS研究中心、吉林大学ITS研究中心
11、、北京交通大学ITS研究中心、同济大学ITS研究中心、华南理工大学ITS研究中心等121。中国交通领域和IT行业的很多企业被ITS巨大的高新技术市场所吸引,纷纷涉足ITS领域进行其产品的开发研究和推广应用,将先进的智能控制技术、信息融合技术、智能信息处理技术与交通工程结合起来,己成为一个崭新的研究方向 为协调和引导中国ITS的发展,2023年初国家科技部会同当时的国家计委、经贸委、公安部、铁道部和交通部等部门,联合成立了全国ITS协调指导小组及办公室,并成立了ITS专家咨询委员会负责组织研究中国的ITS发展总战略、技术政策和技术标准,积极支持有 关部委、地方、企业及科研单位,根据行业和地区特点
12、开展ITS的关键技术研究与应用示范工程,促进ITS研究成果的产业化。 1.3城市交通信号控制概述 按照控制原理的不同,传统的交通信号控制分为定时控制和感应控制.定时控制按事先设定的配时方案运行,根据交通量历史数据进行配时;感应控制是某相位绿时可根据车流量的变化而改变的一种控 制方式,其中车流量可由安装在平面交义日进日道上的车辆检测器测量.一者的控制策略均是基于简单的数学模型,由于城市交通系统中被控对象的不确定性、随机性和过程机理复杂性,现场车辆检测存在 误差,建立精确的数学模型非常困难,这就造成了算法本身就有一定的缺陷.除此之外,即使经多次简化建立的数学模型,它的求解还须简化计算才可完成.对于
13、交通系统这样时变的复杂系统而言其效果往往差强人意.随着人工智能研究热潮的兴起,人工智能方法为智能交通系统的研究提供了坚实的理论基础.针刘传统交通控制的固有缺陷和局限性,许多学者将模糊逻辑、神经网络、遗传算法、蚁群算法、多智能体技术等人工智能基础研究方法同传统的交通控制方法结合应用.一方面,交通系统结构复杂、影响因素多、随机性很强的,利用数学方法解决交通问题的难度很大,所建立的模型往往过于复杂,难于求解, 同时交通流系统的多样性也很难用一种或儿种模型来体现;另一方面,交通系统又是一个动态的时变系统,交通竹理与控制的实时性要求非常高.因此,从实际情况出发,基于数学描述的交通竹理控制方法难以满足在线
14、实时控制的要求,可操作性较差.而人工智能的方法(包括模糊逻辑、人工神经网络、遗传算法等),借鉴人类求解问题的方法,通过知识的表达、推理和学习解决复杂的问题,将以往用纯数 学来描述交通系统转变为用知识或知识与数学模型相结合来描述.1.4国内外城市交通信号控制的发展历程 1868年英国在伦敦市首次使用了燃汽信号灯,用于管理城市交通,这种信号根据铁路信号显示方式由红灯与绿灯组成,这标志着城市交通信号使用的开始141。这时交通警察大多使用手提式照明灯来指挥交通。1914年,美国在克利夫兰城安装使用了人工操作的电气照明信号灯,六年后被日本采用,十年后被英国采用,这种信号设置在交叉口中央的信号塔上,四个方
15、向均有直径为37.5cm的红、绿、黄三色的圆形投光器。许多国家采用后又逐渐给予了改进。1926年,世界上第一台自动控制街道交叉路口的交通信号机在英国研制成 功并开始使用,它采用固定周期控制方式,随后又出现多时段固定周期控制方式。1928年,美国研制成功车辆感应式交通信号灯,使用橡皮管气压式检测器。几年后被英国、日本采用。在交通信号不断改进和发展的同时,用于多个路口协调统一控制的交通信号控制方式 也在不断进步。1917年,美国盐湖城安装使用了人工控制的干道信号协调系统。1922年,美国休斯敦市建立了一个采用电子计时器的干道信号协调系统。1928年,美国研制成功一种灵活的步进式定周期干道信号定时系
16、统,由于其技术简单,可靠性高,价格低廉,很快 被英国、前联邦德国、日本等国广泛应用。 随着交通信号感应控制技术和电子计算机技术的发展,1952年在美国丹佛城出现了采用模拟电子计算机的交通信号控制系统,该系统将单一交叉路口的交通感应控制概念应用于街道交通信号化网络,并用车辆检测器向控制中心输入交通流数据,用模拟电子计算机 进行数据处理,然后再调整各交叉路口的交通信号程序。在随后的11年间,美国建立了100个这种信号控制系统。1963年加拿大多伦多市投入了由IBM650型计算机控制的交通信号协调控制系统,这标志着城市道路交通控制系统进入了一个新的阶段。其后,美国、英国、前联邦德国、日本、澳大利亚等
17、国家相继建成数字电子计算机区域交通控制系统,这种系统一般还配合交通监视系统组成交通管制中心。到八十年代初,全世界建有交通管制中心的城市有300多个。 1.5城市交通信号灯控制的发展方向 越来越多的资料显示表明,城市交通信号控制的研究主要体现在以下三个方面: (1)人工智能(AI)在城市交通信号控制问题中的应用有利于提高当前交通信号控制系统的性能 最近,越来越多的人们开始把注意力集中在人工智能技术应用于交通工程问题上。城市交通信号控制系统在操作方面分为三个重要阶段,即交通数据采集、数据分析与处理、判断与控制。从数据采集和处理,到确定最好的控制动作,以及到动作的实施,关键是全面提高信息决策过程的质
18、量。这些都和相当多的专门知识有关,在很大程度上涉及相关的规章制度,并且受限于现实中的实际约束。归纳上述问题,用AI途径来提高相应的基本职能是可能的。综合起来,难题集中于精确交通信号方案选择体系,交通信号方案选择体系在欧洲己经被广泛用于UTCS田rban Traffic Control System)中。 (2)利用离散时间、滚动区域法(rolling horizon)研究交通信号控制系统 滚动区域法利用最近检测到的数据,对系统现行状态(主要是各个路口的现行排队长,进行估计,为滚动区域的持续时间内搜寻一种优化信号控制方案。滚动区域的时间必须足够长,时间分为两部分,前一段时间执行滚动区域法的优化方
19、案。在滚动区域法的最后一 段时间内,以终端代价函数的形式验证滚动区域法基础上优化的信号方案。若满足要求,则继续执行该方案,否则停止执行,重新优化信号方案。Robertson和Bretherton于1974年最初提出了离散时间滚动区域法,至今该领域的主要研究及发展,大多在欧洲国家。用户网络的离散时间、滚动区域法信号控制系统有待于研究。 (3)分散控制系统仍是未来的一个研究方向 分散控制系统相对集中控制系统来说可以减少信道负载,减少网络控制中灾难性失效。因此,这种控制系统仍是未来研究和发展的一个重要方向。 第二章 城市智能交通控制的基本理论 从应用上来看,日前具有代表性的城市交通控制系统中,英国的
20、SCOOT属于集中式控制系统,澳大利亚的SCAT和德国的MOTION为递阶分层分布式控制系统,但这些系统及其体系结构未考虑到如 何实现控制方式或控制模式多元化及其传统控制方法与人工智能技术集成的问题.西班牙的D.M.Aymerich和法国的G.S cemama对这些问题分别进行了有益的研究和探索,但这些系统的体系结构只强调继承和利用现有的交通系统而不能自成体系,难以体现系统的分层递阶特征,有一定的局限性. 从理论研究上来看,传统的城市智能交通控制方法是通过对城市交通系统建立一定的数学模型,然后运用最优控制理论来求解控制变量.在这类方法中,为了简化问题和解决某些数学技术上的具体限制, 在建模时通
21、常需要对模型进行理想化和一些不确定条件的人为设定,而这些简化与现代城市,尤其是特大型城市的交通系统所具有的非线性、动态时变性等特点是相矛盾的,因此造成了所用最优方法在实际 中并非最优,或者面对大规模城市无法对交通数据进行实时有效的计算等缺点.新的技术和方法的引入显得十分必要和非常迫切,计算机的出现和广泛应用促成了人工智能研究热潮的掀起,而这又必然会导 致包括系统体系结构及控制策略等各方面的调整和改进.许多专家学者从智能控制的角度出发,利用模糊逻辑、人工神经网络等理论来研究这个问题.2.1模糊逻辑(Fuzzy Logic) 模糊逻辑是一种处理不确定性、非线性等问题的有力工具,它与人类思维的某些特
22、征相一致,因此,嵌入到推理技术中具有良好效果.模糊逻辑不需要获取模型中的复杂关系,不需要建立精确的数学模型,是一种基于规则的智能控制方式,特别适用于具有较大随机性的城市交通控制系统.1976年,Pappis和Mamdani就将模糊逻辑用于单路日的交通控制,其仿真结果表明比用传统的控制方法平均减少车辆延误7%左右.我国学者徐冬玲等人则把模糊逻辑用于单路日信号月控制,并用神经网络实现模糊控制,仿真表明控制结果合理、迅速.崔宝侠等在双模糊控制器陇调控制交通信号的基础上,采用模糊推理来替代函数模型,根据输入输出量的大小改变模糊控制器的输入输出变量的论域范围;该算法更加方便地实现了控制器自调整和自适应,
23、车辆平均延误时间改善4.68%至12.24 %.当车流量有突变时,改善效果更明显 2.2人工神经网络(Artificial Neural Networks) 人工神经网络是模拟生物的神经结构及其处理信息方式的一种算法.它具有自适应、自组织和自学习能力,在认知处理、模式识别等方面有很强的优势,最显著特点是具有学习功能.人工神经网络适用于非线性时变性系统的模拟与在线控制,I I适合于交通控制系统这一非线性、时变系统。 1991年,Nahatsuji和Terutoshi通过训练的一个神经网络使其给出某单个交义日的最优绿信比,后来又把研究工作打一展到3个交义日上 .C.J.Barnard等利用BP网络
24、模型,分别以交通流密度和不同相位的绿时作为输人、输出,直接建立起交通模式与信号方案之间的内在联系,从而实现了以交通流最优化为日标的二相位孤立交义路日的自学习动态适应性控制系统.C.Ledoux则提出了基于神经元网络的实时适应性城市交通信号控制系统的交通仿真模型lob.许伦辉等针对城市交义日交通流的分布特点,考虑相邻车道上车辆排队长度,利用多层BP神经网络实现了道路交义日多相位模糊控制,给出一种自适应交义日多相位控制算法,仿真结果表明,模糊神经网络控制器能有效的减少交义日平均车辆延误,具有较强的学习和泛化能力f51.张康等提出了“车流阻塞参数,的概念,用模糊神经网络训练其信号控制规则,仿真结果表
25、明,控制效果有明显提高flll.日前越来越多的路日采用了多相位信号控制,而目控制规则一经确定就不再改变,即不具备实时学习的功能.因此,对于交通状况复杂的多相位路日,很难取得满意的效果.2.3遗传算法(Genetic Algorithm) 遗传算法是运用仿生原理实现在解空间的快速搜索,广泛应用于解决大规模组合优化问题.它是一种比较先进的参数寻优算法,对于不易建立数学模型的场合其实用价值较为突出,是以同样适用于交通系统。 1997年,Kiseok和Michael等应用遗传算法对交通网络内的交义日信号相位进行设计,在交义日形成的冲突点,结果显示该方法给出的相位方案要优于TRANSYT给出的方案.同年
26、,C Q Memon等人给出了利用遗传算法进行信号配时方案设计的研究结果.陈小锋针对典型的多车道双向交义路日的交通流分布,建立四相位控制的动态交通控制模型,采用遗传算法同时对信号周期时长和相位绿月持续 时间进行优化.承向军对到达车辆数日进行模糊分类,将不同数量车辆的信号控制决策方案以规则集形式存储在知识库中,利用改进的遗传算法,对交义日信号模糊控制器的模糊规则进行优化,建立了 新的优化算法.顾榕等将免疫遗传学思想运用到交通信号控制中,提出一种新的相位配时优化算法,将平均延误时间由76.7S降至36.4S,实验结果充分验证了该算法处理交通配时优化问题的可行性和有效性.李艳利用改进的遗传算法对交义
27、日信号模糊控制器进行优化,建立新的配时优化算法,仿真结果比Pappis方法性能提高了21%IB.2.4蚁群算法(Ant Colony Optimization) 蚁群算法是一种模拟进化算法,它是一种求解组合最优化问题的新型通用启发式方法,该方法具有,反馈、分布式计算和富于建设性的贪婪启发式搜索的特点.闻育应用蚁群算法搜索各路日的最优信号灯相位序列,对算法复杂度作了理论分析,并通过仿真实验与单路日感应式信号控制技术进行比较,结果表明效果较好,总停车时间降低7.2%19.闻育还提出 一种基于改进蚁群算法的降阶滚动优化算法,基于宏观交通流模型建立了区域交通控制滚动优化模型,在蚁群算法中设计了层状解结
28、构图,应用降阶方法将大规模区域分解为一系列了区域,仿真结果显示, 区域滚动优化控制比感应式控制的总停车时间下降了8.2% 2.5粒子群算法(Particle Swarm Optimization) 粒了群优化算法是由Eberhart博士和kennedy博士于1995年提出,是基于对鸟群、鱼群捕食的行为模拟研究而来.同其他基于群智能(Swarm Intelligence)的随机优化算法相比,PSO算法具有收敛速度 快、设置参数少、程序实现异常简洁、具有深刻的智能背景等特点。 瞿高峰以交义日车辆平均延误和停车次数最小为日标,建立信号控制交义日配时模型,运用粒子群优化算法求解该模型,结果表明比传统方
29、法更优,车辆停车次数略有增加,通行能力略有下降,但停车延误时间大大下降低,由23.97S下降至14.27 S 22.这表明运用粒子群优化算法解决交义日配时问题是有效和可行的.付绍吕,黄辉先提出在自适应粒子群算法中引入变异算子建立离散交通信号控制模型,以更新粒了群算法的个体极值点和全局极值点,仿真表明该混合算法可解决易陷入局部收敛的缺陷并能有效实现交通信号优化控制傅惠等提出了基于粒子群优化的城市关联交义日群信号控制策略,根 据粒了群优化思想求解信号控制参数.仿真实验证实,基于粒了群优化的关联交义日群信号控制策略有效 2.6多智能体技术(Multi-agent) 智能体技术由M insky在198
30、6年首次提出,一般认为:智能体指驻留在某一环境下,能持续自卞地发挥作用,具备驻留性、反应性、社会性、卞动性等特征的计算实体.随着车辆数和城市路网规模的增 大,信号控制系统的复杂性增大,同时由于交通流在信息、控制方面固有的分布性,采用多智能体系统构建城市交通控制系统的计算环境己成为交通系统陇调控制的热点 国外对智能体在交通中的应用早有报道,如B urmeiste:提出多智能体在交通运输中应用的思路。Roozemond分析了智能体、神经网络和分布式人工智能在城市交通控制应用的前景和价值Goldman提出了一个基于多智能体的增量4.补学习的路日控制器28.Choy等采用一种复杂的模糊神经网络进化混合
31、系统来构造分层分布式交通控制多智能体系统,各个智能体利用模糊系统的推理能力、神经网络的学习能力来进行实时决策.各层智能体的感知过程能通过在线强化学习进行调整. 国内一些学者也对智能体在交通控制中的应用作了一些尝试性研究,马寿峰等提出了单个路日的基于Q学习的交通信号控制Agent,并在此基上研究了基于对策论和社会规则的多智能体陇调方法陶志祥对基于Agent的分层递阶控制结构进行了概述。高海军以博弈论为基础,提出了交通控制Agent之间的区域陇调模型及算法32.李瑞敏结合城市交通控制与诱导系统集成的特点,研究了基于多智能 体系统的城市交通信号控制与动态诱导集成化的系统结构和两类相b_作用的智能体模
32、型结构.赵建有等提出了人、车、路、交通竹理系统的交通系统Agent结构,并提出了路日Agent-区域控制中心Agent-卞控制中心Agent的二级交通控制结构郭建钢、伍雄斌等提出了基于遗传算法和多智能体技术的交通系统陇调控制的建模方法以及建模过程应注意的问题,并实例验证,得到可降低车均延误12%,缩短周期时长27.2%的结论35-37.刘虹秀等提出了基于多智能体的陇调方法,该陇调方式能适应牢时今什的夺诵环靖,曲调方式诵信普川高的缺占. 第三章 多智能体技术介绍 3.1智能体(Agent) 随着计算机技术和人工智能的发展,集中式系统己不能完全适应复杂大系统研究的发展需要.并行计算和分布式处理技术
33、(包括分布式人工智能)应运而生,并在过去20多年中获得快速发展.近10年来,智能体和多智能体系统的研究成为分布式人工智能研究的一个热点,引起多种不同等领域科技工作者的浓厚兴趣,为分布式系统的综合、分析、实现和应用开辟了一条新的有效途径,促进了人工智能和计算 机软件的发展 3.2 Agent的特点 有关Agent的概念可追溯到1977年Hewitt提出的并发的演员(actox)模型,在该模型中,Hewitt提出了自我包含、相匀_作用、并发执行的对象一演员,该对象中具有某些被封装的内部状态并可对来自其它类似对象的消息进行响应.而Agent一词最早可能由M.Minsky所提出,他在1986年出版的”
34、Societyof Mind”中引入了“societyIIISoclal Behavor”的概念.认为个体存在于社会中,社会中的个体在有矛盾的前提下可通过陇商或者竞争的方法对问题进行求解,并将这些个体被称为Agent .日前,普遍认为Agent是一个持续、自治运行的实体,按照Y.S hoham的观点,Agent是一个包含诸如知识(knowledge)、信念(beliefs、承诺(commitments蹄I I能力(capabilities)等精神状态(mental-state)的 实体.虽然不同的研究者对Agent有着这种或那种的解释,但其卞要具有以下特点: 1)自治性(autonomy) A
35、egnt能根据外界环境的变化,而自动地对自己的行为和状态进行调整,而不是仅仅被动地接受外界的刺激,具有自我竹理自我调节的能力.2)反应性(xeactive)与面向对象的方法相似,agent能对外界的激励作出反应的能力.3)卞动吐(pxoactive) 对于外界环境条件的改变,agent能卞动采取活动的能力.4)社会性(social) Agent所具有的与其它Agent或人进行合作的能力,不同的Agent可根据各自的日的意图与其它Agent进行交流,以达到问题解决的日的.除了以上的基本特性,Agent还包括一些其他的属性: 推理能力:Agent AJ以根据当前的知识和经验,以理性的、可再生的方式
36、推理或推测. 规划能力:Agent A丁以根据日标、环境等的要求,至少对自己的短期行为做出规划,具有生成规划的能力. 学习和适应能力:Agent A丁以根据过去的经验积累知识,并目修改其行为以适应新的环境.3.2 Agent的结构 建立Agent的结构是应用Agent技术的基础,关于Agent模型结构的研究是日前卞要的研究领域之一对于Agent的模型构成,存在着各种不同的观点. 一般认为一个Agent应包括感知器、决策控制器、精神状态、知识库、通信器等儿部分组成.BDI模型是一被普遍接受的Agent精神状态模型,它认为Agent的精神因素包括信念(belie、愿望(desire)、意图等部分组
37、成,其本质上要解决的问题是如何确定Agent的目标以及如何实现这个目标。 3.3 Agent的分类 Agent作为一种新兴的计算机软件开发方法,是一个相当大的范畴,从普通的人、动物、社会机构乃至普通的物体根据实际应用的不同,都可被抽象为Agent.根据Agent的功能和应用的不同,一般将Agent分为以下儿种类型: 合作Agent:卞要用在多Agent系统中,为完成自己的任务,能自动地与其它成员进行谈判、信息交流等活动 界面Agent:强调自治性与学习能力,用于与用户交4_的操作界面上,能自动地根据用户的喜好特点,进行个性化设置,并能为用户的操作提供必要的帮助.活动Agent:可以自由地在计算
38、机网络上移动,并与其它的计算机相4_作用,其卞要应用于计算机通讯方面.信息Agent:卞要用于网络信息收集、查询、整理,它将比日前使用的搜索工具更强大,能根据用户的不同要求,提供详细完备的资料.反应Agent:不包括任何内部符号处理模型,只是简单地对外界刺激发生反应,卞要用于一些底层的、简单的系统中.混合Agent:指具有两种以上上述Agent的复杂Agent,由于结构复杂,日前应用相对较少.3.4多智能体系统在交通控制领域的优越性 多智能体系统是分布式人工智能研究的新领域.尽竹MAS在理论上还有很多值得深入研究的课题,然而它己经获得十分广泛的应用,涉及机器人、过程控制、柔性制造、远程通信、网
39、络竹理、交通控制、电子商务、数据库、远程教育和远程医疗等.其中将智能体系统技术用于交通控制是一个新的方向0.由于交通控制拓扑结构的分布式特性,使其很适合于应用多智能体技术.运用多智能体系统进行交通系统调控制的优点有如下儿个方面: (1)多智能体系统采用“由下向上”的设计方法,符合交通系统的形成规律.多智能体系统在原理上首先定义分散自卞的智能体,然后研究怎样完成一个或多个实体的任务求解,所以多智能体系统采用了由底向上的设计方法.交通系统是一个包含了交通工具、交通设施、交通控制中心等多元素多层次的复杂系统.因此多智能体系统的设计方法完全符合交通系统的形成规律. (2)多智能体系统从功能上按层次化结
40、构划分的特点,符合交通系统的分布式特征.构成多智能体系统的不同种类的智能体从功能上按照层次化结构划分,承担不同的任务,相办作完成系统的整体目标.交通系统的各组成元素分布在不同空间位置,按照层次化结构划分.因此,多智能体系统适合交通系统这样具有分布式特征的复杂系统的模拟研究.第四章 基于RBF神经网络的单交叉口自学习控制系统 4.1引言 由于城市化速度的加快,机动车量的迅速增加,人们在赚取由机动车辆所带来的巨额利润以及充分享受汽车巨大便利的同时,也越来越受到交通拥挤和交通安全的困扰。随着城市中的交通线上车流量的日益增加,现有的设施、道路,特别是交通线中承受着高负荷的道路交叉口,己经很难适应这种发
41、展速度,变得越来越拥挤,成为道路交通的瓶颈,因此采用先进的科学技术手段对城市交叉路口的交通灯实施合理优化控制,对改善城市交通状况具有很大的作用。 对于交叉口的信号控制,通常有两种控制方式:一种是定时控制,即根据统计资料算出交通量,给出一个或多个(用于不同时段)控制方案,这种控制方法在交通流不大且较稳定的情况下是简单有效的。但在交通拥挤且变化较大时,定时控制的效果比较差。另一种是感应控制,即根据布置在交叉口的传感器感应到的车辆排队长度来设置控制参数,感应控制在当车流量较小且无规律时,容易产生绿时分配不合理的现象,同样也会降低路口的通行能力。而当车流量较大时则容易退化成定周期控制,从而失去感应能力
42、。由于这些常用控制方法的缺点,一些人工智能的方法愈来愈引起人们的重视。 针对多相位单交叉口的神经网络控制方法,已经有文献提及。本章提出了一种利用RBF神经网络来模拟交警控制思维的智能控制方法,并且加入了对控制状况进行修正的评价准则,在模拟控制过程中,RBF神经网络根据评价准则进行实时调节,因此这种神经网络具有自学习功能。 仿真研究结果表明基于RBF神经网络的交叉口自学习控制系统学习速度快,能有效提高多相位路口的通行能力,对车流的变化具有很强的适应性。 4.2问题描述 城市单交叉路口的交通流如图4-1所示,东、南、西、北四个方向,每个方向均存在左行、直行、右行三个车道车流。 图4-1单交叉口交通
43、流分布 考虑这个十字形的平面交叉路口具有四相位。每个相位对应的车流流向如图4-2所示。 图4-2四相位交叉口交通流控制图 假设一位交通警察在该路口指挥交通,他可以根据这四个相位的车量排队长度作为依据,按顺序给各个相位分配通过时间。由于各相位在不同的时间段里到达车流量具有随机性,根据交通情况,交警给各个相位分配的时间也会不断变化。 由此可见,模拟交警的思维实际上可以将四相位的车辆排队长度为输入,以对应的信号周期时间和各个相位的绿信比为输出构造一个神经网络,然后将交警指挥某些具体交通流情况下的输入输出作为样本训练神经网络。 4.3控制器的设计及其算法 4.3.1基于神经网络的单交叉口模型 根据对四
44、相位交叉口信号控制问题的描述可以确定神经网络结构如图3-3所示。该网络由四个输入分别对应四个相位的车辆排队长度Ii,四个输出分别对应信号周期T和各相位的绿信比( j =1, 2, 3, 4) 图4-3神经网络学习结构模型 4.3.2 RBF神经网络 径向基函数(Radial Basis Function, RBF)神经网络由三层组成其结构如图4-4所示。 图4-4径向基函数RBF神经网络 隐层节点中的作用函数称为基函数,一般采用的基函数形式为高斯函数: 式中: ,x是n维输入向量; c,是第i个基函数的中心,与x具有相同维数的向量; 是第1个感知的变量,它决定了该基函数围绕中心点的宽度; m是
45、感知单元的个数; 4.3.3神经网络自学习方案 (1)原始样本的获取 首先将已知的交警指挥经验用符合上述神经网络的样本形式表示出来,然后用这些样本训练神经网络,这样该网络就具备初步的控制交通的能力,可以将其用于实际交通控制中,但由于此时的网络学习规则不具有遍历性,所以需要有一个评价准则来对网络的控制效果作出评价,并修改重新学习。 (2)评价准则 对于投入实际交叉口控制的神经网络,评价准则要对其配时方法的控制效果作出评价,并修正信号周期和各相位的绿信比。设六个信号周期为一个评价周期,l为第1个信号周期结束时第.1个相位中所有方向车流的排队长度之和;1为一个信号周期结束时的J相位总的排队长度;习为
46、第i个信号周期内第.7个相位中所有方向放行的车辆总数;r;为第i个信号周期内第J个相位中所有方向到达的车辆总数;所以, 式中:当括号内的数小于0时,z=0,否则z=1,且有 一个信号周期过后J相位各个排队长度: 一个信号周期过后四相位累计排队长度: 然后计算这种交通情况下各相位的绿信比: 最后依据平均排队长度的大小L ,来确定周期T的增量T,这里将设定5个档次: L ,55, 55 L ,35, 35 L ,15, 15 L ,5, L 根据以上的评价过程,可以得到新的输入输出样本,神经网络对新样本进行再学习。 4.4仿真分析 本章按照前面所述的RBF神经网络自学习控制方法,在Matlab语言
47、环境中编程进行了仿真。在通过调查采集到的实际数据的基础上分析交警指挥单交叉路口信号的控制规律,并从中选出在不同车流量情况下具有代表性的信号控制模式,形成40个神经网络学习样本,然后用RBF算法对神经网络进行训练,再用服从二项分布的随机数来描述车流的到达情况。仿真研究时,取直行车道的饱和流量为1200PCUlh,左转和右转车道的饱和流量为1000 PCU/h。车流到达路口后,左转、直行和右转的比例分别为30%, 40%和30%。由上述学好的网络进行控制,确定6个信号周期为一个评价周期,得到一个新的样本。每隔20个评价周期,将得到的20个新样本加入总的学习样本集进行再学习。 训练RBF网络时,将网络误差设置为o.01,并通过自动增加径向基神经元的方法来不断减少网络误差,从仿真过程中可以看到,在神经元个数接近样本个数时网络收敛。 为验证本章提出的RBF神经网络自学习控制方案的控制效果,仿真运行中将其与定时控制方法以及BP神经网络学习方法的控制效果进行了比较,结果如表3