《2022年2022年机器人足球简介 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年机器人足球简介 .pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章机器人足球简介1.1Agent技术概论1.1.1 智能 Agent Agent 的概念最早可以追溯到1977 年由 Hewitt提出的演员模型,在该模型中给出了一些“演员”一组具有知我包含、相互作用和并行执行的对象。以后的研究中又把Agent看成一个具有特别技能的个体。后来又提出了软件agent 的概念, 认为软件 agent 是具有自主性和协作性的实体,它能够帮助用户完成一定的任务。还有些研究者认为Agent 是驻留在某一环境下能够持续、自主地发挥作用,满足任务/ 目标驱动性、社会性、主动性等特征的计算主体。由上面可见, agent 的定义和表现格不相同。实际上,要想在对形成Agent
2、 一个比较统一的定义还是不太容易的。所以更多的研究者把关注放在对Agent 的特性的研究上面。现在对 Agent 的特性的研究中,最为经典和广为人接受的是Wooldridge等人提出的有关Agent的“强定义”和“弱定义” ,认为一个 Agent 的最基本的特性应该包含反应性、自主性/自制性、面向目标性和社会性,然后根据其应用情况可以拥有其他特性。Agent 可以拥有的其他特性包括: 移动性、 自适应性、 反应性、 理性、 持续性或时间连续性、自启动和自利等特性。还有一些人从Agent 的精神状态出发,对Agent 的特性进行了更深入的研究。从建造 Agent 的角度出发,单个Agent 的结
3、构通常分为思考型Agent、反应型Agent、混合型 Agent。下面分别介绍一下这些类型的Agent。思考型 Agent(deliberate Agent)建造 Agent 的经典方法是将其看作是一种特殊的知识系统,即通过符号人工智能的方法来实现 Agent 的表示和推理,这就是所谓的思考型Agent。思考型Agent 的最大特点就是将Agent 看作是一种意识系统。人们设计的基于Agent系统的目的之一是把它们作为人类个体或社会行为的智能代理,那么 Agent 就应该能模拟或表现出被代理者具有的所谓意识态度,如信念、愿望、意图、目标、承诺、责任等。在这方面, Bratman 最早提出用信念
4、、愿望、意图来表示Agent。他从认知的角度来描述信念,认为信念是Agent 对当前世界状况以及为达到某种效果所可能采取的行为路线的估计;从情感的角度来描述愿望,认为愿望是描述Agent 对未来世界状态以及对所可能采取的行为路线的喜好;从意动方面来描述意图,认为目标是愿望的子集,但没有采取具体行动的承诺,如果某一或一些目标得到了承诺,这些目标就是意图;这也是最初的BDI 模型。但对 BDI 模型做出最大贡献的当首推澳大利亚的Rao 和 Georgeff,他们提出了一系列用来描述 Agent 意识的 BDI 逻辑,分别用3 个模态算子来刻画信念、愿望和意图。反应型 Agent(reactive
5、Agent)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 7 页 - - - - - - - - - 由于符号人工智能的特点和种种限制,给思考型Agent 带来了许多尚未解决并且很难解决、甚至无法解决的问题。因此导致了反应型Agent 的出现。反应型Agent 认为, Agent 的智能应该取决于感知和行动,从而提出Agent 智能行为的 “感知动作” 模型。此时的 Agent不需要知识,不需要表示,也不需要推理,Agent 可以向人类一样逐步进化,Agent 的行为只
6、能在现实世界与周围环境的交互作用中表现出来。这方面的杰出代表当推MIT 的 Brooks , 他提出了子前提结构 (subsumption architecture ) ,该结构是由用于完成任务的行为(behaviors)来构成的分层结构,这些结构相互竞争以获得对机器人的控制。混合型 Agent(hybrid Agent )反应型 Agent 能及时而快速的响应外来信息和环境的变化,但其智能性较低,也缺乏足够的灵活性。 思考型 Agent 具有较高的智能,但无法对环境的变化做出快速的响应,而且执行效率也较低。混合型Agent 综合了两者的优点,具有较强的灵活性和快速的响应性。混合型 Agent
7、 通常被设计成至少有两层的层次结构。高层是一个包含有符号世界模型的认知层, 进行 Agent 整体规划与设计;低层是一个能快速响应和处理环境中突发事件的反应层。一般反应层具有较高的优先级。这种结构的典型实例是过程推理系统(Procedural Reasoning System,简称 PRS) ,它是一个在动态环境中推理和执行任务的BDI 系统。以上是构造Agent 的 3 种结构,其中思考型Agent 说采用的是Sign AI ,所以得到了大多数 DAI 研究人员的青睐,反应型Agent 尚处初级阶段。而混合型Agent 由于其优点已经成为当前的研究热点。1.1.2 多 agent系统(MAS
8、 )MAS 的协作求解问题的能力超过单个的Agent 是 MAS 产生的最直接原因,导致MAS研究逐渐兴起的其他原因还包括:与已有系统或软件的互操作;求解那些数据、 能力和控制具有分布特性的问题以及提高系统的效率和鲁棒性等;与单个Agent 相比, MAS 具有以下特点:每个成员Agent 仅拥有不完全的信息和问题求解能力(故其观点是有限的),不存在全局控制,数据是分散或分布的,计算过程是异步、并发或并行的。MAS 的研究历史最早可以追溯到80 年代中期的Actors 模型,接着是 Davis 和 Smith 提出的合同网协议。合同网协议至今仍被认为是关于通信、MAS 协商研究的经典工具。目前
9、,MAS 研究的主要方面包括:MAS 论、多 Agent 协商和多Agent 规划。其他比较热门的MAS研究还包括MAS 在 Internet 上的应用、移动Agent 系统、电子商务、基于经济学或市场学的 MAS 等。移动Agent 可以自主地在网络上从一台主机移动到另一台主机上连续运行,这种灵活性为网络环境,尤其是Internet 环境下的应用程序提供了很多潜在的优点。目前,已经有不少较为成功的Agent 移动系统。MAS 与联合意图名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第
10、 2 页,共 7 页 - - - - - - - - - 对于 MAS ,除了要考虑上述因素外,还要考虑到多个Agent 意识态度之间的交互问题,这是 MAS理论研究的重要部分之一。能够对环境中其他Agent的意识态度进行推理是Agent间共存、竞争或协作的要求Agent 之间的协同、协商和协作行为是在其各种精神状态的支配和控制下才产生、进行、和完成的。 与共享精神状态相关的理论主要涉及到相互信念、联合目标和联合意图等概念。其中以联合意图为代表,在多Agent 环境下,相互信念即是所谓的公共知识,它与多Agent通信密切相关。从目前的研究现状来看,对联合意图的研究不外乎是以下两种观点:(1)宏
11、观点, 即在每个个体( Agent)外存在一种联合意图控制整个组织或社会(MAS )的协作行为; (2)微观点,即每个成员的意识态度导致个体动一起完成协作目标。Haddadi 提出的关于联合意图的社会或组织观点和个体观点即分别属于上述两种观点。Jennings 提出的关于联合意图的承诺和公约也分别对应于上述两种观点。Bratman 和 Rao等人提出联合意图的要求,则只限于微观点, 他们认为每个团队成员都对联合行为做出承诺,联合意图是实现共享联合目标的方法,成员间要相互承诺,并及时把各自动作的成功或失败通知给其他成员。下面给出一些与联合意图相关的典型的形式化工作。Rao 和 Georgeff等
12、人基于单个Agent 系统的 BDI 模型,递规定义社会Agent 的概念,引入了设社会规划。Wooldridge和Jennings已承诺和公约概念为基础, 用分支程序逻辑建立了协作问题求解系统的形式的形式化框架。 Haddadi 基于 BDI 逻辑给出了一个协作系统的形式化模型。并且还说明了该模型在 COSY 系统中的应用。多 Agent 协商协商是 MAS 实现协同、协作、冲突消解和矛盾处理的关键环节,有关多Agent 的关键技术可以概括为协商协议、协商策略和协商处理三方面的内容。协商协议的主要研究内容是Agent 通信语言 (ALC) 的定义、表示、处理和语义解释。M ller 认为协商
13、协议的最简单形式是如下一条协商通信消息:( 协商原语 , 消息内容 ) 。其中协商原语即消息类型,它的定义通常基于言语行为理论。消息内容除包含消息的发送者、接收者、 消息信号、 发送时间等固定信息外,还包括与协商应用的具体领域有关的信息描述。协商协议形式化表示方法通常由三种:巴科斯范式表示、有限自动机表示和语义表示。巴科斯范式表示具有简洁、明了的特点, 是最常用的表示方法。采用纯语义表示的协商工作不多,研究者更多的是给除非形式化的语义解释。Agent 通信语言中最著名的是KQML语言。协商策略是 Agent 决策和选择协商协议和通信消息的策略。协商策略包括一组与协商协议相对应的元级协商策略和策
14、略的选择机制或函数两部分内容。协商策略基本上可以分为五类:单方让步、竞争型策略、协作型策略、破坏协商和拖延协商。后两类策略显然不利于推进协商进程,而单方让步策略只在协商陷入僵局或协商不再有意义时才起作用,所以只有竞争型和协作型策略才是有意义的。竞争型策略一般是指协商参与者坚持自己的立场,在协商过程中表现出竞争行为,是协商结果向有利于自身利益方向发展。合同网协商模型、基于策论的协名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 7 页 - - - - - - - - - 商过
15、程等都属于此类。协作型策略则是指协商各方都从系统利益出发,在协商过程中相互合作,他们采取的协商对策有利于寻找相互能接受的协商结果。采用协作型策略的协商过程包括部分全局规划、FA/C 等。 Agent 应动态、智能地选择适宜的协商策略,从而在系统运行的不同时刻表现出不同的竞争或协作行为。策略选择的通常方法是以具影响协商的多方面因素,给出适宜的策略选择函数。策略选择函数可能包括效用函数、比较匹配函数、兴趣或爱好函数等几种。 策略选择函数的设计除了要综合考虑影响协商的各种因素外,还要考虑冲突综合消解以及与应用领域有关的属性等。协商处理包括协商算法和系统分析两部分内容。协商算法用于描述Agent 在协
16、商过程中的行为,包括通信、决策、规划和知识库操作等。系统分析的任务是分析和评价Agent 协商的行为和性能, 回答协商过程中的求解质量、算法效率以及系统的公平性和死锁等问题。协商协议主要处理协商过程中Agent 间的交互,协商策略主要涉及Agent 内的决策和控制过程,而协商处理则侧重于对单个Agent 和多个 Agent 协商社会的整体协商行为的描述和分析。前两者描述了多Agent 协商的微观方面,后者刻画了多Agent 协商的宏观层。有关 MAS 协商的典型工作有下面几个。Sycara 以劳资协商为背景对非协作类的多Agent相互作用进行了研究, 给出基于实例推理和多属性效用优化理论的“劝
17、说性辩论” 模型。 Crosz等人在会谈理解研究中,给出支持人机交互通行的形式化模型。Wellman 等人把面向视场方法用于设计Agent 间的协调过程, 提出所谓基于一般平衡理论的“面向市场程序设计”机制。还有基于经济学理论、对策论和Nash平衡理论的多Agent 协商研究等。多 Agent 规划规划是连接精神状态与动作执行之间的桥梁,有关动作和规划的研究一直是Agent 研究的活跃领域。 MAS 中的规划与经典规划不同,属于适应性规划,需要反映出环境的持续变化。目前对 MAS 中规划的研究主要从如下两个不同的角度进行:(1)将规划看作是一种可以在世界状态间转换的抽象结构,典型的如与或图;(
18、2)将规划看作是一类复杂的Agent精神状态。 这两种方法都在一定程度上降低了经典规划中解空间搜索的代价。从而有效地指导了资源受限Agent 的决策过程。 其中第一种方法应用更广。常用的方法是将Agent 的规划库定义为一个与或图结构,其中的每一条规划包括以下四个部分:(1)规划目标, 这是规划的点火条件,表示该条规划能达到的目标;(2)规划前提,表示该规划被执行前必须满足的环境或状态条件; (3)规划体;是规划的程序部分由规划序列和规划子目标组成;(4)规划结果,表示执行规划后对环境后状态的更新结果。如何在自私的多Agent 动态环境中实现Agent 的灵活通行和动作执行,是当前MAS 规划
19、的热点。目前,多数MAS 规划方法存在以下不足之处:多Agent 规划不太适合动态变化的环境; 很多型式化较好的理论模型与实际距离太远;如何更好地解决多Agent 规划中的资源冲突;如何在多Agent 规划中引入质量因素等等。这些方面是现在、乃至将来Agent 规划研究的方向和趋势。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 7 页 - - - - - - - - - 1.2.机器人足球概况机器人足球赛是由硬件或仿真机器人进行的足球赛,比赛规则与人类正规的足球赛类似。
20、硬件机器人足球队的研制涉及计算机、自动控制、传感与感知融合、无线通讯、精密机械和仿生材料等众多学科的前沿研究与综合集成。仿真机器人足球赛在标准软件平台上进行,平台设计充分体现了控制、通讯、传感和人体机能等方面的实际限制,使仿真球队程序易于转化为硬件球队的控制软件。仿真机器人足球的研究重点是球队的高级功能,包括动态不确定环境中的多主体合作、实时推理规划决策、机器学习和策略获取等当前人工智能的热点问题。 概括地说, 机器人足球是以体育竞赛为载体的前沿科研竞争和高科技对抗,是培养信息自动化科技人才的重要手段,同时也是展示高科技进展的生动窗口和促进科技成果实用化和产业化的新途径。1.2.1 历史发端机
21、器人足球的最初想法由加拿大不列颠哥伦比亚大学的Alan Mackworth教授于 1992 年正式提出。日本学者立即对这一想法进行了系统的调研和可行性分析。1993 年, Minoru Asada(浅田埝)、 Hiroaki Kitano (北野宏明)和Yasuo Kuniyoshi 等著名学者创办了RoboCup 机器人足球世界杯赛(Robot world cup soccer games,简称 RoboCup) 。与此同时, 一些研究人员开始将机器人足球作为研究课题。隶属于日本政府的电子技术实验室( ETL )的 Itsuki Noda(松原仁)以机器人足球为背景展开多主体系统的研究,日本
22、大坂大学的浅田埝、美国卡内基梅隆大学的Veloso 等也开展了同类工作。1997 年,在国际最权威的人工智能系列学术大会第 15 届国际人工智能联合大会(The 15th International Joint Conference on Artificial Intelligence,简称 IJCAI-97 )上,机器人足球被正式列为人工智能的一项挑战。至此,机器人足球成为人工智能和机器人学新的标准问题。1.2.2 历届杯赛情况第一届 RoboCup机器人足球世界杯赛于1997 年 8 月 25 日在日本名古屋与IJCAI-97联合举行。来自美、欧、日、澳的40 多支球队参赛,观众达5000
23、 余人。第二届杯赛于1998年 7 月 4 日至 8 日在法国巴黎与第16 届世界杯足球赛同时举行(当年没有IJCAI 大会),参赛队达 60 多支。 1999 年 7 月 28 日至 8 月 4 日,第三届RoboCup世界杯赛及学术大会在瑞典斯德哥尔摩与IJCAI-99联合举行,参赛队多达90 余支。 2000 年 8 月 25 日至 9 月 3 日,第四届杯赛及学术大学在澳大利亚墨尔本举行,正式参赛队首次突破100 大关,达104 支。一些著名的大学(如美国CMU 和 Cornell等,德国Humboldt) 、国立研究院(如美国NASA )和大公司(如日本SONY )均参与了相关的活动
24、,中国首次参赛,中科大首次参赛并且取得第九名的不俗战绩。 2001 年 8 月 2日至 10 日, 第五届杯赛和学术会议在美国的西雅图举行,约有 100 多支球队参加。 清华大学仿真组、中国科大仿真组及四腿组参赛,清华大学仿真组获得冠军,中国科大队进入双8。第六届RoboCup于 2002 年 6 月 19 25 日在日本福冈举名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 7 页 - - - - - - - - - 行,更多的球队参加。清华大学、北京理工大学仿真组分获冠
25、亚军,科大的仿真和四腿组也取得了不错的成绩。第七届RoboCup 2003 年 7 月 2 11 日在意大利帕多瓦举行,中国的科大、清华、 浙大、 北理和上海交通大学参加了比赛并取得了不错的成绩。是 RoboCup有史以来最盛大的比赛。 比赛项目也是从最初的仿真组、小型组、 中型组到现在的仿真组、小型组、中型组、 Sony 四腿组、机器人营救、中小学生初级组以及类人机器人、舞蹈机器人表演赛(即将成为正式比赛) 。1.2.3 组织机构国际 RoboCup联合会是世界上规模最大的、占主导地位的机器人足球国际组织,总部设在瑞士, 现有成员国近40 个。联合会现任主席是国际著名科学家、在 IJCAI-
26、93大会上获得国际人工智能最高奖“计算机与思维”大奖的北野宏明。联合会负责世界范围的学术活动和竞赛, 包括每年一届的世界杯赛和学术研讨会,并为相关的本科生和研究生教育提供支持(教材、教学软件等) 。除国际 RoboCup 联合会之外,还有其他一些国际组织。其中较大的一个是FIRA ,该组织总部设在韩国大田,现有成员国20 多个,每年举办一次国际性比赛。FIRA 与 RoboCup的主要区别之一是采用不同的技术规范:FIRA 允许一支球队采用传统的集中控制方式,相当于一支球队中的全体队员受同一个大脑的控制;而RoboCup 要求必须采用分布式控制方式,相当于每个队员有自己的大脑,因而是一个独立的
27、” 主体 ” 。1.3 MAS 与 Robocup 在第 15 届国际人工智能联合大会上,由Kitano, Veloso 和 Tambe 等来自美、日、瑞典的 9 位国际著名或知名学者联合发表重要论文” The RoboCup synthetic agent challenge 97 ” ,系统阐述了机器人足球的研究意义、目标、 阶段设想、 近期主要内容和评价原则。概括的说,过去 50 年中人工智能研究的主要问题是” 单主体静态可预测环境中的问题求解” ,其标准问题是国际象棋人机对抗赛;未来 50 年中,人工智能的主要问题是” 多主体动态不可预测环境中的问题求解” ,其标准问题是足球的机机对抗
28、赛和人机对抗赛。从科学研究的观点看,无论是现实世界中的智能机器人或机器人团队(如家用机器人和军用机器人团队),还是网络空间中的软件自主体(如用于网络计算和电子商务的各种自主软件以及它们组成的”联盟 ” ) ,都可以抽象为具有自主性、社会性、反应性和能动性的” 自主体 ” (agents) 。由这些自主体以及相关的人构成的多主体系统(multi-agent systems) ,是未来物理和信息世界的一个缩影。 其基本问题是主体(包括人) 之间的协调, 可细分为自主体设计、多主体体系结构、自主体合作和通讯、自动推理、规划、机器学习与知识获取、认识建模、系统生态和进化等一系列专题。这些专题有的是新提
29、出的(如” 合作 ” ) ,有的是过去未能彻底解决并在新的条件下更加复杂化的(如机器学习)。这些问题不解决,未来社会所需的一些关键性技术就无名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 7 页 - - - - - - - - - 法得到。值得注意的是,上述一系列问题中的大多数都在机器人足球中得到了集中的体现。在这个意义下, 将机器人足球作为未来人工智能和机器人学的标准问题是十分恰当的;这主要是由于机器人足球具有以下特点:(1)典型性。如上所述,RoboCup 机器人足球
30、队的研制涉及当前人工智能研究的大多数主要热点,因而构成一个典型问题。(2)可行性。多主体系统的绝大多数实际背景十分复杂,以致研究人员在目前的条件下难以把握, 无法兼顾具体细节分析与基本问题探索。而在机器人足球中则较易兼顾二者,易于深入。(3)客观性。比赛提供了一种实验平台和评价各种理论与技术的客观方法,便于研究者的” 自我观察 ” 和相互交流。(4)综合性。在以往的研究中,各种技术通常被分别开发和考察,综合集成工作一般由面向最终用户的应用部门来完成,这种方式不利于相关技术在更高层次上的衔接和在更深层次上的创新。机器人足球是第一个深层的” 综合平台 ” 。因此,开展机器人足球研究是人工智能从基础
31、理论走向实际应用的一个战略性步骤。所以我们在研究MAS的时候就选择了机器人足球作为我们的研究平台。我们在研究Robocup机器人足球的时候也是从比较简单不需要其他因数譬如说机械、图像处理的robocup 仿真组比赛( Simulation Game )作为我们的切入点。下面简要介绍一下robocup 仿真组比赛是如何和 MAS结合在一起的。仿真组比赛采用Soccer Server1作为一个标准比赛平台。Soccer Server 是一个允许竞赛者使用支持UDP/IP 的任何程序语言进行仿真足球比赛的系统,整个系统按照100 毫秒的周期运转,比赛以Client/Server方式进行。 Serve
32、r ,即 Soccer Server ,提供了一个虚拟的足球场地, 并对比赛双方的全部队员和足球的移动进行仿真。Client,相当于球员的大脑, 指挥球员的运动, 每个 Client控制一个球员。 Server 和 Client之间的通信是通过UDP/IP协议进行的。通过这种方式,Server 向 Client发送有关的赛场信息(如视觉、听觉信息),Client端通过对这些信息进行分析,产生相应的控制指令,并发送到Server ,以控制相应的队员。要赢得一场足球比赛,单靠个人能力是不可能的,必须有全体队员的相互配合与协作(即 teamwork);同样,要提高一个多主体系统的性能也需要各个主体之间的协调与配合。 因此,在这个系统中,提供了一个与实际环境很接近的多智能体实时环境,在其中既有合作又有对抗。研究者可以在这套平台上设计自己的球队,用以评价各种理论、算法及策略的可行性。实际上, robocup 其他各组别的比赛也都是类似的MAS 系统。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 7 页 - - - - - - - - -