2022年有限理性下的进化博弈与合作机制 .pdf

上传人:Q****o 文档编号:26166731 上传时间:2022-07-16 格式:PDF 页数:13 大小:135.12KB
返回 下载 相关 举报
2022年有限理性下的进化博弈与合作机制 .pdf_第1页
第1页 / 共13页
2022年有限理性下的进化博弈与合作机制 .pdf_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《2022年有限理性下的进化博弈与合作机制 .pdf》由会员分享,可在线阅读,更多相关《2022年有限理性下的进化博弈与合作机制 .pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1 有限理性下的进化博弈与合作机制王先甲1,刘伟兵2 1. 武汉大学经济与管理学院,武汉,430072 2. 武汉大学政治与公共管理学院, 武汉 430072 摘要:在介绍传统博弈论基本假设的基础上,指出完全理性是传统博弈论均衡选择的最基本假设和完全理性在动态博弈中的局限,提出有限理性与动态学习是动态博弈中多个智能体选择的基础;探讨了不断改善有限理性的进化学习方法和智能体选择机制;解释了进化博弈与进化稳定策略的本质;指出了传统博弈论与进化博弈论的区别;提出了有限理性下进化博弈与合作机制研究的问题,给出了有限理性下进化博弈与合作机制的研究结果。关键词:进化博弈;有限理性;强化学习;复制动态;进化

2、稳定策略中图分类号 :0225文献标志码 :Evolutionary Game and Cooperation Mechanisms Based on Bounded RationalityWang Xianjia1,Lui Weibing2(1. Economics and Management School of Wuhan University , Wuhan 430072, China;2.School of Political Science and Public Administration Wuhan University , Wuhan 430072, China)Abstra

3、ct: This paper indicates that complete rationality is the basic assumption of traditional game theory and leads to the limitations in dynamic game by introducing the basic assumptions of traditional game theory. This paper brings forwardbounded rationality and replicator dynamics are the foundation

4、of multi-person selection, explores evolutionary learning methods of improvingbounded rationality and the selected mechanism indynamic game. In addition, this paper resolves the essence of evolutionary game and evolutionary stableequilibrium, points out the deference between traditional game theory

5、and evolutionarygame theory. Finally, this paper proposes the problems about evolutionary game theory and cooperation mechanisms and gives research results about evolutionary game theory and cooperation mechanisms under bounded rationalityKey words: Evolutionary game theory; bounded rationality; enf

6、orcement learning; replicator dynamics; evolutionary stable equilibrium.基金项目 :国家自然科学基金( 71071119) 王先甲( 1957-) ,男,博士,教授,研究方向:决策分析,博弈论;刘伟兵(1981-) ,博士,讲师,研究方向:博弈论,公共管理决策。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 13 页 - - - - - - - - - 2 引 言经济学家和管理学家们发现一切社会关系和

7、管理活动背后的人类行为中包含了丰富的博弈关系,即多个利益智能体之间相互作用的关系(1 )。同时,生物学家和生态学家们也发现生物种群内和生物种群间的相互行为关系本质上也是多个生物智能体或生物智能种群间的博弈关系(2,3). 因此,分析博弈关系能有效揭示人类相互作用的行为规律和生物体间及生物种群间的行为规律。博弈论是一种公认的研究多个智能主体(下称参与人或个体)间相互作用关系的重要理论方法。自 Nash(4 )以来,博弈论现在已经成为主流经济学和管理学最核心的内容和几乎成为所有领域经济学家和管理学家的基本分析工具及共同研究语言(5 )。我们把以Nash 为代表的博弈论称为传统博弈论。传统博弈论建立

8、在如下基本假设下:(1)参与人是完全理性的:知道如何追求自己的利益最大化和有无限的信息处理与计算能力;(2)共同知识性:参与人是理性的是共同知识;(3)博弈结构和博弈环境在博弈发生前事先给定。传统博弈论理论就是在这些假设下探讨所有参与人的理性行为判据。 Nash 均衡是博弈模型的最重要的解概念,它是有效刻划多个参与人相互作用理性行为的判据。然而,传统博弈论的这些假设早在上世纪70 年代就受到挑战(6),这种挑战在动态系统博弈中显得尤为突出(7 ),“囚徒困境( Prisoner s Dilemma game)”、“公共地的悲剧(tragedy of the commons)( 2 )”等问题在

9、传统博弈论框架下无法解决”。于是,有限理性和变化的博弈结构与博弈环境被提出。然而,有限理性至今是一个没有准确界线的概念。那么,如何认识、理解和描述有限理性和变化的博弈局势呢?由于以有限理性为基础考虑变化结构与环境的博弈分析框架与建立在达尔文自然选择思想基础上的生物进化理论的分析框架很相似,例如人类在遇到复杂问题时一般会由直觉引发行为方式,并会模仿成功者的行为,这与其他生物的行为很接近;人类的竞争合作行为与动物世界的竞争合作也是很相似的,借鉴研究生物种群性状进化和稳定机制的方法来分析人类的行为是一种有效的借鉴类比研究思想与方法。更重要的是,借鉴生物进化理论与生物行为规律的分析方法还可以模拟博弈均

10、衡解的动态实现过程。在生物进化思想的启发下,Maynard Smith和 Price将生物理论中的进化思想引入了博弈论,并于1973 年发表了创造性的论文动物冲突的逻辑(6 ),这种起源于生物进化理论的博弈分析方法就被称为“进化博弈论”。本质上,进化博弈论是研究群体中个体间相互作用的合作进化的数学模型方法(8 )。进化博弈认为群体中个体间的相互作用是一个关于他们所面对的局势(博弈环境与参与人状态)不断变化的动态过程,并且博弈局势与参与人行为相互依赖。这表明进化博弈描述了博弈前没有被给定的博弈结构与环境。另外,在进化博弈中,参与人的理性是根据博弈局势的变化不断进化的,个体的有限理性在进化过程中被

11、表征。理性实际上是个体进行选择时所依据的规则,经常可描述成个体选择偏好。于是,在进化博弈中, 有限理性被表述成个体在对博弈局势的认识与学习中确定动态进化的行为选择规则(或名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 13 页 - - - - - - - - - 3 选择偏好)。1 选择与学习自然选择确定博弈局势,个体对博弈环境局势的学习进化和基于这一进化的理性进化确定了个体的行为选择规则,也由此形成个体间的博弈规则,正是因为这种对适应博弈局势变化的有限理性行为选择规则促

12、使群体间相互作用的合作进化。相互作用的个体所处的动态博弈局势是由自然选择进化形成的。进化过程包括突变过程和自然选择过程。突变可以由个体特性的变化描述,自然选择主要是对个体的选择(包括对突变个体的选择)。于是,博弈局势的动态变化可以用定义在博弈局势链上的一个动态映射刻划,遗传算法其提供了有效方法( 9 )。个体特性进化依赖于它对博弈局势的学习,10 提出了四种学习方法:自然选择学习、模仿学习、增强学习和最优反应学习。11 提出了三种学习模型:基于信念的学习、增强学习和模仿学习。 12 提出了基于信号反馈学习方法;Young 认为进化过程中的学习过程可由一个马尔可夫链描述( 13 )。个体基于对博

13、弈局势的动态学习,如果它们被选中参与博弈,他们的理性选择规则也随着它们从动态博弈局势中学得的知识进化。11 提出一种理性策略进化模式和进化对理性策略集的作用。 7 探讨了在进化过程中描述个体理性的个体效用或支付的变化和理性策略对博弈局势的相互关系。 14 提出通过学习其它个体的类型确定理性进化方法。这些我们可以看作为对个体有限理性在动态进化中的不同描述方法。在进化博弈过程中,由个体进化理性选择规则确定的个体行为可能促使种群间的合作。从而实现种群整体利益最大化或保持生物的多样性。人类行为和生物行为的合作基于如下理念:互惠、声誉、惩罚和利他。3 基于互惠研究了有限种群中合作现象出现的可能;15 基

14、于互惠探讨了社会经济系统中社会群体与社会个体动态合作特性。14 基于声誉以囚徒困境为例,在动态博弈中博弈外在环境的变化和个体对这种变化的学习是促进个体合作的主要原因,但这种合作只能在少量种群间才有可能,从而解决囚徒困境问题。2 和7 基于惩罚研究了公共物品的社会悖论(如“公共地的悲剧”)在动态进化博弈中的合作现象。16 用非传递博弈模型动态进化特征揭示了种群合作形成的生物多样性。17 基于利他分析了在囚徒困境动态博弈中的合作行为。国内关于进化博弈理论研究文献很少,尚不见国内重要杂志发表相关理论论文,现发表于国内杂志的论文主要是进化博弈的简单应用。在进化博弈的研究中关于自然选择、个体学习、个体理

15、性进化和个体合作行为的研究尚处于初步发展阶段( 2,3)。当前关于进化博弈中的自然选择主要注重自然法则(自然规律)的作用,自然法则可以完全分析无生命问题的规律,但进化博弈涉及多个有智能特性的生命体间的相互关系,它服从自然法则,但它还服从智能生命体发展运动规律。当前关于个体对博弈局势的学习方法的研究缺乏对信息的接收处理和表示方法;由马尔可夫链描述智能个体学习过程也有较大的局限性。个体有限理性进化与个体学习没有建立起一致关系;种群间和种群中个体间的合作尚未找到内在规律,只在特定名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心

16、整理 - - - - - - - 第 3 页,共 13 页 - - - - - - - - - 4 种群间和种群中个体间分析了促进合作的因素( 3),等等。因此,需要探讨进化博弈中博弈局势的自然选择机制,个体对博弈局势的学习机制与学习方法的表示,基于个体学习的个体理性选择规则的进化机制、种群间和种群中个体合作的内在机理。这里最根本的问题是智能体有限理性在进化博弈动态中的进化理性机制和种群合作形成的机理。完全从达尔文进化论和基因的遗传变异理论的角度解释具有智能个体的理性进化过程只考虑服从自然法则,未考虑服从智能体法则。因为智能体行为中的理性进化实际上是一个学习的过程,与基因通过遗传变异而进化相比

17、,智能体的选择和学习有明确的目的性,不完全是一个自然随机选择过程。对智能体行为中理性进化过程的描述必须要体现生物有目的性的智能特性,必须要能模拟人类在社会经济环境中的现实行为。而这些现象是达尔文进化论无法描述和解释的。基于群智能方法的演化技术更能确切的描述人类经济行为中理性的进化,它比基于基因遗传变异理论的演化技术(18 )更具现实意义。因为基因遗传变异理论描述的是生物进化的自然随机属性,而群智能方法是模拟生物群体的选择有目的性的智能选择行为的属性,蕴涵了生物体之间合作与学习的社会属性。作为现实社会中具有目的性、智能性和社会属性的人,他们的经济行为更符合用群智能方法所提出的模型描述。作为一种群

18、智能描述方法,粒子群优化(Particle Swarm Optimizer, 下简记为 PSO )源于对鸟群捕食行为研究的启发, 由 Eberhart和 Kennedy(19 )于 1995 年提出。他们的研究表明:PSO模型能很好地刻画了群体中的相互学习和理性的进化过程,并且 PSO 模型很容易在计算机上实现, 具有便于建模仿真的极大优势。构建智能体有限理性在进化博弈中的进化机制与模式,应用粒子群优化技术建立粒子群进化博弈模型,并将在粒子群进化博弈模型的基础上模拟有限理性的人在现实社会中通过学习与模仿及理性不断进化的过程。与马尔可夫链描述智能个体在随机环境下的学习过程相比,拟生灭过程(qua

19、si birth and death process ,下简记为QBD )有更强的优势。因为在种群大量个体的行为关系中具有多层次、多相位,变动参数、不确定性等复杂特性,QBD正是为了刻画随机过程在多层次、多相位,变动参数及不确定性情况下演化的要求而发展起来的。QBD是经典的生灭过程从一维状态空间到二维状态空间的推广。QBD适合研究复杂的理性进化过程,适用分析理性进化过程中群体之间相互竞争、相互影响的随机过程( 20 )。通过引入拟生灭过程理论,有限理性进化的复杂随机过程和带有不确定信息以及非对称条件下的博弈过程的描述将更精确;特别是博弈均衡解的实现过程也将得到更加深刻的刻划。另外,Eberha

20、rt和 Kennedy(19 )认为PSO模型能很好地刻画了群体中的相互学习和理性的进化过程。粒子群优化体现了群体智能的相互作用,每个粒子一方面按自己的经验在策略空间寻找最优,另一方面按群体的经验在策略空间寻找最优。这里包含了自我学习和社会学习两个部分。用QBD和 PSO理论分析带有不确定性的理性进化过程原理和学习进化模式,并通过研究拟生灭过程的平稳分布来分析进化博弈模型的博弈均衡的实现。Pielou (1969)( 21 )在简单的生灭过程基础上,提出了单个种群的名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 -

21、 - - - - - - 第 4 页,共 13 页 - - - - - - - - - 5 随机增长模型。但是多个种群之间有相互竞争和相互影响,简单的生灭过程无法解释多个种群之间动态变化的相互关系。需要研究应用基于QBD博弈模型和PSO理论研究种群之间相互竞争的动态增长关系和合作机理,应用基于QBD的进化博弈模型分析种群之间相互竞争的动态增长关系,结合PSO理论对智能体有限理性的进化作用,分析智能体由不断进化的有限理性确定的行为选择规则所揭示的合作机理。2. 进化博弈与进化稳定策略传统博弈论中有一个基本的假设:博弈人是完全理性的,并且理性是共同知识。不管博弈人的偏好如何, 非合作博弈论总假设在

22、给定其他博弈人行动策略的情况下,博弈人选择使自己获得最大效用的行动。理性假设使得博弈论总是在一定的经验性原则下进行研究,从而逐渐暴露出一些问题,严重影响了博弈论的发展。完全理性假设与现实世界不符,因为它不仅意味着博弈人在任何情况下都不会冲动和不理智、不会犯任何错误, 而且还要相信对手也是完全理性的,即要求博弈主体在复杂的博弈环境中,对于博弈的结构、各博弈方的情况和特征,包括信息和知识结构等有准确的认识、分析和判断能力,而且在此基础上能够准确地进行推理。但事实上,不仅个人容易犯错,集体决策也会经常出错。所以,博弈人在大多数比较复杂的决策问题中表现出来的理性都无法满足这种完全理性的要求。对完全理性

23、的质疑,使得Nash 均衡在一定条件下也无法实现,从而也使得建立在有限理性基础上的进化博弈论迅速发展起来。进化博弈论假设博弈人是有限理性的,认为经济社会中博弈人不可能对信息变化做出迅速的最优反应,强调变化的动态过程。进化博弈论的思想起源于达尔文的生物进化论和拉马克的遗传基因理论。进化博弈论的发展也经历了一段较长的过程。20 世纪 60-70 年代,可以说是进化博弈论的萌芽阶段,这时期生物学家应用纯数学理论建立生态演化系统的模型用于解释生态现象(22-23)。生物进化论与博弈论在各自领域的迅速发展为进化论与博弈论的结合提供了理论条件。1973 年 Maynard 和 Price在总结前人研究理论

24、的基础上首次提出了进化博弈论的基本均衡概念进化稳定策略(evolutionary stable strategy) ,并不断进行了完善,认为生物行为是由采用不同纯策略的程序设定,比较成功的策略的基因将有比较高的适应度(6,24-25)。这一均衡概念的提出使得进化博弈论的研究有了明确的方向,同时也为进化博弈论的发展奠定了坚实的基础。Maynard 等人的开创性论文随即引起了大量的进化博弈理论的研究与应用。1978 年, Taylor和名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5

25、页,共 13 页 - - - - - - - - - 6 Jonker 在研究生态演化现象时提出了著名的复制动态模型(replicator dynamics model) ,复制动态模型能用来描述了单群体策略的动态调整过程(26)。1980-1988 年间,Selten对非对称两种群进化博弈作了深入研究, 证明了进化稳定策略必定是严格纳什均衡的论断。Selten认为, 将进化均衡概念由单种群扩展到多种群不是一个简单的过渡,而是涉及到系统的动态调整过程的一系列变化(27-29)。Hammerstein则认为,在非对称博弈中,个体更倾向于应用进化稳定策略来选择行为并决定竞争结果(30)。Fuden

26、berg 研究了进化博弈中博弈人的动态学习过程(31)。Friedman 在研究非对称博弈时得出:渐进稳定均衡必定是纳什均衡,而且他认为在对称和非对称博弈中,对所有单调调整过程而言,进化稳定策略不一定是渐进稳定的(32)。Swinkels对进化稳定策略也进行了研究,他认为在研究进化稳定策略时应对突变策略给予适当的限制条件(33-34)。随着进化博弈理论研究的深入,其应用领域也不断拓展。1981 年, R.Axelrod 和 Hamilton将进化博弈理论引入到经济学领域,用于分析社会制度变迁(8,35)。Young 利用进化博弈理论研究了社会习俗形成的相关问题(13,36)。Hansen 和

27、Samuelson 将进化稳定策略定义为普遍生存策略,利用普遍生存策略分析了经济博弈中的进化过程(37)。Schaffer研究了有限群体的进化稳定策略,并应用进化稳定策略研究了寡头企业之间的竞争问题,认为在经济自然发展过程中,得以生存下来的策略不是绝对的利润最大化策略(38)。Tanaka 定义了全局生存策略,利用复制动态模型研究了差别产品对称寡头企业的竞争情形,认为在价格与数量竞争的寡头市场中,全局生存策略都是随机稳定的并且在两种情况下它们是等价的(39)。还有学者将进化博弈论用来解释货币现象、研究行业的发展演化以及模拟股票市场中价格走势等(40-42。纳什均衡是传统博弈论中的基本均衡概念,

28、而进化稳定均衡则是进化博弈理论中最基本的均衡概念,是由Maynard Smith 和 Price 在研究生态演化问题时提出来的。所谓进化稳定策略是指如果占群体绝大多数的个体选择进化稳定策略,那么小的突变者群体就不可能侵入到这个群体。这一概念的基本思想是: 如果一个群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的支付, 随着时间的演化突变群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。Maynard Smith和 Price给出进化稳定策略的数学定义为:定义 2.1 S

29、x称为进化稳定策略,如果yxSy,,存在一个)1,0(y,使得不等式)1(,)1(,xyyuxyxu对任意),0(y都成立。其中,S为策略集,y表示突变策略,y是一个与突变策略y相关的常数,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 13 页 - - - - - - - - - 7 称为侵入界限,xy)1(表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。进化稳定策略也可用如下定义等价表示:定义 2.2 设m为策略组合,U为效用函数,对于所有不同于*s的ms

30、,如果有),(),(*ssUssU如果上式中的等式成立,则),(),(*ssUssU那么,称*s为进化稳定策略(ESS ) 。从以上定义可以看出:进化稳定策略是这样一个策略,当博弈人在选择它时,另一个策略不能侵入它,因为选择其他策略对当前状况不可能改善,也就是说当一个系统处于进化稳定均衡的范围内时,它能够抵抗来自外部的小冲击而不会偏离进化稳定状态。而且由等价定义容易看出,进化稳定策略是纳什均衡策略,但纳什均衡策略不一定是进化稳定策略。3进化博弈论研究现状及发展趋势3.1 进化博弈论研究现状进化博弈论的早期研究在生物学领域可以追溯到Fisher关于性别比例的研究,在经济学领域则可以追溯到Cour

31、not 对寡头市场产量竞争中产量调整过程的研究古诺模型。Nash对纳什均衡的群体行为解释则是包含较完整的进化博弈思想的最早理论成果。进化博弈论真正受到重视和获得迅速发展,是在 1973 年 Maynard Smith和 Price引进进化稳定策略概念以后。这其间,越来越多的生物学家和经济学家将进化博弈应用到生物学和经济学领域,Hirshleifer认为利用进化博弈模型来解释经济规律是一个很自然的事情,Jones 利用进化博弈论来解释货币现象。上世纪 80 年代, 随着传统博弈论研究和应用的深入,许多经济学家开始把进化博弈论引入到经济学领域, Axelrod和 Hamilton将进化博弈论用于分

32、析社会制度变迁;Porter利用进化博弈论研究行业的演化过程; 还有 Conlisk应用进化博弈论分析股票市场中股票的价格走势等等。Selton将对称进化博弈推广到非对称进化博弈,并取得了一定的成果。1992 年在康奈尔大学召开的进化博弈论会议标志着进化博弈论在经济学上的学术地位得到正式认可。随后,对进化博弈论的研究进入到了一个崭新的阶段。进化博弈论的应用不仅渗透到政治、经济学领域的各个方面,而且还应用到生物化学、进化计算、工程控制等方面。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - -

33、第 7 页,共 13 页 - - - - - - - - - 8 传统博弈论的研究框架是Nash分析法, Nash研究的非合作博弈论对于更好地理解社会、政治和经济中冲突和合作问题具有重大的作用。然而,尽管博弈论在近几十年得到了长足发展,纳什均衡的分析、求解、以及实现的问题却一直存在巨大的理论问题。首先,纳什均衡解的求解和实现就是一个非常困难的问题。对于纳什均衡的求解,Nash并没有给出构造性的证明,对于稍微复杂一点的博弈结构,现有的均衡分析方法便措手无策。在纳什的理论中,纳什均衡被解释为博弈方相互的最优反应,即给定对手在最优策略上,自己采取的策略是对对手策略的最优反应。然而,对手的最优策略本质

34、上是未知的,因此纳什均衡一般不能按这种最优反应的理解一步达到,特别是博弈常常存在多重均衡,即使在很强的理性假设下博弈方也无法预测对手的选择而共同达到均衡。而且, 现有的博弈论无法描述纳什均衡这样一个动态调整的实现过程,也无法解释博弈是如何趋向纳什均衡的,因此纳什均衡解的求解、实现问题一直是博弈论发展的一个主要障碍。更重要的是,经典的博弈理论是建立在完全理性的基本假设之上的,这个基本假设非常严格,实际上很难满足。它不仅要求行为主体始终以自身最大利益为目标,并具有在确定和非确定性环境中追求自身利益最大化的判断和决策能力,还要求他们具有在交互作用的博弈环境中完美的判断和预测能力以及对博弈中信息的无限

35、计算、处理能力;不仅要求人们自身有完美的理性,还要求人们相互信任对方的理性,有对理性的共同认识。事实上,人们在大多数比较复杂的决策问题中所表现出来的理性,都无法满足这种完全理性的要求,人们的个人选择甚至集体决策都会经常犯错误,这表明人的理性不是完全的而只是有限的。因此, 要准确地分析和预测各种社会经济关系和不同相互作用主体间的行为关系及现象,就不得不考虑到人们理性方面的局限性,必须建立以有限理性为基础的博弈分析框架,这就是进化博弈论研究和发展的需要。3.2 进化博弈论研究发展趋势1980 年代以来以完全理性为基础的博弈理论遇到的理论困难,更进一步加强了博弈理论对进化博弈论的研究热情。 进化博弈

36、论从有限理性出发,认为经济系统中博弈人不能对信息变化做出迅速的最优反应,更强调博弈人的决策选择的模仿和学习过程,相比传统博弈论更贴近现实和更有说服力。这也是进化博弈论近年来取得飞速发展的根本原因。正是由于进化博弈论具有非常重大的理论作用和现实价值,而且它拓展了非常广阔的理论研究和应用领域,因此从1970 年代开始许多学者对其表示了极大兴趣进行了研究。特别是一些经济学家,包括从 1994 年开始的诺贝尔经济学奖获得者等大经济学家,都积极投身于对进化博弈论的研究。最近 20 年以来,对有限理性、进化博弈论和均衡选择关系、博弈学习理论、群体博弈与个体博弈间的合作机制等的理论研究,以及进化博弈论在经济

37、学、生物学和其他社会科学的理论和应用研究中的应用,一直是国名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 13 页 - - - - - - - - - 9 际经济学界,特别是博弈理论界最热闹和前沿的研究领域,产生了大量的研究成果。目前这种趋势仍在进一步发展,在未来相当长的时期中进化博弈论仍然将是博弈论和经济学最重要的前沿研究领域。4有限理性下进化博弈与合作机制研究的问题与研究结果4.1 有限理性下进化博弈与合作机制研究的问题从群智能方法的角度构建有限理性的博弈方在博弈中理

38、性进化的模式,应用粒子群优化模型描述群体中有限理性个体的自我学习和社会学习机制;构造PSO算法和平行PSO算法仿真模拟单群体与多群体中个体的策略调整动态;研究有限理性的个体通过长期学习进化的收敛结果,及其与Nash均衡的关系。应用拟生灭过程理论建立持续随机调整的学习进化模型,刻画在随机扰动的博弈环境中有限理性个体的学习调整动态,描述理性进化的不确定性过程。通过分析拟生灭过程的极限分布,研究在变化的博弈环境中随着个体理性的进化长期均衡的实现。建立有局部交互作用的群体模型,研究在不同的信息结构下个体基于对信息观测与处理的知识学习机制与学习方法。通过研究信息结构对个体学习机制和理性进化过程的影响,探

39、讨种群间和种群中个体间出现合作行为的内在机理和条件。要解决的关键问题是:(1)粒子群优化(PSO )模型描述种群中有限理性个体的自我学习和社会学习机制和构造PSO算法求解博弈的均衡解并分析其收敛性。(2)建立不同信息结构下个体基于对信息观测与处理的知识学习机制与学习方法。(3)应用拟生灭过程理论建立具有随机动态博弈局势中有限理性个体学习与进化的动态模型。( 4)发现和寻找种群间和种群中个体间出现合作行为的判据。通过解决这些问题,将达到如下目标:(1)寻找进化博弈中由自然法则和智能体相互作用法则确定的博弈局势的动态进化规律和智能体有限理性进化机制;(2)发现个体和种群基于对信息观测与处理的知识学

40、习机制与学习方法表示;(3)揭示种群间和种群中个体间出现合作行为的内在机理和条件。4.2 有限理性下的进化博弈与合作机制的研究结果(43-44 )(1)应用粒子群优化理论与虚拟行动、模仿者动态、刺激加强等学习模型建立描述群体中有限理性名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 13 页 - - - - - - - - - 10 个体的自我学习和社会学习机制模型。(2)构造进化博弈个体行为动态变化的PSO算法和并行PSO算法仿真模拟单群体与多群体中个体的策略调整动态,通

41、过收敛性分析研究理性进化导致的均衡,从而得到同时反映自然法则和智能体决策法则的个体在进化中的自然选择规律。应用演化算法、并行算法等优化算法理论分析粒子群进化模型的动态过程与收敛结果。(3)应用微分方程与动力系统的方法分析进化过程的稳定性与稳定状态的性质。(4)应用拟生灭过程理论描述进化博弈过程中随机动态博弈局势,通过分析拟生灭过程的极限分布,研究在变化的博弈环境中随个体理性进化长期均衡的实现,建立个体理性随机调整进化动态模型,建立个体有限理性的进化机制与模式。(5)引入复杂网络理论讨论有局部交互作用的群体模型中的信息传递结构与个体相互影响的规律。研究在不同的邻域和信息结构下个体的信息观测与处理

42、,以及他们的知识学习机制与学习方法,揭示种群间合作机理。结合进化博弈模型与种群生态学的种群增长理论,建立两个种群之间相互竞争的动态增长模型。应用合作博弈理论与机制设计理论研究种群间的合作机理。(6)探讨信息结构与理性进化过程的关系,揭示种群间和种群中个体间出现合作行为的内在机理和条件。参考文献:1 张维迎 . 博弈论与信息经济学M. 上海人民出版社,1996. 2 Semmann.D, Krambeck H et al. Volunteering leads to rockpaper scissors dynamics in a publicgoods gameJ. Nature, 2003,

43、425:390-393. 3 Martin A., Akira Sasaki et al. Emergence of cooperation and evolutionary stability in finite populations. Nature, 2004, 428 :646-651 4 Nash, J. The bargaining problemJ. Econometrica, 1950,18(1):155-163; 5 Tirole, J. The Theory of Industrial OrganizationM. MIT Press, 1990. 6 Maynard Sm

44、ith,J and G. Price The logic of animal conflictJ. Natrue ,1973, 246:15-18. 7 Akiyamaa.E, Kaneko K.Dynamical systems game theory and dynamics of games(1,2) J. Physica D 2000,147: 221258; Physica D,2002, 167: 3671 8 Axelrod R, Hamilton WD. The evolution of cooperationJ. Science,1981, 211: 1390 1396. 9

45、 David B. Fogel .An Introduction to Simulated Evolutionary Optimization J . IEEE 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 13 页 - - - - - - - - - 11 Transactions on Neural Networks, 1994, 5(1):3-15 10 Young, H.P . Individual learning and social rationalit

46、y J . European Economic Review,1998,42 :651-663 11 Weibull J W. Evolution, rationality and equilibrium in gamesJ. European Economic Review,1998, 42 : 641-649 12 Jacobsen, H J, Jensen, M and Sloth B. Evolutionary Learning in Signalling GamesJ. Games and Economic Behavior ,2001,34:3463 13 Young, H. P.

47、 The Evolution of ConventionsJ. Econometrica ,1993,61,5784. 14 McNamara1, J M, Barta1, Z & Houston, A I.Variation in behaviour promotes cooperation in the Prisoners Dilemma game J. Nature. 2004,428:745-749 15 Herbert Gintis .Modeling cooperation among self-interested agents: a critiqueJ . The Journa

48、l of Socio-Economics,2004, 33 : 695714 16 Benjamin K, Margaret A. et al. Local dispersal promotes biodiversityina real-life game of rock paper scissorsJ. Nature,2002,418: 171-174 17 Taksu Cheon. Altruistic duality in evolutionary game theoryJ. Physics Letters A, 2003, 318: 327332 18 Thomas Riechmann

49、 , Genetic algorithm learning and evolutionary gamesJ. Journal of Economic Dynamics & Control, 2001 25: 1019-1037 19 Kennedy J, Eberhart R C. Particle swarm optimization C. Proc. IEEE Int. Conf. Neural Networks. Piscataway, NJ: IEEE Press, 1995: 1942- 1948. 20 Tadj, L. A QBD approach to evolutionary

50、 game theory J . Appl. Math. Modelling, 2003,27: 913-927. 21 Pielou E C. An Introduction to Mathematical Ecology M. New York:Wiley, 1969. 22Wynne-Edwards, C. Animal Dispersion in Relation to Social Behavior M. Hofner, NewYork, 1962(28)23Rosen R. Dynamical system theory in biologyC. Vlos. 1 and 2, Wi

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁