《第三章-第五节-演化博弈模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章-第五节-演化博弈模型ppt课件.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五节第五节 演化博弈模型演化博弈模型“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。o传统博弈理论的两个苛刻假设:传统博弈理论的两个苛刻假设: (1 1)完全理性()完全理性(2 2)完全信息)完全信息o与传统博弈理论不同,演化博弈理论并不要求参与与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。人是完全理性的,也不要求完全信息的条件。o演化博弈论(演化博弈论(Evolutionary Game TheoryEvolutionary Game
2、 Theory)把博弈)把博弈理论分析和动态演化过程分析结合起来的一种理论。理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论。化博弈理论源于生物进化论。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。o为什么将演化思想引入到博弈论中?为什么将演化思想引入到博弈论中?(1 1)博弈论对
3、生物学的影响。博弈论的策略对应生)博弈论对生物学的影响。博弈论的策略对应生物学中的基因物学中的基因 ,博弈论的收益对应生物学中的,博弈论的收益对应生物学中的适应度。在生物学中应用的博弈论与经济学中的适应度。在生物学中应用的博弈论与经济学中的传统博弈论最大区别就是非完全理性的选择。传统博弈论最大区别就是非完全理性的选择。(2 2)演化化思想对社会科学的影响。例如,在市场)演化化思想对社会科学的影响。例如,在市场竞争中,我们不必要去理性的想那个策略才是最竞争中,我们不必要去理性的想那个策略才是最优的,最后能够在市场存活下来的企业,一定是优的,最后能够在市场存活下来的企业,一定是适应能力最强的公司。
4、适应能力最强的公司。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 在演化博弈理论中,演化稳定策略在演化博弈理论中,演化稳定策略 (Evolutionary Stable (Evolutionary Stable Strategy, ESS)Strategy, ESS)和复制动态和复制动态(Replication Dynamics)(Replication Dynamics)是两个核是两个核心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有心概念。演化稳定策略是指在博弈的
5、过程中,博弈双方由于有限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。于是,博弈方在博弈的过程中需要不断进行学习,有过策略失于是,博弈方在博弈的过程中需要不断进行学习,有过策略失误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个稳定的策略。稳定的策略。 复制动态实际上是描述某一特定策略在一个种群中被采用复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动
6、态微分方程,可以用下式表示:的频数或频度的动态微分方程,可以用下式表示:(, )( , )iixistdxuxu x xd“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。o当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演化博弈稳定性问题这就是演化博弈稳定性问题, ,一个稳定状态必须对微小扰一个稳定状态必须对微小扰动具有稳健性才能称为演化稳定策略。也就是说,如果我动具有稳健性才能称为演化稳定策略。也就是说,如果我们假
7、定为演化稳定策略的稳定点,则该点除了本身必须是们假定为演化稳定策略的稳定点,则该点除了本身必须是均衡状态以外,还必须具有这样的性质:如果某些博弈方均衡状态以外,还必须具有这样的性质:如果某些博弈方由于偶然的错误偏离了它们,复制动态仍然会使由于偶然的错误偏离了它们,复制动态仍然会使x x回复到回复到x x* *。在数学上,这相当于要求:当干扰使。在数学上,这相当于要求:当干扰使x x低于时低于时x x* * ,dx/dtdx/dt必须大于必须大于0 0;当干扰使得;当干扰使得x x出现高于时出现高于时x x* *, dx/dtdx/dt必必须小于须小于0 0,这就要求这些稳定状态处于的导数必须小
8、于,这就要求这些稳定状态处于的导数必须小于0 0。o演化稳定策略的影响因素分析演化稳定策略的影响因素分析 演化博弈关注的问题演化博弈关注的问题“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。(一)签协议博弈(一)签协议博弈假设:群体中假设:群体中“Y”的比例为的比例为x,“N”的比例为的比例为1-x,对于对于甲甲0 , 00, 00 ,01 , 1,0,0,甲甲乙乙YNYNY Y:同意:同意N N:不同意:不同意110YUxxx 0100NUxx 21YNUx Ux Ux设:群
9、体比例的动态变化速度为设:群体比例的动态变化速度为Ydxx UUdt23dxxxdt当当x=0时,稳定;时,稳定;当当x0时,最终稳定于时,最终稳定于x*=1则:则:复制动态方程复制动态方程“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。dx/dtx01图图1 1 签协议博弈的复制动态相位图签协议博弈的复制动态相位图x*=0,x*=1为稳定状态,此时,为稳定状态,此时,dx/dt=0但但x*=1为为ESS,即最终所有人都将选择,即最终所有人都将选择“Y”0 , 00, 00 ,
10、01 , 1,0,0,甲甲乙乙YNYN23dxxxdt“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。(二)一般两人对称博弈(二)一般两人对称博弈群体中采用群体中采用S1的比例为的比例为x,S2的比例为的比例为1-x,对于甲,对于甲11Ux axb 21Ux cxd 121Ux Ux U 1dxF xx UUdt 11xxx acxbd当当F(x) =0时,时,复制动态稳定状态为:复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)则复制动态方程则复制动
11、态方程F(x):d , dc, bb ,ca , a,甲甲乙乙S1S2S1S2“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。稳定性定理稳定性定理若若x0;若若xx*,为使,为使xx*,应满足,应满足F(x)0.F(x)=dx/dt,t,则,则xF(x)=dx/dt,t,则,则xx*F(x)x0这意味着:这意味着:当当F(x*)0,x*为为ESS“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用
12、为重点的“群众性治安防控工程”。(三)协调博弈的复制动态和(三)协调博弈的复制动态和ESSESS 1116111dxF xxxx acxbddtxxx当当F(x) =0时,时,x*=0,x*=1,x*=11/61为稳定状态为稳定状态复制动态方程复制动态方程F(x):60,600,4949,050,5060,600,4949,050,50甲甲乙乙ABAB图图2 2 协调博弈的协调博弈的复制动态相位图复制动态相位图11/61dx/dtx01可知,当可知,当F (0) 0, F(1)0,则,则 x*=0和和x*=1为为ESS这意味着:这意味着:当初始当初始x11/61时,时,ESS 为为x*=1.“
13、雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。(四)鹰鸽博弈的复制动态和(四)鹰鸽博弈的复制动态和ESSESS令令x为采用为采用“鹰鹰”策略的群体比例策略的群体比例,1-x为采用为采用“鸽鸽”策略的群体比策略的群体比例例 111122dxF xxxx acxbddtvcvxxxx则复制动态方程则复制动态方程F(x):v/2,v/20 ,vv ,0,甲甲乙乙鹰鹰鸽鸽鹰鹰鸽鸽(v-c)/2(v-c)/2当当F(x) =0时,时,x*=0,x*=1,x*=v/c为稳定状态为稳定状态“
14、雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 假设假设v=2v=2,c=12c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)F (0) 0, F(1)0,而,而F(1/6)0,则则ESS为:为: x*=1/6n 当冲突损失严重时,例如当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为时,两个种群发生战争的可能性为1/36;和平共处的;和平共处的可能性为可能性为25/36;一方霸道、一
15、方忍让的可能性为;一方霸道、一方忍让的可能性为10/36。n 发生战争的可能性随着发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。比值的增加而降低,即:和平共处的可能性也随着增加。v/2,v/20 ,vv ,0,甲甲乙乙鹰鹰鸽鸽鹰鹰鸽鸽(v-c)/2(v-c)/2 1122dxvcvF xxxxxdt1/6dx/dtx01“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 假设假设v=8v=8,c=8c=8(表示种群间和平共(表示种群间和平共处所得到的
16、收益等于两者冲突导致的损失)处所得到的收益等于两者冲突导致的损失)ESS: x*=1n 当当cv时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因在于当一方忍让时,另一方可获得更多收益。因在于当一方忍让时,另一方可获得更多收益。n 这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。v/2,v/20 ,vv ,0,甲甲乙乙鹰鹰鸽鸽鹰鹰鸽鸽(v-c)/2(v-c)/2 1122dxvcvF xxxxxdtdx/dtx01 假设假设v=8v=8,c=4c=4(
17、表示种群间和平共(表示种群间和平共处所得到的收益大于两者冲突导致的损失)处所得到的收益大于两者冲突导致的损失)dx/dtx01ESS: x*=1“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。(四)蛙鸣博弈的复制动态和(四)蛙鸣博弈的复制动态和ESSESS令令x为采用为采用“鸣鸣”策略的群体比例策略的群体比例,1-x为采用为采用“不鸣不鸣”策略的群体策略的群体比例比例 11dxF xxxmzP xdt则复制动态方程则复制动态方程F(x):0,蛙蛙A A蛙B蛙B鸣鸣不鸣不鸣P-z
18、P-z鸣鸣不鸣不鸣m-zm-z1-m1-m0 m、P为求偶成功的概率为求偶成功的概率 z为机会成本为机会成本(体力消耗、危险性等体力消耗、危险性等)满足:满足:m (0.5,1,mm-z01-Pm-z0ESS: x*= (m-z)/(1-P) n 在这种情况下,无论初始状况如何,最后总有在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。比例的雄蛙鸣叫。 n 当个别雄蛙当个别雄蛙“搭便车搭便车”的收益大于群体雄蛙的收益大于群体雄蛙“鸣叫鸣叫”所获得的收益时,则总会存所获得的收益时,则总会存在搭便车在搭便车“不鸣叫不鸣叫”的雄蛙。的雄蛙。0,蛙蛙A A蛙B蛙B鸣鸣不鸣不
19、鸣P-zP-z鸣鸣不鸣不鸣m-zm-z1-m1-m0 11dxF xxxmzP xdtdx/dtx011mzP“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 若若(m-z)/(1-P) mESS: x*=0n 显然,当机会成本小于收益时,所有的雄蛙将选择显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫不鸣叫”。n 当当“鸣叫鸣叫”的收益大于群体鸣叫而个别雄蛙的收益大于群体鸣叫而个别雄蛙“搭便车搭便车”的收益时,所有雄蛙都将鸣的收益时,所有雄蛙都将鸣叫。叫。 若若(m-z)
20、/(1-P) 1,即,即m-z1-Pdx/dtx01ESS: x*=10,蛙蛙A A蛙B蛙B鸣鸣不鸣不鸣P-zP-z鸣鸣不鸣不鸣m-zm-z1-m1-m0 11dxF xxxmzP xdtdx/dtx01“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 对称博弈:相似对称博弈:相似/相同群体中的演化博弈行为相同群体中的演化博弈行为 非对称博弈:不同群体间的演化博弈行为非对称博弈:不同群体间的演化博弈行为有两个群体:竞争者和在位者有两个群体:竞争者和在位者1 1,竞竞争争者者在位
21、者在位者进入进入不进不进0 00 0打击打击不打击不打击2 25 51 12 25 5竞争者竞争者不进入不进入进入进入在位者在位者不打击不打击打击打击(1,5)(1,5)(2,2)(2,2)(0,0)(0,0)( (一)一) 市场阻入博弈市场阻入博弈“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y1 1,
22、A AB B进入进入不进不进0 00 0打击打击不打击不打击2 25 51 12 25 5对对A而言:而言:01222AeUyyy 111 1AnUyy 1211AAeAnUx Ux Uxyx则竞争者群体的复制动态方程则竞争者群体的复制动态方程FA(x): 11 2AAeAdxFxx UUxxydt采用采用A表示竞争者,表示竞争者,B表示在位者表示在位者假设:假设:“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。竞争者群体的复制动态方程:竞争者群体的复制动态方程:A:“进入进入
23、”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y1 1,A AB B进入进入不进不进0 00 0打击打击不打击不打击2 25 51 12 25 5 11 2AAeAdxFxx UUxxydt竞争者的群体复制动态相位图为:竞争者的群体复制动态相位图为:(b) y1/2ESS: x*=0dx/dtx01dx/dtx01(a) y=1/2x*0,1dx/dtx01(c) y5/6ESS: x*=0dx/dtx01dx/dtx01(a) y=5/6x*0,1dx/dtx01(c) y1/6
24、ESS: y*=0dx/dtx01dx/dtx01(a) x=1/6y*0,1dx/dtx01(c) x1/6ESS: y*=1“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y1 1,A AB B进入进入不进不进0 00 0打击打击不打击不打击2 25 51 12 25 5最后,得到竞争者和在位者两群体复
25、制动态的关系和稳定性图例最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例? 当初始状态落在当初始状态落在A区域,区域,ESS为为x*=0,y*=1=1? 当初始状态落在当初始状态落在D区域,区域,ESS为为x*=1,y*=0? 当初始状态落在当初始状态落在B、C区域,为不稳定状态,区域,为不稳定状态,但可以确定最终大部分结果是落在但可以确定最终大部分结果是落在D区。区。A5/6yx0111/6BCD!落在区域落在区域A A的概率为的概率为1/361/36,区域,区域DD的概率的概率为为25/3625/36。剩下的。剩下的10/3610/36的可能性中绝大部的可能性中绝大部分也会稳定在分也会稳定在D D区域。区域。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。谢谢大家!谢谢大家!