《演化博弈论简介.pptx》由会员分享,可在线阅读,更多相关《演化博弈论简介.pptx(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、A在前面的学习中,我们都假设博弈参与人为完全理性的人;在前面的学习中,我们都假设博弈参与人为完全理性的人;但在现实中,不存在完全理性的人。但在现实中,不存在完全理性的人。A每个人都有学习和改进过错的经历;每个人学习和改进错每个人都有学习和改进过错的经历;每个人学习和改进错误的速度是有差异的。误的速度是有差异的。A具有具有快速学习能力快速学习能力的的小群体小群体成员之间的反复博弈,可以采成员之间的反复博弈,可以采用用“最优反应动态最优反应动态”。A学习速度较慢学习速度较慢的成员组成的的成员组成的大群体大群体中的反复博弈,可以采中的反复博弈,可以采用用“复制动态复制动态”。第6讲:演化博弈论简介第
2、1页/共30页一、最优反应动态(一)协调博弈(一)协调博弈NENE:(A,A)(A,A),(B,B)(B,B),(11/61(11/61,11/61)11/61)其中,其中,(B,B)(B,B)为为paretopareto最优,但最优,但(A,A)(A,A)为风险上策均衡为风险上策均衡第6讲:演化博弈论简介第2页/共30页最优反应动态最优反应动态:能根据对方的上期策略调整自己的策略。:能根据对方的上期策略调整自己的策略。5 5个博弈方,相邻者彼此博弈,初始策略组合为个博弈方,相邻者彼此博弈,初始策略组合为3232种。种。实际上为实际上为8 8种:无种:无A A,1A1A,相邻,相邻2A2A,不
3、相邻,不相邻2A2A,3 3连连A A,非,非3 3连连A A,4A4A,5A5A例如:例如:令令xi(t)为为t时期博弈方时期博弈方i 的的采用策略采用策略A的邻居的数量,则的邻居的数量,则xi(t)=0,1,2.可知,当可知,当x xi i(t)22/61(t)22/61时,时,U UA AUUB B 在在t t时期,当时期,当2 2个邻居中只要有个邻居中只要有1 1个邻个邻居采用策略居采用策略A A,则,则i i在在t+1t+1时期必然采用时期必然采用A A第6讲:演化博弈论简介第3页/共30页 例举如下:例举如下:1 1、当初始情况为、当初始情况为1A1A时时 综上可知,综上可知,32
4、32种初始情况下,种初始情况下,只有只有1 1种情况稳定于种情况稳定于5B5B,其余,其余3131中情况最后都将稳定于中情况最后都将稳定于5A5A。(此时,此时,A A为为“进化稳定策略进化稳定策略”,即,即ESSESS,evolutionary stable strategyevolutionary stable strategy)2 2、当初始情况为、当初始情况为2 2连连A A时时3 3、当初始情况为、当初始情况为3 3连连A A时时第6讲:演化博弈论简介第4页/共30页(一)连续型的古诺调整过程(一)连续型的古诺调整过程则调整过程为:则调整过程为:反应函数:反应函数:企业企业1企业企业
5、22.53.01.51.752.2152.251.18751.9375则最终的进化稳定则最终的进化稳定策略(策略(ESS)为)为:q1=2,q2=2第6讲:演化博弈论简介第5页/共30页二、复制动态中的对称博弈二、复制动态中的对称博弈 (一)签协议博弈(一)签协议博弈假设:群体中假设:群体中“Y”的比例为的比例为x,“N”的比例为的比例为1-xY Y:同意:同意N N:不同意:不同意设:群体比例的动态变化速度为设:群体比例的动态变化速度为当当x=0时,稳定;时,稳定;当当x0时,最终稳定于时,最终稳定于x*=1则:则:复制动态方程第6讲:演化博弈论简介第6页/共30页图图1 1 签协议博弈的复
6、制动态相位图签协议博弈的复制动态相位图x*=0,x*=1为稳定状态,此时,为稳定状态,此时,dx/dt=0但但x*=1为为ESS,即最终所有人都将选择,即最终所有人都将选择“Y”第6讲:演化博弈论简介第7页/共30页(二)一般两人对称博弈(二)一般两人对称博弈群体中采用群体中采用S1的比例为的比例为x,S2的比例为的比例为1-x当当F(x)=0时,时,复制动态稳定状态为:复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)则复制动态方程则复制动态方程F(x):第6讲:演化博弈论简介第8页/共30页稳定性定理稳定性定理若若x0;若若xx*,为使,为使xx*,应满足,应满足
7、F(x)0.F(x)=dx/dt,t,则,则xF(x)=dx/dt,t,则,则x这意味着:这意味着:当当F(x*)0,x*为为ESS第6讲:演化博弈论简介第9页/共30页(三)协调博弈的复制动态和(三)协调博弈的复制动态和ESSESS当当F(x)=0时,时,x*=0,x*=1,x*=11/61为稳定状态为稳定状态复制动态方程复制动态方程F(x):图图2 2 协调博弈的协调博弈的复制动态相位图复制动态相位图可知,当可知,当F(0)0,F(1)0,则,则 x*=0和和x*=1为为ESS这意味着:这意味着:当初始当初始x11/61时,时,ESS 为为x*=1.第6讲:演化博弈论简介第10页/共30页
8、当当n3复制动态与最优反应动态的比较:复制动态与最优反应动态的比较:n 所以,在有限理性程度下,理性程度较高的一方不一定能得到比所以,在有限理性程度下,理性程度较高的一方不一定能得到比理性程度较低的一方更理想的结果。理性程度较低的一方更理想的结果。学习速度慢学习速度慢理性程度低理性程度低学习速度快学习速度快理性程度高理性程度高第6讲:演化博弈论简介第11页/共30页(四)鹰鸽博弈的复制动态和(四)鹰鸽博弈的复制动态和ESSESS令令x为采用为采用“鹰鹰”策略的群体比例策略的群体比例,1-x为采用为采用“鸽鸽”策略的群体比策略的群体比例例则复制动态方程则复制动态方程F(x):当当F(x)=0时,
9、时,x*=0,x*=1,x*=v/c为稳定状态为稳定状态第6讲:演化博弈论简介第12页/共30页 假设假设v=2v=2,c=12c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)F(0)0,F(1)0,而,而F(1/6)0,则则ESS为:为:x*=1/6n 当冲突损失严重时,例如当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为时,两个种群发生战争的可能性为1/36;和平共处的;和平共处的可能性为可能性为25/36;一方霸道、一方忍让的可能性为;一方霸道、一方忍让的可能性为10/36。n 发生战争的可能
10、性随着发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。比值的增加而降低,即:和平共处的可能性也随着增加。第6讲:演化博弈论简介第13页/共30页 假设假设v=8v=8,c=8c=8(表示种群间和平共(表示种群间和平共处所得到的收益等于两者冲突导致的损失)处所得到的收益等于两者冲突导致的损失)ESS:x*=1n 当当cv时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因在于当一方忍让时,另一方可获得更多收益。在于当一方忍让时,另一方可获得更多收益。n 这是一种悲剧。目前,人类的现状和理性
11、尚不能解决这种悲剧。这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。假设假设v=8v=8,c=4c=4(表示种群间和平共(表示种群间和平共处所得到的收益大于两者冲突导致的损失)处所得到的收益大于两者冲突导致的损失)ESS:x*=1第6讲:演化博弈论简介第14页/共30页(四)蛙鸣博弈的复制动态和(四)蛙鸣博弈的复制动态和ESSESS令令x为采用为采用“鸣鸣”策略的群体比例策略的群体比例,1-x为采用为采用“不鸣不鸣”策略的群体策略的群体比例比例则复制动态方程则复制动态方程F(x):m、P为求偶成功的概率为求偶成功的概率 z为机会成本为机会成本(体力消耗、危险性等体力消耗、危险性等)满足
12、:满足:m (0.5,1,mm-z01-Pm-z0ESS:x*=(m-z)/(1-P)n 在这种情况下,无论初始状况如何,最后总有在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。n 当个别雄蛙当个别雄蛙“搭便车搭便车”的收益大于群体雄蛙的收益大于群体雄蛙“鸣叫鸣叫”所获得的收益时,则总会存所获得的收益时,则总会存在搭便车在搭便车“不鸣叫不鸣叫”的雄蛙。的雄蛙。第6讲:演化博弈论简介第16页/共30页 若(m-z)/(1-P)mESS:x*=0n 显然,当机会成本小于收益时,所有的雄蛙将选择显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫不鸣叫”。n 当当“鸣叫
13、鸣叫”的收益大于群体鸣叫而个别雄蛙的收益大于群体鸣叫而个别雄蛙“搭便车搭便车”的收益时,所有雄蛙都将鸣的收益时,所有雄蛙都将鸣叫。叫。若(m-z)/(1-P)1,即m-z1-PESS:x*=1第6讲:演化博弈论简介第17页/共30页 对称博弈:相似对称博弈:相似/相同群体中的演化博弈行为相同群体中的演化博弈行为 非对称博弈:不同群体间的演化博弈行为非对称博弈:不同群体间的演化博弈行为三、复制动态中的非对称博弈三、复制动态中的非对称博弈有两个群体:竞争者和在位者有两个群体:竞争者和在位者第6讲:演化博弈论简介(一)一)市场阻入博弈市场阻入博弈第18页/共30页A:“进入进入”的群体比例为的群体比
14、例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y对对A而言:而言:则竞争者群体的复制动态方程则竞争者群体的复制动态方程FA(x):采用采用A表示竞争者,表示竞争者,B表示在位者表示在位者假设:假设:第6讲:演化博弈论简介第19页/共30页竞争者群体的复制动态方程:竞争者群体的复制动态方程:A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y竞争者的群体复制动态相位图为:竞争者的群体
15、复制动态相位图为:(b)y1/2ESS:x*=0(a)y=1/2x*0,1(c)y5/6ESS:x*=0(a)y=5/6x*0,1(c)y1/6ESS:y*=0(a)x=1/6y*0,1(c)x1/6ESS:y*=1第28页/共30页A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例?当初始状态落在当初始状态落在A区域,区域,ESS为为x*=0,y*=1=1?当初始状态落在当初始状态落在D区域,区域,ESS为为x*=1,y*=0?当初始状态落在当初始状态落在B、C区域,为不稳定状态,区域,为不稳定状态,但可以确定最终大部分结果是落在但可以确定最终大部分结果是落在D区。区。!落在区域落在区域A A的概率为的概率为1/361/36,区域,区域DD的概率的概率为为25/3625/36。剩下的。剩下的10/3610/36的可能性中绝大部的可能性中绝大部分也会稳定在分也会稳定在DD区域。区域。第6讲:演化博弈论简介第29页/共30页感谢您的观看!第30页/共30页