《博弈论讲义4.ppt》由会员分享,可在线阅读,更多相关《博弈论讲义4.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 完全信息静态信息博弈-纳什均衡n一 博弈的基本概念及战略表述n二 占优战略均衡n三 重复剔除的占优均衡n四 纳什均衡n五 纳什均衡应用举例n六 混合战略纳什均衡n七 纳什均衡存在性及相关讨论1六、混合战略纳什均衡n点名博弈 11,2-1,2-1,-21,逃课学生老师不点名点名上课2六、混合战略纳什均衡n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作3六 混合战略纳什均衡 1-1,-11,-11,1-1,反面正面反面正面猜谜游戏v三毛、一休各拿一枚硬币v若同时正面或反面出现,三毛给一休 1元钱,v若一正面和一反面,一休给三毛 1元钱。零和博弈博弈参与者有输有赢
2、,但结果永远是0。4六混合战略纳什均衡n警察与小偷银行酒馆警察小偷2万元1万元东边西边警察与小偷的最优策略各是什么?5六混合战略纳什均衡n上述博弈的特征是:在这些博弈中,都不存在在前面我们所讲的那种纳什均衡。每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。因此,每个人都不能选择特定的一个行为,必须随机地选择不同的行动。随机选择行动的概率不是任意的,而是有讲究的。6六 混合战略纳什均衡 1-1,-11,-11,1-1,反面正面反面正面零和博弈三毛三毛一休正面反面7六 混合战略纳什均衡战略:参与人在给定信息集的情况下选择行动的规则,战略:参与人在给定信息集的情况下选择行动的
3、规则,它规定参与人在什么情况下选择什么行动,是参与人它规定参与人在什么情况下选择什么行动,是参与人的的“相机行动方案相机行动方案”。v纯战略:如果一个战略规定参与人在每一个给定的信纯战略:如果一个战略规定参与人在每一个给定的信 息情况下息情况下只选择一种特定只选择一种特定的行动,该战略为的行动,该战略为 纯战略纯战略。v混合战略:如果一个战略规定参与人在给定信息情况混合战略:如果一个战略规定参与人在给定信息情况 下下以某种概率分布随机地选择不同的行动以某种概率分布随机地选择不同的行动,则该战略为混合战略。则该战略为混合战略。8六 混合战略纳什均衡v混合战略:如果一个战略规定参与人在给定信息情况
4、混合战略:如果一个战略规定参与人在给定信息情况 下下以某种概率分布随机地选择不同的行动以某种概率分布随机地选择不同的行动,则该战略为混合战略。则该战略为混合战略。9六 混合战略纳什均衡n纯战略可以理解为混合战略的特例,即在诸多战略中,选该纯战略si的概率为1,选其他纯战略的概率为0。5,14,49,-10,0等待小猪大猪按等待按 1-1,-11,-11,1-1,反面正面反面正面10六 混合战略纳什均衡如何寻找混合战略纳什均衡?支付最大化法支付等值法由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略)在两人博弈里,
5、混合战略纳什均衡是两个参与人的最优混合战略的组合。11六 混合战略纳什均衡求解:支付最大化法 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。?支付最大化法12六 混合战略纳什均衡n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略13六 混合战略纳什均衡求解:支付等值法n假定最优混合战略存在,给定
6、流浪汉选择混合战略(r,1-r),政府选择纯战略救济的期望效用为:3r+(-1)(1-r)=4r-1n选择纯战略不救济的效用为:-1r+0(1-r)=-rn如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。4r-1=-r r=0.2 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作支付等值法流浪14六 混合战略纳什均衡n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略
7、15六 混合战略纳什均衡n对 的解释:n如果流浪汉以找工作的概率小于0.2,则政府选择不救济,如果大于0.2,政府选择救济,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.n对*=0.5的解释n如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.16六 混合战略纳什均衡n混合战略纳什均衡的含义:n纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中,*=0.5是唯一的混合战略纳什均衡。n从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济;n
8、如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。17流浪汉寻找工作的概率小于0.2政府概率为1:不救济流浪汉寻找工作政府救济18六 混合战略纳什均衡 1-1,-11,-11,1-1,反面正面反面正面用上述方法:求该猜谜游戏的混合战略纳什均衡19激励的悖论:小偷和守卫的博弈混合战略的应用V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷20激励的悖论:小偷和守卫的博弈混合战略的应用V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发
9、生的概略0-D-D守卫得益(睡)SPt 小偷偷的概率121V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒0-P-P小偷得益(偷)VPg 守卫睡的概略122六 混合战略纳什均衡n练习:模型化下述划拳博弈:n两个老朋友在一起喝酒,每个人有四个纯战略:棒子、老虎、鸡和虫子,输赢规则是:棒子打老虎,老虎吃鸡,鸡吃虫子,虫子蛀棒子,两人同时出。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯战略均衡吗?计算其混合战略纳什均衡。23七 纳什均衡存在性及相关讨
10、论不同均衡概念的关系占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE24七 纳什均衡存在性及相关讨论n纳什均衡存在性定理:每一个有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)。25七 纳什均衡存在性及相关讨论n一个博弈可能有多个均衡:两个人分蛋糕;性别战中的博弈;n纳什均衡的多重性:博弈论并没有一个一般的理论证明纳什均衡结果一定能出现2,10,00,01,2芭蕾女男足球芭蕾足球26七 纳什均衡存在性及相关讨论如何保证均衡出现:1、“聚点”均衡:参与人可以使用某些被抽象掉的信息达到一个“聚点均衡”。两个人分蛋糕;性别战中的博弈;两人同时给对方打电话27七 纳什均衡存在性及相关讨论2、廉价磋商-“协调博弈”n尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。9,90,00,01,1RBAUDL聚点28七 纳什均衡存在性及相关讨论n猎人博弈中的帕累托优势均衡和风险优势均衡:5,50,33,03,3打兔猎人乙猎人甲猎鹿打兔猎鹿有两个纳什均衡:(5,5)与(3,3);可以认为:(5,5)比(3,3)有帕累托优势(3,3)比(5,5)有风险优势29