《博弈论讲义》PPT课件.ppt-淘文阁

资源描述

《《博弈论讲义》PPT课件.ppt》由会员分享，可在线阅读，更多相关《《博弈论讲义》PPT课件.ppt（123页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、博弈论博弈论（Game TheoryGame Theory)第二章第二章完全信息静态博弈完全信息静态博弈一一博弈的基本概念及策略式表述博弈的基本概念及策略式表述二二占优策略均衡占优策略均衡三三重复剔除的占优均衡重复剔除的占优均衡四四纳什均衡纳什均衡五五混合策略均衡混合策略均衡六六纳什均衡存在性及相关讨论纳什均衡存在性及相关讨论n完全信息静态博弈完全信息：每个参与人对所有其他参与人的特征（包括策略空间、支付函数等）完全了解静态：所有参与人同时选择行动且只选择一次。同时：只要每个参与人在选择自己的行动时不知道其他参与人的选择，就是同时行动n博弈分析的目的是预测均衡结果第二章完全信息

2、静态信息博弈-纳什均衡n一博弈的基本概念及战略表述n二占优战略均衡n三重复剔除的占优均衡n四纳什均衡n五混合策略均衡六纳什均衡存在性及相关讨论小游戏n两个同学一组，拿出纸和笔，在左和之两个同学一组，拿出纸和笔，在左和之间右做出你的选择。间右做出你的选择。n游戏规则：如果两人同时选右，两人各游戏规则：如果两人同时选右，两人各得得8 8分；如果两人都选左，各得分；如果两人都选左，各得2 2分。如分。如果一人选左，一人选右，选左的人得果一人选左，一人选右，选左的人得1010分，选右的人得分，选右的人得0 0分。分。囚徒困境 n假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人

3、分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。n如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。n如何描述这个博弈？n他们将如何选择？房地产开发项目房地产开发项目-假设有假设有A A、B B两家开发商两家开发商市场需求：可能大，也可能小市场需求：可能大，也可能小投入：投入：1 1亿亿案

4、例案例v假定市场上有两栋楼出售：假定市场上有两栋楼出售：需求大时，需求大时，每栋售价每栋售价1.41.4亿亿，需求小时，需求小时，售价售价7 7千万千万；v如果市场上只有一栋楼如果市场上只有一栋楼需求大时，需求大时，可卖可卖1.81.8亿亿需求小时，需求小时，可卖可卖1.11.1亿亿一、博弈的基本概念及策略表述n博弈论的基本概念包括：参与人：博弈论中选择行动以最大化自己效用的决策主体；参与人：博弈论中选择行动以最大化自己效用的决策主体；行动：参与人的决策变量行动：参与人的决策变量策略：参与人选择行动的规则策略：参与人选择行动的规则信息：参与人在博弈中的知识，特别是有关其他参与人的信息：参与人在

5、博弈中的知识，特别是有关其他参与人的特征和行动的知识特征和行动的知识支付函数：参与人从博弈中获得的效用水平支付函数：参与人从博弈中获得的效用水平结果：博弈分析真正感兴趣的要素的集合结果：博弈分析真正感兴趣的要素的集合均衡：所有参与人的最优策略的组合均衡：所有参与人的最优策略的组合n参与人、行动、结果称为博弈规则；博弈分析的目的是使参与人、行动、结果称为博弈规则；博弈分析的目的是使用博弈规则决定均衡。用博弈规则决定均衡。11n1、参与人(Players)：在博弈中独立决策、独立承担博弈结果的个人或组织。也称局中人。参与人的目的是通过选择行动或策略(策略)以最大化自己的支付(效用)水平。n特殊的

6、虚拟参与人自然，其实质是决定外生的环境参数的概率分布的一种机制。ni=1,n代表参与人；N代表自然。12n2、行动(Actions)：是参与人在某个时点的决策变量。如开发、不开发就为两种行动。n一般地，以一般地，以a ai i表示第表示第i i个参与人的一个特定个参与人的一个特定行动，行动，A Ai i=a ai i 表示可供表示可供i i选择的所有行动选择的所有行动的集合的集合(也称也称行动空间行动空间)。行动可以是离散。行动可以是离散的，也可以是连续的。的，也可以是连续的。n在在n n人博弈中，人博弈中，n n个参与人的行动的有序集个参与人的行动的有序集a=a=(a(a1 1,a,a2 2

7、,a,ai i,a,an n)称为一个称为一个行动组合行动组合。13n3、信息(Information)：信息是参与人有关博弈的知识，特别是有关自然的选择、其他参与人的特征和行动的知识。n完全信息：每一个参与人对所有其他参与人完全信息：每一个参与人对所有其他参与人(包括自然包括自然)的特征、策略空间及支付函数有的特征、策略空间及支付函数有准确的知识。否则，就是不完全信息。准确的知识。否则，就是不完全信息。n共同知识：指的是所有参与人知道，而且所共同知识：指的是所有参与人知道，而且所有参与人知道所有参与人知道有参与人知道所有参与人知道的知识。的知识。共同知识是一个非常强的假定。共同知识是一个非常

8、强的假定。14n4、策略(Strategies)：也译为战略。是参与人在给定信息下的行动规则，它规定参与人在什么时候选择什么行动。策略告诉参与人如何对其他参与人的行动作出反应，因而策略是参与人的相机行动方案。ns si i表示第表示第i i个参与人的一个特定策略，个参与人的一个特定策略，S Si i=s si i 代表第代表第i i个参与人的所有可选择的策略的集合个参与人的所有可选择的策略的集合(策略空间策略空间)。n如果每个参与人选择一个策略，如果每个参与人选择一个策略，n n维向量维向量s=(ss=(s1 1,s,si i,s,sn n)称为一个称为一个策略组合策略组合。n策略与行动的区别

9、策略与行动的区别n策略必须是完备的策略必须是完备的15n5、支付(Payoff)：指在特定策略组合下参与人的确定效用水平或损益水平，或者期望效用水平、期望损益水平。其单位依具体情况而定。nu ui i表示第表示第i i个参与人的支付，个参与人的支付，u=(uu=(u1 1,u,ui i,u,un n)表表示示n n个参与人的个参与人的支付组合支付组合。n在博弈中，一个参与人的支付不仅取决于自己的在博弈中，一个参与人的支付不仅取决于自己的策略选择，而且取决于所有其他参与人的策略选策略选择，而且取决于所有其他参与人的策略选择，所以择，所以u ui i是所有参与人的策略选择的函数：是所有参与人的策略

10、选择的函数：nu ui i=u=ui i(s(s1 1,s,si i,s,sn n)16n6、结果(Outcome)：结果是博弈分析者所感兴趣的所有东西，如均衡策略组合，均衡行动组合，均衡支付组合等。是个比较宽泛且界定不严格的概念。17n7、均衡(Equilibrium)：均衡是所有参与人的最优策略的组合，记为：s*=(s1*,si*,sn*)。其中，si*是第i个参与人在均衡情况下的最优策略，即在给定其他人的策略选择下，使ui或E(ui)最大化的策略。ns si i*满足如下条件：满足如下条件：nu ui i(s(si i*,s*,s-i-i*)*)u ui i(s(si i,s,s-i-i

11、*)*)s si i s si i*,*,i=1,2,ni=1,2,nn其中，其中，s s-i-i*=(s=(s1 1*,s,si-1i-1*,s,si+1i+1*,s,sn n*),),表示除参与表示除参与人人i i之外其他所有参与人的最优策略组合。之外其他所有参与人的最优策略组合。18n 指一组给定对手行为前提下对各博弈方存在的最佳选择；在纳什均衡状态下，只要其它参与者不变换策略选择，任何单个参与者不可能单方面通过变换策略来提高他的所获支付。纳什均衡纳什均衡n通俗地说，纳什均衡的含义就是：n给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不

12、愿意调整自己的策略。一、博弈的基本概念及策略表述n博弈的策略式表述：如：在两寡头产量博弈里，企业是参与人，产量是战略空间，利润是支付；博弈的战略式表述为：这里，分别为第i个企业的产量和利润一、博弈的基本概念及策略表述n有限博弈1、参与人的个数是有限的；2、每个参与人可选的策略是有限的。n两个人有限博弈的策略表述可以用矩阵形式表述：n下面看看如何用博弈的策略式来描述囚徒困境 -8，-80，-10-10，0-1，-1囚徒A囚徒 B坦白抵赖坦白抵赖-8大于-100大于-1（坦白，坦白）是纳什均衡（坦白，坦白）是纳什均衡案例-囚徒困境一、博弈的基本概念及策略表述n下面看看如何用博弈的策略式来描述房地产

13、开发博弈归纳起来有归纳起来有8 8种可能：种可能：n需求大，你开发，他不开发；你利润8千万，他利润0。n需求大，你不开发，他开发；你利润0，他利润8千万。n需求大，你开发，他也开发；你和他利润各为4千万。n需求大，你不开发，他也不开发；你和他利润各为0。n需求小，你开发，他不开发；你利润1千万，他利润0。n需求小，你不开发，他开发；你利润0，他利润1千万。n需求小，你开发，他也开发；你和他的利润各为-3千万n需求小，你不开发，他也不开发；你和他利润各为0。40004000，4000400080008000，0 00 0，800080000 0，0 0不开发开发商A开发不开发开发开发商B需求大的

14、情况需求大的情况博弈的策略式表述-3000-3000，-3000-3000 10001000，0 00 0，100010000 0，0 0不开发开发商A开发不开发开发需求小的情况需求小的情况开发商B博弈的策略式表述n再想想在开始的小实验中你们是如何分析的？练习：市场进入n有两个销售同样产品的销售商A和B打算进入某一区域性市场。由于这个区域市场对产品的需求是有限的，当他们都同时进入该区域市场时，他们各自占有的市场规模都偏小，从而造成1个单位的亏损；但是，当只有一个销售商进入该区域性市场时，则获得1个单位的利润；当然，不进入市场时的利润为零。假如A和B同时进行决策或者他们在进行各自的决策时并不知

15、道另一方的选择，B进入不进入A进入1,11,0不进入0,10,0表3.1 市场进入的静态博弈练习：智猪博弈n有两头非常聪明的猪，一大一小，共同生活在一个猪圈里。在猪圈的一端放有一个猪食槽，在另一端安装有一个按钮，它控制着猪食的供应量，只要按一下，就会出现10个单位食物，但要付出2个单位的成本。每只猪都有按与不按两种选择。n两只猪一起去按，然后一起回槽边进食，由于大猪吃得快可吃下8个单位的食物，小猪只能吃到2个单位食物。n若大猪去按，小猪在槽边等候，则大猪由于来回跑耽误时间只吃得6单位食物，小猪吃得4单位。n若小猪去按，小猪只吃得1单位，大猪吃9单位n两只猪都不去按，则什么也吃不到6，04，49

16、，-10，0等待小猪大猪按等待按4大于10大于-1纳什均衡：大猪按，小猪等待各得四个单位（4，4）多劳者不多得智猪博弈n 大猪小猪博弈n股份公司中大股东股份公司中大股东小股东小股东监督监督纳什均衡：大股东担当监督经理的责任，小股东搭便车n村中的富人村中的富人穷人穷人修路修路纳什均衡：大户修路n改革中得到好处多的改革中得到好处多的少的少的改革改革n股市的大户股市的大户小户小户炒股炒股纳什均衡：大户搜集信息，小户跟大户性别战2，10，00，01，2芭蕾女男足球芭蕾足球纳什均衡：足球，足球；芭蕾，芭蕾先动优势斗鸡博弈(懦夫博弈)两个司机驾车相向行驶，每个人可以在相撞前转向一边而避

17、免相撞，但这将使其被称作“懦夫”，如果两人都向前，车毁人亡；若一人转向而另一人选择继续向前，则向前的司机将被称作“勇士”。-3，-3 2，00，20，0退BA进退进独木桥纳什均衡：A进，B退；A退，B进斗鸡博弈n村子里有两户富户，有两种可能：一家修，另一家就不修；一家不修，另一家就得修。n冷战期间美苏抢占地盘：一方抢占一块地盘，另一方就占另一块。n夫妻吵架，一方厉害，另一方就出去躲躲。n注意：在混合战略纳什均衡条件下，也可能两败俱伤。协调博弈20，20 0，00，05，5一般用户供应商先进一般先进第二章完全信息静态信息博弈-纳什均衡n一博弈的基本概念及策略表述n二占优策略均衡n三重复剔

18、除的占优均衡n四纳什均衡n五纳什均衡应用举例二占优策略均衡案例-囚徒困境-8，-80，-10-10，0-1，-1囚徒A囚徒 B坦白抵赖坦白抵赖-8大于-100大于-1-8大于-100大于-1抵赖是A的严格劣策略抵赖是B的严格劣策略n 类似的囚犯困境排队排队闯红灯闯红灯价格战价格战占优战略均衡占优战略均衡占优战略均衡占优战略均衡占优战略均衡占优战略均衡商场商场商场商场B B 降价降价降价降价不降价不降价不降价不降价商场商场商场商场A A 降价降价降价降价-3,-3 5,-5 不降价不降价不降价不降价 -5,5 3,3 二占优策略均衡n占优策略：不论其他人选择什么策略，参与人的最

19、优策略是唯一的，这样的最优策略称为“占优策略”(dominant strategy)。二占优策略均衡n占优策略均衡n定义：在博弈的策略表达式中，如果对于所有的i，Si*是i的占优策略，下列策略组合称为占优策略均衡：46n一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但但在在一一些些特特殊殊的的博博弈弈中中，一一个个参参与与人人的的最最优优策策略略可可能能可可以以不不依依赖赖于于其其他他参参与与人人的的策策略略选选择择，就就是是说说，不不论论其其他他参参与与人人选选择择什什么么策策略略，他他的的最最优优策策略略是是唯唯

20、一一的的，这这样样的的最优策略被称为最优策略被称为“占优策略占优策略”。47n如果博弈中，某个参与人有占优策略，如果博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称那么该参与人的其他可选择策略就被称为为“劣策略劣策略”。n在一个博弈里在一个博弈里,如果所有参与人都有占如果所有参与人都有占优策略存在，那么占优策略均衡是可以优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒性的参与人会选择劣策略。所以在囚徒困境博弈里，困境博弈里，坦白，坦白坦白，坦白是占优策略是占优策略均衡。均衡。二占优战略均

21、衡n第二次世界大战胜利在望，可是为了给自己捞取功劳，一个飞行大队的指挥官没完没了地下达提高下属的任务定额，弄得所有的人都人心惶惶。n投弹手尤塞里安不想成为胜利前夕的最后一批牺牲品，千方百计逃避任务。他的上级问：“假如，我的士兵都象你这样想，这仗还怎么打？”，可尤塞里安回答到：“那我若不这么想，岂不成了一个大傻瓜？”二占优策略均衡n注意：n如果所有人都有（严格）占优策略存在，那么占优策略均衡就是可以预测的唯一均衡。n占优策略只要求每个参与人是理性的，而不要求每个参与人知道其他参与人是理性的（也就是说，不要求理性是共同知识）。为什么？二占优策略均衡40004000，40004000800080

22、00，0 00 0，800080000 0，0 0不开发开发商A开发不开发开发-3000-3000，-3000-300010001000，0 00 0，100010000 0，0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的策略式表述A严格劣策略B严格劣策略 5，14，49，-10，0等待小猪大猪按等待按智猪博弈等待是小猪的严格占优策略大猪有无严格占优策略？4大于10大于-1n下面参与者有占优策略吗？性别战2，10，00，01，2芭蕾女男足球芭蕾足球斗鸡博弈-3，-3 2，00，20，0退BA进退进独木桥协调博弈20，20 0，00，05

23、，5一般用户供应商先进一般先进第二章完全信息静态信息博弈-纳什均衡n一博弈的基本概念及策略表述n二占优策略均衡n三重复剔除的占优均衡n四纳什均衡n五纳什均衡应用举例三重复剔除的占优均衡n重复剔除严格劣策略：n思路：首先找到某个参与人的劣策略（假定存在），把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈，然后再剔除这个新的博弈中的某个参与人的劣策略，一直重复这个过程，直到只剩下唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。三重复剔除的占优均衡注意：与占优策略均衡中的占优策略和劣策略不同，这里的占优策略或劣策略可能只是相对于另

24、一个特定策略而言。三重复剔除的占优均衡 5，14，49，-10，0等待小猪大猪按等待按案例-智猪博弈按是小猪的严格劣策略-剔除4大于10大于-1“按”是大猪的占优策略，纳什均衡：大猪按，小猪等待三重复剔除的占优均衡n重复剔除的占优均衡重复剔除的占优均衡策略组合称为重复剔除的占优均衡，如果它是重复剔除劣策略后剩下的唯一策略组合。如果这种唯一策略组合是存在的，我们就说该博弈是重复剔除占优可解。注意：如果重复剔除后的策略组合不唯一，该博弈就不是重复剔除占优可解的。三重复剔除的占优均衡1，01，20，30，1M列先生行先生UDL0，12，0R行：没有占优策略列：M严格优于R剔除 R行：L优于

25、D列：无占优策略剔除 DM优于L（U，M）是重复剔除的占优均衡三重复剔除的占优均衡n卑斯麦海之战n卑斯麦海之战发生在1943年的南太平洋上，日本海军上将木村受命将日本陆军运抵新几内亚，其间要穿越卑斯麦海。n而美国上将肯尼欲对日军运输船进行轰炸，穿越卑斯麦海通往新几内亚的有两条航线，木村必须从中选一条，而肯尼则必须决定将其飞机派往何处去搜索日军，如果肯尼将他的飞机派到了错误的航线上，他虽可以召回他们，但可供轰炸的天数将减少。2，-22，-21，-13，-3木村肯尼北南北南三重复剔除的占优均衡n练习：在下列策略式表达中，找出重复剔除的占优均衡4，35，16，22，18，43，63，09，62，

26、8C2R1R2C1C3R3三重复剔除的占优均衡n注意：n1、重复剔除的占优均衡结果与劣策略的剔除顺序是否有关取决于剔除的是否是严格劣策略。n2、重复剔除的占优均衡要求每个参与人是理性的，而且要求“理性”是参与人的共同知识。即：所有参与人知道所有参与是理性的，所有参与人知道所有参与人知道所有参与是理性的三重复剔除的占优均衡2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除顺序：R3、C3、C2、R2，策略组合（R1，C1）故一般使用严格劣策略剔除，可以看到，（R1，C3）（R1，C1）都是纳什均衡，但在这里是不可解的。剔除顺序：C2、R2、C

27、1、R3，策略组合（R1，C3）举例：举例：三重复剔除的占优均衡n尽管许多博弈中重复剔除的占优均衡是一个合理的预测，但并不总是如此，尤其是大概支付某些极端值的时候。8，10-1000，97，66，5参与人B参与人AUDLRU是A的最优选择，但是，只要有1/1000的概率B选R，A就会选D房地产开发中需求小情况40004000，4000400080008000，0 00 0，800080000 0，0 0不开发开发商A开发不开发开发-3000-3000，-3000-300010001000，0 00 0，100010000 0，0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求

28、小的情况需求大的情况需求大的情况博弈的策略式表述斗鸡博弈-3，-32，00，20，0退BA进退进独木桥纳什均衡：A进，B退；A退，B进n对于相当多的博弈，我们无法运用重复剔除劣策略的方法找出均衡解。n为了找出这些博弈的均衡解，需要引入纳什均衡。第二章完全信息静态信息博弈-纳什均衡n一博弈的基本概念及策略表述n二占优策略均衡n三重复剔除的占优均衡n四纳什均衡n五纳什均衡应用举例四纳什均衡假设n个参与人在博弈之前达成一个协议，规定每一个参与人选择一个特定的策略，另代表这个协议，在没有外在强制力的情况下，如果没有任何人有积极性破坏这个协议，则这个协议是自动实施的。这个协议就构成了一

29、个纳什均衡。四纳什均衡n通俗地说，纳什均衡的含义就是：n给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。四纳什均衡n寻找纳什均衡：划线法0，44，05，34，00，45，33，53，56，6C2R1R2C1C3R3参与人B参与人A（R3，C3）是纳什均衡）是纳什均衡73寻找纳什均衡：划线法BA左左中中右右上上1,01,30,1下下0,40,22,3BALCRT2,01,14,2M3,41,22,3D1,30,23,0市场进入阻挠博弈 n有一个垄断者已在市场上(称为在位者)，另一个企业虎视耽耽想进入(称为进入者)。n进入

30、者有两个战略可以选择：(进入，不进入)，在位者也有两个战略：(默许，斗争)。n假定进入之前的垄断利润为300，进入之后寡头利润为100，进入成本为10。n最终结果会如何？高成本市场进入阻挠博弈n如果我们想用重复剔除弱劣战略的方法找到博弈的解，斗争是在位者的弱劣战略（50 0,300=300），因而被剔除，(进入，默许)是唯一剩下的没有被剔除的战略组合，因而是重复剔除的占优均衡。n纳什均衡(不进入，斗争)被剔除掉了。n这个例子也说明，(弱)纳什均衡允许弱劣战略的存在。77寻找纳什均衡：箭头法高需求高需求开发商开发商B开开发发商商A开发开发不开发不开发开发开发4000,40008000,0不开发不

31、开发0,80000,078寻找纳什均衡：箭头法高需求高需求开发商开发商B开开发发商商A开发开发不开发不开发开发开发4000,40008000,0不开发不开发0,80000,079寻找纳什均衡：箭头法低需求低需求开发商开发商B开开发发商商A开发开发不开发不开发开发开发-3000,-30001000,0不开发不开发0,10000,0四纳什均衡美苏古巴导弹危机n冷战期间美苏争霸最严重的一次危机。苏联：面临将导弹撤回国还是坚持部署在古巴的选择；美国：挑起战争还是容忍苏联的了挑衅行为。n结果：苏联：将导弹从古巴撤回，做了丢面子的“撤退的鸡”，美国：坚持自己的的策略，做了“不退的鸡”，但是象征性地从土耳

32、其撤回了一些导弹，给苏联一点面子。独木桥四纳什均衡2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除顺序：R3、C3、C2、R2，策略组合（R1，C1）故一般使用严格劣策略剔除，可以看到，（R1，C3）（R1，C1）都是纳什均衡，但在这里是不可解的。剔除顺序：C2、R2、C1、R3，策略组合（R1，C3）请用上述划线法寻找下列纳什均衡请用上述划线法寻找下列纳什均衡 -8，-80，-10-10，0-1，-1囚徒A囚徒 B坦白抵赖坦白抵赖案例-囚徒困境练习 5，14，49，-10，0等待小猪大猪按等待按智猪博弈性别战2，10，00，01，2芭蕾女

33、男足球芭蕾足球斗鸡博弈-3，-3 2，00，20，0退BA进退进独木桥协调博弈20，20 0，00，05，5一般用户供应商先进一般先进n练习：n找出下列两队夫妻的纳什均衡2 2，2 2-6-6，0 00 0，-6-60 0，0 0死了恩爱夫妻活着死了活着0 0，0 06 6，0 00 0，6 60 0，0 0死了妻子相互仇恨夫妻活着死了活着妻子丈夫丈夫四纳什均衡n纳什均衡与占优策略均衡及重复剔除的占优均衡：n（1）每一个占优策略均衡及重复剔除的占优均衡一定是纳什均衡，但并非每一个纳什均衡都是占优策略均衡或重复剔除的占优均衡；n（2）纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组

34、合，但没有被剔除掉的组合不一定是纳什均衡，除非它是唯一的（不适用于严格弱劣策略的情况）2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除顺序：R3、C3、C2、R2，策略组合（R1，C1）故一般使用严格劣策略剔除，可以看到，（R1，C3）（R1，C1）都是纳什均衡，但在这里是不可解的。剔除顺序：C2、R2、C1、R3，策略组合（R1，C3）四纳什均衡n市场进入阻挠40，50-10，00，3000，300斗争在位者进入者进入不进入默许纳什均衡：进入，默许；不进入，斗争四纳什均衡用重复剔除弱劣策略的方法找均衡第二章完全信息静态信息博弈-纳什均

35、衡n一博弈的基本概念及战略表述n二占优战略均衡n三重复剔除的占优均衡n四纳什均衡n五混合战略纳什均衡n六纳什均衡存在性及相关讨论五混合战略纳什均衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作没有一个战略组合构成纳什均衡五混合战略纳什均衡 1-1，-11，-11，1-1，反面正面反面正面猜谜游戏v两个儿童各拿一枚硬币，v若同时正面朝上或朝下，A给B 1分钱，v若只有一面朝上，B给A 1分钱。零和博弈博弈参与者有输有赢，但结果永远是0。没有一个战略组合构成纳什均衡五混合战略纳什均衡n警察与小偷银行酒馆警察小偷2万元1万元东边西边警察与小偷的最优策略

36、各是什么？五混合战略纳什均衡n上述博弈的特征是：在这类博弈中，都不存在纯纳什均衡。参与人的支付取决于其他参与人的战略；以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的战略，而每个参与人又不愿意让对方猜透自己的战略。这种博弈的类型是什么？如何找到均衡？五混合战略纳什均衡n请举一些这样的例子：石头、剪子、布游戏老虎、杠子、鸡、虫子游戏扑克游戏橄榄球赛战争中 1-1，-11，-22，2-2，西边东边西边东边五混合战略纳什均衡警察抽签决定去银行还是酒馆，2/3的机会去银行，1/3的机会去酒馆；同样，小偷也抽签决定去银行还是酒馆，2/3的机会去酒馆，1/3的机会去银行。五混合战略纳什均

37、衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作设：政府救济的概率：1/2；不救济的概率：1/2。流浪汉：寻找工作的期望效用：1/22+1/2 1=1.5 流浪的期望效用：1/23+1/2 0=1.5因此，流浪汉的任何一种战略都是都是对政府混合战略的最优反应五混合战略纳什均衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作设：政府救济的概率：1/2；不救济的概率：1/2。流浪汉：寻找工作的概率：0.2；流浪的概率：0.8每个参与人的战略都是给定对方混合战略时的最优战略五混合战略纳什均衡 1-1，-11，-11，1-1，反面正面反面正

38、面猜谜游戏v两个小孩的最优策略是采取每个策略的可能性均为1/2；v每个小孩各取策略的1/2是纳什均衡。零和博弈五混合战略纳什均衡n请举一些这样的例子：石头、剪子、布游戏老虎、杠子、鸡、虫子游戏扑克游戏橄榄球赛战争中这样的博弈的均衡是混合战略纳什均衡五混合战略纳什均衡战略：参与人在给定信息集的情况下选择行动的规则，战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人它规定参与人在什么情况下选择什么行动，是参与人的的“相机行动方案相机行动方案”。v纯战略：如果一个战略规定参与人在每一个给定的信纯战略：如果一个战略规定参与人在每一个给定的信息情况下息情

39、况下只选择一种特定只选择一种特定的行动，该战略为的行动，该战略为纯战略纯战略。v混合战略：如果一个战略规定参与人在给定信息情况混合战略：如果一个战略规定参与人在给定信息情况下下以某种概率分布随机地选择不同的行动以某种概率分布随机地选择不同的行动，则该战略为混合战略。则该战略为混合战略。五混合战略纳什均衡v混合战略：如果一个战略规定参与人在给定信息情况混合战略：如果一个战略规定参与人在给定信息情况下下以某种概率分布随机地选择不同的行动以某种概率分布随机地选择不同的行动，则该战略为混合战略。则该战略为混合战略。五混合战略纳什均衡n纯战略可以理解为混合战略的特例，即在诸多战略中，选该纯战略

40、si的概率为1，选其他纯战略的概率为0。5，14，49，-10，0等待小猪大猪按等待按 1-1，-11，-11，1-1，反面正面反面正面五混合战略纳什均衡如何寻找混合战略纳什均衡？支付最大化法支付等值法由于混合战略伴随的是支付的不确定性，因此参与人关心的是其期望效用。最优混合战略：是指使期望效用函数最大的混合战略（给定对方的混合战略）在两人博弈里，混合战略纳什均衡是两个参与人的最优混合战略的组合。五混合战略纳什均衡 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作即：流浪汉以0.2的概率选择寻找工作，0.8的概率选择游荡同样，可以根据流浪汉的期望效用函数找到政府的最优混合战略。

41、？支付最大化法五混合战略纳什均衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作设：政府救济的概率：1/2；不救济的概率：1/2。流浪汉：寻找工作的概率：0.2；流浪的概率：0.8每个参与人的战略都是给定对方混合战略时的最优战略五混合战略纳什均衡n假定最优混合战略存在，给定流浪汉选择混合战略（r，1-r），政府选择纯战略救济的期望效用为：3r+（-1）（1-r）=4r-1n选择纯战略不救济的效用为：-1r+0（1-r）=-rn如果一个混合战略（而不是纯战略）是政府的最优选择，一定意味着政府在救济与不救济之间是无差异的。4r-1=-r r=0.2 23，3-1，1

42、-1，00，流浪流浪汉政府救济不救济寻找工作支付等值法五混合战略纳什均衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作设：政府救济的概率：1/2；不救济的概率：1/2。流浪汉：寻找工作的概率：0.2；流浪的概率：0.8每个参与人的战略都是给定对方混合战略时的最优战略五混合战略纳什均衡n对的解释：n如果流浪汉以找工作的概率小于0.2,则政府选择不救济,如果大于0.2,政府选择救济,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.n对*=0.5的解释n如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是

43、寻找工作.五混合战略纳什均衡n混合战略纳什均衡的含义：n纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中，*=0.5是唯一的混合战略纳什均衡。n从反面来说，如果政府认为流浪汉选择寻找工作的概率严格小于0.2，那么政府的唯一最优选择是纯战略：不救济；n如果政府以1的概率选择不救济，流浪汉的最优选择是寻找工作，这又将导致政府选择救济的战略，流浪汉则选择游荡。如此等等。流浪汉寻找工作的概率小于0.2政府概率为1：不救济流浪汉寻找工作政府救济五混合战略纳什均衡 1-1，-11，-11，1-1，反面正面反面正面用上述方法：求该猜谜游戏的混合战略纳什均衡五混合战

44、略纳什均衡n练习：模型化下述划拳博弈：n两个老朋友在一起喝酒，每个人有四个纯战略：杠子、老虎、鸡和虫子，输赢规则是：杠子降鸡，鸡吃虫子，虫子降杠子，两人同时出令。如果一个打败另一个，赢的效用为1，输的效用为-1，否则效用为0，写出这个博弈的支付矩阵，这个博弈有纯战略均衡吗？计算其混合战略纳什均衡。第二章完全信息静态信息博弈-纳什均衡n一博弈的基本概念及战略表述n二占优战略均衡n三重复剔除的占优均衡n四纳什均衡n五混合战略纳什均衡n六纳什均衡存在性及相关讨论六纳什均衡存在性及相关讨论不同均衡概念的关系占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE

45、六纳什均衡存在性及相关讨论n纳什均衡存在性定理：每一个有限博弈至少存在一个纳什均衡（纯战略的或混合战略的）。六纳什均衡存在性及相关讨论n一个博弈可能有多个均衡：两个人分蛋糕；性别战中的博弈；n纳什均衡的多重性：博弈论并没有一个一般的理论证明纳什均衡结果一定能出现2，10，00，01，2芭蕾女男足球芭蕾足球六纳什均衡存在性及相关讨论如何保证均衡出现：1、“聚点”均衡：参与人可以使用某些被抽象掉的信息达到一个“聚点均衡”。两个人分蛋糕；性别战中的博弈；两人同时给对方打电话六纳什均衡存在性及相关讨论2、廉价磋商-“协调博弈”n尽管无法保证磋商会达成一个协议，即使达成协议也不一定会被遵守，但在

46、一些博弈中，事前磋商确实可以使某些均衡实际上出现。9，90，00，01，1RBAUDL9，90，88，07，7RBAUDL聚点六纳什均衡存在性及相关讨论n猎人博弈和帕累托优势：10，100，44，04，4打兔猎人乙猎人甲猎鹿打兔猎鹿有两个纳什均衡：（10，10）与（4，4）；可以认为：（10，10）比（4，4）有帕累托优势六纳什均衡存在性及相关讨论n大流士阴谋推翻波斯王国的故事：n当时，一群波斯贵族聚在一起决定推翻国王，其间有人提议休会，大流士此时站出来大声疾呼，说如果休会的话，就一定会有人去国王那里告密，因为如果别人不那么做的话，他自己就会去做，大流士说唯一的办法就是冲进皇宫，杀死国王。n这个谋反的故事还提供了关于协调博弈的出路。在杀死国王之后，贵族们想从自己人中推选出一个人当国王，他们决定不自相残杀，而是在佛晓十分到山上去，谁的马先叫谁就当国王。大流士的马夫在这场随机的安排中做了手脚，从而成为国王。六纳什均衡存在性及相关讨论3、学习过程假定博弈重复多次，即使参与人最初难以协调行动，在博弈若干次后，某种特定的协调模式可能会形成，特别地，假定参与人每一轮根据其对手以前的“平均”战略来选择自己的最优战略，博弈可能收敛于一个纳什均衡。

展开阅读全文