非合作博弈经济管理学及财务知识分析理论djxh.pptx-淘文阁

资源描述

《非合作博弈经济管理学及财务知识分析理论djxh.pptx》由会员分享，可在线阅读，更多相关《非合作博弈经济管理学及财务知识分析理论djxh.pptx（59页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、博弈论与信息经济学（Game Theory and Information EconomicsGame Theory and Information Economics)张玲玲中国科学院研究生院管理学院主要内容简介主要内容简介第一章概述-人生处处皆博弈n第一篇第一篇非合作博弈理论非合作博弈理论第二章完全信息静态信息博弈-纳什均衡第三章完全信息动态搏弈-子博弈精炼纳什均衡第四章不完全信息静态博弈-贝叶斯纳什均衡第五章不完全信息动态博弈-精练贝叶斯纳什均衡n第二篇第二篇信息经济学信息经济学第六章委托-代理理论（I）第七章委托-代理理论（II）第八章逆向选择与信号传递主要内容

2、简介主要内容简介第五章不完全信息动态博弈-精练贝叶斯纳什均衡n一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡n二信号传递博弈及其应用举例n三博弈论概念简要总结基本思路-不完全信息动态博弈n成语故事：黔之驴-驴虎博弈老虎通过不断试探来修正对毛驴的看法，每一步行动都是给定它的信念下最优的，毛驴也是如此。最终老虎将毛驴吃掉。基本思路-不完全信息动态博弈n类型：自然首先选择参与人的类型，参与人自己知道，其他参与人不知道。-不完全信息n行动：行动有先有后，后行动者能观测到先行动者的行动，但不能观测到其类型。-动态博弈但是，参与人是类型依存型的，每个参与

3、人的行动都传递有关自己类型的信息，后行动者可以通过观察先行动者的行动来推断自己的最优行动。先行动者预测到自己的行动被后行动者利用，就会设法传递对自己最有利的信息。n不完全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。n精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。基本思路-不完全信息动态博弈n市场进入博弈：n参与人：在位者，进入者；T=1，市场上只有一个垄断企业，在位者，一个潜在进入者考虑是否进入；如果进入者进入，两个企业进行库诺特博弈，否则在位者获得垄断利润。n类型：在位和有两种类型，高成本或低成本，进入者

4、在博弈开始时只知道在位者高成本的概率是x，低成本概率是1-x。称为先验概率。n对于在位者：价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8基本思路-不完全信息动态博弈进入者只有一种类型：进入成本为2，如果进入，生产成本函数与在位者高成本函数相同。T=2，如果进入者已进入，在位者成本函数为共同知识，若在位者为高成本，企业企业成本函数相同，对称库诺特均衡产量下的价格p=5时，每个企业利润为3，扣除进入成本2，进入者利润为1。若在位者为低成本，两个企业成本函数不同，非对称库诺特均衡产量下

5、的价格p=4,在位者利润是5，进入者利润为1，扣除进入成本2，其利润为-1。价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8进入者进入进入者进入在位者在位者进入者进入者在位者高成本在位者高成本p=5p=53 31 1在位者低成本在位者低成本p=4p=45 5-1-1如何用扩展式表述两个企业的博弈过程？N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0

6、)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈进入者只有一种类型：进入成本为2，如果进入，生产成本函数与在位者高成本函数相同。T=2，如果进入者已进入，在位者成本函数为共同知识，若在位者为高成本，p=5时，每个企业利润为3，扣除进入成本2，进入者利润为1。若在位者为低成本，p=4,在位者利润是5，进入者成本为1，扣除进入成本2，其利润为-1。该博弈的均衡结果将会是什么？基本思路-不完全信息动态博弈

7、n在静态贝叶斯均衡中在静态贝叶斯均衡中，参与人的信念是事前给定的，均衡，参与人的信念是事前给定的，均衡概念没有规定参与人如何修正自己的信念。概念没有规定参与人如何修正自己的信念。但是，如果进入者可以任意修订自己有关在位者成本函数的信念，上述不完全信息动态博弈可以有任意均衡。n如假定x1/2，下列战略组合是一个贝叶斯均衡：不论在位者选择什么价格，进入者总认为在位者是低成本的概率为x*1/2，总是选择不进入；高成本在位者选择p=6,低成本在位者选择p=5。n这个均衡战略合理吗？是精练的纳什均衡吗？价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7

8、在位者低成本时的利润在位者低成本时的利润6 69 98 8基本思路-不完全信息动态博弈n但显然这个均衡是不合理的，因为它包含了一个不可置信威胁：进入者不会修正对在位者成本函数的信念。n给定p=6不可能是低成本在位者的最优选择，如果在位者选择了p=6,进入者为什么仍然认为在位者是高成本的概率小于1/2呢？n那么如何寻找合理的精练的均衡呢？基本思路-不完全信息动态博弈n在不完全信息动态博弈中：在不完全信息动态博弈中：n与静态博弈不同的是，在观测到在位者第一阶段在观测到在位者第一阶段的价格选择后，的价格选择后，进入者进入者可以修正对在位者成本函可以修正对在位者成本函数的先验概率数的先验概率x x，因

9、为在位者的价格可能包含其成本函数的信息。（驴虎博弈，空城计）n那在位者在位者会怎么做呢？价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(

10、7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈进入者只有一种类型：进入成本为2，如果进入，生产成本函数与在位者高成本函数相同。T=2，如果进入者已进入，在位者成本函数为共同知识，若在位者为高成本，p=5时，每个企业利润为3，扣除进入成本2，进入者利润为1。若在位者为低成本，p=4,在位者利润是5，进入者成本为1，扣除进入成本2，其利润为-1。(7,0)高成本在位者不会选择p=6基本思路-不完全信息动态博弈n如：高成本的在位者不会选择p=6，因此，如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本，选择进入是有利可图的。预测到p=6会招致进入者进入，即使高成

11、本的在位者也可能不会选择p=6,而招致进入者的进入。n在位者将如何选择？如何找精练均衡？-多阶段收益最大化。n-问题的核心是：不同的价格如何影响进入者的后验概率从而影响进入者的进入决策。价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶

12、段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈进入者只有一种类型：进入成本为2，如果进入，生产成本函数与在位者高成本函数相同。T=2，如果进入者已进入，在位者成本函数为共同知识，若在位者为高成本，p=5时，每个企业利润为3，扣除进入成本2，进入者利润为1。若在位者为低成本，p=4,在位者利润是5，进入者成本为1，扣除进入成本2，其利润为-1。(7,0)基本思路-不完全信息动态博弈n一个非单阶段最优价格会减少现期利润，但如果它能阻止进入者进入，从而使在位者在第二阶段得到的是垄

13、断利润而不是库诺特均衡利润，如果垄断利润与库诺特均衡利润的差距足够大，如果在位者有足够的信心选择一个非单阶段最优价格可能是最优的。n而且：不同的价格影响进入者的后验概率不同的价格影响进入者的后验概率从而影响进入者的进入决策。n在均衡情况下，在位者究竟选择什么价格，不仅与在位者究竟选择什么价格，不仅与成本函数有关，而且与进入者的先验概率成本函数有关，而且与进入者的先验概率x x有关有关。n-这些都直接影响在位者和进入者的最终决策。这些都直接影响在位者和进入者的最终决策。n综合这些因素得到的均衡才是精练的均衡综合这些因素得到的均衡才是精练的均衡基本思路-不完全信息动态博弈在位者成本函数进入者先验概

14、率在位者价格进入者的后验概率进入者的策略支付最大在位者的策略支付最大究竟如何寻找究竟如何寻找精练贝叶斯纳什均衡？精练贝叶斯纳什均衡？基本思路-不完全信息动态博弈完全信息动态博弈中引入了子博弈精练纳什均衡的概念概念剔除那些不可置信的威胁，但是不完全信息动态博弈中，只有一个子博弈，不能将上述方法直接用于求不完全信息动态博弈的均衡解，但可以借用这一方法逻辑。将每个信息集开始的博弈的剩余部分称为一个“后续博弈”，一个“合理”的均衡应该满足如下要求：给定每一个参与人有关其他参与人类型的后验信念，参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。剔除这种不可信行为的方式是：假定参与人（在所有可能情况下）

15、根据贝叶斯规则修正先验概念，并且，每个参与人都假定其他参与人选择的是均衡战略。N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈进入者只有一种类型：进入成本为2，如果进入，生产成本函数与在位者高成本函数相同。T=2，如果进入者已

16、进入，在位者成本函数为共同知识，若在位者为高成本，p=5时，每个企业利润为3，扣除进入成本2，进入者利润为1。若在位者为低成本，p=4,在位者利润是5，进入者成本为1，扣除进入成本2，其利润为-1。(7,0)基本思路-不完全信息动态博弈n精练贝叶斯均衡精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求：n1、在每个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；n2、给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的；n3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。第五章不完全信息动态博弈-精练贝叶斯纳什均衡n

17、一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡n二信号传递博弈及其应用举例n三博弈论概念简要总结第五章不完全信息动态博弈-精练贝叶斯纳什均衡n苏格拉底的三个弟子曾向老师求教，如何才能找到理想的伴侣？苏格拉底没有直接回答，而是把他们带到一块麦田，要求他们沿着田埂直线前进，不许后退，而且仅给一次机会挑选一支最大的麦穗。n第一个弟子n第二个弟子n第三个弟子贝叶斯法则n在日常生活中，当面临不确定时，我们对某事件发生的可能性有一个判断，然后，会根据新的信息来修正这个判断。n统计学上，修正之前的判断称为“先验概率”n修正后的判断称为“后验概率”n贝叶斯法则贝

18、叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。贝叶斯法则n假定参与人的类型是独立分布的，参与人i有K个类型，有h个可能的行动，k和ah分别代表一个特定的类型和一个特定的行动。n如果我们观察到i选择了ah，i属于k的后验概率是多少？贝叶斯法则人：好人（GP），坏人（BP）事：好事（GT），坏事（BP）一个人干好事的概率等于他是好人的概率p（GP）乘以好人干好事的概率p（GT|GP），加上他是坏人的概率p（BP）乘以坏人干好事的概率p（GT|BP）：ProbGT=p（GT|GP）*p（GP）+p（GT|BP）*p（GT|BP）假定观测到一个人干了一件好事，那么这个人的是好人的后验概

19、率是：贝叶斯法则假定我们认为这个人是好人的先验概率是1/2，观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度：1、是一件非常好的好事，坏人绝对不可能干，则p（GT|GP）=1 p（GT|BP）=02、这是一个非常一般的好事，好人会干，坏人也会干：p（GT|GP）=1 p（GT|BP）=13、介于上述两种情况之间：好人肯定会干，但坏人可能会干也可能不会干：p（GT|GP）=1 p（GT|BP）=1/2贝叶斯法则假定我们观测到他干了一件坏事，我们相信，好人绝对不会干坏事，那么可以肯定他绝对不是一个好人。假定我们原来认为他是个坏人，大突然发现他干了一件好事，我们如何看待呢？第

20、五章不完全信息动态博弈-精练贝叶斯纳什均衡n一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡n二信号传递博弈及其应用举例n三博弈论概念简要总结精练贝叶斯纳什均衡n精练贝叶斯均衡是均衡战略和均衡信念的结合，给定信念：是使用贝叶斯法则从均衡战略和所观测到的行动得到的。因此，精练贝叶斯均衡是一个对应的不动点：N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4

21、第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 x=1/2时，精练贝叶斯均衡为：低成本在位者选择p=4,高成本在位者选择p=6;进入者选择不进入，如果观测到p=4;进入者选择进入，如果观测到p=6.分离均衡精练贝叶斯纳什均衡高-在位者P=6进入者进入在位者利润：7+3X1/2在位者P=5进入者不进入在位者利润：6+7牺牲1单位换取4单位利润是合算的在位者P=5 给定在给定在位者的后验位者的后验概率和战略概率和战略低-在位者P=5进入者不进入在位者利润：9+9最优

22、选择给定两类在位者都选p=5，进入者不能从观测到价格中得到任何信息，x（5）=（1*x）/（1*x+1*（1-x）=x1/2,进入的期望利润x（1）+（1-x）*（-1）=2x-10,不进入的期望利润为0，因此不进入是最优的。混同均衡价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8精练贝叶斯纳什均衡n混同均衡n因为两类在位者选择同样的价格，直观地讲，因为x=1/2低-在位者P=5进入者进入在位者利润：9+5最优选择在位者P=4给定在位给定在位者的后验者的后验概率和战概率和战略略高-在

23、位者P=4进入者不进入在位者利润：2+7给定在位者的战略，x（6）=1和x（4）=0是正确的，因此进入者的最优战略是：如果观测到p=6,选择进入，如果观测到p=4,选择不进入。分离均衡高-在位者P=6进入者进入在位者利润：7+3最优选择在位者P=6精练贝叶斯纳什均衡分离均衡分离均衡因为不同类型的在位者选择了不同的价格。低成本在位者选择了非单阶段最优价格p=4;高成本在位者选择了单阶段最优垄断价格p=6 如果低成本在位者选择p=5,无法将自己与高成本在位者分开，进入者将进入，但如果他选择p=4,高成本在位者不会模仿，进入者不进入，因此低成本在位者宁愿放弃3单位的现期利润换取4单位的下期利润。高

24、成本在位者之所以不选择p=4,是因为成本太高，下阶段的4单位例如不足以弥补现期5单位的损失。不完全信息带来的唯一后果是，低成本在位者损失3单位的利润，这也可以说是他为了证明自己是低成本而支付的“认证”费用。价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8精练贝叶斯纳什均衡n啤酒-蛋糕博弈n参与人1是一个善于打架的强者的概率是0.9，是一个不善于打架的弱者的概率是0.1，但是，即使参与人1知道自己能打赢，也不想和别人打架。如果参与人1是弱者，参与人2就想和他打架。参与人2不知道参与人1

25、的类型，但他能够观察参与人1早餐吃什么，如。参与人2知道若者喜欢以蛋糕为早餐，而强者喜欢以啤酒为早餐。两个均衡：无论参与人1是什么类型，都选择啤酒做早餐，参与人2选择不打架；无论参与人1是什么类型，都选择蛋糕作为早餐，参与人2选择打架。-被排除第五章不完全信息动态博弈-精练贝叶斯纳什均衡n一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡n二信号传递博弈及其应用举例n三博弈论概念简要总结信号传递博弈及其应用举例n信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。n参与人：两个，信号发送者1和信号接收者2；1的类型是私人信息，2 的类型

26、是公共信息（即只有一个类型）。n博弈顺序：n1、“自然”首先选择参与人1的类型，参与人1知道，但参与人2不知道。只知道1属于该类型x的先验概率。n2、参与人1观测到类型x后发出信号n3、参与人2观测到参与人1发出的信号，使用贝叶斯法则从先验概率得到后验概率，然后选择行动。N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)

27、(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)参与人？参与人？博弈顺序博弈顺序？博弈结果博弈结果？市场进入博弈精练贝叶斯纳什均衡n信号传递博弈的所有可能的精练贝叶斯均衡可以划分为3类：n分离均衡：不同类型的发送者（参与人1）以1的概率选择不同的信号，或者说，没有任何类型选择与其他类型相同的信号在分离均衡下，信号准确地揭示出类型。n混同均衡：不同类型的发送者选择相同的信号，或者说，没有任何类型选择与其他类型不同的信号，因此，接收者不修正先验概率。n准分离均衡：一些类型的发送者随机地选择信号，另一些类型的发送者选择特定的信号。练习-8-不完全信息动态博弈n下图是一个信号传递博弈：

28、自然首先选择参与人下图是一个信号传递博弈：自然首先选择参与人1 1的类型，参与人的类型，参与人1 1知道自然的选择，参与人知道自然的选择，参与人2 2 不知道，只知道参与人不知道，只知道参与人1 1属于类型属于类型t t1 1和和t t1 1的可能性相等，参与人的可能性相等，参与人1 1然后选择信号然后选择信号L L或或R R，参与人，参与人2 2选择行选择行动动U U或或D D，博弈结束，支付向量如图所示，给出这个博弈所有纯战，博弈结束，支付向量如图所示，给出这个博弈所有纯战略分离均衡和混同均衡。略分离均衡和混同均衡。Nt1 t21LRUDUDUDUD(1,1)(2,0)(2,2)(0,0)

29、(0,0)(0,1)(1,0)(1,1)0.50.51RL参与人？参与人？博弈顺序博弈顺序？博弈结果博弈结果？22第五章不完全信息动态博弈-精练贝叶斯纳什均衡n一精练贝叶斯纳什均衡基本思路贝叶斯法则精练贝叶斯纳什均衡不完美信息博弈的精练贝叶斯均衡n二信号传递博弈及其应用举例n三博弈论概念简要总结占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE请各对每种均衡举个例子完全信息静态博弈-纳什均衡占优战略均衡案例1-囚徒困境-8，-80，-10-10，0-1，-1囚徒A囚徒 B坦白抵赖坦白抵赖抵赖是A的严格劣战略抵赖是B的严格劣战略重复剔除的占优均衡 5，14

30、，49，-10，0等待小猪大猪按等待按案例2-智猪博弈按是小猪的严格劣战略-剔除4大于10大于-1“按”是大猪的占优战略，纳什均衡：大猪按，小猪等待纳什均衡n寻找纳什均衡0，44，05，34，00，45，33，53，56，6C2R1R2C1C3R3参与人B参与人A（R3，C3）是纳什均衡）是纳什均衡五混合战略纳什均衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作没有一个战略组合构成纳什均衡五混合战略纳什均衡 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作即：流浪汉以0.2的概率选择寻找工作，0.8的概率选择游荡同样，可以根据流浪汉的期望效用函数找

31、到政府的最优混合战略。？支付最大化法五混合战略纳什均衡n假定最优混合战略存在，给定流浪汉选择混合战略（r，1-r），政府选择纯战略救济的期望效用为：3r+（-1）（1-r）=4r-1n选择纯战略不救济的效用为：-1r+0（1-r）=-rn如果一个混合战略（而不是纯战略）是政府的最优选择，一定意味着政府在救济与不救济之间是无差异的。4r-1=-r r=0.2 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作支付等值法五混合战略纳什均衡n社会福利博弈 23，3-1，1-1，00，流浪流浪汉政府救济不救济寻找工作设：政府救济的概率：1/2；不救济的概率：1/2。流浪汉：寻找工作的概率

32、：0.2；流浪的概率：0.8每个参与人的战略都是给定对方混合战略时的最优战略完全信息动态搏弈 -子博弈精炼纳什均衡n强盗分金1UDL（1，1)22，0RU（3，0)(0,2)2D 子博弈精练纳什均衡（U，U），L）.U和L分别是参与人1和参与人2在非均衡路径上的选择。逆向归纳法求解子博弈精练纳什均衡的过程，实质上是重复剔除劣战略的过程：从最后一个决策结依次剔除每个子博弈的劣战略，最后生存下来的战略构成精练纳什均衡。不完全信息静态博弈 -贝叶斯纳什均衡n贝叶斯纳什均衡：n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合，其中每个参与人i在给定自己的类型i和其他参与人类型依存战略的情况下，最

33、大化自己的期望效用。n空城计不完全信息博弈100，100-50，00，00，0不接受求爱者求爱不求爱接受100，-100-50，00，00，0不接受你求爱者求爱不求爱接受你100 x+（-100）（1-x）=0当x大于1/2时，接受求爱求爱博弈：品德优良者求爱求爱博弈：品德恶劣者求爱求爱者有两种类型：品德优良，品德恶劣N高低P1-P不进入进入不进入进入BB合作斗争合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)市场进入博弈n均衡战略是：高成本的在位者在位者选择默许，低成本的在位者在位者选择斗争。只有当高成本的概率p=1/5时，

34、进入者进入者才选择进入，否则不进入。不完全信息动态博弈 -精练贝叶斯纳什均衡n精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求：n1、在每个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；n2、给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的；n3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。n黔之驴信号传递博弈及其应用举例n信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。n参与人：两个，信号发送者1和信号接收者2；1的类型是私人信息，2 的类型是公共信息（即只有一个类型）。n博弈顺序：1、“

35、自然”首先选择参与人1的类型，参与人1知道，但参与人2不知道。只知道1属于该类型x的先验概率。2、参与人1观测到类型x后发出信号3、参与人2观测到参与人1发出的信号，使用贝叶斯法则从先验概率得到后验概率，然后选择行动。精练贝叶斯纳什均衡高-在位者P=6进入者进入在位者利润：7+3X1/2在位者P=5进入者不进入在位者利润：6+7牺牲1单位换取4单位利润是合算的在位者P=5 给定在给定在位者的后验位者的后验概率和战略概率和战略低-在位者P=5进入者不进入在位者利润：9+9最优选择给定两类在位者都选p=5，进入者不能从观测到价格中得到任何信息，x（5）=（1*x）/（1*x+1*（1-x）=x1/

36、2,进入的期望利润x（1）+（1-x）*（-1）=2x-1=1/2低-在位者P=5进入者进入在位者利润：9+5最优选择在位者P=4给定在位给定在位者的后验者的后验概率和战概率和战略略高-在位者P=4进入者不进入在位者利润：2+7给定在位者的战略，x（6）=1和x（4）=0是正确的，因此进入者的最优战略是：如果观测到p=6,选择进入，如果观测到p=4,选择不进入。分离均衡高-在位者P=6进入者进入在位者利润：7+3最优选择在位者P=6精练贝叶斯纳什均衡n信号传递博弈的所有可能的精练贝叶斯均衡可以划分为3类：分离均衡：不同类型的发送者（参与人1）以1的概率选择不同的信号，或者说，没有任何类型选择与

37、其他类型相同的信号在分离均衡下，信号准确地揭示出类型。混同均衡：不同类型的发送者选择相同的信号，或者说，没有任何类型选择与其他类型不同的信号，因此，接收者不修正先验概率。准分离均衡：一些类型的发送者随机地选择信号，另一些类型的发送者选择特定的信号。精练贝叶斯纳什均衡n啤酒-蛋糕博弈n参与人1是一个善于打架的强者的概率是0.9，是一个不善于打架的弱者的概率是0.1，但是，即使参与人1知道自己能打赢，也不想和别人打架。如果参与人1是弱者，参与人2就想和他打架。参与人2不知道参与人1的类型，但他能够观察参与人1早餐吃什么，如。参与人2知道若者喜欢以蛋糕为早餐，而强者喜欢以啤酒为早餐。两个均衡：无论参与人1是什么类型，都选择啤酒做早餐，参与人2选择不打架；无论参与人是什么类型，都选择蛋糕作为早餐，参与人2选择不打架。-被排除

展开阅读全文