2022年博弈论期末复习题 .pdf

上传人:C****o 文档编号:25542974 上传时间:2022-07-12 格式:PDF 页数:15 大小:381.99KB
返回 下载 相关 举报
2022年博弈论期末复习题 .pdf_第1页
第1页 / 共15页
2022年博弈论期末复习题 .pdf_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《2022年博弈论期末复习题 .pdf》由会员分享,可在线阅读,更多相关《2022年博弈论期末复习题 .pdf(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1 一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡B A L R U 1,3 2,5 D 4,1 6,2 解:由划线解得知有一个纯战略均衡(RD,)再看看它是否有混合战略均衡设B以)1 ,(玩混合战略,则有均衡条件:2)1(21)(UVA26)1(64)(DVA262得14,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。2、试将题一中的支付作一修改使其有混合战略均衡解: 由奇数定理, 若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。B A L R U 5,6 2,5 D 4,1 6,2 将博弈改成上述模型,则)1 (64)1(252632得54同样,设A的混合战略为)1

2、,(,则精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 15 页2 )1(25)1(16325121于是混合战略均衡为51,54,21,21。二、逆向归纳法1、用 逆向归纳法 的思路求解下述不完美信息博弈的子博弈精炼均衡1 2 1 2 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解1 LR2 ab1 1 2 LRLRcd(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在 1 的第二个信息集上,1 认为 2 选a的概率为P,则 1 选L的支付PPP32)1(251 选R的支付PPPP3

3、233)1 (36精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 15 页3 故 1 必选R。给定 1 在第二个决策结上选R,2 在左边决策结上会选a,故子博弈精炼均衡为),( ,daRL四、两个厂商生产相同产品在市场上进行竞争性销售。第1 个厂商的成本函数为11qc,其中1q为厂商 1 的产量。 第 2 个厂商的成本函数为22cqc,其中2q为厂商2 的产量,c为其常数边际成本。两个厂商的固定成本都为零。厂商2 的边际成本c是厂商2 的“私人信息” ,厂商1 认为c在23,21上呈均匀分布。设市场需求函数为214qqP,其中P为价格,

4、两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定2q,厂商 1 的问题是12111) 14()1(max1qqqqPq因)(22cqq。厂商 1 不知道c,故目标函数为2/3212112/3121211211)(3max)1)(4(maxdccqqqqdcqcqqqq一阶条件:0)(232/32121dccqq得2/32121)(2123dccqq(1)厂商 2 的问题是:2221222122)4()4()(max2qqqqcqcqqqcPq一阶条件:02)4(21qqc精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 15

5、页4 得24)(12qccq(2)代入式( 1) :4321238144234124212324212312212/32/312/311212121qqcdcqdcqcq得11q代入式( 2) :23)(2ccq若1c,则121qq121若信息是完全的且1c, 则古诺博弈均衡为15321qq,1252721。这说明信息不完全带来的高效率。2、完美信息动态博弈。会用策略式表达、扩展式表达 。用方框找纳什均衡,用树找子博弈精炼均衡。讲理由,看例题。该博弈中有三个纳什均衡:不进入,(进入,进入)进入, (不进入,进入)进入, (不进入,不进入)精选学习资料 - - - - - - - - - 名师归

6、纳总结 - - - - - - -第 4 页,共 15 页5 前两个均衡的结果(进入,不进入),即 A 进入, B 不进入;第二个均衡结果是(不进入,进入 ),即 A 不进入, B 进入如果理论得到这样的结果,无助于预测博弈参与人的行为。此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的“合理纳什均衡”与 “不合理纳什均衡”分开。 正

7、如纳什均衡是完全信息静态博弈解的基本慨念一样, 子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。不进入,(进入,进入) 进入,(不进入,进入) 进入,(不进入,不进入) 前边得到的三个纳什均衡中,均衡意味着当A 不进入时, B 选择进入; 而当 A 选择进入时,B 仍选择进入( B 威胁无论如何都要进入市场)。显然,当 A 选择进入时, B 仍选择进入是不合理的,如果 A 进入市场, B 选择“不进入”比选择“进入”收益要更大,理性的B 不会选择进入,而A 知道 B 是理性的,因此也不会把该战略视为B 会选择的战略。因此,B 的战略(进入,进入)是不可置信威胁。不进入,(进入,进入) 进入,

8、 (不进入,进入) 进入, (不进入,不进入) 均衡意味着当A 进入时, B 选择不进入;而精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 15 页6 当 A 选择不进入时,B 仍选择进入( B 威胁无论如何都不进入市场)。显然,当A 选择不进入时, B 仍选择不进入是不合理的,B 的战略是不可置信的。只有均衡是合理的:如果A 进入, B 不进入;如果A 不进入, B 进入。因为 A 是先行动者, 理性的 A 会选择“进入” (他知道B 是理性的, B 不会选择 “进入”) ,而理性的B 选择“不进入” 。观察博弈树上的三个均衡中,B

9、的不可置信战略中的反应,在第二阶段B 开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B 的战略在所有子博弈中都是最优的,与A 的第一阶段可能选择的行动构成该子博弈的纳什均衡。五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡(8,1) (1,2) 1a发送者1a2m1t1m2a5. 02a(2,7) (10,8) 接收者自然N接收者(6,5) (4,1)1a5. 01a2m发送者1m2a2t2a(7,3) (3,7) 解:有四种可能:混同均衡11mt,12mt21mt,22mt分离均衡11mt,22mt21mt,12mt设)(imu为接收者看见im时认为发送者是1t的后验概率。看1

10、1mt,12mt则5.0)(1mu,非均衡路径上 1 ,0)(2mu精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 15 页7 当接收者看见1m,选1a的支付为5 .115.025 .0选2a的支付为5.15 . 775. 085.0故选2a。当接收者看见2m,选1a的支付为)(455)(1(1)(222mumumu选2a的支付为)(433)(1(7)(222mumumu当1t选1m,接收者会选2a,1t得支付 10,要求1t不选2m,对)(2mu无要求,因1t总会选1m。当2t选1m,接收者会选2a,2t得支付 3,要求2t不选2m是

11、不可能的,因2t选2m是占优于选1m的,故此混同均衡11mt,12mt不存在。再看混同均衡21mt,22mt此时 1 , 0)(1mu为非均衡路径上的后验概率,5 .0)(2mu当接收者看见2m,选1a的支付为355.015. 0选2a的支付为3535. 075.0故接收者必选2a。当接收者看见1m时,选1a的支付为)(11)(1(2)(111mumumu选2a的支付为)(1)(77)(1(8)(1111mumumumu故必选2a。这样,无论发送者发出1m或2m信号,接收者总选2a,给定接收者总是选2a。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -

12、第 7 页,共 15 页8 1t会选1m,2t会选2m。故21mt,22mt不是混同均衡。看分离均衡11mt,22mt1)(1mu,0)(2mu接收者看见1m时,必选2a接收者看见2m时,必选1a此时,1t选1m,2t选2m故11mt,22mt是一个分离均衡。最后看分离均衡21mt,12mt0)(1mu,1)(2mu接收者看见1m时,必选2a接收者看见2m时,必选2a给定接收者总选2a11mt,22mt故21mt,12mt不是分离均衡。故只有一个纯战略子博弈精炼分离均衡11mt22mt鹰-鸽 (Hawk-Dove) 博弈(1) 参与人:争食的两只动物-动物 1 和动物 2。动物 1 和动物 2

13、 的行动空间都是一样的,即:Ai= 鹰,鸽 i=1 ,2 支付矩阵如下:(2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什均衡。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 15 页9 两个纯策略纳什均衡是:(鹰,鸽 )和(鸽,鹰 )。混合策略纳什均衡是:动物1 和动物2分别以 50%的概率随机地选择鹰(象鹰一样行动)或者鸽 (象鸽一样行动)。纯策略纳什均衡可以用划线法或箭头法求解。混合策略纳什均衡则可根据无差异原则求解概率分布,即:首先,动物1 应该以 q 的概率选择鹰,以1-

14、q 的概率选择鸽,使得动物2 在鹰或者鸽之间无差异,那么可得q*:由 4(1-q) = q+3(1-q) 得 q*=50% ;其次,动物2 应该以 a 的概率选择鹰,以1-a 的概率选择鸽,使得动物1 在鹰或者鸽之间无差异,那么可得a*:由 4(1-a) = a+3(1-a) 得 a*=50% 。(3) 此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。七、狩猎博弈此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。支付矩阵如下:根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿 )和

15、(兔,兔 ),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。但是,比较两个纳什均衡,很容易发现两人都猎鹿帕累托优于两人都猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,因此,在现实中两个人都决定猎鹿的可能性要更大一些。然而, 正如卢梭所言, 如果一只野兔碰巧经过他们中的一个人附近,那么也许这个人会去猎兔而使猎鹿失败,因为两个人都猎兔也是一个纳什均衡,这就是人的自私性。此外,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。比如,两个猎人是好朋友,经常合作, 那么我们几乎

16、可以100%的肯定他们都会同时选择猎鹿。如果他们是仇敌,那么我们可以肯定他们不会合作猎鹿,因此他们都会选择各自猎兔。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 15 页10 来源 :考试大 -考博考试不完全信息夫妻博弈混合策略均衡给定妻子分别以q,1-q 的概率选择时装、足球, 则丈 夫 选 择 时 装 、 足 球 的 期 望 收 益 相 等 , 即1.q+0.(1-q)=0.q+3.(1-q) ,解得妻子选择时装、足球的概率分别为(3/4,1/4)给定丈夫分别以p,1-p 的概率选择时装、足球,则妻子选择时装、 足球的期望收益相等

17、,即 2.p+0.(1-p)=0.p+1.(1-p) , 解得妻子选择时装、足球的概率分别为(1/3,2/3)当妻子以 (3/4,1/4)的概率分布随机选择时装表演和足球,丈夫以(1/3,2/3)的概率随机选择时装表演和足球时,双方都无法通过单独改变策略,即单独改变随机选择纯策略的概率分布而提高利益,因此双方的上述概率分布的组合构成一个混合策略纳什均衡。该混合策略纳什均衡给妻子和丈夫各自带来的期望收益分别为:q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3; q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4 双方的期望

18、收益均小于纯策略时的期望收益。某些静态贝叶斯博弈的例子1、市场进入博弈一个完全垄断企业B 正在垄断一个行业市场,另一个潜在的试图进入该行业的企业 A,称 A 为进入者, B 为在位者。 A 不知道 B 的成本特征,设B 有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 15 页11 表 6.1 市场进入博弈B 高成本低成本默认斗争默认斗争A 进入40,50 -10,0 30,80 -10,100 不进入0,300 0,300 0, 400 假定 B 知道进入者A 的

19、成本为高成本,且与 B 为高成本时的成本相同。假若信息是完全的,则当B 为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当B 为低成本时,唯一的纳什均衡为(不进入,斗争),即若 A 进入行业,具有低成本优势的B 将通过降低价格将A 逐出市场。由于存在行业进入成本,所以A 被逐出市场后将有净的10 单位进入成本的损失。当 A 不知道 B 的成本情况时, 他的选择将依赖于他对B 的成本类型的主观概率或先验概率密度。设 A 对 B 是高成本的先验概率判断为P,则 A 认为 B 为低成本的概率为P1。如果 A 进入,其期望支付为)10)(1 ()40(

20、PP如果 1 不进入,其期望支付为0。当且仅当0)10)(1()40(PP或51P时,A 选择进入; 反之,当51P时,A 不进入。于是,贝叶斯均衡为:(进入,默认) ,高成本,51P;(进入,斗争) ,低成本,51P;(不进入, *) ,51P其中 *表示可以是斗争,也可以是默认。2 成本信息不对称的古诺博弈例 3.10 给出的古诺博弈中,每个厂商的成本函数是共同知识。这里,我们假设每个厂商的成本函数是私人信息,具体规定如下: 两个企业生产相同产品在同一市场上进精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页,共 15 页12 行竞争性销

21、售, 市场需求函数为PaQ,0a,P为产品价格, Q 为市场需求量。假设a充分大时总有0Pa,企业i的成本函数为iiiqbC,其中iC为企业i的总成本,iq为其产量,ib为其平均成本,ib为常数且0ib,故ib也是边际成本。ib是企业i的私人信息,企业j不知道ib但认为ib在,ed上呈均匀分布,0d,0e,ed。且进一步假定ib在,ed呈均匀分布是共同知识,ji,2 ,1ji。企业i的支付函数是其利润函数iiiiiiiqbqQacPq)(因21qqQ故iiiiqbqqqa)(21设静态贝叶斯均衡为2, 1*iiq,则由均衡战略的类型依存性有2, 1),(*ibqqiii于是)()()()()(

22、*2*21*1jiiiiiiibbqbbqbqbqai的期望支付为jHjjiijiidbbbbPu)()|(显然)()|(jijbPbbP,由概率分布密度)(jbP的归一化条件jHjjdbbP1)(及jb在,ed上呈均匀分布假设,有jHjjdbbP1)(或1)(jbPde即debPj1)(于是,)()()(1deqbqdbbqdeqadeuiiiHjjjiij一阶条件:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 15 页13 0)()()()()(1jHijjjiiiidebdbbqdeqaqdedequ)(2)(deqdebaq

23、jii(6.5)同样由对称性有)(2)(deqdebaqijj(6.6)在上式两端对jb进行积分22)(22ijqdedeaq(6.7)在式( 6.5)两端对ib积分22)(22jiqdedeaq(6.8)将式( 6.7)代入式( 6.8)的右端,得)(32dedeaqi(6.9)由对称性有)(32dedeaqqij代入式( 6.5)得6232)(2)(32)(*debadededeadebaqiii精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 15 页14 同理有6232*debaqjj于是得静态贝叶斯均衡为)6232,6232(

24、21debadeba。当a充分大时,*iq和*jq均为非负数。当21bb时,*2*1qq;均衡利润*2*22*11*1)()(qbPqbP,即成本较高的一方利润较低,产量较低。当de时,博弈退化成完全信息静态博弈的场合。为了与例3.26 相比较,进一步设ced,cbb21,则)(31*2*1caqq这正好回到例3.26 的结果。若假设ecd,2edc,cbb21,则)(31*2*1caqq,这与完全信息博弈均衡相同。若假设2edc,cbb21,则)(31*2*1caqq,此时每个厂商都误以为对方的成本较自己高的可能性大一些,从而过于自信地扩大产量。相反,若假设2edc,cbb21,则)(31*

25、2*1caqq,此时每个厂商都误以为对方的成本较自己低的可能性大一些,从而过于谨慎地计划自己的产量。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 15 页15 寡头市场两个企业遵循古诺模型,a 企业成本 c1=20q1,b 企业成本c2=60q2,市场需1、求 p=400-q。(1)厂商 1和厂商 2的反应函数 (2) 均衡价格和厂商1和厂商 2的均衡产量。 (3)厂商 1和厂商 2的利润1).profit1=q1*400-(q1+q2)-20q1 profit2=q2*400-(q1+q2)-60q2 分别求偏导:400-2q1-q2-20=0;400-2q2-q1-60=0 反应函数: q1=190-q2/2;q2=170-q1/2 2)联立反应函数,解得q1=140 q2=100 3)profit1=19600;profit2=10000 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 15 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁