第九章博弈论初步张优秀课件.ppt

上传人:石*** 文档编号:48332450 上传时间:2022-10-05 格式:PPT 页数:31 大小:8.16MB
返回 下载 相关 举报
第九章博弈论初步张优秀课件.ppt_第1页
第1页 / 共31页
第九章博弈论初步张优秀课件.ppt_第2页
第2页 / 共31页
点击查看更多>>
资源描述

《第九章博弈论初步张优秀课件.ppt》由会员分享,可在线阅读,更多相关《第九章博弈论初步张优秀课件.ppt(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第九章博弈论初步张第1页,本讲稿共31页1.2.2 赌胜博弈一、田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田 忌齐齐威威王王得益矩阵第2页,本讲稿共31页第一节、博弈论的基本概念坦白不坦白坦白-5 -5-1 -7不坦白-7 -1-2 -2嫌犯A嫌犯B一、囚犯困境(pris

2、oners dilemma)囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。上表给出了囚徒困境模型的表述。每个在不同的屋子里审讯。上表给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或不坦白。表中每一格的两个数字代囚徒都有两种选择:坦白或不坦白。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。表对应两个囚徒选择组合下各自的刑期。第3页,本讲稿共31页二、博弈的三个基本要素n1、参与者参与者(player)(博奕方、局中人、对局者)(博奕方、局中人、对局者):即有哪些人参与博弈。一般至少有两个参与者。:即有哪些

3、人参与博弈。一般至少有两个参与者。可以是个人,团体,集团。可以是个人,团体,集团。n2、策略策略(strategy):参与人在给定信息集的情况下:参与人在给定信息集的情况下的行动方案。囚徒的行动方案。囚徒A、B都只有两种行动可供选择,即都只有两种行动可供选择,即“坦白坦白”和和“不坦白不坦白”。n3、(payoff)(支付)(支付):博弈的结果给参与人带来:博弈的结果给参与人带来的好处。在博弈论中指一个特定策略组合下参与人的好处。在博弈论中指一个特定策略组合下参与人得到的得到的确定效用水平确定效用水平,或者是指参与人得到的期,或者是指参与人得到的期望效用望效用第4页,本讲稿共31页囚徒困境 参

4、与人小偷 参与人策略集坦白,抵赖 参与人的支付判刑年限第5页,本讲稿共31页第二节 博弈的分类及其表达方式n一、博弈的分类n(一)合作博弈与非合作博弈:是否达成协议,是,合作博弈;否非合作博弈。n(二)静态博弈与动态博弈、完全信息博弈与不完全信息博弈n静态博弈:博弈中,参与人同时选择行动或者虽不同时但后行动者不知道先行动者采取了什么策略的博弈。n动态博弈:参与人的行动有先后顺序,且后行动者知道先行动者选择的策略。n完全信息博弈:每一个参与人对所有的其他参与人的特征、战略空间及支付有准确的认识,否则就是不完全信息博弈。第6页,本讲稿共31页坦白不坦白坦白-10 -10-1 -12不坦白-12 -

5、1-2 -2嫌犯A嫌犯B二、博弈的表达方式(一)战略式描述(支付矩阵表示)第7页,本讲稿共31页ANBB(1/2)(1/2)开发不开发开发开发开发开发不开发不开发不开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,1)(0,0)0,8)市场需求大小N大小(0,0)(2)n(二)扩展式描述(博弈树)第8页,本讲稿共31页BB坦白坦白抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白A抵赖AA坦白坦白抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白B抵赖(3)第9页,本讲稿共31页第三节 完全信息静态博弈(重点)n一、占优策略均衡(以不变应万变)n占

6、优策略:占优策略:无论其他参与者采取什么策略无论其他参与者采取什么策略,某参与,某参与者的者的惟一的最优策略惟一的最优策略就是他的占优策略。就是他的占优策略。n博弈均衡:是指博弈的所有参与者都不想改变自博弈均衡:是指博弈的所有参与者都不想改变自己的策略的这样一种相对静止的状态。己的策略的这样一种相对静止的状态。n占优策略均衡占优策略均衡:由博弈中的所有参与者的占优策略由博弈中的所有参与者的占优策略所构成的均衡所构成的均衡。n房地产开发商:市场需求大的开发商而言(开发,房地产开发商:市场需求大的开发商而言(开发,开发)是占优策略均衡,开发)是占优策略均衡,第10页,本讲稿共31页n(1)囚犯的两

7、难困境(prisoners dilemma)坦白不坦白坦白-10 -10-1 -12不坦白-12 -1-2 -2嫌犯A嫌犯B囚犯困境的占优策略均衡反应了个人理性与团体理性的冲突囚犯困境的占优策略均衡反应了个人理性与团体理性的冲突n占优策略均衡第11页,本讲稿共31页囚徒困境的占优策略如果两个疑犯都能够选择不坦白的话,如果两个疑犯都能够选择不坦白的话,他们将明显地得到一个更大的收益,但他们将明显地得到一个更大的收益,但由于两人的信息无法沟通,选择不坦白由于两人的信息无法沟通,选择不坦白并不是两人的理性选择。对于两人而言,并不是两人的理性选择。对于两人而言,不管对方坦白或是不坦白,自己选择坦不管对

8、方坦白或是不坦白,自己选择坦白都是更优的选择,因而,白都是更优的选择,因而,坦白,坦白坦白,坦白就是均衡战略。就是均衡战略。第12页,本讲稿共31页二、纳什均衡n纳什均衡:纳什均衡:在一个纳什均衡里,任何一个参与者都在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者均不改变各不会改变自己的策略,如果其他参与者均不改变各自的策略。自的策略。n即:给定你的策略,我的策略是最好的策略;给即:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。双方在给定的策略下不愿意调整自己

9、的策略。n博弈中双方都没有绝对的最优策略,一方的最优策略博弈中双方都没有绝对的最优策略,一方的最优策略取决于对方的选择。取决于对方的选择。第13页,本讲稿共31页囚徒困境的纳什均衡 结果(坦白,坦白)(或(8,8)。该结果称为博弈的Nash均衡。(1,1)相对于(8,8)为Pareto最优。第14页,本讲稿共31页性别战 女 足球 足球 男 芭蕾 2,1 0,0 0,0 1,2 芭蕾 性别战博弈中存在两个Nash均衡(足球,芭蕾)和(芭蕾,足球)。博弈结果(2,1)和(1,2)。第15页,本讲稿共31页n 类似的囚犯困境 排队 闯红灯占优战略均衡占优战略均衡占优战略均衡占优战略均衡占优战略均衡

10、占优战略均衡第16页,本讲稿共31页纳什均衡n交通博奕开等开-10 -101 0等0 1-1 -1你他第17页,本讲稿共31页纳什均衡与占优策略均衡的关系n占优策略均衡要求任何一个参与者对于其他参与者的任何选择来说,其最优战略都是唯一的。n纳什均衡只要求任何一个参与者的最优战略选择给定的条件下,其选择的战略也是最优的。n所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定是占有战略均衡。第18页,本讲稿共31页三、寡头垄断厂商的共谋及其特征n寡头间合作的可能性。寡头间合作的可能性。n寡头间合作的方式寡头间合作的方式n卡特尔卡特尔n价格领导制价格领导制n寡头间的合作是不稳定的。每一个寡头寡头间的合

11、作是不稳定的。每一个寡头都有强烈的利己动机去背离协议,以获都有强烈的利己动机去背离协议,以获得自身的利益最大化。得自身的利益最大化。第19页,本讲稿共31页卡特尔寡头乙(合作)不降价(不合作)降价 寡头甲(合作)不降价10,10 6,12(不合作)降价 12,6 8,8 价格战囚犯困境模型的扩展应用:寡头厂商合作的不稳定性第20页,本讲稿共31页第三节第三节 重复博弈重复博弈n前面的分析是完全信息静态博弈。在寡前面的分析是完全信息静态博弈。在寡头市场上每个寡头头市场上每个寡头出自个人理性出自个人理性的占优的占优策略却导致了总体和个体利益的下降。策略却导致了总体和个体利益的下降。n在重复博弈(动

12、态博弈的一种)中上述在重复博弈(动态博弈的一种)中上述情况有可能改变。情况有可能改变。n无限次重复博弈会走出无限次重复博弈会走出“囚徒困境囚徒困境”。n有限次重复博弈中仍然会存在有限次重复博弈中仍然会存在“囚徒困囚徒困境境”。第21页,本讲稿共31页一、重复博弈下的合作解一、重复博弈下的合作解重复博弈重复博弈:是指同样结构的博弈重复多次。如果博弈只:是指同样结构的博弈重复多次。如果博弈只是进行了一次,参与人只会关心一次性支付;但如果博弈重是进行了一次,参与人只会关心一次性支付;但如果博弈重复进行,参与人可能会为长期利益暂时牺牲眼前利益从而选复进行,参与人可能会为长期利益暂时牺牲眼前利益从而选择

13、不同的策略。重复博弈分析遵循一个原则择不同的策略。重复博弈分析遵循一个原则“以牙还牙以牙还牙”n有限次重复博弈:相同结构的博弈可以有限次重复进行下去。假设只做5次重复博弈,用逆推法来分析。第5轮博弈,厂商出于理性占有策略会选择不合作的违约行为,在第四轮,每个参与者都知道大家第五轮会选择不合作,所以第四轮也会选择不合作,依次类推到第一轮,仍然选择不合作。所以在有限次重复博弈中,共谋是不稳定的,占有策略均衡是(不合作,不合作)第22页,本讲稿共31页一、重复博弈下的合作解一、重复博弈下的合作解n无限次重复博弈:第一个参与者为了避免“以牙还牙”策略给自己带来的长期损失,都会首先放弃采取不合作策略,寡

14、头厂商们的合作协议可以维持,可以走出囚犯困境。第一个参与者首先选择合作的支付为10+10+10+,首先选择不合作的支付为12+8+8+。最终厂商都会选择合作,即博弈的占有策略均衡为(合作,合作)第23页,本讲稿共31页二、序列博弈n序列博弈:参与者选择策略有时间的先后顺序,某些对局者可以率先采取行动的博弈。此博弈中,率先采取行动的参与者会选择对自己有力的策略,先行者有一定的有利地位,即先行者优势。比如沃尔玛考先行者优势获得成功。第24页,本讲稿共31页市场进入博弈 厂商 B 进入 不进入 进入厂商A 不进入不是Nash均衡-20,-2050,0 0,50 0,0第25页,本讲稿共31页 三、动

15、态行动下的策略行为(了解)(一)阻扰市场进入的威胁 在某一产品生产领域,一厂商(称为在位者)单独生产该产品,获得高额利润300。现有另一厂商(进入者)准备进入该产品市场。第26页,本讲稿共31页市场进入阻扰博弈 进入者面临的选择“进入”或“不进入”;在位者面临的选择“默许”或“斗争”。第27页,本讲稿共31页市场进入阻扰博弈 该博弈同样存在两个Nash均衡(进入,不抵制)和(不进入,抵制)。博弈结果(40,50)和(0,300)。第28页,本讲稿共31页抵制不抵制进入-10 2010 40不进入0 400 80在位者潜在进入者n阻止市场进入的博弈该博弈同样存在两个Nash均衡:(进入,不抵制)和(不进入,不抵制)。博弈结果:(10,40)和(0,80)。第29页,本讲稿共31页抵制不抵制进入-10 2010 40不进入0 400 80在位者潜在进入者n实行承诺的阻止市场进入的博弈可信的承诺能够阻止市场的进入,但也给厂商自身带来一定的限制 第30页,本讲稿共31页人无我有“创新战略”人有我特“差别化战略”人特我廉“低成本战略”人廉我走“多元化战略”完全信息静态博弈第31页,本讲稿共31页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁