《重复博弈的例子(共6页).docx》由会员分享,可在线阅读,更多相关《重复博弈的例子(共6页).docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上重复博弈的例子【篇一:重复博弈的例子】1有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?2两次重复下面的得益矩阵表示的静态博弈。如果你是博弈方1,你会采用怎样的策略。3两次重复下面这个得益矩阵表示的两人静态博弈。问能否有一个子博弈完美纳什均衡策略组合,实现第一阶段的得益是(4,4)?如能,给出双方的策略,如不能,证明为什么不能。如果策略组合(下,左)的得益改为(1,5)会发生什么变化,至少能在部分阶段实现得益(4,4)的条件是什么?4求出下列得益矩阵表示的静态博弈的纳什均衡,并说明有限次和无限次重复该博弈时两博弈方的均衡策略。【篇二:重复博弈的例子
2、】 什么是重复博弈顾名思义,重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stage games)。重复博弈是中的重要内容,它可以是的重复博弈,也可以是。在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或, 即不能象在一次性中那样毫不顾及其它博弈方的利益。有时, 一方做出一种合作的姿态, 可能使其它博弈方在今后阶段采取合作的态度, 从而实现共同的长期利益。下面给出两个重要定义:定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利
3、或不利的行为。定义2:如果动态博弈中各博弈方的策略在动态博弈本身和所有中都构成均衡, 则称该策略组合具有子博弈完美性。在重复博弈中, 可信性同样是非常重要的, 也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据, 又由于长期利益对短期行为的制约作用, 因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的, 从而使博弈的均衡结果出现更多的可能性。 重复博弈的特征1、阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构。2、所有参与人观察到博弈过去的历史。3、参与人的总得益是所有阶段博弈得益的贴现值之和。a、b两个参与人都有两种定价待选择:定高价或定低价。如果两
4、个参与人都定低价,则每个参与人的收益均为20个单位;如果两人都定高价,则每人的收益均为30个单位;如果其中某一参与人定低价,而另一参与人定高价,则定低价的参与人有占有更多的获得40个单位的收益,定高价的参与人由于失去一部分市场份额而只获得10个单位的收益。显然,在这个一次性完全信息静态博弈中,两个参与人均有,占优策略均衡为a、b双方都定低价。如果a、b之间的定价博弈是多次进行的,那么,问题就不是如此简单了。我们先来分析博弈重复次数为无限时的情况。如果a、b双方都选择合作,都保持定高价,则双方在每个阶段的收益均为30个单位,记为(30,30,30,);如果a、b中有一方(如a)采取投机行为,在实
5、际定价中选择不与对方合作,在第一阶段就通过选择定价策略使得选择高价策略的对手b受损,则受损的一方b一定会在第二阶段及其以后的定价中也选择低价策略,加以报复,这样一来,首先选择不合作的一方a在个阶段的收益为(40,20,20,),显然,其远远小于合作、维持高价情况下的总收益。因为,首选选择不合作的一方a,只是在第一阶段获得了“额外”收益,但在以后个阶段的收益将因为对手b的报复性选择而减少,并且,重复若干此后,首先选择不合作的一方a将得不偿失。在这里,b选择的策略称为“”()。冷酷策略是指重复博弈中的任何参与人的一次性不合作将引起其他参与人的永远不合作,从而导致所有参与人的收益减少。因此,所有参与
6、人具有维持合作的积极性。我们再来讨论博弈重复次数为有限时的情况。重复次数有限博弈与重复次数无限博弈之间的惟一区别,是所有参与人都可以明确无误地了解重复的次数,即可以准确地到最后一个阶段博弈。而在最后阶段的博弈中,任何一个参与人选择不合作,不会导致其他参与人的报复。因此,所有参与人都会在最后阶段的博弈中选择自己的占优策略,那就是不合作。上例中,在最后阶段博弈中选择低价是所有参与人的占优策略。既然所有参与人都会在最后阶段选择不合作,那么,在倒数第二阶段博弈中任何参与人也就没有必要担心由于自己选择不合作,导致其他参与人在最后阶段博弈中的报复。因此所有参与人在倒数第二阶段博弈中,也都会选择不合作。即在
7、倒数第二阶段博弈中,所有参与人都会选择占优策略。由此类推,可以得出以下结论:在阶段性博弈存在惟一的纳什均衡时,阶段博弈的纳什均衡解就是重复次数有限博弈的唯一解。即重复次数有限博弈的每个阶段的均衡解都是一次性博弈的纳什均衡解。注意,上述推论成立的前提条件是阶段性博弈纳什均衡的惟一性。 参考文献 池州学院.西方经济学m.第六章 市场结构理论 第八节 博弈论初步【篇三:重复博弈的例子】再举一个生活中的例子:如果你去菜场买菜,当你对某种菜的质量、口味等有疑虑时,卖菜的阿姨常会讲:“你放心,我一直在这儿卖呢!”这句朴实的话中其实包含了华丽的“博弈论”思想:我卖与你们买是一个次数无限的重复博弈,我今天骗了
8、你,你们今后就不会再来我这儿买了,所以我不会骗你的,菜的质量、口味肯定没问题。而你在听了阿姨的上述一句话后,常常也会打消疑虑,买菜回家。在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时,老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察,这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子,老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。一天,毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是最优策略选择。又过了一些天,老虎又来观察,并对
9、毛驴挨得很近,往毛驴身上挤碰,故意挑衅它。毛驴在忍无可忍的情况下,就用蹄子踢老虎,除此之外,别无它法。老虎最终了解到毛驴的真实本领后,就扑过去将它吃了。在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。事实上,毛驴的策略也是正确的,它知道自己的技能有限,总想掩藏自己的真实技能。老虎吃掉毛驴的策略,在“博弈论”中就是所谓的“精炼贝叶斯均衡”。人们常提到的“上有政策、下有对策”,其实是对管理者与被管理者之间的动态博弈的一种描述,面对上边的政策,下边寻求对策是正常的、必然的。从“博弈论”的角度讲,上边的政策制定必须在考虑到下边可能会有的对策的基础上进行,否则,政策就不会是
10、科学、合理的。从以上对“博弈论”简要、通俗的介绍中可以发现,我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学等,这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。案例二:智猪博弈 这个例子讲的是,猪圈里有两头猪,一大一小猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有个单位的猪食进槽,但谁按按钮需要付个单位的成本若大猪先到,大猪吃到个单位,小猪只能吃个单位;若同时到,大猪吃个单位,小猪吃个单位;若小猪先到,大猪吃个单位,小猪吃个单位。表中第一格表示两猪同时按按钮,因
11、而同时走到猪食槽,大猪吃个,小猪吃个,扣除个单位的成本,支付水平分别为和其他情形可以类推 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择”按”还是”等待”,小猪的最优选择均是”等待”比如说给定大猪按,小猪也按时得到个单位,等待则得到个单位;给定大猪等待,小猪按得到单位,等待则得单位,所以,”等待”是小猪的占优战略给定小猪总是选择”等待”,大猪的最优选择只能是”按”所以,纳什均衡就是:大猪按,小猪等待,各得个单位多劳者不多得! 案例三:性别战 这个例子讲的是一男一女谈恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出男的偏好足球,女的则更喜欢芭蕾,但他们都宁愿在一起,不愿
12、分开。这个博弈中,有两个纳什均衡:(足球,足球)(芭蕾,芭蕾)就是说,给定一方去足球场,另一方也会去足球场;类似的,给定一方去看芭蕾舞,另一方也会去看芭蕾舞那么,究竟哪一个纳什均衡会实际发生?我们不知道只有看实际生活了 案例四:斗鸡博弈 设想两个人举着火棍从独木桥的两端走向中央进行火拼,每个人都有两种战略:继续前进,或退下阵来若两人都继续前进,则两败俱伤;若一方前进另一方退下来,前进者取得胜利,退下来的丢了面子;若两人都退下来,两人都丢面子这个博弈里也有两个均衡:如果一方进,另一方的最优战略就是退。两人都进或退都不是纳什均衡。 案例五:市场进入阻挠 这是产业组织经济学中的一个例子设想有一个垄断
13、企业已在市场上(称为”在位者”),另一个企业虎视眈眈想进入(”进入者”)在位者想保持自己的垄断地位,所以就要阻挠进入者进入 在这个博弈中,进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略:默许或斗争假定进入之前垄断利润为,进入之后寡头利润合为(各得),进入成本为各种战略组合下的支付矩阵亦可列表这个博弈中也有两个纳什均衡,即(进入,默许),(不进入,斗争)为什么(进入,默许)是纳什均衡?因为给定进入者进入,在位者选择默许时得单位利润,选择斗争时得不到利润,所以,最优战略是默许。类似的,给定在位者选择默许,进入者的最优战略就是进入尽管在进入者选择不进入时,默许和斗争对在位者是一个意思,只有当在位者选择斗争时,不进入才是进入者的最优选择,所以,(不进入,斗争)是一个纳什均衡,而(不进入,默许)不是一个纳什均衡。 案例六:承诺行动 现实中我们知道存在很多不可置信的威胁,而如何令不可置信的威胁变的真正具有威胁能力呢?那就要引入”承诺行动”这个概念。专心-专注-专业