《博弈论的几个经典模型 (2)课件.ppt》由会员分享,可在线阅读,更多相关《博弈论的几个经典模型 (2)课件.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于博弈论的几个经典模型(2)现在学习的是第1页,共81页博弈论的几个经典模型博弈论的几个经典模型引 言 博博博博弈弈弈弈论论论论又又又又被被被被称称称称为为为为对对对对策策策策论论论论(Game Game Game Game Theory)Theory)Theory)Theory),按按按按照照照照20052005年年因因对对博博弈弈论论的的贡贡献献而而获获得得诺诺贝贝尔尔经经济济学学奖奖的的Robert Robert AumannAumann教教教教授授授授的的的的说说说说法法法法,博博博博弈弈弈弈论论论论就就就就是是是是研研研研究究究究互互互互动动动动决决决决策策策策的的的的理理理理论论
2、论论。所所所所谓谓谓谓互互互互动动动动决决决决策策策策,即即即即各各各各行行行行动动动动方方方方(即即即即局局局局中中中中人人人人playerplayer)的的决决策策是是相相互互影影响响的的,每每个个人人在在决决策策的的时时候候必必须须将将他他人人的的决决策策纳纳入入自自己己的的决决策策考考虑虑之之中中,当当然然也也需需要要把把别别人人对对于于自自己己的的考考虑虑也也要要纳纳入入考考虑虑之之中中在在在在如如如如此此此此迭迭迭迭代代代代考考考考虑虑虑虑情情情情形形形形进进进进行行行行决决决决策策策策,选选选选择最有利于自己的战略择最有利于自己的战略择最有利于自己的战略择最有利于自己的战略(st
3、rategy)(strategy)。现在学习的是第2页,共81页博弈论的几个经典模型博弈论的几个经典模型 博博弈弈论论的的应应用用领领域域十十分分广广泛泛,在在经经济济学学、政政治治科科学学(国国内内的的以以及及国国际际的的)、军军事事战战略略问问题题、进进化化生生物物学学以以及及当当代代的的计计算算机机科科学学等等领领域域都都已已成成为为重重要要的的研研究究和和分分析析工工具具。此此外外,它它还还与与会会计计学学、统统计计学学、数数学学基基础础、社社会会心心理理学学以以及及诸诸如如认认识识论论与与伦理学等哲学分支有重要联系。伦理学等哲学分支有重要联系。引 言现在学习的是第3页,共81页博弈论
4、的几个经典模型博弈论的几个经典模型 按按照照AumannAumann所所撰撰写写的的新新帕帕尔尔格格雷雷夫夫经经济济学学大大辞辞典典“博博博博弈弈弈弈论论论论”辞辞辞辞条条条条的的的的看看看看法法法法,标标标标准准准准的的的的博博博博弈弈弈弈论论论论分分分分析析析析出出出出发发发发点点点点是是是是理理理理性性性性的的的的,而而而而不不不不是是是是心心心心理理理理的的的的或或或或社社社社会会会会的的的的角角角角度度度度。不不不不过过过过,近近近近3030年年来来结结合合心心理理学学和和行行为为科科学学、实实验验经经济济学学的的研研究究成成就就而而对对博博弈弈论论进进行行一一定定改改造造的的行为博
5、弈论行为博弈论(behavoiral game theory)(behavoiral game theory)(behavoiral game theory)(behavoiral game theory)也日益兴起。也日益兴起。也日益兴起。也日益兴起。引 言现在学习的是第4页,共81页博弈论的几个经典模型博弈论的几个经典模型失火了,你往哪个门跑失火了,你往哪个门跑这就是博弈论这就是博弈论 一一天天晚晚上上,你你参参加加一一个个派派对对,屋屋里里有有很很多多人人,你你玩玩得得很很开开心心。这这时时候候,屋屋里里突突然然失失火火,火火势势很很大大,无无法法扑扑灭灭。此此时时你你想想逃逃生生。你你
6、的的面面前前有有两两个个门门,左左门门和和右右门门,你你必必须须在在它它们们之之间间选选择择。但但问问题题是是,其其他他人人也也要要争争抢抢这这两两个个门门出出逃逃。如如果果你你选选择择的的门门是是很很多多人人选选择择的的,那那么么你你将将因因人人多多拥拥挤挤、冲冲不不出出去去而而烧烧死死;相相反反,如如果果你你选选择择的的是是较较少少人人选选择择的的,那那么么你你将将逃逃生生。这这里里我我们们不考虑道德因素,你将如何选择?不考虑道德因素,你将如何选择?现在学习的是第5页,共81页博弈论的几个经典模型博弈论的几个经典模型 你你你你的的的的选选选选择择择择必必必必须须须须考考考考虑虑虑虑其其其其
7、他他他他人人人人的的的的选选选选择择择择,而而而而其其其其他他他他人人人人的的的的选选选选择择择择也也也也考考考考虑虑虑虑你你你你的的的的选选选选择择择择。你你你你的的的的结结结结果果果果博博弈弈论论称称之之为为支支付付,不不仅仅取取决决于于你你的的行行动动选选择择博博弈弈论论称称之之为为策策略略选选择择,同同时时取取决决于于他他人人的的策策略略选选择择。你和这群人构成一个博弈(你和这群人构成一个博弈(gamegame)。)。)。)。上上述述博博弈弈是是一一个个叫叫张张翼翼成成的的中中国国人人在在1997199719971997年年提提出出的的一一个个博博弈弈论论模模型型,被被称称之之为为少少
8、数数者者博博弈弈或少数派博弈(或少数派博弈(Minority GameMinority Game)。)。生生生生活活活活中中中中博博博博弈弈弈弈的的的的案案案案例例例例很很很很多多多多,你你你你会会会会见见见见到到到到很很很很多多多多例例例例子子子子。只只只只要涉及到人群的互动,就有博弈。要涉及到人群的互动,就有博弈。要涉及到人群的互动,就有博弈。要涉及到人群的互动,就有博弈。引 言现在学习的是第6页,共81页博弈论的几个经典模型博弈论的几个经典模型什么叫博弈?什么叫博弈?什么叫博弈?什么叫博弈?博博弈弈的的英英文文为为gamegame,我我我我们们们们一一一一般般般般将将将将它它它它翻翻翻翻
9、译译译译成成成成“游游游游戏戏戏戏”。而而而而在在在在西西西西方方方方,gamegamegamegame的的的的意意意意义义义义不不不不同同同同于于于于汉汉汉汉语语语语中中中中的的的的游游游游戏戏戏戏。在在在在英英英英语语语语中中中中,gamegame即即是是人人们们遵遵循循一一定定规规则则下下的的活活动动,进进行行活活动动的的人人的的目目的的是是使使自自己己“赢赢”。奥奥林林匹匹克克运运动动会会叫叫Olympic Olympic Olympic Olympic GamesGamesGamesGames。在在在在英英英英文文文文中中中中,gamegame有有竞竞赛赛的的意意思思,进进行行gam
10、egamegamegame的的的的人人人人是是是是很很很很认认认认真真真真的的的的,不不不不同同同同于于于于汉汉汉汉语语语语中中中中游游游游戏戏戏戏的的的的概概概概念念念念。在在在在汉汉汉汉语语语语中中中中,游游游游戏戏戏戏有有有有儿儿儿儿戏戏戏戏的的的的味味味味道道道道。因因因因此此此此将将将将关关关关于于于于gamegame的的的的理理理理论论论论,即即即即game game game game theorytheorytheorytheory翻翻翻翻译译译译成成成成博博博博弈弈弈弈论或者对策论,是恰当的。论或者对策论,是恰当的。论或者对策论,是恰当的。论或者对策论,是恰当的。引 言现在学
11、习的是第7页,共81页博弈论的几个经典模型博弈论的几个经典模型 博博博博弈弈弈弈论论论论的的的的出出出出现现现现只只只只有有有有6060多多年年的的历历史史。博博弈弈论论的的开开创创者者为为诺诺意意曼曼与与摩摩根根斯斯坦坦,他他们们1944194419441944年年年年出出出出版版版版了了了了博博弈弈论论与与经经济济行行为为。博博博博弈弈弈弈论论论论天天天天才才才才纳纳纳纳什什什什(John John NashNash)的的开开创创性性论论文文n n人人人人博博博博弈弈弈弈的的的的均均均均衡衡衡衡点点点点(1950)(1950)、非非合合作作博博弈弈(1951)(1951)(1951)(19
12、51)等等等等等等等等,给给给给出出出出了了了了纳纳纳纳什什什什均均均均衡衡衡衡的的的的概概概概念念念念和和和和均均均均衡衡衡衡存存存存在在在在定定定定理理理理。今今今今天天天天博博博博弈弈弈弈论论论论已已已已发发发发展展展展成成成成一一一一个个个个较较较较完完完完善的学科。善的学科。善的学科。善的学科。博博弈弈论论对对于于社社会会科科学学有有着着重重要要的的意意义义,它它正正成成为为社社会会科科学学研研究究范范式式中中的的一一种种核核心心工工具具,以以至至于于我我们们可可称称博博弈弈论论是是“社社会会科科学学的的数数学学”,或或者者说是关于社会的数学。说是关于社会的数学。引 言现在学习的是第
13、8页,共81页博弈论的几个经典模型博弈论的几个经典模型 1994199419941994年年经经济济学学诺诺贝贝尔尔奖奖颁颁发发给给三三位位博博弈弈论论专专家家:纳纳什什、塞塞尔尔屯屯(R.Selten)(R.Selten)、海海萨萨尼尼(John John C.HarsanyiC.Harsanyi),而而而而像像像像19851985年年年年获获获获得得得得诺诺诺诺贝贝贝贝尔尔尔尔奖奖奖奖的的的的公公公公共共共共选选选选择择择择学学学学派派派派的的的的领领领领导导导导者者者者布布布布坎坎坎坎南南南南,19951995年年获获得得诺诺贝贝尔尔奖奖的的理理性性主主义义学学派派的的领领袖袖卢卢卡卡斯
14、斯 (LukasLukasLukasLukas),其其理理论论与与博博弈弈论论都都有有着着较较深深的的联联系系。现现在在博博弈弈论论正正渗渗透透到到各各门门社社会会科科学学,更更重重要要的的是是它它正正深深刻刻地改变着人们的思维。地改变着人们的思维。引 言现在学习的是第9页,共81页博弈论的几个经典模型博弈论的几个经典模型汪汪贤贤裕裕、肖肖玉玉明明编编著著,博博弈弈论论及及其其应应用用,科科学学出版社,出版社,20082008年年2 2 2 2月月 潘潘潘潘天天天天群群群群著著著著,博博博博弈弈弈弈生生生生存存存存(第第第第二二二二版版版版),中中中中央央央央编编编编译译译译出出出出版版版版社
15、,社,社,社,2004200420042004年年年年1010月月 王王王王春春春春永永永永编编编编著著著著,博博博博弈弈弈弈论论论论的的的的诡诡诡诡计计计计,中中中中国国国国发发发发展展展展出出出出版版版版社社社社,20072007年年年年1 1 1 1月月月月参考书现在学习的是第10页,共81页博弈论的几个经典模型博弈论的几个经典模型博博弈弈论论研研究究的的对对象象:是是理理性性的的行行动动者者或或参参与与者者如如何何选选择择策策略略或或如如何何作作出出行行动动的的决决定定。理理性性的的人人是是对对现现实实的的人人的的基基本本假假定定,即即假假定定参参与与者者努努力力用用自自己己的的推推理
16、理能能力力使使自自己己的的目目标标最最大大化化。“理理性性的的”与与与与“道道道道德德德德的的的的”不不不不是是是是一一一一回回回回事事事事,理理理理性性性性的的的的与与与与道道道道德德德德的的的的有有有有时时时时会会会会发发发发生冲突,但是理性的人不一定是不道德的。生冲突,但是理性的人不一定是不道德的。生冲突,但是理性的人不一定是不道德的。生冲突,但是理性的人不一定是不道德的。基本术语基本术语现在学习的是第11页,共81页博弈论的几个经典模型博弈论的几个经典模型 博弈涉及哪些内容呢?博弈涉及哪些内容呢?博弈涉及哪些内容呢?博弈涉及哪些内容呢?博弈涉及至少两个独立的博弈参与者博弈涉及至少两个独
17、立的博弈参与者博弈涉及至少两个独立的博弈参与者博弈涉及至少两个独立的博弈参与者(player)(player)(player)(player)。博博博博弈弈弈弈涉涉涉涉及及及及行行行行动动动动者者者者存存存存在在在在着着着着策策策策略略略略(strategystrategystrategystrategy)选选选选择择择择的的的的可可可可能能能能,博弈论用策略空间来表示参与者可以选择的策略。博弈论用策略空间来表示参与者可以选择的策略。博弈论用策略空间来表示参与者可以选择的策略。博弈论用策略空间来表示参与者可以选择的策略。参参与与者者在在不不同同策策略略组组合合下下会会得得到到一一定定的的支支付
18、付(payoffpayoff)。)。对于博弈参与者来说,存在着一博弈结果。对于博弈参与者来说,存在着一博弈结果。博弈涉及均衡。博弈涉及均衡。重要的均衡重要的均衡纳什均衡。纳什均衡。基本术语基本术语现在学习的是第12页,共81页博弈论的几个经典模型博弈论的几个经典模型 根据参与者能否形成约束性的协议,以便集体根据参与者能否形成约束性的协议,以便集体行动,博弈可分为合作性博弈和非合作性博弈。行动,博弈可分为合作性博弈和非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。合作性博弈合作性博弈合作性博弈合作性博弈:是指参与者从自己的利益出发与其他:是指
19、参与者从自己的利益出发与其他:是指参与者从自己的利益出发与其他:是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟,其结果对联盟方参与者谈判达成协议或形成联盟,其结果对联盟方参与者谈判达成协议或形成联盟,其结果对联盟方参与者谈判达成协议或形成联盟,其结果对联盟方均有利;均有利;均有利;均有利;非合作性博弈非合作性博弈:是指参与者在行动选择时无法达:是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动就成约束性的协议。人们分工与交换的经济活动就是合作性的博弈,而囚徒困境则是非合作性的博是合作性的博弈,而囚徒困境则是非合作性的博弈。弈。博弈的类型博弈的类型现在学习的是第1
20、3页,共81页博弈论的几个经典模型博弈论的几个经典模型 博弈又可分静态博弈和动态博弈。博弈又可分静态博弈和动态博弈。博弈又可分静态博弈和动态博弈。博弈又可分静态博弈和动态博弈。静态博弈静态博弈:指参与者同时采取行动,或者尽管:指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。不知道先采取行动的人采取的是什么行动。动态博弈动态博弈动态博弈动态博弈:指参与者的行动有先后顺序,并且后采:指参与者的行动有先后顺序,并且后采:指参与者的行动有先后顺序,并且后采:指参与者的行动有先后顺序,并且后采取行动的人可
21、以知道先采取行动的人所采取的行动。取行动的人可以知道先采取行动的人所采取的行动。取行动的人可以知道先采取行动的人所采取的行动。取行动的人可以知道先采取行动的人所采取的行动。博弈的类型博弈的类型现在学习的是第14页,共81页博弈论的几个经典模型博弈论的几个经典模型从知识的拥有程度来看,博弈分为完全信息博弈和不从知识的拥有程度来看,博弈分为完全信息博弈和不从知识的拥有程度来看,博弈分为完全信息博弈和不从知识的拥有程度来看,博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。完全信息博弈。信息是博弈论中重要的内容。完全信息博弈。信息是博弈论中重要的内容。完全信息博弈。信息是博弈论中重要的
22、内容。完全信息博弈完全信息博弈完全信息博弈完全信息博弈:参与者对所有参与者的策略空间:参与者对所有参与者的策略空间及策略组合下的支付有及策略组合下的支付有“完全的了解完全的了解”,否则是否则是不完全信息博弈。严格地讲,完全信息博弈是不完全信息博弈。严格地讲,完全信息博弈是指参与者的策略空间及策略组合下的支付指参与者的策略空间及策略组合下的支付,是博是博弈中所有参与者的弈中所有参与者的“公共知识公共知识”的博弈。的博弈。不完全信息博弈不完全信息博弈:参与者所做的是努力使自己的期:参与者所做的是努力使自己的期:参与者所做的是努力使自己的期:参与者所做的是努力使自己的期望支付或期望效用最大化。望支付
23、或期望效用最大化。望支付或期望效用最大化。望支付或期望效用最大化。博弈的类型博弈的类型现在学习的是第15页,共81页博弈论的几个经典模型博弈论的几个经典模型例:猪圈里有两只猪,一只比较大,一只比较小。猪例:猪圈里有两只猪,一只比较大,一只比较小。猪例:猪圈里有两只猪,一只比较大,一只比较小。猪例:猪圈里有两只猪,一只比较大,一只比较小。猪圈狭长,猪食槽在一头,猪食按钮在另一头,按一圈狭长,猪食槽在一头,猪食按钮在另一头,按一圈狭长,猪食槽在一头,猪食按钮在另一头,按一圈狭长,猪食槽在一头,猪食按钮在另一头,按一下会有下会有下会有下会有1010个单位的猪食落进槽里。由于按钮和个单位的猪食落进槽里
24、。由于按钮和食槽距离较远,按按钮的体力耗费相当于食槽距离较远,按按钮的体力耗费相当于2 2个单个单位的食物。位的食物。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈 小猪小猪大猪大猪按按不按不按(等待等待)按按(5(5,1)1)(5(5,3)3)不按不按(等待等待)(9(9,-1)-1)(0(0,0)0)大猪和小猪分别该如何选择。大猪和小猪分别该如何选择。现在学习的是第16页,共81页博弈论的几个经典模型博弈论的几个经典模型选择等待是小猪的占优策略。选择等待是小猪的占优策略。大大猪猪的的最最佳佳选选择择取取决决于于小小猪猪的的行行动动,如如果果小小猪猪去去按按,大大猪猪最最
25、好好选选择择等等待待;如如果果小小猪猪不不去去按按,则则最最佳佳选选择择是大猪亲自去按。是大猪亲自去按。也也就就是是说说,在在智智猪猪博博弈弈中中,大大猪猪没没有有占占优优策策略略,而而小小猪猪有有占占优优策策略略,它它的的最最佳佳选选择择就就是是耐耐心心等等待待大大猪去按钮,才能获得最佳结果。猪去按钮,才能获得最佳结果。“小小猪猪躺躺着着大大猪猪跑跑”的的现现象象是是由由于于故故事事中中的的游游戏戏规规则则所所导导致致的的。规规则则的的核核心心指指标标是是:每每次次落落下下的的事事物物数数量和踏板与投食口之间的距离。量和踏板与投食口之间的距离。模型一、智猪博弈模型一、智猪博弈/完全信息静态博
26、弈完全信息静态博弈现在学习的是第17页,共81页博弈论的几个经典模型博弈论的几个经典模型如如果果改改变变一一下下核核心心指指标标,猪猪圈圈里里还还会会出出现现同同样样的的“小猪躺着大猪跑小猪躺着大猪跑”的景象吗?试试看。的景象吗?试试看。改变方案一:减量方案。改变方案一:减量方案。改变方案二:增量方案。改变方案二:增量方案。改变方案三:减量加移位方案。改变方案三:减量加移位方案。投投食食仅仅原原来来的的一一半半分分量量,但但同同时时将将投投食食口口移移到到踏踏板板附附近近。结结果果呢呢,小小猪猪和和大大猪猪都都在在拼拼命命地地抢抢着着踩踩踏踏板板。等等待待者者不不得得食食,而而多多劳劳者者多多
27、得得。每每次次的的收获刚好消费完。收获刚好消费完。对对于于游游戏戏设设计计者者,这这是是一一个个最最好好的的方方案案。成成本本不不高,但收获最大。高,但收获最大。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈现在学习的是第18页,共81页博弈论的几个经典模型博弈论的几个经典模型 在在博博弈弈论论中中,含含有有占占优优战战略略均均衡衡的的一一个个著著名名例例子子是是由由塔塔克克给给出出的的“囚囚徒徒困困境境”(prisonersdilemmaprisonersdilemma)博博弈弈模模型型。该该模模型型用用一一种种特别的方式为我们讲述了一个警察与小偷的故事。特别的方式为我们
28、讲述了一个警察与小偷的故事。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第19页,共81页博弈论的几个经典模型博弈论的几个经典模型假假设设:有有两两个个小小偷偷A A和和B B联联合合犯犯事事、私私入入民民宅宅被被警警察察抓抓住住。警警方方将将两两人人分分别别置置于于不不同同的的两两个个房房间间内内进进行行审审讯讯,对对每每一一个个犯犯罪罪嫌嫌疑疑人人,警警方方给给出出的的政政策策是是:如如果果一一个个犯犯罪罪嫌嫌疑疑人人坦坦白白了了罪罪行行,交交出出了了赃赃物物,于于是是证证据据确确凿凿,两两人人都都被被判判有有罪罪。如如果果另另一一个个犯犯罪罪嫌嫌疑疑人人也也作作了了
29、坦坦白白,则则两两人人各各被被判判刑刑8 8年年;如如果果另另一一个个犯犯罪罪嫌嫌人人没没有有坦坦白白而而是是抵抵赖赖,则则以以妨妨碍碍公公务务罪罪(因因已已有有证证据据表表明明其其有有罪罪)再再加加刑刑2 2年年,而而坦坦白白者者有有功功被被减减刑刑8 8年年,立立即即释释放放。如如果果两两人人都都抵抵赖赖,则则警警方方因因证证据据不不足足不不能能判判两两人人的的偷偷窃窃罪罪,但但可可以以私私入入民民宅的罪名将两人各判入狱宅的罪名将两人各判入狱1 1年。年。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第20页,共81页博弈论的几个经典模型博弈论的几个经典模型 不不难难看
30、看出出,“坦坦白白”是是任任一一犯犯罪罪嫌嫌疑疑人人的的占占优优战战略,而(坦白,坦白)是一个占优战略均衡。略,而(坦白,坦白)是一个占优战略均衡。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈 乙乙 甲甲坦白坦白抵赖抵赖坦白坦白(-8(-8,-8)-8)(0(0,-10)-10)抵赖抵赖(-10(-10,0)0)(-1(-1,-1)-1)现在学习的是第21页,共81页博弈论的几个经典模型博弈论的几个经典模型 对于两个犯罪嫌疑人总体而言,他们设想的对于两个犯罪嫌疑人总体而言,他们设想的最好的策略可能是都不交代。但任何一个犯罪最好的策略可能是都不交代。但任何一个犯罪嫌疑人在选择不交代的策
31、略时,都要冒很大的嫌疑人在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一犯罪嫌疑人交代风险,一旦自己不交代而另一犯罪嫌疑人交代了,自己就将可能处于非常不利的境地。对于了,自己就将可能处于非常不利的境地。对于A A而言而言,不管不管B B采取何种策略,他的最佳策略都是交代。采取何种策略,他的最佳策略都是交代。对于对于B B而言也是如此。最后两人都会选择交代。而言也是如此。最后两人都会选择交代。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第22页,共81页博弈论的几个经典模型博弈论的几个经典模型该博弈刻划了两大难题:该博弈刻划了两大难题:冲冲突突情情形形下下,参参
32、与与人人的的目目标标是是什什么么?是是采采用用(作作为为个个人人)他他自自己己的的最最好好策策略略,还还是是采采用用(作作为为集集体体的的一一员员)他他们们共共同同的的最最好好策策略略?前前者者导导致致均均衡衡策策略略(坦坦白白,坦坦白白),支支付付为为(-8(-8,-8)-8);后后者者的的最最好好策策略略是是(抵抵赖赖,抵抵赖赖),支支付付为为(-1(-1,-1)-1)。这这里里反反映映了了个个体体理理性性行行为为与与集集体理性行为之间的矛盾、冲突。体理性行为之间的矛盾、冲突。此此博博弈弈只只进进行行一一次次还还是是重重复复进进行行?如如果果博博弈弈只只进进行行一一次次,参参与与人人似似乎
33、乎只只有有坦坦白白才才是是最最好好的的策策略略,因因为为没没有有理理由由相相信信对对手手会会对对你你有有信信心心,他他总总认认为为你你自自己己会会坦坦白白;因因此此,双双方方都都采采取取坦坦白白策策略略。然然而,若博弈进行多次,则结论将会发生变化。而,若博弈进行多次,则结论将会发生变化。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第23页,共81页博弈论的几个经典模型博弈论的几个经典模型囚徒困境可以用来说明许多现象。囚徒困境可以用来说明许多现象。寡头定价寡头定价拍卖出价拍卖出价推销员的努力推销员的努力政治上的讨价还价政治上的讨价还价军军备备竞竞赛赛等等(冲冲突突中中出出现
34、现两两败败俱俱伤伤的的情情况况,往往往往要要考虑到囚徒困境)考虑到囚徒困境)*(纯策略)纳什均衡(纯策略)纳什均衡模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第24页,共81页博弈论的几个经典模型博弈论的几个经典模型 什么是博弈论?试举两个你生活中的例子说明。什么是博弈论?试举两个你生活中的例子说明。什么是博弈论?试举两个你生活中的例子说明。什么是博弈论?试举两个你生活中的例子说明。某年在荷兰召开了一次某年在荷兰召开了一次“合作及社会两难困境研讨会合作及社会两难困境研讨会”,与会者都是博弈论的专家。与会者都是博弈论的专家。当大会结束之后,有两个学者,麦息克和路特提议大家当
35、大会结束之后,有两个学者,麦息克和路特提议大家玩一个游戏。玩一个游戏。他们将一个大信封拿出来,请在场的位专家拿出他们将一个大信封拿出来,请在场的位专家拿出金钱装到这个信封里。如果到最后这信封里的钱超过金钱装到这个信封里。如果到最后这信封里的钱超过元,麦息克和路特将自己掏腰包,退还每人元,麦息克和路特将自己掏腰包,退还每人元。不过,如果最后信封内的钱不足元,就元。不过,如果最后信封内的钱不足元,就统统没收,大家拿不到半毛钱。统统没收,大家拿不到半毛钱。仔细想一想,如果你也在场,你会奉献多少钱呢?仔细想一想,如果你也在场,你会奉献多少钱呢?问题与思考问题与思考现在学习的是第25页,共81页博弈论的
36、几个经典模型博弈论的几个经典模型什么是海萨尼转换?什么是海萨尼转换?海海萨萨尼尼提提出出了了一一种种处处理理不不完完全全信信息息博博弈弈的的方方法法,即即引引入入一一个个虚虚拟拟的的局局中中人人“自自然然”。自自然然首首先先行行动动,它它决决定定每每个个局局中中人人的的特特征征。每每个个局局中中人人知知道道自自己己的的特特征征,但但不不知知道道别别的的局局中中人人特特征征。这这种种方方法法将将不不完完全全信信息息静静态态博博弈弈变变成成一一个个两两阶阶段段动动态态博博弈弈,第第一一个个阶阶段段是是自自然然N N的的行行动动选选择择,第第二二阶阶段段是是除除N N外外的的局局中中人人的的静静态态
37、博博弈弈。这这种种转转换换被被称称为为“海海萨萨尼尼转转换换”,这这个个转转换换把把“不不完完全全信信息息”转转变变成成为为完完全全但但不不完完美美信信息息,从从而而可可以以用用分分析析完完全信息博弈的方法进行分析。全信息博弈的方法进行分析。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第26页,共81页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换的具体方法海萨尼转换的具体方法一一个个虚虚拟拟的的参参与与人人“自自然然”,自自然然首首先先决决定定参参与与人人的的 类类 型型,赋赋 予予 各各 参参 与与 人人 的
38、的 类类 型型 向向 量量 ,其其 中中 ;自自然然告告知知参参与与者者自自己己的的类类型型,却却不不告告诉诉其其他他参参与与者者的的类型;类型;参参与与者者同同时时选选择择行行动动,每每一一参参与与者者 从从可可行行集集 中中选选择择行动方案行动方案 ;各方得到收益各方得到收益 。借借助助于于第第一一步步和和第第二二步步中中虚虚构构的的参参与与者者“自自然然”的的行行动动,我我们们可可以以把把一一个个不不完完全全信信息息的的博博弈弈表表述述为一个不完美信息的博弈。为一个不完美信息的博弈。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态
39、博弈现在学习的是第27页,共81页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换分析海萨尼转换分析 海海萨萨尼尼转转换换是是处处理理不不完完全全信信息息博博弈弈的的标标准准方方法法。一一般般地地,“,“自自然然”在在博博弈弈开开始始的的时时候候选选择择参参与与人人的的类类型型,参参与与人人的的某某个个类类型型包包括括表表征征类类型型的的各各个个特特征征如如策策略略空空间间、信信息息集集、得得益益函函数数等等,这这些些又又称称为为该该类类型型参参与人所拥有的个人信息。与人所拥有的个人信息。不不完完全全信信息息意意味味着着博博弈弈各各方方中中至至少少有有一一个个参参与与人人有有多个类型。多个类
40、型。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第28页,共81页博弈论的几个经典模型博弈论的几个经典模型 通通过过海海萨萨尼尼转转换换,博博弈弈开开始始时时,所所有有参参与与人人有有关关“自自然然”的的行行动动有有一一致致的的信信念念,即即都都知知道道所所有有参参与与人人类类型型的的概概率率分分布布函函数数,此此即即“海海萨尼公理萨尼公理”。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第29页,共81页博弈论的几个经典模型博弈论的几个经典
41、模型经典案例解析经典案例解析例例:某某一一市市场场原原来来被被A A企企业业所所垄垄断断。现现在在B B企企业业考考虑虑是是否否进进入入。B B企企业业知知道道,A A企企业业是是否否允允许许它它进进入入,取取决决于于A A企企业业阻阻挠挠B B企企业业进进入入所所花花费费的的成成本本。如如果果阻阻挠挠的的成成本本低低,那那么么,正正如如下下表表后后两两列列所所表表示示的的,A A企企业业的的占占优优战战略略是是阻阻挠挠,博博弈弈有有重重复复剔剔除除的的占占优优战战略略均均衡衡AA阻阻挠挠,B B不不进进入入。如如果果阻阻挠挠的的成成本本高高,那那么么,正正如如下下表表前前两两列列所所表表示示
42、的的,A A企企业业的的占占优优战战略略是是默默许许B B进进入入,博博弈弈有有重重复复剔剔除除的的占占优优战战略略均均衡衡AA默默许许,B B进进入入。B B企企业业所所不不知知道道的的,是是A A企企业业的的阻阻挠挠成成本本是是高高是是低低。这这里里,某某一一参参与与人人本本人人知知道道、其其他他参参与与人人则则不不知知道道的的信信息息称称为为私私人人信信息息。某某一一参参与与人人所所拥拥有有的的全全部部私私人人信信息息称称为为他他的的类类型型。在在本本例例中中,阻阻挠挠成成本本就就是是 A A的的私私人人信信息息。高阻挠成本和低阻挠成本则是两种不同的类型。高阻挠成本和低阻挠成本则是两种不
43、同的类型。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第30页,共81页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换后的市场进入博弈:海萨尼转换后的市场进入博弈:模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈 A A B B高成本高成本低成本低成本默许默许阻挠阻挠默许默许阻挠阻挠进入进入(40,50)(40,50)(-10,0)(-10,0)(30,100)(30,100)(-10,140)(-10,140)不进入不进入(0,300)(0,300)
44、(0,300)(0,300)(0,400)(0,400)(0,400)(0,400)显显然然,在在这这里里,B B所所遇遇到到的的,是是不不确确定定性性条条件件下下的的选选择择问问题题。因因为为B B不不仅仅不不知知道道A A的的类类型型 (是是高高还还是是低低),而且不知道不同类型的分布概率。,而且不知道不同类型的分布概率。现在学习的是第31页,共81页博弈论的几个经典模型博弈论的几个经典模型 按按照照海海萨萨尼尼的的方方法法,所所有有参参与与人人的的真真实实类类型型都都是是给给定定的的。其其他他参参与与人人虽虽然然不不清清楚楚某某一一参参与与人人的的真真实实类类型型,但但知知道道这这些些可
45、可能能出出现现的的类类型型的的分分布布概概率率,而而且且这这种种概概率率是是公公共共知知识识。用用本本例例来来说说,公公共共知知识识不不仅仅意意味味着着B B企企业业知知道道A A企企业业高高阻阻挠挠成成本本与与低低阻阻挠挠成成本本的的分分布布概概率率,而而且且意意味着味着A A也清楚也清楚B B知道这一概率。知道这一概率。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第32页,共81页博弈论的几个经典模型博弈论的几个经典模型模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不
46、完全信息静态博弈N N低成本低成本高成本高成本A AB BB B(50,40)(50,40)(300,0)(300,0)(0,-10)(0,-10)(300,0)(300,0)(100,30)(100,30)(400,0)(400,0)(140,-10)(140,-10)(400,0)(400,0)A AB BB B默许默许默许默许阻挠阻挠阻挠阻挠进入进入不进入不进入进入进入进入进入进入进入不进入不进入不进入不进入不进入不进入*贝叶斯纳什均衡贝叶斯纳什均衡 现在学习的是第33页,共81页博弈论的几个经典模型博弈论的几个经典模型言语博弈中的言语博弈中的“威胁威胁”与与“承诺承诺”在在现现实实中中
47、,我我们们经经常常看看到到声声称称的的策策略略决决定定,但但是是这些声称的策略可信吗?这些声称的策略可信吗?声声称称的的策策略略包包括括“威威胁胁”与与“承承诺诺”。在在国国际际核核武武器器问问题题上上,我我国国及及其其他他一一些些国国家家承承诺诺“不不首首先先使使用用核核武器武器”就是一种言语承诺。就是一种言语承诺。博博弈弈论论中中,经经常常用用“可可置置信信”和和“不不可可置置信信”的的“威威胁胁”或或“承承诺诺”来来区区分分行行动动者者说说出出来来的的策策略略,我我们们在在对对动动态态博博弈弈的的分分析析中中会会分分析析什什么么样样的的策策略略是是可可置置信信的的,什什么么样样的的策策略
48、略是是不不可可置置信信的的。而而分分析析“威威胁胁”或或“承承诺诺”是是可可置置信信的的还还是是不不可可置置信信的的方方法法是是倒推法。倒推法。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完完全且完美信息动态博弈全且完美信息动态博弈 现在学习的是第34页,共81页博弈论的几个经典模型博弈论的几个经典模型 倒倒推推法法(backward backward inductioninduction)也也叫叫逆逆向向归归纳纳法法。那么什么是倒推法?那么什么是倒推法?要要理理解解什什么么是是倒倒推推法法,先先来来看看一一下下商商界界里里经经常常见到的博弈。见到
49、的博弈。在在某某个个城城市市假假定定只只有有一一家家房房地地产产开开发发商商A,A,我我们们知知道道任任何何没没有有竞竞争争下下的的垄垄断断利利润润是是很很高高的的,假假定定A A此时每年的垄断利润是此时每年的垄断利润是1010亿元。亿元。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完完全且完美信息动态博弈全且完美信息动态博弈 现在学习的是第35页,共81页博弈论的几个经典模型博弈论的几个经典模型 现现在在假假定定有有另另外外一一个个企企业业B B,准准备备从从事事房房地地产产开开发发。面面对对着着B B要要进进入入其其垄垄断断的的行行业业,A A
50、想想:一一旦旦B B进进入入,A A的的利利润润将将受受损损很很多多,B B最最好好不不要要进进入入。所所以以A A向向B B表表示示,你你进进入入的的话话,我我将将阻阻挠挠你你进进入入。假假定定当当B B进进入入时时A A阻阻挠挠的的话话,A,A的的利利润润降降低低到到2 2,B B的的利利润润是是-1-1。而而如如果果A A不不阻阻挠挠的的话话,A A的的利利润润是是4 4,B B的的利利润也是润也是4 4。模型四、模型四、StackelbergStackelberg双寡头竞争模型双寡头竞争模型/完完全且完美信息动态博弈全且完美信息动态博弈 现在学习的是第36页,共81页博弈论的几个经典模