《博弈论复习..优秀PPT.ppt》由会员分享,可在线阅读,更多相关《博弈论复习..优秀PPT.ppt(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1博弈博弈论论第一章第一章 绪论绪论2第一章第一章 绪论绪论l本章首先本章首先对对博弈博弈论论的一些基本概念,包括什么是的一些基本概念,包括什么是博弈和博弈博弈和博弈论论等作初步介等作初步介绍绍;l然后然后给给出一些出一些经经典的博弈例子;典的博弈例子;l最最终对终对博弈的博弈的结结构和分构和分类类作一些探作一些探讨讨。l本章的目的是本章的目的是让让大家大家对对博弈博弈论论的基本内容,以及的基本内容,以及博弈分析的基本思想方法等形成初步的相博弈分析的基本思想方法等形成初步的相识识。3第一章第一章 绪论绪论l1.1 什么是博弈什么是博弈论论l1.2 几几类经类经典博弈模型典博弈模型l1.3 博弈
2、博弈结结构和博弈的分构和博弈的分类类l要在现代社会做一个有文化的人,你必需要在现代社会做一个有文化的人,你必需对博弈论有大致的了解。对博弈论有大致的了解。l l 萨缪尔萨缪尔森森4l运用教材运用教材l博弈论与信息经济学,张维迎著,上海人民出版社,博弈论与信息经济学,张维迎著,上海人民出版社,2012年出版年出版l经济博弈论第三版,谢识予编著,经济博弈论第三版,谢识予编著,复旦高校出版社,复旦高校出版社,2010年出版年出版l 参考书参考书l策略博弈第三版,(美)迪克西特著,蒲永健译,中国人民高校出版策略博弈第三版,(美)迪克西特著,蒲永健译,中国人民高校出版社,社,2012年出版年出版l博弈论
3、,(美)朱博弈论,(美)朱弗登博格弗登博格(法)让(法)让梯若尔,中国人民高校出版梯若尔,中国人民高校出版社,社,2015年出版年出版5671.1 什么是博弈什么是博弈论论l1.1.1 博弈博弈论论的概念的概念l1.1.2 博弈博弈论论的的发发展展l1.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l1.1.4 纳纳什的故事什的故事l1.1.5 博弈博弈论论与主流与主流经济经济学学l1.1.6 几个几个问题问题l1.1.7 博弈的主要方面(要素)博弈的主要方面(要素)81.1.1 博弈博弈论论的概念的概念l博弈博弈论论 Game Theory直直译译“游游戏戏理理论论”;l 游游戏戏的共
4、同点:的共同点:l 那么博弈(那么博弈(论论)就具有)就具有“规则规则、结结果、策略、果、策略、策略和利益相互依存策略和利益相互依存”这这几大要素。几大要素。l现现代代汉语词汉语词典典对对博弈的博弈的说说明明l 博弈博弈丰富多彩的丰富多彩的对对抗性游抗性游戏戏。规则规则、结结果、策略、策略和果、策略、策略和利益相互依存。利益相互依存。91.1.1 博弈博弈论论的概念的概念l一个非技一个非技术术性的定性的定义义l 罗罗伯特伯特奥曼教授指出:所奥曼教授指出:所谓谓博弈,就是策博弈,就是策略性的互略性的互动动决策。决策。l 博弈就是一些个人、博弈就是一些个人、队组队组或其他或其他组织组织,面,面对对
5、确定的确定的环环境条件,在确定的境条件,在确定的规则规则下,同下,同时时或或先后,一次或多次,从各自允先后,一次或多次,从各自允许选择许选择的行的行为为或或策略中策略中进进行行选择选择并加以并加以实实施,各自取得相施,各自取得相应结应结果的果的过过程。程。101.1.2 博弈博弈论论的的发发展展 博弈博弈论论始于始于1944年,年,冯冯诺诺依曼和摩根斯坦恩依曼和摩根斯坦恩合作出版博弈合作出版博弈论论和和经济经济行行为为;50年年头头,合作博弈,合作博弈论论鼎盛鼎盛时时期,期,讨讨价价还还价模价模型型纳纳什(什(1950)和夏普里()和夏普里(1953),核的概念),核的概念吉利斯和夏普里(吉利
6、斯和夏普里(1953););50年年头头非合作博弈起先非合作博弈起先创创立,立,纳纳什(什(1950,1951),囚徒逆境),囚徒逆境塔克(塔克(1950););111.1.2 博弈博弈论论的的发发展展 60年年头头后,精后,精炼纳炼纳什均衡什均衡泽泽尔尔腾腾,纳纳什均衡什均衡中引入了中引入了动态动态分析分析;70年年头头,阿克洛夫、斯,阿克洛夫、斯宾宾斯和斯蒂格利茨相斯和斯蒂格利茨相继继发发展了非展了非对对称信息博弈理称信息博弈理论论,从而衍生出了信息,从而衍生出了信息经经济济学分支;学分支;80年年头头,克瑞普斯和威,克瑞普斯和威尔尔逊逊等将不完全信息引等将不完全信息引入入动态动态博弈中,
7、提出了博弈中,提出了“精精炼贝炼贝叶斯叶斯纳纳什均衡什均衡”;90年年头头,弗得伯格和泰勒,弗得伯格和泰勒尔尔,提出了,提出了“完完备贝备贝叶叶斯均衡斯均衡”的概念;的概念;121.1.2 博弈博弈论论的的发发展展 博弈博弈论论将来将来发发展方向:不完全信息博弈理展方向:不完全信息博弈理论论或信息或信息经济经济学;微分博弈理学;微分博弈理论论;合作博弈理;合作博弈理论论;试验试验博弈理博弈理论论;进进化博弈理化博弈理论论131.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖(颁给颁给活人活人)l1994年:年:非合作博弈,非合作博弈,纳纳什(什(Nash)、海)、海萨萨尼尼(Harsan
8、yi)、)、泽泽尔尔腾腾(Selten)海海萨萨尼尼泽泽尔尔腾腾纳纳什什141957年的年的纳纳什什1.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖(n年前年前贡贡献献)151.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖老年老年纳纳什什161.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l1996年:年:不不对对称信息激励理称信息激励理论论,英国,英国经济经济学家莫里学家莫里斯(斯(Mirrlees)(最)(最优优税制)和美国税制)和美国经济经济学家学家维维克瑞克瑞(Vickrey)(拍)(拍卖卖)莫莫里里斯斯维维克瑞克瑞获获奖奖后后三三天天,驾驾鹤鹤西西归归171.
9、1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l2001年:年:不完全信息市不完全信息市场场博弈,美国博弈,美国经济经济学家阿克洛夫学家阿克洛夫(Akerlof)(旧)(旧车车市市场场)、斯)、斯宾宾塞(塞(Spence)()(劳动劳动力市力市场场)、斯蒂格利茨(、斯蒂格利茨(Stiglitze)(金融市)(金融市场场)阿克洛夫阿克洛夫斯蒂格利茨斯蒂格利茨斯斯宾宾塞塞181.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l2005年年:由由拥拥有以色列和美国双重国籍的有以色列和美国双重国籍的经济经济学家学家罗罗伯特伯特奥曼奥曼(Robert.J.Aumann)和美国和美国经济经济学
10、家托学家托马马斯斯谢谢林林(Thomas.C.Schelling)共享共享(冲突与合作冲突与合作)。谢谢林林奥曼奥曼191.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l2007年:年:诺贝诺贝尔尔经济经济学学奖颁给奖颁给了三位美国了三位美国经济经济学家:赫学家:赫维维茨茨(Hurwicz)、迈迈尔尔森森(Myerson)和和马马斯金斯金(Maskin),以表,以表彰他彰他们为们为机制机制设计设计理理论论奠定基奠定基础础。赫赫维维茨茨马马斯金斯金迈迈尔尔森森1.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l2012年,美国年,美国经济经济学家埃学家埃尔尔文文罗罗斯斯(Alvin
11、 Roth)与与罗罗伊伊德德沙普利沙普利(Lloyd Shapley)因因稳稳定配置和市定配置和市场设计实场设计实践理践理论获奖论获奖。20罗斯罗斯 沙普利沙普利1.1.3 博弈博弈论论与与诺贝诺贝尔尔经济经济学学奖奖l2014年,来自法国年,来自法国图卢兹图卢兹高校的法国教授高校的法国教授让让-梯若梯若尔尔(Jean Tirole)因其因其对对市市场场力气和管制的探力气和管制的探讨讨分析分析获获得得诺诺贝贝尔尔经济经济学学奖奖。21梯若尔梯若尔221.1.4 纳纳什的故事什的故事美美丽丽心心灵灵231.1.4 纳纳什的故事什的故事l1928年年6月月13日,日,约约翰翰福布斯福布斯纳纳什(什
12、(John Forbes Nash)诞诞生于美国西弗吉尼生于美国西弗吉尼亚亚州(美国州(美国较穷较穷的州)的州)的布的布鲁鲁菲菲尔尔德市。德市。20岁岁,1948年年9月入普林斯月入普林斯顿顿高高校作探校作探讨讨生;生;22岁岁,1950年年获获数学博士学位,并数学博士学位,并留校任留校任讲师讲师一年。一年。23岁岁,1951年到麻省理工学院年到麻省理工学院任教,直到任教,直到31岁岁,1959年因精神分裂症而离年因精神分裂症而离职职。66岁岁,1994年年获诺贝获诺贝尔尔经济经济学学奖奖。241.1.4 纳纳什的故事什的故事l关于关于纳纳什的影什的影视视与与传记传记作品作品l 电电影美影美丽
13、丽心灵心灵2002年囊括了第年囊括了第74届奥斯卡最佳届奥斯卡最佳影片、最佳影片、最佳导导演、最佳改演、最佳改编编剧剧本和最佳女配角本和最佳女配角4项项大大奖奖。l 普林斯普林斯顿顿的幽灵的幽灵l 当生命当生命进进入幽灵状入幽灵状态态251.1.4 纳纳什的故事什的故事l1958年,由于年,由于纳纳什在博弈什在博弈论论、代数几何学和非、代数几何学和非线线性理性理论论方方面取得的成就,面取得的成就,财财宝宝杂杂志推志推举举他他为为同同时时活活跃跃在在纯纯粹数粹数学和学和应应用数学两个用数学两个领领域的新一代天才数学家中最杰出的人域的新一代天才数学家中最杰出的人物。物。l1959年,在失踪两个星期
14、之后,无精打采的年,在失踪两个星期之后,无精打采的纳纳什来到麻省什来到麻省理工学院休息室同事的身理工学院休息室同事的身边边,奇妙兮兮地指着手中的一份,奇妙兮兮地指着手中的一份纽约时报纽约时报说说,来自外太空或外国政府的抽象力气正在,来自外太空或外国政府的抽象力气正在通通过过纽约时报纽约时报跟他跟他进进行沟通;行沟通;还说还说,他收到的信息只,他收到的信息只是是给给他一个人的,已他一个人的,已经经用密用密码码加密,加密,须须要要经过经过精密的分析精密的分析才能看出来,其他人不行能破才能看出来,其他人不行能破译译;而;而现现在他已得到在他已得到许许可,可,可以和整个世界共享可以和整个世界共享这这些
15、些隐隐私。私。261.1.4 纳纳什的故事什的故事l(40年后年后)在在1994年年诺贝诺贝尔尔经济经济学学奖奖揭揭晓晓的那天下午,普林的那天下午,普林斯斯顿顿高校高校为为66岁岁的的纳纳什什实实行了一个小型香行了一个小型香槟槟酒会。酒会。纳纳什在什在会上会上说说,他不,他不习惯发习惯发表表讲话讲话,但,但这这次他有三件事要次他有三件事要说说:l 第一件事就是,他希望第一件事就是,他希望获获得得诺贝诺贝尔尔奖奖可以改善他的信可以改善他的信用用评级评级,因,因为为他他实实在太在太须须要一要一张张信用卡了。信用卡了。这这个小小的愿个小小的愿望,竟然出自望,竟然出自这样这样一个杰出人物之口,也真是太
16、令人感一个杰出人物之口,也真是太令人感叹叹了了;l 其次件是他更希望自己能其次件是他更希望自己能够够独享独享诺贝诺贝尔尔奖奖,因,因为为他太他太须须要那笔要那笔钱钱,他要,他要为为自己的住房支付欠款自己的住房支付欠款;l 第三件是他第三件是他认为认为自己的博弈自己的博弈论论探探讨讨是与超弦理是与超弦理论类论类似似的高度智力的高度智力课题课题,其好用性或,其好用性或许许是次要的或者可疑的。是次要的或者可疑的。271.1.5 博弈博弈论论与主流与主流经济经济学学l博弈博弈论进论进入主流入主流经济经济学反映了学反映了经济经济学学发发展的展的趋势趋势l第一:第一:经济经济学的探学的探讨对讨对象象转转向
17、个体;向个体;l其次:其次:经济经济学学转转向向对对人与人关系的探人与人关系的探讨讨,人与人,人与人之之间间行行为为的相互影响作用;的相互影响作用;l第三:第三:经济经济学越来越重学越来越重视对视对信息的探信息的探讨讨,特殊是,特殊是信息不信息不对对称称对对个人个人选择选择及制度支配的影响。及制度支配的影响。281.1.6 几个几个问题问题l1.当我当我们们做一做一项项决策决策时时,考,考虑虑的的仅仅仅仅是自己是自己吗吗?l 答:不。住宿答:不。住宿时时晚上关不关灯都晚上关不关灯都须须要考要考虑虑其他人。其他人。l2.我我们们在思索在思索问题时问题时,应应当从当从现现在向将来推理在向将来推理吗
18、吗?l 答:不确定。我答:不确定。我们们也会假定将来的状况,来推理或也会假定将来的状况,来推理或确定确定现现在的行在的行动动。l 比如,我比如,我“将来将来”想要做一名律想要做一名律师师,那么,那么“现现在在”我我须须要学要学习习法律,通法律,通过过司法考司法考试试;政策制定也是;政策制定也是如此,如将来如此,如将来5年年GDP“翻一番翻一番”,那么,那么现现在在应应当如何当如何发发展。展。这这些都是从将来推理到些都是从将来推理到现现在。在。291.1.6 几个几个问题问题l不留退路会使自己的境况不留退路会使自己的境况变变得更糟糕得更糟糕吗吗?l 答:不确定。作用:激答:不确定。作用:激发发潜
19、能,它可以把人置于死潜能,它可以把人置于死地,也可能使人置于死地而后生。地,也可能使人置于死地而后生。l 破釜沉舟:破釜沉舟:汉汉高祖三年(公元前高祖三年(公元前204年)十月,年)十月,汉汉将将军韩军韩信率信率军军攻攻赵赵,穿出井,穿出井陉陉口,吩咐将士背靠大口,吩咐将士背靠大河河摆摆开开阵势阵势,与,与敌敌人交人交战战。韩韩信以前信以前临临大大敌敌,后无退,后无退路的境况来路的境况来坚坚决将士拼死求决将士拼死求胜胜的决心,的决心,结结果大破果大破赵军赵军。破釜沉舟比方破釜沉舟比方处处于于绝绝境之中,境之中,为为求生路而决一死求生路而决一死战战。l 对对于我于我们们,考学、考,考学、考证证
20、恰恰恰恰须须要要这样这样一种破釜沉舟一种破釜沉舟的心气。挫折也有两重性。的心气。挫折也有两重性。301.1.6 几个几个问题问题l人人们们的合作是出于道德和高尚的情感的合作是出于道德和高尚的情感吗吗?l 答:不确定。四个字答:不确定。四个字“合合则则两利两利”。l 对对各方都有利,那么合作才会持各方都有利,那么合作才会持续续下去。下去。l 损损人利己或人利己或损损己利人的合作不会己利人的合作不会许许久。久。l 31中国的中国的“破坏者破坏者”悉尼的福音悉尼的福音1.1.6 几个几个问题问题l选举选举中多数派确定会中多数派确定会获胜吗获胜吗?l 答:不确定。答:不确定。l 例如中国第一次申奥,例
21、如中国第一次申奥,90年年头头初,申初,申2000年。年。l 倒数其次倒数其次轮轮:l 中国(中国(21票)票)悉尼(悉尼(19)其他国(其他国(3)l 中国似乎是要中国似乎是要获胜获胜了。然后了。然后“其他国其他国”的的3票票给给最最终终的的结结果果带带来了不确定性。来了不确定性。l 最最终终一一轮轮:l 中国(中国(21)悉尼(悉尼(22=19+3)Winner!l 最最终终,老,老萨说萨说:“Beijing?No,Sydney.”321.1.6 几个几个问题问题l选择选择多多,确定快多多,确定快乐乐多多么?多多么?l 答:不确定。答:不确定。l 当当选择选择出出现现人人们们就起先找就起先
22、找寻寻一种不存在的一种不存在的药药。l 用哪个指用哪个指标标度量度量“悔悔”呢?呢?l 大到大到选择选择自己的另一半,小到吃自己的另一半,小到吃顿顿麦当麦当劳劳,我,我们们都在得到某些都在得到某些东东西,同西,同时时也在失去。也在失去。l 启示:我启示:我们们在做在做选择选择的的时时候,不要候,不要对对自己得到了自己得到了什么而沾沾自喜,要冷静的考什么而沾沾自喜,要冷静的考虑虑,我,我们还们还失去了什么。失去了什么。懊悔懊悔懊悔懊悔药药药药 机会成本机会成本机会成本机会成本331.1.6 几个几个问题问题l手中手中驾驭驾驭的信息越多,确定会有利么?的信息越多,确定会有利么?l 答:不确定。答:
23、不确定。l 如,温州炒房者一个月如,温州炒房者一个月5万万赚赚1000万的神万的神话话。l 我我们们在在观观望、取得信息的同望、取得信息的同时时,机会就在悄,机会就在悄然消逝。然消逝。l 启示:启示:该该出手出手时时就出手,莫就出手,莫让让机会机会频频溜走。溜走。341.1.6 几个几个问题问题l以上几个生活中的以上几个生活中的问题问题,事,事实实上都可以用博弈上都可以用博弈论论来来进进行行说说明和分析。明和分析。l运用博弈运用博弈论论来分析我来分析我们们在生活中遇到的在生活中遇到的问题问题,对对我我们们的的选择选择与决策会有很大帮助,会使我与决策会有很大帮助,会使我们们的行的行为为更加合理。
24、更加合理。博弈博弈论论有什么用?有什么用?l作为理论分析工具的博弈论作为理论分析工具的博弈论 l 现象、模型与科学理论现象、模型与科学理论 l 经济现象与经济模型经济现象与经济模型 l作为科学理论的博弈论作为科学理论的博弈论 l 说明、预料、提出建议说明、预料、提出建议 l作为一种思维方式的博弈论作为一种思维方式的博弈论 l 日常生活、政治竞争、商业争斗日常生活、政治竞争、商业争斗都须要一点策略思维都须要一点策略思维 l 可以更好地理解我们所处的现实世界可以更好地理解我们所处的现实世界 l 学好博弈论,并不保证您能成为常胜将军,但是却可以让你更明智学好博弈论,并不保证您能成为常胜将军,但是却可
25、以让你更明智地参与竞争、避开无谓的失败地参与竞争、避开无谓的失败 35361.1.7 博弈的主要方面(要素)博弈的主要方面(要素)l博弈的四个主要方面,亦称博弈的要素博弈的四个主要方面,亦称博弈的要素l 参与者(参与者(Players):常称):常称为为“局中人局中人”、“博弈博弈方方”即在所定即在所定义义的博弈中原委有哪几个独立决策、的博弈中原委有哪几个独立决策、独立担当独立担当结结果的个人或果的个人或组织组织。自然人、企。自然人、企业业、国、国家、国家集家、国家集团团等。各参与者不等。各参与者不论论大小,按博弈大小,按博弈规规则则同等行同等行为为。l 策略(策略(Strategies)或行
26、)或行为为(Actions)集合:)集合:即即规规定每个博弈方在定每个博弈方在进进行决策行决策时时,可以,可以选择选择的方的方法、做法法、做法(行行动动)或或经济经济活活动动的水平、量的水平、量值值(如如产产量、量、价格价格)等等。不同参与者的策略内容与数量均不尽等等。不同参与者的策略内容与数量均不尽相同。相同。371.1.7 博弈的主要方面(要素)博弈的主要方面(要素)博博弈弈的的依依次次(Orders):行行为为决决策策依依次次,不不同同的的博博弈依次弈依次产产生的博弈生的博弈结结果可能会不同。果可能会不同。博博弈弈方方的的得得益益(Payoffs):对对应应于于各各博博弈弈方方的的每每一
27、一组组的的可可能能决决策策选选择择,都都应应当当有有一一个个结结果果表表示示该该策策略略组组合合下下各各博博弈弈方方的的所所得得或或所所失失。“这这些些”所所得得所所失失就就是是博博弈方的得益,也叫做弈方的得益,也叫做“支付支付”。通通常常来来说说,一一个个博博弈弈,最最困困难难的的地地方方就就是是确确定定各各博博弈弈方方的得益。博弈的多的得益。博弈的多样样性也都是由得益的多性也都是由得益的多样样性性产产生的。生的。381.2 几几类经类经典博弈模型典博弈模型l博弈模型分析的一般步博弈模型分析的一般步骤骤l 第一步,博弈模型描述与基本假第一步,博弈模型描述与基本假设设;l 其次步,博弈模型要素
28、(主要方面)分析,其次步,博弈模型要素(主要方面)分析,确定模确定模l 型型类类型;型;l 第三步,博弈模型均衡求解;第三步,博弈模型均衡求解;l 第四步,博弈模型第四步,博弈模型结结构(均衡解)分析;构(均衡解)分析;l 第五步,第五步,结论结论与建与建议议。391.2 几几类经类经典博弈模型典博弈模型l1.2.1 囚徒逆境囚徒逆境l1.2.2 赌胜赌胜博弈博弈l1.2.3 产产量决策的古量决策的古诺诺模型模型401.2.1 囚徒逆境囚徒逆境l1.囚徒逆境的基本模型囚徒逆境的基本模型l(1)囚徒逆境的基本模型是)囚徒逆境的基本模型是 塔克塔克 1950年提出的。年提出的。l(2)主)主题题:
29、个人理性与集体理性冲突。:个人理性与集体理性冲突。l(3)囚徒逆境博弈的主要方面(要素):)囚徒逆境博弈的主要方面(要素):l 局中人:局中人:l 策略集合:策略集合:l 博弈的依次:博弈的依次:l 博弈方的得益:博弈方的得益:两个共同作案的囚徒;囚徒两个共同作案的囚徒;囚徒1、囚徒、囚徒2;坦白,不坦白坦白,不坦白;双方同双方同时选择时选择策略;策略;如下如下页页得益(支付)矩得益(支付)矩阵阵中所示。中所示。411.2.1 囚徒逆境囚徒逆境-5,-50,-8-8,0-1,-1坦坦 白白不坦白不坦白坦坦 白白不坦白不坦白囚徒囚徒 2囚徒囚徒 1(4)分析)分析 假如两个囚徒都不坦白,即都假如
30、两个囚徒都不坦白,即都“不招不招”,则则每个人判每个人判1年;年;假如两个囚徒都坦白,即都假如两个囚徒都坦白,即都“招招”,则则每个人判每个人判5年;年;一方一方招招认认,一方不招,一方不招,则则不招的一方会被判不招的一方会被判8年;相比之下,两年;相比之下,两个囚徒都不坦白是一个比个囚徒都不坦白是一个比较较好的好的结结果,是果,是“集体理性集体理性”的体的体现现,因,因为这样为这样两人坐牢的两人坐牢的时间时间之和最短(之和最短(2年)。年)。但是,但是,这这个个对对双方都双方都较较好的好的结结果事果事实实上不大上不大简洁发简洁发生。生。421.2.1 囚徒逆境囚徒逆境(5)囚徒逆境)囚徒逆境
31、 每个囚徒都会每个囚徒都会发觉发觉:假如假如对对方方“不坦白不坦白”,则则自己自己“坦白坦白”便可便可马马上被上被释释放,而自己放,而自己“不坦白不坦白”会被判会被判1年,因此年,因此“坦白坦白”是是较较好的好的选择选择;假如假如对对方方“坦白坦白”,则则自己自己“坦白坦白”将被判将被判5年,而自己年,而自己“不坦白不坦白”会被判会被判8年,因此年,因此“坦白坦白”是是较较好的好的选择选择;综综上,无上,无论对论对方如何方如何选择选择,选择选择“坦白坦白”始始终终是是对对自己最有利自己最有利的,即的,即“坦白坦白”是个体理性的体是个体理性的体现现。-5,-50,-8-8,0-1,-1坦坦 白白
32、不坦白不坦白坦坦 白白不坦白不坦白囚徒囚徒 2囚徒囚徒 1431.2.1 囚徒逆境囚徒逆境(5)囚徒逆境(接上)囚徒逆境(接上页页)都招,看似都招,看似对对每个囚徒是最有利的每个囚徒是最有利的选择选择,但事,但事实实上的上的结结果果为为双方各判双方各判5年;假如都咬牙挺住不招,双方各判年;假如都咬牙挺住不招,双方各判1年年;个体的最个体的最优优决策,没有决策,没有带带来想象中的最来想象中的最优优效果。效果。因此,个体理性不确定会因此,个体理性不确定会产产生集体理性。生集体理性。(6)假如囚徒双方都知道)假如囚徒双方都知道这这个博弈,且二人关系个博弈,且二人关系够铁够铁、或、或有某种有某种协议协
33、议的的约约束,都咬牙不招。那么必有束,都咬牙不招。那么必有现现在的常在的常见现见现象:坦白从象:坦白从宽宽,牢底坐穿;抗拒从,牢底坐穿;抗拒从严严,回家,回家过过年。年。441.2.1 囚徒逆境囚徒逆境(7)机制)机制设计问题设计问题:如何:如何设计设计,使得参与者,使得参与者说实话说实话,都坦,都坦白?白?答:隔离答:隔离审查审查,分化瓦解,分化瓦解,让让每个囚徒都担每个囚徒都担忧对忧对方会背信方会背信弃弃义义,从而逐步解除囚徒之,从而逐步解除囚徒之间间的集体理性。的集体理性。现实现实中的囚徒逆境中的囚徒逆境现现象:价格象:价格战战;军备竞赛军备竞赛;公共;公共资资源的源的过过度运用;公共品
34、的短缺;度运用;公共品的短缺;团队团队生生产产中的中的偷懒偷懒;451.2.1 囚徒逆境囚徒逆境 分析两寡分析两寡头头的决策的决策优优劣:劣:假如假如对对方定方定“高价高价”,则则自己自己“高价高价”可得收益可得收益100,而自己,而自己“低低价价”会得高收益会得高收益150,因此定,因此定“低价低价”是是较较好的好的选择选择;假如假如对对方定方定“低价低价”,则则自己自己“高价高价”只能得到只能得到20,而自己,而自己“低低价价”会得到会得到较较高收益高收益70,因此,因此“低价低价”是是较较好的好的选择选择;综综上,无上,无论对论对方如何方如何选择选择,寡,寡头们选择头们选择定定“低价低价
35、”始始终终是是对对自自己最有利的。己最有利的。l2.市市场竞场竞争中争中典型的囚徒逆典型的囚徒逆境境现现象之一象之一100,10020,150150,2070,70高高 价价低低 价价高高 价价低低 价价寡寡头头2双寡双寡头头的得益矩的得益矩阵阵寡寡头头1461.2.1 囚徒逆境囚徒逆境 结结果是果是对对两寡两寡头头最有利的最有利的垄垄断情形断情形高价,高价高价,高价并并没有出没有出现现,取而代之的是,取而代之的是竞竞争性更争性更强强、对对消消费费者更有者更有利的市利的市场结场结构。构。这这事事实实上就是某行上就是某行业业内部的企内部的企业业很很难难形成合作形成合作垄垄断、断、价格价格战频发战
36、频发的博弈的博弈说说明。明。现实现实的例子:的例子:电电信信业业;家;家电电的价格的价格战战;石油石油输输出出组织联组织联合限合限产产的失的失败败,等等。,等等。471.2.2 赌胜赌胜博弈博弈l赌胜赌胜博弈之一博弈之一:田忌田忌赛马赛马(赢赢1局,局,1吨吨铜铜)3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上下中上下中中上下中上下中下上
37、中下上下上中下上中下中上下中上上上中中下下上上下下中中中中上上下下中中下下上上下下上上中中下下中中上上田田 忌忌得益矩得益矩阵阵齐齐威王威王481.2.2 赌胜赌胜博弈博弈l赌胜赌胜博弈之二博弈之二:猜硬:猜硬币币博弈(博弈(输赢输赢1美元)美元)猜硬猜硬币币方方-1,11,-11,-1-1,1正正 面面反反 面面正正 面面反反 面面盖硬盖硬币币方方491.2.2 赌胜赌胜博弈博弈l赌胜赌胜博弈之三博弈之三:石:石头头、剪子、布(、剪子、布(输赢输赢1美元)美元)博弈方博弈方2剪剪 子子0,01,-1-1,1-1,11,-10,01,-1-1,10,0石石 头头布布石石 头头剪剪 子子布布博弈
38、方博弈方1501.2.3 产产量决策的古量决策的古诺诺模型模型l三厂商离散(取整)三厂商离散(取整)产产量博弈量博弈(1)市)市场场由三厂商瓜分:由三厂商瓜分:(2)需求函数:)需求函数:(3)利)利润润函数:假函数:假设设成本成本为为0511.2.3 产产量决策的古量决策的古诺诺模型模型 分析:分析:(1)产产量之和大于量之和大于20,无利可,无利可图图。(2)各厂商的)各厂商的产产量不太可能超量不太可能超过过10。因因为为即使其他两个厂商都不生即使其他两个厂商都不生产产,最,最优产优产量也只有量也只有10(对对利利润润函数求函数求导导,令一,令一阶导阶导数数为为0,2.qi=20)。)。更
39、何况,更何况,这这个模型假个模型假设设不是一个厂商不是一个厂商垄垄断市断市场场,其,其他厂商的他厂商的竞竞争必定使得每个厂商的市争必定使得每个厂商的市场场空空间变间变得更小。得更小。521.2.3 产产量决策的古量决策的古诺诺模型模型 三厂商离散三厂商离散产产量量组组合合(部分部分)对应对应价格和利价格和利润润486281612554630302455552525255564202024333113333337337492121531.2.3 产产量决策的古量决策的古诺诺模型模型 产产量量组组合(合(5,5,5)是很)是很稳稳定的。因定的。因为为在在这这个个产产量量组组合下,任何一个厂商合下,
40、任何一个厂商单单独提高或降低独提高或降低产产量,都只会量,都只会削减利削减利润润而不会增加利而不会增加利润润。产产量量组组合(合(3,3,3)会使每个厂商平分市)会使每个厂商平分市场场,获获得得比(比(5,5,5)更高的利)更高的利润润!但是!但是 并不能并不能维维持,因持,因为为在(在(3,3,3)的)的时时候,每个厂商候,每个厂商都会有私自增加都会有私自增加产产量量获获得更高利得更高利润润的的动动机(机(37,利,利润润会大幅度增加)。会大幅度增加)。541.3 博弈博弈结结构和博弈的分构和博弈的分类类l1.3.1 博弈中的博弈方博弈中的博弈方l1.3.2 博弈中的策略博弈中的策略l1.3
41、.3 博弈中的得益博弈中的得益l1.3.4 博弈的博弈的过过程程l1.3.5 博弈的信息博弈的信息结结构构l1.3.6 博弈方的博弈方的实实力和理性力和理性l1.3.7 博弈的分博弈的分类类和博弈理和博弈理论论的的结结构构551.3.1 博弈中的博弈方博弈中的博弈方l博弈方博弈方博弈中独立决策、独立担当博弈博弈中独立决策、独立担当博弈结结果果的个人或的个人或组织组织;博弈方并不;博弈方并不仅仅指自然人,既可指自然人,既可以是个人,也可以是企以是个人,也可以是企业业、国家、国家、经济经济社会社会组组织织等。等。l博弈方数量会博弈方数量会对对博弈分析博弈分析过过程和程和结结果果产产生影响生影响l按
42、博弈方数量分按博弈方数量分类类,博弈可分,博弈可分为单为单人博弈、两人博弈、两人博弈、多人博弈。人博弈、多人博弈。561.3.1 博弈中的博弈方博弈中的博弈方l1.单单人博弈之一:人博弈之一:单单人迷人迷宫宫 单单人博弈人博弈实质实质上是一般的最上是一般的最优优化化问题问题入口入口AB出口(出口(奖奖金金M M)0M00A左左B左左A左左B右右A右右B左左A右右B右右单单人迷人迷宫宫得益矩得益矩阵阵游游戏戏者者57左左A,1右右(0)B,1右右左左(0)(M)1.3.1 博弈中的博弈方博弈中的博弈方l单单人迷人迷宫扩宫扩展型展型581.3.1 博弈中的博弈方博弈中的博弈方l2.单单人博弈之二:
43、运人博弈之二:运输输路途路途问题问题l 引入引入“博弈人博弈人0”:大自然,:大自然,选择选择“好天气好天气”或或“坏坏天气天气”。商商人人-7000-16000-10000-10000好天气好天气(75%)坏天气坏天气(25%)自自 然然水路水路陆陆路路运运输输路路线线得益矩得益矩阵阵坏天气坏天气(25%)好天气好天气(75%)01-7000-10000-16000-10000运运输输路路线扩线扩展形展形591.3.1 博弈中的博弈方博弈中的博弈方 求商人每个策略的期望收益,就可以做出决策。求商人每个策略的期望收益,就可以做出决策。水路:水路:陆陆路:路:水路的期望水路的期望损损失要稍小于失
44、要稍小于陆陆路,所以,商人路,所以,商人选择选择水路会更志向。水路会更志向。601.3.1 博弈中的博弈方博弈中的博弈方l博弈的博弈的扩扩展型(展型(树树形)描述直形)描述直观观明白,能比明白,能比较较形形象地反象地反应应博弈中每个得益的策略路径。与矩博弈中每个得益的策略路径。与矩阵阵型型博弈相比,由于它能反映出博弈博弈相比,由于它能反映出博弈过过程中程中选择选择、行、行为为的先后依次。因此它适合于表示我的先后依次。因此它适合于表示我们们后面将要后面将要介介绍绍的博弈方非同的博弈方非同时时行行动动或或选择选择的的“动态动态博弈博弈”。611.3.1 博弈中的博弈方博弈中的博弈方l3.两人博弈两
45、人博弈l 最常最常见见,探,探讨讨最多,是最基本和有用的博弈最多,是最基本和有用的博弈类类型。型。囚徒逆境、猜硬囚徒逆境、猜硬币币、齐齐威王田忌威王田忌赛马赛马等都是两人博弈;等都是两人博弈;l 两人博弈中的两博弈方两人博弈中的两博弈方间间并不并不总总是相互是相互对对抗的,抗的,有有时时候也会出候也会出现现两博弈方利益一两博弈方利益一样样的情形;的情形;l 在两人博弈中,在两人博弈中,驾驭驾驭信息信息较较多的并不能保多的并不能保证证利益利益也确定也确定较较多;多;l 个人追求最大自身利益的行个人追求最大自身利益的行为为,常常并不能,常常并不能导导致致实现实现社会的最大利益,也常常不能真正社会的
46、最大利益,也常常不能真正实现实现个人自身个人自身的最大利益。的最大利益。621.3.1 博弈中的博弈方博弈中的博弈方l4.多人博弈多人博弈l 多人博弈多人博弈有三个或三个以上博弈方参与的有三个或三个以上博弈方参与的博弈;博弈;l 可能存在可能存在“破坏者破坏者”,如:奥运会的主,如:奥运会的主办权竞办权竞争;争;l 表述形式表述形式文字描述,函数式。文字描述,函数式。631.3.2 博弈中的策略博弈中的策略l策略策略博弈中各博弈方的决策内容,博弈中各博弈方的决策内容,简洁简洁地地说说就是参就是参与人可与人可实实行的行的选择选择。l不是每个博弈的博弈方都有相同的可不是每个博弈的博弈方都有相同的可
47、选选策略,不同博策略,不同博弈方之弈方之间间不不仅仅可可选选策略不同,而且可策略不同,而且可选选策略的数量也策略的数量也不同。不同。l跟据策略的多寡,博弈可分跟据策略的多寡,博弈可分为为有限博弈和无限博弈。有限博弈和无限博弈。641.3.2 博弈中的策略博弈中的策略 有限博弈有限博弈一个博弈中每个博弈方的策略数都是一个博弈中每个博弈方的策略数都是有限的,理有限的,理论论上可以用得益矩上可以用得益矩阵阵法、法、扩扩展形法或展形法或简简洁洁排列法。如,囚徒逆境,排列法。如,囚徒逆境,“坦白坦白”、“不坦白不坦白”。无限博弈无限博弈一个博弈中至少有某些博弈方的策略一个博弈中至少有某些博弈方的策略有无
48、限多个,只能用数集或函数来表示。如,可无有无限多个,只能用数集或函数来表示。如,可无限分割的限分割的产产量决策。量决策。651.3.3 博弈中的得益博弈中的得益l得益得益参与博弈的各个博弈方从博弈中所参与博弈的各个博弈方从博弈中所获获得的利得的利益,是各博弈方的根本目益,是各博弈方的根本目标标,行,行为为和推断的主要依和推断的主要依据;(因此,据;(因此,变变更得益有可能更得益有可能变变更博弈方的行更博弈方的行为为决决策)。策)。l得益可以是利得益可以是利润润、收入,也可以是量化的效用、社、收入,也可以是量化的效用、社会效益、福利等;会效益、福利等;l依据得益依据得益对对博弈博弈进进行的分行的
49、分类类,包括:零和博弈、常,包括:零和博弈、常和博弈、和博弈、变变和博弈。和博弈。661.3.3 博弈中的得益博弈中的得益 1.零和博弈:一方的得益是另一方的零和博弈:一方的得益是另一方的损损失,也称失,也称“严严格格竞竞争博弈争博弈”,博弈方之,博弈方之间间利益始利益始终对终对立,偏好通立,偏好通常不同。常不同。猜硬猜硬币币,田忌,田忌赛马赛马,石,石头头、剪刀、布、剪刀、布 2.常和博弈:博弈方之常和博弈:博弈方之间间利益的利益的总总和和为为常数,博弈方常数,博弈方之之间间的利益是的利益是对对立的且是立的且是竞竞争关系,零和博弈的争关系,零和博弈的扩扩展。展。安排固定数安排固定数额额的的奖
50、奖金、利金、利润润,遗产遗产官司官司671.3.3 博弈中的得益博弈中的得益 3.变变和博弈:零和博弈和常和博弈以外的全部和博弈:零和博弈和常和博弈以外的全部博弈。有可能存在合作利益和博弈效率博弈。有可能存在合作利益和博弈效率问题问题。囚徒逆境,囚徒逆境,产产量博弈,制式量博弈,制式问题问题等等681.3.4 博弈的博弈的过过程程l静静态态博弈:各博弈方是同博弈:各博弈方是同时时决策;或者决策;或者虽虽然各博弈方然各博弈方决策的决策的时间时间不确定真正一不确定真正一样样,但在他,但在他们们做出做出选择选择之前之前不知道其他博弈方的策略,在知道其他博弈方的策略不知道其他博弈方的策略,在知道其他博