《博弈论完整课件.ppt》由会员分享,可在线阅读,更多相关《博弈论完整课件.ppt(480页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、博弈论Game Theory 武汉大学经济与管理学院教材教材:范如国范如国,博弈论博弈论,武汉大学出版社,武汉大学出版社,2011参考书参考书:1.美美哈罗德哈罗德.W.库恩库恩,博弈论经典,中国人民大学出版社2.美美罗伯特罗伯特.吉本斯吉本斯,博弈论基础,中国社会科学出版社3.美美艾里克艾里克.拉斯缪森拉斯缪森,博弈与信息,北京大学出版社4.肖条军肖条军,博弈论及其应用博弈论及其应用,上海三联书店上海三联书店 第一章第一章 什么是博弈什么是博弈几个博弈的例子:1.高考填报志愿2.外交谈判3.企业合作与竞争4.金融危机5.就业 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”保
2、罗萨缪尔森一.什么是“博弈”“博弈论”译自英文“GameTheory”。“Game”的基本意义是游戏,因此“GameTheory”直译应该是“游戏理论”。博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈论(Game Theory,又名对策论)是一门以数学为基础的、研究对抗冲突中最优解决问题的学科,更确切地说是运筹学的一个分支,开山鼻祖是数学家、计算机的发明者冯诺意曼(Vonneumann)。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。1944
3、年他和普林斯顿经济学家摩根斯坦恩(Morgenstern)合写了一本书,博弈论和经济行为(TheTheoryofGamesandEconomicBehaviour),正式奠定了现代博弈论的基础,标志着现代系统博弈理论的的初步形成。博弈论作为一门学科,是在20世纪5060年代发展起来的。1950和1951年,Nash发表了两篇关于非合作博弈的重要文章,明确提出了NashEquilibrium的概念,揭示了博弈论和经济均衡之间的关系,并证明了均衡解的存在,奠定了现代非合作博弈论的基石。到20世纪70年代,博弈论正式成为主流经济学研究的主要方法之一。1994年诺贝尔经济学奖同时授予了纳什、泽尔腾、海
4、萨尼三位博弈论专家。1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞;2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。2005年诺贝尔经济学奖又授予了美国经济学家托马斯谢林(ThomasSchelling)和以色列经济学家罗伯特奥曼(RobertAumann),以表彰他们在合作博弈方面的巨大贡献。最近十几年来,博弈论在经济学中得到了广泛地运用,在揭示经济行为相互制约性质方面。今天,在现代经济学里,博弈论已经成为十分标准的分析工具。The Nobel Memorial Prize in Economic Sc
5、iences2007-Leonid Hurwicz,Eric S.Maskin,Roger B.Myerson 2005-Robert J.Aumann,Thomas C.Schelling 2001-George A.Akerlof,A.Michael Spence,Joseph E.Stiglitz 1996-James A.Mirrlees,William Vickrey 1994-John C.Harsanyi,John F.Nash Jr.,Reinhard Selten 1994年三位获诺奖的博弈论学者年三位获诺奖的博弈论学者John NashJohn HarsanyLeihade
6、n Selten纳什纳什(Nash):Nash-Equilibrium约翰纳什,1928年生于美国 1994年Nobel 经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。纳什传奇的经历纳什1928年6月13日出生于美国弗吉尼亚西部,从小就表现出非凡的数学天分1948年获得数学硕士学位1950年在普林斯顿获得数学博士学位,博士论文关于博弈论的研究,在45年后获得诺贝尔奖19511959年,在MIT数学中心任教。在1958年底,纳什的心智状态出现问题。因为精神分裂症,在1959年丢了MIT的工作。后来妻子Alicia也最终和他离婚,但仍然继续帮助他。纳
7、什在妻子和普林斯顿朋友和同事的无微不至的关怀帮助下,和自己的不懈努力下,病情逐渐好转起来。经历了近30年的精神病的折磨,又重新回到了学术研究中。1994年,纳什和其他两位博弈论的学者一起获得了诺贝尔经济学奖。2002年3月24日,当74岁的纳什拉着妻子Alicia的手走进柯达剧院奥斯卡颁奖现场时,整个剧院爆发出热烈的掌声。2002年3月24日,第74届奥斯卡颁奖典礼在好莱坞柯达剧院隆重开幕。一部名叫美丽心灵(abeautifulmind)的影片大出风头,在获得八项提名后,独得最佳影片、最佳导演、最佳改编剧本、最佳女配角四项大奖。美美 丽丽心心 灵灵泽尔藤泽尔藤(Selten):Subgame-
8、Perfect Nash E-莱因哈德泽尔腾,1930年生于德国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。海萨尼海萨尼(Harsanyi):Bayes-Nash Equilibrium约翰海萨尼,1920年生于美国1994年Nobel经济学奖得主莫里斯莫里斯 1996获奖获奖詹姆斯莫里斯1936年生于英国在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论威廉威廉维克瑞维克瑞1914-1996,生于美国,生于美国,1996获奖获奖在信息经济学、激励理论、博弈论等方面都做出了重大贡献迈克尔迈克尔斯宾斯斯宾
9、斯(Spence)2001获奖获奖斯宾斯斯宾斯(A.Michael Spence)生于1943年,美国加州斯坦福大学教授 为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分.阿克洛夫(阿克洛夫(George A.Akerlof)生于生于1940年,美国加州大学伯克莱分校年,美国加州大学伯克莱分校教授教授为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分.2001获奖获奖斯蒂格利兹(斯蒂格利兹(Joseph E.Stigl
10、itz)生于生于1943年,美国纽约哥伦比亚大学教年,美国纽约哥伦比亚大学教授授为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分.2001获奖获奖罗伯特罗伯特奥曼奥曼(Robert J.Aumann)1930年年6月出生于德国的法兰克福,拥有月出生于德国的法兰克福,拥有以色列和美国双重国籍以色列和美国双重国籍。通过博弈论分析,促进了人们对冲突和合作的理解 2005获奖获奖托马斯托马斯谢林(谢林(Thomas C.Schelling)1921年出生于美国加利福尼亚州的奥克年出生于美国加利福尼亚州的奥克兰市。
11、兰市。通过博弈论分析,促进了人们对冲突和合作的理解2005获奖获奖LeonidHurwicz(里奥尼德赫维克兹)1917年出生于俄罗斯莫斯科,后加入美年出生于俄罗斯莫斯科,后加入美国国籍,目前为美国明尼苏达大学经济国国籍,目前为美国明尼苏达大学经济学荣誉教授学荣誉教授创立和发展了“机制设计理论”。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效。此外,借助“机制设计理论”,人们还可以确定最佳和最有效的资源分配方式。2007获奖获奖马斯金马斯金(EricS.Maskin)1950年出生于美国纽约,现任美国普林年出生于美国纽约,现任美国普林斯顿进修学院教授
12、斯顿进修学院教授创立和发展了“机制设计理论”。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效。此外,借助“机制设计理论”,人们还可以确定最佳和最有效的资源分配方式。2007获奖获奖罗杰B梅尔森(RogerB.Myerson)1951年出生在美国波士顿,现任美国芝年出生在美国波士顿,现任美国芝加哥大学教授加哥大学教授创立和发展了“机制设计理论”。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效。此外,借助“机制设计理论”,人们还可以确定最佳和最有效的资源分配方式。2007获奖获奖梅尔森为芝加哥大学经济系教授。他
13、于1951年3月29日生于美国波士顿,美国国籍。他有两名孩子,分别生于1983年及1985年。梅尔森于1976年获得哈佛大学应用数学系哲学博士学位,其博士课题为“一种合作博弈理论(ATheoryofCooperativeGames)”。教授1976年获得哈佛大学应用数学博士学位,对博弈论有深入的研究。著有博弈论:矛盾冲突分析(GameTheory:AnalysisofConflict)及经济决策的概率模型(ProbabilityModelsforEconomicDecisions)。博弈论是人们深刻理解诸如经济行为和社会问题的基础。现在人们所说的博弈论,一般指非合作博弈论。非合作博弈强调的是个
14、人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。它的特征是:人们行为相互作用时,行为人不能达成一个有约束力的协议。或者说,行为人之间的合约对于签约人没有实质性约束力。然而,在各种生活行为中,人与人之间除了竞争关系,还存在合作关系,常常是两种关系并存,合理的合作能够给双方带来共同利益。这是合作型博弈论研究的范畴。博弈论的应用非常广泛,利用博弈论可以证明现实生活中许多有趣的问题。如:多劳者不多得,公共资源的过度使用,非合作者在一段时间内选择合作。虽然这些结论都是建立在一个很强的假设,即参与人是理性的,有最大化自己效用的趋势。但是其结论有深刻的哲学内涵。目前经济学中的委托代理制、激励理
15、论都可以用博弈论来分析。现代的企业间竞争有很多情况都是在合作的背景下进行的。博弈论目前在生物学,经济学,国际关系,计算机科学,政治学,军事战略和其他很多学科都有广泛的应用。此外,博弈论也应用于数学的其他分支,如概率,统计和线性规划等。为国王画像为国王画像从前,有个国王,瘸了一条腿,瞎了一只眼睛。他想得到一张称心如意的画像,便召来三位著名的画家为他作画。一位画家把国王画得仪表堂堂,气概非凡,特别是把两只眼睛画得炯炯有神,把两条腿画得健壮有力。国王一看,很不满意,气愤地说:“睁着眼睛胡画,肯定是个拍马逢迎的骗子。”第二位画家把国王画得维妙维肖,简直像国王本人一样,瞎眼瘸腿一目了然。国王看过大发雷霆
16、,把画像踩在脚下吼叫起来。第三位画家十分从容地画好了,发怒的国王一见到这张画像,顿时转怒为喜,连声称赞画得好。第三位画家是怎样画的呢?火车过隧道火车过隧道两条火车轨道除了在隧道内的一段外都是平行铺设的。由于隧道的宽度不足以铺设双轨,因此,在隧道内只能铺设单轨。据某人观察,一天下午,一列火车从某一方向驶入隧道,另一列火车从相反方向驶入隧道。两列火车都以最高的速度行驶,然而,它们并未相撞。这是为什么?二.博弈的标准式表达博弈的标准式表达包括以下八个方面:1.博弈的参与者(Players)2.各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合3.进行博弈的次序(Ord
17、ers)4.博弈方的得益(Payoffs)5.博弈行为(action)6.博弈信息(information)7.结果(outcome)8.均衡(equilibrium)三三.经典的博弈模型经典的博弈模型1 1、“囚徒的困境囚徒的困境”(PrisonersDilemma)关关于于博博弈弈论论,流流传传最最广广的的是是一一个个叫叫做做“囚囚徒徒困困境境”的的故故事事。可可以以说说凡凡是是讲讲博博弈弈论论,都都会会说说到到这这个个经经典典的的博弈模型。博弈模型。(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)假设有两个小偷A和B联合犯事、私入民宅被警察抓
18、住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。博弈的支付矩阵博弈矩阵B坦白B抵赖A坦白-8,-80,-10A抵赖-10,0-1,-1囚徒1:坦白囚徒2:坦白这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,
19、坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。这样两人都选择坦白的策略以及因此被判8年的结局被称为“纳什均衡”,也叫非合作均衡。囚徒困境的启示囚徒困境的启示 “囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的
20、结果。“纳什均衡”对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。国富论中有这样一句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。可以说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就
21、是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。2.猜硬币游戏猜硬币游戏-1,11,-11,-1-1,1正 面反 面猜猜 方方盖盖方方正 面反 面3.“田忌赛马田忌赛马”“田忌赛马”是我国古代一个非常有名的故事,讲的是发生在齐威王与大将田忌之间的赛马的故事。田忌在谋士孙膑的帮助下,运用谋略帮助田忌以弱胜强战胜了齐威王。这个故事讲的其实是一个很典型的博弈问题。3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13
22、,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田田 忌忌齐齐威威王王得益矩阵得益矩阵在这个博弈中齐威王和田忌应该怎样选择自己的策略,才能最终获得满意的结果呢?首先,作为博弈方的齐威王和田忌不能让对方知道或猜中自己的策略,从而导致自己输掉比赛。这也意味着任何一方的策略选择不能一成不变,或者不能有规律性地变动,即必须以随机的方式选择策略,否则一旦对方捕捉到这种规律性的变动,就可以针对性地采取应对措施。其次,无论对齐威王还是田忌,可选择的六种策略之间没有优劣之分。从图可以看出,对齐威王来说,每一种策略都可能有六种
23、不同的结果,究竟最终得到哪种结果,主要看对方策略与自己策略的对应状况,而不是自己的策略本身。同样的,对田忌来讲六种策略本身也无好坏之分。因此,两博弈方在决策时对自已的可选策略并无偏好,应以相同的概率选用。夫妻之争夫妻之争2,10,00,01,3时 装足 球时装足球丈丈 夫夫妻妻子子夫妻之争夫妻之争 第三节第三节 博弈结构和博弈的分类博弈结构和博弈的分类一、博弈的分类一、博弈的分类(Types)1.如果按照博弈者的先后顺序,博弈持续的时间和重复的次数进行分类,博弈可以划分为静态博弈(Staticgame)和动态博弈(DynamicGame)。静态博弈是指这样一种博弈,在这种博弈中,博弈者同时采取
24、行动,同时进行策略决定,博弈者所获得的支付依赖于他们所采取的不同的策略组合情况。因此,我们也静态博弈称为“同时行动的博弈”(Simultaneous-MoveGames)。或者尽管博弈者的行动有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。如“囚徒困境”就是如此。再比如工程招标,不同的投标者投标的时间也许不同,但只要互相不知道对方的报价,则是同时行动。动态博弈是指在博弈中,博弈者的行动有先后顺序(Sequential-Move),且后行动者能够观察到先行动者所选择的行动或策略,因此,动态博弈又叫做序贯博弈。2.如果按照博弈者对其他博弈者所掌握的信息的完全与完备程度进行分类,博弈可
25、以划分为完全信息博弈(GamewithCompleteInformation)与不完全信息的博弈(GamewithIncompleteInformation),以及完美信息的博弈(GamewithPerfectInformation)与不完美信息的博弈(GamewithImperfectInformation),确定的博弈(GameofCertainty)与不确定的博弈(GameofUncertainty),对称信息的博弈(GameofSymmetricInformation)与非对称信息的博弈(GameofAsymmetricInformation)等。行动次序信息静态动态完全信息纳什均衡纳
26、什纳什子博弈精练纳什均衡泽尔腾泽尔腾不完全信息贝叶斯均衡海萨尼海萨尼精炼贝叶斯均衡泽尔腾等泽尔腾等博博弈的弈的分类和均衡分类和均衡信息是博弈论中重要的内容。完全博弈是指在博弈过程中,每一位博弈者对其他博弈者的特征、策略空间及收益函数有准确的信息。严格地讲,完全信息博弈是指博弈者的策略空间及策略组合下的支付,是博弈中所有博弈者的“公共知识”(CommomKnowledge)的博弈。完美信息是指博弈者完全清楚到他决策时为止时,所有其他博弈者的所有决策信息,或者说,了解博弈已进行过程的所有信息。3.如果博弈者对其他博弈者的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有博弈者的特征、策略空
27、间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。对于不完全信息博弈,博弈者所做的是努力使自己的期望支付或期望效用最大化。在不完全信息的博弈中,首先行动的是自然(Nature),自然决定了博弈者以多大的可能性采取某种行动,由自然决定的每个博弈者以多大的可能性采取某种行动的情况只有每个博弈者个人知道,其他博弈者都不知道。确定的博弈是指不存在由自然作出行动的博弈,否则就是不确定的博弈。4.如果按照博弈者之间是否存在合作进行分类,博弈可以划分为合作博弈(CooperativeGame)和非合作博弈(Non-CooperativeGame)。合作博弈是指博弈者之间有着一个对各方具有
28、约束力的协议,博弈者在协议范围内进行的博弈。人们分工与交换的经济活动就是合作性的博弈。如果博弈者无法通过谈判达成一个有约束的契约来限制博弈者的行为,那么这个博弈为非合作博弈。典型的合作博弈是寡头企业之间的串谋(Collusion)。串谋是指企业之间通过公开或暗地里签订协议,对各自的价格或产量进行限制,以达到获取更多垄断利润的行为。后面将会继续讨论的囚徒困境和将要讨论的公共资源悲剧都是非合作性的博弈。根据博弈者支付的情况,有以下分类:5.零和博弈(Zero-SumGame)和非零和博弈(Non-Zero-SumGame)。如果一个博弈在所有对局情况下全体参与人的得益之和总为0,这个博弈就叫做零和
29、博弈;如果一个博弈在所有对局情况下全体参与人的得益之和不为0,这个博弈就叫做非零和博弈。6.常和博弈(Constant-SumGame)和变和博弈(Variable-SumGame)。如果一个博弈在所有对局情况下全体参与人的得益之和总为一个常数,这个博弈就叫做常和博弈;如果一个博弈在所有对局情况下全体参与人的得益之和不总是一个常数,这个博弈就叫做变和博弈。二、博弈中的博弈方二、博弈中的博弈方1.单人博弈 单人博弈即只有一个博弈方的博弈。严格地讲,单人博弈已经退化为一般的最优化问题,因此不属于博弈论研究的目标对象。不过讨论单人博弈还是有价值的,因为包括单人博弈可以使博弈理论的结构更加完整,如同集
30、合里面的完整,它使集合理论的结构更完整。一个单人博弈例子的例子有一个商人需要将一批商品从武汉向上海运输,从武汉到上海运输有水、陆两条路线,走陆路运输成本为10000元,走水路的运输成本为6000元。走陆路比较安全,走水路则有一定的风险,如果遇到恶劣天气将会造成这批货物总价值10%的损失。假设已知该批货物的总价值为100000元,运输期间出现暴风雨天气的概率为20%,问该商人该选择哪条运输路线?0武汉武汉 1 武汉武汉海海坏天气(坏天气(20%)好天气(好天气(80%)上海(-0.6)(-1.0)(-1.6)(-1.0)上海在本博弈中,供应商走水路时,得益为-0.6的概率为80%(好天气),得益
31、为-1.6的概率为20%(坏天气),因此走水路 的 期 望 得 益 为(-0.6)80%(-1.6)20%=-0.8;走陆路时,得益是确定的-1。因为-0.8-1,即走水路的期望费用0.8小于走陆路的费用1,所以供应商还是应该选择走水路。若多次碰到同样的决策选择并每次都作这样的选择,则平均每次的运输成本应接近0.8。2.双人博弈 双人博弈就是两个各自独立决策,但策略和利益具有相互依存关系的博弈方的决策问题。双人博弈是博弈问题中最常见,也是研究得最多的博弈类型。3.多人博弈 有三个或三个以上博弈方参加的博弈称为“多人博弈”。多人博弈中的“破坏者”三、博弈中的策略三、博弈中的策略 博弈中各博弈方的
32、决策内容称为“策略”(Strategies)如果一个博弈中每个博弈方的策略数都是有限的,则称为“有限博弈(Finite Games)”如果一个博弈中至少有某些博弈方的策略无限多个,则称为“无限博弈”(InfiniteGames)四、博弈中的得益四、博弈中的得益得益(Payoffs)即参加博弈的各个博弈方从博弈中所获得的利益,得益可以是本身就是数量的利润、收入,也可以是量化的效用、社会效益、福利等等。1.零和博弈 零和博弈:一方的得益必定是另一方的损失,某些博弈方的赢肯定是来源于其他博弈方的输。2.常和博弈 常和博弈可以看作零和博弈的扩展。3、变和博弈 零和博弈和常和博弈以外的所有博弈都称为“变
33、和博弈”。变和博弈是指在不同策略组合(结果)下各博弈方的利益之和往往是不相同的。五、博弈的过程五、博弈的过程1.静态博弈 许多博弈常常要求或者说设定各博弈方是同时决策的,或者虽然各博弈方决策的时间不一定真正一致,但在他们作出选择之前不允许知道其他博弈方的策略,在知道其他博弈方的策略之后则不能改变自己的选择,从而各博弈方的选择仍然可以看作是同时作出的。2.动态博弈(DynamicGames)除了各博弈方同时决策的静态博弈以外,也有大量现实决策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前,可以看到其他博弈方的选择、行动,甚至还包括自己的选择和
34、行动。例例 “市场阻击市场阻击”博弈博弈3.重复博弈(RepeatedGames)所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。“有限次重复博弈”(Finitely Repeated Games)“无 限 次 重 复 博 弈”(InfinitelyRepeatedGames)六、博弈的信息结构 1.博弈中最重要的信息之一是关于得益的信息 一般地,我们将各博弈方都完全了解所有博弈方各种情况下得益的博弈称为“完全信息(CompleteInformation)博弈”,将至少部分博弈方不完全了解其他博弈方得益情况的博弈称为“不完全信息(IncompleteInformation)博弈”。2
35、.关于博弈过程的信息动态博弈中在轮到行为时对博弈的进程完全 了 解 的 博 弈 方,称 为 具 有“完 美 信 息”(PerfectInformation)的博弈方如果动态博弈的所有博弈方都有完美信息,则称为“完美信息的动态博弈”。动态博弈中轮到行为的博弈方不完全了解此前全部博弈进程时,称为具有“不完美信息(ImperfectInformation)的博弈方,有这种博弈 方 的 动 态 博 弈 则 称 为“ImperfectInformation”的博弈方,有这种博弈方的动态博弈则称为“不完美信息的动态博弈”。七、博弈方的能力和理性七、博弈方的能力和理性博弈论关于人的理性假设包括两个方面:一是
36、他们决策行为的根本目标;二是他们追求目标的能力。即认为博弈方都是以个体利益最大化目标,且有准确的判断选择能力,也不会“犯错误”。以个体利益最大为目标被称为“个体理性”(IndividualRationality),有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。1、完全理性和有限理性 2、个体理性和集体理性 例例 “信息与战争信息与战争”博弈博弈 战争胜败大体上取决于实力、信息、战略战争胜败大体上取决于实力、信息、战略与人心。如果其中一方各方面均优于另外一方,与人心。如果其中一方各方面均优于另外一方,并且弱的一方知道的话,理性的弱者是不会参并且弱的一方知道的话,理性的弱者是不会参与
37、战争的,此时战争便打不起来。很多情况下,与战争的,此时战争便打不起来。很多情况下,国与国之间的战争往往是由于不完全了解局势国与国之间的战争往往是由于不完全了解局势造成的,有足够理性的双方之间是不可能发生造成的,有足够理性的双方之间是不可能发生战争的。从理论上讲,具有足够理性和具有足战争的。从理论上讲,具有足够理性和具有足够知识与信息的人能预知战争的结果够知识与信息的人能预知战争的结果,但现实但现实中的人或者因为没有足够的知识和信息,或者中的人或者因为没有足够的知识和信息,或者不具有足够的理性的能力,而往往不能做到这不具有足够的理性的能力,而往往不能做到这一点。一点。比如,第二次世界大战结束后,
38、朝鲜半岛沿三八线被划分为南北朝鲜。1951年南北之间发生战争,美国马上介入了这场战争。美国的考虑是,刚刚成立的中华人民共和国不会介入到这场朝鲜战争中去。在美国看来,新生的中国刚刚内战消耗太大,百废待兴,没有能力卷入战争。并且美国认为,美国武器装备优良,军费充足,即使中国参战,也无力与之抗衡。因此美国得出结论:朝鲜战争因美国的介入很快就会结束,而中国不会介入。当时美国的一家咨询公司在美国未出兵之前,深入地研究了中国的情况,以及朝鲜与中国的关系,认为如果美国介入到朝鲜战争中去,只要中国判断没有失误,中国必将出兵。他们想将研究报告提供的信息以500万美元卖给政府,而美国政府未予理睬。最终,美国以损失
39、几百亿美元的财产,伤亡数十万人的代价在朝鲜战场上大败。八.博弈的表示 我们常用G表示一个博弈:如G有n个博弈方,每个博弈方的全部可选策略的集合我们称为“策略空间”,分别用S1,Sn表示;Sij表示博弈方i的第j个策略,其中j可取有限个值(有限策略博弈),也可取无限个值(无限策略博弈);博弈方i的利益则用ui表示,ui是各博弈方策略的多元函数。n个博弈方的标准式博弈G常写成:(二二)博弈的策略式表达博弈的策略式表达在博弈论中,一个博弈可以用两种不同的方式来表达:一种是策略式表达,另一种是扩展式表达。策略式表达更适合于静态博弈,而扩展式表达更适合于讨论动态博弈。策略式表达又称为标准式表达,在这种表
40、达中,所有参与人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的得益。这里参与人同时选择的是“策略”,而不是“行动”。在静态博弈中,由于参与人只选择一次,所以策略就等同于行动了。而在动态博弈中,策略是参与人在各个阶段的行动的全面计划。策略式表述策略式表述:1、博弈的参与人集合:iK,K=(1,2,,n);2、每个参与人的战略空间:Si,,i1,2,3,n;3、每个参与人的得益函数:ui(s1,,si,sn),i1,2,3,,n。用GS1,Sn;u1,,un代表战略式表述博弈。(三三)博弈的得益矩阵表示博弈的得益矩阵表示 囚徒囚徒B B囚徒囚徒A A坦白不坦白坦白8,80,-10不坦
41、白-10,01,1第二章第二章 完全信息静态博弈完全信息静态博弈第一节第一节 静态博弈分析方法静态博弈分析方法一、静态博弈一、静态博弈(Static Game)博博弈弈方方同同时时作作出出决决策策,且且各各博博弈弈方方对对对对方方的的得得益益完完全全了了解解,或或者者虽虽然然决决策策有有先先后后,但但是是没没有有人人在在决决策策之之前前看看到到了了其其他他博博弈弈方方的的决决策策行行为为,也也没没有有交交换换信信息息,一一旦旦决决策策做做出出之之后后,就就只只能能等等待待结结果果,对对博博弈弈的的发发展展再再也也不不能能产产生生任任何何影影响响,这这种种博博弈弈叫叫做做静静态态博博弈弈。日日常
42、常生生活活中中静静态态博博弈弈的的例例子子很很多多,如如前前面面介介绍绍的的 “囚囚徒徒困境困境”,“石头石头剪子剪子布布”都是静态博弈。都是静态博弈。二二、占占 优优 策策 略略 均均 衡衡(Dominant Strategies Equilibrium)占占优优策策略略均均衡衡是是指指这这样样一一种种特特殊殊的的博博弈弈:某某一一博博弈弈方方的的策策略略可可能能并并不不依依赖赖于于其其他他博博弈弈方方的的策策略略选选择择。换换句句话话说说,无无论论其其他他博博弈弈方方如如何何选选择择自自己己的的策策略略,该该博博弈弈方方的的最最优优策策略略选选择择是是惟惟一一的的。也也就就是是说说,如如果
43、果无无论论所所有有其其他他博博弈弈方方采采取取什什么么策策略略,一一博博弈弈方方的的某某个个策策略略给给他他带带来来的的得得益益始始终终高高于于其其他他策策略略,至至少少不不低低于于其其他他策策略略。那那么么,“某某个个策策略略”必必然然是是该该博博弈弈方方愿愿意意选选择择的的策策略略,我我们们称称这这种种策策略略为为该该博博弈弈方方的的一一个个“占占优优策策略略”(Dominant-Strategy)或或 “上策上策”。进一步,如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。我们称这样的策略组合为该博弈
44、的一个“占优策略均衡”(Dominant-strategyEquilibrium)或“上策均衡”。“占优策略均衡”是博弈分析中最基本的均衡概念之一,“占优策略均衡”分析是最基本的博弈分析方法。囚徒的困境博弈中的(坦白,坦白)实际上就是一个上策均衡,因为根据第一章的分析,“坦白”对该博弈的两个博弈方来说都是上策。占优策略不管囚犯B是选择认罪还是不认罪,囚犯A都会选择认罪!认罪 是囚犯A的占优策略!占优策略(上策)不管对手做什么,对一个参与者都能获得最高得益的策略囚犯B认罪不认罪囚犯A认罪-10,-10-1,-20不认罪-20,-1-3,-3对于囚犯B不管囚犯A是选择认罪还是不认罪,囚犯B都会选择
45、认罪!认罪 是囚犯B的占优策略!囚犯B认罪不认罪囚犯A认罪-10,-10-1,-20不认罪-20,-1-3,-3占优策略(上策)均衡不管囚犯B是选择认罪还是不认罪,囚犯A都会选择认罪!不管囚犯A是选择认罪还是不认罪,囚犯B都会选择认罪!认罪 是囚犯A和B的占优策略!有博弈中,由局中人的上策构成的均衡称为占优策略(上策)均衡囚犯B认罪不认罪囚犯A认罪-10,-10-1,-20不认罪-20,-1-3,-3三、严格下策反复消去法(三、严格下策反复消去法(Iterated Elimination of Strictly Dominated Strategies)该方法可以归纳如下:首先找出某博弈者的严
46、格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一博弈者的严格劣策略;重复进行这一过程,直到博弈者剩下惟一的策略组合为止。剩下的这个惟一的博弈者的策略组合,就是这个博弈的均衡解。所谓“严格劣策略”(StrictlyDominatedstrategies)是指:在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。如果某一个策略的收益和第二个策略一样大,或者偶尔大于第二个策略,我们就说第二个战略是相对于第一个策略的“弱劣策略”(WeaklyDominatedStrategies)。通过上面的分析我们可以发现,严格下策反复消
47、去法的适用范围确实要比占优策略均衡分析更大一些,因此在分析博弈方面的作用也更大。不过,严格下策反复消去法也不能解决所有博弈的分析问题。因为在许多博弈问题中,上述相对意义上的严格下策往往也不存在。如猜硬币、田忌赛马中没有任何博弈方的任何策略是相对其他策略的严格下策。既然不存在任何严格下策的博弈,那么也就无法用严格下策反复消去法进行分析了。此外,在策略数较多的博弈中,往往是严格下策反复消去法只能消去其中的部分策略,不能消去的策略组合并不惟一,这时仅用严格下策反复消去法也无法对博弈作出准确的判断,因此仍然不能完全解决这些博弈问题。例例“智猪博弈智猪博弈”(Boxed Pigs)下面,我们来看博弈论中
48、的另一个著名的例子:“智猪博弈”(BoxedPigs)。假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有个单位的猪食进入猪食槽,供两头猪食用。两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。两只猪应该各采取什么策略呢?答案是:小猪将等在食槽边,而大猪则要不知疲倦地奔忙于踏板和食槽之间。下面我们给出具体的分析。如果某一头猪作出自己去按按钮的选择,它必须付出如下代价:第一,它需要付出相当于两个单位的成本;第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若小猪按按钮,大猪先到食槽,大
49、猪将吃到个单位的猪食,小猪只能吃到个单位的猪食;若大猪场按按钮,小猪先到食槽,大猪和小猪各吃到个单位的猪食;若两头猪都选择等待,两头猪同时到食槽(实际上两头猪都吃不到猪食),大猪吃到个单位的猪食,小猪吃到个单位的猪食。智猪博弈的结果可以被我们用来解释许多社会和经济现象。比如,在股份公司中,股东都承担着监督管理层工作的职能,但是,大小股东从监督中获得的收益大小不一样。在监督成本相同相同的情况下,大股东从监督管理层工作中获得的收益明显大于小股东。因此,小股东往往不会象大股东那样去监督经理人员,这是小股东的占优策略,而大股东也知道小股东会选择不监督,知道小股东要搭大股东的便车,但是大股东别无选择。大
50、股东选择监督管理层工作的责任、独自承担监督成本是大股东在小股东占优选择的前提下必须选择的最优策略。这样以来,与智猪博弈一样,从每股的净收益(每股收益减去每股分担的监督成本)来看,小股东要大于大股东。智猪博弈也能给予我们很多其他方面的启发。比如,大猪不首先按按钮,小猪会不会首先去按按钮?答案是:会。比如,长时间陷于困境的群体中总会出现一个敢于为群体的利益而献身的人,不过他的下场可能是悲壮的,如陈胜吴广起义。澡堂里的智猪博弈澡堂里的智猪博弈上个星期天我在澡堂里当了一次大猪。那时我们第一批冲进了澡堂,结果发现水管里的水还没有放尽。谁先踩踏板,谁就会溅一身的凉水;如果大家都不先踩踏板,显然就都洗不成澡