《经典博弈论概述.doc》由会员分享,可在线阅读,更多相关《经典博弈论概述.doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、经典博弈论概述1什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学,经济学与其他社会科学与行为科学。博弈论是由约翰冯诺依曼创立的,该领域第一本重要著作是诺依曼与另一个伟大的数理经济学家奥斯卡摩根斯坦所著的。博弈论是关于包含相互依存情况中理性行为的研究。所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。相互依存常使博弈中的参与者之间产生竞争。譬如两个人分蛋糕、每个参与者
2、都希望自己的那块可以分得大一些。然而,竞争仅仅是博弈论中相互依存的一个方面。应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧之处在于如何分配。从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕那么是博弈的第二步。在博弈论中还需要对一个词“理性行为作一些说明。博弈论中的所谓理性,一般不是指道德标准。从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。由于参与者
3、的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反响之上。一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个根底上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精华。博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function)。对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了鼓励机制的游戏本身也就失去了“博的意义,在社会经济领域中尤其不太可能出现这类现象。收益函数的构造与取值
4、无疑将会影响到参与者的行为,因而也影响到博弈的最终结局。由此,收益函数确实定在博弈论研究中是件非常重要的事情。从对博弈的不同角度考虑。从参与者不同的观点出发可以有形形色色的收益函数。博弈所涉及的内容:(1)参与者。以i1、2,表示。(2)每个参与者一般有假设干个策略(strategies)可供选择,它们构成了该参与者的纯策略空间。参与者i的纯策略空间用si表示,倘假设si由。i个纯策略构成,那么有si =(si1,si2si)。纯策略空间有时也可以是连续的。(3)每个参与者的盈利函数。我们记参与者i的盈利函数为ui(s),其中s(s1sr),而sj表示参与者J所取策略,s表示r个参与者的策略向
5、量。显然,盈利函数ui(s)与s有密切关系。它是每个参与者真正关心的东西。2 博弈的分类策略空间、盈利函数以及参与者的与博弈有关的特征等知识构成博弈的信息,从信息的角度,博弈可以分为完全信息与不完全信息两类,信息是博弈论中的重要内容。完全信息博弈是指参与者对所有参与者的策略空间及策略组合下的收益有完全的了解,否那么是不完全信息博弈。对于不完全信息的博弈,至少有一个参与者不能确切知道其他参与者的收益函数,在这种情况下,参与者所做的是努力使自己的期望收益或期望效用最大化 。从博弈的均衡结果来看,博弈分为合作性博弈与非合作性博弈。所谓合作性博弈是指参与者从自己的利益出发选择行动,但所选择的行动其结果
6、对双方均有利;而非合作性博弈是指参与者的行动选择对双方均不利。人们分工与交换的经济活动就是合作性的博弈,而“囚徒困境便是典型的非合作性博弈。博弈又分静态博弈与动态博弈。静态博弈是指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指双方的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。3 纳什均衡纳什均衡是博弈分析中的重要概念。1950 年,还是一名研究生的纳什撰写了一篇论文,题为?N人博弈的均衡问题?,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,即纳什均
7、衡。纳什均衡一般可以这样定义:如果断策组合处于这样的状态,即给定别人的选择,没有任何人有积极性改变自己的决策,那么这个决策组合就是纳什均衡。纳什是普林斯顿大学的教授,因为在非合作博弈理论方面的开创性奉献而获得1994 年诺贝尔经济学奖。他是一个了不起的数学天才,早在1951 年,当他还只有20 多岁的时候就提出了日后奠定非合作博弈分析根底的均衡概念,也即今天在社会科学教科书中广泛传播的“纳什均衡概念;另外,他在纯数学领域也有重要的奉献。这个问题可以换一个角度理解:假设当事人之间签订了一个合同或协议,在给定其他人遵守协议、没有外在强制力的情况下,每个人是不是有积极性遵守协议?如果所有的人都有积极
8、性遵守协议,这个协议就是一个纳什均衡。例如10 个人签订一个协议,假定另外9 个人都遵守协议时,最后1 个人是不是有积极性遵守协议?从纳什均衡的概念可以得知,在某些给定条件下,如果治理构造或者一个公司合同不是一个纳什均衡的话,那么它将不会自动得到遵守,合同或协议签了也无用。因此纳什均衡简单说就是一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。如下述“夫妻博弈(或称性别之战)中有两个纳什均衡点。丈夫与妻子商量晚上的5活动,丈夫喜欢看拳击,而妻子
9、喜欢欣赏歌剧。但两人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供应与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义也同样重大
10、。4 囚徒困境及其解析囚徒困境是纳什的导师图克Tucker构造的重要的博弈模型,它是典型的困境,可说明许多现象。在这个模型中有两个囚徒,这两个囚徒一起做坏事,结果被警察抓了起来,分别关在两个独立的不能互通信息的牢房里进展审讯。在这种情形下,两个囚犯都可以独立做出自己的选择。他们被告知:1如果他们之中有一人坦白,而另一人不坦白,那么坦白者可获得自由,而拒不坦白者要被判十年监禁。2如果两人都坦白,那么两人都被判五年监禁。3如果两人都不坦白,那么两人都被判一年监禁。囚徒困境有两个前提预设:一是甲乙二人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略。二是两人无法
11、互通信息,要在不知道对方选择结果的情况下,自己进展选择。在这种条件下,从甲立场来看,共有两种可能情况:第一种可能是乙采取坦白的策略,这时如果甲也坦白,那么要入狱五年,如果不坦白,那么要入狱十年,两相比拟,结论是应该坦白。第二种可能是乙采取沉默的态度,这时假设甲也沉默,要入狱一年,如果甲坦白,那么可获得自由,两相比拟结论是应该坦白。因此,无论乙是坦白还是沉默,甲采取坦白的策略对自己更为有利。同样以上推理对于乙也适用。结果两个囚徒都坦白了,都被判刑五年。囚徒困境的“困境在于如果甲乙二人都保持沉默,那么都只被判刑一年,显然比两人都坦白的结果要好。可是两人经过一番理性计算后,却选择了一个使自己陷入不利
12、的结局。囚徒困境是对传统经济学根底的重大挑战。因为传统经济学认为,人的经济行为的根本动机是自利,因此经济学不必担忧每一个经济行为主体参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。但是囚徒困境的结果,恰恰说明个人理性不能通过市场导致社会福利的最优。只从自己的角度出发,考虑自己利益的最大化,这种基于个人理性选择的结果往往适得其反,导致整体利益的最小化。有人可能会认为:囚徒困境只是“象牙之塔中的理论家虚构的一种“思想游戏,或是一种难得一见的特例。这实在是一种错觉。应该成认:囚徒困境最初确实是“象牙之塔中的“抽象理论思维的“产物
13、。如同其他的许多“象牙之塔中的产物一样,人们愈来愈深刻地感觉到它同“现实世界实际上是存在着密切联系的。已经发现,在经济学、政治学、社会学及现实生活中类似囚徒困境的事例是大量存在的。对于囚徒困境的原因、条件、性质、意义等问题,博弈论专家、经济学家、政治学家、社会学家、哲学家、伦理学家、社会心理学家已从许多方面进展了大量的研究。有人注意到在囚徒困境的“案例中两个参与者不能互相通信是一个限制性条件,因此他们设想这就是造成囚徒困境的“原因。例如,有人说:“囚徒的苦恼在于他们不能商量沟通。于是, 有人便提出了如下的解决问题的途径:两个参与者可以“进展通信,然后合作。反对者认为这是于事无补、不解决问题的。
14、“显然,一个囚徒要保持沉默的意图不可能引起另一个囚徒有同样的意图如果另一方无视这个意图的话。不准通信的假定对于囚徒困境来说不是关键性的。可以增加一个通信条件,但这仍然不能造成什么不同,只要假定每个人对可能结果的偏爱顺序与以前一样并且每个人可以自由地选择与另一个人的意图相反的策略。每个囚徒都可以对另一个囚徒说:如果你将保持沉默,那么我也将保持沉默;可是,只要每个囚徒可自由地说一套而做另一套,那么困境就没有什么变化。有人也许会假定可能存在着强迫性协议条款,比方说对违反协议进展特定的处分,这就会改变囚徒的偏好顺序。这样的假定会改变原有的决策问题的构造。而我们一直假定每一方只对造成他有可能获得的最有利
15、的结果有兴趣,并且他的偏好顺序是严格给定的。在这个假定之下似乎没有任何合作“协议能造成什么不同。从上述分析中可以看出,囚徒困境的“要害不是通信问题。有人可能会认为囚徒困境的“要害在于:每个参与者只关心自己的利益而对他人的利益漠不关心,为了自利的目的他甚至不惜违背“协议。这就是囚徒困境的“要害。于是,有人提出了相应的解决问题的答案:不要做一个利己主义者。在这个语境中“利己主义者的最自然的解释是指那些主要只关心个人利益的人。因此,只关心他自己将在监狱中关多长时间的囚徒是一个利己主义者。但是,很清楚,囚徒困境无须受限于这种意义上的利己主义者。可以构造出一些例子其中的每个人在其所处的选择环境中都是利他
16、主义的。我们可以想到,对于每个参与者对结果之偏好的全部要求只是存在着一定的顺序。在此顺序背后的动因可以是利己的,或是利他的,或者是兼有二者。比方说,我们可以很简便地构造出另一个例子:情景与条件与之前所举的例子皆一样,只是假定两个囚徒在进展决策选择时,决定偏好顺序的标准不是完全唯一的利己标准,而是完全唯一的利他标准,那么甲出于利他的标准会选择自己坦白,而乙也是如此,结果并没有任何变化。所谓的囚徒困境在这个“利他主义者的“情景中依然是一个“困境。所以,囚徒困境的前提条件是偏好的发散而不是自私自利或对他人的漠不关心。在囚徒困境中,两个囚徒都选择了坦白认罪策略。“这个结果与他们是否真的有罪无关,他们即
17、使无罪,也会做出成认有罪的选择。但是人们也发现:囚徒困境的“社会效果也并不总是负面效果,在特定条件下,它也可能造成某种对社会有益的效果。在经济学中最常提到的事例是卡特尔欺骗与寡头垄断的定价问题。设想有两个寡头垄断厂家,假设遵守协议的垄断价格,那么两个寡头皆可获得高额利润。假设一方违反协议降价促销,那么可获得更高额的利润,对方因产品滞销,只能获得很少的利润。两个寡头都按这个“思路考虑定价策略,结果是大家都不遵守协议,都降低销价,结果都不能获得高额利润,而只能得较少的利润。容易看出,在这种情况与条件下的卖方垄断寡头陷入囚徒困境是有利于消费者、有益于社会的。所以许多国家都在法律上不允许卖方垄断寡头订立垄断价格协议。第 10 页