《身边的博弈论博弈论与信息经济学浅说第一稿未定稿bkca.docx》由会员分享,可在线阅读,更多相关《身边的博弈论博弈论与信息经济学浅说第一稿未定稿bkca.docx(161页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、4身边的博弈弈论:博弈论论与信息经济济学浅说第第一稿(未定定稿,为北京京师范大学出出版社某丛书书所作)余治国 编著(中中国民营企业业批判当代代中国出版社社,转型力力:中国企业业转型之道清清华大学出版版社,目前正正在创作企企业与企业家家道德国家家行政学院出出版社)目录序 言 大博博弈的思维观观2第一章 什么是是博弈论:从从秦始皇统一一天下谈起31秦始皇因何何统一天下?32博弈是一种种竞合游戏53博弈论不是是“万金油”7第二章 纳什均均衡、纯策略略与混和策略略81从围棋定式式谈纳什均衡衡82从爱情故事事谈起:优势势策略与房地地产开发博弈弈103房地产博弈弈、警察捉小小偷博弈与纳纳什均衡114位置博
2、弈与与商家策略125猎鹿模型的的合作哲学13第三章 “囚徒徒困境”的启示141“囚徒困境境”的深刻哲理理142经济自由与与效率163“囚徒困境境”的破解:无无限次重复博博弈与有限次次重复博弈174威胁、承诺诺、作弊与惩惩罚195国家法律206猴子的故事事与道德约束束217爱克斯罗德德试验、针锋锋相对的策略略228.合作、利他他主义与爱克克斯罗德试验验的局限23第四章 “智猪猪博弈”:对诸多现现象的解释251“智猪博弈弈”的故事252“智猪博弈”与激励机制制设计263企业战略与与“智猪博弈”274证券市场中中的“智猪博弈”28第五章 常见的的博弈案例291“斗鸡博弈弈”与“骑虎难下”292银行会
3、垮掉掉吗?313如何以弱胜胜强?324公共地悲剧剧345少数人博弈弈与酒吧问题题356房地产市场场的多人博弈弈36第六章 信息经经济学基础371.信息有价372. 从形象工工程谈道德风风险393逆向选择的的困境:二手手车市场为何何建立不起来来?414.声誉、信号号传递与制度度设计425所罗门故事事与信息甄别别44第七章 讨价还还价的策略461从情侣博弈弈谈起462先发优势与与后发优势473谈判的要诀诀:掌握对方心心理与妥协484独裁者博弈弈与劳资谈判判49第八章 如何做做好一个老板板501管理需要建建立预期502奖罚分明513强强如何有有效联合?534如何接到一一个项目?54第九章 民主的的悲
4、剧551.社会选择的的形式552.非排序式投投票563孔多塞投票票法则584BORDAA法则及其他他605投票操纵的的方法:民主主的悖论606阿罗不可能能定理62参考文献:664序 言 大博博弈的思维观观对于许多非数学学专业和经济济学专业的人人们来说,博博弈论可能是是一个极为陌陌生的概念。但但在国外,博博弈论作为现现代经济学的的前沿领域,已已成为占据主主流的基本分分析工具。11994年诺诺贝尔经济学学奖即授予三三位博弈论专专家,19996年诺贝尔尔经济学奖又又授予两位与与博弈论一脉脉相承的信息息经济学的开开拓者。经济学的三次重重大的“革命”,分别是“边际分析革革命”、“凯恩斯革命命”与“博弈论
5、革命命”。博弈论与与信息经济学学的产生与发发展引发了一一场深刻的经经济学革命,博博弈论与信息息经济学代表表着一种新概概念、新方法法论、新分析析方法和一种种全新的思想想。经济学家凯恩斯斯1936年在在就业利息息与货币通论论写过这样样一段深刻的的话,“经济学家和和政治哲学家家的思想,不不管是正确的的还是错误的的,其力量之之大,往往超超出常人意料料。事实上,统统治这个世界界的就只是这这些思想。许许多实践家自自以为绝不受受任何知识的的影响,却往往往当上了一一些已故经济济学家的奴隶隶。执政的狂狂人,自称听听到了上帝的的指示,实际际上却是从若若干年前一些些学术界劣等等思想家那儿儿拾取了一些些怪诞的想法法.
6、比起思想想的逐渐侵蚀蚀力来,既得得利益的势力力被过分夸大大了。”由此可见,博弈弈论的思想比比任何技术性性的分析都要要重要。实际上,博弈之之道是古已有有之,但博弈弈思想的系统统化、数学化化却是近几十十年的事。正正是因为博弈弈科学是一门门新学科,我我国管理界、经经济界对博弈弈论与信息经经济学的研究究还是停留在在引进介绍层层面上,他们们发表的成果果大多堆砌庞庞杂的数学算算法与令人眩眩目的数学模模型。虽然博博弈论与信息息经济学在中中国已是一门门显学,但却却逐渐变成阳阳春白雪、弃弃之不用的高高深学问或是是概念混乱而而被滥用到极极至。博弈论与信息经经济学不仅仅仅能在学术领领域中光彩夺夺目,在其它它领域如军
7、事事、管理、体体育、政治、公公关、个人生生活中同样能能得到充分利利用,甚至在在生物学中都都可以觅其踪踪迹。在普通通的企业管理理中,经营者者要熟练地掌掌握管理之术术,必须能够够自动自发并并自觉地运用用博弈论与信信息经济学。在在日常生活中中,人们可以以博弈论与信信息经济学得得思想方法赖赖分析甚而解解决实际问题题。正是因为为如此,诺贝贝尔经济学奖奖获得者保罗罗萨缪尔逊(PPaul SSamuellson)说说:“要想在现代代社会做一个个有文化的人人,你必须对对博弈论有一一个大致了解解。”笔者试图在这本本小册子中用用最浅显的语语言描述博弈弈论与信息经经济学的大概概思路方法,能能用语言可以以描述的就尽尽
8、量少用或不不用数学,因因此笔者未对对博弈论与信信息经济学作作数学化、系系统的证明与与阐述。但是是,只有这样样才能够使似似乎高深的博博弈论与信息息经济学思想想很轻松地为为普通读者所所掌握,并能能够让读者应应用其思想方方法来分析甚甚至是能够解解决身边的实实际问题。笔者这里还要解解释一下书名名的由来,“身边的博弈弈论”并不是说读读者身边看到到感受到的博博弈论,这样样理解未免过过于狭窄。这这里“身边的博弈弈论”的含义是,人人们身边无处处不在的博弈弈哲学,无论论是直接感受受到还是从未未接触过的社社会、政治、法法律、军事、经经济、管理等等现象。由于笔者本人学学识有限,对对博弈论与信信息经济学的的理解与研究
9、究尚不深刻,错错误在所难免免,敬请博弈弈论与信息经经济学的方家家高人指点,以以免贻误广大大读者。 余治国国2005年年9月谨识于于安徽工业大大学第一章 什么是是博弈论:从从秦始皇统一一天下谈起1秦始皇因何何统一天下?2000多年前前,雄才大略略的秦始皇第第一次统一了了中国大地,并创建了当当时世界上最最庞大的帝国国,得以名垂垂青史。从当当时的历史条条件来看,秦秦国虽然在商商鞅变法之后后实力大增,但但其经济、政政治、军事实实力是远远不不能与六国总总和相匹敌的的。这种情况况下,六国与与秦国的形势势就产生了两两种针锋相对对的可能:其其一,六国采采用“合纵”政策对抗秦秦国,也就是是各国缔结军军事盟约,共
10、共同抵御秦国国的侵略,秦秦国若对任一一国家发动侵侵略,其它国国家必须无条条件出兵营救救;其二,六六国采用“连横”政策与秦国国妥协,也就就是各国都与与秦国签订友友好互助条约约,保持双边边和平关系。当时七国之中,只只有齐国实力力比秦国稍逊逊一筹,成为为六国军事同同盟的核心。一一旦齐国放弃弃“合纵”政策,六国国的军事同盟盟就土崩瓦解解。真实的历历史也证明了了这一点,秦秦国对六国联联盟的破坏正正是从齐国开开始的。在这种情况下,秦秦国与齐国都都有两种战略略政策可以选选择,那就是是“合纵”与“连横”。秦国如果果默许六国“合纵”,齐国采用用“合纵”政策,结果果是秦国势力力扩张被遏制制,而齐国成成为六国领袖袖
11、,势力得以以扩张。秦国国采取“连横”政策,齐国国仍然采取“合纵”政策,结果果是秦国与六六国处于对峙峙状态。秦国国默许六国“合纵”,齐国却采采用“连横”政策与秦国国示好,结果果是秦国没有有吞并六国的的野心自然无无法一统天下下,齐国的势势力也没有得得以扩张。而而历史的真相相是,秦国采采取“连横”政策,齐国国默许秦国的的“连横”政策并与秦秦国建立友好好外交关系,齐齐国最终被灭灭,千古一帝帝秦始皇得以以名扬千秋。秦国与六国集团团之间的争斗斗实质上就是是一种博弈。秦秦国与齐国之之间的战略政政策选择正是是为了在保持持自身能够生生存的基础上上谋取更大的的利益甚至是是统一天下。有利益的争夺是博弈的目的,也是形
12、成博弈的基础。经济学的最基本的公设就是经济人或理性人的目的就是为了收益最大化,参与博弈的博弈者正是为了自身收益的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得利益的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具有稀缺性或是有限的,这时就会发生竞争,竞争需要有一个具体形式把大家拉在一起,一旦找到了这种形式就形成了博弈,
13、竞争各方之间就会走到一起开始一场博弈。孙子兵法上说,“知己知彼,百战百胜。”,可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,秦国与齐国都明白对方的策略,从博弈理论来说,更拗口的说法是秦国知道齐国知道自己的策略,反之齐国亦然,这种句法我们可以一直这么用下去,一直用到打“”,而这正是博弈双方所掌握的信息。因此我们可以了了解到,形成成一个博弈有有4个要素:1博弈要有22个或2个以以上的参与者者(Playyer)。在在博弈中存在一个必必须的因素,那那就是不是一个人在在一个毫无干干扰的真空作作决策。比如,前例例中只有秦国国,而没有与与之对抗的六六国,就不存存在“合纵连横”的博弈。从从经济学的
14、角角度来看,如如果是一个人人做决策而不不受到他人干干扰的话,那那就是一个传传统经济学或或管理学中最最经常研究的的最优化问题题,也就是一一个人或一个个企业在一个个既定的局面面或情况下如如何决策的问问题。最简单单一个最优化化的例子就是是,吸烟伤肺肺,不吸烟却却又伤心,烟烟民是选择抽抽烟还是不抽抽烟,这就需需要进行权衡衡(Traddeoff)。如如果这个烟民民非单身贵族族,而是有妻妻子或女友,这这种情况下就就很有可能形形成一个博弈弈。这也就是是,博弈者的的身边充斥着着具有主观能能动性的决策策者,他们的的选择与其它它博弈者的选选择相互作用用、相互影响响。这种互动动关系自然会会对博弈各方方的思维和行行动
15、产生重要要的影响,有有时甚至直接接影响着其他他参与者的决决策结果。在冯诺依曼(VVon Neeumannn)的博弈论论奠基之作博博弈论与经济济行为一书书中举过这样样一个经典的的例子。在鲁鲁滨逊漂流记记中,与世世隔绝的“鲁滨逊”(Robiinson Crusooe)一个人人组成一个独独立的经济系系统,有中学学数学水平的的人都能够清清楚,这只是是一个普通的的求解最大值值的问题。因因为鲁滨逊面面对的是一些些死的数据,而而不是有主观观意愿的人。一一旦“星期五”(鲁滨逊逊漂流记中中鲁滨逊的黑黑人仆人)加加入这个系统统,这个经济济系统就形成成了一个博弈弈问题。2)博弈要有参参与各方争夺夺的资源或收收益(R
16、essourcees或Payyoff)。资资源指的不仅仅仅是自然资资源,如矿山山、石油、土土地、水资源源等,还包括括了各种社会会资源,如人人脉、信誉、学学历、职位等等。如果这些些资源是无限限供给的,那那么我们也不不需要为共产产主义而奋斗斗了,因为一一步就可以迈迈入“货恶其弃于于地也,不必必藏于已,力力恶其不出于于身也,不必必为已。”、“大道之行也也,天下为公公。”的大同社会会。当然,不可可否认是,一一方面,博弈弈者之间会发发生冲突;另一方面,他他们当中也包含着合作作的潜力。笔者在这里还要要强调一点是是,资源是有有主观性的。人们之所以会参与博弈是受到利益的吸引,预期将来所获得利益的大小直接影响到
17、竞争博弈的吸引力和参与者的关注程度。经济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如,“孩子总是自己的好,妻子总是别人好”:自己的孩子在眼里是无价之宝,而在别人面前相对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正是效用递减规律起了作用。最极端的例子大概就是明代小说镜花缘中所描绘的君子国,人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。3)参与者有自自己能够选择择的策略(SStrateegy)。所所谓策略,就就是“计利以听,乃乃为之势,以以佐其外。势势者,因利而而制权也。”,这指的是是直接实用的的针对某一个个具体问题
18、所所采取的应对对方式。通俗俗的说策略就就是计策,是是博弈参与者者所能够选择择的手段方法法。比如秦国国就采用了“连横”的策略将六六国“合纵”瓦解。一般日常生活中中,策略选择择仅是解决问问题的方法,并并不牵涉到分分析关键因素素、确定局势势特征这些理理论化的内容容。而博弈论论种的策略选选择,是先对对局势和整体体状况进行分分析,确定局局势特征,找找出其中关键键因素,然后后在最重要的的目标上进行行策略选择。由由此可见,博博弈论种的策策略是可以牵牵一发而动全全身的,这直直接对整个局局势造成重大大影响。4)参与者拥有有一定量的信信息(Infformattion)。比比如在“合纵连横”的故事中,秦秦国与六国之
19、之间所拥有的的信息就是完完全的。但有有些时候,信信息并不是完完全的,俗话话说“天有不测风风云”,比如今天天是阴云密布布、狂风大作作,气象台预预报明天是“阴转小雨”,明天出门门上班到底要要不要带伞呢呢?这种情况况的信息是不不完全的,人人们决策的信信息条件是不不确定。当然然从情理上说说,在实际生生活中一般是是要带伞以防防不测。通俗的说,博弈弈就是个人或或组织在一定定的环境条件件与既定的规规则下,同时时或先后,仅仅仅一次或是是进行多次地地选择策略并并实施,从而而得到某种结结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾和冲突。所谓博弈
20、论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就是研究,人们如何进行决策、以及这种决策的如何达到均衡问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。2博弈是一种种竞合游戏“博弈论”的英英文是“Game Theorry”,实际上GGme的本意意是游戏,博博弈论直接翻翻译成中文最最贴切的直译译是“游戏理论”。更准确点说说,是一种竞竞合的智力游游戏。所谓竞合,就是是竞争合作的的简写,一个个博弈,并不不仅仅是竞争争,实际上竞竞争种包含着着潜在
21、合作的的种子,合作作中包含着潜潜在竞争的种种子。合作博博弈并不是指指合作各方具具有合作的意意向或态度,而而是指在博弈弈中有一些对对博弈各方有有约束力的协协议或契约,或或者说是博弈弈各方不能公公然“串通”或“共谋”。合作博弈弈最典型的例例子就是石油油输出国组织织欧佩克(OOrganiizatioon of Petrooleum Exporrting Counttries,简简称Opecc),其19960年9月月,由伊朗、伊伊拉克、科威威特、沙特阿阿拉伯和委内内瑞拉的代表表在巴格达开开会,决定联联合起来共同同对付西方石石油公司,维维护石油收入入。随着成员员的增加,欧欧佩克发展成成为亚洲、非非洲和拉
22、丁美美洲一些主要要石油生产国国的国际性石石油组织。欧欧佩克协调和和统一各成员员国的石油政政策,并以石石油生产配额额制的手段来来维护它们各各自和共同的的利益,把国国际石油价格格稳定在公平平合理的水平平上。比如有有些时候为防防止石油价格格飚升,欧佩佩克可依据市市场形势增加加其石油产量量;为阻止石石油价格下滑滑,欧佩克则则可依据市场场形势减少其其石油产量。智力游戏与博弈弈相近似的本本质是,在确确定游戏规则则的约束下,游游戏参与者决决策、行动的的过程。各种种智力游戏实实际上就是一一个实际社会会、经济、管管理、军事、政政治等现象抽抽象出来的缩缩微模拟的模模型。在这个个意义上不妨妨说,博弈论论就是研究怎么
23、玩好游戏的理论。游戏是一种抽象象。面对复杂杂现象时,人们们经常会“见树木不见森林”,无法抓住住某种现象的的关键所在。而而在游戏中,可可以通过抽象象出现实生活中中的要点,并并将干扰因素素减至最低,从而轻松地分析问题并找到合理可行的解决方法。中国最古老的围围棋最初的功功能形态就是是模拟战争。围围棋包含最多多的是军事内内涵,如围而而歼之,生死死存亡为先,争争地夺利为上上。围棋以获获得最大的利利益为胜,抽抽象出战争的的本质和目的的,非常符合合战争规律。围棋游戏的规则则极其简单,不不过是两气生生,一气死,附附加帖目、打打劫等辅助规规则,最终以以所占地盘大大小定胜负。但但其作为一项项智力游戏,与与战争在很
24、多多方面都相通通。围棋棋手手在小小棋盘盘上较量,就就是战争、战战场、战斗在在棋盘上的演演绎。战争理念和战争争指导思想是是“基于毁伤”,以破坏、消消耗、摧毁敌敌方为上。现现代西方国家家提出“基于效果”的作战思想想,美国人将将这一战争理理念上的革命命称为新的战战争哲学。基基于效果就是是,着眼于敌敌方整个作战战系统的控制制,使之丧失失作战能力。美美军在伊拉克克发动“斩首行动”的前一天,还还专门召开了了推出基于效效果作战理念念的新闻发布布会,接着就就发动了进攻攻。围棋模拟出“基基于效果”的战争理念念,强调从全全局上控制,而而不是基于蝇蝇头小利。即即所有的作战战方法都必须须是有效的,着着子要看在全全局中
25、是否有有用、有效,而不再是基基于棋理、棋棋道、棋风等等虚幻的在形形式。基于效效果的思想就就是赢棋第一一,实事求是是。比如韩国国棋手李昌镐镐就是基于效效果的典范。现在很多世界级级公司都已经经明白智力游游戏的作用。比比如著名的微微软公司在招招聘员工时出出过非常“儿童化”的招聘考题题,题目是这这样的:“某合唱团的的4名成员AA、B、C、DD往演出现场场,他们途中中要经过一座座小桥。当他他们赶到桥头头时,天已经经黑了,周围围没有灯。他他们只有一只只手电筒。现现在规定:一一次最多只许许两人一起过过桥,过桥人人手里必须有有手电筒,而而且手电筒不不能用扔的方方式传递。44个人的步行行速度都不同同,若两人同同
26、行,则以较较慢者的速度度为准。A需需花1分钟过过桥,B过桥桥需花2分钟钟,C需花55分钟过桥,DD需花10分分钟过桥。请请问:他们能能在17分钟钟内过桥吗?” 这可不是是微软公司的的别出心裁,据据说世界上许许多跻身世界界500强的的公司在招收收新员工时,都都要出类似的的智力题。 智力游戏可以锻锻炼人的思维维能力,培养养人的思维方方法。良好的的思维方法能能使我们从错错综复杂的现现象中找到事事物的本质,从从纷繁的因素素中找到事物物变化的主要要原因,使事事物呈现出条条理性。思维维方法是抽象象的,它不像像1122那么简单,只只有通过自己己的想像,亲亲自动手操作作,经历失败败,才能逐步步形成。思维维科学
27、化程度度越高的人,工工作中发现问问题、解决问问题的能力就就越强。这一一点已成为人人们的共识。在许多智力游戏戏中,都存在在这么一个共共同的特点,就就是参与者所所选择的策略略对于胜负有有着举足轻重重的影响。一一个游戏一点点规则制订好好之后,策略略选择的好坏坏就成了游戏戏参加者所能能自由运用的的左右游戏结结果的最关键键因素。特别别是在围棋、象象棋之类参与与者的初始条条件完全相同同的游戏中,策策略选择就成成了游戏结果果的唯一决定定因素。至于从围棋初段段段到九段之之间的差别,从从博弈论的角角度去看,就就是他们之间间策略选择的的技巧高低不不同而已。博博弈论的策略略思维是一种技巧。策策略思维从一一些基本技巧
28、巧出发,考虑虑的是怎样将将这些基本技技巧最大限度度地发挥出来来。任何游戏都有自自己的规则(Rule of thhe gamme)。实际现实自然然也是如此,这这就是法律、道道德和各种成成文或不成文文的规章制度度和惯例等。当当然,这些规规则也不是一一成不变的,它它会随着情况况的改变和人人们的要求不不断修正,但是只只要规则存在在,这个规则则就是确定了了人们行为的的前提条件。因此博弈与与游戏都有一一个重要的共共同特征,那那就是这些规规则规定游戏戏参加者可以以做什么,不不可以作什么么,按照什么么次序去做,什什么时候结束束游戏,一旦旦参与者犯规规将受到怎样样的处罚等。游戏者的策略有有相互依存的的关系。每一
29、一个游戏者从从游戏所得结结果的好坏不不仅取决于自自身的策略选选择,同时也也取决于其它它参加者的策策略选择。有有时甚至一个个坏的策略会会给选它的一一方带来并不不坏的结果,原原因是其它方方选择了更坏坏的利他而不不利己的策略略。这一点也也是游戏与博博弈重要的相相似之处。3博弈论不是是“万金油”博弈论并不是“万金油”,正如诺贝尔尔经济学奖得得主莱因哈德德泽尔滕教教授所说,“博弈弈论并不是疗疗法,也不是是处方,它不不能帮我们在在赌博中获胜胜,不能帮我我们通过投机机来致富,也也不能帮我们们在下棋或打打牌中赢对手手。它不告诉诉你该付多少少钱买东西,这这是计算机或或者字典的任任务。” 要求博弈论论能够完全刻刻
30、画真实的世世界,那么这命中注定会会徒劳无功。根据著名的哥德尔不完备定理,任何一个理论体系必定是不完全的,任何理论包含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能只有其本身,但是正如罗宾逊夫人的妙语“比例尺是一比一的地图是没用的”。博弈论也是这样样,博弈论力力图用最简单单的假设下得得到最大范围围的推理应用用。博弈论的的这种方法与与很多应用广广泛学科都是是相似的。如如欧几里德几几何的基本假假设是两点之之间直线,推推演出庞大而而严密的几何何体系,可以以说,在生活活中或工程应应用中,欧几几里德几何学学的思想方法法是无处不在在、无时不有有。其基本公公设之一就是是,人是理性性的(ratt
31、ionall)。所谓理理性的人是指指行动者具有有推理能力,在在具体策略选选择时的目的的是使自己的的利益最大化化。而现实生生活中,人们们再做决策时时往往是有限限理性。所谓有限理性,也也就是说人不不是机器,人人的理性是有有限度的。比比方说,某人人要签署一份份合同,有三三种方法可供供选择:一种种是计划好,安安排好一切,然然后不动脑筋筋按部就班地地照计划进行行;另一种是是做进度安排排的时候都留留一点余地,可可供签订合同同双方私下协协商解决:最最后一种是完完全没有安排排,凭着当时时的感情与直直觉任意为之之,这种方法法当然不可能能是理性的。后两种一眼就可可看出完全不不满足博弈论论意义上的理理性,即使是是第
32、一种方法法也不是真正正意义上的经经济理性。这这是因为人们们很难对每个个措施将要产产生的结果具具有完全的了了解和正确的的预测,常常常要在缺乏完完全了解的情情况下,一定定程度地根据据主观意识进进行决策,个个人或企业的的决策都是在在有限理性的的条件下进行行的。完全理理性,意味着着对每个抉择择的确切后果果都有完完全全全的了解。事事实上,一个个人对自己的的行动条件的的了解,从来来都只能是零零碎的;至于于使他得以从从对当前状况况的了解去推推想未来后果果的那些规律律和法则,他他也是所知甚甚微的。人类的精力和时时间永远是有有限的,人不不可能具备完完全理性,不不可能掌握所所有知识和信信息。人类也也不可能搜寻寻到
33、所需的全全部的信息。另另一方面也要要意识到信息息的搜寻需要要成本,而不不是毫不费成成本的,因为为人类必须为为此付出大量量的时间、精精力和财力等等等。意图搜搜寻到所有信信息,企图做做出收益最优优的决策行为为有时反而是是最不理性的的行为。但当我们退退而求其次时时,博弈论可以以得到对现实实的客观世界界描述的近似似。所以博弈论仍然是我们目目前所能得到到的最好但非非唯一的工具具。就像并不不完美的力学学是自然科学学的哲学和数数学一样,博博弈论是社会会科学的力学学和数学。没没有牛顿力学学我们连最简简单的物理现现象都无法理理解,马用了了多大的力拉拉动一车货物物?上帝说“让牛顿来做做吧”,于是我们们知道了马用用
34、的力相当于于克服摩擦力力。同样的道道理,没有博博弈论我们也也无法解释分分析很多现实实的社会现象象。著名的博弈论大大师鲁宾斯坦坦(Rubinnsteinn)说过,“一个博弈模模型是我们关关于现实的观观念的近似,而而不是现实的的客观描述的的近似”。看来“理论之树是是灰色的,生生命之树常青青!”这句话,我我们应该谨记记于心。第二章 纳什均均衡、纯策略略与混和策略略1从围棋定式式谈纳什均衡衡我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物的行为。由于世上人间的事物很少不依赖于其他事物而存在。非合作博弈强调利益的冲突,即非合作甚至对抗状态。比如,“零和博弈”就是典型的非合作博
35、弈,它是指博弈各方的所得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度来看,围棋1919的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上的严格的零和博弈。世事如棋局,而而棋局是可以以用博弈思维加以以概括的。比比如过分的“骗着”,“本手”与“缓着”之间,一般般都会选择本本手,着法过过分如不遇反反击,可能占占到便宜,如如遇反击则可可能亏损,因因此如果棋力力相当,则应应考虑到对手手的反击手段段。对手也同同样考虑到在在追求利益中中不可能占尽尽便宜。这就就导致双方都都能接受的方方案。围棋定式从策略略层面看,如如一方的策略略是抢占实地
36、,另另一方是获得得外势,而结结果相当,互互有所得,双双方就愿意那那样下。抢占占实地考虑现现实利益,获获得外势考虑虑将来发展,这这便形成一个个双方的“均衡”;另一方面面,可以从具具体行棋效果果来看,如果果一步棋能考考虑到对手各各种应手而依依然成立,对对手也运用同同样法则找到到应对,则可可以说双方达达成了“均衡”。在经济学中,均均衡(equuilibrrium)意意即相关量处处于稳定值。比比如在经典的的供需分析中中,若某一商商品的市场价价格使得欲购购买该商品的的人均能买到到,同时想卖卖的人均能将将商品卖出去去,此时该商商品的供求达达到了均衡。这这个市场价格格可称之为均均衡价格,产产量可称之为为均衡
37、产量。均均衡分析是经经典经济学中中的重要方法法。在讲解纳什均衡衡之前,我们们再来看这样样一个例子。一一般对博弈论论稍微有些了了解的人,都都会知道“囚徒困境”这个名词。这这个例子就是是在“囚徒困境”的基础上所所作的修改。A和B是两个因因盗窃而被抓抓的惯犯。警警察局局长CC正在调查该该局管辖区域域内的一宗悬悬而未决的银银行抢劫案,并并且他根据一一系列的线索索判定A和BB是这桩案子子的凶犯。因因为该局管辖辖地区治安一一向混乱不堪堪,C的上级级对C非常恼恼火,直接威威胁C如果银银行案破不了了,就要撤销销C局长的职职位,给予降降级惩罚。CC在上级的压压力下不得不不耗费大量时时间、精力提提审A和B。为为了
38、能够让两两个囚犯认罪罪,C想让AA和B明白,假假如只有他们们其中的一人人坦白认罪则则这个人可能能受到的最严严厉的惩罚是是什么,但向向他们遵守承承诺,若两个个人都坦白,则则会从轻发落落。于是,这个警察察局长C分别别与A、B立立下许诺:如如果只有一个个人坦白认罪罪,则认罪的的一方会收到到所有指控,会会因银行抢劫劫而判无期徒徒刑,另一个个人则不会再再加刑罚。如如果无人认罪罪,两个人都都会因盗窃罪罪而判刑2年年。如果两个个人都坦白,则则两个人都被被判处有期徒徒刑5年。这样,警察局长长C给A和BB构造了一个个博弈。不妨妨假设,A和和B都是极其其精明的会打打小算盘的自自私自利不讲讲“江湖义气”的人,同时时
39、A和B被分分别审查不能能够进行沟通通。在这种情情况下,A会会在脑子里打打小算盘,他他会想:如果果选择坦白,那那么B选择坦坦白时将判刑刑5年,B选选择不坦白时时将判刑200年,因此选选择坦白时最最坏的打算就就把牢底坐穿穿;若是选择择不坦白,那那么B选择坦坦白时将无罪罪释放获得自自由,B选择择不坦白时将将判有期徒刑刑5年,因此此选择不坦白白时最坏的可可能就是被囚囚禁5年。两两害相权,取取其轻。因此此在这种情况况下,A必然然会选择不坦坦白,同样的的道理,B也也会选择不坦坦白。这个时时候,博弈达达到了这样一一种局面,这这种局面就是是纳什均衡(NNash EEquiliibriumm)。纳什均衡的思想想
40、其实并不复复杂,在博弈弈达到纳什均均衡时,局中中的每一个博博弈者都不可可能因为单方方面改变自己己的策略而增增加获益,于于是各方为了了自己利益的的最大化而选选择了某中最最优策略,并并与其他对手手达成了某种种暂时的平衡衡。这种平衡衡在外界环境境没有变化的的情况下,倘倘若有关各方方坚持原有的的利益最大化化原则并理性性面对现实,那那么这种平衡衡状况就能够够长期保持稳稳定。再简单一点说,一一策略组合中中,所有的参参与者面临这这样的一种情情况:当其他他人不改变策策略时,他此此时的策略是是最好的。也也就是说,此此时如果他改改变策略,他他的收益将会降低低。在纳什均均衡点上,每每一个理性的的参与者都不不会有单独
41、改改变策略的冲冲动。由此可见,纳什什均衡是一稳稳定的博弈结结果。打一个个比方,如果果把一个乒乓乓球,放到一一个光滑的铁铁锅里,不论论其初始位置置在何处,最最终乒乓球都都会稳定地停停留在锅底,这这时的锅底就就可称为是一一个纳什均衡衡点。相反,如如果锅是扣在在地上的,那那么锅底部位位是很难放稳稳一个乒乓球球的,因为往往任何方向的的一点点移动动,都会使球球彻底离开锅锅底。这时的的锅底部位就就不是一个纳纳什均衡点了了。博弈的结果并不不都能成为均均衡。博弈的的均衡是稳定定的,则必然然可以预测。纳纳什均衡的另另一层含义是是:在对方策策略确定的情情况下,每个个参与者的策策略是最好的的,此时没有有人愿意先改改
42、变或主动改改变自己的策策略。在上面面的“囚徒困境”变形的博弈弈中,A和BB都不坦白就就是一个纳什什均衡,这对对双方来说都都是最优选择择。同时在这这个博弈中,其其均衡对双方方来说是全局局最优的。当当然博弈达到纳什什均衡,并不不一定是对参参与者最有利利的结果,更更不意味着是是对整个社会会作为一个整整体而言最有有利的结果,比比如“囚徒困境”的例子导致致了整体的不不利。围棋与这个博弈弈的例子是有有所不同的。上上面的这个例例子是A和BB双方没有信信息交换下的的博弈,这就就是博弈论中中的静态博弈弈概念。围棋棋则是对弈双双方相继按照一先先一后次序行行动的博弈。对对于一人一步步的相继行动动的博弈,每每个参与者
43、都都必须向前展展望或预期,估计计对手的意图图,从而倒后后推理,决定定自己这一步步应该怎么走走。这是一条条线性的推理理链:“假如我这么么做,他就会会那么做若是那样,我我会这么反击击”,后面的步骤骤依此类推。也也就是说,你你怎么走棋,完全取决决于对手的上上一招。这在博弈论论上叫做“倒推法”。在动态博博弈中,存在在明显的马太太效应,也就就是说凡是少少的,连他仅仅有的也夺过过来;凡是多多的,就加给给他,让他更更多。比如在在围棋上,就就有“一招不慎,满满盘皆输”的谚语,当当然我们也要要应用动态博博弈的马太效效应原理,在在获得优势的的情况能够保保持优势扩大大优势,直至至最后成功。而在同时行动的的静态博弈里
44、,没没有一个博弈弈者可以在自自己行动之前前得知另一个个博弈者的整个个计划。在这这种情况下,互互动推理不是是通过观察对对方的策略进进行,而是必必须通过看穿穿对手的策略略才能展开。要要想做到这一一点,单单假假设自己处于于对手的位置置会怎么做还还不够。即便便你那样做了了,你只会发发现,你的对对手也在做同同样的事情,即即他也在假设设自己处于你你的位置会怎怎么做。因此此,每一个人人不得不同时时担任两个角角色,一个是是自己,一个个是对手,从从而找出双方方的最佳行动动方式。与一一条线性的推推理链不同,这这是一个循环环,即“假如我认为为对方认为我认认为”。这样来看,定式式是一系列纳纳什均衡的累累计直至局部部达
45、到稳定的的一种变化,直直到一方认为为可以根据形形势选择任何何变化或脱先先而无局部受受损之虞。由由于定式是在在大量实战基基础上不断被被验证并长期期积累而成。因此在动态博弈弈中,纳什均均衡的要义在在于:即使在在对抗条件下下,双方可以以通过向对方方提出威胁和和要求,找到到双方能够接接受的解决方方案而不至于于因为各自追追求自我利益益而无法达到到妥协,甚至至两败俱伤。稳稳定的均衡点点建立在找到到各自的“占优策略”(domiinantstrattegy),即即无论对方作作何选择,这这一策略优于于其他策略。2从爱情故事事谈起:优势势策略与房地地产开发博弈弈 “原地高高天,堪叹古古今情难尽;痴男怨女,可可怜风
46、月债难难偿。”我们来先看看欧亨利的小说说麦吉的礼礼物描述的的这样一个爱爱情故事。新新婚不久的MMM和GG,很很是穷困潦倒倒。除了MMM那一头美丽丽的金色长发发,GG那一一只祖传的金金怀表,便再再也没有什么么东西可以让让他们引以为为傲了。虽然然生活很累很很苦,他们却却彼此相爱至至深。每个人人关心对方都都胜过关心自自己。为了促促进对方的利利益,他们愿愿意奉献和牺牺牲自己的一一切。话说明天就是圣圣诞节了,小小两口都是身身无余钱。为为了让爱人过过得好一点,每每个人还是想想悄悄儿准备备一份礼物给给对方。GGG卖掉了心爱爱的怀表,买买了一套漂亮亮发卡,去配配MM那一头头金色长发。MMM剪掉心爱爱的长发,拿
47、拿去卖钱,为为GG的怀表表买了表链和和表袋。最后,到了交换换礼物的时刻刻,他们无可可奈何地发现现,自己如此此珍视的东西西,对方已作作为礼物的代代价而出卖了了。花了惨痛痛代价换回的的东西,竟成成了无用之物物。出于无私私爱心的利他他主义行为,结结果却使得双双方的利益同同时受损。欧亨利在小说说中写道:“聪明的人,送送礼自然也很很聪明。大约约都是用自己己有余的物事事,来交换送送礼的好处。然然而,我讲的的这个平平淡淡淡的故事里里,两个住公公寓的傻孩子子,却是笨到到极点,彼此此为了对方,白白白牺牲了他他们屋檐下最最珍贵的财富富。”从这段文字字看,欧亨利利似乎并不认认为这小两口口是理性的。且且让我们暂时时抛
48、开爱情的的温馨,单从从利益的角度度来解读。我我们假定,他他们每个人,有有一个“毫不利己专专门利人”的偏好系统统,毫不考虑虑自身利益,专专门谋求别人人的幸福。这这样,个人选选择付出还是是不付出,只只看对方能不不能得益,与与自己是否受受损无关。以以这样的偏好好来衡量,最最好的结果自自然是自己付付出而对方不不付出,对方方收益增大;次好的结果果是大家都不不付出,对方方不得益也不不牺牲;再次次的结果是大大家都付出;最坏的结果果是别人付出出而自己不付付出,靠牺牲牲别人来使自自己得益。我我们不妨可用用数字来代表表个人对这四四种结果的评评价:第一种种结果给3分分,第二种结结果给1分,第第三种结果给给1分,最后后那种给0分分。不难看出,无论论对方选择付付出,还是选选择不付出,个个人自己的最最佳选择都是是付出。然而而这并不是对对大家都有利利的选择。事事实上,大家家都选择不付付出,明显优优于大家都选选择付出的境境况,