《经济博弈论管理学及财务知识分析教材.pptx》由会员分享,可在线阅读,更多相关《经济博弈论管理学及财务知识分析教材.pptx(276页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、经济博弈论教材 教学课件 主编:谢识予出版:复旦大学出版社教材:经济博弈论(第二版)经济博弈论(第二版) 复旦大学出版社,2002年1月经济博弈论习题指南经济博弈论习题指南 复旦大学出版社,2003年1月第一章 导论 本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象,本教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。 本章分五节1. 1什么是博弈论1. 2几类经典博弈模型1. 3博弈结构和博弈的分类
2、1. 4博弈论历史和发展的简要评述1. 5博弈论在我国的应用1.1 什么是博弈论1.1.1 从游戏到博弈1.1.2 一个非技术性定义1.1.1 从游戏到博弈博弈就是策略对抗,或策略有关键作用的游戏博弈就是策略对抗,或策略有关键作用的游戏n博弈Game,博弈论Game Theory,Game即游戏、竞技n游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用 游戏下棋、猜大小 经济寡头产量决策、市场阻入、投标拍卖 政治、军事美国和伊拉克、以色列和巴勒斯坦1.1.2 一个非技术性定义定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下
3、,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。四个核心方面四个核心方面 博弈的参加者(Player)博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs)1.2 几个经典博弈模型1.2.1 囚徒的困境1.2.2 赌胜博弈1.2.3 产量决策的古诺模型1.2.1 囚徒的困境n囚徒的困境是图克(Tucker)1950年提出的n该博弈是博弈论最经典、著名的博弈n该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺
4、陷一、基本模型-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白两个罪犯的得益矩阵囚徒囚徒 2囚囚徒徒1囚徒1:坦白囚徒2:坦白二、双寡头削价竞争100,10020,105150,2070,70高 价低 价高 价低 价寡头寡头2寡寡头头1双寡头的得益矩阵政府组织协调的必要性和重要性寡头1:低价(70)寡头2:低价(70)1.2.2 赌胜博弈n赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示n赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”一、田忌赛马3,-31,-11,-11,-1-1,11,-11
5、,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田田 忌忌齐齐威威王王得益矩阵得益矩阵取胜关键取胜关键:不让对方猜到自己策略,尽可能猜出对方策略二、猜硬币博弈-1, 11, -11, -1-1, 1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面三、石头、剪子、布0, 01, -1-1, 1-1, 11, -10, 01, -
6、1-1, 10, 0石 头剪 子布博弈方博弈方2石 头剪 子布博博弈弈方方11.2.3 产量决策的古诺模型n古诺模型是寡头产量竞争,是市场经济中最常见的问题之一n古诺1838年提出,直到现在还是经常使用n古诺模型有很多扩展n古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值一、三厂商离散产量一、三厂商离散产量QQPP20)()(20321qqq020Q20QiiiqqqqqP20321321qqqQP44553762816128565202530564202024555252525431133333337349212131q2q3q123二、二、n个厂商连续产量个厂商连续产量ni
7、iqQ1)()(1niiqPQPP)(1niiiiqPqPq)()(11cqPqcqqPqniiiiniii1.3 博弈结构和博弈分类1.3.1 博弈中的博弈方1.3.2 博弈中的策略1.3.3 博弈中的得益1.3.4 博弈的过程1.3.5 博弈的信息结构1.3.6 博弈方的能力和理性1.3.7 博弈的分类和博弈理论的结构1.3.1 博弈中的博弈方博弈方博弈方:独立决策、独立承担博弈结果的个人或组织n博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变n博弈方数量对博弈结果和分析有影响n根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈一、单人
8、博弈只有一个博弈方的博弈例一:单人迷宫入口AB出口(奖金M)A,1B,1右左右左M00扩展形例二:运输路线-7000-16000-10000-10000好天气(75%)坏天气(25%)自自 然然商商人人水 路陆 路运输路线得益矩阵01-7000-10000 -16000-10000运输路线扩展形好天气(75%)坏天气(25%)单人博弈实质单人博弈实质个体最优化问题个体最优化问题二、两人博弈n两人博弈即有两个博弈方的博弈n两人博弈最常见,研究最多,是最基本和有用的博弈类型n囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈n两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致三、多人博弈n三
9、个博弈方之间的博弈n可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。申办奥运会是典型例子。n多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法1.3.2 博弈中的策略策略策略:博弈中各博弈方的选择内容n策略有定性定量、简单复杂之分n不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同n有限博弈:每个博弈方的策略数都是有限的n无限博弈:至少有某些博弈方的策略有无限多个1.3.3 博弈中的得益得益得益:各博弈方从博弈中所获得的利益n得益对应博弈的结果,也就是各博弈方策略的组合n得益是各博弈方追求的根本目标及行为
10、和判断的主要依据n根据得益的博弈分类:零和博弈、常和博弈、变和博弈n零和博弈零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 猜硬币,田忌赛马,石头-剪刀-布n常和博弈常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 分配固定数额的奖金、利润,遗产官司n变和博弈变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。 囚徒困境、产量博弈、制式问题等1.3.4 博弈的过程博弈过程博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。n博弈过程对博弈结果也有重要影响。n根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博
11、弈。静态博弈静态博弈:所有博弈方同时或可看作同时选择策略的博弈 田忌赛马、猜硬币、古诺模型动态博弈动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 弈棋、市场进入、领导追随型市场结构重复博弈重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能 长期客户、长期合同、信誉问题n有限次重复博弈n无限次重复博弈1.3.5 博弈的信息结构n完全信息博弈完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益n不完全信息博弈不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”
12、n完美信息博弈完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈n不完美信息博弈不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈1.3.6 博弈方的能力和理性完全理性和有限理性完全理性和有限理性n完全理性:有完美的分析判断能力和不会犯选择行为的错误n有限理性:博弈方的判断选择能力有缺陷个体理性和集体理性个体理性和集体理性n个体理性:一个体利益最大为目标n集体理性:追求集体利益最大化n合作博弈:允许存在有约束力协议的博弈n非合作博弈:不允许存在有约束力协议的博弈1.3.7 博弈的分类和博弈理论的结构n非合作博弈和合作博弈n非合作博弈范围内:完全理性博弈和有限
13、理性博弈(进化博弈)n静态博弈,动态博弈,重复博弈n完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈n零和博弈和非零和博弈,单人博弈和多人博弈1.4 博弈论历史和发展简述1.4.1博弈论的早期研究1.4.2博弈论的形成1.4.3博弈论的成长和发展1.4.4博弈论的成熟及与主流经济学的融合1.4.1博弈论的早期研究n博弈论历史没有公认答案n对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早n博弈论真正的发展在本世纪n博弈论总体上仍然是发展中的学科 n2000年前我国古代的“齐威王田忌赛马”n1500年前巴比伦犹太教法典“婚姻合同问
14、题”等。n1838年古诺寡头模型。n1883年伯特兰德寡头竞争模型。 n1913年齐默罗象棋博弈定理 、“逆推归纳法”n1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 n1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果 1.4.2博弈论的形成冯冯.诺伊曼和摩根斯坦诺伊曼和摩根斯坦博弈论和经济行为博弈论和经济行为Theory of Games and Economic Behavior 1944n引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(mat
15、rix form)表示n提出稳定集(stable sets)解概念n正式提出创造博弈论一般理论的主意n给出博弈论研究的一般框架、概念术语和表述方法1.4.3 博弈论的成长和发展一、第一个研究高潮,本世纪40年代末和50年代初n1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。 n1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;n1952-1953年期间(L. S. Shapley)和(
16、D. B. Gillies)提出“核”(Core)作为合作博弈的一般解概念nShapley提出了合作博弈的“Shapley值”(Shapley value)概念等。n奥曼(R. J. Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。” 二、50年代中后期一直到70年代博弈论发展的青年期n1954-1955年提出了“微分博弈”(Differential games)的概念。n奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。n“重复博弈”(Repeated games)也是在50年代末开始研究
17、的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。n1960年(Thomas C. Schelling)引进了“焦点”(Focal point)的概念。n博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。 n塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium)n1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)n海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳
18、什均衡”(Bayesian Nash equilibrium)。n海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。n70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。n“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。 三、40年代末到70年代末是博弈论发展的重要阶段n这个时期博弈理论仍然
19、没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这个时期博弈论研究的繁荣和进展却是非常显著的。n对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有80、90年代博弈论的成熟和对经济学的博弈论革命。 1.4.4博弈论的成熟及与主流经济学的融合一、80、90年代是博弈论走向成熟的时期 n1981(Elon Kohlberg) “顺推归
20、纳法”(Forward induction)n克瑞泼斯(David M. kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)n1982年斯密(John Maynard Smith)出版了进化和博弈论()n1984年由伯恩海姆(B. D. Bernheim)和皮尔斯(D. G. Pearce)提出“可理性化性”(Rationalizability)n海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,n1991年弗得伯格(D. Fudenberg)和泰勒尔(J. Tirole)首先提出了“完美贝叶斯均
21、衡”(Perfext Bayesian equilibrium)的概念二、博弈论和经济学诺贝尔奖n1994:非合作博弈:纳什(Nash)、海萨尼(Harsanyi)、塞尔顿(Selten)n1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey)n2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场)n2002:实验经济学:史密斯(Smith),心理经济学:卡尼曼(Kahneman)1.5 博弈论在我国的应用n企业经营者的决策思路和工具。n政府的政策和管理思路,与个人、企业
22、和地方博弈的意识。n社会经济问题的理论分析工具,解释经济中许多低效率现象的根源,找出各种经济问题的制度性、环境性原因,揭示各种经济行为和政策的效率意义等。第二章 完全信息静态博弈 本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。 本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什
23、均衡的存在性2.6纳什均衡的选择和分析方法扩展2.1 基本分析思路和方法2.1.1 上策均衡2.1.2 严格下策反复消去法2.1.3 划线法2.1.4 箭头法2.1.1 上策均衡上策上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果n上策均衡不是普遍存在的 2.1.2 严格下策反复消去法严格下策严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益
24、小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.3 划线法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬币币2, 10, 00, 01, 3夫夫妻妻之之争争2.1.4 箭头法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬币币2, 10, 00, 01, 3夫夫妻妻之之争争2.2 纳什均衡2.2.1 纳什
25、均衡的定义2.2.2 纳什均衡的一致预测性质2.2.3 纳什均衡与严格下策反复消去法2.2.1 纳什均衡的定义n策略空间:n博弈方 的第 个策略:n博弈方 的得益:n博弈:纳什均衡纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡nSS ,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiissss),.,(),.,(*1*1*1*1*niijiiiniiiiisssssusssssuijiSs),(*ni
26、ssGiij2.2.2 纳什均衡的一致预测性质一致预测一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果n只有纳什均衡才具有一致预测的性质n一致预测性是纳什均衡的本质属性n一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能2.2.3 纳什均衡与严格下策反复消去法n上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什
27、均衡命题命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(*niss,;,11nnuuSSG),(*niss),(*niss,;,11nnuuSSGG2.3 无限策略分析和反应函数2.3.1 古诺的寡头模型2.3.2 反应函数2.3.3 伯特兰德寡头模型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性2.3.1 古诺的寡头模型寡头产量竞争以两厂商产量竞争为例QQPPqqQ8)(21121111112)(8 )(qqqqqcQPqu212116qqq
28、q221 cc221222222)(8 )(qqqqqcQPqu222126qqqq4.5,4.55,3.753.75,54,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈2.3.2 反应函数古诺模型的反应函数)6()()6()()6max(max1211222212112121111qqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古诺模型的反应函数图示理性局限和古诺调整2.3.3 伯特兰德寡头模型n价格竞争寡头
29、的博弈模型价格竞争寡头的博弈模型n产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabP2.3.4 公共资源问题公共草地养羊问题)(1QVVqqQn以三农户为例 n=3,c=4cqQVquiii)(323211212148),(qqqqRq31312
30、2212148),(qqqqRq212133212148),(qqqqRq17287257624*3*2*1*3*2*1uQuuuqqqQQQQu964)100(1728576323047224348uQ合作:总体利益最大化合作:总体利益最大化竞争:个体利益最大化竞争:个体利益最大化2.3.5 反应函数的问题和局限性n在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。n即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点
31、。2.4 混合策略和混合策略纳什均衡2.4.1 严格竞争博弈和混合策略的引进2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和严格下策反复消去法2.4.4 混合策略反应函数2.4.1 严格竞争博弈和混合策略的引进一、猜硬币博弈-1, 11, -11, -1-1, 1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念这类博弈很多,引出混合策略纳什均衡概念二、混合策略、混合策略博弈 和混合策略纳什均衡 混合策略混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布
32、随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 混合策略纳什均衡混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj, 111ikipp三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析5213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方博弈方2博博弈弈方方
33、1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.6四、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田田 忌忌齐齐威威王王得益矩阵五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对首位的处罚:短期中的效
34、果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略0- D- D守卫得益(睡)SPt 小偷偷的概率1V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0- P- P小偷得益(偷)VPg 守卫睡的概略12.4.2 多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2, 10, 00, 01, 3时 装足 球时装足球丈丈 夫夫妻妻子子夫妻之争夫妻之争3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略夫妻之争博弈的
35、混合策略纳什均衡 策略 得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3) 0.75二、制式问题1, 30, 00, 02, 2ABAB厂商厂商2厂厂商商1制式问题制式问题 制式问题混合策略纳什均衡 A B 得益厂商1: 0.4 0.6 0.664厂商2: 0.67 0.33 1.296三、市场机会博弈-50,-50100,00,1000,0进不 进进不进厂商厂商2厂厂商商1市场机会市场机会 进 不进 得益厂商1: 2/3 1/3 0厂商2: 2/3 1/3 02.4.3 混合策略和严格下策反复消去法3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方
36、2博博弈弈方方123212111003eu23212111030eu博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益2.4.4 混合策略反应函数猜硬币博弈-1, 11, -11, -1-1, 1正 面反 面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布)(2rRq )(1qRr 夫妻之争博弈2, 10, 00, 01, 3时装足球丈夫丈夫时装足球妻妻子子夫妻之争夫
37、妻之争rq111/31/3(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布)(2rRq )(1rRr 2.5 纳什均衡的存在性纳什定理纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。n教材106页证明。主要根据是布鲁威尔和角谷的不动点定理。n纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,;,11nnuuSSGiSni, 12.6 纳什均衡的选择和分析方法扩展2.6.1 多重纳什均衡博弈的分析2.6.2 共谋和防共谋均衡2.6.1 多重纳什均衡博弈的分析n帕
38、累托上策均衡n风险上策均衡n聚点均衡n相关均衡一、帕累托上策均衡(鹰鸽博弈)这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。-5, -5-10, 88, -1010, 10战争和平国家国家2战争和平国国家家1战争与和平战争与和平二、风险上策均衡 考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。9, 98, 00, 87, 7LR博弈方博弈方2UD博博弈弈方方1风险上策均衡(风险上策均衡(D,R)5, 53, 00, 33, 3鹿兔子
39、猎人猎人2鹿兔子猎猎人人1猎鹿博弈风险上策均衡(兔子,兔子)风险上策均衡(兔子,兔子)三、聚点均衡n利用博弈设定以外的信息和依据选择的均衡n文化、习惯或者其他各种特征都可能是聚点均衡的依据n城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子四、相关均衡5, 14, 40, 01, 5LR博弈方博弈方2UD博博弈弈方方1相关均衡例子相关均衡例子三个纳什均衡三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)结果都不理想,不如(D,L)。可利用聚点均衡(天气,抛硬天气,抛硬币)币),但仍不理想。相关装置:1、各1/3概率A、B、C2、博弈方
40、1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B) 前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋 (Coalition)问题:博弈方1和2同时偏离。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B2.6.2 共谋和防共谋均衡二、防共谋均衡 如果一
41、个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为“防共谋均衡”。前面例子中:(D,R,B) 是防共谋均衡 (U,L,A)不是防共谋均衡第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,
42、都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论3.1 动态博弈的表示法和特点3.1.1 阶段和扩展性表示3.1.2 动态博弈的基本特点3.1.1 阶段和扩展性表示n阶段:动态博弈中一个博弈方的一次选择行为n例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不
43、仿冒3.1.2 动态博弈的基本特点n策略是在整个博弈中所有选择、行为的计划n结果是上述“计划型”策略的策略组合,构成一条路径n得益对应每条路径,而不是对应每步选择、行为n动态博弈的非对称性先后次序决定动态博弈必然是非对称的。n先选择、行为的博弈方常常更有利,有“先行优势”。3.2 可信性和纳什均衡的问题3.2.1 相机选择和策略中的可信性问题3.2.2 纳什均衡的问题3.2.3 逆推归纳法3.2.1 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保
44、障的开金矿博弈分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈分钱打官司都不可信3.2.2 纳什均衡的问题 第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。n结论结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能可能是不稳定的,不能作为预测的基础。n根源根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.2.3 逆推归纳法定义定义:从动态博弈的最后一个阶段博弈方的行为开始分析
45、,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法逆推归纳法”。n逆推归纳法是动态博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3 子博弈和子博弈完美纳什均衡3.3.1 子博弈3.3.2 子博弈完美纳什均衡3.3.1 子博弈n定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2 子博弈完美纳什均衡定义定义:如果一个完美信息的动态博弈中,各
46、博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。n子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。n逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4 几个经典动态博弈模型3.4.1 寡占的斯塔克博格模型3.4.2 劳资博弈3.4.3 讨价还价博弈3.4.4 委托人代理人理论3.4.1 寡占的斯塔克博格模型n先后选择产量的产量竞争博弈n把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。QQPPqqQ8)(,21221 cc121111112)(8
47、)(qqqqqcQPqu212116qqqq221222222)(8 )(qqqqqcQPqu222126qqqq 产量 得益厂商1 3单位 4.5厂商2 1.5单位 2.25先行优势3.4.2 劳资博弈先由工会决定工资率,再由厂商决定雇用多少劳动力)(*WLRL0W L厂商的反应函数R(L)斜率为W)(max),(max00WLLRLWLLLW0工会的误差异曲线)(*WL)(*WL0u1u2u3u*W)(,max*0WLWuW3.4.3 讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S1)10000(,22SS)10000,(11SS)10000(,22SSSS2SSS
48、211000010000三回合讨价还价博弈结果的讨论益越大甲的得益越小,乙的得越大,时,当益越小甲的得益越大,乙的得越大,时,当5 . 0015 . 0无限回合讨价还价SS211000010000SSS211000010000110000*S11000010000*S3.4.4 委托人代理人理论一、委托人代理人关系n经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。n委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性n委托人代理人涉及问题:激励机制设计、机制设计理论,委托合
49、同设计问题等二、无不确定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束: w(E)-E w(S)-S w(E) w(S)+E-S参与约束:22R(E)-w(E), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0参与约束n委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(
50、E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20) -w(10)五、选择报酬和连续努力水平的 委托人代理人博弈R,