《[经济学课件]]微观经济学--博弈论bei.pptx》由会员分享,可在线阅读,更多相关《[经济学课件]]微观经济学--博弈论bei.pptx(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组第十章博弈论第十章博弈论1 1微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组博弈论用来分析所观察到的决策主体相互博弈论用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解影响时的现象,在给定的条件下寻求最优的解决办法。本章主要介绍非合作博弈,非合作博决办法。本章主要介绍非合作博弈,非合作博弈可分成四种情况:完全信息静态博弈、完全弈可分成四种情况:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。本章分析的重点在完全
2、信息静信息动态博弈。本章分析的重点在完全信息静态博弈和完全信息动态博弈,分别给出纳什均态博弈和完全信息动态博弈,分别给出纳什均衡和子博弈精炼纳什均衡的详细讲解。衡和子博弈精炼纳什均衡的详细讲解。2 2微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组第一节博弈论概述第一节博弈论概述博弈论博弈论:用来分析所观察到的决策主体相互影响时的:用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。现象,在给定的条件下寻求最优的解决办法。一、博弈论的发展一、博弈论的发展2020世纪世纪4040年代博弈论思想体系初步建立,经过年代博弈论思想体系初步建立,经过50
3、50年代年代的理论发展,博弈论在的理论发展,博弈论在6060年代逐步走向成熟。年代逐步走向成熟。2020世纪世纪7070年年代中后期以后,随着博弈论在经济分析领域内的广泛和成代中后期以后,随着博弈论在经济分析领域内的广泛和成功应用,博弈论也逐步进入主流经济学的体系。功应用,博弈论也逐步进入主流经济学的体系。3 3微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组博弈论的发展博弈论的发展19441944年,由冯年,由冯 诺依曼和摩根斯坦恩合著的博弈论诺依曼和摩根斯坦恩合著的博弈论和经济行为一书的出版标志着现代博弈论作为一种系统和经济行为一书的出版标志着现代博弈论作为一种系统
4、理论的创立。理论的创立。2020世纪世纪5050年代,纳什创立了公理化的讨价还价理论,年代,纳什创立了公理化的讨价还价理论,证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作博弈理论为核心的现代博弈论体系。博弈理论为核心的现代博弈论体系。2020世纪世纪6060年代以后,年代以后,泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不完全信息引入到博弈论中。完全信息引入到博弈论中。2020世纪世纪7070年代以后,经济学家开始强调个人理性。年代以后,经济学家开始强调个人理性。4 4微观经济学第十章
5、博弈论南开大学西方经济学课程组南开大学西方经济学课程组博弈论与主流经济学博弈论与主流经济学博弈论进入主流经济学,反映了经济学发展的以下几博弈论进入主流经济学,反映了经济学发展的以下几个趋势:个趋势:经济学研究的对象越来越转向个体,放弃了一经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定;些没有微观基础的假定;经济学越来越转向人与人之间经济学越来越转向人与人之间竞争与合作的研究,特别是经济学注意到理性人的个人理竞争与合作的研究,特别是经济学注意到理性人的个人理性行为可能导致的集体非理性;性行为可能导致的集体非理性;经济学越来越重视对信经济学越来越重视对信息的研究。息的研究。博弈可以划
6、分为博弈可以划分为合作博弈合作博弈和和非合作博弈非合作博弈。合作博弈与。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。如果能,就是合当事人能否达成一个具有约束力的协议。如果能,就是合作博弈;反之,则是非合作博弈。作博弈;反之,则是非合作博弈。5 5微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组二、博弈分析举例二、博弈分析举例沙滩上的饮料销售商沙滩上的饮料销售商为了争取更多的游客,两家销售商的销售位置又会开为了争取更多的游客,两家销售商的销售位置又会开始向中点移动,最终都
7、将销售位置定在了中点处。始向中点移动,最终都将销售位置定在了中点处。图10-1博弈分析举例:沙滩上的饮料销售商两家销售商的初始位置AB1/43/41/21/2销售商A的位置移动AB3/83/49/167/161/29/16销售商B的位置移动AB3/85/81/21/21/2两家销售商的最终位置A、B11/21/26 6微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组掷币游戏掷币游戏A、B两个小孩玩掷币游戏,两人各拿出一枚硬币抛两个小孩玩掷币游戏,两人各拿出一枚硬币抛掷在地面上,要么正面朝上,要么反面朝上。掷在地面上,要么正面朝上,要么反面朝上。都同为正面或反面朝上,都同
8、为正面或反面朝上,A赢得赢得B一枚硬币;一枚硬币;一正面一反面朝上,一正面一反面朝上,A输给输给B一枚硬币。一枚硬币。这个例子中,两个小孩各自得到的结果(赢得一枚硬这个例子中,两个小孩各自得到的结果(赢得一枚硬币或者输掉一枚硬币),不仅取决于自己掷币的后果,也币或者输掉一枚硬币),不仅取决于自己掷币的后果,也取决于对手掷币的后果,双方决策的互相影响构成博弈。取决于对手掷币的后果,双方决策的互相影响构成博弈。在这个博弈中,一方所得正是其他方所失,这种博弈在这个博弈中,一方所得正是其他方所失,这种博弈称为零和博弈。称为零和博弈。7 7微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济
9、学课程组囚徒困境囚徒困境囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。表被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。的两个数字代表对应两个囚徒选择组合下各自的刑期。表表10-1囚徒困境囚徒困境-3,-3-10,0抵抵赖赖0,-10-8,-8坦白坦白囚徒囚徒A抵抵赖赖坦白坦白囚徒囚徒B8 8微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经
10、济学课程组三、博弈的要素三、博弈的要素博弈的要素包括参与人、行动、信息、策略、支付、博弈的要素包括参与人、行动、信息、策略、支付、结果和均衡,其中,参与人、策略和支付是描述一个博结果和均衡,其中,参与人、策略和支付是描述一个博弈所需要的最基本的要素,参与人、行动和结果统称为弈所需要的最基本的要素,参与人、行动和结果统称为博弈规则。博弈规则。参与人:指一个博弈中的决策主体在囚徒困境模参与人:指一个博弈中的决策主体在囚徒困境模型中,有两个参与人,即型中,有两个参与人,即“囚徒囚徒A”和和“囚徒囚徒B”。行动:是参与人在博弈的某个时点的决策变量。行动:是参与人在博弈的某个时点的决策变量。在囚徒困境模
11、型中,囚徒在囚徒困境模型中,囚徒A、B都只有两种行动可供选择都只有两种行动可供选择,即,即“坦白坦白”和和“抵赖抵赖”。9 9微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组信息是参与人在博弈中的知识,特别是有关其他信息是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。在囚徒困境模型参与人(对手)的特征和行动的知识。在囚徒困境模型中,两囚徒的信息是都知道自己和另一囚徒在选择坦白中,两囚徒的信息是都知道自己和另一囚徒在选择坦白和抵赖的不同组合时面对的处罚。和抵赖的不同组合时面对的处罚。策略:是参与人在拥有既定信息情况下的行动规策略:是参与人在拥有既定
12、信息情况下的行动规则,它规定参与人在什么时候选择什么行动。一个参与则,它规定参与人在什么时候选择什么行动。一个参与人的所有可选择的策略的集合就是这个参与人的人的所有可选择的策略的集合就是这个参与人的策略空策略空间间。如果每个参与人选择一个策略,就构成一个。如果每个参与人选择一个策略,就构成一个策略组策略组合合。支付:在博弈论中指一个特定策略组合下参与人支付:在博弈论中指一个特定策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用得到的确定效用水平,或者是指参与人得到的期望效用1010微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组水平。支付是博弈参与人真正关
13、心的东西。在一个策略水平。支付是博弈参与人真正关心的东西。在一个策略组合下,所有参与者的支付就构成了一个支付组合。在组合下,所有参与者的支付就构成了一个支付组合。在囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦白),那么囚徒白),那么囚徒A的支付为的支付为-10,囚徒,囚徒B的支付为的支付为0,两,两囚徒的支付组合为(囚徒的支付组合为(-10,0);如果两囚徒的策略组合);如果两囚徒的策略组合为(坦白,坦白),那么囚徒为(坦白,坦白),那么囚徒A和囚徒和囚徒B的支付均为的支付均为-8,两囚徒的支付组合为(,两囚徒的支付组合为(-8,-8)。)。
14、结果:是博弈分析者感兴趣的所有东西,如均衡结果:是博弈分析者感兴趣的所有东西,如均衡策略组合、均衡支付组合等。策略组合、均衡支付组合等。均衡:是所有参与人的最优策略的组合。均衡:是所有参与人的最优策略的组合。1111微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组四、博弈的分类四、博弈的分类表10-2博弈的分类及对应的均衡概念不完全信息动态博弈精炼贝叶斯纳什均衡不完全信息静态博弈贝叶斯纳什均衡不完全信息完全信息动态博弈子博弈精炼纳什均衡完全信息静态博弈纳什均衡完全信息动态静态行动顺序信息1212微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组第二
15、节完全信息静态博弈第二节完全信息静态博弈每一个参与人对所有其他参与人(对手)的特征、每一个参与人对所有其他参与人(对手)的特征、策略空间及支付函数有准确的知识,而且博弈的参与人策略空间及支付函数有准确的知识,而且博弈的参与人同时选择行动或虽非同时但后行动者并不知道前行动者同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动,这种情况下参与人的决策就是采取了什么具体行动,这种情况下参与人的决策就是完完全信息静态博弈全信息静态博弈。纳什对非合作博弈的主要贡献是在一般的意义上定纳什对非合作博弈的主要贡献是在一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在,义了非合作博弈及其
16、均衡解,并证明了均衡解的存在,这一均衡就被称为这一均衡就被称为“纳什均衡纳什均衡”。1313微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组博博弈弈可可以以采采用用两两种种不不同同的的方方式式来来表表述述,一一种种是是策策略略式式表表述述,一一种种是是扩扩展展式式表表述述。从从理理论论上上讲讲,这这两两种种表表述述形形式式几几乎乎是是完完全全等等价价的的,但但策策略略式式表表述述更更适适合合于于分分析析静静态态博博弈弈,扩展式表述更适合于分析动态博弈。扩展式表述更适合于分析动态博弈。一、博弈的策略式表述一、博弈的策略式表述策略式表述策略式表述n个参与人;说明每个参与人都
17、有哪些策略;每个参个参与人;说明每个参与人都有哪些策略;每个参与人都选定一种策略时,每个参与人的支付水平(获得与人都选定一种策略时,每个参与人的支付水平(获得的效用)是多少。根据上面给出的三要素,策略式表述的效用)是多少。根据上面给出的三要素,策略式表述的博弈就是:的博弈就是:1414微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组在双头垄断的产量博弈中,两个寡头厂商在双头垄断的产量博弈中,两个寡头厂商A、B是参是参与人,两者的产量与人,两者的产量qA、qB的范围是其策略空间,获得利的范围是其策略空间,获得利润润A、B是其支付,策略式表述的博弈可写为:是其支付,策略式表
18、述的博弈可写为:1515微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组表表10-3掷币游戏掷币游戏1,-1-1,1反面反面-1,11,-1正面正面小孩小孩A反面反面正面正面小孩小孩B策略式表述的博弈举例策略式表述的博弈举例在掷币游戏中,每个参与人的支付直接用其赢得或输在掷币游戏中,每个参与人的支付直接用其赢得或输掉的硬币数量来表示:赢得一枚硬币的支付为掉的硬币数量来表示:赢得一枚硬币的支付为1,输掉一,输掉一枚硬币的支付为枚硬币的支付为-1。掷币游戏的支付矩阵见表。掷币游戏的支付矩阵见表10-3所示。所示。1616微观经济学第十章 博弈论南开大学西方经济学课程组南开大
19、学西方经济学课程组表表10-4斗鸡博弈斗鸡博弈-1,-10,2撤退撤退2,0-3,-3进进攻攻公公鸡鸡A撤退撤退进进攻攻公公鸡鸡B再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是进攻,一是撤退。如果一只只公鸡有两个行动选择:一是进攻,一是撤退。如果一只公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表两只公鸡都进攻,那么两败俱伤。设
20、其支付矩阵见表10-4所示。所示。1717微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组二、纳什均衡二、纳什均衡占优策略均衡占优策略均衡不论其他参与人选择什么策略,他的最优策略是唯不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为一的,这样的最优策略被称为占优策略占优策略。在。在“囚徒困境囚徒困境”的例子中,每个囚徒都有两种可选择的策略:坦白或的例子中,每个囚徒都有两种可选择的策略:坦白或抵赖。但是,不论另一囚徒选择什么策略,每个囚徒的抵赖。但是,不论另一囚徒选择什么策略,每个囚徒的最优策略是最优策略是“坦白坦白”。所有参与人占优策略的组合称为所有
21、参与人占优策略的组合称为占优策略均衡占优策略均衡。1818微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组重复剔除的占优均衡重复剔除的占优均衡考虑考虑“智猪博弈智猪博弈”例子。例子。猪圈里围着两头猪,一头大猪圈里围着两头猪,一头大猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一个按钮,控制着猪食的供应。按下一按钮会有个按钮,控制着猪食的供应。按下一按钮会有8个单位的个单位的猪食进槽,但按下按钮的猪需要付出猪食进槽,但按下按钮的猪需要付出2个单位的成本。若个单位的成本。若大猪先到,大猪吃到大猪先到,大猪吃到7个单位,小猪
22、只能吃个单位,小猪只能吃1个单位;若同个单位;若同时到,大猪吃时到,大猪吃5个单位,小猪吃个单位,小猪吃3个单位;若小猪先到,大个单位;若小猪先到,大猪和小猪各吃猪和小猪各吃4个单位。个单位。表表10-5的的表列出对应不同策略组表列出对应不同策略组合的支付水平,如第一格表示两头猪同时按下按钮,就会合的支付水平,如第一格表示两头猪同时按下按钮,就会同时走到猪食槽,大猪吃同时走到猪食槽,大猪吃5个单位,小猪吃个单位,小猪吃3个,扣除个,扣除2个个单位的成本,支付水平分别为单位的成本,支付水平分别为3和和1。1919微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组表表10-5
23、智猪博弈与重复剔除的占优均衡智猪博弈与重复剔除的占优均衡0,07,-1等待等待2,43,1按按大猪大猪A等待等待按按小猪小猪B智猪博弈的支付矩阵0,0等待等待2,4按按大猪大猪A等待等待小猪小猪B剔出小猪劣策略的支付矩阵2,4按按大猪大猪A等待等待小猪小猪B再剔出大猪劣策略的支付矩阵2020微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组纳什均衡纳什均衡如果重复剔除劣策略后剩下的策略组合是唯一的,那如果重复剔除劣策略后剩下的策略组合是唯一的,那么该博弈才是重复剔除占优可解的。但很多博弈是无法使么该博弈才是重复剔除占优可解的。但很多博弈是无法使用重复剔除劣策略的方法找到均
24、衡解的。例如性别之战的用重复剔除劣策略的方法找到均衡解的。例如性别之战的例子。一男一女谈恋爱,周末安排业余活动,要么看足球例子。一男一女谈恋爱,周末安排业余活动,要么看足球比赛,要么看舞蹈演比赛,要么看舞蹈演出。男的爱好足球,出。男的爱好足球,女的更喜欢舞蹈,但女的更喜欢舞蹈,但他们宁愿在一起而不他们宁愿在一起而不愿分开。支付矩阵见愿分开。支付矩阵见表表10-6所示。所示。表表10-6性别之战性别之战2,30,0舞蹈舞蹈1,13,2足球足球男男舞蹈舞蹈足球足球女女2121微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组一个参与人的纳什均衡策略是面对其他参与人的均一个参与
25、人的纳什均衡策略是面对其他参与人的均衡策略时的最优选择衡策略时的最优选择。在囚徒困境中,(坦白,坦白)。在囚徒困境中,(坦白,坦白)是一个纳什均衡,而(抵赖,抵赖)不是一个纳什均衡,是一个纳什均衡,而(抵赖,抵赖)不是一个纳什均衡,因为给定同伙选择抵赖,自己选择抵赖时得到因为给定同伙选择抵赖,自己选择抵赖时得到-3,选择,选择坦白时得到坦白时得到0,因而抵赖不是自己的最优策略;同样,因而抵赖不是自己的最优策略;同样,(坦白,抵赖)和(抵赖,坦白)也不是纳什均衡。在(坦白,抵赖)和(抵赖,坦白)也不是纳什均衡。在性别之战中,(足球,足球)是一个纳什均衡,因为一性别之战中,(足球,足球)是一个纳什
26、均衡,因为一旦形成这个策略组合的结果,任何一方的偏离都会造成旦形成这个策略组合的结果,任何一方的偏离都会造成自己支付的减少,例如女的此时去看舞蹈将把自己的支自己支付的减少,例如女的此时去看舞蹈将把自己的支付从付从2降到降到1;同样,(舞蹈,舞蹈)也是一个纳什均衡,;同样,(舞蹈,舞蹈)也是一个纳什均衡,其他策略组合都不是纳什均衡。其他策略组合都不是纳什均衡。2222微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组寻求纳什均衡寻求纳什均衡首先考虑首先考虑A的策略,对于的策略,对于B的每一个给定策略,找出的每一个给定策略,找出A的最优策略,在其对应的支付下划一横线,再用类似
27、的方的最优策略,在其对应的支付下划一横线,再用类似的方法找出法找出B的最优策略。完成这个过程后,如果某个支付组的最优策略。完成这个过程后,如果某个支付组合的两个数字下都有线,这个支付组合所对应的策略组合合的两个数字下都有线,这个支付组合所对应的策略组合就是一个纳什均衡。就是一个纳什均衡。表表10-7寻求纳什均衡寻求纳什均衡2,33,4M1,40,2U参与人参与人ACL参与人参与人BRD2,11,03,11,14,22323微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组通过对纳什均衡与占优策略均衡以及重复剔除的占优通过对纳什均衡与占优策略均衡以及重复剔除的占优均衡的分析
28、,可知它们之间的关系如下:均衡的分析,可知它们之间的关系如下:每一个占优策略每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡或重复剔除的占优均衡个纳什均衡都是占优策略均衡或重复剔除的占优均衡。这是因为,一个参与人的占优策略是对于所有其他参这是因为,一个参与人的占优策略是对于所有其他参与人的任何策略组合的最优选择,自然也一定是对于所有与人的任何策略组合的最优选择,自然也一定是对于所有其他参与人的某个特定策略的最优选择;而一个参与人的其他参与人的某个特定策略的最优选择;而一个参与人的纳什均衡策略只要求是对于
29、其他参与人均衡策略(这是一纳什均衡策略只要求是对于其他参与人均衡策略(这是一个或几个特定策略)的最优选择。所以说,个或几个特定策略)的最优选择。所以说,占优策略均衡占优策略均衡和重复剔除的占优均衡是特殊的纳什均衡,它们所要求的和重复剔除的占优均衡是特殊的纳什均衡,它们所要求的条件比纳什均衡的条件要严格条件比纳什均衡的条件要严格。2424微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组三、纳什均衡与寡头垄断市场三、纳什均衡与寡头垄断市场库诺特模型与纳什均衡库诺特模型与纳什均衡用用QA、QB分别表示厂商分别表示厂商A和厂商和厂商B的产量;的产量;CA(QA)和和CB(QB)
30、表示两者的成本函数;表示两者的成本函数;PP(QAQB)表示需求函数表示需求函数的逆函数,其中的逆函数,其中P是价格。厂商是价格。厂商A和厂商和厂商B的利润函数分别为:的利润函数分别为:2525微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组对每个厂商的利润函数求一阶偏导数并令其等于零,对每个厂商的利润函数求一阶偏导数并令其等于零,整理可得:整理可得:反应函数意味着每个厂商的最优策略(产量)是另一反应函数意味着每个厂商的最优策略(产量)是另一个厂商的策略(产量)的函数,两个反应函数的交叉点个厂商的策略(产量)的函数,两个反应函数的交叉点(即两个方程的解)就是纳什均衡:(
31、即两个方程的解)就是纳什均衡:2626微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组伯川德模型与纳什均衡伯川德模型与纳什均衡伯川德模型中,由于产品是相同的,消费者将只会从价伯川德模型中,由于产品是相同的,消费者将只会从价格最低的厂商那里购买。因此,价格较低的厂商将供应整个格最低的厂商那里购买。因此,价格较低的厂商将供应整个市场。如果两个厂商定价相同,则消费者对于从哪个厂商购市场。如果两个厂商定价相同,则消费者对于从哪个厂商购买不会在意,假定此时两个厂商各占供给市场的一半。在这买不会在意,假定此时两个厂商各占供给市场的一半。在这种情况下的纳什均衡就是竞争均衡,即两个厂商
32、都制定的价种情况下的纳什均衡就是竞争均衡,即两个厂商都制定的价格将等于边际成本,都只赚到零利润。格将等于边际成本,都只赚到零利润。为了验证这是一个纳什均衡,应指出此时两个厂商都没为了验证这是一个纳什均衡,应指出此时两个厂商都没有改变价格的冲动。这时,厂商没有改变价格的冲动,但已有改变价格的冲动。这时,厂商没有改变价格的冲动,但已经是在给定对方选择的情况下所做的最好的选择。经是在给定对方选择的情况下所做的最好的选择。2727微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组第三节完全信息动态博弈第三节完全信息动态博弈一、博弈的扩展式表述一、博弈的扩展式表述扩展式表述与博弈树
33、扩展式表述与博弈树扩展式表述要给出每个参与人的动态描述,即参与人在扩展式表述要给出每个参与人的动态描述,即参与人在什么时点、什么情况下选择什么样的行动。什么时点、什么情况下选择什么样的行动。当一个人行动在前,而一个人行动在后时,后者自然会当一个人行动在前,而一个人行动在后时,后者自然会根据前者的选择进行策略的调整,前者也能理性地预期到这根据前者的选择进行策略的调整,前者也能理性地预期到这一点,并考虑这一影响。此时,就进入了动态博弈的分析。一点,并考虑这一影响。此时,就进入了动态博弈的分析。2828微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组具体来说,扩展式表述包括五
34、个要素。具体来说,扩展式表述包括五个要素。参与人集合;参与人集合;参与人的行动顺序:哪个参与者在什么时候行动;参与人的行动顺序:哪个参与者在什么时候行动;参与人的行动空间:在每次行动时参与人所有可供参与人的行动空间:在每次行动时参与人所有可供选择的行动;选择的行动;参与人的信息集合:在每次行动时参与人所知道的参与人的信息集合:在每次行动时参与人所知道的有关对手行动选择的信息;有关对手行动选择的信息;参与人的支付函数:在行动结束后每个参与人得到参与人的支付函数:在行动结束后每个参与人得到的支付,它是所有行动的函数。的支付,它是所有行动的函数。2929微观经济学第十章 博弈论南开大学西方经济学课程
35、组南开大学西方经济学课程组如同用支付矩阵描述策略式表述一样,扩展式表述可如同用支付矩阵描述策略式表述一样,扩展式表述可以借用以借用博弈树博弈树来描述。如图来描述。如图10-2所示,有两个参与者所示,有两个参与者A和和B进行博弈,第一个参与者进行博弈,第一个参与者A用用“”来表示,来表示,有两种策略:有两种策略:1或或2。第二个参与者第二个参与者B用用“”来表示,参与者来表示,参与者A选择选择1时,时,参与者参与者B有有11或或12两种选择;参与者两种选择;参与者A选择选择2时,参与者时,参与者B有有21或或22两种选择。两种选择。(A11,B11)、(A12,B12)、(A21,B21)和和(
36、A22,B22)表示两个参与者选择不同策略后的最终支付。这表示两个参与者选择不同策略后的最终支付。这就是博弈树的形式,当然,每个参与者的策略并不局限于就是博弈树的形式,当然,每个参与者的策略并不局限于两种。两种。3030微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组图10-2博弈树的形式举例ABB1211122122(A11,B11)(A12,B12)(A21,B21)(A22,B22)博弈树的基本结构包括结、枝和信息集。结分为决策博弈树的基本结构包括结、枝和信息集。结分为决策结和终点结两类。决策结是参与人采取行动的时点,如图结和终点结两类。决策结是参与人采取行动的时
37、点,如图,如图,如图10-2中的四个支付组合。中的四个支付组合。10-2中的中的“”和和“”三个决策结;终三个决策结;终点结是博弈行动路径的点结是博弈行动路径的终点,如图终点,如图10-2中的四中的四个支付组合枝是从一个个支付组合枝是从一个决策结到下一个后续结决策结到下一个后续结的连线,如图的连线,如图10-2中的中的六个箭头六个箭头“”,它表,它表示参与人的行动选择。示参与人的行动选择。3131微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组扩展式表述的博弈举例扩展式表述的博弈举例看下面这个市场销售的博弈。某销售者在市场上推销看下面这个市场销售的博弈。某销售者在市场上
38、推销某种商品,其行动空间是高价,低价。当销售者选择某种商品,其行动空间是高价,低价。当销售者选择“高价高价”时,购买者有多时,购买者有多购和少购两种选择,但少购和少购两种选择,但少购能得到更多支付(因为购能得到更多支付(因为这样可以通过购买更多其这样可以通过购买更多其他商品来得到支付);同他商品来得到支付);同样,当销售者选择样,当销售者选择“低价低价”时,购买者也有多购和时,购买者也有多购和少购两种选择。少购两种选择。少购图10-3市场销售博弈的博弈树销售者购买者高价低价多购少购(4,1)(2,7)购买者多购(6,8)(0,3)3232微观经济学第十章 博弈论南开大学西方经济学课程组南开大学
39、西方经济学课程组二、子博弈精炼纳什均衡二、子博弈精炼纳什均衡如果采用参与者同时行动的静态博弈分析方法分析动如果采用参与者同时行动的静态博弈分析方法分析动态博弈,得到的纳什均衡中就会存在不合理的均衡策略。态博弈,得到的纳什均衡中就会存在不合理的均衡策略。泽尔腾通过对动态博弈的分析完善了纳什均衡的概念,定泽尔腾通过对动态博弈的分析完善了纳什均衡的概念,定义了义了“子博弈精炼纳什均衡子博弈精炼纳什均衡”。纳什均衡与不可置信威胁纳什均衡与不可置信威胁仍以市场销售的博弈为例。为了构造这个动态博弈的策仍以市场销售的博弈为例。为了构造这个动态博弈的策略式表述,先来分析销售者和购买者的策略空间。略式表述,先来
40、分析销售者和购买者的策略空间。3333微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组销售者先行动,有两种策略:高价和低价。购买者后销售者先行动,有两种策略:高价和低价。购买者后行动,根据销售者的行动,就有四种策略:高价时多购,行动,根据销售者的行动,就有四种策略:高价时多购,低价时少购;高价时多购,低价时多购;高价时少购,低低价时少购;高价时多购,低价时多购;高价时少购,低价时少购;高价时少购,低价时多购。将这四种策略分别价时少购;高价时少购,低价时多购。将这四种策略分别简记为:高多低少;高多低多;高少低少;高少低多。简记为:高多低少;高多低多;高少低少;高少低多。表
41、表10-8市场销售博弈的策略式表述市场销售博弈的策略式表述6,80,3低价低价4,14,1高价高价销销售者售者高多低少高多低少购买购买者者0,32,7高多低多高多低多高少低少高少低少 高少低多高少低多6,82,73434微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组表表10-810-8对市场销售的博弈分析使用的是静态分析方法,对市场销售的博弈分析使用的是静态分析方法,得到三个纳什均衡:得到三个纳什均衡:(高价,高少低少高价,高少低少);(低价,高多低低价,高多低多多);(低价,高少低多低价,高少低多)。但究竟哪一个均衡实际上会发。但究竟哪一个均衡实际上会发生,静态分析
42、难以确定。更严重的是,在纳什均衡中,参生,静态分析难以确定。更严重的是,在纳什均衡中,参与人在选择自己的策略时,把其他参与人的策略当作是给与人在选择自己的策略时,把其他参与人的策略当作是给定的,同时也不考虑自己的选择如何影响对手。所以说,定的,同时也不考虑自己的选择如何影响对手。所以说,纳什均衡允许了纳什均衡允许了“不可置信威胁不可置信威胁”的存在。的存在。不可置信威胁不可置信威胁是指,对于先行动的参与人来说,后行动的参与人的选择是指,对于先行动的参与人来说,后行动的参与人的选择空间依赖于先行动者的选择,在先行动者已做出行动选择空间依赖于先行动者的选择,在先行动者已做出行动选择的前提下,有一些
43、对先行动者不利的策略将不会被后行动的前提下,有一些对先行动者不利的策略将不会被后行动者选择,即这些策略是不可置信的。者选择,即这些策略是不可置信的。3535微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组例如,对于策略组合(高价,高少低少)来说,意味例如,对于策略组合(高价,高少低少)来说,意味着不管销售者采取高价策略还是低价策略,购买者将始终着不管销售者采取高价策略还是低价策略,购买者将始终会少购,在这个策略威胁下,销售者就不会采取低价策略,会少购,在这个策略威胁下,销售者就不会采取低价策略,否则得到的支付为否则得到的支付为0 0。销售者并不会相信这个威胁。在销。销售
44、者并不会相信这个威胁。在销售者真的选择低价时,如果购买者是理性的就会选择多购:售者真的选择低价时,如果购买者是理性的就会选择多购:少购得到的支付是少购得到的支付是3 3,多购却是,多购却是8 8。可见,纳什均衡(高价,。可见,纳什均衡(高价,高少低少)就是不可置信的。高少低少)就是不可置信的。子博弈的概念子博弈的概念子博弈子博弈:指从每一个行动选择(即一个决策结)开始:指从每一个行动选择(即一个决策结)开始至博弈结束这一阶段的行动过程,是原博弈的一部分。至博弈结束这一阶段的行动过程,是原博弈的一部分。3636微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组市场销售博弈的
45、博弈树市场销售博弈的博弈树如图如图10-4的的图所示;决图所示;决策点策点x和它的后续点构成和它的后续点构成一个子博弈,如图一个子博弈,如图10-4的的图所示;决策点图所示;决策点y和它和它的后续点也构成一个子的后续点也构成一个子博弈,如图博弈,如图10-4的的图所图所示。另外,原博弈自身示。另外,原博弈自身也是自己的一个子博弈。也是自己的一个子博弈。这样,这样,市场销售博弈共市场销售博弈共有三个子博弈有三个子博弈。y销售者购买者高价购买者购买者xx多购少购多购少购y少购多购少购图10-4市场销售博弈的博弈树低价(4,1)(2,7)多购(6,8)(0,5)原博弈(4,1)(2,7)购买者(6,
46、8)(0,5)子博弈a子博弈b3737微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组子博弈精炼纳什均衡子博弈精炼纳什均衡泽尔腾定义的子博弈精炼纳什均衡是纳什均衡的一个泽尔腾定义的子博弈精炼纳什均衡是纳什均衡的一个重要改进,分开了动态博弈中的重要改进,分开了动态博弈中的“合理的纳什均衡合理的纳什均衡”和和“不合理的纳什均衡不合理的纳什均衡”。正如纳什均衡是完全信息静态博弈。正如纳什均衡是完全信息静态博弈解的一般概念一样,解的一般概念一样,子博弈精炼纳什均衡是完全信息动态子博弈精炼纳什均衡是完全信息动态博弈解的一般概念博弈解的一般概念。子博弈精炼纳什均衡定义如下:子博弈精
47、炼纳什均衡定义如下:如果一个扩展式表述如果一个扩展式表述的策略组合是其原博弈的纳什均衡,又给出其每一个子博的策略组合是其原博弈的纳什均衡,又给出其每一个子博弈上的纳什均衡,那么它就是一个子博弈精炼纳什均衡弈上的纳什均衡,那么它就是一个子博弈精炼纳什均衡。3838微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组仍以市场销售博弈为例。仍以市场销售博弈为例。在子博弈在子博弈a a中,购买者的最中,购买者的最优选择优选择“少购少购”,在子博弈,在子博弈b b中,购买者的最优选择中,购买者的最优选择“多多购购”。纳什均衡(高价,高少低少)中购买者的均衡战略。纳什均衡(高价,高少低
48、少)中购买者的均衡战略“高少低少高少低少”,给出了子博弈,给出了子博弈a a上的纳什均衡(少购),上的纳什均衡(少购),却没有给出子博弈却没有给出子博弈b b上的纳什均衡上的纳什均衡,所以(高价,高少低,所以(高价,高少低少)不是子博弈精炼纳什均衡。同样,(低价,高多低多)少)不是子博弈精炼纳什均衡。同样,(低价,高多低多)也不是子博弈精炼纳什均衡。而对于纳什均衡(低价,高也不是子博弈精炼纳什均衡。而对于纳什均衡(低价,高少低多)中购买者的均衡战略少低多)中购买者的均衡战略“高少低多高少低多”来说,既给出来说,既给出子博弈子博弈a a上的纳什均衡也给出了子博弈上的纳什均衡也给出了子博弈b b上
49、的纳什均衡(即上的纳什均衡(即高价时将少购,低价时将多购),所以(低价,高少低多)高价时将少购,低价时将多购),所以(低价,高少低多)才是子博弈精炼纳什均衡。才是子博弈精炼纳什均衡。3939微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组逆向归纳法求解子博弈精炼纳什均衡逆向归纳法求解子博弈精炼纳什均衡用逆向归纳法求解市场销售博弈的中子博弈精炼纳什用逆向归纳法求解市场销售博弈的中子博弈精炼纳什均衡如下。均衡如下。销售者购买者高价低价多购少购购买者多购少购购买者高价低价少购多购购买者多购少购图10-5逆向归纳法求解子博弈精炼纳什均衡(4,1)(2,7)(6,8)(0,3)最
50、后决策结上子博弈的纳什均衡销售者(4,1)(2,7)(6,8)(0,3)回溯到初始决策结上的纳什均衡4040微观经济学第十章 博弈论南开大学西方经济学课程组南开大学西方经济学课程组承诺与子博弈精炼纳什均衡承诺与子博弈精炼纳什均衡承诺行动承诺行动:指当事人在不施行这种不可置信的威胁时:指当事人在不施行这种不可置信的威胁时就会付出更大的代价,尽管这一代价不一定发生,但承诺就会付出更大的代价,尽管这一代价不一定发生,但承诺行动会给当事人带来很大的好处,因为它可以改变均衡结行动会给当事人带来很大的好处,因为它可以改变均衡结果。在上面的例子中,子博果。在上面的例子中,子博弈精炼纳什均衡的策略组合弈精炼纳