《微观经济学 第9章hmrp.pptx》由会员分享,可在线阅读,更多相关《微观经济学 第9章hmrp.pptx(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章第八章 博弈论博弈论 要解决的问题:要解决的问题:人们之间决人们之间决策的相互作用、相互影响。策的相互作用、相互影响。博弈论又称为对策论或游戏论博弈论又称为对策论或游戏论博弈论又称为对策论或游戏论博弈论又称为对策论或游戏论,是研究决策主,是研究决策主,是研究决策主,是研究决策主体的行为发生直接相互作用时的决策以及这种决策体的行为发生直接相互作用时的决策以及这种决策体的行为发生直接相互作用时的决策以及这种决策体的行为发生直接相互作用时的决策以及这种决策的均衡问题。的均衡问题。的均衡问题。的均衡问题。严格地说,博弈论并不是经济学的一个分支。严格地说,博弈论并不是经济学的一个分支。严格地说,博
2、弈论并不是经济学的一个分支。严格地说,博弈论并不是经济学的一个分支。它是一种方法,应用范围并不局限于经济学。在政它是一种方法,应用范围并不局限于经济学。在政它是一种方法,应用范围并不局限于经济学。在政它是一种方法,应用范围并不局限于经济学。在政治学、军事学、外交学甚至犯罪学等多个领域都涉治学、军事学、外交学甚至犯罪学等多个领域都涉治学、军事学、外交学甚至犯罪学等多个领域都涉治学、军事学、外交学甚至犯罪学等多个领域都涉及到博弈论知识。实际上,它属于数学知识。及到博弈论知识。实际上,它属于数学知识。及到博弈论知识。实际上,它属于数学知识。及到博弈论知识。实际上,它属于数学知识。近近近近202020
3、20年来,博弈论在经济学中得到了广泛的应年来,博弈论在经济学中得到了广泛的应年来,博弈论在经济学中得到了广泛的应年来,博弈论在经济学中得到了广泛的应用,它对寡头理论、信息经济学等方面的发展做出用,它对寡头理论、信息经济学等方面的发展做出用,它对寡头理论、信息经济学等方面的发展做出用,它对寡头理论、信息经济学等方面的发展做出了重要贡献。了重要贡献。了重要贡献。了重要贡献。1994 1994年度的诺贝尔经济学奖授予三位从事对年度的诺贝尔经济学奖授予三位从事对策论研究的经济学家:策论研究的经济学家:纳什、泽尔腾、海萨尼。纳什、泽尔腾、海萨尼。20052005年诺贝尔经济学奖授予有以色列和美国双重年诺
4、贝尔经济学奖授予有以色列和美国双重国籍的国籍的罗伯特罗伯特奥曼奥曼和美国人和美国人托马斯托马斯谢林谢林,以,以表彰他们通过博弈理论的分析增强世人对合作与表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。冲突的理解。博弈在经济学中应用最广、最成功,其根本博弈在经济学中应用最广、最成功,其根本原因是经济学和博弈论的研究模式是一样的,都原因是经济学和博弈论的研究模式是一样的,都强调强调个人理性个人理性,即追求给定条件下效用最大化。,即追求给定条件下效用最大化。在一个博弈中,基本要素包括参与人或在一个博弈中,基本要素包括参与人或游戏者、行动、信息、战略、收益或支付、游戏者、行动、信息、战略、收益或
5、支付、结果、均衡等。结果、均衡等。第一节第一节 博弈论基本概念博弈论基本概念一、博弈的基本要素一、博弈的基本要素参与人参与人参与人参与人(playersplayers):指的是在博弈中选择行动以最指的是在博弈中选择行动以最指的是在博弈中选择行动以最指的是在博弈中选择行动以最大化自己效用的决策主体(可能是个人,也可能大化自己效用的决策主体(可能是个人,也可能大化自己效用的决策主体(可能是个人,也可能大化自己效用的决策主体(可能是个人,也可能是团体)。是团体)。是团体)。是团体)。行动行动行动行动(actions)actions):指的是指的是指的是指的是参与人的决策参与人的决策参与人的决策参与人
6、的决策变变变变量量量量。战战战战略略略略(strategiesstrategies):参与人选择行动的规则,参与人选择行动的规则,参与人选择行动的规则,参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。它告诉参与人在什么时候选择什么行动。它告诉参与人在什么时候选择什么行动。它告诉参与人在什么时候选择什么行动。信息信息信息信息(Information)Information):指的是参与人在博弈中的:指的是参与人在博弈中的:指的是参与人在博弈中的:指的是参与人在博弈中的知识,特别是有关其它知识,特别是有关其它知识,特别是有关其它知识,特别是有关其它参与人的特征和行参与人的特征和行参与人的
7、特征和行参与人的特征和行动动动动的知的知的知的知识识识识。uu在每一个博弈中,都至少有两个参与者,每在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选择的策略。作为博一个参与者都有一组可选择的策略。作为博弈的结局,每个参与者都得到各自的报酬。弈的结局,每个参与者都得到各自的报酬。每一个参与者的报酬都是所有参与者各自所每一个参与者的报酬都是所有参与者各自所选择的策略的共同作用的结果选择的策略的共同作用的结果,或者说是所,或者说是所有参与者所采用的策略的函数有参与者所采用的策略的函数报酬函数报酬函数或支付函数。或支付函数。uu可以用一个可以用一个支付矩阵支付矩阵来描述和分析一个博弈。来描
8、述和分析一个博弈。假定两个嫌疑犯作案后被警察抓住假定两个嫌疑犯作案后被警察抓住,分别分别被关在不同的屋子里审讯。警察告诉他们被关在不同的屋子里审讯。警察告诉他们:如如果都坦白果都坦白,两人要被各判刑两人要被各判刑7 7年;如果都抵赖年;如果都抵赖,两人可以各判两人可以各判1 1年;如果一人坦白而另一人抵年;如果一人坦白而另一人抵赖赖,则坦白的放出去则坦白的放出去,抵赖的要被判刑抵赖的要被判刑9 9年。年。囚徒困境囚徒困境-1 -1-9 00 -9-7 -7囚囚犯犯A A坦白坦白不坦白不坦白囚犯囚犯B B坦白坦白不坦白不坦白战略式表述战略式表述 二、博弈的分类二、博弈的分类可以从不同的角度对博弈
9、进行分类可以从不同的角度对博弈进行分类1 1、双人博弈和、双人博弈和n n人博弈人博弈 根据局中人的数量,博弈可以划分为双根据局中人的数量,博弈可以划分为双人博弈和人博弈和n n人博弈人博弈2 2、合作博弈与非合作博弈、合作博弈与非合作博弈3 3、根据行动的先后顺序:、根据行动的先后顺序:静态博弈静态博弈:是指参与人同时行动或不同时行:是指参与人同时行动或不同时行动,但后行动者并不知道先行动者采取了什么动,但后行动者并不知道先行动者采取了什么具体行动。具体行动。田忌赛马、猜硬币、古诺模型田忌赛马、猜硬币、古诺模型田忌赛马、猜硬币、古诺模型田忌赛马、猜硬币、古诺模型 动态博弈动态博弈:是指参与人
10、行动有先后顺序,且:是指参与人行动有先后顺序,且后行动者能观察到先行动者所选择的行动。后行动者能观察到先行动者所选择的行动。弈棋、市场进入、斯塔克尔伯格模弈棋、市场进入、斯塔克尔伯格模弈棋、市场进入、斯塔克尔伯格模弈棋、市场进入、斯塔克尔伯格模型型型型4 4、根据参与人掌握的信息、根据参与人掌握的信息n n完全信息博弈完全信息博弈:每一个参与人对所有其他参:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数与人(对手)的特征、战略空间及支付函数有准确的知识。有准确的知识。n n不完全信息博弈不完全信息博弈:至少部分参与人不完全了:至少部分参与人不完全了解其他参与人的特征、战略空间及
11、支付函数解其他参与人的特征、战略空间及支付函数的情况,也称为的情况,也称为“不对称信息博弈不对称信息博弈”行动顺序行动顺序 信息信息静态静态动态动态完全完全信息信息完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡纳什纳什完全信息动态博弈完全信息动态博弈子博弈精炼纳什均衡子博弈精炼纳什均衡泽尔腾泽尔腾不完全不完全信息信息不完全信息静态博弈不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡海萨尼海萨尼不完全信息动态博弈不完全信息动态博弈精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡泽尔腾、克瑞普斯、泽尔腾、克瑞普斯、威尔逊、泰勒尔威尔逊、泰勒尔第二节第二节 完全信息静态博弈完全信息静态博弈 占优战略均衡占优战略
12、均衡是指参与人的最优战略是指参与人的最优战略不依不依赖赖于其他参与人的战略选择。不论其他参与人于其他参与人的战略选择。不论其他参与人选择什么战略,他的最优战略是唯一的,这个选择什么战略,他的最优战略是唯一的,这个最优战略被称为占优战略。最优战略被称为占优战略。在一个博弈中,如果所有参与人都有占优在一个博弈中,如果所有参与人都有占优战略,那么所有参与人的占优战略组合便是该战略,那么所有参与人的占优战略组合便是该博弈的唯一均衡,叫博弈的唯一均衡,叫占优战略均衡占优战略均衡。一、占优战略均衡一、占优战略均衡-1 -1-9 00 -9-7 -7囚囚犯犯A A坦白坦白不坦白不坦白囚犯囚犯B B坦白坦白不
13、坦白不坦白囚徒困境囚徒困境()170 16080 180200 50150 100厂厂商商A A10102020厂商厂商B B10102020 练习:价格竞争策略练习:价格竞争策略()二、重复剔除的占优均衡二、重复剔除的占优均衡 首先找出某一参与人的严格劣战略,将首先找出某一参与人的严格劣战略,将它它剔除剔除掉,重新构造一个不包括已剔除战略掉,重新构造一个不包括已剔除战略的新的博弈,然后继续的新的博弈,然后继续剔除剔除这个新的博弈中这个新的博弈中某一参与人的严格劣战略,直到剩下唯一的某一参与人的严格劣战略,直到剩下唯一的参与人战略组合为止。这个参与人战略组合为止。这个唯一剩下的参与唯一剩下的参
14、与人的战略组合人的战略组合,就是博弈的均衡解,称为,就是博弈的均衡解,称为“重复剔除的占优战略均衡重复剔除的占优战略均衡”。有一头大猪和一头小猪住在同一个猪圈里,猪有一头大猪和一头小猪住在同一个猪圈里,猪圈的一侧放者猪食槽,另一侧安装着一个控制圈的一侧放者猪食槽,另一侧安装着一个控制食物供应的按钮。按一次按钮,有食物供应的按钮。按一次按钮,有8 8个单位的个单位的食物进槽,但需承担食物进槽,但需承担2 2个单位的成本。偌大猪个单位的成本。偌大猪小猪同时到达猪食槽,大猪吃到小猪同时到达猪食槽,大猪吃到5 5个单位的食个单位的食物,小猪吃到物,小猪吃到3 3个单位的食物;若大猪先到,个单位的食物;
15、若大猪先到,大猪吃大猪吃7 7个单位的食物,小猪只能吃到个单位的食物,小猪只能吃到1 1个单个单位;若小猪先到,小猪吃到位;若小猪先到,小猪吃到4 4个单位食物,大个单位食物,大猪也吃到猪也吃到4 4个单位食物。个单位食物。例子:智猪博弈例子:智猪博弈 0 07 -1 2 43 1大大猪猪按按等待等待小猪小猪按按等待等待小猪的理性小猪的理性选择是选择是“等等待待”,那么,那么大猪就会正大猪就会正确的预测到确的预测到小猪的选择小猪的选择而将而将“等待等待”剔除,剔除,(按,等待)(按,等待)是该博弈的是该博弈的唯一均衡。唯一均衡。大猪的收益外部化,小猪不劳而获,大猪的收益外部化,小猪不劳而获,免
16、费搭了大猪的便车。免费搭了大猪的便车。3,6 7,1 5,1 8,2 6,0 6,2游戏者游戏者B B U U V V游戏者游戏者A AX XY YZ Z练习:寻找占优战略均衡?练习:寻找占优战略均衡?()三、纳什均衡三、纳什均衡uu纳什均衡纳什均衡是指这样一种均衡状态,在这一均衡状是指这样一种均衡状态,在这一均衡状态中,每一个参与人选择的战略必须是针对其他态中,每一个参与人选择的战略必须是针对其他参与人选择战略的最优反映,没有人愿意独立放参与人选择战略的最优反映,没有人愿意独立放弃他所选择的战略。弃他所选择的战略。uu纳什均衡要求任何一个参与者在其他参与者的策纳什均衡要求任何一个参与者在其他
17、参与者的策略选择给定的条件下,其选择的策略是最优的。略选择给定的条件下,其选择的策略是最优的。uu在一个纳什均衡里,任何一个参与者都不会改变在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略。自己的策略,如果其他参与者不改变策略。占优策略均衡是比纳什均衡更强的一个占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者任何策略选择来说,参与者对于其他参与者任何策略选择来说,其最优策略都是唯一的。而纳什均衡只要求其最优策略都是唯一的。而纳什均衡只要求任何一个参与者在其他参与者的策略选择给任何一个
18、参与者在其他参与者的策略选择给定的条件下,其选择的策略是最优的。所以,定的条件下,其选择的策略是最优的。所以,占优策略均衡一定是纳什均衡,而纳什均衡占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡。不一定就是占优策略均衡。-1 -1-9 00 -9-7 -7囚囚犯犯A A坦白坦白不坦白不坦白囚犯囚犯B B坦白坦白不坦白不坦白囚徒困境囚徒困境 0,6 6,0 7,5 6,0 0,6 7,5 5,7 5,5 8,8游戏者游戏者B B U U V WV W游戏者游戏者A AX XY YZ Z练习:寻找纳什均衡?练习:寻找纳什均衡?囚徒困境的启示囚徒困境的启示n n个体理性与集体理性的矛盾
19、。个体理性与集体理性的矛盾。n n可以解释的问题可以解释的问题:寡头厂商关于价格、产量的博弈寡头厂商关于价格、产量的博弈公共资源的供给问题公共资源的供给问题军备竞赛军备竞赛n n一种制度安排或一种体制选择,要发生效力,一种制度安排或一种体制选择,要发生效力,它必须是纳什均衡。否则,这种制度安排是它必须是纳什均衡。否则,这种制度安排是不能成立的。不能成立的。例子:性别战例子:性别战 1 2 1 20 0 0 0 0 00 02 12 1男男看足球看足球看电影看电影女女看足球看足球看电影看电影n n纳什均衡纳什均衡常常不是唯一的,在这种条件下,常常不是唯一的,在这种条件下,纳什均衡的存在性并不意味
20、着均衡结果会纳什均衡的存在性并不意味着均衡结果会出现,即使结果是一个纳什均衡,但也是出现,即使结果是一个纳什均衡,但也是我们无法准确预测的;我们无法准确预测的;n n经济学家的建议是:可以增加更多的限制经济学家的建议是:可以增加更多的限制条件,如增加参与人的其他信息,使得纳条件,如增加参与人的其他信息,使得纳什均衡的数目减少,从而做出预测。什均衡的数目减少,从而做出预测。纳什均衡纳什均衡纳什均衡是博弈的结局,在该均衡中每个局中纳什均衡是博弈的结局,在该均衡中每个局中人均不能因单方面改变自己的策略选择而获益。人均不能因单方面改变自己的策略选择而获益。纳什均衡是一个僵局:给定别人不动的情况下,纳什
21、均衡是一个僵局:给定别人不动的情况下,没有人有兴趣动。没有人有兴趣动。纳什均衡可以理解为一种具有自我强制力的协纳什均衡可以理解为一种具有自我强制力的协议,即这种协议没有外加力量保证实施却使每议,即这种协议没有外加力量保证实施却使每个参与者都自愿遵守,原因就在背叛协议无利个参与者都自愿遵守,原因就在背叛协议无利可图。可图。四、混合战略纳什均衡四、混合战略纳什均衡 混合战略指的是参与人以一定的概率钻则混合战略指的是参与人以一定的概率钻则某种战略,导致其他人不能准确的猜出它实际的某种战略,导致其他人不能准确的猜出它实际的选择。选择。甲乙两个人玩同时掷硬币游甲乙两个人玩同时掷硬币游戏。两人约定,如果两
22、枚硬币正戏。两人约定,如果两枚硬币正面或反面同时朝上,则甲付给乙面或反面同时朝上,则甲付给乙1 1块钱;如果出现一正一帆,则乙块钱;如果出现一正一帆,则乙付给甲付给甲1 1块钱。块钱。-1 1-1 11 -11 -11 -11 -1-1 1-1 1 甲甲 正面正面 反面反面乙乙 正面正面反面反面例子:猜硬币例子:猜硬币n如果每一个参与人完全清楚对手将会采取什如果每一个参与人完全清楚对手将会采取什么样的战略,则不会出现均衡。么样的战略,则不会出现均衡。n在实际博弈中,每个参与人都试图猜中对方在实际博弈中,每个参与人都试图猜中对方的战略,然后自己采用相应的战略,因此双的战略,然后自己采用相应的战略
23、,因此双方都以随机的方法去出示硬币是最安全的,方都以随机的方法去出示硬币是最安全的,也是最优的。这样一来,参与人的战略选择也是最优的。这样一来,参与人的战略选择变成不确定的,是遵从某一概率分布的随机变成不确定的,是遵从某一概率分布的随机选择。选择。n假设参与人甲选择正面的概率为假设参与人甲选择正面的概率为p,选择背,选择背面的概率为面的概率为1-p;参与人乙选择正面的概率参与人乙选择正面的概率为为q,选择背面的概率为,选择背面的概率为1-q。n参与人甲的收益是:参与人甲的收益是:这表明当甲乙两个人分别以这表明当甲乙两个人分别以50%50%的概的概率选择正面和背面的次数时,对策达到率选择正面和背
24、面的次数时,对策达到了纳什均衡。了纳什均衡。第三节第三节 完全信息动态博弈完全信息动态博弈 在上面的分析中,所有的对局者仅对抗在上面的分析中,所有的对局者仅对抗一次,不会重复进行。这是一种一次,不会重复进行。这是一种静态博弈静态博弈。但是在现实中,同样结构的博弈可能要重复但是在现实中,同样结构的博弈可能要重复许多次。在对局可以多次重复的情况下,每许多次。在对局可以多次重复的情况下,每个对局者在选择策略的时候,不仅需要考虑个对局者在选择策略的时候,不仅需要考虑当前的对局,可能还要考虑当前的对局,可能还要考虑当前选择的策略当前选择的策略对于以后的对局将产生什么影响对于以后的对局将产生什么影响。一、
25、重复博弈一、重复博弈 如果博弈重复多次,每个参与人都有机如果博弈重复多次,每个参与人都有机会树立合作的信誉,并鼓励对方也树立起合会树立合作的信誉,并鼓励对方也树立起合作的信誉以换取作的信誉以换取双赢双赢的机会。的机会。145 145 145 145180 30180 30180 30180 30100 100100 100厂厂商商A A10102020厂商厂商B B10102020二、序列博弈二、序列博弈 在实践中,还存在着另一种情况,参在实践中,还存在着另一种情况,参与者的行动有与者的行动有先后顺序先后顺序,而且后行动的参,而且后行动的参与者在自己行动之前可以观测到先行动者与者在自己行动之前可以观测到先行动者的行动,并选择相应的战略。这种博弈称的行动,并选择相应的战略。这种博弈称为为序列博弈序列博弈,是动态博弈的一种形式。,是动态博弈的一种形式。0 0 0 00 1000 100100 0100 0-50 -50-50 -50厂厂商商A A进入进入不进入不进入厂商厂商B B进入进入不进入不进入A AB BB B不进入不进入不进入不进入进入进入进入进入不进入不进入不进入不进入不进入不进入不进入不进入进入进入进入进入进入进入进入进入(-50-50,-50-50)(100100,0 0)(0 0,100100)(0 0,0 0)