《博弈论与信息经济学优秀课件.ppt》由会员分享,可在线阅读,更多相关《博弈论与信息经济学优秀课件.ppt(110页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、博弈论与信息经济学第1页,本讲稿共110页关于博弈论的某些光环博弈论很时髦,也有点神秘,谁懂博弈博弈论很时髦,也有点神秘,谁懂博弈论,或在文章中使用博弈方法,似乎很论,或在文章中使用博弈方法,似乎很有面子有面子Why?因为它以数学为基础,似乎不容易因为它以数学为基础,似乎不容易学懂学懂它有广泛的用途,但很直接有效的运用它有广泛的用途,但很直接有效的运用似乎也不多见似乎也不多见发展很快发展很快第2页,本讲稿共110页这些光环的一点猜测性说明它曾经很落寞,少数人自己玩得很高兴它曾经很落寞,少数人自己玩得很高兴它它1994获得诺贝尔奖了,好莱坞居然还拿获得诺贝尔奖了,好莱坞居然还拿纳什的故事拍电影纳
2、什的故事拍电影它来自数学,对数学不太有感觉的人会觉它来自数学,对数学不太有感觉的人会觉得它很枯燥,而数学意识强的人却觉得它得它很枯燥,而数学意识强的人却觉得它很好玩很好玩还不够成熟,因为它还不够成熟,因为它“重在建设重在建设”我国的博弈论运用还很落后,几乎看不到我国的博弈论运用还很落后,几乎看不到高水平的运用高水平的运用第3页,本讲稿共110页博弈论之“数学”的特征只是数学思维、数学符号只是数学思维、数学符号,有些符号怪模怪有些符号怪模怪样样,甚至不会读甚至不会读,但很少有什么艰深的数学但很少有什么艰深的数学这里的符号比较麻烦,因为它和代数中的这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意
3、义的符号不同,在脑子里纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义要时刻记得它们的实际意义但要熟悉这种简捷、抽象的思维方式,记但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义住这些符号的代表意义所以,一个比较有效的学习方法是重复所以,一个比较有效的学习方法是重复第4页,本讲稿共110页博弈论的开拓之功“开拓开拓”一般具备什么特征?一般具备什么特征?从学理看:新方法,新模式,新领域从学理看:新方法,新模式,新领域从功效看:新办法,新答案从功效看:新办法,新答案博弈论兼有之博弈论兼有之新方法:不同主体之间数量比较和概率思想的结合新方法:不同主体之间数量比较和概率思想的结合新
4、模式:经验层次的一些新模式:经验层次的一些“高妙手段高妙手段”具有逻辑刚性,具有逻辑刚性,并非巧合,如并非巧合,如“囚徒困境囚徒困境”新领域:突破了传统经济学的苛刻假设,而且把触角不客新领域:突破了传统经济学的苛刻假设,而且把触角不客气地伸到政治、管理、系统论等领域气地伸到政治、管理、系统论等领域第5页,本讲稿共110页博弈论在研究对象之特点上的根本不同通常的学问或理论体系都以通常的学问或理论体系都以“系统内系统内”为研为研究对象究对象,如果研究多个主体之间的关系,也须如果研究多个主体之间的关系,也须纳入一个框架之中。每个学科都有自己的纳入一个框架之中。每个学科都有自己的“整体观整体观”显然,
5、这里有明显的传统科学理性显然,这里有明显的传统科学理性的风味。的风味。博弈论根本不同,它直接研究几个在逻辑层博弈论根本不同,它直接研究几个在逻辑层次上并列的主体之间的关系。看似简单的方次上并列的主体之间的关系。看似简单的方法,其实开创了一个思路。法,其实开创了一个思路。它之所以不被广泛应用的一个猜测是:人们它之所以不被广泛应用的一个猜测是:人们目前还不熟悉、不适应这种多维的思维方式。目前还不熟悉、不适应这种多维的思维方式。第6页,本讲稿共110页博弈论在思维方式上的特点习见的思维方式:习见的思维方式:还原论:整体可无穷拆分为不同级别的个体还原论:整体可无穷拆分为不同级别的个体目的论:事物的发展
6、有其目标目的论:事物的发展有其目标其他事物不变其他事物不变博弈论思维方式博弈论思维方式历史理性历史理性多元化、相对化、历史化多元化、相对化、历史化事物并不存在一种内在的、永恒的、抽象的事物并不存在一种内在的、永恒的、抽象的“本质本质”,而只有一种,而只有一种在特定历史框架中的建构。在特定历史框架中的建构。对传统经济学的启发对传统经济学的启发:将研究对象转向个体,放弃一些没有微观:将研究对象转向个体,放弃一些没有微观基础的假设,如消费函数及其投资函数,而在给出个人的支付基础的假设,如消费函数及其投资函数,而在给出个人的支付函数及战略空间的条件下,研究每个人都选择其最优战略以最函数及战略空间的条件
7、下,研究每个人都选择其最优战略以最大化个人支付函数时将发生什么。大化个人支付函数时将发生什么。第7页,本讲稿共110页博弈论的学习特点很多人对博弈论有所期待,似乎它有很很多人对博弈论有所期待,似乎它有很强的功效。的确,犹如数学,力量很强,强的功效。的确,犹如数学,力量很强,无处不在,作用非常广泛而深刻,但学无处不在,作用非常广泛而深刻,但学习的时候很枯燥习的时候很枯燥因其与数学密切相关,关于博弈论素养因其与数学密切相关,关于博弈论素养的提高要靠自己的学习、揣摩和领悟的提高要靠自己的学习、揣摩和领悟习薫悟化习薫悟化注重数学的严谨,注意基本功注重数学的严谨,注意基本功得鱼忘筌,得意忘形得鱼忘筌,得
8、意忘形第8页,本讲稿共110页本课程的阅读文献张维迎张维迎博弈论与信息经济学博弈论与信息经济学为主要教材为主要教材通俗读物:王则柯通俗读物:王则柯博弈论平话博弈论平话、白波、白波博弈游博弈游戏戏、潘天群、潘天群博弈生存博弈生存参考书籍:谢识予参考书籍:谢识予经济博弈论经济博弈论、姚国庆、姚国庆博弈论博弈论(南开南开),拉斯缪森,拉斯缪森博弈与信息博弈与信息(北大与三联北大与三联)、弗登博格弗登博格博弈论博弈论(人民大学人民大学),信息经济学信息经济学(湖北湖北)期刊文章:非常多,关于博弈论基本问题的文章自期刊文章:非常多,关于博弈论基本问题的文章自1995陆续发表。但我国直接研究博弈论理论的文
9、章不陆续发表。但我国直接研究博弈论理论的文章不多,应用博弈论方法的文章非常多,但水平低多,应用博弈论方法的文章非常多,但水平低第9页,本讲稿共110页0.导论:博弈论与经济学0.10.1博弈论与主流经济学的发展博弈论与主流经济学的发展传统经济学的局限以及博弈论对经济学的重传统经济学的局限以及博弈论对经济学的重要影响要影响0.20.2基本内容的概述基本内容的概述非合作博弈的非技术性概述非合作博弈的非技术性概述第10页,本讲稿共110页0.1博弈论与主流经济学的发展传统经济学的假设及其局限性传统经济学的假设及其局限性二基本假设:完全竞争,完美信息二基本假设:完全竞争,完美信息局限性:交易主体的数量
10、其实很有限;信息是不对称的局限性:交易主体的数量其实很有限;信息是不对称的一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完美的,帕累托最优成立,平等与效率可以兼顾。然而在以下情况不美的,帕累托最优成立,平等与效率可以兼顾。然而在以下情况不成立:成立:非完全竞争:垄断越来越普遍非完全竞争:垄断越来越普遍外部性:市场不可能把所有的成本收益都计算在内外部性:市场不可能把所有的成本收益都计算在内公共产品:市场无非解决公共产品:市场无非解决“搭便车搭便车”问题问题逆向选择问题:柠檬市场逆向选择问题:柠檬市场道德风险问题:为什么市场的交易
11、费用比较高?道德风险问题:为什么市场的交易费用比较高?百年来,经济学的主要发展围绕以上五方面,如垄断竞争理论、产业百年来,经济学的主要发展围绕以上五方面,如垄断竞争理论、产业组织理论、企业理论、信息经济学、新制度经济学、不确定下的决策组织理论、企业理论、信息经济学、新制度经济学、不确定下的决策(投资理论投资理论),宏观经济学宏观经济学第11页,本讲稿共110页0.1博弈论与主流经济学的发展传统微观经济学与博弈论的比较传统微观经济学与博弈论的比较传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他
12、人无涉,所有其他人的行为都被大化自己的效用,个人的效用与其他人无涉,所有其他人的行为都被总结在总结在“价格价格”参数之中参数之中博弈论中,个人效用不仅依赖于自己的选择,还以来于他人的选博弈论中,个人效用不仅依赖于自己的选择,还以来于他人的选择,研究在存在外部经济条件下的个人选择问题择,研究在存在外部经济条件下的个人选择问题事实上事实上,行为主体的数量通常不多行为主体的数量通常不多,相互之间存在明显影响相互之间存在明显影响经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个博弈论改写经济
13、学,从放宽新古典的完全竞争和完全信息两个条件展开条件展开第12页,本讲稿共110页0.1博弈论与主流经济学的发展国外经济学教科书改写,加入大量博弈论内容国外经济学教科书改写,加入大量博弈论内容博弈论进入主流经济学,反映了:博弈论进入主流经济学,反映了:经济学的研究对象越来越转向个体放弃了有些没有微观基经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设础的假设经济学的研究对象越来越转向人与人之间行为的相互影响和作用经济学的研究对象越来越转向人与人之间行为的相互影响和作用经济学越来越重视对信息的研究经济学越来越重视对信息的研究传统微观经济学的工具是数学传统微观经济学的工具是数学(微积分、线
14、性代数、微积分、线性代数、统计学统计学),而博弈论是一种新的数学。以前只有陆,而博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异不可以道里计军,现在有了空军,其差异不可以道里计第13页,本讲稿共110页0.1博弈论与主流经济学的发展博弈论研究的是:当成果无法由个体完全博弈论研究的是:当成果无法由个体完全掌握,而结局须视群体共同决策而定时,掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略个人为了取胜,应该采取什么策略博弈论成为通用方法论,经济学、政治学、博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公共选择、管理、军事、外交、国际关系、公共选择、犯罪
15、学犯罪学“深蓝深蓝”和和“更深的蓝更深的蓝”使用动态博弈理使用动态博弈理论编写程序,后来战胜了无敌的卡斯帕罗论编写程序,后来战胜了无敌的卡斯帕罗夫夫第14页,本讲稿共110页0.2 博弈论要点著名案例著名案例囚徒困境囚徒困境prisoners dilemma个人理性最终导致集体理性的缺失个人理性最终导致集体理性的缺失第15页,本讲稿共110页0.2 博弈论要点博弈:决策主体在互相对抗中,对抗双方博弈:决策主体在互相对抗中,对抗双方(或多方或多方)互相依存的一系列策略和行动的互相依存的一系列策略和行动的过程集合过程集合参与人的利益有冲突参与人的利益有冲突博弈是一个过程集合博弈是一个过程集合(参与
16、人、策略、行动、参与人、策略、行动、信息等信息等)。把博弈视为集合是思维从具体到抽。把博弈视为集合是思维从具体到抽象的重要一步象的重要一步博弈的一个本质特征是策略的相互依存性博弈的一个本质特征是策略的相互依存性博弈论:专门研究博弈如何出现均衡的规博弈论:专门研究博弈如何出现均衡的规律的学问律的学问第16页,本讲稿共110页0.2 博弈论要点博弈论的基本概念包括:参与人、行动、信息、博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡战略、支付函数、结果、均衡其中,参与人、行动、结果合称博弈规则其中,参与人、行动、结果合称博弈规则博弈有不同的种类:博弈有不同的种类:从行动顺序角度
17、:从行动顺序角度:静态博弈静态博弈。参与人同时选择行动参与人同时选择行动动态博弈。参与人的行动有先后顺序动态博弈。参与人的行动有先后顺序从拥有信息角度:从拥有信息角度:完全信息博弈。每个参与人对所有其他参与人的特征、完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识战略空间、支付函数有准确的知识不完全信息博弈。不完全信息博弈。第17页,本讲稿共110页0.2 博弈论要点将二角度结合,博弈有四种:将二角度结合,博弈有四种:完全信息静态博弈完全信息静态博弈完全信息动态博弈完全信息动态博弈不完全信息静态博弈不完全信息静态博弈不完全信息动态博弈不完全信息动态博弈第18页,本
18、讲稿共110页博弈论模型GP,A,S,I,U 一个博弈需要有五方面内容组成:参与人、一个博弈需要有五方面内容组成:参与人、行动、信息、结果行动、信息、结果P:为局中人,能够独立决策,独立承担责任:为局中人,能够独立决策,独立承担责任的个人或组织,以最终实现自身利益最大化的个人或组织,以最终实现自身利益最大化为目标。为目标。A:各局中人的所有可能的策略或行动的集合。:各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈分为有限博弈和无限博弈,后者表现为连续对后者表现为连续对策、重复博弈和微分对策等。策、重复博弈和微分对策等。S:博弈的进程或次序。分为静态博弈和动态博弈。:博弈的进程或次序
19、。分为静态博弈和动态博弈。第19页,本讲稿共110页I:博弈信息:博弈信息,能够影响最后博弈结局的所有局中人的情报。能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要地位信息在博弈中占重要地位,博弈的赢得很大程度上依赖于信博弈的赢得很大程度上依赖于信息的准确度与多寡。如果各方对各种局势下所有局中人的得息的准确度与多寡。如果各方对各种局势下所有局中人的得益状况完全清楚益状况完全清楚,称为完全信息博弈。反之为不完全信息称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称
20、之为否完全了解此前对方的行动。如果完全了解则称之为“具有具有完美信息完美信息”的博弈。反之称为的博弈。反之称为“不完美信息的动态博弈不完美信息的动态博弈”。由于信息不完美由于信息不完美,博弈的结果只能是概率期望博弈的结果只能是概率期望,而不能像完而不能像完美信息博弈那样有确定的结果。美信息博弈那样有确定的结果。U:为局中人获得利益:为局中人获得利益,也是博弈各方追求的最终目标。也是博弈各方追求的最终目标。分为零和博弈和变和博弈。零和博弈中各方利益之间是分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢完全对立的。变和博弈有可能存在合作关系,争取双赢
21、的局面。的局面。第20页,本讲稿共110页0.2.1 完全信息静态博弈:纳什均衡设有两个人一起玩游戏,每个人都有不同的设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出策略,谁都希望自己出“高招高招”使自己获胜使自己获胜(即寻求效用的最大化即寻求效用的最大化),但获胜并不完全依,但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。赖于自己的行为能力,还依赖于对手怎么做。有时,双方会形成这样一种状态:我的最好有时,双方会形成这样一种状态:我的最好策略所依赖的条件就是你的最好策略。换言策略所依赖的条件就是你的最好策略。换言之:如果你那样做,我这样最好,而你之:如果你那样做,我这样最好,
22、而你“那那样样”做恰恰又是你的最佳策略。做恰恰又是你的最佳策略。通俗地讲:如果别人不动,我也不能动通俗地讲:如果别人不动,我也不能动第21页,本讲稿共110页0.2.1 完全信息静态博弈:纳什均衡假设假设n个人参与博弈,给定其他人战略的条个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略。纳什均件下,每个人选择自己的最优战略。纳什均衡指的是衡指的是“由所有参与人的最优战略组成的由所有参与人的最优战略组成的一个组合一个组合”几个人制订了一个协议,这几个人是否能自几个人制订了一个协议,这几个人是否能自愿遵守?他们会自觉遵守,这个协议就构成愿遵守?他们会自觉遵守,这个协议就构成一个纳什均
23、衡。一个纳什均衡。如果一个协议不构成纳什均衡,它就不可能如果一个协议不构成纳什均衡,它就不可能自动实施,需要外力胁迫,这就无所谓自动实施,需要外力胁迫,这就无所谓“协协议议”第22页,本讲稿共110页Nash EquilibriumA Nash equilibrium,named after John Nash,is a set of strategies,one for each player,such that no player has incentive动机 to unilaterally单方面change her action.Players are in equilibrium i
24、f a change in strategies by any one of them would lead that player to earn获得 less than if she remained保持 with her current strategy.For games in which players randomize(mixed strategies),the expected or average payoff must be at least as large as that obtainable能得到的 by any other strategy.纳什均衡,一个策略集合,
25、其中每个参与人没有动机去但方纳什均衡,一个策略集合,其中每个参与人没有动机去但方面地改变自己的行为。任何一个人改变策略都会获得更少,面地改变自己的行为。任何一个人改变策略都会获得更少,这就是纳什均衡。对于随机化的参与人,期望或平均支付这就是纳什均衡。对于随机化的参与人,期望或平均支付至少与其他任何策略一样大至少与其他任何策略一样大第23页,本讲稿共110页0.2.1 完全信息静态博弈:纳什均衡纳什均衡的重要性:任何纳什均衡的重要性:任何“合理合理”结果结果都要满足的条件都要满足的条件当某一局中人发现当某一局中人发现他单方面改变战略可以获取更多时,他他单方面改变战略可以获取更多时,他会毫不犹豫地
26、改变自己的战略,博弈自会毫不犹豫地改变自己的战略,博弈自然就没有达到均衡然就没有达到均衡一种制度安排要发生效力,必须是纳什一种制度安排要发生效力,必须是纳什均衡,否则,这种制度安排就没有效力均衡,否则,这种制度安排就没有效力第24页,本讲稿共110页0.2.1 完全信息静态博弈:纳什均衡囚徒困境的几个事例:囚徒困境的几个事例:价格大战价格大战两个寡头企业选择产量两个寡头企业选择产量公共产品的供给公共产品的供给军备竞赛军备竞赛做广告做广告围观时踮脚尖围观时踮脚尖应试教育应试教育污染。污染。1968年,格雷特年,格雷特哈丁成功地将哈丁成功地将“囚徒的困境囚徒的困境”与与资源耗竭结合起来资源耗竭结合
27、起来,揭示了生态环境问题与囚徒困境的相似揭示了生态环境问题与囚徒困境的相似之处。之处。贸易自由与壁垒,地方保护主义贸易自由与壁垒,地方保护主义第25页,本讲稿共110页0.2.1 完全信息静态博弈:纳什均衡个人理性与集体理性的冲突,各人追求利己行为个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个而导致的最终结局是一个“纳什均衡纳什均衡”,也是对,也是对所有人都不利的结局。所有人都不利的结局。从从“纳什均衡纳什均衡”引出引出“看不见的手看不见的手”的一个悖论:的一个悖论:从利己目的出发,结果损人不利己。从利己目的出发,结果损人不利己。“纳什均衡纳什均衡”提出的悖论动摇了经济学的基
28、石。提出的悖论动摇了经济学的基石。从从“纳什均衡纳什均衡”还可以悟出:合作是有利的还可以悟出:合作是有利的“利己利己策略策略”,但它必须符合以下黄金律:按照你愿意别,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是行事才行。也就是“己所不欲勿施于人己所不欲勿施于人”。第26页,本讲稿共110页占优战略均衡:不论其他人采取什么策略,A之某策略的payoff总是最高,即为“占优战略”(dominant-strategy)。如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意
29、选择的,必然是比较稳定的结果,这是“占优战略均衡”(dominant-strategy equilibrium)。反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。(参见谢识予p.61)0.2.1 完全信息静态博弈:纳什均衡基本分析思路和方法第27页,本讲稿共110页例例2:圈猪博弈:圈猪博弈(boxed pigs)0.2.1 完全信息静态博弈:纳什均衡小猪按 等待大猪按等待5,-14,4
30、9,-10,0第28页,本讲稿共110页例例3 3:性别战:性别战(battle of sexes)女足球 芭蕾男足球芭蕾2,10,00,01,20.2.1 完全信息静态博弈:纳什均衡先动优势所形成的“解”形成的机会第29页,本讲稿共110页例例4:斗鸡博弈:斗鸡博弈(chicken game)(胆小鬼博弈胆小鬼博弈)0.2.1 完全信息静态博弈:纳什均衡B进 退A进退-3,-32,00,20,0第30页,本讲稿共110页例例5:进入阻挠:进入阻挠(entry deterrance)0.2.1 完全信息静态博弈:纳什均衡在位者默许 斗争进入者进入不进入40,50-10,00,3000,300第
31、31页,本讲稿共110页可能存在多个纳什均衡,如果某种情况不可能存在多个纳什均衡,如果某种情况不可能出现可能出现(如,不可信的威胁如,不可信的威胁),则可剔除,则可剔除之。精炼,缩小了之。精炼,缩小了“解解”的个数的个数如果是动态博弈,从每一个行动选择开始如果是动态博弈,从每一个行动选择开始到博弈结束又构成一个博弈,即到博弈结束又构成一个博弈,即“子博弈子博弈”精炼纳什均衡:当只当参与人的战略在每精炼纳什均衡:当只当参与人的战略在每一个子博弈中都构成纳什均衡一个子博弈中都构成纳什均衡承诺行动:当事人使自己的威胁变得可信承诺行动:当事人使自己的威胁变得可信的行动的行动0.2.2 完全信息动态博弈
32、:子博弈精炼纳什均衡第32页,本讲稿共110页很多时候,参与人并不清楚对手的偏好、战略空很多时候,参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平,即,只拥有不完全间、各种组合下的利润水平,即,只拥有不完全信息。每个人知己于必然,知人于或然信息。每个人知己于必然,知人于或然引入一个虚拟的参与人:自然。它选择了参与人引入一个虚拟的参与人:自然。它选择了参与人的特征类型。的特征类型。海萨尼转换海萨尼转换。完全但不完美信息博弈。因为使博弈分析成为可完全但不完美信息博弈。因为使博弈分析成为可能,故称能,故称“完全完全”,但所知不确,故,但所知不确,故“不完美不完美”给定自己的类型和别人的类型的
33、概率分布的情况下,给定自己的类型和别人的类型的概率分布的情况下,每个参与人的期望效用达到最大。每个参与人的期望效用达到最大。0.2.3 不完全信息静态博弈:贝叶斯-纳什均衡第33页,本讲稿共110页贝叶斯统计简介经典统计学需要两种信息:总体和样本经典统计学需要两种信息:总体和样本贝叶斯统计加入了贝叶斯统计加入了“先验信息先验信息”,来源于,来源于经验和历史资料。其统计分布为经验和历史资料。其统计分布为“先验分先验分布布”Bayes T.R.17021761。有贝叶斯公式。有贝叶斯公式贝叶斯学派的基本观点:任一未知量都可贝叶斯学派的基本观点:任一未知量都可看作随机变量,可用一个概率分布去描述看作
34、随机变量,可用一个概率分布去描述它,这个分布称为它,这个分布称为“先验分布先验分布”。任意未。任意未知量都有不确定性,因此非常适合用概率知量都有不确定性,因此非常适合用概率来表达来表达第34页,本讲稿共110页后行动者可以通过观察而增加对先行者的了解,再修正其主观判断,并由此选择自己的行动。先行者知道自己的行为会被他人利用,就会设法传递有利信息。博弈过程是不仅是参与人选择行动的过程,还是不断学习的过程。精炼贝叶斯均衡要求:给定其他参与人类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯-纳什均衡,而且在所有可能的情况下,参与人要根据观察结果来修正对其他参与人的信念,据此选择自
35、己的最优化行为。0.2.3 不完全信息动态博弈:精炼贝叶斯均衡第35页,本讲稿共110页1.1博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述1.2纳什均衡纳什均衡1.3纳什均衡应用举例纳什均衡应用举例1.4混合战略纳什均衡混合战略纳什均衡1.5纳什均衡的存在性与多重性纳什均衡的存在性与多重性 1 完全信息静态博弈第36页,本讲稿共110页1.1博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述1.1.1基本概念基本概念参与人参与人 i=1,2,n N表示自然表示自然行动。行动。ai表示第表示第i个参与人的一个特定行动个参与人的一个特定行动 Ai=ai表示可供表示可供i个选择的所
36、有行动的集合个选择的所有行动的集合 n人博弈中,人博弈中,n个参与人行动的有序集个参与人行动的有序集a称为称为“行动组合行动组合”信息信息完美信息:某个信息集只有完美信息:某个信息集只有1个值个值完全信息:自然不首先行动或其初始行动为所有参与人完全信息:自然不首先行动或其初始行动为所有参与人知道知道共同知识共同知识第37页,本讲稿共110页1.1博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述1.1.1基本概念基本概念战略战略s:参与人在给定信息集时的行动规则:参与人在给定信息集时的行动规则静态博弈中,战略等同于行动静态博弈中,战略等同于行动战略必须是完备的战略必须是完备的支付支付u。
37、u=ui(s1,si,sn)结果结果均衡均衡s*=(s1*,si*,sn*)均衡:一种所有动作的影响都互相抵消,整个系统处于均衡:一种所有动作的影响都互相抵消,整个系统处于平稳的、均势的、不变的状态平稳的、均势的、不变的状态第38页,本讲稿共110页ui(si*,s-i)ui(si,s-i)si si*是数理逻辑符号,全称量词,是数理逻辑符号,全称量词,读作读作“对于全部对于全部”或或“对于每一个对于每一个”Universal quantifier,read for all or for every第39页,本讲稿共110页1.1博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述1.1.
38、2博弈的战略式表述博弈的战略式表述G博弈的参与人集合博弈的参与人集合每个人的战略空间每个人的战略空间每个人的支付函数每个人的支付函数如果:参与人个数有限,每个参与人的战如果:参与人个数有限,每个参与人的战略有限,则为略有限,则为“有限博弈有限博弈”两人有限博弈的战略式表述可以用矩阵表两人有限博弈的战略式表述可以用矩阵表示示第40页,本讲稿共110页纳什均衡是完全信息静态博弈的一般概念,纳什均衡是完全信息静态博弈的一般概念,也是也是所有所有其他类型博弈的基本要求其他类型博弈的基本要求1.2.1占优战略均衡占优战略均衡占优战略均衡的定义占优战略均衡的定义p.59如果所有参与人都有占优战略存在,则占
39、优如果所有参与人都有占优战略存在,则占优战略均衡是可以预测到的惟一的均衡战略均衡是可以预测到的惟一的均衡1.2 纳什均衡第41页,本讲稿共110页占优战略均衡是非常合理的预测,但经常占优战略均衡是非常合理的预测,但经常不存在,这才是博弈论真正的用武之地不存在,这才是博弈论真正的用武之地1.2.2重复剔除的占优战略均衡重复剔除的占优战略均衡智猪博弈中,没有占优战略均衡智猪博弈中,没有占优战略均衡首先找出某个参与人的劣战略,剔除之,首先找出某个参与人的劣战略,剔除之,再找,再剔除,直到最后的一个再找,再剔除,直到最后的一个劣战略、占优战略的定义劣战略、占优战略的定义p.62弱占优战略的定义弱占优战
40、略的定义p.63重复剔除的占优均衡的定义重复剔除的占优均衡的定义p.631.2 纳什均衡第42页,本讲稿共110页1.2.3纳什均衡纳什均衡很多博弈无法使用重复剔除的方法找到很多博弈无法使用重复剔除的方法找到均衡解均衡解定义定义p.69没有任何一个战略严格优于纳什均衡战没有任何一个战略严格优于纳什均衡战略略(严格优,大于,不包括等于)强纳什均衡强纳什均衡p.711.2 纳什均衡第43页,本讲稿共110页1.3.1古诺寡头竞争模型古诺寡头竞争模型两个寡头企业,市场总产量为Q=q1+q2。市场出清价格P是市场总产量的函数P=P(Q)=8-Q。假设生产无固定成本,且每增加一单位产量的边际成本c相等=
41、2,则其成本分别为2q1、2q2,他们同时选择产量利润:u1=q1(Q)-c1q1=q18-(q1+q2)-2q1=6q1-q1q2-q12u2=q2(Q)-c2q2=q28-(q1+q2)-2q2=6q2-q1q2-q22可以寻找纳什均衡:只要两方的一个策略组合(q1*,q2*)相互是对方的最佳对策,就构成一个纳什均衡,如果再可以证明它是惟一的,则可以预言博弈的解可直接根据定义来寻找1.3 纳什均衡应用举例第44页,本讲稿共110页(q1*,q2*)必须是最大值解得均衡产量为q1*=q2*=2策略组合(2,2)是惟一的纳什均衡市场最终产量为2+2=4,价格为8-4=4双方各自利润2(8-4)
42、-22=4如果只有一家厂商,总得益U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2。其最大产量为6-2Q=0,即Q=3,而得益为9。高于各自产量为2时的总得益8。第45页,本讲稿共110页1.3.2 Hotelling价格竞争模型价格竞争模型1.3.3 公共地的悲剧公共地的悲剧1.3.4 公共物品的私人自愿供给公共物品的私人自愿供给1.3.5基础设施建设:中央政府与地方政基础设施建设:中央政府与地方政府之间的博弈府之间的博弈1.3 纳什均衡应用举例第46页,本讲稿共110页1.4 混合战略纳什均衡有些博弈不存在有些博弈不存在(纯策略的纯策略的)纳什均衡纳什均衡社会福利博弈之例:不存在纳什均衡
43、社会福利博弈之例:不存在纳什均衡猜谜游戏之例:不存在纳什均衡猜谜游戏之例:不存在纳什均衡B正面 反面A正面反面-1,1 1,-11,-1-1,1流浪汉找工作 游荡政府救济不救济3,2-1,3-1,10,0第47页,本讲稿共110页设流浪汉找工作的概率为设流浪汉找工作的概率为p,则游荡为,则游荡为1-p政府的支付政府的支付:当政府救济,政府得到当政府救济,政府得到3p-(1-p)=4p-1当政府不救济,政府得到当政府不救济,政府得到-p+0=-p流浪汉应比较两种策略:流浪汉应比较两种策略:4p-1-p,p0.2或者或者4p-1-p,p3q,q0.5第48页,本讲稿共110页1.4 混合战略纳什均
44、衡纯战略:参与人在每一个给定信息的情况下只选择纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动一个特定的行动混合战略:参与人在每一个给定信息的情况下以混合战略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动某种概率分布随机地选择不同的行动纯战略可视为混合战略的特例纯战略可视为混合战略的特例以混合策略为对象,重新定义效用函数,即期望以混合策略为对象,重新定义效用函数,即期望效用函数效用函数p101p101再定义纳什均衡再定义纳什均衡p102p102103103“流浪汉流浪汉”的纳什均衡:政府以的纳什均衡:政府以0.50.5救济,流浪汉以救济,流浪汉以0.20.2找工作
45、找工作第49页,本讲稿共110页1.4 混合战略纳什均衡一个参与人使用混合策略的好处是给对方造成不确定性,一个参与人使用混合策略的好处是给对方造成不确定性,浑水摸鱼浑水摸鱼海萨尼对混合战略的解释:混合战略等价于不完海萨尼对混合战略的解释:混合战略等价于不完全信息下的纯战略均衡全信息下的纯战略均衡如税收检查,检查则不偷税,不检查则偷税。但如税收检查,检查则不偷税,不检查则偷税。但税务局检查有成本,企业在知道税务局可能检查税务局检查有成本,企业在知道税务局可能检查的情况下,偷税有风险。此时,可以根据某些参的情况下,偷税有风险。此时,可以根据某些参数寻找一个混合策略的纳什均衡数寻找一个混合策略的纳什
46、均衡几乎所有优先博弈都有优先奇数个纳什均衡。几乎所有优先博弈都有优先奇数个纳什均衡。如果一个博弈有两个纯战略纳什均衡,那么,一定存如果一个博弈有两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡在第三个混合战略纳什均衡第50页,本讲稿共110页1.5 纳什均衡的存在性和多重性的讨论1.5.1纳什均衡的存在性纳什均衡的存在性p113图图X本来是一组自变量,每一个自变量都有一些取本来是一组自变量,每一个自变量都有一些取值,必然存在一点,使每个人的选择所形成的结值,必然存在一点,使每个人的选择所形成的结果等于自己在这一点上所期望的结果。在这一个果等于自己在这一点上所期望的结果。在这一个点上,所
47、有人的选择重合为一个相同的点。点上,所有人的选择重合为一个相同的点。需要理解两点:多个自变量的取值至少在一个点上是需要理解两点:多个自变量的取值至少在一个点上是重合的;这个点上每个人都没有偏离自己的规律重合的;这个点上每个人都没有偏离自己的规律(符合符合自己在此种选择下的意愿自己在此种选择下的意愿)如果有人不选择这一点的取值,则有可能不形成这个点如果有人不选择这一点的取值,则有可能不形成这个点每个自变量都符合自己的规律每个自变量都符合自己的规律第51页,本讲稿共110页1.5 纳什均衡的存在性和多重性的讨论1.5.2纳什均衡的多重性纳什均衡的多重性最令人无奈的是可能存在多个纳什均衡,仍然存在最
48、令人无奈的是可能存在多个纳什均衡,仍然存在不稳定性不稳定性你预测出现这个纳什均衡,因而有相你预测出现这个纳什均衡,因而有相应选择,我却以为会出现另一个,乃有我的选择,此应选择,我却以为会出现另一个,乃有我的选择,此时的组合可能并不构成纳什均衡时的组合可能并不构成纳什均衡当一个博弈有多个纳什均衡时,博弈论并没有一个当一个博弈有多个纳什均衡时,博弈论并没有一个一般的理论注明纳什均衡结果一定会出现。一般的理论注明纳什均衡结果一定会出现。可以利用外在的信息达到纳什均衡,如性别战可以利用外在的信息达到纳什均衡,如性别战Cheap talk也可能促成纳什均衡也可能促成纳什均衡重复博弈也有可能促成纳什均衡重
49、复博弈也有可能促成纳什均衡但以上情况并不保证必然出现纳什均衡但以上情况并不保证必然出现纳什均衡第52页,本讲稿共110页2 完全信息动态博弈不能同时选择和行动的博弈是动态博弈Dynamic Games,后行动者可以先观察别人的行动,自己再选择本章讨论完全信息下的动态博弈第53页,本讲稿共110页2.1 博弈的扩展式表述扩展式表述所扩展式表述所“扩展扩展”的主要是参与人的主要是参与人的战略空间的战略空间战略式表述简单地给出参与人有些什么战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,个战略的动态描述:谁在什
50、么时候行动,每次行动时有些什么具体行动方案可供每次行动时有些什么具体行动方案可供选择,以及知道些什么选择,以及知道些什么此时的战略:如果你这样,我将怎样此时的战略:如果你这样,我将怎样第54页,本讲稿共110页2.1 博弈的扩展式表述要素:要素:参与人集合参与人集合参与人的行动顺序参与人的行动顺序参与人的行动空间参与人的行动空间参与人的信息集参与人的信息集参与人的支付函数参与人的支付函数外生事件外生事件(即即“自然自然”的选择的选择)的概率分布的概率分布第55页,本讲稿共110页2.1 博弈的扩展式表述博弈树的基本元素:博弈树的基本元素:结、枝、信息集结、枝、信息集需要注意的概念:前列集、后续