《(本科)信息经济学-第三章信息经济学研究方法-1教学ppt课件.ppt》由会员分享,可在线阅读,更多相关《(本科)信息经济学-第三章信息经济学研究方法-1教学ppt课件.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、(本科)信息经济学-第三章信息经济学研究方法-1教学ppt课件第三章第三章 信息经济学研究方法信息经济学研究方法 第一节第一节 规范研究与实证研究规范研究与实证研究 第二节第二节 博弈论博弈论 第三节第三节 非线性规划理论非线性规划理论假设条件假设条件 与现实不违背与现实不违背 条件之间不矛盾条件之间不矛盾基本模型基本模型 构造合理构造合理 推导简洁、正确推导简洁、正确分析或分析或结论结论 不可批判性不可批判性 与现实吻合或合理与现实吻合或合理复杂模型(扩展或推广)复杂模型(扩展或推广) 复杂化复杂化 应用应用评论评论理论演绎理论演绎 提出假说提出假说 构建模型构建模型实证分析实证分析 收集数
2、据收集数据 数据处理数据处理 计量检验计量检验结论结论 做出预测做出预测 给出问题的对策给出问题的对策文献综述文献综述 研究方法研究方法 研究结论研究结论讨论讨论经济学研究的基本问题:经济学研究的基本问题: 资源的有效配置资源的有效配置 人的行为人的行为经济学的基本假设:人是理性的经济学的基本假设:人是理性的理性人:在一定的约束条件下,使自己的收益最大化。理性人:在一定的约束条件下,使自己的收益最大化。一、经济博弈论的产生与发展一、经济博弈论的产生与发展 通常,人们将数学家冯通常,人们将数学家冯 诺依曼(诺依曼(von Neumann)于)于1928年提出的二年提出的二人零和博弈的极小化极大定
3、理作为博弈论奠基的标志。人零和博弈的极小化极大定理作为博弈论奠基的标志。 1944年,数学家年,数学家冯冯 诺依曼(诺依曼(von Neumann)和经济学家摩根斯坦恩)和经济学家摩根斯坦恩(Morgenstern)合作发表了)合作发表了博弈论和经济行为博弈论和经济行为一书,被认为是应用一书,被认为是应用博弈论进行经济分析的开始。博弈论进行经济分析的开始。 20世纪世纪50-60年代,博弈论确立了发展的基础。年代,博弈论确立了发展的基础。1950-1951年,年,Nash发发表了两篇关于非合作博弈的重要论文。表了两篇关于非合作博弈的重要论文。1950年,年,Tucker定义了定义了“囚犯难题囚
4、犯难题”(prisoners dilemma) 。Nash和和Tucker的工作基本奠定了现代博弈论的的工作基本奠定了现代博弈论的基础。基础。 20世纪世纪60年代,泽尔腾(年代,泽尔腾( Selten )将纳什均衡的概念引入了动态分析。)将纳什均衡的概念引入了动态分析。1967-1968年,海萨尼(年,海萨尼(Harsanyi)发表了具有不完全信息的由发表了具有不完全信息的由Bayesian局中人所进行的博弈。此后,局中人所进行的博弈。此后,他们两人长期合作,发展了非合作博弈理他们两人长期合作,发展了非合作博弈理论。论。 1994年诺贝尔经济学奖获得者:年诺贝尔经济学奖获得者: 美国数学家美
5、国数学家John F. Nash,德国经济学家,德国经济学家Reinhard Selten,美籍匈牙利,美籍匈牙利经济学家经济学家John C. Harsanyi。 1928年年Nash出生于美国,出生于美国,1950年获年获Princeton大学数大学数学博士学位,曾先后任教于学博士学位,曾先后任教于MIT和和Princeton大学。其博大学。其博士论文士论文非合作博弈非合作博弈首次区分了合作博弈与非合作博首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的所谓弈,并且提出了非合作博弈的所谓Nash均衡概念。均衡概念。 1930年年 Selten出生于现属于波兰的德国城市,出生于现属于波兰
6、的德国城市,1961年获法兰克福大学数学博士学位,曾先后任年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。教于柏林自由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。其主要贡献是在博弈论中引入了动态分析。 1920年年Harsanyi出生于匈牙利,出生于匈牙利,1947年获布达年获布达佩斯大学博士学位,后到美国,佩斯大学博士学位,后到美国,1954年获斯坦福大年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于州伯克利分校。于2000年去世。他的贡献是将不完年去世。他的贡献是
7、将不完全信息引入了博弈论的研究。全信息引入了博弈论的研究。奥曼发现,在很多现实情况中,奥曼发现,在很多现实情况中,因此短期博弈理论往往具有很因此短期博弈理论往往具有很多限制性。为此,他首先提出了完整详尽的无限期重复博多限制性。为此,他首先提出了完整详尽的无限期重复博弈理论,并严格论证了何种结果能够在长时期的关系中得弈理论,并严格论证了何种结果能够在长时期的关系中得到维持。到维持。 2005年诺贝尔经济学奖获得者:年诺贝尔经济学奖获得者: 以色列和美国以色列和美国Robert J. Aumann(罗伯特(罗伯特奥曼奥曼),以及美),以及美国经济学家国经济学家Thomas C. Schelling
8、(托马斯(托马斯 谢林)谢林) 谢林于谢林于20世纪世纪60年代出版的著作年代出版的著作冲突的战略冲突的战略(The Strategy of Conflict),着力阐述了),着力阐述了。这些手段包括:事先承诺、边缘政策和有威慑力。这些手段包括:事先承诺、边缘政策和有威慑力的威胁。应用在核军备竞赛方面,上述理论为美国提供了处理一个的威胁。应用在核军备竞赛方面,上述理论为美国提供了处理一个根本问题的战略,这个问题就是如何发挥那些杀伤力极大武器的作根本问题的战略,这个问题就是如何发挥那些杀伤力极大武器的作用,由于它们的杀伤力太大,人们并不认为会真的投入使用。用,由于它们的杀伤力太大,人们并不认为会
9、真的投入使用。二、经济博弈论主要概念及表述二、经济博弈论主要概念及表述 (playersplayers):指做决策的个体。每个局中人):指做决策的个体。每个局中人的目标都是通过选择行动来使自己的效用最大化。的目标都是通过选择行动来使自己的效用最大化。 (pseudo-playerspseudo-players):指以一种纯机械的):指以一种纯机械的方式来采取行动的个体。自然是一种虚拟局中人,它在博方式来采取行动的个体。自然是一种虚拟局中人,它在博弈的特定时点上以特定的概率随机选择行动。弈的特定时点上以特定的概率随机选择行动。 例如:例如: 阴天阴天你要出门,要决定是否带伞你要出门,要决定是否带
10、伞 两个人两个人打牌打牌(actions):是指局中人的决策变量。):是指局中人的决策变量。 局中人局中人i i的行动以的行动以a ai i表示,是他所能做的某一选择。局表示,是他所能做的某一选择。局中人中人i i的行动集(的行动集(action set)是其可以采用的全部行动的集是其可以采用的全部行动的集合。一个行动组合(合。一个行动组合(action profile)是一个由博弈中的是一个由博弈中的n n个个局中人每人选择一个行动所组成的有序集。局中人每人选择一个行动所组成的有序集。 例如:例如: 出门:带伞出门:带伞 或或 不带伞不带伞 打牌:出牌打牌:出牌(information)指局
11、中人在博弈中的知识,特别是)指局中人在博弈中的知识,特别是有关其他局中人(竞争者或对手)的特征和行动的知识。有关其他局中人(竞争者或对手)的特征和行动的知识。 一般地,信息一般地,信息是以信息集(是以信息集(information set)的概念来的概念来模型化的。可以将局中人的信息集看成是其在特定时点对于模型化的。可以将局中人的信息集看成是其在特定时点对于不同变量的取值的了解程度。不同变量的取值的了解程度。例如:例如: 出门出门对天气的判断对天气的判断 打牌打牌对其他人的判断对其他人的判断 信息集的要素包括局中人认为可能的不同值。如果信息信息集的要素包括局中人认为可能的不同值。如果信息集有许
12、多要素的话,则表明存在局中人无法排除的许多取值。集有许多要素的话,则表明存在局中人无法排除的许多取值。如果信息集只有一个要素,则表明局中人准确地知道变量的如果信息集只有一个要素,则表明局中人准确地知道变量的取值。取值。信息种类信息种类含含 义义完美(完美(Perfect)每个信息集都是单结的每个信息集都是单结的确定(确定(Certain)自然不在任一参与人行动之后行动自然不在任一参与人行动之后行动对称对称(Symmetric)没有参与人在行动时或在终点结处与其它参与人不同的信息没有参与人在行动时或在终点结处与其它参与人不同的信息完全(完全(Complete)自然不首先行动或它的最初行动被每个参
13、与人所观察到自然不首先行动或它的最初行动被每个参与人所观察到* 来源:艾里克来源:艾里克拉丝缪森,拉丝缪森,博弈与信息博弈与信息博弈论概论,北京大学出版社,博弈论概论,北京大学出版社,2003年,第年,第46页。页。博弈中博弈中的分类的分类(common knowledge):指):指“所有局中人知道,所有局中人知道,所有局中人知道所有局中人知道所有局中人知道所有局中人知道” 的知识。的知识。 例如,在一个博弈中,局中人例如,在一个博弈中,局中人A知道自己的行动集合,局知道自己的行动集合,局中人中人B也知道也知道A的行动集合,的行动集合,A知道知道B知道知道A的行动集合的行动集合。 (stra
14、tegies),是局中人选择行动的规则,是局中人选择行动的规则,它告诉局中人在什么时候选择什么行动。它告诉局中人在什么时候选择什么行动。 局中人局中人i的战略(的战略(strategy)si是以下一项规则:给定其信是以下一项规则:给定其信息集,该战略决定在博弈的每一时点上局中人选择何种行动。息集,该战略决定在博弈的每一时点上局中人选择何种行动。 局中人局中人i的战略集(的战略集(strategy set)或战略空间(或战略空间(strategy space)Si=si是其可行战略的集合。是其可行战略的集合。 (strategy profile)s=(s1,sn)是由博弈的是由博弈的n个局中人每
15、人选择一个战略所组成的一个有序集。个局中人每人选择一个战略所组成的一个有序集。例如:例如: “人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我不犯人;人若犯我,我必犯人” 三个和尚没水喝三个和尚没水喝 (payoff):指每个参与人从博弈中获得的效用):指每个参与人从博弈中获得的效用水平。既可以指实际支付,也可以用来指期望支付。它是水平。既可以指实际支付,也可以用来指期望支付。它是所有局中人战略或行动的函数,是每个局中人关注的核心所有局中人战略或行动的函数,是每个局中人关注的核心问题。问题。例如:例如: 出门带伞的成本为出门带伞的成本为2,如果下雨,有伞获得的,如果下雨,有伞获得的收益为收益
16、为6,则实际得到的效用为,则实际得到的效用为4。 (outcome):):是指在博弈结束后,建立博弈模是指在博弈结束后,建立博弈模型者从行动、支付和其他变量的取值中所挑选出来的他所型者从行动、支付和其他变量的取值中所挑选出来的他所感兴趣的要素的集合。感兴趣的要素的集合。(equilibrium):指所有局中人的最优战略组合或行动):指所有局中人的最优战略组合或行动组合。或者,均衡组合。或者,均衡s*=(s1*, sn*)指由博弈中的)指由博弈中的n个局中个局中人人每人选取的最佳战略所组成的一个战略组合。每人选取的最佳战略所组成的一个战略组合。 局中人局中人B 左左 右右 上上 2, 1 0,
17、0局中人局中人A 下下 0, 0 1, 2 一个博弈中需要的要素包括:局中人、行动、信息、战一个博弈中需要的要素包括:局中人、行动、信息、战略或策略、支付、结果和均衡。略或策略、支付、结果和均衡。 其中,对一个博弈的描述至少必须包括:局中人、战略其中,对一个博弈的描述至少必须包括:局中人、战略和支付。和支付。 局中人、行动和结果合起来统称为博弈规则(局中人、行动和结果合起来统称为博弈规则(rules of the game),博弈分析的目的在于运用博弈规则来确定均衡。),博弈分析的目的在于运用博弈规则来确定均衡。(uniqueness):):公认的均衡概念并不能保证惟公认的均衡概念并不能保证惟
18、一性,缺乏惟一性是博弈论的主要缺陷或问题。例如,可能一性,缺乏惟一性是博弈论的主要缺陷或问题。例如,可能存在多种均衡,或者根本就没有均衡。存在多种均衡,或者根本就没有均衡。 解决方案:看重博弈的规则,而不是均衡概念。解决方案:看重博弈的规则,而不是均衡概念。双变量指在两个局中人的博弈中,每一双变量指在两个局中人的博弈中,每一单元格都有两个数字单元格都有两个数字分别表示两个局中人的收益。分别表示两个局中人的收益。 局中人局中人B 左左 右右 上上 2, 1 0, 0局中人局中人A 下下 0, 0 1, 2 合作博弈(合作博弈(cooperative game):是以局中人整体的可):是以局中人整
19、体的可能联合行动集合为基本要素。通俗地说,如果局中人能够能联合行动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。作博弈强调的是集体理性。 非合作博弈(非合作博弈(non-cooperative game):是以单个局中):是以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。弈为
20、非合作博弈。非合作博弈强调的是个体理性。 信息经济学主要研究的是非合作博弈。信息经济学主要研究的是非合作博弈。 按照博弈的收益分配结果划分,博弈可以划分为零和博弈按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。和非零和博弈。 零和博弈指在博弈中一组局中人所得到的支付(或收益)零和博弈指在博弈中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。的博弈称为零和博弈。 非零和博弈指所有局中人的支付(或收益)的代数和不为非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为
21、负。零。为正或为负。 例如:赢钱与输钱为零和博弈;例如:赢钱与输钱为零和博弈; 工会与厂方达成增加工资的协议双方获得工会与厂方达成增加工资的协议双方获得“双赢双赢”。反之,。反之,罢工导致罢工导致“两败俱伤两败俱伤”。(symmetric information):指):指博弈中任一局博弈中任一局中人都至少包含与其他每个局中人的信息集相同的元素。中人都至少包含与其他每个局中人的信息集相同的元素。 (asymmetric information):指):指至少有一个至少有一个局中人拥有私人信息(局中人拥有私人信息(private information)。)。(complete informat
22、ion):指局中人完全了解):指局中人完全了解其他局中人的收益或收益函数。通俗地说,局中人完全了解其他局中人的收益或收益函数。通俗地说,局中人完全了解其他局中人的特征、战略空间及支付函数。其他局中人的特征、战略空间及支付函数。 (incomplete information):指至少有一个):指至少有一个局中人不完全了解其他局中人的收益或收益函数。局中人不完全了解其他局中人的收益或收益函数。(perfect information):指一个参与人对其):指一个参与人对其他参与人的行动选择有准确的了解。他参与人的行动选择有准确的了解。(Imperfect information):):指博弈中至
23、少指博弈中至少有一个局中人不了解其他局中人的行动选择。有一个局中人不了解其他局中人的行动选择。 (static game):博弈中局中人同时选择行动,):博弈中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了或虽然不是同时行动但后行动者并不了解前行动者采取了什么具体行动。什么具体行动。 例如:例如: “石头、剪刀、布石头、剪刀、布”的游戏的游戏 应聘者演讲(轮流,但其他人在外等候)应聘者演讲(轮流,但其他人在外等候) 1 1)田忌赛马的博弈是否属于静态博弈?)田忌赛马的博弈是否属于静态博弈? 2 2)当你知道对方)当你知道对方40%40%出石头,出石头,30%30%出布和
24、出布和30%30%出剪刀,但不出剪刀,但不知道组合的顺序,你的最优策略是什么?知道组合的顺序,你的最优策略是什么?(dynamic game):指局中人的行动有先后顺):指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。序,且后行动者能够观察到先行动者所选择的行动。 例如:例如: 下棋、打牌等游戏下棋、打牌等游戏 应聘者演讲(轮流,但后者可以听前者的演讲)应聘者演讲(轮流,但后者可以听前者的演讲) 博士答辩的安排顺序博士答辩的安排顺序 政府政策与企业行为之间政府政策与企业行为之间“上有政策,下有对策上有政策,下有对策”博弈:博弈: 关税水平与走私、税收与逃税之间的博弈关税水平
25、与走私、税收与逃税之间的博弈 政府与企业之间政府与企业之间“鞭打快牛鞭打快牛”的博弈的博弈 政府官员政府官员“四菜一汤四菜一汤”规定的博弈规定的博弈 博弈的类型及对应的均衡概念博弈的类型及对应的均衡概念 行动顺序行动顺序 静态结构静态结构 动态结构动态结构 信信 息息 (战略博弈)(战略博弈) (扩展博弈)(扩展博弈) 完全信息静态博弈完全信息静态博弈 完全信息动态博弈完全信息动态博弈 完全信息结构完全信息结构 Nash均衡均衡 子博弈精练子博弈精练Nash均衡均衡 Nash(1950,1951) Selten(1965) 不完全信息静态博弈不完全信息静态博弈 不完全信息动态博弈不完全信息动态
26、博弈不完全信息结构不完全信息结构 贝叶斯贝叶斯Nash均衡均衡 精练贝叶斯精练贝叶斯Nash均衡均衡 Harsanyi(1967-1968) Selten(1975)等等 信息结构与行动结构框架图信息结构与行动结构框架图 静态结构静态结构 动态结构动态结构 (战略博弈)(战略博弈) (扩展博弈)(扩展博弈) 完全信息结构完全信息结构 石头石头/剪刀剪刀/布布 围棋、象棋围棋、象棋 不完全信息结构不完全信息结构 赌赌 博博 黔驴技穷黔驴技穷 局中人局中人 1人博弈人博弈 2人博弈人博弈 多人博弈多人博弈 (个人与自然)(个人与自然) 零和零和 A C E博弈结果博弈结果 非零和非零和 B D F
27、 假设一位花农需要决定种植花的品种,但无法知道明年的天气假设一位花农需要决定种植花的品种,但无法知道明年的天气情况,通过经验和资料得知明年各种天气类型出现的可能性是:情况,通过经验和资料得知明年各种天气类型出现的可能性是:S1=0.2,S20.1,S30.4,S40.3。可以选择的花的品种为。可以选择的花的品种为3种。种。 不同的花在不同的气候条件下的收成为:不同的花在不同的气候条件下的收成为:S1S2S3S4A1121090A28844A3161232概率概率0.20.10.40.3如果只能选择一种花的话,花农应该选择种哪种花?如果只能选择一种花的话,花农应该选择种哪种花?期望值(期望值(A
28、1)、大中最大()、大中最大(A3)、小中最大()、小中最大(A2)天天 气气品品 种种 通俗地说,通俗地说,Nash均衡是指由全部局中人的均衡是指由全部局中人的最优战略最优战略组成组成的均衡。在其他局中人战略既定的情况下,没有任何单个局的均衡。在其他局中人战略既定的情况下,没有任何单个局中人会选择其他战略,从而没有任何局中人会打破这种均衡。中人会选择其他战略,从而没有任何局中人会打破这种均衡。 Nash 均衡是一个稳定状态的解。在这个(均衡是一个稳定状态的解。在这个(“僵局僵局”)状态下,每个局中人的决策依赖于均衡的知识。状态下,每个局中人的决策依赖于均衡的知识。 导出导出Nash均衡的方法
29、之一,是证明如果博弈论还可以为均衡的方法之一,是证明如果博弈论还可以为博弈问题提供一个惟一解,这个解一定是博弈问题提供一个惟一解,这个解一定是Nash均衡。均衡。 理由如下:理由如下: 设想在博弈论预测的博弈结果中,给每个局中人选定各设想在博弈论预测的博弈结果中,给每个局中人选定各自的战略,为使该预测使是正确的,那么,必须使局中人自自的战略,为使该预测使是正确的,那么,必须使局中人自愿选择理论给他推导出的战略。这样,每个局中人要选择的愿选择理论给他推导出的战略。这样,每个局中人要选择的战略必须是针对其他局中人选择战略的战略必须是针对其他局中人选择战略的。 这种理论推测结果可以称为这种理论推测结
30、果可以称为“战略稳定战略稳定”或或“自动实施自动实施”的,因为没有局中人愿意独自放弃他所选定的战略。我们将的,因为没有局中人愿意独自放弃他所选定的战略。我们将这种状态称为这种状态称为Nash均衡。均衡。在在n个局中人标准式博弈个局中人标准式博弈G= Si,.,Sn;ui,.,un 中,如果中,如果 s1*,.,sn* 满足满足对每个局中人对每个局中人i i,si*是(至少不劣于)他针对其他是(至少不劣于)他针对其他n-1n-1个局中人所选战略个局中人所选战略 s1*,.,s*i-1,s*i+1,.,sn* 的最优反应战略,则称战略组合的最优反应战略,则称战略组合 s1*,.,sn* 是该博弈的
31、一个是该博弈的一个NashNash均衡。即:均衡。即:对所有对所有Si中的中的si都成立,即都成立,即si*是以下最优化问题的解:是以下最优化问题的解:*111111.iiiiniiiinu sssssu sssss( , ) ( , , ).*1*1*1maxniiiiSssssssuii,( Nash均衡意味着:当其他局中人都不改变策均衡意味着:当其他局中人都不改变策略(战略组合)时,每个局中人都无法获得更大略(战略组合)时,每个局中人都无法获得更大的收益。的收益。 事实上,事实上,Nash均衡的概念在均衡的概念在Cournot研究双头研究双头垄断问题(两个企业同时进行产量决策)时已有垄断
32、问题(两个企业同时进行产量决策)时已有体现。体现。(1)Nash均衡可能是高成本的均衡可能是高成本的(2)可能不存在纳什均衡)可能不存在纳什均衡(3)Nash均衡可能有多重解均衡可能有多重解 张张 三三 坦坦 白白 不坦白不坦白 坦坦 白白 -3, -3 0, -6 李李 四四 不坦白不坦白 -6, 0 -1, -1 囚犯难题的推论:囚犯难题的推论: 1)可能不是帕累托最优;)可能不是帕累托最优; 2)个体理性与集体理性的不一致性;)个体理性与集体理性的不一致性; 3)表明制度安排的重要性;)表明制度安排的重要性; 4)在现实政治经济中,合作具有积极普遍的意义。)在现实政治经济中,合作具有积极
33、普遍的意义。 军备竞赛军备竞赛 环境污染环境污染 交通堵塞交通堵塞 改革与创新改革与创新 20世纪世纪60-70年代,美、苏两国是两个超级大国,相互对年代,美、苏两国是两个超级大国,相互对垒。美国成功研制了航天飞机,苏联则在空间站技术方面领垒。美国成功研制了航天飞机,苏联则在空间站技术方面领先。假设他们有两种策略选择:扩军或裁军。双方选择的支先。假设他们有两种策略选择:扩军或裁军。双方选择的支付如下:付如下: 苏苏 联联 扩扩 军军 裁裁 军军 扩扩 军军 -2000,-2000 8000,- 美美 国国 裁裁 军军 - ,8000 0,0 两个企业两个企业u1和和u2:是否同意建造一个新的下
34、水管道以使:是否同意建造一个新的下水管道以使地下水不被污染。假设建造下水管道需要投资地下水不被污染。假设建造下水管道需要投资120万。如同意万。如同意各承担各承担50%,下水管道的建设对企业的价值分别是,下水管道的建设对企业的价值分别是80万。万。 启示:产权界定与环境保护的制度建设对于公共资源的启示:产权界定与环境保护的制度建设对于公共资源的保护是十分必要的。保护是十分必要的。 u2 不不同同意意 同同 意意 u1 不不同同意意 0,0 80,-40 同同意意 -40,80 20,20 欧美已基本解决了食品安全问题,而在中国,大家都在欧美已基本解决了食品安全问题,而在中国,大家都在饱受食品不
35、安全之苦。饱受食品不安全之苦。欧欧 美:不守规则是高成本的美:不守规则是高成本的中中 国:遵守规则是高成本的国:遵守规则是高成本的 灯塔、路灯等公共设施;灯塔、路灯等公共设施; 环境污染问题;环境污染问题; 各种滥竽充数的广告、产品或服务。各种滥竽充数的广告、产品或服务。 中央集权制;中央集权制; 投票制:少数服从多数;投票制:少数服从多数; 征收克拉克税(如汽油税、过桥费)。征收克拉克税(如汽油税、过桥费)。 小小 偷偷 不不 偷偷 偷偷 不睡觉不睡觉 0, 0 0, -1 保安保安 睡睡 觉觉 1, 0 -1, 3每个局中人的战略空间为(正面,背面)每个局中人的战略空间为(正面,背面) 局
36、中人局中人2 正面正面 背面背面 正面正面 -1, 1 1, -1 局中人局中人1 背面背面 1, -1 -1, 1 在博弈中,一旦每个局中人都竭力猜测其他局中人的战在博弈中,一旦每个局中人都竭力猜测其他局中人的战略选择,就不存在略选择,就不存在Nash均衡(至少不存在前面定义的标准均衡(至少不存在前面定义的标准的的Nash均衡)。因为这时局中人的最优行动是不确定的,均衡)。因为这时局中人的最优行动是不确定的,而博弈的结果必然要包含这种不确定性。而博弈的结果必然要包含这种不确定性。 假设按一下按钮要支付假设按一下按钮要支付2个单位成本,有个单位成本,有10个单位猪食进入猪槽。个单位猪食进入猪槽
37、。又假设:又假设:1)大猪和小猪同时赶到,大猪吃)大猪和小猪同时赶到,大猪吃7个单位,小猪吃个单位,小猪吃3个单位。个单位。 2)大猪和小猪同时按按钮又同时赶到猪槽,扣除)大猪和小猪同时按按钮又同时赶到猪槽,扣除2个单位成本后,个单位成本后,大猪支付水平为大猪支付水平为7- -2=5,小猪支付水平为,小猪支付水平为3- -2=1。 3)大猪按按钮,小猪等待,小猪先赶到,小猪吃)大猪按按钮,小猪等待,小猪先赶到,小猪吃4个单位,大猪吃个单位,大猪吃6个单位。大猪支付水平为个单位。大猪支付水平为6- -2=4,小猪支付水平为,小猪支付水平为4- -0=4。 4)小猪按按钮,大猪等待,大猪先赶到,大
38、猪吃)小猪按按钮,大猪等待,大猪先赶到,大猪吃9个单位,小猪吃个单位,小猪吃1个单位。大猪支付水平为个单位。大猪支付水平为9- -0=9,小猪为,小猪为1- -2= - -1。 大大 猪猪 按按 等等 待待 按按 1, 5 -1, 9 小猪小猪 等待等待 4, 4 0, 0在每个行业中龙头企业都要承担三个在每个行业中龙头企业都要承担三个“大猪成本大猪成本”:1)市场开拓成本)市场开拓成本群狼策略;群狼策略;2)人才培训成本)人才培训成本猎头策略;猎头策略;3)商业模式创新成本)商业模式创新成本模仿策略。模仿策略。例如,例如,“大猪控股大猪控股”和和“小猪有限小猪有限”都计划引进一种新产品,但为
39、了获都计划引进一种新产品,但为了获得公众的认同,须投入广告费用。如大猪控股打头阵,小猪有限跟进也得公众的认同,须投入广告费用。如大猪控股打头阵,小猪有限跟进也可以获得一部分市场。相反,如小猪有限先进入,大猪控股就会后发制可以获得一部分市场。相反,如小猪有限先进入,大猪控股就会后发制任,独占市场。任,独占市场。 领头企业与小企业(麦当劳与小快餐店)领头企业与小企业(麦当劳与小快餐店) 股票市场上的大户与小户股票市场上的大户与小户 企业的大股东和小股东企业的大股东和小股东 公共设施或基础设施投资:富人与穷人的博弈公共设施或基础设施投资:富人与穷人的博弈投食仅为原来的一半。结果是小猪大猪都投食仅为原
40、来的一半。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪也会不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,因此,谁也不会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,因此,谁也不会有踩踏板的动力了。有踩踏板的动力了。 如果游戏设计者的目的是想让猪去多踩踏板,这个设计显然是失败的。如果游戏设计者的目的是想让猪去多踩踏板,这个设计显然是失败的。 投食为原来的一倍。结果是小猪、大猪都投食为原来的一倍。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板,反正对方不会一次把食物吃完。会去踩踏板。谁想吃,谁就会
41、去踩踏板,反正对方不会一次把食物吃完。小猪和大猪相当于生活在小猪和大猪相当于生活在“共产主义共产主义”社会,缺乏竞争意识。社会,缺乏竞争意识。 对于游戏设计者来说,这个设计的成本显然太高。对于游戏设计者来说,这个设计的成本显然太高。 投食仅为原来的一半,但同时将投食仅为原来的一半,但同时将投食口移到踏板附近。结果,小猪和大猪都要拼命抢着踩踏板。等待者投食口移到踏板附近。结果,小猪和大猪都要拼命抢着踩踏板。等待者不得食,多劳者多得,每次的收获刚好消费完。不得食,多劳者多得,每次的收获刚好消费完。 对于游戏设计者而言,这是一个更优的方案。成本不高,但收获最大。对于游戏设计者而言,这是一个更优的方案
42、。成本不高,但收获最大。 假设条件:假设条件: 1)联合行动收益大于非联合行动收益;)联合行动收益大于非联合行动收益; 2)非合作基础:影响力或影响因子相同。)非合作基础:影响力或影响因子相同。 丈丈 夫夫 足足 球球 芭芭 蕾蕾 足足 球球 2, 3 -1, - 1 妻妻 子子 芭芭 蕾蕾 1, 1 3, 2在性别之战中,任一在性别之战中,任一Nash均衡都是帕累托最优,其均衡都是帕累托最优,其他任一战略组合都不可能在不降低其他局中人支付的条件他任一战略组合都不可能在不降低其他局中人支付的条件下提高另一局中人的支付。下提高另一局中人的支付。在性别之战的两个在性别之战的两个Nash均衡中,最终
43、究竟是哪个?均衡中,最终究竟是哪个? 勇士博弈是反映勇士博弈是反映20世纪世纪50年代美国青年的行为特征,并通年代美国青年的行为特征,并通过过Jame Dean主演的电影主演的电影无因的反叛无因的反叛典型地表现出来:某典型地表现出来:某个青年集团中有个青年集团中有A和和B两人争斗集团头领。他们将通过一个勇两人争斗集团头领。他们将通过一个勇气测验来决定谁更勇敢,勇敢者就可以当头领。气测验来决定谁更勇敢,勇敢者就可以当头领。 测验规则如下:测验规则如下:A与与B各自驾驶自己的小车在一条道路上各自驾驶自己的小车在一条道路上面对面朝对方高速开去,谁第一个让开谁就输掉。让开者被称面对面朝对方高速开去,谁
44、第一个让开谁就输掉。让开者被称为胆小鬼(为胆小鬼(chicken)而不能当头领。如果两人都不让开,结)而不能当头领。如果两人都不让开,结果是车毁人亡。如果两人同时让开,结果是平局。如果一方让果是车毁人亡。如果两人同时让开,结果是平局。如果一方让开一方不让,让开者则既丢面子,又当不成头领。开一方不让,让开者则既丢面子,又当不成头领。 勇士博弈的支付矩阵如下:勇士博弈的支付矩阵如下:勇士博弈模型:勇士博弈模型: 局中人局中人B 前前 进进 避避 让让 前进前进 0, 0 8, 2 局中人局中人A 避让避让 2, 8 6, 6 警察与游行队伍警察与游行队伍 夫妻吵架夫妻吵架 产品销售的竞争产品销售的
45、竞争 假设局中人假设局中人A为潜在市场进入者,局中人为潜在市场进入者,局中人B为现有市场为现有市场的占有者。具体博弈模型如下所示:的占有者。具体博弈模型如下所示: 局中人局中人B:占有者:占有者 接接 纳纳 竞竞 争争 进入进入 20, 30 -10, 0 局中人局中人A: 进入者进入者 不进入不进入 0, 100 0, 100 局中人进行局中人进行“鹰鸽博弈鹰鸽博弈”对抗时,存在两种不同的对抗策对抗时,存在两种不同的对抗策略:或如鹰般地凶狠强硬;或如鸽子般地温和隐忍。略:或如鹰般地凶狠强硬;或如鸽子般地温和隐忍。 如果鹰同鸽进行搏斗,鸽就会迅即逃跑,因此鸽不会受到如果鹰同鸽进行搏斗,鸽就会迅
46、即逃跑,因此鸽不会受到伤害;如果是鹰跟鹰进行搏斗,就会一直打到其中一只受重伤伤害;如果是鹰跟鹰进行搏斗,就会一直打到其中一只受重伤或死亡才罢休;如果是鸽同鸽相遇,就谁也不会受伤。每只动或死亡才罢休;如果是鸽同鸽相遇,就谁也不会受伤。每只动物在搏斗中都选择两种策略之一,即物在搏斗中都选择两种策略之一,即“鹰策略鹰策略”或或“鸽策略鸽策略”。具体博弈模型如下:具体博弈模型如下: 甲甲 鹰鹰 鸽鸽 鹰鹰 -10,-10 10,5 乙乙 鸽鸽 5,10 5,5鹰鸽博弈的鹰鸽博弈的共有三种:共有三种:1.,即霍布斯的原始丛林;,即霍布斯的原始丛林;2.,即乌托邦;,即乌托邦;3.,这要求混合采取强硬或合
47、作的策略。,这要求混合采取强硬或合作的策略。 鹰鸽博弈不等同于斗鸡博弈:鹰鸽博弈不等同于斗鸡博弈: 斗鸡是两个兼具侵略性的个体,鹰、鸽却是两个不同群体斗鸡是两个兼具侵略性的个体,鹰、鸽却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子的苞谷场里,突然的博弈,一个和平,一个侵略。在只有鸽子的苞谷场里,突然加入的鹰将大大获益,并吸引其同伴加入。但结果不是鹰将鸽加入的鹰将大大获益,并吸引其同伴加入。但结果不是鹰将鸽悉数逐出苞谷场,而是以一定比例共存,因为当鹰群增加一只悉数逐出苞谷场,而是以一定比例共存,因为当鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡就达成。由此产鹰的边际收益趋零时(鹰
48、群发生内斗),均衡就达成。由此产生了演化稳定策略(生了演化稳定策略(Evolutionary Stable Strategy)一旦均一旦均衡形成,偏离的运动会受到自然选择的打击,也就是鹰群饱满衡形成,偏离的运动会受到自然选择的打击,也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤出去。后,再试图加入的鹰将会被鹰群排挤出去。 在以下的选择中,如果你的选择与多数局中人在以下的选择中,如果你的选择与多数局中人的选择一致,你就可以赢钱,否则就输钱,那么,你在博弈中的选择一致,你就可以赢钱,否则就输钱,那么,你在博弈中将采取什么策略?将采取什么策略? (1)选择下列中的一个数字:)选择下列中的一个数字:7
49、,100,13,265,98,666。 (2)你要在学校与一个没有来过这里的高中同学会面,你会)你要在学校与一个没有来过这里的高中同学会面,你会选择在什么时间(上午、中午、晚上)、什么地点(校园范围)选择在什么时间(上午、中午、晚上)、什么地点(校园范围)碰面?碰面? (3)你与另一位同学共同分一个蛋糕,你们各自报出期望分)你与另一位同学共同分一个蛋糕,你们各自报出期望分到的比例,如果你们报的比例之和超过到的比例,如果你们报的比例之和超过100%,大家都将一无所,大家都将一无所获,你会报名什么比例?获,你会报名什么比例? 就是出于心理或其他非理性原因受到人们共同就是出于心理或其他非理性原因受到
50、人们共同关注的那些关注的那些Nash均衡。均衡。 在上述博弈中,每一个题目都有许多在上述博弈中,每一个题目都有许多Nash均衡。均衡。但是,在这些但是,在这些Nash均衡中,总有一些看起来或多或少可能均衡中,总有一些看起来或多或少可能性会更大一些。这些特点的战略组合就称为聚点。性会更大一些。这些特点的战略组合就称为聚点。 在重复博弈中,以往的经历或做法通常就确定在重复博弈中,以往的经历或做法通常就确定了聚点的位置。例如,如果我们第一次分蛋糕,往往彼此了聚点的位置。例如,如果我们第一次分蛋糕,往往彼此可能会同意五五分成。但是,如果曾经按四六分成过,这可能会同意五五分成。但是,如果曾经按四六分成过