《博弈论与企业竞争策略.ppt》由会员分享,可在线阅读,更多相关《博弈论与企业竞争策略.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第第七章七章 博弈论与博弈论与企业竞争策略企业竞争策略l 第一节第一节 博弈论的基本概念博弈论的基本概念l 第二节第二节 完全信息静态博弈完全信息静态博弈l 第三节第三节 重复博弈和序列博弈重复博弈和序列博弈l 在在现现实实经经济济社社会会,完完全全垄垄断断和和完完全全竞竞争争的的市市场场结结构构十十分分少少见见。厂厂商商在在市市场场中中既既有有一一定定的的垄垄断断势势力力,又又面面临临很很大大的的竞竞争争压压力力。厂厂商商之之间间具具有有相相关关性性和和依依存存性性。因因此此,可可以以用用博博弈弈论论的的方法解释和说明厂商的竞争行为和策略方法解释和说明厂商的竞争行为和策略 博博弈弈论论是是
2、70年年代代中中期期以以来来微微观观经经济济学学发发展展的一个重要方面的一个重要方面。1994年年的的诺诺贝贝尔尔经经济济学学奖奖被被授授予予博博弈弈论论专专家家:纳纳什什(Nash)、泽泽尔尔腾腾(Selten)和和海海萨萨尼尼(Harsanyi),他他们们都都对对博博弈弈论论在在经经济济学学中中的的应用作出了贡献。应用作出了贡献。l70年年代代以以来来,博博弈弈论论已已经经发发展展成成为为现现代代经经济济学学的的基基础础重重要要基基础础之之一一,改改变变了了传传统统经经济济学学的的结结构构,这这主主要要有有两个方面的原因两个方面的原因:l1传传统统经经济济学学着着重重研研究究市市场场机机制
3、制和和价价格格制制度度,分分析析完完全全竞竞争争市市场场中中的的最最优优决决策策,不不考考虑虑决决策策者者之之间间的的相相互互影影响响。但但是是,现现实实经经济济运运行行中中市市场场是是不不完完全全竞争的,行为主体之间的决策具有相互影响竞争的,行为主体之间的决策具有相互影响。l2完完全全竞竞争争市市场场是是以以完完全全信信息息为为条条件件的的,这这在在现现实实经经济济运运行行中中也也难难以以保保证证。在在信信息息不不对对称称条条件件下下,考考虑虑行行为为主主体体相相互互影影响响的的非非价价格格制制度度可可以以用用博博弈弈论论分析分析。l当当然然,应应用用博博弈弈论论解解决决竞竞争争策策略略问问
4、题题也也是是有有条条件件的的。除除了了掌掌握握博博弈弈论论方方法法外外,关关键键是是正正确确估估计计各各参参与与者者的的策略空间和收益函数策略空间和收益函数。寡头对抗寡头对抗&博弈理论博弈理论博弈博弈:是指个人或组织在一定的环境条件下,以一定:是指个人或组织在一定的环境条件下,以一定的规则进行决策并从中取得相应结果的的规则进行决策并从中取得相应结果的过程过程。博弈论(博弈论(Game Theory):):研究博弈参与者在利益冲突条件下进行决策的研究博弈参与者在利益冲突条件下进行决策的理论理论。博弈的种类:博弈的种类:合作博弈与非合作博弈合作博弈与非合作博弈同时博弈与顺序博弈同时博弈与顺序博弈一
5、次博弈与重复博弈一次博弈与重复博弈双人博弈与双人博弈与 n人博弈人博弈零和博弈与非零和博弈零和博弈与非零和博弈 博弈论与博弈论与寡头厂商竞争寡头厂商竞争 严格地讲,严格地讲,博弈论博弈论并不是经济学的一个分并不是经济学的一个分支,它支,它是一种方法是一种方法,应用范围除经济学外,还,应用范围除经济学外,还包括政治学、军事学、外交学、国际关系学、包括政治学、军事学、外交学、国际关系学、犯罪学等。但为何博弈论受到经济学的重视呢?犯罪学等。但为何博弈论受到经济学的重视呢?主要原因是博弈论在经济学中得到最广泛、最主要原因是博弈论在经济学中得到最广泛、最成功的应用,尤其在寡头市场理论中得到直接成功的应用
6、,尤其在寡头市场理论中得到直接的应用。的应用。另外,博弈论的许多成果也是借助于另外,博弈论的许多成果也是借助于经济学的例子来发展的。经济学的例子来发展的。当寡头竞争者改变其产品或定价时当寡头竞争者改变其产品或定价时,企业必须企业必须要做出反应或调整,能够预见到对方行动的事前要做出反应或调整,能够预见到对方行动的事前行为最佳。行为最佳。第一节第一节 博弈论的基本概念博弈论的基本概念l一博弈论及其特点博弈论及其特点l1博弈和博弈论博弈和博弈论l博博弈弈是是指指具具有有不不同同利利益益和和目目标标的的多多个个行行为为主主体体共共同同参参加加,并并相相互互影影响响的的事事态态发发展展过过程程中中的策略
7、决策的策略决策。l博弈论(博弈论(Game Theory)也称对策论也称对策论,研究研究博弈参与者在利益冲突条件下进行决策的理博弈参与者在利益冲突条件下进行决策的理论论。它是一种分析博弈过程和结果的数学方它是一种分析博弈过程和结果的数学方法法。研究具有理性的多个行为主体的决策和研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,行动直接相互作用和影响时,事态发展过程事态发展过程的决策和均衡问题。的决策和均衡问题。广泛应用于政治、军事、广泛应用于政治、军事、经济、外交和日常生活的许多领域经济、外交和日常生活的许多领域。2特点特点:l(1)参与者具有各自的目标:)参与者具有各自的目标:l(
8、2)参与者都是理性行为者;)参与者都是理性行为者;l(3)参与者之间具有相关性;)参与者之间具有相关性;l(4)事事态态发发展展的的结结果果取取决决于于全全部部参参与与者者的的共共同行为;同行为;l(5)参参与与者者要要根根据据对对其其他他参参与与者者的的判判断断决决定定自己的行动,因而是对策。自己的行动,因而是对策。l可可见见,博博弈弈论论是是与与优优化化论论不不同同的的决决策策理理论论。优优化化论论是是一一种种单单人人决决策策理理论论;博博弈弈论论所所揭揭示示的的规规律是一种律是一种多人决策理论多人决策理论。二博弈论的基本概念二博弈论的基本概念l在在博弈论中,博弈论中,博弈的基本要素被概括
9、为以下概念:博弈的基本要素被概括为以下概念:(1)参参与与者者Players(玩玩家家):即即参参加加博博弈弈过过程程的的行行为为和和决决策策主体,也是利益主体。在一个博弈中,最少要有两个参与者。主体,也是利益主体。在一个博弈中,最少要有两个参与者。(2)策策略略Strategies(战战略略或或策策略略行行为为):即即参参与与者者在在某某个个博博弈弈时时点点,根根据据其其掌掌握握的的有有关关博博弈弈信信息息而而选选择择的的决决策策变变量量和和行行动动计划,一个参与者的全部可行策略称为他的计划,一个参与者的全部可行策略称为他的策略空间策略空间。(3)收收益益Payoff(支支付付、得得益益)和
10、和收收益益函函数数:收收益益是是指指在在既既定定策策略略组组合合条条件件下下参参与与者者的的得得失失情情况况。每每个个参参与与者者的的收收益益取取决决于于全部参与者所采取的策略,称为收益函数。全部参与者所采取的策略,称为收益函数。(4)结结局局 outcome(结结果果):指指博博弈弈的的结结果果,指指既既定定策策略略组组合合条件下全部参与者所得收益的集合。条件下全部参与者所得收益的集合。(5)均均衡衡 Equilibrium(均均势势):指指达达到到稳稳定定的的策策略略组组合合或或结结局局。(6)博博弈弈规规则则:指指参参与与者者、策策略略、结结局局之之间间的的联联系系。它它是是由由博博弈的
11、环境和参与者之间的相互影响决定的。弈的环境和参与者之间的相互影响决定的。l例:例:可口可乐与百事可乐(可口可乐与百事可乐(参与者参与者)的价格决策)的价格决策:l双方都可以保持价格不变或者提高价格(双方都可以保持价格不变或者提高价格(策略策略)l博弈的目标和得失情况体现为利润的多少(博弈的目标和得失情况体现为利润的多少(收益收益)l利润的大小取决于双方的策略组合(利润的大小取决于双方的策略组合(收益函数收益函数)l博弈有四种策略组合,其博弈有四种策略组合,其结局结局是:是:l(1)如果双方都不涨价,各得利润)如果双方都不涨价,各得利润10单位;单位;l(2)如如果果可可口口可可乐乐不不涨涨价价
12、,百百事事可可乐乐涨涨价价,可可口口可可乐乐利利润润100,百事可乐利润,百事可乐利润-30;l(3)如如果果可可口口可可乐乐涨涨价价,百百事事可可乐乐不不涨涨价价,可可口口可可乐乐利利润润-20,百事可乐利润,百事可乐利润30;l(4)如果双方都涨价,可口可乐利润)如果双方都涨价,可口可乐利润140,百事可乐利润,百事可乐利润35l博博弈弈的的稳稳定定状状态态有有两两个个:都都不不涨涨价价或或者者都都涨涨价价(均均衡衡),均均衡衡称称为为博博弈弈的的解解,它它是是由由博博弈弈规规则则(即即参参与与者者采采取取什什么么策策略略会会取取得什么结局,市场的需求弹性、交叉价格弹性等)决定得什么结局,
13、市场的需求弹性、交叉价格弹性等)决定的的。三博弈的表述方法三博弈的表述方法l博弈一般用数学模型表达,分为标准和扩展模型两种。博弈一般用数学模型表达,分为标准和扩展模型两种。l1.博博弈弈的的标标准准模模型型 包包括括三三个个要要素素:参参与与者者、每每个个参参与与者者可可以以选选择的择的策略策略以及以及收益函数收益函数。l在在两两个个参参与与者者的的有有限限博博弈弈中中,标标准准模模型型可可以以用用收收益益矩矩阵阵表表示示。如上例的可乐价格博弈可以表示如下:如上例的可乐价格博弈可以表示如下:l在收益矩阵中,包在收益矩阵中,包含了标准博弈模型含了标准博弈模型的基本信息,表格的基本信息,表格中各组
14、数字表示不中各组数字表示不同策略组合条件下同策略组合条件下的结局。的结局。在每个结在每个结局中,第一个数字局中,第一个数字代表参与者代表参与者1 的收的收益,第二个数字代益,第二个数字代表参与者表参与者2的收益的收益。参与者参与者2 百事可乐百事可乐 参与者参与者2 可口可乐可口可乐 不涨价不涨价 涨价涨价 不涨价不涨价 涨价涨价10,10 100,-30-20,30 140,35返回2.博弈的扩展模型博弈的扩展模型l 包包括括五五个个要要素素:参参与与者者、决决策策时时点点、策策略略空空间间、信信息息和和收收益益函函数数。在在简简单单的的博博弈弈中中,扩扩展展模模型型可可以以用用博博弈弈树树
15、表表示示。如如上上例例的的可乐价格博弈可表示如图可乐价格博弈可表示如图下下:不不涨涨价价涨价涨价参与者1可口可乐10,10100,-30-20,30140,35不涨价涨价参与者2百事可乐不涨价涨价参与者2百事可乐l博弈树一般用来博弈树一般用来分析动态博弈。分析动态博弈。在博弈过程中,在博弈过程中,从某一个决策点从某一个决策点开始,参与者在开始,参与者在已有行动的基础已有行动的基础上开始选择,到上开始选择,到博弈结束,称为博弈结束,称为“子博弈子博弈”。子博子博弈是相对的,从弈是相对的,从事态发展的历史事态发展的历史来看,所有的博来看,所有的博弈都是子博弈弈都是子博弈。四博弈的分类四博弈的分类l
16、(1)合合作作博博弈弈与与非非合合作作博博弈弈 根根据据参参与与者者之之间间能能否否通通过过谈谈判判达成具有约束力的协议或合同来划分达成具有约束力的协议或合同来划分。l可可以以达达成成协协议议的的为为合合作作博博弈弈cooperative game,合合作作博博弈弈强调集体理性和整体最优。强调集体理性和整体最优。如买卖双方如买卖双方讨价还价讨价还价后后成交成交。l不不能能达达成成协协议议的的为为非非合合作作博博弈弈non-cooperative game,非非合合作作博博弈弈强强调调个个体体理理性性和和局局部部最最优优。如如寡寡头头之之间间的的竞竞争争博博弈弈,双双方方的的利利益益和和目目标标
17、有有冲冲突突,难难以以达达成成可可以以实实施施的的协协议议,双双方方都都有有欺欺骗骗和和违违约约的的冲冲动动。博博弈弈论论在在经经济济学学中中的的应应用用主主要要在在非非合作博弈领域合作博弈领域。l(2)静态博弈与动态博弈静态博弈与动态博弈 根据参与者选择策略的关系划分根据参与者选择策略的关系划分l参与者参与者同时或独立选择策略同时或独立选择策略的博弈是的博弈是静态博弈静态博弈。l参参与与者者按按照照一一定定的的次次序序选选择择策策略略,后后选选择择者者了了解解先先选选择择者者的的行动,这种博弈是行动,这种博弈是动态博弈动态博弈。l(3)完完全全信信息息博博弈弈与与不不完完全全信信息息博博弈弈
18、 根根据据参参与与者者对对其其他他参参与者的特征、策略空间、收益函数等信息的了解程度划分。与者的特征、策略空间、收益函数等信息的了解程度划分。l全部相互了解即为全部相互了解即为完全信息博弈完全信息博弈,否则是,否则是不完全信息博弈不完全信息博弈。第二节第二节 完全信息静态博弈完全信息静态博弈l一囚徒的困境与纳什均衡一囚徒的困境与纳什均衡l1囚囚徒徒的的困困境境:假假设设有有两两个个嫌嫌疑疑犯犯作作案案后后被被抓抓获获,并并在在不不同同的的房房间间审审讯讯。警警察察告告诉诉他他们们,如如果果两两人人都都坦坦白白,各各判判刑刑8年年;如如果果两两人人都都抵抵赖赖,各各判判刑刑1年年;如如果果其其中
19、中一一人人坦坦白白而而另另一一人人抵抵赖赖,坦坦白白者者释释放放,抵抵赖赖者者判判刑刑10年年;这这样样,每每个个犯犯人就有两种策略,即坦白和抵赖。这个博弈的收益矩阵如人就有两种策略,即坦白和抵赖。这个博弈的收益矩阵如下 囚徒囚徒1坦白坦白抵赖抵赖 囚徒囚徒2坦白坦白 抵赖抵赖-8,-8 0,-10-10,0 -1,-1l在这个博弈中,(坦白,在这个博弈中,(坦白,坦白)是博弈的解,即坦白)是博弈的解,即均衡结局。因为不管对均衡结局。因为不管对方怎样行动,两个囚徒方怎样行动,两个囚徒都会选择坦白。都会选择坦白。l囚徒的困境说明,个人囚徒的困境说明,个人理性(最优)与集体理理性(最优)与集体理性
20、(最优)可能不一致。性(最优)可能不一致。如寡头之间的广告投入、如寡头之间的广告投入、产量控制等。产量控制等。2纳什均衡纳什均衡l纳什均衡纳什均衡:是指由所有参与者的最优策略组成的策略组合。是指由所有参与者的最优策略组成的策略组合。在这种情况下,没有人可以从改变策略中得到好处,因而形在这种情况下,没有人可以从改变策略中得到好处,因而形成了一种均衡(僵局)。成了一种均衡(僵局)。l一种制度或者协议要能够自动实行(即得到自觉遵守),必一种制度或者协议要能够自动实行(即得到自觉遵守),必须满足纳什均衡的条件须满足纳什均衡的条件。l可以通过画圈的方法求解纳什均衡。即设定一个参与者的策可以通过画圈的方法
21、求解纳什均衡。即设定一个参与者的策略,然后把另一个参与者将会选择的策略可以带来的收益圈略,然后把另一个参与者将会选择的策略可以带来的收益圈起来。如果收益矩阵中某个策略组合中的两个收益都被圈起起来。如果收益矩阵中某个策略组合中的两个收益都被圈起来,则这个策略组合就是纳什均衡。来,则这个策略组合就是纳什均衡。l例如例如,前述前述可乐定价博弈收益矩阵可以确定有(涨价,涨价)可乐定价博弈收益矩阵可以确定有(涨价,涨价)和(不涨价,不涨价)两个纳什均衡和(不涨价,不涨价)两个纳什均衡。l在在这这个个博博弈弈中中,出出现现了了两两个个纳纳什什均均衡衡,参参与与者者不不能能判判断断对对方方会会采采取取什什么
22、么策策略略,因因而而可可能能出出现现非非均均衡衡的的结结局局(涨涨价价,不不涨涨价价)和和(不不涨涨价价,涨涨价价);或或者者对对双双方方不不利利的的均均衡衡(不不涨涨价价,不不涨涨价价)。因因此此,纳纳什什均均衡衡只只说说明明均均衡衡存存在在的的可可能能,不不能能解解释均衡的释均衡的结果结果。二支配性策略均衡二支配性策略均衡l支支配配性性策策略略均均衡衡也也称称上上策策均均衡衡或或优优势势策策略略均均衡衡。在在博博弈弈中中,对对有有些些参参与与者者来来说说,不不管管对对手手采采取取什什么么策策略略,他他的的策策略略都都保保持持不不变变。这这种种不不取取决决于于对对手手选选择择的的最最优优策策
23、略略称称为为支支配配性性策策略略(上上策策或优势策略)。或优势策略)。l当当存存在在支支配配性性策策略略时时,可可以以首首先先确确定定支支配配性性策策略略,然然后后确确定定对对手手的的选选择择,从从而而得得出出博博弈弈的的均均衡衡解解。例例如如,两两个个寡寡头头厂厂商商的的广广告博弈收益矩阵如告博弈收益矩阵如下:参与者参与者1可可 口口 可可乐乐有广告有广告无广告无广告 参与者参与者2 百事可乐百事可乐有广告有广告 无广告无广告10,5 15,06,8 20,6l在这个博弈中,百事可乐有在这个博弈中,百事可乐有一个支配性策略,即不管可一个支配性策略,即不管可口可乐是否有广告,他都会口可乐是否有
24、广告,他都会有广告。在此基础上,可口有广告。在此基础上,可口可乐必然也会有广告。博弈可乐必然也会有广告。博弈的结果就是(有广告,有广的结果就是(有广告,有广告)。这种均衡称为告)。这种均衡称为上上策均策均衡。它也是纳什均衡衡。它也是纳什均衡,但纳但纳什均衡不一定是什均衡不一定是上策均衡上策均衡。价格竞争的策略选择价格竞争的策略选择BA10元元15元元10元元15元元100,8050,170180,30150,120A、B两家的上策均是低价两家的上策均是低价-10元元上策与上策均衡:上策与上策均衡:不管对方如何,这种策略总是最优的策略称为不管对方如何,这种策略总是最优的策略称为上策。上策。在上述
25、价格竞争博弈中,低价策略对任一方来说都是上策。在上述价格竞争博弈中,低价策略对任一方来说都是上策。博弈中的博弈中的均衡均衡是指一种稳定的结局,是指一种稳定的结局,当这种结局出现时,所有当这种结局出现时,所有对局者都不想再改变他们的策略。对局者都不想再改变他们的策略。双方都采取上策的均衡为双方都采取上策的均衡为上策均衡。上策均衡。在上述价格竞争博弈中在上述价格竞争博弈中(10元,元,10元元)就是一个上策均衡就是一个上策均衡 性别之战性别之战 l现实中也大量存在着现实中也大量存在着没有上策的均衡没有上策的均衡男男女女足球足球电影电影足球足球电影电影2,10,00,01,2纳什均衡纳什均衡在这种博
26、弈中,男女双方都没有上策,其最优策略依在这种博弈中,男女双方都没有上策,其最优策略依赖于对方的选择,一旦对方选择了某一活动,则选择赖于对方的选择,一旦对方选择了某一活动,则选择与对方一样的活动就是最好的策略与对方一样的活动就是最好的策略这一博弈中存在两个均衡结局,我们称之为这一博弈中存在两个均衡结局,我们称之为纳什均衡纳什均衡(NASH EQUILIBRIUM)手机短消息标准的争夺手机短消息标准的争夺诺基亚诺基亚EMSSMEMSSM100,5030,200,0 60,90 爱立信等爱立信等上策均衡与纳什均衡上策均衡与纳什均衡上策均衡上策均衡:不管你选择什么,我的选择是最好的;:不管你选择什么,
27、我的选择是最好的;不管我选择什么,你的选择是最好的;不管我选择什么,你的选择是最好的;纳什均衡纳什均衡:给定你的策略,我所选择的是最好的,:给定你的策略,我所选择的是最好的,给定我的策略,你所选择的是最好的;给定我的策略,你所选择的是最好的;上策均衡是纳什均衡的一种特殊情况。上策均衡是纳什均衡的一种特殊情况。下例是纳什均衡。下例是纳什均衡。智猪博智猪博弈弈l猪圈中有两头猪,一头大猪,一头小猪。猪圈中有两头猪,一头大猪,一头小猪。猪圈的一头是食槽,另一头是按钮。按猪圈的一头是食槽,另一头是按钮。按一次按钮会有一次按钮会有10个单位猪食进槽,但按个单位猪食进槽,但按按钮需花费按钮需花费2个单位的成
28、本。若大猪先到,个单位的成本。若大猪先到,大猪能吃到大猪能吃到9个单位,小猪只能吃到个单位,小猪只能吃到1个个单位;若同时到,大猪吃单位;若同时到,大猪吃7个单位,小猪个单位,小猪吃吃3个单位;若小猪先到,大猪吃个单位;若小猪先到,大猪吃6个单个单位,小猪吃位,小猪吃4个单位。纳什均衡何在?个单位。纳什均衡何在?智猪博弈的得益矩阵智猪博弈的得益矩阵小猪的上策是等待小猪的上策是等待小猪小猪大大猪猪按按按按等待等待5,1 4,4 等待等待9,1 0,0 研究开发中的研究开发中的“智猪博弈智猪博弈”小企业的上策是模小企业的上策是模仿仿 小企业小企业 投入投入 模仿模仿500,80 300,30080
29、0,100 0,0投入投入模仿模仿大大企企业业 三合作的诱惑三合作的诱惑l在在类类似似囚囚徒徒的的困困境境这这样样的的博博弈弈中中,个个体体理理性性往往往往导导致致集集体体的的非非理理性性。在在有有多多个个纳纳什什均均衡衡的的博博弈弈中中,参参与与者者判判断断失失误误,或或者者某某个个参参与与者者非非理理性性行行为为,都都会会导导致致双双方方的的严严重重损损失失。因因此此,存存在在着着通通过过合合作作(共共谋谋、勾勾结结和和串串通通)改改善善博博弈弈结结果果的的诱诱惑惑,这这样样可可以以是是大大家家的的收收益都得到改善。益都得到改善。l例例如如,在在上上述述广广告告博博弈弈中中,如如果果双双方
30、方都都不不做做广广告告,比比都都做做广广告告收收益益高高。但但这这种种合合作作难难以以自动实现。自动实现。1对社会无害的合作,往往通过某些规则实现对社会无害的合作,往往通过某些规则实现。l如香烟广告,交通规则,重复建设。如香烟广告,交通规则,重复建设。l下下图图列列出出了了斗斗鸡鸡博博弈弈的的收收益益矩矩阵阵。设设两两辆辆汽汽车车同同时时到到达达一一个个十十字字路路口口,每每个个驾驾驶驶员员都都有有开开和和等等两两种种选选择择,博弈结果如下:博弈结果如下:驾驶员驾驶员1开开等等 驾驶员驾驶员2 开开 等等 -8,-8 4,0 0,4 0,0l在这个博弈中,在这个博弈中,(开,等)和(等,(开,
31、等)和(等,开)是两个纳什均开)是两个纳什均衡,但在完全信息衡,但在完全信息静态博弈中,可能静态博弈中,可能由于判断失误导致由于判断失误导致交通事故,或无谓交通事故,或无谓地延误时间。因此地延误时间。因此通过交通规则引导通过交通规则引导博弈博弈。厂商厂商1脆脆甜甜 厂商厂商2 脆脆 甜甜 -5,-5 10,20 20,10 -8,-8 避免重复建设避免重复建设l例如例如两个厂商进行产品开发博弈的收益矩阵。两个两个厂商进行产品开发博弈的收益矩阵。两个厂商同时开发一个市场(麦片),市场需要甜和脆厂商同时开发一个市场(麦片),市场需要甜和脆两种产品,每个厂商只能生产其中一种产品。从收两种产品,每个厂
32、商只能生产其中一种产品。从收益矩阵可以看出,在理性行为条件下博弈的两个纳益矩阵可以看出,在理性行为条件下博弈的两个纳什均衡是(脆,甜)和(甜,脆)。但由于推出甜什均衡是(脆,甜)和(甜,脆)。但由于推出甜的厂商有较多利润,可能导致(甜,甜)的重复建的厂商有较多利润,可能导致(甜,甜)的重复建设结果。因此,应该通过发布信息和政策引导。国设结果。因此,应该通过发布信息和政策引导。国外不允许厂商之间勾结分割市场,主要靠准确的市外不允许厂商之间勾结分割市场,主要靠准确的市场信息。场信息。2对社会有害的合作,设法制止对社会有害的合作,设法制止l在在囚囚徒徒的的困困境境博博弈弈中中,如如果果两两个个囚囚徒
33、徒可可以以互互相相协协商商,并并形形成成攻攻守守同同盟盟,则则罪罪犯犯得得到到好好处处,对对社社会会不不利利。例例如如在在寡寡头头厂厂商商的的定定价价博博弈弈中中,勾勾结结定定高高价价对对双双方方都都有有好好处处,但但对对社社会会不不利利,因因此此受受到到反反垄垄断断法法的的严严密监控。密监控。l寡头寡头厂商的厂商的价格博弈收益矩阵价格博弈收益矩阵如下:如下:厂商厂商1高价高价低价低价 厂商厂商2 高价高价 低价低价 50,50 10,70 70,10 30,30 四最大最小策略四最大最小策略l纳纳什什均均衡衡是是建建立立在在参参与与者者理理性性行行为为基基础础上上的的,这这就就使使参参与与者
34、者的的决决策策时时面面临临可可能能出出现现某某些些非非理理性性行行为为的的风风险险。为为了了降降低低风风险险,决决策策者者可可以以采采取取最最大大最最小小策策略略(先先选选小小的的,再再选选大大的的;或或叫叫小小中中选选大大)以以便便降降低低风风险险,即即在在各各种种策策略略的的最最小小收收益益中中,选选择择具具有最大收益的策略有最大收益的策略。其其代价是放弃最优策略。代价是放弃最优策略。l下下图图是是一一个个产产品品开开发发博博弈弈的的收收益益矩矩阵阵。其其中中,按按照照理理性性行行为为会会有有两两种种纳纳什什均均衡衡,(无无新新产产品品,有有新新产产品品)以以及及(有有新新产产品品,无无新
35、新产产品品)。但但如如果果采采取取最最大大最最小小策策略略,两两个个企企业业都都不不推推出出新新产品。产品。厂商厂商1无新品无新品有新品有新品 厂商厂商2无新品无新品 有新品有新品4,4 3,66,3 2,2厂商厂商2的最小收益的最小收益 3 2厂厂商商1的的最最小小收收益益 3 2支配性策略支配性策略l在在有有些些情情况况下下,为为了了避避免免陷陷入入被被动动,采采取取最最大大最最小小策策略略十十分分必必要要。在在下下图图的的博博弈弈中中,乙乙方方采采取取“右右”是是一一个个支支配配性性策策略略。因因为为不不管管甲甲方方选选什什么么,乙乙方方采采取取右右的的策策略略都都比比左左的的策策略略好
36、好,可可以以得得到到1的的收收益益。在在期期望望乙乙方方采采取取右右的的情情况况下下,甲甲方方应应该该采采取取“下下”,并得到,并得到2的收益。这样,的收益。这样,支配性策略均衡为(下,支配性策略均衡为(下,右)右)l如如果果甲甲方方比比较较慎慎重重,考考虑虑到到乙乙方方可可能能不不一一定定理理性性,或或者者可可能能故故意意捉捉弄弄甲甲方方,则则应应该该采采取取最最大大最最小小策策略略,形形成成(上上,右右)的博弈结果。的博弈结果。甲方甲方上上下下 乙方乙方 左左 右右 1,0 1,1 -8,0 2,1乙方的最小收益乙方的最小收益 0 1甲甲方方的的最最小小收收益益 1 8-如果两个硬币的面一
37、致如果两个硬币的面一致(都是正面或都是反面)(都是正面或都是反面)博弈博弈A方赢,如果一正方赢,如果一正一反,一反,B方赢。你的策略方赢。你的策略最好是最好是1/2选正面,选正面,1/2选反面的随机策略选反面的随机策略。B方方正面正面反面反面正面正面反面反面A方方1,-1-1,1-1,1 1,-1五五.混合策略混合策略 在有些博弈中,不存在所谓纯策略的纳什均衡在有些博弈中,不存在所谓纯策略的纳什均衡。在任一个纯策略组合下,都有一个博弈方可单方改变在任一个纯策略组合下,都有一个博弈方可单方改变策略而得到更好的得益。但有一个策略而得到更好的得益。但有一个混合策略混合策略,就是,就是博弈方根据一组选
38、定的概率,在可能的行为中随机选博弈方根据一组选定的概率,在可能的行为中随机选择的策略。择的策略。例如博弈硬币的正反面,例如博弈硬币的正反面,博弈模型与竞争策略博弈模型与竞争策略警卫与窃贼的博弈警卫与窃贼的博弈警卫睡觉警卫睡觉,小偷去偷小偷去偷,小偷得益小偷得益B,警卫被处分警卫被处分-D。警卫不睡,小偷去偷,小偷被警卫不睡,小偷去偷,小偷被抓受惩处抓受惩处-P,警卫不失不得。警卫不失不得。警卫睡觉,小偷不偷,小偷不警卫睡觉,小偷不偷,小偷不失不得,警卫得到休闲失不得,警卫得到休闲R.警卫不睡,小偷不偷,都不得警卫不睡,小偷不偷,都不得不失。不失。警卫警卫睡觉睡觉不睡觉不睡觉偷偷不偷不偷窃贼窃贼
39、B,-D-P,0 0,R0,0博弈模型与竞争策略博弈模型与竞争策略混合博弈的两个原则混合博弈的两个原则一一 不能让对方知道或猜到自己的选择,不能让对方知道或猜到自己的选择,因此必须在决策时采取随机决策;因此必须在决策时采取随机决策;二二 选择每种策略的概率要恰好使对方无选择每种策略的概率要恰好使对方无机可乘,对方无法通过有针对性的倾向机可乘,对方无法通过有针对性的倾向于某种策略而得益于某种策略而得益博弈模型与竞争策略博弈模型与竞争策略警卫是不是睡觉决定于小偷偷不偷的警卫是不是睡觉决定于小偷偷不偷的概率,而小偷偷不偷的概率在于小概率,而小偷偷不偷的概率在于小偷偷猜猜警卫睡不睡觉。警卫睡不睡觉。小
40、偷一定来偷,警卫一定不睡觉;小偷一定来偷,警卫一定不睡觉;小偷一定不来偷,警卫一定睡觉。小偷一定不来偷,警卫一定睡觉。警卫的得益警卫的得益 与小偷偷不偷的概率有关与小偷偷不偷的概率有关博弈模型与竞争策略博弈模型与竞争策略若小偷来偷的概率为若小偷来偷的概率为 偷偷 警卫警卫睡觉睡觉的得益为:的得益为:R (1-偷偷)+(-D)偷偷小偷认为警卫不会愿意小偷认为警卫不会愿意得益为负,最多为零。得益为负,最多为零。即即R/D=偷偷/(1-偷偷)小偷偷不偷的概率比等小偷偷不偷的概率比等于于R与与D的比率的比率 01小偷偷小偷偷的概率的概率警卫睡觉的期望得益警卫睡觉的期望得益RDP偷偷R相较于相较于D越大
41、,即罚得越轻,越大,即罚得越轻,警卫睡觉的可能性越大,小偷偷警卫睡觉的可能性越大,小偷偷的可能性越大。守卫的严密程度的可能性越大。守卫的严密程度决定了小偷偷的可能性大小。决定了小偷偷的可能性大小。博弈模型与竞争策略博弈模型与竞争策略 同样的道理警卫偷懒的概率同样的道理警卫偷懒的概率(睡觉)(睡觉)睡睡 决定了小偷的得益为:决定了小偷的得益为:(-P)(1-睡睡)+(B)睡睡警卫也认为小偷不会愿意得益警卫也认为小偷不会愿意得益为负,最多为零。为负,最多为零。即即B/P=(1-睡睡)/睡睡 警卫偷不偷懒的概率取决于警卫偷不偷懒的概率取决于 B与与P的比率的比率有趣的激励悖论有趣的激励悖论-抓住小偷
42、罚款抓住小偷罚款?01警卫偷懒警卫偷懒的概率的概率小偷的期望得益小偷的期望得益P睡PBB 较较 P越大,即越大,即 被盗损失越大,警卫不睡的可能性越大被盗损失越大,警卫不睡的可能性越大第三节第三节 重复博弈和序列博弈重复博弈和序列博弈l在在现现实实经经济济社社会会,完完全全信信息息静静态态博博弈弈的的条条件件并并不不经经常常可可以以得得到到满满足足。特特别别是是在在市市场场竞竞争争中中,厂厂商商之之间间的的竞竞争争不不是是一一次次性性的的,而而是是长长期期和和反反复复的的。同同时时,厂厂商商之之间间的的行行为为往往往往是是有有先先后后次次序序的的,决决策策者者可可以以先先了了解解对对手手的的行
43、行动动,在在充充分分掌掌握握信信息息的的基基础础上上,然然后后再再决决定定自自己己的的对对策策。这这种种情情况况称称为为完完全全信信息息动动态态博博弈弈。它它对对于于分分析析具具有有多多个个纳纳什什均均衡衡的的博博弈弈结结果果很很有帮助。有帮助。重复博弈重复博弈l对对重复的囚犯困境博弈,发现最好的策略重复的囚犯困境博弈,发现最好的策略也是最简单的策略,即也是最简单的策略,即“以牙还牙以牙还牙”l美国密执安大学教授美国密执安大学教授R.爱克塞罗曾邀请博爱克塞罗曾邀请博弈论专家就囚犯的困境问题提交计算机程弈论专家就囚犯的困境问题提交计算机程序,以竞赛方式来决定哪种策略是最好的。序,以竞赛方式来决定
44、哪种策略是最好的。有有14位各个领域的专家提交了程序,共进位各个领域的专家提交了程序,共进行了行了5次循环赛,次循环赛,12万次对局,得到上述结万次对局,得到上述结论论重复博弈次数的影响重复博弈次数的影响l理论上理论上容易证明容易证明,只要博弈只进行有限次,只要博弈只进行有限次,那么重复博弈的结果就和一次性博弈没有那么重复博弈的结果就和一次性博弈没有差别差别l思考:思考:在实践中,应如何理解博弈的重复在实践中,应如何理解博弈的重复次数?如何理解在这种情况下竞争者的理次数?如何理解在这种情况下竞争者的理性?(性?(竞争者能进行无限次吗?因此在实竞争者能进行无限次吗?因此在实践中践中“收敛收敛”得
45、很快!)得很快!)一重复博弈一重复博弈 Repeated gamel重重复复博博弈弈是是指指参参与与者者之之间间的的博博弈弈不不是是一一次次性性的的,而而是是可可以以重重复复的的。这样,参与者就可以通过分析对手的行动采取相应的策略。这样,参与者就可以通过分析对手的行动采取相应的策略。l1摆脱囚徒的困境的条件摆脱囚徒的困境的条件l以以寡寡头头之之间间的的价价格格竞竞争争为为例例,在在下下图图的的价价格格博博弈弈中中,如如果果是是静静态态博博弈弈,厂厂商商很很容容易易陷陷入入囚囚徒徒的的困困境境(低低价价,低低价价)。但但如如果果博博弈弈可可以以无无限限重重复复下下去去,则则厂厂商商的的最最佳佳策
46、策略略是是“以以牙牙还还牙牙”。这这样样,考考虑虑到到对对手手会会以以牙牙还还牙牙,从从长长远远和和整整体体来来看看,降降低低价价格格不不会会有有什什么么好处,好处,博弈可能达到合作的结果博弈可能达到合作的结果(高价,高价高价,高价)。)。厂商厂商1低价低价高价高价 厂商厂商2 低价低价 高价高价 10,10 100,-50-50,100 50,502合作的条件和困难合作的条件和困难l在在现现实实经经济济运运行行中中,寡寡头头之之间间的的价价格格默默契契并并不不容容易易,主要原因有:主要原因有:(1)如如果果博博弈弈重重复复是是有有限限的的,则则最最后后一一次次博博弈弈会会采采取取低低价价策策
47、略略,理理性性的的结结果果是是抢抢先先低低价价,一一直直到到第第一一次次博博弈弈;但但是是,只只要要以以牙牙还还牙牙的的理理性性行行为为有有一一定定的的可能实现可能实现,合作以避免价格战的结果仍然会出现。,合作以避免价格战的结果仍然会出现。(2)厂厂商商较较多多,使使以以牙牙还还牙牙(对对欺欺骗骗者者进进行行报报复复和和惩惩罚罚)难难以以实实现现,合合作作就就十十分分困困难难。如如航航空空运运输输市市场场。(3)厂厂商商之之间间的的成成本本差差别别较较大大,需需求求和和成成本本变变化化很很快,难以达成默契。快,难以达成默契。二序列博弈二序列博弈 Sequential gamel在在现现实实中中
48、,较较常常见见的的是是序序列列博博弈弈,即即一一方方先先行行动动,另另一方后行动。一方后行动。l1先行者优势先行者优势l在在序序列列博博弈弈中中,先先行行者者处处于于有有利利地地位位,可可得得到到竞竞争争优优势势。在在下下图图中,两家厂商进行产品开发的博弈,中,两家厂商进行产品开发的博弈,如果是静态博弈,两家如果是静态博弈,两家l厂厂商商必必须须同同时时宣宣布布决决策策(一一家家有有,另另一一家家无无)。根根据据最最大大最最小小原原则则,可可能能大大家家都都无无新新产产品品。但但如如果果其其中中某某一一厂厂商商具具有有研研发发优优势势,可可以以率率先先推推出出新新产产品品,则则另另一一厂厂商商
49、只只好好放放弃弃进进入入该该市市场场的的打算打算。厂商厂商1无新产品无新产品有新产品有新产品 厂商厂商2无新产品无新产品 有新产品有新产品 2 2,2 2 0,10 10,0 -5,-52空头威胁、承诺和策略性行动空头威胁、承诺和策略性行动l在在序序列列博博弈弈中中,先先行行者者可可以以用用既既成成事事实实获获得得竞竞争争优优势势。在在这这种种情情况况下下,怎怎样样才才能能获获得得先先行行优优势势呢呢?理理性性的的厂厂商商都都知知道道先先行行者者优优势势,并并希希望望让让竞竞争争者者确确信信自自己己一一定定会会推推出新产品,从而放弃新产品。怎样才能做到这一点呢?出新产品,从而放弃新产品。怎样才
50、能做到这一点呢?l(1)空空头头威威胁胁 如如果果厂厂商商的的努努力力不不足足以以使使对对手手相相信信自自己己肯肯定定会会推推出出新新产产品品,如如制制造造舆舆论论、研研究究与与开开发发投投入入、广广告告宣宣传传等等,这这种种努努力力称称为为空空头头威威胁胁。它它可可能能不不足足以以吓吓退退竞争者竞争者。l(2)承承诺诺和和策策略略性性行行动动 如如果果厂厂商商想想要要吓吓退退竞竞争争者者,必必须须作作出出一一定定推推出出新新产产品品的的承承诺诺commitment,它它是是一一种种无法反悔的行动。无法反悔的行动。承诺与空头威胁的界限在哪里呢?承诺与空头威胁的界限在哪里呢?l要要使使对对手手确