中级微观经济学 博弈论.ppt

上传人:hyn****60 文档编号:71386649 上传时间:2023-02-03 格式:PPT 页数:23 大小:164KB
返回 下载 相关 举报
中级微观经济学 博弈论.ppt_第1页
第1页 / 共23页
中级微观经济学 博弈论.ppt_第2页
第2页 / 共23页
点击查看更多>>
资源描述

《中级微观经济学 博弈论.ppt》由会员分享,可在线阅读,更多相关《中级微观经济学 博弈论.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第九讲第九讲 博弈论博弈论1博弈论博弈论n n完全信息静态博弈:纳什均衡n n完全信息动态博弈:子博弈精炼纳什均衡n n不完全信息静态博弈:贝叶斯纳什均衡n n不完全信息动态博弈:精炼贝叶斯均衡2博弈的分类及对应的均衡概念博弈的分类及对应的均衡概念静态静态动态动态完全信息完全信息完全信息静态博弈;完全信息静态博弈;纳什均衡;纳什均衡;纳什(纳什(19501950,19511951)完全信息动态博弈;完全信息动态博弈;子博弈精炼纳什均衡;子博弈精炼纳什均衡;泽尔腾(泽尔腾(19651965)不完全信息不完全信息不完全信息静态博弈;不完全信息静态博弈;贝叶斯纳什均衡;贝叶斯纳什均衡;海萨尼(海萨尼

2、(1967-19681967-1968)不完全信息动态博弈;不完全信息动态博弈;精炼贝叶斯纳什均衡;精炼贝叶斯纳什均衡;泽尔腾(泽尔腾(19751975),),KrepsKreps和和WilsonWilson(19821982),),FudenbergFudenberg和和TiroleTirole(19911991)行动顺序信息3博弈论与策略行为(博弈论与策略行为(1 1):学科概念):学科概念n n博弈论(博弈论(Game TheoryGame Theory)又名对策论,游戏论。顾名又名对策论,游戏论。顾名思义,是一门研究互动关系的游戏中参与者各自选择思义,是一门研究互动关系的游戏中参与者各

3、自选择策略的科学,换言之,是研究机智而理性的决策者之策略的科学,换言之,是研究机智而理性的决策者之间冲突及合作的学科。博弈论把这些复杂关系理论化,间冲突及合作的学科。博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导以便分析其中的逻辑和规律,并对实际决策提供指导或借鉴。或借鉴。n n一个所谓游戏至少需要三个要素:(一个所谓游戏至少需要三个要素:(1 1)博弈或游戏)博弈或游戏参加者。博弈论分析假定参与者都是机智而理性的。参加者。博弈论分析假定参与者都是机智而理性的。(2 2)行动或策略空间。博弈参与者必须知道他自己)行动或策略空间。博弈参与者必须知道他自己及其对手伙伴的

4、策略选择范围,并了解各种策略之间及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。(的因果关系。(3 3)有可评价优劣高下的决策行为结)有可评价优劣高下的决策行为结果。博弈论用数字表示这类结果,并称之为支付果。博弈论用数字表示这类结果,并称之为支付(Payoff).Payoff).上述上述3 3部分描述了一个博弈的规则或结构。部分描述了一个博弈的规则或结构。4博弈论与策略行为(博弈论与策略行为(2 2):支付矩阵):支付矩阵n n可以用支付矩阵(可以用支付矩阵(Payoff MatrixPayoff Matrix,又称得益矩阵,收益矩阵,赢又称得益矩阵,收益矩阵,赢得矩阵等)来描述一个

5、博弈结构。下面这个简单的支付矩阵中,得矩阵等)来描述一个博弈结构。下面这个简单的支付矩阵中,有两个参与者厂商有两个参与者厂商A A和厂商和厂商B B;它们各自可以选择两种策略,分它们各自可以选择两种策略,分别用别用“左右左右”和和“上下上下”来标识(它们可以表示生产或不生产来标识(它们可以表示生产或不生产某种商品,提高或不提高价格,做不做广告的选择等);数字某种商品,提高或不提高价格,做不做广告的选择等);数字表示双方在不同策略选择组合下各自得到的支付,较大数字代表示双方在不同策略选择组合下各自得到的支付,较大数字代表较大利益或效用。例如,在厂商表较大利益或效用。例如,在厂商A A和和B B分

6、别选择上和左代表的分别选择上和左代表的策略时,左上角方框的数字策略时,左上角方框的数字“1“1,2”2”表示表示A A和和B B分别得到的支付。分别得到的支付。同理,同理,A A和和B B分别选择策略下和右时,它们分别得到右下角方框分别选择策略下和右时,它们分别得到右下角方框数字数字“1“1,0”0”代表的支付。代表的支付。1,21,02,10,1左上右下厂商B厂商A5博弈论与策略行为(博弈论与策略行为(3 3):支配策略):支配策略n n由于游戏参与者试图实现自身利益最大化并具有机智而理性的决由于游戏参与者试图实现自身利益最大化并具有机智而理性的决策能力,加上信息方面的假定,所以上述支付矩阵

7、表示的博弈具策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。从厂商有一个简单而确定的结果。从厂商A A角度来说,它采取策略角度来说,它采取策略“下下”而得到的支付总是好于而得到的支付总是好于“上上”(2 2,1 1分别对分别对1 1,0 0)。同样,对)。同样,对于于B B来说,选择策略来说,选择策略“左左”得到的利益总是优于得到的利益总是优于“右右”(1 1,2 2分分别对别对0 0,1 1)。因此,我们可以确定预期均衡选择策略是)。因此,我们可以确定预期均衡选择策略是A A选择选择“下下”而而B B选择选择“左左”的策略。的策略。n n这一博弈中每个参与者都

8、存在一个支配策略(这一博弈中每个参与者都存在一个支配策略(Dominant StrategyDominant Strategy,又称占优或超优策略又称占优或超优策略)。不管其它参与者如何选择,每个局中不管其它参与者如何选择,每个局中人自有的那个最优选择称作支配策略,由此实现的均衡是支配均人自有的那个最优选择称作支配策略,由此实现的均衡是支配均衡(又称衡(又称占优或超优均衡)占优或超优均衡)。1,21,02,10,1左上右下厂商B厂商A6博弈论与策略行为(博弈论与策略行为(4 4):囚徒困境):囚徒困境n n下面支付矩阵表示著名的下面支付矩阵表示著名的“囚徒困境(囚徒困境(Prisoners D

9、ilemma)”Prisoners Dilemma)”游戏。游戏。从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯A A,B B来说,无论对方如何选择来说,无论对方如何选择“坦白坦白”都是各自的最优选择。都是各自的最优选择。n n虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(持沉默,然而,由于猜忌,试图获得更大好处(3 3个月刑期)等个月刑期)等竞争性动机阻碍了它们达到更好的互利选择,它们面临竞争性动机阻碍了它们达到更好的互利选

10、择,它们面临“囚徒困囚徒困境境”。我们将看到,寡头垄断厂商经常面临类似的困境。我们将看到,寡头垄断厂商经常面临类似的困境。n n囚徒困境告诉我们,不满足纳什均衡的协议是无效的。囚徒困境告诉我们,不满足纳什均衡的协议是无效的。A坐3年牢B坐3年牢A坐1年牢B坐1年牢A坐10年牢B坐3个月牢A坐3个月牢B坐10年牢坦白坦白保持沉默保持沉默囚犯B囚犯A7完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡n n支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵表示的博弈中,厂商表示的博弈中,厂商A A,B B在选择做广

11、告问题上存在的策略关系。其中厂商在选择做广告问题上存在的策略关系。其中厂商A A没有支配策略。因为没有支配策略。因为A A的最佳决策取决于的最佳决策取决于B B的选择。例如,当的选择。例如,当B B选择做广告时,选择做广告时,A A应当选择做广告,由此得到应当选择做广告,由此得到1010而不是而不是6 6的支付得益;然而,当的支付得益;然而,当B B选择不做广告选择不做广告时,时,A A应当选择不做广告,从而得到应当选择不做广告,从而得到2020而不是而不是1515的支付得益。假定两个厂商需的支付得益。假定两个厂商需要同时决策,要同时决策,A A应当如何决策?应当如何决策?n n解答这一问题,

12、解答这一问题,A A需要把自己放在需要把自己放在B B的位置,从的位置,从B B的角度看什么是最好的选择,的角度看什么是最好的选择,并在此基础上考虑自己的选择。支付矩阵表明并在此基础上考虑自己的选择。支付矩阵表明B B有一个支配策略:不论有一个支配策略:不论A A选择选择如何,如何,B B选择做广告时利益较大(选择做广告时利益较大(5 5,8 8对对0 0,2 2),因而),因而A A可以判断可以判断B B会选择做会选择做广告。而在广告。而在B B做广告时,做广告时,A A应当选择做广告。因而,均衡结局是双方都做广告。应当选择做广告。因而,均衡结局是双方都做广告。10,520,26,815,0

13、做广告不做广告厂商B厂商A做广告不做广告8完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡n n上述均衡结果被称作纳什均衡上述均衡结果被称作纳什均衡(The Nash Equilibrium)(The Nash Equilibrium)。纳什均衡纳什均衡指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不变换策略选择,任何单个参与什均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高他的所获支付。美国数学家者不可能单方面通过变换策略来提高他的所获支付。美国数学家和统计

14、学家纳什(和统计学家纳什(Nash)50Nash)50年代年代提出这一概念,所以称作纳什均提出这一概念,所以称作纳什均衡。衡。n n在上面广告策略关系事例中,给定厂商在上面广告策略关系事例中,给定厂商B B做广告的策略,做广告的策略,A A所能所能做的一个最好选择是做广告;而当做的一个最好选择是做广告;而当A A做广告时,做广告时,B B的选择仍是它的选择仍是它能做的最好的。因而,纳什均衡条件得到满足。能做的最好的。因而,纳什均衡条件得到满足。n n它与支配策略均衡的区别在于:在纳什均衡下,它与支配策略均衡的区别在于:在纳什均衡下,“我(你)所做我(你)所做的是的是给定给定给定给定你(我)的选

15、择我(你)所能做的最好的你(我)的选择我(你)所能做的最好的”,而支配均,而支配均衡下,衡下,“我(你)所做的是我(你)所做的是不论不论不论不论你(我)的选择我(你)所能做你(我)的选择我(你)所能做的更好的的更好的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配。支配均衡必然是纳什均衡,但纳什均衡未必是支配均衡。均衡。9完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡n n一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略),有时又可能不存在纳什均衡。下面左表存在两个纳什均衡:略),有时又可能不存在纳什均衡。下面左表存在两个

16、纳什均衡:其中其中“上,左上,左”是纳什均衡(是纳什均衡(A A选上,则选上,则B B选左;且选左;且B B选左时选左时A A仍仍应选上);应选上);“下,右下,右”也是纳什均衡(也是纳什均衡(A A选下,则选下,则B B选右;且选右;且B B选选右时右时A A仍应选下)。如没有更多信息,则无法判断均衡在什么位仍应选下)。如没有更多信息,则无法判断均衡在什么位置。右表没有纳什均衡。如置。右表没有纳什均衡。如A A选选“上上”,B B则选则选“左左”;然而当;然而当B B选选“左左”时,时,A A却应当选却应当选“下下”。反之,。反之,A A选选“下下”时,时,B B应选应选“右右”;然而当;然

17、而当B B选右时,选右时,A A又应选又应选“上上”。没有均衡点。没有均衡点。2,11,20,00,0左上右下局中人B局中人A(左)0,0-1,31,00,-1左上右下局中人B局中人A(右)10纳什均衡举例:智猪博弈纳什均衡举例:智猪博弈n n在这一例子中,无论大猪选择在这一例子中,无论大猪选择“按按”还是还是“等待等待”,小猪都有一个占优策略,小猪都有一个占优策略“等待等待”。在给定小。在给定小猪选择猪选择“等待等待”的条件下,打住的最优选择只能的条件下,打住的最优选择只能是是“按按”。所以,纳什均衡就是:大猪按,小猪。所以,纳什均衡就是:大猪按,小猪等待,各得等待,各得4 4个单位。多劳者

18、不多得。个单位。多劳者不多得。n n想一想,在经济现实中智猪博弈的例子。想一想,在经济现实中智猪博弈的例子。5 5,1 14 4,4 49 9,-1-10 0,0 0小猪按等待大猪按等待11纳什均衡举例:性别战纳什均衡举例:性别战n n这个博弈中有两个纳什均衡:这个博弈中有两个纳什均衡:(足球,足球),(足球,足球),(芭蕾,芭蕾)。究竟哪一种纳什均衡会实际发(芭蕾,芭蕾)。究竟哪一种纳什均衡会实际发生?也许一次一次,形成默契;也许由先动优势生?也许一次一次,形成默契;也许由先动优势形成惯例。形成惯例。2 2,1 10 0,0 00 0,0 01 1,2 2女足球芭蕾男足球芭蕾12纳什均衡举例

19、:斗鸡博弈纳什均衡举例:斗鸡博弈n n在这个博弈中,有两个纳什均衡:如果一方进,在这个博弈中,有两个纳什均衡:如果一方进,另一方的最优战略就是退。两人都进或都退都不另一方的最优战略就是退。两人都进或都退都不是纳什均衡。但是,就是谁会退下来呢?是纳什均衡。但是,就是谁会退下来呢?-3-3,-3-32 2,0 00 0,2 20 0,0 0B进退A进退13博弈论与策略行为:重复博弈博弈论与策略行为:重复博弈n n上面讨论的上面讨论的“囚徒的困境囚徒的困境”暗含的几个假定是静态的一次性博弈,暗含的几个假定是静态的一次性博弈,结果陷入了个体理性决策导致集体非理性结果的困境。现在我们结果陷入了个体理性决

20、策导致集体非理性结果的困境。现在我们改变假定条件,讨论博弈可以多次进行的重复博弈(改变假定条件,讨论博弈可以多次进行的重复博弈(Repeated Repeated Game)Game)。这时囚犯同时选择不交代有可能成为纳什均衡点。这时囚犯同时选择不交代有可能成为纳什均衡点。n n因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选择。例如,择。例如,A A有机会与有机会与B B组成策略联盟,并对组成策略联盟,并对B B宣布如下方针:我宣布如下方针:我将选择沉默,并要求你也如此来增进各自利益;然而,如果你半将选择沉默,并要求你也如此来增

21、进各自利益;然而,如果你半途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一方针与方针与A A利益一致,因而是可信的。从利益一致,因而是可信的。从B B角度来看,如和角度来看,如和A A合作,合作,可在每阶段得到可在每阶段得到1 1年监禁的较好结果;如中途变卦,固然当期可年监禁的较好结果;如中途变卦,固然当期可得一次得一次3 3个月的更好结果,但此后便每次面临个月的更好结果,但此后便每次面临3 3年监禁后果,显然年监禁后果,显然是不利的。因而,重复性博弈中,是不利的。因而,重复性博弈中,”沉默沉默+沉默沉默“点可能成为对点可能成为对

22、双方最佳选择,因而成为纳什均衡点。双方最佳选择,因而成为纳什均衡点。由于博弈条件由一次由于博弈条件由一次性变为重复性,均衡状态随之发生变化。性变为重复性,均衡状态随之发生变化。14博弈论与策略行为:序列博弈博弈论与策略行为:序列博弈n n至此讨论的博弈是参与者同时选择。在序列博弈(至此讨论的博弈是参与者同时选择。在序列博弈(Sequential Sequential Game)Game)中,各博弈方先后依次行动。下面支付矩阵描述了一个博中,各博弈方先后依次行动。下面支付矩阵描述了一个博弈,如果同时行动,它有两个纳什均衡点(弈,如果同时行动,它有两个纳什均衡点(“甜,咸甜,咸”与与“咸,咸,甜甜

23、”)。假定厂商)。假定厂商A A可以先推出甜饼干(如较快投入生产),我可以先推出甜饼干(如较快投入生产),我们就有了序列博弈:们就有了序列博弈:A A先作决策,先作决策,B B随后选择。随后选择。A A决策时必须考虑决策时必须考虑竞争者的理性反应:它知道不论自己推出那种饼干,竞争者的理性反应:它知道不论自己推出那种饼干,B B出于自身出于自身利益会推出另一种。因而利益会推出另一种。因而A A推出甜饼干,推出甜饼干,B B在给定在给定A A决策时选择咸决策时选择咸饼干;给定饼干;给定B B的选择的选择A A的选择仍然最佳。结果两个纳什均衡点收的选择仍然最佳。结果两个纳什均衡点收敛为一个(下,左)

24、。其中敛为一个(下,左)。其中A A由于具有先行者优势(由于具有先行者优势(First Movers First Movers AdvantageAdvantage)而得到较大利益,而得到较大利益,-5,-5-5,-520,1010,20咸饼干咸饼干甜饼干甜饼干厂商B厂商A15完全信息动态博弈:子博弈精炼纳完全信息动态博弈:子博弈精炼纳什均衡什均衡n n市场进入阻挠:这个博弈中有两个纳什均衡,即(进入,市场进入阻挠:这个博弈中有两个纳什均衡,即(进入,默许)和(不进入,斗争)。但是显然,斗争在这里是一默许)和(不进入,斗争)。但是显然,斗争在这里是一个不可置信的威胁。因为一旦进入者选择进入,在

25、位者并个不可置信的威胁。因为一旦进入者选择进入,在位者并不会真的选择斗争,而会默许。不会真的选择斗争,而会默许。4040,5050-10-10,0 00 0,300300 0 0,300300在位者默许斗争进入者进入不进入16完全信息动态博弈:子博弈精炼纳什均衡完全信息动态博弈:子博弈精炼纳什均衡n n完全信息下动态博弈的均衡,子博弈精炼纳什均衡就是将完全信息下动态博弈的均衡,子博弈精炼纳什均衡就是将纳什均衡中包含的不可置信的威胁战略剔除出去。纳什均衡中包含的不可置信的威胁战略剔除出去。n n我们用扩展型来表述这种博弈形式。扩展型的表述有五个我们用扩展型来表述这种博弈形式。扩展型的表述有五个因

26、素组成因素组成(1 1)参与人,()参与人,(2 2)每个参与人选择行动的时点,)每个参与人选择行动的时点,(3 3)每个参与人在每次行动时可供选择的行动集合,)每个参与人在每次行动时可供选择的行动集合,(4 4)每个参与人在每次行动时有关对手过去行动选择的)每个参与人在每次行动时有关对手过去行动选择的信息,(信息,(5 5)支付函数。)支付函数。n n下面是扩展型的形象化表述博弈树。下面是扩展型的形象化表述博弈树。进入者进入不进入在位者合作斗争40,50-10,00,30017完全信息动态博弈:子博弈精炼纳什均衡完全信息动态博弈:子博弈精炼纳什均衡n n在动态博弈中,如果所有以前的行动是在动

27、态博弈中,如果所有以前的行动是“共同知识共同知识”,那,那么给定历史,从每一个行动选择开始至博弈结束又构成一么给定历史,从每一个行动选择开始至博弈结束又构成一个博弈,称为个博弈,称为“子博弈子博弈”。n n一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在每一个子博弈中都构成纳什均衡。即组成精炼纳什均衡的每一个子博弈中都构成纳什均衡。即组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。战略必须在每一个子博弈中都是最优的。n n不可置信的威胁又引出信息经济学中一个很重要的概念,不可置信的威胁又引出信息经济学中一个很重要的概念,即即“承诺行动承

28、诺行动”。它是当事人使自己的威胁战略变得可置。它是当事人使自己的威胁战略变得可置信的行动。信的行动。18不完全信息静态博弈:贝叶斯纳什均衡不完全信息静态博弈:贝叶斯纳什均衡n n在上例中,如果进入者实际上并不完全了解在位者的生产在上例中,如果进入者实际上并不完全了解在位者的生产函数,成本函数及偏好,这就是不完全信息博弈。如果在函数,成本函数及偏好,这就是不完全信息博弈。如果在位者的成本函数有两种可能,对应于这两种情况的支付矩位者的成本函数有两种可能,对应于这两种情况的支付矩阵分别如下面两表所示。阵分别如下面两表所示。4040,5050-10-10,0 00 0,3003000 0,300300

29、3030,100100-10-10,1401400 0,4004000 0,400400在位者默许斗争进入不进入进入者在位者默许斗争进入不进入进入者市场进入:高成本情况市场进入:低成本情况19不完全信息静态博弈:贝叶斯纳什均衡不完全信息静态博弈:贝叶斯纳什均衡n n海萨尼转换:引入一个虚拟的参与人海萨尼转换:引入一个虚拟的参与人-“-“自然自然”,由它选,由它选择参与人的择参与人的“类型类型”。被选择的参与人只清楚自己的真实。被选择的参与人只清楚自己的真实类型,却不清楚其他参与人的真实类型。但是,各种可能类型,却不清楚其他参与人的真实类型。但是,各种可能性的概率分布是一种性的概率分布是一种“共

30、同知识共同知识”。在上例中,自然首先。在上例中,自然首先选择了在位者的类型,进入者仅知道在位者是高成本和低选择了在位者的类型,进入者仅知道在位者是高成本和低成本的可能性是多少。成本的可能性是多少。n n贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说,没有人有积极性选择其望效用达到了最大化,也就是说,没有人有积极性选择其他战略。他战略。n n在上例中,高成本可能性为在上例中,高成本可能性为x x,低成本为,低成本为1

31、-x1-x。选择不进入。选择不进入的期望利润为零。则进入者选择进入的期望利润为的期望利润为零。则进入者选择进入的期望利润为40 x+(-40 x+(-10)(1-x)10)(1-x),选择不进入的期望利润为零。则只有在,选择不进入的期望利润为零。则只有在x0.2x0.2时,时,进入者会选择进入。进入者会选择进入。20不完全信息静态博弈举例:求爱博弈不完全信息静态博弈举例:求爱博弈n n如果求爱者品德优良的概率为如果求爱者品德优良的概率为x x。求爱者知道这个。求爱者知道这个x x为多少,为多少,那么他求爱你接受时你的期望效用为那么他求爱你接受时你的期望效用为100 x+(-100)(1-x)1

32、00 x+(-100)(1-x),你,你不接受时你的期望效用为零。当不接受时你的期望效用为零。当x0.5x0.5时,你接受才是最优时,你接受才是最优选择。所以,如果选择。所以,如果x0.5x0.5,贝叶斯均衡是:求爱者求爱,你,贝叶斯均衡是:求爱者求爱,你接受;当接受;当x0.5x0.5时,贝叶斯均衡是求爱者不求爱,你不接受时,贝叶斯均衡是求爱者不求爱,你不接受。因为此时他知道他求爱会被你拒绝,这种。因为此时他知道他求爱会被你拒绝,这种lose facelose face的事的事情是不会干的情是不会干的100100,-100-100-50-50,0 00 0,0 00 0,0 0100100,

33、100100-50-50,0 00 0,0 00 0,0 0你接受不接受求爱不求爱求爱者你接受不接受求爱不求爱求爱者品德优良者求爱品德恶劣者求爱21不完全信息动态博弈:精炼贝叶斯均衡不完全信息动态博弈:精炼贝叶斯均衡n n精炼贝叶斯均衡的要点在于当事人要根据所观察精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的到的他人的行为来修正自己有关后者类型的“信信念念”,也就是主观概率,并由此选择自己的行动。,也就是主观概率,并由此选择自己的行动。n n精炼贝叶斯均衡是所有参与人战略和信念的一种精炼贝叶斯均衡是所有参与人战略和信念的一种结合:它满足如下条件结合:它满足如下

34、条件(1 1)给定每个人有关其他)给定每个人有关其他人类型的信念的情况下,它的战略都是最优的;人类型的信念的情况下,它的战略都是最优的;(2 2)每个人有关他人类型的信念都是使用贝叶斯)每个人有关他人类型的信念都是使用贝叶斯法则所观察到的行为中获得的。法则所观察到的行为中获得的。n n举例:黔之驴,古代社会的科举制度,我们当代举例:黔之驴,古代社会的科举制度,我们当代的教育体制。的教育体制。22约翰约翰纳什纳什n n19281928n n19501950,19511951:非合作博:非合作博弈弈n n19941994:诺贝尔经济学奖:诺贝尔经济学奖n n普林斯顿的幽灵普林斯顿的幽灵n n大学老师的评价:他大学老师的评价:他是个天才是个天才23

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁