《中级微观经济学博弈论.ppt》由会员分享,可在线阅读,更多相关《中级微观经济学博弈论.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九讲 博弈论1博弈论n n 完全信息静态博弈:纳什均衡n n 完全信息动态博弈:子博弈精炼纳什均衡n n 不完全信息静态博弈:贝叶斯纳什均衡n n 不完全信息动态博弈:精炼贝叶斯均衡2博弈的分类及对应的均衡概念静态静态动态动态完全信息完全信息完全信息静态博弈;完全信息静态博弈;纳什均衡;纳什均衡;纳什(纳什(1950 1950,1951 1951)完全信息动态博弈;完全信息动态博弈;子博弈精炼纳什均衡;子博弈精炼纳什均衡;泽尔腾(泽尔腾(1965 1965)不完全信息不完全信息不完全信息静态博弈;不完全信息静态博弈;贝叶斯纳什均衡;贝叶斯纳什均衡;海萨尼(海萨尼(1967-1968 1967
2、-1968)不完全信息动态博弈;不完全信息动态博弈;精炼贝叶斯纳什均衡;精炼贝叶斯纳什均衡;泽尔腾(泽尔腾(1975 1975),),Kreps Kreps 和 和Wilson Wilson(1982 1982),),Fudenberg Fudenberg 和 和Tirole Tirole(1991 1991)行动顺序信息3博弈论与策略行为(1):学科概念n n博弈论(博弈论(Game TheoryGame Theory)又名对策论,游戏论。顾名)又名对策论,游戏论。顾名思义,是一门研究互动关系的游戏中参与者各自选择思义,是一门研究互动关系的游戏中参与者各自选择策略的科学,换言之,是研究机智而
3、理性的决策者之策略的科学,换言之,是研究机智而理性的决策者之间冲突及合作的学科。博弈论把这些复杂关系理论化,间冲突及合作的学科。博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导以便分析其中的逻辑和规律,并对实际决策提供指导或借鉴。或借鉴。n n一个所谓游戏至少需要三个要素:(一个所谓游戏至少需要三个要素:(11)博弈或游戏)博弈或游戏参加者。博弈论分析假定参与者都是机智而理性的。参加者。博弈论分析假定参与者都是机智而理性的。(22)行动或策略空间。博弈参与者必须知道他自己)行动或策略空间。博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间及其对手伙
4、伴的策略选择范围,并了解各种策略之间的因果关系。(的因果关系。(33)有可评价优劣高下的决策行为结)有可评价优劣高下的决策行为结果。博弈论用数字表示这类结果,并称之为支付果。博弈论用数字表示这类结果,并称之为支付(Payoff).Payoff).上述上述33部分描述了一个博弈的规则或结构。部分描述了一个博弈的规则或结构。4博弈论与策略行为(2):支付矩阵n n 可以用支付矩阵(可以用支付矩阵(Payoff Matrix Payoff Matrix,又称得益矩阵,收益矩阵,赢,又称得益矩阵,收益矩阵,赢得矩阵等)来描述一个博弈结构。下面这个简单的支付矩阵中,得矩阵等)来描述一个博弈结构。下面这个
5、简单的支付矩阵中,有两个参与者厂商 有两个参与者厂商A A 和厂商 和厂商B B;它们各自可以选择两种策略,分 它们各自可以选择两种策略,分别用 别用“左右 左右”和 和“上下 上下”来标识(它们可以表示生产或不生产 来标识(它们可以表示生产或不生产某种商品,提高或不提高价格,做不做广告的选择等);数字 某种商品,提高或不提高价格,做不做广告的选择等);数字表示双方在不同策略选择组合下各自得到的支付,较大数字代 表示双方在不同策略选择组合下各自得到的支付,较大数字代表较大利益或效用。例如,在厂商 表较大利益或效用。例如,在厂商A A 和 和B B 分别选择上和左代表的 分别选择上和左代表的策略
6、时,左上角方框的数字 策略时,左上角方框的数字“1“1,2”2”表示 表示A A 和 和B B 分别得到的支付。分别得到的支付。同理,同理,A A 和 和B B 分别选择策略下和右时,它们分别得到右下角方框 分别选择策略下和右时,它们分别得到右下角方框数字 数字“1“1,0”0”代表的支付。代表的支付。1,21,02,10,1左上右下厂商B厂商A5博弈论与策略行为(3):支配策略n n 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具 策能力,加上信息方面的假定,所以上述支
7、付矩阵表示的博弈具有一个简单而确定的结果。从厂商 有一个简单而确定的结果。从厂商A A 角度来说,它采取策略 角度来说,它采取策略“下 下”而得到的支付总是好于 而得到的支付总是好于“上 上”(2 2,1 1 分别对 分别对1 1,0 0)。同样,对)。同样,对于 于B B 来说,选择策略 来说,选择策略“左 左”得到的利益总是优于 得到的利益总是优于“右 右”(1 1,2 2 分 分别对 别对0 0,1 1)。因此,我们可以确定预期均衡选择策略是)。因此,我们可以确定预期均衡选择策略是A A 选择 选择“下 下”而 而B B 选择 选择“左 左”的策略。的策略。n n 这一博弈中每个参与者都
8、存在一个支配策略(这一博弈中每个参与者都存在一个支配策略(Dominant Strategy Dominant Strategy,又称占优或超优策略,又称占优或超优策略)。不管其它参与者如何选择,每个局中 不管其它参与者如何选择,每个局中人自有的那个最优选择称作支配策略,由此实现的均衡是支配均 人自有的那个最优选择称作支配策略,由此实现的均衡是支配均衡(又称 衡(又称 占优或超优均衡)占优或超优均衡)。1,21,02,10,1左上右下厂商B厂商A6博弈论与策略行为(4):囚徒困境n n 下面支付矩阵表示著名的 下面支付矩阵表示著名的“囚徒困境(囚徒困境(Prisoners Dilemma)”P
9、risoners Dilemma)”游戏。游戏。从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯 从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯A A,B B 来说,无论对方如何选择 来说,无论对方如何选择“坦白 坦白”都是各自的最优选择。都是各自的最优选择。n n 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(持沉默,然而,由于猜忌,试图获得更大好处(3 3 个月刑期)等 个月刑期)等竞争性动机阻碍了它们达到更好的互利选择,它们面临 竞争性动机阻碍了它们达到更好的互利选
10、择,它们面临“囚徒困 囚徒困境 境”。我们将看到,寡头垄断厂商经常面临类似的困境。我们将看到,寡头垄断厂商经常面临类似的困境。n n 囚徒困境告诉我们,不满足纳什均衡的协议是无效的。囚徒困境告诉我们,不满足纳什均衡的协议是无效的。A坐3年牢B坐3年牢A坐1年牢B坐1年牢A坐10年牢B坐3个月牢A坐3个月牢B坐10年牢坦白坦白保持沉默保持沉默囚犯B囚犯A7完全信息静态博弈:纳什均衡n n 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵表示的博弈中,厂商 表示的博弈中,厂商A A,B B 在选择做广告问题上存在
11、的策略关系。其中厂商 在选择做广告问题上存在的策略关系。其中厂商A A没有支配策略。因为 没有支配策略。因为A A 的最佳决策取决于 的最佳决策取决于B B 的选择。例如,当 的选择。例如,当B B 选择做广告时,选择做广告时,A A 应当选择做广告,由此得到 应当选择做广告,由此得到10 10 而不是 而不是6 6 的支付得益;然而,当 的支付得益;然而,当B B 选择不做广告 选择不做广告时,时,A A 应当选择不做广告,从而得到 应当选择不做广告,从而得到20 20 而不是 而不是15 15 的支付得益。假定两个厂商需 的支付得益。假定两个厂商需要同时决策,要同时决策,A A 应当如何决
12、策?应当如何决策?n n 解答这一问题,解答这一问题,A A 需要把自己放在 需要把自己放在B B 的位置,从 的位置,从B B 的角度看什么是最好的选择,的角度看什么是最好的选择,并在此基础上考虑自己的选择。支付矩阵表明 并在此基础上考虑自己的选择。支付矩阵表明B B 有一个支配策略:不论 有一个支配策略:不论A A 选择 选择如何,如何,B B 选择做广告时利益较大(选择做广告时利益较大(5 5,8 8 对 对0 0,2 2),因而),因而A A 可以判断 可以判断B B 会选择做 会选择做广告。而在 广告。而在B B 做广告时,做广告时,A A 应当选择做广告。因而,均衡结局是双方都做广
13、告。应当选择做广告。因而,均衡结局是双方都做广告。10,520,26,815,0做广告不做广告厂商B厂商A做广告不做广告8完全信息静态博弈:纳什均衡n n 上述均衡结果被称作纳什均衡 上述均衡结果被称作纳什均衡(The Nash Equilibrium)(The Nash Equilibrium)。纳什均衡。纳什均衡指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳 指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不变换策略选择,任何单个参与 什均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高他的所获支付。美国数学
14、家 者不可能单方面通过变换策略来提高他的所获支付。美国数学家和统计学家纳什(和统计学家纳什(Nash)50 Nash)50 年代提出这一概念,所以称作纳什均 年代提出这一概念,所以称作纳什均衡。衡。n n 在上面广告策略关系事例中,给定厂商 在上面广告策略关系事例中,给定厂商B B 做广告的策略,做广告的策略,A A 所能 所能做的一个最好选择是做广告;而当 做的一个最好选择是做广告;而当A A 做广告时,做广告时,B B 的选择仍是它 的选择仍是它能做的最好的。因而,纳什均衡条件得到满足。能做的最好的。因而,纳什均衡条件得到满足。n n 它与支配策略均衡的区别在于:在纳什均衡下,它与支配策略
15、均衡的区别在于:在纳什均衡下,“我(你)所做 我(你)所做的是 的是 给定 给定 你(我)的选择我(你)所能做的最好的 你(我)的选择我(你)所能做的最好的”,而支配均,而支配均衡下,衡下,“我(你)所做的是 我(你)所做的是 不论 不论 你(我)的选择我(你)所能做 你(我)的选择我(你)所能做的更好的 的更好的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配。支配均衡必然是纳什均衡,但纳什均衡未必是支配均衡。均衡。9完全信息静态博弈:纳什均衡n n 一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策 一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略),有时又可能不存在纳什均
16、衡。下面左表存在两个纳什均衡:略),有时又可能不存在纳什均衡。下面左表存在两个纳什均衡:其中 其中“上,左 上,左”是纳什均衡(是纳什均衡(A A 选上,则 选上,则B B 选左;且 选左;且B B 选左时 选左时A A 仍 仍应选上);应选上);“下,右 下,右”也是纳什均衡(也是纳什均衡(A A 选下,则 选下,则B B 选右;且 选右;且B B 选 选右时 右时A A 仍应选下)。如没有更多信息,则无法判断均衡在什么位 仍应选下)。如没有更多信息,则无法判断均衡在什么位置。右表没有纳什均衡。如 置。右表没有纳什均衡。如A A 选 选“上 上”,B B 则选 则选“左 左”;然而当;然而当
17、B B选 选“左 左”时,时,A A 却应当选 却应当选“下 下”。反之,。反之,A A 选 选“下 下”时,时,B B 应选 应选“右 右”;然而当;然而当B B 选右时,选右时,A A 又应选 又应选“上 上”。没有均衡点。没有均衡点。2,11,20,00,0左上右下局中人B局中人A(左)0,0-1,31,00,-1左上右下局中人B局中人A(右)10纳什均衡举例:智猪博弈n n在这一例子中,无论大猪选择在这一例子中,无论大猪选择“按按”还是还是“等待等待”,小猪都有一个占优策略,小猪都有一个占优策略“等待等待”。在给定小。在给定小猪选择猪选择“等待等待”的条件下,打住的最优选择只能的条件下
18、,打住的最优选择只能是是“按按”。所以,纳什均衡就是:大猪按,小猪。所以,纳什均衡就是:大猪按,小猪等待,各得等待,各得44个单位。多劳者不多得。个单位。多劳者不多得。n n想一想,在经济现实中智猪博弈的例子。想一想,在经济现实中智猪博弈的例子。55,1144,4499,-1-100,00小猪按 等待大猪按等待1 1纳什均衡举例:性别战n n这个博弈中有两个纳什均衡:这个博弈中有两个纳什均衡:(足球,足球),(足球,足球),(芭蕾,芭蕾)。究竟哪一种纳什均衡会实际发(芭蕾,芭蕾)。究竟哪一种纳什均衡会实际发生?也许一次一次,形成默契;也许由先动优势生?也许一次一次,形成默契;也许由先动优势形成
19、惯例。形成惯例。22,1100,0000,0011,22女足球 芭蕾男足球芭蕾12纳什均衡举例:斗鸡博弈n n在这个博弈中,有两个纳什均衡:如果一方进,在这个博弈中,有两个纳什均衡:如果一方进,另一方的最优战略就是退。两人都进或都退都不另一方的最优战略就是退。两人都进或都退都不是纳什均衡。但是,就是谁会退下来呢?是纳什均衡。但是,就是谁会退下来呢?-3-3,-3-322,0000,2200,00B进 退A进退13博弈论与策略行为:重复博弈n n 上面讨论的 上面讨论的“囚徒的困境 囚徒的困境”暗含的几个假定是静态的一次性博弈,暗含的几个假定是静态的一次性博弈,结果陷入了个体理性决策导致集体非理
20、性结果的困境。现在我们 结果陷入了个体理性决策导致集体非理性结果的困境。现在我们改变假定条件,讨论博弈可以多次进行的重复博弈(改变假定条件,讨论博弈可以多次进行的重复博弈(Repeated Repeated Game)Game)。这时囚犯同时选择不交代有可能成为纳什均衡点。这时囚犯同时选择不交代有可能成为纳什均衡点。n n 因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选 因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选择。例如,择。例如,A A 有机会与 有机会与B B 组成策略联盟,并对 组成策略联盟,并对B B 宣布如下方针:我 宣布如下方针:我将选择沉默,并要求你也如此
21、来增进各自利益;然而,如果你半 将选择沉默,并要求你也如此来增进各自利益;然而,如果你半途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一 途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一方针与 方针与A A 利益一致,因而是可信的。从 利益一致,因而是可信的。从B B 角度来看,如和 角度来看,如和A A 合作,合作,可在每阶段得到 可在每阶段得到1 1 年监禁的较好结果;如中途变卦,固然当期可 年监禁的较好结果;如中途变卦,固然当期可得一次 得一次3 3 个月的更好结果,但此后便每次面临 个月的更好结果,但此后便每次面临3 3 年监禁后果,显然 年监禁后果,显然是不利的。因而
22、,重复性博弈中,是不利的。因而,重复性博弈中,”沉默 沉默+沉默 沉默“点可能成为对 点可能成为对双方最佳选择,因而成为纳什均衡点。双方最佳选择,因而成为纳什均衡点。由于博弈条件由一次 由于博弈条件由一次性变为重复性,均衡状态随之发生变化。性变为重复性,均衡状态随之发生变化。14博弈论与策略行为:序列博弈n n 至此讨论的博弈是参与者同时选择。在序列博弈(至此讨论的博弈是参与者同时选择。在序列博弈(Sequential Sequential Game)Game)中,各博弈方先后依次行动。下面支付矩阵描述了一个博 中,各博弈方先后依次行动。下面支付矩阵描述了一个博弈,如果同时行动,它有两个纳什均
23、衡点(弈,如果同时行动,它有两个纳什均衡点(“甜,咸 甜,咸”与 与“咸,咸,甜 甜”)。假定厂商)。假定厂商A A 可以先推出甜饼干(如较快投入生产),我 可以先推出甜饼干(如较快投入生产),我们就有了序列博弈:们就有了序列博弈:A A 先作决策,先作决策,B B 随后选择。随后选择。A A 决策时必须考虑 决策时必须考虑竞争者的理性反应:它知道不论自己推出那种饼干,竞争者的理性反应:它知道不论自己推出那种饼干,B B 出于自身 出于自身利益会推出另一种。因而 利益会推出另一种。因而A A 推出甜饼干,推出甜饼干,B B 在给定 在给定A A 决策时选择咸 决策时选择咸饼干;给定 饼干;给定
24、B B 的选择 的选择A A 的选择仍然最佳。结果两个纳什均衡点收 的选择仍然最佳。结果两个纳什均衡点收敛为一个(下,左)。其中 敛为一个(下,左)。其中A A 由于具有先行者优势(由于具有先行者优势(First Movers First Movers Advantage Advantage)而得到较大利益,)而得到较大利益,-5,-5-5,-520,1010,20咸饼干咸饼干甜饼干甜饼干厂商B厂商A15完全信息动态博弈:子博弈精炼纳什均衡n n 市场进入阻挠:这个博弈中有两个纳什均衡,即(进入,市场进入阻挠:这个博弈中有两个纳什均衡,即(进入,默许)和(不进入,斗争)。但是显然,斗争在这里是
25、一 默许)和(不进入,斗争)。但是显然,斗争在这里是一个不可置信的威胁。因为一旦进入者选择进入,在位者并 个不可置信的威胁。因为一旦进入者选择进入,在位者并不会真的选择斗争,而会默许。不会真的选择斗争,而会默许。4040,5050-10-10,0000,30030000,300300在位者默许 斗争进入者进入不进入16完全信息动态博弈:子博弈精炼纳什均衡n n 完全信息下动态博弈的均衡,子博弈精炼纳什均衡就是将 完全信息下动态博弈的均衡,子博弈精炼纳什均衡就是将纳什均衡中包含的不可置信的威胁战略剔除出去。纳什均衡中包含的不可置信的威胁战略剔除出去。n n 我们用扩展型来表述这种博弈形式。扩展型
26、的表述有五个 我们用扩展型来表述这种博弈形式。扩展型的表述有五个因素组成 因素组成(1 1)参与人,()参与人,(2 2)每个参与人选择行动的时点,)每个参与人选择行动的时点,(3 3)每个参与人在每次行动时可供选择的行动集合,)每个参与人在每次行动时可供选择的行动集合,(4 4)每个参与人在每次行动时有关对手过去行动选择的)每个参与人在每次行动时有关对手过去行动选择的信息,(信息,(5 5)支付函数。)支付函数。n n 下面是扩展型的形象化表述博弈树。下面是扩展型的形象化表述博弈树。进入者进入不进入在位者合作斗争40,50-10,00,30017完全信息动态博弈:子博弈精炼纳什均衡n n 在
27、动态博弈中,如果所有以前的行动是 在动态博弈中,如果所有以前的行动是“共同知识 共同知识”,那,那么给定历史,从每一个行动选择开始至博弈结束又构成一 么给定历史,从每一个行动选择开始至博弈结束又构成一个博弈,称为 个博弈,称为“子博弈 子博弈”。n n 一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在 一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在每一个子博弈中都构成纳什均衡。即组成精炼纳什均衡的 每一个子博弈中都构成纳什均衡。即组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。战略必须在每一个子博弈中都是最优的。n n 不可置信的威胁又引出信息经济学中一个很重要的概念,不可置信的威
28、胁又引出信息经济学中一个很重要的概念,即 即“承诺行动 承诺行动”。它是当事人使自己的威胁战略变得可置。它是当事人使自己的威胁战略变得可置信的行动。信的行动。18不完全信息静态博弈:贝叶斯纳什均衡n n 在上例中,如果进入者实际上并不完全了解在位者的生产 在上例中,如果进入者实际上并不完全了解在位者的生产函数,成本函数及偏好,这就是不完全信息博弈。如果在 函数,成本函数及偏好,这就是不完全信息博弈。如果在位者的成本函数有两种可能,对应于这两种情况的支付矩 位者的成本函数有两种可能,对应于这两种情况的支付矩阵分别如下面两表所示。阵分别如下面两表所示。40 40,50 50-10-10,0 00
29、0,300 300 0 0,300 30030 30,100 100-10-10,140 1400 0,400 400 0 0,400 400在位者默许 斗争进入不进入进入者在位者默许 斗争进入不进入进入者市场进入:高成本情况市场进入:低成本情况19不完全信息静态博弈:贝叶斯纳什均衡n n 海萨尼转换:引入一个虚拟的参与人 海萨尼转换:引入一个虚拟的参与人-“-“自然 自然”,由它选,由它选择参与人的 择参与人的“类型 类型”。被选择的参与人只清楚自己的真实。被选择的参与人只清楚自己的真实类型,却不清楚其他参与人的真实类型。但是,各种可能 类型,却不清楚其他参与人的真实类型。但是,各种可能性的
30、概率分布是一种 性的概率分布是一种“共同知识 共同知识”。在上例中,自然首先。在上例中,自然首先选择了在位者的类型,进入者仅知道在位者是高成本和低 选择了在位者的类型,进入者仅知道在位者是高成本和低成本的可能性是多少。成本的可能性是多少。n n 贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己 贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期 的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说,没有人有积极性选择其 望效用达到了最大化,也就是说,没有人有积极性选择其他战略。他战略。n n 在上例中,高成本可能性为
31、 在上例中,高成本可能性为x x,低成本为,低成本为1-x 1-x。选择不进入。选择不进入的期望利润为零。则进入者选择进入的期望利润为 的期望利润为零。则进入者选择进入的期望利润为40 x+(-40 x+(-10)(1-x)10)(1-x),选择不进入的期望利润为零。则只有在,选择不进入的期望利润为零。则只有在x0.2 x0.2 时,时,进入者会选择进入。进入者会选择进入。20不完全信息静态博弈举例:求爱博弈n n 如果求爱者品德优良的概率为 如果求爱者品德优良的概率为x x。求爱者知道这个。求爱者知道这个x x 为多少,为多少,那么他求爱你接受时你的期望效用为 那么他求爱你接受时你的期望效用
32、为100 x+(-100)(1-x)100 x+(-100)(1-x),你,你不接受时你的期望效用为零。当 不接受时你的期望效用为零。当x0.5 x0.5 时,你接受才是最优 时,你接受才是最优选择。所以,如果 选择。所以,如果x0.5 x0.5,贝叶斯均衡是:求爱者求爱,你,贝叶斯均衡是:求爱者求爱,你接受;当 接受;当x0.5 x0.5 时,贝叶斯均衡是求爱者不求爱,你不接受 时,贝叶斯均衡是求爱者不求爱,你不接受。因为此时他知道他求爱会被你拒绝,这种。因为此时他知道他求爱会被你拒绝,这种lose face lose face 的事 的事情是不会干的 情是不会干的 100 100,-100
33、-100-50-50,0 00 0,0 0 0 0,0 0100 100,100 100-50-50,0 00 0,0 0 0 0,0 0你接受不接受求爱不求爱求爱者你接受 不接受求爱不求爱求爱者品德优良者求爱 品德恶劣者求爱21不完全信息动态博弈:精炼贝叶斯均衡n n精炼贝叶斯均衡的要点在于当事人要根据所观察精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的到的他人的行为来修正自己有关后者类型的“信信念念”,也就是主观概率,并由此选择自己的行动。,也就是主观概率,并由此选择自己的行动。n n精炼贝叶斯均衡是所有参与人战略和信念的一种精炼贝叶斯均衡是所有参与人战略
34、和信念的一种结合:它满足如下条件结合:它满足如下条件(11)给定每个人有关其他)给定每个人有关其他人类型的信念的情况下,它的战略都是最优的;人类型的信念的情况下,它的战略都是最优的;(22)每个人有关他人类型的信念都是使用贝叶斯)每个人有关他人类型的信念都是使用贝叶斯法则所观察到的行为中获得的。法则所观察到的行为中获得的。n n举例:黔之驴,古代社会的科举制度,我们当代举例:黔之驴,古代社会的科举制度,我们当代的教育体制。的教育体制。22约翰纳什n n19281928n n19501950,19511951:非合作博:非合作博弈弈n n19941994:诺贝尔经济学奖:诺贝尔经济学奖n n普林斯顿的幽灵普林斯顿的幽灵n n大学老师的评价:他大学老师的评价:他是个天才是个天才23