《经济学课件第五章.pptx》由会员分享,可在线阅读,更多相关《经济学课件第五章.pptx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第五五章章 博弈论博弈论 (一一)学习目标学习目标 n单一策略的竞争行为与纳什均衡单一策略的竞争行为与纳什均衡 (Nash equilibrium)n混合策略与纳什均衡混合策略与纳什均衡单一策略与纳什均衡单一策略与纳什均衡 释例 5.1囚犯困境问题(prisoners dilemma): 两个嫌疑犯被抓到法官面前问话,他们在无法沟通下有两个选择:供认或不供认。如下表所示,若两人都不认罪,则各被关 2 年;若是两人都认罪,则将各关 3 年;若张三不认罪而李四认罪,则张三被关 5 年,李四仅关 1 年;若李四不认罪而张三认罪,则李四被关 5 年,张三仅关 1 年。 李四 认罪 不认罪 认罪 -3
2、,-3 -1,-5 张三 不认罪 -5,-1 -2,-2 单一策略与纳什均衡单一策略与纳什均衡 由上表可以发现,张三的最佳策略 (strictly dominant strategy) 会是选择认罪:因为不论李四采用何种策略, 张三认罪的报偿要大于不认罪的报偿: (-3,-1) (-5,-2);换言之,张三的不认罪策略是一个严格劣势策略 (strictly dominated strategy)。 同样地,对李四而言,不论张三采取何种策略,李四的最佳策略也是认罪:(-3,-1) (-5,-2),而不认罪成为绝对劣势策略。在张三与李四都采取最佳策略 (认罪) 之下,两人分别得到被关 3 年的结果
3、:(-3,-3),虽然 (-2,-2) 是对双方较好的结果,但是却无法达成,这就是著名的囚犯困境问题。 单一策略与纳什均衡单一策略与纳什均衡 (-3,-3) 是一个稳定的均衡点,也就是在这一个点上,若对手不改变其策略,而自己改变策略的结果是会吃亏。 定义 5.1 假设有 I 个参赛者 ), 1(Ii,第 i 个参赛者的单一策略的集合为 iS,Ii, 1, 其中 miiiisssS,21(亦即第 i 个参赛者有 m 个单一策略), I 个参赛者的单一策略的集合为 ISSSS21。第 i 个参赛者采用 is (其中 iiSs ) 策略,而他的对手们采取 ),(1121Iiiissssss 的单一策
4、略 (其中IiiiiSSSSSSs1121),则第 i 个参赛者的报偿 (效用) 为:),(iiissu。设所有参赛者是同时出招 (称为同时出招博弈:simultaneous-move game),这个博弈的正态型博弈(normal form game) 表示为: )(,iiNuSI,Ii, 1,代表了参赛者的人数,可使用的各个单一策略,以及参赛者在不同的单一策略下所得到的报偿。 单一策略与纳什均衡单一策略与纳什均衡 定义 5.2单一策略的纳什均衡: 若 I 个参赛者的单一策略:),(21Isss 满足下式: ),(),(iiiiiissussu,对所有的 IiSsssSsiimiiii, 1
5、 , ,1, 则我们称此 I 个参赛者的单一策略 ),(21Issss 的点,是正态型博弈: )(,iiNuSI,Ii, 1,的纳什均衡点。 单一策略与纳什均衡单一策略与纳什均衡 释例 5.2如下表所示,张三有三个策略,李四有两个策略: 李四 d e a 3,p 1,q b 5,z 2,w 张三 c 6,x 3,y 则因为张三有一个最优策略:c,因此对李四而言,p,q,z 与 w 的报偿是没有任何意义的: 张三不可能选 a 或 b 策略。 李四只能就 x 与 y 的大小, 来选择他的 a 或 b 策略: 若是 x y 或 y x, 则上述的博弈只会有一个纳什均衡点; 若是 x = y,则会有两
6、个纳什均衡点:(6,x) 与 (3,y)。 单一策略与纳什均衡单一策略与纳什均衡 定义 5.3第 i 个参赛者的第 i 个单一策略 iiSs 若满足下式,则称此 is 为第 i 个参赛者在 )(,iiNuSI,Ii, 1,博弈中的最佳策略: ),(),(iiiiiissussu,对所有的 ,iiSs IiSsssiiii, 1 , ; 单一策略与纳什均衡单一策略与纳什均衡 定理 5.1两个参赛者的单一策略博弈: )(, 2iiNuS,2 , 1i, 若某一人有最佳策略,则存在有单一策略的纳什均衡点。 单一策略与纳什均衡单一策略与纳什均衡 定义 5.4 第 i 个参赛者的第 i 个单一策略 ii
7、Ss 若满足下式,则称此 is 为第 i 个参赛者在 )(,iiNuSI,Ii, 1,博弈中的严格劣势策略: 若 iS 中存在一个 )( iiisss,使得对所有的 IiSsii, 1 ,, ),(),(iiiiiissussu 单一策略与纳什均衡单一策略与纳什均衡 释例 5.3如下表所示,张三有三个策略,李四有两个策略: 李四 d e a -3,4 2,3 b 4,0 1,2 张三 c -2,5 -4,2 张三的 c 策略要比 b 策略来的差,因此对张三而言,c 策略是没有意义 (c 是严格劣势策略)、可以被删除的: 李四 d e a -3,4 2,3 张三 b 4,0 1,2 由上表我们可
8、以发现张三与李四各有两个单一策略,但是没有一个单一策略的纳什均衡点。 单一策略与纳什均衡单一策略与纳什均衡 释例 5.5 假设在释例 5.1 中的囚犯困境博弈不是只进行一次, 而是进行有限次数 (n 次) 的重复博弈 (repeated game)。 则在非合作之下, 最后一次 (第 n 次)的博弈的报偿是: 李四 认罪 不认罪 认罪 -3,-3 -1,-5 张三 不认罪 -5,-1 -2,-2 他们两人的最佳策略仍是认罪, 而 (-3,-3) 是纳什均衡点。 再倒推至第 1n 次的博弈,则两人的报偿仍是如上表所示,两人仍会采取认罪策略。以此类推,第一次的博弈 (或只有一次的博弈) 与在其他次
9、的博弈的结果完全相同, 都是只有 (-3,-3) 为纳什均衡点。 混合策略混合策略 释例 5.6假设张三与李四同时各出一枚硬币,若是两人都出正面或出反面,则李四要给张三一元;若是两人所出的结果正反不一,则张三需给李四一元: 李四 正 反 正 +1,-1 -1,+1 张三 反 -1,+1 +1,-1 在上面的博弈里,每个人都没有单一策略的最佳策略,也没有单一策略下的纳什均衡点。 混合策略混合策略 在上表,我们可以很直观地猜测,此博弈的混合策略的纳什均衡为:张三选用正或反的概率为 1/2;李四选取正或反的概率也是 1/2。 1. (a) 在李四选正面与反面的概率各为 1/2 之下,张三选正面的期望
10、报偿为 (若是表中的数字代表效用,则是期望效用 (见第四章式(4-4): 0) 1(21) 1(21 (5-1) (b) 在李四选正面与反面的概率各为 1/2 之下,张三选反面的期望报偿为: 0) 1(21) 1(21 (5-2) 因此在李四选正面与反面的概率各 1/2 之下,张三选正面与反面的概率也为 1/2 时,张三的期望报偿为: 0) 1(21) 1(2121) 1(21) 1(2121 同样地,在张三选正面与反面的概率为 1/2 之下,李四选正面与反面的概率也为 1/2时,李四的期望报偿为: 0) 1(21) 1(2121) 1(21) 1(2121 我们宣称:张三选正面与反面的概率各
11、为 1/2,并且李四选正面与反面的概率各为1/2,则在此混合策略下的张三与李四的期望报偿:(0,0) 是一个纳什均衡点。 混合策略混合策略 2. 若是张三偏离上述的作法:例如张三选取正面的概率为 2/3,选取反面的概率为1/3,而李四仍维持正面与反面各 1/2 概率的策略,则由式(5-1)与式(5-2)得知张三的期望报偿为: 0) 1(21) 1(2131) 1(21) 1(2132 (5-3) 并没有比以前增加,张三没有意愿改变。但是李四在张三采取正面 2/3 与反面 1/3之下,会舍弃正面 1/2 与反面 1/2 的策略,而改采取只出反面的策略: 张三出正面 2/3 概率与出反面 1/3
12、概率时,李四出反面的期望报偿 0) 1(31) 1(3221) 1(31) 1(322131) 1(31) 1(32 = 张三出正面 2/3 概率与出反面 1/3 概率时,李四出正面与反面各 1/2 概率的期望报偿。 (5-4) 因此,张三出正面 2/3 概率与出反面 1/3 概率,而李四出正面与反面各 1/2 概率的混合策略 (及他们所得到的期望报偿:(0,0) 不是一个纳什均衡点。 混合策略混合策略 混合策略的正态型博弈: 定义 5.5 假设有 I 个参赛者 ), 1(Ii,第 i 个参赛者的单一策略的集合为 iS,Ii, 1,面对 iS 的混合策略为:1)(, 0)(iiSsiiiiss
13、。设所有的参赛者同时出招, 这个混合策略下的正态型博弈表示为:)(,)(,iiNuSI,Ii, 1,其中 12()(,): 0, 1,MiiiMimiSRmM, 并且 11Mmmi (亦即第 i 个参赛者是在他的 M 个单一策略中随机选取策略)。 混合策略混合策略定义 5.6混合策略的纳什均衡: 若 I 个参赛者的混合策略:),(21I 满足下式: ),(),(iiiiiiuu,对所有的 )(iiS, 则 我 们 称 此 I 个 参 赛 者 的 混 合 策 略 ),(21I 的 点 , 是 :)(,)(,iiNuSI,Ii, 1 的纳什均衡点。 混合策略混合策略 定理 5.2 I 个参赛者的单
14、一策略的集合 iS,Ii, 1,若都只含有限个单一策略,则一定存在一个混合策略 ),(21I 的点,是 )(,iiNuSI,Ii, 1 的纳什均衡点。 混合策略混合策略 定理 5.3 设 iiSS 为第 i 个参赛者的可能采取的单一策略的集合 (因此严格劣势策略不在其内),Ii, 1。),(21I 为 )(,)(,iiNuSI 的混合策略的纳什均衡点 (i) ( ,)( ,),iiiiiiu su s 对所有的 , , 1, ,iiiisSsSiI (ii) ( ,)( ,),iiiiiiu su s 对所有的 , , 1,iiiisSsSiI 混合策略混合策略 释例 5.7由定理 5.3 的 (i) 的性质,我们推得下列两个表中的混合策略下的纳什均衡点: 李四 正 反 正 +1,-1 -1,+1 反 -1,+1 +1,-1 张三 竖立 硬币 -3,+100 -5,+1000 222222222(, (1)( 1) ()( 1) (1)(, (1)( 1) ()( 1) (1)1 2uu 張三張三張三出正面 李四出正面及出反面張三出反面 李四出正面及出反面 因此, 張三(正面概率, 反面概率)11( , )22 李四(正面概率, 反面概率)11( , )22 为混合策略的纳什均衡点。