《北京大学博弈论课件第2章-完全信息静态博弈教案资料.ppt》由会员分享,可在线阅读,更多相关《北京大学博弈论课件第2章-完全信息静态博弈教案资料.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、北京大学博弈论课件第北京大学博弈论课件第2 2章章-完全信息静态博弈完全信息静态博弈v在完全信息静态博弈中,博弈各参与方同时行动,在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。且对博弈相关信息完全了解。v“划横线法划横线法”是求解完全信息静态博弈的常用方法。是求解完全信息静态博弈的常用方法。v通常说来,完全信息静态博弈都存在通常说来,完全信息静态博弈都存在“纳什均衡纳什均衡”或或“混合策略纳什均衡混合策略纳什均衡”。第一节第一节 定义和求解方法定义和求解方法v一、完全信息静态博弈的定义和实例一、完全信息静态博弈的定义和实例v完全信息静态博弈指:博弈各方同时决策,任何博弈
2、参与完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。弈结果、博弈各方的策略集、收益等。v可以通过支付矩阵(可以通过支付矩阵(Payoff Matrix)寻找完全信息静)寻找完全信息静态博弈的均衡。态博弈的均衡。v以以“囚徒困境囚徒困境”为例,介绍支付矩阵的构造方法和应用。为例,介绍支付矩阵的构造方法和应用。1囚徒困境囚徒困境v在在“囚徒困境囚徒困境”博弈中,有两个博弈参与者:嫌疑人甲和博弈中,有两个博弈参与者:嫌疑人甲和嫌疑人乙。嫌疑人乙。v将嫌疑人甲标识在支
3、付矩阵左侧,将嫌疑人乙标识在支付将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方矩阵上方。v嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。甲可能的策略纵向排列在博弈支付矩阵左侧。v嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。人乙可能的策略横向排列在博弈支付矩阵上方。嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)“囚徒困境囚徒困
4、境”博弈的支付矩阵博弈的支付矩阵v矩阵左上方的(矩阵左上方的(5,5)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“坦白坦白”、嫌疑人乙选、嫌疑人乙选择择“坦白坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。表示嫌疑人乙的收益。v矩阵左下方的(矩阵左下方的(10,1)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“不坦白不坦白”、嫌疑人乙选择嫌疑人乙选择“坦白坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够
5、得到的收益。v矩阵右上方的(矩阵右上方的(1,10)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“坦白坦白”、嫌、嫌疑人乙选择疑人乙选择“不坦白不坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够得到的收益。v矩阵右下方的(矩阵右下方的(2,2)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“不坦白不坦白”、嫌、嫌疑人乙选择疑人乙选择“不坦白不坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够得到的收益。2智猪博弈智猪博弈v猪栏里养了两头猪,一头大猪、一头小猪。猪栏里养了两头猪,一头大猪、一头小猪。v在猪圈的一端有一个盛食槽。在猪圈的一端有一个盛食槽。v在猪圈的另一端有一个按压式开关。在猪圈
6、的另一端有一个按压式开关。v开关每被按压一次,就有固定数量的食物出现在盛食槽中。开关每被按压一次,就有固定数量的食物出现在盛食槽中。v大猪和小猪都在思考是否去按压开关。大猪和小猪都在思考是否去按压开关。v如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为压开关的劳动却没有
7、吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为,小猪的收益为-1。v如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是下,大猪得到的收益是 4,小猪得到的收益是,小猪得到的收益是 2。v如果
8、小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收益为益为 10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益的郁闷,小猪得到收益-2。v如果大猪和小猪都不
9、去按压开关,则大猪和小猪都无法吃到食如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益物,大猪和小猪均得到收益 0。小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,-1)(4,2)等待等待(10,-2)(0,0)“智猪博弈智猪博弈”的支付矩阵的支付矩阵二、划横线法二、划横线法v1通过通过“划横线法划横线法”求解求解“囚徒困境囚徒困境”博弈的均衡博弈的均衡嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)v如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择?如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选
10、择?v理性的嫌疑人甲会选择坦白。理性的嫌疑人甲会选择坦白。v在嫌疑人甲选择坦白所对应的收益在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。的下方划一道短横线。v类似可分析其他情况类似可分析其他情况v2通过通过“划横线法划横线法”求解求解“智猪博弈智猪博弈”的均衡的均衡v如果大猪选择按开关,那么小猪应该如何选择?如果大猪选择按开关,那么小猪应该如何选择?v理性的小猪会选择等待。理性的小猪会选择等待。v在小猪选择等待所对应的收益在小猪选择等待所对应的收益“2”的下方划一道短横线。的下方划一道短横线。v类似可分析其他情况类似可分析其他情况小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,
11、-1)(4,2)等待等待(10,-2)(0,0)第二节第二节 纳什均衡纳什均衡v一、纳什均衡的定义一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者都给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为被称为“纳什均衡纳什均衡”(Nash Equilibrium)。)。v“囚徒困境囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。嫌疑人乙选择坦白)。v给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑人甲的给定嫌疑人乙在纳什
12、均衡的策略选择:坦白;嫌疑人甲的最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均衡的策略。衡的策略。v给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什均衡的策略。均衡的策略。v“智猪博弈智猪博弈”的纳什均衡为:(大猪选择按开关,小猪选的纳什均衡为:(大猪选择按开关,小猪选择等待)。择等待)。v给定大猪在纳什均衡的策略选择:按开关;小猪的最优策给定大猪在纳什均衡的策略选择:按开关;小猪的最优策略
13、就是等待,小猪没有动机改变策略。略就是等待,小猪没有动机改变策略。v给定小猪在纳什均衡的策略选择:等待;大猪的最优策略给定小猪在纳什均衡的策略选择:等待;大猪的最优策略就是按开关,大猪没有动机改变策略。就是按开关,大猪没有动机改变策略。二、存在多个纳什均衡的博弈二、存在多个纳什均衡的博弈v1性别博弈性别博弈v采用采用“划横线法划横线法”寻找寻找“性别博弈性别博弈”的纳什均衡的纳什均衡v(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博弈性别博弈”的纳什均衡。的纳什均衡。女方女方看足球看足球听昆曲听昆曲男方男方看足球看足球
14、(10,2)(-1,-1)听昆曲听昆曲(-1,-1)(2,10)v甲、乙两人相对而行,试图通过一座独木桥。甲、乙两人相对而行,试图通过一座独木桥。v独木桥仅能容纳一人通行。独木桥仅能容纳一人通行。v如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄的独木桥,两人都会掉到河里,均得到收益的独木桥,两人都会掉到河里,均得到收益-10。v如果甲选择退让,让乙先行,那么得意的乙将得到收益如果甲选择退让,让乙先行,那么得意的乙将得到收益 20,面子受损的甲面子受损的甲 得到收益得到收益-2。v如果乙选择退让,让甲先行,那么得意的甲将得到收益如果乙
15、选择退让,让甲先行,那么得意的甲将得到收益 20,面子受损的乙得到收益面子受损的乙得到收益-2。v如果甲和乙均选择退让,那么双方均得到收益如果甲和乙均选择退让,那么双方均得到收益 10。2.“斗鸡博弈斗鸡博弈”v采用采用“划横线法划横线法”寻找寻找“斗鸡博弈斗鸡博弈”的纳什均衡的纳什均衡v(甲前行、乙退让)和(甲退让、乙前行)都是(甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈斗鸡博弈”的纳什均衡。的纳什均衡。乙乙前行前行退让退让甲甲前行前行(-10,-10)(20,-2)退让退让(-2,20)(0,0)v假设在市场中有两个竞争对手。一个是已经在市场中的假设在市场中有两个竞争对手。一个是已
16、经在市场中的“在位者在位者”,另一个是企图进入市场的另一个是企图进入市场的“潜在进入者潜在进入者”。v潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个可以选择的策略:斗争、默许。可以选择的策略:斗争、默许。v如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会使得双方均亏损,双方收益均为使得双方均亏损,双方收益均为-10。v如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可获得收益获得收
17、益 5。v如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收益为益为 0,在位者的收益为,在位者的收益为 20。v如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收益为益为 0,在位者的收益为,在位者的收益为 153“市场争夺战市场争夺战”博弈博弈v采用采用“划横线法划横线法”寻找寻找“市场争夺战市场争夺战”博弈的纳什均衡博弈的纳什均衡v(潜在进入者进入、在位者默许)和(潜在进入者不进入、在(潜在进入者进入、在位者默许)和(潜在进入者不进入、在位者斗争)都
18、是位者斗争)都是“市场争夺战市场争夺战”博弈的纳什均衡。博弈的纳什均衡。在位者在位者斗争斗争默许默许潜在进入者潜在进入者进入进入(-10,-10)(5,5)不进入不进入(0,20)(0,15)三、无法通过三、无法通过“划横线法划横线法”找到纳什均衡的博弈找到纳什均衡的博弈v1“锤头、剪刀、布锤头、剪刀、布”博弈博弈v通过通过“划横线法划横线法”无法找到无法找到“锤头、剪刀、布锤头、剪刀、布”博弈的纳什均衡。博弈的纳什均衡。参与者参与者2锤头锤头剪刀剪刀布布参与者参与者1锤头锤头(0,0)(1,-1)(-1,1)剪刀剪刀(-1,1)(0,0)(1,-1)布布(1,-1)(-1,1)(0,0)v市
19、场中有两个厂商进行产量竞争。市场中有两个厂商进行产量竞争。v市场上该商品的总产量为:市场上该商品的总产量为:Q=q1+q2。v其中:其中:Q 为总产量,为总产量,q1 为厂商为厂商 1 的产量,的产量,q2 为厂商为厂商 2 的产量。的产量。v市场的需求函数为:市场的需求函数为:P=A-Q。v其中,其中,P 为市场价格,为市场价格,A 为外生常数。为外生常数。v厂商厂商 1 的生产成本函数为:的生产成本函数为:C(q1)=cq1。其中。其中 c 为厂商为厂商 1 的边际成本,且假设厂商的边际成本,且假设厂商 1 的生产没有固定成本。的生产没有固定成本。v类似的,厂商类似的,厂商 2 的生产成本
20、函数为:的生产成本函数为:C(q2)=cq2。v厂商厂商 1 和厂商和厂商 2 通过选择各自的最优产量达到各自利润最大化通过选择各自的最优产量达到各自利润最大化的目标。的目标。2古诺寡头博弈古诺寡头博弈v在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法通过通过“划横线法划横线法”求解古诺寡头博弈的均衡。求解古诺寡头博弈的均衡。v但可以通过求解两个厂商的但可以通过求解两个厂商的“反应函数(反应函数(Reaction function)”来求解寡头博弈的均衡。来求解寡头博弈的均衡。v厂商厂商 1 在决策时,假设厂商在决策时,假
21、设厂商 2 的产量为给定的产量为给定v厂商厂商 2 在决策时,假设厂商在决策时,假设厂商 1 的产量为给定的产量为给定v根据根据 ,得到,得到v得到反应函数(得到反应函数(Reaction Function)古诺寡头博弈反应函数和均衡古诺寡头博弈反应函数和均衡v市场中有市场中有 n 个厂商进行产量竞争。个厂商进行产量竞争。v市场上该商品的总产量为:市场上该商品的总产量为:Q=q1+q2+qn。v其中:其中:Q 为总产量,为总产量,qi 为厂商为厂商 i 的产量。的产量。v市场的需求函数为:市场的需求函数为:P=A-Q。v其中,其中,P 为市场价格,为市场价格,A 为外生常数。为外生常数。v厂商
22、厂商 i 的生产成本函数为:的生产成本函数为:C(qi)=cqi。其中。其中 c 为厂商为厂商 i 的的边际成本,且假设厂商边际成本,且假设厂商 i 的生产没有固定成本。的生产没有固定成本。v市场中市场中 n 个厂商个厂商 通过选择各自的最优产量达到各自利润最大化通过选择各自的最优产量达到各自利润最大化的目标。的目标。3多厂商古诺寡头博弈多厂商古诺寡头博弈v市场中的市场中的 n 个厂商利润最大化,一阶条件得到:个厂商利润最大化,一阶条件得到:v均衡产量为:均衡产量为:v均衡价格为:均衡价格为:v可以证明,当厂商个数趋于无穷个时,市场价格趋于厂商的边可以证明,当厂商个数趋于无穷个时,市场价格趋于
23、厂商的边际成本际成本 c,即:,即:v也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋于无穷时,市场的均衡价格趋于完全竞争市场下的价格。于无穷时,市场的均衡价格趋于完全竞争市场下的价格。4伯特兰德寡头博弈伯特兰德寡头博弈v市场中有两个厂商进行价格竞争。市场中有两个厂商进行价格竞争。v厂商厂商 1 的价格为的价格为 p1。v厂商厂商 2 的价格为的价格为 p2。v厂商厂商 1 的生产成本函数为:的生产成本函数为:C(q1)=cq1。其中。其中 c 为厂商为厂商 1 的边际成本,且假设厂商的边际成本,且假设厂商 1 的生产没有固定成本。的
24、生产没有固定成本。v类似的,厂商类似的,厂商 2 的生产成本函数为:的生产成本函数为:C(q2)=cq2。v厂商厂商 1 和厂商和厂商 2 通过选择各自的最优价格达到各自利润最大化通过选择各自的最优价格达到各自利润最大化的目标。的目标。v当厂商当厂商 1 产品的价格大于厂商产品的价格大于厂商 2 产品的价格时,消费者产品的价格时,消费者会购买厂商会购买厂商 2 的产品,对厂商的产品,对厂商 1 产品的消费量为零。产品的消费量为零。v当厂商当厂商 1 产品的价格小于厂商产品的价格小于厂商 2 产品的价格时,消费者产品的价格时,消费者会购买厂商会购买厂商 1 的产品,对厂商的产品,对厂商 2 产品
25、的消费量为零。产品的消费量为零。v当厂商当厂商 1 产品的价格等于厂商产品的价格等于厂商 2 产品的价格时,消费者产品的价格时,消费者会同时消费厂商会同时消费厂商 1 和厂商和厂商 2 的产品。的产品。v因此伯特兰德寡头博弈的均衡为:因此伯特兰德寡头博弈的均衡为:v伯特兰德寡头博弈的均衡是一个纳什均衡。伯特兰德寡头博弈的均衡是一个纳什均衡。v这是因为:当厂商这是因为:当厂商 2 的价格满足的价格满足 时,时,v厂商厂商1的最优策略选择是使得自己的定价满足的最优策略选择是使得自己的定价满足v如果厂商如果厂商 1 的定价高于的定价高于 c,则厂商,则厂商 1 会失去整个市场;会失去整个市场;v如果
26、厂商如果厂商 1 的定价低于的定价低于 c,则厂商,则厂商 1 会亏损。会亏损。v因此当厂商因此当厂商 2 的定价等于的定价等于 c 时,厂商时,厂商 1 的最优定价策略的最优定价策略是使得价格等于是使得价格等于 c。v类似的,当厂商类似的,当厂商 1 的价格等于的价格等于 c 时,厂商时,厂商 2 的最优定价的最优定价策略也是使得价格等于策略也是使得价格等于 c。现实中的囚徒困境现实中的囚徒困境v1囚徒困境与苏美争霸囚徒困境与苏美争霸v在苏美争霸博弈中,美国和前苏联都处于在苏美争霸博弈中,美国和前苏联都处于“囚徒困境囚徒困境”中。中。前苏联前苏联不扩军备战不扩军备战扩军备战扩军备战美国美国不
27、扩军备战不扩军备战(10,10)(-100,100)扩军备战扩军备战(100,-100)(0,0)苏美争霸博弈的支付矩阵苏美争霸博弈的支付矩阵v2囚徒困境与观看演出囚徒困境与观看演出v不管别人的策略是什么,所有理性人的选择都是踮起脚尖,观众都陷不管别人的策略是什么,所有理性人的选择都是踮起脚尖,观众都陷入入“囚徒困境囚徒困境”中。中。观众观众2不踮脚尖不踮脚尖踮脚尖踮脚尖观众观众1不踮脚尖不踮脚尖(10,10)(-5,15)踮脚尖踮脚尖(15,-5)(5,5)众人观看演出博弈的支付矩阵众人观看演出博弈的支付矩阵v3囚徒困境与交通秩序囚徒困境与交通秩序v博弈均衡是一个博弈均衡是一个“囚徒困境囚徒
28、困境”。v博弈参与者都选择无视交通规范和交通礼仪,胡乱夹塞,结果不但不博弈参与者都选择无视交通规范和交通礼仪,胡乱夹塞,结果不但不能提高交通参与者的出行效率,反而会使所有人的出行时间延长。能提高交通参与者的出行效率,反而会使所有人的出行时间延长。驾驶员驾驶员2不夹塞不夹塞夹塞夹塞驾驶员驾驶员1不夹塞不夹塞(10,10)(-10,20)夹塞夹塞(20,-10)(0,0)交通秩序博弈的支付矩阵交通秩序博弈的支付矩阵v“囚徒困境囚徒困境”的内在根源是:人类的个人理性有时可能导的内在根源是:人类的个人理性有时可能导致集体的非理性致集体的非理性v在在“囚徒困境囚徒困境”中,每个博弈参与者都是理性人。中,
29、每个博弈参与者都是理性人。v博弈参与者的个体理性表现为:每个博弈参与者都只关心博弈参与者的个体理性表现为:每个博弈参与者都只关心自己的利益,不关心博弈对方的利益及整体利益。自己的利益,不关心博弈对方的利益及整体利益。v然而,个体理性自由发挥的结果,导致了集体不理性。然而,个体理性自由发挥的结果,导致了集体不理性。第三节第三节 混合策略均衡混合策略均衡v一、混合策略纳什均衡的定义和求解方法一、混合策略纳什均衡的定义和求解方法 混合策略均衡指博弈参与者以一定的概率分布随机选择混合策略均衡指博弈参与者以一定的概率分布随机选择策略集中的策略,使得其他博弈参与者在各个可能的策策略集中的策略,使得其他博弈
30、参与者在各个可能的策略之间无差异。略之间无差异。v在在“锤头、剪刀、布锤头、剪刀、布”的博弈中的博弈中v博弈参与者博弈参与者 1 的混合策略指:博弈参与者的混合策略指:博弈参与者 1 在在“锤头、剪刀、锤头、剪刀、布布”三个策略中随机选择,使得博弈参与者三个策略中随机选择,使得博弈参与者 2 在在“锤头、剪刀、锤头、剪刀、布布”三个策略之间无差异。三个策略之间无差异。v博弈参与者博弈参与者 2 的混合策略指:博弈参与者的混合策略指:博弈参与者 2 在在“锤头、剪刀、锤头、剪刀、布布”三个策略中随机选择,使得博弈参与者三个策略中随机选择,使得博弈参与者 1 在在“锤头、剪刀、锤头、剪刀、布布”三
31、个策略之间无差异。三个策略之间无差异。v假设博弈参与者假设博弈参与者 1 选择出选择出“锤头锤头”的概率为的概率为 ,选择出,选择出“剪刀剪刀”的概率为的概率为 ,选择出,选择出“布布”的概率为的概率为 v得到联立方程组:得到联立方程组:v类似的,得到联立方程组:类似的,得到联立方程组:v得到得到二、二、“小偷和守卫小偷和守卫”博弈博弈v“小偷和守卫小偷和守卫”博弈是一个存在混合策略纳什均衡的经典博弈。博弈是一个存在混合策略纳什均衡的经典博弈。v守卫负责在夜间看守一个仓库,小偷试图在夜间去偷窃这个仓库守卫负责在夜间看守一个仓库,小偷试图在夜间去偷窃这个仓库的物品。的物品。v守卫有两个策略:睡觉
32、、不睡觉。守卫有两个策略:睡觉、不睡觉。v小偷也有两个策略:偷、不偷。小偷也有两个策略:偷、不偷。小偷小偷偷偷不偷不偷守卫守卫睡觉睡觉(-5,5)(0,0)不睡觉不睡觉(10,-10)(-2,0)v根据根据“划横线法划横线法”,“小偷和守卫小偷和守卫”博弈没有纯策略均衡博弈没有纯策略均衡(Pure Strategy Equilibrium),但),但“小偷和守卫小偷和守卫”博弈存在一个混合策略纳什均衡。博弈存在一个混合策略纳什均衡。v假设守卫选择假设守卫选择“睡觉睡觉”的概率为的概率为 ,选择,选择“不睡觉不睡觉”的的概率为概率为v得到:得到:v求解联立方程组,得到:求解联立方程组,得到:v假
33、设小偷选择假设小偷选择“偷偷”的概率为的概率为 ,选择,选择“不偷不偷”的概率的概率为为v小偷通过选择自己的策略使得守卫在选择小偷通过选择自己的策略使得守卫在选择“睡觉睡觉”和和“不不睡觉睡觉”两种策略之间无差异。两种策略之间无差异。v得到:得到:v求解联立方程组,得到:求解联立方程组,得到:第四节第四节 占优策略与均衡占优策略与均衡v一、严格占优策略的定义一、严格占优策略的定义 博弈参与者进行策略选择时,有可能存在某个策略的收益博弈参与者进行策略选择时,有可能存在某个策略的收益严格优于其他策略的情况,该策略被称为严格占优策略严格优于其他策略的情况,该策略被称为严格占优策略(Strictly
34、Dominant Strategy)。)。v“囚徒困境囚徒困境”博弈与严格占优策略博弈与严格占优策略v不管嫌疑人乙选择何种策略(坦白还是不坦白),嫌疑人甲的最不管嫌疑人乙选择何种策略(坦白还是不坦白),嫌疑人甲的最优策略都是坦白。在这种情况下,优策略都是坦白。在这种情况下,“坦白坦白”是嫌疑人甲的严格占是嫌疑人甲的严格占优策略。优策略。v不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最优策略都是坦白。因此优策略都是坦白。因此“坦白坦白”也是嫌疑人乙的严格占优策略。也是嫌疑人乙的严格占优策略。嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑
35、人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)二、通过寻找严格占优策略求解博弈均衡二、通过寻找严格占优策略求解博弈均衡v在寻找博弈均衡时,如果该博弈某参与者存在严格占优策在寻找博弈均衡时,如果该博弈某参与者存在严格占优策略,那么在博弈均衡中,该参与者会选择严格占优策略,略,那么在博弈均衡中,该参与者会选择严格占优策略,而不会选择其他策略。而不会选择其他策略。v因为不管其他参与者选择何种策略,该参与者选择严格占因为不管其他参与者选择何种策略,该参与者选择严格占优策略的收益均高于选择其他策略的收益。优策略的收益均高于选择其他策略的收益。v因此在博弈均衡中,理性参与者一
36、定会选择严格占优策略。因此在博弈均衡中,理性参与者一定会选择严格占优策略。1“囚徒困境囚徒困境”博弈博弈v由于由于“坦白坦白”是嫌疑人甲的严格占优策略,所以将嫌疑人甲选择是嫌疑人甲的严格占优策略,所以将嫌疑人甲选择“坦白坦白”策略导致的博弈结果从博弈支付矩阵中剥离出来。策略导致的博弈结果从博弈支付矩阵中剥离出来。v将嫌疑人乙选择将嫌疑人乙选择“坦白坦白”策略导致的博弈结果从上表中剥离出来策略导致的博弈结果从上表中剥离出来嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)嫌疑人乙嫌疑人乙坦白坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)v定理:定理:如果每个博弈参与者都存
37、在一个严格占优策略,如果每个博弈参与者都存在一个严格占优策略,那么在博弈中各参与者必然选择其严格占优策略。那么在博弈中各参与者必然选择其严格占优策略。各博弈参与者的严格占优策略构成博弈均衡。各博弈参与者的严格占优策略构成博弈均衡。v在某些博弈中,并不是所有博弈参与者都存在严格占优策略。在某些博弈中,并不是所有博弈参与者都存在严格占优策略。v2.“智猪博弈智猪博弈”v小猪存在严格占优策略,大猪没有严格占优策略。小猪存在严格占优策略,大猪没有严格占优策略。v将小猪选择严格占优策略将小猪选择严格占优策略“等待等待”导致的博弈结果从上表中剥离导致的博弈结果从上表中剥离出来出来小猪小猪按开关按开关等待等
38、待大猪大猪按开关按开关(5,-1)(4,2)等待等待(10,-2)(0,0)v得到:得到:v给定小猪必然选择给定小猪必然选择“等待等待”,大猪如果选择,大猪如果选择“按开关按开关”,大猪得,大猪得到的收益为到的收益为 4,如果选择,如果选择“等待等待”,大猪得到的收益为,大猪得到的收益为 0。因此。因此大猪会选择大猪会选择“按开关按开关”。v所以所以“智猪博弈智猪博弈”的均衡解为(大猪选择按开关,小猪选择等待)。的均衡解为(大猪选择按开关,小猪选择等待)。小猪小猪等待等待大猪大猪按开关按开关(4,2)等待等待(0,0)v在某些博弈中,所有博弈参与者均不存在严格占优策略。在某些博弈中,所有博弈参
39、与者均不存在严格占优策略。v3性别博弈性别博弈v对男方而言,如果女方选择看足球,那么男方会选择看足球;如果女方对男方而言,如果女方选择看足球,那么男方会选择看足球;如果女方选择听昆曲,那么男方会选择听昆曲。男方不存在严格占优策略。选择听昆曲,那么男方会选择听昆曲。男方不存在严格占优策略。v对女方而言,如果男方选择看足球,那么女方会选择看足球;如果男方对女方而言,如果男方选择看足球,那么女方会选择看足球;如果男方选择听昆曲,那么女方会选择听昆曲。女方也不存在严格占优策略。选择听昆曲,那么女方会选择听昆曲。女方也不存在严格占优策略。v无法通过寻找严格最优策略法求解无法通过寻找严格最优策略法求解“性
40、别博弈性别博弈”的均衡解。的均衡解。女方女方看足球看足球听昆曲听昆曲男方男方看足球看足球(10,2)(-1,-1)听昆曲听昆曲(-1,-1)(2,10)三、严格被占优策略三、严格被占优策略v有些博弈不存在严格占优策略,但存在严格被占优策略有些博弈不存在严格占优策略,但存在严格被占优策略(Strictly Dominated Strategy)。)。v通过剔除严格被占优策略的方法也可以找出博弈的均衡。通过剔除严格被占优策略的方法也可以找出博弈的均衡。v1严格被占优策略的定义严格被占优策略的定义 严格被占优的策略指:不管其他博弈参与者采用何种策略,严格被占优的策略指:不管其他博弈参与者采用何种策略
41、,某个博弈参与者采用某种策略的收益总是小于采用另外某某个博弈参与者采用某种策略的收益总是小于采用另外某种策略的收益。收益较小的策略称为该博弈参与者的严格种策略的收益。收益较小的策略称为该博弈参与者的严格被占优策略。被占优策略。v存在严格被占优策略的博弈存在严格被占优策略的博弈v博弈参与者博弈参与者 1 和博弈参与者和博弈参与者 2 都没有严格占优策略。都没有严格占优策略。v无法通过寻找严格占优策略法求解此博弈的均衡。无法通过寻找严格占优策略法求解此博弈的均衡。v策略策略c是博弈参与者是博弈参与者 2 的严格被占优策略。的严格被占优策略。v不管博弈参与者不管博弈参与者 1 采用何种策略,博弈参与
42、者采用何种策略,博弈参与者 2 选择策略选择策略 c 的的收益均小于选择策略收益均小于选择策略 b 的收益。的收益。参与者参与者2策略策略a策略策略b策略策略c参与者参与者1策略策略A(3,1)(5,5)(1,3)策略策略B(1,5)(1,3)(5,1)2剔除严格被占优策略与博弈均衡剔除严格被占优策略与博弈均衡v将博弈参与者将博弈参与者 2 的严格被占优策略从博弈支付矩阵中剔除,的严格被占优策略从博弈支付矩阵中剔除,得到:得到:v策略策略 A 成为博弈参与者成为博弈参与者 1 的严格占优策略。的严格占优策略。v将参与者将参与者 1 选择策略选择策略 A 导致的博弈结果从表中剥离出来,导致的博弈
43、结果从表中剥离出来,得到:得到:参与者参与者2策略策略a策略策略b参与者参与者1策略策略A(3,1)(5,5)策略策略B(1,5)(1,3)v当博弈参与者当博弈参与者 1 选择策略选择策略 A 时,博弈参与者时,博弈参与者 2 的最优策略选择的最优策略选择是策略是策略 b。v博弈均衡为:(参与者博弈均衡为:(参与者1选择策略选择策略A,参与者,参与者2选择策略选择策略b)参与者参与者2策略策略a策略策略b参与者参与者1策略策略A(3,1)(5,5)v练习:通过剔除严格被占优策略法找到下表的博弈均衡练习:通过剔除严格被占优策略法找到下表的博弈均衡v博弈的均衡解为:博弈参与者博弈的均衡解为:博弈参
44、与者 1 选择策略选择策略 C,博弈参与者,博弈参与者 2 选择策略选择策略 c。参与者参与者2策略策略a策略策略b策略策略c参与者参与者1策略策略A(1,0)(6,4)(0,9)策略策略B(4,6)(2,0)(0,3)策略策略C(7,3)(3,2)(1,4)四、弱占优策略与弱被占优策略四、弱占优策略与弱被占优策略v有些博弈不存在严格占优策略,但存在弱占优策略。有些博弈不存在严有些博弈不存在严格占优策略,但存在弱占优策略。有些博弈不存在严格被占优策略,但存在弱被占优策略。格被占优策略,但存在弱被占优策略。v1弱占优策略与弱被占优策略的定义弱占优策略与弱被占优策略的定义v弱占优策略(弱占优策略(
45、Dominant Strategy)指:不管其他博弈参与者采用)指:不管其他博弈参与者采用何种策略,某博弈参与者采用某种策略得到的收益总是大于或等于采用何种策略,某博弈参与者采用某种策略得到的收益总是大于或等于采用另外某种策略的收益。收益较大的策略称为该博弈参与者的弱占优策略。另外某种策略的收益。收益较大的策略称为该博弈参与者的弱占优策略。v弱被占优策略(弱被占优策略(Dominated Strategy)指:不管其他博弈参与者)指:不管其他博弈参与者采用何种策略,某博弈参与者采用某种策略的收益总是小于或等于采用采用何种策略,某博弈参与者采用某种策略的收益总是小于或等于采用另外某种策略的收益。
46、收益较小的策略称为该博弈参与者的弱被占优策另外某种策略的收益。收益较小的策略称为该博弈参与者的弱被占优策略。略。v严格占优策略指博弈参与者选择某个策略的收益严格占优策略指博弈参与者选择某个策略的收益严格大于严格大于另外某个策略的收益。另外某个策略的收益。v弱占优策略指博弈参与者选择某个策略的收益弱占优策略指博弈参与者选择某个策略的收益大于等于大于等于另另外某个策略的收益。外某个策略的收益。v严格被占优策略指博弈参与者选择某个策略的收益严格被占优策略指博弈参与者选择某个策略的收益严格小严格小于于另外某个策略的收益。另外某个策略的收益。v弱被占优策略指博弈参与者选择某个策略的收益弱被占优策略指博弈
47、参与者选择某个策略的收益小于等于小于等于另外某个策略的收益。另外某个策略的收益。2弱占优策略与弱被占优策略的应用与局限弱占优策略与弱被占优策略的应用与局限v在下表中,策略在下表中,策略 C 是博弈参与者是博弈参与者 1 的弱被占优策略,策略的弱被占优策略,策略 C 被策略被策略 A 弱占优,也被策略弱占优,也被策略 B 弱占优。弱占优。v面对同样的博弈支付矩阵,通过剔除弱被占优策略的方法求解时,剔除面对同样的博弈支付矩阵,通过剔除弱被占优策略的方法求解时,剔除策略的顺序不同,得到的均衡解也可能不同。策略的顺序不同,得到的均衡解也可能不同。v因此不建议采用剔除弱被占优策略的方法寻找博弈均衡。因此
48、不建议采用剔除弱被占优策略的方法寻找博弈均衡。参与者参与者2策略策略a策略策略b策略策略c参与者参与者1策略策略A(3,8)(2,5)(2,8)策略策略B(1,8)(3,8)(1,6)策略策略C(1,8)(2,5)(1,9)第五节第五节 补充阅读补充阅读v一、博弈的数学定义一、博弈的数学定义v二、纳什均衡的数学定义和存在性二、纳什均衡的数学定义和存在性v三、严格占优策略的数学定义三、严格占优策略的数学定义v四、混合策略的数学定义四、混合策略的数学定义v在完全信息静态博弈中,博弈各方同时行动且博弈各方对博在完全信息静态博弈中,博弈各方同时行动且博弈各方对博弈信息均完全了解。弈信息均完全了解。v某
49、些完全信息静态博弈可以通过某些完全信息静态博弈可以通过“划横线法划横线法”求解出均衡。求解出均衡。v在纳什均衡中,给定其他参与者选择的策略,任何一方博弈在纳什均衡中,给定其他参与者选择的策略,任何一方博弈参与者都没有动机改变自己的策略选择。参与者都没有动机改变自己的策略选择。v寻找严格占优策略或剔除严格被占优策略也是求解博弈均衡寻找严格占优策略或剔除严格被占优策略也是求解博弈均衡的有力工具。的有力工具。v在混合策略纳什均衡中,博弈参与者以一定的概率分布随机在混合策略纳什均衡中,博弈参与者以一定的概率分布随机选择策略集中的策略,使博弈其他参与者在选择各个可能的选择策略集中的策略,使博弈其他参与者
50、在选择各个可能的策略时无差异。策略时无差异。本章小结本章小结本章习题本章习题1 1什么是完全信息静态博弈?什么是完全信息静态博弈?2 2什么是什么是“智猪博弈智猪博弈”?请举出一个现实生活中满?请举出一个现实生活中满足足“智猪博弈智猪博弈”模式的实例。模式的实例。3 3什么是纳什均衡?用什么是纳什均衡?用“划横线法划横线法”分别求解下表所示博弈的分别求解下表所示博弈的纳什均衡。纳什均衡。参与者参与者2策略策略X策略策略Y参与者参与者1策略策略A(1,4)(2,3)策略策略B(0,9)(8,7)参与者参与者2策略策略X策略策略Y参与者参与者1策略策略A(2,4)(2,6)策略策略B(3,3)(1