《均衡(博弈论与信息经济学-中科院,张玲玲)fgcr.pptx》由会员分享,可在线阅读,更多相关《均衡(博弈论与信息经济学-中科院,张玲玲)fgcr.pptx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、博弈论与信息经济学(Game Theory and Information Economics)张玲玲中国科学院研究生院管理学院主要内容简介第一章 概述-人生处处皆博弈n 第一篇 非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡第三章 完全信息动态搏弈-子博弈精炼纳什均衡第四章 不完全信息静态博弈-贝叶斯纳什均衡第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n第二篇 信息经济学 第六章 委托-代理理论(I)第七章 委托-代理理论(II)第八章 逆向选择与信号传递 主要内容简介第四章 不完全信息静态博弈-贝叶斯纳什均衡n 一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不
2、完全信息静态博弈的战略式表述和贝叶斯纳什均衡n 二 贝叶斯纳什均衡应用举例n 三 贝叶斯纳什均衡与混合战略均衡n 四 机制设计理论与显示原理不完全信息博弈-无法避免的不确定性 有一次,主人派伊索进城。半路上,他遇见一位法官。法官严厉地盘问:“你要去哪儿?”“不知道”伊索回答说。法官起了疑心,派人把伊索关进了监狱,严加审问。“法官先生,要知道,我讲的是实话。”伊索说,“我确实不知道我会进监狱”。不完全信息博弈n 我们不可能料事如神,也无法掌握所有变因,更无力预测未来,不确定性就象缴税一样不可避免。n 这里主要探讨如何在不确定性的情况下做出理性、一致的决策,换句话说,首先必须承认自己虽然没有办法做
3、到无所不知,但也不至于一无所知,而应该或尽可能有效运用自己所知的一切为自己谋利。不完全信息博弈“空城计”街亭失守,司马懿引大军蜂拥而来,当时孔明身边只有一班文官,军士一半已经运粮草去了,只有2500军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城上敌楼前凭栏而望,焚香操琴。不完全信息博弈 司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌,犹豫再三,难下决断。又接到远山中可能有埋伏的情报,于是叫后军做前军,前军做后军,急速退去。司马懿之子司马昭问:
4、“莫非诸葛亮无军,故做此态,父何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏,我兵若进,必中计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险,疑有伏兵,所以退去。吾非行险,盖因不得已而用之,弃城而去,必为之所擒。”不完全信息博弈n 分析这个博弈n 参与人n 行动n 战略n 支付n 画出这个博弈的战略式或扩展式表述不完全信息博弈-信息的重要性被擒,?不被擒,?被擒,?不被擒,?司马懿诸葛亮弃城守城进攻撤退司马懿:兵多将广,但不知道自己和对方在不同行动策略下的支付;诸葛亮:处于劣势,但知道博弈的结构,比对方掌握更多的信息。计策:使用各种
5、手段迷惑司马懿,为的是不让对方知道其策略的结果(支 付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主 观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。司马懿关于自己策略的支付的信息是不完全的。不完全信息博弈 在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的期望效用或支付最大。如让你在50%的概率获得100元与10%的概率获得200元两者之间选择的话,前者的期望所的是50元,后者是20元,故选前者。不完全信息博弈100,100-50,00,0 0,0不接受求爱者求爱不求爱接受100,-100-50,0
6、0,0 0,0不接受你求爱者求爱不求爱接受你100 x+(-100)(1-x)=0当x大于1/2时,接受求爱求爱博弈:品德优良者求爱求爱博弈:品德恶劣者求爱 被求爱者对于求爱者的品德的信息是不完全的。4000,4000 8000,00,8000 0,0不开发开发商A开发不开发开发-3000,-3000 1000,00,1000 0,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况房地产开发博弈不完全信息博弈 市场需求信息是不完全的。-3,-3-3,-3 1,0 1,00,1 0,0 0,1 0,0默许 斗争 默许斗争进入不进入在位者市场进入博弈:不完全信息进入者高成本情况
7、低成本情况不完全信息博弈 进入者关于在位者成本信息是不完全的。进入者的最优选择依赖于他在多大程度上认为在位者是低成本的。n 假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p),那么,进入者选择进入的期望利润是p(40)+(1-p)(-10),选择不进入的利润是0,因此,进入者的最优选择是:如果p=1/5,进入,如果p1/5,当p=1/5时,进入与不进入是无差异的,我们假定其进入。不完全信息博弈n 在生活中我们也会碰到这样的问题,比如一个乞丐向你乞讨,你愿意帮助别人,但不知道他是真的乞丐还是骗子,该如何决定呢?如果你喜欢与人为善,你可能愿意冒一点上当的危险,这不等于你愚蠢,而是你认
8、为,帮助一个困境中的人比回绝一个骗子更重要。不完全信息博弈v 不完全信息:每一个参与人对所有其他参与人的(对手)的特征、战略空间及支付函数有准确的 知识,否则为不完全信息。类似上述情况称为不完全信息博弈,即在不完全信息博弈中,至少有一个参与人不知道其他参与人的支付函数。第四章 不完全信息静态博弈-贝叶斯纳什均衡n 一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡n 二 贝叶斯纳什均衡应用举例n 三 贝叶斯纳什均衡与混合战略均衡n 四 机制设计理论与显示原理海萨尼转换-3,-3-3,-3 1,0 1,00,1 0,0 0,1 0,
9、0默许 斗争 默许斗争进入不进入在位者市场进入博弈:不完全信息进入者高成本情况低成本情况 进入者似乎在与两个在位者博弈,一个是高成本的在位者,一个是低成本的在位者;如果在位者有T种不同的成本函数在位者就相当于与T个不同的在位者博弈。1976年以前,博弈论专家认为这样的不完全信息是没法分析的。海萨尼转换n 海萨尼在1967-1968年提出了一个处理不完全信息的方法-引入一个虚拟的参与人“自然”,自然首先行动,选择决定参与人的特征(如成本函数),参与人知道自己的特征,其他参与人不知道。这样不完全信息博弈就转换为完全但不完美信息博弈,可以利用标准的分析技术进行分析,这就是“海萨尼转换”。N高低P1-
10、P不进入进入 不进入进入BB合作 斗争 合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)海萨尼转换n 类型:一个参与人拥有的所有的个人信息(即所有不是共同知识的信息)称为他的类型。n 根据这个定义,甚至允许参与人不知道其他参与人是否知道自己的类型。例如:市场进入博弈:在位者不知道进入者是否知道自己是高成本还是低成本,只知道进入者有p的概率知道自己的成本函数,(1-p)的概率不知道自己的成本函数。这种情况下,进入者也有两种类型:知道(在位者的成本)或不知道(在位者的成本)。例如:在谈判中,甲方知道自己是强硬派或妥协派,乙方知道自己
11、是否知道甲方是强硬派或妥协派,但甲方不知道乙方是否知道自己是强硬派还是妥协派,则甲方有两种类型:强硬派或妥协派,乙方有两种类型:知道或不知道。n 不完全信息意味着,至少有一个参与人有多个类型。真正的“信息不对称”n 一个古董商发现一个人用珍贵的茶碟做猫食碗,于是假装对这只猫很感兴趣,要丛主人手里买下,主人不卖,为此古董商出了大价钱。成交之后,古董商装做不在意地说:这个碟子它已经用惯了,就一块送给我吧。猫主人不干了:你知道用这个碟子,我已经卖了多少只猫了?n 如果参与人i的类型只包含一个元素,即每个参与人只有一种类型,则该博弈退化为完全信息静态博弈,即完全信息静态博弈是完全信息动态博弈的特例。海
12、萨尼转换n 设i表示参与人i的一个特定的类型,根据海萨尼公理:假定参与人类型的分布函数P(1,n)是所有参与人的共同知识,所有参与人知道P(1,n),所有参与人知道所有参与人知道P(1,n),如此等等。这意味着在进入市场的博弈中,如果进入者有一种类型,在位者有两种类型,那么p是共同知识,即进入者知道在位者是高成本的概率是p,进入者知道在位者知道进入者知道在位者是高成本的概率是p,如此等等,即在博弈开始时,所有参与人有关自然行动的信念(belief)是相同的。练习-将下列博弈进行海萨尼转换100,100-50,00,0 0,0不接受求爱者求爱不求爱接受100,-100-50,00,0 0,0不接
13、受你求爱者求爱不求爱接受你求爱者品德优良的概率是p求爱博弈:品德优良者求爱求爱博弈:品德恶劣者求爱 被求爱者对于求爱者的品德的信息是不完全的。第四章 不完全信息静态博弈-贝叶斯纳什均衡n 一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡n 二 贝叶斯纳什均衡应用举例n 三 贝叶斯纳什均衡与混合战略均衡n 四 机制设计理论与显示原理不完全信息静态博弈-贝叶斯纳什均衡n 在不完全信息静态博弈中,所有参与人同时行动,其战略空间等于行动空间,但是参与人i的行动空间可能依赖于其类型,也就是行动空间是类型依存的。类似的,其支付函数也是类型依
14、存的。如企业能选择什么产量依赖于它的成本函数,一个人能干什么依赖于它的能力等。n 贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展,不完全信息静态博弈又叫做静态贝叶斯博弈。不完全信息静态博弈-贝叶斯纳什均衡n 静态贝叶斯博弈的时间顺序为:1、自然选择类型向量,参与人i能观测到自己的类型,但参与人j只知道除i之外所有参与人类型,但不知道参与人i的类型。2、n个参与人同时行动;3、参与人i得到类型依存支付函数。给定参与人i只知道自己的类型而不知道其他参与人的类型,参与人i将选择使自己的效应最大化的期望效用。贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略
15、组合,其中每个参与人i在给定自己的类型i和其他参与人类型依存战略的情况下,最大化自己的期望效用。N高低P1-P不进入进入 不进入进入BB合作 斗争 合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)市场进入博弈n在市场进入的例子里,均衡战略是:高成本的在位者选择默许,低成本的在位者选择斗争。只有当高成本的概率p=1/5时,进入者才选择进入,否则不进入。第四章 不完全信息静态博弈-贝叶斯纳什均衡n 一 不完全信息静态博弈和贝叶斯纳什均衡 不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡n 二 贝叶斯纳什均衡
16、应用举例n 三 贝叶斯纳什均衡与混合战略均衡n 四 机制设计理论与显示原理不完全信息库诺特模型企业1企业2v参与人:企业1、企业2;v行动顺序:同时行动v不完全信息:企业1单位成本c1是共同知识,企业2的成本可能是c2l或c2h,企业1只知道c2=c2l的可能性是1/2,这是共同知识。n不完全信息库诺特模型n qi:第i个企业的产量n Ci:代表第i个企业的成本n 假定逆需求函数为:n 第i个企业的利润函数为:企业1 企业2n 假定a=2,c1=1,c2l=3/4,c2h=5/4。n 给定企业2知道企业1的成本,企业2将选择q2最大化利润函数:n t=a-c=a-3/4=5/4或t=a-5/4
17、=3/4n 依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为:企业1 企业2不完全信息库诺特模型不完全信息库诺特模型 也就是说,企业2的最优产量不仅依赖于企业的产量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最优产量,q2h为t=3/4时企业2的最优产量。那么,q2l=1/2*(5/4-q1);q2h=1/2*(3/4-q1)企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h,因此企业1将选择q1最大化下列利润函数:不完全信息库诺特模型n 最优化一阶条件得企业1的反应函数为:是企业1关于企业2产量的期望值 均衡意味着两个反应函数同时成立,解两个
18、反应函数得贝叶斯均衡为:将计就计-真正的“信息不对称”n 一个古董商发现一个人用珍贵的茶碟做猫食碗,于是假装对这只猫很感兴趣,要丛主人手里买下,主人不卖,为此古董商出了大价钱。成交之后,古董商装做不在意地说:这个碟子它已经用惯了,就一块送给我吧。猫主人不干了:你知道用这个碟子,我已经卖了多少只猫了?将计就计-掌握的正确信息越多,获胜的可能就越大n 有一个卖草帽的人,有一天叫卖归来,在一棵大树旁打起了瞌睡,等他醒来的时候,发现身边的帽子都不见了,抬头一看,树上有很多猴子,模仿人的样子把帽子戴在头上,他想到猴子喜欢模仿人的动作,就拿下自己的帽子扔在地上,猴子也学他,纷纷将帽子扔在地上。于是卖帽子的
19、人检起帽子回家去了,并将这个故事告诉了他的子孙。n 很多年后,他的孙子继承了卖帽子的家业,有一天,他也在大树旁睡着了,而帽子也同样被猴子拿走了,他想起爷爷的办法,拿下帽子扔在地上。可是猴子非但没有照他的做,还把扔在地下的帽子也拣走了,临走时还说:我爷爷早告诉我了,你这个老骗子要玩什么把戏。著名的BF实验-如果我们根本不能从别人那里得到有用的信息,怎么办?n 把几只蜜蜂和几只苍蝇放进一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗户,结果会怎样呢?你会看到,蜜蜂不停地在瓶底寻找出口,直到累死为止,而苍蝇则在不到两分钟内全部逃出。为什么呢?因为蜜蜂喜欢光亮而且有智力,于是他们坚定的认为,出口一定在有光亮
20、的地方,于是他们不停地重复这一合乎逻辑的行为。而苍蝇呢?它们对事物的逻辑毫不在意,而是到处乱飞,探索有可能出现的任何机会,于是他们成功了。n 实验、试错、冒险、即兴发挥、迂回前进、混乱、随机应变,所有这些都有助于应付变化,要善于打破固定的思维模式,要有足够的探索未知领域的学习能力。如何甄别信息的真伪?n 索罗门王断案将计就计-练习 在三国演义第45-46回中,周瑜伪造假降书,诱骗曹操杀了蔡瑁、张允二将,曹操遂派蔡中、蔡和两兄弟假装降周瑜,去土获取东吴情报,周瑜识破曹操的诡计,将计就计,对黄盖施以苦肉计,如何将这一故事模型转化为一个不完全信息博弈?或者,不完全信息博弈是否就是将计就计?练习n 自然决定支付矩阵如下所示,概率分别为x和1-x,参与人1知道自然选择了a还是b,但参与人2不知道,参与人1和2 同时行动。n 给出这个博弈的扩展式表述并求纯战略贝叶斯纳什均衡。1,1 0,00,0 0,0R参与人1TBL0,0 0,00,0 2,2R参与人2参与人1TBL参与人2