《博弈论第三章修改课件.ppt》由会员分享,可在线阅读,更多相关《博弈论第三章修改课件.ppt(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 完全且完美信息的动态博弈动态博弈:指的是博弈方的行动有先后次序,且后行动者能够观察到先行动者所选择的行动并在此基础上采取自己最有利的策略。完全信息的博弈:在一个博弈中,每一个博弈方都完全了解所有博弈方的在各种情况下得益的博弈。完美信息的动态博弈:在动态博弈中,若所有的博弈方在轮到自己行动时,对此前的全部过程完全了解。第一节 动态博弈的表示方法和特点 一、阶段和扩展形表示 阶段:在动态博弈中,一个博弈方的一次选择策略的 行为我们常称为一个阶段。在动态博弈中,各个博弈方的选择策略的行为有先后次序,所以动态博弈也称为序列博弈,或称之为多阶段博弈。二、扩展式表述是用博弈树来表述的。而博弈树是有
2、选择结点(信息集),终端结点以及树枝所组成的。其中,空心圆表示选择结点,实心圆表示终端结点,标注在博弈树终端结点下的是博弈方的得益函数;而直线表示博弈树的树枝,代表博弈方的一个选择。也就是:扩展式表示动态博弈,它包括选择结点,终端结点和树枝组成。扩展式表述例题例:有一个容量有限的市场已经被厂商A 抢先占领,而 另一个生产同样产品的厂商B 也想加入该市场发 展,分享一定的利润。厂商B 知道一旦自己进入该 市场先占领市场的厂商A 有可能通过降价等竞争手 段来打击自己,此时厂商B 不但不能赢利,而且肯 定还会亏损。例题的假定在这个“先来后到”博弈中,假设A 独占市场时利润为10个单位;与B 和平共处
3、分享市场则双方各得5个单位;如B 进入市场而A 进行打击,则B 要亏损2个单位,A 的利润则降为3个单位。我们可以用博弈的扩展式表述来表达。“现来后到”博弈的扩展式表示 B 进 A 不进 打击 和平(0,10)(-2,3)(5,5)注意:双方损益值中,第一个是先动一方的损益。“开发金矿”的博弈例:“开发金矿”的博弈 甲有一价值4万元的金矿,但缺1万元的开发资金,而乙正好有1万元资金可以投资。设甲想说服乙将这 一万元资金借给自己用于开发金矿,并许诺在采到 金子后与乙对半分成,试用动态博弈的扩展式表 示。“开发金矿”博弈表示一三阶段“开发金矿”博弈表示二(法律保证不足)三阶段“开发金矿”博弈表示三
4、(有法律保证)“仿冒和反仿冒”的博弈设有一家企业的产品被另一家企业仿冒,如果被仿冒企业采取措施制止,仿冒企业就会停止仿冒,如果仿冒企业不采取措施制止,那么仿冒企业就会继续仿冒。上述博弈有两个博弈方A,B,其中博弈方A 是仿冒企业,博弈方B 是被仿冒企业,并且假设仿冒最多进行两次。再假设第一次不仿冒,仿冒被制止以及第一次仿冒没被制止的情况下,第二次不仿冒,仿冒被制止和仿冒不被制止这几种情况下,写出它的扩展式表示。“仿冒和反仿冒”的扩展式表示博弈树所遵循的原则(1)每一个结点至多有一个其他结点直接位于它 的前 面。(2)在博弈树中没有一条路径可以使选择结点与自身 相连。(3)每个博弈树必须有初始结
5、点。(4)每个博弈树只有一个初始结点。三、动态博弈的策略动态博弈的策略:在整个的动态博弈中,各博弈方在每个阶段所选择的行为,以及针对前面的每个阶段的各种行为所做的相应选择的完整过程,称之为动态博弈中博弈方的一个策略。“仿冒和反仿冒”的扩展式表示三阶段“开发金矿”博弈表示二(法律保证不足)四、动态博弈的结果动态博弈的结果有三个含义:(1)指各博弈方由动态博弈的策略所构成的策略组合。(2)是各博弈方的策略组合形成的一条连接各个阶段 的路径。从动态博弈的扩展式图中来看,是指连接 博弈每个阶段的一条路径。(3)动态博弈的结果还包括实施上述策略组合的最终得 益。就是上述路径终端结点处得益数组的数字。“仿
6、冒和反仿冒”的扩展式表示三阶段“开发金矿”博弈表示二(法律保证不足)五、动态博弈的非对称性是指由于动态博弈中各个博弈方的选择行为有先后次序,且后行为者可以观察到此前选择行为博弈方的选择行为,因此动态博弈中各博弈方的地位是不对称的。第二节 动态博弈中的纳什均衡和可信性问题一、动态博弈中的纳什均衡纳什均衡的策略组合是指每一个博弈方的策略都是针对其他博弈方策略的最佳对策,各博弈方都不愿意改变策略的策略组合,具有一定的稳定性。动态博弈的纳什均衡分析例:“开发金矿的博弈”甲有一价值4万元的金矿,但缺1万元的开发资金,而乙正好有1万元资金可以投资。设甲想说服乙将这 一万元资金借给自己用于开发金矿,并许诺在
7、采到 金子后与乙对半分成,试用动态博弈的扩展式表 示。“开发金矿”的博弈表示(法律保证不足)“开发金矿”博弈(有法律保证)二、相机选择和策略中的可信性问题相机选择问题:在动态博弈中,对于博弈方在各个阶段针对各种情况所预先设定的策略,只要符合博弈方自己的利益,他们完全可以在博弈过程中改变预先设定的策略。我们称这种问题为动态博弈的相机选择问题。“开发金矿”博弈“开发金矿”博弈(有法律保证)第二节 动态博弈的分析方法-逆推归纳法 逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法。我们称之为逆推归纳法。“开发金矿”博弈(法律
8、保证不足)“开发金矿”博弈(有法律保证)逆推归纳法的例子一甲(2,0)(1,1)(0,2)上 乙 右 甲 后下 左 前(3,0)逆推归纳法的例子二有5个海盗抢来100枚金币,大家决定了下面分赃的方式:由海盗一提出一种分赃的方式,如果同意这种方式的人达到半数,那么该提议就通过并付诸实施;若同意这种方式的人未达到半数,则提议不能通过且提议人将被扔进大海喂鲨鱼,然后由接下来的海盗继续重复提议过程。假设海盗个个都非常聪明,也不互相合作,并且每个海盗都想尽可能多得到金币,那么,第一个提议的海盗将怎样提议既可以使得提议被通过又可以最大限度得到金币呢?逆推归纳法的总结(1)逆推归纳法就是把多阶段动态博弈化为
9、一系列 的单人博弈进行分析;(2)逆推归纳法是严格下策反复消去法在动态博弈中 的应用。(3)由逆推归纳法确定的各个博弈方在各阶段的选择都 是建立在后续阶段各个博弈方理性的基础上的,因 此自然排除了包含不可信的许诺;(4)逆推归纳法不适用于无限博弈和不完美信息博弈。第三节 子博弈完美纳什均衡 一、子博弈定义:由一个动态博弈的第一阶段以外的某阶段开始 的后续博弈所有阶段构成,有初始信息集和进 行博弈所需要的全部信息,能够自成一个博 弈,并且是原博弈的一部分,我们称之为原动 态博弈的一个“子博弈”。子博弈(1):“开发金矿”博弈例:在“开发金矿”的博弈中,虚线框中的部分满足 上述定义,因此是这个博弈
10、的“子博弈”。子博弈(2):“开发金矿”博弈子博弈的子博弈:称后面的这个子博弈为原博弈的“二级子博弈”。二、子博弈完美纳什均衡定义:在一个完美信息的动态博弈中,如果各博弈方的 策略构成的一个策略组合满足,在整个动态博弈 以及它的所有子博弈中都构成纳什均衡,那么,这个策略组合称为该动态博弈的一个“子博弈完 美纳什均衡”。求完美信息动态博弈的子博弈完美纳什均衡的最基本的方法就是我们已经介绍的逆推归纳法。“现来后到”博弈:子博弈完美纳什均衡 B 进 A 不进 打击 和平(0,10)(-2,3)(5,5)注意:双方损益值中,第一个是先动一方的损益。“仿冒和反仿冒”:子博弈完美纳什均衡三、几个经典的动态
11、博弈模型(1)寡占的斯塔克博格模型 该模型假设寡头市场有两个厂商1和2,其中厂商1较强而厂商2较弱,决策内容是确定他们各自的均衡产量,并且它们的产量决策是由较强的厂商1先进行选择,较弱的厂商2则根据较强的厂商2的产量选择自己的产量。其中,厂商1的产量为q1,厂商2的产量为q2,则市场上的总产量为Q=q1+q2。设上述总产量全部售出的价格为P=P(Q)=8-Q。(1)寡占的斯塔克博格模型(续)再设两厂商的生产都无固定成本,且每增加一单位产量的边际成本相等,c1=c2=2,即他们分别生产q1和q2单位产量的总成本分别为2 q1和2q2。试用逆推归纳法分析这个博弈,确定他们各自的均衡产量,并找出它的
12、子博弈完美纳什均衡。(2)里昂惕夫(Leontief)劳资模型 这个模型是里昂惕夫(Leontief)1964年提出的,博弈双方分别代表了劳资双方的工会和厂商之间的一种博弈模型。该博弈模型假定工资完全由工会决定,而厂商则根据工会要求的工资高低决定雇佣工人的数量 工会代表的劳方效用u应该是工资率W 和雇佣工人数L 两者的函数,即:u=u(W,L)。(2)里昂惕夫(Leontief)劳资模型(续)而厂商的效用直接用利润来表示,它是收益和成本之差。假定厂商的收益是劳动雇佣数量的函数R(L),再假定厂商只有劳动成本,这样,厂商的总成本为工资率乘以雇佣劳动数量W x L,假定工会和厂商之间的博弈过程是这
13、样的:先由工会决定工资率,然后厂商根据工会提出的工资率决定雇佣多少劳动力。假定工资率和雇佣数量都是连续可分的,因此博弈双方都有无限多的选择。试用逆推归纳法来分析博弈问题的子博弈完美纳什均衡。劳资模型的图示 讨论1:子博弈完美纳什均衡假设一个n个厂商的寡头垄断市场的需求函数为p(Q)=a-Q,其中Q 是它们的总产量。如果厂商的产出qi都等于雇佣的劳动力数量Li,并且除工资以外没有其他成本。再假设工会是所有厂商唯一的劳动力供给者。如果先由工会决定统一的工资率w,厂商看到w 后同时选择雇佣数量Li,工会的效用函数为(w-w0)(其中w0为工会成员到其他行业就业的收入,L=L1+L2+Ln为工会的总就
14、业水平)。求该博弈的子博弈完美纳什均衡。(3)三个回合的讨价还价模型 假设有两人就如何分享1万元现金进行谈判,并且已经定下如下的规则:首先由甲定下一个分割的比例,对甲提出的比例,乙可以接受也可以拒绝;如果乙拒绝甲的方案,则他自己必须提出另一个方案,让甲选择接受与否。在上述循环过程中,只要任何一方接受对方的方案,博弈就告结束,而如果方案被另一方拒绝,则被拒绝的方案与以后的讨价还价不再有关系。(3)三个回合的讨价还价模型 再假设上述博弈以每一次一方提出一个方案和另一方选择是否接受为一个回合,讨价还价每多进行一个回合,由于谈判费用和利息损失等,双方的利益都要打一个折扣(01,称 为消耗系数)。再假定
15、,上述讨价还价最多只能进行三个回合,到第三回合,乙必须接受甲的方案。试用逆推归纳法来分析博弈问题的子博弈完美纳什均衡。讨价还价模型的特点 上述博弈有两个特点:(1)第三回合甲的方案有强制力,这一点双方都是清楚 的。(2)该博弈每多进行一个回合,其双方的得益就会下降 一个比例,因此,谈判拖的越长,对双方都不利。讨价还价模型图示(4)无限回合的讨价还价模型 无限回合的讨价还价的博弈在第三回合并不会强制结束,只要双方互不接受对方的出价方案,则博弈就要不断的进行下去,其中奇数回合由甲出价乙选择是否接受,偶数回合由乙出价甲选择是否接受。在无限回合的讨价还价的博弈中更有必要有一个消耗系数。在1984年,夏
16、克德(SHAKED)和萨顿(SUTTON)提出了解决这个博弈问题的一个思路,其主要的内容是:对于一个无限回合博弈来讲,无论是从第三回合开始,还是从第一回合开始,其最终结果应该是一样的。无限回合的讨价还价模型的图示 无限回合的讨价还价博弈 与其等价的三回合的讨价还价的博弈 讨论2:子博弈完美纳什均衡有两个人分一块冰激凌。A 先提出一个分割比例,B可以接受也可以不接受,接受则按A 的提议分割,若拒绝,就要提出新的分割比例。但此时,冰激凌已化得只剩1/2 了。对B 的提议,A 可以接受也可以拒绝,若接受则按B 的提议分割,若拒绝则冰激凌会全部化光。求该博弈的子博弈完美纳什均衡。讨论3:子博弈完美纳什
17、均衡某人正在打一场官司,不请律师肯定会输,请律师的结果与律师的努力程度有关。假设当律师努力工作(100小时)时有50%的概率能赢,律师不努力工作(10小时)则只有15%的概率能赢。如果诉讼获胜可得到250万元的赔偿,失败则没有赔偿。因为委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可以获赔偿金额的10%,失败则律师一分钱也得不到。如果律师的效用函数为m-0.05e,其中m 是报酬,e 是努力的小时数,且律师有机会成本5万元。试用动态博弈的方法分析这个博弈,并求这个博弈的均衡。第四节 有同时选择的动态博弈模型一、标准模型(1)博弈中有四个博弈方,分别称为博弈方1,博弈方 2,博弈
18、方3,博弈方4。(2)第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的策略空间A1,A2中分别选择a1和a2。(3)第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择a1和a2以后,他们同时在各自的策略空间A3,A4中分别选择a3和a4。(4)上述各博弈方的得益ui 都取决于所有博弈方的策略a1,a2,a3和a4,即博弈方i(i=1,2,3,4)的得益是各个博弈方所选择策略的多元函数ui=ui(a1,a2,a3,a4)二、间接融资和挤兑模型设一家银行为了给一个企业放一笔一年期20000元的贷款,准备以20%的年利率吸引两个储户的存款。若两个储户各有10000元资
19、金,如果他们把资金作为1年期的定期存款存入该银行,那么银行就可以向企业贷款。如果两个储户都不愿意存款或只有一个储户存款,那么银行就无法给上述企业贷款,此时这两个储户都能保住自己的本金。在两个储户都存款,从而银行给上述企业提供贷款的情况下,如果银行满1年收回贷款,企业就能完成一笔生意,同时银行也可收回贷款本息支付储户的存款本息。二、间接融资和挤兑模型(续)但如果在不满1年的时候,一个储户单独或两个储户同时要求提前取出存款,银行就不得不提前收回贷款,企业的生意就无法完成,此时假设企业只能收回80%的本钱,并全部偿还给银行。若是一个储户要求提前取款,则银行会偿还其全部本金,余款则属于另一个储户;若两
20、储户同时要求提前取款,则平分收回资金。为了简单起见,我们假设银行不收任何佣金,手续费。试用动态博弈的分析方法来分析上述博弈。三、国际竞争和最优关税假设有两个相似的国家,我们分别称他们为国家1和国家2,这两个国家在本博弈中作为博弈方,决定本国进口商品的关税税率。假设两国国内各有一个企业(可以看作是两国国内企业的联合体)生产同一种既内销又相互出口的商品,我们分别称他们为企业1和企业2(我们也可以把模型中的两个国家理解为两个相互隔离的市场,两国的消费者在各自的国内市场上既可以购买国货,也可以购买进口货,国货和进口货是可以相互替代的)。三、国际竞争和最优关税(续)如果用Qi(i=1,2)表示国家1和国
21、家2在各自国内市场上此种商品的总量,则该市场的市场出清价格(商品全部售出的价格)为Pi(i=1,2)=Pi(Qi)=a-Qi(i=1,2)。假设企业i(i=1,2)生产hi(i=1,2)的产品供内销,ei(i=1,2)供出口。再假设两企业的边际生产成本同为常数c,且都无固定成本,则企业i(i=1,2)生产总成本为c(hi+ei)。当企业存在出口时,国家i 的关税税率为tj(j=1,2)。三、国际竞争和最优关税(续)假设先由两国政府同时制定关税税率t1和t2,然后企业1和企业2根据t1和t2同时决定各自的内销和外销的数量h1,e1和h2,e2。这就是一个两阶段都有同时选择的四方动态博弈(其中在第
22、一阶段决定关税税率的两个国家相当于标准模型中的博弈方1和博弈方2,在第二阶段决定内销和外销的数量的两个企业相当于标准模型中的博弈方3和博弈方4)。试用动态博弈的分析方法来分析上述博弈。四、逆推归纳法存在的问题(1)首先逆推归纳法只能分析明确设定的博弈问题,要 求博弈的结构,包括次序,规则和得益情况等都非 常清楚,并且各个博弈方了解博弈结构,相互知道 对方了解博弈结构。(2)其次逆推归纳法也不能分析比较复杂的动态博弈。(3)使用逆推归纳法分析某些博弈问题时,有时会遇 到两条路径得益相同的情况。四、逆推归纳法存在的问题(续)(4)逆推归纳法最大的问题是对博弈方的理性要求太 高,不仅要求所有的博弈方都有高度的理性,不允 许博弈方犯任何错误,而且要求所有博弈方相互了 解和信任对方的理性,对理性(个体理性,集体理 性,风险偏好)有相同的理解。四、逆推归纳法存在问题的例子例:下图是一个三阶段的动态博弈,试用逆推归纳法来 分析这个动态博弈。讨论:逆推归纳法存在问题的例子例:非理性的博弈:下图是动态博弈,试用逆推归纳法 来分析这个动态博弈。