威胁承诺与动态博弈ppt课件.ppt

上传人:飞****2 文档编号:92522889 上传时间:2023-06-06 格式:PPT 页数:57 大小:338.50KB
返回 下载 相关 举报
威胁承诺与动态博弈ppt课件.ppt_第1页
第1页 / 共57页
威胁承诺与动态博弈ppt课件.ppt_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《威胁承诺与动态博弈ppt课件.ppt》由会员分享,可在线阅读,更多相关《威胁承诺与动态博弈ppt课件.ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、五、威胁、承诺与动态博弈1.博弈的基本分类(1)按照博弈各方是否同时决策,分为静态静态博弈和动态动态博弈。若局中人是同时行动同时行动,或者行动有前有后,但后行动者在决策时不知道先行动者的决策不知道先行动者的决策,是静态博弈;若局中人的行动有先有后,则为动态博弈。(2)按照参与人是否清楚各种情况下每个局中人的得益,分为完全信息博弈完全信息博弈和不完全信息博不完全信息博弈弈。两种分类方式结合起来,博弈可分为四个大的类型:静态静态动态动态完全信息完全信息不完全信息不完全信息完全信息静态博弈完全信息静态博弈完全信息动态博弈完全信息动态博弈不完全信息静态博弈不完全信息静态博弈 不完全信息动态博弈不完全信

2、息动态博弈2.博弈的描述方式(1)矩阵式 仅限于参与人只有两个两个或者三个三个的有限有限博弈博弈。如前面所讲的情侣博弈,博弈矩阵如下:(2)展开式(博弈树博弈树)大海足球芭蕾丽娟 足球芭蕾 1,2 -1,-1 0,0 2,1情侣博弈也可用展开式表述如下:足球芭蕾丽娟丽娟芭蕾足球芭蕾足球(1,2)(-1,-1)(0,0)(2,1)大海对情侣博弈的改变:假设大海先做出决策,之后丽娟看到大海的选择再决策,该博弈就变成了动态博弈。足球芭蕾丽娟丽娟芭蕾足球芭蕾足球(1,2)(-1,-1)(0,0)(2,1)大海3.作为完整行动方案的策略n策略策略与行动行动不同,策略是参与人相机行动方案相机行动方案,以动

3、态情侣博弈为例说明。n双方的行动集合相同 该博弈中供参与人选择的行动行动有两个,即芭蕾芭蕾或足球足球。n二者的策略不同:丽娟后行动,其策略应该是针对大海的选择而做的计划如果大海怎么样,我就怎么样的一个行动方如果大海怎么样,我就怎么样的一个行动方案。案。n因此,丽娟有四个策略:追随策略;对抗策略;芭蕾策略;足球策略n大海的策略 由于大海先行动,故其策略只有两个:芭蕾策略和足球策略。由上比较可见,策略与行动的不同。4.动态博弈的矩阵式表述 动态博弈不仅可以用博弈树博弈树来表述,也可以用矩阵式矩阵式表示。以动态情侣博弈为例,找出参与人的所有找出参与人的所有策略之后策略之后,就可以用矩阵式来表述了。大

4、海(F,F)(F,B)(B,F)FB丽娟 2,1 2,1 0,0-1,-1 1,2-1,-1(B,B)0,0 1,2 从上比较可以看出,动态博弈动态博弈适用于博弈树博弈树表示,静态博弈静态博弈适用于矩阵式矩阵式表示。n用划线法找出该博弈的NE.nNE有三个:大海(F,F)(F,B)(B,F)FB丽娟 2,1 2,1 0,0-1,-1 1,2-1,-1(B,B)0,0 1,2F,(F,F)F,(F,B)B,(B,B)5.逆向归纳法与子博弈精炼纳什均衡(SPE)逆向归纳法:当动态博弈用博弈树表示时,从最后一个做决策的参与人开始向前推,直至分析到第一个做决策的参与人为止,每一步找出参与人的最优选择。

5、所有参与人的最优策略组合就是子博弈精子博弈精炼纳什均衡(炼纳什均衡(SPE)。如下分析情侣博弈。n从丽娟开始分析,右侧,若大海选择芭蕾,丽娟选芭蕾最佳;左侧,若大海选择足球,丽娟选足球亦为最佳。n分析大海:选芭蕾,丽娟也会选芭蕾,支付为1;选足球,丽娟也会选足球,支付为2,大海选足球足球最佳。足球芭蕾丽娟丽娟芭蕾足球芭蕾足球(1,2)(-1,-1)(0,0)(2,1)大海6.威胁、承诺与SPEn 从情侣博弈中,可以看到SPE剔除了NE中不可置信的均衡。SPE的定义比NE更严格严格。n 大海作为先动者先动者,具有先动优势先动优势。那么,作为后动者后动者,是否可以通过策略策略来改变自己的命运呢?n

6、 威胁威胁对不肯与你合作的人进行惩罚的一种回应规则;n 承诺承诺对愿意与你合作的人提供回报的方式。n 下面举例加以说明。在下图中,有两个房地产开发商A和B分别决定在同一地段上开发一栋写字楼。由于市场需求有限,如果他们都开发,则在同一地段会有两栋写字楼,超过了市场对写字楼的需求,难以完全出售,空置房太多导致各自亏损1百万。当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润1百万。假定A先决策,B在看见A的决策后再决策是否开发写字楼。博弈过程可用博弈树表示:房地产开发博弈 房地产开发博弈A不开发开发BB开发不开发开发不开发(-1,-1)(1,0)(0,1)(0,0)n 在其中每一

7、条“路径”的末端用向量给出A和B的支付,称为支付向量。下面用“逆向归纳法”可以求解这个博弈。在B进行决策的2个“决策结”上,B在左边的决策结上选择“不开发”;而在右边的决策结上选择“开发”。即给定A开发,B就不开发;给定A不开发,B就开发。B应避免同时与A都选择开发而蒙受损失。n 在这种情况下,A在自己的决策结上当然选择“开发”,因为他预计当自己选择“开发”后,B会选择“不开发”,自己就净赚一百万。n 当B威胁A说:“不管你是否开发,我都会在这里开发写字楼。”倘若A将B的话当了真,A就不敢开发,让B单独开发写字楼占便宜。但是,B的威胁是的威胁是“不可置信不可置信”的的。当A不理会B的威胁而果断

8、地开发出一栋写字楼时,B其实不会将事前的威胁付诸实施。因为“识时务者为俊杰”,在A已开发的情况下,B的最优决策是“不开发”而不是“开发”。但是,如果B在向A发出威胁的同时又当当着着A的的面面与与第第三三者者C打打赌赌一定要在该地段上开发出一栋写字楼,否则输给C 2百万元。B与C为此签定合同并加以公证有效。这时,博弈变成如下所示的动态博弈。承诺行动后房地产开发博弈A不开发开发BB开发不开发开发不开发(-1,-1)(1,-2)(0,1)(0,-2)n 称B的这种行动为“承承诺诺行行动动”,它使原来不不可可置置信信的威胁变为可可以以置置信信。这时,A就不得不相信B一定要开发写字楼的威胁了,于是放弃开

9、发写字楼的计划,让B如愿以偿单独开发写字楼。B不仅未向C支付2百万元,反而净赚1百万。威胁与许诺改改变变了了对对手手对对你你的的看看法法,从而改变了博弈的结果。n 一垄断市场,垄断企业可卖高价每年赚10亿元。别的企业进入这个市场需要4亿元投资。当别的企业进入后,原有企业必须决策:或者“容忍容忍”进入,即收缩产量维持高价,双方利润均为5亿元;或者“抵抗抵抗”,即加大产量,降低价格,力图把进入者挤出去,双方利润均为2亿元。n 用博弈树表示如下:市场进入博弈n用逆推归纳法得出SPE为:进入者进入在位者容忍n在位者的“你一旦进入,我就降价抵抗”的威胁不可置信。n若你是在位者,你如和保持你的垄断地位?容

10、忍抵抗不进入进入(1,5)(-2,2)(0,10)进入者在位者对任性女儿的管教n假设父亲非常疼爱女儿,女儿也知道这一点,那么父亲对女儿的威胁“再再要跟他好,我就跟要跟他好,我就跟你断绝关系你断绝关系”是否可信?n假若父亲虽然很疼爱女儿,但更看重自己的面子,威胁可信吗?断不断不结婚结婚(1,-2)(2,-1)(-2,1)女儿 父亲要求老板加薪n你非常希望每年的薪水再多1万元,但老板凭什么给你加薪?你如何说服老板给你加你如何说服老板给你加薪?薪?n你的“不加薪就走人不加薪就走人”的威胁可信吗?如何使之变得可信?n向老板证明有一家公司愿意每年多花1万元聘用你;n使自己在本公司陷入一个非常尴尬的处境,

11、如果没有得到加薪,你无法在同事面前抬头,非走不可。委婉的拒绝加薪n 假设你是一位经理,你的员工对你非常重要,而且他们也清楚这一点,于是提出加薪的要求。在这场谈判中,你显然居于下风,如何拒绝又能保住他们呢?n 比如,你非常满意的秘书提出加薪,你如何拒绝?n 交出控制权交出控制权可帮你脱身困境n 海盗勒索 老师搪塞n 切断联系切断联系 1965年美国的监狱暴动,典狱长拒绝与犯人对话,该行为实际是昭告犯人,他不会做出让步。破釜沉舟与占岛断桥n项羽的“破釜沉舟”。n“占岛断桥”的经典:两国之间有一个无人的小岛,有桥梁分别通向两个国家。两国都想把小岛占为己有,但都不敢轻举妄动。一天,A国发现B国的士兵已

12、经驻扎在岛上,并且把通向自己方面的桥梁拆掉。A国明白,小岛已经是别人的了,因因为他们已经发出不会退却的信号。为他们已经发出不会退却的信号。n 破釜沉舟和占岛断桥实际上都是通过减少通过减少自己的选择以威慑对手的例子。自己的选择以威慑对手的例子。应该在什么时候诚实?n树立诚实的信誉诚实的信誉可以提高威胁和承诺的可信性n绑架、勒索与诚实 绑匪的目的:钱财,而不是杀人 父母的偏好:最好不舍钱财就能救人,但给了钱能救人也算不错。若预期绑匪不会放人,则无论如何也若预期绑匪不会放人,则无论如何也不会给钱。不会给钱。因此,除非绑匪能取信于人,才有办法捞到油水。n企业在重复做买卖时多半多半能诚实。特殊的,大订单

13、;得过且过的公司;发现欺骗行为的时间;客户对公司的重要性(即对欺骗的惩罚)欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自自由由竞竞争争精精神神而对与波音公司进行竞争的空中客车公司进行补贴。“欧洲空中客车”和“波音”的争斗 当双方都未获得政府的补贴时,两个公司都开发新型飞机会因市场饱和而亏损,但若一家公司开发而另一家公司不开发时,则开发的那家公司会获巨额 利润,见下表。未补贴时的博弈 空中客车 开发 不开发 开发 波音 不开发 -10,-10100,00,1000,0n 此时有两个纳什均衡,即一家开发而另一家不开发。下面,考虑欧共体对空中客车进行补贴20个单位的情况。此时,当两

14、家都开发时,空中客车仍然盈利10单位而不是亏损,博弈矩阵见下表。有补贴时的博弈 空中客车 开发 不开发 开发 波音 不开发 -10,10100,00,1200,0 这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡(不开发,开发),这有利于空中客车。在这里,欧共体对空中客车的补贴就是使空中客车一定要开发(无论波音是否开发)的威胁变得可置信的一种“承诺行动”。为何大人物、大公司要聘请常年律师?大人物、大公司对声誉十分看重,因而为一些不良人物或公司通过诽谤大人物、大公司企图迫使大人物、大公司花钱“私了”而获利。这是因为,尽管对于一些无端的指控,大人物、大公司可望通过法律手段(打官司)而

15、出清了结,但打官司请律师会增加他们额外的成本。如果能花稍少一些钱“私了”,则既使自己清白又省钱,同时诽谤者也获得收入。大人物、大公司为了避免这种无端的损失,干脆花钱请常年律师,律师费用已经一次性支付,打官司不会带来额外的花费。这是一个承诺行动,它告诉潜在的诽谤者,大人物、大公司一旦受到无端诽谤必定会让他们吃官司。这样,大人物、大公司因此承诺行动而使自己得到保护,避免了许多无端指控的发生。罪犯的补偿问题问题:能否让罪犯花钱购买宽大处罚?如有一个罪犯愿意用钱补偿受害人,以换取受害人放弃所有的控告。若受害人愿意的话,政府该不该同意?例子例子:假设你刚刚被劫,损失的财物只有30美元,但心理创伤很大,假

16、设为9000美元。现劫匪被抓,可能被判一年。可若你放弃控告,劫匪愿意补偿其身上所有的钱3000美元,你会如何选择?政府是否该干涉?n用逆推归纳法n劫匪知道一旦他抢劫你,你最后一定会放弃控告,因此,劫匪的优势策略是“抢”,故你放弃控告的行为实际上怂恿了劫匪,其会越来越嚣张。n那么,你的承诺“一定要把劫匪送去坐牢”可信吗?n只有政府出面以法律形式制止你接受罪犯的补偿。n宽恕就是怂恿宽恕就是怂恿90%抓不到10%抓到不抢 抢(30,-9030)(-,-9030)(0,0)罪犯 自然 你控告不控告(0,-6030)政府和制药公司之间的博弈n政府最有办法给公司带来很大的伤害,如政府无偿征用等。n药品的销

17、售价格往往高于制造成本,为什么?n制药业的沉没成本非常高n政府针对高价药的常用办法是要求制药公司降价,否则你就关门。n如果你是制药公司,你如何选择,是降价降价还是关门关门?n 假设一家制药公司研发并生产第一剂药品花了9900万元,而再生产第二剂药只需要1元钱,而且公司通过调查发现在未来50年内对这种药的需求量为100万剂。n制药公司卖100剂药,总成本为100万+9900万=1亿元,平均一剂药的成本为100元。假设公司定价为110元。n此时政府不满,要求你降价到50元,你是否接受?若制药公司预计到将来政府会对价格限制,则制药公司在最开始是否会研发新药?n不会n长期影响:新药越来越少,受苦的还是

18、老百姓。n艾滋病的防治控价不控价不研发 研发(-5,2)(1,0)(0,0)公司 政府n 你是老板,有10个雇员,每个雇员得到的工资减去工作的成本后净支付净支付如下:努力工作者 5000美元 懈怠者 10000美元 被开除者 0美元 你如何激励所有的雇员努力的为你工作呢?以一个威胁对抗多人n 若你顶多只能开除一个雇员(因为若开除的人数超过一个,公司就会无法生存),而且雇员也知道这一点,你如何激励他们呢?n 假设你随便选一个懈怠者开除,可能出现两种结果:每个人努力工作,没人敢偷懒,支付为5000美元;每个人都偷懒,被开除的概率为10%,期望支付为:90%*10000+10%*0=9000美元。于

19、是会出现集体偷懒的情况。那又如何激励呢?排序排序精神失常的收益n装疯卖傻可以提高威胁的可信性n若一个疯子以自杀威胁向每个路人要10元钱,他会成功吗?n理性为了追求更多的钱财,更高的支付。n市场进入博弈中,若在位者被认为是非理性的非理性的,则进入者不敢轻易进入,因为他怕在位者采取降价报复的行动,从而两败俱伤。这样,在位者就以非理性的身份保住了自己的垄断地位。n报复心强报复心强的人一般能给人以非理性的印象。进入门槛跳楼价可信吗?n如果你是在位者,你如何设置进入门槛,力保垄断地位呢?n威胁对手:你若敢进入,我就压低价格,使你血本无归。n你的威胁可信吗?n若你被对手认为是非理性非理性的,可能凑效。n若

20、你被认为是理性理性的,跳楼价能够成为威胁?n“鼓钱袋鼓钱袋”理论理论7.如何建立可信的威胁与承诺?n口头许诺不可信。制片人萨姆戈尔德温:“口头合同还不如把它记录下来的用的白纸值钱呢。”n建立可信度的三个原则原则和八正道八正道:(1)改变博弈的结果改变博弈的结果,即务必使遵守你的承诺成为符合你自身利益的选择。具体方法为:建立和利用一种信誉;写下合同;这两种手段都能使破坏承诺的代价高于遵守承诺的代价。(2)改变博弈改变博弈,使你背弃承诺的能力大受限制。最极端的做法莫过于剥夺自己反悔的机会,断绝一切反悔的后路,或者离开决策位置,听天由命。切断沟通;破釜沉舟;让后果超出你的控制;小步前进(把一个大承诺

21、分成许多小的承诺,违背其中的一个小承诺得到的利益不足以抵消失去余下承诺的损失)。(3)充分利用别人充分利用别人,帮助自己遵守承诺。比如,一个团队比单独一个人更容易建立可信度,或考虑雇佣其他人来做你的代表。通过团队合作建立可信度;雇佣谈判代理人。8.分“蛋糕”博弈n无论在日常生活、在商界还是在国际政坛,有关各方经常需要讨价还价或者谈判一个总收益应该如何谈判,这个总收益通常被称为“蛋糕蛋糕”。n人们心目中公平的的分配是怎样的呢?若两方来分,是不是一半对一半呢?如何做到对半分?n 讨价还价是一个谈判的过程,不同的谈判按照不同的规则不同的规则进行。但要认清楚两个特征:n谁对谁提出了什么条件;n如果各方

22、不能达成一个协定会导致什么后果。收益缩水:假如时间谈判越拉越长,谈判以分割的“蛋糕”就会开始缩水。这时,各方就必须掂量继续争取一个对自己更有利的结果的好处是否继续争取一个对自己更有利的结果的好处是否超过谈判的代价超过谈判的代价。在现实生活中,收益缩水的方式非常复杂,不同情况有不同的速度。不同情况有不同的速度。假设每等到提出一个新的建议或者反建议,蛋糕都会朝零的方向缩小同样的数目,或者假设讨价还价如何分割的是一个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化。一轮讨价还价:假设整个讨价还价就只有一步。桌子上放了一个冰淇淋蛋糕;小娟向小明提议应该如此分配。假如小明同意,他们按照成立的契约分享这个

23、蛋糕;假如小明不同意,蛋糕将完全融化,谁也得不到。假设你是小娟,你会提出何种分配方案对自己最有利?假设X1 表示小娟的份额,则小明的份额为(1-X1)。该博弈有无穷多个NE,但自利的小娟会提出(1,0)两轮讨价还价 假设两轮谈判过后,整个蛋糕就会完全融化。第一轮由小娟提出条件,小明可以接受,从而游戏结束,小明也可以不接受,则游戏进入第二轮,蛋糕只剩下1/2;第二轮由小明提出条件,小娟可以接受,从而游戏结束,也可以不接受,于是蛋糕完全融化,游戏同样结束。小娟又该如何提出分配方案?设Xi表示第i轮提出的小娟的份额。n左图简单的表示博弈过程,利用逆推归纳法分析。nX2=0nX1=1/2接受提出X2,

24、蛋糕只有1/2提出X1(X1,1-X1)(0,0)(0.5X2,0.5(1-X2)小娟 小明 小娟接受拒绝三轮讨价还价 假设三轮谈判过后,整个蛋糕就会完全融化。第一轮由小娟提出条件,小明可以接受,从而游戏结束,小明也可以不接受,则游戏进入第二轮,蛋糕只剩下2/3;第二轮由小明提出条件,小娟可以接受,从而游戏结束,也可以不接受,则游戏进入第三轮,蛋糕只剩下1/3;第三轮又由小娟提出条件,小明可以接受,从而游戏接受,也可以不接受,蛋糕完全融化,游戏也结束。N轮讨价还价nN=2n,则小娟应提出的方案为(1/2,1/2);nN=2,则小娟应提出的方案为((n+1)/(2n+1),(n-1)/(2n+1

25、));n总结:(1)漫长的多轮的谈判过程,谁第一个提出条件并不占有太大的优势;(2)结果是要么大家妥协,一半对一半,要么,双方僵持,最后谁也捞不着好处。9.海盗分金n 五个海盗抢到100颗宝石,这些宝石不可分割,他们决定按如下的方法分配:按抽签顺序为五个人排好序。先由1号海盗提出分配方案,其余的人进行表决,当且仅当半数和超过半数的人同意时,按1号提出的方案分配,否则将1号扔进大海喂鲨鱼;若1号被否决,则由2号提出,同样,若半数及其以上的人同意,则按2号的方法分配,否则扔进大海;再由三号提出。问第一个海盗应提出怎样的分配方案才能免于受死且获得的宝石最多?10.重复博弈n有限重复博弈 假设囚徒困境重复三次,局中人是否会联合起来,共同抵抗?n无限重复博弈 若囚徒困境重复无限次呢?冷酷战略、一报还一报(针锋相对)、一报还两报、两报还一报等连锁店悖论n 回顾市场进入博弈n假若在位者有20个市场(如不同的地理位置),则市场进入博弈会发生20次。在位者会为了保护其他的19个市场,而与第一个进入者进行激烈竞争吗?n结论:当阶段博弈只有一个NE时,则该博弈重复有限次,这个NE就重复出现有限次。但若重复无限次,则有可能出现NE之外的结果。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁