《博弈论非常好的讲解ppt课件.ppt》由会员分享,可在线阅读,更多相关《博弈论非常好的讲解ppt课件.ppt(308页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。博弈论与信息经济学博弈论与信息经济学Game Theory and Economics of Information“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。博弈论基本思想博弈论基本思想人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/ /员工,教授等。类似的博弈也在商业活动、政治和外交事务、战争中进行
2、着在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学, 心理学和哲学。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。如何在“博弈”中获胜?日常生活中的博弈(“游戏”)往往指的是诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/ /橄榄球How can you win such games?许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。它是对于如何最好地利用身体(
3、物质)的技巧的一种算计。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。什么是策略博弈?What is a Game of Strategy? 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、对同一情形也在进行类似的思考。 博弈论就是用来分析这样交互式的决策的。 理性的行为指的是:明白自己的目的和偏好,同时了解自己行动的限制和约束,然后以精心策划的方式选择自己的行为,按照自己的标准做到最好。 博弈论对理性的行为又从新的角度赋予其新的含义与其他同样具有理性的决策者进行相互
4、作用。 博弈论是关于相互作用情况下的理性行为的科学。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。如何在博弈中获胜? 真的能在博弈中(总是)获胜吗?对手和你一样聪明! 许多博弈相当复杂,博弈论并不能提供万无一失的应对办法。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例1:无谓竞争(The GPA Rat Race)你所注册的一门课程按照比例来给分:无论卷面
5、分数是多少,只有4040的人能够得优秀,4040的人能得良好。所有学生达成一个协议,大家都不要太用功,如何?想法不错,但无法实施! !稍加努力即可胜过他人,诱惑大矣。问题是,大家都这么做。这样一来,所有人的成绩都不比大家遵守协议来得高。而且,大家还付出了更多的功夫。正因为这样的博弈对所有参与者存在着或大或小的潜在成本,如何达成和维护互利的合作就成为一个值得探究的重要问题。存在双赢的博弈吗?“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例2 2:焦点博弈 “We Cant Ta
6、ke the Exam,Because We Had a Flat Tire”两个学生想要推迟考试,谎称由于返校途中轮胎漏气,未能很好地备考。教授分别对他们提出了问题:“哪个轮胎漏气?”?”如何应答?他们本应该预计到教授的招数,提前准备好答案。在博弈中,参与者应该向前看到未来的行动,然后通过向后推理,推算出目前的最佳行动。如果双方都没有准备,他能够独立地编出一个相互一致的谎言吗?“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例2 2:焦点博弈 “We Cant Take th
7、e Exam,Because We Had a Flat Tire”“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你的朋友是否使用同样的逻辑,或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然;反之,是否她认为这一选择对你同样显然。以此类推。也就是说,需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例2 2:焦点博弈 “We Cant Ta
8、ke the Exam,Because We Had a Flat Tire”我们无法从所有这样的博弈的结构中找到一般和本质的东西,来保证这样的收敛。某些博弈中,由于偶然的外因可以对策略贴标签,或者参与者之间拥有某些共同的知识体验,导致了焦点的存在。没有某个这样的暗示,默契的合作就完全不可能。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例3:为什么教授如此苛刻?许多教授强硬地规定,不进行补考,不允许迟交作业或论文。教授们为何如此苛刻?如果允许某种迟交,而且教授又不能辨别真伪
9、,那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法,就是“没有例外”的策略。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例3:为什么教授如此苛刻?问题是,一个好心肠的教授如何维持如此铁石心肠的承诺?他必须找到某种使拒绝变得强硬和可信的方法。拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声誉导论博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者博弈论的基本概念与类型主要参考文献导论一、博弈均衡与一般均衡
10、“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 案例:囚犯困境案例:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。与传统微观经济学的比较与传统微观经济学的比较一致性利益最大化原则均衡原则不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性
11、信息不完全-委托-代理理论、信号传递与信息筛选模型导论二、博弈论与诺贝尔经济学奖获得者“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。1994年诺贝尔经济学奖获得者美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综
12、治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。约翰约翰纳什纳什1928年生于美国年生于美国约翰约翰海萨尼海萨尼19201920年年生于美生于美国国莱因哈莱因哈德德泽泽尔腾,尔腾,19301930年年生于德生于德国国“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。1996年诺贝尔经济学奖获得者英国人詹姆斯莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey) 获奖理
13、由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。詹姆斯詹姆斯莫里斯莫里斯19361936年生于英国年生于英国威廉维克瑞,1914-1996,生于美国“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。2001年诺贝尔经济学
14、奖获得者三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。约瑟夫斯蒂格利茨,1943年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授乔治阿克尔洛夫1940年生于美
15、国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学经济学教授。迈克尔斯彭斯1948年生于美国的新泽西,1972年获美国哈佛大学博士头衔,现兼任美国哈佛和斯坦福两所大学的教授。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。2005年诺贝尔经济学奖获得者以罗伯特奥曼色列经济学家罗伯特奥曼(Robert J. Aumann)和美国经济学家托马斯谢林(Thomas Thomas C. SchellingC. Schelling) 获奖原因:“通过博弈论分析加强
16、了我们对冲突和合作的理解”所作出的贡献而获奖。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 罗伯特奥曼 托马斯谢林导论三、博弈论的基本类型“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。合作博弈与非合作博弈合作博弈(cooperative game) 达成有约束力的协议(binding agreement),强调团体理性,强调效率、公正、公平非合作博弈(n
17、on-cooperative game) 强调个人理性,其结果可能有效率,也可能无效率。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。纳什均衡(纳什均衡(NENE)子博弈完美纳什子博弈完美纳什均衡(均衡(SPNESPNE)贝氏纳什均衡贝氏纳什均衡(BNEBNE)完美贝氏纳什均衡完美贝氏纳什均衡(PBNEPBNE)及序贯均及序贯均衡(衡(SESE)完全信息 不完全信息静态动态非合作博弈的基本分类非合作博弈的基本分类“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平
18、台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。静态博弈与动态博弈(static games and dynamic games)同时决策或者同时行动的博弈属于静态博弈;先后或序贯决策或者行动的博弈,属于动态博弈即使决策或行动有先后,但只要局中人在决策时都还不知道对手的决策或者行动是什么,也算是静态博弈“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。完全信息博弈与不完全信息博弈(games of complete infor
19、mation and games of incomplete information)按照大家是否清楚对局情况下每个局中人的得益。“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识(common knowledge)。据“共同知识”的掌握分为完全信息与不完全信息博弈。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。完美信息博弈与不完美信息博弈(games with perfect information and games with imperfect informa
20、tion)是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。如果在博弈进行过程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈;否则位不完美信息。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。零和博弈与非零和博弈(zero-sum game and non-zero-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫
21、零和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。零和博弈是利益对抗程度最高的博弈。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。常和博弈与非常和博弈(constant-sum game and variable-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。常和
22、博弈也是利益对抗程度最高的博弈。非常和(变和)博弈蕴含双赢或多赢。导论四、主要参考文献“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。张维迎著,博弈论与信息经济学,上海三联书店、张维迎著,博弈论与信息经济学,上海三联书店、上海人民出版社,上海人民出版社,19961996年版。年版。Roger B. Myerson著:Game Theory(原文版、译文版),中国经济出版社,2001年版。王则柯、李杰编著,博弈论教程,中国人民大学出版社,2004年版。艾里克.拉斯缪森(Eric
23、Rasmusen)著,博弈与信息:博弈论概论,北京大学出版社,2003年版。因内思马可-斯达德勒,J.大卫佩雷斯-卡斯特里罗著,信息经济学引论:激励与合约,上海财经大学出版社,2004年版。施锡铨编著,博弈论上海财大出版社,2000年版。谢识予编著,经济博弈论,复旦大学出版社,谢识予编著,经济博弈论,复旦大学出版社,20022002年版。年版。谢识予主编,经济博弈论习题指南,复旦大学出谢识予主编,经济博弈论习题指南,复旦大学出版社,版社,20032003年版。年版。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网
24、应用为重点的“群众性治安防控工程”。课程主要内容第一章 完全信息静态博弈第二章 完全信息动态博弈第三章 不完全信息静态博弈第四章 不完全信息动态博弈第五章 委托-代理理论第六章 逆向选择与信号传递第一章 完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节 博弈论的基本概念与战略式表述“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。博弈论的基本概念与战略式表述博弈论(game theory)是研究决策主体的行为发生直
25、接相互作用时候的决策以及这种决策的均衡问题。博弈的战略式表述:G=N,(Si)iN,(Ui)iN有三个基本要素:(1)参与人(players)iN=1,2,n ;(2)战略(strategies),siSi(战略空间);(3)支付(payoffs),ui=ui(s-i,si)。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 案例案例1 1:囚犯困境:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A“雪亮工程是以区(县)、乡(镇)、村(社区)三级
26、综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)第二节 纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。完全信息静态博弈的几点特性完全信息静态博弈的几点特性 同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的 承诺(非合作) “雪亮工程是以区(县)、乡(镇)、
27、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。定义:在博弈G=N,(Si)iN,(Ui)iN中,如果对所有的参与人i,si*是它的占优战略,那么所有参与人选择的战略组合(s1*,sn*)成为该对策的占优战略均衡。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 案例案例1 1:囚犯困境:囚犯困境抵赖坦白抵赖-1,-1-9,0
28、坦白0,-9-6,-6支付嫌疑人B嫌疑人A“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“囚犯困境” 的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革 结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。价格大战低价高价低价3,36,1高价1,65,5支付百事可乐可口可乐“雪亮工
29、程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。案例2:智猪博弈 猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、
30、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 案例案例2 2:智猪博弈:智猪博弈按等待按5,14,4等待9,-10,0支付小猪大猪“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以
31、公共安全视频监控联网应用为重点的“群众性治安防控工程”。二、重复剔除的占优战略均衡绝对劣势战略:si是一绝对劣势战略当且仅当存在另一战略siSi使得ui(si,s-i) ui(si,s-i) 对所有s-iS-i均成立。( si 未必是优势战略)重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 例:重复剔除的占优战略均衡例:重复剔除的占优战略均衡2,30,23,41,12,74,5 参与人2 L M R参与人1UD“
32、雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例 重复剔除的占优战略均衡4,35,16,22,18,43,63,09,62,8 参与人2L M R参与人1UDM“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例 重复剔除的占优战略均衡1,01,33,00,20,13,00,22,45,3 参与人2L M R参与人1UDM“雪亮工程是以区(县)、乡(镇)、村(社区
33、)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。三、纳什均衡纳什均衡定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s1*,sn*)=(si*,s-i*)是一纳什均衡,当且仅当对所有参与人而言,ui (si*,s-i*) ui (si,s-i*)对所有siSi 均成立。简单而言,当s1*是对s2*的最适反应,s2*也是s1*的最适反应时,(s1*,s2*)就是二人博弈的纳什均衡。命题1:纳什均衡在占优战略重复剔除解法中不会被剔除命题2:重复剔除的严格占优战略均衡一定是纳什均衡。
34、“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例 纳什均衡求解0,44,05,34,00,45,33,53,56,6 参与人2L M R参与人1UDM“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。作业7,76,67,65,75,88,56,65,84,8 乙 左 中 右上中下甲一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?第
35、三节 纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。一、古诺寡头模型特点:存在两家厂商;同时行动确定产量。通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。厂商1表示为:max p(y1+y2e)y1-c(y1),得出y1=f1(y2e),同理得出y2=f2(y1e),称为反应函数,两条曲线的交点为古诺模型的解。“雪亮工程是以区(县)、乡(镇)、村(社区)
36、三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。古诺寡头模型的纳什均衡反应函数 y1=f1(y2) y2=f2(y1)(y1*,y2*)是该对策的纳什均衡解。y1* y12y11 y10y2*y22y21y1oy2f1(y2)f2(y1)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例题:古诺模型的解假设p=a-(y1+y2),C1=y1c,C2=y2c则根据利润最大化的一阶条件分别得到反应函数y1=f
37、1(y2)=(a-y2-c)/2,y2=f2(y1)=(a-y1-c)/2,求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,均衡利润为(1/9(a-c)2,1/9(a-c)2)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。古诺模型的解:与垄断市场的比较古诺模型的解:与垄断市场的比较假设为一垄断企业,则有: Max =y(a-y-c), 得到垄断企业的最优产量 y=1/2(a-c) y1+y2=2/3(a-c) 垄断利润为=1/4(a-c)2 2/9(a-c)
38、2寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。寡头厂商与垄断厂商的比较 1/3(a-c) 1/2(a-c)1/2(a-c)y1oy2f1(y2)f2(y1)1/3(a-c)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。0 1二、沙
39、滩卖冰假设游客沿沙滩0,1间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买。生活中还有哪些类似的例子?“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。三、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基
40、础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。假定长度为1的线性城市,消费者均匀分布在0,1区间内,分布密度为1;两个商店1、2分别位于x=0,x=1,即城市的两端;消费者购买商品的旅行成本与商店的距离成反比,单位距离的成本为t;住在x的消费者在两个商店之间是无差异的,需求D1=x,D2=1-x,x满足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。豪泰林模型:以空间上差异为例“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。豪泰林模型:以空间
41、上差异为例根据两个商店的利润函数,1=(p1-c)x, 2=(p2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p1*=p2*=c+t,均衡利润1=2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。四、公共地的悲剧生物学家和生态学家哈
42、丁(Garrett Harden)在科学(1968年,第162卷)发表公地的悲剧。考虑一块对所有的人都开放的牧场,在着的制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口。增加一头牲口既有正效用,也有负效用。正效用是牲口的销售收入,增加一头为+1负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担-1/n放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。四、公共地的悲剧资源没有排他性产权:草地放牧、公海捕鱼、小煤
43、窑的过度开发;另一类是人们向其中排放废物的公地。草地放牧:n个农民,每个拥有羊的数量为gi,G=gi,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v(G) w(S)-S w(E) w(S)+E-S“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。参与约束:参与约束:22R(E)-w(E), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0
44、参与约束“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0
45、.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要对于委托人来说,就是要根据上述两个条件,以及根据上述两个条件,以及 E E、S S的值,选择最佳的工的值,选择最佳的工资水平资水平w(20)w(20)和和w(10)w(10),或或者它们的差额者它们的差额w(20)w(20)- -w(10)w(10)第四节 重复博弈和无名氏定理有限次重复博弈:连锁店悖论无限次重复博弈和无名氏定理“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支
46、撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。一、有限次重复博弈一、有限次重复博弈有限次重复博弈 令G为阶段性博弈,G(T)是G重复T次的重复博弈(Tl0;工人也可以受雇后不干活,这不需任何劳动成本,同时创造的利润也是0。假设公司与工人在工程结束之前没有任何工资合同,它只是在雇用期满后才决定付给每个工人的工资额w。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。作业2如果该建筑公司在未来的10年内每年有一项相同的工程,证明:无论公司的利润贴现
47、因子是多少,唯一的子博弈完美均衡是:在每一项工程中,无论工人是否干活,公司向工人付的工资额w都是0;工人不干活。如果该建筑公司依次有无穷多个工程,而下一期工人又能看到以前的工资政策。证明:只要充分接近1,每一期工人都努力干获将是一个子博弈完美均衡战略。在所有子博弈完美均衡中,对公司最有利的是什么样的均衡?第三章 不完全信息静态博弈不完全信息博弈和贝叶斯纳什均衡贝叶斯均衡的应用举例贝叶斯博弈与混合战略均衡机制设计理论与显示原理第一节 不完全信息博弈和贝叶斯均衡“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重
48、点的“群众性治安防控工程”。一、不完全信息博弈完全信息(complete information) 每个局中人对其他局中人的特征(或类型)和支付函数有准确的了解;否则,为不完全信息(incomplete information )。完美信息(perfect information) 在博弈过程的任何时点每个局中人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息(imperfect information )“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。40,50 -1
49、0,030,80-10,1000,300 0,3000,4000,400 高成本情况高成本情况 低成本情况低成本情况 默许默许 斗争斗争 默许默许 斗争斗争进入进入不进入不进入进入者进入者在位者在位者市场进入博弈:不完全信息市场进入博弈:不完全信息“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。二、海萨尼(Harsanyi)转换在位者存在不同类型,类似于与n个参与人博弈;海萨尼(1967-1968)提出,引入虚拟参与人自然,自然先决定参与人的特征,不完全信息博弈转换为不完美信息
50、博弈不完全信息意味着至少有一个人有多个类型(type),即个人所拥有的非共同信息,用i表示参与人i的一个类型,分布函数p(1,n)为共同知识。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。自然进入者进入者在位者在位者高低不进入进入不进入进入合作斗争 合作斗争(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)p1-p海萨尼转换后的市场进入博弈“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格