《洪开荣《经济博弈论》习题答案.doc》由会员分享,可在线阅读,更多相关《洪开荣《经济博弈论》习题答案.doc(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 经济博弈论思考题 第1章 纳什均衡1、每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。2、博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。3、要素包括参与人,行动,支付和信息。明确了三要素也就完成了建模。模型的表述需要将各要素参数化和数据化。 参与人1参与人2尽力不尽力闹(5,-5)(0,0)不闹(0,0)(-5,5) 4、博弈论模型中的元素就是对经济分析中
2、因素的抽象,分析方法就是关注各个参与人之间的互动及相互之间的影响。比如,甲、乙两公司分数两个国家,在开发某种新产品时有下面矩阵表示的博弈关系(单位:百万美元)。乙公司开发不开发甲公司开发10,10100,0不开发0,1000,0 在这个收益矩阵中,将原本复杂的经济问题抽象化,用明确的数据表示出双方的博弈的收益,这些不同策略组合下的收益则是双方互动选择的结果。5、博弈论和经济学都是基于“理性人”的假设,人们都是追求自身利益的最大化。以性别战博弈为例,女生选择芭蕾时,尽管男生更偏好足球,但此时他为使收益最大化,会选择芭蕾,即男生的最适反应是芭蕾。同样,男生选择足球时,尽管女生更偏好芭蕾,但此时她为
3、使收益最大化,会选择足球,即女生的最适反应是足球。6、(1)博弈双方是在比较每个策略下自己的受益而做出选择,得益值的绝对值也就失去了意义。 (2)若对受益矩阵修改如下:囚徒2坦白不坦白囚徒1坦白-5,-5-1,-7不坦白-7,-10,0此时,(坦白,坦白)和(不坦白,不坦白)是两个纳什均衡,但如果双方稍作协商,必然会选择(不坦白,不坦白),因为这样双方的收益都能最大化。7、博弈至少是在两方之间进行的,博弈的过程中双方都是理性的,在理性的指引下做出策略选择,故博弈论应包含理性、互动和决策。其中理性是前提,互动是过程,决策时结果。博弈过程中,各方都追求其自身的利益最大化,也就是给定对方的策略,自己
4、的策略总是最优的。博弈双方的两个最优反应以最适合的方式结合起来,也就是互为最适反应,这就会说博弈论的决策方法。8、以囚徒困境为例,若双方同时选择抵赖,收益为(-1,-1),此时,双方收益和最大,但这种非纳什均衡的情况是不稳定的。纳什均衡下,双方的策略为(坦白,坦白),收益为(-8,-8),此时收益明显比双方同时抵赖要低。纳什均衡是完全自利的双方理性作用的结果,但结果却并非最优。在现实生活中,在各方同时逐利的前提下,往往会造成结果的次优,如劣币驱逐良币,这也就是说在各方同时理性(追求自身利益的最大化)的情况下,有时会引导出非理性。9、交互理性指个体的利益与他人的行为有关,或者相互取决于其他人的行
5、为时追求自身利益的意识或能力。不论是策略互动还是信念互动,都是博弈主体在保证自身利益的前提下,各方的一种交互。特定主体内心的交互理性是个人追求自身利益最大化;而关联主体之间的交互理性是个体之间利益关联之下,各方在其他人的策略下选定自己的策略。双方的差别在于参与方数量的不同、主体考虑的角度不同。10、不是的。存在多重纳什均衡时,博弈方的决策只会是纳什均衡下的各项策略,不会是随意的。 11、模型是对已有信息的加工和抽象,当通过该模型运算出的结论与之前的假设不相符合,这存在两种可能,一是假设存在错误,另一种是模型本身存在缺陷。因此,这就要求我们在构建模型时要将严格把握控制变量,减少其对因变量的影响。
6、12、博弈论是以完全自利人为假设的,也就是说,经济学中的理性人为完全自利人。这一假设是经济学的基础,实际是有悖于实际生活的,因此就需要更加深入的研究来探讨有限理性下的决策模型和非完全自利人的决策问题。13、 纳什均衡的精炼将最基本的纳什均衡进行扩展,使其适用范围更广。纳什均衡的三种精炼为“策略支持式”精炼、“信念扩展式”精炼和“自利坚守式”精炼。它们的区别在于一个对纳什均衡扩展的方向不同,前者由静态扩展至动态,由完全信息扩展至不完全信息;中间方将个体完全理性扩展至有限理性;后者放松了主体的完全自利假设。14、 博弈论就是在个体之间寻求最适策略组合,而纳什均衡是在理性人的假设之下,各方的最适反应
7、,这也就是博弈论的内核之所在。纳什均衡就是个博弈主体在信念的支持下做出的最优策略的组合,因此博弈均衡就是策略互动均衡与信念互动均衡。15、 不可或缺的关键词是纳什均衡,因为纳什均衡是博弈论的关键性支柱,各类博弈最终的结果都是寻找纳什均衡。本书从第3章到第10章,遵循由一般到具体,由原理到应用实例,由简单到复杂的原则进行编排,内容充实有序。第2章 博弈逻辑 1、从最简化意义上,博弈均衡就是纳什均衡。博弈均衡就是互为最适反应,纳什均衡尽管外在表现为特定形式的策略组合,但在完全信息下而隐藏信念互动,而在不完全信息以及非对称信息下,信念互动甚至对博弈均衡的结果产生关键性影响。策略互动逻辑是指纳什均衡直
8、接表现为一种策略组合,信念互动逻辑是指支撑策略组合的信念互动才是决策的关键动因。自利互动逻辑是指支撑主体策略选择的自利特征决定了决策的关键特征。 2、颤抖手均衡是纳什均衡思想的扩展。从理性基础的扩展角度,颤抖手均衡把自利主体可能的犯错行为(决策颤抖)考虑进纳什均衡中,是围绕策略互动,信念互动和自利假设的纳什均衡概念,扩展纳什均衡的思想,强化均衡思维的博弈均衡的概念。 3、以采金矿博弈为例: 资本家借不借企业家还( 1 , 0 )不还( 0 , 4 )( 2 , 2 )由于信念的非对称性,企业家无法让其对手相信其还钱承诺,则均衡为(1,0),社会财富无法增长,而当美德形成,企业家具有遵守承诺的美
9、德,并且资本家也认可这种美德,于是资本家将会借钱给企业家,形成(2,2)的均衡,社会财富增长。群体性策略互动逻辑是由特殊利益群体的策略选择来决定,个体之间存在特殊的利益关联和相同的策略选择。 4、海萨尼转换盒贝叶斯均衡是建立在信念互动的基础上,信念互动在完全信息的情况下隐藏在策略互动之中。而在不完全信息和非对称信息中更是影响策略均衡结果的关键因素,由此我们发现信念是一种隐藏在心中,但却一直影响人行为的偏好,从某种意义上是精神信仰,乃至宗教。如在囚徒困境中,由于博弈方2有义气的信念存在,原本(坦白,坦白)的博弈均衡成为了(抵赖,抵赖)的均衡,两者发生了颠覆性的改变,这就是革命的力量。 5、真正的
10、理性是私利,私利是理性的唯一标准,江湖道义也是一种追求私利的表现。在法官私恩和江湖道义中,对于博弈方2来说,坦白会产生-6的心理惩罚,这-6是理性的私利,出于不愿让自己心理难受的私利,于是博弈方2选择抵赖,由此产生了“美德”。而在完全且完美信息的囚徒困境中,只会出现双方都认为对方会坦白,于是“美德”无法产生,私利也无法实现。 6、在真假话博弈中,假定其中一个博弈方相信对方讲真话,而这种相信也被策略对手充分认知,如此的信念互动将引导出帕累托效率的纳什均衡,讲假话的策略选择被排除了,有帕累托效率的纳什均衡精炼实现了。而在社会稳定诉求的博弈中,会产生(0,0)、(2,2)两种均衡,政府应当引导博弈双
11、方都能在特定阶段共同寻找到策略2选择的信念判断,从而达到更好的均衡(2,2)。 7、狭义自利:性别战博弈; 广义自利:拆迁问题; 完全信息:美苏争霸; 不完全信息:连锁店博弈; 个体:美苏争霸;群体:资本家和企业家博弈; 8、在群体性策略互动逻辑下,特殊的利益群体中,个体之间存在特殊的利益关联和相同的策略选择,在个体作用微乎其微的特殊博弈环境中,相同利益需求的个体构成特殊利益群体,于是产生了社会群体疯狂事件。在道德沦丧的社会中,在利益群体的博弈中,由于背叛的存在,(不相信,背叛)将成最终的博弈均衡结果。于是社会财富无法得到增长,整个社会向下沉沦。 9、在慈善式财富创造的博弈均衡假设中,由于对于
12、商家来说,生产优质产品会使得心理得到极大的满足,由此我们构造:厂家消费者少买多买劣质产品10,-110,-2优质产品5 ,220 ,1从而产生(优质产品,少买)的均衡。10、瓦尔拉斯均衡指整个经济体系处于均衡状态时,所有消费品和生产要素的价格将有一个确定的均衡值,它们的产出和供给,将有一个确定的均衡量。在“完全竞争”的均衡条件下,出售一切生产要素的总收入和出售一切消费品的总收入必将相等。博弈逻辑是研究理性的行动者或参与者在互动过程中如何选择策略或如何做出行动的逻辑。从经济观念来看,博弈逻辑是基于经济个体的行为逻辑,要保证经济问题分析的正确性,就必须要保证任何现实行动的主体一定要具有符合博弈逻辑
13、的个体理念,自利观念和理性观念。所以博弈论是现在经济学一个特别重要的组成部分。11、博弈方1博弈方2高尚卑鄙高尚5,5-2,2卑鄙2 ,-20,0 第1、2节,是对人类生存世界的黑暗体验并由此产生质疑。在诗中所描绘的世界里,卑鄙者以卑鄙的手段可以在世上畅行,高尚者的高尚品行却使其自身走向墓地。“镀金的天空”喻示着以辉煌的表象掩盖了一个时代真正的黑暗,到处是歌功颂德,到处是粉饰太平,人性被扭曲成“弯曲的倒影”四处凋落。博弈方1博弈方2相信不相信相信2,23,1不相信1 ,30,0 从第3节开始,“我”作为抒情主体,出现在一片死寂、冰凉、规则混乱和缺乏公正的世界,以一种理性的声音,开始对世俗世界审
14、判、否定和挑战,对一切习以为常的规则表示质疑:“我不相信!” 12、从经济观念来看,个体观念是站在自我本体立场上各自依据各自主观价值的独立判断,自利观念是与个体观念相依托,是不必证明的先验判断,而理性观念是主体行为的观念标准。从经济行为来看,逐利源于人类天性,在追求利益最大化的同时,也会寻求损失最小化。同时特定主体也具有不可更改的信念判断。所以政府在制定决策时,也一定要考虑到上文所述的观念的行为,只有均衡,理性,微观的政策才能长久有效的实行。例如将贫民区搬到富人区,希望发达带动落后,但是由于人对于逐利的理性观念,使得这种理想化的政策无法实行。 第3章 完全信息博弈1、完全信息博弈分析纯粹自利支
15、配个人行动的博弈均衡,将经济问题高度抽象为具有完全理性和完全信息的博弈问题,是经济问题分析的极度深化。囚徒困境博弈:生产优质和劣质产品的生产者与多买和少买商品的消费者博弈,双方都基于完全自利和完全信息的支配下,生产者不相信消费者愿意多花钱买更多的优质产品,从而生产劣质产品;消费者不相信生产者会多生产优质产品,从而花更低的价格少买商品。最终博弈的结果就是厂商生产更多的劣质产品,消费者用较低的价格买较少的商品,个人和社会效用并没有达到最优。斗鸡博弈:三星手机厂商与苹果手机厂商在某技术研发方面的竞争也属于斗鸡博弈。双方同时投入研发,增加双方研发投入和产品竞争成本,若只有其中一人研发,研发者获取更大收
16、益,若都不研发,则减少相应成本。性别战博弈与猜硬币博弈当中,在现实经济博弈过程中,若博弈双方对其策略选择并不是百分之百的倾向,而是存在不同的概率,但双方都知道自己和对方的倾向,这时可以用混合策略博弈均衡求解。2、混合策略纳什均衡是博弈方以概率判断的方式进行策略选择,这种随机选择的概率判断正是博弈主体信息或信念判断不完全性的特殊表现而已,表现为博弈主体对可选策略的不确定性。从不完全信息博弈的角度看,混合策略纳什均衡是完美贝叶斯均衡的一种特例。以猜硬币博弈为例,博弈主体双方猜正面和反面各自存在两种概率,由于在互为最适反应的情况下无法得到纯策略纳什均衡,所以根据支付均等化方法,使博弈主体的两种策略选
17、择效用支付值相等,从而得出混合策略均衡解。3、 表3 打假对策博弈厂家消费者少买(p)多买(1-p)劣质产品(q)5,-7-3,0优质产品(1-q)0,40,0(1)如上表3打假对策博弈所示,在互为最适反应的完全信息博弈条件下,不存在打假对策的纯策略纳什均衡。因此,只能通过求混合策略纳什均衡的方式来球均衡解。厂家和消费者各自策略选择的概率如上表中小括号所示,给定p,厂家选择“劣质铲平”的支付值为:5p-3(1-p);选择“优质产品”的支付值为:0。根据混合策略支付均等方法,令5p-3(1-p)=0,得出p=3/8。给定q,消费者选择“少买”的支付值为:-7q+4(1-q);选择“多买”的支付值
18、为:0。根据支付均等方法,令-7q+4(1-q)=0,得出q=4/11。因此,打假对策博弈的混合策略均衡解为(3/8,4/11),即消费者以3/8的概率选择少买,厂商4/11的概率选择劣质产品。(2) 当社会上厂家认为消费者愿意花更多的钱买更多的买优质产品,更少的买劣质产品,以及消费者更愿意相信厂家生产的更多是优质产品时,或者国家出台相应假冒伪劣产品严厉的惩罚措施,提高产品信息透明度,让消费者清楚了解优质产品的价值和劣质产品的坏处,打假对策将对得到纯策略纳什均衡(优质产品,多买)。这里面,只需要将消费者生产优质产品的支付值分别增加到6和7,消费者多买的支付值都增加到7就能够实现。(3) 若在完
19、全信息博弈条件下,改变支付值得到一个纯策略均衡(劣质产品,少买);但即使若在动态博弈环境下,无论谁具有先行优势,在狭义自利互动下,仍然无法改变(劣质产品,少买)的囚徒困境均衡4、 表4 智猪博弈(小国占优)小猪大猪踩不踩踩1.5,3.5-0.5,6不踩5,0.50,0智猪博弈中,在完全信息博弈的互为最适反应条件下,小猪必然会选择“不踩”策略,而大猪不能忍受任何利益的损失,只能选择“踩策略”。其现实意涵就在于,在小国与大国的利益博弈过程中,小国需要抓住大国不愿利益受到任何损失的弱点,积极构建利于自身最有优势策略选择地位的条件,使大国只能服从自己的最优策略选择。就比如,中国所主导的APEC组织,中
20、国在该组织中起主导地位,拥有绝对的话语权,而美国若不加入这个组织将会失去很多利益,但若要加入这个组织,则必须服从中国的话语权。 表5 智猪博弈(弱国无外交)小猪大猪踩不踩踩1.5,3.51,6不踩-1,0.50,3如上表5所示“弱国无外交”的智猪博弈中,由于大猪在能力、资源等各方面的条件都优于小猪,所以无论大猪选择“踩”还是“不踩”策略,小猪都只能向大猪妥协选择“踩策略”,才能最大化自己的利益;而当小猪选择“踩”的策略时,大猪选择“不踩”的策略能实现最大化利益。其现实意涵为,大国有其强力优势,小国在大国面前只能选择屈服于大国才能保全自己微弱的利益,否则损失更大,而且在小国选择与大国诚心合作的情
21、况下,大国可以随意选择不合作以获取更大利益,此谓“弱国无外交”。5、 表6 转型升级博弈政府政策企业生产方式选择传统生产方式转型升级生产方式传统发展政策0,63,0转型升级发展政策1,18,3上表6是在汽车厂引擎厂博弈模型基础上构建了转型升级博弈模型,博弈参与者有政府(政策),企业(生产方式选择);支付值在原汽车厂引擎厂的基础上稍有改变,纯策略纳什均衡结果也变为唯一的(转型升级发展政策,转型升级生产方式)。在未改变支付值之前,存在两个纯策略纳什均衡,(传统政策,传统方式),(转型升级政策,转型升级方式),其总社会效用相等。但政府为了实现国家产业转型升级,实现更长远、更大的社会效用,愿意出台政策
22、,使传统发展政策的效用支付由3,变为0,即政府愿意牺牲暂时的税收和就业等效用收入,促进产业转型升级;在这种情况下,企业也明知政府的政策意图,会意识到从长远上来看,政府的转型升级政策会给企业带来更大的政策红利,因而会选择转型升级方式,在这种策略和信念互动的情况下,得到唯一纯策略纳什均衡(转型升级政策,转型升级方式),国家产业转型升级会慢慢形成。此外,在计划经济向市场经济转型的过程中,政府的政策对市场仍然有很大的导向作用,政府这只有形的手可以引导市场,通过政策调控快速而有力地促进市场的产业转型升级,发挥中国政府调控力的特色优势;中国作为人口大国,其国内市场的需求和消费能力潜力巨大,因此可以引导需求
23、和消费,增大对转型升级产品的需求和消费,促进转型升级。6、采金矿博弈中,在完全信息博弈条件下,博弈双方基于完全自利理性的人,企业家会选择不还款以获得更大利益,资本家在明知企业家策略选择和不守信的信念条件下,会选择不借款,保证1个单位的利益,但社会总效用最低。当加入一个打官司博弈环节时,资本家可以通过法律保障利益,企业家有法律限制其不守信行为,资本家会愿意借款,企业家会选择还款,社会生产得以进行,社会总财富得以增加。7、福利博弈中,并不存在纯策略纳什均衡,因为政府愿意救助愿意找工作的贫民,而不愿救济那些游手好闲坐等救济的贫民;但一般情况下,贫民只有在得不到政府救助时才会找工作,而政府无法准确辨别
24、贫民的这种非对称选择,所以只有通过概率判断的形式寻找混合策略均衡。在这种博弈情况下,政府只能遵循福利保障与市场机制平衡的原则,让那些确实需要救助的贫民及时得到救助,那些坐等救助的人刺激其找工作。如果不这样,则会造成社会上大量游手好闲的人存在。如下表7所示,可以通过改变支付值的相对大小,使得到唯一纯策略纳什均衡结果为(救济,游手好闲)。其现实意涵在于,若政府欲打造成绝对平等、正义的福利主义政府,对所有贫民实行救助计划,为贫民提供丰厚的救助,政府会在全国乃至全世界得到一个美名,得到很大的效用支付。但对于贫民而言,其不用工作就能够得到巨大的政府补助,而工作的贫民选择工作却只能得到较少的工资收入,并且
25、还付出劳动力,从而造成社会上大多数人选择游手好闲,社会不再有工作的动力,最终社会财富创造停止。 表7 福利博弈(纯策略纳什均衡)政府贫民工作游手好闲救济2,23,3不救济-1,10,08、(1)典型特征:可能存在所谓的“破坏者”或“建设者”,其策略选择的变化可能对自身利益影响并不大,但对其他博弈方可能产生很大影响。(2)因为对于某个特定利益主体来说,多主体博弈的破坏者肯能对其他博弈主体造成利益损失,但对于整个社会来说可能带来社会总体效用的增加。(3)根据“三主体共谋和防共谋”博弈模型,在多主体博弈中,不同的利益判别标准导致对多主体策略选择的破坏性和建设性判别不同,但这都是基于每个博弈方追求自身
26、利益最大化的先验理性假设下形成的,谁也不会偏离这以共同认知,这是分析任何博弈问题可能性的必要前提。9、(1)在现实博弈问题中,多主体博弈使得个体的策略互动和信念互动不再突出显像,个体已无法直接影响和觉察博弈的均衡结果,而是基于由相同关联主题组成的群体之间的策略和信念互动博弈,现代经济问题的实质就是各种不同利益集团之间的博弈。(2)当完全信息博弈的高度抽象性思考对应到经济社会问题分析的极端深刻性要求,通过一种极值化与极端化的逻辑分析构架构建,各种形式经济社会博弈问题的实质内涵被充分显现出来,使自利主体博弈方的道德包袱完全卸下,让所有博弈问题有了共同的论证基础。10、首先,企业成长是社会帕累托效率
27、提升的基础动力,而企业竞争行为是维持这一动力的源泉,寡头竞争的博弈模型能对产业竞争进行数理化分析;其次,将寡头竞争模型集合起来,产业组织理论化产业经济学的模型体系也就建立了;然后,最经典的寡头竞争模型常常以连续性策略互动的完全信息博弈形式出现,充分体现虚拟性和现实性,使得现代经济社会的深层次难题有了简单的破解之法。11、完全信息古诺模型构建的最优产量博弈竞争模型;完全信息斯坦伯格模型构建的动态博弈产业组合均衡;完全信息贝特朗模型构建的价格竞争的古诺模型;完全信息霍特林模型构建的企业区位竞争博弈模型,等等。12、以日元兑美元的折现率与汇率博弈为例,若日元价格与美元价格相同,二者货币发行量相互均衡
28、,折现率和汇率相等;若美元率先定价,日元再确定自身的价格,并且日元接受美元价格作为汇率计算和调整价格,以确定日元的折现率,那么美元发行更多的货币可以是日元升值,提高日元兑美元汇率,折现率提高;发行更少的货币,可以使降低日元兑美元汇率,降低折现率,即美元有绝对的定价权。13、(1)在有限重复博弈中,原博弈的一次性博弈有均衡得益数组由于一次性博弈中最差的均衡得益,那么在该博弈的多次重复中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限平均得益来实现它们在无限次重复博弈中,博弈主体对于未来博弈结果无法准确预期,但只要关联主题对于未来的利益看得足够的重,折现率足够的大,博弈者
29、就会出于自利动机选择触发策略,实现合作博弈。(2)以双寡头三价博弈为例,若是有限重复博弈,博弈方第一次选择(H,H)而第二次则选择M,若第一次结果选择其他策略组合,则第二次选择L,而到了第二阶段的(L,L)策略,任何一方都不会偏离;若是无限重复博弈,只要博弈方队未来利益看得足够重,贴现率达到一定的临界值,那么博弈方从第一阶段到最后阶段都不会偏离选择(H,H),合作博弈实现。14、在完全且完美信息的极端化假设下,作为支撑博弈主体均衡策略行为基础的完全自利假设被凸显,这种伴随共同知识和共同理性的完全自利假设,使策略互动的博弈逻辑找到一个可以先验假定的论证基础。而这种先验假定也隐含了第三方“自然”的
30、支撑和左右,因为没有这个第三方“自然”的先验假定,博弈主体必然陷入思想悖论,无法逃脱现实决策的行为困境。15、(1)以囚徒困境博弈为例,在完全且完美信息特殊假定前提下,博弈双方为完全自利的理性人,始终摆脱不了囚徒困境的均衡结果;但若在不完全信息博弈的条件下,博弈双方不仅存在策略互动,更多的是一种信念互动,江湖道义信念的存在使得博弈主体能够摆脱囚徒困境。(2)完全信息博弈均衡类型包括:一是纯策略纳什均衡。博弈主体完全以其个体自利理性行为偏好做出个体经济效用最大化的互为最适反应决策;二是混合策略纳什均衡。博弈主体在给定对手策略选择以概率判断的情况下选择最大化自身利益的策略,在混合策略当中根据概率判
31、断随机选择;三是子博弈完美纳什均衡。博弈主体并不是同时决策,而是存在决策的先后顺序的动态博弈过程时,先行的博弈方具备先行优势,但其必须考虑后行动者的策略互动选择,所以采取逆推归纳法进行决策;四是触发机制下的子博弈完美纳什均衡,也就是有限重复博弈和无限重复博弈均衡。重复博弈的各个博弈方既有有限次和无限次阶段博弈的每一阶段最大化自己利益的选择,也同时追求所有阶段平均利益或整体利益的最大化。 第四章 不完全信息博弈1、 因为在海萨尼转换的这种方式下,原本不利于双方的决策不一定是百分之百的,所以博弈决策必须以一些先验而不必证明的人性假设为基础,在此种方式下有利于博弈方实现最大效益。在囚徒困境博弈中,当
32、其中一个囚徒在先验判断基础上后验判断出其策略对手百分之百不会选择坦白(P值为0)时,他实际确信其策略对手是百分之百的侠士,维持讲义气的江湖道义是其必然选择。如此一来,囚徒困境将在特定的策略信念组合下消失,保证江湖道义的策略选择成为了两个囚犯谁也不会偏离的均衡选择。博弈方1不确定博弈方2是否有义气,能使得博弈方1可能会得到优于(坦白,坦白)决策的博弈结果。2、 对于囚徒1选择坦白的概率判断为P,选择抵赖的概率判断为1-P,如此一来,囚徒2找到了选择坦白或者抵赖的依据。在附加主体策略的信念概率判断时,纳什均衡的精炼选择方式也确定了。引进虚拟的第三方“自然”是不完全信息博弈均衡求解的关键步骤的原因是
33、第三方“自然”赋予博弈方决策的先验概率能把博弈结果的不确定性转换成博弈过程的不完美,能使有效的博弈决策出现。另外,当博弈方对于博弈结果的不确定时,有效的博弈就无从谈起。3、海萨尼转换和序列理性决定了不完全信息博弈决策的特殊方式的原因是博弈方认为会影响其决策的任何因素都成为信念更新的条件和判断,从而能在一种序列理性的决策框架中有效整合了关联主体的决策互动与信念互动。4、在海萨尼转换中假定“自然”博弈方的行为的唯一功能是赋予实际博弈方以决策行为开始前的先验概率判断。为了解决不确定性决策问题,引进虚拟的第三方“自然”可以保证不完全信息博弈的纳什均的策略有效性的互动。在典型的囚徒困境博弈中,其现实理解
34、是所有博弈主体都是百分之百自私自利的,然而这种情况有时候是各博弈方最不愿出现的结果。其决策意涵是各博弈方都是在争取最大利益的基础上做的决策,然而会出现类似于“囚徒困境”的情况。5、经过海萨尼转换,不完全信息条件被巧妙地潜入纳什均衡的互为最适反应的分析框架中,纳什均衡不再仅仅表现为策略互动均衡,也同时表现为信念互动均衡,纳什均衡成为了策略互动均衡与信念互动均衡的整合,不然会使任何博弈主体判断和决策无从谈起。进行海萨尼转换之前进行博弈行为时是对博弈结果不清楚,而转换之后主体是对博弈过程不完美。因为,海萨尼转换使原本是不完全信息博弈转化为了完全但不完美信息的动态博弈。6、 因为特定博弈方既要保证自己
35、在前后阶段中信念判断的一致性,保证自己在前一阶段的信念判断与之后阶段的信念判断相互契合,同时在特定博弈方对于其他博弈方策略的一致性,博弈方之间关于均衡策略的相互判断不能在不同阶段相互冲突,只有同时保证两方面序列理性要求的策略互动与信念互动组合才是真正稳定的不完全信息博弈均衡。基于海萨尼转换的主体理性基础假设是给定各博弈方的策略判断,他们的策略必须是序列理性的。特殊意涵是在每个信息集合处,如果给定信念和策略选择顺序,策略是最优的。7、主体1主体2LRO1,41,4T2,10,0B0,20,1如上图所示,可以很快看出那是均衡有:(T,L)、(O,R)。尽管都是那是均衡,但是(O,R)是不可置信的,
36、行为R是主体2在信息集合上是一个被严格优超的策略,因为海萨尼转换本身就有独特的宗教意涵与哲学逻辑,各博弈方都是自私自利的。 8、 在性别战博弈中,若男生或女生的其中一个是百分之百雷锋,结果会是非百分之百雷锋博弈方较为倾向的选择,而百分之百雷锋会选择博弈对手所倾向的博弈选择,因为百分之百活雷锋会放弃自己的利益而使博弈对方的利益最大化,这也是一个纯策略纳什均衡。若男生和女生两个都是百分之百雷锋,结果则是(足球,足球),因为这个博弈选择使博弈双方的总收益最大。9、 旧车市场博弈指明了维护市场秩序和提升市场效率的基本途径,明确了促进市场健康有序发展的有效政策措施,而这些政策举措主要与有关政策意涵的分离
37、均衡相互联系。而分析双价旧车交易博弈及有退款保证的旧车市场博弈,完善的市场机制必须有保证效率和公平的博弈规则,而这些博弈规则必须表现为社会共同接受的道德体系和法律体系,才有助于市场化改革战略的选择。10、 博弈方1可能得到法官私恩,博弈方2拥有江湖道义能使双方博弈利益最大化,大多数时候囚徒困境也不复存在了。“好人”因为在这种贝叶斯规则下,大家一致公认的“好人”有可能会选择抵赖,这是有违于社会道德的。11、 “完全且完美信息可能导致疯狂”是指类似于“囚徒困境”这种博弈情况的出现,会使博弈双方的利益受到最大的损害,而“不完全信息可能产生美好”是指不完全信息博弈在引入第三方“自然”之后可能会使博弈双
38、方利益最小的困境得到改善。完全信息博弈下的囚徒困境会使两个囚徒都付出5支付值,为最差博弈选择。而法官私恩与江湖道义博弈及其各种变化形式的均衡是不完美信息博弈,可能会使得囚徒选择(坦白,抵赖)、(抵赖,抵赖)等,这些选择都优于(坦白,坦白)策略。12、 不完全信息“好朋友博弈”朋友1 朋友2合作背叛合作(10,10)(0,17)背叛(15,0)(-5,1) 朋友1知道朋友2是百分之百好朋友,而朋友2不知道朋友1是不是百分之百好朋友。因为朋友1是百分之百雷锋,因此肯定会选择“合作”,而行为“背叛”是朋友2在信息集合上是一个严格优超的策略,因此百分之百选择背叛,使得朋友1无收益,说明了“朋友之交淡如
39、水”和“千金易得而知己难求”。13、 最好法律(完美合同)的判别标准是在正确道德基础上使各博弈方的利益最大化。因为最好的合同使利益最大化,所以说“最好的合同是谁也不愿不会违背的合同”。因为法律对各博弈方的行为决策会有一定的约束和制约,所以说“最好的法律是所有关联主体都实现了自我利益的法律”。14、 社会认同感对于社会财富创造的特别意义在于博弈主体对世界的一定认识有助于博弈主体进行博弈选择,促进实现利益最大化。从现实意义来看,不完全信息吓阻博弈表明由于不完美信息博弈均衡以来于第三方“自然”赋予的先验概率判断,所以博弈主体对世界的认识,这里就是P和1-P,影响到最后的均衡,或者说先验和后验判断决定
40、了最终均衡。 15、 政府 贫民 工作 游手好闲 救济(3,2)(-1,3) 不救济(-1,1)(0,2) 如上图所示,行为“游手好闲”为贫民在信息集合上优超策略,因此贫民肯定会选择游手好闲,而政府知道这种现象之后肯定会选择救济,但是(救济,游手好闲)不能使得社会效益最大化。因此,参与人宁可拥有更差的信息。 第5章 非对称信息博弈 1、因为从建模目的来比较,非对称信息博弈均衡是私人信息或非对称新年互动支配下的策略互动均衡,而这些均衡都以特定的契约安排形式出现,这种契约安排常常与现实博弈问题的关键性特征相对应。相比对称信息博弈,声明博弈通过类型差异与偏好差异显现一种“内在非对称性”,这种非对称性
41、的私有信息支持了非对称的信念互动,而这种非对称的信念互动又支配了博弈方的策略互动。比如社会阶层的不同。2、因为任何形式的非对称信息博弈均衡一定可以寻找到特殊表现的现实问题。在更为现实的博弈环境中,博弈方的不完全信息实际上是一种非对称信息,即特定博弈方相对于其他博弈。因为非对称信息博弈的关键之处在于,非对称信息导致了博弈主体的非对称信念,而非对称信念支持了非对称的策略互动,从而产生了非对称性的策略互动均衡与信念互动均衡。因此,可以说非对称信息博弈是一种策略互动极小化和信念互动最大化特征的博弈均衡。决策意涵表现为分析非对称信息博弈问题,实际就是思考非对称信念支配下的各种博弈均衡表现,就是提炼现实博
42、弈问题的主体非对称信念判断,分析其非对称信念支配下的策略互动均衡与信念互动均衡。3、在一般意义上,非对称信息博弈主体会各自发挥委托人和代理人的功能,在激励相容和个体理性约束下进行委托代理机制设计。实际上,触发策略机制下的子博弈完美均衡就是重复博弈环境的一种机制设计。非对称信息博弈的博弈均衡不再是一种可以简单表示的策略组合,而是需要多种信念判断假定及多种策略选择的策略信念判断组合。这种策略信念判断组合就是非对称信念博弈主题各自寻求多种多重利益组合的契约安排,也可以说,非对称信息博弈的均衡特征就是实现关联主体利益最大化的最优契约设计。不完全的贝叶斯纳什均衡,可以视为特殊形式的最优契约,只不过这种最
43、优契约是非对称条件下不完全契约设计的极端简化版本,也是一种机制设计。4、 非对称信息博弈均衡是私人信息或非对称新年互动支配下的策略互动均衡,而这些均衡都以特定的契约安排形式出现。以委托代理来说,道德风险在现实中表现为委托人只能观察到结果,不能知道代理人的行动和状态本身,或者是委托人只能观察到代理人的行动,而不能观测到自然的选择,逆向选择表现为如果委托人针对代理人的激励契约不合适,那么代理人的选择很可能和委托人所期望的方向不同,做出逆向的选择。信号传递表现为代理人在逆向选择下传达自己类型的一种手段,信号甄别与信号传递相反,表现为代理人在委托人提供契约之后选择信号。机制设计表现为比如委托人提供给代
44、理人的部分契约或全部契约,就是针对不同客户的一种机制,机制设计的理想结果是最优契约。5、 知识分子宿命在非对称信息博弈中是一种特定的契约安排形式。秀才遇到兵,有理说不清实际上就是一种非对称信息的博弈,秀才和兵成长于不同的环境,两人拥有的信息并不是对称的。秀才应该针对小兵的偏好与逻辑传递不同的信号。6、 好人形成阿规律在非对称信息博弈中是一种特定的契约安排形式。好人的高尚并不等同于道德的高尚,在有具体支付值的非对称信息博弈中,好人的高尚并不一定表现为道德的高尚。与对称信息博弈相比较,主要差异在于一个是非对称信息,一个是对称信息。7、 与对称信息博弈相比较,非对称信息博弈的特殊性在于非对称信息博弈
45、都有特定的激励相容约束和委托代理框架,委托代理框架下的博弈均衡都可以理解为特定形式的最优契约选择,而且非对称信息博弈都是委托代理博弈。比如在囚徒困境中,囚徒2知道囚徒1选择坦白或抵赖后自己的结果,但是囚徒1不知道,存在非对称信息,在这种情况下,囚徒1很有可能选择抵赖,而囚徒2选择坦白。特殊要求即非对称信息博弈建模需要特定的激励相容约束和委托代理框架。不卖买 3 1 2 2差好卖不卖卖不买买不买 8、阿克洛夫旧车市场博弈: 斯宾塞雇佣博弈: 劳动力市场不接受能力高教育水平低教育水平高接受不接受能力低能力高能力低雇员接受中国教育体制改革战略设计的认识:对完善我国教育体制的一些建议。(1)加大投入,调整结构。对于中、高等教育,因其具有消费的排他性,可依照谁受益谁负担的利益原则,由政府、受教育者和社会共同分担,以政府为主渠道,以补助和贷款的方式给予支持。最后,公共财政应加强对贫困地区和贫困家庭的直接资金补助,对城市“外来人口”的子女应和当地户籍孩子一样,就地接受义务教育和参加高考,平等竞争和录取。(2)制定、完善和严格执行教育财政法规。应修订现行有关教育法规和财政法规中有关教育财政的条款,完善我国的教育财政法规体系,使教育经费的筹集、负担、分配、使用都有法可依,责任明确。(3)建立公平公正的资源配置制度。针对教育投入,应借鉴发达国家公共财政的