《信息经济学第三章博弈论精.ppt》由会员分享,可在线阅读,更多相关《信息经济学第三章博弈论精.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息经济学第三章博弈论第1页,本讲稿共46页博弈:博弈:博弈:博弈:国家之间、企业之间、人与人之间国家之间、企业之间、人与人之间生活中的博弈:生活中的博弈:打牌、下棋打牌、下棋 宿舍打扫卫生宿舍打扫卫生 宿舍买电风扇宿舍买电风扇 家庭装修家庭装修 挤公共汽车挤公共汽车第2页,本讲稿共46页二、产生与发展二、产生与发展通常,人们将数学家冯通常,人们将数学家冯 诺依曼(诺依曼(von Neumann)于)于1928年提出的二人零和博弈的极小化极大定理作为博弈论年提出的二人零和博弈的极小化极大定理作为博弈论奠基的标志。奠基的标志。1944年,数学家冯年,数学家冯 诺依曼(诺依曼(von Neuman
2、n)和经济学)和经济学家摩根斯坦恩(家摩根斯坦恩(Morgenstern)合作发表了)合作发表了博弈论和博弈论和经济行为经济行为一书,被认为是应用博弈论进行经济分析的开始。一书,被认为是应用博弈论进行经济分析的开始。第3页,本讲稿共46页50年代合作博弈发展到鼎盛期:纳什和夏普里提出年代合作博弈发展到鼎盛期:纳什和夏普里提出“讨讨价还价价还价”模型;吉利斯和夏普里提出模型;吉利斯和夏普里提出“核核”的概念。的概念。50年代非合作博弈开始创立:年代非合作博弈开始创立:1950和和1951年,纳什发年,纳什发表了两篇关于非合作博弈的重要论文表了两篇关于非合作博弈的重要论文n人博弈中的均衡人博弈中的
3、均衡点点、非合作博弈非合作博弈。1950年,塔克定义了年,塔克定义了“囚徒困囚徒困境境”(prisoners dilemma)。第4页,本讲稿共46页6060年代,泽尔腾将纳什均衡的概念引入了动态分析,年代,泽尔腾将纳什均衡的概念引入了动态分析,提出提出“精炼纳什均衡精炼纳什均衡”概念。概念。1967-19681967-1968年,海萨年,海萨尼将不完全信息引入博弈论的研究。此后,他们两尼将不完全信息引入博弈论的研究。此后,他们两人长期合作,发展了非合作博弈理论。人长期合作,发展了非合作博弈理论。8080年代,克瑞普斯和威尔逊于年代,克瑞普斯和威尔逊于19821982年合作发表了关年合作发表了
4、关于动态不完全信息博弈的重要文章。于动态不完全信息博弈的重要文章。第5页,本讲稿共46页 1994年诺贝尔经济学奖获得者:年诺贝尔经济学奖获得者:1928年纳什出生于美国,年纳什出生于美国,1950年获普林斯顿大学数学博士学位,年获普林斯顿大学数学博士学位,其博士论文其博士论文非合作博弈非合作博弈首次区分了合作博弈与非合作博弈,首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的所谓纳什均衡概念。并且提出了非合作博弈的所谓纳什均衡概念。1930年年 泽尔滕出生于现属于波兰的德国城市,泽尔滕出生于现属于波兰的德国城市,1961年获法兰克福大学数学博士学位,曾先后任教于柏年获法兰克福大学数学博士
5、学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。其主要贡献林自由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。是在博弈论中引入了动态分析。1920年海萨尼出生于匈牙利,年海萨尼出生于匈牙利,1947年获布达佩斯大学博士年获布达佩斯大学博士学位,后到美国,学位,后到美国,1954年获斯坦福大学博士学位,曾先后任年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于教于澳大利亚国立大学、加州伯克利分校。于2000年去世。年去世。他的贡献是将不完全信息引入了博弈论的研究。他的贡献是将不完全信息引入了博弈论的研究。第6页,本讲稿共46页第二节第二节第
6、二节第二节 基本概念基本概念基本概念基本概念一、组成要素:一、组成要素:局中人局中人局中人局中人(playersplayers):指做决策的个体。每个局中人的目标都是通):指做决策的个体。每个局中人的目标都是通过选择行动来使自己的效用最大化。过选择行动来使自己的效用最大化。信息信息信息信息(informationinformation)指局中人在博弈中的知识,特别是有关其他局中)指局中人在博弈中的知识,特别是有关其他局中人(竞争者或对手)的特征和行动的知识。人(竞争者或对手)的特征和行动的知识。策略策略策略策略(strategiesstrategies)是局中人选择行动的规则,它告诉局中人)是
7、局中人选择行动的规则,它告诉局中人在什么时候选择什么行动。在什么时候选择什么行动。第7页,本讲稿共46页 支付支付支付支付(payoff):指每个参与人从博弈中获得的效用水平。):指每个参与人从博弈中获得的效用水平。均衡均衡均衡均衡(equilibrium):指所有局中人的最优战略组合或行动组合。):指所有局中人的最优战略组合或行动组合。或者,均衡或者,均衡s*=(s1*,sn*)指由博弈中的)指由博弈中的n个局中人每人个局中人每人选取的最佳战略所组成的一个战略组合。选取的最佳战略所组成的一个战略组合。第8页,本讲稿共46页二、划分类型二、划分类型二、划分类型二、划分类型1.1.行动顺序行动顺
8、序行动顺序行动顺序 静态博弈静态博弈静态博弈静态博弈(static game):博弈中局中人同时选择行动,或虽然):博弈中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了什么具体行动。不是同时行动但后行动者并不了解前行动者采取了什么具体行动。动态博弈动态博弈动态博弈动态博弈(dynamic game):指局中人的行动有先后顺序,且后):指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。行动者能够观察到先行动者所选择的行动。2.2.信息结构信息结构信息结构信息结构 完全信息博弈完全信息博弈完全信息博弈完全信息博弈(complete information)
9、:指局中人完全了解其):指局中人完全了解其他局中人的特征、战略空间及支付函数。他局中人的特征、战略空间及支付函数。不完全信息博弈不完全信息博弈不完全信息博弈不完全信息博弈(incomplete information):指至少有一个局):指至少有一个局中人不完全了解其他局中人的收益或收益函数。中人不完全了解其他局中人的收益或收益函数。第9页,本讲稿共46页3.3.3.3.合作博弈与非合作博弈合作博弈与非合作博弈合作博弈与非合作博弈合作博弈与非合作博弈 合作博弈(合作博弈(cooperative game):是以局中人整体的可能联合行):是以局中人整体的可能联合行动集合为基本要素。通俗地说,如果
10、局中人能够达成有约束力的协议或动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。非合作博弈(非合作博弈(non-cooperative game):是以单个局中人的可能行):是以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。强调的是个体理性。第10页,本讲稿
11、共46页4.4.4.4.零和博弈与非零和博弈零和博弈与非零和博弈零和博弈与非零和博弈零和博弈与非零和博弈 按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。博弈。零和博弈指在博弈中一组局中人所得到的支付(或收益)恰零和博弈指在博弈中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。称为零和博弈。非零和博弈指所有局中人的支付(或收益)的代数和不为零。非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。为
12、正或为负。第11页,本讲稿共46页基于信息结构和行动结构来划分博弈的结果:基于信息结构和行动结构来划分博弈的结果:基于信息结构和行动结构来划分博弈的结果:基于信息结构和行动结构来划分博弈的结果:博弈的类型及对应的均衡概念博弈的类型及对应的均衡概念 行动顺序行动顺序 静态结构静态结构 动态结构动态结构 信信 息息 (战略博弈)(战略博弈)(扩展博弈)(扩展博弈)完全信息静态博弈完全信息静态博弈 完全信息动态博弈完全信息动态博弈 完全信息结构完全信息结构 Nash均衡均衡 子博弈精练子博弈精练Nash均衡均衡 Nash(1950,1951)Selten(1965)不完全信息静态博弈不完全信息静态博
13、弈 不完全信息动态博弈不完全信息动态博弈不完全信息结构不完全信息结构 贝叶斯贝叶斯Nash均衡均衡 精练贝叶斯精练贝叶斯Nash均衡均衡 Harsanyi(1967-1968)Selten(1975)等等第12页,本讲稿共46页三、支付矩阵表示方法三、支付矩阵表示方法三、支付矩阵表示方法三、支付矩阵表示方法 双因素表示法:双因素表示法:双因素表示法:双因素表示法:指在两个局中人的博弈中,每一单元格都有指在两个局中人的博弈中,每一单元格都有两个数字两个数字分别表示两个局中人的收益。分别表示两个局中人的收益。局中人局中人B 左左 右右 上上 2,1 0,0局中人局中人A 下下 0,0 1,2第13
14、页,本讲稿共46页第三节第三节 经典模型经典模型 博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就既可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手,学习到最适合的为人处世的方法。第14页,本讲稿共46页一、囚徒困境一、囚徒困境自愿坐牢的嫌疑人自愿坐牢的嫌疑人 两个嫌疑犯作案后被警察抓住,被分别关在不同的房间里受审讯。警察知道两个人有罪,但缺乏足够的证据定罪,除非两个人当中至少有一个人坦白。警察告诉每个人:1
15、、如果两个人都坦白,各判刑5年;2、如果两个人都不承认,每人判刑1年;3、两个人一人坦白一人抵赖,坦白者释放,抵赖者判刑8年;第15页,本讲稿共46页这样,每个嫌疑犯面临4种可能后果:释放(自己坦白同伙抵赖);判刑1年(两人都抵赖);判刑5年(两人都坦白);判刑8年(自己抵赖同伙坦白)。囚徒困境的支付矩阵 囚犯B 坦白 抵赖囚犯A坦白抵赖-5,-5 0,-8-8,0-1,-1 第16页,本讲稿共46页对A而言:如B坦白,A坦白时的支付为-5,抵赖时的支付为-8,因而坦白好;如B抵赖,A坦白时的支付为0,抵赖时的支付为-1,还是坦白好;这样,坦白是A的唯一最优策略。同样也是B的唯一最优策略。此博
16、弈的纳什均衡是(坦白,坦白)。分析分析第17页,本讲稿共46页应用应用应用应用1 1:军备竞赛:军备竞赛:军备竞赛:军备竞赛 20多多年年前前,美美、苏苏两两国国是是两两个个超超级级大大国国,他他们们相相互互对对垒垒都都竞竞相相增增加加各各自自的的军军费费预预算算。假假设设他他们们有有两两种种策策略略选选择择:扩扩军军或或裁裁军军。双双方方选选择的支付如下:择的支付如下:苏苏 联联 扩扩 军军 裁裁 军军 扩扩 军军 -2000,-2000 8000,-美美 国国 裁裁 军军 -,8000 0,0 第18页,本讲稿共46页应用应用应用应用2 2:公共事业:公共事业:公共事业:公共事业 两两个个
17、企企业业(u1,u2)被被问问:是是否否同同意意建建造造一一个个新新的的下下水水管管道道以以使使地地下下水水不不被被污污染染。假假设设建建造造下下水水管管道道需需要要投投资资120万万。如如同同意意各各承承担担50%,下水管道对企业的价值分别是,下水管道对企业的价值分别是80万。万。第19页,本讲稿共46页应用应用应用应用3 3:价格战:价格战:价格战:价格战 生活中,我们经常会遇到各种各样的家电价格生活中,我们经常会遇到各种各样的家电价格大战:彩电大战、冰箱大战、空调大战等等。这些大战:彩电大战、冰箱大战、空调大战等等。这些大战的受益者是消费者。价格大战的结局也是一个大战的受益者是消费者。价
18、格大战的结局也是一个“纳什均衡纳什均衡”,而且是厂家谁都没钱赚。,而且是厂家谁都没钱赚。问题:价格战的囚徒困境现象可以改变吗?问题:价格战的囚徒困境现象可以改变吗?第20页,本讲稿共46页囚徒困境的结论:囚徒困境的结论:1)个体理性与集体理性的不一致性;2)表明制度安排的重要性;3)在现实政治经济中,合作具有积极普遍的意义。第21页,本讲稿共46页二、智猪博弈二、智猪博弈多劳并不多得多劳并不多得 猪圈里有大、小猪各一头,猪圈的一头有一个猪食槽,另一头有一个按钮,控制猪食供应。按一下按钮有10个猪食供应,但谁按谁要付出2个单位成本。(1)若小猪按则大猪先到,大猪吃9个单位,小猪只吃到1个单位。(
19、2)若同时按则同时到,大猪吃7个单位,小猪吃到3个单位。(3)若大猪按则小猪先到,大猪吃6个单位,小猪吃到4个单位。第22页,本讲稿共46页智猪博弈的支付矩阵智猪博弈的支付矩阵 小猪 按 等待 大猪按 等待5,14,49,-10,0第23页,本讲稿共46页分析分析 小猪的最优策略是:等待。因为 大猪按,小猪同时也按,得到1,而等待则得到4。大猪等待,小猪按,得到-1,而等待则得到0。给定小猪的最优策略是等待,大猪的最优策略只能是按。所以,此博弈的纳什均衡是(按,等待)。智猪博弈表明:能者多劳,但多劳者未必多得。智猪博弈表明:能者多劳,但多劳者未必多得。第24页,本讲稿共46页对管理者的启示对管
20、理者的启示 在“智猪博弈”的模型中,小猪搭便车的现象是由于规则所导致。为使资源最有效配置,如何才能激励小猪和大猪去抢按按钮?其核心问题是每次落下食物数量和按钮与投食口之间的距离。改变方案一:减量方案。投食量仅为原来的一半。结果是小猪和大猪都不去按。谁去按就意味着为对方贡献食物。改变方案二:增量方案。投食量为原来的两倍。结果是小猪和大猪谁想吃谁就去按,反正对方不会一次把食物吃完,都有足够的食物,所以竞争意识不强。第25页,本讲稿共46页改变方案三:减量加移位方案。投食量仅为原来的一半,但将投食口移到按钮旁边。结果小猪和大猪都在拼命抢着按按钮。等待者不得食,而多劳者多得。此方案成本不高而收获最大,
21、可以说是最佳方案。第26页,本讲稿共46页三、斗鸡博弈三、斗鸡博弈狭路相逢的策略狭路相逢的策略 有两个人举着火棍从独木桥的两端走向中央准备火拼。每个人有两种策略:继续前进或退却。赢得2分,主动退却0分,败-3分。有3种情况发生:(1)两个人都继续前进,则两败俱伤。(2)一方前进,一方后退,前进者赢,退下来丢面子。(3)两人都退,都丢面子。第27页,本讲稿共46页斗鸡博弈的支付矩阵斗鸡博弈的支付矩阵 B 进进 退退 有两个纳什均衡(进,退)或(退,进)。有两个纳什均衡(进,退)或(退,进)。斗鸡博弈说明:狭路相逢勇者胜。斗鸡博弈说明:狭路相逢勇者胜。A进退-3,-3 2,0 0,2 0,0 第2
22、8页,本讲稿共46页把对手变成朋友把对手变成朋友自20世纪80年代起,苹果和微软就一直处于敌对状态,为争夺个人计算机市场展开激烈的竞争。90年代中期,微软公司占领了约90%的市场份额,而苹果公司举步维艰。而让所有人都大跌眼镜的是,1997年,微软向苹果公司投资1.5亿美元,把它从倒闭的边缘拉了回来。2000年,微软为苹果推出Office2001。自此,微软与苹果真正实现双赢,合作伙伴关系进入了一个新的时代。第29页,本讲稿共46页 生活在纷繁复杂的社会中,难免会与人发生对立和冲突。在这些对手中,有的也许的确是蓄意阻挡你的前进道路,有的大多数是由于阴差阳错产生的误会,这时就不能讲究“狭路相逢勇者
23、胜”,而应该调整自己的姿态,避免因为针尖麦芒而两败 俱伤,并且要“一笑泯恩仇”,化对手为朋友,找到一条让 双方共同前进的道路。第30页,本讲稿共46页四、市场进入博弈四、市场进入博弈 设想有一个垄断企业已在市场上(称为“在位者”),另一个企业想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以要阻挠进入者进入。在此博弈中,进入者有两种策略:进入或不进入,在位者也有两种策略:默许或阻挠。假定进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本为10。第31页,本讲稿共46页市场进入博弈支付矩阵市场进入博弈支付矩阵 在位者在位者 默许默许 阻挠阻挠有两个纳什均衡(进入,
24、默许),或(不进有两个纳什均衡(进入,默许),或(不进入,阻挠)。入,阻挠)。进入者进入者 进入进入不进入不进入40,50-10,0 0,300 0,300 第32页,本讲稿共46页五、酒吧博弈五、酒吧博弈混沌系统中的策略混沌系统中的策略 “酒吧问题”是美国人阿瑟1994年在美国经济评论发表的一篇文章中提出来的。酒吧问题是:假设一个小镇上总共有100人,每个周末均要去酒吧活动或是待在家。小镇只有一间酒吧,设计接待人数为60人,即只有60人时酒吧服务最好,气氛最融洽。第一次,100人中的大多数去了酒吧,导致酒吧爆满,他们没有享受到应有的乐趣。第二次,人们去之前根据上次经验,人多得受不了,决定不去
25、,结果去的人享受了一次高质量的服务。问题是,小镇上的人应该如何做出去还是不去的选择呢?第33页,本讲稿共46页这是一个典型的动态群体博弈问题。前提条件有如下限制:每个参与者面临的信息只是以前去酒吧的人数。因此只能根据以前的历史数据归纳出此次行动的策略,没有其他的信息可以参考,他们之间也没有信息交流。酒吧问题对真实人群的实验数据:周别ii+1i+2i+3i+4i+5i+6i+7人数4476237745667822第34页,本讲稿共46页对真实人群的实验中,实验对象的预测呈有规律的波浪形态,这种预测是一个非线性的过程。从一个非线性系统的整体来说,其变化往往是不可预测的。对于处身于一个混沌系统中的个
26、体来说,在无法预测的过程中也可以采取恰当的策略,少少数数者者策策略略是值得重点关注的。第35页,本讲稿共46页“少数者少数者”的红衣服的红衣服美国钢铁大王卡耐基小的时候家里很穷。有一天,他放学回家的时候经过一个工地,看到一个老板模样的人正在指挥盖一幢摩天大楼。卡耐基走上前问:“我长大后怎么才能成为像您这样的人呢?”“第一要勤奋,第二,要买一件红衣服穿上!”卡耐基满腹疑惑:“这与成功有关吗?”那人指着前面的工人说:“有啊!你看他们都穿着清一色的蓝色衣服,所以我一个都不认识。”说完,他又指着旁边一个工人说:“你看那个穿红衣服的,就因为他穿得和别人不一样,这才引起了我的注意。我也就认识了他,发现了他
27、的才能,过几天我会安排给他一个职位。”第36页,本讲稿共46页六、枪手博弈六、枪手博弈先发优势与后发制人先发优势与后发制人 有三个不共戴天的快枪手在街上不期而遇,他们对于彼此之间的实力都了如指掌:枪手甲枪法精准,十发八中;枪手乙枪法不错,十发六中;枪手丙枪法拙劣,十发四中。我们来推断一下,假如三人同时开枪,谁活下来的机会大一些?如果三个人轮流开枪,谁的机会更大?如果三人中首先开枪的是丙,他该怎么选择?第37页,本讲稿共46页同时出招的策略同时出招的策略每个星期,美国两大杂志时代和新闻周刊都会暗自较劲,要做出最引人注目的封面故事。双方的行动是同时进行,对对手的情况毫不知晓。假定本周有两个大新闻:
28、一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。他们只会购买感兴趣的新闻为封面的杂志。假如两本杂志用同一条新闻做封面,那么感兴趣的买主平分两组。两个杂志社如何进行决策?第38页,本讲稿共46页时代时代:假如新闻周刊采用艾滋病新药做封面故事,我采用预算问题,则可得全体读者的30%;我也采用艾滋病新药,则得到全体读者的35%。因此,我采用艾滋病新药做封面故事。假如新闻周刊采用预算问题做封面故事,我也采用则得到15%的读者;我采用艾滋病新药做封面故事,则得到70%读者。因此,我采用艾滋病新药做封面故事。因此,我有一
29、个优势策略就是采用艾滋病新药做封面,而无论对手的选择是什么。第39页,本讲稿共46页这样的策略考虑,同样对新闻周刊有效。选择艾滋病新药是他们共同的优势策略。同时出招的策略就是同时出招的策略就是无论对方采取何种策略,无论对方采取何种策略,均应采取自己的最优策略。均应采取自己的最优策略。思考:思考:假设全体读者偏向于选择时代。假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的人60%会选时代,40%的选新闻周刊,则两个杂志社如何决策?第40页,本讲稿共46页七、猎鹿博弈七、猎鹿博弈走上集体优化之路走上集体优化之路 在古代的一个村庄有两个猎人,假设主要的猎物只有鹿和兔子。受条件所限,两个人一起去才
30、能猎获1只鹿,并且能使每个人吃上10天;如果一个人去,只能打到4只兔子,可以保证4天不挨饿。要么分别打兔子,每人得4;要么合作,每人得10。合作猎鹿比分别抓兔子更具有帕累托帕累托优势。帕累托效率:经济的效率体现于配置社会资源以改善人们的境况,特别要看资源是否已经被充分利用。如果要想再改善任何人都必须损害别人,这时就实现了帕累托效率最优。如果双方按照各人的贡献来分配猎物,会出现什么情况?第41页,本讲稿共46页挤兑风潮挤兑风潮 假设A和B两个人,都借给朋友C100万元做生意。C拿到200万元在第一年进行投资,第二年才可以赚取利润。A和B两个人如果第一年索要借款,C只能还给两个人共140万元:同时
31、要各得70万元;先来要的得100万元,后来的得40万元。A和B两个人如果第二年索要借款,C能还给两个人共280万元:同时要各得140万元;先来要的得180万元,后来的得100万元。A和B如何博弈?第42页,本讲稿共46页参与者的策略组合参与者的策略组合都采取合作的方式,绝不背叛,这对集体来说是最优的策略;本人采取不合作的方式但个人收益是最大的,这对个人来说是最优的策略;所有参与者都选择背叛,这对集体来说是最坏的结果,同时对个人而言也可能是最坏的结果;当别人采取不合作态度时自己坚守合作的方式,这种情况对个人和集体来说都不是最优策略,而且从个人追求自身效益最大化的动机来看,做出这种选择几乎不可能。
32、第43页,本讲稿共46页八、警察与小偷博弈八、警察与小偷博弈混合策略的应用混合策略的应用 假设某个小镇上只有一名警察和一个小偷,小镇的一头有一家酒馆,另一头有一家银行,因为分身乏术,警察一次只能在一个地方巡逻,而小偷也只能去一个地方。银行需要保护的财产价格为2万元;酒馆的财产价格为1万元。警察怎么巡逻才能使效果最好?第44页,本讲稿共46页分析分析警察警察的最优策略是:抽签决定去银行还是酒馆。银行的财产是酒馆的2倍,所以用2个签代表:1、2号签去银行,3号签去酒馆。警察有2/3机会去银行巡逻,1/3机会去酒馆巡逻。小偷小偷的最优策略是:以同样抽签的办法决定去银行还是去酒馆。抽到1、2号签去酒馆,抽到3号签去银行。小偷有1/3机会去银行,2/3机会去酒馆。第45页,本讲稿共46页混合策略纳什均衡混合策略纳什均衡“石头、剪子、布”游戏:每个参与者的最优策略是采取每个策略的可能性都是1/3;猜硬币游戏:每个参与者的最优策略是选择正反面的概率都是1/2。这一类博弈没有纯策略纳什均衡点(纯策略是指局中人在他的策略集中选取唯一确定的策略),而只有混合策略均衡点(混合策略是指居中人在各种备选策略中采取随机方式选取并且可以改变,而使之满足一定的概率的策略)。第46页,本讲稿共46页