《第二章完全且完美信息静态博弈.ppt》由会员分享,可在线阅读,更多相关《第二章完全且完美信息静态博弈.ppt(108页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 完全信息静态博弈完全信息静态博弈4/5/20231一、博弈的数学描述一、博弈的数学描述2.1 2.1 基本分析思路和方法基本分析思路和方法 假假设设一一个个博博弈弈有有n个个博博弈弈方方,博博弈弈方方i i的的策策略略集集(又又称称策策略略空空间间)为为S Si i(i(i=1,2,n)=1,2,n),用用s sijij S Si i表表示示博博弈弈方方i i的的第第j j个个策策略略;若若s si iSSi i(i(i=1,2,n),=1,2,n),称称s=(ss=(s1 1,s,s2 2,s sn n)为为一一个个策策略略组组合合;若若用用s s-i-i=(s(s1 1,s,
2、s2 2,s,si-1i-1,s si+1i+1,s sn n),则则 s s=(s si i,s,s-i-i)。4/5/20232用用u ui i(s(s)=u)=ui i(s(s1 1,s,s2 2,s sn n)(i=1,2,n)(i=1,2,n)表示表示博弈方博弈方i i 在在策略组合策略组合s=(ss=(s1 1,s,s2 2,s sn n)的的得益得益,u ui i是策略集是策略集S S1 1SS2 2S Sn n上上的多元函数。的多元函数。定义定义1:若一个博弈的策略空间为若一个博弈的策略空间为S Si i,得益函数为得益函数为:u ui i(s(s)=u)=ui i(s(s1
3、1,s,s2 2,s sn n)(i)(i=1,2,n),=1,2,n),则该博弈表示为:则该博弈表示为:G=G=SS1 1,S,S2 2,S Sn n;u u1 1,u,u2 2,u,un n 。4/5/20233二、上策均衡二、上策均衡定义定义2:一个博弈一个博弈G,若对若对博弈方博弈方i i及及所有所有s si i都有都有u ui i (s si i,s,s-i-i)u ui i (s si i,s,s-i-i),则称则称s si i是是s si i的的严格上策严格上策,s si i是是s si i的的严格下策严格下策。即:即:如果不管其他博弈方选择什么策略,一博弈方的某个如果不管其他博
4、弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其他策略,该策略称为该博弈策略给他带来的得益始终高于其他策略,该策略称为该博弈方的一个方的一个“严格上策严格上策”。4/5/20234定义定义3:若在博弈若在博弈G中对每个博弈方中对每个博弈方i都存在策略都存在策略s si i*是其它是其它所有策略的所有策略的严格上策严格上策,则称策略组合则称策略组合s s*=(s=(s1 1*,s,s2 2*,s sn n*)是是G G的的上策均衡上策均衡。在第一章的在第一章的“囚徒困境囚徒困境”博弈中,其中博弈中,其中(坦白,坦白)坦白,坦白)就就是一个上策均衡。而其它例子都没有上策均衡。是一个上策
5、均衡。而其它例子都没有上策均衡。上策均衡反映了所有博弈方的上策均衡反映了所有博弈方的绝对偏好绝对偏好,因此非常稳定,因此非常稳定,根据上策均衡可以对博弈结果作出最肯定的预测。根据上策均衡可以对博弈结果作出最肯定的预测。4/5/20235三、严格下策反复消去法三、严格下策反复消去法在在博弈博弈G中博弈方的严格下策当然是博弈方实际上中博弈方的严格下策当然是博弈方实际上不愿选不愿选择择的策略的策略,因此可以从博弈方的策略集中去掉。,因此可以从博弈方的策略集中去掉。定义定义4:若博弈若博弈G中每个博弈方都反复去掉严格下策后剩下唯中每个博弈方都反复去掉严格下策后剩下唯一策略组合一策略组合s s*=(s=
6、(s1 1*,s,s2 2*,s sn n*),则称则称s s*=(s=(s1 1*,s,s2 2*,s sn n*)为为G G的的反复消去严格下策均衡反复消去严格下策均衡。4/5/20236 显然第一章的显然第一章的“智猪博弈智猪博弈”中大猪中大猪“按按”、小猪、小猪“等待等待”是是一一个个 反复消去严格下策均衡反复消去严格下策均衡。例例1:博弈博弈G如右图:如右图:1,01,30,10,40,22,0博弈方博弈方 左左 中中 右右求解反复消去严格下策均衡的方法称为求解反复消去严格下策均衡的方法称为严格下策反复消去法严格下策反复消去法。博弈方博弈方上上下下4/5/20237 解:解:博弈方博
7、弈方的策略的策略“右右”是是策略策略“中中”的严格下策,消去策的严格下策,消去策略略“右右”后为:后为:0,41,00,21,3左左 中中 博弈方博弈方的策略的策略“下下”是策是策略略“上上”的严格下策,消去策略的严格下策,消去策略“下下”后为:后为:1,01,3左左 中中上上 博弈方博弈方的策略的策略“左左”是策略是策略“中中”的严格下策,消去策略的严格下策,消去策略“左左”后为可知后为可知(上,中)(上,中)就是该就是该博弈博弈反复消去严格下策均衡。反复消去严格下策均衡。1,01,30,10,40,22,0 左左 中中 右右上上下下4/5/20238 严格下策反复消去法中每次消去的必须是严
8、格下策反复消去法中每次消去的必须是严格下策严格下策,否,否则会出现一些意想不到的结果。则会出现一些意想不到的结果。例例2:博弈博弈G如下图如下图:1,81,62,80,80,80,91,50,80,6博弈方博弈方 L M R4/5/202391,81,62,80,80,80,91,5 0,8 0,6 解:解:1)博弈方)博弈方的策略的策略“L”和和“M”都是策略都是策略“R”的下策的下策(不是严格下策不是严格下策),消,消去策略去策略“L”和和“M”后为:后为:0,90,81,8 R 博弈方博弈方的策略的策略“S”和和“D”都是策略都是策略“U”的严格下策,的严格下策,消去策略消去策略“S”和
9、和“D”后剩下唯后剩下唯一策略组合一策略组合(U,R)。L M RU SD4/5/202310 1,81,62,80,80,80,91,5 0,8 0,6 2)博弈方)博弈方的策略的策略“S”和和“D”都是策略都是策略“U”的下策的下策(不是严格下策不是严格下策),消消去策略去策略“S”和和“D”后为后为:博弈方博弈方的策略的策略“M”和和“R”都是策略都是策略“L”的下策的下策(不是严格下策不是严格下策),消去策略,消去策略“M”和和“L”后剩下唯一策后剩下唯一策略组合略组合(U,L)。L M RU SD1,81,62,8L M R U4/5/202311四、划线法四、划线法博弈方的最终目标
10、都是实现自身的最大利益。在具有策略和博弈方的最终目标都是实现自身的最大利益。在具有策略和利益相互依存性的博弈问题中,各个博弈方的得益既取决于自利益相互依存性的博弈问题中,各个博弈方的得益既取决于自己选择的策略,还与其他博弈方选择的策略有关,因此博弈方己选择的策略,还与其他博弈方选择的策略有关,因此博弈方在决策时必须考虑其他博弈方的存在和策略选择。在决策时必须考虑其他博弈方的存在和策略选择。思路:思路:找出自己针对其他博弈方每种策略或策略组合(对多找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策人博弈)的最佳对策,即自己的可选策略中与其他博弈方
11、的策略或策略组合配合,给自己带来最大得益的策略(这种相对最略或策略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,不过不一定唯一)。若存在一个策略组合,佳对策总是存在的,不过不一定唯一)。若存在一个策略组合,使得所有博弈方的得益值下都划了线,则该策略组合就是一个使得所有博弈方的得益值下都划了线,则该策略组合就是一个纳什均衡。纳什均衡。4/5/202312例例3:博弈博弈G如右图:如右图:0,41,00,00,20,11,3博弈方博弈方 左 中 右解:解:该博弈的纳什均衡为该博弈的纳什均衡为(上,中)(上,中)。博弈方博弈方 上下4/5/202313例例4:博弈博弈G如下图:如下
12、图:2,81,61,80,80,60,80,81,50,9博弈方博弈方 L M R解:解:该博弈有两个纳什均衡该博弈有两个纳什均衡(U,L)和和(U,R)。U博弈方博弈方 S D4/5/202314例例5:博弈博弈G如下图:如下图:-1,1 1,-11,-1-1,1猜硬币方猜硬币方正面正面 反面反面盖盖硬硬币币方方正面正面反面反面该博弈没有一个策略组合是双方同时愿意接受的。该博弈没有一个策略组合是双方同时愿意接受的。没有纯策略纳什均衡。没有纯策略纳什均衡。4/5/202315 例例6:博弈博弈G如下图:如下图:2,1 0,0 0,01,3丈夫丈夫时装时装 足球足球妻妻子子时装时装足球足球该博弈
13、有两个策略组合是双方同时愿意接受的:该博弈有两个策略组合是双方同时愿意接受的:(时装,时装),(足球,足球)(时装,时装),(足球,足球)。但是,由于具有上述特征。但是,由于具有上述特征的策略组合不是唯一的一个,因此我们也无法确定哪一个会出的策略组合不是唯一的一个,因此我们也无法确定哪一个会出现,对于这种博弈,划线法显然也没有完全解决问题。现,对于这种博弈,划线法显然也没有完全解决问题。4/5/202316五、箭头法五、箭头法 箭头法与划线法的分析思路不同,但效果与划线法相同。箭头法与划线法的分析思路不同,但效果与划线法相同。考察在每个策略组合处各个博弈方能否通过单独改变自己考察在每个策略组合
14、处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组。益数组引一箭头,到改变策略后策略组合对应的得益数组。若存在一策略组合,其得益数组若存在一策略组合,其得益数组只有进来只有进来的箭头而的箭头而没有出去没有出去的箭头,则该策略组合就是纳什均衡。的箭头,则该策略组合就是纳什均衡。4/5/202317例例7:博弈博弈G如右图:如右图:1,01,30,10,40,20,0博弈方博弈方 左左 中中 右右纳什均衡为纳什均衡为(上,中)(上,中)。博弈方博弈方上下4/5/2
15、02318斗鸡斗鸡B进攻进攻 退却退却-3,-32,00,20,0例例8:斗鸡博弈斗鸡博弈 (进,退进,退)和和(退,进退,进)是两个是两个纳什纳什均衡。均衡。斗鸡A进攻退却4/5/202319 一、纳什均衡的定义一、纳什均衡的定义定义定义5:博弈博弈G=SG=S1 1,S,S2 2,S Sn n;u u1 1,u,u2 2,u,un n 中中,若存在策略,若存在策略组合组合s s*=(s=(s1 1*,s,s2 2*,s sn n*),任一博弈方任一博弈方 i的策略的策略s si i*都是对其余都是对其余博弈方策略组合博弈方策略组合 s s-i-i*(s(s1 1*,s,s2 2*,s,si
16、-1i-1*,s,si+1i+1*,s sn n*)最佳对最佳对策,即策,即u ui i(s(si i*,s,s-i-i*)u ui i(s(si i,s,s-i-i*)对任意对任意s si iSSi i都成立,都成立,则称则称s s*=(s(s1 1*,s,s2 2*,s sn n*)是是G G的一个的一个纳什均衡纳什均衡。2.2 2.2 纳什均衡纳什均衡4/5/202320二、纳什均衡的一致预测性二、纳什均衡的一致预测性一致预测性一致预测性是指这样一种性质:如果所有博弈方都预测一个是指这样一种性质:如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测特定的博弈结果
17、会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会成为博弈的结果真会成为博弈的结果。即:即:如果所有博弈方都预测一个特定的纳什均衡会出现,那么,如果所有博弈方都预测一个特定的纳什均衡会出现,那么,没有人有兴趣作不同的选择。没有人有兴趣作不同的选择。一致预测性是纳什均衡的一致预测性是纳什均衡的本质属性本质属性。一致预测性使纳什均衡是一致预测性使纳什均衡是稳定稳定的和的和自我强制自我强制的。
18、的。4/5/202321三、纳什均衡与严格下策反复消去法三、纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡,但反过来纳什均上策均衡肯定是纳什均衡,但反过来纳什均衡不一定是上策均衡,因此上策均衡是比纳什衡不一定是上策均衡,因此上策均衡是比纳什均衡更强、稳定性更高的均衡概念。只是,上均衡更强、稳定性更高的均衡概念。只是,上策均衡在博弈问题中的普遍性比纳什均衡要差策均衡在博弈问题中的普遍性比纳什均衡要差得多。得多。4/5/202322命题命题1:在在n个博弈方的博弈个博弈方的博弈G=SG=S1 1,S,S2 2,S Sn n;u u1 1,u,u2 2,u,un n 中,如果中,如果s s*=(
19、s=(s1 1*,s,s2 2*,s sn n*)是是G的一个纳什均的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。衡,那么严格下策反复消去法一定不会将它消去。证:证:用反证法:用反证法:设策略组合设策略组合 (s(s1 1*,s,s2 2*,s sn n*)是博弈是博弈G的一的一个纳什均衡,且博弈方个纳什均衡,且博弈方i的策略的策略s si i*,是该策略组合中第一个由是该策略组合中第一个由于相对于该博弈方的其他策略是严格下策而被消去的策略于相对于该博弈方的其他策略是严格下策而被消去的策略(也许也许是在其他某些策略被消去以后是在其他某些策略被消去以后)。则必然存在博弈方。则必然存在博
20、弈方i的某个策的某个策略略s si i,该,该s si i在在s si i*被被消去的时候还没有被消去,并且是相对于消去的时候还没有被消去,并且是相对于s si i*的严格上策,即满足:的严格上策,即满足:4/5/202323u ui i (s si i,s,s-i-i)u ui i (s si i,s,s-i-i)(1)(1)对任意由其他博弈方此时尚未消去的所有策略构成的策略组合对任意由其他博弈方此时尚未消去的所有策略构成的策略组合s s-i-i=(s=(s1 1,s,si-1i-1,s,si+1i+1,s sn n)都成立都成立。由于假设由于假设s si i是是纳什均衡纳什均衡(s(s1
21、1*,s,s2 2*,s sn n*)的各方策略中第一个的各方策略中第一个被消去的,被消去的,因因此其他博弈方的策略此其他博弈方的策略s s1 1,s,si-1i-1,s si+1i+1,s sn n,在,在s si i被消去的时候都还没有被消去,于是对被消去的时候都还没有被消去,于是对s s-i-i=(s=(s1 1,s,si-1i-1,s,si+1i+1,s sn n)也必须成立即也必须成立即:u ui i (s si i,s,s-i-i*)u ui i (s si i,s,s-i-i*)(2)(2)4/5/202324 这显然与这显然与(s(s1 1*,s,s2 2*,s sn n*)是
22、纳什均衡策略组合的假设相矛是纳什均衡策略组合的假设相矛盾,因为不等式盾,因为不等式(2)表明表明s si i不是博弈方不是博弈方i对其他博弈方的策略对其他博弈方的策略组合的最佳反应。组合的最佳反应。该矛盾证明了开头所作的:纳什均衡被严格下策反复消该矛盾证明了开头所作的:纳什均衡被严格下策反复消去法消去的假设是不可能成立的,这样命题去法消去的假设是不可能成立的,这样命题1就得到了证明。就得到了证明。4/5/202325 命题命题2:在在n 个个博弈方的博弈博弈方的博弈G中,如果严格下策反复消去中,如果严格下策反复消去法排除了除法排除了除s s*=(s=(s1 1*,s,s2 2*,s sn n*
23、)之外的所有策略组合,那么之外的所有策略组合,那么s s*一定是该博弈惟一的纳什均衡。一定是该博弈惟一的纳什均衡。证:证:命题命题2的后半部分即惟一性可由命题的后半部分即惟一性可由命题1的结论得到证明。的结论得到证明。下面用反证法证明前半部分:下面用反证法证明前半部分:4/5/202326 设严格下策反复消去法已经消去除了设严格下策反复消去法已经消去除了s s*=(s=(s1 1*,s,s2 2*,s sn n*)以外的所有策略组合。但以外的所有策略组合。但s s*却不是一个却不是一个纳什均衡。就是说,至少存在某个博弈方纳什均衡。就是说,至少存在某个博弈方i的某个策略的某个策略s si i使使
24、得:得:u ui i(s(si i,s,s-i-i*)u ui i(s(si i*,s,s-i-i*)(1)(1)但由于但由于s s*是经过严格下策反复消去法以后留下的惟一策是经过严格下策反复消去法以后留下的惟一策略组合,因此略组合,因此s si i必然是被严格下策反复消去法消去的策略。也必然是被严格下策反复消去法消去的策略。也就是说,在严格下策反复消去过程中的某个阶段,必然存在某就是说,在严格下策反复消去过程中的某个阶段,必然存在某个当时还没有被消去的策略个当时还没有被消去的策略s si i使得:使得:4/5/202327u ui i (s si i,s,s-i-i)u ui i (s si
25、 i,s,s-i-i)(2)(2)对由此时尚未被消去的,其他博弈方的策略构成的所对由此时尚未被消去的,其他博弈方的策略构成的所有策略组合有策略组合s s-i-i都成立。都成立。由于由于s s*是本博弈经过严格下策反复消去法以后惟一留下是本博弈经过严格下策反复消去法以后惟一留下的策略组合,因此策略的策略组合,因此策略s s1 1,s si-1i-1,s,si+1i+1,s sn n始终不会被始终不会被消去,因此也应该满足消去,因此也应该满足(2)式,即式,即:u ui i (s si i/,s,s-i-i*)u ui i (s si i,s,s-i-i*)(3)(3)4/5/202328 如果如
26、果s si i/就是就是s si i*,即即s si i*是是相对于相对于s si i的严格上策,则的严格上策,则(3)式式和和(1)式相矛盾,从而式相矛盾,从而s s*不是纳什均衡的假设不能成立。这就不是纳什均衡的假设不能成立。这就证明了命题证明了命题。如果如果s si i/与与s si i*不同,则不同,则s si i/在在严格下策反复消去的过程严格下策反复消去的过程中也必须被消去中也必须被消去(要不然要不然s s*就不会是留下的惟一的策略组合就不会是留下的惟一的策略组合)。4/5/202329 进一步推定在某阶段存在进一步推定在某阶段存在s si i/是相对于是相对于s si i/的的严
27、格上策,严格上策,用用s si i/和和s si i/分别代替分别代替s si i/和和s si i时,时,(2)式和式和(3)式仍然必须成立,式仍然必须成立,如果如果s si i/就是就是s si i*,则与上相同也证明了命题。则与上相同也证明了命题。否则用否则用s si i/代替代替s si i/重复上述过程。这样,总会找到某重复上述过程。这样,总会找到某个个s si i(k(k)就是就是s si i*,从而证明在前述假设下必然导致从而证明在前述假设下必然导致(1)式和式和(3)式的矛盾,否定前述假设成立的可能性,由此证明了命题式的矛盾,否定前述假设成立的可能性,由此证明了命题2。4/5/
28、202330 根据上一节的分析已经明白,分析完全信息静态博弈的根据上一节的分析已经明白,分析完全信息静态博弈的关键是找出其中的纳什均衡。但前面所讨论都是可通过策略之关键是找出其中的纳什均衡。但前面所讨论都是可通过策略之间的两两比较进行分析的有限策略博弈模型。间的两两比较进行分析的有限策略博弈模型。在无限策略、连续策略空间的博弈中,纳什均衡的概念在无限策略、连续策略空间的博弈中,纳什均衡的概念同样适用。我们通过具体模型来说明这种博弈的纳什均衡分析同样适用。我们通过具体模型来说明这种博弈的纳什均衡分析方法。方法。2.3 2.3 无限策略博弈分析和反应函数无限策略博弈分析和反应函数4/5/20233
29、1一、古一、古诺(诺(CournotCournot)模型模型 古诺模型是研究寡头垄断市场的古诺模型是研究寡头垄断市场的经典模型经典模型,在古诺模型中,在古诺模型中,假设一个市场有两家生产同一种产品的厂商。如果厂商假设一个市场有两家生产同一种产品的厂商。如果厂商1 1的产的产量为量为q q1 1,厂商厂商2 2的产量为的产量为q q2 2,则市场总产量为则市场总产量为Q Qq q1 1十十q q2 2。设市设市场出清价格场出清价格P(P(即可以将产品全部卖出去的价格即可以将产品全部卖出去的价格)是市场总产量是市场总产量的函数的函数(即逆需求函数即逆需求函数)P=P(QP=P(Q)a-Qa-Q。再
30、设两厂商有相同再设两厂商有相同的单位生产成本的单位生产成本c c1 1=c=c2 2=c=c,且都没有固定成本,则该博弈中两博且都没有固定成本,则该博弈中两博弈方的弈方的得益得益(即两厂商各目的利润即两厂商各目的利润)分别为分别为:4/5/202332和和虽然本博弈中两博弈方都有虽然本博弈中两博弈方都有无限多种无限多种可选策略,但可选策略,但根据纳根据纳什均衡的定义我们知道,纳什均衡就是具有相互是最优对策什均衡的定义我们知道,纳什均衡就是具有相互是最优对策性质的各博弈方策略组成的策略组合。性质的各博弈方策略组成的策略组合。(1)(2)4/5/202333 因此,如果假设策略组合因此,如果假设策
31、略组合(q(q1 1*,q,q2 2*)是本博弈的纳什均衡,是本博弈的纳什均衡,则则(q(q1 1*,q,q2 2*)必须是使得两博弈方的得益达到最大值必须是使得两博弈方的得益达到最大值,即满足即满足:4/5/202334 要要求求上上式式的的最最大大值值,只只需需(1)(1)、(2)(2)两两式式分分别别对对q q1 1、q q2 2求求偏偏导导并并令令两两个个偏偏导导数数都都等等于于零零,由由此此可可得得q q1 1*,q,q2 2*应应满满足足方方程程组组:4/5/202335 解之得该方程组唯解之得该方程组唯的一组解的一组解:两博弈方的均衡得益两博弈方的均衡得益(利润利润)分别为分别为
32、:均衡总产量为:均衡总产量为:具体地具体地,若设若设:则则:4/5/202336 如果想对上述博弈结果作效率评价,可以再从两厂商总如果想对上述博弈结果作效率评价,可以再从两厂商总体利益最大化的角度作一次产量选择,根据已知条件求实现体利益最大化的角度作一次产量选择,根据已知条件求实现总得益总得益(总利润总利润)最大的总产量最大的总产量。设总产量为设总产量为Q,则总得益为则总得益为UPQ cQQ(8Q)2Q6Q Q2。很容易求得使总得益最大的总产量很容易求得使总得益最大的总产量Q*3,最大总得最大总得益益U*9。4/5/202337 将此结果与两厂商独立决策,追求自身而不是共同利益将此结果与两厂商
33、独立决策,追求自身而不是共同利益最大化时的博弈结果相比,不难发现此时总产量较小,而总利最大化时的博弈结果相比,不难发现此时总产量较小,而总利润却较高润却较高。因此从两厂商的总体来看,根据总体利益最大化确定产因此从两厂商的总体来看,根据总体利益最大化确定产量效率更高。换句话说,如果两厂商更多考虑合作,联合起来量效率更高。换句话说,如果两厂商更多考虑合作,联合起来决定产量,先定出使总利益最大的产量后各自生产一半决定产量,先定出使总利益最大的产量后各自生产一半(1.5,1.5单位单位),则各自可分享到的利益为,则各自可分享到的利益为4.5,比只考虑自身利益,比只考虑自身利益的独立决策行为得到的利益要
34、高。的独立决策行为得到的利益要高。4/5/202338 当然,在独立决策、缺乏协调机制的两个企业之当然,在独立决策、缺乏协调机制的两个企业之间,上述合作的结果并不容易实现,即使实现了也往间,上述合作的结果并不容易实现,即使实现了也往往是不稳定的。合作难以实现或维持的原因主要是:往是不稳定的。合作难以实现或维持的原因主要是:各生产一半实现最大总利润产量的产量组合各生产一半实现最大总利润产量的产量组合(1.5,1.5)不是该博弈的纳什均衡策略组合。不是该博弈的纳什均衡策略组合。4/5/202339 也就是说,在这个策略组合下,双力都可以通过独自改也就是说,在这个策略组合下,双力都可以通过独自改变变
35、(增加增加)自己的产量而得到更高的利润,它们都有突破自己的产量而得到更高的利润,它们都有突破1.5单单位产量的冲动。在缺乏由强制作用的协议等保障手段的情况下,位产量的冲动。在缺乏由强制作用的协议等保障手段的情况下,这种冲动注定了维持上述较低水平的产量组合是不可能的,两这种冲动注定了维持上述较低水平的产量组合是不可能的,两厂商早晚都会增产,只有达到纳什均衡的产量水平厂商早晚都会增产,只有达到纳什均衡的产量水平(2,2)时才时才会稳定下来。会稳定下来。因为只有这时候任一厂商单独改变产量才不利于自己,因为只有这时候任一厂商单独改变产量才不利于自己,这实际上也是一种这实际上也是一种“囚徒困境囚徒困境”
36、,如果将遵守限额还是突破限,如果将遵守限额还是突破限额作为厂商面临的选择,则构成了得益矩阵如下图的博弈。额作为厂商面临的选择,则构成了得益矩阵如下图的博弈。4/5/2023404.5,4.53.75,55,3.754,4厂商厂商2不突破不突破 突破突破当然不难看出该博弈是一个囚徒困境博弈。当然不难看出该博弈是一个囚徒困境博弈。上述两寡头产量博弈只是古上述两寡头产量博弈只是古诺诺模型中比较简单的一个特模型中比较简单的一个特例,更一般的古例,更一般的古诺诺模型是包括模型是包括n 个寡头的寡占市场产量决策。个寡头的寡占市场产量决策。但其分析方法是一样的。但其分析方法是一样的。典型例子:典型例子:石油
37、输出国组织的限额和突破问题石油输出国组织的限额和突破问题F4厂商厂商1不突破不突破突破突破4/5/202341二、反应函数二、反应函数古诺模型的纳什均衡也可以通过对划线法思路的推广来求,古诺模型的纳什均衡也可以通过对划线法思路的推广来求,划线法的思路是先找出划线法的思路是先找出每个博弈方每个博弈方针对针对其他博弈方所有策略其他博弈方所有策略(或策略组合或策略组合)的的最佳最佳对策,然后再找出相互构成最佳对策的对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,也就是博弈的纳什均衡。各博弈方策略组成的策略组合,也就是博弈的纳什均衡。在无限策略的在无限策略的古诺古诺博弈模型中这样的思路实
38、际上也是可行博弈模型中这样的思路实际上也是可行的,只是其他博弈方的策略现在有无限多种,因此各个博弈的,只是其他博弈方的策略现在有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数方的最佳对策也有无限种,它们之间往往构成一种连续函数关系。关系。4/5/202342 在上面讨论的两寡头古诺模型中,对厂商在上面讨论的两寡头古诺模型中,对厂商2的任意产量的任意产量q q2 2,厂商厂商1的最佳对策产量的最佳对策产量q q1 1,就是使白己在厂商就是使白己在厂商2生产产量生产产量q q2 2的情的情况下利润最大化的产量,即况下利润最大化的产量,即q q1 1是最大化问题:是最大化
39、问题:的解。上式对的解。上式对q q1 1求导求导并令导数等于并令导数等于0:由此得:由此得:4/5/202343 这样我们得到了对于厂商这样我们得到了对于厂商2的每的每个可能的产量,厂商个可能的产量,厂商1的的最佳对策最佳对策产量的计算公式,它是厂商产量的计算公式,它是厂商2产量的一个连续函数,产量的一个连续函数,我们称这个连续函数为厂商我们称这个连续函数为厂商1对厂商对厂商2产量的一个产量的一个“反应函数反应函数”(Reaction Function)。同样的方法,我们可再求出厂商同样的方法,我们可再求出厂商2对厂对厂商商1产量产量q q1 1的反应函数:的反应函数:q q2 26363q
40、 q1 1由于这两个反应函数都是连续的由于这两个反应函数都是连续的线性函数,因此可以用坐标平面线性函数,因此可以用坐标平面上的两条直线表示它们上的两条直线表示它们,如图如图:(2,2)4/5/202344 从图中可以看出,当一方的产量选择为从图中可以看出,当一方的产量选择为0时,另一方的时,另一方的最最佳反应为佳反应为3。这正是实现市场总利润最大的产量,因为这时候。这正是实现市场总利润最大的产量,因为这时候等于由一个厂商垄断市场,市场总体利润就是该厂商的利益;等于由一个厂商垄断市场,市场总体利润就是该厂商的利益;当一方的产量达到当一方的产量达到6时,另一方时,另一方被迫选择被迫选择0,因为这时
41、后者坚持因为这时后者坚持生产已经生产已经无利可图无利可图。在两个反应函数对应的两条直线上,只有它们的交点在两个反应函数对应的两条直线上,只有它们的交点(2,2)代表的产量组合,才是由相互对对方的最佳反应产量构成代表的产量组合,才是由相互对对方的最佳反应产量构成的。的。R1(q2)上的其他所有点上的其他所有点(q q1 1,q,q2 2)只有只有q q1 1是对是对q q2 2的的最佳反最佳反应应,q q2 2 不是不是对对q q1 1的最佳反应,而的最佳反应,而R2(q1)上的点则刚好相反。上的点则刚好相反。4/5/202345 根据纳什均衡的定义,根据纳什均衡的定义,(2,2)是该古诺模型的
42、纳什是该古诺模型的纳什均衡,并且因为它是惟一的一个,因此应该是该均衡,并且因为它是惟一的一个,因此应该是该博弈的博弈的结果结果。这个结论与前面直接根据纳什均衡定义得到的完这个结论与前面直接根据纳什均衡定义得到的完全全样。样。4/5/202346现在我们把反应函数法应用到伯特兰德模型的分析。伯现在我们把反应函数法应用到伯特兰德模型的分析。伯持兰德持兰德1883年提出了另一种形式的寡占模型。这种模型与年提出了另一种形式的寡占模型。这种模型与选择产量的古诺模型的区别在于,伯特兰德模型中各厂商选择产量的古诺模型的区别在于,伯特兰德模型中各厂商所选择的是所选择的是价格价格而不是产量。我们用简单的两寡头且
43、产品而不是产量。我们用简单的两寡头且产品有一定差别的伯特兰德价格博弈模型进行分析。有一定差别的伯特兰德价格博弈模型进行分析。三、伯特兰德三、伯特兰德(Bertrand)寡头模型寡头模型4/5/202347 上述产品有一定差别是指两个厂商生产的是同类产品,上述产品有一定差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同,因此伯特兰德模但在品牌、质量和包装等方面有所不同,因此伯特兰德模型中厂商的产品之间有很强的型中厂商的产品之间有很强的替代性替代性。但又不是完全可替。但又不是完全可替代,即价格不同时,价格较高的不会完全销不出去。当厂代,即价格不同时,价格较高的不会完全销不出去。当
44、厂商商1和厂商和厂商2价格分别为价格分别为P1和和P2时,它们各自的时,它们各自的需求函数需求函数为:为:和和4/5/202348 从上式可以看出产品之间是有差别的,其中从上式可以看出产品之间是有差别的,其中d1,d20即即两厂商产品的替代系数。我们也假设两厂商无固定成本,假设两厂商产品的替代系数。我们也假设两厂商无固定成本,假设边际生产成本分别为边际生产成本分别为c c1 1和和c c2 2。两博弈方的得益函数分别为:两博弈方的得益函数分别为:我们直接用反应函数法分析这个博弈。上两式分别对我们直接用反应函数法分析这个博弈。上两式分别对P1和和P2求偏导,并令偏导数为求偏导,并令偏导数为0,由
45、此得:由此得:4/5/202349很容易求出两厂商对对方策略很容易求出两厂商对对方策略(价格价格)的反应函数分别为的反应函数分别为和和4/5/202350 纳什均衡纳什均衡(P1*,P2*)必是两反应函数的必是两反应函数的交点交点,即必须满足:,即必须满足:求解此方程组即可得到求解此方程组即可得到纳什均衡纳什均衡(P1*,P2*):记:记:4/5/202351具体地,如果进一步假设模型中的参数分别为:具体地,如果进一步假设模型中的参数分别为:将将P1*,P2*代入得益函数则可进一步得到两厂商的代入得益函数则可进一步得到两厂商的均衡得均衡得益益值。值。则可以得到:则可以得到:P1*P2*20,u
46、1*u2*324。4/5/202352 值得一提的另外一点是,这种价格决策与古诺模型中值得一提的另外一点是,这种价格决策与古诺模型中的产量决策一样,其纳什均衡也不如各博弈方通过协商、合的产量决策一样,其纳什均衡也不如各博弈方通过协商、合作得到的最佳结果,因此也是囚徒困境的一种。作得到的最佳结果,因此也是囚徒困境的一种。上述模型是伯特兰德模型较简单的情况。更一般的情况上述模型是伯特兰德模型较简单的情况。更一般的情况是有是有n个个寡头寡头的价格决策,并且产品也可以是的价格决策,并且产品也可以是无差别无差别的。的。4/5/202353随着社会经济的不断发展,我们越来越无法回避随着社会经济的不断发展,
47、我们越来越无法回避公共资源公共资源利用利用、公共设施提供公共设施提供和和公共环境保护公共环境保护等方面的问题。而在这些等方面的问题。而在这些问题中,也包含了众多的博弈关系。我们以人们对公共资源利问题中,也包含了众多的博弈关系。我们以人们对公共资源利用方面的博弈关系为例来作一些讨论。用方面的博弈关系为例来作一些讨论。四、公共资源问题四、公共资源问题4/5/202354 在经济学中,所谓公共资源是指具有在经济学中,所谓公共资源是指具有(1)没有哪个个人、企没有哪个个人、企业或组织拥有所有权业或组织拥有所有权;(2)大家都可以自由利用大家都可以自由利用,这样两个特,这样两个特征的自然资源或人类生产的
48、供征的自然资源或人类生产的供大众免费使用大众免费使用的设施和财货。的设施和财货。例如大家都可以开采使用的地下水,可自由放牧的草地,例如大家都可以开采使用的地下水,可自由放牧的草地,可自由排放废水的公共河道可自由排放废水的公共河道(假设政府未予限制假设政府未予限制),以及公共道,以及公共道路、楼道的照明灯等。路、楼道的照明灯等。由于公共资源有上述两个特征,因而利用这些资源时不由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价,除非政府将这些资源收归国有,并对使用者征支付任何代价,除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。收资源税或收取类似的费用。4/5/2023
49、55 最晚是从休漠最晚是从休漠1739年开始,政治经济学者们就己经开始认年开始,政治经济学者们就己经开始认识到,在人们完全从自利动机出发自由利用公共资源时,公共识到,在人们完全从自利动机出发自由利用公共资源时,公共资源倾向于资源倾向于被过度利用被过度利用、低效率使用低效率使用和和浪费浪费,并且过度利用会,并且过度利用会达到任何利用它们的人都达到任何利用它们的人都无法得到实际好处无法得到实际好处的程度。的程度。我们用下面这个我们用下面这个公共草地的放牧公共草地的放牧问题为例来论证这个结论。问题为例来论证这个结论。设某村庄有设某村庄有n个农户,该村有一片大家都可以自由放牧羊群个农户,该村有一片大家
50、都可以自由放牧羊群的公共草地。出于这片草地的面积有限,因此只能让不超过某的公共草地。出于这片草地的面积有限,因此只能让不超过某一数量的羊群吃饱,如果在这片草地上放牧羊只的实际数量超一数量的羊群吃饱,如果在这片草地上放牧羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、毛、皮、肉的总价值肉的总价值)就会减少,甚至只能勉强存活或要饿死。就会减少,甚至只能勉强存活或要饿死。4/5/202356 假设这些农户在夏天才到公共草地放羊,而每年春天就假设这些农户在夏天才到公共草地放羊,而每年春天就要决定养羊的数量,因此可看作各农户在决定