《博弈论第二章-完全信息静态博弈课件.ppt》由会员分享,可在线阅读,更多相关《博弈论第二章-完全信息静态博弈课件.ppt(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 完全信息静态博弈完全信息静态博弈博弈问题分为四类;每一类对应着一个均衡完全信息静态博弈 Nash均衡完全信息动态博弈 子博弈精练Nash均衡不完全信息静态博弈 贝叶斯Nash均衡不完全信息动态博弈 精练贝叶斯Nash均衡均衡(equilibrium):是指有博弈中的几个博弈方每方选取的最佳策略所组成的一个策略组合。2023/5/251 博弈的基本概念及战略表述案例-房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿v假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;v如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿2
2、023/5/252中南财经政法大学信息学院博弈的基本概念及战略表述40004000,4000400080008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的战略式表述2023/5/253中南财经政法大学信息学院博弈的基本概念及战略表述博弈论的基本概念包括:参与人:博弈论中选择行动以最大化自己效用的决策主体;参与人:博弈论中选择行动以最大化自己效用的决策主体;行动
3、:参与人的决策变量行动:参与人的决策变量战略:参与人选择行动的规则战略:参与人选择行动的规则信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识支付函数:参与人从博弈中获得的效用水平支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合均衡:所有参与人的最优战略的组合均衡:所有参与人的最优战略的组合参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。2023/5/254中南财经政法大学信息学院不完全信息静态博弈-贝叶斯纳什均衡海萨尼(1967-1968)100,100-50,00,00,0不接受求爱博弈:品德优良者求爱求爱者进入不进入接受1
4、00,-100-50,00,00,0不接受你求爱者进入不进入接受求爱博弈:品德恶劣者求爱你100 x+(-100)(1-x)=0当x大于1/2时,接受求爱对手特征、战略空间行动自然选择参与人的类型自然选择参与人的类型2023/5/256中南财经政法大学信息学院不完全信息动态博弈-精练贝叶斯纳什均衡泽尔腾(1965)n成语故事:黔之驴-驴虎博弈 老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的。最终将毛驴吃掉。对手特征、支付函数、战略空间未知行动有先后2023/5/257中南财经政法大学信息学院博弈的基本概念及战略表述信息:参与人在博弈中的知识,特别是有关其他参与人的特信息
5、:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识。征和行动的知识。如房地产开发博弈中,如果如房地产开发博弈中,如果A A不知道市场需求,而不知道市场需求,而B B知道,则知道,则A A的信息集为的信息集为 大,小大,小,B B的信息集为的信息集为 大大 或或 小小 完美信息完美信息:指一个参与人对其他参与人(包括指一个参与人对其他参与人(包括“自然自然”)的)的行动选择有准确了解的情况,即每一个信息集只包含一个值。行动选择有准确了解的情况,即每一个信息集只包含一个值。完全信息完全信息:指自然不首先行动或自然的行动的初始行动所有指自然不首先行动或自然的行动的初始行动所有参与人观察到
6、的情况。参与人观察到的情况。共同知识共同知识:指指“所有参与人知道所有参与人知道所有参与人所有参与人知道所有参与人知道所有参与人知道知道.”.”的知识。的知识。2023/5/258中南财经政法大学信息学院博弈的基本概念及战略表述支付函数:参与人从博弈中获得的效用水平,或者指支付函数:参与人从博弈中获得的效用水平,或者指参与人得到的期望效用水平。参与人得到的期望效用水平。博弈的基本特征是一个参与人的支付不仅取决于自己博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择的战略选择,而且取决于所有其他参与人的战略选择2023/5/2510中南财经政法大学信息学
7、院博弈的基本概念及战略表述结果:博弈分析感兴趣的所有东西结果:博弈分析感兴趣的所有东西如均衡战略组合、均衡行动组合、均衡支付组合等。如均衡战略组合、均衡行动组合、均衡支付组合等。2023/5/2511中南财经政法大学信息学院博弈的基本概念及战略表述博弈的战略式表述:2023/5/2513中南财经政法大学信息学院博弈方乙对应着一个盈利u2(s1i,s2j)记bij=u2(s1i,s2j)得博弈方乙的盈利矩阵B=(bij)m若cij=(aij,bij)则有C=(cij)m=2023/5/2515中南财经政法大学信息学院二、两人零和博弈定义:在两人博弈问题中,若各盈利矩阵分别为:A=(aij)mB=
8、(bij)m且aij=-bij(或u1(s1i,s2j)+u2(s1i,s2j)=0)则称此博弈为两人零和博弈。2023/5/2516中南财经政法大学信息学院一种对策一种对策最大最小方法最大最小方法例题:设有博弈G=S1,S2,A 其中S1=(1,2 3 4),S2=(1 2 3)试分析其博弈。2023/5/2518中南财经政法大学信息学院解:方案一情形一:甲选3,乙选3。结局:博弈方甲不仅得不到9,反而输掉10。情形二:考虑到乙选3的心理,甲选4。结局:博弈方乙不但得不到10,反而损失6。分析得,双方都要考虑如何在不冒风险的情况下得到自己最好的收入。2023/5/2519中南财经政法大学信息
9、学院方案二对博弈方甲:A中每一行的最小数字(赢得最少最坏的情况)分别是:-8,2,-10,-3其中最大数字(最好的结果)为2。结果是:博弈方甲选结果是:博弈方甲选2 2参加博弈时,可保证收参加博弈时,可保证收益不低于益不低于2 2。2023/5/2520中南财经政法大学信息学院对博弈方乙:A中每一列的最大数字(输得最多最坏情况)分别是:9,2,6其中最小数字(最好的结果)为2。结果是:博弈方乙选结果是:博弈方乙选2 2参加博弈时,可保证至参加博弈时,可保证至多输掉多输掉2 2。结论:结论:策略组合(2,2)是一个最稳妥能使双方满足的一种策略组合。也称这样的策略组合为博弈问题在纯策略范围内的一个
10、解。2023/5/2521中南财经政法大学信息学院 两人零和纯策略对策两人零和纯策略对策 特点特点:博弈方只有两人博弈方只有两人,双方都只有有限个策略可供选择,双方都只有有限个策略可供选择,甲的策略集为:甲的策略集为:S=SS=S1 1,S S2 2,。,S S m m;乙的策略集为:乙的策略集为:N=NN=N1 1,N,N2 2,。N N n n 博弈方的博弈方的“得失得失”相加等于零相加等于零,这种对策称为,这种对策称为“零和对策零和对策”。在两人对策中,甲方的所获等于乙方的所失。在两人对策中,甲方的所获等于乙方的所失。假定在策略组合假定在策略组合(S(Si i,N,Nj j)下下(即甲取
11、策略即甲取策略S Si i ,乙取策略,乙取策略N Nj j时所形成的局势时所形成的局势),甲的收入或得益是,甲的收入或得益是a ai ji j。将所有的得益值将所有的得益值a aijij排成一个矩阵,叫做得益矩阵或支付矩阵。排成一个矩阵,叫做得益矩阵或支付矩阵。2023/5/2522中南财经政法大学信息学院其次,如果乙采取策略其次,如果乙采取策略N Nj j ,则乙至多失去则乙至多失去(第(第j列的最大者)列的最大者)由于乙希望由于乙希望ai j 越小越好越小越好,因此乙当然选择,因此乙当然选择 j,使得使得达到最小。即乙选择策略达到最小。即乙选择策略N Nj j,使得他的支付不多于:使得他
12、的支付不多于:(乙至多失去的数)(乙至多失去的数)例、例、设有一个两人零和有限对策、博弈方设有一个两人零和有限对策、博弈方A A的支付矩阵如下:的支付矩阵如下:求求A A和和B B的最优策略。的最优策略。2023/5/2524中南财经政法大学信息学院结论:甲方的最优策略为:策略结论:甲方的最优策略为:策略a a2 2 ,乙的最优策略为:策略乙的最优策略为:策略b b2 2。甲方:甲方:乙方:乙方:min:8293max:2max:16 2 5min:2解:解:2023/5/2525中南财经政法大学信息学院1 1、优劣策略、优劣策略定义:定义:设有G=S1,S2,A,B若对一切j(1jn),均有
13、aijakj则称博弈方甲的纯策略i优于纯策略k,或纯策略k劣于纯策略i。同样,若对一切i(1im)均有bijbik则称博弈方乙的纯策略j优于纯策略k,或纯策略k劣于纯策略j。三、一般两人博弈分析三、一般两人博弈分析(一)占优策略均衡(一)占优策略均衡2023/5/2526中南财经政法大学信息学院2 2、严优策略、严优策略定义:定义:设有G=S1,S2,A,B,若对于一切j(1jn),均有 aijakj且至少有一个j0(j01,2,n),使 则称纯策略i严优于纯策略k,或称纯策略k严劣于纯策略i。2023/5/2528中南财经政法大学信息学院 类似,若对于一切i(1im),均有 bijbik且至
14、少有一个i0(i01,2,m),使 则称纯策略j严优于纯策略k,或称纯策略k严劣于纯策略j。2023/5/2529中南财经政法大学信息学院由乙的盈利向量甲估计乙会采用策略3,这时甲就应选择策略1情形二:局中人乙无论如何不能选择2,或者说2为局中人乙的劣策略。2023/5/2531中南财经政法大学信息学院3 3、占优策略(上策)均衡、占优策略(上策)均衡(dominant-strategy equilibrium)一般来说,由于每个博弈方的效用是依赖于所有人的选择,因此每个博弈方的最优选择(策略)也依赖于所有其博弈方的选择(策略)。但是,当一个博弈方的最优选择并不依赖于他人的选择,这样的最优策略
15、就被称为“占优策略”(dominant strategy)。由所有博弈方的占优策略构成的战略组合被称为“占优均衡”。占优策略均衡的出现只要求所有博弈方都是理性的,但不要求每个博弈方知道其他博弈方是否理性。2023/5/2532中南财经政法大学信息学院占优策略:不论其他博弈方选择什么策略,博弈方的最优策略是唯一的,这样的最优策略称为“占优策略”(dominant strategy)。2023/5/2533中南财经政法大学信息学院占优策略均衡:定义:在博弈的策略表达式中,如果对于所有的在博弈的策略表达式中,如果对于所有的i i,S Si i*是是i i的占优策略,下列策略组合就称为占优策略均衡:的
16、占优策略,下列策略组合就称为占优策略均衡:理解:理解:当你身处同时行动的博弈问题时,你的最佳策略是什么?决定胜负的因素又是什么?当双方的策略选择是有迹可循时,并能形成某种“定式”即均衡 如果所有博弈方都有(严格)占优策略存在,那如果所有博弈方都有(严格)占优策略存在,那么占优策略均衡就是大家都可预测的唯一均衡。么占优策略均衡就是大家都可预测的唯一均衡。2023/5/2534中南财经政法大学信息学院特点二:个人理性有时与集体理性的冲突特点二:个人理性有时与集体理性的冲突下面要介绍的下面要介绍的“囚徒困境囚徒困境”就表明个人理性与就表明个人理性与集体理性的冲突。集体理性的冲突。且这样的例子很多:寡
17、头竞争,军备竞赛,团且这样的例子很多:寡头竞争,军备竞赛,团队生产中的劳动供给,公共产品的供给,等等;队生产中的劳动供给,公共产品的供给,等等;特点一:不要求理性是共同知识特点一:不要求理性是共同知识 占优策略只要求每个博弈方是理性的,而不占优策略只要求每个博弈方是理性的,而不要求每个博弈方知道其他博弈方是理性的(也就要求每个博弈方知道其他博弈方是理性的(也就是说,不要求理性是共同知识)。为什么?是说,不要求理性是共同知识)。为什么?2023/5/2535中南财经政法大学信息学院经典案例一囚徒困境(prisoners dilemma)坦白不坦白坦白不坦白8,8 0,1515,01,1无论对方如
18、何选择,每个人的最优选择:坦白。所以,我们可以预测,结果将是(坦白,坦白)2023/5/2536中南财经政法大学信息学院 经典案例一经典案例一囚徒困境囚徒困境-8,-80,-15-15,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖-8大于-150大于-1-8大于-150大于-1坦白是A的严格占优策略坦白是坦白是B的严格占优策略的严格占优策略2023/5/2537中南财经政法大学信息学院思考:有什么好的途径来解决思考:有什么好的途径来解决“囚囚徒困境徒困境”问题?问题?2023/5/2538中南财经政法大学信息学院用法规解决“囚徒困境”2023/5/2539中南财经政法大学信息学院例例1 1 为什
19、么在城市中心道路上禁止汽车鸣喇叭?禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因。见表3,当汽车司机可以鸣喇叭时,可能为汽车超速抢行提供条件。但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付(2,2)。2023/5/2540中南财经政法大学信息学院 表表1 1 交通博弈交通博弈 司机2 缓行 抢行 缓行 司机1 抢行 8,81,99,12,22023/5/2541中南财经政法大学信息学院 但但当当对对方方缓缓行行时时,自自己己抢抢行行会会占占便便宜宜,获获得得得益得益9 9。这这个个博博弈弈中中,“缓缓行行”是是劣劣策策略略,“占占优优策策略均衡略均衡”
20、(抢行(抢行,抢行),这不是一个好的均衡。抢行),这不是一个好的均衡。当当禁禁止止鸣鸣喇喇叭叭时时,司司机机为为了了避避免免造造成成交交通通事事故,只得缓行,从而得到好的结果(缓行故,只得缓行,从而得到好的结果(缓行,缓行)。缓行)。2023/5/2542中南财经政法大学信息学院例例2 2、苏格兰的草地为什么消失了?、苏格兰的草地为什么消失了?(公共(公共资源经常被过度利用的原因)资源经常被过度利用的原因)在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场
21、,但如果不限制放牧规模,过多的牛羊将草吃得一干二净,则今后不会再有新草生长出来,草场就会消失。2023/5/2543中南财经政法大学信息学院 由由于于草草地地的的产产权权没没有有界界定定,政政府府也也没没有有对对放放牧牧作作出出规规模模限限制制,每每家家牧牧民民都都会会如如此此盘盘算算:如如果果其其他他牧牧民民不不约约束束自自己己的的放放牧牧规规模模,让让自自己己的的牛牛羊羊过过多多地地到到草草地地上上吃吃草草,那那么么,我我自自己己一一家家约约束束自自己己的的放放牧牧规规模模规规模模对对保保护护草草场场的的贡贡献献是是微微乎乎其其微微的的,不不会会使使草草场场免免于于破破坏坏;相相反反,我我
22、也也加加入入过过度度放放牧牧的的行行列列,至至少少在在草草场场消消失失之之前前还还会会获获得得一部分短期的收益。一部分短期的收益。2023/5/2544中南财经政法大学信息学院 如如果果其其他他牧牧民民约约束束放放牧牧规规模模,单单独独一一家家人人过过度度放放牧牧不不会会破破坏坏广广褒褒的的牧牧场场,但但却却获获得得了了高高额额的的收收益益。因因此此,任任何何一一位位牧牧民民的的结结论论都都会会是是:无无论论其其他他牧牧民民是是否否过过度度放放牧牧,我我选选择择“约约束束自自己己的的放放牧牧规规模模”都都是是劣劣策策略略,从从而而被被剔剔除除。大大家家最最终终都都会会选选择择过过度度放放牧牧,
23、结结果导致草地消失,生态破坏。果导致草地消失,生态破坏。2023/5/2545中南财经政法大学信息学院类似的例子还有:类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的中,每年有一段时间的“休渔期休渔期”,此时禁,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网
24、眼大小作出规定,好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。关闭了前些年泛滥成灾的许多小造纸厂等。2023/5/2546中南财经政法大学信息学院公共产品与税收制度解决囚徒困境公共产品与税收制度解决囚徒困境比较私人产品与公共产品的不同:使用比较私人产品与公共产品的不同:使用上排他性;上排他性;私人产品是志愿购买的,但公共产品可私人产品是志愿购买的,但公共产品可能需要强制购买;能需要强制购买;税收制度就是保证公共
25、产品的生产,解税收制度就是保证公共产品的生产,解决公共产品生产上的决公共产品生产上的“囚徒困境囚徒困境”;2023/5/2547中南财经政法大学信息学院例例3 3、为为什什么么政政府府要要负负责责修修建建公公共共设设施施?-?-因为私人没有积极性出资修建公共设施因为私人没有积极性出资修建公共设施 设设想想有有两两户户相相居居为为邻邻的的农农家家,十十分分需需要要有有一一条条好好路路从从居居住住地地通通往往公公路路。修修一一条条路路的的成成本本为为4 4,每每个个农农家家从从修修好好的的好好路路上上获获得得的的好好处处为为3 3。如如果果两两户户居居民民共共同同出出资资联联合合修修路路,并并平平
26、均均分分摊摊修修路路成成本本,则则每每户户居居民民获获得得净净的的好好处处(盈盈利利)为为3-3-4/2=14/2=1;当当只只有有一一户户人人家家单单独独出出资资修修路路时时,修修路路的的居居民民获获得得的的盈盈利利为为3-4=-13-4=-1(亏亏损损),“搭搭便便车车”不不出出资资但但仍仍然然可可以以使使用用修修好好的的路路的的另另一一户户人人家获得盈利家获得盈利3-0=33-0=3,见表,见表2 2。2023/5/2548中南财经政法大学信息学院表表2 2 修路博弈修路博弈 乙 修 不修 修 甲 不修 1,1-1,33,-10,02023/5/2549中南财经政法大学信息学院 我我们们
27、看看到到,对对甲甲和和乙乙两两家家居居民民来来说说,“修修路路”都都是是劣劣策策略略,因因而而他他们们都都不不会会出资修路。出资修路。这这里里,为为了了解解决决这这条条新新路路的的建建设设问问题题,需需要要政政府府强强制制性性地地分分别别向向每每家家征征税税2 2单单位位,然然后后投投入入4 4单单位位资资金金修修好好这这条条对对大大家家都都有有好好处处的的路路,并并使使两两家家居居民民的的生生活活水水平都得到改善。平都得到改善。2023/5/2550中南财经政法大学信息学院 修路博弈公共物品问题修路博弈公共物品问题2023/5/2551中南财经政法大学信息学院公共产品(public good
28、s)的提供:提供不提供提供不提供4,4-1,55,-10,0无论对方如何选择,每个人的最优选择:不提供。无论对方如何选择,每个人的最优选择:不提供。所以,我们可以预测,结果将是(不提供,不提供)所以,我们可以预测,结果将是(不提供,不提供)2023/5/2552中南财经政法大学信息学院 这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。2023/5/2553中南财经政法大学信息学院思考:还有什么好的途径来解决思考:还有什么好的途径来解决“囚徒困境囚徒困境”问题?
29、问题?2023/5/2554中南财经政法大学信息学院思路思路-增大未来的影响解决囚徒困境增大未来的影响解决囚徒困境通常人们认为合作是件好事,毕竟双方合通常人们认为合作是件好事,毕竟双方合作在作在“囚徒困境囚徒困境”中对双方都有好处。然中对双方都有好处。然而如前面说过的,在一些情形中人们要做而如前面说过的,在一些情形中人们要做的却恰恰相反。的却恰恰相反。只要这种接触不是重复的,合作就非常只要这种接触不是重复的,合作就非常困难,正是持续的接触,使基于回报的合困难,正是持续的接触,使基于回报的合作的稳定成为可能。促进双方合作可以从作的稳定成为可能。促进双方合作可以从三个方面着手:使得未来相对于现在更
30、重三个方面着手:使得未来相对于现在更重要些;改变对策者的四个可能的结果的收要些;改变对策者的四个可能的结果的收益值;教给对策者那些促进合作的准则、益值;教给对策者那些促进合作的准则、事实和技能事实和技能。2023/5/2555中南财经政法大学信息学院 如果未来相对于现在是足够重要的话,如果未来相对于现在是足够重要的话,双方的合作是稳定的。因为每个对策者双方的合作是稳定的。因为每个对策者可以用隐含的报复来威胁对方,如果相可以用隐含的报复来威胁对方,如果相互之间的接触能持续足够长使得这种威互之间的接触能持续足够长使得这种威胁能够奏效的话。胁能够奏效的话。这个结论强调了促进合作的第一方这个结论强调了
31、促进合作的第一方法的重要性,即增大未来的影响。有两法的重要性,即增大未来的影响。有两个基本的方法来做到这一点:使相互作个基本的方法来做到这一点:使相互作用更持久和使相互作用更频繁。用更持久和使相互作用更频繁。2023/5/2556中南财经政法大学信息学院例例4 4 为什么要加入为什么要加入WTOWTO?WTOWTO是一个自愿性申请加入的自由贸易联盟,是一个自愿性申请加入的自由贸易联盟,即即WTOWTO成员国之间实现低关税或零关税的相互间成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢?这是因为,如果没有一个协调
32、组的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易税的自由贸易局面,因为这时国与国之间的贸易是一个是一个“囚徒困境囚徒困境”。给定一个国家对另一个国。给定一个国家对另一个国家的货物实行低关税,另一个国家反过来对这个家的货物实行低关税,另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的策国家的货物实行高关税是占优于实行低关税的策略的。略的。2023/5/2557中南财经政法大学信息学院也就是说:集中接触是使两个人更经常也就是说:集中接触是使两个人更经常见面的一个方法
33、。在协商谈判中,另一见面的一个方法。在协商谈判中,另一个使接触更加频繁的方法是把问题分解个使接触更加频繁的方法是把问题分解成若干的部分。成若干的部分。例如,例如,可以将军备控制和裁军条约分解可以将军备控制和裁军条约分解成许多阶段,这样就允许双方有更多让成许多阶段,这样就允许双方有更多让步的机遇而不只是一两个让步。这样可步的机遇而不只是一两个让步。这样可以使回报更有效。如果双方都知道对方以使回报更有效。如果双方都知道对方的一步不合适的策略可以通过下一步的的一步不合适的策略可以通过下一步的回报来补偿,那么双方对整个过程可以回报来补偿,那么双方对整个过程可以按所期望的进行就更有信心。按所期望的进行就
34、更有信心。2023/5/2558中南财经政法大学信息学院而且,如果双方对自己识别欺骗的能力缺而且,如果双方对自己识别欺骗的能力缺乏信心,那么,有许多小的步骤比只有少乏信心,那么,有许多小的步骤比只有少数大的步骤更有助于促进合作。数大的步骤更有助于促进合作。分解是一个广泛使用的原则。在商业上,分解是一个广泛使用的原则。在商业上,人们喜欢一个大订单分别按每次发货时间人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总账。使得当前付款,而不愿等到最后付总账。使得当前步骤的背叛相对于整个未来的接触过程来步骤的背叛相对于整个未来的接触过程来说不是那么有诱惑力,这是促进合作的好说不是那么有诱惑力,
35、这是促进合作的好方法。方法。2023/5/2559中南财经政法大学信息学院启示:启示:两只困倦的刺猬由于寒冷而拥在一起。可因为各自身上都长着刺,于是它们离开了一段距离,但又冷得受不了,于是凑到一起。几经折腾,两只刺猬终于找到一个合适的距离:既能互相获得对方的温暖而又不至于被扎。了解并关心对方,并巧妙地保护自己,会使合作更加长久。2023/5/2560中南财经政法大学信息学院占优策略的分析占优策略的分析情形一:占优均衡存在情形一:占优均衡存在双方都有双方都有一个占优策略时。一个占优策略时。2023/5/2561中南财经政法大学信息学院以一般观点来看,各方均有一个占优策略的博弈以一般观点来看,各方
36、均有一个占优策略的博弈是最简单的一种博弈。虽然其中存在策略互动,却是最简单的一种博弈。虽然其中存在策略互动,却有一个可以预见的结局:全体博弈方都会选择自己有一个可以预见的结局:全体博弈方都会选择自己的优势策略,完全不必理会其他人会怎么做。这一的优势策略,完全不必理会其他人会怎么做。这一点并不会降低博弈方思考这种博弈的趣味性。点并不会降低博弈方思考这种博弈的趣味性。在囚徒困境中,两个博弈方都有一个占优策略,在囚徒困境中,两个博弈方都有一个占优策略,只不过这股压倒一切的力量最终将他们引向了一起只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题:倒霉的结局。这就提出了一个很有意思的问题:博弈方怎样做才能取得一个更好的结果呢?博弈方怎样做才能取得一个更好的结果呢?2023/5/2562中南财经政法大学信息学院