《博弈论经典例子最新.docx》由会员分享,可在线阅读,更多相关《博弈论经典例子最新.docx(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、博弈论经典例子最新 博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要探讨公式化了的激励结构间的相互作用。我为大家整理的相关的,供大家参考选择。 博弈论经典例子博弈论的经典案例篇1:在美国西部的小镇上,三个枪手打算进行一场生死较量。枪手甲枪法精准,十发八中;枪手乙枪法不错,十发六中;枪手丙枪法拙劣,十发四中。假如三人同时开枪,谁活下来的概率大一些?经具体分析,枪法最劣的枪手丙活下来的概率最大。假如这三个枪手相互之间充溢仇恨,看法不行能达成一样,作为枪手甲,他的最佳策略是对枪手乙开枪,因为这个人对他的威逼最大。这样他的第一枪不行能瞄准丙。同样,对于枪手乙来说,他也
2、会把甲作为第一目标,一旦把他干掉,下一轮(假如还有下一轮的话)和丙对决,他的胜算较大;相反,假如他先打丙,即使活了下来,到了下一轮与甲对决时也是凶多吉少。而丙呢?自然他所选的目标人物也是甲,因为不管怎么说,枪手乙还是比甲差一些(尽管比自己强),假如肯定要和某个人对决下一场的话,选择枪手乙,自己获胜的概率要比对决甲多少大一点。于是,第一阵乱枪过后,甲还能活下来的概率特别小(将近10%),乙是20%,丙是100%。通过概率分析,不难看出丙很可能在这一轮就成为成功者,即使某个对手幸运地活下来,在下一轮的对决中也并非万无一失,终归丙还有胜出的机会。而三人中作为强者的甲,却面临着最大的生存风险。从这个博
3、弈案例中可以总结出一个道理:强者并非肯定能赢,正所谓木秀于林,风必摧之。博弈论的经典案例篇2:在博弈论(Game Theory)经济学中,智猪博弈是一个闻名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所须要付出的劳动,加起来要消耗相当于2份的猪食。问题是踏板和食槽分置笼子的两端,假如有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。笼中猪博弈的详细状况如下:假如两只猪同时踩踏板,同时跑向食槽
4、,大猪吃进7份,得益5份,小猪吃进3份,实得1份;假如大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;假如大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;假如双方都懒得动,所得都是0。利益安排格局确定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择搭便车策略,也就是舒舒适服地等在食槽边,这是最好的选择。现在来看大猪。由于小猪有等待这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以等待就变成了大猪的劣势策略,当大猪知道小猪
5、是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲乏地奔忙于踏板和食槽之间。博弈论的经典案例篇3:假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不非常准确,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,假如他们都交代犯罪事实,则可能将各被判刑5年;假如他们都不交代,则有可能只会被以较轻的阻碍公务罪各判1年;假如一人交代,另一人不交代,交代者有可能会被马上释放,不交代者则将可能被重判8年。对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交
6、代而另一囚徒交代了,自己就将可能处于特别不利的境地。对于囚徒A而言,不管囚徒B实行何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最终两人都会选择交代。因此,囚徒逆境反映了个体理性行为与集体理性行为之间的冲突、冲突。囚徒逆境现象在现实生活中比比皆是。记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。住户在公共楼道里堆满了杂物,结果大家都极不便利,以致即将分娩的妇女都没法刚好被送往医院。但你假如不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化动身,都会选择占用。但占用的结果却最终损害了大家的利益。前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的
7、价格战使全部生产厂家都遭遇重创,这也是一种囚徒逆境。博弈论经典例子前一段时间看过一个博弈论的课程,里面就有一个令我印象深刻的例子。大致是这样的:老师给学生们每人一张纸,要求写下一个1100的整数。写的数字最接近全部人的结果的平均值的三分之二就是优胜,就可以得到肯定的嘉奖。那么问题来了,假如是你,你会写多少?(先不要看下面,以评论的形式写下来,容我也做个试验嘛)等全部人都写完了,老师就起先统计结果了。首先,写的数字大于66的同学,也许属于智商捉鸡型吧。因为只要简洁一想就可以了解,即使全部人都写100,最终均值的三分之二都是66左右,所以最终不行能优胜。其次,不少人写了33左右的数值,也许属于智商
8、捉鸭型吧。这批人想的是0100嘛,平均值是50,于是三分之二就是33左右。但是除了智商捉鸡的人,一般不会有66+的,而且大家的写的数字一般也不会是平均分布。那么明显真正的平均值应当在50以下。然后,就轮到有智商的理性人了。这批人就根据之前的思路思索了:写66+的人是智商捉鸡,那么应当假设理性的人不会写66+的数字,那么最极端的状况也是大家都写66,这样平均值的三分之二就是44左右。所以这么一想写,4466这些人也不过智商捉两只鸡而已,理性人不会写44以上的值。然而这个思索还可以进行下去的,100X2/3≈66;66X2/3≈44;44X2/3≈29;29X2
9、/3≈19 所以理性人的结论:最终优胜的答案应当是1啊。最终老师统计结果,平均值为20左右,所以优胜的应当是写14的人。也许有五六个人bingo获得优胜。可能有人会问,理性人不应当是都写1嘛,怎么最终结果平均值有这么大?因为并不是全部人都是肯定理性的,智商捉鸡、捉鸭的人还是挺多的。事实上这个问题的答案肯定程度上可以代表这个群体的平均智商或者平均的理性程度。(上面的例子是耶鲁高校的学生,不知道在知乎这个值会是多少呢?)所以想要优胜,须要的是考虑整个被测群体的平均理性程度,就是要分析有多少智商捉鸡的,多少有点智商的,不过最重要的是要知道自己属于哪一类,有多少人和自己是想的是一样的。大道
10、理说了不少,然而并没有什么茶叶蛋用所以我就联系时下热点中的热点:股市,重新讲一下上面的例子吧。问题来了:这一轮A股的大牛市最高可以涨到那里?相应的优胜就是在大跌前刚好卖出,撤离股市。首先,这个问题下智商捉鸡的人应当就是认为牛市恒久远,我会发大财的人,他们也许恒久想着离股市到顶还远着呢。再者,有点想法的人也许就是看各种机构给的预料,综合一下估计个值,例如8000点,然后就定在7800点的时候收钱走人。然后,上面的思路可以接着思索下去:假如预料大跌在8000点,那么就应当在7800点之前就卖掉。但假如很多人都这么想,在7800点起先卖出,那么大跌可能在7800点就起先了,所以要再早点,比如7600
11、点卖出。于是早点再早点,理性人应当现在就全部卖出啊!但是现在卖出,明天甚至下个月、明年都还涨,那不是亏大了?纯理性的人一样无法优胜。所以类似与前面的课堂试验,最终确定股价高点的也许就是全部股民的平均理性程度,不过在疯狂的牛市里,估计应当是平均胆子了,所谓人有多大胆,股有多大涨。最终多提一句,课堂里的试验在第一次结果出来并讲解后又来了一次。其次次的结果优胜的值也许就是3左右了,同学们果真理性多了。对应股市来讲,应当就是暴跌之后,广阔股民才学乖了点,不过往往就是长期的熊市。博弈论经典例子博弈论(Game Theory),亦名对策论、赛局理论,属应用数学的一个分支, 博弈论已经成为经济学的标准分析工
12、具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他许多学科都有广泛的应用。博弈论主要探讨公式化了的激励结构间的相互作用。是探讨具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑嬉戏中的个体的预料行为和实际行为,并探讨它们的优化策略。生物学家运用博弈理论来理解和预料进化论的某些结果。几个重要的概念1、 策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。假如在一个博弈中局中人都总
13、共有有限个策略,则称为有限博弈,否则称为无限博弈。2、 得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的得失是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。3、 次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。4、 博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场假如在某一价格下,想以此价格买此
14、商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。5、 纳什均衡(Nash Equilibrium):纳什均衡是一种策略组合,使得同一时间内每个参加人的策略是对其他参加人策略的最优反应。假设有n个局中人参加博弈,假如某状况下无一参加者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方情愿变更其策略的),则此策略组合被称为纳什均衡。纳什均衡的数学定义:在博弈G=S1,Sn:u1,,un中,假如由各个博弈方的各一个策略组成的某个策略组合(s1*,,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,s*i-1,s*i+1,,sn*)的
15、最佳对策,也即ui(s1*,s*i-1,si*,s*i+1,,sn*)≥ui(s1*,s*i-1,sij*,s*i+1,,sn*)对随意sij∈Si都成立,则称(s1*,,sn*)为G的一个纳什均衡。在纳什均衡点上,每一个理性的参加者都不会有单独变更策略的冲动。纳什均衡点存在性证明的前提是博弈均衡偶概念的提出。所谓均衡偶是在二人零和博弈中,当局中人A实行其最优策略a*,局中人B也实行其最优策略b*,假如局中人B仍实行b*,而局中人A却实行另一种策略a,那么局中人A的支付不会超过他实行原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题1、囚徒逆境囚徒逆境是博弈论里最
16、经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是坦白从宽,抗拒从严,假如两人都坦白则各判8年;假如一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;假如都不坦白则因证据不足各判1年。在这个例子里,博弈的参与者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种状况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑
17、而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的变更行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。<br>囚徒逆境反映了个人理性和集体理性的冲突。假如A和B都选择抵赖,各判刑1年,明显比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有主动性遵守这个协定。2、海盗分金币问题在一座座荒岛上,有5个强盗掘出了10
18、0块特别宝贵的金币。他们商定了一个安排金币的规则:首先抽签确定每个人的次序,排列成强盗一至五。然后由强盗一先提出安排方案,经5人表决,如多数人同意,方案就被通过,否则强盗一将被扔入大海喂鲨鱼。假如强盗一被扔入大海,就由强盗二接着提出安排方案,如多数人同意方案就被通过,否则强盗二也要被扔入大海。以下依次类推。假定每个强盗都足够聪慧,都能做出理性的选择,那么,强盗一提出什么样的安排方案,能够使自己得到最大的收益?对于这个问题要采纳方向推导方法:假如1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号肯定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。3号知道这一点,就会提出100
19、,0,0的安排方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。不过,2号推知3号的方案,就会提出98,0,1,1的方案,即放弃3号,而赐予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号安排时更为有利,他们将支持他而不希望他出局而由3号来安排。这样,2号将拿走98枚金币。同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号安排时更优,他们将投1号
20、的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获得最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。安排方案可写成(97,0,1,2,0)或(97,0,1,0,2)。1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消退了死亡威逼,还收益最大。而5号,看起来最平安,没有死亡的威逼,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。在海盗分金中,任何安排者想让自己的方案获得通过的关键是,事先考虑清晰挑战者的安排方案是什么,并用最小的代价获得最大收益,拉拢挑战者安排方案中最不得意的人们
21、。3、旅行者逆境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发觉花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格也许在八九十元的价位浮动,但是不知道两位旅客买的时候的准确价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。假如两人写的一样,航空公司将认为他们讲真话,就根据他们写的数额赔偿;假如两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客嘉奖2元,对讲假话的旅客罚款2元。为了获得最大赔偿而言,原来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。
22、可是不,甲很聪慧,他想:假如我少写1元变成99元,而乙会写100元,这样我将得到101元。何乐而不为?所以他打算写99元。可是乙更聪慧,他算计到甲要算计他写99元,于是他打算写98元。想不到甲还要更聪慧一个层次,估计到乙要写98元来坑他,于是他打算写97元大家知道,下象棋的时候,不是说要多看几步吗,看得越远,胜算越大。 你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,假如两个人都彻底理性,都能看透十几步甚至几十步上百步,那么上面那样精明竞赛的结果,最终落到每个人都只写一两元的地步。事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡。4、枪手博弈彼此痛
23、恨的甲、乙、丙三个枪手打算决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。假如三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。我们来分析一下各个枪手的策略。枪手甲肯定要对枪手乙先开枪。因为乙对甲的威逼要比丙对甲的威逼更大,甲应当首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大许多。枪手丙的最佳策略也是先对甲开枪。乙的枪法终归比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要
24、高一些。我们计算一下三个枪手在上述状况下第一轮枪战中的存活几率:甲:24%(被乙丙合射40% X 60% = 24%)乙:20%(被甲射100% - 80% = 20%)丙:100%(无人射丙)其次轮枪战中甲乙丙存活的几率粗算如下:(1) 假设甲丙对决:甲的存活率为60%,丙的存活率为20%。(2) 假设乙丙对决:乙的存活率为60%,丙的存活率为40%。第一轮:甲射乙,乙射甲,丙射甲。甲的活率为24%(40% X 60%),乙的活率为20%(100% - 80%),丙的活率为100%(无人射丙)。其次轮:状况1:甲活乙死(24% X 80% = 19.2%)甲射丙,丙射甲甲的活率为60%,丙的
25、活率为20%。状况2:乙活甲死(20% X 76% = 15.2%)乙射丙,丙射乙乙的活率为60%,丙的活率为40%。状况3:甲乙皆活(24% X 20% = 4.8%)重复第一轮。状况4:甲乙皆死(76% X 80% = 60.8%)枪战结束。甲的活率为12.672%19.2% X 60%) + (4.8% X 24%) = 12.672%,乙的活率为10.08%,(15.2% X 60%) + (4.8% X 20%) = 10.08%,丙的活率为75.52%,(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) =
26、75.52%,通过对两轮枪战的具体概率计算,我们仍旧发觉枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。对于这样的例子,有人会发出英雄创建历史,庸人繁衍子孙的感叹。5、硬币正反硬币正反你正在图书馆枯坐,一位生疏美女主动过来和你搭讪,并要求和你一起玩个数学嬉戏。美女提议:让我们各自亮出硬币的一面,或正或反。假如我们都是正面,那么我给你3元,假如我们都是反面,我给你1元,剩下的状况你给我2元就可以了。那么该不该和这位姑娘玩这个嬉戏呢?这基本是废话,当然该。问题是,这个嬉戏公允吗?每一种嬉戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够实行固
27、定的策略(比如始终出正面或者始终出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个嬉戏中,便应当采纳混合策略纳什均衡。假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应当在对手出正面或反面的时候我们的收益都相等(不然对方可以变更正反面出现的概率让我们的总收入削减),由此列出方程就是3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )<br>解方程得x=3/8。同样,美女的收益,列方程<br>-3y + 2( 1-y)= 2y+ (-1) * ( 1-y),解得y也等于3/
28、8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告知我们,在双方都实行最优策略的状况下,平均每次美女赢1/8元。其实只要美女实行了(3/8,5/8)这个方案,不论你再采纳什么方案,都是不能变更局面的。但是当你也采纳最佳策略时,至少可以保证自己输得最少。否则,你确定就会被美女采纳的策略针对,从而赔掉更多。本文来源:网络收集与整理,如有侵权,请联系作者删除,谢谢!第15页 共15页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页第 15 页 共 15 页