《经济博弈论管理学与财务知识分析初步(91页PPT).pptx》由会员分享,可在线阅读,更多相关《经济博弈论管理学与财务知识分析初步(91页PPT).pptx(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十章博弈论初步第十章博弈论初步第一节博弈论和策略行为第一节博弈论和策略行为第二节同时博弈:纯策略均衡第二节同时博弈:纯策略均衡第三节同时博弈:混合策略博弈第三节同时博弈:混合策略博弈第四节序贯博弈第四节序贯博弈博弈论博弈论game theory 在传统经济理论中,经济主体做出决策时,不考虑自在传统经济理论中,经济主体做出决策时,不考虑自己的选择(决策)对其他人的影响,也不考虑其他人对自己的选择(决策)对其他人的影响,也不考虑其他人对自己的影响。然而,在现实经济生活中,经济主体之间的行己的影响。然而,在现实经济生活中,经济主体之间的行为是为是相互作用、相互影响的相互作用、相互影响的。博弈论博弈
2、论game theory博弈论博弈论是研究在是研究在策略性环境策略性环境中如何进行中如何进行策略性决策策略性决策和采取和采取策略性行动策略性行动的科学。的科学。u策略性环境是指,每一个人进行的决策和采取的策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;行动都会对其他人产生影响;u策略性决策和策略性行动是指,每个人要根据其策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。他人的可能反应来决定自己的决策和行动。博弈的三个基本要素博弈的三个基本要素u参与人参与人(局中人,(局中人,players):):可以是自然人,也可以是企业、国家,还可能是甚至是
3、若干个国家可以是自然人,也可以是企业、国家,还可能是甚至是若干个国家组成的集团(组成的集团(OPEC,欧盟)。,欧盟)。u策略策略(strategies):局中人的行动规则,它指定局中人在每种情况下应如何行动,局中人的行动规则,它指定局中人在每种情况下应如何行动,至少有至少有两个两个可供选择的策略,可供选择的策略,“相机行动方案相机行动方案”。如。如“人不犯我,我不人不犯我,我不犯人;人若犯我,我必犯人犯人;人若犯我,我必犯人”就是一种策略:就是一种策略:“犯犯”与与“不犯不犯”就是两种不同的行动,策略则规定了什么时候选择就是两种不同的行动,策略则规定了什么时候选择“犯犯”还是还是“不犯不犯”
4、。u支付支付(payoffs)局中人得到的效用(或期望效用),局中人得到的效用(或期望效用),局中人真正关心的东西。局中人真正关心的东西。博弈的类型博弈的类型u根据参与人的数量:二人博弈和多人博弈根据参与人的数量:二人博弈和多人博弈u根据参与人的支付情况:零和博弈和非零和博弈根据参与人的支付情况:零和博弈和非零和博弈参与人的支付总和为参与人的支付总和为0时,零和博弈,这意味着参与人的利益在博弈时,零和博弈,这意味着参与人的利益在博弈是相互冲突的。是相互冲突的。u根据参与人拥有的策略的数量的多少:有限博弈和根据参与人拥有的策略的数量的多少:有限博弈和无限博弈无限博弈u根据参与人在实施策略上是否有
5、时间的先后(参与根据参与人在实施策略上是否有时间的先后(参与人在决策时是否已经知道了其他参与人的决策):同人在决策时是否已经知道了其他参与人的决策):同时博弈和序贯博弈;静态博弈(时博弈和序贯博弈;静态博弈(static game)和动态)和动态博弈(博弈(dynamic game)。)。同时博弈:石头、剪刀、布。同时博弈:石头、剪刀、布。序贯博弈:下棋、打麻将。序贯博弈:下棋、打麻将。一、例子:寡头博弈一、例子:寡头博弈囚徒困境囚徒困境prisoners dilemma 两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了
6、抢劫罪,除非有一个供认或两个人都供认,即使两可以判他们犯了抢劫罪,除非有一个供认或两个人都供认,即使两个人都不供认,也可判他们犯盗窃物品的轻罪。个人都不供认,也可判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间互通信息,并交代政策如下:如囚徒被分离审查,不允许他们之间互通信息,并交代政策如下:如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判果两个人都供认,每个人都将因抢劫罪加盗窃罪被判2年监禁;如果两年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒
7、供者将因抢而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪及抗拒从严而被重判劫罪、盗窃罪及抗拒从严而被重判5年。年。二、支付矩阵二、支付矩阵payoffs table囚徒甲囚徒甲囚徒乙囚徒乙拒供拒供供认供认拒供拒供0.5年,年,0.5年年5年,年,0年年供认供认0年,年,5年年2年,年,2年年参与人参与人策略策略支付支付寡头的囚徒困境寡头的囚徒困境厂商甲厂商甲厂商乙厂商乙不降价不降价降价降价不降价不降价500,5000,800降价降价800,0200,200厂商甲厂商甲厂商乙厂商乙合作合作不合作不合作合作合作5,61,5不合作不合作7,12,3三、条件策略和条件策略组
8、合三、条件策略和条件策略组合把甲厂商在乙厂商选择合作条件下的最优策略即把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略,合作叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。简称条件策略。把与甲厂商的条件策略相联系的策略组合叫做把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合,甲厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。简称条件策略组合。在乙厂商选择合作的条件下:在乙厂商选择合作的条件下:条件策略:不合作条件策略:不合作条件策略组合:不合作,合作条件策略组合:不合作,合作在乙厂商选择不合作的条件下:在乙
9、厂商选择不合作的条件下:条件策略:不合作条件策略:不合作条件策略组合:不合作,不合作条件策略组合:不合作,不合作四、纳什均衡(非合作均衡)四、纳什均衡(非合作均衡)1、博弈均衡的概念、博弈均衡的概念 当两个厂商的条件策略组合恰好相同,从而,当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时两个厂商都不再有单独改变策略的倾向时,整个,整个博弈就达到了均衡,即博弈均衡。博弈就达到了均衡,即博弈均衡。博弈均衡是博弈各方最终选取的策略组合,博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。是博弈的最终结果,是博弈的解。四、纳什均衡四、纳什均衡2、纳什均衡的概
10、念、纳什均衡的概念 指的是参与人的这样一种策略组合,在该策略指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。组合上,任何参与人单独改变策略都不会得到好处。或者说,在一个策略组合中,如果所有其他人都不或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人会改变自己的策略,则该策略改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。组合就是一个纳什均衡。“单独改变策略单独改变策略”是指任何一个参与人在所有其他人是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其他人也都不改变策略的情况下改变自己的策略。其他人也同时改变策略
11、的情况不在考虑之列。同时改变策略的情况不在考虑之列。“不会得到好处不会得到好处”是指任何一个参与人在单独改变策是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情况:略之后自己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。或者支付减少,或者支付不变。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法 先用下划线法分别表示甲厂商和乙厂商的条件先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均衡(就是找到在两个数字策略,最后确定博弈的均衡(就是找到在两个数字之下都划线的单元格即可,与这些单元格相对应的之下都划线的单元格即可,与这些
12、单元格相对应的策略组合就是所要求的均衡策略组合)。策略组合就是所要求的均衡策略组合)。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法第一步:分解矩阵第一步:分解矩阵第二步:在第二步:在甲甲的支付矩阵中,找出的支付矩阵中,找出每列的最大者每列的最大者。第三步:在第三步:在乙乙的支付矩阵中,找出的支付矩阵中,找出每行的最大者每行的最大者。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法第四步:合并矩阵第四步:合并矩阵第五步:找出两个数字下均有下划线的组合。第五步:找出两个数字下均有下划线的组合。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条
13、件策略下条件策略下划线法划线法 在一个单元格中,如果两个数字之下均划有线,在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数两个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略字之下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最的动机,因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策
14、略的则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略动机,没线的数字所代表的参与人有单独改变策略的动机。的动机。六、纳什均衡的存在性、唯一性和最优性六、纳什均衡的存在性、唯一性和最优性1、存在性:在同时博弈中,(纯策略的)纳什均衡存在性:在同时博弈中,(纯策略的)纳什均衡可可能存在,也可能不存在能存在,也可能不存在。没有纳什均衡的同时博弈没有纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙左左右右上上4,69,1下下7,32,8六、纳什均衡的存在性、唯一性和最优性六、纳什均衡的存在性、唯一性和最优性2、唯一、唯一性:在纳什均衡存在的情况下,可能唯一,也可性:在
15、纳什均衡存在的情况下,可能唯一,也可能不唯一。能不唯一。存在多重纳什均衡的同时博弈存在多重纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙左左右右上上5,61,4下下4,12,3六、纳什均衡的存在性、唯一性和最优性六、纳什均衡的存在性、唯一性和最优性3、最优性:如果纳什均衡存在,可能是最优的,也可能不最优性:如果纳什均衡存在,可能是最优的,也可能不是最优的。是最优的。存在多重纳什均衡的同时博弈存在多重纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙左左右右上上5,61,4下下4,12,3七、二人同时博弈的一般理论七、二人同时博弈的一般理论二人同时博弈的一般模型二人同时博弈的一般模型AB策略策略1策略策略2
16、 策略策略1a11,b11a12,b12策略策略2a21,b21a22,b22AB策略策略1策略策略2 策略策略13,b112,b12策略策略23,b212,b22类型类型1中:中:A在策在策略上是略上是“无差异无差异”的,可以选择策略的,可以选择策略1,也可能选择,也可能选择策略策略2,结果完全相同。,结果完全相同。AB策略策略1策略策略2 策略策略13,b117,b12策略策略23,b211,b22类型类型2、3、4、5中:中:A在某一策在某一策略上具有不严格的绝对优势略上具有不严格的绝对优势它选择它选择策略策略1所得到的支付不会小于策略所得到的支付不会小于策略2。AB策略策略1策略策略2
17、 策略策略13,b113,b12策略策略23,b211,b22类型类型2、3、4、5中:中:A在某一策在某一策略上具有不严格的绝对优势略上具有不严格的绝对优势它选择策它选择策略略1所得到的支付不会小于策略所得到的支付不会小于策略2。AB策略策略1策略策略2 策略策略13,b112,b12策略策略23,b211,b22类型类型2、3、4、5中:中:A在某一策略上具有不严格的绝对优势在某一策略上具有不严格的绝对优势它选择策略它选择策略1所得到的支付不会小于策略所得到的支付不会小于策略2。AB策略策略1策略策略2 策略策略13,b117,b12策略策略22,b211,b22类型类型6、7中:中:A在
18、某一策略上具有严格的绝对优势在某一策略上具有严格的绝对优势它选择策略它选择策略1所得到的支付总大于策略所得到的支付总大于策略2。AB策略策略1策略策略2 策略策略13,b113,b12策略策略22,b211,b22类型类型6、7中:中:A在某一策略上具有严格的绝对优势在某一策略上具有严格的绝对优势它选它选择策略择策略1所得到的支付总大于策略所得到的支付总大于策略2。AB策略策略1策略策略2 策略策略13,b112,b12策略策略22,b211,b22类型类型6、7中:中:A在某一策略上具有严格的绝对优势在某一策略上具有严格的绝对优势它选择它选择策略策略1所得到的支付总大于策略所得到的支付总大于
19、策略2。AB策略策略1策略策略2 策略策略13,b112,b12策略策略22,b213,b22类型类型8、9中:中:A在某一策略上不存在绝对优势在某一策略上不存在绝对优势A按按“列列”,划线法,划线法B按按“行行”A的支付矩阵有的支付矩阵有9种可能,种可能,B的支付矩阵也有的支付矩阵也有9种可能,种可能,因此,整个博弈(亦即因此,整个博弈(亦即A与与B两人合在一起)的支付矩阵两人合在一起)的支付矩阵总共就有总共就有99=81种可能。种可能。全部的纳什均衡可分为五种类型,分别有全部的纳什均衡可分为五种类型,分别有四个均衡(包括四个均衡(包括1种情况)、种情况)、三个均衡(包括三个均衡(包括12种
20、情况)、种情况)、两个均衡(包括两个均衡(包括38种情况)、种情况)、一个均衡(包括一个均衡(包括28种情况)、种情况)、零个均衡(包括零个均衡(包括2种情况)。种情况)。一、不存在纯策略均衡时的混合策略均衡一、不存在纯策略均衡时的混合策略均衡即使纯策略的纳什均衡不存在,即使纯策略的纳什均衡不存在,相应的混合策略均衡却总会存在。相应的混合策略均衡却总会存在。1、混合策略、混合策略第一,第一,“确定性确定性”选择选择 在没有纳什均衡的同时博弈里,所有参与人对在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是策略的选择都是“确定确定”的,即某参与人在选择某个的,即某参与人在选择某个策略的时候,
21、他不能再同时选择其他的策略,此时策略的时候,他不能再同时选择其他的策略,此时相应的条件策略也是相应的条件策略也是“确定确定”的;最后,当参与人的的;最后,当参与人的条件策略是条件策略是“确定确定”的时候,最终的博弈均衡(如果的时候,最终的博弈均衡(如果有的话)也是有的话)也是“确定确定”的。的。第二,第二,“混合性混合性”选择选择 在现实生活中,人们对策略的选择常常并不像在现实生活中,人们对策略的选择常常并不像前面所说的那样前面所说的那样“非此即彼非此即彼”,而是会以一定的可能,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一性来选择某个策略,又以另外的可能性选择另外一些策略。些
22、策略。没有纳什均衡的同时博弈没有纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙0.30.7左左右右0.6上上4,69,10.4下下7,32,8第三,第三,“混合混合”策略的概念策略的概念 把甲厂商和乙厂商原来的策略叫做把甲厂商和乙厂商原来的策略叫做“纯纯”策略,策略,把赋予这些纯策略的概率向量叫做把赋予这些纯策略的概率向量叫做“混合混合”策略。策略。没有纳什均衡的同时博弈没有纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙q1q2左左右右p1上上4,69,1p2下下7,32,82、混合策略组合、混合策略组合 参与人的混合策略组合是一个概率向量组合,其参与人的混合策略组合是一个概率向量组合,其中,每一个概
23、率向量是相应参与人的一个混合策略。中,每一个概率向量是相应参与人的一个混合策略。3、期望支付、期望支付 在混合策略博弈中,对于每一个混合策略组合,也在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参与人存在一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。不过,由于在该混合策略组合条件下所得到的支付。不过,由于现在每个参与人都是以一定的概率来选择其纯策略的,现在每个参与人都是以一定的概率来选择其纯策略的,故相应的支付也就成了所谓的故相应的支付也就成了所谓的“期望支付期望支付”,即支付,即支付的期望值。的期望值。4、条件混合策略、条
24、件混合策略 利用计算期望支付的公式可以求得甲厂商和乙厂利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略)。商的条件混合策略(即具有相对优势的混合策略)。上式含义:上式含义:甲厂商在乙厂商选择某个既定的甲厂商在乙厂商选择某个既定的q1时所选择的使时所选择的使E甲甲达到最大的达到最大的p1。上式含义:上式含义:乙厂商在甲厂商选择某个既定的乙厂商在甲厂商选择某个既定的p1时所选择的时所选择的使使E乙乙达到最大的达到最大的q1。5、混合策略纳什均衡混合策略纳什均衡 参与人的条件混合策略可以分别确定,确定了参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进
25、一步来确定混合策略的纳条件混合策略,就可以进一步来确定混合策略的纳什均衡。什均衡。二、存在纯策略均衡时的混合策略均衡二、存在纯策略均衡时的混合策略均衡 求解混合策略纳什均衡的方法不仅适用于纯策求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况,而且也适用于纯策略纳略纳什均衡不存在的情况,而且也适用于纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均什均衡将作为特例被包含在相应的混合策略纳什均衡之中。衡之中。存在纯策略纳什均衡的混合策略模型存在纯策略纳什均衡的混合策略模型厂商甲厂商甲厂商乙厂商乙
26、q1q2合作合作不合作不合作p1合作合作5,61,5p2不合作不合作7,12,3三、混合策略博弈的一般理论三、混合策略博弈的一般理论1、模型、模型ABq1q2策略策略1策略策略2p1策略策略1a11,b11a12,b12p2策略策略2a21,b21a22,b22混合策略博弈的一般模型混合策略博弈的一般模型2、混合策略和混合策略组合、混合策略和混合策略组合A的混合策略:的混合策略:B的混合策略:的混合策略:A与与B的混合策略组合:的混合策略组合:3、期望支付、期望支付 运用两个参与人的混合策略组合,可以分别表运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。示出两个参与人得到的支
27、付。A的期望支付:的期望支付:B的期望支付:的期望支付:4、A的条件混合策略的条件混合策略5、B的条件混合策略的条件混合策略q1p1Ob11=b12,b21=b2211q1p1Ob11=b12,b21b2211q1p1Ob11=b12,b21b12,b21=b2211q1p1Ob11b12,b21b2211q1p1Ob11b12,b21b2211q1p1Ob11b12,b21b2211p*q1p1Ob11b2211p*6、纳什均衡、纳什均衡q1p1Ob11=b12,b21=b2211单位平面单位平面6、纳什均衡、纳什均衡三条线段三条线段q1p1Ob11b12,b21b2216、纳什均衡、纳什均
28、衡一条线段一条线段p1Ob11b12,b21b22116、纳什均衡、纳什均衡三个点三个点q1p1Ob11b12,b21b2211p*6、纳什均衡、纳什均衡两个点两个点q1p1Ob11b12,b21b2211p*一、例子:竞争者一、例子:竞争者垄断者博弈垄断者博弈1、两个参与者:竞争者和垄断者。、两个参与者:竞争者和垄断者。2、两个参与者的决策顺序及其策略:、两个参与者的决策顺序及其策略:竞争者先决策,它决定进入还是不进入由垄断者独霸竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根据竞争者的行动决定对其的市场;垄断者后决策,它根据竞争者的行动决定对其“容忍容忍”还是还是“
29、抵抗抵抗”。竞争者有进入和不进入两个策略,垄断者也有容忍和竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗两个策略。因此,总共有四个策略组合。抵抗两个策略。因此,总共有四个策略组合。每一策略组合中,第一项是先行动者即竞争者的策略,每一策略组合中,第一项是先行动者即竞争者的策略,第二项是后行动者即垄断者的策略。第二项是后行动者即垄断者的策略。二、博弈树二、博弈树game tree起点起点中间决策点中间决策点终点终点第一个数字是先行动者的支付,第二个数字是后行动者的支付。第一个数字是先行动者的支付,第二个数字是后行动者的支付。三、纳什均衡三、纳什均衡1、序贯博弈中的纳什均衡、序贯博弈中的纳什均衡
30、 在竞争者在竞争者垄断者博弈中,第一个终点,即旁边标有支垄断者博弈中,第一个终点,即旁边标有支付组合(付组合(1,4)所代表的策略组合(进入,容忍)是一个纳)所代表的策略组合(进入,容忍)是一个纳什均衡。因为在该策略组合上,没有哪个参与人愿意单独改什均衡。因为在该策略组合上,没有哪个参与人愿意单独改变自己的策略。变自己的策略。三、纳什均衡三、纳什均衡2、序贯博弈中的纳什均衡可能不止一个、序贯博弈中的纳什均衡可能不止一个 情侣博弈情侣博弈battle of sex:有一对热恋中的情侣,吕布和:有一对热恋中的情侣,吕布和貂蝉,两人平时上班都很忙,没时间见面,难得周六晚上能貂蝉,两人平时上班都很忙,
31、没时间见面,难得周六晚上能在一起过。两人就想:这么一个美好的夜晚该怎么度过呢?在一起过。两人就想:这么一个美好的夜晚该怎么度过呢?这个吕布是个足球迷,正好周六晚上要直播一场他这个吕布是个足球迷,正好周六晚上要直播一场他最喜欢的意大利队的足球赛。而貂蝉是个芭蕾迷,恰巧最喜欢的意大利队的足球赛。而貂蝉是个芭蕾迷,恰巧这晚上世界著名的俄罗斯芭蕾舞蹈团要进行最后一场巡这晚上世界著名的俄罗斯芭蕾舞蹈团要进行最后一场巡回演出。看足球赛还是看芭蕾呢?回演出。看足球赛还是看芭蕾呢?2、序贯博弈中的纳什均衡可能不止一个、序贯博弈中的纳什均衡可能不止一个 假如两人决定一起看足球,对于吕布来说幸福感是假如两人决定一
32、起看足球,对于吕布来说幸福感是2。而貂蝉对足球一窍不通,但是因为能和吕布在一起,晚上而貂蝉对足球一窍不通,但是因为能和吕布在一起,晚上一起看球的幸福感是一起看球的幸福感是1。如果两人一起去看芭蕾演出,对。如果两人一起去看芭蕾演出,对于貂蝉来说幸福感是于貂蝉来说幸福感是2,可是吕布偏偏对芭蕾不太感兴趣,可是吕布偏偏对芭蕾不太感兴趣,和貂蝉在一起看芭蕾对他来说幸福感只有和貂蝉在一起看芭蕾对他来说幸福感只有1。现在两人正处于如胶似漆的热恋阶段,双方对在现在两人正处于如胶似漆的热恋阶段,双方对在一起的每一刻都非常珍惜。所以,一旦分开,若吕布一起的每一刻都非常珍惜。所以,一旦分开,若吕布单独去看球、貂蝉
33、单独去看芭蕾,幸福感为(单独去看球、貂蝉单独去看芭蕾,幸福感为(0,0););若吕布单独看芭蕾,貂蝉单独去看球,幸福感为(若吕布单独看芭蕾,貂蝉单独去看球,幸福感为(-1,-1)。)。2、序贯博弈中的纳什均衡可能不止一个、序贯博弈中的纳什均衡可能不止一个四、纳什均衡的精炼:四、纳什均衡的精炼:逆向归纳法逆向归纳法backward induction1、逆向归纳法的两个步骤、逆向归纳法的两个步骤 第一步,先从博弈的最后阶段的每一个决策点开始,第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删
34、除,从而得到原博弈的一个简化博弈;其他策略删除,从而得到原博弈的一个简化博弈;第二步,再对简化博弈重复步骤一的程序,直到最第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解。原博弈的解。四、纳什均衡的精炼:逆向归纳法四、纳什均衡的精炼:逆向归纳法2、逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定、逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也是逆向归纳策略也是逆向归纳策略3、先动优势:、先动优势:first-mover advantage 先行动者的得益大于后行动者的得益。先行动者的得益大于后
35、行动者的得益。比如,男方先动,逆向归纳的结果就是对男方更比如,男方先动,逆向归纳的结果就是对男方更加有利的纳什均衡(足球,足球);如果情侣博弈改加有利的纳什均衡(足球,足球);如果情侣博弈改为女方先行动,则逆向归纳的结果就是对女方更加有为女方先行动,则逆向归纳的结果就是对女方更加有利的纳什均衡(芭蕾,芭蕾)。利的纳什均衡(芭蕾,芭蕾)。情侣博弈:女方先动情侣博弈:女方先动四、纳什均衡的精炼:逆向归纳法四、纳什均衡的精炼:逆向归纳法4、序贯博弈与同时博弈的一个重要区别、序贯博弈与同时博弈的一个重要区别 当博弈是当博弈是“同时同时”的时候,如果出现多重纳什均的时候,如果出现多重纳什均衡,常常无法确
36、定最终实现的是哪一个纳什均衡,但衡,常常无法确定最终实现的是哪一个纳什均衡,但是,当博弈是是,当博弈是“序贯序贯”的时候,即使纳什均衡是多重的时候,即使纳什均衡是多重的,往往能够从中确定一个最终的均衡。这是因为,的,往往能够从中确定一个最终的均衡。这是因为,与同时博弈相比,序贯博弈提供了更多的信息与同时博弈相比,序贯博弈提供了更多的信息关关于参与人决策秩序的信息。于参与人决策秩序的信息。1、有时候读书是一种巧妙地避开思考的方法。11月-2211月-22Monday,November 7,20222、阅读一切好书如同和过去最杰出的人谈话。13:09:3713:09:3713:0911/7/202
37、2 1:09:37 PM3、越是没有本领的就越加自命不凡。11月-2213:09:3713:09Nov-2207-Nov-224、越是无能的人,越喜欢挑剔别人的错儿。13:09:3713:09:3713:09Monday,November 7,20225、知人者智,自知者明。胜人者有力,自胜者强。11月-2211月-2213:09:3713:09:37November 7,20226、意志坚强的人能把世界放在手中像泥块一样任意揉捏。07 十一月 20221:09:37 下午13:09:3711月-227、最具挑战性的挑战莫过于提升自我。十一月 221:09 下午11月-2213:09Novem
38、ber 7,20228、业余生活要有意义,不要越轨。2022/11/7 13:09:3713:09:3707 November 20229、一个人即使已登上顶峰,也仍要自强不息。1:09:37 下午1:09 下午13:09:3711月-2210、你要做多大的事情,就该承受多大的压力。11/7/2022 1:09:37 PM13:09:3707-11月-2211、自己要先看得起自己,别人才会看得起你。11/7/2022 1:09 PM11/7/2022 1:09 PM11月-2211月-2212、这一秒不放弃,下一秒就会有希望。07-Nov-2207 November 202211月-2213、无论才能知识多么卓著,如果缺乏热情,则无异纸上画饼充饥,无补于事。Monday,November 7,202207-Nov-2211月-2214、我只是自己不放过自己而已,现在我不会再逼自己眷恋了。11月-2213:09:3707 November 202213:09谢谢大家谢谢大家