《第十五章 对策论精选PPT.ppt》由会员分享,可在线阅读,更多相关《第十五章 对策论精选PPT.ppt(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十五章 对策论第1页,此课件共63页哦对策论的基本概念对策论的基本概念 1 第十三章第十三章 对策论对策论 矩阵对策的混合策略矩阵对策的混合策略 3 其他类型的对策论简介其他类型的对策论简介 4 矩阵对策的最优纯策略矩阵对策的最优纯策略 2 第2页,此课件共63页哦 对策论(对策论(The GaThe Gameme Theory)Theory)也称竞赛论或也称竞赛论或博弈论,是研究具有竞争、对抗、利益分配等方博弈论,是研究具有竞争、对抗、利益分配等方面的数量化方法,并提供寻求最优策略的途径。面的数量化方法,并提供寻求最优策略的途径。19441944年以来,对策论在投资分析、价格制定、年以来,
2、对策论在投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗费用分摊、财政转移支付、投标与拍卖、对抗与追踪、国际冲突、双边贸易谈判、劳资关系与追踪、国际冲突、双边贸易谈判、劳资关系以及动物行为进化等领域得到广泛应用。以及动物行为进化等领域得到广泛应用。11对策论的基本概念第3页,此课件共63页哦从孙子兵法到三十六计从孙子兵法到三十六计从田忌赛马到孙庞斗智从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从运筹帷幄到韬光养晦从曹刿论战到论持久战从曹刿论战到论持久战博弈论的产生和发展博弈论的产生和发展1.博弈在中国博弈在中国第4页,此课件共63页哦2.博弈论的开山之作博弈论的开山之作1943年年,冯
3、冯诺诺依依曼曼和和摩摩根根斯斯顿顿发发表表博博弈弈论论和和经经济济行行为为的一书,的一书,标标志志着着博博弈弈论论作作为为一一门门独独立立科科学学的的开开始始,也也标标志志着新古典经济学进入了一个新的发展阶段。着新古典经济学进入了一个新的发展阶段。第5页,此课件共63页哦 3.1994年三位年三位获诺奖的博弈的博弈论学者学者John NashJohn HarsanyLeihaden Selten第6页,此课件共63页哦4.1996年年诺贝尔经济学学奖得得主主:詹詹姆姆斯斯莫莫里里 斯斯:主主要要贡献献:不不对称称信息条件下的激励理信息条件下的激励理论第7页,此课件共63页哦5.2001年年诺贝
4、尔经济学学奖得得主主:迈克克尔斯斯宾塞塞:在在不不对称称信信息息市市场分分析析方方面面所所做做出出开开创性研究。性研究。第8页,此课件共63页哦6.2005年二位年二位获诺奖的博弈的博弈论学者学者Robert AumannThomas Shelling第9页,此课件共63页哦11对策论的基本概念对策模型的三个基本要素:对策模型的三个基本要素:1.1.局中人局中人:参与对抗的各方;:参与对抗的各方;2.2.策略集:局中人选择对付其它局中人的行动方案称为策略集:局中人选择对付其它局中人的行动方案称为策略策略;某局;某局中人的所有可能策略全体称为中人的所有可能策略全体称为策略集策略集;3.3.一局势
5、对策的益损值:局中人各自使用一个对策就形成了一局势对策的益损值:局中人各自使用一个对策就形成了一个局一个局势势,一个局势决定了各局中人的对策结果(量化)称为该,一个局势决定了各局中人的对策结果(量化)称为该局势对策的局势对策的益损值益损值。第10页,此课件共63页哦“齐王赛马齐王赛马”齐王在各局势中的益损值表(单位:千金)齐王在各局势中的益损值表(单位:千金)11对策论的基本概念第11页,此课件共63页哦其中:齐王的策略集其中:齐王的策略集:S1=1,2,3,4,5,6,田忌的策略集:田忌的策略集:S2=1,2,3,4,5,6。下面矩阵称齐王的下面矩阵称齐王的赢得矩阵赢得矩阵:3 1 1 1
6、-1 1 1 3 1 1 1 -1 A=1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 11对策论的基本概念第12页,此课件共63页哦二人有限零和对策二人有限零和对策(又称(又称矩阵对策矩阵对策):):局中人为局中人为2 2;每个局中人的策略集的策略数目都是有限;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。两个局中人的益损值之和为零。通常将矩阵对策记为通常将矩阵对策记为:G=S1,S2,A S1:甲的策略集;:甲的策
7、略集;S2:乙的策略集;:乙的策略集;A:甲的赢得矩阵。甲的赢得矩阵。“齐王赛马齐王赛马”是一个矩阵策略。是一个矩阵策略。11对策论的基本概念第13页,此课件共63页哦在甲方的赢得矩阵中:在甲方的赢得矩阵中:A=aijmni 行代表甲方策略行代表甲方策略 i=1,2,m;j 行代表乙方策略行代表乙方策略 j=1,2,n;aij 代表代表甲方取策略甲方取策略 i,乙方取策略乙方取策略 j,这一局势下甲方的益损值。此时乙方的益损值这一局势下甲方的益损值。此时乙方的益损值为为 -aij(零和性质)。(零和性质)。在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智在考虑各方采用的策略时,必须注
8、意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。况作为决策的依据。22矩阵对策的最优纯策略矩阵对策的最优纯策略第14页,此课件共63页哦 例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得规定每局胜者得1 1分,输者得分,输者
9、得-1-1分,可知三赛三胜得分,可知三赛三胜得3 3分,三赛二胜得分,三赛二胜得1 1分,三赛一胜得分,三赛一胜得-1-1分,三赛三负得分,三赛三负得-3-3分。甲队的策略集为分。甲队的策略集为S S1 1=1 1,2 2,3 3,乙队的策略集为,乙队的策略集为S S2 2=1 1,2 2,3 3。根据以往比赛的资料,有甲队的赢得矩阵为。根据以往比赛的资料,有甲队的赢得矩阵为A A,如下所示,如下所示,请问这次比赛各队采用哪种阵容上场最为稳妥请问这次比赛各队采用哪种阵容上场最为稳妥?22矩阵对策的最优纯策略矩阵对策的最优纯策略第15页,此课件共63页哦矩阵矩阵A A中每行的最小元素分别为中每行
10、的最小元素分别为1 1,-3-3,-1-1。在这些最少赢得中最好的结果是在这些最少赢得中最好的结果是1 1,故甲队会采取策略,故甲队会采取策略 1 1,无论对手采取何策略,无论对手采取何策略,甲队至少得甲队至少得1 1分。对于乙队,分。对于乙队,1 1,2 2,3 3 可能带来的最少赢得,即可能带来的最少赢得,即A A中每列的最大元素,分别中每列的最大元素,分别为为3 3,1 1,3 3。乙队会采取。乙队会采取 2 2策略,确保甲队不会超过策略,确保甲队不会超过1 1分。分。1 1和和 2 2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,分别称为局中人甲队、乙队的最优策
11、略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。这种策略又称为最优纯策略。这种最优纯策略只有当赢得矩阵这种最优纯策略只有当赢得矩阵A=A=(a aijij)中等式)中等式 成立时,双方才有最优纯策略,并把(成立时,双方才有最优纯策略,并把(1 1,2 2)称为对策)称为对策G G在纯策略下的解,又称在纯策略下的解,又称(1 1,2 2)为对策)为对策G G的鞍点。把其值的鞍点。把其值V V称之为对策称之为对策G=SG=S1 1,S S2 2,AA的值。的值。22矩阵对策的最优纯策略矩阵对策的最优纯策略第16页,此课件共63页哦 例例 某单位采购员在秋天决定冬季取暖用煤的储量问题
12、,已知在正常的某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在正常的冬季气温条件下要消耗冬季气温条件下要消耗1515吨煤,在较暖和较冷的天气下要消耗吨煤,在较暖和较冷的天气下要消耗1010吨和吨和2020吨。假定冬吨。假定冬天的煤价随天气寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下每吨煤价分别天的煤价随天气寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下每吨煤价分别为为1010元、元、1515元、元、2020元。又设秋季时煤炭价格为每吨元。又设秋季时煤炭价格为每吨1010元。在没有关于当年冬季准确元。在没有关于当年冬季准确的气象预报的条件下,秋天储煤多少吨能使得单位的支出最少?
13、的气象预报的条件下,秋天储煤多少吨能使得单位的支出最少?解:局中人解:局中人I I为采购员,局中人为采购员,局中人IIII为大自然,采购员有三个策略,买为大自然,采购员有三个策略,买1010吨、吨、1515吨、吨、2020吨。分别记为吨。分别记为 1 1,2 2,3 3。大自然也有三个策略:暖、正常、冷,分别记为。大自然也有三个策略:暖、正常、冷,分别记为 1 1,2 2,3 3。22矩阵对策的最优纯策略矩阵对策的最优纯策略第17页,此课件共63页哦赢得矩阵如下:赢得矩阵如下:在此表上计算,有在此表上计算,有 得得故(故(3 3,3 3)为对策)为对策G G的解,的解,V VG G=-200=
14、-200。1 1 2 2 3 3 1 1(10(10吨)吨)-100-175-300 2 2(15(15吨)吨)-150-150-250 3 3(20(20吨)吨)-200-200-200 1 1 2 2 3 3minmin 1 1(10(10吨)吨)-100-175-300-300 2 2(15(15吨)吨)-150-150-250-250 3 3(20(20吨)吨)-200-200-200-200*maxmax-100-150-200*22矩阵对策的最优纯策略矩阵对策的最优纯策略第18页,此课件共63页哦 设矩阵对策设矩阵对策 G=S1,S2,A。当当 max min aij min ma
15、x aij i j j i时,不存在最优纯策略。时,不存在最优纯策略。例:设一个赢得矩阵如下例:设一个赢得矩阵如下:min min 5 9 5 5 9 5 A=max 6 =max 6 策略策略 2 8 6 6 i 8 6 6 i max 8 9 max 8 9 min 8 min 8 策略策略 1 j j 33矩阵对策的混合策略矩阵对策的混合策略第19页,此课件共63页哦 当甲取当甲取策略策略 2 2,乙取,乙取策略策略 1 1时,甲实际赢得时,甲实际赢得8比预期的多比预期的多2 2,乙当然不,乙当然不满意。考虑到甲可能取满意。考虑到甲可能取策略策略 2 2这一点,乙采取策略这一点,乙采取策
16、略 2 2。若甲也分析到。若甲也分析到乙可乙可能采取策略能采取策略 2 2这一点,取策略这一点,取策略 1 1,则赢得更多为则赢得更多为9 9 。此时,对两个局中人甲、。此时,对两个局中人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,即述原则的共同基础,即 一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)在各种情况下的平均赢得(损失)最多(最少)-即混
17、合策略。即混合策略。33矩阵对策的混合策略矩阵对策的混合策略第20页,此课件共63页哦 求解求解混合策略的混合策略的问题有问题有图解法、迭代法、线性方程法和线性规划法等,我图解法、迭代法、线性方程法和线性规划法等,我们这里只介绍们这里只介绍线性规划法线性规划法,其他方法略。,其他方法略。例:设甲使用策略例:设甲使用策略 1 1的概率为的概率为X1 1,使用策略,使用策略 2 2的概率为的概率为X2 ,并设在最坏的情,并设在最坏的情况下,甲赢得的平均值为况下,甲赢得的平均值为V(未知)。(未知)。5 9 A=STEP 1 8 6 1)1)X1+X2=1 X1,X2 0 33矩阵对策的混合策略矩阵
18、对策的混合策略第21页,此课件共63页哦2)2)无论乙取何策略,甲的平均赢得应不少于无论乙取何策略,甲的平均赢得应不少于V:V:对乙取对乙取 1 1:5X5X1 1+8X+8X2 2 V V对乙取对乙取 2 2:9X9X1 1+6X+6X2 2 V V注意注意 V0,V0,因为因为A A各元素为正。各元素为正。STEP 2 STEP 2 作变换:作变换:X X1 1=X=X1 1/V;X/V;X2 2=X=X2 2/V/V得到上述关系式变为:得到上述关系式变为:X X1 1+X+X2 2=1/V (V=1/V (V愈大愈好)待定愈大愈好)待定 5X5X1 1+8X+8X2 2 1 1 9X 9
19、X1 1+6X+6X2 2 1 1 X X1 1,X,X2 2 0 033矩阵对策的混合策略矩阵对策的混合策略第22页,此课件共63页哦建立线性模型:建立线性模型:min Xmin X1 1+X+X2 2 s.t.5Xs.t.5X1 1+8X+8X2 2 1 1 X X1 1=1/21=1/21 9 9X X1 1+6X+6X2 2 1 1 X X2 2=2/21=2/21 X X1 1,X,X2 2 0 1/V=0 1/V=X X1 1+X+X2 2=1/7=1/7 所以,所以,V=7 V=7 返回原问题:返回原问题:X X1 1=X X1 1V=1/3V=1/3 X X2 2=X X2 2
20、V=2/3V=2/3于是甲的最优混合策略为:于是甲的最优混合策略为:以以1/31/3的概率选的概率选 1 1,以以2/32/3的概率选的概率选 2 2,最优值,最优值V=7V=7。33矩阵对策的混合策略矩阵对策的混合策略第23页,此课件共63页哦 同样可求乙的最优混合策略:同样可求乙的最优混合策略:设乙使用策略设乙使用策略 1 1的概率为的概率为Y Y1 1 Y Y1 1+Y+Y2 2=1=1设乙使用策略设乙使用策略 2 2的概率为的概率为Y Y2 2 Y Y1 1,Y,Y2 2 0 0 设在最坏的情况下,甲赢得的平均值为设在最坏的情况下,甲赢得的平均值为V V。这也是乙损失的平均值,越小越好
21、。这也是乙损失的平均值,越小越好。作变换:作变换:Y Y1 1=Y=Y1 1/V/V,Y Y2 2=Y=Y2 2/V/V 建立线性模型:建立线性模型:max Ymax Y1 1+Y+Y2 2 s.t.5Ys.t.5Y1 1+9Y+9Y2 2 1 1 Y Y1 1=1/14=1/14 8 8Y Y1 1+6Y+6Y2 2 1 1 Y Y2 2=1/14=1/14 Y Y1 1,Y,Y2 2 0 1/V=0 1/V=Y Y1 1+Y+Y2 2=1/7=1/7 所以,所以,V=7 V=7 33矩阵对策的混合策略矩阵对策的混合策略第24页,此课件共63页哦返回原问题:返回原问题:Y1=Y1V=1/2
22、Y2=Y2V=1/2于是乙的最优混合策略为:于是乙的最优混合策略为:以以 的概率选的概率选 1 1;以以 的概率选的概率选 2 2,最优值,最优值 V=7。当赢得矩阵中有非正元素时,当赢得矩阵中有非正元素时,V 0 的条件不一定成立,可以作下列变换:的条件不一定成立,可以作下列变换:选选一正数一正数 k,令矩阵中每一元素加上,令矩阵中每一元素加上 k 得到新的正矩阵得到新的正矩阵A A,其对应的矩阵对策,其对应的矩阵对策G G=S=S1 1,S,S2 2,A,A 与与 G=SG=S1 1,S,S2 2,A,A 解相同,但解相同,但VG=VG k。33矩阵对策的混合策略矩阵对策的混合策略第25页
23、,此课件共63页哦例例:求解:求解“齐王赛马齐王赛马”问题。问题。已知齐王的赢得矩阵已知齐王的赢得矩阵A A求得求得故不存在纯策略问题下的解,可求其混合策略。故不存在纯策略问题下的解,可求其混合策略。A A中有负元素,可以取中有负元素,可以取k=2,k=2,在在A A的每个元素上加的每个元素上加2 2得到得到A A如下:如下:33矩阵对策的混合策略矩阵对策的混合策略第26页,此课件共63页哦 建立对建立对G G=S=S1 1,S S2 2,A A 中求甲方最佳策略的线性规划如下:中求甲方最佳策略的线性规划如下:Min xMin x1 1+x+x2 2+x+x3 3+x+x4 4+x+x5 5+
24、x+x6 6 约束条件:约束条件:5x5x1 1+3x+3x2 2+3x+3x3 3+x+x4 4+3x+3x5 5+3x+3x6 6 11 3x 3x1 1+5x+5x2 2+x+x3 3+3x+3x4 4+3x+3x5 5+3x+3x6 6 11 3x 3x1 1+3x+3x2 2+5x+5x3 3+3x+3x4 4+3x+3x5 5+x+x6 6 11 3x 3x1 1+3x+3x2 2+3x+3x3 3+5x+5x4 4+x+x5 5+3x+3x6 6 11 x x1 1+3x+3x2 2+3x+3x3 3+3x+3x4 4+5x+5x5 5+3x+3x6 6 11 3x 3x1 1+
25、x+x2 2+3x+3x3 3+3x+3x4 4+3x+3x5 5+5x+5x6 6 11 x xi i 0,i=1,2,0,i=1,2,6,6 可解得解为:可解得解为:x x1 1=x=x4 4=x=x5 5=0,x=0,x2 2=x=x3 3=x=x6 6=0.111,v=0.111,v=3,x=3,x1 1=x=x4 4=x=x5 5=0=0,x x2 2=x=x3 3=x=x6 6=1/3,=1/3,即即X X*=(0,1/3,1/3,0,0,1/3)=(0,1/3,1/3,0,0,1/3)T T,所以甲的最优策略为作出策略,所以甲的最优策略为作出策略 2 2、3 3、6 6的概率都的
26、概率都为为0.333,0.333,而作出而作出 1 1、4 4、5 5 的概率为的概率为0 0,此时,此时V VG G=V=V=3=3。33矩阵对策的混合策略矩阵对策的混合策略第27页,此课件共63页哦 同样可以建立对策同样可以建立对策G G=S=S1 1,S S2 2,A A 中求乙方最佳策略的线性规划如下:中求乙方最佳策略的线性规划如下:Min yMin y1 1+y+y2 2+y+y3 3+y+y4 4+y+y5 5+y+y6 6 约束条件:约束条件:5y5y1 1+3y+3y2 2+3y+3y3 3+3y+3y4 4+y+y5 5+3y+3y6 6 11 3y 3y1 1+5y+5y2
27、 2+3y+3y3 3+3y+3y4 4+3y+3y5 5+y+y6 6 11 3y 3y1 1+y+y2 2+5y+5y3 3+3y+3y4 4+3y+3y5 5+3y+3y6 6 11 y y1 1+3y+3y2 2+3y+3y3 3+5y+5y4 4+3y+3y5 5+3y+3y6 6 11 3y 3y1 1+3y+3y2 2+3y+3y3 3+y+y4 4+5y+5y5 5+3y+3y6 6 11 3y 3y1 1+3y+3y2 2+y+y3 3+3y+3y4 4+3y+3y5 5+5y+5y6 6 11 y yi i0,i=1,2,0,i=1,2,6,6 可解得解为:可解得解为:y
28、y1 1=y=y4 4=y=y5 5=0.111,y=0.111,y2 2=y=y3 3=y=y6 6=0,v=0,v=3,y=3,y1 1=y=y4 4=y=y5 5=1/3=1/3,y y2 2=y=y3 3=y=y6 6=0=0,即,即Y Y*=(1/3,0,0,1/3,1/3,0)=(1/3,0,0,1/3,1/3,0)T T。所以田忌的最优混合策略为作出策略所以田忌的最优混合策略为作出策略 1 1、4 4、5 5的概率都为的概率都为1/3,1/3,而作出而作出 2 2,3 3,6 6的概率为的概率为0 0,此时,此时V VG G=V=VG G-k=1-k=1。齐王赛马问题的对策最优解
29、可简记为齐王赛马问题的对策最优解可简记为X X*=(0,1/3,1/3,0,0,1/3)(0,1/3,1/3,0,0,1/3)T T,Y Y*=(1/3,0,0,1/3,1/3,0)(1/3,0,0,1/3,1/3,0)T T,对策值,对策值V VG G=1=1。33矩阵对策的混合策略矩阵对策的混合策略第28页,此课件共63页哦例例 两个局中人进行对策,规则是两人互相独立的各自从两个局中人进行对策,规则是两人互相独立的各自从1 1、2 2、3 3这三个这三个数字中任意选写一个数字。如果两人所写的数字之和为偶数,则局中人乙支数字中任意选写一个数字。如果两人所写的数字之和为偶数,则局中人乙支付给局
30、中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,则局付给局中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,则局中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。解:首先计算局中人甲的赢得矩阵如下表:解:首先计算局中人甲的赢得矩阵如下表:33矩阵对策的混合策略矩阵对策的混合策略4-56-34-52-34 1 1(出(出1 1)2 2(出(出2 2)3 3(出(出3 3)3 3(出(出3 3)2 2(出(出2 2)1 1(出(出1 1)甲的赢得甲的赢得甲的策略甲的策略乙的策略乙的策略第29页,此课件共63页哦即甲的赢
31、得矩阵为即甲的赢得矩阵为A A:可知无纯策略意义的解,下面求其在混合策略下的解。可知无纯策略意义的解,下面求其在混合策略下的解。A A的各元素都加上的各元素都加上6 6,得到,得到建立线性规划模型如下:建立线性规划模型如下:Min xMin x1 1+x+x2 2+x+x3 3 Max yMax y1 1+y+y2 2+y+y3 3 S.T.8xS.T.8x1 1+3x+3x2 2+10 x+10 x3 3 1 8y1 8y1 1+3y+3y2 2+10y+10y3 311 3x 3x1 1+10 x+10 x2 2+x+x3 3 1 3y1 3y1 1+10y+10y2 2+y+y3 3 1
32、1 10 x 10 x1 1+x+x2 2+12x+12x3 3 1 10y1 10y1 1+y+y2 2+12y+12y3 311 x x1 1,x,x2 2,x,x3 3 0 y0 y1 1,y,y2 2,y,y3 3 00 33矩阵对策的混合策略矩阵对策的混合策略第30页,此课件共63页哦得到得到x x1 1=0.25,x=0.25,x2 2=0.50,x=0.50,x3 3=0.25=0.25;y y1 1=0.25,y=0.25,y2 2=0.50,y=0.50,y3 3=0.25=0.25。即此对策的解为即此对策的解为X X*=(0.25,0.50,0.25)=(0.25,0.50
33、,0.25)T T,Y Y*=(0.25,0.50,0.25)=(0.25,0.50,0.25)T T。V VG G=V=VG G-k=0-k=0。33矩阵对策的混合策略矩阵对策的混合策略第31页,此课件共63页哦例例4 4 甲乙两个企业生产同一种电子产品,甲企业可以采取的策略措施有甲乙两个企业生产同一种电子产品,甲企业可以采取的策略措施有:(1)(1)降低产品价格;降低产品价格;(2)(2)提高产品质量;提高产品质量;(3)(3)推出新产品。乙企业考虑采取的策略措施有推出新产品。乙企业考虑采取的策略措施有(1)(1)增加广告费用;增加广告费用;(2)(2)增增设维修网点,加强售后服务;设维修
34、网点,加强售后服务;(3)(3)改进产品性能。由于甲乙两个企业财力有限,都只能采取一个措施。改进产品性能。由于甲乙两个企业财力有限,都只能采取一个措施。假定这两个企业所占有的市场总份额一定,由于各自采取的措施不同,通过预测今后两个企业的市场假定这两个企业所占有的市场总份额一定,由于各自采取的措施不同,通过预测今后两个企业的市场占有份额变动情况如下表,试求出这两个企业各自的最优策略。占有份额变动情况如下表,试求出这两个企业各自的最优策略。3-58-6510108-12 1 1(措施(措施1 1)2 2(措施(措施2 2)3 3(措施(措施3 3)3 3(措施(措施3 3)2 2(措施(措施2 2
35、)1 1(措施(措施1 1)33矩阵对策的混合策略矩阵对策的混合策略甲的赢得甲的赢得甲的策略甲的策略乙的策略乙的策略第32页,此课件共63页哦解:易知此对策无纯策略意义下的解。把解:易知此对策无纯策略意义下的解。把A A的每一个元素加上的每一个元素加上1212,得到,得到A A建立线性规划模型如下:建立线性规划模型如下:Min xMin x1 1+x+x2 2+x+x3 3 Max yMax y1 1+y+y2 2+y+y3 3 S.T.22xS.T.22x1 1+20 x+20 x2 21 22y1 22y1 1+6y+6y2 2+15y+15y3 3 11 6x 6x1 1+17x+17x
36、2 2+22x+22x3 3 1 20y1 20y1 1+17y+17y2 2+7y+7y3 3 11 15x 15x1 1+7x+7x2 2+20 x+20 x3 3 1 22y1 22y2 2+20y+20y3 3 11 x x1 1,x,x2 2,x,x3 30 y0 y1 1,y,y2 2,y,y3 300得到:得到:x x1 1=0.027,x=0.027,x2 2=0.020,x=0.020,x3 3=0.023=0.023;y y1 1=0.0225,y=0.0225,y2 2=0.0225,y=0.0225,y3 3=0.025=0.025。V=14.29V=14.29。x x
37、1 1=0.3858,x=0.3858,x2 2=0.2858,x=0.2858,x3 3=0.3286=0.3286;y y1 1=0.3215,y=0.3215,y2 2=0.3215,y=0.3215,y3 3=0.3572=0.3572。即此对策的解为即此对策的解为 X X*=(0.3858,0.2858,0.3286)=(0.3858,0.2858,0.3286)T T,Y,Y*=(0.3215,0.3215,0.3572)=(0.3215,0.3215,0.3572)T T。V VG G=V=VG G-k=2.29-k=2.29。33矩阵对策的混合策略矩阵对策的混合策略第33页,此
38、课件共63页哦优超原则:优超原则:假设假设矩阵对策矩阵对策 G=SG=S1 1,S,S2 2,A,A 甲方赢得矩阵甲方赢得矩阵 A=aA=aijij m m n n若存在两行(列),若存在两行(列),s s 行(列)的各元素均优于行(列)的各元素均优于 t t 行(列)的元素,即行(列)的元素,即a asjsj a atj tj j=1,2 j=1,2 n (a n (ais is a ait it i=1,2 i=1,2 m)m)称甲方策略称甲方策略 s s优超于优超于 t t(s s优超于优超于 t t)。优超原则优超原则:当局中人甲方的策略:当局中人甲方的策略 t t被其它策略所被其它策
39、略所优超时,可在其赢得矩阵优超时,可在其赢得矩阵A A中划去第中划去第t t行(同理,当局中人乙方的策略行(同理,当局中人乙方的策略 t t被其它策略所被其它策略所优超时,可在优超时,可在矩阵矩阵A A中划去第中划去第t t列)。列)。如此得到阶数较小的赢得矩阵如此得到阶数较小的赢得矩阵A A,其对应的矩阵对策其对应的矩阵对策G=S1,S2,A 与与 G=S1,S2,A 等价,即解相同。等价,即解相同。33矩阵对策的混合策略矩阵对策的混合策略第34页,此课件共63页哦例例.设设甲方的益损值,赢得矩阵为甲方的益损值,赢得矩阵为 3 2 0 3 0 被第被第3 3、4 4行所优超行所优超 5 0
40、2 5 9 被第被第3 3行所优超行所优超A=7 3 9 5 9 4 6 8 7 5.5 6 0 8 8 3得到得到 7 3 9 5 9 被第被第1 1列所优超列所优超A1=4 6 8 7 5.5 被第被第2 2列所优超列所优超 6 0 8 8 333矩阵对策的混合策略矩阵对策的混合策略第35页,此课件共63页哦得到得到 7 3 9 A2=4 6 5.5 6 0 3 被第被第1 1行所优超行所优超得到得到 7 3 9 被第被第1 1列所优超列所优超 A3=4 6 5.5 7 3最终得到最终得到 A4=4 6 33矩阵对策的混合策略矩阵对策的混合策略第36页,此课件共63页哦对对A A4 4计算
41、,用线性规划方法得到:计算,用线性规划方法得到:(注意:余下的策略为(注意:余下的策略为 3 3,4 4,1 1,2 2)甲:甲:X*=(0,0,1/15,2/15,0)T V=5 X*=(0,0,1/3,2/3,0)T 乙:乙:Y*=(1/10,1/10,0,0,0)T V=5 Y*=(1/2,1/2,0,0,0)T。注:注:利用优超原则化简赢得矩阵时,有可能将原对策问题的解也划去一些利用优超原则化简赢得矩阵时,有可能将原对策问题的解也划去一些(多解情况);(多解情况);线性规划求解时有可能是多解问题。线性规划求解时有可能是多解问题。33矩阵对策的混合策略矩阵对策的混合策略第37页,此课件共
42、63页哦 44其他类型的对策论简介其他类型的对策论简介 在对策论中可以根据不同方式对对策问题进行分类,通常分类的在对策论中可以根据不同方式对对策问题进行分类,通常分类的方式有(方式有(1)根据局中人的个数,分为二人对策和多人对策;()根据局中人的个数,分为二人对策和多人对策;(2)根据)根据各局中人的赢得函数的代数和是否为零,可分为零和对策和非零和对各局中人的赢得函数的代数和是否为零,可分为零和对策和非零和对策;(策;(3)根据局中人是否合作,又可分为合作对策和非合作对策;()根据局中人是否合作,又可分为合作对策和非合作对策;(4)根据局中人的策略集中个数,又分为有限对策和无限对策(或连续对策
43、);)根据局中人的策略集中个数,又分为有限对策和无限对策(或连续对策);(5)也可根据局中人掌握信息的情况及决策选择是否和时间有关可分为完全信)也可根据局中人掌握信息的情况及决策选择是否和时间有关可分为完全信息静态对策、完全信息动态对策、非完全信息静态对策及非完全信息动态对策;息静态对策、完全信息动态对策、非完全信息静态对策及非完全信息动态对策;也可以根据对策模型的数字特征又分为矩阵对策、连续对策、微分对策、阵地对也可以根据对策模型的数字特征又分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策。策、凸对策、随机对策。本节只对对策论中非合作对策的完全信息对策、多人非合作对策、非零和对本
44、节只对对策论中非合作对策的完全信息对策、多人非合作对策、非零和对策作一个简单的叙述性介绍。策作一个简单的叙述性介绍。第38页,此课件共63页哦 44其他类型的对策论简介其他类型的对策论简介一、完全信息静态对策一、完全信息静态对策 该对策是指掌握了参与人的特征、战略空间、支付函数等知识和信息并且参该对策是指掌握了参与人的特征、战略空间、支付函数等知识和信息并且参与人同时选择行动方案或虽非同时但后行动者并不知道前行动者采取了什么行动与人同时选择行动方案或虽非同时但后行动者并不知道前行动者采取了什么行动方案。方案。纳什均衡是一个重要概念。在一个战略组合中,给定其他参与者战略的情况下,任何纳什均衡是一
45、个重要概念。在一个战略组合中,给定其他参与者战略的情况下,任何参与者都不愿意脱离这个组合,或者说打破这个僵局,这种均衡就称为参与者都不愿意脱离这个组合,或者说打破这个僵局,这种均衡就称为纳什均衡纳什均衡。下。下面以著名的面以著名的“囚徒困境囚徒困境”来进一步阐述。来进一步阐述。第39页,此课件共63页哦l上策均衡:l我所做的是不管你做什么我所能做的最好的l你所做的是不管我做什么你所能做的最好的lNASH均衡:l我所做的是给定你所做的我所能做的最好的l你所做的是给定我所做的你所能做的最好的第40页,此课件共63页哦纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。纳什均衡纳什
46、均衡 1上策均衡与纳什均衡的区别:上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。什么策略,你所选择的是最好的。纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。的是最好的。上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。第41页,此课件共63页哦纳什均衡的意义纳什均衡的意义所以所以“纳什均衡纳什均衡”是对冯是对冯
47、诺依曼和摩根斯特恩的合作博弈理论的重大发诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。展,甚至可以说是一场革命。合作是有利的合作是有利的“利己策略利己策略”。但它必须符合以下黄金律:按照你愿意别人对。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人己所不欲勿施于人”。但前提是人所不欲勿施于我。但前提是人所不欲勿施于我。其次,其次,“纳什均衡纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比是一种非合作博弈均衡,在现实中非合作的情
48、况要比合作情况普遍。合作情况普遍。纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。第42页,此课件共63页哦例例1 1 囚徒困境模型囚徒困境模型 两人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人都将因抢劫罪加盗窃罪被判3年监禁;如果两人都拒供,则两人都将因盗窃罪被判半年监禁;如果一人供认而另一个拒供,则供认这被认为有功而免受处
49、罚,拒供者将因抢劫罪、盗窃罪以及拒供重判5年。44其他类型的对策论简介其他类型的对策论简介第43页,此课件共63页哦囚徒困境囚徒困境赢赢利表(利表(Payoff Table)Payoff Table)拒供供认拒供0.5年,0.5年5年,0年供认0年,5年3年,3年乙乙甲甲第44页,此课件共63页哦囚徒困境囚徒困境每个囚徒都会发现每个囚徒都会发现如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。如果对方供认,则自己供认将被判3年,而自己拒供则会被判5年,因此供认是较好的选择。由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是由于每个囚徒都发现
50、供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。两个囚徒都会选择供认。这就是博弈的纳什均衡。攻守同盟?攻守同盟?很难达成:隔离审查,每个人都担心对方背弃盟约。很难达成:隔离审查,每个人都担心对方背弃盟约。第45页,此课件共63页哦囚徒困境的启示囚徒困境的启示“囚囚徒徒的的两两难难选选择择”有有着着广广泛泛而而深深刻刻的的意意义义。个个人人理理性性与与集集体体理理性性的的冲冲突突,各各人人追追求求利利己己行行为为而而导导致致的的最最终终结结局局是是一一个个“纳纳什什均均衡衡”,也也是是对对所所有有人人都都不不利利的的结结局局。他他们们两两人人都都是是在在坦