《运筹学博弈论课件.pptx》由会员分享,可在线阅读,更多相关《运筹学博弈论课件.pptx(86页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、运运筹筹学学基基础础 博弈论博弈论 博弈论博弈论博弈论博弈论概论概论概论概论 纳什均衡纳什均衡纳什均衡纳什均衡 子子子子博弈精炼纳什博弈精炼纳什博弈精炼纳什博弈精炼纳什均衡均衡均衡均衡 贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡 精练精练精练精练贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡第第1 1节节 博弈论博弈论概论概论1 1什么是博弈论什么是博弈论一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾矛盾。如何。如何克服和解决人们之间的利益冲突?
2、如何才能实现一种既能让每个人都实现自己的利益,克服和解决人们之间的利益冲突?如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面?第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.1 1.1.1 1.1.1 1.1.1 博弈论的意义博弈论的意义博弈论的意义博弈论的意义博弈论博弈论博弈论博弈论(game theorygame theorygame theorygame theory)为)为)为)为解决这些问题提供了有力工具解决这些问题提供了有力工具解决这些问题提供了有力工具解
3、决这些问题提供了有力工具。要要想在现代社会做一个有文化的人,你必须对想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。博弈论有一个大致了解。保罗保罗.萨缪尔森萨缪尔森第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.1 1.1.1 1.1.1 1.1.1 博弈论的意义博弈论的意义博弈论的意义博弈论的意义孙膑孙膑孙膑孙膑与与与与庞涓吃饼庞涓吃饼庞涓吃饼庞涓吃饼第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例一天鬼谷子想试孙膑与庞涓的一天鬼谷子想试孙膑与庞涓的智力,鬼智力,鬼谷子拿出谷子拿出
4、5 5个个饼,放饼,放在桌上在桌上,让他们两人取去让他们两人取去吃。鬼吃。鬼谷子说谷子说:每人一次最多拿两个每人一次最多拿两个饼,并且饼,并且拿的饼全部吃完后才能再拿的饼全部吃完后才能再拿。鬼拿。鬼谷子说完谷子说完后,庞涓后,庞涓赶忙拿了赶忙拿了2 2个个饼,饼,而而孙膑从容地拿孙膑从容地拿1 1个饼吃个饼吃起来,庞涓起来,庞涓未吃完两个未吃完两个饼,孙膑饼,孙膑已经吃完已经吃完1 1个个饼,孙膑饼,孙膑第二次拿了第二次拿了2 2个个饼,饼,此时此时桌上已经没有饼桌上已经没有饼了,最后,孙膑了,最后,孙膑吃了三个吃了三个饼,而饼,而庞涓吃了两个庞涓吃了两个饼。在饼。在这则典故当中其实隐藏着这则
5、典故当中其实隐藏着一条生存一条生存法则。法则。海滩选址博弈海滩选址博弈海滩选址博弈海滩选址博弈两两个竞争者个竞争者Y Y和和C C销售销售软饮料软饮料日光日光裕者均匀分布在海滩裕者均匀分布在海滩上上Y Y和和C C价格价格相等相等消费者消费者从较近的售点购买从较近的售点购买饮料饮料第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例海洋海洋海洋海洋0 0B B海滩海滩A A200200码码C C海滩选址博弈海滩选址博弈海滩选址博弈海滩选址博弈第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1
6、.2 1.1.2 1.1.2 引例引例引例引例在中国的大城市里,你会发现一个有意思的现象,当你在街边看到一个肯德基后,相距不太远的距在中国的大城市里,你会发现一个有意思的现象,当你在街边看到一个肯德基后,相距不太远的距离你会发现一个麦当劳离你会发现一个麦当劳囚徒囚徒囚徒囚徒困境困境困境困境是是图克(图克(TuckerTucker)19501950年提出年提出的的,该该博弈是博弈论最经典、著名的博弈是博弈论最经典、著名的博弈。该博弈。该博弈本身博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各
7、种社会问题。问题。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例囚徒囚徒 B B坦白坦白不坦白不坦白囚徒囚徒 A A坦白坦白-5,-5-5,-5-5,-5-5,-51,-101,-101,-101,-10不坦白不坦白-10,-1-10,-1-10,-1-10,-1-2,-2-2,-2-2,-2-2,-2商业竞争策略:广告战商业竞争策略:广告战商业竞争策略:广告战商业竞争策略:广告战 两个公司互相竞争,两个公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入两个公司互相竞争,两个公司的广告互相影响,即
8、一公司的广告较被顾客接受则会夺取对方的部分收入。但。但若双方同时期发布同等数量的广告,双方收入都增加很少而成本增加若双方同时期发布同等数量的广告,双方收入都增加很少而成本增加。但。但若不提高广告数量,生意又会被对若不提高广告数量,生意又会被对方夺走方夺走。两。两个公司可以有二选择个公司可以有二选择:1.1.互相达成协议,减少广告的开支。(合作)互相达成协议,减少广告的开支。(合作)2.2.增加广告开支,压倒对方。增加广告开支,压倒对方。(背叛)(背叛)在现实中,要两个互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中在现实中,要两个互相竞争的公司达成合作协议是较为困难的,多数都会陷
9、入囚徒困境中。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例百事可乐百事可乐做广告做广告不做广告不做广告可口可口可乐可乐做广告做广告10101010,5,5,5,515151515,0,0,0,0不做广告不做广告6 6 6 6,8 8 8 810101010,2,2,2,2囚徒困境与苏美争霸囚徒困境与苏美争霸囚徒困境与苏美争霸囚徒困境与苏美争霸在苏美争霸博弈中,美国和前苏联都处于在苏美争霸博弈中,美国和前苏联都处于“囚徒困境囚徒困境”中。中。前苏联前苏联不扩军备战不扩军备战扩军备战扩军备战美国美国不扩军备战不扩军备
10、战(10,1010,10)(-100,100-100,100)扩军备战扩军备战(100,-100100,-100)(0,00,0)第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例智猪博弈智猪博弈智猪博弈智猪博弈猪猪圈圈中中有有一一头头大大猪猪和和一一头头小小猪猪,在在猪猪圈圈的的一一端端设设有有一一个个按按钮钮,每每按按一一下下,位位于于猪猪圈圈另另一一端端的的食食槽槽中中就就会会有有1010单单位位的的猪猪食食进进槽槽,但但每每按按一一下下按按钮钮会会耗耗去去相相当当于于2 2单单位位猪猪食食的的成成本本。如如果果
11、大大猪猪先先到到食食槽槽,则则大大猪猪吃吃到到9 9单单位位食食物物,小小猪猪仅仅能能吃吃到到1 1单单位位食食物物;如如果果两两猪猪同同时时到到食食槽槽,则则大大猪猪吃吃7 7单单位位,小小猪猪吃吃3 3单位食物;如果小猪先到,大猪吃单位食物;如果小猪先到,大猪吃6 6单位而小猪吃单位而小猪吃4 4单位食物。给出这个博弈的支付矩阵单位食物。给出这个博弈的支付矩阵。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例小猪小猪按按等待等待大猪大猪按按5,5,5,5,1 1 1 14 4 4 4,4 4 4 4等待等待9 9
12、 9 9,-1,-1,-1,-10 0 0 0,0 0 0 0第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例“智猪博弈智猪博弈智猪博弈智猪博弈搭便车搭便车搭便车搭便车”股市股市股市股市博弈博弈博弈博弈在在股股票票市市场场上上,大大户户是是大大猪猪,他他们们要要进进行行技技术术分分析析,收收集集信信息息、预预测测股股价价走走势势,但但大大量量散散户户就就是是小小猪猪。他他们们不不会会花花成成本本去去进进行行技技术术分分析析,而而是是跟跟着着大大户户的的投投资资战战略略进进行行股股票票买买卖卖,即即所所谓谓“散散户户跟
13、跟大大户户”的现象的现象。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例为什么为什么为什么为什么中小企业不会花钱去开发新产品?中小企业不会花钱去开发新产品?中小企业不会花钱去开发新产品?中小企业不会花钱去开发新产品?在在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后
14、生产模仿生产模仿大企业的新产大企业的新产品的品的产品产品去销售。去销售。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例斗鸡斗鸡斗鸡斗鸡博弈(懦夫博弈)博弈(懦夫博弈)博弈(懦夫博弈)博弈(懦夫博弈)大英雄大英雄进进退退大将军大将军进进-3-3-3-3,-3-3-3-32 2 2 2,0 0 0 0退退0 0 0 0,2 2 2 20 0 0 0,0 0 0 0第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例独木桥独木桥冷战期间美苏抢占地盘
15、冷战期间美苏抢占地盘,一方抢占一块地盘,另一方就占另一块。一方抢占一块地盘,另一方就占另一块。夫妻吵架,一方厉害,另一方就出去躲躲。夫妻吵架,一方厉害,另一方就出去躲躲。斗鸡博弈(懦夫博弈)斗鸡博弈(懦夫博弈)斗鸡博弈(懦夫博弈)斗鸡博弈(懦夫博弈)第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例石头石头石头石头、剪子、布、剪子、布、剪子、布、剪子、布第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例博博博博弈方弈方弈方弈方2 2 2 2石头
16、石头剪子剪子布布博弈方博弈方博弈方博弈方1 1 1 1石头石头0 0 0 0,0 0 0 01 1 1 1,-1-1-1-1-1-1,1 1剪子剪子-1-1-1-1,1 1 1 10 0 0 0,0 0 0 01 1,-1-1布布1 1,-1-1-1-1,1 10 0,0 0利益与道德的博弈利益与道德的博弈利益与道德的博弈利益与道德的博弈有一群猴子被关在笼子里。在笼子里的上方有一条绳子,绳有一群猴子被关在笼子里。在笼子里的上方有一条绳子,绳子拴着一个香蕉,绳子的另一头连着一个水箱子拴着一个香蕉,绳子的另一头连着一个水箱。猴子。猴子们发现们发现了香蕉,有个猴子跳上去够这个香蕉,当猴子够到时,与香
17、了香蕉,有个猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了水箱,于是一盆水倒进了笼子蕉相连的绳子带动了水箱,于是一盆水倒进了笼子。尽管。尽管够够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了。吃到香蕉到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了。吃到香蕉的猴子是少数,而其余的大多数猴子都被淋湿的猴子是少数,而其余的大多数猴子都被淋湿。经过。经过一段时一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。久而久之,猴子们内部形成了道德约束,们便揍那个猴子。久而久之,猴子们内部形成了道德约束,再也没有猴子敢去取香蕉了。再
18、也没有猴子敢去取香蕉了。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.2 1.1.2 1.1.2 1.1.2 引例引例引例引例第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.3 1.1.3 1.1.3 1.1.3 博弈论的概念博弈论的概念博弈论的概念博弈论的概念博弈论(博弈论(博弈论(博弈论(game theorygame theorygame theorygame theory):):):):研究利益存在冲突的决策主体在相互依赖的条件下,如何选择适研究利益存在冲突的决策主体在相互依赖的条件下,如何选择适当的策略实施以获得最大利益的思想和方法。当的
19、策略实施以获得最大利益的思想和方法。1 12 2研究对象不是客观规律,而是带有主动性的人的活动。研究对象不是客观规律,而是带有主动性的人的活动。最优不是绝对的,而是现有主客观条件下的理想结果。最优不是绝对的,而是现有主客观条件下的理想结果。从游戏到从游戏到从游戏到从游戏到博弈博弈博弈博弈:博弈博弈就是策略对抗,或策略有关键作用的就是策略对抗,或策略有关键作用的游戏。游戏。博弈博弈GameGame,博弈论,博弈论Game Game TheoryTheory,GameGame即游戏、即游戏、竞技。竞技。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.3 1.1.3 1.1.3
20、 1.1.3 博弈论的概念博弈论的概念博弈论的概念博弈论的概念博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想。比如比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间企业在决策时,总是会考虑竞争对手的反应;个人与政府之间“上有政策,下有对策上有政策,下有对策”;金融监管与创新犹如;金融监管与创新犹如“猫鼠猫鼠博弈博弈”;博弈还作为消遣游戏,让人们获得快乐。;博弈还作为消遣游戏,让人们获得快乐。博弈的特征表现为两个或两个以
21、上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。于对方的行动,每个当事人的收益都取决于所有当事人的行动。于对方的行动,每个当事人的收益都取决于所有当事人的行动。于对方的行动,每个当事人的收益都取决于所有当事人的行动。当当所有当事人都拿定主意作出决策时,博弈的局势便确定下来。所
22、有当事人都拿定主意作出决策时,博弈的局势便确定下来。博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策理论。博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策理论。博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策理论。博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策理论。博弈论关注的问题博弈论关注的问题博弈论关注的问题博弈论关注的问题在在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动?每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动?第第1 1节
23、节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.4 1.1.4 1.1.4 1.1.4 博弈论博弈论博弈论博弈论的研究对象的研究对象的研究对象的研究对象参与参与参与参与人:人:人:人:博弈论中选择行动以最大化自己效用的决策博弈论中选择行动以最大化自己效用的决策主体主体行动:行动:行动:行动:参与人的决策变量参与人的决策变量战略:战略:战略:战略:参与人选择行动的规则参与人选择行动的规则信息:信息:信息:信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识支付函数:支付函数:支付函数:支付函数:参与人从博弈中获得
24、的效用水平参与人从博弈中获得的效用水平 结果:结果:结果:结果:博弈分析真正感兴趣的要素的集合博弈分析真正感兴趣的要素的集合均衡:均衡:均衡:均衡:所有参与人的最优战略的组合所有参与人的最优战略的组合参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.5 1.1.5 1.1.5 1.1.5 博弈论博弈论博弈论博弈论的基本概念的基本概念的基本概念的基本概念参与人:博弈论中选择行动以最大化自己效用的决策主体。参与人:博弈论中选择行动以最大化自
25、己效用的决策主体。参与人:博弈论中选择行动以最大化自己效用的决策主体。参与人:博弈论中选择行动以最大化自己效用的决策主体。可以是自然人,也可以是团体,如企业、国家甚至由可以是自然人,也可以是团体,如企业、国家甚至由若干国家若干国家组成的集团(组成的集团(OPECOPEC、欧盟等)、欧盟等)。虚拟参与人:虚拟参与人:虚拟参与人:虚拟参与人:“自然自然自然自然”作为虚拟参与人作为虚拟参与人作为虚拟参与人作为虚拟参与人自然:指决定外生的随机变量的自然:指决定外生的随机变量的机制为机制为分析方便引入,自然作为虚拟参与人没有自己的支付分析方便引入,自然作为虚拟参与人没有自己的支付和目标函数和目标函数(即
26、(即所有结果对它是无差异的)所有结果对它是无差异的)参与人决策的后果依赖于自然的选择。在不完全信息参与人决策的后果依赖于自然的选择。在不完全信息博弈中博弈中,自然选择参与人的类型,自然选择参与人的类型第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.5 1.1.5 1.1.5 1.1.5 博弈论博弈论博弈论博弈论的基本概念的基本概念的基本概念的基本概念四个核心四个核心四个核心四个核心博弈的参加者博弈的参加者(Player(Player)各博弈方的策略各博弈方的策略(Strategies(Strategies)或或行为行为(Actions)(Actions)博弈的次序博弈的次
27、序(Order)(Order)博弈方的得益博弈方的得益(Payoffs)(Payoffs)第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.5 1.1.5 1.1.5 1.1.5 博弈论博弈论博弈论博弈论的基本概念的基本概念的基本概念的基本概念2 2博弈的分类博弈的分类第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.1 1.2.1 1.2.1 1.2.1 博弈博弈博弈博弈的的的的分类概述分类概述分类概述分类概述按人数按人数按人数按人数按策略按策略按策略按策略按收益按收益按收益按收益按性质按性质按性质按性质按次序按次序按次序按次序按信息按信息按信息按信息二人博弈
28、二人博弈多人博弈多人博弈有限博弈有限博弈无限博弈无限博弈零和博弈零和博弈非零和博弈非零和博弈非合作博弈非合作博弈合作博弈合作博弈静态博弈静态博弈动态博弈动态博弈完全信息博弈完全信息博弈不不完全信息博弈完全信息博弈交叉分类:交叉分类:交叉分类:交叉分类:以上分类方式的结合,比如二人零和有限博弈。以上分类方式的结合,比如二人零和有限博弈。第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.2 1.2.2 1.2.2 1.2.2 博弈分类博弈分类博弈分类博弈分类详解详解详解详解二人博弈二人博弈二人博弈二人博弈多人博弈多人博弈多人博弈多人博弈在博弈中有两个局中人,称为二人博弈在博弈中有两个局
29、中人,称为二人博弈。在博弈中有在博弈中有两以上个两以上个局中人,局中人,称为多人博弈称为多人博弈。第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.2 1.2.2 1.2.2 1.2.2 博弈分类博弈分类博弈分类博弈分类详解详解详解详解有限有限有限有限博弈博弈博弈博弈无限博弈无限博弈无限博弈无限博弈博弈被重复一个固定的次数称为博弈被重复一个固定的次数称为有限博弈。有限博弈。博弈被博弈被重复,没有一重复,没有一个固定的次数个固定的次数称为无限称为无限博弈。博弈。第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.2 1.2.2 1.2.2 1.2.2 博弈分类博弈分类博弈分
30、类博弈分类详解详解详解详解零和博弈零和博弈零和博弈零和博弈非零和非零和非零和非零和博弈博弈博弈博弈在博弈在博弈中一组局中人所得到的支付(或收益)中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。弈结果总和为零的博弈称为零和博弈。非非零和博弈指所有局中人的支付(或收益)零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。的代数和不为零。为正或为负。赢赢赢赢钱与输钱为零和博弈钱与输钱为零和博弈钱与输钱为零和博弈钱与输钱为零和博弈;工会与厂方达成增加工资的协议双方获得工会与厂方达成增加工资的协议
31、双方获得工会与厂方达成增加工资的协议双方获得工会与厂方达成增加工资的协议双方获得“双赢双赢双赢双赢”。反之,罢工导致。反之,罢工导致。反之,罢工导致。反之,罢工导致“两败俱伤两败俱伤两败俱伤两败俱伤”。第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.2 1.2.2 1.2.2 1.2.2 博弈分类博弈分类博弈分类博弈分类详解详解详解详解合作博弈(合作博弈(合作博弈(合作博弈(cooperative gamecooperative gamecooperative gamecooperative game)非合作博弈(非合作博弈(非合作博弈(非合作博弈(non-cooperative
32、 gamenon-cooperative gamenon-cooperative gamenon-cooperative game)以局中人整体的可能联合行动集合为基本要以局中人整体的可能联合行动集合为基本要素。如果局中人能够达成有约束力的协议或素。如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强合约,则该博弈称为合作博弈。合作博弈强调的是集体理性调的是集体理性。以单个局中人的可能行动集合为基本要素的以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博弈为达成有约束力的协议或
33、合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。非合作博弈。非合作博弈强调的是个体理性。运筹学主要运筹学主要运筹学主要运筹学主要研究的是非合作博弈研究的是非合作博弈研究的是非合作博弈研究的是非合作博弈第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.2 1.2.2 1.2.2 1.2.2 博弈分类博弈分类博弈分类博弈分类详解详解详解详解静态博弈静态博弈静态博弈静态博弈(static gamestatic gamestatic gamestatic game)动态博弈动态博弈动态博弈动态博弈(dynamic gamedynamic gamedynamic gamedynam
34、ic game)博弈博弈中局中人同时选择行动,或虽然不是同中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了时行动但后行动者并不了解前行动者采取了什么具体行动。什么具体行动。指指局中人的行动有先后顺序,且后行动者能局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动够观察到先行动者所选择的行动。“石头、剪刀、布石头、剪刀、布石头、剪刀、布石头、剪刀、布”的的的的游戏;游戏;游戏;游戏;下棋、打牌等游戏。下棋、打牌等游戏。下棋、打牌等游戏。下棋、打牌等游戏。第第1 1节节 博弈论博弈论概论概论 博弈分类博弈分类1.2.2 1.2.2 1.2.2 1.2.2 博弈
35、分类博弈分类博弈分类博弈分类详解详解详解详解完全信息完全信息完全信息完全信息博弈博弈博弈博弈(complete(complete(complete(completeinformation)information)information)information)不完全信息博弈不完全信息博弈不完全信息博弈不完全信息博弈(incomplete(incomplete(incomplete(incompleteinformation)information)information)information)将各博弈方都完全了解所有博弈方各种情况将各博弈方都完全了解所有博弈方各种情况下得益的博弈称为下得益的
36、博弈称为“完全信息博弈完全信息博弈”。将至少部分博弈方不完全了解其他博弈方得将至少部分博弈方不完全了解其他博弈方得益情况的博弈称为益情况的博弈称为“不完全信息博弈不完全信息博弈”。3 3博弈论的表示方法博弈论的表示方法战略式战略式表述表述(strategic form strategic form representation)representation)多多用矩阵用矩阵1 12 22 2L LL LS SS SL LS S(2 2,2 2)(-1-1,-1 1)(-1-1,-1 1)(1 1,1 1)扩展式扩展式表述表述(extensive form representationexten
37、sive form representation)多多用博弈树用博弈树第第1 1节节 博弈论博弈论概论概论 博弈论博弈论表示方法表示方法1.3.1 1.3.1 1.3.1 1.3.1 博弈论的两种表示方法博弈论的两种表示方法博弈论的两种表示方法博弈论的两种表示方法1 1L LS S2 2L L5,5,5,5,1 1 1 14 4 4 4,4 4 4 4S S9 9 9 9,-1,-1,-1,-10 0 0 0,0 0 0 0案例:案例:案例:案例:房地产房地产开发开发项目项目,假设假设有有A A、B B两家两家开发商,市场需求可能开发商,市场需求可能大,也可能大,也可能小小,投入需要投入需要1
38、 1亿。亿。假定市场上有两栋楼出售假定市场上有两栋楼出售:需求:需求大时,大时,每栋售价每栋售价每栋售价每栋售价1.41.41.41.4亿;亿;亿;亿;需求小时需求小时,每栋售价每栋售价每栋售价每栋售价7 7 7 7千万千万千万千万如果市场如果市场上有上有一栋一栋楼楼出售出售:需求:需求大时大时,每栋售价每栋售价每栋售价每栋售价1.81.81.81.8亿;亿;亿;亿;需求小时需求小时,每栋售价每栋售价每栋售价每栋售价1.11.11.11.1亿亿亿亿第第1 1节节 博弈论博弈论概论概论 博弈论博弈论表示方法表示方法1.2.2 1.2.2 1.2.2 1.2.2 博弈论的表示方法博弈论的表示方法博
39、弈论的表示方法博弈论的表示方法示例示例示例示例开发商开发商B B开发开发不开发不开发开发商开发商A A开发开发4000400040004000,40004000400040008000800080008000,0 0 0 0不开发不开发0 0 0 0,80008000800080000 0 0 0,0 0 0 0开发商开发商B B开发开发不开发不开发开发商开发商A A开发开发-3000-3000-3000-3000,-3000-3000-3000-30001000100010001000,0 0 0 0不开发不开发0 0 0 0,10001000100010000 0 0 0,0 0 0 0需
40、求大的情况需求大的情况需求大的情况需求大的情况需求小的情况需求小的情况需求小的情况需求小的情况第第1 1节节 博弈论博弈论概论概论 博弈论博弈论表示方法表示方法1.2.2 1.2.2 1.2.2 1.2.2 博弈论的表示方法博弈论的表示方法博弈论的表示方法博弈论的表示方法示例示例示例示例A A开发开发不开发不开发NNNN大大小小1/21/21/21/2大大小小1/21/21/21/2B BB BB BB B开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发(4,4)(4,4)(8,0)(8,0)(-3,-3)(-3,-3)(1,0)(1,0)(0,8)(0,8)(
41、0,0)(0,0)(0,1)(0,1)(0,0)(0,0)第第1 1节节 博弈论博弈论概论概论 博弈论博弈论表示方法表示方法1.2.2 1.2.2 1.2.2 1.2.2 博弈论的表示方法博弈论的表示方法博弈论的表示方法博弈论的表示方法示例示例示例示例完全信息完全信息博弈博弈B B B B在决策时不确切地知道自然的在决策时不确切地知道自然的在决策时不确切地知道自然的在决策时不确切地知道自然的选择;选择;选择;选择;B B B B的决策结由的决策结由的决策结由的决策结由4 4 4 4个变为个变为个变为个变为2 2 2 2个个个个A A开发开发不开发不开发NNNN大大小小1/21/21/21/2大
42、大小小1/21/21/21/2B BB BB BB B开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发(4,4)(4,4)(8,0)(8,0)(-3,-3)(-3,-3)(1,0)(1,0)(0,8)(0,8)(0,0)(0,0)(0,1)(0,1)(0,0)(0,0)第第1 1节节 博弈论博弈论概论概论 博弈论博弈论表示方法表示方法1.2.2 1.2.2 1.2.2 1.2.2 博弈论的表示方法博弈论的表示方法博弈论的表示方法博弈论的表示方法示例示例示例示例不完全信息不完全信息博弈博弈B B B B知道自然的知道自然的知道自然的知道自然的选择,但选择,但选择,
43、但选择,但不知道不知道不知道不知道A A A A的的的的选择选择选择选择(或或或或A A A A、B B B B同时同时同时同时决策)决策)决策)决策)A A开发开发不开发不开发NNNN大大小小1/21/21/21/2大大小小1/21/21/21/2B BB BB BB B开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发(4,4)(4,4)(8,0)(8,0)(-3,-3)(-3,-3)(1,0)(1,0)(0,8)(0,8)(0,0)(0,0)(0,1)(0,1)(0,0)(0,0)第第1 1节节 博弈论博弈论概论概论 博弈论博弈论表示方法表示方法1.2.2
44、1.2.2 1.2.2 1.2.2 博弈论的表示方法博弈论的表示方法博弈论的表示方法博弈论的表示方法示例示例示例示例不完全信息不完全信息博弈博弈干洗店市场进入博弈的扩展式干洗店市场进入博弈的扩展式干洗店市场进入博弈的扩展式干洗店市场进入博弈的扩展式:新新店知道但老店不知道自然的选择店知道但老店不知道自然的选择-市场需求的大小市场需求的大小自然自然新店新店新店新店老店老店老店老店老店老店老店老店NN正常正常,.7,.7衰退衰退,.3,.3进入进入不进入不进入进入进入不进入不进入高价高价低价低价高价高价低价低价高价高价低价低价高价高价低价低价(100,100)(100,100)(-100,-50)
45、(-100,-50)(0,300)(0,300)(0,50)(0,50)(40,40)(40,40)(-160,-110)(-160,-110)(0,240)(0,240)(0,-10)(0,-10)第第1 1节节 博弈论博弈论概论概论 什么是博弈论什么是博弈论1.1.1 1.1.1 1.1.1 1.1.1 博弈论博弈论博弈论博弈论的基本概念的基本概念的基本概念的基本概念第第2 2节节 纳什纳什均衡均衡1 1占占优战略均衡优战略均衡一般来说一般来说,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的最优策略,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的
46、最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中,一个参与人的最优策略可能可以选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中,一个参与人的最优策略可能可以不依赖于其他参与人的策略选择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,不依赖于其他参与人的策略选择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为这样的最优策略被称为“占优策略占优策略占优策略占优策略”。第第2 2节节 纳什纳什均衡均衡 占占优战略均衡优战略均衡2.1.1 2.1.1 2.1.1 2.1.1 占占占占优策略优策略优策略优策略(dominant stra
47、tegy)(dominant strategy)(dominant strategy)(dominant strategy)概述概述概述概述如果一个博弈中,某个参与人有占如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被称为优策略,那么该参与人的其他可选择策略就被称为“劣策略劣策略”。在一个博弈里在一个博弈里,如果所有参与人都有占优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,如果所有参与人都有占优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里,因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里
48、,坦白,坦白坦白,坦白 是占优策略均衡。是占优策略均衡。第第2 2节节 纳什纳什均衡均衡 占占优战略均衡优战略均衡2.1.1 2.1.1 2.1.1 2.1.1 占占占占优策略优策略优策略优策略(dominant strategy)(dominant strategy)(dominant strategy)(dominant strategy)概述概述概述概述如果所有人都有(严格)占优策略存在,那么占优策略均衡就是可以预测的唯一均衡。如果所有人都有(严格)占优策略存在,那么占优策略均衡就是可以预测的唯一均衡。占优策略只要求每个参与人是理性的,而不要求每个参与人知道其他参与人是理性的(也就是说,
49、占优策略只要求每个参与人是理性的,而不要求每个参与人知道其他参与人是理性的(也就是说,不要求理性是共同知识)。为什么?不要求理性是共同知识)。为什么?第第2 2节节 纳什纳什均衡均衡 占占优战略均衡优战略均衡2.1.1 2.1.1 2.1.1 2.1.1 占占占占优策略优策略优策略优策略(dominant strategy)(dominant strategy)(dominant strategy)(dominant strategy)概述概述概述概述思路思路思路思路:首先找到某个参与人的劣策略(假定存在),把这个劣策略剔除掉,重新构造一个不包含首先找到某个参与人的劣策略(假定存在),把这个劣
50、策略剔除掉,重新构造一个不包含已剔除策略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣策略,一直重复这个过程,已剔除策略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣策略,一直重复这个过程,直到只剩下唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解,称为直到只剩下唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解,称为“重复剔重复剔重复剔重复剔除的占优均衡除的占优均衡除的占优均衡除的占优均衡”。第第2 2节节 纳什纳什均衡均衡 占占优战略均衡优战略均衡2.1.2 2.1.2 2.1.2 2.1.2 重复重复重复重复剔除的占优均衡剔除的占优均衡剔除的占优均衡