《博弈论在现代食品发展决策中的应用2014第一次.ppt》由会员分享,可在线阅读,更多相关《博弈论在现代食品发展决策中的应用2014第一次.ppt(274页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、博弈论在现代食品博弈论在现代食品发展决策中的应用发展决策中的应用 Application of Game Theory in Decision-making for Development of Modern Food Industry教师:杨立刚单位:公共卫生学院Email:电话:13813981531第一页,编辑于星期一:十二点 十八分。n营养营养n外观外观n风味风味n安全性安全性n耐贮藏性(货架)耐贮藏性(货架)n方便性方便性食食品品的的功功能能n食品对人类所食品对人类所发挥的作用发挥的作用n人类吃食品人类吃食品的目的的目的n人类对食品人类对食品的要求的要求食食品品的的属属性性食食品品的
2、的特特性性第二页,编辑于星期一:十二点 十八分。n吃是一切动物的本能,人亦具有这一本能。自从人类在地吃是一切动物的本能,人亦具有这一本能。自从人类在地球上出现,就同食品联系在一起球上出现,就同食品联系在一起“民以食为天民以食为天”说明食品说明食品对人类来说如同阳光雨露一样重要。从茹毛饮血、燧木取火到对人类来说如同阳光雨露一样重要。从茹毛饮血、燧木取火到美味佳肴、食品营养,充分说明人类进化与食品息息相关。人美味佳肴、食品营养,充分说明人类进化与食品息息相关。人从食品中获取营养和能量,以食品维持人体机能平衡,没有食从食品中获取营养和能量,以食品维持人体机能平衡,没有食品,就没有人类。品,就没有人类
3、。背景介绍现代食品的发展食品的工业食品的工业化带给人类化带给人类的是?的是?第三页,编辑于星期一:十二点 十八分。第四页,编辑于星期一:十二点 十八分。第五页,编辑于星期一:十二点 十八分。第六页,编辑于星期一:十二点 十八分。第七页,编辑于星期一:十二点 十八分。食品组分食品组分加工技术加工技术食品配料食品配料食品感官食品感官食品消费食品消费食食品品种植、养殖者种植、养殖者食品生产企业食品生产企业食品物流、运输食品物流、运输食品销售、超市食品销售、超市食品消费食品消费收购收购食品消费食品消费食品分析检验食品分析检验第八页,编辑于星期一:十二点 十八分。食品组分食品组分加工技术加工技术食品配料
4、食品配料食品感官食品感官食品消费食品消费食食品品种植、养殖者种植、养殖者食品生产企业食品生产企业食品物流、运输食品物流、运输食品销售、超市食品销售、超市食品消费者食品消费者收购收购政府、行政管政府、行政管理理第九页,编辑于星期一:十二点 十八分。新型食品n转基因食品n保健食品n辐照食品n微波食品n纳米食品n绿色食品n有机食品新型食品给我们带来了什么?新新型食品给我们带来了什么?新口味、新功能、新问题口味、新功能、新问题你所知道的新型食品还你所知道的新型食品还有哪些?你能接受这些有哪些?你能接受这些新型食品吗?新型食品吗?第十页,编辑于星期一:十二点 十八分。第十一页,编辑于星期一:十二点 十八
5、分。公众接公众接受程度受程度企业企业利益利益媒体报道媒体报道贸易贸易壁垒壁垒食品问题不那么简单!食品问题不那么简单!食品问题不那么简单!食品问题不那么简单!科学性科学性第十二页,编辑于星期一:十二点 十八分。背景介绍n民以食为天,近年来,人们对食品问题的关注度急剧攀升,成为了社会焦点和研究热点。n食品涉及范围非常广泛.n从学科上涉及农业、化学、生物学、机械等;n在利益上涉及生产者、销售者、消费者、管理者等;n在影响上涉及人群健康、社会心理、经济效益等n现代食品加工规模大、科技含量高,其发展决策成为难题,稍有不慎就会对社会各个方面产生巨大影响。n博弈论就是描述和研究行为者之间的策略相互依存和相互
6、作用的一种决策理论,本课程对博弈论在现代食品发展决策中的应用进行研讨。现代食品发展中存在哪些现代食品发展中存在哪些问题?问题?第十三页,编辑于星期一:十二点 十八分。动物界,每种动物都是动物界,每种动物都是动物界,每种动物都是动物界,每种动物都是其他动物潜在的食物。其他动物潜在的食物。其他动物潜在的食物。其他动物潜在的食物。两种动物相遇,有三种选择:两种动物相遇,有三种选择:两种动物相遇,有三种选择:两种动物相遇,有三种选择:进攻、原地不动、逃跑进攻、原地不动、逃跑进攻、原地不动、逃跑进攻、原地不动、逃跑目的:目的:目的:目的:生存!生存!生存!生存!第十四页,编辑于星期一:十二点 十八分。生
7、存的过程就是一系列决策的过程:生存的过程就是一系列决策的过程:生存的过程就是一系列决策的过程:生存的过程就是一系列决策的过程:正确正确正确正确的决策:的决策:的决策:的决策:使决策者青云直上,春风得意,得到的利益使决策者青云直上,春风得意,得到的利益使决策者青云直上,春风得意,得到的利益使决策者青云直上,春风得意,得到的利益 最大化。最大化。最大化。最大化。错误错误错误错误的决策:使决策者身陷泥淖,难以自拔。的决策:使决策者身陷泥淖,难以自拔。的决策:使决策者身陷泥淖,难以自拔。的决策:使决策者身陷泥淖,难以自拔。人的决策行动是理性的:人的决策行动是理性的:人的决策行动是理性的:人的决策行动是
8、理性的:人能够仔细人能够仔细人能够仔细人能够仔细分析分析分析分析各个可能的行动,审慎各个可能的行动,审慎各个可能的行动,审慎各个可能的行动,审慎计算计算计算计算各种行动各种行动各种行动各种行动下的得失后果,精确计算这些后果的可能性,从而选择下的得失后果,精确计算这些后果的可能性,从而选择下的得失后果,精确计算这些后果的可能性,从而选择下的得失后果,精确计算这些后果的可能性,从而选择更有更有更有更有利于自己利于自己利于自己利于自己的行动。的行动。的行动。的行动。第十五页,编辑于星期一:十二点 十八分。博弈论简介博弈论简介 博弈论博弈论 博弈(博弈(博弈(博弈(game theorygame th
9、eory)亦称对策论,指研究理性的)亦称对策论,指研究理性的)亦称对策论,指研究理性的)亦称对策论,指研究理性的行动者相互作用的形式理论。行动者相互作用的形式理论。行动者相互作用的形式理论。行动者相互作用的形式理论。最初是运用数学方法来研究有最初是运用数学方法来研究有最初是运用数学方法来研究有最初是运用数学方法来研究有利害冲突利害冲突利害冲突利害冲突的双方在的双方在的双方在的双方在竞竞竞竞争争争争性性性性的活动中的活动中的活动中的活动中是否存在是否存在是否存在是否存在自己制胜对方的自己制胜对方的自己制胜对方的自己制胜对方的最优策略最优策略最优策略最优策略,以及,以及,以及,以及如何找出如何找出
10、如何找出如何找出这种策略。这种策略。这种策略。这种策略。博弈论是研究决策主体在给定信息结构下如何决策以最博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。大化自己的效用,以及不同决策主体之间决策的均衡。第十六页,编辑于星期一:十二点 十八分。n博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。q失火了,屋里人很多,你往哪个门跑失火了,屋里人很多,你往哪个门跑这就是博弈这就是博弈q你的行动结果不仅取决于你的策略选择,同时也取你的行动结果不仅取决于你的策略选择,同时也取决于他人的策略选择决于他人的策略选择,博弃论又称为博弃论又
11、称为“对策论对策论”q它研究个体或组织之间存在利益冲突情况下如何进它研究个体或组织之间存在利益冲突情况下如何进行最优决策。行最优决策。博弈论博弈论要解决的问题:要解决的问题:人们之间决策的相互作用、相互影响。人们之间决策的相互作用、相互影响。第十七页,编辑于星期一:十二点 十八分。博弈理论博弈理论著名经济学家保罗.萨缪尔森:要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。保罗.萨缪尔森第十八页,编辑于星期一:十二点 十八分。n子曰:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之犹贤乎已。”n孔子说:“整天吃得饱饱的,一点也不肯动脑筋,这样的人可真是无聊啊!不是有下棋之类的游戏吗
12、?玩玩这些,也比一点不动脑筋好啊。”博弈理论博弈理论第十九页,编辑于星期一:十二点 十八分。n博弈字面意思就是赌博、下棋,赌博和下棋,是游戏,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。n在足球比赛中,双方都想在努力巩固防守的同时,在足球比赛中,双方都想在努力巩固防守的同时,积极进攻以积极进攻以置对方于置对方于“死地死地”,这种行为就是一种博弈。这种行为就是一种博弈。n“弈弈”是下棋的意思,下棋中的双方行为特征也如同足球比赛中是下棋的意思,下棋中的双方行为特征也如同足球比赛中双方的行为。双方的行为。n企业之间的竞争、国家之间的角力等,企业之间的竞争、国家之间的角力等,都是都是
13、“游戏游戏”,只是游戏的内容不同而已。只是游戏的内容不同而已。博弈论游戏理论()博弈论对策论第二十页,编辑于星期一:十二点 十八分。田忌赛马n屡战屡败:屡战屡败:田忌:上田忌:上 中中 下下 齐威王:上齐威王:上 中中 下下n赢得比赛:赢得比赛:田忌:下田忌:下 上上 中中 齐威王:上齐威王:上 中中 下下第二十一页,编辑于星期一:十二点 十八分。经济决策与博弈论n公司的老总在决定是否将自己的产品降价以及降价多少公司的老总在决定是否将自己的产品降价以及降价多少时,必须首先要考虑至少以下几个方面的问题:时,必须首先要考虑至少以下几个方面的问题:n消费者将会增加购买吗?消费者将会增加购买吗?n大概
14、会增加多少购买量呢?大概会增加多少购买量呢?n其他同种产品的厂家也会降价吗?其他同种产品的厂家也会降价吗?n“博弈论博弈论”主要是研究各相关行为主体的决策行为相主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,理性的行为主体如互影响、相互作用的假定条件下,理性的行为主体如何决策,以及这种决策的均衡等问题的。何决策,以及这种决策的均衡等问题的。第二十二页,编辑于星期一:十二点 十八分。博弈论n“博弈论博弈论”就是分析就是分析博弈行为和博弈决策博弈行为和博弈决策的的一门科学。一门科学。n研究问题研究问题1:人们之间决策的相互作用、相互:人们之间决策的相互作用、相互影响影响n研究问题
15、研究问题2:决策的均衡问题。:决策的均衡问题。n决策均衡是一个经济学概念,意味着最佳决策决策均衡是一个经济学概念,意味着最佳决策或最佳决策的组合。因为只要决策是最佳的,或最佳决策的组合。因为只要决策是最佳的,相关的行为主体就不会去改变它,相关的行为主体就不会去改变它,从而使它从而使它处于稳定、均衡的状态。处于稳定、均衡的状态。第二十三页,编辑于星期一:十二点 十八分。博弈论的基本概念博弈论的基本概念博弈论概念包括:博弈论概念包括:参与人、行动、信息、战略、参与人、行动、信息、战略、支付函数、结果、均衡。支付函数、结果、均衡。博弈论的三要素:博弈论的三要素:参与人、战略和支付参与人、战略和支付第
16、二十四页,编辑于星期一:十二点 十八分。n构成完整博弈过程需要规定的四件事:n1)参与人或局中人。即有哪些人参与博弈。n2)行动或策略。什么人在什么时候行动;当他行动时,他具有什么样的信息;他能做什么,不能做什么。n3)结果。对参与人的不同行动,这场博弈的结果或结局是什么。n4)报酬。博弈的结果给参与人带来的好处。n例:硬币博弈。n1)参与人:两个小孩甲和乙;n2)行动或策略:甲乙两人各往地上抛一个硬币,甲先抛,乙后抛,要么反面朝上,要么正面朝上;n3)结果:若硬币同为正面或反面,甲赢得乙一个硬币,若硬币一正一反,则甲输给乙一个硬币;n4)报酬:一个一元硬币。n本例中每个参与人的输赢可用货币值
17、表示。但也并非都是如此。第二十五页,编辑于星期一:十二点 十八分。参与人 playersv一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用水平)。v参与人可能是自然人,也可能是团体,如企业,国家等。v重要的是:每个参与人必须有可供选择的行动和一个很好定义的偏好函数。v不做决策的被动主体只能被当作环境参数。博博弈论的要素论的要素第二十六页,编辑于星期一:十二点 十八分。虚拟参与人n自然:外部环境的不确定性,指决定外生的随机变量的概率分布的机制。n为了分析方便,自然nature被当作虚拟参与人。n自然代表决定外生随机变量的概率分布的机制。比如房地产开发中市场需求的大小
18、。n在博弈论中,“自然”作为“虚拟参与人”(没有支付和目标函数)来处理。第二十七页,编辑于星期一:十二点 十八分。行动 ACTIONS OR MOVESn参与人在博弈的某个时点的决策变量。(囚徒困境:坦白)nN个参与人的行动的有序集称为行动组合(坦白,抵赖)。n1行动集合行动集合action set:可供某个参与人(:可供某个参与人(i)选择的所有)选择的所有 行动的集合,写作行动的集合,写作Ai=ai。n2行动组合行动组合action profile:n个参与人的行动的有序集个参与人的行动的有序集 a=(a1,ai,an)。n3行动顺序行动顺序the order of play:根据行动顺序
19、,可以将博:根据行动顺序,可以将博 弈分为静态博弈和动态博弈。因此,弈分为静态博弈和动态博弈。因此,行动顺序对于博弈行动顺序对于博弈 结果非常重要结果非常重要。n不完全信息博弈中,后行动者依赖观察先行动者的行动来获取信息。第二十八页,编辑于星期一:十二点 十八分。顺序和信息n博弈论非常强调时间和信息的重要性,认为时间和信息是影响博弈均衡的主要因素。n在博弈过程中,参与者之间的信息传递决定了其行动空间和最优战略的选择;n同时,博弈过程中始终存在一个先后问题,参与人的行动次序对博弈最后的均衡有直接的影响。第二十九页,编辑于星期一:十二点 十八分。博弈信息博弈信息n博弈信息能够影响最后博弈结局的所有
20、局中人的情报。博弈信息能够影响最后博弈结局的所有局中人的情报。n信息在博弈中占重要地位,信息在博弈中占重要地位,博弈的赢得很大程度上依赖博弈的赢得很大程度上依赖于信息的准确度与多寡于信息的准确度与多寡。n如果各方对各种局势下所有局中人的得益状况完全清楚,如果各方对各种局势下所有局中人的得益状况完全清楚,称为称为完全信息博弈完全信息博弈。反之为。反之为不完全信息博弈不完全信息博弈。n在动态博弈中还有一类信息在动态博弈中还有一类信息:轮到行动的轮到行动的博弈方是否完全博弈方是否完全了解此前对方的行动了解此前对方的行动。如果完全了解则称之为。如果完全了解则称之为“具有完具有完美信息美信息”的博弈的博
21、弈。反之称为。反之称为“不完美信息的动态博弈不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是由于信息不完美,博弈的结果只能是概率期望,概率期望,而不能而不能像完美信息博弈那样有像完美信息博弈那样有确定的结果确定的结果。第三十页,编辑于星期一:十二点 十八分。信息 informationn信息:参与人有关博弈的知识,特别是有关自然的选择,参与参与人有关其他参与人的特征、战略、行动、支付等的知识人有关其他参与人的特征、战略、行动、支付等的知识。n信息集:参与人在特定时刻所拥有的有关变量的值的知识。n完美信息perfect information:指一个参与人对其他参与人的行动选择有准确的理
22、解,即每个信息集只包含一个值。n共同知识共同知识common knowledge:“所有参与人知道,所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道知道所有参与人知道”的知识。的知识。所有参与人知道每一步的信息集。第三十一页,编辑于星期一:十二点 十八分。战略strategiesn战略:参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。n战略与行动:战略是行动的规则而不是行动本身。n例如例如“人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我不犯人;人若犯我,我必犯人”,就是一
23、,就是一个战略,而个战略,而“犯犯”与与“不犯不犯”是两种行动是两种行动,这一战略规定了什,这一战略规定了什么时候选择么时候选择“犯犯”与与“不犯不犯”的行动。的行动。n可以有的战略还包括:可以有的战略还包括:n“人不犯我,我必犯人;人若犯我,我不犯人人不犯我,我必犯人;人若犯我,我不犯人”;n“人不犯我,我不犯人;人若犯我,我还不犯人人不犯我,我不犯人;人若犯我,我还不犯人”;n“人不犯我,我必犯人;人若犯我,我还犯人人不犯我,我必犯人;人若犯我,我还犯人”等。等。第三十二页,编辑于星期一:十二点 十八分。n战略必须是完备的。战略必须是完备的。它要给出参与人在每一种可想象到的情况下它要给出参
24、与人在每一种可想象到的情况下的行动选择,即使参与人并不预期到这种情况会实际发生。的行动选择,即使参与人并不预期到这种情况会实际发生。(1)战略集合)战略集合strategy set:某参与人:某参与人i所有可选择的战略的所有可选择的战略的 集合。集合。Si=si。(2)战略组合)战略组合strategy profile:n个参与人每人选择一个战个参与人每人选择一个战 略的略的n为向量。为向量。s=(s1,si,sn)。n在静态博弈时,战略与行动是相同的。在静态博弈时,战略与行动是相同的。n作为参与人行动的规则,战略必须依赖于参与人获得其他参与作为参与人行动的规则,战略必须依赖于参与人获得其他参
25、与人行动的信息。人行动的信息。n在静态博弈中,双方同时行动,从而不可能获得对方行动的信在静态博弈中,双方同时行动,从而不可能获得对方行动的信息,因此战略选择就变成简单的行动选择。息,因此战略选择就变成简单的行动选择。第三十三页,编辑于星期一:十二点 十八分。支付payoff(效用utility)n在一个特定的战略组合下,参与人得到的确定在一个特定的战略组合下,参与人得到的确定的的效用水平效用水平,或者是指参与人得到的,或者是指参与人得到的期望效用期望效用水平水平。n支付是博弈参与人真正感兴趣的东西。支付是博弈参与人真正感兴趣的东西。n博弈的一个基本特征是,一个参与人的支付不博弈的一个基本特征是
26、,一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择。他参与人的战略选择。第三十四页,编辑于星期一:十二点 十八分。均衡equilibriumn指所有参与人的最优战略的组合。n记为记为s*=(s1*,si*,sn*)。n当博弈的所有参与人当博弈的所有参与人都不想改换战略时所达到的稳定都不想改换战略时所达到的稳定状态状态叫做均衡,均衡的结果叫做博弈的解。叫做均衡,均衡的结果叫做博弈的解。结果结果outcome 即博弈均衡产生的博弈的最终后果,包括即博弈均衡产生的博弈的最终后果,包括均衡及其支付均衡及其支付。n结果(outcomeo
27、utcome):博弈分析者所感兴趣的所有东西,:博弈分析者所感兴趣的所有东西,如均衡战略组合、均衡行动组合、均衡支付组合等如均衡战略组合、均衡行动组合、均衡支付组合等第三十五页,编辑于星期一:十二点 十八分。参与人、行动和结果统称为参与人、行动和结果统称为“博弈规则博弈规则”。参与人、战略和支付参与人、战略和支付是一个博弈所需最少的是一个博弈所需最少的元素。元素。博弈分析的目的是使用博弈规则预测均衡博弈分析的目的是使用博弈规则预测均衡。第三十六页,编辑于星期一:十二点 十八分。n博弈的描述方法n1)策略式描述:表述规定和定义n完全信息下的静态博弈的策略表述:用支付矩阵形式直观表描述。-8,-8
28、0,-10-10,0-1,-1坦白抵赖坦白抵赖詹 尼邦 德第三十七页,编辑于星期一:十二点 十八分。n扩展式表述。表述规定:n如例,甲乙两个小孩往地上抛硬币,甲先乙后,若硬币同面,则甲赢得乙一个硬币,若硬币异面则甲输给乙一个硬币。由此可给出该博弈的博弈树:1,-1-1,1-1,11,-1正正正反反反甲乙乙第三十八页,编辑于星期一:十二点 十八分。博弈论基本假定博弈论基本假定博弈论的基本假定:n参与者拥有的共同知识包括:参与人集合/参与人的行动空间/每个参与者的行动顺序。共同知识(common knowledge):任何时刻都知道对方所知道的,并且知道对方知道自己所知道的,而且知道对方知道自己知
29、道对方所知道的n每个参与者都是理性的 理性的两层含义:q追求个人最大利益追求个人最大利益经济学中的经济人假设q非常聪明非常聪明在任何情况下都知道如何追求个人最大利益基本假设前提基本假设前提 -完全理性完全理性 -完全信息完全信息第三十九页,编辑于星期一:十二点 十八分。博弈论基本假定博弈论基本假定博弈论基本假定博弈论基本假定1.1.理性人假定理性人假定理性人假定理性人假定经济经济经济经济理性:通过选择策略使自身的支付(收益)最大化。理性:通过选择策略使自身的支付(收益)最大化。理性:通过选择策略使自身的支付(收益)最大化。理性:通过选择策略使自身的支付(收益)最大化。逻辑逻辑逻辑逻辑理性:具有
30、理性:具有理性:具有理性:具有“完全的完全的完全的完全的”逻辑推导、决策能力。逻辑推导、决策能力。逻辑推导、决策能力。逻辑推导、决策能力。2.2.利益相关性假定利益相关性假定利益相关性假定利益相关性假定 博弈参与人之间的策略选择以及选择下的利益支付是相关的,参博弈参与人之间的策略选择以及选择下的利益支付是相关的,参博弈参与人之间的策略选择以及选择下的利益支付是相关的,参博弈参与人之间的策略选择以及选择下的利益支付是相关的,参与者的利益不仅是自己选择的结果,还受其他参与者选择的影响。与者的利益不仅是自己选择的结果,还受其他参与者选择的影响。与者的利益不仅是自己选择的结果,还受其他参与者选择的影响
31、。与者的利益不仅是自己选择的结果,还受其他参与者选择的影响。第四十页,编辑于星期一:十二点 十八分。博弈论基本假定博弈论基本假定博弈论基本假定博弈论基本假定3.3.公共知识假定公共知识假定公共知识假定公共知识假定双方都双方都双方都双方都知道知道知道知道上述博弈过程的各种要素上述博弈过程的各种要素上述博弈过程的各种要素上述博弈过程的各种要素双方都双方都双方都双方都知道知道知道知道对方对方对方对方知道知道知道知道上述要素上述要素上述要素上述要素双方都双方都双方都双方都知道知道知道知道对方是理性人对方是理性人对方是理性人对方是理性人双方都双方都双方都双方都知道知道知道知道对方对方对方对方知道知道知道
32、知道自己是理性人自己是理性人自己是理性人自己是理性人 第四十一页,编辑于星期一:十二点 十八分。完全理性与有限理性n人的完全理性意味着人的完全理性意味着,人有足够的信息、知识和计算能力,来人有足够的信息、知识和计算能力,来确保实现自己的效用最大化。因此确保实现自己的效用最大化。因此,理性假定意味着理性人能理性假定意味着理性人能够运用数学工具描述人的够运用数学工具描述人的(最大化最大化)行为行为n完全理性人完全理性人q他们有一个很好定义的偏好他们有一个很好定义的偏好,并能够按照即定的偏好进行并能够按照即定的偏好进行选择;选择;q他们的选择受到预算约束;他们的选择受到预算约束;q他们努力在约束条件
33、下实现效用最大化。他们努力在约束条件下实现效用最大化。n有限理性人有限理性人q他们不可能也不期望在复杂的环境中想得太远太多。他们不可能也不期望在复杂的环境中想得太远太多。q他们不可能预测到将来发生的所有可能事件,并且针对他们不可能预测到将来发生的所有可能事件,并且针对它们做出详细的行动计划和分配方案。它们做出详细的行动计划和分配方案。第四十二页,编辑于星期一:十二点 十八分。完全信息n完全信息意味着信息是完全信息意味着信息是对称的,充分对称的,充分的,完全信息的人的,完全信息的人有足够的信息实现自己最大化行为。有足够的信息实现自己最大化行为。n但现实的市场并不完全,如买卖双方的人数并不足够的多
34、,但现实的市场并不完全,如买卖双方的人数并不足够的多,信息也是不对称的信息也是不对称的。q有限的人数意味着人们之间的行为是有直接影响有限的人数意味着人们之间的行为是有直接影响的,所以一个人在决策时必须考虑对方的反应,的,所以一个人在决策时必须考虑对方的反应,这就是这就是博弈论博弈论博弈论博弈论要研究的问题。要研究的问题。第四十三页,编辑于星期一:十二点 十八分。博弈的分类博弈的分类n1.根据博弈参与人划分根据博弈参与人划分 (1)单人博弈单人博弈。其实质是个体的最优化问题,即在一定条。其实质是个体的最优化问题,即在一定条 件下选择最优战略。件下选择最优战略。单人博弈区别于两人博弈和多人博弈的根
35、本之处在于,博弈单人博弈区别于两人博弈和多人博弈的根本之处在于,博弈 的信息越多,支付越高。的信息越多,支付越高。(2)两人博弈两人博弈。参与人为两人的博弈。参与人为两人的博弈。(3)多人博弈多人博弈。三个或三个以上参与人的博弈。三个或三个以上参与人的博弈。其与单人博弈和两人博弈最大的区别在于,可能存在其与单人博弈和两人博弈最大的区别在于,可能存在“破坏破坏 者者”,即具有下列特征的参与人:其策略选择对自身支,即具有下列特征的参与人:其策略选择对自身支 付没有任何影响,但却会影响其他参与人的支付,有付没有任何影响,但却会影响其他参与人的支付,有 时甚至是决定性的影响,如奥运会申办。时甚至是决定
36、性的影响,如奥运会申办。第四十四页,编辑于星期一:十二点 十八分。2.根据战略划分根据战略划分 (1)有限博弈()有限博弈(finite game)。一个博弈被称为有限)。一个博弈被称为有限博弈,如果,第一,参与人个数是有限的;第二,每个博弈,如果,第一,参与人个数是有限的;第二,每个参与人可选择的纯战略是有限的。它可以用矩阵式、扩参与人可选择的纯战略是有限的。它可以用矩阵式、扩展式,甚至罗列方式表示。展式,甚至罗列方式表示。(2)无限博弈()无限博弈(infinite game)。不符合上述两)。不符合上述两个条件的博弈。一般用数集或函数式表示。个条件的博弈。一般用数集或函数式表示。第四十五
37、页,编辑于星期一:十二点 十八分。3.根据支付划分根据支付划分 (1)零和博弈与非零和博弈n零和博弈(zero-sum gamezero-sum game):):一方所得即是另一方所失,二者的得失之和为零。两方利益严格对立两方利益严格对立,如下棋。,如下棋。无论各参与人如何决策,无论各参与人如何决策,最后的社会总支付,即最后的社会总支付,即各参与人支付之和总是为零各参与人支付之和总是为零。n一是各参与人之间的利益是对立的,相互之间难以和平共处;一是各参与人之间的利益是对立的,相互之间难以和平共处;n二是各参与人为了多得利益,总不希望对方知道自己选择的战略,因二是各参与人为了多得利益,总不希望对
38、方知道自己选择的战略,因此,这种博弈的结果是不能完全确定的;此,这种博弈的结果是不能完全确定的;n三是即使进行重复多次的博弈,也不会产生新的机会或可能。三是即使进行重复多次的博弈,也不会产生新的机会或可能。赌硬币第四十六页,编辑于星期一:十二点 十八分。非零和博弈非零和博弈(non-zero-sum game):一方所得并非一方所失,而且都获得了增量收益,其得益总和不再为零。n疑犯博弈。n局中人:犯罪人邦德和詹尼;n行动策略:警局需要两人的口供作为证据,对其隔离录供。每人面对两种选择,坦白或抵赖;n结果:一方坦白,另一方抵赖,则坦白方可获释放,抵赖方则判刑10年;都坦白则各判8年;都抵赖则各判
39、1年。n报酬:以各自刑期的负数作为报酬。n本例中的博弈是一个非零和博弈,同时又是不合作博弈,即两人为获释和不被判刑10年,都将会出卖对方。第四十七页,编辑于星期一:十二点 十八分。(2)常和博弈。)常和博弈。各参与人支付之和总是等于一个非零常数。各参与人支付之和总是等于一个非零常数。如分配固定数额的奖金。各参与人之间的利益关如分配固定数额的奖金。各参与人之间的利益关系也是对立的,但较易取得妥协,因而往往有一个确系也是对立的,但较易取得妥协,因而往往有一个确定的结果。在重复博弈中,由于总支付增加,会创造定的结果。在重复博弈中,由于总支付增加,会创造出许多新结果。出许多新结果。(3)变和博弈。)变
40、和博弈。在不同的战略组合下,各参与人支付之和是不同的,在不同的战略组合下,各参与人支付之和是不同的,是博弈的一般形式。是博弈的一般形式。第四十八页,编辑于星期一:十二点 十八分。4.根据参与人行动次序划分根据参与人行动次序划分参与人行动的先后顺序参与人行动的先后顺序(1)静态博弈(static gamestatic game):):局中人同时选择行动,或虽不同时行动但局中人同时选择行动,或虽不同时行动但局中人同时选择行动,或虽不同时行动但局中人同时选择行动,或虽不同时行动但后行动者后行动者后行动者后行动者不知道不知道不知道不知道先行动的人采取了什么具体行动,即先行动的人采取了什么具体行动,即先
41、行动的人采取了什么具体行动,即先行动的人采取了什么具体行动,即后行动的人决策选择不受先后行动的人决策选择不受先后行动的人决策选择不受先后行动的人决策选择不受先行动者决策的直接影响。行动者决策的直接影响。行动者决策的直接影响。行动者决策的直接影响。如:如:如:如:囚徒困境囚徒困境囚徒困境囚徒困境(2)动态博弈(dynamic gamedynamic game):):局中人的行动有先后顺序,并且后行动者能够观局中人的行动有先后顺序,并且后行动者能够观局中人的行动有先后顺序,并且后行动者能够观局中人的行动有先后顺序,并且后行动者能够观察到先行动者所选择的策略。察到先行动者所选择的策略。察到先行动者所
42、选择的策略。察到先行动者所选择的策略。后行为的参与人可根据先行动的参与人的行动作出针对性选择,而先行动的参后行为的参与人可根据先行动的参与人的行动作出针对性选择,而先行动的参与人在决策时,不但看不到后行动参与人的选择,而且还要考虑后行动参与人的与人在决策时,不但看不到后行动参与人的选择,而且还要考虑后行动参与人的反应。反应。第四十九页,编辑于星期一:十二点 十八分。博弈的类型博弈的类型博弈的类型博弈的类型例如:孙膑与庞涓例如:孙膑与庞涓例如:孙膑与庞涓例如:孙膑与庞涓 鬼谷子想试徒弟孙膑和庞涓的智力:拿出鬼谷子想试徒弟孙膑和庞涓的智力:拿出鬼谷子想试徒弟孙膑和庞涓的智力:拿出鬼谷子想试徒弟孙膑
43、和庞涓的智力:拿出5 5个饼让孙个饼让孙个饼让孙个饼让孙膑和庞涓取去吃,每人每次最多只能拿两个饼,全部吃完膑和庞涓取去吃,每人每次最多只能拿两个饼,全部吃完膑和庞涓取去吃,每人每次最多只能拿两个饼,全部吃完膑和庞涓取去吃,每人每次最多只能拿两个饼,全部吃完后才能再拿。庞涓急切地拿了两个饼,而孙膑只取了一个后才能再拿。庞涓急切地拿了两个饼,而孙膑只取了一个后才能再拿。庞涓急切地拿了两个饼,而孙膑只取了一个后才能再拿。庞涓急切地拿了两个饼,而孙膑只取了一个饼,吃完又取了两个饼。最终孙膑吃了饼,吃完又取了两个饼。最终孙膑吃了饼,吃完又取了两个饼。最终孙膑吃了饼,吃完又取了两个饼。最终孙膑吃了3 3个
44、,庞涓只吃了两个,庞涓只吃了两个,庞涓只吃了两个,庞涓只吃了两个。个。个。个。这是典型的这是典型的这是典型的这是典型的动态博弈动态博弈动态博弈动态博弈,一人先行动,另外的行动者观,一人先行动,另外的行动者观,一人先行动,另外的行动者观,一人先行动,另外的行动者观察到先行者的行动然后行动。察到先行者的行动然后行动。察到先行者的行动然后行动。察到先行者的行动然后行动。从开始看,庞涓一下子占了两个,但算总账还是孙膑从开始看,庞涓一下子占了两个,但算总账还是孙膑从开始看,庞涓一下子占了两个,但算总账还是孙膑从开始看,庞涓一下子占了两个,但算总账还是孙膑获益多。获益多。获益多。获益多。第五十页,编辑于星
45、期一:十二点 十八分。(3)重复博弈。)重复博弈。同一博弈反复进行所构成的博弈过程。构成重复博弈同一博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈称为的一次性博弈称为“原博弈原博弈”或或“阶段博弈阶段博弈”,其一般是,其一般是静态博弈。静态博弈。重复博弈的最少重复次数是两次。其中,到一定重复次数后肯重复博弈的最少重复次数是两次。其中,到一定重复次数后肯定要结束的重复博弈称为定要结束的重复博弈称为“有限次重复博弈有限次重复博弈”。而无限次重复。而无限次重复进行的博弈叫进行的博弈叫“无限次重复博弈无限次重复博弈”。在重复博弈中,考察的重点不是某一次重复的结果或支付,在重复博弈中,考察的重点
46、不是某一次重复的结果或支付,而是原博弈重复进行后的总体效果或平均效果,而是原博弈重复进行后的总体效果或平均效果,重复博弈是一重复博弈是一种特殊的动态博弈种特殊的动态博弈。在重复博弈中,一次静态博弈中的均衡可能会发生变化。在重复博弈中,一次静态博弈中的均衡可能会发生变化。第五十一页,编辑于星期一:十二点 十八分。5.根据参与人根据参与人对其他参与人收益支付信息的掌握程度对其他参与人收益支付信息的掌握程度 (1)完全信息博弈()完全信息博弈(complete information)。)。若各参与人都完全了解所有参与人的特征、战略、若各参与人都完全了解所有参与人的特征、战略、行动,以及在每种战略组
47、合下的支付,并且不存在事前行动,以及在每种战略组合下的支付,并且不存在事前的不确定性,该博弈称为的不确定性,该博弈称为“完全信息博弈完全信息博弈”。(2)不完全信息博弈()不完全信息博弈(incomplete information)至少存在部分参与人不完全了解其他参与人相关情至少存在部分参与人不完全了解其他参与人相关情况的博弈,称为况的博弈,称为“不完全信息博弈不完全信息博弈”。第五十二页,编辑于星期一:十二点 十八分。6.根据参与人对博弈进程信息,对动态博弈根据参与人对博弈进程信息,对动态博弈进行划分进行划分 (1)动态博弈中,若某参与人行动时,对此前行动的各参与)动态博弈中,若某参与人行
48、动时,对此前行动的各参与人(包括人(包括“自然自然”)的选择、行动完全了解,称为)的选择、行动完全了解,称为“具有具有完美信息的完美信息的”参与人参与人。若其不完全了解此前全部的博。若其不完全了解此前全部的博弈进程,称为弈进程,称为“具有不完美信息的具有不完美信息的”参与人参与人。(2)如果动态博弈中的所有参与人都是具有完美信息的,则)如果动态博弈中的所有参与人都是具有完美信息的,则该动态博弈称为该动态博弈称为“完美信息动态博弈完美信息动态博弈”,perfect information。若动态博弈中存在具有不完美信息的参与。若动态博弈中存在具有不完美信息的参与人,该博弈称为人,该博弈称为“不完
49、美信息动态博弈不完美信息动态博弈”,(imperfect information)。)。第五十三页,编辑于星期一:十二点 十八分。博弈的类型博弈的类型博弈的类型博弈的类型是否达成有约束力的协议是否达成有约束力的协议是否达成有约束力的协议是否达成有约束力的协议1.1.合作博弈合作博弈合作博弈合作博弈合作博弈(cooperative gamecooperative game):当人们的行为相互作用时,当事):当人们的行为相互作用时,当事人能够达成一个具有约束力的协议,参与人在协议范围内进行的博人能够达成一个具有约束力的协议,参与人在协议范围内进行的博弈。弈。强调团体理性(包括效率、公正与平等),典
50、型例子:寡头典型例子:寡头企业之间的共谋。企业之间的共谋。(1 1)强调)强调)强调)强调团体理性团体理性团体理性团体理性,强调的是效率、公正和公平;,强调的是效率、公正和公平;,强调的是效率、公正和公平;,强调的是效率、公正和公平;(2 2)研究在协议下的)研究在协议下的)研究在协议下的)研究在协议下的联盟利益分配联盟利益分配联盟利益分配联盟利益分配问题。问题。问题。问题。2.2.非合作博弈非合作博弈非合作博弈非合作博弈 参与人在行动选择时参与人在行动选择时参与人在行动选择时参与人在行动选择时无法达无法达无法达无法达成一个有约束力的成一个有约束力的成一个有约束力的成一个有约束力的协议协议协议