《《对策论基础》课件.pptx》由会员分享,可在线阅读,更多相关《《对策论基础》课件.pptx(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、对策论基础PPT课件对策论简介纳什均衡优势策略与劣势策略对策论中的混合策略对策论中的扩展型对策contents目录对策论简介01总结词对策论是一门研究竞争、合作和冲突的数学分支,通过数学模型和理论来描述和分析策略性决策问题。详细描述对策论是研究策略性决策问题的数学理论,主要关注参与者之间的竞争、合作和冲突关系。它通过建立数学模型来描述和分析这些关系,为策略制定提供理论支持。对策论的定义对策论起源于20世纪初的博弈论,经过多年的发展,已经成为一个成熟的数学分支,广泛应用于经济学、政治学、社会学等领域。总结词对策论的历史可以追溯到20世纪初的博弈论,当时主要用于研究游戏中的策略性问题。随着时间的推
2、移,对策论不断发展壮大,逐渐形成了完整的理论体系,并扩展到各个学科领域,如经济学、政治学、社会学等。详细描述对策论的历史与发展对策论的应用领域对策论在经济学、政治学、军事学、生物学等领域都有广泛的应用,为解决实际问题提供了重要的理论支持。总结词对策论的应用领域非常广泛。在经济学中,它被用于研究市场均衡和竞争策略;在政治学中,它被用于分析选举和政治联盟的形成;在军事学中,它被用于制定战略和战术;在生物学中,它被用于研究物种之间的竞争与进化。此外,对策论还在其他学科领域中得到了广泛应用,为解决实际问题提供了重要的理论支持。详细描述纳什均衡02纳什均衡是指在非合作博弈中,所有参与者都预测到其他参与者
3、的策略,并作出最优选择的一种策略组合。在这种策略组合下,任何单个参与者都没有动力改变自己的策略,因为其他参与者的策略已经最优,改变策略只会带来更差的结果。纳什均衡是一种稳定的状态,其中每个参与者都认为其他参与者的策略是已知的,并且已经作出了最优选择。这种均衡可以通过求解参与者的最优策略来获得。纳什均衡的定义线性规划法对于某些特定类型的博弈,可以使用线性规划法来求解纳什均衡。这种方法通过建立线性规划模型来找到最优策略组合。迭代法通过不断迭代来逼近纳什均衡。这种方法需要设定一个初始策略组合,然后根据每个参与者的最优策略进行迭代,直到达到一个稳定的状态。梯度下降法类似于迭代法,但使用梯度下降法来逼近
4、纳什均衡。这种方法通过计算每个参与者的梯度向量来找到最优策略方向,并沿着该方向进行迭代。纳什均衡的求解方法在寡头垄断市场中,几个大型企业控制了大部分的市场份额。这些企业之间的竞争往往呈现出非合作博弈的特点,纳什均衡可以用来分析这种竞争关系。寡头垄断在国际贸易中,各国之间的贸易政策往往受到其他国家的影响。纳什均衡可以用来分析这种国家之间的贸易竞争关系。国际贸易在城市交通规划中,道路使用者的行为往往呈现出博弈的特点。纳什均衡可以用来分析这种道路使用者的行为模式,优化交通流量的分配。交通规划纳什均衡的应用实例优势策略与劣势策略03在对策中,如果一个策略不论对手采取什么策略,都能使自己获得比其他任何策
5、略更好的结果,这种策略称为优势策略。与优势策略相反,如果一个策略在对手采取任何策略时,都不能使自己获得比其他任何策略更好的结果,这种策略称为劣势策略。优势策略与劣势策略的定义劣势策略优势策略优势策略与劣势策略的判定方法优势策略判定定理如果一个策略在所有对手可能采取的策略下,都能使自己获得比其他任何策略更高的收益,则该策略为优势策略。劣势策略判定定理如果一个策略在所有对手可能采取的策略下,都不能使自己获得比其他任何策略更高的收益,则该策略为劣势策略。在这个博弈中,两个囚犯都有优势策略,即坦白。无论对方选择坦白还是抵赖,坦白都是最优选择。因此,最终的结果是两个囚犯都坦白,得到了较重的惩罚。囚徒困境
6、在这个游戏中,每个策略都有优势和劣势。石头能打败剪刀,剪刀能剪断布,布能包裹石头。因此,没有绝对的优劣之分,需要根据对手的策略来选择自己的最优策略。石头-剪刀-布游戏优势策略与劣势策略的应用实例对策论中的混合策略04混合策略是指在对策中,参与者以一定的概率分布随机选择不同的策略。它是一种概率型策略,其中每个参与者都有一系列可能的行动,并选择每个行动的概率。混合策略是一种非确定性的策略,与确定性的策略相对。在确定性策略中,参与者明确选择一个特定的行动而不考虑其他可能性。混合策略的定义混合策略的求解方法在混合策略中,如果每个参与者的混合策略使得其他参与者的最优选择对自己最有利,则该混合策略组合称为
7、纳什均衡。概率计算在求解混合策略问题时,需要计算每个行动的概率,以确定每个参与者应选择的最佳行动。这些概率通常基于参与者的收益和对手可能的行动。迭代法一种常见的求解混合策略的方法是通过迭代法,反复计算每个参与者的最优策略,直到达到纳什均衡或近似纳什均衡。纳什均衡扑克牌游戏01在扑克牌游戏中,玩家可能会使用混合策略来迷惑对手并增加赢牌的机会。例如,玩家可能会随机地选择“跟注”或“加注”行动,而不是总是采取相同的行动。经济博弈02在寡头垄断市场中,厂商可能会使用混合策略来决定产量或价格。通过随机选择不同的产量或价格水平,厂商可以避免被对手预测并采取针对性的行动。军事战略03在战争中,混合策略可用于
8、制定攻击和防御计划。例如,通过随机部署兵力和武器系统,可以降低敌人预测攻击路线的可能性,增加作战成功的机率。混合策略的应用实例对策论中的扩展型对策05扩展型对策局中人集合策略集合支付函数扩展型对策的定义01020304是一种对策的数学模型,用于描述具有有限数量局中人的零和、常和或变和对策。扩展型对策中所有局中人的集合,通常用N表示。每个局中人都拥有一个策略集合,通常用Si表示第i个局中人的策略集合。局中人在每个策略组合下的支付函数,通常用ui(s)表示第i个局中人在策略组合s下的支付。扩展型对策的求解方法当局中人的策略集合是有限的离散集合时,可以使用混合策略来求解扩展型对策。混合策略是指局中人
9、以一定的概率分布随机选择不同的策略。混合策略基于极大极小原则,选择每个局中人的最优策略,使得在对方采取最优策略的情况下,自己仍然能够获得最大支付。极大极小策略纳什均衡是扩展型对策中的一个重要概念,指在给定其他局中人的策略的情况下,每个局中人都能通过选择最优策略来最大化自己的支付。纳什均衡零和对策在零和对策中,所有局中人的支付之和为零,即一个局中人的支付是另一个局中人的损失。例如,国际象棋、围棋等竞技游戏中的最优策略分析。常和对策在常和对策中,所有局中人的支付之和是一个常数。例如,经济合作组织内的贸易政策、资源分配等问题。变和对策在变和对策中,所有局中人的支付之和不是一个常数,而是与某些因素有关。例如,寡头垄断市场中的竞争策略、投资组合优化等问题。010203扩展型对策的应用实例THANKS感谢观看