《西方经济学(微观部分)-第八章博弈论初步课件.ppt》由会员分享,可在线阅读,更多相关《西方经济学(微观部分)-第八章博弈论初步课件.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高等院校经济学专业“十二五”规划教材v 西方经济学(微观部分)(微观部分)主编 张玉明 聂艳华第八章 博弈论初步8.1本章框架结构图博 弈 论 在20世 纪50年 代 由 数 学 家 约 翰冯诺 依 曼(V on Neumann)和 经 济 学 家 奥 斯 卡摩 根 斯 坦(Morgenstern)引 入 经 济 学,目 前 已 经 成 为 主 流 经 济 分 析 的 主 要 工 具,对 寡 头 理 论、信 息 经 济 学 等 经 济 理 论 的 发 展作出了重要贡献。【学习目的】v1掌握博弈的基本含义及其分类。v2.掌握囚徒的困境博弈的意义。v3.掌握严格下策反复消去法的分析思路;掌握纳什均
2、衡的定义及其无限策略博弈和混合策略博弈中纳什均衡的解。v4.了解重复博弈中有限次重复博弈与无限次重复博弈概念及意义。【主要内容】v第一节 博弈论概述v第二节 囚徒的困境v第三节 纳什均衡v第四节 重复博弈v 3支付函数v 支 付 函 数 也 称 为 效 用 函 数,表 明 了 博 弈 的 参 与 人 采 取 的 每 种 策 略 组 合的 结 果 或 收 益,它 是 所 有 参 与 人 策 略 或 行 动 的 函 数,是 每 个 参 与 人 真 正 关心的东西。v 4支付矩阵v 参 与 博 弈 的 多 个 参 与 人 的 收 益 可 以 用 一 个 矩 阵 或 框 图 表 示,这 样 的 矩阵或
3、框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。v 其 中,博 弈 参 与 人、参 与 人 的 策 略 和 参 与 人 的 支 付 构 成 了 博 弈 须 具 有的三个基本要素。表10-1即为一个支付矩阵。表8-1支付矩阵第一节 博弈论概述二、同时博弈:纯策略均衡“同 时 博 弈”是 参 与 人 同 时 进 行 决 策 或 行 动 的 博 弈。在 同 时 博 弈 中,在 给 定 其 他 参 与 人的 策 略 时,某 个 参 与 人 的 最 优 策 略 称 之 为 该 参 与 人 的 条 件 优 势 策 略(简 称 条 件 策 略),而 包 括 该 参 与 人 的 条 件 策 略 以 及 这 些
4、 条 件 在 内 的 所 有 参 与 人 的 策 略 组 合 称 之 为 该 参 与人的条件优势策略组合(简称条件策略组合)。1占优策略在 一 些 特 殊 的 博 弈 中,一 个 参 与 人 的 最 优 策 略 可 能 并 不 依 赖 于 其 他 人 的 选 择。也就 是 说,无 论 其 他 参 与 人 采 取 什 么 策 略,该 参 与 人 的 最 优 策 略 是 惟 一 的,这 样 的 策 略称 之 为 占 优 策 略。如 表10-2所 示,通 过 对 支 付 矩 阵 的 分 析 可 以 看 出,如 果A、B两 厂 商都 是 理 性 的,则 这 个 博 弈 的 结 果 是 两 厂 商 都
5、做 广 告,即 不 管 一 个 厂 商 如 何 决 定,另 外一 个 厂 商 都 会 选 择 做 广 告。这 种 策 略 均 衡 称 之 为 占 优 策 略 均 衡(equilibrium in dominant strategies)。表8-2广告博弈的支付矩阵第二节纳什均衡并 不 是 每 个 博 弈 的 各 个 参 与 人 都 有 一 个 占 优 策 略。如 表10-3所 示,通 过 对 支 付矩 阵 的 分 析 可 以 看 出,现 在 厂 商A没 有 占 优 策 略,它 的 最 优 决 策 取 决 于 厂 商B的选 择。如 果 厂 商B做 广 告,则 厂 商A最 好 也 做 广 告;但
6、如 果 厂 商B不 做 广 告,厂商A不 做 广 告 又 是 最 好 的 选 择。这 种 均 衡 就 是 纳 什 均 衡(Nash equilibrium)。所 谓 纳 什 均 衡,指 的 是 参 与 人 的 这 样 一 种 策 略 组 合,在 该 策 略 组 合 上,任 何 参与 人 单 独 改 变 策 略 都 不 会 得 到 好 处。即 如 果 在 一 个 策 略 组 合 中,当 所 有 其 他 人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。表8-3广告博弈的支付矩阵例题1【例8.1】下列说法错误的是()。A占优策略均衡一定是纳什均衡B纳什均衡不一定是占优策略均衡
7、C 占 优 策 略 均 衡 中,每 个 参 与 者 都 是 在 针 对 其 他参与者的某个特定策略而做出最优反应D 纳 什 均 衡 中,每 个 参 与 者 都 是 在 针 对 其 他 参 与者的最优反应策略而做出最优反应【答案】C【解 析】占 优 策 略 均 衡 中,不 论 其 他 参 与 者 采 取 何种策略,每个参与者都会选择其自身的最优策略。4寻找纳什均衡的方法条件策略下划线法u 对 于 一 个 简 单 的“二 人 同 时 博 弈”,可 以 用 一 个 以 二 元 数 组 为 元素 的 支 付 矩 阵 来 表 示,并 用“条 件 策 略 下 划 线 法”来 确 定 它 的 纳 什均衡。具
8、体步骤如下:(1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。(2)在 第 一 个(即 位 于 整 个 博 弈 矩 阵 左 方 的)参 与 人 的 支 付矩阵中,找出每一列的最大者,并在其下画线。(3)在 第 二 个(即 位 于 整 个 博 弈 矩 阵 上 方 的)参 与 人 的 支 付矩阵中,找出每一行的最大者,并在其下画线。(4)将 已 经 画 好 线 的 两 个 参 与 人 的 支 付 矩 阵 再 合 并 起 来,得到带有下划线的整个博弈的支付矩阵。(5)在 带 有 下 划 线 的 整 个 的 支 付 矩 阵 中,找 到 两 个 数 字 之 下均 画 有 线 的 支 付 组 合。由
9、该 支 付 组 合 代 表 的 策 略 组 合 就 是 博 弈 的纳什均衡。第三节囚徒困境l 囚 徒 困 境 的 博 弈 模 型 的 假 设 条 件 是:甲、乙 两 个 被 怀 疑 为 合 谋偷 窃 的 嫌 疑 犯 被 警 方 抓 获,但 警 方 对 他 们 偷 窃 的 证 据 并 不 充 分。他 们 每 一 个 人 都 被 单 独 囚 禁,并 单 独 进 行 审 讯,即 双 方 无 法 互 通信 息。警 方 向 这 两 个 嫌 疑 犯 交 待 的 量 刑 原 则 是:如 果 一 方 坦 白,另 一 方 不 坦 白,则 坦 白 者 从 宽 处 理,判 刑1年;不 坦 白 者 从 重 处理,判
10、刑7年。如 果 两 人 都 坦 白,则 每 人 都 各 判 刑5年。如 果 两 个都 不 坦 白,则 警 方 由 于 证 据 不 足,只 能 对 每 个 人 各 判 刑2年。表8-6的 支 付 矩 阵 描 述 了 这 一 博 弈。表 中 的 报 酬 均 为 负 数,以 表 示判刑的年数。表8-6囚徒困境同时博弈:混合策略均衡v 并 不 是 所 有 的 博 弈 都 存 在 纳 什 均 衡。比 如,如表8-7 所 示。这 博 弈 就 不 存 在 纯 策 略 纳 什 均 衡,但 却 存 在 混 合 策 略 纳 什 均 衡。混 合 策 略 纳 什 均衡 是 这 样 一 种 均 衡,在 这 种 均 衡
11、下,给 定 其 他参 与 人 的 策 略 选 择 概 率,每 个 参 与 人 都 为 自 己确定了选择每一种策略的最优概率。表8-7社会福利博弈同时博弈:混合策略均衡v 所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参与人的条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的。例题3【答案】A【解析】根据题中条件可写出两人的收益矩阵,如表8-8所示。表
12、8-8两人的收益矩阵从 收 益 矩 阵 可 看 出,这 个 博 弈 有 两 个 纯 策 略 纳 什 均 衡(冲 过 去,避 让),(避 让,冲过 去)。设 甲 选 择 冲 过 去 的 概 率 为r,乙 选 择 冲 过 去 的 概 率 为c。对 于 甲 来 说,应 该 使冲过去的期望收益等于避让的期望收益,即,解 得 r=0.2;对 于 乙 来 说,也 应 该 使 其 冲 过 去 的 期 望 收 益 等 于 避 让 的 期 望 收 益,即,解得c=0.2。所以,存在一个混合策略纳什均衡。乙选择概率冲过去 避让甲冲过去-36,-36 9,0避让 0,9 0,0选择概率第四节序贯博弈v“序贯博弈”是
13、参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是“博弈树”。博弈树由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略。图8-1博弈树在 序 贯 博 弈 中,可 能 存 在 多 个 纳 什 均 衡 的 情 况。在 多 个 纳 什 均 衡 中,有 些 可 能 并 不 合 理。所 谓 对 纳 什 均 衡 的“精 炼”,就 是 要 从 众 多 的 纳什 均 衡 中 进 一 步 确 定“更 好”的 纳 什 均 衡。纳 什 均 衡
14、 的 精 炼 方 法 通 常是使用所谓的“逆向归纳法”,具体包括以下两个步骤:第 一 步,先 从 博 弈 的 最 后 阶 段 的 每 一 个 决 策 点 开 始,确 定 相 应参 与 人 此 时 所 选 择 的 策 略,并 把 参 与 人 所 放 弃 的 其 他 策 略 删 除,从而得到原博弈的一个简化博弈。第 二 步,再 对 简 化 博 弈 重 复 步 骤 一 的 程 序,直 到 最 后,得 到 原博 弈 的 一 个 最 简 博 弈。这 个 最 简 博 弈,就 是 原 博 弈 的 解;而 在 存 在多重纳什均衡时,它就是对纳什均衡的精炼。第四节序贯博弈例题4【例8.4】在下面的博弈树中,确定
15、纳什均衡和逆向归纳策略。例题4答:纳 什 均 衡 是(决 策1,决 策3)、逆 向 归 纳 策 略 也 是(决 策1,决 策3)。分 析 如下:(1)(决 策1,决 策3)是 一 个 纳 什 均 衡。在 该 策 略 组 合 上,没 有 哪 个 参 与 人愿 意 单 独 改 变 自 己 的 策 略。首 先,参 与 人B不 会 单 独 改 变 自 己 的 策 略。如 果 它 单 独改 变 策 略,即 将 原 来 的 决 策3变 为 决 策4,参 与 人B的 支 付 将 从 原 来 的3下 降 到0。其次,参 与 人A也 不 会 单 独 改 变 自 己 的 策 略。如 果 它 单 独 改 变 策 略
16、,即 将 原 来 的 决 策1变 为 决 策2,则 策 略 组 合 就 成 为(决 策2,决 策3),参 与 人A的 支 付 将 从 原 来 的1下降到0。(2)采 用 逆 向 归 纳 法,可 以 判 断 出 逆 向 归 纳 策 略 也 是(决 策1,决 策3)。首先,如 果 参 与 人A选 择 决 策1,参 与 人B肯 定 不 会 选 择 决 策4。另 一 方 面,如 果 参 与人A选 择 决 策2,参 与 人B肯 定 不 会 选 择 决 策4。在 此 情 况 下,考 察 参 与 人A的 选 择。由 博 弈 树 可 以 看 出,参 与 人A的 最 优 选 择 是 决 策1。最 终 结 果 是
17、,参 与 人A选 择 决 策1,参与人B选择决策3,即最优策略组合为(决策1,决策3)。2 混 合 策 略北 京 交 通 大 学2004研;东 北 大 学2007 研;华 中 科技大学2008研答:混 合 策 略 是 指 在 博 弈 中,博 弈 方 的 决 策 内 容 不 是 确 定性 的 具 体 的 策 略,而 是 在 一 些 策 略 中 随 机 选 择 的 概 率 分 别 的 策略。混合策略情况下的决策原则有以下两个:(1)博 弈 参 与 者 互 相 不 让 对 方 知 道 或 猜 到 自 己 的 选 择,因而 必 须 在 决 策 时 利 用 随 机 性 来 选 择 策 略,避 免 任 何
18、 有 规 律 性 的选择。(2)博 弈 参 与 者 选 择 每 种 策 略 的 概 率 一 定 要 恰 好 使 对 方 无机 可 乘,即 让 对 方 无 法 通 过 有 针 对 性 倾 向 的 某 一 种 策 略 而 在 博弈中占上风。名校考研真题详解二、简答题1 说 明 纳 什 均 衡 与 纳 什 定 理 的 基 本 概 念。南 开 大 学2005研答:(1)纳 什 均 衡 是 指 这 样 一 种 策 略 集,在 这 一 策 略 集 中,任 何 一 个 博 弈 者 在 其 他 参 与 者 的 策 略 给 定 的 条 件 下,其 选 择 的 策略 是 最 优 的。所 以,给 定 其 他 人 的
19、 策 略,任 何 个 人 都 没 有 积 极 性去选择其他策略,从而这个均衡没有人有积极性去打破。(2)纳 什 定 理 的 含 义 是:对 于 任 何 一 个 个 人 参 与 的 非 合作 博 弈(零 和 或 非 零 和 博 弈),如 果 每 个 参 与 者 都 只 有 有 限 策 略,那么一定存在至少一个纳什均衡解。名校考研真题详解2表8-9为两竞争对手的博弈结果矩阵:表8-9两竞争对手的博弈结果矩阵请 问:什 么 是 纳 什 均 衡?求 出 该 博 弈 的 所 有 可 能 的 纳 什 均衡,利用图形说明求出的纳什均衡的意义。中山大学2010研名校考研真题详解三、计算题1甲、乙两个学生决定是
20、否打扫宿舍。无论对方是否参与,每个参与人的打扫成本都是8;而每个人从打扫中的获益则是5乘以参与人数。(1)请用一个博弈简单描述上述情景。(2)找出该博弈的所有纳什均衡。中山大学2010研解:(1)共有以下四种情况:当甲乙都参与时,每个人的收益均为5 2-8=2。当甲参与乙不参与时,甲收益为5 1-8=-3,乙收益为5 1-0=5。当甲不参与乙参与时,甲收益为5 1-0=5,乙收益为5 1-8=-3。当甲乙都不参与时,每个人的收益均为0。名校考研真题详解名校考研真题详解具体博弈矩阵如表8-11所示:表8-11博弈的收益矩阵(2)从表8-11中可以看出,该博弈的纳什均衡是甲不参与乙也不参与,这一均
21、衡解也是占优策略均衡。从参与人甲的角度看,不论参与人乙参与不参与打扫宿舍,不参与打扫宿舍都是参与人甲的较好的选择。同样的情形,从参与人乙的角度看,不参与打扫宿舍也是参与人乙的较好的选择。所以,这是一个占优策略均衡,即双方都没有动力去改变这一局面,最后谁都不去打扫宿舍。可以看出,如果甲乙两人都参与打扫宿舍,则他们的境况就要比在其他选择下更好一些。(参与,参与)是帕累托有效率的策略组合,而(不参与,不参与)则是帕累托低效率的策略组合。双方从自己的理性出发的最优策略,从社会看来是最糟糕的策略。乙参与 不参与甲参与 2,2-3,5不参与 5,-3 0,0名校考研真题详解(2)若 A先 推 出 新 产
22、品,然 后 B再 推 出 新 产 品,则 会 形 成 一 个 动 态 博 弈。此 博 弈 序 列 将 呈 现 如 图8-2的 博 弈树形状。图8-2动态博弈从 图8-2可 见,A先 推 出 新 产 品 的 话,肯 定 选 择 高 品 质 产 品 H,于 是 B只 能 选 择 高 品 质 产 品 H。可 见,这 时 A的 利 润 是20,B 的利润也是20。若B先推出新产品,然后A再推出新产品,则此博弈序列将呈现如图8-3的博弈树形状。图8-3动态博弈从 图8-3可 见,B先 推 出 新 产 品 的 话,肯 定 选 择 高 品 质 产 品 H,于 是 A只 能 选 择 高 品 质 产 品 H。可
23、 见,这 时 A的 利 润 是20,B 的利润也是20。【本 章 小 结】v(1)博弈论是描述和研究经济行为者之间策略相互依存和相互作用的一种决策理论。一个博弈包含四个关键方面:博弈的参加者即博弈方、各博弈方的策略或行为、博弈的次序、博弈方的得益。v(2)博弈大致可进行如下分类:一是根据博弈方是否合作分为合作博弈和非合作博弈;二是在非合作博弈基础上,根据博弈方的理性和行为逻辑差别分为完全理性博弈和有限理性博弈;三是根据博弈过程可分为静态博弈、动态博弈和重复博弈,并在此基础上根据信息的完全完美与否分为:完全信息静态博弈和不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全
24、信息动态博弈。v(3)“囚徒的困境”从博弈中两个决策者的立场上来看该结局属于个人最优策略,但从整体来说却是最差的结果,即个体理性和团体理性发生冲突,使得该结果既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益。该博弈的重要意义在于类似的情况会发生在社会经济活动中,因而该博弈具有很大的普遍性。v(4)严格下策反复消去法是建立在理性的博弈方不会选择严格下策这一原则上。它有两点不足:第一,每一步消去都需要更进一步假定博弈方之间是相互了解的,扩展到任意多步,需要假定“博弈方是理性的”是共同知识。第二,当不存在严格下策的博弈,则无法用该法进行分析,或者在策略数较多的博弈中,当该法只能消去其中
25、的部分策略时,这时严格下策反复消去法往往无法对博弈作出准确的预测。v(5)如果参与者之间能够交谈并达成有约束力的合约,博弈就是合作的,否则就是非合作的。在任何一类博弈中,策略设计的最重要的方面就是理解你的对手的处度,并(如果你的对手是理性的)正确推导出其对你的行为会做的反应。v(6)一个纳什均衡就是各参与者所做的是在给定其他参与者的策略时所能做的最好的一组策略。占优策略的均衡是纳什均衡的一种特例,不管其他参与者如何做,占优策略总是最优的。纳什均衡依赖各参与者的理性。极大化极小策略是较保守的,因为它只是使最小的可能结果最大化。v(7)有些博弈没有纯策略纳什均衡,但却有一个或更多个混合策略纳什均衡
26、。一个混合策略就是一种参与者根据一组选定的概率在两种或更多种可能的行为中随机选择的策略。v(8)混合策略博弈中,一是博弈方决策时必须具有随机性,即不能让对方知道或猜到自己的选择。二是彼此选择每种策略的概率一定要恰好让对方无机可乘,即不能使得某一方有针对性地倾向某一策略而在博弈中占上风。v(9)在一次性博弈中不是最优的策略可能在一个重复博弈中是最优的。取决于重复次数的以牙还牙策略。其中一个参与者只要其竞争者合作就保持合作,可能对重复的囚徒困境博弈是最优的。【本 章 小 结】【阅读推荐与网络链接】v 1.马丁J.奥斯本(Martin J.Osborne),施锡铨,陆秋君,钟明:博弈入门,上海财经大学出版社,2010v 2.谢识予编著,经济博弈论(第3版),复旦大学出版社,2008v 3.罗伯特吉本斯,高峰:博弈论基础,中国社会科学出版社,1999 v 4.张维迎,博弈论与信息经济学,上海人民出版社,2004v 5.武庚平编著,高级微观经济学,清华大学出版社,2001v 6.张军主编,高级微观经济学,复旦大学出版社,2002v 7.施锡铨编,博弈论,上海财经大学出版社,2000v 8.v 9.