《金融数学博弈论基础第二章3解析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《金融数学博弈论基础第二章3解析优秀PPT.ppt(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.4 完全非完备信息动态博弈完全非完备信息动态博弈 2.4.A 博弈的扩展式表述博弈的扩展式表述 (回顾回顾)第一章)第一章静态博弈静态博弈G 的的标准式标准式表示表示 博弈博弈G 的标准式表述包括:的标准式表述包括:(1)博弈的参与人;)博弈的参与人;(2)每个参与人可供选择的战略;)每个参与人可供选择的战略;(3)与参与人可能选择的每一战略组合相对应的各)与参与人可能选择的每一战略组合相对应的各 个参与人的收益个参与人的收益.在静态博弈中,在静态博弈中,全部参与者同时行动(或行动虽有全部参与者同时行动(或行动虽有 行动者在自己行动之前能观测到先行动者的行动行动者在自己行动之前能观测到先行
2、动者的行动.先后,但没有参与者在自己行动之前观测到别人的行动先后,但没有参与者在自己行动之前观测到别人的行动 ););在动态博弈中,在动态博弈中,参与者人的行动有先后依次,且后参与者人的行动有先后依次,且后 正如正如博弈论专家习惯于用博弈论专家习惯于用标准式标准式表述描述和分析静态博弈一表述描述和分析静态博弈一 样,他们也习惯于用样,他们也习惯于用扩展式表述扩展式表述(extensive forme repr-esentation)来描述和分析来描述和分析动态博弈动态博弈.博弈的扩展式表述所博弈的扩展式表述所“扩展扩展”的主要是的主要是 参与者的战参与者的战 略空间略空间.标准式表述简洁地给出
3、参与者有些什么战略可标准式表述简洁地给出参与者有些什么战略可以选择,以选择,而扩展式表述而扩展式表述 要给出每个战略的动态描述:要给出每个战略的动态描述:谁谁 在什么时候行动,在什么时候行动,每次行动时有些什么具体行动可供选每次行动时有些什么具体行动可供选 择,以及知道些什么择,以及知道些什么.简洁地说,简洁地说,在扩展式表述中,在扩展式表述中,战战略对应于参与人的相机行动规则略对应于参与人的相机行动规则(contingent action pla-n),即,即 而不是简洁的、与环而不是简洁的、与环 什么状况下选择什么行动,什么状况下选择什么行动,境无关的行动选择境无关的行动选择.具体来讲,具
4、体来讲,博弈的扩展式表述包括以下要素:博弈的扩展式表述包括以下要素:1.参与人集合:参与人集合:用用N 代表虚拟参与者代表虚拟参与者“自然自然”;2.参与人的行动依次:参与人的行动依次:谁在什么时候行动;谁在什么时候行动;3.参与人的行动空间:参与人的行动空间:每次行动时,参与者有些什每次行动时,参与者有些什 么行动选择;么行动选择;4.参与人的信息集:参与人的信息集:每次行动时,参与者知道什么;每次行动时,参与者知道什么;5.参与人的支付函数:参与人的支付函数:在行动结束后,每个参与者在行动结束后,每个参与者 得到什么(支付是全部行动的函数);得到什么(支付是全部行动的函数);6.外生事务(
5、即自然的选择)的概率分布外生事务(即自然的选择)的概率分布.定义定义 一个博弈的一个博弈的扩展式表述扩展式表述包括:包括:(1)博弈中的参与人;博弈中的参与人;(2a)每一参与人在何时行动;每一参与人在何时行动;(2b)每次轮到某参一与人在行动时,可供他选择的每次轮到某参一与人在行动时,可供他选择的行动;行动;(2c)每次轮到某参与人在行动时,他所了解的信息;每次轮到某参与人在行动时,他所了解的信息;(3)与参与人可能选择的每一行动组合相对应的各与参与人可能选择的每一行动组合相对应的各 个参与人的收益个参与人的收益.说明:说明:一般来讲,一般来讲,静态博弈一般用标准式表述,动静态博弈一般用标准
6、式表述,动 态博弈一般用扩展式表述态博弈一般用扩展式表述.但不是确定的但不是确定的.任何博弈都任何博弈都既可以用标准式表述,既可以用标准式表述,也可以用扩展式表述,也可以用扩展式表述,只是选择只是选择 哪一种表述形式更便利些而已哪一种表述形式更便利些而已.博弈树博弈树描述描述博弈的扩展式博弈的扩展式 1 2 2 LR(3,1)(1,2)(2,1)(0,0)收益向量第一个数字是收益向量第一个数字是参与者参与者1的收益,其次个的收益,其次个数字是参与者数字是参与者2的收益的收益.图图2.4.1 博弈树博弈树 一个决策节一个决策节decision node 终点节终点节teminal node 将图
7、将图2.4.1的博弈树进行扩展,的博弈树进行扩展,用来表示全部完全用来表示全部完全 且完备信息动态博弈且完备信息动态博弈 即任何参与者依次行动,对下即任何参与者依次行动,对下 一行动作出选择之前其前面全部行动都是共同学问,并一行动作出选择之前其前面全部行动都是共同学问,并 且每一可能的行动组合下各参与者的收益也是共同学问且每一可能的行动组合下各参与者的收益也是共同学问 的博弈的博弈.只是有时比较困难(只是有时比较困难(当行动空间无限时当行动空间无限时).动态博弈也可以用标准式表述,动态博弈也可以用标准式表述,但须要把扩展式中但须要把扩展式中 的信息转换为对标准式中每一个参与者战略空间的描述的信
8、息转换为对标准式中每一个参与者战略空间的描述.定义定义 参与者的一个战略是关于行动的一个完整支配参与者的一个战略是关于行动的一个完整支配 它明确了在参与者可能会遇到的每一种状况下对可行它明确了在参与者可能会遇到的每一种状况下对可行 行动的选择行动的选择.针对图针对图2.4.1的博弈,的博弈,考虑参与者考虑参与者2的战略的战略.参与者参与者2有有 两个行动,两个行动,但却有但却有4个战略个战略.战略战略1:假如参与者假如参与者1选择选择L,则选择则选择 假如参与者假如参与者1 选择选择R,则选择则选择 表示为表示为 战略战略2:假如参与者假如参与者1选择选择L,则选择则选择 假如参与者假如参与者
9、1选择选择R,则选择则选择 表示为表示为 战略战略3:假如参与者假如参与者1选择选择L,则选择则选择 假如参与者假如参与者1选择选择R,则选择则选择 表示为表示为 战略战略4:假如参与者假如参与者1选择选择L,则选择则选择 假如参与者假如参与者1选择选择R,则选择则选择 表示为表示为 考虑参与者考虑参与者1的战略的战略.参与者参与者1有两个行动,有两个行动,也只有也只有1个战略个战略.因为参与者因为参与者1行动时,行动时,只面对一种状况,只面对一种状况,因此,因此,参与者参与者1的战略与其行动空间是相同的的战略与其行动空间是相同的.即即 3,13,11,21,22,10,02,10,0参与者参
10、与者1 参与者参与者2 L R L R L R 二人博弈的扩展式(树)表示二人博弈的扩展式(树)表示扩展式表示与标准式(策略式)的转换扩展式表示与标准式(策略式)的转换3,13,11,21,22,10,02,10,0参与者参与者2 参与者参与者1 静态博弈静态博弈也可以用也可以用扩展式表述,扩展式表述,留意:留意:静态博弈中参与者不确定要同时行动:静态博弈中参与者不确定要同时行动:只须只须 每个参与者在选择战略时不知道其他参与者的选择每个参与者在选择战略时不知道其他参与者的选择.以两个参与者的静态博弈为例,以两个参与者的静态博弈为例,将其表示为将其表示为动态博动态博 弈的形式弈的形式.1.参与
11、者参与者1 从可行集从可行集A1中选择一个行动中选择一个行动a1,2.参与者参与者2没有观测到参与者没有观测到参与者1的行动,从可行集的行动,从可行集A2中选择一个行中选择一个行动动a2,3 两人的收益分别为两人的收益分别为 和和 定义定义 参与者的一个信息集参与者的一个信息集 指满足以下条件的决策指满足以下条件的决策 节节的集合:的集合:(1)在此信息集的每一个节都轮到该参与者行动,)在此信息集的每一个节都轮到该参与者行动,且且(2)当博弈的进行达到此信息集中的一个节,)当博弈的进行达到此信息集中的一个节,应当应当 行动的参与者并不知道达到了行动的参与者并不知道达到了(或没有达到或没有达到)
12、信息集中信息集中 的哪一个节的哪一个节.留意:(留意:(2)意味着参与者在信息集中的每一个)意味着参与者在信息集中的每一个决策节决策节 都有着都有着相同的行动集合相同的行动集合.以囚徒逆境静态博弈为例以囚徒逆境静态博弈为例(4,4)(0,3)(5,0)(1,1)囚徒囚徒1 沉默沉默 招认招认 囚徒囚徒2 囚徒囚徒2 沉默沉默 沉默沉默 招认招认 招认招认 图图2.4.3 在一个扩展式博弈中,在一个扩展式博弈中,为表示某些决策节处于同为表示某些决策节处于同 一信息集中,一信息集中,用虚线把这些用虚线把这些决策节连起来决策节连起来.三阶段动态博弈树三阶段动态博弈树 看下面的例子,看下面的例子,1.
13、参与者参与者1 从可行集从可行集2.参与者参与者2观测到观测到a1,然后从从可行集,然后从从可行集中选择一个行中选择一个行动动a2;中选择一个行动中选择一个行动a1;3.参与者参与者3观测是否观测是否 然后从从可然后从从可 行集行集 中选择一个行中选择一个行动动a3.三阶段动态博弈树三阶段动态博弈树见图见图2.4.4,在扩展式中,在扩展式中,参与者参与者3 有两个信息集:有两个信息集:假如假如1 选择选择R,2 选择选择 参与者参与者3进进 入入只有一个决策节只有一个决策节的的信息集信息集,另一个信息集是轮到参与另一个信息集是轮到参与 者者3 行动时,行动时,则他进入包含其余全部决策节的信息集
14、则他进入包含其余全部决策节的信息集.从而,参与者从而,参与者3 3所能观测到的只是所能观测到的只是是否是否 成立成立.1 L R 2 2 3 33 图图2.4.4 信息集的引入信息集的引入使得使得 我们可以区分完备信息和非完备我们可以区分完备信息和非完备 信息信息的另一种定义的另一种定义.(回顾)完备信息:(回顾)完备信息:博弈的每一步行动中,轮到行动博弈的每一步行动中,轮到行动 的参与者了解前面博弈进行的全部过程的参与者了解前面博弈进行的全部过程.对完备信息的对完备信息的一个等价定义是一个等价定义是 每一个信息集都是每一个信息集都是单节的单节的.相反,相反,非非 完备信息则完备信息则 意味着
15、至少存在一个意味着至少存在一个非单节的信息集非单节的信息集.(注:这种用是否单节信息区分完备信息和非完备信息注:这种用是否单节信息区分完备信息和非完备信息的方法只限于完全信息的博弈,参见课本的方法只限于完全信息的博弈,参见课本95页角注页角注.)因为第一章已经指出,因为第一章已经指出,依据以上分析得知,依据以上分析得知,无论静态博弈还是动态博弈,无论静态博弈还是动态博弈,只是只是选择哪一种表述形式更便利些而已选择哪一种表述形式更便利些而已.都既可以用标准式表述,也可以用扩展式表述,都既可以用标准式表述,也可以用扩展式表述,但是,假如博弈分析的目的是预料博弈中参与但是,假如博弈分析的目的是预料博
16、弈中参与 特殊是,动态博特殊是,动态博 弈弈也可以用也可以用标准式表述,标准式表述,从而,纳什均衡的概念适合从而,纳什均衡的概念适合 用于全部的博弈,用于全部的博弈,而不仅仅是参与者同时行动的静态而不仅仅是参与者同时行动的静态 博弈博弈.者的行为,者的行为,纳什均衡给出的可能并不是一个特别合理纳什均衡给出的可能并不是一个特别合理的预料的预料.(甚至无穷多个)纳什均衡,原委那一个均衡更为合理(甚至无穷多个)纳什均衡,原委那一个均衡更为合理 一个博弈可能有多个一个博弈可能有多个博弈论并没有一般结论博弈论并没有一般结论.但是,均衡的多重性并不是但是,均衡的多重性并不是 纳什均衡存在的严峻问题纳什均衡
17、存在的严峻问题.最严峻的问题是,最严峻的问题是,纳什均纳什均 衡假定每一个参与者在选择自己的最优战略时假定所衡假定每一个参与者在选择自己的最优战略时假定所 有其他参与者的战略选择是给定的,有其他参与者的战略选择是给定的,也就是说,也就是说,参与参与者并不考虑自己的选择对其他参与者选择的影响者并不考虑自己的选择对其他参与者选择的影响.故故 纳什均衡纳什均衡很难说是很难说是动态博弈的一个动态博弈的一个合理解合理解.因为在动因为在动 态博弈中,态博弈中,参与者的行动有先有后,参与者的行动有先有后,空间依靠于前行动者的选择空间依靠于前行动者的选择.后行动者的选择后行动者的选择前行动者在选择自己的战前行
18、动者在选择自己的战 略时不行能不考虑自己的选择对后行动者选择的影响略时不行能不考虑自己的选择对后行动者选择的影响.纳什均衡的这个缺陷使博弈论专家从纳什均衡的这个缺陷使博弈论专家从 60 年头起先就不年头起先就不 断寻求断寻求改进和精炼改进和精炼纳什均衡概念纳什均衡概念.子博弈精炼纳什均衡子博弈精炼纳什均衡 概念是由概念是由泽尔腾泽尔腾(Selten,1965)第一个最重要的改进,它第一个最重要的改进,它 的而目的是的而目的是 把动态博弈中的把动态博弈中的“合理纳什均衡合理纳什均衡”与与“不合理不合理 纳什均衡纳什均衡”分开分开.正如纳什均衡概念是正如纳什均衡概念是完全信息静态博弈完全信息静态博
19、弈 解的基本概念一样,解的基本概念一样,子博弈精炼纳什均衡是子博弈精炼纳什均衡是完全信息完全信息 动态博弈解动态博弈解的基本概念的基本概念.(博弈论与信息经济学博弈论与信息经济学-160)博弈树:博弈树:包括包括结结(nodes)、枝枝(branches)、信息集信息集(information sets).1.结结包括包括 决策结决策结和和终点结两类:终点结两类:一般地,用一般地,用X 表表 示全部结的集合,示全部结的集合,表示某个表示某个特定的结特定的结.用用 表表 示定义在示定义在X上的依次关系上的依次关系(precedence relation);比如比如 意味意味 在在之前之前”.假定
20、假定 满足:满足:传递性和反传递性和反 对称性,对称性,即即是是半序的半序的(partial order),即即有些结有些结之之 间是不行比较的间是不行比较的.定义定义P(x)为在为在 x 之前的全部结的集合,之前的全部结的集合,简称为简称为 x 的的前列集前列集(the set of precedecessors);定义定义T(x)为在为在 x之后的全部结的集合,之后的全部结的集合,简称为简称为 x 的的后续集后续集(the set of su-ccessors).假如假如 x 称为称为初始结;初始结;若若 x 称为称为终点结终点结.除终点结之外的全部结都是决策结除终点结之外的全部结都是决策
21、结.2.枝枝(branches):枝是从一个决策结到它的干脆后枝是从一个决策结到它的干脆后 续结续结的的连线连线,每一个枝代表参与者的一个行动选择每一个枝代表参与者的一个行动选择.干脆前列结:干脆前列结:除初始结除初始结O 之外,对于全部的之外,对于全部的 假如存在一个假如存在一个 使得对于全部的使得对于全部的 有有 意味着意味着 那么那么 p(x)称为称为x 的干脆前的干脆前 列结列结.假如假如是是 x 的干脆前列结,那么的干脆前列结,那么x 称为称为 的干脆的干脆 后续结后续结.3.信息集信息集(information sets):博弈树上的全部决策博弈树上的全部决策 结结分割成不同的信息
22、集分割成不同的信息集.每一个每一个信息集信息集是决策结集合的是决策结集合的 一个子集一个子集.该子集包括全部满足下列条件的决策结:该子集包括全部满足下列条件的决策结:(1)每一个决策结都是同一参与者的决策结;)每一个决策结都是同一参与者的决策结;2.4.B 子博弈精炼纳什均衡子博弈精炼纳什均衡 (回顾)(回顾)给出的给出的子博弈精炼纳什均衡子博弈精炼纳什均衡 仅限于重复博弈,仅限于重复博弈,战略,子博弈,共同学问等概念,战略,子博弈,共同学问等概念,下面下面将子博弈精炼纳什均衡的概念将子博弈精炼纳什均衡的概念 用于一般的用于一般的完全信完全信 息动态博弈息动态博弈.(回顾)(回顾)子博弈的非正
23、式定义,子博弈的非正式定义,即从博弈进即从博弈进 行到的某一点起先,行到的某一点起先,前面整个博弈的进行过程在全部前面整个博弈的进行过程在全部参与者中都是共同学问,参与者中都是共同学问,始于该点的其余部分的博弈始于该点的其余部分的博弈 就是原博弈的一个子博弈(限于重复博弈)就是原博弈的一个子博弈(限于重复博弈).定义定义 扩展式博弈扩展式博弈中的中的子博弈子博弈 (a)始于单节信息集的始于单节信息集的决策节决策节n(但不包括博弈的(但不包括博弈的(2)该参与者知道博弈进入该集合的某个决策结,)该参与者知道博弈进入该集合的某个决策结,但不知道自己原委处于哪一个决策结但不知道自己原委处于哪一个决策
24、结.第一个决策节);第一个决策节);(b)包含博弈树中包含博弈树中n 之下全部的决策节和终点节(之下全部的决策节和终点节(但不在但不在 n下面的除外);下面的除外);(c)没有任何信息集分割没有任何信息集分割.有一个决策节有一个决策节(即假如博弈树中(即假如博弈树中n 之下之下 处于处于同一信息集同一信息集的其它决策的其它决策 则和则和 节也必需在节也必需在n 之下,之下,从而也必需包含于子博弈中)从而也必需包含于子博弈中).关于定义的说明:关于定义的说明:(a)说明整个博弈不是子博弈,说明整个博弈不是子博弈,(c)说明子博弈是说明子博弈是一个独立的博弈一个独立的博弈,并且对其分析的结并且对其
25、分析的结 果用于果用于原博弈原博弈.分别用图分别用图2.4.1,图,图2.4.3,图,图2.4.4为例为例 说明说明.对对(c)必要性的另一说明是:必要性的另一说明是:(a)只保证了在决策只保证了在决策 节节n 应当行动的参与者知道博弈到此为止的整个过程,应当行动的参与者知道博弈到此为止的整个过程,而不能保证其他参与者也知道这一过程而不能保证其他参与者也知道这一过程.(c)则保证了则保证了而不能保证其他参与者也知道这一过程,而不能保证其他参与者也知道这一过程,(c)则保证)则保证 了博弈到该点为止的整个过程在全部参与者中是共同了博弈到该点为止的整个过程在全部参与者中是共同 学问学问.缘由如下:
26、缘由如下:在在n 之后的任何节,比如之后的任何节,比如 在在 应应 该行动的参与者知道博弈到达了决策节该行动的参与者知道博弈到达了决策节n,从而即使从而即使 处于非单节的信息集,处于非单节的信息集,由于在该信息集中的全部节都由于在该信息集中的全部节都 在在n 之下,之下,在该信息集行动的参与者就知道博弈已经到在该信息集行动的参与者就知道博弈已经到 达了达了n 下面的某个决策节下面的某个决策节.和和该决策结该决策结的的后续结后续结T(x)(包括终点结包括终点结)组成,组成,定义:定义:一个扩展式博弈一个扩展式博弈的的子博弈子博弈G 由一个决策结由一个决策结x 它满足:它满足:(1)x 是一个单结
27、信息集,即是一个单结信息集,即(2)对于全部对于全部 的的 假如假如 那么那么(博弈论与信息经济学(博弈论与信息经济学163)定义定义 (塞尔滕塞尔滕 Selten,1965)假如参与者的战略在每假如参与者的战略在每 则称则称纳什均衡纳什均衡是是子博子博一个子博弈一个子博弈中都构成中都构成纳什均衡纳什均衡,弈精炼的弈精炼的.Definition(Selten 1965):A Nash equilibrium is subg-ame-perfect if the players strategies constitute a Nash eq-uilibrium in every subgame.
28、定义定义 (塞尔滕塞尔滕 Selten,1965)扩展式博弈扩展式博弈G 的战略的战略 组合组合满足满足 是原博弈是原博弈G 的纳什均衡;的纳什均衡;(1)在在G 的每个子博弈上给出纳什均衡;的每个子博弈上给出纳什均衡;(2)则称则称 是是G 的的子博弈精炼子博弈精炼纳什均衡纳什均衡.1 2 2 LR(3,1)(1,2)(2,1)(0,0)(4,4)(0,3)(5,0)(1,1)囚徒囚徒1 沉默沉默 招认招认 囚徒囚徒2 囚徒囚徒2 沉默沉默 沉默沉默 招认招认 招认招认 1 L R 2 2 3 33 图图2.4.4 图图2.4.3 图图2.4.1 两个子博弈两个子博弈 一个子博弈一个子博弈
29、没有子博弈没有子博弈 例题例题 用逆向归纳法的思路求解下述不完备信息博用逆向归纳法的思路求解下述不完备信息博弈的子博弈精炼均衡弈的子博弈精炼均衡.1 2 2 1 1 LR abcd(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)解解 设参与者设参与者1在其次个信息集上,在其次个信息集上,参与者参与者1认为参与认为参与 者选择者选择a 的概率为的概率为p,则参与者则参与者1选择选择 的的期望收益期望收益为为则参与者则参与者1选择选择 的的期望收益期望收益为为明显,明显,则参与者则参与者1选择选择 的的期望期望 收益收益大于其选择大于其选择 的的期望收益期望收益,则参与者则参与者1选择选择 给定给定 2在左边决策结上会选在左边决策结上会选 故子博弈精炼均衡为故子博弈精炼均衡为 1在其次个决策结上选择在其次个决策结上选择 考虑:为什么考虑:为什么 不是博弈精炼均衡?不是博弈精炼均衡?