不完全信息动态博弈学习资料.ppt-淘文阁

资源描述

《不完全信息动态博弈学习资料.ppt》由会员分享，可在线阅读，更多相关《不完全信息动态博弈学习资料.ppt（18页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、不完全信息动态博弈二手车交易博弈二手车交易博弈二手车交易博弈二手车交易博弈n n1 1、二手车交易看成这样一个动态博弈、二手车交易看成这样一个动态博弈、二手车交易看成这样一个动态博弈、二手车交易看成这样一个动态博弈 n n先是自然先是自然先是自然先是自然(N)(N)决定二手车的决定二手车的决定二手车的决定二手车的类型类型类型类型：好车或差车。：好车或差车。：好车或差车。：好车或差车。n n卖主卖主卖主卖主(参与人参与人参与人参与人1)1)知道自己的类型后选择卖或不卖，若卖主选择不知道自己的类型后选择卖或不卖，若卖主选择不知道自己的类型后选择卖或不卖，若卖主选择不知道自己的类型后选择卖或不卖，

2、若卖主选择不n n卖，则博弈结束；若选择卖，则轮到顾客卖，则博弈结束；若选择卖，则轮到顾客卖，则博弈结束；若选择卖，则轮到顾客卖，则博弈结束；若选择卖，则轮到顾客(参与人参与人参与人参与人2)2)决定买还是不决定买还是不决定买还是不决定买还是不n n买。买。买。买。n n顾客在轮到决策的时点上，只能观测到卖主选择了卖的行动而不顾客在轮到决策的时点上，只能观测到卖主选择了卖的行动而不顾客在轮到决策的时点上，只能观测到卖主选择了卖的行动而不顾客在轮到决策的时点上，只能观测到卖主选择了卖的行动而不n n知道卖主的类型是好车还是差车知道卖主的类型是好车还是差车知道卖主的类型是好车还是差车知道卖主的类型

3、是好车还是差车(即顾客不知道自然的选择是好即顾客不知道自然的选择是好即顾客不知道自然的选择是好即顾客不知道自然的选择是好n n车还是差车车还是差车车还是差车车还是差车)。（这是不完美信息）。（这是不完美信息）。（这是不完美信息）。（这是不完美信息）n n这个交易里有两个决策节点就形成这个交易里有两个决策节点就形成这个交易里有两个决策节点就形成这个交易里有两个决策节点就形成一个多节点的信息集一个多节点的信息集一个多节点的信息集一个多节点的信息集（用椭（用椭（用椭（用椭圆圈出）。圆圈出）。圆圈出）。圆圈出）。n n2、多节点信息集有如下特征：、多节点信息集有如下特征：n n n n（1 1）在

4、此信息集中的每一个节点都轮到该参与人行动，）在此信息集中的每一个节点都轮到该参与人行动，）在此信息集中的每一个节点都轮到该参与人行动，）在此信息集中的每一个节点都轮到该参与人行动，n n n n（2 2）当博弈的进行达到该信息集中的某个节点时，轮到行动的）当博弈的进行达到该信息集中的某个节点时，轮到行动的）当博弈的进行达到该信息集中的某个节点时，轮到行动的）当博弈的进行达到该信息集中的某个节点时，轮到行动的n n参与人并不知道实际到达了哪一个节点，而只知道到达了其中的参与人并不知道实际到达了哪一个节点，而只知道到达了其中的参与人并不知道实际到达了哪一个节点，而只知道到达了其中的参与人并不知道实

5、际到达了哪一个节点，而只知道到达了其中的n n某个节点的概率某个节点的概率某个节点的概率某个节点的概率(先验概率或后验概率先验概率或后验概率先验概率或后验概率先验概率或后验概率)。（二）完美贝叶斯一纳什均衡n n 对动态博弈进行分析，可信性问题始终是一对动态博弈进行分析，可信性问题始终是一个中心问题，一个理想的均衡必须是排除了所有个中心问题，一个理想的均衡必须是排除了所有不可信的威胁和许诺的。不可信的威胁和许诺的。n n n n在动态博弈中，行动有先后次序，后行动者可以通过观察先行动者的行动获在动态博弈中，行动有先后次序，后行动者可以通过观察先行动者的行动获在动态博弈中，行动有先后次序，后行动

6、者可以通过观察先行动者的行动获在动态博弈中，行动有先后次序，后行动者可以通过观察先行动者的行动获n n得有关后者偏好、战略空间等方面的信息，修正自己的判断得有关后者偏好、战略空间等方面的信息，修正自己的判断得有关后者偏好、战略空间等方面的信息，修正自己的判断得有关后者偏好、战略空间等方面的信息，修正自己的判断。n n对应于不完全信息动态博弈的均衡概念是对应于不完全信息动态博弈的均衡概念是对应于不完全信息动态博弈的均衡概念是对应于不完全信息动态博弈的均衡概念是“精炼贝叶斯均衡精炼贝叶斯均衡精炼贝叶斯均衡精炼贝叶斯均衡”。这个概念是。这个概念是。这个概念是。这个概念是完完完完n n全信息动态博弈

7、的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。n n在完全信息动态博弈中，鉴于纳什均衡本身无法排除不可信的威胁和许诺，在完全信息动态博弈中，鉴于纳什均衡本身无法排除不可信的威胁和许诺，在完全信息动态博弈中，鉴于纳什均衡本身无法排除不可信的威胁和许诺，在完全信息动态博弈中，鉴于纳什均衡本身无法排除不可信的威胁和许诺，n n我们加上了子博弈完美这一要求我们加上了子博弈完美这一要求我们加上了

8、子博弈完美这一要求我们加上了子博弈完美这一要求(即要求策略组合在每一个子博弈中都能构成即要求策略组合在每一个子博弈中都能构成即要求策略组合在每一个子博弈中都能构成即要求策略组合在每一个子博弈中都能构成n n纳什均衡纳什均衡纳什均衡纳什均衡)，并称这样的纳什均衡为子博弈完美纳什均衡，并称这样的纳什均衡为子博弈完美纳什均衡，并称这样的纳什均衡为子博弈完美纳什均衡，并称这样的纳什均衡为子博弈完美纳什均衡.n n对于不完全信息动态博弈，由于贝叶斯纳什均衡同样未能排除不可信的威胁对于不完全信息动态博弈，由于贝叶斯纳什均衡同样未能排除不可信的威胁对于不完全信息动态博弈，由于贝叶斯纳什均衡同样未能排除不可信

9、的威胁对于不完全信息动态博弈，由于贝叶斯纳什均衡同样未能排除不可信的威胁n n和许诺，我们需要对贝叶斯纳什均衡进一步强化（即加强对条件的要求），和许诺，我们需要对贝叶斯纳什均衡进一步强化（即加强对条件的要求），和许诺，我们需要对贝叶斯纳什均衡进一步强化（即加强对条件的要求），和许诺，我们需要对贝叶斯纳什均衡进一步强化（即加强对条件的要求），n n并把强化后的贝叶斯纳什均衡称为精练并把强化后的贝叶斯纳什均衡称为精练并把强化后的贝叶斯纳什均衡称为精练并把强化后的贝叶斯纳什均衡称为精练(完美完美完美完美)贝叶斯纳什均衡，简称为精练贝叶斯纳什均衡，简称为精练贝叶斯纳什均衡，简称为精练贝叶斯纳什均衡，简

10、称为精练n n(完美完美完美完美)贝叶斯均衡。贝叶斯均衡。贝叶斯均衡。贝叶斯均衡。n n精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为n n来修正自己有关后者类型的来修正自己有关后者类型的来修正自己有关后者类型的来修正自己有关后者类型的“信念信念信念信念”(主观概率主观概率主观概率主观概率)并由此选择自并由此选择自并由此选择自并由此选择自己的行动。己的行动。己的行动。己的行动。n n精炼贝叶斯均衡是所有参与人战略和信念

11、的一种结合，它满足如下条件：精炼贝叶斯均衡是所有参与人战略和信念的一种结合，它满足如下条件：精炼贝叶斯均衡是所有参与人战略和信念的一种结合，它满足如下条件：精炼贝叶斯均衡是所有参与人战略和信念的一种结合，它满足如下条件：n n(1)(1)给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的；给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的；给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的；给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的；n n(2)(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得每个人有关他人类型的信念都是使用

12、贝叶斯法则从所观察到的行为中获得每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得n n的。的。的。的。n n因此，用更为广义的后续博弈的概念来代替子博因此，用更为广义的后续博弈的概念来代替子博n n弈的概念。前面我们已经定义过的子博弈必须开弈的概念。前面我们已经定义过的子博弈必须开n n始于单节点信息集，并且不能分割信息集，与之始于单节点信息集，并且不能分割信息集，与之n n不同的是不同的是“后续博弈后续博弈”是指从任何信息集（不论是指从任何信息集（不论是是n n单节点的还是包含多节点的）开始的动态博弈的单节点的还

13、是包含多节点的）开始的动态博弈的n n后续部分。后续部分。精练贝叶斯纳什均衡的理解n n在不完全信息动态博弈中，在不完全信息动态博弈中，在不完全信息动态博弈中，在不完全信息动态博弈中，“自然自然自然自然”首先选择参与人的类型首先选择参与人的类型首先选择参与人的类型首先选择参与人的类型，参与人，参与人，参与人，参与人自自自自n n己知道，其他参与人不知道；己知道，其他参与人不知道；己知道，其他参与人不知道；己知道，其他参与人不知道；n n在在在在“自然自然自然自然”选择之后，参与人开始行动，参与人的行动有先有后，后选择之后，参与人开始行动，参与人的行动有先有后，后选择之后，参与人开始行动，参与

14、人的行动有先有后，后选择之后，参与人开始行动，参与人的行动有先有后，后行行行行n n动者能观测到先行动者的行动，但不能观测到先行动者的类型。动者能观测到先行动者的行动，但不能观测到先行动者的类型。动者能观测到先行动者的行动，但不能观测到先行动者的类型。动者能观测到先行动者的行动，但不能观测到先行动者的类型。n n因为参与人的行动是类型依存的，每个参与人的行动都传递着自己类因为参与人的行动是类型依存的，每个参与人的行动都传递着自己类因为参与人的行动是类型依存的，每个参与人的行动都传递着自己类因为参与人的行动是类型依存的，每个参与人的行动都传递着自己类n n型的某种信息，后行动者可以通过观察先行动

15、者所选择的行动来推断其类型的某种信息，后行动者可以通过观察先行动者所选择的行动来推断其类型的某种信息，后行动者可以通过观察先行动者所选择的行动来推断其类型的某种信息，后行动者可以通过观察先行动者所选择的行动来推断其类n n型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。n n先行动者理性预测到自己的行动将被后行动者所利用，就会设法选择先行动者理性预测到自己的行动将被后行动者所利用，就会设法

16、选择先行动者理性预测到自己的行动将被后行动者所利用，就会设法选择先行动者理性预测到自己的行动将被后行动者所利用，就会设法选择n n传递对自己有利的信息，避免传递对自己不利的信息。传递对自己有利的信息，避免传递对自己不利的信息。传递对自己有利的信息，避免传递对自己不利的信息。传递对自己有利的信息，避免传递对自己不利的信息。n n因此，该博弈过程的实质不仅是参与人选择行动的过程，而且是参与因此，该博弈过程的实质不仅是参与人选择行动的过程，而且是参与因此，该博弈过程的实质不仅是参与人选择行动的过程，而且是参与因此，该博弈过程的实质不仅是参与人选择行动的过程，而且是参与n n人不断修正信念的过程。精练

17、贝叶斯纳什均衡是完全信息动态子博弈精练人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练n n纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。不完全信息动态博弈的精炼贝叶斯均衡不完全信息动态博弈的精炼贝叶斯均衡应用及分析应用及分析你与张三不完全信息动态博弈你与张三不完全信息动态博弈你与张三不完全信息动态博

18、弈你与张三不完全信息动态博弈黔驴之技不完全信息动态博弈黔驴之技不完全信息动态博弈黔驴之技不完全信息动态博弈黔驴之技不完全信息动态博弈市场进入不完全信息动态博弈市场进入不完全信息动态博弈市场进入不完全信息动态博弈市场进入不完全信息动态博弈二信号博弈n n1 1、什么是信号博弈、什么是信号博弈、什么是信号博弈、什么是信号博弈n n 信号博弈是一类比较简单但有着广泛应用的不完全信息动态信号博弈是一类比较简单但有着广泛应用的不完全信息动态信号博弈是一类比较简单但有着广泛应用的不完全信息动态信号博弈是一类比较简单但有着广泛应用的不完全信息动态n n博弈。在这种博弈中，有两个参与人，双方各自都只行动一次

19、，博弈。在这种博弈中，有两个参与人，双方各自都只行动一次，博弈。在这种博弈中，有两个参与人，双方各自都只行动一次，博弈。在这种博弈中，有两个参与人，双方各自都只行动一次，n n后行动的参与人具有不完全信息，但他能够从先行动的参与人所后行动的参与人具有不完全信息，但他能够从先行动的参与人所后行动的参与人具有不完全信息，但他能够从先行动的参与人所后行动的参与人具有不完全信息，但他能够从先行动的参与人所n n采取的行动中获得部分信息，因此，先行动的参与人的行动对后采取的行动中获得部分信息，因此，先行动的参与人的行动对后采取的行动中获得部分信息，因此，先行动的参与人的行动对后采取的行动中获得部分信息，

20、因此，先行动的参与人的行动对后n n行动的参与入来讲就好像是某种反应其支付函数的信号，因此，行动的参与入来讲就好像是某种反应其支付函数的信号，因此，行动的参与入来讲就好像是某种反应其支付函数的信号，因此，行动的参与入来讲就好像是某种反应其支付函数的信号，因此，n n这种博弈被称为这种博弈被称为这种博弈被称为这种博弈被称为“信号博弈信号博弈信号博弈信号博弈”，n n 其中，先行动的参与人就被称为信号发送者，后行动的参与其中，先行动的参与人就被称为信号发送者，后行动的参与其中，先行动的参与人就被称为信号发送者，后行动的参与其中，先行动的参与人就被称为信号发送者，后行动的参与n n人被称为信号接收者

21、。人被称为信号接收者。人被称为信号接收者。人被称为信号接收者。n n信号博弈可以划分为三类；混同策略、半分离策略和分离策略。信号博弈可以划分为三类；混同策略、半分离策略和分离策略。信号博弈可以划分为三类；混同策略、半分离策略和分离策略。信号博弈可以划分为三类；混同策略、半分离策略和分离策略。n n各自的意义如下：各自的意义如下：各自的意义如下：各自的意义如下：n n（1 1）混同策略）混同策略）混同策略）混同策略n n混同策略这类策略中，信号发送者在不同类型下部发出相同的信混同策略这类策略中，信号发送者在不同类型下部发出相同的信混同策略这类策略中，信号发送者在不同类型下部发出相同的信混同策略这

22、类策略中，信号发送者在不同类型下部发出相同的信n n号。因而，信号接收者无法从观测到的信号中得到新的信息，也号。因而，信号接收者无法从观测到的信号中得到新的信息，也号。因而，信号接收者无法从观测到的信号中得到新的信息，也号。因而，信号接收者无法从观测到的信号中得到新的信息，也n n就无法对先验概率进行修正。就无法对先验概率进行修正。就无法对先验概率进行修正。就无法对先验概率进行修正。n n（2 2）半分离策略）半分离策略）半分离策略）半分离策略n n指信号发送者对某些类型选择特定的信号，而对另指信号发送者对某些类型选择特定的信号，而对另指信号发送者对某些类型选择特定的信号，而对另指信号发送者对

23、某些类型选择特定的信号，而对另些类型则随些类型则随些类型则随些类型则随n n机地选择信号。这时，信号接收者观测到某些信号能够准确地判机地选择信号。这时，信号接收者观测到某些信号能够准确地判机地选择信号。这时，信号接收者观测到某些信号能够准确地判机地选择信号。这时，信号接收者观测到某些信号能够准确地判n n断出发送者的类型，而观测到另外某些信号时尽管不能完全判断断出发送者的类型，而观测到另外某些信号时尽管不能完全判断断出发送者的类型，而观测到另外某些信号时尽管不能完全判断断出发送者的类型，而观测到另外某些信号时尽管不能完全判断n n出发送者的类型，但是能够据以修正自己的先验概率。出发送者的类型，

24、但是能够据以修正自己的先验概率。出发送者的类型，但是能够据以修正自己的先验概率。出发送者的类型，但是能够据以修正自己的先验概率。n n（3 3）分离策略）分离策略）分离策略）分离策略n n指信号发送者针对不同的类型完全选择不同的信号。这类策略指信号发送者针对不同的类型完全选择不同的信号。这类策略指信号发送者针对不同的类型完全选择不同的信号。这类策略指信号发送者针对不同的类型完全选择不同的信号。这类策略n n中，信号准确地表现类型，接收者可以通过所观测到的信号准确中，信号准确地表现类型，接收者可以通过所观测到的信号准确中，信号准确地表现类型，接收者可以通过所观测到的信号准确中，信号准确地表现类型

25、，接收者可以通过所观测到的信号准确地判断出发送者的类型。地判断出发送者的类型。地判断出发送者的类型。地判断出发送者的类型。三序贯均衡n n1 1、序贯均衡的概念是由克瑞普斯和威尔逊、序贯均衡的概念是由克瑞普斯和威尔逊、序贯均衡的概念是由克瑞普斯和威尔逊、序贯均衡的概念是由克瑞普斯和威尔逊(1982)(1982)首先提出的。它的原理与完首先提出的。它的原理与完首先提出的。它的原理与完首先提出的。它的原理与完n n美贝叶斯一纳什均衡相似，也应用于动态贝叶斯博弈，但更着重强调非均衡美贝叶斯一纳什均衡相似，也应用于动态贝叶斯博弈，但更着重强调非均衡美贝叶斯一纳什均衡相似，也应用于动态贝叶斯博弈，但更

26、着重强调非均衡美贝叶斯一纳什均衡相似，也应用于动态贝叶斯博弈，但更着重强调非均衡n n路径上后验概率的形成，对局中人随着博弈的进行修正自己信念的方式作了路径上后验概率的形成，对局中人随着博弈的进行修正自己信念的方式作了路径上后验概率的形成，对局中人随着博弈的进行修正自己信念的方式作了路径上后验概率的形成，对局中人随着博弈的进行修正自己信念的方式作了n n更加严格的要求，认为局中人的行动必须由对行动历史的信念合理化决定。更加严格的要求，认为局中人的行动必须由对行动历史的信念合理化决定。更加严格的要求，认为局中人的行动必须由对行动历史的信念合理化决定。更加严格的要求，认为局中人的行动必须由对行动历

27、史的信念合理化决定。n n2 2、序贯均衡对非均衡路径上后验概率的处理是：首先假定在每个信息集上，、序贯均衡对非均衡路径上后验概率的处理是：首先假定在每个信息集上，、序贯均衡对非均衡路径上后验概率的处理是：首先假定在每个信息集上，、序贯均衡对非均衡路径上后验概率的处理是：首先假定在每个信息集上，n n局中人选择严格混合策略局中人选择严格混合策略局中人选择严格混合策略局中人选择严格混合策略(即以严格正的概率选择每一个行动即以严格正的概率选择每一个行动即以严格正的概率选择每一个行动即以严格正的概率选择每一个行动)，从而博弈到达，从而博弈到达，从而博弈到达，从而博弈到达n n每一个信息集的概率严格为

28、正，这样贝叶斯公式在每一个信息集上都可以适每一个信息集的概率严格为正，这样贝叶斯公式在每一个信息集上都可以适每一个信息集的概率严格为正，这样贝叶斯公式在每一个信息集上都可以适每一个信息集的概率严格为正，这样贝叶斯公式在每一个信息集上都可以适n n用而不会出现后验概率任意取位的情况；然后，将均衡作为这种严格混合策用而不会出现后验概率任意取位的情况；然后，将均衡作为这种严格混合策用而不会出现后验概率任意取位的情况；然后，将均衡作为这种严格混合策用而不会出现后验概率任意取位的情况；然后，将均衡作为这种严格混合策n n略和相应后验概率的序列的极限，而能够成为这种极限的均衡就是序均衡。略和相应后验概率的

29、序列的极限，而能够成为这种极限的均衡就是序均衡。略和相应后验概率的序列的极限，而能够成为这种极限的均衡就是序均衡。略和相应后验概率的序列的极限，而能够成为这种极限的均衡就是序均衡。四颤抖手均衡n n1 1、其基本思想是：在任何一个博弈中，每一个局中人均、其基本思想是：在任何一个博弈中，每一个局中人均、其基本思想是：在任何一个博弈中，每一个局中人均、其基本思想是：在任何一个博弈中，每一个局中人均n n有可能犯错误，如同一个人抓东西时因手的颤抖使其发生有可能犯错误，如同一个人抓东西时因手的颤抖使其发生有可能犯错误，如同一个人抓东西时因手的颤抖使其发生有可能犯错误，如同一个人抓东西时因手的颤抖使其

30、发生n n偏差而抓不住一样偏差而抓不住一样偏差而抓不住一样偏差而抓不住一样(这种均衡概念的名称即来源于此这种均衡概念的名称即来源于此这种均衡概念的名称即来源于此这种均衡概念的名称即来源于此)，这，这，这，这n n样局中人在选择策略时就需要考虑到其他局中人犯错误的样局中人在选择策略时就需要考虑到其他局中人犯错误的样局中人在选择策略时就需要考虑到其他局中人犯错误的样局中人在选择策略时就需要考虑到其他局中人犯错误的n n可能性，这样的均衡比纳什均衡概念更为合理。可能性，这样的均衡比纳什均衡概念更为合理。可能性，这样的均衡比纳什均衡概念更为合理。可能性，这样的均衡比纳什均衡概念更为合理。n n2 2、

31、泽尔滕将非均衡事件的发生解释为局中人策略选择时的、泽尔滕将非均衡事件的发生解释为局中人策略选择时的、泽尔滕将非均衡事件的发生解释为局中人策略选择时的、泽尔滕将非均衡事件的发生解释为局中人策略选择时的“颤颤颤颤n n抖抖抖抖”，当局中人发现博弈偏离均衡时，他将这一事件归结为某一，当局中人发现博弈偏离均衡时，他将这一事件归结为某一，当局中人发现博弈偏离均衡时，他将这一事件归结为某一，当局中人发现博弈偏离均衡时，他将这一事件归结为某一n n个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针

32、个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针n n对这些颤抖作出最佳反应，从而构成了纳什均衡。当颤抖的幅度对这些颤抖作出最佳反应，从而构成了纳什均衡。当颤抖的幅度对这些颤抖作出最佳反应，从而构成了纳什均衡。当颤抖的幅度对这些颤抖作出最佳反应，从而构成了纳什均衡。当颤抖的幅度n n缩小时，被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖缩小时，被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖缩小时，被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖缩小时，被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖n n手均衡要求均衡策略不仅是对对手策略的最佳反应，而且是当对手均衡要求均衡策略不仅是

33、对对手策略的最佳反应，而且是当对手均衡要求均衡策略不仅是对对手策略的最佳反应，而且是当对手均衡要求均衡策略不仅是对对手策略的最佳反应，而且是当对n n手策略发生微小手策略发生微小手策略发生微小手策略发生微小(或无限小或无限小或无限小或无限小)颤抖时的最佳反应；颤抖时的最佳反应；颤抖时的最佳反应；颤抖时的最佳反应；n n3 3、缺陷：这样定义的颤抖手均衡仍然有缺陷，将它应用到动态、缺陷：这样定义的颤抖手均衡仍然有缺陷，将它应用到动态、缺陷：这样定义的颤抖手均衡仍然有缺陷，将它应用到动态、缺陷：这样定义的颤抖手均衡仍然有缺陷，将它应用到动态n n博弈对应的策略型描述时，就会出现颤抖手均衡不是子博弈

34、完美博弈对应的策略型描述时，就会出现颤抖手均衡不是子博弈完美博弈对应的策略型描述时，就会出现颤抖手均衡不是子博弈完美博弈对应的策略型描述时，就会出现颤抖手均衡不是子博弈完美n n均衡的情况。这是由于动态博弈的策略型描述中，同一局中人在均衡的情况。这是由于动态博弈的策略型描述中，同一局中人在均衡的情况。这是由于动态博弈的策略型描述中，同一局中人在均衡的情况。这是由于动态博弈的策略型描述中，同一局中人在n n动态博弈不同阶段的错误动态博弈不同阶段的错误动态博弈不同阶段的错误动态博弈不同阶段的错误(颤抖颤抖颤抖颤抖)具有相关性，从而不能剔除子博具有相关性，从而不能剔除子博具有相关性，从而不能剔除子博

35、具有相关性，从而不能剔除子博n n奔完美均衡概念所揭示的不合理的均衡。奔完美均衡概念所揭示的不合理的均衡。奔完美均衡概念所揭示的不合理的均衡。奔完美均衡概念所揭示的不合理的均衡。n n 于是，在经济学上，为了排除局中人犯错误时的动态相关于是，在经济学上，为了排除局中人犯错误时的动态相关于是，在经济学上，为了排除局中人犯错误时的动态相关于是，在经济学上，为了排除局中人犯错误时的动态相关n n性，泽尔滕引人了性，泽尔滕引人了性，泽尔滕引人了性，泽尔滕引人了“代理人一策略型表述代理人一策略型表述代理人一策略型表述代理人一策略型表述”，也就是将原来的局，也就是将原来的局，也就是将原来的局，也就是将原来

36、的局中中中中n n人作为委托人、他在不同信息集上雇佣了不同的代理人，授权后人作为委托人、他在不同信息集上雇佣了不同的代理人，授权后人作为委托人、他在不同信息集上雇佣了不同的代理人，授权后人作为委托人、他在不同信息集上雇佣了不同的代理人，授权后n n者进行决策：代理人的支付函数与委托人相同，按委托人的利益者进行决策：代理人的支付函数与委托人相同，按委托人的利益者进行决策：代理人的支付函数与委托人相同，按委托人的利益者进行决策：代理人的支付函数与委托人相同，按委托人的利益n n行动，但是各代理人间彼此独立行动，这样犯错误的可能性就是行动，但是各代理人间彼此独立行动，这样犯错误的可能性就是行动，但是

37、各代理人间彼此独立行动，这样犯错误的可能性就是行动，但是各代理人间彼此独立行动，这样犯错误的可能性就是n n独立的，从们消除了颤抖的动态相关性。通过这种方法就改进了独立的，从们消除了颤抖的动态相关性。通过这种方法就改进了独立的，从们消除了颤抖的动态相关性。通过这种方法就改进了独立的，从们消除了颤抖的动态相关性。通过这种方法就改进了n n颤抖手均衡的概念，与子博弈完美均衡不再矛盾。颤抖手均衡的概念，与子博弈完美均衡不再矛盾。颤抖手均衡的概念，与子博弈完美均衡不再矛盾。颤抖手均衡的概念，与子博弈完美均衡不再矛盾。n n 4、颤抖手均衡与序贯均衡的关系是：颤抖手均衡一定是序贯均衡，而序贯均衡却不一定是颤抖手均衡。此课件下载可自行编辑修改，仅供参考！此课件下载可自行编辑修改，仅供参考！感谢您的支持，我们努力做得更好！谢谢感谢您的支持，我们努力做得更好！谢谢

展开阅读全文