您的当前位置:首页正文

贝叶斯博弈

2023-07-01 来源:好走旅游网
不完全信息的市场进入博弈

参与人:企业1,企业2

行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入

行动顺序和信息结构:自然先以概率对(p,1p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。

赢利状况:如下表

对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。这一方法是Harsanyi(1967-1968)创造的。 1 BB BD DB DD IN 2.1, -1 0.6, -0.4 2.3 0.4 2, 1 OUT 2.9, 0 2.3, 0 3.6, 0 3, 0

企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。 贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。

不完全信息动态博弈(贝叶斯博弈)

我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样 的不足。回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。如果参与者的策略要成为博弈的一个完美贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的子博弈完美纳什均衡。完美贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什均衡。

为引进完美贝叶斯均衡概念,考虑如下不完全信息动态博弈。

[例1]首先,参与者1在3个行动中进行选择——L、M及R,如果参与者1选择R,则博弈结束(不等参与者2行动);如果参与者1选择了L或M,则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M),并在或L或R两个行动中进行选择,博弈随之结束。收益情况由图10-1的扩展式博弈给出。

从图博弈的标准式表述,我们可以发现存在两个纯策略贝叶斯纳什均衡(L,L)和

(R,R)。为确定这些纳什均衡是否符合子博弈完美纳什均衡的条件,我们先明确博弈的子

博弈,图10-1里的博弈不存在子博弈。如果一个博弈没有子博弈,则子博弈完美纳什均衡条件(具体地说,即参与者的策略在每一个子博弈中均构成纳什均衡)自然就得到满足。从而在任何没有子博弈的博弈中,子博弈完美纳什均衡的定义便等同于纳什均衡的定义,于是在图10-1中,(L,L)和(R,R) 都是子博弈完美纳什均衡。然而,(R,R) 却又明显要依赖于一个不可信的威胁:如果轮到参与者2行动,则选择L要优于选择R,于是参与者1便不会由于2威胁他将在其后的行动中选择R,而去选择R。换言之,参与人1认为参与人选择R不过是个空头威胁。

上面的例子反映一个问题,在信息完全但不完美的博弈中,尽管(R,R)是子博弈纳什均衡,它依赖一个不可信的空头威胁,应该从合理的预测中排除。问题出现的原因是,参与人2不知道参与人1若不选择R,他究竟选择了L还是M ?附加的条件中,将要求参与人2对这个问题有一定的推断,并在这个推断下采取最佳的策略行动。为此要进一步强化均衡概念,以排除图6-1中像0(1)11的子博弈完美纳什均衡,对均衡附加以下两个要求。

要求1: 在每一信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪个节有一个推断。对于非单节信息集,推断是在信息集中不同节点的一个概率分布;对于单节的信息集,参与者的推断就是到达此单一决策节的概率为l。

要求2: 给定参与者的推断,参与者的策略必须满足序贯理性的要求。即在每一信息集中应该行动的参与者(以及参与者随后的策略),对于给定的该参与者在此信息集中的推

断,以及其他参与者随后的策略(其中“随后的策略”是在达到给定的信息集之后,包括了其后可能发生的每一种情况的完全的行动计划)必须是最优反应。

在图10-1中,要求l意味着如果博弈的进行达到参与者2的非单节信息集,则参与者2必须对具体到达哪一个节(也就是参与者l选择了L还是R)有一个推断。这样的推断就表示为到达两个节的概率和(1),见图6-3。

fivery2@126.com

6-3

给定参与者2的推断,选择R的期望收益就等于

E2(R')0(1)11E3(L')12(1)2E3(R')31(1)121311223212 E2(L')1(1)22E2(R')0(1)11而选择L的期望收益等于

由于对任意的,都有21,要求2就排除了2选择R的可能性,从而,在本例中简单要求每一参与者持有一个推断,并且在此推断下选择最优行动,就可以排除不合

理的BAYES—NASH均衡(R,R)。

、要求1和2只保证了参与者持有推断,并对给定的推断选择最优行动,但并没有明确这些推断是否是理性的。为进一步约束参与者的推断,我们需要区分处于均衡路径上的信息集和不处于均衡路径上的信息集。为此,首先给出如下定义。

定义6.1 对于一个给定的扩展式博弈中的均衡,如果博弈根据均衡策略进行时将以正的概率达到某信息集,我们称此信息集处于均衡路径之上。反之,如果博弈根据均衡策略进行时,肯定不会达到某信息集,我们称之为不在均衡路径上的信息集。(其中“均衡”可以是纳什、子博弈完美、贝叶斯以及完美贝叶斯均衡)

要求3: 在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与者的均衡策略给出。

例如,在图6-3的子博弈完美纳什均衡(L,L)中,参与者2的推断一定是p1:给定参与者1的均衡策略(具体地说,L),参与者2知道已经到达了信息集中的哪一个节。作为要求3的另一种说明(假定性的),设想在图6-3中存在一个混合策略均衡,其中参与者l选择L的概率为p(L),M的概率为p(M),选择R的概率为1p(L)p(M)。

p(L)p(L)p(R)E3(L')1(1)2213要求3则强制性规定参与者2的推断必须为E3(R')3(1)112。

212要求1到要求3包含了完美贝叶斯均衡的主要内容,这一均衡概念最为关键的新的特征要归功于克雷普斯和威尔逊(1982):在均衡的定义中,推断(信念)被提高到和策略同等重要的地位。正式地讲,一个均衡不再只是由每个参与者的一个策略所构成,还包括了两个参与者在该他行动的每一信息集中的一个推断。通过这种方式使参与者推断得以明确的好处在于,和前面我们强调参与者选择可信的策略一样,现在我们就可以强调参与者持有理性的推断,无论是处于均衡路径之上(要求3),还是处于均衡路径之外(后面的要求4)。

在简单的经济学应用中,包括信号博弈和空谈博弈——要求1到3不仅包括了完美贝叶斯博弈的主要思想,而且还构成了它的定义。不过,在更为复杂的经济学应用中,为剔除不合理的均衡,还需引入进一步的要求。不同的学者使用过不同的完美贝叶斯均衡定义,所有的定义都包括要求l到3,绝大多数同时包含了要求4;还有的引入了更进一步的要求。我们用要求l到4作为完美贝叶斯均衡的定义。

要求4: 对不在均衡路径上的信息集,推断由贝叶斯法则以及可能情况下的参与者的均衡策略决定。

定义10.2 满足要求1到4的策略和推断构成博弈的完美贝叶斯均衡。

对要求4再给出一个更为精确的表述,有助于我们理解 “可能情况下均衡策略”的含义。我们通过图10-4和图10-5中的三位参与者博弈来说明并理解要求4的必要性。

图6-4

此博弈有一个子博弈:它开始于参与者2的单节信息集。这一子博弈(参与者2和3之间的)唯一的纳什均衡为(L,R),于是整个博弈惟一的子博弈完美纳什均衡为(D,L,R)。这一组策略和参与者3的推断p1满足了要求1到要求3,而且也简单地满足了要求4,因为没有不在这一均衡路径上的信息集,于是构成了一个完美贝叶斯均衡。

下面考虑策略(A,L,L)以及相应的推断p0。这组策略是一个纳什均衡,没有参与者愿意单独偏离这一结果。这一组策略及推断也满足要求l到3,参与者3有一个推断并根据它选择最优行动。但是,这一纳什均衡却不是子博弈完美纳什均衡,因为博弈中仅有子博弈有唯一的纳什均衡为(L,R),这也说明要求l到3并不能保证参与者的策略是子博弈完美纳什均衡。为什么会出现这样的问题呢?问题在于参与者3的推断0与参与者2的策略L并不一致,但要求1到3并没有对3的推断进行任何限制,因为如果按给定的策略进行博弈将不会到达3的信息集。不过,要求4强制3的推断决定于参与者2的策略:如果2的策略为L,则3的推断必须为p1;如果2的策略为R,则3的推断必须为0。但

是,如果3的推断为1,则要求2又强制3的策略为R,于是策略(A,L,L)及相应推断0不能满足要求1到4。根据定义,策略(A,L,L)以及相应的推断0不能构成完美贝叶斯均衡。要求4的作用,排除了一个一个不合理的纳什均衡与推断,尽管这组策略及推断满足要求l到3。

图6-5

为进一步理解要求4,假设图图6-4稍作改变成为图6-5:现在参与者2多出了第三种可能的行动A,也可以令博弈结束(为使表示简化,这一博弈略去了收益情况)。和前例相同,如果参与者1的均衡策略为A,则参与者3的信息集就不在均衡路径上,但现在要求4却无法从2的策略中决定3的推断。如果2的策略为A,则要求4就对3的推断没有任何

1q1q2的概率选择A,限制,但如果2的策略为以q1的概率选择L,q2的概率选择R,

其中,q1q20,则要求4就限定了3的推断为pq1/(q1q2)。

现在我们讨论几种均衡概念之间的关系。在纳什均衡中,每一参与者的策略必须是其他参与者策略的一个最优反应,于是没有参与者会选择严格劣策略(下策)。在完美贝叶斯均衡中,要求1和2事实上就是要保证没有参与者的策略是始于任何一个信息集的劣策略。纳什均衡及贝叶斯纳什均衡对不在均衡路径上的信息集则没有这方面的要求,即使是子博弈完美纳什均衡对某些不在均衡路径上的信息集也没有这方面的要求,例如那些不包含在任何子博弈内的信息集。完美贝叶斯均衡弥补了了这一缺陷:参与者不可以使用起始于任何信息集的严格劣策略,即使该信息集不在均衡路径上。

此博弈完美贝叶斯均衡是(D,L, R'),1

完美贝叶斯均衡的概念=贝叶斯纳什均衡+子博弈完美+信念(Bayes 推断)构成

把上述博弈贝叶斯标准形式: U D

LL 3,0.5 0,0.5 LR 2.5,1 2,1 RL 2.5,0 2,0 RR 2,0.5 4,0.5

因篇幅问题不能全部显示,请点此查看更多更全内容