ゲーム理論入門/(6)じゃんけんのナッシュ均衡

じゃんけんのナッシュ均衡

2回目のエントリの利得表を再掲)

    プレイヤ
ー2
(=混合 戦略 )
    確率p 確率q 確率r   純粋戦略での
    G T P   プレイヤー1利得
プレイヤー1 G    0    1   −1        q-r
  T   −1    0    1        -p+r
  P    1   −1    0        p-q
<純粋戦略でのナッシュ均衡

このゲームのナッシュ均衡は純粋戦略では存在しない。
(相手=Gならば最適反応戦略=P、相手=Pならば最適反応戦略=T、相手=Tならば最適反応戦略=G)

<混合戦略でのナッシュ均衡

プレイヤー1の混合戦略を(p’, q’, r’)、プレイヤー2の混合戦略を(p, q, r)とすると、
プレイヤー1の利得は(r’=1-p’-q’、r=1-p-qを考慮して)
p’(q-r) + q’(-p+r) + r’(p-q)
= p’(2q+p-1) + q’(-2p-q+1) + (1-p’-q’)(p-q)
= p’(3q-1) + q’(1-3p) + (p-q)


この式より、場合分けでプレイヤー1の最適反応戦略を考えてみると

[ q>1/3 のケース ]*1

  • q>1/3、p≧1/3 ならば p’=1, q’=r’=0 *2
  • q>1/3、p<1/3 ならば: *3
    • q>2/3-p i.e. r<1/3 ならば p’=1, q’=r’=0
    • q<2/3-p i.e. r>1/3 ならば q’=1, p’=r’=0
    • q=2/3-p i.e. r=1/3 ならば r’=0, p’,q’は不定 *4

[ q<1/3 のケース ]

  • q<1/3、p<1/3 ならば q’=1, p’=r’=0 *5
  • q<1/3、p>1/3 ならば r’=1, p’=q’=0 *6
  • q<1/3、p=1/3 ならば p’=0, q’,r’は不定 *7

[ q=1/3 のケース ]

  • q=1/3、p<1/3 ならば q’=1, p’=r’=0 *8
  • q=1/3、p>1/3 ならば q’=0, p’,r’は不定 *9
  • q=1/3、p=1/3 ならば p’,q’,r’は不定 *10

となる。


まとめると
[プレイヤー1の最適反応戦略]

        q>1/3 q<1/3 q=1/3
p>1/3       G   P  G,P
p<1/3 r<1/3   G   -   -
    r>1/3   T   T   T
    r=1/3  G,T   -   -
p=1/3       G  T,P  G,T,P


プレイヤー2についても同様。


上記の最適反応戦略の組み合わせで、(p’, q’, r’)と(p, q, r)を入れ替えて成立するのは
(1/3, 1/3, 1/3)の混合戦略のみ。よってそれがナッシュ均衡となる。

*1:この場合、プレイヤー2がチョキを出す確率qが1/3より高いので、プレイヤー1がパーを出す戦略は最適反応戦略とはなり得ない。

*2:この場合、上式のp'の係数=3q-1>0、q'の係数=1-3p≦0なので、Gを選ぶことになる。別の表現をすれば、プレイヤー2がパーを出す確率が、グー、チョキを出す確率より低いので、プレイヤー1はグーを出すのが最適反応戦略になる(グーもしくはチョキが相手ならば、グーは悪くてもあいこ)。

*3:この場合、上式のp'の係数=3q-1 と q'の係数=1-3p は共に正なので、その大小関係 i.e. qと2/3-pの大小関係 i.e. 1/3 と 1-p-q = r の大小関係 でGとTのどちらが利得が高いか決まる。つまり、プレイヤー2がチョキを出す確率が高いので、プレイヤー1としてはグーで勝ちに行きたいが、パーに食われる可能性も考慮すると、チョキという選択肢も考慮せざるを得なくなる。そのため、どちらを選ぶかは、相手がパーを出す確率如何、ということになる。

*4:この場合、プレイヤー1にとってグーもチョキも同値。

*5:この場合、上式のp'の係数=3q-1<0、q'の係数=1-3p>0なので、Tを選ぶことになる。つまり、プレイヤー2がパーを出す確率が、グー、チョキを出す確率より高いので、プレイヤー1はチョキを出すのが最適反応戦略になる。

*6:この場合、上式のp'の係数=3q-1<0、q'の係数=1-3p<0なので、p'もq'も0とする i.e. r’=1とする i.e. Pを選ぶことになる。つまり、プレイヤー2がグーを出す確率が、チョキを出す確率より高いので、プレイヤー1はパーを出すのが最適反応戦略になる(その場合、プレイヤー2がパーを出してもあいこになるので、その[プレイヤー2がパーを出す]確率は影響しない)。

*7:この場合、上式のp'の係数=3q-1<0、q'の係数=1-3p=0なので、p'を0とする i.e. G以外(=TかP)を選ぶことになる。つまり、プレイヤー2がパーを出す確率が高いので(∵q<1/3、p=1/3 ならば r>1/3)、プレイヤー1としてはチョキで勝ちに行きたいが、グーに食われる可能性も考慮すると、パーという選択肢も考慮せざるを得なくなる。そのため、どちらを選ぶかは、相手がグーを出す確率如何、ということになるが、その確率が1/3ならばプレイヤー1にとってチョキもパーも同値。

*8:この場合、上式のp'の係数=3q-1=0、q'の係数=1-3p>0なので、Tを選ぶことになる。つまり、プレイヤー2がパーを出す確率が、グー、チョキを出す確率より高いので、プレイヤー1はチョキを出すのが最適反応戦略になる。

*9:この場合、上式のp'の係数=3q-1=0、q'の係数=1-3p<0なので、GかPを選ぶことになるが、q=1/3とすると両選択肢は同値になる。つまり、プレイヤー2がグーを出す確率が高いので、プレイヤー1としてはパーで勝ちに行きたいが、チョキに食われる可能性も考慮すると、グーという選択肢も考慮せざるを得なくなる。そのため、どちらを選ぶかは、相手がチョキを出す確率如何、ということになるが、その確率が1/3ならばプレイヤー1にとってグーもパーも同値。

*10:この場合、上式のp'の係数=3q-1=0、q'の係数=1-3p=0なので、プレイヤー1の利得はプレイヤー1の戦略に無関係となる。