じゃんけんのナッシュ均衡
(2回目のエントリの利得表を再掲)
プレイヤ ー2 |
(=混合 | 戦略 ) | ||||
---|---|---|---|---|---|---|
確率p | 確率q | 確率r | 純粋戦略での | |||
G | T | P | プレイヤー1利得 | |||
プレイヤー1 | G | 0 | 1 | −1 | q-r | |
T | −1 | 0 | 1 | -p+r | ||
P | 1 | −1 | 0 | p-q |
<混合戦略でのナッシュ均衡>
プレイヤー1の混合戦略を(p’, q’, r’)、プレイヤー2の混合戦略を(p, q, r)とすると、
プレイヤー1の利得は(r’=1-p’-q’、r=1-p-qを考慮して)
p’(q-r) + q’(-p+r) + r’(p-q)
= p’(2q+p-1) + q’(-2p-q+1) + (1-p’-q’)(p-q)
= p’(3q-1) + q’(1-3p) + (p-q)
この式より、場合分けでプレイヤー1の最適反応戦略を考えてみると
[ q>1/3 のケース ]*1
- q>1/3、p≧1/3 ならば p’=1, q’=r’=0 *2
- q>1/3、p<1/3 ならば: *3
[ q<1/3 のケース ]
- q<1/3、p<1/3 ならば q’=1, p’=r’=0 *5
- q<1/3、p>1/3 ならば r’=1, p’=q’=0 *6
[ q=1/3 のケース ]
- q=1/3、p<1/3 ならば q’=1, p’=r’=0 *8
となる。
まとめると
[プレイヤー1の最適反応戦略]
q>1/3 | q<1/3 | q=1/3 | ||
---|---|---|---|---|
p>1/3 | G | P | G,P | |
p<1/3 | r<1/3 | G | - | - |
r>1/3 | T | T | T | |
r=1/3 | G,T | - | - | |
p=1/3 | G | T,P | G,T,P |
プレイヤー2についても同様。
上記の最適反応戦略の組み合わせで、(p’, q’, r’)と(p, q, r)を入れ替えて成立するのは
(1/3, 1/3, 1/3)の混合戦略のみ。よってそれがナッシュ均衡となる。
*1:この場合、プレイヤー2がチョキを出す確率qが1/3より高いので、プレイヤー1がパーを出す戦略は最適反応戦略とはなり得ない。
*2:この場合、上式のp'の係数=3q-1>0、q'の係数=1-3p≦0なので、Gを選ぶことになる。別の表現をすれば、プレイヤー2がパーを出す確率が、グー、チョキを出す確率より低いので、プレイヤー1はグーを出すのが最適反応戦略になる(グーもしくはチョキが相手ならば、グーは悪くてもあいこ)。
*3:この場合、上式のp'の係数=3q-1 と q'の係数=1-3p は共に正なので、その大小関係 i.e. qと2/3-pの大小関係 i.e. 1/3 と 1-p-q = r の大小関係 でGとTのどちらが利得が高いか決まる。つまり、プレイヤー2がチョキを出す確率が高いので、プレイヤー1としてはグーで勝ちに行きたいが、パーに食われる可能性も考慮すると、チョキという選択肢も考慮せざるを得なくなる。そのため、どちらを選ぶかは、相手がパーを出す確率如何、ということになる。
*4:この場合、プレイヤー1にとってグーもチョキも同値。
*5:この場合、上式のp'の係数=3q-1<0、q'の係数=1-3p>0なので、Tを選ぶことになる。つまり、プレイヤー2がパーを出す確率が、グー、チョキを出す確率より高いので、プレイヤー1はチョキを出すのが最適反応戦略になる。
*6:この場合、上式のp'の係数=3q-1<0、q'の係数=1-3p<0なので、p'もq'も0とする i.e. r’=1とする i.e. Pを選ぶことになる。つまり、プレイヤー2がグーを出す確率が、チョキを出す確率より高いので、プレイヤー1はパーを出すのが最適反応戦略になる(その場合、プレイヤー2がパーを出してもあいこになるので、その[プレイヤー2がパーを出す]確率は影響しない)。
*7:この場合、上式のp'の係数=3q-1<0、q'の係数=1-3p=0なので、p'を0とする i.e. G以外(=TかP)を選ぶことになる。つまり、プレイヤー2がパーを出す確率が高いので(∵q<1/3、p=1/3 ならば r>1/3)、プレイヤー1としてはチョキで勝ちに行きたいが、グーに食われる可能性も考慮すると、パーという選択肢も考慮せざるを得なくなる。そのため、どちらを選ぶかは、相手がグーを出す確率如何、ということになるが、その確率が1/3ならばプレイヤー1にとってチョキもパーも同値。
*8:この場合、上式のp'の係数=3q-1=0、q'の係数=1-3p>0なので、Tを選ぶことになる。つまり、プレイヤー2がパーを出す確率が、グー、チョキを出す確率より高いので、プレイヤー1はチョキを出すのが最適反応戦略になる。
*9:この場合、上式のp'の係数=3q-1=0、q'の係数=1-3p<0なので、GかPを選ぶことになるが、q=1/3とすると両選択肢は同値になる。つまり、プレイヤー2がグーを出す確率が高いので、プレイヤー1としてはパーで勝ちに行きたいが、チョキに食われる可能性も考慮すると、グーという選択肢も考慮せざるを得なくなる。そのため、どちらを選ぶかは、相手がチョキを出す確率如何、ということになるが、その確率が1/3ならばプレイヤー1にとってグーもパーも同値。
*10:この場合、上式のp'の係数=3q-1=0、q'の係数=1-3p=0なので、プレイヤー1の利得はプレイヤー1の戦略に無関係となる。