という3年前に放映を終了した英国のバラエティ番組(Wikipedia)が、最近ブロゴスフィアの一角で注目を集めた。きっかけは、CheaptalkブログのJeff Elyが、その番組のある回のYouTube映像を取り上げたことにある。
その映像では、2人のプレイヤーが囚人のジレンマのような以下の状況に置かれている(Elyエントリを受けたDigitopolyブログでのJoshua Gansの解説エントリより)。
プレイヤー2 | |||
---|---|---|---|
Steal | Split | ||
プレイヤー1 | Steal | 0,0 | 13600, 0 |
Split | 0,13600 | 6800,6800 |
即ち、賞金13600ポンドを巡って、「Steal」か「Split」かのいずれかの意思表示を迫られる(=中を開けると各選択肢が書かれている金色のボール2つが両者に配られるので、どちらかを選んで司会者に渡す)。両者が共に「Steal」を選択した場合、賞金は誰にも渡されない。両者が共に「Split」を選択した場合は、賞金は半分に分割され、各々が6800ポンドを得る。もし、片方が「Split」、もう片方が「Steal」を選択した場合は、「Steal」を選択した方が賞金の全額を勝ち取る。
この状況と囚人のジレンマの大きな違いは、WikipediaやGansエントリで説明されているように、囚人のジレンマでは自白が強支配戦略であり、ナッシュ均衡が一つだったのに対し(cf. ここ、ここ)、このゲームでは「Steal」が弱支配戦略であり、ナッシュ均衡は三つ(=(Split,Split)以外)存在する点にある。
ところが、今回Elyが紹介した映像では、プレイヤー2が、自分は「Steal」を選択すると事前に宣言する、という挙に打って出ている。その上で、プレイヤー1が「Split」を選択すれば、自分が得た賞金の半額を番組終了後にプレイヤー1に渡す、という提案を行っている。
Gansによれば、その結果、利得表は以下のように変化したという。
プレイヤー2 | |||
---|---|---|---|
Steal | Split | ||
プレイヤー1 | Steal | 0,0 | 13600, 0 |
Split | 6800, 6800 - c | 6800,6800 |
ここでcは、このようにゲームを変更したためにプレイヤー2に課されることになるのではないかと想定される取引コストである。
この時、c=0でない限り、(Split,Steal)はもはやナッシュ均衡ではなくなる(プレイヤー1がSplitを選択することを所与とすると、プレイヤー2はStealを選択した方がcだけ受取額を増やせるため)。実際、蓋を開けてみると、プレイヤー1はプレイヤー2の提案に従ってSplitを選択したが、プレイヤー2も実はSplitを選択していた。しかし、その結果得られた(Split,Split)という解も、もとよりナッシュ均衡ではない。従って、今回プレイヤー2が行ったことも、このゲームに持続可能な解を与えるものではない、というのがGansの解説である。
なお、このGansのエントリのコメント欄ではGreg Taylorというコメンターが、(Split,Steal)セルのペイオフを(6800-x,6800-c+x)のようにすれば(ただしc<x<6800)、プレイヤー2の均衡の問題は解決するのではないか、とコメントしている。ちなみにTaylorは、Elyのエントリにもコメントを寄せ、プレイヤー2は囚人のジレンマゲームもどきを最後通牒ゲームに転換させてしまった、という考察を示している。
一方、Elyは、後続のエントリで、今回のプレイヤー2の戦略は、彼が3年前にこの番組を取り上げた時に既にコメント欄で提示されていたと指摘すると同時に(ちなみに前述のTaylorも自分の授業でその戦略を提唱してきたと述べている)、あれやこれや考えると持続可能性に疑問符が付く今回の解決策よりは、別のコメンターが提案した方法、即ち、プレイヤーがお互いの選択をランダムにピックアップする(その場合、獲得賞金の期待値は3/8×賞金額となる)、という方法が良いのではないか、と述べている。