2. ゲーム理論って?~ビル君の危機

小難しい話は無視無視!

まず、ゲーム理論は、フォン・ノイマンって人とモルゲンシュタインって人が… おっと、んなヤボなことは言いません。さっそくどんなものか、一つの例を見ていただきましょう。

2-1 ビル君の危機

このビル君、泥棒です。相棒ジム君と結構な額を荒らしてたみたいです。しかし、そんな彼らもついに当局に捕まっちゃいました。二人は別々の取調室に入れられ、尋問を受けています。

(刑事)
「おまえらがやったのは判ってるんだ! いいかげんに吐かね~か!!」
(ビル)
「・・・」
(刑事)
「ここ以外にも、オルフレア宝石店や、セレロム銀行もおまえらなんだろ!
ネタは上がってんだよ!」
(ビル)
「・・・」

どうやら黙秘権ってやつを行使しているみたいですね。でもビル君、内心ドキドキしてました。「バレてる…」 でも刑事の口ぶりでは、完全にバレているのは今回の事件についてのみで、前の2件はまだハッキリ証拠を掴んでいないようです。また、刑事の様子から、相棒ジム君もまだ何も話していないようでした。
すると刑事が言いました。

(刑事)
「なあ、俺らはすでに有力な証拠を掴んでいる。
このまま黙ってても、刑務所送りなのは目に見えてるんだよ。
そこで、だ。取引といかね~か?」
(ビル)
「・・・」
(刑事)
「今話してくれたら、自首ってことにしてやる。
しかも、捜査に協力してくれたってことで懲役の期間も短くなるだろ~な。
ま、おまえの相棒も話しちまったら意味ね~けどな(笑)
だが、このままおまえが話さずに、おまえの相棒が話しちまったら、
裁判官はおまえのことを、"ネタはアガッてんのに、
最後まで拒否しやがったどうしようもね~悪党"ってことで、
通常よりも罪を重くするだろ~な」
(ビル)
「・・・」

司法取引ってやつですね。でも、このまま二人とも黙っていれば罪になるのは今回の事件のみで、前の2件は証拠不十分ってことで大した懲役にはならないようです。そう、3年くらい。でも今話すと、なんと1年で刑務所を出られるみたいです。さすが司法取引の魔力! もっとも、二人とも話しちゃうと、当然余罪まで勘案されちゃうんで、5年。ところが、ジム君が話しちゃって、このままビル君が話さなかったら…なんとビル君は10年の懲役で、ジム君は1年

となりの取調室にいるジム君にも同じ取引を持ちかけているらしいのですが、ジム君がどういう風に考えているかは分かりません。でも所詮泥棒仲間、いつ裏切られるとも限りません。さて、ビル君はどうしたらいいのでしょうか…

2-2 さて、どうしよう…

ビル君、難しい選択ですね~(笑) どちらにせよ、このまま有罪→刑務所送りになるのは分かっていますけど、できることなら懲役は1年でも短い方がいいです。また、となりのジム君もきっとそう考えているはずです。もちろんジム君も、「ビルのやつも、懲役は1年でも短い方がいいって考えているだろうな~」っていう風に思っています。とにかく、ビル君とジム君には、以下の2つの選択肢があるわけです。

  • 話す
  • 話さない

各選択肢を選んだ場合の懲役の期間を、解りやすく表にしてみましょう。ちなみに、この表を利得表と呼びます。

  ジム
話す 話さない
ビル 話す (-5,-5) (-1,-10)
話さない (-10,-1) (-3,-3)

表のカッコ内の数値は、それぞれの懲役の年数を利得(利益)化したものです。左がビル君のもので、右がジム君のものです。自由なシャバとは大違いの刑務所生活は、人生を損したことになりますんで、1年の懲役は-1、10年の懲役は-10としています。

それでは、ビル君にとってどちらがより良い選択か検証してみましょう。まず、ジム君が話すか話さないかはまったく分かりません。ホント、丁半バクチみたいなもんです。ですんで、ジム君が話すか話さないかはそれぞれ1/2の確率とします。これにより、例えばビル君が「話す」を選んだ場合、次のことが言えます。

"ビル君の懲役は1/2の確率で5年になり、同じく1/2の確率で1年になる。"

さて、ここでひとつ定義を。

「ある事柄の起こる確率 x その事柄による利益 = その事柄の確率的な利益」

これを「期待利得」っていいます。例えば、"1/2の確率で10000円が手に入るという事柄の期待利得は5000円"って感じです。さらに各期待利得を足して、全体の期待利得を出すことも可能です。なにしろこの言葉、ゲーム理論を語る上で重要なものですから覚えておいてくださいね。

では、この期待利得を例題に用いてみます。

「ビル君が「話す」を選んだ場合の期待利得」 = (1/2*-5)+(1/2*-1) = -3
「ビル君が「話さない」を選んだ場合の期待利得」 = (1/2*-10)+(1/2*-3) = -6.5

これで各選択肢の期待利得が出ました。上の式より、ビル君が合理的な人間だったら、より損の少ない(つまりより利得の大きい)選択肢である、「話す」を選択します。もちろんジム君にも同じ事がいえます。よって、ふたりとも「話す」を選択することになるわけなんですね。

このような選択方法を、ゲーム理論では「混合戦略」と呼びます。他にも「ミニ・マックス定理」を用いた基本的な選択方法をはじめ、様々な選択方法や戦略があるのですが、それらの解説は他に譲ります。

2-3 ジレンマ

検証の結果、ふたりとも「話す」を選択することが判りました。しかし、ふたりにはある葛藤が生まれます。それは、"示し合わせることが出来れば、ふたりとも絶対話さないで3年の懲役で済ますことができるのに…"ということです。でも、この状況では懲役10年のリスクがふたりにとってはあまりに大きいため、話さざるを得ないのです。

このような、個々の最大利益を追求した結果、結果としては最大利益を得ることが出来ないゲームを「囚人のジレンマ」ゲームと呼びます。例題の、ふたりが懲役の期間をいかにして短くするか考えた結果、その結果としては最も短い期間にすることが出来なかったという状況が正にそれにあたります。

この、"個々の最大利益の追求行動が全体の最大利益の追求に繋がっていない"という「囚人のジレンマ」ゲーム。この現象はゲーム理論の枠内のみに留まらず、ゴミ問題公害の問題、また、原子力発電所の建設地域選定の問題など、よくある社会問題でも現れます。それらのケースをゲーム化(つまり、本講座みたいに利得表を作ってみて、それを検証すること)してみるのも面白いかと思います。このように、ある特定の状況を検証することにより、その結果から法則性やいわゆる教訓などを得る際、ゲーム理論は非常に論理的な検証方法となりえます。

今回はかなり簡単でしたね(^^ゞ 次回もこれくらいの難度で、「賢い豚さん」の話をしたいと思います。