
この記事では、
ゲーム理論に興味のある人向けに
”戦略の支配”から勉強を始めて
非協力ゲームの有名な例である
「囚人のジレンマ」を解く所まで解説したいと思います。
目次[開く]
企業に見られるゲーム
例として次のゲーム的な状況を考えます。
企業Aと企業Bはライバル関係にあり、
共に新テクノロジーへの投資を検討しています。
企業Aが投資し、企業Bが投資しなければ
企業Aは新テクノロジーを独占、
企業Bを出し抜いて利益をあげれます。
ところが企業Bまで投資してしまうと独占できず、
新テクノロジーによる利益よりも
投資に費やしたお金が勝り、
結果損してしまいます。
企業Bについても同様です。
企業A、B共に投資しなければ
各社は例年通りの利益を確保できるとします。
企業A、Bはそれぞれどう行動するべきでしょうか。
お互いに話し合うことはせず同時に意思決定するとします。
問題を解くに当たって、
各要素に名前を与えます。
プレイヤー
ゲーム的状況において
意思決定を下す主体を”プレイヤー”と呼びます。
ここでは企業Aと企業Bがプレイヤーです。
戦略
プレイヤーの取り得る行動を”戦略”と呼びます。
ここでは「投資する」、「投資しない」が戦略です。
利得行列
上の問題において
*企業Aが投資して企業Bが投資しなければ、
企業Aの利益は6億円で企業Bの利益は3億円。
*企業Bが投資して企業Aが投資しなければ、
企業Bの利益は6億円で企業Aの利益は3億円。
*企業A、B共に投資すれば、各社の利益は4億円。
*企業A、B共に投資しなければ、各社の利益は5億円
とします。
このままだと見づらいので行列にまとめます。
企業A / 企業B | 投資する | 投資しない |
投資する | 4, 4 | 6, 3 |
投資しない | 3, 6 | 5, 5 |
これを”利得行列”と呼びます。
戦略の支配

利得行列を企業Aの視点から見てみましょう。
企業A / 企業B | 投資する | 投資しない |
投資する | 4 | 6 |
投資しない | 3 | 5 |
企業Bがもし「投資する」を選択したとすれば
企業Aも同じ様に「投資する」と利益は4億円、
「投資しない」と3億円です。
この場合、企業Aは「投資する」を選択した方が得をします。
また企業Bが今度は「投資しない」を選択したとすれば
企業Aは「投資する」と利益は6億円、
「投資しない」と5億円。
この時も「投資する」方が得です。
この様に相手プレイヤーの
取る戦略に依らず、より得をできる時、
”戦略「投資する」は戦略「投資しない」を支配する”
と言います。
合理的なプレイヤーは、
支配される戦略よりも
支配する戦略(支配戦略)を選ぶので
企業Aの取るべき行動は「投資する」になります。
同じく企業Bの視点から利得行列を見てみます。
企業A / 企業B | 投資する | 投資しない |
投資する | 4 | 3 |
投資しない | 6 | 5 |
こちらも「投資する」が「投資しない」を支配しているので、
企業Bの取るべき行動も「投資する」です。
以上よりこの問題の答えは
企業A、B共に投資して、それぞれ4億円ずつ手に入れる
になります。
例年通りであれば5億円を手に入れられたのに、
ライバル企業を出し抜こうとした結果
両プレイヤーとも4億円と利益を落とす事になりました…。
★戦略の支配について補足します。
弱支配
先の企業A視点の利得行列を少し書き換えて、次を考えます。
企業A / 企業B | 投資する | 投資しない |
投資する | 3 | 6 |
投資しない | 3 | 5 |
企業Bが「投資しない」を選んだ時、
企業Aの正解の行動は「投資する」ですが
企業Bが「投資する」を選んだ時は、
「投資する」でも「投資しない」でも
企業Aの利益は一緒、どちらを選んでも正解です。
この様に相手プレイヤーの
ある戦略には勝ち、
その他の戦略に対しても
同等以上の結果になる事を”弱支配”と呼びます。
企業Aの戦略「投資する」は「投資しない」を弱支配します。
支配(弱支配)の無い例
戦略の支配関係の無い事もあります。
身近な例はじゃんけんです。
由香ちゃん、さとる君の二人でじゃんけんして
勝った方は100円もらえるゲームを考えます。

利得行列は
由香ちゃん / さとる君 | グー | チョキ | パー |
グー | 0, 0 | 1, -1 | -1, 1 |
チョキ | -1, 1 | 0, 0 | 1, -1 |
パー | 1, -1 | -1, 1 | 0, 0 |
であり、戦略「グー」、「チョキ」、「パー」の間に支配関係はありません。
囚人のジレンマ

最後に、囚人のジレンマを解きます。
男Aと男Bはそれぞれ軽い窃盗罪
で逮捕されて取り調べを受けています。
よく調べてみると、
この二人には共同で強盗事件を
行った容疑もかけられていました。
そこで検事は二人に強盗事件の自白をすれば
刑期を短くする司法取引を提案します。
取引は個別に行われ、
男A、男Bは互いに相手が自白したか分からないとします。
二人の刑期を利得行列にすると
男A / 男B | 黙秘 | 自白 |
黙秘 | 2, 2 | 15, 1 |
自白 | 1, 15 | 10, 10 |
です。
刑期が短くなるのは自分だけ自白した時のみで、
自白しなかった方はより重い刑に処せられてしまいます。
二人とも黙秘すると窃盗の罪だけ、
二人とも自白すると強盗事件の罪も追加です。
戦略の支配を考えると男Aにとっても男Bにとっても
「自白」は「黙秘」を支配しています。
なので、囚人のジレンマでは二人とも自白してしまいます。
参考書籍
もっとゲーム理論を勉強したい人にお勧めの本です、
簡潔に書かれているので初学者向きです。