数学

【ゲーム理論入門】
支配戦略から囚人のジレンマまでを解説。

経済とデータのイメージ

この記事では、
ゲーム理論に興味のある人向けに

”戦略の支配”から勉強を始めて

非協力ゲームの有名な例である
「囚人のジレンマ」を解く所まで解説したいと思います。

企業に見られるゲーム

例として次のゲーム的な状況を考えます。

企業Aと企業Bはライバル関係にあり、
共に新テクノロジーへの投資を検討しています。

企業Aが投資し、企業Bが投資しなければ

企業Aは新テクノロジーを独占、
企業Bを出し抜いて利益をあげれます。

ところが企業Bまで投資してしまうと独占できず、

新テクノロジーによる利益よりも
投資に費やしたお金が勝り、
結果損してしまいます。

企業Bについても同様です。

企業A、B共に投資しなければ
各社は例年通りの利益を確保できるとします。

企業A、Bはそれぞれどう行動するべきでしょうか。

お互いに話し合うことはせず同時に意思決定するとします。

問題を解くに当たって、
各要素に名前を与えます。

プレイヤー

ゲーム的状況において
意思決定を下す主体を”プレイヤー”と呼びます。

ここでは企業Aと企業Bがプレイヤーです。

戦略

プレイヤーの取り得る行動を”戦略”と呼びます。

ここでは「投資する」、「投資しない」が戦略です。

利得行列

上の問題において

*企業Aが投資して企業Bが投資しなければ、
 企業Aの利益は6億円で企業Bの利益は3億円。

*企業Bが投資して企業Aが投資しなければ、
 企業Bの利益は6億円で企業Aの利益は3億円。

*企業A、B共に投資すれば、各社の利益は4億円。

*企業A、B共に投資しなければ、各社の利益は5億円

とします。

このままだと見づらいので行列にまとめます。

企業A / 企業B投資する 投資しない
投資する 4, 4 6, 3
投資しない3, 6 5, 5
(単位:億円)

これを”利得行列”と呼びます。

戦略の支配

コントロールと書かれた紙

利得行列を企業Aの視点から見てみましょう。

企業A / 企業B投資する 投資しない
投資する 46
投資しない35
(単位:億円)

企業Bがもし「投資する」を選択したとすれば

企業Aも同じ様に「投資する」と利益は4億円、
「投資しない」と3億円です。

この場合、企業Aは「投資する」を選択した方が得をします。

また企業Bが今度は「投資しない」を選択したとすれば

企業Aは「投資する」と利益は6億円、
「投資しない」と5億円。

この時も「投資する」方が得です。

この様に相手プレイヤーの
取る戦略に依らず、より得をできる時、

”戦略「投資する」は戦略「投資しない」を支配する”
と言います。

合理的なプレイヤーは、

支配される戦略よりも
支配する戦略(支配戦略)を選ぶので

企業Aの取るべき行動は「投資する」になります。

同じく企業Bの視点から利得行列を見てみます。

企業A / 企業B投資する 投資しない
投資する 4 3
投資しない6 5
(単位:億円)

こちらも「投資する」が「投資しない」を支配しているので、
企業Bの取るべき行動も「投資する」です。

以上よりこの問題の答えは

企業A、B共に投資して、それぞれ4億円ずつ手に入れる

になります。

例年通りであれば5億円を手に入れられたのに、

ライバル企業を出し抜こうとした結果
両プレイヤーとも4億円と利益を落とす事になりました…。

★戦略の支配について補足します。

弱支配

先の企業A視点の利得行列を少し書き換えて、次を考えます。

企業A / 企業B投資する 投資しない
投資する 36
投資しない35
(単位:億円)

企業Bが「投資しない」を選んだ時、
企業Aの正解の行動は「投資する」ですが

企業Bが「投資する」を選んだ時は、
「投資する」でも「投資しない」でも

企業Aの利益は一緒、どちらを選んでも正解です。

この様に相手プレイヤーの
ある戦略には勝ち、

その他の戦略に対しても
同等以上の結果になる事を”弱支配”と呼びます。

企業Aの戦略「投資する」は「投資しない」を弱支配します。

支配(弱支配)の無い例

戦略の支配関係の無い事もあります。

身近な例はじゃんけんです。

由香ちゃん、さとる君の二人でじゃんけんして
勝った方は100円もらえるゲームを考えます。

じゃんけんする子供(男子と女子)

利得行列は

由香ちゃん / さとる君グー チョキ パー
グー 0, 0 1, -1 -1, 1
チョキ-1, 1 0, 0 1, -1
パー 1, -1 -1, 1 0, 0
(単位:百円)

であり、戦略「グー」、「チョキ」、「パー」の間に支配関係はありません。

囚人のジレンマ

牢屋に入れられた囚人のイラスト

最後に、囚人のジレンマを解きます。

男Aと男Bはそれぞれ軽い窃盗罪
で逮捕されて取り調べを受けています。

よく調べてみると、

この二人には共同で強盗事件を
行った容疑もかけられていました。

そこで検事は二人に強盗事件の自白をすれば
刑期を短くする司法取引を提案します。

取引は個別に行われ、
男A、男Bは互いに相手が自白したか分からないとします。

二人の刑期を利得行列にすると

男A / 男B 黙秘 自白
黙秘 2, 2 15, 1
自白 1, 15 10, 10
(単位:年)

です。

刑期が短くなるのは自分だけ自白した時のみで、
自白しなかった方はより重い刑に処せられてしまいます。

二人とも黙秘すると窃盗の罪だけ、
二人とも自白すると強盗事件の罪も追加です。

戦略の支配を考えると男Aにとっても男Bにとっても
「自白」は「黙秘」を支配しています。

なので、囚人のジレンマでは二人とも自白してしまいます。

参考書籍

もっとゲーム理論を勉強したい人にお勧めの本です、
簡潔に書かれているので初学者向きです。

-数学