支配戦略

支配戦略 (しはいせんりゃく、英: dominant strategy)^[1]とは、戦略型ゲームにおけるあるプレイヤーの戦略で、他のプレイヤーの戦略の選択によらず他の全ての戦略“よりも” (あるいは“以上に”) 高い利得を得られる戦略のことである。また、支配関係 (英: dominance relation)^[2]とは、戦略型ゲームにおけるあるプレイヤーの2戦略間の関係で、他のプレイヤーの戦略の選択によらず一方が他方“よりも” (あるいは“以上に”) 高い利得をもたらすというものである。

定義

以下、プレイヤーの集合を $I$ 、混合戦略空間を $Θ = \prod i \in I Δ i$ 、混合戦略利得関数を $u i : Θ \to ℝ (i \in I)$ とする。また、戦略 $x i \in Δ i$ と戦略プロファイル $z \in Θ$ のもとで、戦略プロファイル $(x i, z - i) \in Θ$ は、プレイヤー $i$ が戦略 $x i$ を選択し、それ以外のプレイヤーが $z$ にしたがって戦略を選択する戦略プロファイルを表す。

支配関係: 戦略 $x i, y i \in Δ i$ が任意の戦略プロファイル $z \in Θ$ に対して $u i (x i, z - i) \geq u i (y i, z - i)$ を満たし、少なくとも一つの $z$ に対しては等号が成り立たないとき、「 $x i$ は $y i$ を弱支配する」( $x i$ weakly dominates $y i$ )^[2]、または「 $y i$ は $x i$ に弱支配される」( $y i$ is weakly dominated by $x i$ ) という。

戦略

x i, y i \in Δ i

が任意の戦略プロファイル

z \in Θ

に対して

u i (x i, z - i) > u i (y i, z - i)

を満たすとき、「

x i

は

y i

を強支配する」(

x i

strictly dominates

y i

)^[2]^{[注 1]}、または「

y i

は

x i

に強支配される」(

y i

is strictly dominated by

x i

) という。

支配戦略: 戦略 $x i \in Δ i$ が任意の戦略 $y i \in Δ i ∖{x i}$ を弱支配するとき、 $x i$ を弱支配戦略 (weakly dominant strategy)^[1]という。

戦略

x i \in Δ i

が任意の戦略

y i \in Δ i ∖{x i}

を強支配するとき、

x i

を強支配戦略 (strictly dominant strategy)^{[注 2]}という。

支配される戦略: 戦略 $x i \in Δ i$ がある戦略 $y i \in Δ i$ に弱支配されるとき、 $x i$ を弱支配される戦略 (weakly dominated strategy) という。

戦略

x i \in Δ i

がある戦略

y i \in Δ i

に強支配されるとき、

x i

を強支配される戦略 (strictly dominated strategy) という。

合理性と支配戦略均衡

あるプレイヤーが合理的 (rational) であるとは、そのプレイヤーが強支配される戦略を決して選択しないことである^[2]。また、どのプレイヤーも強支配戦略を持つならば、その組による戦略プロファイルを支配戦略均衡 (dominant strategy equilibrium)^[1]という。支配戦略均衡の存在するゲームでは、全てのプレイヤーが合理的であるならば支配戦略均衡が実現する。しかし、支配戦略均衡は必ずしもパレート効率的であるとは限らない。囚人のジレンマはパレート効率的でない支配戦略均衡をもつゲームの典型例である。

最適反応およびナッシュ均衡との関連

ある戦略プロファイルに対して最適反応となる戦略は強支配されず、したがって、ナッシュ均衡をなす戦略はいずれも強支配されない。特に、完全混合戦略のみからなる戦略プロファイルに対して最適反応となる戦略は弱支配されず、また、弱支配されない戦略のみからなるナッシュ均衡 (支配されない (undominated) ナッシュ均衡) はいかなる戦略型ゲームにも必ず存在することが知られている^{[注 3]}。

強支配される戦略の繰り返し消去

強支配される戦略の繰り返し消去 (Iterated elimination of strictly dominated strategies (IESDS))^{[注 4]}とは、基本的なゲームの解法のひとつである。

戦略型ゲーム $G$ が与えられたときに、次のように $G t = (I, S t = \prod i \in I S i t, π t) (t \in ℕ)$ を定める。

$G 0 = G$ とする。
次に、t ≥ 0 について、以下のように G^t から G^{t +1} を定める (帰納的定義)。
1. $S i t +1 \subset S i t$ を、プレイヤー $i \in I$ の純粋戦略のうち、 $G t$ において強支配されない戦略の集合とする^{[注 5]}。これにより純粋戦略空間 $S t +1 = \prod i \in I S i t +1 \subset S t$ が定まる。
2. (結合)純粋戦略利得関数を $π t +1 = π t | S t +1$ とする。

与えられたゲーム $G$ が有限ゲームの場合は、ある $T \in ℕ$ が存在して、任意の $t \in {n \in ℕ | t \geq T}$ に対して $G t = G t +1$ となる。このとき、 $G T$ の各純粋戦略は反復的に強支配されない (not iteratively strictly dominated)^[2]という。特に、各プレイヤーの純粋戦略がそれぞれ一つずつしか残らない場合、 $G$ は強支配により可解 (strictly dominance solvable)^[2]^{[注 6]}であるという。この解の実現には、全プレイヤーが合理的であることに加えて、「全プレイヤーが合理的である」という共有知識が必要である。上記の説明では全プレイヤーについて強支配される戦略の消去を同時に行うが、最終的な $G T$ は、各プレイヤーを順に周回して戦略を消去する、戦略を一つずつ消去する、といった戦略の消去順によらず一意である^[1]^[2]^{[注 7]}。

以上と同様の繰り返し消去を弱支配される戦略について行うことも可能だが、一部のナッシュ均衡が消去される可能性があり、また、最終的な $G T$ は戦略の消去順によって異なることがある^[1]^{[注 8]}。

B A	b₁	b₂	b₃
a₁	0, 3	1, 1	2, 0
a₂	1, 0	3, 2	0, 5

IESDSでは純粋戦略のみについて消去をするが、これは^{[注 5]}に述べたように、強支配される純粋戦略の消去が同時に強支配される混合戦略の消去になっていることによる。他方、ある純粋戦略が他のいかなる純粋戦略にも強支配されないことは、その純粋戦略が強支配されないことを含意しない。例えば、右の双行列ゲームにおいてプレイヤーBの純粋戦略の間に支配関係は無いが、b₁とb₃をそれぞれ0.5すつの確率で選択する混合戦略はb₂を強支配する。

注釈

^ 単に支配する (dominates) と呼ぶこともある^[1]。
^ 単に支配戦略 (dominant strategy) と呼ぶこともある^[1]。
^ 一般に、より強い主張が成り立つ。摂動完全均衡やプロパー均衡は支配されないナッシュ均衡であるが、いずれも任意の戦略型ゲームについて存在する^[2]。
^ 「繰り返し」は「反復(的)」や「逐次(的)」とされることもある。「消去」は「削除」とされることもある。
^ ^a ^b 強支配される純粋戦略を選択する確率が正である混合戦略は必ず強支配される戦略である。なぜならば、強支配される純粋戦略を選択する代わりにその戦略を強支配している純粋戦略を選択すれば任意の戦略プロファイルに対して利得がより大きくなるからである。
^ 単に支配可解 (dominance solvable) と呼ぶこともある^[1]。
^ 強支配関係にある2戦略について、他プレイヤーの純粋戦略の削除によって厳密に利得が異なる戦略プロファイルが全て消去されることは無く、必ず強支配関係が保たれる。
^ 弱支配関係にある2戦略について、他プレイヤーの純粋戦略の削除によって厳密に利得が異なる戦略プロファイルが全て消去された場合、もはや弱支配関係が成り立たない。

出典

^ ^a ^b ^c ^d ^e ^f ^g ^h 渡辺隆裕『ゼミナールゲーム理論入門』日本経済新聞出版、2008年4月7日。ISBN 978-4-532-13346-7。
^ ^a ^b ^c ^d ^e ^f ^g ^h ヨルゲン W. ウェイブル『進化ゲームの理論』大和瀬達二監訳、三澤哲也/赤尾健一/大阿久博/横尾昌紀訳、文化書房博文社、1998年3月31日（原著1995年）。ISBN 4-8301-0820-7。

表話編歴ゲーム理論
定義	非協力ゲーム協力ゲーム標準型ゲーム展開型ゲームベイジアンゲーム簡潔ゲーム（英語版）情報集合信念の階層選好進化ゲームハイパーゲーム（英語版）行動ゲーム
解概念と精緻化	ナッシュ均衡部分ゲーム完全均衡 Mertens-stable equilibrium（英語版）ベイジアン・ナッシュ均衡完全ベイズ均衡摂動完全均衡プロパー均衡 ε均衡相関均衡（英語版、ドイツ語版）逐次均衡準完全均衡進化的安定戦略リスク支配コアシャープレイ値パレート効率性質的応答均衡自己確証均衡強ナッシュ均衡（英語版、ヘブライ語版）マルコフ完全均衡（英語版）戦略的補完性合理化可能性直観的基準
戦略	支配戦略混合戦略（英語版）しっぺ返し戦略トリガー戦略共謀（英語版）後ろ向き帰納法前向き帰納法マルコフ戦略（英語版）主人と奴隷
ゲームのクラス	対称ゲーム（英語版）完全情報完全情報ゲーム完備情報不完備情報ゲーム確実情報同時手番ゲーム逐次手番ゲーム（英語版）繰り返しゲームシグナリングゲームチープトークゼロ和非ゼロ和メカニズムデザイン交渉問題（英語版）確率ゲーム（英語版）大ポアソンゲーム（英語版）非推移的ゲームグローバルゲーム（英語版）特性関数型ゲーム二人零和有限確定完全情報ゲーム
ゲーム	囚人のジレンマ旅人のジレンマ（英語版）協調ゲーム（英語版）チキンゲームムカデゲーム（英語版）ボランティアのジレンマ（英語版）ドル・オークション（英語版）男女の争い（英語版）スタグハントゲームマッチングペニー（英語版）最後通牒ゲームじゃんけん海賊ゲーム（英語版）独裁者ゲーム（英語版）公共財ゲーム（英語版） Blotto games（英語版）消耗戦（英語版）エルファロル・バー問題公平分割行き詰まり（英語版）割り勘のジレンマ Guess 2/3 of the average（英語版）クーン・ポーカー交渉問題（英語版）スクリーニングゲーム（英語版）囚人と帽子のパズル（英語版） Trust game（英語版） Princess and monster game（英語版）モンティ・ホール問題クールノー競争ベルトラン競争シュタッケルベルグ競争
定理	ミニマックス法ナッシュの定理純化定理フォーク定理顕示原理（英語版）アローの不可能性定理
主要人物	ケネス・アローロバート・オーマンケン・ビンモアサミュエル・ボールズメルヴィン・ドレッシャー（英語版）メリル・フラッド（英語版）ドリュー・フューデンバーグ（英語版）ドナルド・ギリースジョン・ハーサニレオニード・ハーヴィッツデイヴィッド・レヴァイン（英語版）ダニエル・カーネマンハロルド・クーンエリック・マスキンジャン＝フランソワ・メルタン（英語版）ポール・ミルグロムオスカー・モルゲンシュテルンロジャー・マイヤーソンジョン・ナッシュジョン・フォン・ノイマンアリエル・ルービンシュタイントーマス・シェリングラインハルト・ゼルテンハーバート・サイモンロイド・シャープレージョン・メイナード＝スミスジャン・ティロールアルバート・タッカーウィリアム・ヴィックリーロバート・ウィルソンペイトン・ヤング（英語版）
関連項目	コモンズの悲劇 Tyranny of small decisions（英語版） All-pay auction（英語版）ゲーム理論におけるゲームの一覧（英語版） Confrontation analysis（英語版）ゲーム理論家の一覧（英語版）数学経済学進化論集団遺伝学オペレーションズリサーチ社会生物学環境社会学クープマンモデル
カテゴリ

定義

合理性と支配戦略均衡

最適反応およびナッシュ均衡との関連

強支配される戦略の繰り返し消去

注釈

出典

関連項目

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.