数理分析方法論 第 6 回 早稲田大学政治学研究科河野勝 (Email: kohno@waseda.jp) 早稲田大学経済学研究科代講 : 須賀晃一 (Email: ksuga@waseda.jp) 1
今日のメニュー 前回までの復習 純粋戦略と混合戦略 期待利得の求め方 男女の争い ゲーム 反応曲線の描き方 混合戦略の解釈 2
前回の復習 戦略の支配 という考え方 強支配と弱支配 戦略の逐次消去 戦略の逐次消去とナッシュ均衡との関係 ナッシュ均衡とそれ以外の均衡概念との関係 3
純粋戦略と混合戦略 前回 ナッシュ均衡の求め方を詳しく説明した しかし 前回までの均衡は プレイヤーがひとつの戦略を確実に選択するという意味での 純粋戦略 に基づいていた 純粋戦略に対して もう一つ別の種類の戦略がある 混合戦略 4
混合戦略とは何か 教科書 ( 武藤 46 頁 ) によると 戦略を確率的に混合して用いる方法??? 具体的な例を考えると テニスのサーバーは レシーバーの右と左にばらしてサーブをする サッカーの PK で キッカーはキーパーの右左 上下などにばらしてシュートをする 5
混合戦略とは何か こうしたゲームにおいては 各戦略 ( レシーバーの右にサーブするか キーパーの左に蹴るか etc) は 100 パーセントの確率で選択されるとは仮定しない 確率付きで戦略が採用される と考える 混合戦略に基づくナッシュ均衡の存在 : 武藤 混合戦略まで考えたときにはナッシュ均衡は必ず存在します ( 教科書 48 頁 ) 6
期待利得 戦略が確率付きで採用されるということは ある戦略が採用された場合に実現される利得を期待利得 (expected utility) として考えなければならない 期待利得とはなにか? くじの例 :100 万円の当たりくじ 1 本と はずれくじ 999 本が入った箱から 1 本だけを引くとき 当たりくじを引く確率は 1000 分の 1 である ゆえに 期待利得 =1/1000x 100 万円 = 1000 円 7
では 混合戦略に基づくナッシュ均 衡について 男女の争いゲームと呼 ばれるゲームを例にして 考えてみましょう 8
男女の争い ゲーム このゲームも よく政治学でメタファーとして使われる 別名 :coordination game with distributional consequences( 分配の帰結を伴った調整ゲーム ) ゲーム : どうデートを実現するか プレイヤー : 男 (A) と女 (B) 戦略 : 野球に行くか サッカーに行くか 9
男女の争い ゲーム A B 野球サッカー 野球 サッカー A も B も 一緒にデートしないよりは一緒にデートした方がいいと思っている ただし A は野球の方が好きで B はサッカーの方が好き この状況を利得表で表すと 10
男女の争い ゲーム A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 では このゲームのナッシュ均衡を求めてみよう まず 前回までのように 純粋戦略の場合を考える 11
男女の争い ゲーム A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 A の最適反応 B の最適反応をそれぞれ考える 12
男女の争い (A の最適反応 1) A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 B が野球を選択すれば A も野球を選択する 13
男女の争い (A の最適反応 2) A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 B がサッカーを選択すれば A もサッカーを選択する 14
男女の争い (B の最適反応 1) A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 A が野球を選択するとき B も野球を選択する 15
男女の争い (B の最適反応 2) A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 A がサッカーを選択すれば B もサッカーを選択する 16
男女の争いのナッシュ均衡 A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 このように ( 野球 野球 ) ( サッカー サッカー ) がナッシュ均衡として求まる 17
男女の争いのナッシュ均衡 A B 野球サッカー 野球 2, 1 0, 0 サッカー 0, 0 1, 2 しかし この二つの均衡は純粋戦略に基づく均衡である もうひとつ 混合戦略に基づくナッシュ均衡がある 18
男女の争い ( 混合戦略による均衡 ) A B 野球サッカー 野球 x1.00 2, 1 0, 0 サッカー x0 0, 0 1, 2 純粋戦略による均衡を求める上では A が野球を選択する場合 その確率は 1 で ( サッカーを選択する確率は 0) 19
男女の争い ( 混合戦略による均衡 ) A B 野球サッカー 野球 x0 2, 1 0, 0 サッカー x1.00 0, 0 1, 2 逆に A がサッカーを選択する場合その確率は 1( サッカーを選択する確率は 0) と考える ここでは この前提を変え 自分の持つ各戦略に確率を割り振る混合戦略を導入する 20
男女の争い ( 混合戦略による均衡 ) A B 野球サッカー 野球 (p) 2, 1 0, 0 サッカー 0, 0 1, 2 A が野球を選択する確率を p とする ( ただし p=[0, 1] すなわち p の値は 0 から 1 の間しかとらない ) 21
男女の争い ( 混合戦略による均衡 ) A B 野球サッカー 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 A が野球を選択する確率を p ならば サッカーを選択する確率は 1 p となる 22
男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 同様に B が野球を選択する確率を q サッカーを選択する確率を 1 q とする 23
男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) サッカー (1-p) いま A と B の得る利得を考慮からはずして A と B とが以上のような混合戦略を用いた場合 各戦略の組み合わせがどのような確率で現れるか を考える つまり この 4 つのセルごとの確率を 考える ここで 2 人は独立に各戦略の確率を決めるとする 24
男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) pq サッカー (1-p) A と B が混合戦略を用いた場合 ( 野球 野球 ) という結果は pq の確率で現れる 25
男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) pq p(1-q) サッカー (1-p) (1-p)q (1-p)(1-q) 同様に ( 野球 サッカー ) という結果は p(1-q) の確率で ( サッカー 野球 ) という結果は (1-p)q の確率で ( サッカー サッカー ) という結果は (1-p)(1-q) の確率で現れる 26
期待利得の計算 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 では ここで利得表にもどる そして 期待利得とは 利得と確率を掛け合わせたものであった とすると 27
A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 28
A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 2pq 29
A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 2pq + 0p(1-q) 30
A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 2pq + 0p(1-q) + 0(1-p)q 31
A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず Aの期待利得を考える EUA= Expected Utility of A = 2pq + 0p(1-q) + 0(1-p)q + 1(1-p)(1-q) しかし これを最大化する とはどういうこと? どう式を整理すればよいのだろうか? 32
A の期待利得 EUA = 2pq + 0p(1-q) + 0(1-p)q + 1(1-p)(1-q) ここで A がコントロールできるのは p のみである だから 上式を p で整理すると = 2pq - p + pq + 1 q = (3q- 1)p + 1- q ということは 3q- 1 が負の時 0 の時 正の時の三つに場合分けしないと p の値による EUA の値の変化がわからない p=? if 3q-1>0 q>1/3 p=? if 3q-1<0 q<1/3 p=? if 3q-1=0 q=1/3 それぞれの場合において p がどういう値をとれば EUA が最大化されるかを考えればよい 33
A の期待利得 EUA = (3q- 1)p + 1- q 1p=1 if 3q-1>0 q>1/3 2p=0 if 3q-1<0 q<1/3 30 p 1 if 3q-1=0 q=1/3 ここで 3 の意味するところは EUA の最大化は p の値に依存しない よって p は 0 から 1 のどんな値をとってもよい ということ では 次に同じように B さんの側を考えよう 34
B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = 35
B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = pq 36
B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = pq + 0p(1-q) 37
B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = pq + 0p(1-q) + 0(1-p)q 38
B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 Bの期待利得を考える EUB= Expected Utility of B = pq + 0p(1-q) + 0(1-p)q + 2(1-p)(1-q) 先ほど同様 整理すると 39
B の期待利得 EUB = pq + 0p(1-q) + 0(1-p)q + 2(1-p)(1-q) ここで B がコントロールできるのは q である だから 上式を q で整理すると = pq - 2q +2pq + 2 2p = (3p- 2)q + 2 2p ということは 3p- 2 が負の時 0 の時 正の時の三つに場合分けしないと q の値による EUB の値の変化がわからない q=? if 3p-2>0 p>2/3 q=? if 3p-2<0 p<2/3 q=? if 3p-2=0 p=2/3 それぞれの場合において q がどういう値をとれば EUB が最大化されるかを考えればよい 40
B の期待利得 EUB = (3p- 2)q + 2-2p 1q=1 2q=0 30 q 1 if 3p-2>0 p>2/3 if 3p-2<0 p<2/3 if 3p-2=0 p=2/3 ここで 3 の意味するところは EUB の最大化は q の値に依存しない よって q は 0 から 1 のどんな値をとってもよい ということ このそれぞれの条件を 図に表わすと 41
男女の争い (A の最適反応 : 混合 ) q p=1 if 3q-1>0 q>1/3 p=0 if 3q-1<0 q<1/3 0 p 1 if 3q-1=0 q=1/3 1 1/3 0 1 p 42
男女の争い (A の最適反応 : 混合 ) q p=1 if 3q-1>0 q>1/3 p=0 if 3q-1<0 q<1/3 0 p 1 if 3q-1=0 q=1/3 1 1/3 0 1 p 43
男女の争い (B の最適反応 : 混合 ) q q=1 if 3p-2>0 p>2/3 q=0 if 3p-2<0 p<2/3 0 q 1 if 3p-2=0 p=2/3 1 1/3 0 2/3 1 p 44
男女の争い (B の最適反応 : 混合 ) q q=1 if 3p-2>0 p>2/3 q=0 if 3p-2<0 p<2/3 0 q 1 if 3p-2=0 p=2/3 1 1/3 0 2/3 1 p 45
男女の争い ( ナッシュ均衡再び ) ナッシュ均衡とは q 各プレイヤーの最適反応の組み合わせなので ナッシュ均衡 1 1/3 0 2/3 1 ナッシュ均衡 ナッシュ均衡 p 混合戦略まで考えると このゲームにはナッシュ均衡が 3 つある (p=1, q=1) (p=0, q=0) (p=2/3, q=1/3) 46
男女の争い ( ナッシュ均衡 ): まとめ 純粋戦略でのナッシュ均衡 : (p=1, q=1) ( 野球 野球 ) (p=0, q=0) ( サッカー サッカー ) 混合戦略でのナッシュ均衡 : (p=2/3, q=1/3) A が 2/3 の確率で野球を 1/3 の確率でサッカーを選択し B が 1/3 の確率で野球を 2/3 の確率でサッカーを選択する 47
混合戦略のナッシュ均衡しかない例 ( 教科書 p46 より ) プレイヤー : テレビ局 A テレビ局 B 戦略 : ドラマを放映する バラエティーを放映する 利得に関する背景 1: A 局のほうが人気があり 同じ種類の番組が放映された場合には A 局に視聴者が集まるため B 局は A 局と異なる種類の番組を放送したい 利得に関する背景 2: B 局はドラマよりもバラエティーに実績がある 48
混合戦略のナッシュ均衡しかない例 ( 教科書 p46 より ) B ドラマ バラエティー A ドラマ 7,3 4,6 バラエティー 5,5 6,4 純粋戦略のナッシュ均衡をもとめてみよう! 49
混合戦略のナッシュ均衡しかない例 B ドラマ バラエティー A ドラマ 7,3 4,6 バラエティー 5,5 6,4 純粋戦略でナッシュ均衡がない => 混合戦略を考えてみよう 50
混合戦略のナッシュ均衡しかない例 B A ドラマ (q) バラエティー (1-q) ドラマ (p) 7,3 4,6 バラエティー (1-p) 5,5 6,4 0 p 1, 0 q 1 51
混合戦略のナッシュ均衡しかない例 ( 各結果の確率 ) B A ドラマ (q) バラエティー (1-q) ドラマ (p) pq p(1-q) バラエティー (1-p) (1-p)q (1-p)(1-q) 52
混合戦略のナッシュ均衡しかない例 (A の期待利得 ) A B ド (q) バ (1-q) ド (p) 7,3 4,6 バ (1-p) 5,5 6,4 EUA=7pq+4p(1-q)+5(1-p)q+6(1-p)(1-q) = p(4q-2)-q+6 この値を最大化するためには p=1 if 4q-2>0 q>1/2 p=0 if 4q-2<0 q<1/2 0 p 1 if 4p-2=0 q=1/2 これがAの混合戦略を使った最適反応 53
混合戦略のナッシュ均衡しかない例 (B の期待利得 ) A B ド (q) バ (1-q) ド (p) 7,3 4,6 バ (1-p) 5,5 6,4 EUB=3pq+6p(1-q)+5(1-p)q+4(1-p)(1-q) = q(1-4p)+2p+4 この値を最大化するためには q=1 if 1-4p>0 p<1/4 q=0 if 1-4p<0 p>1/4 0 q 1 if 1-4p=0 p=1/4 これがBの混合戦略を使った最適反応 54
混合戦略のナッシュ均衡しかない例 (A の最適反応 : 混合 ) 1 q p=1 if 4q-2>0 q>1/2 p=0 if 4q-2<0 q<1/2 0 p 1 if 4p-2=0 q=1/2 1/2 0 1 p 55
混合戦略のナッシュ均衡しかない例 (B の最適反応 : 混合 ) 1 q q=1 if 1-4p>0 p<1/4 q=0 if 1-4p<0 p>1/4 0 q 1 if 1-4p=0 p=1/4 1/2 0 1/4 1 p 56
混合戦略のナッシュ均衡しかない例 ( ナッシュ均衡 ) 1 q ナッシュ均衡 1/2 0 1/4 1 p このゲームの ( 唯一の ) ナッシュ均衡 (p=1/4, q=1/2) A が 1/4 の確率でドラマを 3/4 の確率でバラエティーを放送し B が 1/2 の確率でドラマを 1/2 の確率でバラエティーを放送する 57
混合戦略の解釈 人間が 戦略を確率的に決定する とは どういう意味だろうか? ある女性は 自分が 野球 という戦略を Y% の確率で取ると決める サッカー という戦略を 100-Y% の確率で取ると決める そんな決定などしてない! という反論がきそう 擁護する立場から 二つの解釈が提示されている 58
混合戦略の解釈 (1) 集団 を想定する解釈男一人ではなく 男性集団を想定する たとえば 男女ゲームが 100 ゲーム行われているとすると その 100 人の男性 ( 女性 ) のうち P 人 (Q 人 ) がサッカーを選択し 100-P 人 (10 0-Q 人 ) が野球を選択する と解釈できる 59
混合戦略の解釈 (2) ゲームの状況は 本当は 男性は 自分がサッカーを選択するタイ プか 野球を選択するタイプかを知っている しか し 女性がそれを知らないだけである と考える ( 不完備情報?) つまり 混合戦略は 相手の私的情報に対する自分の対処の仕方である と解釈する Rubinstein (1991) をよんでくださーい! 60
男女の争い ゲーム :revised A B 野球サッカー 野球 3, 1 0, 0 サッカー 0, 0 1,3 このゲームのナッシュ均衡を求めてみよう! 混合戦略も考えよう! 61
参考文献 Ariel Rubinstein, Comments on the Interpretation of Game Theory, Econometrica, Vol. 59-4, 1991. 62
さまざまな 均衡 の関係 ここまで ナッシュ均衡 について勉強してきた では これからは?? ゲーム理論は 均衡の概念を狭めていき より現実に見合う予測をしようと発展してきた ナッシュ均衡 サブゲーム完全均衡 完全ベイズ均衡 63
さまざまな 均衡 の関係 ナッシュ均衡の集合 サブゲーム完全均衡の集合 完全ベイズ均衡の集合 64
情報について ゲーム理論にしばしば登場する概念に 完全情報 (perfect information) 不完全情報 (imperfect information) 完備情報 (complete information) 不完備情報 (incomplete information) の 4 つがある それぞれの概念はよく間違いやすいので 注意が必要 65
情報について 完全情報とは 過去に相手 ( 自分 ) がどのような行動をとったか知っていること 反対に 不完全情報とは 過去に相手 ( 自分 ) がどのような行動をとったか知らないこと 66
情報について 完備情報とは 相手 ( 自分 ) の利得関数など 行動以外に関するゲームの要素 ( ルール ) を知っていること 反対に 不完備情報とは 相手 ( 自分 ) の利得関数など 行動以外に関するゲームの要素 ( ルール ) を知らないこと 67
情報について 知っている 知らない 過去の行動 それ以外 ( 主に利得 ) 完全 情報ゲーム 完備 情報ゲーム 不完全 情報ゲーム 不完備 情報ゲーム 68
均衡解概念と情報 サブゲーム完全均衡 (Subgame-Perfect Equilibrium) 主に完全かつ完備情報ゲームに対応 ベイジアン ナッシュ均衡 (Baysian-Nash Equilibrium) 主に完全かつ不完備情報ゲームに対応 完全ベイズ均衡 (Perfect Bayesian Equilibrium) 主に不完全かつ不完備情報ゲームに対応 69