混合戦略 - PDF 無料ダウンロード

数理分析方法論第 6 回早稲田大学政治学研究科河野勝 (Email: kohno@waseda.jp) 早稲田大学経済学研究科代講 : 須賀晃一 (Email: ksuga@waseda.jp) 1

今日のメニュー前回までの復習純粋戦略と混合戦略期待利得の求め方男女の争いゲーム反応曲線の描き方混合戦略の解釈 2

前回の復習戦略の支配という考え方強支配と弱支配戦略の逐次消去戦略の逐次消去とナッシュ均衡との関係ナッシュ均衡とそれ以外の均衡概念との関係 3

純粋戦略と混合戦略前回ナッシュ均衡の求め方を詳しく説明したしかし前回までの均衡はプレイヤーがひとつの戦略を確実に選択するという意味での純粋戦略に基づいていた純粋戦略に対してもう一つ別の種類の戦略がある混合戦略 4

混合戦略とは何か教科書 ( 武藤 46 頁 ) によると戦略を確率的に混合して用いる方法??? 具体的な例を考えるとテニスのサーバーはレシーバーの右と左にばらしてサーブをするサッカーの PK でキッカーはキーパーの右左上下などにばらしてシュートをする 5

混合戦略とは何かこうしたゲームにおいては各戦略 ( レシーバーの右にサーブするかキーパーの左に蹴るか etc) は 100 パーセントの確率で選択されるとは仮定しない確率付きで戦略が採用されると考える混合戦略に基づくナッシュ均衡の存在 : 武藤混合戦略まで考えたときにはナッシュ均衡は必ず存在します ( 教科書 48 頁 ) 6

期待利得戦略が確率付きで採用されるということはある戦略が採用された場合に実現される利得を期待利得 (expected utility) として考えなければならない期待利得とはなにか? くじの例 :100 万円の当たりくじ 1 本とはずれくじ 999 本が入った箱から 1 本だけを引くとき当たりくじを引く確率は 1000 分の 1 であるゆえに期待利得 =1/1000x 100 万円 = 1000 円 7

では混合戦略に基づくナッシュ均衡について男女の争いゲームと呼ばれるゲームを例にして考えてみましょう 8

男女の争いゲームこのゲームもよく政治学でメタファーとして使われる別名 :coordination game with distributional consequences( 分配の帰結を伴った調整ゲーム ) ゲーム : どうデートを実現するかプレイヤー : 男 (A) と女 (B) 戦略 : 野球に行くかサッカーに行くか 9

男女の争いゲーム A B 野球サッカー野球サッカー A も B も一緒にデートしないよりは一緒にデートした方がいいと思っているただし A は野球の方が好きで B はサッカーの方が好きこの状況を利得表で表すと 10

男女の争いゲーム A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 ではこのゲームのナッシュ均衡を求めてみようまず前回までのように純粋戦略の場合を考える 11

男女の争いゲーム A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 A の最適反応 B の最適反応をそれぞれ考える 12

男女の争い (A の最適反応 1) A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 B が野球を選択すれば A も野球を選択する 13

男女の争い (A の最適反応 2) A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 B がサッカーを選択すれば A もサッカーを選択する 14

男女の争い (B の最適反応 1) A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 A が野球を選択するとき B も野球を選択する 15

男女の争い (B の最適反応 2) A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 A がサッカーを選択すれば B もサッカーを選択する 16

男女の争いのナッシュ均衡 A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 このように ( 野球野球 ) ( サッカーサッカー ) がナッシュ均衡として求まる 17

男女の争いのナッシュ均衡 A B 野球サッカー野球 2, 1 0, 0 サッカー 0, 0 1, 2 しかしこの二つの均衡は純粋戦略に基づく均衡であるもうひとつ混合戦略に基づくナッシュ均衡がある 18

男女の争い ( 混合戦略による均衡 ) A B 野球サッカー野球 x1.00 2, 1 0, 0 サッカー x0 0, 0 1, 2 純粋戦略による均衡を求める上では A が野球を選択する場合その確率は 1 で ( サッカーを選択する確率は 0) 19

男女の争い ( 混合戦略による均衡 ) A B 野球サッカー野球 x0 2, 1 0, 0 サッカー x1.00 0, 0 1, 2 逆に A がサッカーを選択する場合その確率は 1( サッカーを選択する確率は 0) と考えるここではこの前提を変え自分の持つ各戦略に確率を割り振る混合戦略を導入する 20

男女の争い ( 混合戦略による均衡 ) A B 野球サッカー野球 (p) 2, 1 0, 0 サッカー 0, 0 1, 2 A が野球を選択する確率を p とする ( ただし p=[0, 1] すなわち p の値は 0 から 1 の間しかとらない ) 21

男女の争い ( 混合戦略による均衡 ) A B 野球サッカー野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 A が野球を選択する確率を p ならばサッカーを選択する確率は 1 p となる 22

男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 同様に B が野球を選択する確率を q サッカーを選択する確率を 1 q とする 23

男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) サッカー (1-p) いま A と B の得る利得を考慮からはずして A と B とが以上のような混合戦略を用いた場合各戦略の組み合わせがどのような確率で現れるかを考えるつまりこの 4 つのセルごとの確率を考えるここで 2 人は独立に各戦略の確率を決めるとする 24

男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) pq サッカー (1-p) A と B が混合戦略を用いた場合 ( 野球野球 ) という結果は pq の確率で現れる 25

男女の争い ( 混合戦略による均衡 ) A B 野球 (q) サッカー (1-q) 野球 (p) pq p(1-q) サッカー (1-p) (1-p)q (1-p)(1-q) 同様に ( 野球サッカー ) という結果は p(1-q) の確率で ( サッカー野球 ) という結果は (1-p)q の確率で ( サッカーサッカー ) という結果は (1-p)(1-q) の確率で現れる 26

期待利得の計算 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 ではここで利得表にもどるそして期待利得とは利得と確率を掛け合わせたものであったとすると 27

A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 28

A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 2pq 29

A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 2pq + 0p(1-q) 30

A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず A の期待利得を考える EUA= Expected Utility of A = 2pq + 0p(1-q) + 0(1-p)q 31

A の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 まず Aの期待利得を考える EUA= Expected Utility of A = 2pq + 0p(1-q) + 0(1-p)q + 1(1-p)(1-q) しかしこれを最大化するとはどういうこと? どう式を整理すればよいのだろうか? 32

A の期待利得 EUA = 2pq + 0p(1-q) + 0(1-p)q + 1(1-p)(1-q) ここで A がコントロールできるのは p のみであるだから上式を p で整理すると = 2pq - p + pq + 1 q = (3q- 1)p + 1- q ということは 3q- 1 が負の時 0 の時正の時の三つに場合分けしないと p の値による EUA の値の変化がわからない p=? if 3q-1>0 q>1/3 p=? if 3q-1<0 q<1/3 p=? if 3q-1=0 q=1/3 それぞれの場合において p がどういう値をとれば EUA が最大化されるかを考えればよい 33

A の期待利得 EUA = (3q- 1)p + 1- q 1p=1 if 3q-1>0 q>1/3 2p=0 if 3q-1<0 q<1/3 30 p 1 if 3q-1=0 q=1/3 ここで 3 の意味するところは EUA の最大化は p の値に依存しないよって p は 0 から 1 のどんな値をとってもよいということでは次に同じように B さんの側を考えよう 34

B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = 35

B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = pq 36

B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = pq + 0p(1-q) 37

B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 B の期待利得を考える EUB= Expected Utility of B = pq + 0p(1-q) + 0(1-p)q 38

B の期待利得 A B 野球 (q) サッカー (1-q) 野球 (p) 2, 1 0, 0 サッカー (1-p) 0, 0 1, 2 Bの期待利得を考える EUB= Expected Utility of B = pq + 0p(1-q) + 0(1-p)q + 2(1-p)(1-q) 先ほど同様整理すると 39

B の期待利得 EUB = pq + 0p(1-q) + 0(1-p)q + 2(1-p)(1-q) ここで B がコントロールできるのは q であるだから上式を q で整理すると = pq - 2q +2pq + 2 2p = (3p- 2)q + 2 2p ということは 3p- 2 が負の時 0 の時正の時の三つに場合分けしないと q の値による EUB の値の変化がわからない q=? if 3p-2>0 p>2/3 q=? if 3p-2<0 p<2/3 q=? if 3p-2=0 p=2/3 それぞれの場合において q がどういう値をとれば EUB が最大化されるかを考えればよい 40

B の期待利得 EUB = (3p- 2)q + 2-2p 1q=1 2q=0 30 q 1 if 3p-2>0 p>2/3 if 3p-2<0 p<2/3 if 3p-2=0 p=2/3 ここで 3 の意味するところは EUB の最大化は q の値に依存しないよって q は 0 から 1 のどんな値をとってもよいということこのそれぞれの条件を図に表わすと 41

男女の争い (A の最適反応 : 混合 ) q p=1 if 3q-1>0 q>1/3 p=0 if 3q-1<0 q<1/3 0 p 1 if 3q-1=0 q=1/3 1 1/3 0 1 p 42

男女の争い (A の最適反応 : 混合 ) q p=1 if 3q-1>0 q>1/3 p=0 if 3q-1<0 q<1/3 0 p 1 if 3q-1=0 q=1/3 1 1/3 0 1 p 43

男女の争い (B の最適反応 : 混合 ) q q=1 if 3p-2>0 p>2/3 q=0 if 3p-2<0 p<2/3 0 q 1 if 3p-2=0 p=2/3 1 1/3 0 2/3 1 p 44

男女の争い (B の最適反応 : 混合 ) q q=1 if 3p-2>0 p>2/3 q=0 if 3p-2<0 p<2/3 0 q 1 if 3p-2=0 p=2/3 1 1/3 0 2/3 1 p 45

男女の争い ( ナッシュ均衡再び ) ナッシュ均衡とは q 各プレイヤーの最適反応の組み合わせなのでナッシュ均衡 1 1/3 0 2/3 1 ナッシュ均衡ナッシュ均衡 p 混合戦略まで考えるとこのゲームにはナッシュ均衡が 3 つある (p=1, q=1) (p=0, q=0) (p=2/3, q=1/3) 46

男女の争い ( ナッシュ均衡 ): まとめ純粋戦略でのナッシュ均衡 : (p=1, q=1) ( 野球野球 ) (p=0, q=0) ( サッカーサッカー ) 混合戦略でのナッシュ均衡 : (p=2/3, q=1/3) A が 2/3 の確率で野球を 1/3 の確率でサッカーを選択し B が 1/3 の確率で野球を 2/3 の確率でサッカーを選択する 47

混合戦略のナッシュ均衡しかない例 ( 教科書 p46 より ) プレイヤー : テレビ局 A テレビ局 B 戦略 : ドラマを放映するバラエティーを放映する利得に関する背景 1: A 局のほうが人気があり同じ種類の番組が放映された場合には A 局に視聴者が集まるため B 局は A 局と異なる種類の番組を放送したい利得に関する背景 2: B 局はドラマよりもバラエティーに実績がある 48

混合戦略のナッシュ均衡しかない例 ( 教科書 p46 より ) B ドラマバラエティー A ドラマ 7,3 4,6 バラエティー 5,5 6,4 純粋戦略のナッシュ均衡をもとめてみよう! 49

混合戦略のナッシュ均衡しかない例 B ドラマバラエティー A ドラマ 7,3 4,6 バラエティー 5,5 6,4 純粋戦略でナッシュ均衡がない => 混合戦略を考えてみよう 50

混合戦略のナッシュ均衡しかない例 B A ドラマ (q) バラエティー (1-q) ドラマ (p) 7,3 4,6 バラエティー (1-p) 5,5 6,4 0 p 1, 0 q 1 51

混合戦略のナッシュ均衡しかない例 ( 各結果の確率 ) B A ドラマ (q) バラエティー (1-q) ドラマ (p) pq p(1-q) バラエティー (1-p) (1-p)q (1-p)(1-q) 52

混合戦略のナッシュ均衡しかない例 (A の期待利得 ) A B ド (q) バ (1-q) ド (p) 7,3 4,6 バ (1-p) 5,5 6,4 EUA=7pq+4p(1-q)+5(1-p)q+6(1-p)(1-q) = p(4q-2)-q+6 この値を最大化するためには p=1 if 4q-2>0 q>1/2 p=0 if 4q-2<0 q<1/2 0 p 1 if 4p-2=0 q=1/2 これがAの混合戦略を使った最適反応 53

混合戦略のナッシュ均衡しかない例 (B の期待利得 ) A B ド (q) バ (1-q) ド (p) 7,3 4,6 バ (1-p) 5,5 6,4 EUB=3pq+6p(1-q)+5(1-p)q+4(1-p)(1-q) = q(1-4p)+2p+4 この値を最大化するためには q=1 if 1-4p>0 p<1/4 q=0 if 1-4p<0 p>1/4 0 q 1 if 1-4p=0 p=1/4 これがBの混合戦略を使った最適反応 54

混合戦略のナッシュ均衡しかない例 (A の最適反応 : 混合 ) 1 q p=1 if 4q-2>0 q>1/2 p=0 if 4q-2<0 q<1/2 0 p 1 if 4p-2=0 q=1/2 1/2 0 1 p 55

混合戦略のナッシュ均衡しかない例 (B の最適反応 : 混合 ) 1 q q=1 if 1-4p>0 p<1/4 q=0 if 1-4p<0 p>1/4 0 q 1 if 1-4p=0 p=1/4 1/2 0 1/4 1 p 56

混合戦略のナッシュ均衡しかない例 ( ナッシュ均衡 ) 1 q ナッシュ均衡 1/2 0 1/4 1 p このゲームの ( 唯一の ) ナッシュ均衡 (p=1/4, q=1/2) A が 1/4 の確率でドラマを 3/4 の確率でバラエティーを放送し B が 1/2 の確率でドラマを 1/2 の確率でバラエティーを放送する 57

混合戦略の解釈人間が戦略を確率的に決定するとはどういう意味だろうか? ある女性は自分が野球という戦略を Y% の確率で取ると決めるサッカーという戦略を 100-Y% の確率で取ると決めるそんな決定などしてない! という反論がきそう擁護する立場から二つの解釈が提示されている 58

混合戦略の解釈 (1) 集団を想定する解釈男一人ではなく男性集団を想定するたとえば男女ゲームが 100 ゲーム行われているとするとその 100 人の男性 ( 女性 ) のうち P 人 (Q 人 ) がサッカーを選択し 100-P 人 (10 0-Q 人 ) が野球を選択すると解釈できる 59

混合戦略の解釈 (2) ゲームの状況は本当は男性は自分がサッカーを選択するタイプか野球を選択するタイプかを知っているしかし女性がそれを知らないだけであると考える ( 不完備情報?) つまり混合戦略は相手の私的情報に対する自分の対処の仕方であると解釈する Rubinstein (1991) をよんでくださーい! 60

男女の争いゲーム :revised A B 野球サッカー野球 3, 1 0, 0 サッカー 0, 0 1,3 このゲームのナッシュ均衡を求めてみよう! 混合戦略も考えよう! 61

参考文献 Ariel Rubinstein, Comments on the Interpretation of Game Theory, Econometrica, Vol. 59-4, 1991. 62

さまざまな均衡の関係ここまでナッシュ均衡について勉強してきたではこれからは?? ゲーム理論は均衡の概念を狭めていきより現実に見合う予測をしようと発展してきたナッシュ均衡サブゲーム完全均衡完全ベイズ均衡 63

さまざまな均衡の関係ナッシュ均衡の集合サブゲーム完全均衡の集合完全ベイズ均衡の集合 64

情報についてゲーム理論にしばしば登場する概念に完全情報 (perfect information) 不完全情報 (imperfect information) 完備情報 (complete information) 不完備情報 (incomplete information) の 4 つがあるそれぞれの概念はよく間違いやすいので注意が必要 65

情報について完全情報とは過去に相手 ( 自分 ) がどのような行動をとったか知っていること反対に不完全情報とは過去に相手 ( 自分 ) がどのような行動をとったか知らないこと 66

情報について完備情報とは相手 ( 自分 ) の利得関数など行動以外に関するゲームの要素 ( ルール ) を知っていること反対に不完備情報とは相手 ( 自分 ) の利得関数など行動以外に関するゲームの要素 ( ルール ) を知らないこと 67

情報について知っている知らない過去の行動それ以外 ( 主に利得 ) 完全情報ゲーム完備情報ゲーム不完全情報ゲーム不完備情報ゲーム 68

均衡解概念と情報サブゲーム完全均衡 (Subgame-Perfect Equilibrium) 主に完全かつ完備情報ゲームに対応ベイジアンナッシュ均衡 (Baysian-Nash Equilibrium) 主に完全かつ不完備情報ゲームに対応完全ベイズ均衡 (Perfect Bayesian Equilibrium) 主に不完全かつ不完備情報ゲームに対応 69