. 進化ゲーム 0. ゲームの理論の分類 これまで授業で取り扱ってきたゲームは 協 ゲームと呼ばれるものである これはプレイヤー同士が独立して意思決定する状況を表すゲームであり ふつう ゲーム理論 といえば 非協力ゲームを表す これに対して プレイヤー同士が協力するという前提のもとに提携形成のパタンや利得配分の在り方を分析するゲームを協 ゲームという もっとも 社会現象への応用可能性も大きいはずなのに なぜかそれほど流行っていない ( ので 授業でも省略 ) もう つのゲーム理論に進化ゲームがある これについて取り上げて解説する. 進化ゲームの基礎 進化ゲームは 多人数の社会においてどのような戦略が優勢なのかという社会全体での分布を対象とする つまり 個々のプレイヤーがどのような戦略をとるのかではなく ある戦略をとるプレイヤーの割合とその時間的変化に焦点を合わせている 時間が経過するにつれて 社会状態がどのように変化するのかを分析するのがポイント これは生物進化のプロセスになじみやすい発想である 生物進化の基本的な考え方は 多数の個体がランダムに相互作用する中で 適応度の高い個体が生き残り 適応度の低い個体は絶滅するというものである ( 自然淘汰 自然選択 ) 時間の変化とともに個体の分布は変わっていくが どのような特性をもった個体が長続きするのか ( 定常状態 ) が重要な関心である しかし 遺伝には突然変異が生じる そして 突然変異した個体が集団の中に増殖していくこともある 突然変異が生じても元の定常状態が維持されるとき 進化的に安定という 生物学では 進化的に安定な定常状態が成立する条件を分析する これをゲーム理論的状況に置き換えて考えよう 社会の中に様々な戦略をとる人々がいたとしても 利得が低い ( 適応度が低い ) 戦略はやがて用いられなくなる そして 利得の高い戦略が定常状態として出現する さらに 新たな戦略が登場することもある ( 突然変異 ) 進化ゲームでは どのような戦略が生き残って社会の中で定常状態となるのか また 新たな突然変異戦略が普及するのかを探究していくことになる 進化ゲームでは 進化論になぞらえて ゲームの プレイヤー ではなく エージェント または 個体 と呼ぶ
進化ゲームでは 非協力ゲームのように プレイヤーの選択から得られる期待利得を予想して意思決定するわけではない 戦略は自動的に決まっており 過去にとった行動の利得によって変更することもある ( たとえば 前回 A という行動をとったら利得が低かったから B という戦略に変更する など ) これを後ろ向き合理性という 2. 進化のダイナミックス例 ) 技術スタンダードの選択問題 パソコンの OS(Windows と Macintosh) 次世代 DVD( ブルーレイと HDVD) など 技術の標準規格 ( デファクト スタンダード ) をめぐって競争が行われている 人々は標準規格となった技術を使うほうがいろいろと便利である それでは どれが標準規格になるのだろうか パソコンの OS を例に考える 下記の利得のように みなが Windows で一致すれば 2 の利得があり Macintosh で一致すれば 4 の利得があるものとする つまり ここでは Mac のほうが性能がよいものと考える 互いの OS が異なると ファイルの交換などが面倒なので利得を 0 とする Win Mac Win 2,2 0,0 Mac 0,0 4,4 これは 2 人ゲームではなく C 行動または D 行動をとるエージェントが無数いると考える Win を使っているエージェントの割合を x Mac を使っている割合を -x とする Win ユーザーの利得は 2x+0(-x) Mac ユーザーの利得は 0x+4(-x) である x 2/3 のとき Win ユーザーのほうが利得が大きい 一方 x<2/3 のとき Mac ユーザーのほうが利得が大きい エージェントの割合は時間が経過するにつれ どのように変わるのだろうか 利得の大きい戦略が生き残るとしたら x 2/3 のとき Win x<2/3 のとき Mac となるはずである Win をとるエージェントの変化率を次の微分方程式で表す =(Win を選択したときの期待利得 - 社会全体の期待利得 ) Win を選択したエージェントの割合 ={2x-(2x x+4(-x) (-x))} x =(-6x 2 +0x-4)x 2
この式が正であれば Win が増加し 負であれば Win が減少 (Mac が増加 ) する 0 であれば Win の割合は変化しない たとえば Win ユーザーが 50% ならば dx/dt=-0.25 なので減少する Win ユーザーが 70% ならば dx/dt=5.64 なので増加する 戦略の増減が起きない ( つまり dx/dt=0) ときの x の値 ( 極値 ) を求めると x=2/3,,0 である つまり x の増減は下記のようになる x の値 0 0<x<2/3 x=2/3 x>2/3 x= dx/dt の符号 0-0 + 0 x の増減なし減少なし増加なし ここから 初期の Win ユーザーが 2/3 より少なければ減少を続け やがて Win ユーザーがいなくなる ( 全員が Mac ユーザーになる ) 時点で減少が終わる これに対して 初期の Win ユーザーがちょうど 2/3 であれば ユーザー数に変化はない Win ユーザーが 2/3 より多ければ増加し続け やがて全員が Win ユーザーとなる 進化の定常状態が戦略の初期分布によって異なる このように 初期条件とその後の経過によって現在の社会状態を経路依存性という Win ユーザーがいない (x=0) という状態から わずかな割合のユーザーが現れたとしても これらのユーザーはやがて戦略を変更するので また x=0 に戻る x= についても同様である しかし x=2/3 という状態から Win ユーザーがわずかでも増えれば Win ユーザーは増加してやがて x= となる また x=2/3 という状態から Win ユーザーがわずかでも減れば Win ユーザーは減少してやがて x=0 となる x=0, はわずかな突然変異が生じても元に戻るので進化的に安定であるが x=2/3 はわずかな突然変異で社会状態が大きく変化すので進化的に安定ではない 例 2) 異文化交流 日本人とアメリカ人が共同作業するとします お互いの文化や慣習に違いがありますが 一緒に働くうえでは共通したやり方を用いたほうが効率的です 相手に合わせるのは大 変なので それぞれ自分の文化と同じやり方であるほうが利得が大きいものとします 利得行列は下記の通りです アメリカ人 日本文化 米文化 日本人 日本文化 3, 0,0 米文化 0,0,3 3
このゲームでは 日本人とアメリカ人という 2 種類のプレイヤーが存在する この場合 それぞれの集団があると考え その中から 人がランダムに選ばれると考える 今 日本人で アメリカ人に会っても日本文化を通そうとする人の割合を x アメリカ文化に合わせようとする人の割合を -x とする 同様に アメリカ人で 日本人に会ってもアメリカ文化を通そうとする人の割合を y 日本文化に合わせようとする人の割合を -y とする 時間の経過とともにそれぞれの分布はどのように変わり 定常状態に到達するのだろうか このように異なる集団間での相互作用によって それぞれの集団の戦略が進化していくことを共進化という 日本人で日本文化を通そうとする人の割合の変化率は ={3y-(3yx+(-y)(-x)} x =(4y-) (-x) x 割合が変わらない (dx/dt=0) とき x=0, y=/4 日本人の戦略分布はアメリカ人の戦略分布によっても決まる 0 y</4 のとき dx/dt<0 /4 y< のとき dx/dt 0 アメリカ人で日本文化に合わせようとする人の割合の変化率は ={x-(xy-(-x)(-y)} x =(4x-3) (-y) y 割合が変わらない (dy/dt=0) とき x=3/4 y=0, アメリカ人の戦略分布は日本人の戦略分布によっても決まる 0 x<3/4 のとき dy/dt<0 3/4 x< のとき dy/dt 0 y /4 戦略の分布(0,0) と (,) はわずかな突然変異が起きても元に戻るので進化的に安定 (3/4, /4) はわずかな突然変異で元にもどる場合もあるが 大きく変化する場合もある したがって 進化的に安定ではない 0 3/4 x 4
練習問題 番号 名前 世の中には強気でケンカ好きな人もいれば 弱気で争いごとを避けたがる人もいます このような人々の性質を戦略とみなすと タカ-ハトゲームとして考えることができます そこで 次の利得行列で表される 集団のタカ-ハトゲームにおける進化的に安定な戦略をレプリケーター ダイナミクスによって求めなさい 平和 ( ハト ) 好戦 ( タカ ) 平和 ( ハト ) 2,2,3 好戦 ( タカ ) 3, 0,0 5