Microsoft PowerPoint - ゲーム理論2016.pptx

Similar documents
Microsoft PowerPoint - 計算機科学入門2014.pptx

Microsoft PowerPoint - ゲーム理論2018.pptx

Microsoft PowerPoint - DA1_2018.pptx

戦略的行動と経済取引 (ゲーム理論入門)

PowerPoint Presentation

情報 システム工学概論 コンピュータゲームプレイヤ 鶴岡慶雅 工学部電子情報工学科 情報理工学系研究科電子情報学専攻

Information Theory

明治大模擬2

東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint - 05.pptx

ゲーム論 I 第二回

Microsoft Word - apstattext04.docx

040402.ユニットテスト

PowerPoint Presentation

Microsoft PowerPoint - mp13-07.pptx

様々なミクロ計量モデル†

2014年度 九州大・理系数学

Microsoft PowerPoint - qcomp.ppt [互換モード]

Microsoft PowerPoint _人工知能とロボット2_rev.pptx

EBNと疫学

…好きです 解説

基礎統計

1 (1) (2)

- 2 -


PR映画-1

II III I ~ 2 ~

中堅中小企業向け秘密保持マニュアル



2016.

第121回関東連合産科婦人科学会総会・学術集会 プログラム・抄録

メソッドのまとめ

dlshogiアピール文章

写真 1: 挑戦状 1980 年代になってパソコン用の市販プログラムが発売されるようになったが まだとても弱かった アマの有段者になったのは 1990 年代半ばのことである その後は比較的順調に 2 年で 1 段程度のペースで強くなり 2000 年代になってアマチュアの高段者のレベルに達した 筆者自

Microsoft Word - lec_student-chp3_1-representative

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝


青焼 1章[15-52].indd

Microsoft Word - VBA基礎(3).docx

Microsoft Word - Stattext12.doc

ボルツマンマシンの高速化

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

発展プログラミング (5) 例題 5-03( 応用プログラム 3 目並べ その 2) 勝敗判定機能をそなえた 3 目並べ のゲーム盤を作りましょう 必要な変数を考えましょう 1 マス目の状態を保持する配列 整数型 :mas[] 2 何手目かを数える変数 整数型 :nante 3 ゲームが終了したかど

模擬試験問題(第1章~第3章)

Taro-最大値探索法の開発(公開版

特集01-2c.indd

情報処理Ⅰ

Microsoft PowerPoint - ゲーム理論2018.pptx

情報量と符号化

Microsoft PowerPoint - 10.pptx

< 中 3 分野例題付き公式集 > (1)2 の倍数の判定法は 1 の位が 0 又は偶数 ( 例題 )1~5 までの 5 つの数字を使って 3 ケタの数をつくるとき 2 の倍数は何通りできるか (2)5 の倍数の判定法は 1 の位が 0 又は 5 ( 例題 )1~9 までの 9 個の数字を使って 3

ダイジェスト 将棋ソフトは機械学習で強くなった近年 将棋ソフトの実力は人間のチャンピオンに近づいてきている 2013 年から 将棋ソフトとプロ棋士が対戦する 電王戦 というイベントが行われている 山本が開発した Ponanza( ポナンザ ) は 現役プロ棋士と対戦し 史上初の勝利を収めた その後も

provider_020524_2.PDF

東邦大学理学部情報科学科 2011 年度 卒業研究論文 Collatz 予想の変形について 提出日 2012 年 1 月 30 日 指導教員白柳潔 提出者 藤田純平

学習指導要領

AI 三目並べ

問 題

PowerPoint Presentation

スライド 1

Copywrite 遊学社長山訓 Part-SU0011 文字 ( 未知数 ) はできるだけ少なくしよう! x や y などの文字 ( 未知数 ) はできるだけ少ないほうが, 一般に計算処理はラクになります x1 個だけで OK なのに,x と y の 2 個使ったりすると, 問題によっては解けなく

プログラミング基礎

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft Word - NumericalComputation.docx

æœ•å¤§å–¬ç´—æŁ°,æœ•å°‘å–¬å•“æŁ°,ã…¦ã…¼ã‡¯ã…ªã……ã…›ã†®äº™éŽ¤æ³Ł

最 近 の 人 工 知 能 第 三 次 ブーム 機 械 学 習 が 一 つの 鍵 ( 特 に 深 層 学 習 ) たくさんのデータが 使 えることがもう 一 つの 鍵 世 の 中 で 広 く 使 われるようになってきた シンギュラリティ( 技 術 的 特 異 点 )の 議 論 が 盛 ん

2 場合の数次の問いに答えよ (1) 表裏がわかる 3 種類のコイン a,b,c を投げて, 表が出た枚数が奇数となる場合は何通りあるか (2) ソファ, テーブル, カーペットがそれぞれ 3 種類,4 種類,2 種類ある それぞれ 1 つずつ選ぶとすると, 選び方は何通りあるか 要点和の法則 2

配付資料 自習用テキスト 解析サンプル配布ページ 2

4 分岐処理と繰返し処理 ( 教科書 P.32) プログラムの基本的処理は三つある. (1) 順次処理 : 上から下に順番に処理する ぶんきそろ (2) 分岐処理 : 条件が揃えば, 処理する はんぷく (3) 反復処理 : 条件が揃うまで処理を繰り返す 全てのプログラムは (1) から (3) の

測量士補 重要事項「標準偏差」

Microsoft PowerPoint - DA2_2019.pptx

Microsoft PowerPoint - comprog11.pptx

データ解析

学習指導要領

模擬試験問題(第1章~第3章)

Information Theory

経営統計学

コンピュータ工学講義プリント (7 月 17 日 ) 今回の講義では フローチャートについて学ぶ フローチャートとはフローチャートは コンピュータプログラムの処理の流れを視覚的に表し 処理の全体像を把握しやすくするために書く図である 日本語では流れ図という 図 1 は ユーザーに 0 以上の整数 n

<4D F736F F F696E74202D A B837D836C CA48F435F >

ゲーム情報学研究の事例 将棋

学習指導要領

PowerPoint プレゼンテーション

Microsoft PowerPoint - algo ppt [互換モード]

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

ネットワーク工学演習 解答編 典型的な IP アドレス問題と解答を示す 解き方をよく覚えるように N 科 ある PC がある ネットワークの設定をみると IP アドレスが であり サブネットマスクは である 下記について解答せよ [1]

経済と社会

Microsoft PowerPoint - 三次元座標測定 ppt

調和系工学 ゲーム理論編

Microsoft Word - 19-d代 試é¨fi 解ç�fl.docx

<4D F736F F F696E74202D208AF489BD8A7782C CF97CA82A882DC82AF2E B8CDD8AB B83685D>

Microsoft PowerPoint - DA2_2018.pptx

Microsoft PowerPoint ppt

小石川中_試験問題_適性検査3.indd

Microsoft PowerPoint - ppt-7.pptx

Microsoft PowerPoint - 09re.ppt [互換モード]

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

スライド 1

Microsoft PowerPoint - DA2_2017.pptx

SNPs( スニップス ) について 個人差に関係があると考えられている SNPs 遺伝子に保存されている情報は A( アデニン ) T( チミン ) C( シトシン ) G( グアニン ) という 4 つの物質の並びによってつくられています この並びは人類でほとんど同じですが 個人で異なる部分もあ

Transcription:

125 126 ゲーム理論 ( 第 6 回ゲーム木探索 II) 九州大学大学院システム情報科学研究院情報学部門横尾真 E-mail: yokoo@inf.kyushu-u.ac.jp http://agent.inf.kyushu-u.ac.jp/~yokoo/ 先読みの効果 基本的には, 深く読めば読むほど強い 終盤の方が静的評価関数の値が信用できる そうでない場合は, 先読みの効果は必ずしも自明ではない 静的評価関数の値が, ノイズを含む値だとすると,MIN-MAX 法で集計した値はノイズを増幅している可能性がある 評価関数がエラーを含む場合 先読み 2 で,MIN-MAX は右を選ぶ 本当に右が良いか? 静的評価関数の値が確率 1/3 で正しく, 確率 1/3 で ±10 とする 本当に右が良いのは,(i) 左が過大評価の場合 (1/3), (ii) 左が正しく, 右で過大評価が一つもない場合,(iii) 全部が過小評価の場合 (ii), (iii) の確率は小さい 127 水平線効果 先読みの深さが一定だと, 将来の損失が明らかな場合に, 本質的でない先延ばしの手を選んでしまう可能性がある ほぼ負けが決定の状態で, 無意味な王手を繰り返す 頭を砂に埋めるダチョウみたいなもの 128 99 1000 1000 1000 100 100 100 100 129 130 ( とりあえずの ) まとめ 二人, 完全情報, 決定的ゲームはゲームの木で記述される 原理的には先手必勝 / 後手必勝 / 引き分け ゲーム木を完全に展開すれば分かる 完全に展開できない場合は, 静的評価関数を用いて, 一定の先読みで MIN-MAX 法を用いる ゲームプログラムの歴史 (1) ゲームをプレイするプログラムの作成は, 人工知能の fruit fly ( ショウジョウバエ ) と呼ばれていた. 1950 年 Shannon, Turing がコンピュータチェスの可能性を示す論文 1950 年代初めてチェスを指すプログラムが作成される 1950 年代 Herbert Simon が 10 年で世界チャンピオンに勝つと予想 1

131 132 ゲームプログラムの歴史 (2) 1960 年代哲学者のヒューバート ドレイファスがチェスのプログラムは 永久に世界チャンピオン に勝てないと予想 1960 年代 Arthur Samuel のチェッカープログラム 静的評価関数の学習 ( 強化学習の一種 ) 強い! ゲームプログラムの歴史 (3) 1980 年代 チェス専用コンピュータ スーパーコンピュータ Deep Thought CMU 1 秒間に70 万局面人間のベスト100に到達 133 134 Deep Blue IBM が 1989 年から開発を開始 1990 年世界チャンピオンのカスパロフと対戦 2 戦 2 敗 1996 年再度カスパロフと対戦 6 戦 1 勝 3 敗 2 分け 1997 年ニューヨーク 6 戦 2 勝 1 敗 3 引き分け 1 秒間に2 億個の状態を評価 3 分で14 手先読みスーパーコンピュータ +チェス専用の論理回路 512 台 将棋 難しさの要因 持ち駒制度 平均分岐数の大きさ 勝負の長さ 静的評価関数のむずかしさ 小駒が多い 将棋 ( 続き ) 平均分岐数の多さから,α-β 探索を使うことは困難で, 従来は, あらかじめ有望な手を絞り込む手法が中心 最近の強いソフト ( ボナンザ ) は, 絞込みをあまり行わないことが特徴 評価関数の自動学習を頑張っている 本気の勝負で, ソフトが名人に勝つ日は ( 実現するなら ) かなり近い or もう遅い? 135 将棋 将棋は先手必勝? ( 羽生名人が言っているらしい ) もちろん本当はどうなのか分からないが, もっともらしい気がする 統計的には先手の方が勝率が高いらしい 多くのゲームで, 必勝のパターンの方が, 必敗のパターンよりずっと数が多い. 一つの必敗のパターンから, 数多くの必勝のパターンが生まれる. 一方, 必敗のパターンは, その子ノードがすべて必勝にならないといけない. 136 2

137 138 二人ゲーム以外への応用 一人での意思決定だが, 偶然の要素がある場合 : 自然というもう一人のプレイヤがいると考える 自然がどう行動しても ( 自分に取って最悪の手を打っても ), 自分が勝てるような手を選ぶようにする 偽金貨を見つける 12 個の見た目は全く同じ金貨がある 一つだけ偽の金貨があり, 本物よりわずかに重い 天秤秤を三回だけ使って, 偽金貨を見つけられるか? 139 140 例えば, 金貨を一つずつ選んで秤にのせた場合, 起こりうる可能性は三通り つりあう 左が重い 右が重い どれが起こるかは分からない ( 自然の選択 ) どれが起こっても大丈夫なように計画を作っておく 偽金貨を見つける ( 答え ) まず4つずつ比べる つりあわなかったら重かった方, つりあったら残りの4 個の中に偽金貨がある うたがわしい4 個から,2 個ずつ比べる 重いほうの2 個のどちらかが偽金貨 2 個を比べて重いほうが偽金貨 他の解も多数存在 141 142 一つだけ偽金貨があることは分かっているが, それが本物より重いか軽いか分からない場合 うまく工夫するとやはり 3 回で十分 それが重いか軽いかも分かる ヒント : 最初は 4 つずつ比較 二回目がポイント, うまくまぜる 1, 2, 3,..., 11, 12 の金貨がある (1, 2, 3, 4) と (5, 6, 7, 8) を比較 If (1, 2, 3, 4) = (5, 6, 7, 8) : 偽は 9,, 12 の中 (1, 9) と (10, 11) を比較 If (1, 9) = (10, 11), 12 が偽 (1) と (12) を比較,(1)<(12) なら重い, (1)>(12) なら軽い If (1, 9) < (10, 11) (10) と (11) を比較,(10)=(11) なら 9 が軽い, (10)<(11) なら 11 が重い,(10)>(11) なら 10 が重い If (1, 9) > (10, 11) (10) と (11) を比較,(10)=(11) なら 9 が重い, (10)<(11) なら 10 が軽い,(10)>(11) なら 11 が軽い 3

143 144 If (1, 2, 3, 4) > (5, 6, 7, 8) : 9,,12 は本物 (1, 2, 5) と (3, 6, 12) を比較 If (1, 2, 5) = (3, 6, 12) --- 4, 7, 8 のどれか (7) と (8) を比較,(7)=(8) なら 4 が偽で重い,(7)<(8) なら 7 が軽い,(7)>(8) なら 8 が軽い If (1, 2, 5) < (3, 6, 12) --- 5 が軽いか 3 が重い (3) と (12) を比較,(3)=(12) なら 5 が軽い,(3)>(12) なら 3 が重い If (1, 2, 5) > (3, 6, 12) --- 1, 2 が重いか 6 が軽い (1) と (2) を比較,(1)=(2) なら 6 が軽い,(1)<(2) なら 2 が重い,(1)>(2) なら 1 が重い If (1, 2, 3, 4) < (5, 6, 7, 8) --- 省略 コインの個数 n に対して,3 回で偽金貨を発見できる最大の n はいくつか? 重いことが分かっている場合 重いか軽いか分からない場合 重いか軽いかも判定しないといけない場合 nと最小の秤の使用回数との関係は? 145 146 偽金貨を見つける ( 一般化 ) コインの個数 n に対して,3 回で偽金貨を発見できる最大の n はいくつか? 重いことが分かっている場合 結果は n 通り 天秤秤を三回使うと, 端点は 27 個 よって n=27 まで解ける --- 実際にそのような手順があることを示せる 重いか軽いかも判定しないといけない場合 結果は 2n 通り よって n=13 まで解ける (2n<27) --- 間違い, これは n=14 は解けないことを証明しているだけで,13 に関しては本当に解ける方法を示さないとダメ 偽金貨を見つける ( 一般化 ) 重いか軽いかも判定しないといけない場合 結果は 2n 通り 最初に k 個ずつ比べるとする 左 ( 右 ) が重い場合, 残る可能性は 2k 通り つりあう場合は 2(13 ー 2k) 通り これらすべてが 9 通り以下でないとダメだが, そのような k は存在しない. 147 148 二人ゲームの拡張 三人以上でするゲームの場合は? 偶然の要素の入るゲームはどうする? 三人の場合, 自分以外の二人が共謀すると仮定すれば二人ゲームと同じ, それでも自分に必勝法があれば必勝, しかし, 必勝法がないから必ず負けるとも言えない ( 二人が共謀するとは限らない ). また, 偶然もプレイヤの一人と思えば, どんな目が出ても勝てるような必勝法があれば, それを求めればよい ( 多分存在しない ). ポーカーではナッシュ均衡を求めるのが主流. 相手もナッシュ均衡なら, 平均的には引き分け. 相手が逸脱すれば勝てる. プレイヤ 2, 3 が共謀する場合, プレイヤ 3 が 6 を言って回せばプレイヤ 2 の勝ち プレイヤ 1 がいくつを選んでも, プレイヤ 2, 3 が共謀すれば 6 を言って順番を回せる よって, 共謀すればプレイヤ 2, 3 が必勝 よってプレイヤ 1 の必勝法はない 4

149 150 プレイヤ 1, 2 が共謀する場合, プレイヤ 2 が 6 を言って回せば勝ち プレイヤ 1, 2 が共謀すれば 6 を言ってプレイヤ 3 に順番を回せる よって, 共謀すればプレイヤ 1, 2 が必勝 よってプレイヤ 3 の必勝法はない プレイヤ 1, 3 が共謀する場合, プレイヤ 1 が 3 まで言えば, プレイヤ 2 が選べるのは 4 から 6, 次にプレイヤ 1 が 10 を言える よって, 共謀すればプレイヤ 1, 3 が必勝 よってプレイヤ 2 の必勝法はない 誰にとっても ( 単独でプレイする場合の ) 必勝法は存在しない 151 152 ゲームの例 : ニム ( マッチ棒 ) マッチ棒で,3 本,5 本, 7 本の三つの山を作る 交互にマッチ棒を取っていく 一つの山を選んで, 好きな数だけ取る ( 全部取っても良い ) 自分の手で全部取ったほうが勝ち 前のコインバージョンと違って, 山が分割されることはない このゲームは先手必勝 or 後手必勝? ニムの性質 (I) 簡潔な必勝法の記述方法がある 各山の本数を二進数で表現 すべての山に関して, 上記のビット毎の排他的論理和を取る 値が0 以外なら, その手番のプレイヤの必勝, そうでなければ相手が必勝 ニムの性質 (II) 必勝法の直観的な意味 最終的に 0 を相手に渡せば勝ち この排他的論理和は明らかに 0 排他的論理和が 0 の場合, どのように取っても 0 にすることは不可能 取る山の最大のビットは 1 から 0 に変化する よって,0 を渡し続ける限り負けることはない 排他的論理和が 0 以外の場合,0 以外の値の最大の桁を持つ山から適切に取ることにより, 必ず 0 にできる 他のゲームにも同様なアイデアが利用可能 ( グランディ値 ) 153 5