世界コンピュータ将棋選手権参加報告、及び、GPS 将棋の技術

Similar documents

Microsoft PowerPoint - vc2013.s.takeuchi.pptx

dlshogiアピール文章

レーティングと棋譜分析

ナッシュ均衡 ( 最適反応 ) 支配戦略のみで説明できない場合 ( その) 戦略 A 戦略 B 戦略 A (,) (0,0) 戦略 B (0,0) (,) 支配戦略均衡 : 無しナッシュ均衡 :(,) と (,) 支配戦略均衡よりも適応範囲が広いナッシュ均衡の良い性質各プレイヤーは戦略変更の積

しています. これには探索木のすべてのノードを探索する必要がありますが,αβカットなどの枝刈りの処理により探索にかかる計算時間を短縮しています. これに対して, 探索するノードを限定したり, 優先順位をつけて選択的に探索する選択探索という探索方式があります. 本チームはノードの選択方式としてノー

将棋吊人のレーティングと棋譜分析

世界コンピュータ将棋選手権 [30] CSA CSA 電王戦 [31] Computer Olympiad [32] ICGA コンピュータ将棋対局場 [33],floodgate [34] 24 floodgate floodgate

用しないことを世界選手権大会で試みて参りました. 芝浦将棋 Jr. でも強化学習で評価関数を学習するなど, 上記の開発コンセプトに沿って開発を進めていくつもりです. 3. 開発メンバー本チームの開発統括者は芝浦工業大学工学部情報工学科に所属する教員, 五十嵐治一教授です. 開発メンバーはすべて五十

PowerPoint Presentation

将棋プログラムの現状と未来

ゲーム情報学研究の事例　将棋

CodeRecorderでカバレッジ

ビッグデータ分析を高速化する分散処理技術を開発日本電気株式会社

合わせを許すフリースタイルチェスという対戦形式も考案され, 発展を遂げている. この対戦では, あまり強くない人間 + コンピュータ + 良いプロセスがグランドマスター + コンピュータ + 良くないプロセスに勝利するということが起こっている. このことは, コンピュータをどう使いこなすか

Microsoft PowerPoint - install_NGSsokushu_windows(ver2.1).pptx

ERDAS IMAGINE における処理速度の向上株式会社ベストシステムズ PASCO CORPORATION 2015

“nice to meet you”

掲示板の閲覧掲示板の閲覧登録権または参照権のある掲示板グループの掲示版を閲覧することができます各利用者の権限は管理者によって設定されます掲示板を閲覧する 1 掲示板画面を表示し閲覧する掲示が含まれている掲示板グループ掲示板の順にクリックします掲示板画面の表示方法ポータル画面の画面説

情報システム工学概論コンピュータゲームプレイヤ鶴岡慶雅工学部電子情報工学科情報理工学系研究科電子情報学専攻

PowerPoint Presentation

インストール先 PC 推奨環境 Intel Virtualization Technology 対応 CPU Windows 7 以降 64 bit メモリ 4 GB 以上ハードディスク空き容量 20 GB 以上インターネット接続 ( アップデートをうため ) ( 動作を保証するものではありま

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint - DEXCS2015_Salome_Installation pptx

論文誌用MS-Wordテンプレートファイル

PowerPoint プレゼンテーション

TopSE並行システムはじめに

Touch Panel Settings Tool

連載講座 : 高生産並列言語を使いこなす (3) ゲーム木探索問題田浦健次朗東京大学大学院情報理工学系研究科, 情報基盤センター目次 1 概要 17 2 ゲーム木探索必勝必敗引き分け盤面の評価値 αβ 法指し手の順序付け (mo

リソース制約下における組込みソフトウェアの性能検証および最適化方法

Microsoft PowerPoint - ShadowProtectIT手順書_ ppt

Microsoft PowerPoint - ゲーム理論2016.pptx

EnSightのご紹介

AI 三目並べ

wdr7_dial_man01_jpn.indd

vdi_service_details

4-1 Palmi をインターネットに接続するには Palmi に最新のニュースや天気予報などの情報を読ませたり Palmi が撮影した写真をメールで送信させたりといった使い方をするにはインターネットに接続する必要があります Palmi をインターネットに接続する環境を準備する Palmi をイン

ic3_cf_p1-70_1018.indd

基本設計書

1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します一般に OSS は営利企業ではない特定のグループが開発するソフトウェアでソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが大規模な

Maser - User Operation Manual

Microsoft PowerPoint - Android+TPMによるセキュアブート_KDDI研_後日配布用

大学ファイルサーバー ( 共有フォルダ ) について大学ファイルサーバー ( 共有フォルダ ) への利用について... 2 共有フォルダの説明... 3 共有フォルダ構成... 3 教職員共有フォルダ... 3 学生共有フォルダ... 4 教職員 / 学生個人フォルダ... 4 大学ファイルサーバ

XAMPP で CMS のお手軽テスト環境を手に入れよう 2011/5/21 上村崇 1

伝送通信ソフトVer.8マニュアル

Sｉ知識情報処理

2019 年度国際ペタンク大会日本代表選手選考会及び強化指定選手選考会開催要項年度の選考方法 (1) 1 次選考会と2 次選考会を 4で記載する日程にて実施する (2) 選考会は男子の部女子の部ジュニアの部に分けて実施する (3) 2019 年度より選考会は2 年毎の開催と

arduino プログラミング課題集 ( Ver /06/01 ) arduino と各種ボードを組み合わせ制御するためのプログラミングを学ぼう! 1 入出力ポートの設定と利用方法 (1) 制御( コントロール ) するとは外部装置( ペリフェラル ) が必要とする信号をマイ

V6.5L20 の主な変更点 1. ScanSnap の最新の推奨動作環境 (CPU: Intel Core i5 2.5GHz 以上メモリ容量 :4GB 以上 ) における PDF ファイルの出力表示処理を全面的に見直しました ( 1) 特に ScanSnap Organizerの表示性能が大

B: サイトから参加 1) ブラウザからミーティングが開催されるコーポレートサイト URL にアクセスします 2) ミーティング一覧内の自分の参加するミーティングから [ 参加 ] をクリックします C: パーソナル会議へ参加 1) ブラウザからミーティングが開催されるパーソナル会議 URL にアク

平成 30 年 9 月 10 日修正海外ベンチャー企業連携案件組成イベント Global Connection 2018 募集要領平成 30 年 7 月 10 日 IoT 推進ラボ経済産業省 (IoT 推進ラボ事務局 : 一般財団法人日本情報経済社会推進協会 ) 0

ICカードリーダー動作確認手順書

Transcription:

世界コンピュータ将棋選手権参加報告及び, GPS 将棋のアルゴリズム JST ERATO 湊プロジェクト研究員竹内聖悟 1

概観世界コンピュータ将棋選手権の紹介今年は GPS 将棋が優勝上位 5 プログラムがプロ棋士と対局予定コンピュータ将棋のアルゴリズム GPS 将棋とそのアルゴリズムを紹介約 800 台のマシンで疎結合並列探索 2

あらためて自己紹介竹内聖悟 JST ERATO 湊プロジェクト研究員 ( 札幌 ) GPS 将棋の開発メンバー GPS = Game Programming Seminar 東大総合文化研究科の教員と学生が中心となって開催しているゼミ @ 駒場コンピュータ将棋囲碁やチェスの研究性能評価探索制御など ERATO : Simpath アルゴリズムの並列化, 3

将棋インドのチャトランガが起源? ヨーロッパ : チェスアジア : 各国の将棋中国韓国タイモンゴルなど他の将棋類との大きな違い取った駒を再利用終盤でも駒数が同じ : 分岐数も減らない駒の動きが弱い 4

コンピュータ将棋選手権の記事読売新聞朝日新聞週刊将棋掲載予定? 将棋世界情報処理学会誌出典: 朝日新聞 5

IBM Deep Blue チェスのスパコンカスパロフに勝利してから 15 年 1997/5/12 ( 米国時間 5/11) 誕生日じゃない 1 秒間に 1 億局面探索 6 Tech Crunch か

コンピュータ将棋への注目 2010 年 10 月情報処理学会の学会創立 50 周年記念事業にてあからが清水市代女流王将と対局勝利 2012 年 1 月電王戦にてボンクラーズが元名人の米長邦雄日本将棋連盟会長と対局勝利出典 : 情報処理学会 7 出典 : 産経ニュース

プロ棋士との対局将棋プログラムが強くなりプロレベルに近づいている ( 諸説あり ) プロ棋士との対局イベント電王戦プロ棋士とプログラム 5 対 5 の対局が予定電王戦出場プログラムは今年の世界コンピュータ将棋選手権の上位 5 プログラム 8

世界コンピュータ将棋選手権 CSA 主催 (Computer Shogi Association) コンピュータ将棋の強さを競う大会ハードウェア : 制限なし会場持込の場合騒音と電源の制限ありソフトウェア : 公認の将棋ライブラリライブラリ例 : Bonanza, GPS 将棋, ライブラリは予選通過が 2 つまでと制限一から作らないでも参加できる強くするアイデアとその実装は必要 9

参加資格自作のプログラム 1 つ機種は問わない ( 原則として持ち込み ) 複数のプログラムには参加できない思考部について自力で十分な工夫を施したものであることその他細かい点はルール参照 CSA プロトコルでの LAN 対戦への対応など 10

対局時間 25 分切れ負け, 秒単位で消費 1 手あたり 1 秒は消費比較的短い参考 : プロの対局 : 各 3 時間など, 1 分単位で消費 2 時間 59 分使ってもかならず1 分は考えられるタイトル戦には各 8 時間で2 日制のものもアマチュア : 1 手 1 分や 20 分 +1 手 30 秒など 11

今大会の上位 5 プログラム GPS 将棋 Puella α ( 旧名ボンクラーズ ) ツツカナ Ponanza 習甦 http://www.computershogi.org/wcsc22/team.html 12

スケジュール 12 月 WCSC 参加募集 1 月末 WCSC 参加締切 2 月オープン戦 3 月アピール文書など締切 4 月オープン戦 4 月末 - 5 月マシン送付など 5 月 2 日前日テスト 5 月 3 日 - 5 日選手権 13 WCSC = World Computer Shogi

選手権に必要なもの参加申し込み参加費 1 万円将棋プログラムマシンアピール文書当日参加できるスケジュール 14

将棋プログラムを作ろう CSA 公認ライブラリの Bonanza を使おう強いし GPS 将棋よりも読みやすいと評判! bonanza~/src/client/ 以下にソース評価関数には bonanza~/winbin/fv.bin が必要 Bonanza を改造する探索を評価関数を 15

次は? そういえば名前がない Bonanza が元なので Honanza と名付けるカタカナならホナンザ Honanza はちゃんと動くのか? 変なことがないか手元で確認したい GUI を使って指し手の確認 Windows かつ Bonanza 付属の CSA 将棋 16

GUI 将棋所 : Windows USI への対応が必要読み筋や評価値のグラフがあって見やすい Linux やMac ならwine やmono で頑張る? 自動対戦もしてくれる Universal Shogi Interface Bonanza : U2B http://www.geocities.jp/shogi_dep ot/ 将棋所 17 http://www.geocities.jp/shogid

実力を試したい floodgate 自動対局場所 floodgate に接続 30 分に一度他のプレイヤと対戦 15 分切れ負け組み合わせはレーティングなどを元に決定対局結果に応じてレーティングがつく寝ている間に試せる騒音熱電気代に注意 http://wdoor.c.utokyo.ac.jp/shogi/floodgate.html 18

floodgate 決勝プログラムも参加本番マシンでの参加も予選通過の目安にも? gps_normal (2150) が一次通過の目安とか様々なプログラムが参加手元では出にくいバグ, 弱点の発見に 19

情報収集発信情報処理学会ゲーム情報学研究会 (sig-gi) ゲームプログラミングワークショップ (GPW) 研究会 CSA 例会 CG, ACG Blog など何となくはてなダイアリーが多い? 20

ゲームプログラミングワークショップ (GPW) 毎年 11 月に箱根で開催 2012 年 11 月 9 日 ( 金 ) から 11 日 ( 日 ) 研究発表がメイン夜はナイトイベント, コンピュータ将棋や囲碁の大会情報交換交流 http://sig-gi.c.u-tokyo.ac.jp/gpw/2012/ 21

選手権参加申込 12 月頃に募集参加締切は 1 月いっぱい何が必要? 将棋プログラムマシン参加費 1 万円アピール文書選手権当日の予定 22

申し込んだその後は? 2 月 4 月オープン戦が開催接続テストを兼ねている参加数は少ない. GPS 将棋はできるだけ参加 floodgate は拡張プロトコル本番で拡張のまま参加してうまくいかないこともありえるのでここで経験するのが吉お弁当やパーティーの予約, 追加入場者ホテルや航空券の予約 (GW!) マシンの送付 23

本番直前一次予選前日に会場にて接続テスト本番環境でのテスト他の参加者との交流も遅刻しないように適当な睡眠をマシンを送付しているので予選前はすることがない場合も 24

当日参加受付本番ログイン, 確認に返事, 対戦相手に挨拶将棋を眺めながら雑談や情報交換終局したら挨拶以下, くり返し対局が始まれば離れても OK むしろ触ってはいけないプロ棋士やアマの強い人がコメントくれるかもしれない 25

参加後予選を通過したなら点呼に答えることマシンの送付挨拶片付け帰宅選手権参加記関連 blog や情報を追う本番マシンでfloodgate に参加などなど 26

スケジュール 12 月 WCSC 参加募集 1 月末 WCSC 参加締切 2 月オープン戦 3 月アピール文書など締切 4 月オープン戦 4 月末 - 5 月マシン送付など 5 月 2 日前日テスト 5 月 3 日 - 5 日選手権 27 WCSC = World Computer Shogi

参加ハードウェア次の中で選手権に参加したことのあるハードウェアは? 1. ファミコン 2. PS3 3. FPGA 4. imac 788 台 28

参加ハードウェア次の中で選手権に参加したことのあるハードウェアは? 全部! 1. ファミコン ( 第 1 回 ) 招待プログラム 2. PS3( 第 18 回 ) 3. FPGA( 第 18, 19 回 ) ボンクラーズ開発者 4. imac 788 台 ( 第 22 回 )GPS 将棋 29

今大会について日時 : 5 月 3 日から 5 月 5 日 (GW!) 場所 : 電気通信大学全 42 プログラムが参加奇数だったため 1 プログラムが招待参加ここ 10 年ぐらいは 40~50 プログラム今大会から決勝シードなし上位者を電王戦へ推薦 30

第 22 回大会の主催共催など主催共催コンピュータ将棋協会 (CSA) 電気通信大学エンターテイメントと認知科学研究ステーション早稲田大学ゲームの科学研究所特別協力協賛後援公益社団法人日本将棋連盟富士通株式会社株式会社ドワンゴ総務省文部科学省経済産業省一般社団法人情報処理学会一般社団法人情報サービス産業協会電気通信大学早稲田大学メディアネットワークセンター 31

予選と決勝参加プログラム数試合数一次予選 26 7 8 二次予選 24 ( シード 16) 9 8 選出決勝 8 7 ( 総当り ) (5) 予選では完全スイス式と変形スイス式で組み合わせ基本的に同じ成績のもの同士を当てる順位の決定は勝ち数, ソルコフ, SB, MD, DB を見る強い相手と戦った方が有利 32

GPS 将棋将棋プログラム GPS のメンバーが主体となって開発 GPS = Game Programming Seminar 東京大学大学院総合文化研究科の教員, 学生が開催 GPS 将棋, OSL は CSA 公認ライブラリ OSL = Open Shogi Library 選手権 : GPS 将棋としては10 回参加成績 : 2009 年優勝 10 年 3 位 12 年優勝 33

GPS 将棋の特色コンピュータチェスやコンピュータ将棋の最新の研究を取り入れている実現確率を用いた探索評価関数の機械学習 ( 並列 )df-pn による詰将棋探索疎結合並列探索オープンソース, フリーウェアクラスタ : 約 800 台約 3200 コア 34

計算機群情報基盤センター教育用計算機を利用東京大学駒場キャンパス情報教育棟平日と土曜日は学生が利用土曜日は一部演習室は閉鎖されている日曜祝日しか利用できない! 利用申請が必要申請者は離れられない http://gps.tanaka.ecc.utokyo.ac.jp/gpsshogi 35

GPS 将棋の参加記 5/2: 接続テスト, 駒場と会場 5/3: 一次予選, 駒場にて作業 5/4: 二次予選, 駒場と会場 5/5: 決勝, 駒場と会場終了後に現地へ集合 / 表彰式など 36

5/2 : 前日夕方から会場へリモートのため回線の接続テストネットワーク越しに対局できるかテストなど問題なく終了 37

5/3 : 一次予選シードなので参加しないで良い情報教育棟にて作業東大駒場キャンパス GW に入ったので imac 全台を借りられた 1 人で全台起動すると 1 時間半かかる管理者がいないといけないログの読み方や作業の共有おかしな点を発見するため定跡のチェック変な指手がないかのチェック 38

5/4 : 二次予選朝は駒場マシン起動の手伝いなど起動の仕組みがうまくいったので不要だった会場とskype で接続中継を眺めるなど午後から現地へ予選通過後の作業ルートでの分割数を増やす定跡の一部変更時間制御 / 切れ負けの反省 39

5/5 : 決勝駒場中継を眺める個人の感想 : 今年は安心して見ていられた最終戦を除く全局終了後マシンを落として現地へ閉会式と表彰式に間に合った懇親会 40

選手権の模様の紹介コンピュータ将棋選手権ネット中継 http://computer-shogi-live.cocolognifty.com/ 情報交換しながら和気あいあい本人同士が将棋を指すわけではないでも胃が痛くなったりする少しくだけたワークショップなどと雰囲気が似ているかも発表はないが 41

個人的なポイントなど一次予選 Selene の全勝, 新規参加組が多く予選通過二次予選決勝シードがないためより厳しい戦いクラスタ参加が6 組? 去年の決勝 8プログラム + ツツカナの争い決勝この 9 プログラムは 10 位以下のプログラムに負けていない Bonanza が予選落ち GPS 将棋がラスト前で優勝を決めたかと思いきや上位 5 位の争い新人賞と独創賞 42

報道一般紙読売新聞, 朝日新聞将棋専門誌週刊将棋 5/16 号, 将棋世界 7 月号? その他情報処理学会学会誌例年は 8 月号にミニ小特集 Yahoo ニュースや /. 43

決勝 8 プログラム + 1 の紹介 GPS 将棋 Puella α ( 旧名ボンクラーズ ) ツツカナ Ponanza 習甦激指 YSS Blunder Bonanza http://www.computershogi.org/wcsc22/team.html 44

以上選手権の紹介と参加報告でした 45

コンピュータ将棋入力 : 局面 (+ 時間, これまでの棋譜 ) 出力 : 指し手入力出力 46

ゲーム木ゲームを木として表す x o 局面 : ノード手 : 枝 x o x x x o x 展開すれば解ける! ( 必勝法 ) x o x o x x o x o x o x o x x o x x o x x o x o x x o x o x x 47

ゲーム木サイズゲームチェッカーオセロチェス中国象棋将棋囲碁(19路) ゲーム木サイズ 10^30 10^60 10^120 10^150 10^220 10^360 解析済人間より上人間のトップレベル人間のトップレベル? トップにはまだアマチュアレベル阿伽羅あから = 10^224 現実的には解けない 48

強いプログラムを作るには評価関数 ( 形勢判断 ) 探索 ( 先読み ) どちらかが完全解析できる現実的でない 49

1 手読み 1 手進めてから選ぶ 1 手で終わるゲームなら解析 : 局面 : 手実際のゲーム : 1 手では終わらない 1 手先の勝ち負けを知りたい形勢判断勝分負??? 50

1 手読み + 形勢判断 1 手進め形勢が良い手を選ぶ形勢判断が完璧なら解析実際のゲーム : 不正確 +100 0-90 深い探索正確な形勢判断が必要 51

評価関数局面の良し悪しを数値化評価項目 / 特徴とその重みからなる例 ) 5*( 駒得 ) + 10*( 危険度 ) +... 重みは機械学習で自動調整特徴は人間が考える局面評価関数評価値 +300 52

評価関数ひとむかし特徴を考える人間が考える, 将棋の知識が必要駒の点数, 王の危険度重みをつける人間が考える, 将棋の知識が必要歩が 100 点として香車は 200?400? パラメータ数に限界せいぜい数百数千?

評価関数, 現在特徴をたくさん考える人間が考える駒の点数, 王の危険度重みをつける機械学習による自動処理棋譜の指し手を選ぶように重みを調整パラメータ数は数百万, 数千万, 億?

GPS 将棋の評価関数序盤, 中盤, 中盤 2, 終盤の 4 種類 8,952,491 項目 ( 重み 0 も含める ) 2009 年は約 300 万 : およそ 3 倍に局面の進行度に基づき内分を取る人間の知識で項目を選択重みは棋譜から調整調整後強くなったか対戦で確認, 採否 55

Min-Max 探索 Max Player は最大値 Min Player は最小値を選ぶ Best Move 3 Root Max-Player 3 2 Min-Player 3 5 2 4 3 2 5 1 1 2 1 4 5 3 6 2 4 5 1 1 9 2 3 4 1 4 数字は評価値点数が高いほど Max-Player が有利 56

探索評価関数 + αβ 探索互いに最善を尽くす前提深さ打ち切り探索葉ノードで評価関数による評価値を得る一般に, 深く探索するほど強い速度を上げる工夫局面探索指し手, 評価値 (7776FU, +300) 57

αβ 探索 Min-Max を効率的に行い同じ結果を得る不要な探索を行わない : 枝刈探索窓, alpha-beta window の導入興味のある評価値の範囲 (alpha, beta) として表記返り値 V で更新 Max : If (V > alpha) alpha = V Min : if (V < beta) beta = V 58

枝刈枝刈条件 Max : V >= beta Min : V <= alpha 例 : ルートの Max ノードは 5 以上 Max Min 矢印のノードに左の子ノードから 3 が返った値は 3 以下になる ( Min ノード ) ルートには 3 以下しか返らない選ばれないそれ以上探索するのは無駄枝刈 5 3 (5, ) (5, ) Cut! 59

αβ 探索 (-,5) ) 3 2 (-, ) 3) 3 Best Move 3 5 5 (-, (3, ) ) (-, (3, ) (-, ) 3) (-, (3, 6) ) 3) Cut 3 Root (3, ) (3, ) (3, ) 1 2 2 2 Cut (3, ) Cut Max-Player Min-Player 5 3 6 2 9 5 1 2 数字は評価値点数が高いほど Max-Player が有利 60

αβ 探索の結果 3 Root 3 3 5 2 2 3 2 5 1 2 5 3 6 2 9 5 1 2 枝刈されたノード枝刈されたノード 61

αβ探索と効率探索の順序良い手を先に探索すると枝刈の効率が良いハッシュ表千日手や合流 76歩 34歩 66歩 66歩 34歩 76歩 62

探索順序の重要性 Max で小さい値 Min で大きな値を先に探索 Root 3 Best Move 2 3 Max-Player Min-Player 4 2 4 3 1 4 1 2 1 4 2 3 4 1 4 1 3 2 4 1 5 4 6 2 5 3 αβ 探索で枝刈が起こらない! 63

効率的な探索 Null-window search (NWS) V より大きいかを調べるなら (v, v+1) で探索探索窓の幅が Null, 枝刈がすぐ起こるので高速 Principal Variation Search (PVS) 一番左端は (-, ) で探索 : 評価値 v 残りに PV の結果を上回る手がないか調べる v = Null-window search (v, v+1) 上回る (v > v) なら (v, ) で再探索 (v ) 64

PVS 左端の探索結果は 5. 5 より大きくなるか調べたい (5,6) で NWS 5 Root 5 (5,6 ) (5,6 ) 3 (5,6 ) 3 2 (5,6 ) 3 (5,6 ) (5,6 ) (5,6 ) 1 (5,6 ) 5 3 6 2 9 5 1 4 1 2 2 2 2 3 4 1 4 65

探索の効率化に重要な情報探索順序枝刈が起こらないことも探索窓の広さ狭いほど枝刈は起こりやすいハッシュ表探索結果の保持 : 同一局面の探索を行わない手の並び替え : 浅い探索結果を元に 66

探索の工夫枝刈探索延長探索順序探索窓ハードウェア専用ハードウェア ( 例 : Deep Blue) CPUのオーバークロックマルチコアクラスタ / 疎結合 67

並列化の難しさ処理は並列に行える? 処理に順序依存性があると難しいオーバヘッド探索 : ( 逐次なら ) 枝刈されるノードの探索同期 : 他のプロセッサの結果を待つ通信 : 仕事の分割, 仕事を通信, 通信遅延 68

αβ 探索の結果色のついた分を探索するのが探索オーバヘッド 3 Root 3 3 5 2 2 3 2 5 1 2 5 3 6 2 9 5 1 2 枝刈されたノード枝刈されたノード 69

メモリ共有環境例 : 最近のパソコン Nコアプロセッサ間の通信は十分速い通信オーバヘッドはあまりない PV Split PVS の並列化左端を1 人で展開残りのノードを並列にnull window search ハッシュ表を共有ロックレスハッシュ 70

PVSplit 2 並列 Processor1,2 (P1,P2) Max Min P1 P1 P2 P 1 P 2 P 1 P 2 P1 P2 1 2 2 3 3 4 4 5 5 71

GPS 将棋の疎結合並列探索 2010 年の第 20 回大会からクラスタ参加順位 : 3 位 -> 6 位 -> 1 位! コア数 : 666, 800, 3200 情報教育棟の imac, Amazon EC2 (2011) ネットワークで緩く接続されたマシン群通信速度はそんなに速くない情報のやり取りがあまり出来ない協調的に動かすのが難しい 72

単純なアイデア木を展開していき台数分ノードができたら全ノードに 1 台ずつ割り振る無駄な探索がかなり多い台数効果が出ない将棋の平均合法手数は80 1 手深く探索するには80 台 2 手深く探索するには6,400 台必要! 73

メモリ非共有環境情報のやり取りが通信となり遅い探索結果やハッシュ表ハッシュ表については local, global, ハッシュ値に応じて割り振る, hybrid などが考えられる探索結果を使うには他の人の仕事が終わるのを待つ必要がある 74

従来手法 YBWC, APHID, TDSAB YBWC は PVSplit に近い手法合議将棋では実際に成功した例があまりないチェスでもRybka がクラスタ探索をしているが詳細は不明他ではクラスタ探索を聞かない http://cluster.rybkachess.com/ 75

合議お手軽な ( 疎結合 ) 並列探索複数台で1 台のマシンよりも強くなる 4, 8 台で55% 前後逓減は速い準備 : 異なるプログラムの用意 : 台数分評価関数に乱数を入れるなど手順 : それぞれ同じ局面を探索多数決で指手を選択 76

8台合議例左から手a,b,c と並ぶ指手票 a P1, P2, P4, P8 b P3, P5 c P6, P7 P3 P4 手a が選ばれる Root P1 P2 P5 P6 P7 P8 77

GPS 将棋探索窓を共有しない同期オーバヘッドと効率のトレードオフハッシュ表は各自で持つ割当て時に前回担当分に割当てられるここでは通信オーバヘッドはない並び替えは探索など探索オーバヘッドはあるが並び替えがうまくいけば少なく抑えられる 78

GPS 将棋のアプローチ ( 概要 ) ルートで手生成上位 N 手にマシンを割当順位に応じて台数を変化残りの手は1 台で通常探索それぞれ, 手を進めた局面で手生成各手の台数が1 台なら1 台で通常探索上位 M 手にマシンを割当, 残りは1 台で探索以下繰り返し残りの手が最善となったら探索時間延長 79

8 並列 N=M=1 Root Max Min A P6 P 7 P8 P1 P2 P3 P 4 P 5 P8 と比較し, A の子ノードは 5 手深く探索 80

11 並列 N=2, M=1 Root Max Min A P 5 P 1 0 P 1 1 P1 P2 P3 P 4 P6 P7 P8 P 9 P11 と比較し, A の子ノードは 3 手深く探索 81

82

83

台数分割良い手には多く割当良くない手にはあまり割当てたくない良い手がわかれば探索する必要はない順位付けが必要 1 秒での探索や実現確率の上位の手を利用 (2010,2011) 84

上位を選ぶ (2012) 前回その局面を探索した前回の探索結果の上位 N 手 (new) 探索していないが 5 秒以上ある 1 秒で探索した結果の上位 N 手実現確率の上位 N 手 85

探索時間延長残りの手が一番良い探索時間延長他の手よりも浅い 1 台で複数の手を担当信用出来ない残りの手以外での 1 位はそのまま探索他は残りの手の最善の探索に再割当残りの手を読んでいた 1 台は新しい残りの手を探索 ( これは問題 ) 86

問題点残りの手を読んでいた1 台は新しい残りの手を探索新しい残りの手は1 台で探索やはり怪しい浅い探索の結果が選ばれる可能性がある本番でも起きていた様子どうすべきだったか残りの手で良い手残りの手以外での1 位の手だけを探索すれば良い 87

評価値 : d > a > b > c 探索時間延長 ( 延長前 ) Root 手 a 手 b 手 d = best 手 c P1 P2 P3 P 4 P 5 P6 P7 P8 P 9 P 1 0 P 11 手 a, 手 b に比べて 3 手浅い手 d が最善単純な比較では判断できない探索時間延長 88

探索時間延長 ( 再割当後 ) 上位 N(=2) 手の最善 (a) : そのまま探索を続行手 a Root 手 d 残りの手 (c,d) の担当は新しい残りの手 (b,c) を探索手 c 手 b P5 P 1 0 P11 P1 P2 P3 P 4 P6 P7 P8 P 9 上位 N(=2) 手の残り (b) : プロセッサ (6-10) を集め最善手 d を探索 89

GPS 将棋のアプローチ ( 再掲 ) ルートで手生成上位 N 手にマシンを割当順位に応じて台数を変化残りの手は1 台で通常探索それぞれ, 手を進めた局面で手生成各手の台数が1 台なら1 台で通常探索上位 M 手にマシンを割当, 残りは1 台で探索以下繰り返し残りの手が最善となったら探索時間延長 90

選手権での構成マスタ 1 台情報の統合などスレーブ 792 台探索詰将棋専用スレーブ 4 台詰将棋専用 91

今年のクラスタ差分 Perl, ruby から C++ へ書き換え速度向上タスク分割方法性能向上探索時間延長探索結果の信頼性を向上 92

マシンスペック imac Core 2 Duo imac Core i 5 Amazon EC2 その他コア数 2010 307 0 0 7 666 2011 208 0 40 15 832 2012 0 788 0 9 3224 CPU #core #cpu memory imac Core 2 Duo imac Core i 5 Amazon EC2 2.0GHz Intel Core 2 Duo 2.5GHz Intel Core i 5 2.93GHz? Intel Xeon 93 2 1 2GB 4 1 4GB 4 2 23GB

対戦実験今年も行なっていない参考記録: 金子, 田中最善手の予測に基づくゲーム木探索の分散並列実行 GPW2010 逐次よりも強い 8コアでメモリ共有探索4コアと同等勝,負,引分メモリ共有型 1コアクラスタ8コア 71 28-94 2コア 4コア 57 29-43 50 -

計算機群 ( 再掲 ) 情報基盤センター教育用計算機を利用東京大学駒場キャンパス情報教育棟平日と土曜日は学生が利用土曜日は一部演習室は閉鎖されている日曜祝日しか利用できない! 利用申請が必要申請者は離れられない http://gps.tanaka.ecc.utokyo.ac.jp/gpsshogi 95

他の部分の去年との違い評価関数古いバージョンに勝ち越すものを採用探索チェスプログラムStockfish を将棋へ移植 gpsfish 今回探索のスレーブとして利用チェスと将棋の違いに起因する問題が多々稲庭対策がない / クラスタはあり詰将棋がない / クラスタはあり 96 (元)駒得少年の冒険 http://www.sgtpepper.net/kaneko/di

関連 URL GPS 将棋 http://gps.tanaka.ecc.utokyo.ac.jp/gpsshogi http://twitter.com/gpsshogi Floodgate ( コンピュータ将棋対局道場 ) http://wdoor.c.u-tokyo.ac.jp/shogi 第 22 回コンピュータ将棋選手権 http://www.computer-shogi.org/wcsc22/ 97

まとめ WCSC において, GPS 将棋が優勝約 800 台での疎結合並列探索注目の集まる電王戦への出場コンピュータ将棋のアルゴリズムを紹介 GPS 将棋の疎結合並列探索を簡単に紹介選手権参加をお待ちしています 98