Microsoft PowerPoint - vc2013.s.takeuchi.pptx
|
|
|
- せとか たなせ
- 9 years ago
- Views:
Transcription
1 コンピュータ将棋の技術と GPS 将棋について JST ERATO 湊離散構造処理系プロジェクト 竹内聖悟
2 概要 GPS 将棋の紹介 コンピュータ将棋で使われる技術 形勢判断と先読み GPS 将棋の技術 今後の将棋 AI と研究 コンピュータ将棋と可視化
3 近年のコンピュータ将棋 2007 年 : 渡辺明竜王 -Bonanza 渡辺竜王の勝利 2010 年 : あから 清水市代女流王将 あからの勝利 2012 年 : ボンクラーズ - 米長邦雄永世棋聖 ボンクラーズの勝利 2013 年 : プロ棋士 5 人対 5 プログラム 三勝一敗一分でコンピュータ側の勝越 現役プロ棋士に初勝利
4 GPS 将棋とは
5 GPS 将棋の特色 コンピュータチェスやコンピュータ将棋の最新の研究を取り入れている 実現確率を用いた探索 評価関数の機械学習 ( 並列 )df-pn による詰将棋探索 疎結合並列探索 オープンソース 将棋ライブラリの公開
6 コンピュータ将棋選手権の成績 位1 決勝 5 10 二次予選 一次予選 年順
7 順位 GPS将棋の成績と出来事 初優勝 (2009) 決勝 二次予選 15 機械学習 (2008) あから参加 (2010) 30 一次予選 開発開 始(2002) 電王戦: 三浦 弘行八段に 勝利 (2013) 疎結合並列 探索(2009) 初参加 (2003) 年 2014
8 Twitter タイトル戦の形勢判断 無料中継のタイトル戦 最近はお休み中 各局面に対し 評価値,読み筋,探索時間 詰みや狙いなど 指手, 評価値, 最善応手手順, 秒 電王戦当日 数 [(100) 9九と] 9五香 7七歩 同角 同金 8六玉 6六角 7六銀 8 五香 同銀 同桂 3二角成 同玉 7二 飛 4二金 6四歩 7五角 同飛成 同 銀 同玉 8四銀 7四玉 7三飛
9 ゲーム研究 情報科学/人工知能 認知科学 完全解析 強いプログラム 強いプレーヤーはどう考えるか 教育 どう教えたら強くなりやすいか
10 強いプログラムを作るには
11 1手読み :局 面 :手 1手進めてから選ぶ 1手で終わるゲームなら解析 実際のゲーム: 勝 分 ゲーム木 1手では終わらない 1手先の勝ち負けを知りたい 形勢判断 負???
12 1手読み + 形勢判断
13 ゲーム木サイズ ゲーム チェッカー オセロ チェス 将棋 囲碁(19路) サイズ コンピュータの強さ 解析済み 引分 チャンピオンを超えた チャンピオンを超えた プロ棋士レベル アマチュアレベル 阿伽羅(あから) = 現実的には解けない
14 強くするために 正確な形勢判断 評価関数の重みを機械学習により調整 効率的な探索 枝刈, 延長, 短縮 実現確率探索 詰将棋探索 並列探索 疎結合並列探索
15 評価関数 局面 評価 関数 評価値 +300
16 評価関数, ひとむかし 特徴を考える 重みをつける 人間が考える, 将棋の知識が必要 駒の点数, 王の危険度 人間が考える, 将棋の知識が必要 歩が100点として 香車は200?400? パラメータ数に限界 せいぜい数百数千?
17 評価関数, 現在 特徴をたくさん考える 重みをつける 人間が考える, 将棋の知識が必要 駒の点数, 王の危険度, 3駒間の関係... 機械学習による自動処理 棋譜の指し手を選ぶように重みを調整 パラメータ数は数百万, 数千万, 億?
18 GPS将棋の評価関数
19 評価関数の学習 評価関数のパラメータ調整 Bonanza が成功(2006) 強化学習や進化的アルゴリズム あまり成功していなかった GPW 2006 にて機械学習の発表 2008年ソースコードの公開 現在 将棋プログラムの大半が利用 オンライン学習化など研究も進んでいる
20 学習のイメージ 棋譜の指手を真似られるように調整 プログラムの指手との一致率を高くする 棋譜以外の手を選ばない 兄弟局面の比較 棋譜の指手 探索を行う 探索末端局面同士の比較 歩兵 7 11 簡単な例 金将 3 1 f(x) = 3 1 歩+4 3 金 f(x)
21 評価関数の項目 f (x) = å wi xi どうやって項目を選ぶか xi: 駒の枚数, 3駒の関係 人間の知識が必要 自動生成の研究: あまり成功していない
22 Evaluation Curve 勝率 手法: 評価値に対し勝率をプロット 有効な特徴の発見を目的とする X軸: 評価値 Y軸: 勝率 評価値 強いプログラムのカーブ: 単調性 (評価値と勝率の大小関係が単調増加) 一貫性 (異なる棋譜でも同じカーブになる) 理想 役立たず 逆転すれば良い
23 E.C. の分離 棋譜セット A, B, C 一本 一貫 (良いプログラム) 例) 駒の価値だけの評価関数 全局面 自玉が安全 (勝ちやすい) 自玉が危険 (負けやすい) 分離 非一貫 (良くないプログラム)
24 分離したE.C. の問題点 ゲーム木 勝率 B 勝率 評価 値 A B の勝率が高い しかし A が選ばれる 良くない! 評価値
25 実例 2006年前後のGPS 将棋の評価関数 王の危険度: 王周辺にある敵の利きの数 機械学習以前のもの 多いほど負けやすい 利き: 駒が動ける範囲 評価関数が上記を正しく評価できている なら 勝率に影響はない 正しく評価: Evaluation Curve が1本化される
26 改良前 分離 問題あり 有効な特徴
27 改良後 一本 問題ない 対戦実験からも棋力の改善を確認
28 E.C.
29 評価関数 線形の評価関数が主流 重さは機械学習による自動調整 ニューラルネットワークなども一部あり 基本的に速度が優先される 数百万の重みを調整 特徴は人間が知識を使って見つける サポートする手法が必要
30 探索 評価関数 + αβ探索 互いに最善を尽くす前提 深さ打ち切り探索 葉ノードで 評価関数による評価値を得る 一般に, 深く探索するほど強い 速度を上げる工夫 局面 探索 指し手, 評価値 +7776FU, +300
31 αβ探索 Min-Max を効率的に行い 同じ結果を得 る 不要な探索を行わない : 枝刈 探索窓, alpha-beta window の導入 興味のある評価値の範囲 (alpha, beta) として表記 返り値V で更新 Max : If (V > alpha) alpha = V Min : if (V < beta) beta = V
32 枝刈 枝刈条件 例: Max : V >= beta Min : V <= alpha (5, ) 5 3 (5, ) Cut Max! Min ルートのMax ノードは5以上 矢印のノードに左の子ノードから3が返った 値は3以下になる ( Min ノード) ルートには3以下しか返らない 選ばれない それ以上探索するのは無駄 枝刈
33 αβ探索の挙動 (-, ) (3, ) Best Move 3 Root Max-Player ) (-, 3) 3 (-, (3, ) ) (-, 3) (-, 3) ) (3, 6) (-,5) (-, ) 5 (3, ) Cut 2 Cut Min-Player 2 (3, ) (3, (3, ) ) 1 2 Cut 1 2 数字は 評価値 点数が高いほどMax-Player が有利
34 αβ探索の結果 3 Root 枝刈されたノード 2 2 枝刈されたノード
35 探索の効率化に重要な情報 探索順序 探索窓の広さ 最善を先に探索できると効率的 最悪の場合 枝刈が起こらないことも 狭いほど枝刈は起こりやすい ハッシュ表 探索結果の保持 : 同一局面の探索を行わない 手の並び替え: 浅い探索結果を元に
36 探索の工夫 枝刈 探索延長 探索順序 探索窓 ハードウェア 専用ハードウェア (例: Deep Blue) CPUのオーバークロック マルチコア クラスタ/疎結合
37 並列化の難しさ 並列処理が可能か? 処理に順序依存性があると難しい オーバヘッド 探索 : 逐次なら枝刈されるノードの探索 同期 : 他のプロセッサの結果を待つ 通信 : 仕事の分割, 仕事を通信, 通信遅延
38 メモリ共有環境 プロセッサ間の通信は十分速い 通信オーバヘッドはあまりない PV Split 左端を1人で展開 残りのノードを並列にnull window search ハッシュ表を共有 ロックレスハッシュ
39 PVSplit Max 2並列 Processor1,2 (P1,P2) Min P2 P1 P1 P1 P P 1 3 P 2 P1 P
40 GPS将棋の疎結合並列探索 40
41 計算機群
42 クラスタ構成 選手権 他 合計 台/コア数 備考 / / / 3224 Intel Core 2 Duo 2.0GHz Amazon EC2 40台 imac 2012 imac 入れ替え Intel Core i5 2.5GHz / 3318
43 単純なアイデア
44 従来手法
45 GPS将棋の疎結合並列探索 探索窓を共有しない ハッシュ表は各自で持つ 同期オーバヘッドと効率のトレードオフ 割当て時に前回担当分に割当てられる ここでは 通信オーバヘッドはない 並び替えは探索など 探索オーバヘッドはあるが 並び替えがうま くいけば 少なく抑えられる
46 GPS将棋のアプローチ 概要 ルートで手生成 上位N 手にマシンを割当 それぞれ, 手を進めた局面で手生成 順位に応じて台数を変化 残りの手は1台で通常探索 前回担当した局面は同じマシンが担当 各手の台数が1台なら1台で通常探索 上位M手にマシンを割当, 残りは1台で探索 以下 繰り返し 残りの手 が最善となったら探索時間延長
47 N=M=1 Max Root 8並列 Min P8 P7 P6 A P5 P1 P2 P3 P4 P8 と比較し, Aの子ノードは5手深く探索
48 N=2, M=1 11並列 Max Root Min A P1 P2 P3 P1 0 P5 P 4 P6 P7 P8 P 9 P11 と比較し, Aの子ノードは3手深く探索 P 11
49 クラスタの思考の可視化
50 nps = nodes per second 2013年5月の例 約3億nps を達成 (Deep Blue: 1億nps) 6手深く探索
51 探索のまとめ アルファベータ探索と評価関数 効率的な探索の工夫 枝刈や探索延長など 並列探索 SMP 環境での並列化 疎結合並列探索
52 順位 GPS将棋の成績と出来事 初優勝 (2009) 決勝 二次予選 15 機械学習 (2008) あから参加 (2010) 30 一次予選 開発開 始(2002) 電王戦: 三浦 弘行八段に 勝利 (2013) 疎結合並列 探索(2009) 初参加 (2003) 年 2014
53 今後の展望など 人間のトップに勝つことは 1つの目標 さらに強いプレイヤの作成 段々近付いてきた チェスは現在も強くなり続けている 強いプレイヤがいないと出来ない研究 プレイヤの強さの解析 時代の違うプレイヤの比較
54 これからの研究 人間らしい指手 人間のサポート 昔から研究されている 人間らしい ことの評価の難しさ 感想戦支援など 思考の可視化 言語化の研究など
55 コンピュータ将棋と可視化
世界コンピュータ将棋選手権参加報告、及び、GPS 将棋の技術
世界コンピュータ将棋選手権参加報告 及び, GPS 将棋のアルゴリズム JST ERATO 湊プロジェクト研究員竹内聖悟 1 概観 世界コンピュータ将棋選手権の紹介 今年は GPS 将棋が優勝 上位 5 プログラムがプロ棋士と対局予定 コンピュータ将棋のアルゴリズム GPS 将棋と そのアルゴリズムを紹介 約 800 台のマシンで疎結合並列探索 2 あらためて自己紹介 竹内聖悟 JST ERATO
しています. これには探索木のすべてのノードを探索する必要がありますが,αβカットなどの枝刈りの処理により探索にかかる計算時間を短縮しています. これに対して, 探索するノードを限定したり, 優先順位をつけて選択的に探索する 選択探索 という探索方式があります. 本チームはノードの選択方式としてノー
芝浦将棋 Softmax のチーム紹介 2017 年 3 月 14 日芝浦工業大学情報工学科五十嵐治一, 原悠一 1. はじめに本稿は, 第 27 回世界コンピュータ将棋選手権 (2017 年 5 月 3 日 ~5 日開催 ) に出場予定の 芝浦将棋 Softmax ( シバウラショウギソフトマックス ) のアピール文書です. 本チームは 芝浦将棋 Jr. から分離した初参加のチームです. 探索手法が従来の
dlshogiアピール文章
第 28 回世界コンピュータ将棋選手権 dlshogi アピール文章 山岡忠夫 2018 年 5 月 1 日更新 下線部分は 第 5 回将棋電王トーナメントからの差分を示す 1 特徴 ディープラーニングを使用 指し手を予測する Policy Network 局面の勝率を予測する Value Network 入力特徴にドメイン知識を活用 モンテカルロ木探索 並列化 自己対局による強化学習 既存将棋プログラムの自己対局データを使った事前学習
ナッシュ均衡 ( 最適反応 ) 支配戦略のみで説明できない場合 ( その) 戦略 A 戦略 B 戦略 A (,) (0,0) 戦略 B (0,0) (,) 支配戦略均衡 : 無し ナッシュ均衡 :(,) と (,) 支配戦略均衡よりも適応範囲が広い ナッシュ均衡の良い性質 各プレイヤーは戦略変更の積
コンピュータ将棋の技術と展望 自己紹介 名前保木邦仁 ( 生まれ北海道東区 ) 年齢 36 職業電気通信大学特任助教 専門 00 年頃まで化学, 以降ゲーム情報学 コンピュータ将棋プログラム Bonanza を作っています 囲碁将棋から学ぶゲーム情報学公開講座保木邦仁 0 年 月 8 日 内容 将棋と関係するゲーム理論概略 将棋と関係するゲーム理論概略 チェス 将棋の思考アルゴリズム コンピュータ将棋対人間の歴史
レーティングと棋譜分析
将棋名人のレーティングと棋譜分析 山下宏 2014 年 11 月 7 日 GPW 箱根 大山 15 世名人と羽生名人 全盛期に戦えばどちらが強い? 大山康晴 15 世名人 タイトル獲得 80 期 昭和の覇者 羽生善治名人 1996 年に7 冠達成 平成の覇者 歴代名人の強さを調べる 対局の結果から 対局者の棋力を点数で表す 勝てば点数プラス 負ければマイナス いわゆるEloレーティング 棋譜の内容から
PowerPoint Presentation
名人を超えるコンピュータ将棋 2013 年 8 月 伊藤英紀 1 目次 コンピュータ将棋概観 コンピュータ将棋の基礎技術 機械学習 並列処理 ボンクラーズ /Puella αの概要 将棋の後の人工知能 2 自己紹介 1988 富士通 ( 株 ) 入社 以来 CPU 設計 半導体製造のサポート マーケティングに従事 1998 趣味でコンピュータ将棋の開発を始める 2011 世界コンピュータ将棋選手権優勝
将棋プログラムの現状と未来
将棋プログラムの現状と未来 鶴岡慶雅 2 1. はじめにコンピュータ将棋の実力はプロ棋士のレベルに近づきつつある その理由の一つは ハードウェアの進歩により探索を高速に実行できるようになったことにあるが ソフトウェアの面での進歩も大きい 本稿では 第 15 回世界コンピュータ将棋選手権で優勝した将棋プログラム 激指 ( げきさし ) の探索手法を中心にして 現在トップレベルにある将棋プログラムの中身
将棋吊人のレーティングと棋譜分析
歴代名人の強さ 山下宏 2017 年 10 月 13 日 札幌 NoMaps 大山 15 世名人と羽生棋聖 全盛期に戦えばどちらが強い? 大山 15 世名人昭和の大名人 羽生棋聖将棋史上最強と言われる (19 世名人 ) 時代が違う二人を直接戦わせることは不可能 しかし二人が指した棋譜は残されている 棋譜から強さを推定 将棋ソフトを使って解析 初心者からアマ高段者まで1800 局を調べた ソフトが悪手と指摘した手と棋力に関連性
合わせを許す フリースタイルチェス という対戦形式も考案され, 発展を遂げている. この対戦では, あまり強くない人間 + コンピュータ + 良いプロセス が グランドマスター + コンピュータ + 良くないプロセス に勝利するということが起こっている. このことは, コンピュータをどう使いこなすか
HAI シンポジウム 2013 Human-Agent Interaction Symposium 2013 IV-1 アドバンスド将棋で人はどうコンピュータを利用するか How Human use Computer on Advanced Shogi? 伊藤毅志 1 Takeshi Ito 1 1 電気通信大学 1 The University of Electro-Communications
用しないことを世界選手権大会で試みて参りました. 芝浦将棋 Jr. でも強化学習で評価関数 を学習するなど, 上記の開発コンセプトに沿って開発を進めていくつもりです. 3. 開発メンバー本チームの開発統括者は芝浦工業大学工学部情報工学科に所属する教員, 五十嵐治一教授です. 開発メンバーはすべて五十
芝浦将棋 Jr. のチーム紹介 2017 年 3 月 24 日 芝浦工業大学情報工学科 和田悠介, 古根村光, 桐井杏樹, 岩間雄紀, 内山正吏 1. はじめに本稿は, 第 27 回世界コンピュータ将棋選手権 (2017 年 5 月開催 ) に出場予定の 芝浦将棋 Jr. ( シバウラショウギジュニア ) の紹介文です. 本チームは芝浦工業大学工学部情報工学科の学生と教員により構成されており, 教育と研究の一環として活動しています.
PowerPoint Presentation
ゲーム木の探索について ミニマックス法のアルゴリズム アルファベータ法のアルゴリズ 三目並べゲームの例 1 ゲーム TicTacToe Othello Chess Let us find game and play! 三目並べ http://perfecttictactoe.herokuapp.com/ オセロ http://atohi.com/osg/default.aspx 将棋 2 ゲーム木の探索問題
ゲーム情報学研究の事例 将棋
ゲーム情報学研究の事例将棋 なぜ将棋? 2002 年の秋に中東のバーレーンで行われたチェスの対局で 最強のチェスプレーヤーの一人であるクラムニクがコンピュータと引き分けた 使用されたコンピュータは Pentium III 900MHz を8 台搭載した汎用サーバである 当時チェス世界ランキング1 位のカスパロフが IBM のディープブルーに敗れたのは 1997 年であるが 今回はディープブルーとは違って個人が使う
コンピュータ将棋における全幅探索と 以上の探索範囲が削減される. この枝刈りの手法では, 手番を 1 回放棄すると形勢が悪化するというゲームの性質を利用する. この手法はチェスの場合よりも将棋の方がうまく働く. これは, 特にチェスの終盤で重要となる zugzwang 局面が, 将棋の場合において実
ミニ小特集コ03 ンピュータ将棋の新しい動きミニ小特集 03 コンピュータ将棋における全幅探索と 保木邦仁 ( 東北大学院理学研究科化学専攻 ) [email protected] 5 月に行われたコンピュータ将棋選手権において, 拙作の Bonanza が接戦のリーグ戦をすり抜け, 幸運に助けられながらも優勝することができた.Bonanza の思考アルゴリズムは, チェスで広く用いられている全幅探索の手法に基づく.
1 913 10301200 A B C D E F G H J K L M 1A1030 10 : 45 1A1045 11 : 00 1A1100 11 : 15 1A1115 11 : 30 1A1130 11 : 45 1A1145 12 : 00 1B1030 1B1045 1C1030
1 913 9001030 A B C D E F G H J K L M 9:00 1A0900 9:15 1A0915 9:30 1A0930 9:45 1A0945 10 : 00 1A1000 10 : 15 1B0900 1B0915 1B0930 1B0945 1B1000 1C0900 1C0915 1D0915 1C0930 1C0945 1C1000 1D0930 1D0945 1D1000
情報 システム工学概論 コンピュータゲームプレイヤ 鶴岡慶雅 工学部電子情報工学科 情報理工学系研究科電子情報学専攻
情報 システム工学概論 2018-1-15 コンピュータゲームプレイヤ 鶴岡慶雅 工学部電子情報工学科 情報理工学系研究科電子情報学専攻 DEEP Q-NETWORK (DQN) Deep Q-Network (Mnih et al., 2015) Atari 2600 Games ブロック崩し スペースインベーダー ピンポン etc. 同一のプログラムですべてのゲームを学習 CNN+ 強化学習 (Q-Learning)
Microsoft PowerPoint - ゲーム理論2016.pptx
125 126 ゲーム理論 ( 第 6 回ゲーム木探索 II) 九州大学大学院システム情報科学研究院情報学部門横尾真 E-mail: [email protected] http://agent.inf.kyushu-u.ac.jp/~yokoo/ 先読みの効果 基本的には, 深く読めば読むほど強い 終盤の方が静的評価関数の値が信用できる そうでない場合は, 先読みの効果は必ずしも自明ではない
AI 三目並べ
ame Algorithms AI programming 三目並べ 2011 11 17 ゲーム木 お互いがどのような手を打ったかによって次にどのような局面になるかを場合分けしていくゲーム展開を木で表すことができる 相手の手 ゲームを思考することは このゲーム木を先読みしていく必要がある ミニマックス法 考え方 では局面が最良になる手を選びたい 相手は ( 自分にとって ) 局面が最悪となる手を選ぶだろう
連載講座 : 高生産並列言語を使いこなす (3) ゲーム木探索問題 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 概要 17 2 ゲーム木探索 必勝 必敗 引き分け 盤面の評価値 αβ 法 指し手の順序付け (mo
連載講座 : 高生産並列言語を使いこなす (3) ゲーム木探索問題 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 概要 17 2 ゲーム木探索 17 2.1 必勝 必敗 引き分け 17 2.2 盤面の評価値 18 2.3 αβ 法 19 2.4 指し手の順序付け (move ordering) 20 3 Andersson の詰み探索およびその並列化 21 3.1 Andersson
特集01-2c.indd
特集 ゲーム情 基応専般 ゲーム情の現在 ゲームの研究は日本で疎外されなくなったのか 松原仁 ( 公立はこだて未来大 ) ゲーム情 ゲーム情という名称ができたのはそんなに古いことではない. 本会でゲームに関する研究会を立ち上げることを計画していた 1998 年頃に研究会の名称を何にすればよいか関係者で検討をしていた. なかなかよい案が出てこなかったが, 筆者が橋田浩一氏 ( 当時電子技術総合研究所現産業技術総合研究所
CLEFIA_ISEC発表
128 ビットブロック暗号 CLEFIA 白井太三 渋谷香士 秋下徹 盛合志帆 岩田哲 ソニー株式会社 名古屋大学 目次 背景 アルゴリズム仕様 設計方針 安全性評価 実装性能評価 まとめ 2 背景 AES プロジェクト開始 (1997~) から 10 年 AES プロジェクト 攻撃法の進化 代数攻撃 関連鍵攻撃 新しい攻撃法への対策 暗号設計法の進化 IC カード, RFID などのアプリケーション拡大
2. AI 将棋の準備 本章では AI 将棋を使うための準備について解説します 2.1 AI 将棋に入っているディスクについて AI 将棋の商品には 以下のディスクが入っています AI 将棋 Version 19 CD-ROM このディスクにはインストーラや AI 将棋のプログラムといった AI 将棋を動作 させるのに必要な各種ファイルが入っています 2.2 AI 将棋のインストールとアンインストール
ボルツマンマシンの高速化
1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,
PowerPoint プレゼンテーション
モンテカルロ木探索 並列化 囲碁 マリオ AI 美添一樹 ETATO 研究員 湊離散構造処理系プロジェクト 2013 年度秋のワークショップ 2013 年 11 月 26 日 並列モンテカルロ木探索の意義 コンピュータ囲碁で人間を超える 情報科学の有効性を示す 大規模並列探索ライブラリ 近い将来 全てのアルゴリズムは大規模並列化が必要 並列探索は実装が 非常に 大変なのでライブラリとして提供できると良い
TopSE並行システム はじめに
はじめに 平成 23 年 9 月 1 日 トップエスイープロジェクト 磯部祥尚 ( 産業技術総合研究所 ) 2 本講座の背景と目標 背景 : マルチコア CPU やクラウドコンピューティング等 並列 / 分散処理環境が身近なものになっている 複数のプロセス ( プログラム ) を同時に実行可能 通信等により複数のプロセスが協調可能 並行システムの構築 並行システム 通信 Proc2 プロセス ( プログラム
論文誌用MS-Wordテンプレートファイル
将棋の局面評価関数におけるディープラーニングの利用 1 和田悠介 1 五十嵐治一 概要 : コンピュータ囲碁ではディープラーニングが有効であることが分かり, コンピュータチェスにおいても局面評価関数の学習に利用されてきている. その適用例として,Deep Pink と Giraffe がある. 前者はビット列で表現された盤面情報を入力とする教師付き学習を, 後者は特徴量で表現された盤面情報を入力とする強化学習を用いている.
dTV 将棋プラス 2018年2月 週間番組表
1 年 2 月週間番組表 時分番組内容時分番組内容分番組内容 00 将棋プレミアムフェス in 名古屋 00 第 期王将戦七番勝負第 1 局 2 目 00 石田直裕の初級講座 00 第 30 期竜王戦七番勝負第 1 局 1 目久保利明銀河 VS 藤井聡太四段久保利明王将 VS 豊島将之八段渡辺明竜王 vs 羽生善治棋聖対局 ://10 対局 :1/1/ #-10 対局 :/10/ 木金 2 月 1
Microsoft PowerPoint - mp11-06.pptx
数理計画法第 6 回 塩浦昭義情報科学研究科准教授 [email protected] http://www.dais.is.tohoku.ac.jp/~shioura/teaching 第 5 章組合せ計画 5.2 分枝限定法 組合せ計画問題 組合せ計画問題とは : 有限個の もの の組合せの中から, 目的関数を最小または最大にする組合せを見つける問題 例 1: 整数計画問題全般
世界コンピュータ将棋選手権 [30] CSA CSA 電王戦 [31] Computer Olympiad [32] ICGA コンピュータ将棋対局場 [33],floodgate [34] 24 floodgate floodgate
254 30 2 2015 3 ゲームプログラミング ( 将棋を中心に ) 1 竹内聖悟 ( 科学技術振興機構 ERATO 湊離散構造処理系プロジェクト ) 1 1999 [1] 2 2012 松原仁 : ゲーム情報学 :1. ゲーム情報学の現在 ゲームの研究は日本で疎外されなくなったのか [2], 情報処理,Vol. 53, No. 2, pp. 102-106(2012) 小谷善行 : ゲーム情報学
[14: :10] 囲碁 (2 件 ) (3) 棋力認定問題によるコンピュータ囲碁の評価 ( その4) 鎌田真人 豊間根衣吹 ( 岩手県立大学宮古短期大学部 ) 松原仁 ( 公立はこだて未来大学 ) モンテカルロ法前後と最新バージョンの市販囲碁ソフト 4 シリーズ 12 ソフトについて
第 33 回ゲーム情報学研究会 ( 発表件数 18 件 ) 日時 : 平成 27 年 3 月 5 日 ( 木 )13:20-16:45,6 日 ( 金 )10:00-16:30 場所 : 東京大学駒場キャンパス情報教育棟 3 階セミナー室 153-8902 東京都目黒区駒場 3-8-1 [ 駒場キャンパス地図 ] http://www.c.u-tokyo.ac.jp/info/about/visitors/maps-directions/campusmap.html
Microsoft PowerPoint - algo ppt [互換モード]
( 復習 ) アルゴリズムとは アルゴリズム概論 - 探索 () - アルゴリズム 問題を解くための曖昧さのない手順 与えられた問題を解くための機械的操作からなる有限の手続き 機械的操作 : 単純な演算, 代入, 比較など 安本慶一 yasumoto[at]is.naist.jp プログラムとの違い プログラムはアルゴリズムをプログラミング言語で表現したもの アルゴリズムは自然言語でも, プログラミング言語でも表現できる
Qhapaqの技術文書
Qhapaqの技術文書 猿猿真似からはじめる 素敵なコンピュータ将棋ライフ Sawada Ryoto (May, 2016) Who is Qhapaq かぱっく と読みます aperyチルドレンの一人で す Qhapaq とは 偉大なもの を指すケチュア語で 本作が多くの巨人の肩の上に立った作品であることを 示しています 大樹の枝への勝率は55 程度 WCSC 2016の順位は13位 なぜかGPSと激指に大金星をあ
ムーアの法則に関するレポート
情報理工学実験レポート 実験テーマ名 : ムーアの法則に関する調査 職員番号 4570 氏名蚊野浩 提出日 2019 年 4 月 9 日 要約 大規模集積回路のトランジスタ数が 18 ヶ月で2 倍になる というムーアの法則を検証した その結果 Intel 社のマイクロプロセッサに関して 1971 年から 2016 年の平均で 26.4 ヶ月に2 倍 というペースであった このことからムーアの法則のペースが遅くなっていることがわかった
Microsoft PowerPoint - mp13-07.pptx
数理計画法 ( 数理最適化 ) 第 7 回 ネットワーク最適化 最大流問題と増加路アルゴリズム 担当 : 塩浦昭義 ( 情報科学研究科准教授 ) [email protected] ネットワーク最適化問題 ( 無向, 有向 ) グラフ 頂点 (verex, 接点, 点 ) が枝 (edge, 辺, 線 ) で結ばれたもの ネットワーク 頂点や枝に数値データ ( 距離, コストなど ) が付加されたもの
次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1
4. ソート ( 教科書 p.205-p.273) 整列すなわちソートは アプリケーションを作成する際には良く使われる基本的な操作であり 今までに数多くのソートのアルゴリズムが考えられてきた 今回はこれらソートのアルゴリズムについて学習していく ソートとはソートとは与えられたデータの集合をキーとなる項目の値の大小関係に基づき 一定の順序で並べ替える操作である ソートには図 1 に示すように キーの値の小さいデータを先頭に並べる
計算機アーキテクチャ
計算機アーキテクチャ 第 11 回命令実行の流れ 2014 年 6 月 20 日 電気情報工学科 田島孝治 1 授業スケジュール ( 前期 ) 2 回日付タイトル 1 4/7 コンピュータ技術の歴史と コンピュータアーキテクチャ 2 4/14 ノイマン型コンピュータ 3 4/21 コンピュータのハードウェア 4 4/28 数と文字の表現 5 5/12 固定小数点数と浮動小数点表現 6 5/19 計算アーキテクチャ
MATLAB®製品紹介セミナー
MATLAB における分類 パターン認識 - 入門編 - MathWorks Japan アプリケーションエンジニアリング部 ( テクニカルコンピューティング部 ) アプリケーションエンジニア大開孝文 2012 The MathWorks, Inc. 1 アジェンダ 回帰モデルと分類モデルについて 分類手法を使ったワインの品質モデリング まとめ 2 分類手法を使ったワインの品質モデリング アプローチ
リソース制約下における組込みソフトウェアの性能検証および最適化方法
リソース制約下における組込みソフト ウェアの性能検証および最適化方法 広島市立大学 大学院情報科学研究科システム工学専攻 中田明夫倉田和哉百々太市 1 提案技術の概要 組込みシステムの開発 厳しいリソース制約 (CPU, ネットワークなど ) 非機能要求 ( リアルタイム性など ) の達成 開発プロセスにおける設計段階 性能問題を発見することが困難 実装段階で性能問題が発覚 設計の手戻りが発生 設計段階での性能検証手法
