UCT探索を用いた大貧民クライアント



Similar documents
aisatu.pdf

Sigma

Sigma

PDF


日本外傷歯学会認定医(平成24年11月30日付) H

2301/1     目次・広告

IPSJ SIG Technical Report Vol.2016-GI-35 No /3/9 StarCraft AI Deep Q-Network StarCraft: BroodWar Blizzard Entertainment AI Competition AI Convo


ホームページ用原稿 3-1

2 74

[1] AI [2] Pac-Man Ms. Pac-Man Ms. Pac-Man Pac-Man Ms. Pac-Man IEEE AI Ms. Pac-Man AI [3] AI 2011 UCT[4] [5] 58,990 Ms. Pac-Man AI Ms. Pac-Man 921,360

untitled

p-9-10.eps

Vol. 52 No (Dec. 2011) Ms. Pac-Man IEEE CIG Ms. Pac-Man Ms. Pac-Man AI AI Ms. Pac-Man Ms. Pac-Man Competition Ms. Pac-Man Monte

2015 3


i

コンピュータ 囲 碁 に 起 きた 革 命 2008 年 3 月 末 パリ 囲 碁 トーナメントのエキシビショ ンでプロ 対 コンピュータの 対 戦 が 実 現 ( プロ:タラヌ カタリン 五 段 ( 日 本 棋 院 中 部 総 本 部 所

「産業上利用することができる発明」の審査の運用指針(案)

The 19th Game Programming Workshop 2014 SHOT 1,a) 2 UCT SHOT UCT SHOT UCT UCT SHOT UCT An Empirical Evaluation of the Effectiveness of the SHOT algori


…K…E…X„^…x…C…W…A…fi…l…b…g…‘†[…N‡Ì“‚¢−w‘K‡Ì‹ê™v’«‡É‡Â‡¢‡Ä

チュートリアル:ノンパラメトリックベイズ

無線LAN VoIP 高度化技術

36

‡¢‡é‡Ü8/1“ƒŁ\1.4

(interval estimation) 3 (confidence coefficient) µ σ/sqrt(n) 4 P ( (X - µ) / (σ sqrt N < a) = α a α X α µ a σ sqrt N X µ a σ sqrt N 2

31 gh gw

R pdf


2

61“ƒ/61G2 P97

Taro13-本文(校正後).jtd

卓球の試合への興味度に関する確率論的分析

N i p p o n h a m AI R M A I L A C h i n a I R M A I L V i e t n a m AI R M A I L 61 62

π, R { 2, 0, 3} , ( R),. R, [ 1, 1] = {x R 1 x 1} 1 0 1, [ 1, 1],, 1 0 1,, ( 1, 1) = {x R 1 < x < 1} [ 1, 1] 1 1, ( 1, 1), 1, 1, R A 1


25 Study on Effectiveness of Monte Calro Tree Search for Single-Player Games

( )

Mastering the Game of Go without Human Knowledge ( ) AI 3 1 AI 1 rev.1 (2017/11/26) 1 6 2

データの分布

Microsoft PowerPoint - 公開講座ー伊藤 [互換モード]

AI


日本糖尿病学会誌第58巻第1号

23_33.indd

第6回ストックリーグ入賞レポート 敢闘賞・大学 (PDF)


ICU ( ) ICU ( ) ICU SpO 2 ICU ( ) -297 S.E DEX: N=30 DEX: N= 6 (J-DEX Placebo: N=30 Placebo: N= 3 65 DEX: N=16 DEX: N= 3 Placebo: N=

BTI T90% Tave Tave Tave T90% 48 JICE REPORT vol.20/ 11.12

untitled

橡 PDF

1 I

PowerPoint プレゼンテーション

概況

Logistello 1) playout playout 1 5) SIMD Bitboard playout playout Bitboard Bitboard 8 8 = black white 2 2 Bitboard 2 1 6) position rev i

( _NL)

1,a) 1,b) TUBSTAP TUBSTAP Offering New Benchmark Maps for Turn Based Strategy Game Tomihiro Kimura 1,a) Kokolo Ikeda 1,b) Abstract: Tsume-shogi and Ts


0 (1 ) 0 (1 ) 01 Excel Excel ( ) = Excel Excel = =5-5 3 =5* 5 10 =5/ 5 5 =5^ 5 5 ( ), 0, Excel, Excel 13E E

1 1.1 Excel Excel Excel log 1, log 2, log 3,, log 10 e = ln 10 log cm 1mm 1 10 =0.1mm = f(x) f(x) = n

NEWS Topics

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2009-GI-22 No /6/26 ( ) GPCC (Games and Puzzles Competitions on Computers) 200

70の法則

橡J PDF

Chap9.dvi

t14.dvi

較バンディットアルゴリズムを いた クラウドソーシングにおける 品質 コストトレードオフの 動調整 畠正和, 宮 純平, 場雪乃 北海道 学 /NTT, 東京 学, 京都 学




_11_19_2.indd

リスクとは何か?

これからの強化学習 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. このサンプルページの内容は, 初版 1 刷発行時のものです.

1 n i i 1 i n index = 0; [ index] = 1; = = ; if ( == ) { // [ index ]++; } else if () { if( index == 0 ) { // // // // [ index ]++; = ; } else { // //

<4D F736F F D B B83578B6594BB2D834A836F815B82D082C88C60202E646F63>

AR(1) y t = φy t 1 + ɛ t, ɛ t N(0, σ 2 ) 1. Mean of y t given y t 1, y t 2, E(y t y t 1, y t 2, ) = φy t 1 2. Variance of y t given y t 1, y t

スライド 1

PowerPoint プレゼンテーション

AI 1,a) 1,b) 1,c) , AI branching factor AI AI AI Proposal of Challenges and Approaches to Create Effective Artificial Players for Tur

Research on decision making in multi-player games with imperfect information

?

untitled

Ł\”ƒ2001B

( ) a C n ( R n ) R a R C n. a C n (or R n ) a 0 2. α C( R ) a C n αa = α a 3. a, b C n a + b a + b ( ) p 8..2 (p ) a = [a a n ] T C n p n a

日本株式市場における経済レジームファクターの役割

a n a n ( ) (1) a m a n = a m+n (2) (a m ) n = a mn (3) (ab) n = a n b n (4) a m a n = a m n ( m > n ) m n 4 ( ) 552

離散数学 第 4回 集合の記法 (1):外延的記法と内包的記法


_FH28_J.qxd

s s U s L e A = P A l l + dl dε = dl l l

Report C: : ( )

HILIC 90% CH3CN 80% CH3CN 70% CH3CN 40% CH3CN [ min ] PC N + P R

1.. 1 ll a ii. 1i. i f 1 1 a. a. i. t. 1 fi fi. t i j fj i. j ;i 1. i. aa a

4 4. A p X A 1 X X A 1 A 4.3 X p X p X S(X) = E ((X p) ) X = X E(X) = E(X) p p 4.3p < p < 1 X X p f(i) = P (X = i) = p(1 p) i 1, i = 1,, r + r

1 1. x 1 (1) x 2 + 2x + 5 dx d dx (x2 + 2x + 5) = 2(x + 1) x 1 x 2 + 2x + 5 = x + 1 x 2 + 2x x 2 + 2x + 5 y = x 2 + 2x + 5 dy = 2(x + 1)dx x + 1


20139 mother-river homing 9 282:00 4,0007,500 2,000 7 * AIHALL * Nagai Ai Tanoue Yutaka

2 log 3 9 log 0 0 a log log 3 9 y 3 y = = 9 y = 2 0 y = 0 a log 0 0 a = a 9 2 = 3 log 9 3 = 2 a 0 = a = a log a a = log a = 0 log a a =. l

Transcription:

UCT.. ( ) UCT 1 / 34

1 2 UEC 2012 3 4 UCT UCB1 UCB1-Tuned 5 ( ) UCT 2 / 34

1 http://uguisu.skr.jp/othello/ http://matome.naver.jp/odai/2128989764455845801 ( ) UCT 3 / 34

1 : (1997) : (1997) : (2010) : 4 (2012) http://210.150.246.43/game.hp/checker/index/1.html http://aitiken22.blog54.fc2.com/blog-entry-145.html ( ) UCT 4 / 34

1 UEC ( ) http://uecda.nishino-lab.jp/2012/ ( ) UCT 5 / 34

1 ( ) UCT 6 / 34

2 UEC 2012 2012 11 24 AI ( ) ( ) UCT 7 / 34

2.1 ( ) ( ) UCT 8 / 34

2.2 ( ) http://entcog.c.ooco.jp/entcog/event/20120318/nishino.pdf ( ) UCT 9 / 34

2.3 ( ) UCT 10 / 34

2.3 ( ) UCT 11 / 34

( ) : ( ) ( ) UCT 12 / 34

3 ( ) UCT 13 / 34

3.1 ( ) ( ) UCT 14 / 34

3.2 (B.Brügmann. 1993.) ( ) UCT 15 / 34

3.2 ( ) http://repository.dl.itc.u-tokyo.ac.jp/dspace/bitstream/2261/25490/1/k-01865.pdf ( ) UCT 16 / 34

3.2 i s i ( ) X i X i X i = X i s i 1 0.75 0.5 0.25 0 ( ) UCT 17 / 34

3.2 ( ) UCT 18 / 34

3.2 ( ) ( ) UCT 19 / 34

3.3 ( ) UCT ( ) ( ) ( ) UCT 20 / 34

3.4 UCB1 ( ) UCT 21 / 34

3.4 400 5 4 3 2 1... ( ) UCT 22 / 34

3.4 A ( ) 1459 1276 1248 1009 1008 B ( ) 1452 1452 1428 837 831 ( ) UCT 23 / 34

4 ( ) UCT 24 / 34

4.1 3( ) ( ) 3( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) UCT 25 / 34

4.1 ( ) UCT 26 / 34

4.2 UCT UCT ( ) UCT 27 / 34

4.2.1 UCB1 (P.Auer, N. Cesa-Bianchi, P.Fischer 2002) UCB(Upper Confidence Bound) X i i s i i n i UCB UCB(i) = X i + c log n s i UCB UCB c ( c = 2) ( ) UCT 28 / 34

4.2.1 UCB1 UCT ( / ) ( ) UCT 29 / 34

4.2.1 UCB1 800 ( ) UCT 30 / 34

4.2.2 UCB1-Tuned(B. Bouzy and G. Chaslot. 2005) ( ) UCT 31 / 34

4.2.2 UCB1-Tuned(B. Bouzy and G. Chaslot. 2005) UCB1 UCB(i) = X i + c log n s i UCB1 UCB c σ 2 i c = min( 1 4, V i), V i = σ 2 i + 2 log n s i ( ) UCT 32 / 34

4.2.2 UCB1-Tuned(B. Bouzy and G. Chaslot. 2005) UCB(i) = X i + c log n c = min( 1 s 4, V i), V i = σi 2 2 log n + i s i ( ) V i c 1 4 ( ) V i c UCB ( ) UCT 33 / 34

5 2011 UCT ( ) UCT 34 / 34