レーティングと棋譜分析

Similar documents
将棋吊人のレーティングと棋譜分析

dlshogiアピール文章

しています. これには探索木のすべてのノードを探索する必要がありますが,αβカットなどの枝刈りの処理により探索にかかる計算時間を短縮しています. これに対して, 探索するノードを限定したり, 優先順位をつけて選択的に探索する 選択探索 という探索方式があります. 本チームはノードの選択方式としてノー

Microsoft PowerPoint - vc2013.s.takeuchi.pptx

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

将棋プログラムの現状と未来

不偏推定量

風力発電インデックスの算出方法について 1. 風力発電インデックスについて風力発電インデックスは 気象庁 GPV(RSM) 1 局地気象モデル 2 (ANEMOS:LAWEPS-1 次領域モデル ) マスコンモデル 3 により 1km メッシュの地上高 70m における 24 時間の毎時風速を予測し

untitled

横浜市環境科学研究所

Microsoft Word - apstattext04.docx

無党派層についての分析 芝井清久 神奈川大学人間科学部教務補助職員 統計数理研究所データ科学研究系特任研究員 注 ) 図表は 不明 無回答 を除外して作成した 設問によっては その他 の回答も除外した この分析では Q13 で と答えた有権者を無党派層と定義する Q13 と Q15-1, 2 のクロ

スライド 1

論文誌用MS-Wordテンプレートファイル

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

統計的データ解析

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft Word - mstattext02.docx

EBNと疫学

Taro-プレミアム第66号PDF.jtd

第 5 回国際将棋フォーラムが 10 月 27 日から 30 日まで フランス パリ近郊のリュエィユ マルメゾン市で開催された このイベントは将棋の海外普及と国際親善を目指して 1999 年に第 1 回が開催され 今回が初の海外開催 プロ棋士は森内俊之名人 羽生善治二冠 青野照市九段 畠山成幸七段

スライド 1

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

コンピュータ応用・演習 情報処理システム

mycards の使い方 1. カードの登録方法 2. カードセットの作成と編集 3. STUDY モードについて 4. CHALLENGE モードについて 5. カード閲覧 について 6. 設定 について 1. カードの登録方法 mycards のトップページから 以下の方法で登録ができます レッ

Microsoft PowerPoint - 09macro3.ppt

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Gatlin(8) 図 1 ガトリン選手のランニングフォーム Gatlin(7) 解析の特殊な事情このビデオ画像からフレームごとの静止画像を取り出して保存してあるハードディスクから 今回解析するための小画像を切り出し ランニングフォーム解析ソフト runa.exe に取り込んで 座標を読み込み この

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - ゲーム理論2016.pptx

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

合わせを許す フリースタイルチェス という対戦形式も考案され, 発展を遂げている. この対戦では, あまり強くない人間 + コンピュータ + 良いプロセス が グランドマスター + コンピュータ + 良くないプロセス に勝利するということが起こっている. このことは, コンピュータをどう使いこなすか

ナッシュ均衡 ( 最適反応 ) 支配戦略のみで説明できない場合 ( その) 戦略 A 戦略 B 戦略 A (,) (0,0) 戦略 B (0,0) (,) 支配戦略均衡 : 無し ナッシュ均衡 :(,) と (,) 支配戦略均衡よりも適応範囲が広い ナッシュ均衡の良い性質 各プレイヤーは戦略変更の積

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc


1. 期待収益率 ( 期待リターン ) 収益率 ( リターン ) には次の二つがあります 実際の価格データから計算した 事後的な収益率 将来発生しうると予想する 事前的な収益率 これまでみてきた債券の利回りを求める計算などは 事後的な収益率 の計算でした 事後的な収益率は一つですが 事前に予想できる

表紙.indd

用しないことを世界選手権大会で試みて参りました. 芝浦将棋 Jr. でも強化学習で評価関数 を学習するなど, 上記の開発コンセプトに沿って開発を進めていくつもりです. 3. 開発メンバー本チームの開発統括者は芝浦工業大学工学部情報工学科に所属する教員, 五十嵐治一教授です. 開発メンバーはすべて五十

Microsoft Word - 【セット版】別添資料2)環境省レッドリストカテゴリー(2012)

第1章 財務諸表

世界コンピュータ将棋選手権参加報告、及び、GPS 将棋の技術

ゲーム情報学研究の事例 将棋

資金量 方針 性格等を考慮して 自己売買ルールを確立してください 売買シミュレーションの手仕舞いマークは 仕掛けマーク ( 通常は終値 ) に対して発生します 実際の仕掛け位置が違う場合は 予定利益から計算して判断してください 取引マークはメニューの売買条件 全ペア売買条件詳細設定から確認 変更可能

( ) ( ) ( )

untitled

untitled


Excelによる統計分析検定_知識編_小塚明_5_9章.indd

リンクされたイメージを表示できません ファイルが移動または削除されたか 名前が変更された可能性があります リンクに正しいファイル名と場所が指定されていることを確認してください 9 2

[14: :10] 囲碁 (2 件 ) (3) 棋力認定問題によるコンピュータ囲碁の評価 ( その4) 鎌田真人 豊間根衣吹 ( 岩手県立大学宮古短期大学部 ) 松原仁 ( 公立はこだて未来大学 ) モンテカルロ法前後と最新バージョンの市販囲碁ソフト 4 シリーズ 12 ソフトについて

小次郎講師のトレーダーズバイブル第53回

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

スライド 1

目次 ペトリネットの概要 適用事例

日本棋院棋士採用規定

Microsoft PowerPoint ppt

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Transcription:

将棋名人のレーティングと棋譜分析 山下宏 2014 年 11 月 7 日 GPW 箱根

大山 15 世名人と羽生名人 全盛期に戦えばどちらが強い? 大山康晴 15 世名人 タイトル獲得 80 期 昭和の覇者 羽生善治名人 1996 年に7 冠達成 平成の覇者

歴代名人の強さを調べる 対局の結果から 対局者の棋力を点数で表す 勝てば点数プラス 負ければマイナス いわゆるEloレーティング 棋譜の内容から 棋譜を将棋プログラムで解析して強さを推定 勝敗の情報は使わない こちらがメインです

棋譜 棋譜でーたーべーす ネットでの匿名による棋譜の登録 56,000 局 プロがメインだがアマや女流も含む 重複や入力ミスがある 日付が同じ棋譜だけは修正 将棋倶楽部 24 の 24 万局集 対局サイトの棋譜からアマの棋譜を24 万局 2004 年出版 今は絶版

対局の結果からのレーティング Elo レーティング 対局者の強さを点数で表す 100 点差で勝率 64% 200 点差で75% になる 同じ点数同士 勝者 +16 点 敗者ー 16 点 200 点差 強い方が勝ち 勝者 +8 点 敗者ー 8 点 200 点差 弱い方が勝ち 勝者 +24 点 敗者ー 24 点 3 勝 1 敗ペース (75%) で点数の変動なし

実際は理論勝率からずれるらしい チェスの場合 白番の勝率が互角で 54% 近い The Sonas Rating Formula から引用

将棋倶楽部 24 のレーティング差と勝率 ±50 で 95% を占めるのでレート差があるときのデータ不足

Elo の計算式

Elo レーティングの特徴 点数の差のみに意味がある 点数の大きさに意味はない 全員に +500 点 など任意の数字を足せる 計算が簡単 将棋倶楽部 24 は Elo の簡易版を利用

プロ棋士の Elo レーティングを計算 全員の初期値を 1500 点で計算 清水市代さんが 1578 点に 高すぎる! 男性に 163 局で勝率 0.18 女流に 523 局で勝率 0.65 女流を除くと 1286 点まで下がる 女流を含めた計算で清水さんが 1286 点になるように女流の初期値を 1074 点にした

Elo レーティングの弱点 母集団が異なり 相互の対局数が尐ないときは苦手

歴代名人の Elo レーティングの推移

棋譜でーたべーす の年毎の棋譜数 大山の 1960 年代は棋譜数が 250 程度と尐ない 弱い棋士の棋譜がないため Elo の上昇が小さくなっていると思われる

現役プロ棋士の人数の推移 現在は 160 人 1960 年代も 70 人でそれほど尐ないわけではない

Whole-History Rating (WHR) Elo が 1 局のみの結果で更新するのに対し WHR はすべての対局結果から最大事後確率を計算する レーティングの高い方が勝つ という予想が Elo 55.1% 当たる WHR 55.8% 当たる わずかだが WHR の方が予測性能がいい

WHR の計算例 1 例えば下記の結果があった場合 3 人のプレイヤ (A B C) がいて 1 日目 A が B に勝つ 2 日目 A が B に勝つ 3 日目 C が A に勝つ

WHR の計算例 2 1 日目 (A が B に勝つ ) で計算 A B C 1 日目 +92-92 ---

WHR の計算例 3 2 日目 (AがBにまた勝つ) までで計算 A B C 1 日目 +131-131 --- 2 日目 +132-132 ---

WHR の計算例 4 3 日目 (CがAに勝つ) までで計算 A B C 1 日目 +35-174 --- 2 日目 +35-174 --- 3 日目 +34-174 +132 3 日目は対局していない B の点も下がり 同時に A, B の過去の点も変化する

Elo WHR

棋譜の内容からレーティングを計算 Bonanza6.0 を使って棋譜の 1 手 1 手を探索 最善手と評価値を記録 探索深さは11に固定 詰をBonanzaのdfpn 1000 万ノードで調べる

棋力との関連性が高い指標を見つけたい 平均悪手 という指標を導入する Bonanza と違う手を指して かつ評価が下がったときを悪手とする

平均悪手の計算例 7 六歩をBonanzaは選び評価は +0.3 人間は 2 六歩を指した 次の 2 六歩の局面の評価は +0.2 評価が下がっているので悪手と認定 悪手合計 += 0.1 平均悪手 = 悪手合計 手数

平均悪手で無視する手 40 手目以降のみを対象 定跡の排除 +10 以上の評価は無視 形作り の手を排除 詰みが絡む局面が必要以上に影響するのを避ける

同様に 平均好手 Bonanza と違う手を指して評価が上がった場合 一致率 Bonanza と同じ手を指した割合 好手率 好手を指した割合

複雑さ 局面の複雑さを表す指標 反復深化の途中で最善手が変わった場合の評価値の差の合計 深さ 1 76 歩 +0.3 深さ 2 26 歩 +0.2 深さ 3 26 歩 +0.0 深さ 1 2 のみが対象で 複雑さは 0.1 平均変動 という名称が正しいかも

複雑さ と 平均悪手 の関係 複雑になるほど悪手も増加

将棋倶楽部 24 の棋譜を解析 R300 R800 R1300 R1800 R2300 R2400 R2500 R2600 R2700 の棋譜を 200 局ずつ調べた R300 の棋譜は R350 ±30 同士の対戦 Bonanza の深さは 11 だけでなく 深さ 2 深さ 6 も調べた

将棋倶楽部 24 のレーティング分布

深さ 2 6 11 での平均悪手

深さ 11 での平均好手

深さ 2 6 11 での好手率

深さ 2 6 11 での複雑さ

深さ 2 6 11 での一致率

詰見逃し率 (100 局あたりの回数 )

平均悪手がもっとも予測できそう 深さ 11 の平均悪手に直線を当てはめる Rating = -3148 平均悪手 + 4620 が成り立つとする

解析に使った Bonanza の強さ

floodgate と将棋倶楽部 24 のレーティングを直接比較できるとする 2004 年の将棋倶楽部 24 との比較 将棋倶楽部 24 は年々インフレしている? floodgateは2007 年の将棋倶楽部 24の YSSの点数と一致するように調整された ちょっと乱暴だがそれほど差はないはず

深さ 2 6 11 での平均悪手 ( 再掲 ) 深さ 6 で R2700 まで分類できている 深さ 6 の強さは R2009 700 点上まで予測可能か?

深さ 3 4 5 での平均悪手 深さ 5 でも R2700 まで分類できている 深さ 5 の強さは R1830 900 点上まで予測可能か?

この手法の欠陥 プログラムより強い棋譜は分類できないはず 深さ 2(R1200) でも R1800 まで分類できている? 自分より強い棋譜も分類可能か プログラム自身の棋譜を解析すれば平均悪手は 0 になってしまう 明らかに正しくない! しかし人間の棋譜に関しては強い関連性があるように思われる

GPSFish でも同様の解析を行った GPSFish(2013 年 8 月版 ) の深さ 12 固定 Bonanza より 1 手深いが時間は 1 局 8 分と 6 分で GPSFish の方が短い Bonanza の深さ 11 に 319 勝 181 敗 レーティングだと +99 強い より正確な解析ができると期待

深さ 2 7 12 の平均悪手 (GPSFish)

深さ 3 4 5 6 の平均悪手 (GPSFish) 縦方向に拡大している 深さ 4 で R2700 まで分類できている?

4 人の名人のタイトル戦でのレーティング推移 タイトル戦の平均悪手をレーティングに換算 タイトル戦に限定したのはトップレベルの強さを発揮していた時期を比較したかったため 以下の 4 人 大山康晴 15 世名人 中原誠 16 世名人 谷川浩司 17 世名人 羽生善治 19 世名人

大山の換算レーティングの推移 年平均 16 局 R3000 前後で推移

中原の換算レーティングの推移 年平均 18 局 R3100 前後で推移

谷川の換算レーティングの推移 年平均 12 局 R3100? ばらつきが大きい

羽生の換算レーティングの推移 年平均 22 局 R3300 前後で推移

羽生の点数が大山を上回る 羽生の 1996 年 大山の 1964 年 その前後 2 年の平均では羽生が 227 点上

GPSFish の方が変動が小さい

加藤一二三の WHR レーティングと換算レーティングを比較する 棋譜は早指し戦を除く 1455 棋譜 タイトル戦以外も含む Bonanza と GPSFish の平均を取る さらにその 3 年間の移動平均と WHR を比較

加藤の WHR と換算レーティング

勝敗の結果のみから計算したレーティングと棋譜の内容のみからら計算したレーティングがほぼ一致した

江戸時代の棋士の結果

家元制最強は宗英 を確認? 六代大橋宗英の換算 R が高い 宗英は家元制で最強の名人とされる 関西将棋連盟のホームページより

タイトル戦 (2 日制 ) を基準とした 1 日制 NHK 杯の差 NHK 杯の棋譜は両対局者の Elo レーティングの合計が高いものから年間上位 10 局 タイトル戦と同レベルの棋士が指した棋譜を集めた

2 日制と 1 日制には明確に差がある 2 日制に比べて 1 日制は 100 点低い NHK 杯は 200 点低い Bonanza と GPSFish の平均で 加藤一二三は NHK 杯で 91 点低い と小さい 秒読みの神様 を確認?

ソフトの換算レーティング Floodgate の棋譜から 全般に換算 R が高すぎる 15 分の NDF より 6 時間の gpsfish_xeon が強いはずだが分かってない 詰見逃しはソフトには無関係らしい ソフトの換算 R は信用できない?

NHK 杯の羽生と dcsyhi( デクシ ) の比較 dcsyhi は羽生ではなかった? 400 点差もある dcsyhi の棋譜は羽生にしては弱すぎる もしくは NHK 杯の 10 分 +30 秒 + 考慮時間 1 分 10 回と将棋倶楽部 24 の 1 分 +30 秒の差か?

以降はやや否定的なデータです

アマチュアの人の換算 R を計算 将棋倶楽部 24 の人達のレーティングを検証 名前の後ろは平均レーティング 1300 点 (1350±30) で対局した棋譜を解析 1800 点 (1850±30) 2300 点 (2350±30) 対局日は関係なくランダムに並び替え 論文含め 換算 R は +50 を足すのが正しい

1300 点の人達の換算 R

1300 点の人達の換算 R その 2

1800 点の人達の換算 R

2300 点の人達の換算 R

2600 点の人達の換算 R

かなりブレが大きい 棋風によって 500 点程度はずれる? R が高いほどぶれは減っている 持ち時間の差が大きい?( 棋譜に情報なし ) 早指し 1 分 +1 手 30 秒 15 分 15 分 +1 手 1 分 R1300は7 割が早指し R1800は9 割が早指し 対局数は 24 局程度は必要か?

勝又さんの換算レーティング推移 年平均 11 局平均換算 R3042

勝又さんの換算レーティング WHRはほとんど動きがない 換算 Rの平均は3042 WHRの平均はR2952で90 点差 加藤一二三さんと同じだけ並行移動した場合 女流を含めた平均はR2837(1438+1399) 換算 R はタイトル戦の中原 16 世名人に近い

神様のレーティングは R4600? Bonanza rating = -3148y + 4620 GPSFish rating = -2560y + 4743 平均悪手 y=0 で 4620 と 4743 このあたりが神様のレーティングか?

仮定に仮定を重ねた結果ですが 羽生の 7 冠時代は大山の全盛期より 227 点強い 20 棋譜程度ですべてのプレイヤの棋力を推定できる 大橋宗英が家元制で最強なのを確認した 2 日制の棋譜は 1 日制 NHK 杯よりはっきりレベルが高い

今後の課題 より予測が正確な指標の発見 平均悪手と好手率 複雑さの組み合わせなど より正確で 多くの棋譜の入手 将棋倶楽部 24のレーティングが正しいか検証 R2700 以上が増えるなどインフレしている? 持ち時間を統一して調べる より深い探索での解析 より多くのプログラムでの解析