将棋吊人のレーティングと棋譜分析

Similar documents
レーティングと棋譜分析

dlshogiアピール文章

dTV 将棋プラス 2018年2月 週間番組表

しています. これには探索木のすべてのノードを探索する必要がありますが,αβカットなどの枝刈りの処理により探索にかかる計算時間を短縮しています. これに対して, 探索するノードを限定したり, 優先順位をつけて選択的に探索する 選択探索 という探索方式があります. 本チームはノードの選択方式としてノー

Microsoft PowerPoint - vc2013.s.takeuchi.pptx

dTV将棋プラス 2019年2月週間番組表

横浜市環境科学研究所

将棋プログラムの現状と未来

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

日本将棋連盟 七段 神吉 宏充 かんき ひろみつ 氏 略 歴 昭和3 4年3 月1 日 兵庫県加古川市に生まれる 中学生の時に本格的に将棋を始め 17 歳でアマ名人戦全国3 位になる 1 9歳からプロを目指し 内藤國雄九段の門を叩く 以降 20 歳で初段 プロ 24歳で四段 28歳で五段と順調に昇

不偏推定量

Microsoft Word - apstattext04.docx


第 5 回国際将棋フォーラムが 10 月 27 日から 30 日まで フランス パリ近郊のリュエィユ マルメゾン市で開催された このイベントは将棋の海外普及と国際親善を目指して 1999 年に第 1 回が開催され 今回が初の海外開催 プロ棋士は森内俊之名人 羽生善治二冠 青野照市九段 畠山成幸七段

Microsoft Word - mstattext02.docx


ナッシュ均衡 ( 最適反応 ) 支配戦略のみで説明できない場合 ( その) 戦略 A 戦略 B 戦略 A (,) (0,0) 戦略 B (0,0) (,) 支配戦略均衡 : 無し ナッシュ均衡 :(,) と (,) 支配戦略均衡よりも適応範囲が広い ナッシュ均衡の良い性質 各プレイヤーは戦略変更の積

EBNと疫学

Microsoft PowerPoint ppt

論文誌用MS-Wordテンプレートファイル

Taro-プレミアム第66号PDF.jtd

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

無党派層についての分析 芝井清久 神奈川大学人間科学部教務補助職員 統計数理研究所データ科学研究系特任研究員 注 ) 図表は 不明 無回答 を除外して作成した 設問によっては その他 の回答も除外した この分析では Q13 で と答えた有権者を無党派層と定義する Q13 と Q15-1, 2 のクロ

日本棋院棋士採用規定

風力発電インデックスの算出方法について 1. 風力発電インデックスについて風力発電インデックスは 気象庁 GPV(RSM) 1 局地気象モデル 2 (ANEMOS:LAWEPS-1 次領域モデル ) マスコンモデル 3 により 1km メッシュの地上高 70m における 24 時間の毎時風速を予測し

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

スライド 1

表紙.indd

PowerPoint プレゼンテーション

世界コンピュータ将棋選手権参加報告、及び、GPS 将棋の技術

Microsoft Word - lec_student-chp3_1-representative

統計的データ解析

Microsoft PowerPoint - GLMMexample_ver pptx

mycards の使い方 1. カードの登録方法 2. カードセットの作成と編集 3. STUDY モードについて 4. CHALLENGE モードについて 5. カード閲覧 について 6. 設定 について 1. カードの登録方法 mycards のトップページから 以下の方法で登録ができます レッ

用しないことを世界選手権大会で試みて参りました. 芝浦将棋 Jr. でも強化学習で評価関数 を学習するなど, 上記の開発コンセプトに沿って開発を進めていくつもりです. 3. 開発メンバー本チームの開発統括者は芝浦工業大学工学部情報工学科に所属する教員, 五十嵐治一教授です. 開発メンバーはすべて五十


( ) ( ) ( )

untitled

untitled

Microsoft Word - フェイスブック入門(6版)

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

untitled

リンクされたイメージを表示できません ファイルが移動または削除されたか 名前が変更された可能性があります リンクに正しいファイル名と場所が指定されていることを確認してください 9 2

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

目次 ペトリネットの概要 適用事例

第1章 財務諸表

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft Word - 【セット版】別添資料2)環境省レッドリストカテゴリー(2012)

目次 1. サイトの概要 2. このサイトで行なうこと 3. ログインするには 4. 情報発信会員 管理画面の説明 5. 掲載情報を決める 6. マイページを作成する 6-1 マイページのトップ画面について 7. コンテンツを作成する 7-1 掲載場所を決める 7-2 ページを作成する プロフィール

Transcription:

歴代名人の強さ 山下宏 2017 年 10 月 13 日 札幌 NoMaps

大山 15 世名人と羽生棋聖 全盛期に戦えばどちらが強い? 大山 15 世名人昭和の大名人 羽生棋聖将棋史上最強と言われる (19 世名人 ) 時代が違う二人を直接戦わせることは不可能 しかし二人が指した棋譜は残されている

棋譜から強さを推定 将棋ソフトを使って解析 初心者からアマ高段者まで1800 局を調べた ソフトが悪手と指摘した手と棋力に関連性 悪手が尐ないほど強い 勝敗の情報は使わない

使ったソフト Bonanza 6.0 2011 年のソフト ponanza とは違います GPSFish 2013 年のソフト 東大のチームが作成 Bonanzaより尐し強い ( 勝率 6 割 )

棋譜の解析 ソフトを使って棋譜の 1 手 1 手を探索 最善手と評価値を記録 探索深さは 11 に固定

平均悪手 という指標を使う ソフトが選んだ手と人間が指した手が違った場合 ソフトは 7 六歩を選び評価は +30 人間は 2 六歩を選び評価は +20 評価が下がっているので悪手と認定 平均悪手 = 悪手の合計 手数 評価が上がってる場合はソフトの読みを上回っているので無視

深さ 2 6 11 での平均悪手

平均悪手と棋力は比例する? 深さ 11 の平均悪手に直線を当てはめる Rating = -3148 平均悪手 + 4620 が成り立つとする

深さ 2 7 12 の平均悪手 (GPSFish)

4 人の名人のタイトル戦の棋譜を解析 タイトル戦の平均悪手をレーティングに換算 タイトル戦に限定したのはトップレベルの強さを発揮していた時期を比較したかったため 以下の 4 人 大山康晴 15 世名人 中原誠 16 世名人 谷川浩司 17 世名人 羽生善治 19 世名人

大山の換算レーティングの推移 年平均 16 局 R3000 前後で推移

中原の換算レーティングの推移 年平均 18 局 R3100 前後で推移

谷川の換算レーティングの推移 年平均 12 局 R3100? ばらつきが大きい

羽生の換算レーティングの推移 年平均 22 局 R3300 前後で推移

羽生の点数が大山を上回る 羽生の七冠 大山の五冠の点数では羽生が 227 点上 10 回対局すれば羽生が 8 勝 2 敗で勝ち越す

江戸時代の棋士の結果

家元制最強は宗英 を確認? 六代大橋宗英の換算 R が高い 宗英は家元制で最強の名人とされる 関西将棋連盟のホームページより

2 日制と 1 日制には明確に差がある 2 日制に比べて 1 日制は 100 点低い NHK 杯は 200 点低い 羽生さんは持時間 10 分 相手は 9 時間というハンデでも互角に戦える 加藤一二三は NHK 杯で 91 点低い と小さい 秒読みの神様 を確認?

NHK 杯の羽生と dcsyhi( デクシ ) の比較 dcsyhi は羽生ではなかった? 400 点差もある dcsyhi の棋譜は羽生にしては弱すぎる もしくは NHK 杯の 10 分 +30 秒 + 考慮時間 1 分 10 回と将棋倶楽部 24 の 1 分 +30 秒の差か?

29 連勝した藤井聡太四段の強さ 点数 羽生善治棋聖 (46) 3347 藤井聡太四段 (14) 3305 渡辺明竜王 (33) 3214 森内俊之 9 段 (46) 3151 谷川浩司 9 段 (55) 3159 アマチュアの平均 1200 程度 29 棋譜の結果では羽生さんに匹敵する強さ

神様のレーティングは R4600? Bonanza rating = -3148y + 4620 GPSFish rating = -2560y + 4743 平均悪手 y=0 で 4620 と 4743 このあたりが神様のレーティングか?

まとめ 羽生棋聖は大山名人に 8 勝 2 敗で勝ち越すぐらいに強い 20 棋譜程度あれば棋譜から棋力が分かる 二日制のタイトル戦の棋譜は一日制よりはっきりレベルが高い 藤井聡太四段は羽生さんに匹敵する強さ

加藤一二三の WHR レーティングと換算レーティングを比較する 棋譜は早指し戦を除く 1455 棋譜 タイトル戦以外も含む Bonanza と GPSFish の平均を取る さらにその 3 年間の移動平均と WHR を比較

加藤の WHR と換算レーティング

勝敗の結果のみから計算したレーティングと棋譜の内容のみからら計算したレーティングがほぼ一致した

棋譜 棋譜でーたーべーす ネットでの匿名による棋譜の登録 56,000 局 プロがメインだがアマや女流も含む 重複や入力ミスがある 日付が同じ棋譜だけは修正 将棋倶楽部 24 の 24 万局集 対局サイトの棋譜からアマの棋譜を24 万局 2004 年出版 今は絶版

対局の結果からのレーティング Elo レーティング 対局者の強さを点数で表す 100 点差で勝率 64% 200 点差で75% になる 同じ点数同士 勝者 +16 点 敗者ー 16 点 200 点差 強い方が勝ち 勝者 +8 点 敗者ー 8 点 200 点差 弱い方が勝ち 勝者 +24 点 敗者ー 24 点 3 勝 1 敗ペース (75%) で点数の変動なし

実際は理論勝率からずれるらしい チェスの場合 白番の勝率が互角で 54% 近い The Sonas Rating Formula から引用

将棋倶楽部 24 のレーティング差と勝率 ±50 で 95% を占めるのでレート差があるときのデータ不足

Elo の計算式

Elo レーティングの特徴 点数の差のみに意味がある 点数の大きさに意味はない 全員に +500 点 など任意の数字を足せる 計算が簡単 将棋倶楽部 24 は Elo の簡易版を利用

プロ棋士の Elo レーティングを計算 全員の初期値を 1500 点で計算 清水市代さんが 1578 点に 高すぎる! 男性に 163 局で勝率 0.18 女流に 523 局で勝率 0.65 女流を除くと 1286 点まで下がる 女流を含めた計算で清水さんが 1286 点になるように女流の初期値を 1074 点にした

Elo レーティングの弱点 母集団が異なり 相互の対局数が尐ないときは苦手

歴代名人の Elo レーティングの推移

棋譜でーたべーす の年毎の棋譜数 大山の 1960 年代は棋譜数が 250 程度と尐ない 弱い棋士の棋譜がないため Elo の上昇が小さくなっていると思われる

現役プロ棋士の人数の推移 現在は 160 人 1960 年代も 70 人でそれほど尐ないわけではない

棋譜の内容からレーティングを計算 Bonanza6.0 を使って棋譜の 1 手 1 手を探索 最善手と評価値を記録 探索深さは11に固定 詰をBonanzaのdfpn 1000 万ノードで調べる

棋力との関連性が高い指標を見つけたい 平均悪手 という指標を導入する Bonanza と違う手を指して かつ評価が下がったときを悪手とする

平均悪手の計算例 7 六歩をBonanzaは選び評価は +0.3 人間は 2 六歩を指した 次の 2 六歩の局面の評価は +0.2 評価が下がっているので悪手と認定 悪手合計 += 0.1 平均悪手 = 悪手合計 手数

平均悪手で無視する手 40 手目以降のみを対象 定跡の排除 +10 以上の評価は無視 形作り の手を排除 詰みが絡む局面が必要以上に影響するのを避ける

同様に 平均好手 Bonanza と違う手を指して評価が上がった場合 一致率 Bonanza と同じ手を指した割合 好手率 好手を指した割合

複雑さ 局面の複雑さを表す指標 反復深化の途中で最善手が変わった場合の評価値の差の合計 深さ 1 76 歩 +0.3 深さ 2 26 歩 +0.2 深さ 3 26 歩 +0.0 深さ 1 2 のみが対象で 複雑さは 0.1 平均変動 という名称が正しいかも

複雑さ と 平均悪手 の関係 複雑になるほど悪手も増加

深さ 2 6 11 での平均悪手

深さ 11 での平均好手

深さ 2 6 11 での好手率

深さ 2 6 11 での複雑さ

深さ 2 6 11 での一致率

詰見逃し率 (100 局あたりの回数 )

平均悪手がもっとも予測できそう 深さ 11 の平均悪手に直線を当てはめる Rating = -3148 平均悪手 + 4620 が成り立つとする

解析に使った Bonanza の強さ

floodgate と将棋倶楽部 24 のレーティングを直接比較できるとする 2004 年の将棋倶楽部 24 との比較 将棋倶楽部 24 は年々インフレしている? floodgateは2007 年の将棋倶楽部 24の YSSの点数と一致するように調整された ちょっと乱暴だがそれほど差はないはず

深さ 2 6 11 での平均悪手 ( 再掲 ) 深さ 6 で R2700 まで分類できている 深さ 6 の強さは R2009 700 点上まで予測可能か?

深さ 3 4 5 での平均悪手 深さ 5 でも R2700 まで分類できている 深さ 5 の強さは R1830 900 点上まで予測可能か?

この手法の欠陥 プログラムより強い棋譜は分類できないはず 深さ 2(R1200) でも R1800 まで分類できている? 自分より強い棋譜も分類可能か プログラム自身の棋譜を解析すれば平均悪手は 0 になってしまう 明らかに正しくない! しかし人間の棋譜に関しては強い関連性があるように思われる

GPSFish でも同様の解析を行った GPSFish(2013 年 8 月版 ) の深さ 12 固定 Bonanza より 1 手深いが時間は 1 局 8 分と 6 分で GPSFish の方が短い Bonanza の深さ 11 に 319 勝 181 敗 レーティングだと +99 強い より正確な解析ができると期待

29 連勝した藤井聡太四段の強さ GPSFish(2013 年 8 月版 ) の深さ 12 固定 Bonanza より 1 手深いが時間は 1 局 8 分と 6 分で GPSFish の方が短い Bonanza の深さ 11 に 319 勝 181 敗 レーティングだと +99 強い より正確な解析ができると期待

深さ 2 7 12 の平均悪手 (GPSFish)

深さ 3 4 5 6 の平均悪手 (GPSFish) 縦方向に拡大している 深さ 4 で R2700 まで分類できている?

4 人の名人のタイトル戦でのレーティング推移 タイトル戦の平均悪手をレーティングに換算 タイトル戦に限定したのはトップレベルの強さを発揮していた時期を比較したかったため 以下の 4 人 大山康晴 15 世名人 中原誠 16 世名人 谷川浩司 17 世名人 羽生善治 19 世名人

大山の換算レーティングの推移 年平均 16 局 R3000 前後で推移

中原の換算レーティングの推移 年平均 18 局 R3100 前後で推移

谷川の換算レーティングの推移 年平均 12 局 R3100? ばらつきが大きい

羽生の換算レーティングの推移 年平均 22 局 R3300 前後で推移

羽生の点数が大山を上回る 羽生の 1996 年 大山の 1964 年 その前後 2 年の平均では羽生が 227 点上

GPSFish の方が変動が小さい

加藤一二三の WHR レーティングと換算レーティングを比較する 棋譜は早指し戦を除く 1455 棋譜 タイトル戦以外も含む Bonanza と GPSFish の平均を取る さらにその 3 年間の移動平均と WHR を比較

加藤の WHR と換算レーティング

勝敗の結果のみから計算したレーティングと棋譜の内容のみからら計算したレーティングがほぼ一致した

江戸時代の棋士の結果

家元制最強は宗英 を確認? 六代大橋宗英の換算 R が高い 宗英は家元制で最強の名人とされる 関西将棋連盟のホームページより

タイトル戦 (2 日制 ) を基準とした 1 日制 NHK 杯の差 NHK 杯の棋譜は両対局者の Elo レーティングの合計が高いものから年間上位 10 局 タイトル戦と同レベルの棋士が指した棋譜を集めた

2 日制と 1 日制には明確に差がある 2 日制に比べて 1 日制は 100 点低い NHK 杯は 200 点低い Bonanza と GPSFish の平均で 加藤一二三は NHK 杯で 91 点低い と小さい 秒読みの神様 を確認?

ソフトの換算レーティング Floodgate の棋譜から 全般に換算 R が高すぎる 15 分の NDF より 6 時間の gpsfish_xeon が強いはずだが分かってない 詰見逃しはソフトには無関係らしい ソフトの換算 R は信用できない?

NHK 杯の羽生と dcsyhi( デクシ ) の比較 dcsyhi は羽生ではなかった? 400 点差もある dcsyhi の棋譜は羽生にしては弱すぎる もしくは NHK 杯の 10 分 +30 秒 + 考慮時間 1 分 10 回と将棋倶楽部 24 の 1 分 +30 秒の差か?

以降はやや否定的なデータです

アマチュアの人の換算 R を計算 将棋倶楽部 24 の人達のレーティングを検証 名前の後ろは平均レーティング 1300 点 (1350±30) で対局した棋譜を解析 1800 点 (1850±30) 2300 点 (2350±30) 対局日は関係なくランダムに並び替え 論文含め 換算 R は +50 を足すのが正しい

1300 点の人達の換算 R

かなりブレが大きい 棋風によって 500 点程度はずれる? R が高いほどぶれは減っている 持ち時間の差が大きい?( 棋譜に情報なし ) 早指し 1 分 +1 手 30 秒 15 分 15 分 +1 手 1 分 R1300は7 割が早指し R1800は9 割が早指し 対局数は 24 局程度は必要か?

神様のレーティングは R4600? Bonanza rating = -3148y + 4620 GPSFish rating = -2560y + 4743 平均悪手 y=0 で 4620 と 4743 このあたりが神様のレーティングか?

仮定に仮定を重ねた結果ですが 羽生の 7 冠時代は大山の全盛期より 227 点強い 20 棋譜程度ですべてのプレイヤの棋力を推定できる 大橋宗英が家元制で最強なのを確認した 2 日制の棋譜は 1 日制 NHK 杯よりはっきりレベルが高い