Copyright 2006 DataStadium Inc. All rights reserved. 日本プロ野球のデータを用いた試合結果のシミュレーション - 第 3 回スポーツデータ解析コンペティションに向けて - September, 2013 データスタジアム株式会社 ベースボール事業部アナリスト金沢慧 k_kanazawa@datastadium.co.jp
メニュー 1: 評価 から 予測 へ 2: 野球をシミュレーションする仕組み 3: シミュレーション結果 課題 4: コンペティションへの期待
メニュー 1: 評価 から 予測 へ 2: 野球をシミュレーションする仕組み 3: シミュレーション結果 課題 4: コンペティションへの期待
1: 評価 から 予測 へ データスタジアムについて * 下記以外の競技に関しても 国内外の提携各社との連携により ご提供することが可能です 野球 サッカー リーグ チーム メディア ラグビー バスケットボール 2012 Data Stadium Inc. All rights reserved 主にスポーツデータの取得 配信 分析を行っている
1: 評価 から 予測 へ 野球選手の評価指標例 専門的で親しみにくい 打撃評価 + 守備評価 + 投球評価 =WAR ( 野手 ) ( 投手 ) 2012 年統計関連学会連合大会 日本におけるスポーツ選手の評価指標の現状 ( 金沢 )
1: 評価 から 予測 へ スポーツの予測を楽しむ需要 サッカーくじや野球選手の活躍を予想するゲームが web 上で展開されている 予測エンタテインメントが徐々に普及 予測力を高める分析アウトプットの需要増 分かりやすいアウトプットが必要 スポーツのデータに親しんでもらえるチャンス
メニュー 1: 評価 から 予測 へ 2: 野球をシミュレーションする仕組み 3: シミュレーション結果 課題 4: コンペティションへの期待
課題 : 野球の試合結果を予測したい 勝率を予測するためにシミュレーションロジックを製作
ツールの紹介
ツールの紹介 藤浪がバレンティンに一発を浴びるも 2 安打完投勝利!!
シミュレーションの考え方 選手の能力値を推定 打席結果を抽出 イニング得点を計算 1 試合の得点と勝敗を決定 200 試合分の結果から予測勝率を推定
能力値 の考え方 藤浪 ( 阪神 )vs バレンティン ( ヤクルト ) 四球 死球犠飛併殺打 どのようにして能力分布を作ったか? 本塁打 二塁打 安打
過去 3 年の成績をベースに能力値を推定 参考 :Tom Tango の成績予測システム Marcel 2004 年の成績を予測するために 2003 年 /2002 年 /2001 年 を 5/4/3 の割合で重みを付ける これを応用して 2013 年の成績を予測するために 2013 年 /2012 年 /2011 年 を 5/4/3 の割合で重みを付ける 5 4 3 2013 年は試合日前日までのデータ
藤浪とバレンティンの能力値 藤浪 バレンティン 全右打者 vs. 藤浪 死球 四球 犠飛併 犠打 殺打 バレンティン vs. 全右投手 四球 犠死飛球併殺打 本塁三打塁打 二塁打 単打 対左右打者別で算出 対左右投手別で算出
藤浪とバレンティンの能力値 藤浪とバレンティンの対決 藤浪 vs バレンティン 四球 死犠併球飛殺打 本塁打 二塁打 安打 藤浪の各項目を NPB 先発投手の平均と比べ その比をバレンティンの各項目の割合に掛けて算出
シミュレーションの考え方 選手の能力値を推定 打席結果を抽出 乱数を発生させる イニング得点を計算 1 試合の得点と勝敗を決定 200 試合分の結果から予測勝率を推定
打席結果の抽出方法 藤浪 vs バレンティン 四球 死球犠飛併殺打 打席毎に乱数を発生させて 打席結果を抽出する 本塁打 二塁打 安打
打席結果の抽出方法
シミュレーションの考え方 選手の能力値を推定 進塁規則を実データで計算 打席結果を抽出 イニング得点を計算 1 試合の得点と勝敗を決定 200 試合分の結果から予測勝率を推定
イニング得点の計算方法 これらの打席結果で 5 回裏 3 点 とどのように判断するか??
イニング得点の計算方法 2004~2012 年の実データ 打席結果 進塁規則
イニング得点の計算方法 5 回裏 1: 俊介 四球 <5 回裏開始 > 無死一塁 合計 3 点!! 2: 清水 凡打 1 死一塁 3: 藤浪 単打 1 死一三塁 4: 西岡 二塁打 1 死二塁 2 得点!! 5: 上本 単打 1 死一塁 1 得点!! 6: マートン 三振 2 死一塁 7: 鳥谷 三振 3アウトチェンジ <5 回裏終了 >
勝敗の決定 各イニングの得点を合計し 勝敗を決定
シミュレーションの考え方 選手の能力値を推定 打席結果を抽出 イニング得点を計算 1 試合の得点と勝敗を決定 200 試合分の結果から勝率を推定
勝率の推定 同じ試合で繰り返しシミュレーション 200 回繰り返し 勝率を推定する
勝率の推定 ややヤクルト有利 ( 推定勝率は 51%)
メニュー 1: 評価 から 予測 へ 2: 野球をシミュレーションする仕組み 3: シミュレーション結果 課題 4: コンペティションへの期待
3: シミュレーション結果 課題 2013 年をシミュレーションし精度を検証 8 月終了時点まで
3: シミュレーション結果 課題 田中将大 ( 楽天 ) 先発試合一覧 ほぼ 楽天が勝利する予想に
3: シミュレーション結果 課題 2013 年 8 月までの順位表
3: シミュレーション結果 課題 2013 年 8 月までの順位表 実際の結果ともそれなりの整合性
3: シミュレーション結果 課題 課題 ロジックについて 能力値の推定方法をどうするか 勝敗分を判定する基準をどうするか 統一球の影響をどう組み込むか 初出場や出場数の少ない選手の扱いをどうするか スタメンをどう予測するか エクセル以外でどう作るか 使用データについて 救援投手や代打 代走などのデータを反映させる 盗塁など作戦データを反映させる
メニュー 1: 評価 から 予測 へ 2: 野球をシミュレーションする仕組み 3: シミュレーション結果 課題 4: コンペティションへの期待
4: コンペティションへの期待 コンペティションへの期待 2013 年度も開催! 参加者募集中!! 個人成績予測 バレンティン本塁打予報 試合の面白さを予測 試合展開をカテゴリー化 試合時間予測 など 評価だけではなく予測につながる新視点を期待!!
4: コンペティションへの期待 参考文献 [1] 金沢慧 (2012) 日本におけるスポーツ選手の評価指標の現状,2012 年度統計関連学会講演報告集 [2] FanGraphs http://www.fangraphs.com/ [3]J. アルバート /J. ベネット著, 加藤貴昭訳 (2004) メジャーリーグの数理科学 上 [4] Tango on Baseball Archives Tangotiger による成績予測システム Marcel の説明 http://www.tangotiger.net/archives/stud0346.shtml [5] 齊藤善弘 (2007) 野球における打者評価の計算手法について Excel によるシミュレーション, 岐阜聖徳学園大学 Review of economics and information studies [6]THOMAS M. COVER CARROLL W.KEILERS(1977) An Offensive Earned-Run Average for Baseball, OPERATIONS RESEARCH
Copyright (C) 2012 Data Stadium Inc. All rights reserved.