マルコフ過程による 野球の作戦の評価 藤澤幸太郎(東大総合文化) 共同研究者 当山学 澤山慶博 高松賢二 柏原賢二 山口和紀
打率の推移 スティーヴン ジェイ グールド フラミンゴの微笑みより 日本のプロ野球全選手 の打率の推移
研究の動機 野球は原データが豊富なスポーツである 本塁打数 奪三振数 エラー数など 二次的なデータも数多く存在する 打率 防御率 出塁率など 作戦に関する定説も数多く存在する 無死一塁からは送りバント 強打者は敬遠 こういった定説を数理科学的手法を用いて定量 的に評価 検証を行う
全体の流れ 1.目的 2.モデルの選定と手法 3.盗塁の解析結果 4.送りバントの解析結果 5.犠牲フライ スクイズの解析結果 6.敬遠の解析結果 7.無死一塁 三塁での内野ゴロの処理 8.打順の検証 9.まとめ
研究の目的 数理科学的手法を用いて 野球の作戦 定説を定量的 に評価する 野球の最適な打順を考慮する 実際の試合を解析してその作戦の是非を問う
具体的な作戦の有用性 無死一塁の送りバント 盗塁の利得 無死一三塁からの内野ゴロ 最強の打者は何番が妥当か 実際の試合の解析
単純なモデル 塁に出る回数と得点には相関があるのは自明という考え方から 打率モデル 打率=安打数/打数 打率と平均得点で回帰直線を引き得点を予想 長打率モデル 長打率 =総塁打数/打数 長打率と平均得点で回帰直線を引き得点を予想 出塁率モデル 出塁率=(安打数+四球+死球)/打席数 出塁率と平均得点で回帰直線を引き得点を予想
直感的なモデル OPSモデル OPS = 出塁率+長打率 得点とOPSで回帰直線を引き得点を予想 TAモデル TA = (総塁打数+四球+死球+盗塁)/アウト数 1試合27アウトとするとTA 27=1試合の予想得点 RCモデル RC = (安打数+四球) 総塁打数/(打数+四球) 直に予想得点を算出
分析的なモデル 回帰直線による得点予想モデル 打率モデル 得点との回帰直線 (他 長打率 出塁率 長打率 出塁率 etc) o LSLR 各打撃成績と得点との重回帰直線 得点 = (一塁打 W1+二塁打 W2 盗塁 W6)/試合数 o 回帰直線によらないモデル RCモデル RC = (安打数+四球) 総塁打数/(打数+四球) o
分析的なモデル2 [Lindsey 1959, 1961, 1963] 試合結果や得点分布を統計的に解析 作戦の評価を行う [鳩山 1979] 野球のOR (オペレーションズ リサーチ) Lindseyを元に盗塁やバントを評価 [J.アルバート,J.ベネット 2004] メジャーリーグの数理科学 実際のデータを細かく分析 野球の数理科学の教科書 [Bukiet et al. 1997]のScoring Indexモデル マルコフ過程を用いて最適な打順を検証 [廣津 宮地 2004] 野球チームのラインナップ選定のための数理的 手法-日本代表チーム選定を例として(オペレーションズ リサーチ) 最適な打順を考慮 [大澤 合田 2005]グリッド環境における野球チームの最適打順決 定手法の高速化 (情報処理学会研究報告)
Lindseyのモデル バントは相当弱い打者なら効果的 バントはよくも悪くもない 敬遠は悪い
1978年セ リーグ平均のデータを使用 盗塁は二死三塁 二三塁 満塁に効 果的 OERA(Offensive Earned Run Average)を用いた野球選手の評価 投手の評価
モデルの選定 各モデルの特性
目的を検証可能なモデル 盗塁やバント等の作戦を評価するには 作戦の有無による変化が分かる必要 アウト数 走者の位置が分類できるモデル 打順を評価するには 選手を区別する必要
モデルの選定 各モデルの特性 SIモデルを採用
SIモデル 流れ 6つの進塁規則 入力 SIモデル 出力 24状態の得点期待値 得点毎の得点確率 勝率 打順を考慮した1試合あたりの得点期待値
SIモデルの考え方1 進塁規則[D'Esopo, Lefkowitz 1977] 24状態 (塁の状態8つXアウト3つ)
SIモデルの考え方2 要素qijは状態 i から状態 j に 遷移する確率 打席あたりの確率 PS:一塁打 PD:二塁打 Pr:三塁打 PH:ホームラン Pw:四球 Pout:アウト
SIモデルの考え方3 として rはその状態から直接得点する期待値 viは各状態における得点期待値 このVを解くと1イニングの得点期待値が求まる (24元連立方程式を解く)
SIモデルの特徴 SI値について 1イニングにおける各状態の得点期待値が求まる 盗塁やバントといった作戦の評価 同じ人間が打席に立ち続ける 個人の評価 SIL値について SIをベースに9イニング 異なる9人に拡張[廣津 宮地 2004] 得点期待値が打順によって変化 打順の検討 各得点確率を算出可能
SILモデル
得点確率の求め方 行 イニング中 の獲得点 列 状態
1イニング中の得点期待値 2008年日本プロ野球の全チーム平均進塁率 1イニング中における各状態の得点期待値
SIモデルの検証 2008年プロ野球の全試合の得点分布(実線)と SIモデルからもとめた得点分布(破線)
得点毎の確率と勝率 ある選手の打撃結果による得点確率の変化 勝率の変化
盗塁 盗塁 o 打者 アウト数は変化せず 走者が進塁する 有利な状態に遷移する 必ず成功する訳ではない 盗塁の成功確率を指標として 盗塁の評価 評価項目 得点期待値 1点以上をあげる確率 勝率
盗塁.評価法(期待値) 1回ノーアウト1塁 状態2 を考える 盗塁が成功した場合 状態2 状態3 盗塁が失敗した場合 状態2 状態9 得失を計算 成功した場合 1.0634 0.8277=0.22357 失敗した場合 0.2463 0.8277= 0.5813
盗塁 盗塁成功確率 p を考慮 p 0.22357 (1-p) (-0.5813) 0.8170p 0.5813 P 0.7115で得失は0になる
盗塁 期待値による盗塁評価 結果 二死一塁では 積極的に盗塁を試みるべき
盗塁 1点以上あげる確率による盗塁評価 結果 表 1点以上あげる確率 1点以上得点する期待値 が0になる盗塁確率 得点期待値は下がるが 確実に1点がとれるよう になる
盗塁 勝率による盗塁評価 結果 2つの傾向 走者の数のよる違い
盗塁 打撃成績の変化と盗塁成功確率 1塁打の増減と得失0点確率の変化
盗塁.盗塁成功率 平均0.668 イチロー2008年度 盗塁数43 盗塁刺4 盗塁成功率0.915
盗塁まとめ 盗塁は二死一塁の時に行うのが最も効果的 一点が欲しい時に特に有効である 同点の場合 走者が一人の時 後半のイニング になるほど勝利の上昇が大きい
バント 日本の野球は送りバントの数がメジャーリーグ よりも多い 日本の野球の特徴 送りバントは本当に有効か
バント アウトを増やすかわりに走者を進める作戦 (100%バントが成功すると仮定) "平均的なチーム"での1イニングの得点期待値 0.828 0.727 得点期待値を上げる効果はない
バント有, 無のときの得点分布
バント 得点期待値は下がるが, 1点以上の点数が入 る確率は上がる 1点を確実に取りたい場合は有効? バントの有効性を勝率を用いて評価する o 無死一塁での勝率と一死二塁での 勝率を比べる
バントしたとき, しないときの勝率の差
バントのまとめ バントを行うと得点期待値は下がる 1点を確実に取りたい時は有効 後半のイニングで同点または一点勝っている時 には有効 負けている時にはよくない
スクイズ スクイズ o 無死または一死で三塁走者をバントで生還させる作戦 盗塁と同様に成功確率を指標として スクイズを評価 評価項目 得点期待値 勝率
スクイズ 状態遷移 o 成功 三塁走者は得点 打者はアウト o 失敗 三塁走者はアウト 打者は一塁へ進塁 例えば 1点 開始 成功 失敗
スクイズ 期待値によるスクイズ評価 結果 状態12では 積極的にスクイズを試みるべき 全体的に値は低い
勝率によるスクイズの評価 勝率の利得が0になる成功確率 4回の前後で状態12 状態6の評価が逆転
敬遠 強打者をわざと四球にして対決を避ける o 四球で歩かせ次の打者に o 強打者と勝負 どちらの方が良い作戦だろうか
全打席敬遠 SI値が大きい選手ほど敬遠すべき 王なみに長打が打て打率0.45なら全打席敬遠 すべき
特定の場面での敬遠 敬遠は二死二塁 二死三塁が効果的
敬遠による分布の変化
イニングによる違い
敬遠のまとめ 強打者ほど有効 二死二塁 二死三塁の時が最も有効 1,2点取られる確率を下げ 0点 3点以上の確 率を上げる 前半より後半 特に7回以降に有効
無死一, 三塁での内野ゴロの処理 打者が内野ゴロを放ち三塁走者が本塁へむかった 場合 野手の選択肢 次の状態 状況 本塁へ送球 1点入るのを阻止 走者を2人残す 併殺を取る 1点与える それ以上の点が入 りにくい
得点期待値による比較 0.952 0.092+1=1.092 得点期待値だけを見ると本塁へ送球が良い
得点分布の比較 2点以上取られる可能性は 本塁へ送球 のほうが高い
勝率の比較
結論 2点以上リードしているときは, 終盤に いくほど 併殺をとる ほうが有利 リードが1点以下の時には, 終盤にいくほど 本塁へ送球 が有利 2点リードのときには, 序盤は 本塁へ送球 のほうが良く, 終盤は 併殺をとる が良い
SIモデルを用いた打順の検証 先行研究[Bukiet97]ではSI値が一番高い打者は2番 になるべきと結論 o 長打をよく打つがアウト率が高い 一塁打をよく打つが長打は打てない といった打者のタイプが考慮されていない SI値, 出塁率, 長打率を用いた観点から最適打順 の傾向を見る o 日本のプロ野球12球団で投手を含む打順, 含ま ない打順を検証
投手を含む打順 最適打順におけるSI値1位の打者の打順 2番 3番 4番 5番 先行研究(メジャー) 本研究(日本) 7 2 2 4 3 5 0 1 日米の打者のタイプの違いによる可能性 o SI値1位で2番になった2選手は 出塁率1位, 長打率2位以下 メジャーではそういう打者が多い?
投手を9番に固定した場合 打席数を減らして負担を軽減するなどの 理由で投手はほぼ9番に置かれる (最適打順の得点期待値) - (投手9番での最適打順の得点期待値) 最大: 0.021 最小: 0 (最適打順も投手9番) 平均: 0.007
投手を9番に固定した場合 最適打順におけるSI値1位の打者の打順 2番 3番 4番 5番 1 1 9 1 4番最強説は投手を9番に固定したときには正しい
DH制の場合 最適打順におけるSI値1位の打者の打順 1番 2番 3番 4番 3 4 3 2 投手がいる場合といない場合で各打順の役割は 異なる
出塁率, 長打率と打順 出塁率1位の打者と長打率1位の打者が異なる 場合, 出塁率1位の選手のほうが前の打順にな る o 直感的には, 出塁率1位の選手が塁に出て, 長打率1位の選手にチャンスで打席を回す
実際の試合に関して WBCの主力選手陣を並べ替えてSIL値を求める 順位 名前 SIの値 1 村田 1.004 2 内川 0.934 3 青木 0.865 4 中島 0.852 5 小笠原 0.838 6 福留* 0.536 7 イチロー* 0.530 8 岩村* 0.488 9 城島* 0.289 プロ野球平均0.459 *メジャーリーガー
2009年WBCの決勝(日韓戦)の解析
まとめと今後の課題 得点確率分布や勝率から新しい結果と従来の 定説の裏付けが得られた 従来の研究をつなぎ広い視点からの分析を 行った 新しい進塁規則の作成 様々な進塁規則からの評価