2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 プロ野球における日本人選手の役割 ~2016 年度と 2015 年度のチーム状況の違い ~ 目次 1. 研究目的 2. 使用データ概要 3. 研究の流れ 4. 分析結果 5. まとめ 今後の課題 - 参考文献 - 東海大学情報通信学部経営システム工学科 松家大士
研究目的 セ リーグヤクルトスワローズ読売ジャイアンツ阪神タイガース広島カープ中日ドラゴンズ DeNA ベイスターズ NPB ( 日本野球機構 ) パ リーグソフトバンクホークス日本ハムファイターズ千葉ロッテマリーンズ西武ライオンズオリックスバッファローズ楽天イーグルス 表 1 2015 年度セ リーグ順位 セ リーグ チーム 1 位ヤクルト 2 位巨人 3 位阪神 4 位広島 5 位中日 6 位 D en A 表 2 2016 年度セ リーグ順位 セ リーグ チーム 1 位広島 2 位巨人 3 位 DeNA 4 位阪神 5 位ヤクルト 6 位中日 2015 年と 2016 年何が違うの?? 目的 2015 年度と比較して 2016 年度は何が影響しているのか? 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 2
使用データ概要 提供元 NPB 公式記録 [1] データ概要日本プロ野球で行われた各対戦カードの試合結果計 143 試合 期間 2015 年度 2016 年度レギュラーシーズン ( 交流戦を含む ) 使用範囲全 12 球団 分析対象 2015 年度 :658 人の打撃データ 2016 年度 : 680 人の打撃データ データ項目 安打, 二塁打, 三塁打, 本塁打, 打点, 盗塁, 犠打, 四球, 死球, 三振, 併殺打, 得点, 塁打, 犠飛, 故意四球 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 3
研究の流れ NPB のデータを参考に両年度の打者データの収集 主成分分析の結果をグラフにプロットする 縦軸をアベレージヒッター 横軸をパワーヒッターと定義 データ 収集 主成分分析 プロット チームの現状把握 11 個の変数を使う ( 安打, 二塁打, 三塁打, 本塁打, 打点, 盗塁, 犠打, 四球, 死球, 三振, 併殺打 ) 主成分プロットしたデータの外側を円で描き その円の大きさを違うことを確認共分散構造分析により 背景を探る 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 4
分析結果 (2015 年度 ) 表 3 プロ野球 12 球団 2015 年度打者成績主成分分析による分布表 成分 1 2 安打 0.979 0.032 二塁打 0.953-0.090 三塁打 0.589 0.501 本塁打 0.847-0.372 打点 0.954-0.218 盗塁 0.643 0.546 犠打 0.412 0.715 四球 0.943-0.057 死球 0.741-0.125 三振 0.944-0.045 併殺打 0.862-0.201 図 1 プロ野球 12 球団 2015 年度打者成績の主成分分析 主成分分析で使用する指標安打 二塁打 三塁打 本塁打 打点 盗塁 犠打 四球 死球 三振 併殺打 犠打 三塁打 死球 併殺打 盗塁 二塁打 三振 本塁打 安打 四球 打点 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 5
分析結果 (2016 年度 ) 表 4 プロ野球 12 球団 2016 年度打者成績主成分分析による分布表 成分 1 2 安打 0.979 0.022 二塁打 0.959-0.082 三塁打 0.688 0.411 本塁打 0.819-0.436 打点 0.952-0.241 盗塁 0.619 0.514 犠打 0.384 0.688 四球 0.938 0.004 死球 0.771 0.022 三振 0.944-0.019 併殺打 0.84-0.269 図 2 プロ野球 12 球団 2016 年度打者成績の主成分分析 主成分分析で使用する指標安打 二塁打 三塁打 本塁打 打点 盗塁 犠打 四球 死球 三振 併殺打 犠打 盗塁 併殺打 三塁打 死球 三振 本塁打 四球安打 二塁打 打点 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 6
分析結果 ( 主成分分析 ) 表 5 プロ野球 12 球団 2015 年度打者成績の主成分分析による成分表 初期の固有値 成分合計分散 (%) 累積 (%) 1 7.5 68.130 68.130 2 1.3 11.977 80.107 3 0.6 5.760 85.867 4 0.5 4.234 90.101 5 0.4 3.959 94.059 6 0.2 2.240 96.300 7 0.2 1.458 97.757 8 0.1.890 98.648 9 0.1.876 99.523 10 0.0.306 99.829 11 0.0.171 100.000 累積寄与率が第 2 主成分で 80% 以上ある第 3 主成分では分散約 5% 図 3 2015 年度打者成績の主成分分析による成分図 採用 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 7
分析結果 ホームランバッター 第一主成分右に行くほどヒット性の当たりを打つ人が多い アベレージヒッター 安打四球 二塁打 アベレージヒッター 第二主成分上に行くほど盗塁する人が多い下に行くほど本塁打が多い 図 4 プロ野球 12 球団 2015 年度打者成績の主成分分析による成分分布図 ホームランバッター 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 8
分析結果 ( 共分散構造分析 ) アベレージヒッターが得点に大きく関連している アベレージヒッターが打点に絡むことが多い 安打 二塁打 四球の共分散が高い * アベレージヒッターとは主成分分析で出た第 1 主成分の結果を入れた *e は誤差変数を表す.93.96 安打 二塁打.17.61 アベレージヒッター.97.94 得点 打点 e1 e2.04.52.90 四球.23 GFI =.960 AGFI =.833.62 盗塁 e3.-37 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 9
分析結果 ( 共分散構造分析 ) パワーヒッターが打点に大きく関連している パワーヒッターが犠飛に絡むことが多い 本塁打と塁打の共分散が高い * パワーヒッターとは主成分分析で出た第 2 主成分の結果を入れた *e は誤差変数を表す.87.60 本塁打 故意四球 -01.34 パワーヒッター.98.77 打点 犠飛 e1 e2.33.00.63 塁打.69 GFI =.972 AGFI =.881.68 死球 e3.00 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 10
主成分分析結果 ( 広島 ) 菊池選手 田中選手 田中選手丸選手 鈴木選手 丸選手 図 6 広島 2015 年度打者成績の主成分分析による分布図 図 5 広島 2016 年度打者成績の主成分分析による分布図 円の大きさは 2015 年度の方が大きい プロットデータが横に分散している プロットデータが横に伸びることに勝率のカギがある!?!? 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 11
主成分分析結果 ( 広島 ) 2015 横軸縦軸 選 手 F A C 1_1 F A C 2_1 丸 佳浩 3.15635-0.3195 田中 広輔 3.15171 2.2609 菊池 涼介 2.75932 6.79362 新井 貴浩 2.23764-1.1468 會澤 翼 1.40015-0.3454 エルドレッド 1.32806-1.9872 梵 英心 1.19963 0.36256 鈴木 誠也 0.92029 1.44936 シアーホルツ 0.87364-0.6052 平均 1.7338 2016 横軸縦軸 選手 F A C 1_1 F A C 2_1 丸佳浩 4.22708 1.49121 鈴木誠也 3.7367 0.45358 田中広輔 3.43072 2.2157 新井貴浩 2.72846-2.6089 菊池涼介 2.58027 2.71972 エルドレッド 1.80529-2.4676 安部友裕 1.31059 1.48379 石原慶幸 0.92014 0.8701 松山竜平 0.88901-0.8572 平均 2.17515 表 6 2015 年度広島主成分得点表 表 7 2016 年度広島主成分得点表 2015 年度と 2016 年度で平均が 0.5 違う!! 横軸が伸びれば勝率も上がる!? 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 12
主成分分析結果 (DeNA) 梶谷選手 梶谷選手 桑原選手 バルディリス選手 筒香選手 ロペス選手 ロペス選手筒香選手 図 8 DeNA2015 年度打者成績の主成分分析による分布図 図 7 DeNA2016 年度打者成績の主成分分析による分布図 2016 年度の方が円が大きくなっている プロットデータが横に分散している プロットしたデータが横に伸びることに勝率のカギがある!! 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 13
主成分分析結果 (DeNA) 2015 横軸 選手 F A C 1_1 F A C 2_1 梶谷隆幸 3.10932 1.52008 筒香嘉智 2.88201-2.7344 ロペス 2.83427-2.8503 バルディリス 2.4835-2.807 石川雄洋 1.19614 0.99247 嶺井博希 0.71719-0.4352 白崎浩之 0.66259 2.18485 荒波翔 0.6568 0.40122 倉本寿彦 0.6354-0.229 平均 1.68636 表 8 2015 年度 DeNA 主成分得点表 縦軸 2016 去年と今年で平均が 0.4 違う!! 広島と同じように横軸が伸びている! 横軸 選手 F A C 1_1 F A C 2_1 筒香嘉智 3.754-3.3379 桑原将志 2.88624 1.41575 ロペス 2.75712-3.823 梶谷隆幸 2.7337 1.43061 倉本寿彦 1.88873-0.1379 宮﨑敏郎 1.53483-1.9478 石川雄洋 0.9161 1.71049 エリアン 0.87128 0.0657 戸柱恭孝 0.86409-0.6874 平均 2.0229 縦軸 表 9 2016 年度 DeNA 主成分得点表 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 14
主成分分析結果 ( ヤクルト ) 2015 横軸縦軸 選手 F A C 1_1 F A C 2_1 山田哲人 4.79182-0.4121 畠山和洋 2.92868-3.5031 川端慎吾 2.69487-1.3398 雄平 2.47127 0.26846 中村悠平 1.65132 0.42319 大引啓次 1.29591 0.28358 デニング 0.84524-1.2411 上田剛史 0.73591 1.96765 比屋根渉 0.61932 0.89493 平均 2.00381 2016 横軸縦軸 選 手 F A C 1_1 F A C 2_1 山田 哲人 4.55224-1.2021 バレンティン 3.17882-4.3236 坂口 智隆 2.31981 1.85618 雄平 1.46453-1.0983 川端 慎吾 1.45195-0.7577 中村 悠平 1.36431 0.44017 大引 啓次 1.31265-0.0338 西浦 直亨 0.85159-0.1507 西田 明央 0.83961-0.495 平均 1.92617 表 10 2015 年度ヤクルト主成分得点表 表 11 2016 年度ヤクルト主成分得点表 FAC1-1 の平均が 2015 年度が 2016 年度より下がっている 山田 雄平 川端 畠山選手はケガで離脱している時期がある 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 15
まとめ まとめ 横軸に円が伸びている方が勝率が高い 来年度 補強するなら円が横に伸びる方がよい ケガなどで出場回数が減るとチームの勝率が下がる 2015 2016 チーム名 F A C 1_1 F A C 1_1 広島 1.73380 2.17515 D en A 1.68636 2.02290 巨人 1.70585 1.84998 ヤクルト 2.00381 1.92617 阪神 1.71573 1.76626 中日 1.63888 1.77127 表 14 各チームの主成分得点 打点順位 1 筒香 嘉智 D 2 山田 哲人 ヤ 3 新井 貴浩 広 4 バレンティン ヤ 5 鈴木 誠也 広 5 ロペス D 7 丸 佳浩 広 本塁打順位 1 筒香 嘉智 D 2 山田 哲人 ヤ 3 ロペス D 4 バレンティン ヤ 5 鈴木 誠也 広 表 13 2016 年度本塁打ランキング広広島 表 12 2016 年度打点ランキング D D en A ヤ ヤクルト 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 16
今後の課題 今後の課題 3 年以上のデータ使用して精度を上げる ピッチャーのデータを使用する 費用対効果の検証 最多勝 防御率 1 野村祐輔広 1 菅野智之巨 2 ジョンソン広 2 ジョンソン広 3 メッセンジャー神 3 野村祐輔広 4 山口俊 D 4 田口麗斗巨 5 田口麗斗巨 5 岩貞祐太神 5 岩貞祐太神 6 メッセンジャー神 5 黒田博樹広 7 黒田博樹広 8 菅野智之巨 8 石田健大 D 8 石田健大 D 9 藤浪晋太郎神 8 内海哲也巨 10 井納翔一 D 順位チーム年棒合計 1 位巨人 32 億円 2 位阪神 24 億円 3 位ヤクルト 21 億円 4 位広島 18 億円 5 位中日 16 億円 6 位 D en A 14 億円 表 16 セ リーグチーム別年棒順位 [5] 表 15 セ リーグ勝利数 防御率ランキング 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 17
参考文献 [1] 日本野球機構 (http://www.npb.or.jp/) 最終閲覧日 ;2016 年 10 月 25 日 [2] コトバンク (https://kotobank.jp/) 最終閲覧日 ;2016 年 10 月 25 日 [3] 木下栄蔵 阪神はなぜ優勝したか( スポーツデータ II) オペレーションズ リサーチ,51(2),111-115, 2006 [4] 日刊スポーツ : 記事 2016 年 4 月 26 日 (http://www.nikkansports.com/baseball/news/1637560.html) 最終閲覧日 ; 2016 年 10 月 25 日 [5] 鍋谷清治 野球のデータの統計的分析 日本統計学会誌 2007 年 3 月 pp91~115 [6] 石岡文生 栗原考次 文勝浩主成分分析を用いた空間データのホットスポットの検出について ( 日本計算機統計学会シンポジウム論文集 (19), pp39-42, 2005-10-20) 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 18
Appendix 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 19
言葉の定義 1 安打 : 野球で 打者が守備側の失策なしに一塁またはそれ以上の塁に進むことができる打球 また 打者がそのような打球を飛ばすこと 打点 : 野球で, 打者が安打 犠打 四死球などで走者をホーム - インさせてあげた得点の数 盗塁 : 野球で, 出塁した走者が守備側の隙をねらって, 次の塁へ進むこと 四球 : 野球で, 打者が四つのボールを得ること 打者は一塁へ進むことができる 死球 : 野球で, 投球が打者の体または着衣に触れること 打者は一塁へ進塁することができる 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 20
言葉の定義 2 三振 : 野球で, 打者がストライクを三回とられてアウトになること 併殺打 : 野球で ダブルプレーをとられてしまう打撃 ダブルプレー : 野球で 2 人の走者 あるいは 1 人の走者と打者を 連続したプレーによって合わせてアウトにすること 得点 : 走者が正規に一塁 二塁 三塁 本塁の順に進塁し 本塁に触れるときに記録される点数のことである 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 21
言葉の定義 3 犠飛 : 野球で 打者はアウトになるが 走者を進塁させたフライ 塁打 : 野球で 打った安打のうち 単打を 1 二塁打を 2 三塁打を 3 本塁打を 4 として集計した数 故意四球 : 野球において投手が打者に対して 意図的に四球を与える行為につく記録である 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 22
Comp.2-0.2-0.1 0.0 0.1 0.2-30 -20-10 0 10 20 Variances 0 2 4 6 主成分分析の結果 (S-plus) -30-20 -10 0 10 20 Relative Importance of Principal Components 261 62 271 368 316333 565 146 421 440 443 592418 3 70 104 214 272 506 172 488 138 7 585 2 ` 本塁打 ` 11658 539 358 441 4 10 14 17 21 106 107 105 6869 73 71 96 152 201 193 498 244 350 229 114 108 109 112 117 120 122 124 130 132 134 136 139 143 145 148 153 154 155 158 160 163 164 165 167 170 173 175 177 179 180 181 183 187 121 157 182 113 115 118 101 111 123 126 125 110 119 137 127 135 162 178 174 150 184185 151 156 159 142 171 188 169 140 209 329 291 191 192 194 198 199 200 203 204 206 207 211 212 218 222 223 226 230 23233 235 236 241 245 248 251 252 253 255 258 265 266 268 269 270 276 280 283 195 262 275 281 267 274 219 227 256 238 254 240 263 273 260 231 243 285 247 221 234 168 301 287 292 295 296 297 298 300 302 306 307 308 309 310 313 314 317 320 321 322 324 326 327 328 331 332 335 342 344 347 348 351 352 359 361 299 304 357 366 288 289 349 290 334 325 360 353 303 338 319 323 363 354 355 336 282 340 365 367 406 373 378 390 433 469 371 372 374 133 103 23 189 216 202 220 250 284 341 380 382 384 394 395 396 407408 416 419 420 422 423 426427 428 430 385 386 393 400 398 379 381 370 375 402 432 473 438 451 453454 459 472 475 477 480 485 487 489 490 492 499 501 502 507 509 513 415 425 462 467 474 405 417 446447 458 445 491 413 482 389 450 410 434 411 448 466 391 439 483 449 215 89 19 16 92 225 237 242 312 259 100 161 286 15 293 345 339 346 364 377 414 429 435 455 464 479 456 457 470 461 478 494 504 503 505 508 431 401 436 437 403 356 102 246 387 20 84 13 210 277 186362 2786 190 196 217 311 383 392 468 484 495 486 496 497 512 518 517 521 524 528 529 530 533 536 532 541 514 520516 540 531 542 527 519 526 543 545 547 548 544 549 563 583 656 ` 併殺打 ` 打点 `` 558 559 560 561 562 564 566 569 572 575 576 577 578 586 589 591 593 597 598 599 601 602 603 613 614 617 618 567 579 605 568 607 582 590 595 620 574 552 554 551 606 612 615 535 537 571 600 584 621 632 622 623 624 627 628 633 635 636 626 630 637 556 609 625 641 ` 死球 639 647 652 653 638 648 654 650 655 646 634 631 629 649 ` ` 二塁打 `` 四球三振 ` ` 651 657 500 608 515 546 476 570442 550 337 444 463 493 587 481 523 594 611 553 538580 557 588 616 645 640 ` 安打 ` 224 465 404 397 8369 116 166 257 388 17612 98 249 330 460 581 197 376 511 573 604 424 279 98522 643 294 213 147 131 149 305 399 343 208 409 5 76 144 47160 128 141 525 129 ` 三塁打 412 239 ` 盗塁 ` 596 534 66 610 ` 犠打 `1 228 619 555 452 0.681 0.801 0.859 0.901 0.941 0.963 0.978 0.986 0.995 0.998 315 318 510 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9 Comp.10-0.2-0.1 0.0 0.1 0.2 Comp.1 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 23
主成分分析の結果 (S-plus) princomp(x = ~ ` 安打 ` + ` 二塁打 ` + ` 三塁打 ` + ` 本塁打 ` + ` 打点 ` + ` 盗塁 ` +` 犠打 ` + ` 四球 ` + ` 死球 ` + ` 三振 ` + ` 併殺打 `, data = ` 野球 1`, scores = TRUE, cor = FALSE, na.action = na.exclude) princomp(x = ~ ` 安打 ` + ` 二塁打 ` + ` 三塁打 ` + ` 本塁打 ` + ` 打点 ` + ` 盗塁 ` + ` 犠打 ` + ` 四球 ` +` 死球 ` + ` 三振 ` + ` 併殺打 `, data = `X2016 野手データ... コピー `, scores = TRUE, cor = FALSE, na.action = na.exclude) 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 24
主成分分析の結果 (VMS) 2016 年 S-PLUS &Visual R Platform 学生研究奨励賞 25