要約 鍋谷 (2007) では2001 年 ~2005 年の高校野球 プロ野球における各プレーの貢献度を 得点 勝敗を被説明変数 各プレーを説明変数とした重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いて分析し 犠打 ( 犠牲バント 犠牲フライ ) は得点に対しては有意ではないが勝敗

Similar documents
( その他 ) 7 投手 捕手 ( ピッチャー キャッチャー ) とも相手チームの相手チームの選手名を選手名を記入記入します 同じ苗字が 2 名以上いるときには 下の名前を区別できるところまで記入 ( 長打 ) 二塁打 三塁打 本塁打を打った選手名を記入同じ苗字が 2 名以上いるときには 下の名前を

福井県軟式野球連盟スコア記入資料

スコアカードの点検に関する留意点-①

スコアブックの記入について スコアブックの記入法には 各種の記号を含めていろいろな方法がありますが 要は 誰が見ても理解でき 正確に記載されていることが大切です 1. 試合の前の記入 (1) 年月日 大会名 球場名 天候 審判名 記録者名など (2) 先発メンバー 守備位置の記入法投手 1 捕手 2

タイトル

情報基礎論Ⅱ(担当:二宮智子先生)・後期最終課題

スライド 1

スライド 1

PowerPoint Presentation

要約 本稿では プロ野球における予告先発投手制の導入が観客動員数を変動させているのかを検討する パ リーグの活性化を図るために導入された予告先発投手制だが 2012 年にセ リーグにおいても採用された Yamamura(2010) は 2005~2007 年の試合データを分析し パ リーグにとって先

1.民営化

Microsoft PowerPoint - e-stat(OLS).pptx

スコアー記入要項

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Slide 1

はじめに 本書は 野球デジタルスコアブック ばちこい のユーザ操作マニュアルです ばちこい は タブレット端末を利用して野球のスコアを簡単に入力 管理できるアプリケーションです 本バージョンでは 少年野球の使用に最適な仕様となっております 本書に掲載されている画面は開発中の画面です 実際の画面とは異

山形県高等学校野球連盟記録記入方法について 1992 年一部改正 2009 年一部改正 1. 守備位置と打者の欄野手は 1~9 打者は ( 一 )~( 九 ) アウトは Ⅰ Ⅱ Ⅲ( 中央の欄 ) Ⅰ Ⅱ Ⅲ 一死 二死 三死 2. ボールカウントの欄見逃しストライク空振りストライクボールファール

日本プロ野球におけるバントの有効性 ~実データを用いたデータマイニングより~

研究目的 セ リーグヤクルトスワローズ読売ジャイアンツ阪神タイガース広島カープ中日ドラゴンズ DeNA ベイスターズ NPB ( 日本野球機構 ) パ リーグソフトバンクホークス日本ハムファイターズ千葉ロッテマリーンズ西武ライオンズオリックスバッファローズ楽天イーグルス 表 年度セ リ

ソフトボール競技スコア記帳(実技)練習問題下線入り

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

9/3 D52 布袋 4 盗塁で盗塁王へ驀進! 9/10 G11 野内 7 打点の荒稼ぎ 9/10 A17 山田監督自らサヨナラ打! 9 月 3 日第 13 戦中止試合 ( サンケイ 19 号面 ) 第一試合 DCUPS 4 第二試合 FUNKY S 2 第三試合 HEROES 9 第四試合 GAI

13章 回帰分析

野球規則に基づいた スコアブック記入上の留意点 ( 安打 打点 塁打 失策 野手選択 盗塁 犠打 )

平成 25 年度卒業論文 浪人と留年 所属ゼミ 村澤ゼミ 学籍番号 氏名中司雄也 大阪府立大学 経済学部

Microsoft Word usui03-11E0095臼井友希.セイバーメトリクス

男子一部 試合の部 2017 ( 平成 29 ). 得点 新記録 最多安打試合 35 今里クラブ (19) 20 上今泉スターズ (16) 新記録 最多得点試合 38 上今泉スターズ (20) 20 バッカス (18) 最多盗塁試合 10 さがみ野ブラザーズ (3)

目次 本ガイドについて... 4 スコアの入力... 5 基本編... 5 二塁打... 5 本塁打... 6 打者のアウト : ゴロでアウト... 7 打者のアウト : の併殺... 8 進塁 : 通常進塁 ( 打撃による進塁 )... 9 進塁 : 盗塁による進塁 進塁

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

290 末木 会的な動きが活発化している. 経済協力開発機構の行った国際比較調査で明らかになったように, 日本の教員の週当たりの勤務時間は参加国中最長であり, その中でも部活動等の課外活動の指導時間が大きな負担となっているからである ( 国立教育政策所,2014). こうした問題を解決するため, 2

Microsoft Word - あしあとつくば市連盟杯

2008sc_Total.XLS

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

山形県高等学校野球連盟記録記入方法について

Microsoft PowerPoint - ch04j

Microsoft Word - econome5.docx

4. ボールカウントの記号 ボールカウントはマスの左横にある空白の部分に書きます ボール 見逃しストライク 空振りストライク ファウル バント空振り バントファウル 5. アウト記号 アウト記号は 真ん中のダイヤ部分の中に記入します 1 アウトの時は Ⅰ 2 アウトの時は Ⅱ 3 アウトの時は Ⅲ

第12回土屋旗(シニア)大会結果記録1号

Microsoft Word - å“Ÿåłžå¸°173.docx

1. はじめに 野球の試合で勝つためには 自チームの投手が失点を許さず 自チームの打者がより多くの得点を獲得することが必要である 攻撃側に絞って言えば 全ての打者が塁に出て得点を獲得することが理想的であるが そのようなことが起こる確率は限りなく低い そのため 監督がどのような采配をするかも重要となっ

データ解析

13章 回帰分析

NPB式スコアブックの記入方法

PowerPoint プレゼンテーション

はじめに 最近の住宅市場は世帯数に比べ 住宅数が多く 1 この数字だけを見れば供給過剰といえる しかし実際には 消費者側の多様な需要とそれに合わせた供給も存在するため 世帯数と住宅数だけで需給バランスを把握でき るとは言い難い 国土交通省の不動産の鑑定評価基準にもあるように 不動産の価値には 現在の

横浜市環境科学研究所

インゼミ発表11月

Microsoft Word - econome4.docx

Microsoft Word - scorebook_rec.doc

試合前に記入すること 日付 対戦相手 天候 球場等 スターティングメンバー ( 最初に出る選手 ) の記入 ( 守備位置は番号で記述 表紙参照 ) 基本的な記入の流れスコアブックは上図のようになっています 見開きの左側のページに先攻のチーム 右側に後攻チームの攻撃の経過を記入していきます 赤矢印で示

目次 1. 研究背景 2. データ概要 3. 研究手順 4. 主成分分析の結果 5. クラスター分析の結果グループ 1~6 の結果 6. 高校生選手ごとの球団提案 7. まとめ 8. 今後の課題 参考文献 Appendix 2017/11/ 年 S-PLUS 学生研究奨励賞 2

2010detail.xls

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

第29回県民総合体育大会(一般男子の部)埼玉県大会記録1号

目黒区砧野球場 チーム名 合計 ヒット getters Hot Boys X 6 ヒット 氏名 打席

様々なミクロ計量モデル†

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

Probit , Mixed logit

回打者 (UN)< 打 > 詳細記録上の注意 [ 選手交代 ] [ 先攻監督からのコールはなし ] 2 代打 FP 植木 () は,6 番打者のままとみなす 植木 () の位置は, H H7 となる 選手交代 7 番打者 友田 (7) に代わって, 代打に FP の福永 (11) 福

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

第 32 回土屋会長旗争奪ソフトボール ( 男子 ) 大会県西支部予選会 期 会 日 場 平成 27 年 月 9 日 ( 日 ) 吉見町総合運動公園 大会結果 NO 所属 県西支部代表チーム 2 前田フェニックス 山口クラブ ( 狭山市 ) ( 所沢市 ) 9 カシワクラブ 3 カシワクラブ ( 狭

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

ビジネス統計 統計基礎とエクセル分析 正誤表

記録用紙の記入の仕方.xls

Microsoft Word - reg2.doc

EBNと疫学

回答結果については 回答校 36 校の過去 3 年間の卒業生に占める大学 短大進学者率 現役 浪人含む 及び就職希望者率の平均値をもとに 進学校 中堅校 就職多数校 それぞれ 12 校ずつに分類し 全体の結果とともにまとめた ここでは 生徒対象質問紙のうち 授業外の学習時間 に関連する回答結果のみ掲

11 月 19 日の練習試合結果 vs 鎌倉高校 向の岡工業高校グラウンド 第一試合一二三四五六七八九計 横浜明朋 向の岡工業 鎌倉 初回 先頭打者が四球で出塁すると エンドランと守備の乱れで無死 2 3 塁の好機を作ります

Excelにおける回帰分析(最小二乗法)の手順と出力

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

Microsoft Word - SDA2012kadai07.doc

期日平成 8 年 3 月 0 日 ( 日 ) 3 月 7 日 ( 日 ) 予備日 月 3 日 ( 日 ) 会場本庄市山王堂グランド 大会成績 第 37 回全日本クラブ男子ソフトボール選手権大会埼玉県予選会 第 1 位原巽ジャガーズ第 位ドルフィンズ第 3 位秩父ノースターズ SC 三郷スターズ 本予

スライド 1

春季リーグ戦と秋季リーグ戦の失点パターンについて (2016 年度春 秋季リーグ戦 N 体育大学硬式野球部公式戦 29 試合 学籍番号 13A0024 学生氏名伊藤竜次 I. はじめに 野球は試合終了時に得点が高いチームが勝利となるた め 失点を防ぎ得点を重ねることを目的としてゲームを進 盤の失点

2 福永 (11) 三塁前バントヒット 回選手交代一塁走者 福永 (11) は FP に戻り, 代走に再出場の友田 (7) 裏林 (23) [BF] 二ゴロ 二塁で一塁走者アウト ( ベースカバーは遊撃手, 併殺記録を, 表面欄に記入 一死 ) 遊撃手 一塁で打者走者アウト ( 併殺成立, 二死 )

Microsoft Word - reg.doc

選手交代一塁走者 福永 () は FP に戻り, 代走に友田 (7)( 再出場 ) 回林 () [BF] 二塁ゴロ 二塁触塁で一塁走者アウト ( ベースカバーは遊併殺記録を, 表面に記入 裏撃手, 一死 ) 遊撃 一塁で打者走者アウト ( 併殺成立, 二死 ) 榎田 () [S] 遊撃ゴロとなったが

安 打 全日程終了時点 ( 安打 + 四死球 ) 打 数 打席 位 打率 選手名 位本塁打 選手名 位 打点 選手名 位 盗塁 選手名 位 安打 選手名 位四死球 選手名 位 出塁率 選手名 S3 渡辺 ( 兄 ) E18 岩名 34 1 F25 森 ( 福 ) 48

安 打 全日程終了時点 ( 安打 + 四死球 ) 打 数 打席 位 打率 選手名 位本塁打 選手名 位 打点 選手名 位 盗塁 選手名 位 安打 選手名 位四死球 選手名 位 出塁率 選手名 S51 真鍋 S0 眞田 42 1 E11 阿部 40 4 J14 岡村 39

夢の島総合運動場 チーム名 合計 ヒット getters Red Spirits ヒット 氏名 打席 打数 得点 塁打 安打 犠打 四死球

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft Word - mstattext02.docx

膳所中学 2 滋賀 近江神宮虎姫中学 2 外苑球場 チーム 計 打数 安打 打点 二塁打 三塁打 本塁打 三振 四死球 犠打 盗塁 残塁 失策 膳所中学 虎姫中学 準決勝 彦根中学 28 4

2013/3/17 公式試合 ( 西部地区春季大会 ) vs 本宿リトルエース 大河原 左飛 アウト 大河原 四球 ,3 5 竹村元 中飛 アウト ,2 8 黒田健 四球 ,

スライド 1

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

学習指導要領

<937989AE89EF92B78AF8926A8E7191E589EF E786C73>

MLB選手タイプ別モデルの構築と展望

記録1号_xlsx

ソフトボール記録統一記号 抜粋 名 称 記号 名 称 記号 指名選手 DP 強襲安打 例三塁 5 打撃専門選手 OPO OP 盗塁 S 代打 H ダブルスチール 重盗 DS 代走 R トリプルスチール 三重盗 TS 打点 4 番 4 打撃 走塁妨害 オブストラクション 一死 守備妨害 インターフェア

untitled

No0 大会日会場 平成 2 年 10 月 19 日 ( 日 )10 月 2 日 ( 日 ) 富士見市運動公園 大会結果 第 1 位第 2 位第 位第 位 所沢狭山ヶ丘クラブ DAIWAクラブイーグルス土合小 PTAソフトボール ( 所沢市 ) ( 宮代町 ) ( 蓮田市 ) ( さいたま市 ) 試

第 回全日本レディース埼玉県予選会 期 会 日 場 平成 年 月 5 日 ( 日 ) 日 ( 日 ) 5 月 日 ( 日 ) 上尾市平方スポーツ広場 大会成績 第 位第 位第 位第 位 クィーンズソフトボールクラブ TMG Victory 狭山エンジェルスボンバーズ ( 北本市 ) ( 朝霞市 )

第 回埼玉県スーパーシニア大会 大会結果 大会日 会 場 第一位第二位第三位第三位 平成 年 9 月 3 日 ( 火 ) 月 7 日 ( 火 ) 日 ( 火 ) N45 毛呂山町大類ソフトボールパーク 西戸町民グラウンド シルバースターズ上尾ハイシニアーズ上尾西部スーパーシニア北本ヤングススーパーシ

夏季五輪の メダル獲得要因はなにか

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

Transcription:

平成 26 年度卒業論文 高校野球における各プレーの貢献度 所属ゼミ 村澤ゼミ 学籍番号 1110402082 氏 名 野村剛志 大阪府立大学経済学部

要約 鍋谷 (2007) では2001 年 ~2005 年の高校野球 プロ野球における各プレーの貢献度を 得点 勝敗を被説明変数 各プレーを説明変数とした重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いて分析し 犠打 ( 犠牲バント 犠牲フライ ) は得点に対しては有意ではないが勝敗に対しては有意に貢献していることなどを示した 本稿では 2010 年 ~2014 年の春 夏の高校野球全国大会 計 399 試合の試合データを用いて 得点への貢献度を重回帰モデル 勝敗への貢献度を 2 項ロジットモデルによる分析を行い鍋谷 ( 2007) と比較する その結果 鍋谷 (2007) では得点に対して有意ではないという結果が出た犠打を犠牲バント 犠牲フライに分けて分析すると 犠牲バントは有意ではないが犠牲フライは有意であるということ 死球は単打一本打つことよりも勝敗への貢献度が高いことなどがわかった i

目次 第 1 章序論... 1 第 2 章先行研究... 2 第 3 章データ... 4 1. データ一覧... 4 2. 要約統計量... 6 第 4 章分析手法... 8 1. 最小二乗法... 8 2.2 項ロジットモデル... 9 第 5 章分析結果... 10 1. 得点の重回帰モデル... 10 2. 勝敗の 2 項ロジットモデル... 13 第 6 章結論... 16 参考文献... 17 ii

第 1 章序論 鍋谷 (2007) では2001 年 ~2005 年の高校野球 プロ野球における各プレーの貢献度を 得点 勝敗を被説明変数 各プレーを説明変数とした重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いて分析し 犠打 ( 犠牲バント 犠牲フライ ) は得点に対しては有意ではないが勝敗に対しては有意に貢献していることなどを示した 本稿では 2010 年 ~2014 年の春 夏の高校野球全国大会 計 399 試合の試合データを用いて 得点への貢献度を重回帰モデル 勝敗への貢献度を 2 項ロジットモデルによる分析を行い鍋谷 ( 2007) と比較する その結果 鍋谷 (2007) では得点に対して有意ではないという結果が出た犠打を犠牲バント 犠牲フライに分けて分析すると 犠牲バントは有意ではないが犠牲フライは有意であるということ 死球は単打一本打つことよりも勝敗への貢献度が高いことなどがわかった 本稿の構成は以下の通りである 第 2 章で先行研究を紹介する 第 3 章で使 用するデータの説明をする 第 4 章で分析手法の説明をする 第 5 章で分析結 果を示し考察する 第 6 章で全体の要約と残された課題について述べる 1

第 2 章先行研究 高校野球について分析した先行研究として 鍋谷 (2007) がある 2001 年 ~ 2005 年のプロ野球の公式戦 春 夏の高校野球全国大会の試合結果を分析し 以下の 2 つの結果があげられている 1 プロ野球 高校野球ともに 1 試合あたりの得点や本塁打数等 諸変数の分布の多くが通常の正または負の 2 項分布で近似される 2 試合ごとのチームの得点並びに試合の勝敗に対して 諸変数の中では本塁打数が最も重要であること 犠打数が得点に対してあまり影響力を持たないのと比較して 勝敗に対してかなりの影響力を持つ 本稿では 2 で行われている 得点 勝敗を被説明変数 安打数 本塁打数 三振数 四球数 犠打数 併殺数 盗塁数 失策数 先攻後攻 先取点を説明変数とした分析を参考にしている 基本的に鍋谷 ( 2007) の追試を行うが 以下の 8 点が異なる 1 鍋谷 (2007) では2001 年 ~2005 年のデータを用いていたが 本稿では 2010 年 ~2014 年のデータを用いる 2 鍋谷 (2007) では単打 二塁打 三塁打 本塁打を安打数として一括りにされていたが 本稿ではそれらを分ける 3 鍋谷 (2007) では本塁打数 安打数ともに本塁打の数が含まれているので重複していたが 本稿ではそれらを分ける 4 鍋谷 (2007) では犠牲バント 犠牲フライを犠打数で一括りにされていたが 本稿ではそれらを分ける 5 鍋谷 (2007) では四球 死球を四球数で一括りにされていたが 本稿ではそれらを分ける 6 鍋谷 (2007) では盗塁数を用いていたが 本稿ではデータを観測できなかったので用いない 2

7 鍋谷 (2007) では失策数にボークや暴投も含まれていたが 本稿ではデータを観測できなかったので打者の出塁に影響を与えた失策だけを用いる 8 鍋谷 (2007) では勝敗への貢献度の分析で重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いていたが 本稿では 2 項ロジットモデルだけを用いる 3

第 3 章データ 1. データ一覧 本稿では 朝日新聞デジタル高校野球の総合情報サイト より 2010 年から 2014 年の5 年間 計 399 試合の試合結果のデータを入手した データにはイニングごとの打者の打撃結果が記されており 1 試合の中で1チームあたりのそれぞれの変数の個数を調べた 以下が調べた変数の一覧である 自チームの打撃結果 得点 単打 二塁打 三塁打 本塁打 四球 死球 犠牲バント 犠牲フラ イ 三振 併殺打 失策 勝敗ダミー 勝ちを 1 負けを 0 というダミー変数を用いる 引き分けは 1 試合でしか観測 されていないのでその 1 試合を除き 398 試合の分析を行う 後攻ダミー自チームが後攻のときに 1 先攻のときに 0というダミー変数を用いる 野球の試合において 先攻と後攻では一般的に後攻の方が有利と言われている 投手が最初のイニングを 0 点に抑えることによって攻撃に勢いがでる サヨナラ勝ちが期待できるなどさまざまな要因があげられる 実際に高校野球では試合前のじゃんけんで先攻後攻を決めるのだが じゃんけんに勝利した多くのチームが後攻を選択する 本稿のデータを見ても後攻チームの勝率は約 56% となっている 4

先取点ダミー自チームが先取点をあげたときに1 先取点をとられたときに 0というダミー変数を用いる 野球の試合において 先取点の重要性は度々指摘されている そのために早いイニングからバント等の戦術がとられることが多く 本稿のデータを見ても先取点をあげたチームの勝率は約 70% となっている 5

2. 要約統計量 以下の表 1 は本稿の各変数の要約統計量 表 2 は鍋谷 (2007) の各変数の平均 である 表 1 本稿の各変数の要約統計量 変数 平均中央値 最小値 最大値 標準偏差 得点 4.22 4 0 21 3.49 単打 6.70 6 1 21 3.02 二塁打 1.34 1 0 6 1.23 三塁打 0.44 0 0 4 0.71 本塁打 0.33 0 0 4 0.63 四球 2.55 2 0 11 1.90 死球 0.94 1 0 7 1.10 犠牲バント 1.80 2 0 7 1.42 犠牲フライ 0.21 0 0 3 0.47 三振 5.88 6 0 22 3.14 併殺打 0.56 0 0 3 0.75 失策 0.62 0 0 4 0.78 表 2 鍋谷 (2007) の各変数の平均 変数 平均 得点 4.44 本塁打 0.28 総安打数 8.98 三振 6.22 四死球 3.36 総犠打数 2.68 併殺 0.68 盗塁 1.05 失策 1.84 6

平均を比較すると 本塁打 四死球以外はやや減少しているが そこまで大 きな変動は見られない 失策が大きく減少しているようにみえるが 鍋谷 ( 2007) ではボークや暴投もカウントしていたからである 7

第 4 章分析手法 1. 最小二乗法 得点に対するプレーの貢献度を分析するために 被説明変数を得点として最 小二乗法を用いる 説明変数は単打 二塁打 三塁打 本塁打 四球 死球 犠牲バント 犠牲フライ 三振 併殺打 失策 後攻ダミーの 12 個とした 以下は最小二乗法についての説明である 東京大学教養学部統計学教室 ( 編 )( 1991) を参考にした 最小二乗法 ( OLS:ordinary least squares) とは 重回帰方程式における回帰係数 β 1,β 2, β k を推定する際に残差二乗和を最小にするよう定める方法である 残差は ε i = Y i (β 1 + β 2 X 2i + β 3 X 3i + + β k X ki ) であるが その平方和 2 S = Σ ε i を最小にする S を最小にする β 1,β 2, β k は その一次の偏微分を 0 と置いた k 個の連立方程式 S β 1 = 0, S S = 0,, = 0 β 2 β k を解くことによって求められる 8

2.2 項ロジットモデル 鍋谷 (2007) では勝敗への貢献度の分析に重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いていたが 本稿では引き分けの 1 試合を除き 被説明変数を勝敗とした 2 項ロジットモデルを用いる 鍋谷 (2007) 同様 説明変数は前節でも用いた単打 二塁打 三塁打 本塁打 四球 死球 犠牲バント 犠牲フライ 三振 併殺打 失策をそれぞれ自チームの値から相手チームの値を引いたものに 後攻ダミー 先取点ダミーを加えた13 個とする た 以下は 2 項ロジットモデルについての説明である 豊田 ( 2012) を参考にし 最小二乗法のように被説明変数が連続変数であるのとは異なり 2 項ロジッ トモデルとは 被説明変数が はい いいえ のように 2 値の場合に用いられ る分析手法である モデル式は y = となる 推定方法は最尤法を用いる 1 1 + exp[ (b 0 + b 1 x 1 + b 2 x 2 + + b i x i )] 9

第 5 章分析結果 1. 得点の重回帰モデル 表 3は得点の重回帰モデルの推定結果 表 4は鍋谷 (2007) の結果である 結果の読み取り方を説明する 本稿では係数の比較により各プレーの貢献度の分析を行う 係数が正に高ければ高いほど得点に対する貢献度が高く 負の値になるとマイナスに貢献しているとなる 標準誤差とは標準偏差をデータの個数の平方根で割ることで算出される誤差である t 値は説明変数の係数や定数項の確からしさの度合いを判断する際に使用する数値である t 値の絶対値が大きいほど有意であると判断できる p 値とは説明変数の係数や定数項が偶然その値である確率である p 値が小さいほど有意であると判断できる この p 値の値によってその横のアスタリスク ( * ) の数が変わる 具体的には *=p 値 <0.1 * * = p 値 <0.05 * * * = p 値 <0.01 となる この * が多いほど有意であり * が無ければ有意ではないと判断できる 表の最後の列に表示されている決定係数とは説明変数が被説明変数をどの程度説明できているかを表す数値であり 大きいほど当てはまりが良いと判断できる その決定係数の説明変数の数を調整したものが修正済み決定係数であり 通常はこちらを見て判断する 10

表 3 得点の重回帰モデルの推定結果 説明変数 係数 標準誤差 t 値 p 値 定数項 -2.74 0.26-10.56 <0.00001 *** 本塁打 1.31 0.10 13.34 <0.00001 *** 三塁打 1.27 0.09 14.51 <0.00001 *** 二塁打 0.83 0.05 16.35 <0.00001 *** 失策 0.61 0.08 7.87 <0.00001 *** 単打 0.51 0.02 23.04 <0.00001 *** 犠牲フライ 0.45 0.13 3.39 0.0007 *** 死球 0.42 0.06 7.53 <0.00001 *** 四球 0.37 0.03 11.34 <0.00001 *** 後攻ダミー 0.12 0.12 1.00 0.32 三振 -0.01 0.02-0.36 0.71 犠牲バント -0.06 0.05-1.29 0.2 併殺打 -0.45 0.08-5.49 <0.00001 *** 決定係数 0.77 修正済み決定係数 0.77 表 4 鍋谷 (2007) の得点の重回帰モデルの推定結果 説明変数 係数 有意性 本塁打 0.84 * 総安打数 0.59 * 失策 0.42 * 四死球 0.34 * 盗塁 0.20 * 後攻ダミー 0.14 * 総犠打数 0.05 三振 -0.03 併殺打 -0.46 * 11

る 本稿の分析結果と鍋谷 ( 2007) の分析結果を比較すると以下の 4 点がわか 1 鍋谷 (2007) では単打 二塁打 三塁打 本塁打を総安打数として一括りにし 失策よりも貢献度が高いと示されていたが 本稿ではそれらを分けることで単打のみが失策よりも貢献度が低い 2 鍋谷 (2007) では犠牲バント 犠牲フライを総犠打数として一括りにし 有意ではないと示されていたが 本稿ではそれらを分けることで犠牲バントは有意ではないが犠牲フライは有意である 3 鍋谷 (2007) では四球 死球を四死球数として一括りにしていたが 本稿ではそれらを分けることで四球よりも死球の方が貢献度はわずかに高い 4 鍋谷 (2007) では後攻ダミーは有意であると示されていたが 本稿では有意ではない 12

2. 勝敗の 2 項ロジットモデル 表 5 は勝敗の 2 項ロジットモデルの推定結果である 結果の読み取り方は前節 と同様である 表 6 は鍋谷 ( 2007) の結果である 13

表 5 勝敗の2 項ロジットモデルの推定結果 説明変数 係数 標準誤差 t 値 p 値 定数項 -4.292 0.16 <0.00001 *** 本塁打 0.74 0.11 6.98 <0.00001 *** 先取点ダミー 0.54 0.19 2.83 0.00 *** 三塁打 0.45 0.09 5.25 <0.00001 *** 後攻ダミー 0.44 0.17 2.55 0.01 ** 犠牲フライ 0.30 0.13 2.32 0.02 ** 二塁打 0.27 0.05 5.34 <0.00001 *** 死球 0.26 0.06 4.79 <0.00001 *** 単打 0.25 0.02 10.44 <0.00001 *** 犠牲バント 0.21 0.05 4.38 0.00 *** 四球 0.15 0.03 4.64 <0.00001 *** 失策 0.07 0.08 0.85 0.40 三振 -0.10 0.02-4.72 <0.00001 *** 併殺打 -0.33 0.08-3.88 0.00 *** 決定係数 0.57 修正済み決定係数 0.56 表 6 鍋谷 (2007) の勝敗の 2 項ロジットモデルの推定結果 説明変数 係数 有意性 本塁打 0.96 * 先取点ダミー 0.56 * 総安打数 0.43 * 後攻ダミー 0.42 * 失策 0.33 * 総犠打数 0.27 * 四死球数 0.16 * 盗塁 0.13 三振 -0.14 * 併殺打 -0.36 * 14

る 本稿の分析結果と鍋谷 ( 2007) の分析結果を比較すると以下の 4 点がわか 1 鍋谷 (2007) では単打 二塁打 三塁打 本塁打を総安打数として一括りにし 後攻よりも貢献度が高いと示されていたが 本稿ではそれらを分けることで本塁打 三塁打のみが後攻よりも貢献度が高い 2 鍋谷 (2007) では犠牲バント 犠牲フライを総犠打数として一括りにしていたが 本稿ではそれらを分けることで犠牲フライは単打よりも貢献度が高く 犠牲バントは単打よりも貢献度が低い 3 鍋谷 (2007) では四球 死球を四死球数として一括りにしていたが 本稿ではそれらを分けることで死球は単打以上に勝敗への貢献度が高い 4 鍋谷 (2007) では失策は有意であると示されていたが 本稿では有意ではない 15

第 6 章結論 鍋谷 (2007) との比較では 総安打数 総犠打数 四死球をそれぞれ細かく分けることによってより詳細な分析結果を得ることができた 特に驚くべき結果となったのは死球が単打以上に勝敗への貢献度が高いことである ともに塁打 1の出塁となる死球と単打だが 仮に走者が三塁にいる場面を想定すると 単打は確実に1 点が得られるが 死球は 1 3 塁という状況にしかならない にもかかわらず死球の方が勝敗への貢献度が高くなった結果になった要因としては 死球を与えることによって高校生投手は精神的負担を感じてしまうことでその後のピッチングに影響を及ぼすことがあると予測できる 本稿の分析では 鍋谷 ( 2007) よりも変数を増やしてより細かい分析を行ったが それでも盗塁数や犠牲バントの失敗数など考慮すべき変数が存在する さらに 得点についての分析で有意ではないと判断されて犠牲バントについては 相手の得点等を操作変数とした操作変数法を 勝敗についての分析では試合を観測単位とした 2チームの2 変量モデルとして分析すると より精度の高い分析結果が得られるであろう 16

参考文献 豊田秀樹 (2012) 回帰分析入門 Rで学ぶ最新データ解析 東京図書株式会社 鍋谷清治 (2007) 野球のデータの統計的分析 日本統計学会誌 第 36 巻 第 2 号 2007 年 3 月 91 頁 -115 頁 東京大学教養学部統計学教室 ( 編 )( 1991) 統計学入門 東京大学出版会 参考 WEB サイトリスト 高校野球 : 朝日新聞デジタル http://www.asahi.com/koshien/ 17