目次 第 1 章 はじめに 3 第 2 章 先行研究 先行研究概要 先行研究問題点 問題点の解決策 4 第 3 章 分析方法 データ説明 モデル説明 多重共線性 7 第 4 章 結果 考察 回帰分析結果

Similar documents
過去 5 年間における箱根駅伝競技成績とハーフマラソン 10000m との関連性について ( 平均タイムを順位付け点数化して調査 ) 学籍番号 11A0055 学生氏名太田達之オセイダニエル加藤光児玉瑞樹近並郷 Ⅰ はじめに箱根駅伝は近年 お正月の風物詩として社会に親しまれている 各大学ともに箱根駅

スライド 1

13章 回帰分析

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

横浜市環境科学研究所

夏季五輪の メダル獲得要因はなにか

1.民営化

Microsoft PowerPoint - ch04j

要約 鍋谷 (2007) では2001 年 ~2005 年の高校野球 プロ野球における各プレーの貢献度を 得点 勝敗を被説明変数 各プレーを説明変数とした重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いて分析し 犠打 ( 犠牲バント 犠牲フライ ) は得点に対しては有意ではないが勝敗

経営戦略研究_1.indb

ビジネス統計 統計基礎とエクセル分析 正誤表


切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

東京箱根間往復大学駅伝競走シード権獲得と 10000m 平均タイムとの関連性学籍番号 :12A0096 学生氏名 : 河西大輝周防俊也桃原誉 Ⅰ. はじめに東京箱根間往復大学駅伝競走 ( 以下 箱根駅伝 ) は学生駅伝最大であり今年で 92 を数える歴史の永い駅伝競走である テレビをはじめ多くのメデ

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

測量士補 重要事項「標準偏差」

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft Word - mstattext02.docx

Excelにおける回帰分析(最小二乗法)の手順と出力

アダストリア売り上げデータによる 現状把握と今後の方針 東海大学情報通信学部経営システム工学科佐藤健太

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - lec_student-chp3_1-representative

画像類似度測定の初歩的な手法の検証

EBNと疫学

参加標準記録 少年女子 B 少年共通 少年男子 B 少年女子 A

測量試補 重要事項

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

第2回全日本大学女子選抜駅伝競走

日体大ハンドボール部女子における平成 26 年度春季 秋季リーグ ハンドボール研究室 の勝ち試合と負け試合のシュートレンジについての考察 指導教員 辻 昇一准教授 ~DS のシュート成功率 平均シュート数 平均得点に着目して~ 学籍番号 11A A A A0746

ドーハ 2019 世界陸上競技選手権大会トラック & フィールド種目日本代表選手選考要項 2019 年 5 月 28 日公益財団法人日本陸上競技連盟 1. 編成方針 2020 年東京オリンピックの目標は より多くのメダルや入賞をより多く獲得するとともに 大会により多くの競技者を送り込むことにある そ

Excelによるデータ分析

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

統計的データ解析

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

2009高体連男子大会要項

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子

交通インフラのストロー効果と地域間格差

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft Word - SPSS2007s5.doc

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

大会の振り返り [ 短距離 ] 今回は5 人の選手にインタビューし 今シーズンを振り返っていただきました! Q1, 振り返った大会に出場した際の思い 意気込みを含めての感想 Q2, 今後の目標 渡邉隆太郎 (4) 種目 : 棒高跳 PB:5m10( 中大記録 ) 大会名 : 全日本インカレ A1 正

<4D F736F F F696E74202D EC08F4B CF58BB48C92816A205B8CDD8AB B83685D>

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

目次 はじめに P.02 マクロの種類 ---

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

8 A B B B B B B B B B 175

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

経済統計分析1 イントロダクション

< B824F82548F48838A815B834F2E786C73>

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

PowerPoint プレゼンテーション

Transcription:

卒業論文 箱根駅伝の結果決定要因分析 千葉大学法経学部経済学科 4 年 大鋸ゼミナール 09A2070Z 佐藤圭介 1

目次 第 1 章 はじめに 3 第 2 章 先行研究 4 2.1 先行研究概要 4 2.2 先行研究問題点 4 2.3 問題点の解決策 4 第 3 章 分析方法 5 3.1 データ説明 5 3.2 モデル説明 6 3.3 多重共線性 7 第 4 章 結果 考察 8 4.1 回帰分析結果 8 4.2 回帰分析考察 9 4.3 予想と結果の比較 10 第 5 章 結論と課題 12 第 6 章 参考文献 12 第 7 章 付録 13 2

第 1 章はじめに 本研究の目的は 2007 年度 ~2012 年度の各大学の駅伝チームの詳細データを用いて箱根駅伝の結果を予想 考察し 箱根駅伝を征するにはどのような要素が重要であるかを提言する事である 箱根駅伝 ( 東京箱根間往復大学駅伝競走 ) とは 関東学生陸上競技連盟主催で毎年 1 月 2 日 3 日に行われる大学駅伝であり 関東の大学駅伝チャンピオンを決める大会である 箱根駅伝の特徴は 学生三大駅伝 ( 出雲駅伝 全日本大学駅伝 箱根駅伝 ) の中で最も一人当たりの走行距離が長く 走行人数も多いということである また 高低差 800m 以上ある箱根の山を登り降りする区間が有ることが上げられる このように箱根駅伝は大変厳しい条件の下で戦われるため 脱水症状などのアクシデントが発生しやすく 結果が各大学の持ちタイム (10000m 上位 10 人平均 ) などの序列通りに決まらないことが多い 過去の塩野貴之 (2010) の研究では 2005 年度 ~2009 年度において箱根駅伝に出場した事のある 27 大学の 5000m 10000m ハーフマラソンタイムのチーム内上位 1 人 3 人 10 人 16 人の平均タイムを説明変数とし 箱根駅伝順位を被説明変数とした重回帰分析を行うというもので 結果としてハーフマラソン上位 10 人 16 人と 10000m 上位 1 人の平均タイムが予測を行う上で重要な要因として選ばれた 本研究では 2007 年度 ~2011 年度において箱根駅伝に出場した事のある 24 大学の1 5000m 10000m ハーフマラソンのチーム内 1~3 番手 4~7 番手 8~12 番手 13~16 番手 17~20 番手選手の平均タイム 2 過去 5 年間の 3 大駅伝順位 3 各個人のトラックレース ロードレース 駅伝の結果をハーフマラソンのタイムに換算した KM 指数 4 各大学の 5 区のタイムを予想した山登り偏差値 5 各大学が関東学生陸上競技大会の長距離部門 (1500m 5000m 10000m ハーフマラソン 3000m 障害 ) で得た関東インカレポイントを説明変数とし 箱根駅伝タイムを被説明変数として重回帰分析を行った結果 タイム同士の説明変数の相関が強いため 多重共線性が発生してしまい 有意な分析が出来なかったため タイムの説明変数の中から選んだ一つのデータと他のタイム以外のデータを説明変数とした重回帰分析を行うことで 2012 年度の箱根駅伝順位 タイム予想を行うというものである 箱根駅伝を予想するに当たり 重要な要素として 持ちタイムでは 1 万 mチーム内 8 ~12 番手の平均タイム 持ちタイム以外の要素として山登り偏差値 関東インカレポイントが選ばれた 第 89 回箱根駅伝で優勝したのは日本体育大学であった 予想順位では 5 位だったが 予想タイムとの差が僅か 2 分であり 全員が自分の力を十分に発揮した結果と言える 逆に予想 1 位であった駒沢大学は予想タイムより 17 分遅れでの 3 位だった チーム内実力上位選手の欠場で下位の選手が急遽走らざるを得なかったことと そこから来るプレッシャーで本来のパフォーマンスを発揮出来なかったからだと考えられる このように 選手全員が安定して走ることが 箱根駅伝では非常に重要である また 本研究では触れなかった 3

が 天気や選手の状態面から結果を予想するという試みをする必要がある 本論文は以下のような構成になっている 第 2 章では先行研究の紹介を行い 第 3 章で分析手法とデータ説明 意義を明らかにする 第 4 章で分析結果と考察をし 第 5 章で結論を示す 第 2 章過去の研究 2.1 先行研究概要塩野貴之 統計的手法を用いた箱根駅伝予想順位 (2010) では 2005 年度 ~2009 年度において箱根駅伝に出場した全 27 大学の 5000m 10000m ハーフマラソンの上位 1 人平均 上位 3 人平均 上位 10 人平均 上位 16 人平均タイムと上位 10 人 上位 16 人の標準偏差 前年箱根駅伝順位を説明変数とし回帰分析をおこなった結果 予測に重要な要因として ハーフマラソン上位 16 人平均タイム 10000m 上位 16 人平均タイム 10000m 上位 1 人タイムの 3 要因が選ばれたとしている 上位 10 人ではなく上位 16 人平均が選ばれたのは 箱根は分厚い戦力がないと 戦えないということ またハーフとともに 10000m が選ばれたのは ハーフは一部主力選手や一年生が走っていないことが多く チームの戦力を正確に評価できないためということ 10000m 上位 1 人タイムが選ばれたのは エース効果が駅伝にあったとしている 以上の先行研究を基に 本研究でも基本的に各チームの持ちタイムを説明変数として重回帰分析を行うこととするが 先行研究の問題点と解決策を以下で考察する 2.2 先行研究の問題点先行研究の問題点として 持ちタイムの上位から平均を取る場合 例えば上位 10 人平均と上位 16 人平均ではそれぞれ説明変数としてあまりにも相関が強く出てきてしまい 多重共線性が発生してしまう可能性が高くなる また 駅伝は距離が長く 走る人数も多く 持ちタイム通りに決着する事はあまりないと考えられるため 持ちタイム以外の指標が必要である そして昨今の大学駅伝のスピード化 混戦化により 短い距離や 大人数での分析が必要なのではないかと考えられる 東洋大学がそれまでのレコードタイムを 8 分以上更新し 2 位に大差をつけた 2011 年度の箱根駅伝のように順位が一つ違うだけでかなりの差がある場合や 逆にシード権内 10 位であった國學院大學とシード落ち 11 位の城西大学のタイム差が 3 秒であった第 87 回大会のように僅差である場合があり 順位を被説明変数にすると細かい予想が出来ないと考えられる 2.3 問題点の解決策 問題点の解決策として 持ちタイムの上位から順に平均を取るのではなく 上位 1~3 4 ~7 人平均のように差を付ける事によって説明変数どうしの相関を減らす 持ちタイム以外 4

の指標として出雲駅伝や全日本大学駅伝 関東学生陸上競技大会の結果を用いる事によって本番の強さを指標に入れる 昨今の大学駅伝のスピード化 混戦化に対応するために持ちタイムチーム内 16 番目までの選手では無く 20 番目の選手までのデータを用いて 尚且つ 5000m のタイムも 10000m とハーフマラソンのタイムと同様に重要な要素として組み入れる また 順位では無く タイムを被説明変数にする事でより詳しい予想を立てる 第 3 章分析手法 3.1 データ説明 箱根駅伝を重回帰分析によって予想するに当たり 説明変数として用いるデータを表 1 に示し それぞれのデータの詳細を以下に示す 1 持ちタイムデータ各チームの持ちタイム上位から 1 番目 ~3 番目の平均はチーム内でのエース級選手の力を表しており エースの働きがどう結果に結び付くかを見る 持ちタイム 4 番目 ~7 番目平均は中堅選手である 持ちタイム 8 番目 ~12 番目平均はレギュラー争いをする選手達であり 彼らの競争が激化することによって結果がまるで変わると言われている 持ちタイム 13 番目 ~16 番目平均は 12 月 10 日にある箱根駅伝の一次エントリーの登録メンバー数で実質的にこの 16 番目の選手までが箱根駅伝を走る可能性が高い 持ちタイム 17 番目 ~20 番目平均は一次エントリーにも入る事が出来ない選手だが この層がレギュラークラスや 16 番目までの選手と大差無い実力を持っている場合 エントリー日ぎりぎりまでチーム全体として追い込む事ができるため 怪我のリスクを考えないで競わせる事が出来ると考え 説明変数にいれた 2 本番の強さを示すデータ陸上競技 特に長距離という種目は距離 コース条件 天候によって力を発揮出来るか 出来ないかのブレが大きいと考えられ 持ちタイム以外の本番の強さで結果が左右されるので 本番の強さを示すデータとして以下の 2 つの指標を用いた (a) 出雲駅伝 全日本大学駅伝順位 2 つの駅伝は何れも箱根駅伝の前哨戦として開催される大会であり チーム状態や各選手の調子を知る良い指標となり 箱根駅伝への直結度が高いと考えたためである タイムでは無く 順位を用いるのは箱根駅伝に出場する大学全てが 2 つの駅伝に出場する事が出来る訳では無いので 出場権が無い大学は各駅伝の予選会の順位によって順位付けをしたものである (b) 関東インカレ長距離部門ポイント関東インカレ ( 関東学生陸上競技対抗選手権大会 ) で行われる長距離部門 (1500m 5000m 10000m ハーフマラソン ) において 8 位まで入賞した場合に与えられるポイント 5

(1 位 8 点 2 位 7 点 8 位 1 点 ) を合計したものである 3 箱根駅伝特有のデータ箱根駅伝は他の長距離種目 駅伝と比較して 走者一人当たりの距離が長い事 標高差 800m 以上の山道を登り降りするという特殊性があるため 箱根独自の指標が必要である 箱根駅伝を予想するための特有のデータを以下に示した (a) km指数 古豪中央大学陸上部応援ホームページ 内において km氏 が独自に開発した係数により算出されたハーフマラソン換算のタイムである km指数は計算式が不明であるが 各個人の 5000m 10000m のトラックレース 20 km ハーフマラソン 30 kmのロードレース 箱根駅伝 出雲駅伝 全日本大学駅伝と新入生は全国高校駅伝の結果によりハーフマラソンタイムを換算し 各チーム上位 10 選手の平均値として算出される km指数を導入することで チームの主力選手が頻繁に走らないハーフマラソンをあらゆる条件の記録によって予想できる 駅伝は各区間で距離やアップダウン 競争相手が変わるので同じ区間賞でも区間が違えばその価値が変わるのは当然であり条件が異なる結果を箱根駅伝で選手が走る距離であるハーフマラソンという一つの指標に換算する事は非常に重要である 表 2 に今年のkm指数ランキングを示した (b) 山登り偏差値山登り区間である 5 区に配置する選手を予想し その選手の前年までの 5 区成績や基礎走力 大学別の 5 区育成力を基に偏差値化したものである 箱根駅伝における 5 区とうい区間は非常に特殊である 5 区以外の区間は概ね持ちタイムの序列から区間順位が大きくかい離する事は余り無い しかし 5 区は 23.4 kmという箱根駅伝 10 区間中最長距離でありながら標高差 864mを一気に駆け上がる過酷な区間であり 持ちタイム通りの結果にならない事が多い このように 5 区は特殊な区間であるため コース適性が必要とされ 4 年連続同一区間走行選手数が 36 と最多でスペシャリストが担当することが多い 偏差値の出し方は前年まで 5 区を走った選手がエントリーされているチームはその選手が走った年の偏差値の平均 前年まで 5 区を走った選手がエントリーされていないチームは過去 8 年間で箱根駅伝に出場したすべての年の 5 区偏差値の平均により算出する 3.2 モデル説明 2007 年度 ~2011 年度に箱根駅伝に出場した全 24 大学の 3-1 で示したデータを説明変数とし 被説明変数を箱根駅伝タイムとし 重回帰分析を行うと 以下のようなモデルとなる Y i = β 0 + β 1 X 1i + β 2 X 2i + + β n X ni + ε i i = {1,2,3 N} 6

Y i = 箱根駅伝タイム β O : 定数項 β 1, β 2,, β N : 回帰係数 X 1, X 2,, X n : 各データ ε i : 誤差項 { N: 2007~2012 年度箱根駅伝出場大学総数 } 左辺は被説明変数であり 箱根駅伝タイムを表している また 右辺は説明変数である各データとその回帰係数 誤差を表している 以上の方法を用いて 箱根駅伝に出場している各大学のデータと箱根駅伝タイムの関係を検証する 回帰直線を推定するために本研究では 未知の回帰係数の値をデータから推定する最小二乗法を使用し エクセルのデータ分析ツールを用いて回帰分析を行う 3.3 多重共線性説明変数の中で持ちタイム同士は相関が高い可能性がある 重回帰分析は一般に 説明変数同士の相関が高いと多重共線性の可能性があるため 高い相関を持つ説明変数同士の組み合わせのうち一方を排除する必要がある ここで被説明変数と説明変数全 20 個の相関を表 3 に示した この中から絶対値 0.8 以上の相関を持つ組み合わせを相関が高いとして一方の説明変数を排除し残った 14 個の説明変数を用いて回帰分析を行った 結果は表 4 に示した 表 4 の係数に注目する 被説明変数はタイムなので 順位やタイムなど値が小さければ小さいほど良い説明変数の係数はプラスのはずであり ポイントや偏差値など値が大きい方が良い説明変数の係数はマイナスのはずである しかし表の黄色塗の係数はその逆の符号になっている このように相関係数と回帰係数が逆符号になっている説明変数は多重共線性の疑いがあるため排除し残った 7 つの説明変数により回帰分析を行う 結果を表 5 に示した 説明変数が有意であるかを表 5 の t 値に注目することで判断する 有意水準 5% のとき t 値が絶対値 1.985 以上であれば その説明変数が箱根駅伝に影響を与えていることになる 表 5 でその条件を満たしているのは山登り偏差値のみである ここでもう一度表 3 を見ると 持ちタイムとkm指数の説明変数同士の相関が非常に高く これらの変数が全て同じような動きをするため 多重共線性を誘発し このことが山登り偏差値だけを優位にした要因ではないかと考えた ここで持ちタイムとkm指数の説明変数から一つだけを選んでモデルに組み入れることで 持ちタイムとkm指数の説明変数同士の相関が高いことで発生した弊害を回避しようと考える [ 山登り指数 関東インカレポイントと ( 出雲駅伝か全日本大学駅伝 )+ 持ちタイムとkm指数のデータの中から一つ ] を説明変数とし 箱根駅伝を被説明変数とした重回帰分析を行 7

い その結果モデルの説明力を表す補正 R2 が最も高い値を示したモデルで箱根駅伝を予想する また ここでは 3.1 節で示された持タイムのデータ ( 各距離チーム内 1~3 番手 4 ~7 番手 8~12 番手 13~16 番手 17~20 番手選手の平均タイム ) に加えて各距離チーム内 1~3 番手 1~7 番手 1~12 番手 1~16 番手 1~20 番手選手の平均タイムと 1~ 5 番手 6~10 番手 11~15 番手 16~20 番手選手の平均タイムを説明変数に加える これは より細かく持ちタイムの平均を区分けすることで どの選手の層が最も箱根駅伝の結果に繋がる要素か判断するためである その結果が表 6 であり 10000m のチーム内 8 番手 ~12 番手の選手の平均タイムと全日本大学駅伝が説明変数として入ったモデルが選択された このモデルを基に箱根駅伝のタイムを予想する 4 章以降その結果について考察をする 第 4 章結果と考察 4.1 回帰分析結果多重共線性の可能性がある説明変数を排除して残った 10000m のチーム内 8 番手 ~12 番手の選手の平均タイムと全日本大学駅伝順位と山登り偏差値と関東インカレポイントを説明変数とし 箱根駅伝タイムを被説明変数とした重回帰分析を行った結果を表 7 に示した 表 7 において 推定された回帰係数の符号が理論的な符号と全て一致しているので多重共線性の疑いは無い また 自由度 98 有意水準 5% で両側の t 検定をした結果 山登り偏差値と 1 万 m チーム内 8~12 番手の平均タイムの 2 項目で t 値が棄却域を超えているので それらの説明変数は有意である また自由度 98 有意水準 10% で検定すれば 関東インカレポイントも t 値が棄却域を超えるので 関東インカレポイントも有意である [ 結果 1] 持ちタイムの中では 1 万 m チーム内 8~12 番手の平均タイムが良いチームは箱根駅伝タイムが良い [ 結果 2] 山登り偏差値が高いチームは箱根駅伝のタイムが良い [ 結果 3] 関東インカレポイントが高いチームは箱根駅伝のタイムが良い [ 結果 4] 全日本大学駅伝 出雲駅伝の結果が良いチームは箱根駅伝のタイムが良いとは限らない以下に箱根駅伝予想タイム式を示した 箱根駅伝予想タイム = 0.261+0.00013 ( 全日本大学駅伝順位 )+11.0 (1 万 m チーム内 8 番手 ~12 番手平均タイム ) -0.000128 ( 関東インカレポイト )-0.00034 ( 山登り偏差値 ) 上の箱根駅伝予想タイム式に 2012 年度の箱根駅伝に出場する各大学のデータを代入した 8

結果が第 89 回箱根駅伝結果予想であり 実際の結果と共に表 8 に示した 4.2 回帰分析考察 [ 結果 1] 持ちタイムの中では 1 万 m チーム内 8~12 番手の平均タイムが良いチームは箱根駅伝タイムが良い 5000m は箱根駅伝で走る約 20 kmと比べて距離が短く 直結しないということが考えられ ハーフマラソンは 箱根駅伝の距離と同じであるが チーム内のエース選手が走らない場合や トラック競技であり 頻繁に記録会 大会がある 5000m 10000m よりも走る機会が少なく 必ずしもその選手の力を表す指標にはなり得ないからだと考えられる よって 距離としても力を表す指標としても問題が少ない 10000m が選ばれたと考える 8~12 番手の平均タイムが選ばれたのは 箱根駅伝を走るか走らないかギリギリの選手の力がチーム内の上位層と遜色がなければ 上位の選手としては下位の選手の実力を信じて 自分の力を出すことができるが 8~12 番手の選手の実力がなければ 上位選手は自分が頑張らないといけないというプレッシャーで実力を発揮出来なく ブレーキをしてしまう可能性がある このように 箱根駅伝を走れるかの瀬戸際の選手の実力如何でチーム内が自信に満ち溢れるかプレッシャーに飲まれるか決まり 結果を左右するのだと考える [ 結果 2] 山登り偏差値が高いチームは箱根駅伝のタイムが良い予想通り箱根駅伝の結果を左右するのは山であった 各大学が優勝を狙う またはシード権を獲得するためには山登りに適正がある選手を若い学年の内から見つけ出し 能力を開花させる必要がある 1 年生で 5 区を好走する選手がいる大学は その後の 3 年間は安泰と言っていいであろう [ 結果 3] 関東インカレポイントが高いチームは箱根駅伝のタイムが良いチームの本番の強さを示す指標として 出雲駅伝や全日本大学駅伝の結果ではなく 関東インカレポイントが選ばれた 関東インカレは長距離以外の短距離 中距離 投擲 跳躍などの種目も行われ 大学陸上部の威信を賭けた戦いであるために 箱根駅伝と同等に重要な大会で 調整も入念に行うため チームの実力を真に反映するからであると考える [ 結果 4] 出雲 全日本大学駅伝結果が良いチームは箱根駅伝のタイムが良いとは限らない 出雲 全日本駅伝が選ばれなかった 3 つの理由を考察した 1 出雲駅伝や全日本大学駅伝はあくまで箱根駅伝の前哨戦であり 箱根駅伝ほど調整をして望むチームが少ないと考えられ チームの力を表す指標としては不十分である 2 箱根駅伝に出場するすべてのチームが出雲 全日本駅伝に出場出来るわけではなく 出場しないチームは予選会の順位を結果として当てはめただけであるので これもデータとして不十分である 3 出雲 全日本駅伝はタイムではなく順位としてのデータなので 箱根駅伝タイムを緻密に予想するに 9

はそぐわない 4.3 予想と結果の比較 分析 表 8 から第 89 回箱根駅伝の予想と実際の結果の比較 考察をする 優勝日本体育大学 11 時間 13 分 26 秒予想タイム+2 分 5 秒 ( 予想順位 5 位予想タイム 11 時間 11 分 21 秒 ) 戦前の予想では完全に東洋大学と駒澤大学の実力が抜けていて 2 校の一騎打ちだと思われた しかし最初にゴールテープを切ったのは日体大であった 確かに箱根駅伝予選会 (1 位 ) そして全日本大学駅伝(3 位と僅差の 4 位 ) の成績からして上位に食い込むだろうと考え 今回の分析でも 5 位という予想であったが まさか優勝するとは考えられなかった しかし他の有力大学が軒並み予想タイムを大幅に下回る中 日体大は予想と結果タイムがほぼ同じであった これは 10 区間誰もミスと言っていいミスが無く 非常に安定した走りを全員がしていたからだと言える チームの 3 本柱である 2 区本田 (4 位 ) 5 区服部 (1 位 ) 9 区矢野 (2 位 ) は想定通りの走りであったが 6 区鈴木 (7 位 ) 7 区高田 (2 位 ) 8 区高柳 (2 位 ) など 中堅選手の好走は予想出来なかった 昨年度の箱根駅伝で 19 位と大敗し 直後当時 2 年生であった服部選手を主将に任命した別府監督の決断や 下級生のキャプテンについて行った 4 年生は非常に複雑な思いがあったと想像するが そこから1 年間チームを立て直したという自信が全員にあり 良い流れで走れたのではないかと考える そして今回走ったメンバーの内 4 年生は高田と高柳のみであり 8 人が来年も残るので 連覇にも期待が持てる結果と言える 2 位東洋大学 11 時間 18 分 20 秒予想タイム+15 分 54 秒 ( 予想順位 2 位予想タイム 11 時間 02 分 26 秒 ) 3 区終了時点で 2 位に 2 分 40 秒の差を付けた時点で東洋大学の総合優勝を確信した しかし 4 区の淀川選手が区間 11 位 5 区の定方選手が区間 10 位と優勝を争う大学としては少し手痛い結果となってしまい 日体大に逆転を許してしまう ただ 往路終了時点では 復路に前年度区間賞の 6 区市川選手 8 区大津選手や 7 区高久選手 ( 出雲駅伝 5 区区間新 ) など他大学ではエース級と呼ばれるほど実力を持った選手が揃っていたので 逆転は十分に可能であると見ていた しかし日体大を追い詰めるどころか逆に離されてしまう結果となった 中でも最も優勝を遠ざけてしまったのは 4 区である 本来であれば淀川選手では無く 今井選手が走る予定だった 今井選手は 5000m13 分台と 東洋大学の中でも主力選手の一人であったが 箱根駅伝前日に左足首の故障が判明し当日変更を余儀なくされた 淀川選手も力の無い選手では無いが 当日変更で急遽であったと言うのと 5 区に柱がいなかったために 自分がリードを広げなければならないというプレッシャーで少し力んでしまったと考える 駅伝は流れが重要なので この 4 区以降悪い流れが伝わってしまい 総合的にも予想タイムとかけ離れる結果となってしまったと考える 10

3 位駒澤大学 11 時間 19 分 23 秒予想タイム+17 分 8 秒 ( 予想順位 1 位予想タイム 11 時間 02 分 15 秒 ) 大八木監督は数年前から勝負の年と謳い 戦力は他大学の追随を許さない程充実していた今年度の駒沢大学であったが エースである窪田選手 (2 区 7 位 ) 村山選手(5 区 8 位 ) が不発に終わったことと 4 区のブレーキがあったことにより 往路終了時点で優勝は遠のいてしまった 東洋大学と同様に 特に 4 区の湯地選手 (19 位 ) のブレーキが余りにも痛かった 7 区を予定していた撹上選手が発熱で走れず 4 区を予定していた久我選手が体調不良で 7 区に回ったことで チーム内 11 番手の湯地選手が 4 区を走ることになった ただ 優勝した日体大 2 位東洋大も 11 番手の選手が当日変更で走っていることを考えると 湯地選手というよりチーム全体としての準備や統一感が欠けていたのかもしれない そんな中 復路のメンバー 特に 4 年生は諦めていなかった 6 区千葉選手 9 区上野選手 10 区後藤田選手が有終の美を飾る区間賞で総合優勝は叶わなかったが 堂々の復路優勝で来年へと繋げた 4 位帝京大学 11 時間 21 分 39 秒予想タイム +17 秒 ( 予想順位 15 位予想タイム 11 時間 21 分 22 秒 ) 最も予想タイムに近い結果だったチームが帝京大学である 全員が本当に安定して走るこれぞ駅伝と言える襷リレーであった 高校時代の無名選手を大学でじっくり育て 箱根駅伝に出場出来るレベルまで引き上げるという特徴がある大学で 中野監督の手腕を存分に見せつけられた結果となった 箱根駅伝出走者 10 人の高校時代の 5000m 平均タイムは出場全 22 大学中最下位 (14 分 48 秒 1 位駒沢大学は 14 分 05 秒 ) であることからも 帝京大学の育成力の凄味がわかる 特に 6 区を走った千葉選手は高校時代 5000m のベストタイムが 15 分 6 秒で区間 3 位と言うのは 全国の無名高校生に夢を与えてくれた 5 位早稲田大学 11 時間 21 分 39 秒予想タイム +13 分 14 秒 ( 予想順位 3 位予想 タイム 11 時間 08 分 25 秒 ) 主力を往路に全投入し 往路終了時では 2 位に付けていたが 復路のメンバーが手薄で 区間一桁が 10 区田口選手 (4 位 ) のみで選手層の薄さが露呈する結果となってしまった 流れとしては 1 区前田選手が 17 位とブレーキしてしまったのが最後まで響いてしまったと言える 中学時代から世代でも有力選手だった佐々木選手 (4 区 8 位 ) や志方選手 (7 区 11 位 ) が大学入学以降故障で伸び悩んでいた状態が続いていたのもチーム状態が芳しくなかった一因と言える 11

第 5 章結論と課題 本研究では第 89 回箱根駅伝の結果を重回帰分析により予想し 箱根で勝つ為にはどのような要因が重要であるかを明らかにすることを目的とした 4 章で得られた結果からこの研究で明らかになったことは 箱根駅伝は チームの下位の選手層の実力 箱根駅伝の 5 区を走るためのスペシャリストの存在 チームの本番の強さという指標で予想することが重要であるということだった 今後の課題として 今回の箱根駅伝は強い向かい風が終始吹いていたことで 全体的にタイムが例年と比較して悪かった そういった風の影響や温度の影響などを考慮に入れた予想をするために 説明変数に天気などのデータも含めたい そして 主力選手が怪我や病気で欠場することが多かったので 選手やチームの状態面から結果を予想する試みをして行きたいと思う 第 6 章参考文献 古豪! 中央大学陸上部応援ホームページ http://homepage2.nifty.com/chuo84/ 統計的手法を用いた箱根駅伝予想順位 ( 塩野貴之 2010 年 12 月 9 日 ) http://toetoe.exblog.jp/15585248/ 12

第 7 章付録 表 1 説明変数として用いるデータ 1 持ちタイムデータ 5000m 10000m ハーフマラソンの持ちタイム上位から 1 番目 ~3 番目 4 番目 ~7 番目 8 番目 ~ 12 番目 13 番目 ~16 番目 17 番目 ~20 番目のそれぞれの平均 2 本番の強さを示すデータ (a) 全日本大学駅伝 出雲駅伝順位 (b) 関東インカレ長距離部門ポイント 3 箱根駅伝特有のデータ (a)km 指数 (b) 山登り (5 区 ) 偏差値 表 2 km指数ランキング (2012 年 11 月 20 日現在 ) 順位 大学名 km指数 順位 大学名 km指数 1 駒沢大学 62:26 11 山梨学院大学 63:37 2 東洋大学 62:34 12 中央学院大学 63:41 3 明治大学 62:49 13 城西大学 63:42 4 早稲田大学 63:03 14 学連選抜 63:43 5 青山学院大学 63:06 15 日本大学 63:49 6 日本体育大学 63:16 16 上武大学 63:59 7 中央大学 63:26 17 神奈川大学 64:17 8 順天堂大学 63:29 18 大東文化大学 64:20 9 東京農業大学 63:36 19 法政大学 64:23 10 帝京大学 63:37 20 國学院大学 64:23 13

表 3 説明変数同士の相関係数 箱根タイム全日本出雲関東インカレ山登り指数km指数 5 千 1~3 5 千 4~7 5 千 8~125 千 13~15 千 17~21 万 1~3 1 万 4~7 1 万 8~121 万 13~161 万 17~20 ハーフ 1~3 ハーフ 4~7 ハーフ 8~1 ハーフ 13~ 箱根タイム 1.000 全日本 0.540 1.000 出雲 0.474 0.678 1.000 関東インカレ -0.351-0.552-0.435 1.000 山登り指数 -0.568-0.411-0.426 0.384 1.000 km指数 0.694 0.717 0.677-0.572-0.542 1.000 5 千 1~3 0.467 0.611 0.519-0.642-0.347 0.698 1.000 5 千 4~7 0.543 0.673 0.604-0.518-0.371 0.717 0.821 1.000 5 千 8~12 0.581 0.661 0.588-0.475-0.388 0.747 0.782 0.941 1.000 5 千 13~16 0.585 0.629 0.613-0.440-0.435 0.724 0.720 0.860 0.932 1.000 5 千 17~20 0.004-0.008-0.008-0.017 0.028-0.072 0.077 0.056 0.005-0.022 1.000 1 万 1~3 0.448 0.523 0.505-0.606-0.361 0.725 0.799 0.615 0.610 0.580 0.146 1.000 1 万 4~7 0.572 0.483 0.441-0.491-0.385 0.729 0.641 0.708 0.754 0.715 0.132 0.672 1.000 1 万 8~12 0.590 0.414 0.443-0.370-0.346 0.665 0.539 0.581 0.703 0.679 0.084 0.530 0.854 1.000 1 万 13~16 0.493 0.270 0.349-0.240-0.275 0.516 0.384 0.386 0.503 0.545 0.212 0.459 0.665 0.859 1.000 1 万 17~20 0.413 0.236 0.300-0.187-0.286 0.404 0.289 0.307 0.413 0.535 0.148 0.362 0.511 0.671 0.877 1.000 ハーフ 1~3 0.449 0.534 0.585-0.415-0.293 0.655 0.398 0.428 0.463 0.516-0.129 0.474 0.432 0.485 0.378 0.374 1.000 ハーフ 4~7 0.507 0.603 0.647-0.429-0.366 0.780 0.489 0.591 0.631 0.640-0.137 0.519 0.585 0.595 0.433 0.339 0.862 1.000 ハーフ 8~12 0.514 0.561 0.606-0.363-0.433 0.775 0.456 0.546 0.612 0.639-0.073 0.506 0.577 0.601 0.472 0.381 0.752 0.909 1.000 ハーフ 13~16 0.423 0.402 0.518-0.228-0.416 0.652 0.360 0.444 0.514 0.584-0.042 0.452 0.462 0.488 0.446 0.421 0.612 0.728 0.892 1.000 ハーフ 17 0.324 0.313 0.410-0.170-0.337 0.549 0.208 0.334 0.387 0.474-0.075 0.324 0.378 0.390 0.375 0.396 0.541 0.606 0.755 0.894 14

表 4 12 個の説明変数で回帰分析を行った結果 回帰統計 重相関 R 0.775 重決定 R2 0.601 補正 R2 0.535 標準誤差 0.00414 観測数 99 係数 標準誤差 t P- 値 切片 0.133 0.0982 1.36 0.176 全日本 6.40E-06 0.000123 0.05213 0.9589 出雲 -4.07E-05 0.000111-0.367 0.714 関東インカレ -7.283E-05 7.672E-05-0.949 0.345 山登り指数 -0.00031 9.920E-05-3.123 0.00243 km指数 7.799 2.843 2.742 0.00738 5 千 1-3.201 8.172-0.392 0.695 5 千 8 8.712 9.892 0.882 0.381 5 千 17 0.369 0.4757 0.771 0.439 1 万 1-4.512 3.784-1.194 0.235 1 万 4 2.553 4.387 0.583 0.561 1 万 17 2.815 2.398 1.175 0.242 ハーフ1 1.232 1.603 0.778 0.441 ハーフ8-1.313 2.533-0.510 0.606 ハーフ17-1.469 1.384-1.056 0.293 15

表 5 多重共線性の可能性がある説明変数を排除し 回帰分析を行った結果 回帰統計 重相関 R 0.758 重決定 R2 0.574 補正 R2 0.531 標準誤差 0.004 観測数 99 係数 標準誤差 t P- 値 切片 0.150 0.091 1.650 0.103 全日本 0.000018 0.00012 0.153 0.879 関東インカレ -0.000084 0.00008-1.120 0.266 山登り偏差値 -0.000301 0.00010-3.079 0.003 km指数 4.450 2.447 1.819 0.072 5 千 8 4.587 8.068 0.568 0.571 5 千 17 0.157 0.461 0.341 0.734 1 万 4 1.893 4.167 0.454 0.651 1 万 17 2.470 2.333 1.059 0.292 ハーフ1 0.036 1.332 0.027 0.979 16

全日本大学駅伝出雲駅伝 表 6 回帰分析をした結果の各モデルにおける補正 R2 の値 タイムデータ 補正 R2 タイムデータ 補正 R2 タイムデータ 補正 R2 km指数 0.551 km指数 0.551 km指数 0.537 5 千 1~3 0.496 5 千 1~3 0.491 5 千 1~5 0.504 5 千 1~7 0.515 5 千 4~7 0.518 5 千 6~10 0.510 5 千 1~12 0.547 5 千 8~12 0.532 5 千 11~15 0.514 5 千 1~16 0.547 5 千 13~16 0.533 5 千 16~20 0.480 5 千 1~20 0.550 5 千 17~20 0.482 1 万 1~5 0.483 1 万 1~3 0.485 1 万 1~3 0.485 1 万 6~10 0.545 1 万 1~7 0.509 1 万 4~7 0.529 1 万 11~15 0.550 1 万 1~12 0.559 1 万 8~12 0.560 1 万 16~20 0.507 1 万 1~16 0.559 1 万 13~16 0.548 ハーフ1~5 0.490 1 万 1~20 0.556 1 万 17~20 0.526 ハーフ 6~10 0.489 ハーフ1~3 0.494 ハーフ 1~3 0.494 ハーフ 11~15 0.486 ハーフ1~7 0.495 ハーフ 4~7 0.493 ハーフ 16~20 0.480 ハーフ1~12 0.495 ハーフ 8~12 0.494 ハーフ1~16 0.493 ハーフ 13~16 0.487 ハーフ1~20 0.491 ハーフ 17~20 0.483 タイムデータ 補正 R2 タイムデータ 補正 R2 タイムデータ 補正 R2 km指数 0.553 km指数 0.555 km指数 0.537 5 千 1~3 0.492 5 千 1~3 0.486 5 千 1~5 0.502 5 千 1~7 0.513 5 千 4~7 0.516 5 千 6~10 0.509 5 千 1~12 0.548 5 千 8~12 0.531 5 千 11~15 0.513 5 千 1~16 0.547 5 千 13~16 0.531 5 千 16~20 0.476 5 千 1~20 0.550 5 千 17~20 0.475 1 万 1~5 0.479 1 万 1~3 0.478 1 万 1~3 0.477 1 万 6~10 0.540 1 万 1~7 0.502 1 万 4~7 0.523 1 万 11~15 0.542 1 万 1~12 0.554 1 万 8~12 0.553 1 万 16~20 0.500 1 万 1~16 0.554 1 万 13~16 0.537 ハーフ1~5 0.485 1 万 1~20 0.550 1 万 17~20 0.515 ハーフ6~10 0.484 ハーフ1~3 0.487 ハーフ 1~3 0.486 ハーフ 11~15 0.480 ハーフ1~7 0.488 ハーフ 4~7 0.486 ハーフ 16~20 0.474 ハーフ1~12 0.488 ハーフ 8~12 0.486 ハーフ1~16 0.486 ハーフ 13~16 0.478 17

ハーフ1~20 0.486 ハーフ 17~20 0.474 表 7 10000m のチーム内 8 番手 ~12 番手の選手の平均タイムと全日本大学駅伝順位と山登り偏差値と関東インカレポイントを説明変数とし 箱根駅伝タイムを被説明変数とした重回帰分析を行った結果 回帰統計 重相関 R 0.761 重決定 R2 0.579 補正 R2 0.560 標準誤差 0.004 観測数 94 係数 標準誤差 t P- 値 切片 0.261 0.058 4.513 0.000020 全日本 0.000131 0.000107 1.219 0.226 1 万 8~12 11.031 2.738 4.029 0.000118 関東インカレ -0.000128 0.000071-1.796 0.076 山登り指数 -0.000340 0.000090-3.768 0.000295 18

表 8 第 89 箱根駅伝結果予想 ( 学連選抜は除く ) と結果 予想順位 大学 予想タイム 結果順位 大学 結果タイム 1 位 駒沢 11:02:15 1 位 日本体育大学 11.13.26 2 位 東洋 11:02:26 2 位 東洋大学 11.18.20 3 位 早稲田 11:08:25 3 位 駒沢大学 11.19.23 4 位 明治 11:10:20 4 位 帝京大学 11.21.39 5 位 日体大 11:11:21 5 位 早稲田大学 11.21.39 6 位 山学 11:12:25 6 位 順天堂大学 11.24.43 7 位 青学 11:13:33 7 位 明治大学 11.25.14 8 位 農大 11:16:04 8 位 青山学院大学 11.25.59 9 位 中央 11:16:06 9 位 法政大学 11.26.40 10 位 城西 11:16:07 10 位 中央学院大学 11.27.34 11 位 日大 11:16:17 11 位 山梨学院大学 11.28.24 12 位 中学 11:19:39 12 位 大東文化大学 11.30.46 13 位 上武 11:20:11 13 位 関東学連選抜 11.30.46 14 位 順天 11:20:40 14 位 國學院大学 11.33.28 15 位 帝京 11:21:22 15 位 日本大学 11.35.23 16 位 國學院 11:21:44 16 位 神奈川大学 11.37.36 17 位 大東 11:22:42 17 位 東京農業大学 11.39.13 18 位 神奈川 11:23:04 18 位 上武大学 11.42.44 19 位 法政 11:26:59 棄権 中央大学 - 棄権 城西大学 - 19