1 夏季五輪の メダル獲得要因はなにか 富山大学経済学部 山田ゼミ
発表の流れ 2 1. イントロダクション ~ QUIZ TOKYO 2020 ~ 2. 研究内容 研究方法の紹介 3. 分析結果 重回帰分析を用いた分析 ダミー変数の導入による分析 4. 考察 推測
研究の動機なぜこの研究をしようと思ったか 3 東京五輪の開催 メダル獲得数の分析への興味 統計学で学習した分析方法の利用
夏季五輪での日本のメダル獲得数の推移 4 16 11 13 9 10 4 3 3 5 16 9 7 12 5 7 8 6 8 3 8 6 8 9 7 14 8 8 7 8 10 14 7 11 5 5 12 9 17 21 0 5 10 15 20 25 30 35 40 45 金銀銅
2016 年リオ五輪での各国のメダル獲得数 5 0 20 40 60 80 100 120 140 アメリカ中国イギリスロシアドイツフランス日本オーストラリアイタリアカナダ韓国オランダブラジルニュージーランドアゼルバイジャンスペインカザフスタンハンガリーデンマークケニアウズベキスタンジャマイカキューバスウェーデンウクライナポーランドクロアチア南アフリカチェコベラルーシコロンビアイランセルビアトルコエチオピアスイス北朝鮮ジョージアギリシャベルギータイルーマニアマレーシアメキシコアルゼンチンスロバキアアルメニアスロベニアリトアニアノルウェーインドネシア台湾ブルガリアベネズエラエジプトチュニジアメダル獲得数は国によってばらつきがある!
研究内容 6 五輪におけるメダル獲得数には国ごとにばらつきがある どんな国がより多くのメダルを獲得しているのだろうか メダル獲得数と関係の深い要素は何だろうか
仮説分析を始める前に 7 メダル獲得数に影響を与える要因は多数あると考える ここでは以下のメダル獲得要因を挙げて検証する 人口 実質 GDP 出場選手数 / 人口 平均身長 開催国との平均気温 (8 月 ) の差 人口増加率 開催国との距離 経済成長率 腐敗認識度 (CPI) 平均寿命
仮説メダル獲得要因とした理由 8 メダル獲得要因と関係の深そうなデータを選んだ 人口 : 人口が多い国が強いイメージ スター選手が生まれる可能性が高いのでは? 実質 GDP:GDP の高さは国の豊かさを示すイメージがあるから スポーツにも力を入れているのでは? 出場選手数 / 人口 : 人口に対する選手数が多ければメダル獲得数が 多いのも当然では?
仮説メダル獲得要因とした理由 9 平均身長 : 背の高い人の方が有利な競技が多いのでは? 開催国との平均気温 (8 月 ) の差 : 気温差が大きいと選手の体調などに影響があるのでは? 開催国との距離 : 気温差同様 環境や文化の違いが選手に与える影響が 大きいのでは?
仮説メダル獲得要因とした理由 10 経済成長率 _( 当期 GDP 前期 GDP)/ 前期 GDP : 経済成長が大きい国は 経済的余裕が増し スポーツに力を入れるようになるのでは? 腐敗認識指数 (CPI)_ 公務員と政治家がどの程度腐敗していると認識されるか : 国への信頼度が測れる指数だから国民の愛国心がわかるのでは? 平均寿命 : 健康の度合い 医療の発達レベルがわかるはず 寿命が長いほどメダル獲得数が多いのでは?
研究方法どうやって分析を進めていくか 11 回帰分析の実施 重回帰分析 ダミー変数などを用いて分析を行う ( 例 ) 目的変数 = メダル獲得数 説明変数 = メダル獲得要因 とし それらの関係を分析する 分析結果から 夏季五輪での獲得メダル数と関係の深い要素を考える 回帰分析とは? ある変数の変動を別の変数の変動により 説明 予測 影響関係を検討するための手法
データについてどのようなデータを分析に使うか 12 過去 5 回の夏季オリンピックを研究の対象とする (2016 年リオ五輪 2012 年ロンドン五輪 2008 年北京五輪 2004 年アテネ五輪 2000 年シドニー五輪 ) 以下の G20 の国をこの研究の対象国とする 日本アメリカイギリスフランスドイツイタリアカナダ トルコアルゼンチンロシアメキシコ韓国中国サウジアラビア インドインドネシアオーストラリアブラジル南アフリカ
分析結果 2016 年リオ五輪 13 回帰統計 重相関 R 0.9650097 係数 t P- 値 人口 -8.64E-06-0.698311 0.5047714 重決定 R2 0.9312437 補正 R2 0.8452982 GDP 5.377E-06 5.8119517 0.0003997 出場選手数 / 人口 1019.7156 0.8150377 0.4386391 平均気温 1.2549503 1.2277539 0.2544361 平均身長 0.940939 0.8907992 0.3990341 開催国との距離 0.0006816 0.7758971 0.46013 人口増加率 -1928.428-2.35321 0.0464479 経済成長率 -171.867-2.101186 0.0688104 腐敗認識度 3.8961949 1.4943825 0.1734329 平均寿命 -1.439331-1.633662 0.1409716
分析結果 2012 年ロンドン五輪 14 回帰統計 係数 t P- 値 重相関 R 0.9567993 重決定 R2 0.9154648 補正 R2 0.8097959 人口 -1.03E-05-0.76821 0.4644326 GDP 7.476E-06 4.645766 0.0016538 出場選手数 / 人口 4099.304 2.3659724 0.0455318 平均気温 -0.528965-0.56631 0.5867137 平均身長 -0.725424-0.481986 0.6427257 開催国との距離 -0.003098-2.152829 0.0634949 人口増加率 -1662.201-2.584538 0.0323869 経済成長率 160.47045 2.2943185 0.0509204 腐敗認識度 -2.93161-0.867117 0.4111304 平均寿命 -1.287339-1.549312 0.1599003
分析結果 2008 年北京五輪 15 回帰統計 重相関 R 0.9526671 係数 t P- 値 人口 1.319E-05 1.0077248 0.3430906 重決定 R2 0.9075745 補正 R2 0.7920427 GDP 8.877E-06 5.5942092 0.0005137 出場選手数 / 人口 632.00206 0.3791994 0.7144067 平均気温 -2.618016-2.214597 0.0576661 平均身長 1.9779138 1.5903847 0.1504121 開催国との距離 -0.004006-2.904846 0.0197445 人口増加率 606.07652 0.7614325 0.4682481 経済成長率 37.784432 0.9212236 0.383873 腐敗認識度 -5.972941-1.642073 0.1392011 平均寿命 0.3286899 0.4436253 0.6690666
分析結果 2004 年アテネ五輪 16 回帰統計 係数 t P- 値 重相関 R 0.9427945 重決定 R2 0.8888615 補正 R2 0.7499383 人口 1.29E-05 0.990623 0.3508821 GDP 8.659E-06 3.2840366 0.0111206 出場選手数 / 人口 2563.299 1.8843376 0.0962611 平均気温 1.1273482 0.8805657 0.4042295 平均身長 0.1725599 0.0711035 0.9450608 開催国との距離 0.0005248 0.2827655 0.784535 人口増加率 -2040.674-3.27889 0.0112064 経済成長率 166.86333 1.4692046 0.1799711 腐敗認識度 -3.423472-1.106071 0.3008448 平均寿命 0.4399785 0.3658196 0.723984
分析結果 2000 年シドニー五輪 17 回帰統計 係数 t P- 値 重相関 R 0.9053385 重決定 R2 0.8196377 補正 R2 0.5941849 人口 3.865E-05 2.5517848 0.0340799 GDP 7.829E-06 2.9471483 0.0185062 出場選手数 / 人口 3239.4129 1.9679019 0.0846178 平均気温 -0.142222-0.158546 0.8779556 平均身長 1.258703 0.6348343 0.5432614 開催国との距離 0.0022567 1.0137496 0.3403775 人口増加率 -1659.204-1.987191 0.0821295 経済成長率 63.532213 1.3466647 0.2149932 腐敗認識度 -5.230708-1.339878 0.2170949 平均寿命 -0.687604-0.70831 0.498868
考察分析結果をふまえて 18 P- 値は それぞれの説明変数の係数の有意確率を表す 一般的に 有意確率が 0.1(10%) を下回っていると その説明変数は目的変数に対して 関係性がある という判断をする ここでは 有意水準を 0.1(10%) とする P- 値が 0.1 以下のものを有意とする
考察分析結果をふまえて 19 P- 値が 0.1 以下だった要素 (2016 年 ) GDP 人口増加率 経済成長率 (2012 年 ) GDP 出場選手数 / 人口 開催国との距離 人口増加率 経済成長率 (2008 年 ) GDP 平均気温 開催国との距離 (2004 年 ) GDP 出場選手数 / 人口 人口増加率 (2000 年 ) 人口 GDP 出場選手数 / 人口 人口増加率
推測なぜ GDP が高ければメダルが多いのか 20 高い GDP スポンサー企業 豊富なインフラ 資金援助 オリンピック誘致
分析結果の応用 21 GDP や人口増加率がメダル獲得数と関係しているとわかりましたね! オリンピックに使うお金は国ごとによって違うのかな ~ 他にも関係のある要素があるんじゃないかな ~ オリンピックの歴史を調べてみるのはどうかしら? 何か関係がありそうじゃない?
オリンピックの起源 22 < 古代オリンピック > 紀元前 776 年古代ギリシャの宗教儀式の一環の祭りとして開催紀元 393 年までの間に273 回も開催される 世界平和を目的としたスポーツの祭典を復活させよう!! 1500 年もの間オリンピックは開催されなかった < 近代オリンピック > 1896 年第 1 回オリンピックの開催 in アテネ ピエール ド クーベルタン男爵
夏季五輪の実施競技 ( リオ五輪 ) の発祥地 23 柔道 テコンドー 自転車 ホッケー サッカー レスリング アーチェリー ウエイトリフティング これらのスポーツの発祥地を知っていますか? ハンドボール バスケットボール 水泳 ボクシング ラグビー ヨット バドミントン ゴルフ トライアスロン ボート テニス カヌー 体操 馬術 バレーボール
夏季五輪の実施競技 ( リオ五輪 ) の発祥地 24 柔道 テコンドー 自転車 ホッケー サッカー レスリング アーチェリー ウエイトリフティング ハンドボール バスケットボール 水泳 ボクシング 発祥地の多くは欧米の国なんだね! オリンピックの起源とは関係があるのかな ~? ラグビー ヨット バドミントン ゴルフ トライアスロン ボート テニス カヌー 体操 馬術 バレーボール 赤字 : 発祥地が欧米の国
欧米諸国ダミーの導入 欧米諸国か否か はメダル獲得要因か 25 仮説 欧米諸国は夏季五輪に有利なのではないか 理由 オリンピックの歴史において 欧米諸国の影響が強いと考えられるから オリンピックの種目のほとんどが欧米諸国発祥であるから 欧米諸国か否か という要素を加味すれば より高い相関が得られるのでは? ダミー変数の設定 D=0 ( 欧米諸国である ) D=1 ( 欧米諸国でない )
ダミー変数とは 26 ダミー変数とは 数字でないデータを数字に変えて用いる手法である 数字でないデータを 0 と 1 だけの数列で表す 要因 A が存在する 要因 A が存在しない 値 (D)=0 をとる 値 (D)=1 をとる
分析結果ダミー変数導入後のデータ分析 27 回帰統計 係数 t P- 値 重相関 R 0.9754393 重決定 R2 0.9514819 補正 R2 0.8752392 人口 -1.52E-05-1.372925 0.2121396 GDP 9.956E-06 5.8645577 0.0006214 出場選手数 / 人口 2458.6303 1.5590096 0.1629567 平均気温 -3.565704-2.327535 0.0528052 平均身長 -0.969114-0.791998 0.4543594 開催国との距離 -0.005176-3.498194 0.0100174 人口増加率 247.78838 0.2511587 0.8089047 経済成長率 20.870915 0.2501875 0.8096263 腐敗認識度 -5.201503-1.785256 0.1173894 平均寿命 1.2692757 0.9704383 0.364157 欧米諸国ダミー 38.417528 2.2795622 0.0566728
考察ダミー変数導入後のデータ分析 28 2012 年ロンドン五輪では 欧米諸国か否か はメダル獲得数に有意であった しかし 他 4 回の五輪では 有意でなかった この研究では 欧米諸国か否か はメダル獲得要因とは認められなかった
強化費用とメダル数 29 仮説強化費用が高い国はメダル数が多いのではないか? 理由各国の強化費用 ( スポーツ関係予算 ) を調べることで 各国のスポーツに対する熱意がわかるのでは? しかし データを公表している国が少ない そこで 唯一データが見つかった 2008 年北京五輪の強化費用とメダル数の関係をグラフを示した
強化費用とメダル数 30 北京オリンピックにおける強化費用と獲得メダル数 相関係数 =0.373 120 アメリカ 獲得 100 80 中国 y = 0.0015x + 38.168 メダル数 60 40 20 日本 カナダ オーストラリア ドイツ 0 0 5000 10000 15000 20000 25000 30000 強化費用 ( 百万円 ) メダル数と強化費用には 正の相関があるといえる
強化費用とメダル数 31 GDP で規格化した強化費用と人口あたりのメダル数 相関係数 =0.826 人口百万人あたりのメダル数 2.5 2 1.5 1 0.5 0 日本 アメリカ カナダ 中国 ドイツ y = 157.37x + 0.0224 R² = 0.6828 オーストラリア 0 0.002 0.004 0.006 0.008 0.01 0.012 GDP あたりの強化費用 GDP あたりの強化費用と人口 100 万人あたりのメダル数には 正の相関があるといえる
まとめ 32 今回の研究では 夏季五輪におけるメダル獲得数は GDP や 人口増加率 と関係していることがわかった オリンピックの歴史や競技の発祥国も調べたが メダル獲得数との関連性が見られなかった 人口 100 万人あたりのメダル数と GDP あたりの強化費用には強い相関があった この研究を通して より東京五輪が楽しみになった
先行研究 参考文献 33 2014 年度中部経済学インターゼミ オリンピックから見えた経済格差 日本オリンピック委員会 https://www.joc.or.jp/ 国際オリンピック委員会 https://www.olympic.org/ GLOBAL NOTE ( 世界の各データ ) https://www.globalnote.jp/
参考文献 34 オリンピック国別メダル獲得数 https://entamedata.web.fc2.com/sports/olympic_medal.html 回帰分析とは https://kotobank.jp/word/%e5%9b%9e%e5%b8%b0%e5%88%86%e6%9e%90-2191 データ分析基礎知識重回帰分析 https://www.albert2005.co.jp/knowledge/statistics_analysis/multivariate_analysis/multiple_regression p 値 ( 有意確率 ) と有意水準アタリマエ! https://atarimae.biz/archives/12011