調査統計法 ( 杉浦 ) 第 1 回 オリエンテーション
( 自己紹介 ) 京都警察 ~ 大和総研を経て独立 ユニクロやソフトバンクなどで IT マーケティングやデータ分析を支援
1 調査統計法で何を学ぶのか - 学術研究でもビジネスでも必要となるデータ分析の知識 - なぜ 統計学が最強の学問なのか? http://diamond.jp/articles/-/52085 エビデンスベースドメディスン (EBM) 現代医学では大御所の意見や生物学的なロジックよりも統計学的な実証研究の成果を最重要視する 科学的根拠に基づく医療 が必要とされている
1 調査統計法で何を学ぶのか - 学術研究でもビジネスでも必要となるデータ分析の知識 - Kaizen Platform https://kaizenplatform.com/ja/ オバマ大統領のランディグページは一番左のものが 10% 効果が高く ボタンは赤のほうが 30% 効果が高くなった http://www.find-job.net/startup/growth-hack-method-of-kaizen
2 調査統計法の講義計画 - 調査統計手法の基礎から実践 応用まで - 第 1 回 : オリエンテーション ( 調査統計手法の概要 ) 第 2 回 : 調査統計手法の基礎 ( 記述統計 ) 第 3 回 : 調査統計手法の基礎 ( 相関回帰 ) 第 4 回 : 調査統計手法の基礎 ( 多変量解析 ) 第 5 回 : 調査統計手法の実践 (Web アクセス解析 ) 第 6 回 : 調査統計手法の実践 ( 需要予測 ) 第 7 回 : 調査統計手法の実践 ( 顧客満足度調査 ) 第 8 回 : 調査統計手法の実習 ( 統計処理ソフトウェア SPSS の使い方 ) 第 9 回 : 調査統計手法の実習 ( 統計処理ソフトウェア EasyR の使い方 ) 第 10 回 : 調査統計手法の演習 ( アンケート調査の企画 ) 第 11 回 : 調査統計手法の演習 ( アンケート調査の設計 / 質問紙作成 ) 第 12 回 : 調査統計手法の演習 ( アンケート調査の実施 / 収集 入力 ) 第 13 回 : 調査統計手法の演習 ( アンケート調査の実施 / 集計 ) 第 14 回 : 調査統計手法の演習 ( アンケート調査の実施 / 分析 ) 第 15 回 : 調査統計手法の演習 ( アンケート調査の実施 / 評価 ) 成績評価では出席と授業の姿勢 態度を重視します 第 2 回から第 7 回までの内容で小レポートを 2 回実施します 第 10 回から第 15 回までの演習内容を期末レポートとして提出してもらいます 真面目に授業に出ていれば小レポートも期末レポートも難しくありません レジュメ及びサンプルデータは講師 Web サイトトップページ下部のリンクからダウンロードできます
3 参考書 参考 Web サイト - 苦手意識がある人やもっと勉強したい人に - < 参考書 > 1 わかりやすい統計学の参考書 統計学 Ⅰ データ分析の基礎オフィシャルスタディノート ( 日本統計学会 ) 統計学 Ⅱ 推測統計の方法オフィシャルスタディノート ( 日本統計学会 ) 2SPSS の使い方 アンケート演習の参考書 SPSS でやさしく学ぶアンケート処理 ( 東京図書石村貞夫他著 ) 3 ビジネスでよく使われている R の参考書 フリー統計ソフト EZR(EasyR) で誰でも簡単統計解析 ( 南江堂神田義伸著 ) 4 実践的なデータ分析事例の参考書 消費を見抜くマーケティング実践講座 ( 翔泳社 杉浦 司著 ) < 参考 Web サイト > 1 統計学の参考 Webサイト ハンバーガー統計学にようこそ! http://kogolab.chillout.jp/elearn/hamburger/ アイスクリーム統計学にようこそ! http://kogolab.chillout.jp/elearn/icecream/index.html 2SPSSの参考 Webサイト SPSSによる統計的データ解析入門 http://www.juen.ac.jp/lab/okumura/resume4/ SPSSの使い方 http://www2.kokugakuin.ac.jp/~ogiso/spss/ SPSS 講座 http://www.u-gakugei.ac.jp/~kishilab/spssindex.htm
- 調査統計手法の基礎 ( 記述統計 )- 600 500 400 300 200 100 0 No.1 No.2 No.3 No.4 No.5 No.6 No.7 No.8 No.9 No.10 合計 600 500 400 300 200 100 0 No.1 No.2 No.3 No.4 No.5 No.6 No.7 No.8 No.9 No.10 合計 合計関数によって起きる情報欠落の例 ( どちらも合計は 500 になる )
- 調査統計手法の基礎 ( 記述統計 )- 1 世帯 (2 人以上 ) の平均貯蓄額は 1,101 万円 ( 金融広報中央委員会調べ 2013 年 *) 2 人以上世帯の貯蓄額の平均値 :1,739 万円 2 人以上世帯の貯蓄額の中央値 :1,023 万円勤労者世帯に限った平均値 :1,244 万円勤労者世帯に限った中央値 :735 万円 貯蓄額が 0 円 100 万円 2000 万円の 3 人がいた場合 中央値は 100 万円だが 平均値は貯蓄の高い人に引きずられて 700 万円になってしまう http://kstat.sakura.ne.jp/ medical/med_004.htm データの要約には注意が必要 合計や平均だけでなく バラツキ ( 分散や標準偏差 ) を知ることが大切!
- 調査統計手法の基礎 ( 相関 )- < 注意 > 疑似相関に騙されるな! http://mcn-www.jwu.ac.jp/~kuto/kogo_lab/ psi-home/stat2000/data/09/03.htm ではこれは?
- 調査統計手法の基礎 ( 回帰 )- Excel 散布図では最も当てはまりのよい線の引き方を教えてくれる http://miku.motion.ne.jp/multi/ 01_MinSquare.html < 注意 > 相関関係がみられても回帰 ( 因果関係 ) するとは限らない! 事故多発注意の看板がある場所では事故が多発する? 事故が多発するから看板が設置されただけ!( 因果関係が逆 )
- 調査統計手法の基礎 ( 多変量解析 )- 場所 売上高 ( 百万円 ) 乗降客数 ( 万人 ) 駐車台数 ( 台 ) 取扱品目数 ( 品目 ) 小田原 272 245 60 290 秦野 161 118 35 146 伊勢原 129 142 30 101 本厚木 252 249 45 224 海老名 204 174 40 172 藤沢 168 202 35 85 大和 242 254 45 172 相模大野 169 168 40 152 町田 224 224 50 158 新百合ケ丘 202 186 45 168 成城学園前 259 212 50 285 経堂 165 145 30 103 下北沢 180 174 35 106 梅ケ丘 131 82 30 162 代々木上原 215 177 40 192 概要 回帰統計 重相関 R 0.97434289 重決定 R2 0.94934407 補正 R2 0.93552881 標準誤差 11.5240307 観測数 15 売上高 ( 百万円 )=28.54+0.55 最寄駅での乗降客数 ( 万人 ) +0.2 駐車台数 ( 台 )+0.36 取扱品目数 ( 品目 ) 分散分析表 自由度 変動 分散 測された分散有意 F 回帰 3 27377.5639 9125.85463 68.71709 2.07E-07 残差 11 1460.83611 132.803283 合計 14 28838.4 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 切片 28.5409165 16.1378989 1.76856459 0.104651-6.97838 64.06021-6.97838 64.06021 乗降客数 ( 万人 ) 0.55209428 0.11221818 4.91982931 0.000457 0.305104 0.799085 0.305104 0.799085 駐車台数 ( 台 ) 0.20194949 0.96046139 0.210263 0.837306-1.91201 2.315912-1.91201 2.315912 取扱品目数 ( 品目 ) 0.35863816 0.09526135 3.76478153 0.003129 0.148969 0.568307 0.148969 0.568307 二変量の回帰分析 単回帰 多変量の回帰分析 重回帰
- 調査統計手法の実践 (Web アクセス解析 )- http://www.powerweb.co.jp/column/ google-analytics-20140611.html
- 調査統計手法の実践 ( 需要予測 : 移動平均法と指数平滑法 )- 移動平均法は単純な変動のパターンを繰り返すデータに対して有効な分析手法 例えば 1 ヶ月の日次データの場合 移動平均値の区間を 7 日とするとそれぞれの日次データの前後 7 日間の合計を 7 で割った数値が移動平均値となる 移動平均により曜日に関わる変動が平準化されるので 1 ヶ月間の全体的な傾向を分析するのに利用できる 指数平滑法は当期の値に平滑化定数を掛け これに前期の値と (1- 平滑化定数 ) を掛けたものを加算する 平滑化定数を小さく設定するほど 指数平滑値はなだらかな線を描き 1 に近づけるほど原データとの差が少なくなる https://software.ssri.co.jp/ex/all.html
- 調査統計手法の実践 ( 需要予測 : 数量化 Ⅰ 類による重回帰分析 )- ビールの売上と広告効果 日付 8/1 月 8/2 火 8/3 水 8/4 木 8/5 金 8/6 土 8/7 日 一日当たりの売上数量 412 741 1021 666 447 678 1677 チラシ広告 ケース前宣伝 温度 30 32 32 28 28 26 33 日付 8/8 月 8/9 火 8/10 水 8/11 木 8/12 金 8/13 土 8/14 日 一日当たりの売上数量 319 218 263 1335 942 916 732 チラシ広告 ケース前宣伝 温度 27 26 26 34 29 30 30 日付 8/15 月 8/16 火 8/17 水 8/18 木 8/19 金 8/20 土 8/21 日 一日当たりの売上数量 770 552 263 268 508 811 283 チラシ広告 ケース前宣伝 温度 31 30 26 25 25 28 30 出典 事例でわかるパソコンデータ分析入門回帰分析偏 小幡卓 堀合啓一著技術評論社 回帰統計 重相関 R 0.902014 重決定 R2 0.81363 補正 R2 0.661145 標準誤差 220.7629 観測数 21 分散分析表 自由度 変動 分散 測された分散有意 F 回帰 9 2340430 260047.8 5.335819 0.005791 残差 11 536098.8 48736.26 合計 20 2876529 一日当たりの売上数量 日付 火 水 木 金 土 日 チラシ広告 ケース前宣伝 温度 412 8 月 1 日 0 0 0 0 0 0 0 0 30 741 8 月 2 日 1 0 0 0 0 0 0 1 32 1021 8 月 3 日 0 1 0 0 0 0 1 0 32 666 8 月 4 日 0 0 1 0 0 0 1 0 28 447 8 月 5 日 0 0 0 1 0 0 0 1 28 678 8 月 6 日 0 0 0 0 1 0 1 0 26 1677 8 月 7 日 0 0 0 0 0 1 1 0 33 319 8 月 8 日 0 0 0 0 0 0 0 1 27 218 8 月 9 日 1 0 0 0 0 0 0 0 26 263 8 月 10 日 0 1 0 0 0 0 0 0 26 1335 8 月 11 日 0 0 1 0 0 0 0 0 34 942 8 月 12 日 0 0 0 1 0 0 1 1 29 916 8 月 13 日 0 0 0 0 1 0 1 0 30 732 8 月 14 日 0 0 0 0 0 1 0 0 30 770 8 月 15 日 0 0 0 0 0 0 1 0 31 552 8 月 16 日 1 0 0 0 0 0 0 1 30 263 8 月 17 日 0 1 0 0 0 0 0 0 26 268 8 月 18 日 0 0 1 0 0 0 0 0 25 508 8 月 19 日 0 0 0 1 0 0 1 0 25 811 8 月 20 日 0 0 0 0 1 0 1 0 28 283 8 月 21 日 0 0 0 0 0 1 1 1 30 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 切片 -2974.97 627.8087-4.73866 0.000611-4356.77-1593.17-4356.77-1593.17 火 117.7526 189.1972 0.62238 0.546377-298.668 534.173-298.668 534.173 水 96.52729 187.0462 0.516061 0.616026-315.159 508.2134-315.159 508.2134 木 217.2504 185.8696 1.168832 0.267178-191.846 626.3469-191.846 626.3469 金 414.9295 201.1858 2.062419 0.063599-27.8777 857.7368-27.8777 857.7368 土 311.1504 205.5251 1.513929 0.158235-141.208 763.5083-141.208 763.5083 日 161.4056 186.3516 0.866135 0.404912-248.752 571.5629-248.752 571.5629 チラシ広告 107.0654 126.4925 0.846417 0.415355-171.343 385.4737-171.343 385.4737 ケース前宣伝 -236.192 137.9945-1.71161 0.114982-539.916 67.53149-539.916 67.53149 温度 119.9436 21.49808 5.579268 0.000165 72.62659 167.2606 72.62659 167.2606 一日当たりの売上数量 = -2975+0 月曜日 +118 火曜日 +97 水曜日 +217 木曜日 +415 金曜日 +311 土曜日 +161 日曜日 +107 チラシ広告 +-236 ケース前宣伝 +120 温度
- 調査統計手法の実践 ( 顧客満足度調査 : アンケート )-
- 調査統計手法の実践 ( 統計解析 : 因子分析 )- 学生の授業評価視点に関する因子分析和歌山大学 教育学部 https://most-keep.jp/keep25/toolkit/html/ snapshot.php?id=501331882086892
- 調査統計手法の実習 ( 統計処理ソフトウェア SPSS の使い方 )- オシャレと衛生の男女差に有意性あり整理整頓の差には有意性なし t 検定による男女差の検討 http://psy.isc.chubu.ac.jp/~oshiolab/teaching_folder/data_b/02/06.html#01
- 調査統計手法の実習 ( 統計処理ソフトウェア EasyR の使い方 )- 統計ソフト R の使い方 https://sites.google.com/site/webtextofr/basics 自治医科大学附属さいたま医療センターフリー統計ソフト EZR(Easy R) http://www.jichi.ac.jp/saitamasct/saitamahp.files/statmed.html
- 調査統計手法の演習 ( アンケート調査 )- 調査表の作成 アンケート結果の入力 回答者把握 ( グラフ ) クロス集計 相関 独立性分析 因子分析