13章 回帰分析

Similar documents
13章 回帰分析

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - mstattext02.docx

1.民営化

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - Econometrics

基礎統計

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

横浜市環境科学研究所

Microsoft Word - reg.doc

回帰分析 単回帰

構造方程式モデリング Structural Equation Modeling (SEM)

Microsoft Word - econome5.docx

Microsoft Word - reg2.doc

測量士補 重要事項「標準偏差」

Microsoft Word - å“Ÿåłžå¸°173.docx

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

EBNと疫学

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

学習指導要領

スライド 1

tshaifu423

PowerPoint プレゼンテーション

データ解析

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft Word - SDA2012kadai07.doc

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

Microsoft Word - econome4.docx

経済統計分析1 イントロダクション

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft Word - 補論3.2

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

ビジネス統計 統計基礎とエクセル分析 正誤表

6. 消費関数と 乗数効果 経済統計分析 (2017 年度秋学期 )

Microsoft PowerPoint - ch03j

8 A B B B B B B B B B 175

Excelにおける回帰分析(最小二乗法)の手順と出力

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

統計的データ解析

様々なミクロ計量モデル†

Microsoft PowerPoint - Econometrics pptx

【補足資料】確率・統計の基礎知識

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

測量試補 重要事項

相関分析・偏相関分析

重回帰式 y= x x 2 重症度 5 TC TC 重症度

スライド タイトルなし

6. 消費関数と乗数効果 経済統計分析 (2014 年度秋学期 ) 消費関数 ( 統計分析手法 ) 回帰分析 ( 単回帰 重回帰 ) 最小二乗法 回帰分析の推定結果の読み取り方 回帰係数の意味 実績値 推定値 残差 決定係数 自由度修正済決定係数 説明変数の選択 外れ値 ( 異常値 ) の影響 推定

要約 鍋谷 (2007) では2001 年 ~2005 年の高校野球 プロ野球における各プレーの貢献度を 得点 勝敗を被説明変数 各プレーを説明変数とした重回帰モデル 2 項ロジットモデル 2 項プロビットモデルを用いて分析し 犠打 ( 犠牲バント 犠牲フライ ) は得点に対しては有意ではないが勝敗

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

Excelによるデータ分析

経済統計分析1 イントロダクション

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

景気指標の新しい動向

Probit , Mixed logit

Microsoft PowerPoint - Statistics[B]


Microsoft Word - Time Series Basic - Modeling.doc

PowerPoint プレゼンテーション

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

1

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A>

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft Word - appendix_b

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

経営統計学


314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション

確率・統計の基礎知識

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

回帰分析の重要な手続きは 次の 3 点にまとめられる 順に説明しよう ( 1) もっともよい線を引く ( 2) その線はどのくらいよい線であるかを評価する ( 3) 母集団についても同様の線を引く価値があるかどうかを判断する 概要をスライドで確認 テキスト p.99 の図が回帰分析の本質 実際のデー

プログラミング基礎

スライド 1

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

数値計算法

航空機の運動方程式

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft Word - NumericalComputation.docx

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft Word - Chap17

ベイズ統計入門

スライド 1

不偏推定量

0415

PowerPoint プレゼンテーション

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

カイ二乗フィット検定、パラメータの誤差

Transcription:

単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない

ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か?

最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える 回帰分析 この関係は 必ずしも 因果関係でなくてもよい 3

直近のデータを利用して予測する 時間的に先行する測定値から 遅れて観察される他の測定値を予測する 例 前日のニューヨーク市場の指数をもとに 東京市場の変動を予測する 例 人体の中で最も成長の早い部位で かつ身長と相関の深い量を測定して 最終的な身長を予測する 怪しい説である

収益率の相関係数行列 009 年 5

6

収益率の相関係数行列 008 年 7

8

収益率の相関係数行列 007 年 9

0

調査困難な量を推測する 調査するのに膨大な時間と経費のかかる量を 代替物の測定値をもとに推測する 精密調査法の代わりに 簡易検査法を用いる 例 体脂肪率を測定する 家庭にある体脂肪計を用いる 例 アルツハイマー病の診断 脳の中を調べる代わりに 脳脊髄を調べる

体脂肪率測定の場合 正確な測定 被説明変数 目的変数 体をスキャンして計算する. 水中体重測定法 空気置換法 により体の容積を測定する 生体インピーダンスを測定する 説明変数 予測式を立てる 身長 体重 年齢 性別なども考慮に入れる

アルツハイマー病の診断法 00/0/5 日経朝刊より 脳内にタンパク質断片 ペプチド の 種 アミロイド β が蓄積して発病する 病気の進行程度を目的 被説明 変数とし 脳脊髄の ALβ の濃度を説明変数とする 3

直線 =α+β とは? 4

直線 =α+β とは? 点 0 α を通る 傾き β の直線 5

直線 =+c- とは? c 6

直線 =+c- とは? c c 点, を通る傾き c の直線 7

直線 =α+β を回帰直線と考える とき 8

直線 =α+β を回帰直線と考える とき *, } * 観測値には誤差が加わっている 9

直線 =α+β を回帰直線と考えるときの観測値の得られ方 3 0

直線 =α+β を回帰直線と考える ときの観測値の得られ方, 3, 3

回帰直線 =α+β は未知である

回帰直線 =α+β は未知である データから推定するしかない 直線であるという保証もない 3

直線 =α+β の推定法.5 上の式を最小にするように α と β を決める 最小 乗法により決めるとも言う.6 SSE 上の Sum of Squred Error を最少化するとも考えられる 4

回帰直線 =α+β の推定法 図解 5

回帰直線 =α+β の推定法 図解 赤線の長さの 乗和を最小にする を求めよう 6

最小 乗推定値の公式結果を先に示す.7.8 ここで, 7

回帰直線とは 8

回帰直線とは 9 傾きの直線を通る,

回帰分析の実習 30

散布図を描く 3

散布図 相関図 を完成させよ う データ点に 番号をつける 5 3 4 3

平均と平均からの偏差を求める 67 7 48 56 7 7 54 56 33

分散 共分散の計算 5 5 8 64 5 8 40 0 0 4 0 0 68 3.6 90 38 9 8.4 34

回帰直線の切片と傾き 8.4 3.6 9 68.35 56.3576 76.7 8.4 3.638 0.8 相関係数 35

回帰直線を描き込む 56.35 7 3.5 4 5 3 0 36

残差とは? 実際の観測値と推定値との差を残差と呼ぶ 37

ˆ e 残差とは? 実際の観測値と推定値との差を残差と呼ぶ } { e 38, e ˆ

残差プロット 軸に残差をとったものを残差プロットと呼ぶ 39

残差プロット 軸に残差をとったものを残差プロットと呼ぶ ˆ, e e 40

残差の計算と残差プロット 6.00 4.00.00 0.00 -.00 65 70 75 80-4.00-6.00 4

残差の計算と残差プロット 6.00 56 0 4.00.00 0.00 -.00 65 70 75 80-4.00-6.00 4

残差の和と残差の平方和 残差の総和は 0 である 43 e ee e e e e 0 当然のことだが 残差の平均も 0 である 残差の分散は 下のように表される 0

残差について考える この場合は 身長の影響を取り除いた体重と考えてよい 残差がプラスの場合 身長の割に重いと言える 残差は 身長以外の他の要素で説明されるかもしれない 44

残差分散 ˆ 45 ee ˆ

残差平方和と相関係数の関係 r : 相関係数 ee r 相関係数が に近いほど 残差平方和は小さくなる つまり 推定精度が高い r : 回帰の決定係数という r あるいは r あるいは R と書く 46

残差平方和の計算 ee r 38 0.8 38 6.6 ee 3. 3.6 47

3 決定係数 r r : 相関係数 : 回帰の決定係数という 決定係数は相関係数を 乗したものであるが その他にもさまざまな方法で性格づけができる 48

決定係数の意味 小さな相関 図を書いてみる ee r 49 ee e S

決定係数の意味 小さな相関 ee e 図を書いてみる e e e ee S r 相関係数が小さければ 残差分散は小さくならない 50

決定係数の意味 大きな相関 図を書いてみる ee r 5 ee e S

決定係数の意味 大きな相関 図を書いてみる ee r 5 ee e S 相関係数が大きければ 残差分散は小さくなる

以上が第一回目 第二回目は 身長体重データ 0 名 を使って復習する 決定係数の意味を説明する 決定係数とは 回帰直線により説明できた割合を言う 53

の変動の分解と決定係数 ˆ ˆ, ˆ 54

の変動の分解と決定係数 残差 : 回帰直線では説明しきれない部分 e ˆ ˆ ˆ, ˆ ˆ 平均からの偏差 回帰直線で説明できる部分 55

の全変動 平均からの変動, 56

の全変動 平均からの変動, 平均からの偏差 57

回帰で説明されない変動 残差 58, ˆ e ˆ ˆ e ˆ

回帰で説明されない変動 残差 ˆ e, ˆ e ˆ 残差 ˆ 59

回帰で説明される変動 ˆ, ˆ ˆ 60

回帰で説明される変動 ˆ, ˆ ˆ 説明できた部分 6

決定係数のもう一つの意味 ˆ ˆ 両辺を で割ると ˆ ˆ 6

決定係数のもう一つの意味 計算すれば この等式が成り立つことが分かる ˆ ˆ 両辺を で割ると ˆ ˆ この部分をR と呼ぶ. 63

決定係数の意味 さらに ˆ ˆ R ˆ R e 64

決定係数の意味 さらに ˆ ˆ R ˆ R e 65

決定係数のまとめ ee R r r R ˆ e R 66

決定係数は 全変動のうち回帰で説明できる割合である 決定係数のまとめ ee R r r R ˆ 決定係数は 相関係数の 乗である R e 決定係数は 全変動のから回帰で説明できなかった部分を除いた割合である 67

プロ野球 J 68

犯罪率と死亡 率の関係 犯罪率が上がると 死亡率が下がると考えて良いのだろうか? 69

人口構成比の内 0 34 歳人口に注目してみる 70

死亡率と犯罪率から 0 34 歳人口の影響を取り除いた残差の相関係数を求めてみる 7

最小 乗推定値の求め方 難 7 } { } {

最小 乗推定値の求め方 難 } { 0 73

最小 乗推定値の求め方 3 難 のとき 0 になる. 74 この部分を最小にするように を決める

最小 乗推定値の求め方 4 難 のとき最小となる 75

決定係数とは 難 ˆ 76 { ˆ ˆ } ˆ ˆ ˆ ˆ 0 } }{ { ˆ ˆ 0 なぜなら

全変動 決定係数とは 3 回帰からの変動 難 回帰による変動 ˆ ˆ ˆ ˆ { } ˆ 決定係数 :R 全変動のうち 回帰による変動の占める割 合 77

決定係数とは 4 難 78 ˆ ˆ e R R ˆ 相関係数の 乗この表現が後に重要になる