回帰分析 単回帰

Similar documents
回帰分析 重回帰(1)

スライド 1

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

201711grade2.pdf

13章 回帰分析

Microsoft Word - reg.doc

Microsoft Word - reg2.doc

1.民営化

回帰分析 重回帰(3)

DAA09

Microsoft PowerPoint - 資料04 重回帰分析.ppt

(lm) lm AIC 2 / 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

経済統計分析1 イントロダクション

Microsoft PowerPoint - ch03j

R による共和分分析 1. 共和分分析を行う 1.1 パッケージ urca インスツールする 共和分分析をするために R のパッケージ urca をインスツールする パッケージとは通常の R には含まれていない 追加的な R のコマンドの集まりのようなものである R には追加的に 600 以上のパッ

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A>

操作変数法

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

Microsoft Word - 計量研修テキスト_第5版).doc

J1順位と得点者数の関係分析

Excelにおける回帰分析(最小二乗法)の手順と出力

Medical3

第11回:線形回帰モデルのOLS推定

回帰分析 重回帰(2)

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

と入力する すると最初の 25 行が表示される 1 行目は変数の名前であり 2 列目は企業番号 (1,,10),3 列目は西暦 (1935,,1954) を表している ( 他のパネルデータを分析する際もデ ータをこのように並べておかなくてはならない つまりまず i=1 を固定し i=1 の t に関

Microsoft Word - 計量研修テキスト_第5版).doc

最小2乗法

統計的データ解析

6. 消費関数と 乗数効果 経済統計分析 (2017 年度秋学期 )

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

1

untitled

データ解析

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

Use R

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

E-Views 簡単な使い方

Microsoft Word - mstattext02.docx

6. 消費関数と乗数効果 経済統計分析 (2014 年度秋学期 ) 消費関数 ( 統計分析手法 ) 回帰分析 ( 単回帰 重回帰 ) 最小二乗法 回帰分析の推定結果の読み取り方 回帰係数の意味 実績値 推定値 残差 決定係数 自由度修正済決定係数 説明変数の選択 外れ値 ( 異常値 ) の影響 推定

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

1 15 R Part : website:

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

基礎統計

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

tshaifu423

Microsoft PowerPoint - Econometrics

様々なミクロ計量モデル†

13章 回帰分析

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - Econometrics pptx

Microsoft Word - 計量研修テキスト_第5版).doc

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

Microsoft Word - 計量研修テキスト_第5版).doc

今日の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか


Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

まず y t を定数項だけに回帰する > levelmod = lm(topixrate~1) 次にこの出力を使って先ほどのレジームスイッチングモデルを推定する 以下のように入力する > levelswmod = msmfit(levelmod,k=,p=0,sw=c(t,t)) ここで k はレジ

Microsoft Word - 計量研修テキスト_第5版).doc

4 OLS 4 OLS 4.1 nurseries dual c dual i = c + βnurseries i + ε i (1) 1. OLS Workfile Quick - Estimate Equation OK Equation specification dual c nurser

Microsoft Word - econome4.docx

PowerPoint プレゼンテーション

Microsoft Word - econome5.docx

以下の内容について説明する 1. VAR モデル推定する 2. VAR モデルを用いて予測する 3. グレンジャーの因果性を検定する 4. インパルス応答関数を描く 1. VAR モデルを推定する ここでは VAR(p) モデル : R による時系列分析の方法 2 y t = c + Φ 1 y t

28

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

スライド タイトルなし

R John Fox R R R Console library(rcmdr) Rcmdr R GUI Windows R R SDI *1 R Console R 1 2 Windows XP Windows * 2 R R Console R ˆ R

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - 教育経済学:課題1.docx

Microsoft PowerPoint - Econometrics

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - eviews6_

情報工学概論

Microsoft Word - eviews1_

第7章

サーバに関するヘドニック回帰式(再推計結果)

kubostat2017j p.2 CSV CSV (!) d2.csv d2.csv,, 286,0,A 85,0,B 378,1,A 148,1,B ( :27 ) 10/ 51 kubostat2017j (

数値計算法

Microsoft PowerPoint - Econometrics

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

第2回 回帰と分散分析

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

計量経済分析 2011 年度夏学期期末試験 担当 : 別所俊一郎 以下のすべてに答えなさい. 回答は日本語か英語でおこなうこと. 1. 次のそれぞれの記述が正しいかどうか判定し, 誤りである場合には理由, あるいはより適切な 記述はどのようなものかを述べなさい. (1) You have to wo

Microsoft Word - å“Ÿåłžå¸°173.docx

横浜市環境科学研究所

EBNと疫学

Chapter 1 Epidemiological Terminology

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft Word - SDA2012kadai07.doc

インターネットを活用した経済分析 - フリーソフト Rを使おう

不均一分散最小二乗法の仮定では 想定しているモデルの誤差が時間やサンプルを通じて一定であるとしている 次のような式を想定する 誤差項である ut の散らばり具合がサンプルを通じて一定であるという仮定である この仮定は均一分散と呼ばれる 不均一分散とは その仮定が満たされない場合で 推計した係数の分散

Transcription:

回帰分析 単回帰 麻生良文

単回帰モデル simple regression model = α + β + u 従属変数 (dependent variable) 被説明変数 (eplained variable) 独立変数 (independent variable) 説明変数 (eplanator variable) u 誤差項 (error term) 撹乱項 (disturbance term) 他の要因, 観察されない変数の影響, の測定誤差

= α + β + u 左のようなモデルを仮定し, 現実に観察されたデータから, パラメータ a,b を推計する 直線を当てはめる 推計された a,b 当てはめられた直線の切片と傾き 傾き が 1 単位増加したとき は何単位増加するか

重回帰モデル multiple regression model 説明変数が 2 個以上 a b 1 1 b 2 2 b k k u b i i 他の説明変数を一定に保っておいて, i だけを 1 単位増加させたときに が何単位増えるか 他の要因をコントロールした i 固有の影響

単回帰モデルにおける仮定 i a b i u i 1. 線型モデル ( パラメータに関し ) 2. 誤差項の期待値は0 3. 誤差項は互いに独立 4. 誤差項の分散は一定 ( 分散均一性 ) 5. 誤差項は正規分布に従う BLUEの成立のためにはこの条件は不要

最小二乗法 残差平方和を最小にするようにパラメータを決定 a,b: 未知パラメータ a,b の推定値 e: 残差 S( a, b) n i1 e 2 i n i a bi i1 2 1 階の条件 S a S 0, b 0 2 本の方程式から a,b を決定する

最小二乗推定量 b a S S b 1 S n i1 ( i ) i 誤差項の分散の推定量 s 2 1 RSS n 2 SER (standard error of the regression) 1 n 2 n i1 2 e i n-2 の 2 は説明変数の個数 ( 定数項と ) 最小二乗推定量は BLUE (Best Linear Unbiased Estimator) という望ましい性質を持っている

Eviews での回帰分析 メニューから Quick/Estimate Equation 下の画面が表れる 被説明変数, 説明変数をスペースで区切って並べる c は定数項 (constant term) 最小二乗法の指定 ( 他にも推定方法の option あり ) 分析に用いるサンプルを指定することもできる

R での回帰分析 データの import, load ここでは wage1.csv を用いる データ フレーム wage1 に import されているとして ---------------- >attach(wage1) > wage1.lm <- lm(wage ~ educ) > summar(wage1.lm) ------------------ attach(wage1) で wage1 データセット内の変数に直接アクセスできるようにする lm( ~ 1 + 2 + 3 ) 回帰分析 wage1.lm に回帰分析の結果を代入し,summar( ) で結果の要約を表示

仮説の検定 H 0 : b=b 0 b b 2 S ~ N 0,1 b b b b 0 0 ~ tn s. e.( b) 2 s S 2 n 2 : 2 は説明変数の個数 ( 定数項と )

当てはまりの良さ TSS=ESS+RSS 決定係数 0から1の間の値 1に近いほど当てはまりが良いことを表す R 2 ESS 1 TSS RSS TSS

Eviews の出力 回帰係数

WAGE wage と educ の散布図 30 25 20 15 10 5 0 0 4 8 12 16 20 EDUC

RESID 残差のプロット 20 16 Eviews では resid という変数に直前の回帰分析の残差が保存される 12 8 4 0-4 -8 0 4 8 12 16 20 EDUC 残差を検討することで回帰分析の前提 ( 分散均一性 ) が満たされているかどうかチェックする グラフをみる限り, 分散の均一性の前提が満たされていないようである 教育年数の増加とも分散が大きくなっている 残差を後の分析でも使いたい場合は新しい変数に resid を代入して保存する

RESID 残差と被説明変数 wage の推定値 (wagehat) の関係 20 16 12 8 4 0-4 -8-2 0 2 4 6 8 10 WAGEHAT 重回帰の場合には, 被説明変数の推定値と残差の関係を調べる ( 単回帰の場合は前のページと同じ結果 ) wagehatの求め方 menugenr 新しい変数を次のように作成 wagehat= @coefs(1)+@coefs(2)* educ または weaghat = wage - resid

R での回帰分析 > summar(wage1.lm) Call: lm(formula = wage ~ educ) Residuals: Min 1Q Median 3Q Ma -5.3396-2.1501-0.9674 1.1921 16.6085 係数の推定値, 標準誤差,t 値, p 値が出力される Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -0.90485 0.68497-1.321 0.187 educ 0.54136 0.05325 10.167 <2e-16 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 3.378 on 524 degrees of freedom Multiple R-squared: 0.1648, Adjusted R-squared: 0.1632 F-statistic: 103.4 on 1 and 524 DF, p-value: < 2.2e-16

R での回帰分析 回帰分析の結果は summar(object) で取り出せたが, 他の情報も取り出せる summar(object) 回帰分析の結果のようやく coef(object) 係数の推定値 resid(object) 残差 fitted(object) 回帰モデルの推定値 deviance(object) 残差平方和 plot(object) 残差のチェックのためのグラフ confint(object) 係数の信頼区間 ----------------- コマンドラインで,coefficients(wage1.lm) または coef(wage1.lm) とタイプすると推計された係数が出力される coef(wage1.lm)[1] coef(wage1.lm)[2] で係数ベクトルの 1 番めの要素と 2 番めの要素が出力される

残差診断 plot(wage1.lm) で出力される図の 1 部

非線形効果のとらえ方 = a + b () () = a + b () = a + b () = a + b 1 * + b 2 * 2 = a + b / = a + b 1 / + b 2 *

対数 a a ) ep( h h h ) (1 ) (1 b b a b b a b b a 対数の性質から次の式が成り立つ対数での変化 = もとの変数での比率での変化 は自然対数レジュメでは, と書いたり, log と書いたりしますが, 全て自然対数だと思ってください

LNWAGE (wage) と educ の散布図 4 3 2 1 0 こちらのほうが当てはまりが良いようにみえる -1 0 4 8 12 16 20 EDUC

(wage)=a+b*educ での回帰 Genr というボタンをクリックすると新しい変数を作成する画面が表れる そこで新変数名 = 計算式で新しい変数を作成 ここでは次のようにする wage =log(wage) or wage =@log(wage) 回帰分析の結果

RESID 残差 1.6 1.2 0.8 0.4 分散不均一性は解消されたようにみえる 0.0-0.4-0.8-1.2-1.6-2.0-2.4 0 4 8 12 16 20 EDUC

回帰分析の解釈 係数の意味 教育年数 (educ) が 1 年増加すると賃金 (wage) はどのくらい増加するか 教育年数 (educ) の係数が 0 であるという仮説は棄却できるか 対数 ( 賃金 ) が被説明変数の場合の係数 educ が 1 単位増加したとき, 賃金の対数値が何単位増加するか 賃金が何 % 増加するか 賃金に影響を与える変数にはどのような他の要因があるだろうか 他の変数と賃金の単相関をみる educ を連続変数とすることの意味 学歴別 当てはまりの良さ 因果関係 ( 代替的なモデルが考えられる ) 教育年数 賃金人的資本の蓄積 教育年数 その人の能力の証 高学歴者は学業に耐えられるだけの能力をもともと備えていた スクリーニングの機能だけ ( 人的資本の蓄積ではない )

みせかけの関係 Wooldridge の chapter2 eample 2.12 meap93.raw 生徒の成績と高校の lunch program の関係 chprg :perc. of studs. in sch. lunch prog math10 :perc studs passing MEAP math( 数学の学力テスト ) ミシガン州の高校 : 408 校, 1992-1993 年 他の条件が一定なら, 昼食への補助が生徒の成績にプラスの影響? 推計結果 math10 = 32.14-0.319chprg n=408, R 2 =0.171 誤差項 ( 他の条件 ) と chprg の相関あり chprg と相関があり,math10 とも高い相関 貧困家庭の比率?

練習問題 1 CEOSAL2.RAW salar: CEO の年棒 (1000$) ceoten: その会社での CEO 在職期間 ( 年 ) 1. salar, ceoten の平均値を求めよ 2. salar, ceoten, log(salar) のヒストグラムを描け 3. 在職期間が 1 年未満の人が何人いるか, 最長の在職期間は何年か 4. salar と ceoten の散布図,log(salar) と ceoten の散布図を描け 5. 次の回帰を行い, 結果を報告せよ log(salar) = a + b* ceoten + u

練習問題 2 WAGE2.RAW wage: 月給 IQ: IQ のスコア 1. wage と IQ の平均値, 分散, 最大, 最小を求めよ 2. wage と IQ のヒストグラムを描け 3. wage と IQ,log(wage) と IQ の散布図を描け 4. wage = a + b * IQ + u の回帰を行い, 結果を解釈せ よ 5. log(wage) = a + b * IQ +u の回帰を行い, 結果を解釈せよ