回帰分析 重回帰(3)

Similar documents
回帰分析 重回帰(1)

操作変数法

回帰分析 単回帰

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

Microsoft Word - reg2.doc

Microsoft PowerPoint - ch04j

1.民営化

Microsoft Word - reg.doc

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - 計量研修テキスト_第5版).doc

Microsoft Word - å“Ÿåłžå¸°173.docx

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

13章 回帰分析

ビジネス統計 統計基礎とエクセル分析 正誤表

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

Probit , Mixed logit

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

経済統計分析1 イントロダクション

1

Microsoft Word - 補論3.2

景気指標の新しい動向

EBNと疫学

回帰分析 重回帰(2)

情報工学概論

Microsoft Word - eviews6_

Microsoft PowerPoint - ch03j

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - appendix_b

Medical3

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

講義「○○○○」

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

Medical3

Microsoft Word - 計量研修テキスト_第5版).doc

6. 消費関数と 乗数効果 経済統計分析 (2017 年度秋学期 )

博士学位請求論文審査報告書 申請者 : 植松良公 論文題目 :Statistical Analysis of Nonlinear Time Series 1. 論文の主題と構成経済時系列分析においては, 基礎となる理論は定常性や線形性を仮定して構築されるが, 実際の経済データにおいては, 非定常性や

構造方程式モデリング Structural Equation Modeling (SEM)

ANOVA

統計的データ解析

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

6. 消費関数と乗数効果 経済統計分析 (2014 年度秋学期 ) 消費関数 ( 統計分析手法 ) 回帰分析 ( 単回帰 重回帰 ) 最小二乗法 回帰分析の推定結果の読み取り方 回帰係数の意味 実績値 推定値 残差 決定係数 自由度修正済決定係数 説明変数の選択 外れ値 ( 異常値 ) の影響 推定

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Microsoft Word - mstattext02.docx

様々なミクロ計量モデル†

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

PowerPoint プレゼンテーション

Microsoft Word - econome5.docx

Microsoft Word - 教育経済学:課題1.docx

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

日心TWS

PowerPoint プレゼンテーション

Microsoft Word - SDA2012kadai07.doc

基礎統計

Microsoft PowerPoint - Econometrics

E-Views 簡単な使い方

不均一分散最小二乗法の仮定では 想定しているモデルの誤差が時間やサンプルを通じて一定であるとしている 次のような式を想定する 誤差項である ut の散らばり具合がサンプルを通じて一定であるという仮定である この仮定は均一分散と呼ばれる 不均一分散とは その仮定が満たされない場合で 推計した係数の分散

基礎統計

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - econome4.docx

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Excelにおける回帰分析(最小二乗法)の手順と出力

The effect of smoking habit on the labor productivities

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

<4D F736F F D20837D834E838D97FB8F4B96E291E889F090E091E682528FCD81698FAC97D1816A>

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

と入力する すると最初の 25 行が表示される 1 行目は変数の名前であり 2 列目は企業番号 (1,,10),3 列目は西暦 (1935,,1954) を表している ( 他のパネルデータを分析する際もデ ータをこのように並べておかなくてはならない つまりまず i=1 を固定し i=1 の t に関

Microsoft PowerPoint - ch10j

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

カイ二乗フィット検定、パラメータの誤差

解析センターを知っていただく キャンペーン

Microsoft PowerPoint - 08macro2_1.ppt

Excelによるデータ分析

Microsoft Word - SPSS2007s5.doc

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

サーバに関するヘドニック回帰式(再推計結果)

第7章

Microsoft PowerPoint - Econometrics

不偏推定量

横浜市環境科学研究所

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

事例研究(ミクロ経済政策・問題分析III) -規制産業と料金・価格制度-

データ科学2.pptx

スライド タイトルなし

Microsoft Word - eviews1_

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Transcription:

回帰分析 重回帰 (3)

内容 分散不均一性 分散不均一性とは何か 分散不均一性の検出 Heteroskedstcty robust estmator 加重最小二乗法 (Weghted Least Square) 誤差項の系列相関 多重共線性 説明変数の誤差 誤差項と説明変数の相関

回帰分析の前提 モデルの線型性 u ~N(0,s )..d. 誤差項の期待値は0 誤差項は互いに独立 ( 系列相関は無い ) 誤差項の分散は一定 ( 分散均一性 ) 誤差項は正規分布 (t 検定,F 検定のための前提 ) 説明変数と誤差項は独立 説明変数の行列 Xはfull rank 説明変数間の多重共線性は存在しない

分散不均一性 heteroskedastcty 分散均一性 (homoskedastcty) 誤差項は互いに独立で同一の分布に従う var( u ) s 回帰係数 b の分布 ( 特に分散 ) はこの仮定に依存 E b = β, b = β + σ ҧ u S var b = σ ҧ σ (S ) b β ~t n (k + 1) s. e. (b) = σ S 分散均一性の仮定が満たされなくても不偏性は成立 しかし,b の分散は上式のようにはならない t 検定,F 検定は正しくない

分散不均一性 () 誤差項の分散が不均一 誤差項の分散がある変数の関数になっている場合 例 ) 賃金方程式で, 高学歴者ほど賃金の分散が大 説明変数と残差の散布図でチェックする 被説明変数 ( の推定値 ) と残差の散布図でチェックする 分散不均一性のテスト 時系列データでの回帰分析では, 誤差項に系列相関があるかもしれない

分散不均一性の検出 残差の平方と説明変数または y の予測値の間に相関があるかどうかを調べる なぜ残差の平方か 最小二乗法による推計では, 残差と説明変数は直交する ( 相関がない ) 単回帰, 重回帰の理論の解説を参照せよ したがって, 残差を, 説明変数 (y の予測値 ) に回帰してもその係数はゼロ 残差の平方と, や y の予測値との間にシステマティックな関係があるかどうかを調べる

分散不均一性の検出 () Breusch and Pagan のテスト 1) (, ~ 1)) ( /( / 1)) ( /( ) / ( 0 : test : estmate compure save : : estmate 1 0,, 1, 1 0,, 1, 1,, 1, 1 k n k F k n RSS k ESS k n RSS k TSS RSS H v e e b b b a y e u y k k k k k k k

分散不均一性の検出 (3) Whte のテスト 残差の平方 e を被説明変数 説明変数 : j, j の平方, j と h の交差項 これらの説明変数の係数が全て 0 という仮説を検定する 簡便な方法 y の予測値 ( 説明変数の線形関数 ), およびその平方を説明変数に加える

Evews: Breusch and Pagan の検定 回帰式を推定した後, Vew/ Resdual Dagnostcs/ Heteroskedastcty Tests を選択 Breusch and Pagan test Whte test などの Opton がある

Evews: Whte の検定 回帰分析の後, Vew/ Resdual Tests/ Heteroskedastcty tests を選択 Whte の test を選択すると, 自動的に説明変数のクロス項, 平方を説明変数のリストに加えてくれる

Evews: 分散不均一性の検定メニューを使わない方法 Breusch and Pagan 残差の平方を計算 直前の回帰の残差は resd に保存されている seres res = resd^ コマンドウィンドウで上のコマンドをタイプ res を被説明変数にして回帰分析 説明変数の係数 =0 の F 検定 Whte の検定 残差の平方を計算 直前の回帰の残差 resd と被説明変数の差で予測値を計算 seres res =resd seres ft = lnwage - res res を被説明変数に,ft, ft の平方を説明変数にした回帰分析を行い,F 検定

R での分散不均一性 wage1.lm <- lm(wage ~ educ + eper + tenure) 残差の平方は resd(wage1.lm) で取り出せる 残差の平方を被説明変数として回帰 > res <- resd(wage1.lm) > res <- res^ > wage1_bptest.lm <- lm(res ~ educ + eper + tenure) > summary(wage1_bptest.lm) 結果 ---( 途中省略 )--- F-statstc: 15.53 on 3 and 5 DF, p-value: 1.09e-09 res を被説明変数とした回帰で全ての説明変数の係数が 0 であるという仮説は棄却される パーケージ lmtest の bptest( ) という関数を用いる方法もあり

問題 1 wage1.raw で次の賃金方程式を推計する 被説明変数 wage 説明変数 educ, eper, tenure, female 分散不均一性のテストを行え Breusch and Pagan の test Whte の test 被説明変数を log(wage) に変えて回帰分析を行い, 分散不均一性が検出されるかどうか確かめよ

問題 HPRICE1.RAW 次のモデルを推計せよ 被説明変数 :prce( 住宅価格 ) 説明変数 :lotsze, sqrft, bdrms 分散不均一性のテストを行え 上のモデルを対数形で推計せよ 被説明変数 : log(prce) 説明変数 :log(lotsze), log(sqrft), log(bdrms) 分散不均一性のテストを行え

Heteroskedastcty Consstent Estmator 分散不均一性 係数の推定値は不偏性をもつが, 分散の推定値は正しくない t 検定,F 検定は正しくない Evews では, 最小二乗法の opton で,heteroskedastcty robust estmator を算出してくれる Evews では Whte の方法と HAC(Newey West) の方法が選択できる HAC は誤差項に系列相関がある場合の方法 漸近的に正しい統計量 ( サンプルサイズが十分に大きいとき ) var( b) S e Heteroskedastcty robust estmator: OLS の残差を e として, 左のように計算

Evews での HC estmator Menu から Quck /Estmate Equaton speccfcaton に回帰式を書き (method は LS), optons のタブをクリック Coeffcent covarance の covarance method で Huber-Whte を選択する ( 他の opton は Ordnary( 通常の OLS),HAC) 通常の OLS と係数の値, s.e.,t 値の比較をせよ

vcov(object 名 ) R での HC estmator 回帰分析の係数の分散共分散行列 vcovhc(object 名 ) OLS の残差をもとに係数の分散共分散行列を修正 パッケージ sandwtch が必要 lbrary(sandwch) 回帰分析の結果 -->wage1.lm vcov(wage1.lm) で通常の分散共分散行列, vovhc(wage1.lm) で誤差項の分散不均一性を考慮した分散共分散行列

R での HC estmator () OLS の結果を object として保存 ( 例えば wage1.lm) coeftest(wage1.lm) 係数の推定値, 標準誤差,t 値,p 値などが出力される coeftest(wage1.lm, vcov=vcovhc) 分散不均一性を考慮して, 標準誤差,t 値,p 値が修正された結果が出力される 係数の推定値自体は, 分散不均一性があっても変わらない ( 不偏性を持つ ) ことに注意 複数の制約がある場合は waldtest( 制約なしモデル, 制約付きモデル ) を用いる

加重最小二乗法 Weghted Least Square 不均一性のテストは検出のみ どのような方法で対処すべきかは教えてくれない 推定する方程式の関数型を変えることで解決する場合もある 誤差項の分散がある変数に比例していることがわかっている場合 Weghted Least Square 加重最小二乗法 WLS : 次の式を最小化するように係数を決定 n =1 w y a b 1 1, b k k, w : weght

Weghted Least Square 次のモデルを考える y = α + β 1 1, + + β k k, + u (1) ただし,var u = σ = h σ ( 誤差項の分散が変数 hに比例している 分散不均一性 ) このとき次のように式変換すれば y h = α 1 h + β 1 1, h + + β k k, h + u h () var u h = σ 分散は均一

Weghted Least Square () () 式をもとに係数を推定 次の式の最小化 = n =1 y h n 1 =1 n = =1 a 1 h b 1 1, h b k k, h h y a b 1 1, b k k, w y a b 1 1, b k k, 元のモデルの誤差項の分散が h に比例する weght 変数を 1/h にする

Evews での WLS Quck/Estmate Equaton で最小二乗法 (LS) を選択し, モデル式を記述 Opton のタブを選択 Weghts の欄 Type Varance ( 誤差項の分散が h に比例 ) Weght Serese 変数 h を指定 例 ) 賃金方程式で残差の分散が EDUC( 教育年数 ) に比例している場合 Type: Varance ; Weght Serese: EDUC とする Evews の WLS の opton の指定はわかりにくいので注意 w=1/h の wegt の場合,weght 変数に h を指定する Opton の Type Std.dev ( 誤差項の標準偏差が h に比例 ) Inverse Varance ( 誤差項の分散が 1/h に比例 ) Inverse Std.dev( 誤差項の標準偏差が 1/h に比例 )

R での WLS wls: lm(y~1++3,weghts=w) で実行 (w=1/h) 例 ) 賃金方程式で誤差項の分散が教育年数 (EDUC) に比例する場合,weghts=1/EDUC とし wage.wls <- lm(lwage ~educ + epre + tenure, weghts=1/educ, subset=(educ>0)) summary(wage.wls) で結果を取り出す 注意 )weght 変数に0があるとエラーが出ます ( 自動的に除外してくれない ) lm() のoptonでsubset=( ) を指定すると,( ) 内の条件を満たすようなデータについてのみの回帰を行うことができる

誤差項の系列相関 回帰分析の前提 : 誤差項は互いに独立 誤差項に系列相関がある場合 回帰係数 b の分散が s (X X) -1 にならない クロスセクションデータの場合には問題にならない オブザベーションの並び方が, 隣接した地域や人の順番になっている場合には意味がある場合あり 時系列データの場合には意味がある ある時点で生じたショックがしばらく尾をひく ( 誤差項の系列相関アリ )

Durbn Watson 検定 1 階の系列相関を調べる検定 DW T t T t e e T t1 t (1 ) t e e t t1 T 1 t1 T e t1 t e t T 1 e e t1 t t1 DW 比は多くの統計パッケージでは自動的に出力される Rではdwtest( ) 関数を用いる ( パッケージlmtestが必要 ) 経済データでは,>0のケースが普通 (は1 階の相関係数 ) 大雑把なルールではDW 比が1に近いと系列相関あり 現在では, 誤差項はもっと一般的に AR(p) 過程に従うとして, 推計ができる また, 時系列データの分析では, 説明変数が定常過程か非定常過程かの区別が重要

多重共線性 multcolnearty 説明変数間の相関が高いこと 回帰分析において, 個々の変数の影響を分離して推計することができなくなる 単相間だけで判断してはいけない 変数間の単相間は低くても, ある説明変数が別の複数の説明変数の線形結合でかなり説明できる場合もある 多重共線性が存在すると 回帰式全体では当てはまりが良いが, 個々の説明変数の係数が有意でない (s.e. が大きい ) という現象が生じる 実験データ 個々の変数の影響が十分に分離できるように実験計画を立てる 経済データ 上のようなことは不可能 分析方法の再検討

多重共線性の検出 OLS において説明変数 j の係数の分散は次の通りになる var b j = σ S j 1 R j s : 誤差項の分散, S j : 説明変数 j の平均値の回りの平方和, R j : 説明変数 j を他の説明変数に回帰した場合の R ( 決定係数 ) 多重共線性 R j が高い b j の分散が大きくなる VIF ( Varance nflaton factor 分散増幅因子 ) VIF b j = 1 1 R j VIF は手動でも計算できるが,evews では estmaton output の wndow の menu から Vew /Coeffcent Dagnostcs /Varance Inflaton Factors とたどれば求められる R の場合 : vf( 回帰分析の object 名 ) で出力される ただし,car という package を読み込んでおく必要がある

多重共線性の例 地方政府の行動 ( 支出 ) を, 地域の財政状況 ( 債務残高, 税収, 国からの補助金, 交付税額 ), 地域の属性 ( 山間地, 豪雪地帯,..), 所得, 面積等で説明 国からの補助金は, その地域属性によって決まる 所得が低い, 中山間地,. 財政状況と地域属性の間の多重共線性 個々の変数の効果が捉えられない MLB プレイヤーの年俸の決定要因の分析 HR 数と打点数に非常に強い単相間 HR 数の効果と打点の効果を分離できない

説明変数の誤差 u y * j v u v v j, all for 0 ), cov( 0, E * 真のモデル説明変数 * は観察できない : そのかわり が観察できる w v u u v y 誤差項 w の期待値は 0, 分散は一定 しかし,w と には相関がある

説明変数の誤差 () 説明変数の誤差 誤差項と説明変数の相関 最少二乗推定量 特に単回帰の場合 w X X X y X X X b ' ) ' ( ' ) ' ( 1 1 s s s s s s * * * * * ) var( ), cov( ) var( ), cov( plm v v v v v u v w b

説明変数の誤差 (3) 例 ) 恒常所得仮説 C Y E Y u T P T 0, cov, cov T Y Y Y Y, u 0 ky Y P P T Y: 観察される所得, YP: 恒常所得, YT: 変動所得 消費は観察不可能な恒常所得に比例する (k はほぼ 1 に近い ) 消費関数を推計すると, 消費性向はケインズ型消費関数の消費性向 (0.6~ 0.7) と推定される 説明変数の誤差 操作変数法 (Instrumental Varables Method)