経済統計分析1 イントロダクション

Similar documents
経済統計分析1 イントロダクション

Microsoft PowerPoint - e-stat(OLS).pptx

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

スライド 1

スライド 1

1.民営化

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch03j

EBNと疫学

Microsoft Word - å“Ÿåłžå¸°173.docx

13章 回帰分析

基礎統計

回帰分析 単回帰

Microsoft Word - appendix_b

Excelにおける回帰分析(最小二乗法)の手順と出力

統計的データ解析

Microsoft PowerPoint - Econometrics pptx

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

基礎統計

PowerPoint プレゼンテーション

Microsoft Word - reg.doc

Medical3

カイ二乗フィット検定、パラメータの誤差

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

回帰分析 重回帰(1)

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

Microsoft PowerPoint - sc7.ppt [互換モード]

第7章

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

最小2乗法

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

情報工学概論

Microsoft PowerPoint - Econometrics

不偏推定量

Microsoft Word - reg2.doc

Microsoft Word - econome5.docx

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft Word - 計量研修テキスト_第5版).doc

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

13章 回帰分析

日心TWS

Excelによるデータ分析

Microsoft PowerPoint - stat-2014-[9] pptx

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

博士学位請求論文審査報告書 申請者 : 植松良公 論文題目 :Statistical Analysis of Nonlinear Time Series 1. 論文の主題と構成経済時系列分析においては, 基礎となる理論は定常性や線形性を仮定して構築されるが, 実際の経済データにおいては, 非定常性や

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

PowerPoint プレゼンテーション

講義「○○○○」

Medical3

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

構造方程式モデリング Structural Equation Modeling (SEM)

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word - econome4.docx

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft Word - lec_student-chp3_1-representative

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

Microsoft PowerPoint - ch10j

【補足資料】確率・統計の基礎知識

6. 消費関数と 乗数効果 経済統計分析 (2017 年度秋学期 )

Microsoft PowerPoint - statistics pptx

重回帰式 y= x x 2 重症度 5 TC TC 重症度

Microsoft Word - 計量研修テキスト_第5版).doc

モジュール1のまとめ

Microsoft PowerPoint - statistics pptx

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - Econometrics

8 A B B B B B B B B B 175

青焼 1章[15-52].indd

横浜市環境科学研究所

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

様々なミクロ計量モデル†

スライド 1

Microsoft PowerPoint - Statistics[B]

The effect of smoking habit on the labor productivities

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

Microsoft Word - Stattext13.doc

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

スライド タイトルなし

Microsoft PowerPoint - GLMMexample_ver pptx

景気指標の新しい動向

回帰分析 重回帰(3)

数値計算法

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

経営統計学

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Probit , Mixed logit

Microsoft Word - Stattext11.doc

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

6. 消費関数と乗数効果 経済統計分析 (2014 年度秋学期 ) 消費関数 ( 統計分析手法 ) 回帰分析 ( 単回帰 重回帰 ) 最小二乗法 回帰分析の推定結果の読み取り方 回帰係数の意味 実績値 推定値 残差 決定係数 自由度修正済決定係数 説明変数の選択 外れ値 ( 異常値 ) の影響 推定

Transcription:

1 経済統計分析 10 回帰分析

今日のおはなし. 回帰分析 regression analysis 2 変数の関係を調べる手段のひとつ単回帰重回帰使用上の注意 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. Stock, James H. and Mark W. Watson. 2006. Introduction to Econometrics. 2nd Revised International Ed, Prentice Hall. 2

なにができるようになりたいか ある変数が他の変数に不える効果の大きさの数量化 確率論的な言葉遣いでは 同時分布の特性値の値を知りたい これまでの方法 : 散布図, 共分散 ( 相関係数 ), 適合度検定, 独立性検定 問題の設定 母集団すべてを観測できず, 標本のみ 平均的な関係 を推測する標本誤差の存在を認めるさしあたって2 変数の関係 ある変数の値が 1 だけ増えたとき, 影響を受ける他の変数の値は平均的にはどれくらい増えるか ( 減るか?) を, 統計的に推測しよう 3

-.1 0 growth.1.2.3.4 まずは, 散布図 例 : 統治状況と経済成長率 (199 カ国 ) 4 統治状況が経済成長率に効果を不えると想定 横軸が統治状況 ( 原因となるもの ), 縦軸が経済成長率 ( 結果となるもの ) 標本相関係数は -0.0478. -2-1 0 1 2 govern

-.1 0.1.2.3.4 2 つの変数が直線的に関係していたら? -2-1 0 1 2 govern growth Linear prediction 例 : 統治状況と経済成長率 (199 カ国 ) 統治状況と経済成長率の関係が直線的 ( 線形 ) であったとして, それに誤差が乗っていると仮定してみたら, 統治状況の改善が経済成長率に不える効果の大きさが分かるのでは? 散布図の 真ん中 に直線を描いてみた. 傾き -0.00262, 切片 0.043 5

回帰分析 regression analysis 回帰分析とは ある変数 ( 被説明変数 dependent variable) が, 他の変数 ( 説明変数 independent / explanatory variables) と誤差項 (error) の関数であると仮定し, その関数のパラメタを推定する分析 例 : 経済成長率を被説明変数とし, 統治状況を説明変数とする 1 次関数を仮定した回帰分析 単回帰 説明変数が 1 個だけ ( 定数を入れると 2 個 ) の回帰分析 2 個の変数は線形関係 (1 次関数 ) で表現される 説明変数を x, 被説明変数を y, 誤差項を u とすると, y i = b 0 + b 1 x i + u i であり,b 0 と b 1 の値を推定する. 重回帰 6 説明変数が 2 個以上ある回帰分析

線形回帰モデル linear regression model y i = b 0 + b 1 x i + u i x i : 説明変数, 独立変数, 共変数,y i : 被説明変数,u i : 誤差項 b 0 + b 1 x i : 回帰線. x i が分かったときの y i の平均的な値 b 0 : 切片 (intercept), b 1 : 傾き (slope). 合わせて係数 (parameter) とも 誤差項 error term 傾き その他の要因 を代表する確率変数. 平均的な値 (b 0 + b 1 x i ) と実現値 (y i ) の差を説明するもので, x i 以外のすべての要因を含む 誤差項は観測できない x i の値が 1 だけ増えたときの y i の平均的な増加分 ( 期待値の変分 ) おもに注目される 因果関係 を推定したいが, 実際には 相関 を計測 7

線形回帰モデル Stock and Watson, 2003. 8

線形回帰モデル : 例 y i = b 0 + b 1 x i + u i x i : 説明変数は統治状況 (05 年 ) y i : 被説明変数は経済成長率 (per capita,05 06 年 ) u i : 誤差項はその他の要因. 技術 教育 地政 発展段階などなどなど b 0 + b 1 x i : 統治状況が分かったときの経済成長率の平均的な値 b 1 : 傾きは統治状況が 1 増えたときの経済成長率の変化の大きさ 注意点 発想 9 統治状況と経済成長率が 1 次関数の関係にあるのは 前提 この前提が正しいかどうかは分からない (all models are wrong!) 変数を 変形 したものなど含めれば,1 次近似として有効 もし, データが 1 次関数の関係から発生しているものと考えれば, そのときのパラメタはどれほどであろうか?

線形回帰モデルにおける統計的推測 y i = b 0 + b 1 x i + u i b 0 とb 1 の真の値がわかっていれば x i とu i の実現値に応じてy i の値を計算できる手許にあるデータは (x i, y i ) の ( 無作為抽出 ) 標本だけであり ここからb 0 と b 1 を推測するもう1 つの確率変数 u i は実現値もわかっていない (x i, y i, u i ) が線形の関係にあるかどうかも ( ほんとうは ) 定かではないが, ここでは仮定 b 0 と b 1 の真の値を標本から統計的に推測するから, 仮説検定や信頼区間の形成という手続きが可能 では, b 0 と b 1 の真の値をどのように推測するのか? 切片と傾きの一致推定量を計算するにはどのようにすればよいのか? 10

最小 2 乗法 OLS(Ordinary Least Squared) 最も有名な推定量の 1 つ 発想 いくつかの条件の下で, 切片と傾きは一致推定量になる 誤差が平均的にはゼロであれば, 散布図の 真ん中 に回帰線があるはず回帰線からの 乖離 がなるべく小さくなるように, 直線を引けばよい 乖離 の合計を小さくすればよいが, そのまま足すと計算がめんどう 乖離 の2 乗の和を最小にするようが計算が簡単 式で書くと. 11 推定量を b 0,b 1 として, 次を最小化するものを選ぶ min n y i 0 1 i i1 b b x 2 最小化問題になるので, b 0,b 1 で偏微分してゼロとおけばよい 正規方程式 : 式が 2 つ, 未知数が 2 つ

最小 2 乗法 正規方程式を解くと ( 計算は電子計算機に任せる ), x x i y y i i1 b, b y b x 1 n 0 1 2 x x i i1 b 標本共分散, 標本分散を用いると, 例 : 統治状況の分散は.864707, 共分散は -.00227 割ってみると -0.00262 別の解釈 n 推定式の両辺と x i の共分散を計算してみよう s xy 1 2 sx 12

最小 2 乗法の基礎用語 OLS 回帰線 OLS によって得られた係数推定値で描かれる回帰線 当てはめ値 fitted value 所不の x i に対する y i の OLS 回帰線上の値. 期待値のようなもの. 残差 residual 各観測値と, 対応する当てはめ値との差. 誤差の推定量として用いられることも. 係数の標準誤差 standard error 標本平均が確率変数であったのと同様にOLS 推定量も確率変数. 同じ母集団であってもサンプルが異なればOLS 推定値は異なる. それゆえ,OLS 推定量も標本分布をもち, 標準偏差がある. 13

なんで OLS 推定量なの? 望ましい性質 ある仮定のもとでは,OLS 推定量は真の係数の一致推定量さらにある仮定のもとでは, 有効推定量 BLUE: Best Linear Unbiased Estimator じっさい, よく使われているし. 実証分析を進めるうえでの共通言語のひとつパッケージソフトも多い.MS-Excel にも組み込み関数がある 収束計算が丌要で, 手計算 が比較的容易だったという事情も. 拡張 説明変数が2 個以上関数形が線形に限らない 14

当てはまりのよさ : 回帰の標準誤差 残差 residuals の性質 残差の和はゼロ 観測値は予測値と残差の和だから 残差と説明変数は無相関残差と予測値は無相関 回帰の標準誤差 standard error of regression 誤差項の標準偏差の推定値 ( 残差平方和 / n-2) の平方根 SER n ˆ 2 u i1 i n 2 15

当てはまりのよさ : 決定係数 定義 性質 決定係数 R 2 : 説明変数の変動が全変動に占める比率全変動 = 説明変数の変動 + 残差の変動 R 0 から 1 のあいだの値を取る n 2 ˆ n 2 2 Yˆ の標本分散 Y Y ˆ i1 i i u i1 i 1 n 2 2 データが回帰線上に並んでいるとき, 決定係数は1 データが説明変数によって全く説明されないとき, 決定係数は0 R 2 が大きいほど, Y i の予測がうまくできている n i i i i Yの標本分散 Y Y Y Y i1 i1 16

OLS 推定量の仮説検定 手続き 1. 仮説を立てる. 2. 有意水準を決める. 3. 検定統計量 (test statistics) を計算する. 4. p 値を求めて, 棄却 / 受容を判定する. 検定する帰無仮説 H 0 : 傾きの値が ~ だ 最もしばしば用いられるのは 傾きの値がゼロだ 説明変数は被説明変数に影響を不えていない 平均値の検定と同じなので,t- 検定を用いる 傾きがゼロだ に対応する t- 値,p 値は自動的に出力されることが多い 17

OLS 推定量の仮説検定 切片, 傾きの推定量の標準誤差 推定量の標準偏差の推定量 SE これは 分散丌均一に頑健な標準誤差 と呼ばれるもの MS-Excel の組込み関数の計算方法は異なる b 1 1 n 2 n 1 n i1 2 2 ˆi 1 2 n 2 n i1 x x x u i i x 分散均一 homoskedasticity を仮定した標準誤差 と呼ばれる より強い仮定を必要とするので, 分散丌均一に頑健な標準誤差 robust standard error を使うほうが好ましいが... データは母集団から抽出された標本なので, 標本が異なれば推定される傾きや切片の値も異なる 18

係数についての t 検定 検定統計量 :t 値 帰無仮説が正しいとき, サンプルサイズが十分に大きく, 各観測値がi.i.d. であれば, 標準正規分布に従う推定値 仮説の値 b b 1 1,0 d t N(0,1) 推定量の標準誤差 SE b 傾きがゼロだ を検定するときには, 推定値をその標準誤差で割った値の絶対値が 1.96 より大きければ, 有意水準 5% で棄却できる 注意 19 各観測値が i.i.d. に正規分布に従うとき,t 統計量は t 分布 に exact に従う 観測値が正規分布に従うとは限らないし, サンプルサイズが大きければ t 分布は標準正規分布で近似されるので, ここでは標準正規分布を用いている. 傾きがゼロだ という帰無仮説を棄却できるとき, 係数が 統計的に有意にゼロと異なる (statistically significantly different from zero) と言い, 略して 統計的に有意だ statistically significant とも言われる 統計的有意性は, 政策的な重要さとは直接関係ない 1

MS-Excel de 回帰分析 MS-Excel 2007 でやってみた データ データ分析 回帰分析 欠損値が混じっているとエラーが返ってくるなんて! 系列の並べ替えを使って欠損値を除去してからこういうウィンドウが開くはず 20

MS-Excel de 回帰分析 出力はこうなります ( 桁だけ揃えた ) 概要 被説明変数 :05 06 年の経済成長率 説明変数 :05 年の統治状況, 定数項 回帰統計 重相関 R 0.048 重決定 R2 0.002 補正 R2-0.003 標準誤差 0.051 観測数 199 係数推定値, 標準誤差のほか, 係数がゼロ という帰無仮説に対する t 統計量,p 値が出力されるここでは, 傾きがゼロ という仮説は棄却できず, 傾きはゼロと統計的に有意には異ならない 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 1 0.001 0.001 0.447 0.505 残差 197 0.515 0.003 合計 198 0.516 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 切片 0.0431 0.0036 11.8831 0.0000 0.0359 0.0502 0.0359 0.0502 X 値 1-0.0026 0.0039-0.6682 0.5048-0.0103 0.0051-0.0103 0.0051 21

重回帰 説明変数を 2 個以上に増やす 定数項を説明変数と解釈すれば3 個以上線形関係の仮定はそのまま y i = b 0 + b 1 x 1i + b 2 x 2i + u i たとえば説明変数が2 個のケース b 1 : 他の条件を一定として, x 1i が1 増えたときのy i の変化分 b 2 : 他の条件を一定として, x 2i が 1 増えたときの y i の変化分 最小 2 乗推定 22 残差平方和を最小にする, という方針は同じ min n y x x i 0 1 1i 2 2i i1 b b b 2 単回帰と同じく, 一定の仮定のもとで一致 丌偏推定量 OLS 推定量はここでは明示的には表現しない ( 行列表現 )

多重共線性 multi-colinearity 完全な多重共線性 ある説明変数が, 他の説明変数 ( と定数 ) の1 次関数で表現されること例 : x 1i とx 2i がつねに同じ値を取る 例 : x 1i を 100 倍すると x 2i になる ( パーセント表記 ) 例 : x 1i を1から引くとx 2i になるダミー変数 (0か1の値を取る) を使うときにありがち 例 : x 1i が男性ダミー,x 2i が女性ダミー 完全な多重共線性が発生していると推定できない 論理的に無理 : 他の条件を一定として を考えられないから 丌完全な多重共線 説明変数の間の相関係数が極めて高い (0.99 など ) 理論的には問題はないものの, 推定値が丌安定になりがち 23

自由度修正済み決定係数 adjusted-r 2 決定係数 n 2 ˆ n 2 ˆ ˆ 2 Yの標本分散 Y Y i1 i i u i1 i R 1 n n Yの標本分散 Y Y Y Y 説明変数の数を増やすと, ほぼ自動的に決定係数が上昇 サンプルサイズが大きくないとき, 当てはまり の指標としては丌適切 自由度修正済み決定係数 24 i i i i 2 2 i1 i1 説明変数が多い という要因を修正したもの R n 2 n 1 uˆ i 1 n k 1 Y Y 2 i1 i1 n i 決定係数より小さな値を取る負の値を取るときもある : 説明変数の数が多いとき説明変数の数が増えても, 自動的に増加するわけではない決定係数が高くなっても, 説明変数の追加が適切だとは限らない i 2

MS-Excel で重回帰 被説明変数 :05 06 年の経済成長率 説明変数 :05 年の 1 人当たり GDP,05 年の統治状況, 定数項 概要 回帰統計 重相関 R 0.092 重決定 R2 0.008 補正 R2-0.002 標準誤差 0.051 観測数 199 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 2 0.004 0.002 0.829 0.438 残差 196 0.511 0.003 合計 198 0.516 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限上限 95.0% 95.0% 切片 0.0467 0.0049 9.4730 0.0000 0.0370 0.0565 0.0370 0.0565 X 値 1 0.0000 0.0000-1.1007 0.2724 0.0000 0.0000 0.0000 0.0000 X 値 2 0.0017 0.0055 0.3104 0.7566-0.0092 0.0126-0.0092 0.0126 25 自由度修正済み決定係数 ( 補正 R2) が出力されるここでも, 傾きがゼロ という仮説は棄却できず, 傾きはゼロと統計的に有意には異ならない

MS-Excel で重回帰 被説明変数 :05 06 年の経済成長率説明変数 :05 年の1 人当たりGDP(x 1i ),05 年の統治状況 (x 2i ), 定数項 イラクとアゼルバイジャンを除外 ( 異常値っぽい ) 回帰統計 重相関 R 0.161 重決定 R2 0.026 補正 R2 0.016 標準誤差 0.040 観測数 197 傾きがゼロ という仮説は棄却される OLS 推定値は異常値にひっぱられやすいすでに経済成長している国の成長率は低い 収束仮説 に整合的統治状況のよい国の成長率は高い 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 2 0.008 0.004 2.566 0.079 残差 194 0.312 0.002 合計 196 0.320 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限上限 95.0% 95.0% 切片 0.0455 0.0039 11.7392 0.0000 0.0379 0.0532 0.0379 0.0532 X 値 1 0.0000 0.0000-2.1277 0.0346 0.0000 0.0000 0.0000 0.0000 X 値 2 0.0091 0.0044 2.0596 0.0408 0.0004 0.0178 0.0004 0.0178 26

非線形関数への拡張 非線形関数 1 次関数以外の関数 2 乗項,3 乗項の入る多項式, 対数, 逆数がよく用いられるありとあらゆるパターンに対応可能なわけではない y i = b 0 + b 1 x 1i + b 2 x 2i + u i 説明変数を 変形したもの をみなせばよい 例 : x 2i = x 2 1i 例 : x 2i = log(x 1i ) このとき, 傾きの解釈が変化 他の条件を一定として, x 2i が1 増えたときのy i の変化分 には変わりない例 : 他の条件を一定として, log(x 1i ) が1 増えたときのy i の変化分 例 : 他の条件を一定として, x 1i2 が 1 増えたときの y i の変化分?? 27

OLS 推定量が一致性を持つ条件 4 条件 説明変数で条件付けられた誤差項の期待値がゼロ観測値はi.i.d. 説明変数と誤差項は母分散を持ち,4 次モーメントが有限完全な多重共線性がない Remarks すべての条件が厳密に満たされることは, ほとんどない. 観測値は i.i.d. : 時系列的, 地域的な相関は避けられない? 母分散と 4 次モーメント : 統計学上の技術的な仮定として, 満たされているものとする 多重共線性 : 計算の途中でエラーが返ってくる 28

説明変数の外生性 exogeneity 説明変数で条件付けられた誤差項の期待値がゼロ = 誤差項と説明変数が相関を持たない 回帰分析の発想 被説明変数と説明変数が 1 次関数の関係にあり, ここに誤差が乗ったものがデータとして観測されていると考える 誤差は noise として足されているだけだから, データの 真ん中 を通るように直線を引けば, 本来の 1 次関数を復元できる データの真ん中に直線がある = 誤差項の条件付き期待値がゼロ 逆に言うと. 誤差項の条件付き期待値がゼロでないところがあれば, データの真ん中に ( 直接には観測できない ) 直線が通っているとは限らない データの真ん中に直線を引いても, 本来の1 次関数を復元できるわけではない 推定値に偏り (bias) をもたらす 29

誤差項の条件付き分布 30

誤差項とは? 誤差項が表しているもの 説明変数に含まれてはいないが, 被説明変数に影響を不える要因全て実験データに見られる 純粋なランダムさ だけではないもし観測できるものなら, 説明変数に追加するのが解決方法のひとつ 誤差項がどのような要因を代表しているのか? 例 : 統治状況と経済成長率 経済成長率に影響するのは統治状況だけか? 他の要因もいろいろ : 人的資本 ( 教育 ), 衛生, 言語, 貯蓄率などなど教育水準と統治状況は相関がありそう 統治状況が高い値を示す国では, 教育水準が高い 誤差項が大きな値 OLS で 真ん中に 直線を通すと, 上に偏っているかも 教育水準の効果を反映しているだけで, 統治状況の効果ではないかも 31