と入力する すると最初の 25 行が表示される 1 行目は変数の名前であり 2 列目は企業番号 (1,,10),3 列目は西暦 (1935,,1954) を表している ( 他のパネルデータを分析する際もデ ータをこのように並べておかなくてはならない つまりまず i=1 を固定し i=1 の t に関

Similar documents
まず y t を定数項だけに回帰する > levelmod = lm(topixrate~1) 次にこの出力を使って先ほどのレジームスイッチングモデルを推定する 以下のように入力する > levelswmod = msmfit(levelmod,k=,p=0,sw=c(t,t)) ここで k はレジ

様々なミクロ計量モデル†

dae opixrae 1 Feb Mar Apr May Jun と表示される 今 必要なのは opixrae のデータだけなので > opixrae=opixdaa$opi

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft Word - 計量研修テキスト_第5版).doc

R による共和分分析 1. 共和分分析を行う 1.1 パッケージ urca インスツールする 共和分分析をするために R のパッケージ urca をインスツールする パッケージとは通常の R には含まれていない 追加的な R のコマンドの集まりのようなものである R には追加的に 600 以上のパッ

以下の内容について説明する 1. VAR モデル推定する 2. VAR モデルを用いて予測する 3. グレンジャーの因果性を検定する 4. インパルス応答関数を描く 1. VAR モデルを推定する ここでは VAR(p) モデル : R による時系列分析の方法 2 y t = c + Φ 1 y t

4.9 Hausman Test Time Fixed Effects Model vs Time Random Effects Model Two-way Fixed Effects Model

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

回帰分析 単回帰

ビジネス統計 統計基礎とエクセル分析 正誤表

DAA09

パネル・データの分析

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

201711grade2.pdf

Microsoft PowerPoint - GLMMexample_ver pptx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

講義のーと : データ解析のための統計モデリング. 第5回

Probit , Mixed logit

Microsoft PowerPoint - e-stat(OLS).pptx


講義のーと : データ解析のための統計モデリング. 第3回

Microsoft Word - 計量研修テキスト_第5版).doc

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

k3 ( :07 ) 2 (A) k = 1 (B) k = 7 y x x 1 (k2)?? x y (A) GLM (k

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

一般化線形 (混合) モデル (2) - ロジスティック回帰と GLMM

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

統計的データ解析

Microsoft Word - eviews1_

基礎統計

最小2乗法

スライド 1

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Use R

スライド 1

y = x x R = 0. 9, R = σ $ = y x w = x y x x w = x y α ε = + β + x x x y α ε = + β + γ x + x x x x' = / x y' = y/ x y' =

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Excelにおける回帰分析(最小二乗法)の手順と出力

1 15 R Part : website:

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - 計量研修テキスト_第5版).doc

日本内科学会雑誌第102巻第4号

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

回帰分析 重回帰(1)

Microsoft Word - eviews2_

第11回:線形回帰モデルのOLS推定

Ł\”ƒ-2005

第90回日本感染症学会学術講演会抄録(I)

Microsoft PowerPoint - Econometrics pptx

R John Fox R R R Console library(rcmdr) Rcmdr R GUI Windows R R SDI *1 R Console R 1 2 Windows XP Windows * 2 R R Console R ˆ R

EBNと疫学

Microsoft PowerPoint - ch04j

% 10%, 35%( 1029 ) p (a) 1 p 95% (b) 1 Std. Err. (c) p 40% 5% (d) p 1: STATA (1). prtesti One-sample test of pr

(p.2 ( ) 1 2 ( ) Fisher, Ronald A.1932, 1971, 1973a, 1973b) treatment group controll group (error function) 2 (Legendre, Adrian

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft Word - 計量研修テキスト_第5版).doc

Medical3

Microsoft Word - Stattext12.doc

操作変数法

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

こんにちは由美子です

インターネットを活用した経済分析 - フリーソフト Rを使おう

経済統計分析1 イントロダクション

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

kubostat2018d p.2 :? bod size x and fertilization f change seed number? : a statistical model for this example? i response variable seed number : { i

1 環境統計学ぷらす 第 5 回 一般 ( 化 ) 線形混合モデル 高木俊 2013/11/21

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Medical3

s = 1.15 (s = 1.07), R = 0.786, R = 0.679, DW =.03 5 Y = 0.3 (0.095) (.708) X, R = 0.786, R = 0.679, s = 1.07, DW =.03, t û Y = 0.3 (3.163) + 0

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Transcription:

R によるパネルデータモデルの推定 R を用いて 静学的パネルデータモデルに対して Pooled OLS, LSDV (Least Squares Dummy Variable) 推定 F 検定 ( 個別効果なしの F 検定 ) GLS(Generalized Least Square : 一般化最小二乗 ) 法による推定 およびハウスマン検定を行うやり方を 動学的パネルデータモデルに対して 1 階階差 GMM とシステム GMM を行うやり方を 説明する 1. パッケージ plm のインスツールパネルデータモデルを分析するために R のパッケージ plm をインスツールする パッケージとは通常の R には含まれていない 追加的な R のコマンドの集まりのようなものである R には追加的に 600 以上のパッケージが用意されており それぞれ分析の目的に応じて標準の R にパッケージを追加していくことになる インターネットに接続してあるパソコンで R を起動させ パッケージ パッケージのインスツール ( 適当なミラーサイトを選ぶ どれを選んでもよい 例えば Japan(Tokyo)) OK plm とクリックしていくと自動的にインスツールしてくれる インスツールが終わったら 次に実際に使用できるようにするために > library(plm) と入力する 2. 静学的パネルデータ分析データとしてパッケージ plm に含まれる Grunfeld データと呼ばれるアメリカの有名企業に関するパネルデータを用いる これは 10 の企業 (N=10) に関する 20 期分 (T=20) のデータで 次のような変数を含んでいる inv: 総投資 ( 単位 :100 万ドル ) value: 企業価値 ( 単位 :100 万ドル ) capital: 有形固定資産 ( 単位 :100 万ドル ) 今回はパッケージからデータを読み込むので Working ディレクトリの変更は必要ない 次のように入力する > data("grunfeld",package="plm") 読み込んだデータの最初の 25 行を見るために > head(grunfeld,25) この資料は私の講義で R の使用法を説明するために作成した資料です ホームページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが 間違いがあるかもしれません 間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任は負いかねますのでご了承ください 1

と入力する すると最初の 25 行が表示される 1 行目は変数の名前であり 2 列目は企業番号 (1,,10),3 列目は西暦 (1935,,1954) を表している ( 他のパネルデータを分析する際もデ ータをこのように並べておかなくてはならない つまりまず i=1 を固定し i=1 の t に関するデー タを並べ 並べ終わったら次は i=2 を固定し i=2 の t に関するデータを並べるというような並べ 方を i=1,,n までやるという事 ここで N はクロスセクションの個体数 ) ここでは投資がどのよ うな要因によって決定されるかを分析するとして 以下のモデルを推定する invit = αi + β1 valueit + β2 capitalit + εit i =1,,10, t =1,, 20. このモデルに対してまず pooled OLS で係数 β 1 と β 2 を推定する (pooled OLS とは上記 のモデルにおいて α 1 = α 2 = = α N であると想定して推定したもの これは普通の OLS と同じ ) > result1=plm(inv~value+capital,data=grunfeld,model="pooling") ここで model="pooling" の部分が Pooled OLS で推定を行うということを R に指示している 部分である 結果は > summary(result1) でみることができる Oneway (individual) effect Pooling Model Call: plm(formula = inv ~ value + capital, data = Grunfeld, model = "pooling") Balanced Panel: n=10, T=20, N=200 Residuals : Min. 1st Qu. Median 3rd Qu. Max. -292.0-30.0 5.3 34.8 369.0 Coefficients : Estimate Std. Error t-value Pr(> t ) (Intercept) -42.7143694 9.5116760-4.4907 1.207e-05 *** value 0.1155622 0.0058357 19.8026 < 2.2e-16 *** capital 0.2306785 0.0254758 9.0548 < 2.2e-16 *** Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Total Sum of Squares: 9359900 Residual Sum of Squares: 1755900 R-Squared : 0.81241 Adj. R-Squared : 0.80022 F-statistic: 426.576 on 2 and 197 DF, p-value: < 2.22e-16 Coefficients のところにある Estimate の列が係数の推定値である value の横の数 字が β 1 の推定値 capital の横の数字が β 2 の推定値である 横の Std.Error, t-value 2

は推定量の標準誤差 t- 値である Pr(> t ) は P 値である ここでの F 値はこの 2 つの係数がともに 0 であるという帰無仮説を検定する F 値であり p-value はその P 値である ちなみにこれはただの OLS 推定なので > resultols=lm(inv~value+capital,data=grunfeld) でも同じ推定結果を得る (summary(resultols) で確認してみて下さい ) 次に固定効果モデルの推定を LSDV 推定で行う (LSDV 推定は別名として Within 推定とも呼ばれる ) 以下のように入力する > result2=plm(inv~value+capital,data=grunfeld,model="within") ここで model="within" の部分が LSDV で推定を行うという事を R に指示している部分である 推定結果を見るには先ほどと同様に > summary(result2) と入力する 結果は以下のようになる Oneway (individual) effect Within Model Call: plm(formula = inv ~ value + capital, data = Grunfeld, model = "within") Balanced Panel: n=10, T=20, N=200 Residuals : Min. 1st Qu. Median 3rd Qu. Max. -184.000-17.600 0.563 19.200 251.000 Coefficients : Estimate Std. Error t-value Pr(> t ) value 0.110124 0.011857 9.2879 < 2.2e-16 *** capital 0.310065 0.017355 17.8666 < 2.2e-16 *** Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Total Sum of Squares: 2244400 Residual Sum of Squares: 523480 R-Squared : 0.76676 Adj. R-Squared : 0.72075 F-statistic: 309.014 on 2 and 188 DF, p-value: < 2.22e-16 推定値の見方は先ほどと同様である 個別効果 μ i の推定値を見るには関数 fixef() を用いる > mu=fixef(result2) 3

> summary(mu) Estimate Std. Error t-value Pr(> t ) 1-70.2967 49.7080-1.4142 0.15730 2 101.9058 24.9383 4.0863 4.383e-05 *** 3-235.5718 24.4316-9.6421 < 2.2e-16 *** 4-27.8093 14.0778-1.9754 0.04822 * 5-114.6168 14.1654-8.0913 6.661e-16 *** 6-23.1613 12.6687-1.8282 0.06752. 7-66.5535 12.8430-5.1821 2.194e-07 *** 8-57.5457 13.9931-4.1124 3.915e-05 *** 9-87.2223 12.8919-6.7657 1.327e-11 *** 10-6.5678 11.8269-0.5553 0.57867 Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 一番左の番号が i の番号である 例えば α 1 の推定値は -70.2967, α 3 の推定値は -235.5718 である またそれぞれの t 値は α i = 0 かどうかの t 検定用である 個別効果の平均は > mean(mu) [1] -58.74394 で見ることができる 1 場合によっては個別効果のその平均からの乖離を見たい時がある ( つまり ˆ i N ˆ i = 1 i ここで ˆ は個別効果 α i の推定値 ) これは i > mu2=fixef(result2,type="dmean") とすれば mu2 がそれである 結果は > summary(mu2) Estimate Std. Error t-value Pr(> t ) 1-11.5528 49.7080-0.2324 0.816217 2 160.6498 24.9383 6.4419 1.180e-10 *** 3-176.8279 24.4316-7.2377 4.565e-13 *** 4 30.9346 14.0778 2.1974 0.027991 * 5-55.8729 14.1654-3.9443 8.003e-05 *** 6 35.5826 12.6687 2.8087 0.004974 ** 7-7.8095 12.8430-0.6081 0.543136 8 1.1983 13.9931 0.0856 0.931758 9-28.4783 12.8919-2.2090 0.027174 * 10 52.1761 11.8269 4.4116 1.026e-05 *** Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. となる ここでの t 値は 乖離が 0 かどうか すなわち それぞれの個別効果が個別効果全体の 平均から異なるかどうかを検定している事に注意する必要がある また type として type="dfirst" とすると最初の個別効果との差が出力される N 次に個別効果があるかどうかの F 検定を行うやり方を見てみよう 帰無仮説は 4

H 0 : α 1 = α 2 = = α N ( 全ての個別効果が同じ値である ) である これは pftest() 関数を用いて行う 今 result1 に pooled OLS 推定の結果 result2 に LSDV 推定の結果が保存されているとする この時 この F 検定は > pftest(result2,result1) によって行う (result1 が 2 番目になっている事に注意 ) 結果は F test for individual effects data: inv ~ value + capital F = 49.1766, df1 = 9, df2 = 188, p-value < 2.2e-16 alternative hypothesis: significant effects と表示される F 値が 49.177 であり これは第 1 自由度 9 第 2 自由度 188 の F 分布に従う ( 誤差項が正規分布の場合 これは正確に成り立つ ただし誤差項が正規分布に従わない場合もこの F 検定は (T を固定し N を大きくしたとき ) 漸近的には正しい事が示されている また有限標本でも正規分布を仮定した F 検定とほぼ同じ結果になるのでそのまま F 検定でやっても特に問題ない ) P 値が非常に小さいので 帰無仮説は棄却されることがわかる つまり 個別効果はある ということになる 次に GLS 推定を行う 今回は μ i を確率変数とするので モデルは invit = μi + μα + β1 valueit + β2 capitalit + εit, i =1,,10, t =1,, 20. E(μi) =0, var (μi) = σα 2, E(εit) = 0, var (εit) = σε 2, cov(μi, εit) = 0 となる ( より詳しくはスライド参照 ) 再び関数 plm() を用いる > result3=plm(inv~value+capital,data=grunfeld,model="random") > summary(result3) Oneway (individual) effect Random Effect Model (Swamy-Arora's transformation) Call: plm(formula = inv ~ value + capital, data = Grunfeld, model = "random") Balanced Panel: n=10, T=20, N=200 Effects: var std.dev share idiosyncratic 2784.46 52.77 0.282 individual 7089.80 84.20 0.718 theta: 0.8612 Residuals : Min. 1st Qu. Median 3rd Qu. Max. -178.00-19.70 4.69 19.50 253.00 Coefficients : 5

Estimate Std. Error t-value Pr(> t ) (Intercept) -57.834415 28.898935-2.0013 0.04674 * value 0.109781 0.010493 10.4627 < 2e-16 *** capital 0.308113 0.017180 17.9339 < 2e-16 *** Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Total Sum of Squares: 2381400 Residual Sum of Squares: 548900 R-Squared : 0.7695 Adj. R-Squared : 0.75796 F-statistic: 328.837 on 2 and 197 DF, p-value: < 2.22e-16 推定結果のうち Effects: の部分における var の列で idiosyncratic の横の数字が σ ε 2 の推定値 individual の横の数値が σ α2 の推定値となる また Coefficients : の部分に おける Estimate の列の (Intercept) の横の数値が μ α の推定値 value の横の数値が β 1 の推定値 capital の横の数値が β 2 の推定値である GLS 推定では μ i と説明変数の間に相関があると推定量が一致性を失う ( 今までは相関なしを仮 定していたが ) よってこの相関があるかないかを確かめるのは重要である 相関が 0 という帰無仮 説を検定するための検定としてハウスマン検定と呼ばれる検定がある この検定は以下のように LSDV 推定による推定結果 (result2) と GLS 推定 (result3) による推定結果の 2 つを用い phtest() 関数を用いる事によってできる > phtest(result2,result3) Hausman Test data: inv ~ value + capital chisq = 2.3304, df = 2, p-value = 0.3119 alternative hypothesis: one model is inconsistent 結果を見ると P 値が 0.3119 なので帰無仮説は棄却されないという事になる つまり GLS による 推定は問題ないという事になる 3. 動学的パネルデータ分析データとしてパッケージ plm に含まれる EmplUK データを用いる これは 1976-1984 の 9 年間のイギリスの 140 の企業の就業者数に関するデータで 次の変数を含んでいる emp: 就業者数 (i 番目の企業の t 年度末の値, 単位不明 ) wage: 実質賃金 ( 計算方法は複雑なので省略 単位不明 ) capital: 総資本 ( 計算方法は複雑なので省略 単位不明 ) output: 生産量 ( 計算方法は複雑なので省略 単位不明 ) データを読み込むには > data("empluk",package="plm") と入力する 上記のデータに対して (i =1,,140, t =1,..,9) 以下のモデルを推定してみよう(log は自然対数 ) 6

log(emp it) = α i + β 1 log(emp it 1) + β 2 log(emp it 2) + γ 1log(wage it) + γ 2log(wage it 1) + δ 1 log(capital it 1) + θ 1 log(output it) + θ 2 log(output it 1) +λ t + ε it, i=1,,140, t=3,,9, ( ラグを 2 つとっているので最初の 2 時点のデータが消えることに注意 ) ここで λ t は t 時点の時間 効果を表す このモデルでは説明変数に被説明変数の過去の値 ( ラグ項 ) が入っていることに注 意 このモデルにおいて個別効果を消去するために 1 階の階差を取ると Δlog(emp it) = β 1 Δlog(emp it 1) + β 2 Δlog(emp it 2) + γ 1Δlog(wage it) + γ 2Δlog(wage it 1) + δ 1 Δlog(capital it) + θ 1 Δlog(output it) + θ 2 Δlog(output it 1) +Δλ t + Δε it i=1,,140, t=4,,9, となる (1 階の階差を取ったのでさらに 1 つの時点のデータが使えなくなることに注意 ) ここで Δx it = x it x it 1 である このモデルにおいて説明変数の Δlog(emp it 1) は誤差項 Δε it と相関がある ( ただしもう一つのラグ項 Δlog(emp it 2) は Δε it と無相関 これは先決変数と考えられる ) ので Δlog(emp it 1) に対する操作変数を用いて GMM で推定する これを 1 階階差 GMM 推定とよぶ 1 階 階差 GMM 推定は pgmm() 関数を用いて推定することができる 上記のモデルの場合は > result4=pgmm(log(emp)~lag(log(emp),1:2)+lag(log(wage),0:1)+ +log(capital)+lag(log(output),0:1) lag(log(emp),2:99),data=empluk, +effect="twoways", model="twosteps") と入力することによって推定できる ここで lag(x,k:j) は変数 x の k から j までのらラグ項 x t k,, x t j を含めるということ ちなみに x t k だけを含めるのであれば lag(x,k) となる ) 縦棒 " " の右側の lag(log(emp),2:99) は GMM 推定に追加的に用いる操作変数 ( ここでは 2:99 は emp のラグを 2 時点前から用いるということでこのようになっている 99 の方は特に意味はな く十分な長さであれば何でもよいようである 8( 実際に使える最大の値 ) にしても推定結果は変わ らなかった ) effect="twoways" は ( もともとの ) モデルに個別効果と時間効果両方を入れて いることを意味し ( 個別効果だけであれば effect="individual" とする ) model="twosteps" は 2 段階 GMM で推定していることを意味する 結果は > summary(result4) によって見ることができる また 2 段階 GMM 推定の通常の ( 計算方法で計算した ) 標準誤差は実 際の標準誤差を過小評価する傾向があるため ここではロバストな標準誤差を用いてる 通常の 標準誤差は > summary(result4, robust=false) で見ることができる ( デフォルトでは robust=true になっている ) 推定した時間効果を見るには > summary(result4, time.dummies=true) とする ただし 1 階階差モデルに時間ダミーを入れて推定すると Δλ t が推定されるが ここでの時 7

間効果はモデルの最初の時点 ( 今回の場合は t = 4) の Δλ t を λ t と等しいと仮定して ( 言い換える と最初の時点の 1 つ前の時点の λ t は 0 だと仮定して ) 以後 λ t+1=λ t +Δλ t+1 という関係式より λ s, s>t を推定していることに注意 推定結果には λ t の推定値が出力されている 次に以下のモデルをシステム GMM 推定してみよう log(emp it) = α i + β 1 log(emp it 1) + γ 1log(wage it) + γ 2log(wage it 1) 以下のように入力する + δ 1 log(capital t) + δ 2 log(capital t 1) +λ t + ε it i=1,, N, t=3,,t, > result5=pgmm(log(emp)~lag(log(emp),1)+lag(log(wage),0:1)+ +lag(log(capital),0:1) lag(log(emp),2:99)+lag(log(wage),2:99)+ +lag(log(capital),2:99),data=empluk,effect="twoways", +model="onestep",transformation="ld") ここで tranformation="ld" がレベル式 ("l" は level の l) と階差式 ("d" が difference の d を表す ) を合わせたもの すなわちシステム GMM で推定することを意味する また 先ほどは ( 追加的な ) 操作変数として emp のラグのみを用いたが ここでは wage と capital のラグも用いている 練習問題 (csv ファイルは read.csv() 関数を read.table() 関数と同じように用いて読み込める ) 資料ページの chigin.csv ファイル ( これは 2003 年から 2007 年の地銀 第二地銀 信金 410 社のデータ 1 である ) にある badloan( 不良債権額 ) capgap( 自己資本比率 ) yokin( 預金額 ) public( 公的資本投資ダミー ) kyujin( 本店所在地有効求人倍率 ) listed( 上場ダミー ) keihi( 営業経費 ) というデータを用いて log(badloanit)= αi + β1 log(yokini,t 1)+ β2 capgapi,t 1 +β3 publici,t 1 + β4 kyujinit + β5listedit + β6 keihiit + εit i =1,,410, t =1,,5. というパネルデータモデルに対して Pooled OLS 推定 固定効果モデルの LSDV 推定 個別効果の有無についての F 検定 変量効果モデルの GLS 推定 ハウスマン検定 を行いなさい ここで yokin i, t 1 は i 番目の yokin データの t-1 時点 ( 年 ) の値を表している (capgap i, t 1 および public i, t 1 についても同様 ) 回帰式の説明変数に 1 時点前のデータが含まれていることに注意が必要である 動学的パネルデータ分析のところで出てきたようにラグ項を指定する また 同様に説明変数に不良債権の対数値の 1 期前の値をいれた log(badloanit)= αi + ρ log(badloanit 1)+β1 log(yokini,t 1)+ β2 capgapi,t 1 + β3 publici,t 1 + β4 kyujinit + β5listedit + β6 keihiit + εit というモデルを 1 階階差 GMM システム GMM で推定しなさい 追加的な操作変数としては 1 松浦克己 コリン マッケンジー (2012) EViews による計量経済分析 東洋経済新報社の提供データより 8

log(badloan it) の ( 使用可能な ) 過去の値だけを ( できるだけ多く ) 用いなさい 9