切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Similar documents
様々なミクロ計量モデル†

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - e-stat(OLS).pptx

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

tnbp59-21_Web:P2/ky132379509610002944

日本内科学会雑誌第97巻第7号

日本内科学会雑誌第98巻第4号

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

ビジネス統計 統計基礎とエクセル分析 正誤表

Ł\”ƒ-2005

第90回日本感染症学会学術講演会抄録(I)

日本内科学会雑誌第102巻第4号

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6


プログラム

放射線専門医認定試験(2009・20回)/HOHS‐05(基礎二次)

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

Probit , Mixed logit

スライド 1

データ解析

プログラム

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

回帰分析 重回帰(1)

dae opixrae 1 Feb Mar Apr May Jun と表示される 今 必要なのは opixrae のデータだけなので > opixrae=opixdaa$opi

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

スライド 1

EBNと疫学

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

13章 回帰分析

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft Word - reg.doc

喨微勃挹稉弑

Microsoft PowerPoint - Econometrics

Microsoft Word - mstattext02.docx

回帰分析 単回帰

Microsoft Word - reg2.doc

Microsoft PowerPoint - statistics pptx

基礎統計

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

抄録/抄録1    (1)V

Microsoft Word - 補論3.2

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint ppt

情報工学概論

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

研修コーナー

【指導のポイント】

パーキンソン病治療ガイドライン2002

Excelにおける回帰分析(最小二乗法)の手順と出力

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな


Microsoft PowerPoint - 応用数学8回目.pptx

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

スライド 1

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - Econometrics pptx

_0212_68<5A66><4EBA><79D1>_<6821><4E86><FF08><30C8><30F3><30DC><306A><3057><FF09>.pdf

OCW-iダランベールの原理

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

サーバに関するヘドニック回帰式(再推計結果)

memo

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft Word - 微分入門.doc

景気指標の新しい動向

データ科学2.pptx

13章 回帰分析

講義「○○○○」

Microsoft Word - å“Ÿåłžå¸°173.docx

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

スライド タイトルなし

第86回日本感染症学会総会学術集会後抄録(I)

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

03実習2・松井.pptx

snkp-14-2/ky347084220200019175

zsj2017 (Toyama) program.pdf


_170825_<52D5><7269><5B66><4F1A>_<6821><4E86><5F8C><4FEE><6B63>_<518A><5B50><4F53><FF08><5168><9801><FF09>.pdf

Microsoft PowerPoint - システム創成学基礎2.ppt [互換モード]

GJG160842_O.QXD

本冊子の利用にあたって 本冊子は 能力強化研修で扱う内容を理解する上で助けとなるであろう統計学の基礎事 項を選択肢形式の問題として提示したものです 統計学に不安のある受講生は事前の学 習として活用ください 試験ではないので正答数自体は重要ではありません より効果的な学習 復習となるよ う 次のような

PowerPoint プレゼンテーション

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

Microsoft PowerPoint - GLMMexample_ver pptx


Microsoft Word - Matlab_R_MLE.docx

Microsoft PowerPoint - Econometrics

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D FCD B90DB93AE96402E646F63>

1.民営化

横浜市環境科学研究所

Microsoft Word - appendix_b

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Transcription:

統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない このモデルは あくまでダミー変数をどのように使うかを説明するための非常に簡略化したモデルである ) 2

切片 ( 定数項 ) ダミー 観測されたデータから 最小二乗法によって未知パラメータの α と β を推定する事は難しくない しかしながら 就業年数が賃金に与える影響は 何らかの理由により 男性と女性で異なる可能性がある もしこの仮説が正しいのであれば これはつまり 先ほどの回帰モデルにおいて 男性の場合と女性の場合で α と β の値が異なる事を意味している 3

切片 ( 定数項 ) ダミー このような男女の違いを分析するために 以下の回帰モデルを考えよう : Y i = α + α M D M,i + β X i + u i, i =1,, n, ここで D M,i は以下のような変数である D M,i 1 0 ( i 番目の労働者のデータが男性の場合 ), ( i 番目の労働者のデータが女性の場合 ). この D M,i のような変数の事をダミー変数もしくは単純にダミーと呼ぶ 4

切片 ( 定数項 ) ダミー i 番目の労働者が女性だった場合 D M,i = 0 であるので Y i は Y i = α + β X i + u i によって決定される 切片の値は α である また 男性の場合は D M,i = 1 であるから Y i は Y i = α + α M + β X i + u i によって決定される 切片の値は α + α M である 5

切片 ( 定数項 ) ダミー この 2 つの回帰モデルを比較すると α M いうのはそれぞれ男性と女性の回帰モデルの切片の値の差である事がわかる もし α M が正であれば これは ( 就業年数の影響を除くと ) 男性の賃金の方が平均的に高い事を意味している 負であれば逆の解釈になる 以後この α M を ( 賃金における ) 男性効果 と呼ぶ事にしよう 6

切片 ( 定数項 ) ダミー 先ほどのモデルにおいて 未知係数の α, α M, β は Y i = α + α M D M,i + β X i + u i という回帰モデルの係数を最小二乗法で推定する事により推定する事ができる またこの場合も t 検定によって帰無仮説 H 0 : α M = 0 を通常通り検定することができる この仮説は男性効果が存在しないことを意味している 7

係数ダミー 就業年数が賃金へ与える影響も男性と女性で違う可能性がある この場合賃金関数において就業年数の係数である β の値が男性と女性で異なるという事になる もし そうであるとするならば この β における男性と女性の違いはどのようにとらえることができるだろうか? 8

係数ダミー もし賃金関数において (α に加えて ) β における男女の違いも考慮したい場合は以下の回帰モデルを推定すればよい : Y i = α + α M D M,i + (β + β M D M,i ) X i + u i, = α + α M D M,i + β X i + β M D M,i X i + u i, ここで D M,i は先ほどと同じである この回帰モデルにおいては β M の値が就業年数の影響の男女間の違いを表している このようにダミー変数を入れることをしばしば係数ダミーを入れるという 9

係数ダミー この場合もやはりこの回帰モデルの α, α M, β, および β M は最小二乗法で推定する事ができる この回帰モデルにおける説明変数は 1, D M,i, X i, および D M,i X i の 4 つある事に注意 通常通り t 検定で帰無仮説 H 0 : β M = 0 を検定する事もできる ( また H 0 : α M = 0, β M = 0 も F 検定で検定することができる ) 10

ダミー変数 例題 1: D F,i を i 番目の労働者が女性なら 1, 男性なら 0 を取るダミー変数としよう 以下の回帰モデルを考えよう : Y i = δ + δ F D F,i + γx i + γ F D F,i X i + u i. このモデルにおける δ, δ F, γ, および γ F, を 先ほどの回帰モデルの α, α M, β, および β M を用いて表しなさい 11

2 つ以上のダミー変数 ここまではダミー変数は 1 つだけであったが 分析によっては 2 つ以上のダミー変数が必要となる場合がある 例えば 賃金関数において ブルーカラー ( 肉体労働系の仕事 ) とホワイトカラー ( 事務系の仕事 ) の違いも考慮したいとする この場合は以下の回帰モデルを推定する 12

2 つ以上のダミー変数 ( 以下では説明の簡単化のため 説明変数は定数だけとする ) : Y i = α + α M D M,i + α W D W,i + u i, i =1,, n. ここで D W,i はもし i 番目の労働者がホワイトカラーなら 1 をとり ブルーカラーなら 0 を取るダミー変数とする この回帰モデルは 労働者のカテゴリー ( ダミー変数の値 ) によって 以下の 4 つの回帰モデルになる : 13

2 つ以上のダミー変数 ( ホワイトカラーで男性の場合 ; D W,i = 1, D M,i = 1) Y i = α + α M + α W + u i, ( ブルーカラーで男性の場合 ; D W,i = 0, D M,i = 1) Y i = α + α M + u i, ( ホワイトカラーで女性の場合 ; D W,i = 1, D M,i = 0) Y i = α + α W + u i, ( ブルーカラーで女性の場合 ; D M,i = 0, D W,i = 0) Y i = α + u i. 14

2 つ以上のダミー変数 これら 4 つの回帰モデルを比べると α M は男女間の違いを反映しており α W はブルーカラーとホワイトカラーの違いを反映している事がわかる これら 2 つの値の解釈の仕方は先ほどのダミー変数が 1 つの時の解釈の仕方と同じである ( すなわち α M が正であれば 男性であると女性より α M だけ賃金が高い事を表すことになる ) 15

相互作用効果 上記の回帰モデルにおいて α W は ホワイトカラーである事の効果 を反映していたが 暗黙のうちに この ホワイトカラーである事の効果 は男性の場合も女性の場合も同じであると仮定していた しかしながら ( 何らかの理由により ) この効果も男性と女性で異なるかもしれない 16

相互作用効果 このような違いを分析するには 以下の回帰モデルを考えればよい : Y i = α + α M D M,i + (α W + α WM D M,i ) D W,i + u i, = α + α M D M,i + α W D W,i + α MW D M,i D W,i + u i. この回帰モデルに ( 暗黙のうちに ) 含まれる 4 つの回帰モデルは : 17

相互作用効果 ( ホワイトカラーで男性 ; D W,i = 1, D M,i = 1) Y i = α + α M + α W + α WM + u i, ( ブルーカラーで男性 ; D W,i = 0, D M,i = 1) Y i = α + α M + u i, ( ホワイトカラーで女性 ; D W,i = 1, D M,i = 0) Y i = α + α W + u i, ( ブルカラーで女性 ; D W,i = 0, D M,i = 0) Y i = α + u i. 18

相互作用効果 最初の回帰モデル ( ホワイトカラーで男性 ) に追加的な項である α WM が出てきたのが確認できる この数値は 男性におけるホワイトカラーである事の追加的な効果 を表している この追加的な効果である α WM を相互作用効果と呼ぶ 19

相互作用効果 これらの 4 つの未知パラメーター α, α M, α W, α WM は最小二乗法で推定する事ができ 通常通り t 検定や F 検定を行う事ができる 帰無仮説としては例えば, H 0 : α M = 0 ( 男性効果 は存在しない ), や H 0 : α W = 0 ( ホワイトカラー効果は存在しない ), や H 0 : α WM = 0 ( 男性への追加的なホワイトカラー効果 は存在しない ) などである 20

3 つ以上のカテゴリーに分けられるダミー変数 ここまでは ダミー変数として カテゴリーの数が 2 つしかないもの ( 男性か女性 ホワイトカラーかブルーカラー ) を見てきた しかしながら 実際の分析において カテゴリーの数が 3 つ以上ある場合がある 例として あるテストにおける 勉強時間の試験の点数への効果 を考えてみよう 21

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 次の級 人数 ダミー変数 以下はある科目におけるある中間試験のために勉強した時間に関するアンケートの結果である 14 12 10 勉強時間のヒストグラム 8 6 4 2 0 勉強時間 22

3 つ以上のカテゴリーに分けられるダミー変数 試験における勉強時間の効果を見るために これらを以下の 3 つのカテゴリーに分けるとする グループ 1: 勉強時間が 9 時間未満 グループ 2: 勉強時間が 9 時間以上 18 時間未満 グループ 3: 勉強時間が 18 時間以上 ( この分け方はあくまで一つの例で深い意味はない ) 23

3 つ以上のカテゴリーに分けられるダミー変数 これらのグループ分けに対して以下の回帰モデルを考えよう : ここで Y i = α + α 2 S 2,i + α 3 S 3,i + u i, i = 1,, n, Y i : i 番目の学生の試験の点数 S 2,i : i 番目の学生がグループ 2 なら 1 そうでないなら 0 を取るダミー変数 S 3,i : i 番目の学生がグループ 3 なら 1 そうでないなら 0 を取るダミー変数 とする この回帰モデルは以下の 3 つの回帰モデルを暗黙に含んでいる 24

3 つ以上のカテゴリーに分けられるダミー変数 ( グループ 3: 勉強時間が 18 時間以上の学生 ) Y i = α + α 3 + u i, ( グループ 2: 勉強時間が 9 時間以上 18 時間未満の学生 ) Y i = α + α 2 + u i, ( グループ 1: 勉強時間が 9 時間未満の学生 ) Y i = α + u i. この場合は相互作用効果は考えられない事に注意 ( 勉強時間が 9 時間未満 かつ 18 時間以上というような学生は存在しない ) 25

例題 2: 勉強時間効果 に加え 講義出席率効果 も考えよう P i を i 番目の学生の講義出席率が 50% 以上なら 1 そうでないなら 0 をとるダミー変数とする 勉強時間効果 と 講義出席率効果 があるかどうかを同時に確かめるためにはどのような回帰モデルを考えればよいか? またその回帰モデルにおいて 講義出席率効果 があるかどうかを見るにはどのような帰無仮説を検定すればよいか? 相互作用効果も合わせて考えなさい 26