様々なミクロ計量モデル†

Similar documents
切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Probit , Mixed logit

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft Word - 補論3.2

Microsoft Word - Matlab_R_MLE.docx

講義「○○○○」

基礎統計

Microsoft Word - Time Series Basic - Modeling.doc

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

まず y t を定数項だけに回帰する > levelmod = lm(topixrate~1) 次にこの出力を使って先ほどのレジームスイッチングモデルを推定する 以下のように入力する > levelswmod = msmfit(levelmod,k=,p=0,sw=c(t,t)) ここで k はレジ

Microsoft PowerPoint - sc7.ppt [互換モード]

Ł\”ƒ-2005

Microsoft Word - 微分入門.doc

第90回日本感染症学会学術講演会抄録(I)

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

PowerPoint Presentation

第86回日本感染症学会総会学術集会後抄録(I)

平成 年 月 7 日 ( 土 第 75 回数学教育実践研究会アスティ 45 ビル F セミナールーム A 札幌医科大学 年 P ab, を正の定数とする 平面上において ( a, を中心とする円 Q 4 C と (, b を中心とする円 C が 原点 O で外接している また P を円 C 上の点と

データ解析

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft Word - thesis.doc

スライド 1

memo

SAP11_03

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

tnbp59-21_Web:P2/ky132379509610002944

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

基礎数理 ()Aさんは確定拠出年金の加入者となった 投資商品は収益率がそれぞれ独立な正規分布 N(7, σ ), N(, σ y ) に従う,Y から選択することとした の過去 8 年間の収益率の実績は {8,,,5,,-,6,}(%) Y の過去 6 年間の収益率の実績は {,,,4,,}(%)

日本内科学会雑誌第98巻第4号

日本内科学会雑誌第97巻第7号

統計学的画像再構成法である

スライド 1

Microsoft Word - reg.doc

Microsoft Word - reg2.doc

抄録/抄録1    (1)V

2011年度 大阪大・理系数学

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

研修コーナー

パーキンソン病治療ガイドライン2002

パソコンシミュレータの現状

dae opixrae 1 Feb Mar Apr May Jun と表示される 今 必要なのは opixrae のデータだけなので > opixrae=opixdaa$opi

ベイズ統計入門

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

スライド 1

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - e-stat(OLS).pptx

N cos s s cos ψ e e e e 3 3 e e 3 e 3 e

Microsoft PowerPoint - mp11-02.pptx

201711grade1ouyou.pdf

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 測量学.ppt [互換モード]

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

Microsoft PowerPoint - stat-2014-[9] pptx

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - Inoue-statistics [互換モード]

Microsoft PowerPoint - 応用数学8回目.pptx

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

Microsoft PowerPoint - Statistics[B]

日心TWS

本文/目次(裏白)

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

ビジネス統計 統計基礎とエクセル分析 正誤表

OCW-iダランベールの原理

_KyoukaNaiyou_No.4

DVIOUT

Microsoft PowerPoint - 第3回2.ppt

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - ch04j

喨微勃挹稉弑

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

‚åŁÎ“·„´Šš‡ðŠp‡¢‡½‹âfi`fiI…A…‰…S…−…Y…•‡ÌMarkovŸA“½fiI›ð’Í

DVIOUT-SS_Ma

Microsoft PowerPoint - statistics pptx

社会保険料の賃金への影響について

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

2011年度 筑波大・理系数学

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - å“Ÿåłžå¸°173.docx

日本内科学会雑誌第102巻第4号

y = x x R = 0. 9, R = σ $ = y x w = x y x x w = x y α ε = + β + x x x y α ε = + β + γ x + x x x x' = / x y' = y/ x y' =

数値計算法

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

Microsoft Word - 量子化学概論v1c.doc

O x y z O ( O ) O (O ) 3 x y z O O x v t = t = 0 ( 1 ) O t = 0 c t r = ct P (x, y, z) r 2 = x 2 + y 2 + z 2 (t, x, y, z) (ct) 2 x 2 y 2 z 2 = 0

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

1

ディジタル信号処理

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

構造方程式モデリング Structural Equation Modeling (SEM)

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6

Transcription:

担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1

カウントデータモデル 労働経済学などで扱うデータには連続変数ではなく離散変数 特に非負の整数の値を取るデータが多い 例えば ある個人による通院の回数などは非負の整数のデータである このようなデータはカウントデータと呼ばれる そのような変数をその性質を考慮しないで たとえば線形回帰分析などを行うと いろいろと不都合なことが起きる 以下ではこのようなデータを扱うのに適したミクロ計量モデルを紹介する 2

ポアソン分布 カウントデータのような非負の整数の値を取る離散型の分布の代表的なものにポアソン分布がある 確率変数 Y がポアソン分布に従うとは Y の確率関数が以下のように与えられる時である Pr(Y = y) = exp( ) y! y, y = 0, 1, 2, ここで λ は正の実数である ( 整数ではないことに注意 ) この分布の期待値は λ で与えられ 分散も λ で与えられる 以下では確率変数 Y がパラメーター λ のポアソン分布に従うことを Y ~ Po(λ) と表すとする 3

ポアソン回帰モデル 前述のポアソン分布においては期待値は λ で一定である より柔軟性のあるモデルにしたい場合 特に説明変数による影響を考えたい場合 この仮定は制約的である 例えば線形回帰分析などは 被説明変数 Y i の期待値を説明変数の線形の関数でモデル化していると考えることができるが 同じような拡張をポアソン分布に対して行ったものがポアソン回帰モデルと呼ばれるモデルである 4

線形回帰分析の時と同様に ポアソン分布の期待値 λ を説明変数の関数として表すことを考える ただし λ は常に正の値をとらないといけないので ポアソン回帰モデルでは それを考慮して λ i = exp(β 0 + β 1 X 1i + + β K X Ki ), のように定式化する このように定式化すると λ i は各説明変数 X ki の値に依存して変わり また X ki の値によらず正の実数をとる λ i の定式化としては 分析の目的に応じて他の定式化を使用することも可能であるが 上記の定期化が非常によく用いられる 5

よって非負の整数の値をとる被説明変数 Y i に対するポアソン回帰モデルは以下で与えられる Pr(Y i = y) = λ i = exp(β 0 + β 1 X 1i + + β K X Ki ) λ i の部分は exp( ) i y! y i, y = 0, 1, 2,. log λ i = β 0 + β 1 X 1i + + β K X Ki と書き直すこともできる 6

最尤法によるポアソン回帰モデルの推定 ポアソン回帰モデルは最尤法で簡単に推定できる β = [β 0, β 1,.., β K ] T とすると 実現値 y 1, y 2,., y n が与えられた下での 対数尤度関数は log L(β) i= 1 λ i = exp(β 0 + β 1 X 1i + + β K X Ki ) によって与えられる n = log Pr( Y = y ) i n n n = + y log y! i i i i i= 1 i= 1 i= 1 i 7

最大化の 1 階の条件は log L( β) n = X + y X = 0, k = 0,..., K ki i i ki k i= 1 i= 1 n である ここで X 0i = 1 とする この連立方程式は β について明示的には解けないので ポアソン回帰モデルの最尤推定値は数値的に求めることになる 8

例題 1 ポアソン回帰モデル Y i ~ Po(λ i ), λ i = exp(β 0 + β 1 X i ) を考える ここで X i は i 番目の観測値に対する説明変数である Y i, i =1,,n は λ i が与えられたもとで互いに独立であるとする 今 n = 3 であり X i と Y i の観測値として X 1 = 1, X 2 = 1, X 3 = 1, y 1 = 5, y 2 = 4, y 3 = 3 が与えられたとする この時 β 0 と β 1 の最尤推定値を求めなさい 9

デュレーションモデル デュレーションモデルとは何らかのイベントが起こる ( または終わる ) までの時間を分析したい場合によく用いられる 例えば 病気が治癒するまでの時間 製品が故障するまでの時間 失業が続く期間 などの分析である デュレーション分析は生存時間分析などとも呼ばれる 10

生存関数 確率変数 T は非負の実数とする ここで T はあるイベントが続いた時間を表すと解釈しよう T の分布関数 F(t) = Pr(T t) はこのイベントが続く時間が t 以下になる確率 言い換えると ( 時点 0 から始まった ) このイベントが時点 t までに終わる確率を表している この時 S(t) = 1 F(t) と定義される関数 S(t) は生存関数と呼ばれる S(t) はこのイベントが続く時間が t より大きくなる確率 つまりこのイベントが時点 t になっても続いている確率 を表している 11

ハザード関数 Δt を任意の小さな値を表すとする このイベントが続く時間が t 以上 t + Δt 以下となる確率は Pr(t < T t + Δt ) = F(t + Δt) F(t) である これは無条件確率であることに注意しよう 今 興味のある確率として このイベントが時点 t まで続いたという条件付きでさらに非常に小さな時間 Δt 続く確率を考えたいとする これは Pr(t < T t + Δt T t ) = と表すことができる F( t + t) F( t) St () 12

ここでこの条件付き確率と Δt の比 Pr( t T t + t T t) F( t + t) F( t) 1 = t t S() t を考え この比が Δt 0 の時にどのように表せるか考える これは条件付き分布関数の点 t における ( 右から極限を取った ) 傾きと解釈できる T の確率密度関数を f(t) とすると この極限は F( t + t) F( t) 1 f ( t) ht ( ) = lim = t 0 t S( t) S( t) と表すことができる これをハザード関数と呼ぶ デュレーション分析ではしばしばこのハザード関数をモデル化する 13

ウェイブル分布 T の分布として ウェイブル分布を考える ウェイブル分布の分布関数は以下で与えられる F(t ; β, α) = 1 exp( (βt) α ) ここで β > 0 である よってその密度関数 生存関数 ハザード関数はそれぞれ f (t ; β, α) = αβ α t α 1 exp( (βt) α ) S(t) = exp( (βt) α ) h(t) = αβ α t α 1 で与えられる 14

ウェイブル分布のハザード関数の性質 t が増加した時 ハザード関数が減少していく場合 負のデュレーション依存があるといい 増加していく場合 正のデュレーション依存があるという またハザード関数が t に依存しないときはデュレーション独立と呼ぶ ウェイブル分布場合は α < 1 負のデュレーション依存 α > 1 正のデュレーション依存 α = 1 デュレーション独立となる 15

対数正規分布 確率変数 Y の分布が対数正規分布であるとは log Y ~ N(μ, σ 2 ) となる分布のことである ウェイブル分布のハザード関数は t についての単調関数であり やや制約的である 実際の分析では ハザード関数が t が大きくなるにつれて 当初は増加するが 次第に減少に転じるような場合がよく観測される そのようなハザード関数はウェイブル分布のハザード関数では表現できないため 他の分布を用いる必要がある そのような分布としてよく用いられるのが対数正規分布である 16

対数正規分布の分布関数 密度関数 生存関数 ハザード関数は 1 F( t) = (log t ) 1 1 f ( t) (log t ) t = 1 1 S( t) = 1 (log t ) = (log t ) 1 ((log t ) / ) ht () = t (log t ) / ( ) で与えられる ここでΦ(.) および (.) はそれぞれ標準正規分布の分布関数と密度関数である 17

デュレーションモデルの最尤推定 T i を i 番目のデュレーションで確率変数とする また t i を i 番目のデュレーションの観測値とする T i は X i という説明変数ベクトルで条件付けした場合 条件付きで独立であるとし その条件付き密度関数は f (t i ; X i, θ) で与えられるとする ここで θ は未知パラメーターベクトルである この時 一般的に尤度関数は n log L( θ) = log f ( t ; X, θ) i= 1 i と書け これを最大化する未知パラメーター θ の値を求めれば最尤推定値が得られる i 18

例えばウェイブル分布において i 番目の分布の β を β = β i = exp(β 0 + β 1 X 1i + + β K X Ki ) とすると 先ほどのウェイブル分布の密度関数より f (t i ; X i, θ) = f(t i ; α, β 0,, β K ) = αβ iα t i α 1 exp( (β i α t iα )) である ここで β iα = exp(αβ 0 + αβ 1 X 1i + + αβ K X Ki ) であるので γ k = αβ k とすれば f (t i ; X i, θ) = f(t i ; α, γ 0,, γ K ) = αβ i t i α 1 exp( (β i t iα )) β i = exp(γ 0 + γ 1 X 1i + + γ K X Ki ) という表現を得ることもできる 19

よってその対数尤度関数は L 0 K = n + i + ti t i i i= 1 i= 1 i= 1 β i = exp(γ 0 + γ 1 X 1i + + γ K X Ki ) log (,,..., ) log log ( 1) log で与えられる n n n 20

例題 2 対数正規分布の分布関数 密度関数 生存関数 ハザード関数が前述のように得られることを確認しなさい 例題 3 デュレーション T i が log T i ~ N(μ, σ 2 ) の対数正規分布に従っている時 T i = t i が観測された時の μ, σ 2 についての対数尤度関数を書きなさい 21