Probit , Mixed logit

Similar documents
Microsoft Word - 補論3.2

スライド 1

様々なミクロ計量モデル†

ベイズ統計入門

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

ビジネス統計 統計基礎とエクセル分析 正誤表

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

講義「○○○○」

評価点の差と選択率 実際には ほとんど評価点が同じときは, どちらも選択される可能性がある 評価点の差が大きいときは, 片方しか選ばれない. A が圧倒的に劣る A が選ばれることはほとんどない 選択肢 A が選ばれる可能性 0 つは同じ魅力 0% ずつ A が圧倒的に良いほとんど A だけが選ばれ

U U U car Vcar car bus Vbus bus rail Vrail bus 多項ロジットモデル ε~iidガンベル 2 独立で (Independently) 同一 (Identically) の分散を持つ 0 分布 (Distributed) 0 Cov(U)

memo

Microsoft Word - Time Series Basic - Modeling.doc

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

基礎統計

統計的データ解析

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

PowerPoint Presentation

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

2014 BinN 論文セミナーについて

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - statistics pptx

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

第7章

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

データ解析

景気指標の新しい動向

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft Word - Matlab_R_MLE.docx

PowerPoint プレゼンテーション

Medical3

Microsoft Word - reg2.doc

スライド 1

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft Word - å“Ÿåłžå¸°173.docx

(Compton Scattering) Beaming 1 exp [i (k x ωt)] k λ k = 2π/λ ω = 2πν k = ω/c k x ωt ( ω ) k α c, k k x ωt η αβ k α x β diag( + ++) x β = (ct, x) O O x

統計学的画像再構成法である

第3章 離散選択分析

Microsoft PowerPoint - Statistics[B]

医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. このサンプルページの内容は, 第 2 版 1 刷発行時のものです.

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

y = x x R = 0. 9, R = σ $ = y x w = x y x x w = x y α ε = + β + x x x y α ε = + β + γ x + x x x x' = / x y' = y/ x y' =

数値計算法

パソコンシミュレータの現状

パーキンソン病治療ガイドライン2002

統計学の基礎から学ぶ実験計画法ー1

研修コーナー

画像処理工学

Microsoft Word - eviews6_

Microsoft Word - Stattext07.doc

Microsoft PowerPoint - 7依田高典 ppt[読み取り専用]

ii 3.,. 4. F. ( ), ,,. 8.,. 1. (75% ) (25% ) =7 24, =7 25, =7 26 (. ). 1.,, ( ). 3.,...,.,.,.,.,. ( ) (1 2 )., ( ), 0., 1., 0,.

経済統計分析1 イントロダクション

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Excelにおける回帰分析(最小二乗法)の手順と出力

スライド 1

情報工学概論

スライド 1

PowerPoint プレゼンテーション

Microsoft Word - Stattext13.doc

本文/目次(裏白)

横浜市環境科学研究所

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

日心TWS

Microsoft Word - thesis.doc

A = A x x + A y y + A, B = B x x + B y y + B, C = C x x + C y y + C..6 x y A B C = A x x + A y y + A B x B y B C x C y C { B = A x x + A y y + A y B B

<4D F736F F D208CF68BA48C6F8DCF8A C30342C CFA90B68C6F8DCF8A7782CC8AEE967B92E8979D32288F4390B394C529332E646F63>


<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

第6章 確率的利用者均衡モデル

Microsoft Word - reg.doc

N cos s s cos ψ e e e e 3 3 e e 3 e 3 e

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Variational Auto Encoder

0415

<4D F736F F D2094F18F578C B82CC8F578C768CEB8DB72E646F63>

「稲作における規模間生産性格差について」

ワースペクトルの離散フーリエ逆変換として以下の式で 与えられる XkY k rm IDFT Xk Y k 信号の位相スペクトルが 変量確率分布に従う場合 の POC 関数の統計的性質 3 3. 著者らのグループがこれまでに行ってきた POC 関数の XkY k W mk Xk Y k 統計的解析では

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - Econometrics pptx

構造方程式モデリング Structural Equation Modeling (SEM)

Transcription:

Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1

0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2

1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため, 中心極限定理により, 正規分布を仮定するのは自然な発想. 3

1.Probit 概要 ロジットモデルの限界 1 パラメータで個人の嗜好が考慮できない 2IIA 特性 3 非観測項が意思決定者ごとに時間相関がある場合に利用できない. GEV モデルの導入により,2 については緩和することができた. 4

1.Probit 概要 Probit モデルの場合, 3 つのこと全てについて取り扱える. 1 各個人についてランダムなパラメータを扱える. 2 あらゆる代替パターンを許容する. 3 時間相関誤差のあるデータに適用可能 5

1.Probit 概要 Probit モデルの制約 効用の非観測要素すべてに正規分布の仮定が必要. 基本的には十分な表現が可能であるが, 時々不適切な推定となってしまう. Ex) 価格係数について正の価格係数を持つ人ができてしまう. 6

2.Probit の定式化と理解 効用関数の設定 確定項と確率項に分ける U nj = V nj + ε nj n: 個人を表す j: 選択肢を表す (j J) ε nj を要素に持つベクトル ε n を導入する ε n = (ε n1,, ε nj ) 7

2.Probit の定式化と理解 誤差項ベクトル ε n が平均ベクトル 0, 分散共分散行列 Ω の正規分布に従うとして,ε n の密度関数は φ ε n = 1 2π J/2 Ω 1 e 2 ε n Ω 1 ε n 1/2 (Ω は実際は個人 n によって異なるが添え字を省略している ) 8

2.Probit の定式化と理解 選択確率は P ni = Prob(V ni + ε ni > V nj + ε nj j i) = Prob(V nj < ε ni + V ni ε nj j i) ε ni +V ni ε n1 = න න ε n1 = ε ni = ε ni +V ni ε njφ න εn dε nj dε n1 ε nj= ε ni についての積分は確率密度関数を全範囲積分している. 9

2.Probit の定式化と理解 選択確率 ε ni +V ni ε n1 P ni = න න ε n1 = ε ni = ε ni +V ni ε njφ න εn dε nj dε n1 ε nj= は (J-1) 次の積分となる. したがってプロビットモデルはオープンフォームであり, シミュレーション法などで推定することとなる. 10

3.Probit の推定 1.AR シミュレータ (accept-reject) 個人 n の選択肢 i の選択確率を求める. (1) 平均 0, 分散共分散行列 Ω の正規分布から,J 次元誤差項ベクトルを取り出して r を用いてラベリングする. ε n r : r は順番を表す,1 回目なら r=1 (2) 誤差項の値を用いて各選択肢の効用を計算する. U r nj = V nj + ε r nj j 11

3.Probit の推定 (3) 選択肢 iの効用が他のすべての効用より大きいかどうかを調べる. I r という値を定義し, U r ni r > U nj それ以外のとき,I r = 0 (reject) と置く. j i のとき,I r = 1 (accept) (4) (1)~(3) までを何度も繰り返し, 繰り返し回数を R とする 12

3.Probit の推定 (5) シミュレーション確率はacceptの割合として求められる. P ni = 1 R I r r=1 (6) 尤度関数を定義し, 尤度を計算する. シミュレーション対数尤度関数 SLL = d nj log P nj d nj j を選択したかどうかのダミー変数 n j R 13

3.Probit の推定 AR シミュレータの弱点シミュレーション確率 P in は R がどのような値であっても 0 となる可能性がある. 対数尤度関数が定義不可能なケース シミュレーション確率はパラメータに対して滑らかな関数とならない 微分不可能となり, 最尤推定ができない 14

3.Probit の推定 Smoothed AR シミュレータ効用から選択を求める際にロジット関数を導入 (1) 平均 0, 分散共分散行列 Ω の正規分布から,J 次元誤差項ベクトルを取り出して r を用いてラベリングする. ε n r : r は順番を表す,1 回目なら r=1 (2) 誤差項の値を用いて各選択肢の効用を計算する. U r nj = V nj + ε r nj j 15

3.Probit の推定 (3) 以下のロジット関数に効用を入れて計算する λ はスケールを表す S r = eu ni r /λ σ j e U nj r /λ (4) (1)~(3) までを何度も繰り返し, 繰り返し回数を R とする 16

3.Probit の推定 (5) シミュレーション確率はロジット関数の平均として求められる. P ni = 1 R S r r=1 (6) 尤度関数を定義し, 尤度を計算する. シミュレーション対数尤度関数 SLL = d nj log P nj d nj j を選択したかどうかのダミー変数 n j R 17

4.Mixed logit の概要 Mixed logit とは 誤差項に正規分布を仮定したプロビット系列のモデルと誤差項にガンベル分布を仮定したモデルを組み合わせたもの. MNL の選択確率のパラメータを確率分布によって扱うことによって母集団内でのばらつきを表現できる. 誤差項相関や異分散性を表現することが可能である. 18

5.Mixed logit の定式化と理解 選択確率式は P ni = න L ni β f β dβ L ni β = J σ j=1 ev ni(β) L ni (β): ロジット型確率 V ni (β): 効用の確定部分 (β の関数 ) f(β): 確率密度関数 β ランダム係数 e V nj(β) 19

5.Mixed logit の定式化と理解 Mixed logit β によって評価されたロジット型確率式 L ni と確率分布としての f(β) の組み合わせ 実際には β の密度関数 f(β) が θ で表されるため, P ni = න L ni β f β θ dβ となり,θ の関数としてあらわされる. 20

5.Mixed logit の定式化と理解 密度関数 f(β) に関して f(β) は離散, 連続どちらもありうる ( ただし多くの場合で連続型を用いる ) f β の平均を b とすると f β = 1 for β = b, 0 for β b となるとき, 通常のロジットモデルとなる. 21

5.Mixed logit の定式化と理解 パラメータが個人 n によって異なると考えるとき個人ごとに異なる β n は実際に観測することはできない. 確率密度関数 f(β) によって表現する. 個人 n が J 個の選択肢から選択肢 j を選択したときの効用 U nj = β n x nj + ε nj (β n は個人によって異なり,f(β) に従うとする ) 22

5.Mixed logit の定式化と理解 β n が定数であるとすれば確率式はロジットモデルと同様に考えて, と書くことができる. L ni = eβ n x ni σ j e β n x nj 実際には β n が f(β) に従って変動するため,β に対して積分の必要がある. 23

5.Mixed logit の定式化と理解 したがって確率式は以下のようになる P ni = න eβ n x ni σ j e β n x nj f β dβ 24

5.Mixed logit の定式化と理解 異なる選択肢間の誤差項の相関を考える場合 U nj = α x nj + μ n z nj + ε nj x nj, z nj : j に関する観測値ベクトル α: 固定された係数ベクトル μ 平均 0 の変動する係数ベクトル ε nj iid の誤差項 25

5.Mixed logit の定式化と理解 z nj の項も誤差項で ε nj と合わせて効用の確率項と考えられる. η nj = μ n z nj + ε nj Cov η ni, η nj = E μ n z nj + ε nj μ n z ni + ε ni = z nj Wz ni 26

5.Mixed logit の定式化と理解 NestedLogit のアナロジー ダミー変数の導入 K μ n z nj = μ nk d jk k=1 d jk : 選択肢 j がネスト k に含まれていれば 1, そうでなければ 0 μ nk ~N(0, σ k ) とする効用は U nj = α x nj + μ nk d jk + ε nj K k 27

5.Mixed logit の定式化と理解 ネスト k に含まれる選択肢の共分散は Cov η ni, η nj = E μ k + ε ni μ k + ε nj = σ k Var η ni = E μ k + ε ni 2 = σ k + π2 6 したがってネスト k 内の相関係数は σ k σ k + π2 6 28

5.Mixed logit の定式化と理解 全てのネストにおいて各ネストの誤差項の分散が等しいとすると, ( すなわち,σ k = σ, k = 1 K) ネストロジットにおいて, ログサム変数がすべてのネストに対して等しくなるということを意味している. 29

5.Mixed logit の定式化と理解 Mixed logit = IIA 特性がない P ni /P nj は選択肢 i,j 以外を含む全データに依存する. ほかの選択肢のm 番目の特性が変化したときの選択確率の変化は E nixnj m = x m nj න β m L P ni β L nj β f β dβ ni = x m nj න β m L nj β L ni β P ni f β dβ 30

6.Mixed logit の推定 改めて選択確率を示すと P ni = න L ni β f β θ dβ L ni β = eβ x ni σe β x nj であり, 確率は θ が与えられれば計算可能である. 31

6.Mixed logit の推定 以下に推定の流れを示す. (1) 確率密度関数 f(β θ) をもとにランダムにβを一つ取り出し,β r とラベリングする.(rは順番を表す.1 回目ならr=1) (2) 取り出したβ r を用いてL ni (β r ) を計算する. (3)1,2を何度も繰り返し,L ni β r の平均を取る R P ni = 1 R r=1 L ni (β r ) 32

6.Mixed logit の推定 R P ni = 1 R r=1 L ni (β r ) P ni > 0 なので ln P ni が定義可能 Simulated log likelihood( 対数尤度関数 ) N J SLL = d nj ln P nj n=1 j=1 SLL を最大化する密度関数のパラメータ θ を求める 33