U U U car Vcar car bus Vbus bus rail Vrail bus 多項ロジットモデル ε~iidガンベル 2 独立で (Independently) 同一 (Identically) の分散を持つ 0 分布 (Distributed) 0 Cov(U)

Similar documents
Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

スライド 1

Probit , Mixed logit

Microsoft PowerPoint - 夏の学校2018配布用佐々木.pptx

PowerPoint プレゼンテーション

ベイズ統計入門

基礎統計

評価点の差と選択率 実際には ほとんど評価点が同じときは, どちらも選択される可能性がある 評価点の差が大きいときは, 片方しか選ばれない. A が圧倒的に劣る A が選ばれることはほとんどない 選択肢 A が選ばれる可能性 0 つは同じ魅力 0% ずつ A が圧倒的に良いほとんど A だけが選ばれ

Microsoft Word - 補論3.2

EBNと疫学

講義「○○○○」

Microsoft PowerPoint - e-stat(OLS).pptx

PowerPoint プレゼンテーション

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

統計的データ解析

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

様々なミクロ計量モデル†

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

生命情報学

数値計算法

カイ二乗フィット検定、パラメータの誤差

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

ビジネス統計 統計基礎とエクセル分析 正誤表

memo

情報工学概論

日心TWS

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - 資料3 BB-REVIEW (依田構成員).ppt

Microsoft Word - Time Series Basic - Modeling.doc

データ解析

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

2014 BinN 論文セミナーについて

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - reg2.doc

Microsoft PowerPoint - 資料04 重回帰分析.ppt

スライド 1

第7章

Microsoft Word - NumericalComputation.docx

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

スライド 1

Microsoft PowerPoint - stat-2014-[9] pptx

以下のように整理できる ( 個人の添え字 n は省略 ). Ordered Logit exp Z exp Z exp Z exp Z Ordered Probit P P F Z P P F Z F Z P 3 P3 F Z あとは通常の MNL と同様, 以下の尤度関数を最大化すればよい. L

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - sc7.ppt [互換モード]

Variational Auto Encoder

< E6D6364>

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Microsoft Word - reg.doc

Microsoft Word - Matlab_R_MLE.docx

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

1.民営化

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

統計学の基礎から学ぶ実験計画法ー1

PowerPoint プレゼンテーション

SAP11_03

Title

スライド 1

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

不偏推定量

Microsoft Word doc

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

解析センターを知っていただく キャンペーン

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft PowerPoint - 03ModelBased.ppt

パソコンシミュレータの現状

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

統計学的画像再構成法である


 

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

Microsoft Word - Stattext13.doc

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

PowerPoint プレゼンテーション

Microsoft PowerPoint - ch04j

スライド 1

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

スライド 1

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

研修コーナー

RP/SPモデル推定のための SP調査の最適設計

パーキンソン病治療ガイドライン2002

スライド 1

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

Transcription:

ral ral 多項ロジットモデル ε~iidガンベル 独立で (Iply) 同一 (Ially) の分散を持つ 分布 (Dsrbu) Cov() 6 愛媛大学倉内慎也 kurauh@.hm u.a.jp.5.5..35.3.5..5..5 f(ε) ε -3 -.5 - -.5 - -.5.5.5.5 3 3.5.5 5 図. 正規分布とガンベル分布の確率密度関数 f xp xp xp F ε xp xp με η 多項ロジットモデル los-formであるため計算が容易 便益計算が簡便 jc xp xp j ロジットモデルと IIA 特性 無関係な選択肢からの選択確率の独立 (Ip from Irrlva Alravs) C A xp xp C ral C ral walk bk C xp xp xp ral xp xp xp xp xp xp xp ral ral A walk ral A A 選択確率の比は無関係な選択肢 (walkbk) に影響を受けない bk 3 Bfor IIA 特性の問題点 () 赤バス () 車 () / / Afr BB BB 赤バス () 青バス (BB) 車 () / / / ロジットモデル /3 /3 /3

IIA 特性の問題点 () Bfor Afr バス () 車 () 鉄道 (ral) バス () 車 () % 6% % 3% 8% % % IIA 特性の問題を避けるには 誤差項間に相関が生じないようにする 調査等で影響要因を観測 確定項の関数型等の工夫 誤差項には確定項で説明で ral きない要因が含まれる ral 交差弾性値が等しい 誤差相関を明示的に考慮したモデルの適用 効用関数の特定化の工夫 () 個人間の異質性を考慮 個人属性をたくさん入れる / セグメンテーションを行う mal 女性の定数項 :α 男性の定数項 :α + α 女性のハ ラメータ :β 男性のハ ラメータ :β mal * mal * * * Group Group Group Group のハ ラメータヘ クトル : Groupのハ ラメータヘ クトル : Group Group 7 効用関数の特定化の工夫 () Bfor Afr バス () 車 () 鉄道 (ral) バス () 車 () % 6% % 3% 8% % % 人数 バス 車 人数 鉄道 バス 車 男性 5 人 % 8% 男性 5 人 % 8% 7% 女性 5 人 6% % 女性 5 人 3% % 8% 合計 人 % 6% 合計 人 % 3% 5% 5% 7% マーケットシェアの変化率は異なる 8

多項プロビットモデル ral ral ε~ 多変量正規分布多項プロビットモデル 中心極限定理より誤差項の仮定は尤もらしい op-form であるため計算負荷が大きい (J- 重積分 ) xp J J J J ral ral ral ral ral ネスティッドロジット (NL) モデル () BB BB BB os os os 多項ロジットモデルの仮定 :ε~iid ガンベル分布 ε と ε BB は共通の非観測属性を含んでいる 料金 快適性 利便性など BB BB 共通要因相関 Cov() 6 ネスティッドロジット (NL) モデル () NL モデルの誤差構造公共交通自動車鉄道バス Cov() ras ras 鉄道バス自動車等分散無相関 ral ral ral ral ral 一般的な誤差構造 (MN モデル ) 鉄道バス自動車ミックストロジット (MMNL) モデル () ral ral ral ral ral ral ral ral ral IID ガンベル分布プロビットタイプのフレキシブルな誤差項ロジットモデルの操作性プロビットモデルの柔軟な誤差構造 η ν

ミックストロジット (MMNL) モデル () ral ral ral f ral ral ral ロジットモデルの操作性 IID ガンベル分布 η は ukow ミックストロジット (MMNL) モデル (3) ˆ f D D op form どうやって推定? シミュレーション法 ral ral Sp: 分布 f(η) に従う乱数 η を発生 Sp: それを用いて選択確率を計算 Sp3: これを D 回繰り返し選択確率の平均値を計算 Sp: それを尤度として最尤推定法により未知パラメータを推定 ミックストロジット (MMNL) モデル () Ns ral ras ras ral ras ras ras ras ras ~ N ras ras ral 自動車バス鉄道 ras ras ras NL モデルとは違う!! ras ミックストロジット (MMNL) モデル (5) Cross-Ns roa roa ral roa ras roa ras ral ras ras ras ras ras ras ras roa ~ N roa roa roa roa roa roa ral roa ras ras 自動車バス鉄道 roa CNL モデルとは違う!! ras ras

ミックストロジット (MMNL) モデル (6) 異分散 ral ral ral ral ral ral ral ~ N Ifao の問題で 一つの σ は に固定する必要あり ral Group Group 嗜好の異質性 : ランダム係数モデル () mal 女性の定数項 :α 男性の定数項 :α + α * mal * 観測異質性 Group * mal 女性のハ ラメータ :β 男性のハ ラメータ :β Group β は母集団で同一 嗜好は母集団で同質と仮定 嗜好には異質性 ( 個人差 ) が存在 * のハ ラメータヘ クトル : Group のハ ラメータヘ クトル : 非観測異質性 アプリオリ マーケットセグメンテーション Group Group Group ral 嗜好の異質性 : ランダム係数モデル () ral ~ N ~ N ral : ukow ral paramr IID ガンベル分布を仮定すれば ML モデル β でも 結局のところ... MMNL モデルも op-form のモデル プロビットモデルや GE モデルでよいのでは? 誤差相関を部分的かつ発見探索的に考える場合は有効 対 MN: 計算負荷が少ない ( 特に選択肢数が多い場合 ) 対 GE: 推定プログラムの変更が容易 ランダム係数モデルとしての意義 個人パラメータの算定 再現性の向上

モデル推定の意義 行動モデルの推定 ~ シミュレーションによる推定と fao の問題 ~ BEhavor Suy for rasporao Graua shool v. of Yamaash 山梨大学佐々木邦明愛媛大学倉内慎也 行動モデルにはパラメータが含まれることが多い m os xp xp jc どのような要因が どのような影響を及ぼすのか不明 現実のデータにもっとも良く適合するようにパラメータ値を決める これを通じて どのような要因が どのような影響を及ぼすのか 等についての仮説検定 j モデル推定の手順. モデルの選定 ネスティッドロジットモデル. 効用関数の特定化 ( 誤差分布のパラメータ ) 説明変数の選定 所要時間 費用 性別 年齢... 効用関数の関数型 m l 3. パラメータ推定. 結果の考察 os m os 点推定量を求める最もポピュラーな方法 右上の式を θ の関数とみなしたものが尤度関数 尤度関数を最大化する θ の値を最尤推定量とするのが最尤推定法 最尤推定法 L x 選択モデルの場合 f が選択確率 個人の選択確率を全員で掛け合わせる MaxLklhoo max f x データ (ab) が得られたとき 全体の平均がいくつとするのがよいか 平均がいくつだったら (ab) が得られやすいか? x

最大化アルゴリズムの考え方 代表的な繰り返し計算法 対数尤度関数の段階的な最大化. 初期値を与える. 初期値周りで勾配 ( 次微分 ) 等を用いて次の推定値の方向を決める 3. 初期値付近のステップサイズを 次微分 次微分を用いて適切に決めて次の推定値を決める. 収束基準 ( 尤度関数の一時微分ベクトル ) を判定し 収束していない場合は 現在の値を初期値として に進む S L x ˆML 尤度関数を最大化 : 尤度関数の一階微分 = を解く Nwo Raphso 法 テイラー展開の 次近似を利用して進める 解の収束が早い ( ステップ数が少ない ) 準 Nwo 法 (BFGS 法 ) ヘッセ行列を逐次近似する. g() H g H: 尤度関数の二階微分ヘッセ行列 g: 尤度関数の一階微分 5 6 シミュレーションによる推定 Ns ral ras ras ミックストロジットモデル ras ras ras ral ras ral f ras ras 自動車バス鉄道 ras ras ras ras ras ral ras ras ras 8

シミュレーションによる尤度計算 f ras ras ras ras ras ral ras Sp: 分布 f(η) に従う ( 準 ) 乱数 η を発生 Sp: それを用いて選択確率を計算 Sp3: これを D 回繰り返し選択確率の平均値を計算 Sp: それを尤度として最尤推定法により未知パラメータを推定 ˆ D D ral ral モデルの特定化と IDENIFICAION の問題 9 パラメータ推定がうまくいかない 収束するとは θ + と θ が同じになる g が になる 収束しない 無限に繰り返す θ が計算不能 局所最適解 見かけ上の最大化 H が存在しない ( 計算できない ) 変数が完全相関変数が効用関数に影響していない関数の近似状況 次関数近似初期値の問題 そもそも推定不可能 推定プログラムに誤り g() 変数が完全相関 mal fmal fmal mal mal mal mal 推定可能なパラメータは3つ 未知パラメータはつ 極めて相関が高い場合には推定できない場合も

そもそも推定不能 最大値において唯一解が求まらない可能性がある ( 最大値となるパラメータベクトルが無数にある ) 例 定数項 ral β β 3 ral β β 3 β β ral つは に固定する R r R C r R R r C R これを満たす組み合わせは無限に存在 R R C C C R 同様に個人属性も つは に固定 C C 3 そもそも推定不能 人も選択していない 例 ) 誰も鉄道を選択していない ral β β β 3 ral 3 β β β とすれば完璧なモデル ( とは?) 同様に ある代替案を選択した人が極めて少ない場合も危険 ral 乱数による最大値計算 ベイズ推定 D 事後分布 D D 事前確率 尤度 ある変数に対して乱数を発生させ その時の関数の値を調べる 単純な乱数だと効率が悪い 尤度関数の値の大きさで 次のパラメータにあたりをつける 尤度分布に基づく乱数を発生できれば その頻度がパラメータの分布になる θ

MCMC 法による推定 平均値も計算可能 Gbbs Samplg 一つを除いて残りのパラメータを固定して条件付き分布を考える あるパラメータの事後分布を求め その分布から次のパラメータをサンプリングする 同様に事後分布から順々にサンプリングする Mropols Hasgs Samplg あるパラメータに対する尤度を計算する パラメータをある方向 ( ランダムに ) に変える 基本的には 尤度が大きくなるようならその方向を採択 尤度が小さくなるようなら 逆方向にパラメータを変える 実際は一様乱数との大小で採択を決定 データ拡大法によるプロビットモデル ベイズロジットモデル 例 平日一日の平均トリップ数が右の表のように与えられる 分散の事前分布を逆ガンマ 平均値の事前分布を正規分布とする 7 6 5 3 メトロポリス法の MCMC で平均値と分散の分布を計算してみる 5 89 33 77 65 39 353 397 85 59 573 67 66 75 79 793 837 88 95 969 3 57 5 89 33 77 3 365 9 53 97 5 585 69 673 77 76 85 89 893 937 98 6. 8. 7. 3.9.5.5 6.6.. 5.5 続く μ σ 前の状態に基づいて (Markov Cha) 新しいパラメータをランダムにサンプリング (Mo Carlo) する この時 μ と σ の平均値は単純に平均で計算可能で 5. と.7 ( まで廃棄 ) ロジット プロビットモデルの MCMC 推定プログラム ( 兵藤 9) 推定例 (MH アルゴリズムでロジット ) lbrary(mcmcpak) ### データファイルの読み込み Da< ra.sv("h://aa.sv"har=re) hh< row(da) ## データ数 :Daa の行数を数える rm < Da[ 6]/; bm < Da[ 9]/; m < Da[]/ ros < Da[ 7]/; bos < Da[]/; os < Da[3]/ rag < marx(row=hhol=); bag < *(Da[3]>=6); ag < rag r < marx(row=hhol=); b < r; < *(Da[]>=) ## 選択結果 h < marx(row=hhol=3) olams(h) < ("" "" "3") for ( :hh){ f (Da[ 5]==) h[] < 999 f (Da[ ]==) h[] < f (Da[ 8]==) h[] < 999 f (Da[ ]==) h[] < f (Da[]==) h[3] < 999 f (Da[ ]==3) h[3] < } pos < MCMCml(h ~ hovar(rm "m" "") + hovar(bm "m" "") + hovar(m "m" "3") + hovar(ros "os" "") + hovar(bos "os" "") + hovar(os "os" "3") + hovar(rag "ag" "") + hovar(bag "ag" "") + hovar(ag "ag" "3") + hovar(r "" "") + hovar(b "" "") + hovar( "" "3") basl="3" bur= mm.mho="rwm" b= B= s=38 vrbos= mm= B=.) plo(pos) summary(pos) ロジット lbrary(baysm) ### データファイルの読み込み Da< ra.sv("h://aa.sv"har=re) hh< row(da) ## データ数 :Daa の行数を数える al < 3 rm < Da[ 6]/; bm < Da[ 9]/; m < Da[]/ ros < Da[ 7]/; bos < Da[]/; os < Da[3]/ rag < marx(row=hhol=); bag < *(Da[3]>=6); ag < rag r < marx(row=hhol=); b < r; < *(Da[]>=) rs < Da[] a < a < b(rmbmmrosbososragbagagrb) < < ra(al a=a = a=a =NLL DIFF=RE bas=3) a < ls(p=al y=rs =) mm < ls(r=5k=) rs < rmpgbbs(daa=a Mm=mm) plo(rs$baraw) plo(rs$sgmaraw) プロビット 兵藤 9 を用いた

ベイズ推定のメリットデメリット メリット 解析的にはパラメータが求まらない複雑なモデルもパラメータ分布が求まる 例 : パネルデータの個人モデルを考慮した階層モデル パラメータの分布がわかる 多峰性の分布になったならばモデル構造を考え直す 参考文献等 入門ベイズ統計学松原望 ベイズモデリングによるマーケティング分析照井伸彦 R による離散選択モデルの推定方法メモ兵藤哲朗 デメリット 時間がかかる MNL の推定 MCMC:5 秒最尤推定 :7 秒 パラメータの分布が収束しない場合もある