ベイズ統計入門

Similar documents
Probit , Mixed logit

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft Word - 補論3.2

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

講義「○○○○」

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

統計的データ解析

基礎統計

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

様々なミクロ計量モデル†

Microsoft Word - reg.doc

memo

Microsoft Word - å“Ÿåłžå¸°173.docx

ビジネス統計 統計基礎とエクセル分析 正誤表

スライド 1

日心TWS

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft Word - reg2.doc

Microsoft PowerPoint - sc7.ppt [互換モード]

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - Statistics[B]

カイ二乗フィット検定、パラメータの誤差

情報工学概論

統計学の基礎から学ぶ実験計画法ー1

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

数値計算法

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

パソコンシミュレータの現状

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

PowerPoint プレゼンテーション

第7章

Microsoft PowerPoint - 測量学.ppt [互換モード]

景気指標の新しい動向

スライド 1

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

スライド 1

DVIOUT

PowerPoint Presentation

横浜市環境科学研究所

Microsoft PowerPoint - stat-2014-[9] pptx

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

PowerPoint プレゼンテーション

生命情報学

 

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

基礎統計

モジュール1のまとめ

Microsoft Word - Stattext07.doc

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

EBNと疫学

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

スライド 1

PowerPoint プレゼンテーション

スライド 1

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

スライド 1

学習指導要領

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - statistics pptx

1.民営化

Microsoft PowerPoint - H21生物計算化学2.ppt

航空機の運動方程式

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

構造方程式モデリング Structural Equation Modeling (SEM)

Microsoft PowerPoint - 第3回2.ppt

統計学入門 練習問題解答集

データ解析

経営統計学

FEM原理講座 (サンプルテキスト)

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Medical3

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

多次元レーザー分光で探る凝縮分子系の超高速動力学

Variational Auto Encoder

PowerPoint プレゼンテーション

Microsoft Word - Chap17

経済統計分析1 イントロダクション

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

kubo2015ngt6 p.2 ( ( (MLE 8 y i L(q q log L(q q 0 ˆq log L(q / q = 0 q ˆq = = = * ˆq = 0.46 ( 8 y 0.46 y y y i kubo (ht

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft Word doc

Microsoft PowerPoint - H22制御工学I-2回.ppt

数値計算法

不偏推定量

PowerPoint プレゼンテーション

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

09.pptx

Microsoft PowerPoint - R-stat-intro_20.ppt [互換モード]

学習指導要領

ワースペクトルの離散フーリエ逆変換として以下の式で 与えられる XkY k rm IDFT Xk Y k 信号の位相スペクトルが 変量確率分布に従う場合 の POC 関数の統計的性質 3 3. 著者らのグループがこれまでに行ってきた POC 関数の XkY k W mk Xk Y k 統計的解析では

Transcription:

ベイズ統計入門

条件付確率 事象 F が起こったことが既知であるという条件の下で E が起こる確率を条件付確率 (codtoal probablt) という P ( E F ) P ( E F ) P( F ) 定義式を変形すると 確率の乗法公式となる ( E F ) P( F ) P( E F ) P( E) P( F E) P

事象の独立 ある事象の生起する確率が 他のある事象が生起するかどうかによって変化しないとき つの事象は独立であるという P E P E F P ( E F ) P( E) P( F ) いま F F... F が互いに素である集合で かつ F F... F Ωであるとすると ( E) P( E F ) P( F ) P( E F ) P( F )... P( E F ) P P F

ベイズの定理 以上から ベイズの定理 (Baes Theor) が成立する P ( F E ) P( E ) P E F P( F E ) P( E ) P( F E ) P( E )... P( F E ) P( E ) ( 覚え方のこつ ) データがFであるときにパラメータEが得られる確率は データがFでかつパラメータがEである確率を データがFである確率でわったもの

ベイズ定理の本質 前頁のベイズの定理の一般形において 右辺の分母は分子の和となっている したがって分子も知れば分母も知る このとき母数を定数とみなして以下のように略記する ( E F ) P( F E ) P( E ) P すなわち パラメータの尤度 パラメータの事前分布 パラメータの事後分布

確率変数 () 確率が定義される基礎空間 Ω の要素は事象や命題である 今 Ω の要素 ω にある つの実数 x を対応させる 命題が真であるかどうかが観測するまで確定することのできない不確実性を持つとき Ω の要素と対応する x も同じ不確実性を持つ Ω について定義された確率関数によって x についてその生起確率を定義でき このような x の全体を とおき 確率変数 (radom arable) と呼ぶ 特定の値 x が生起することを x と表す

確率変数 () 実験の結果生ずるのすべての可能な値によって構成される集合を標本空間 (sample space) と呼ぶ 標本空間上に定義される確率を確率分布と呼ぶ の可能な値が不連続であるとき xの分布を離散分布 (dscrete dstrbuto) という が連続の値をとるとき xの分布を連続分布 (cotuous dstrbuto) という P ( x) が関数 p ( x) によって表されるとき p( x) を確率密度関数 (probablt dest fucto) と呼ぶ またが連続であるとき 以下で表される f ( x) も確率密度関数と呼ぶ b P a b f ( x) dx a

確率変数の期待値 確率変数のデータの平均値は以下で表現する t t x( ) f x x() pˆ x f () : 確率変数 の取りうる値 : 各々の観測値の数 pˆ : 個の観測値のうち x() をとる観測値の割合 期待値は以下で表現する E( ) xp( x) dx Ψ Ψ : 標本空間の取りうる値 E ( g( )) g( x) p( x) Ψ dx

確率変数の分散 確率変数の分散は以下で表現する 確率変数の分散とは 確率変数 が平均して E() からどれくらい離れているかを示す の分布のばらつきともいえる ( ) V ( ) E ( E( )) V を標準偏差とよぶ 以下で表現することもある E V ( ) x ( ) x ( ) x V { } ( E ) E( )

多変量分布 基礎空間の要素をつの確率変数ではなく 複数の確率変数の組として表すことがある この場合の標本空間は 次元ユークリッド空間の部分空間である Yの分布が p ( x ) によって表現されるとき xと が連続であればその生起確率は以下で表現し p x を同時確率密度関数と呼ぶ P {( Y ) R} p( x ) R dxd ( )

周辺分布 p( x) 以下の時 を周辺確率密度関数といい この関数が示す分布を周辺分布 (margal dstrbuto) と呼ぶ の値にかかわらずa b a p p b ( x) dx p( x ) すなわち ( x) p( x ) a d ddx bとなる確率は * ある変数の周辺分布はもう一つの変数を積分消去することによって得られる これを周辺化とよぶ

条件付分布 Y Y が与えられた時のの条件付分布の確率密度関数は以下で与えられる ( ) p p ( ) p( )

共分散 変数 Y Y の同時確率密度 ( 同時分布 ) が与えられている時 E ( Y ) E( Y ) とすると 以下をそれぞれ共分散 相関係数と呼ぶ Co ρ ( Y Y ) E( E( Y E( Y )) E( Y E( Y ))) V ( )( ) p( ) ( Y Y ) ( Y ) V ( Y ) Co d d

P P P P L P M ベイズ定理のまとめ P ( θ ) P( θ ) θ P( ) L ( θ ) P( θ ) θ L( θ ) P( θ ) M ( ) ( θ ) P( θ ) P( ) P( θ ) P( θ ) ( θ ) : 事後密度関数 (posteror dest fucto) ( θ ): 尤度 (lelhood) ( θ ): 事前分布 (pror dstrbuto) ( ) L( θ ) P( θ ) dθ : 周辺尤度 (margal lelhood) 要は分子をパラメータに関して積分 データ の得られる尤度

変量正規分布のベイズ推定 正規分布から N 個のランダムサンプリング 分散 を既知とし を推定する 尤度関数 p 事前分布.. d. ~ N ( )... π (... ) ( ) ~ N p ( ) ( ) ( ) π

補足 :d とは Idepedetl ad detcall dstrbuted: 独立に同一の分布に従うの意味 次のように用いる Y ( ) ~..d. N

変量正規分布のベイズ推定 ( 続き ) 事後分布 ( 事前分布と尤度関数をかける ) の事後平均をさすはここで...... s p p p p

変量正規分布のベイズ推定 ( 続き ) 事後分布 ( 続き ) データ精度事前精度データ精度事前精度事後平均 データ精度 ) ( 事後精度 事前精度精度表示 ( 精度 分散の逆数 ) 縮約推定 ( データの平均を事前平均へ縮約 ) > N ~ γ τ γ τ γ τ γ γ τ ω ω ω

変量正規分布のベイズ推定 平均 を既知とし 分散 を推定する 尤度関数 事前分布 p... π ~ I χ χ χ

補足 : カイ二乗分布と逆カイ二乗分布 いずれまた機会があれば

変量正規分布のベイズ推定 事後分布 I p ~ χ

変量正規分布のベイズ推定 3 未知 共役事前分布 ; ~ ~ χ χ I N p I N

変量正規分布のベイズ推定 3 尤度関数と同時事後分布 ; ; χ s s I N s p

変量正規分布のベイズ推定 3 条件付事後分布 周辺事後分布 ~ N N ~ I χ

多変量正規分布のベイズ推定 尤度関数 d S S tr p N... : ~ 分散共分散行列

多変量正規分布のベイズ推定 既知 事前分布 事後分布 Λ Λ ~ p N Λ Λ Λ Λ Λ Λ ~ p N

多変量正規分布のベイズ推定 未知 事前分布 事後分布 ~ ~ ; Λ Λ Λ Λ Wshart I N tr p Wshart I Normal d Λ Λ Λ S S Wshart I N ; ~ ~

ベイズを理解するためには ここまでの数式の導出を完全に理解するためには 確率統計を一から丁寧にさらっていかなくてはならない それはまるでコンピュータを使うのにマシン語を習うようなもの

線形回帰モデルのベイズ推測 モデル Y 事前分布 ( ) ; ow ε; ε ~ N ( ); ハイパーパラメー ~ N 古典的ベイズ : ハイパーパラメータを指定 経験ベイズ : ハイパーパラメータをデータから推定 階層的ベイズ : ハイパーパラメータに確率分布を設定 ( 第 段階事前分布として階層構造を形成 ) ~ ~ f g ( ) ( )

線形回帰モデルのベイズ推測 古典的ベイズ (Classcal Baes) 共役事前分布 ( 正規分布 ) がもっとも簡単 望ましくない性質を与える場合あり Ubouded Rs: 事前分布が悪ければベイズ推定も話しにならぬ ハイパーパラメータ ( 事前分布パラメータ ) の選択が困難 事前分布とデータが矛盾してしまう

線形回帰モデルのベイズ推測 経験ベイズ (Emprcal Baes) 回帰のパラメータと共に ハイパーパラメータも推定 ( 最尤法 ML モーメント法 MOM など ) 問題点 ハイパーパラメータの推定に伴う不確実性を考慮しない ( 小標本で問題 ) Admssble ではない 推定された事前分布の効果が漸近的にゼロへ収束しない

線形回帰モデルのベイズ推測 階層的ベイズ (Herachcal Baes) 段階のベイズ推定手続きを行う 経験ベイズ推定のハイパーパラメータをベイズで推定 ハイパーパラメータに事前分布を設定 ( 通常は無情報事前分布 o-formate)

線形回帰モデルのベイズ推測 モデル 行列表記 尤度関数 を仮定 ) 期の誤差項 ( 独立な正規分布 : ル次元パラメータベクト : 次元説明変数ベクトル 期の : 期の従属変数 :... ; N t t x t T t x t t t t t t ε ε ε π Y Y L T

線形回帰モデルのベイズ推測事前分布の特定化 非報知的事前分布 (No-Iformate Pror) 一様 (uform) 事前分布 ( 省略 ) Jeffres 事前分布 ( 省略 ) 共役事前分布 古典的ベイズ推定 経験ベイズ推定 階層的ベイズ推定

線形回帰モデルのベイズ推測古典的ベイズ推定 既知 尤度関数 事前分布 事後分布 ˆ ˆ ˆ ˆ ˆ Y Y s Y s Y Y L T ~ N ˆ ~ N

線形回帰モデルのベイズ推測リッジ回帰 前頁の式を以下の様に変形するとリッジ回帰となる ri ri E r I ˆ とすると

線形回帰モデルのベイズ推測 経験ベイズ推定 データの margal dest を直接利用 デンジョン ルールを直接推定 事後分布のパラメータを推定 ( 階層的ベイズの特殊ケース ) すべて省略

線形回帰モデルのベイズ推測階層的ベイズ推定 事前分布 条件付事後分布 を仮定 p ある分布 : ow ; ハイパーパラメータ ( 事前分布のパラメータ ) Ω Ω ~N ˆ ~ Ω Ω Ω N ) 条件付ベイズ推定量 :

線形回帰モデルのベイズ推測 階層的ベイズ推定量 ) Q HR P 階層的ベイズ推定 ( ) P ) ( ) ( ) Ω ( ) ˆ Ω P( ) P( ) ( ) P( ) K ( ) ( Q { ( )}) K ( ) ( Q { ( )}) ) ) ( ) ( ) ; ( mproperの場合 ) P P P d d d d d

線形回帰モデルのベイズ推測 階層的ベイズ推定 3 前頁の式の分母の積分は解析的には評価不可能であるため 以下のアルゴリズムを用いる完全条件付分布とアルゴリズム () () ~ ~ N 点推定 : M ( ) K ( Q ) ; 逆ガンマ分布 ( KQ) をN( ) を固定して ()() を繰り返して 周辺だけを見れば p {...}{...} これらの経験分布 ( ヒストグラム ) が事後分布 p M E ( ) p( ) M ( ) E( ) M からサンプリング を固定して を逆ガンマ分布からサンプリング ( ) に収束

事後分布評価 モンテカルロ法 棄却 受容 (Accept/Reject) 法 MCMC( マルコフチェーンモンテカルロ ) 法 Gbbsサンプリング Metropols-Hastgs(M-H) サンプリング ランダム ウォーク (RW) アルゴリズム 独立 M-Hアルゴリズム