ベイズ統計入門 - PDF 無料ダウンロード

ベイズ統計入門

条件付確率事象 F が起こったことが既知であるという条件の下で E が起こる確率を条件付確率 (codtoal probablt) という P ( E F ) P ( E F ) P( F ) 定義式を変形すると確率の乗法公式となる ( E F ) P( F ) P( E F ) P( E) P( F E) P

事象の独立ある事象の生起する確率が他のある事象が生起するかどうかによって変化しないときつの事象は独立であるという P E P E F P ( E F ) P( E) P( F ) いま F F... F が互いに素である集合でかつ F F... F Ωであるとすると ( E) P( E F ) P( F ) P( E F ) P( F )... P( E F ) P P F

ベイズの定理以上からベイズの定理 (Baes Theor) が成立する P ( F E ) P( E ) P E F P( F E ) P( E ) P( F E ) P( E )... P( F E ) P( E ) ( 覚え方のこつ ) データがFであるときにパラメータEが得られる確率はデータがFでかつパラメータがEである確率をデータがFである確率でわったもの

ベイズ定理の本質前頁のベイズの定理の一般形において右辺の分母は分子の和となっているしたがって分子も知れば分母も知るこのとき母数を定数とみなして以下のように略記する ( E F ) P( F E ) P( E ) P すなわちパラメータの尤度パラメータの事前分布パラメータの事後分布

確率変数 () 確率が定義される基礎空間 Ω の要素は事象や命題である今 Ω の要素 ω にあるつの実数 x を対応させる命題が真であるかどうかが観測するまで確定することのできない不確実性を持つとき Ω の要素と対応する x も同じ不確実性を持つ Ω について定義された確率関数によって x についてその生起確率を定義できこのような x の全体をとおき確率変数 (radom arable) と呼ぶ特定の値 x が生起することを x と表す

確率変数 () 実験の結果生ずるのすべての可能な値によって構成される集合を標本空間 (sample space) と呼ぶ標本空間上に定義される確率を確率分布と呼ぶの可能な値が不連続であるとき xの分布を離散分布 (dscrete dstrbuto) というが連続の値をとるとき xの分布を連続分布 (cotuous dstrbuto) という P ( x) が関数 p ( x) によって表されるとき p( x) を確率密度関数 (probablt dest fucto) と呼ぶまたが連続であるとき以下で表される f ( x) も確率密度関数と呼ぶ b P a b f ( x) dx a

確率変数の期待値確率変数のデータの平均値は以下で表現する t t x( ) f x x() pˆ x f () : 確率変数の取りうる値 : 各々の観測値の数 pˆ : 個の観測値のうち x() をとる観測値の割合期待値は以下で表現する E( ) xp( x) dx Ψ Ψ : 標本空間の取りうる値 E ( g( )) g( x) p( x) Ψ dx

確率変数の分散確率変数の分散は以下で表現する確率変数の分散とは確率変数が平均して E() からどれくらい離れているかを示すの分布のばらつきともいえる ( ) V ( ) E ( E( )) V を標準偏差とよぶ以下で表現することもある E V ( ) x ( ) x ( ) x V { } ( E ) E( )

多変量分布基礎空間の要素をつの確率変数ではなく複数の確率変数の組として表すことがあるこの場合の標本空間は次元ユークリッド空間の部分空間である Yの分布が p ( x ) によって表現されるとき xとが連続であればその生起確率は以下で表現し p x を同時確率密度関数と呼ぶ P {( Y ) R} p( x ) R dxd ( )

周辺分布 p( x) 以下の時を周辺確率密度関数といいこの関数が示す分布を周辺分布 (margal dstrbuto) と呼ぶの値にかかわらずa b a p p b ( x) dx p( x ) すなわち ( x) p( x ) a d ddx bとなる確率は * ある変数の周辺分布はもう一つの変数を積分消去することによって得られるこれを周辺化とよぶ

条件付分布 Y Y が与えられた時のの条件付分布の確率密度関数は以下で与えられる ( ) p p ( ) p( )

共分散変数 Y Y の同時確率密度 ( 同時分布 ) が与えられている時 E ( Y ) E( Y ) とすると以下をそれぞれ共分散相関係数と呼ぶ Co ρ ( Y Y ) E( E( Y E( Y )) E( Y E( Y ))) V ( )( ) p( ) ( Y Y ) ( Y ) V ( Y ) Co d d

P P P P L P M ベイズ定理のまとめ P ( θ ) P( θ ) θ P( ) L ( θ ) P( θ ) θ L( θ ) P( θ ) M ( ) ( θ ) P( θ ) P( ) P( θ ) P( θ ) ( θ ) : 事後密度関数 (posteror dest fucto) ( θ ): 尤度 (lelhood) ( θ ): 事前分布 (pror dstrbuto) ( ) L( θ ) P( θ ) dθ : 周辺尤度 (margal lelhood) 要は分子をパラメータに関して積分データの得られる尤度

変量正規分布のベイズ推定正規分布から N 個のランダムサンプリング分散を既知としを推定する尤度関数 p 事前分布.. d. ~ N ( )... π (... ) ( ) ~ N p ( ) ( ) ( ) π

補足 :d とは Idepedetl ad detcall dstrbuted: 独立に同一の分布に従うの意味次のように用いる Y ( ) ~..d. N

変量正規分布のベイズ推定 ( 続き ) 事後分布 ( 事前分布と尤度関数をかける ) の事後平均をさすはここで...... s p p p p

変量正規分布のベイズ推定 ( 続き ) 事後分布 ( 続き ) データ精度事前精度データ精度事前精度事後平均データ精度 ) ( 事後精度事前精度精度表示 ( 精度分散の逆数 ) 縮約推定 ( データの平均を事前平均へ縮約 ) > N ~ γ τ γ τ γ τ γ γ τ ω ω ω

変量正規分布のベイズ推定平均を既知とし分散を推定する尤度関数事前分布 p... π ~ I χ χ χ

補足 : カイ二乗分布と逆カイ二乗分布いずれまた機会があれば

変量正規分布のベイズ推定事後分布 I p ~ χ

変量正規分布のベイズ推定 3 未知共役事前分布 ; ~ ~ χ χ I N p I N

変量正規分布のベイズ推定 3 尤度関数と同時事後分布 ; ; χ s s I N s p

変量正規分布のベイズ推定 3 条件付事後分布周辺事後分布 ~ N N ~ I χ

多変量正規分布のベイズ推定尤度関数 d S S tr p N... : ~ 分散共分散行列

多変量正規分布のベイズ推定既知事前分布事後分布 Λ Λ ~ p N Λ Λ Λ Λ Λ Λ ~ p N

多変量正規分布のベイズ推定未知事前分布事後分布 ~ ~ ; Λ Λ Λ Λ Wshart I N tr p Wshart I Normal d Λ Λ Λ S S Wshart I N ; ~ ~

ベイズを理解するためにはここまでの数式の導出を完全に理解するためには確率統計を一から丁寧にさらっていかなくてはならないそれはまるでコンピュータを使うのにマシン語を習うようなもの

線形回帰モデルのベイズ推測モデル Y 事前分布 ( ) ; ow ε; ε ~ N ( ); ハイパーパラメー ~ N 古典的ベイズ : ハイパーパラメータを指定経験ベイズ : ハイパーパラメータをデータから推定階層的ベイズ : ハイパーパラメータに確率分布を設定 ( 第段階事前分布として階層構造を形成 ) ~ ~ f g ( ) ( )

線形回帰モデルのベイズ推測古典的ベイズ (Classcal Baes) 共役事前分布 ( 正規分布 ) がもっとも簡単望ましくない性質を与える場合あり Ubouded Rs: 事前分布が悪ければベイズ推定も話しにならぬハイパーパラメータ ( 事前分布パラメータ ) の選択が困難事前分布とデータが矛盾してしまう

線形回帰モデルのベイズ推測経験ベイズ (Emprcal Baes) 回帰のパラメータと共にハイパーパラメータも推定 ( 最尤法 ML モーメント法 MOM など ) 問題点ハイパーパラメータの推定に伴う不確実性を考慮しない ( 小標本で問題 ) Admssble ではない推定された事前分布の効果が漸近的にゼロへ収束しない

線形回帰モデルのベイズ推測階層的ベイズ (Herachcal Baes) 段階のベイズ推定手続きを行う経験ベイズ推定のハイパーパラメータをベイズで推定ハイパーパラメータに事前分布を設定 ( 通常は無情報事前分布 o-formate)

線形回帰モデルのベイズ推測モデル行列表記尤度関数を仮定 ) 期の誤差項 ( 独立な正規分布 : ル次元パラメータベクト : 次元説明変数ベクトル期の : 期の従属変数 :... ; N t t x t T t x t t t t t t ε ε ε π Y Y L T

線形回帰モデルのベイズ推測事前分布の特定化非報知的事前分布 (No-Iformate Pror) 一様 (uform) 事前分布 ( 省略 ) Jeffres 事前分布 ( 省略 ) 共役事前分布古典的ベイズ推定経験ベイズ推定階層的ベイズ推定

線形回帰モデルのベイズ推測古典的ベイズ推定既知尤度関数事前分布事後分布 ˆ ˆ ˆ ˆ ˆ Y Y s Y s Y Y L T ~ N ˆ ~ N

線形回帰モデルのベイズ推測リッジ回帰前頁の式を以下の様に変形するとリッジ回帰となる ri ri E r I ˆ とすると

線形回帰モデルのベイズ推測経験ベイズ推定データの margal dest を直接利用デンジョンルールを直接推定事後分布のパラメータを推定 ( 階層的ベイズの特殊ケース ) すべて省略

線形回帰モデルのベイズ推測階層的ベイズ推定事前分布条件付事後分布を仮定 p ある分布 : ow ; ハイパーパラメータ ( 事前分布のパラメータ ) Ω Ω ~N ˆ ~ Ω Ω Ω N ) 条件付ベイズ推定量 :

線形回帰モデルのベイズ推測階層的ベイズ推定量 ) Q HR P 階層的ベイズ推定 ( ) P ) ( ) ( ) Ω ( ) ˆ Ω P( ) P( ) ( ) P( ) K ( ) ( Q { ( )}) K ( ) ( Q { ( )}) ) ) ( ) ( ) ; ( mproperの場合 ) P P P d d d d d

線形回帰モデルのベイズ推測階層的ベイズ推定 3 前頁の式の分母の積分は解析的には評価不可能であるため以下のアルゴリズムを用いる完全条件付分布とアルゴリズム () () ~ ~ N 点推定 : M ( ) K ( Q ) ; 逆ガンマ分布 ( KQ) をN( ) を固定して ()() を繰り返して周辺だけを見れば p {...}{...} これらの経験分布 ( ヒストグラム ) が事後分布 p M E ( ) p( ) M ( ) E( ) M からサンプリングを固定してを逆ガンマ分布からサンプリング ( ) に収束

事後分布評価モンテカルロ法棄却受容 (Accept/Reject) 法 MCMC( マルコフチェーンモンテカルロ ) 法 Gbbsサンプリング Metropols-Hastgs(M-H) サンプリングランダムウォーク (RW) アルゴリズム独立 M-Hアルゴリズム