スライド 1

Similar documents
様々なミクロ計量モデル†

Microsoft Word - 補論3.2

Probit , Mixed logit

生命情報学

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft PowerPoint - 10.pptx

memo

SAP11_03

ベイズ統計入門

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

景気指標の新しい動向

PowerPoint Presentation

PowerPoint プレゼンテーション

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft PowerPoint - mp11-02.pptx

パソコンシミュレータの現状

Microsoft PowerPoint - H21生物計算化学2.ppt

航空機の運動方程式

Microsoft PowerPoint - 9.pptx

PowerPoint プレゼンテーション

Microsoft PowerPoint - 9.pptx

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

データ解析

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - thesis.doc

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

日心TWS

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

アルゴリズムとデータ構造

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

PowerPoint プレゼンテーション

カイ二乗フィット検定、パラメータの誤差

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

ディジタル信号処理

Microsoft PowerPoint - 10.pptx

スライド 1

Microsoft Word - ㅎ㇤ㇺå®ı璃ㆨAIã†®æŁ°ç’ƒ.docx

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Microsoft PowerPoint - qcomp.ppt [互換モード]

PowerPoint プレゼンテーション

<4D F736F F D2094F795AA95FB92F68EAE82CC89F082AB95FB E646F63>

統計的データ解析

DVIOUT

行列、ベクトル

オートマトン 形式言語及び演習 3. 正規表現 酒井正彦 正規表現とは 正規表現 ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械正規表現 : 言語

DVIOUT

Microsoft PowerPoint - 7.pptx

Microsoft PowerPoint - 第3回2.ppt

スライド 1

数値計算法

講義「○○○○」

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 2.ppt [互換モード]

PowerPoint プレゼンテーション

受信機時計誤差項の が残ったままであるが これをも消去するのが 重位相差である. 重位相差ある時刻に 衛星 から送られてくる搬送波位相データを 台の受信機 でそれぞれ測定する このとき各受信機で測定された衛星 からの搬送波位相データを Φ Φ とし 同様に衛星 からの搬送波位相データを Φ Φ とす

Microsoft PowerPoint - DA2_2017.pptx

untitled

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

横浜市環境科学研究所

Microsoft Word - 微分入門.doc

Microsoft Word - 素粒子物理学I.doc

Microsoft Word - 201hyouka-tangen-1.doc

Microsoft Word - 非線形計画法 原稿

Microsoft PowerPoint - H22制御工学I-2回.ppt

Microsoft Word - Matlab_R_MLE.docx

平成 年 月 7 日 ( 土 第 75 回数学教育実践研究会アスティ 45 ビル F セミナールーム A 札幌医科大学 年 P ab, を正の定数とする 平面上において ( a, を中心とする円 Q 4 C と (, b を中心とする円 C が 原点 O で外接している また P を円 C 上の点と

Information Theory

Microsoft PowerPoint - 13approx.pptx

PowerPoint プレゼンテーション

DVIOUT-SS_Ma

ビジネス統計 統計基礎とエクセル分析 正誤表

航空機の運動方程式

微分方程式による現象記述と解きかた

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

ボルツマンマシンの高速化

数学の世界

補足 中学で学習したフレミング左手の法則 ( 電 磁 力 ) と関連付けると覚えやすい 電磁力は電流と磁界の外積で表される 力 F 磁 電磁力 F li 右ねじの回転の向き電 li ( l は導線の長さ ) 補足 有向線分とベクトル有向線分 : 矢印の位

2-1 / 語問題 項書換え系 4.0. 準備 (3.1. 項 代入 等価性 ) 定義 3.1.1: - シグネチャ (signature): 関数記号の集合 (Σ と書く ) - それぞれの関数記号は アリティ (arity) と呼ばれる自然数が定められている - Σ (n) : アリ

スライド 1

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

8. 自由曲線と曲面の概要 陽関数 陰関数 f x f x x y y y f f x y z g x y z パラメータ表現された 次元曲線 パラメータ表現は xyx 毎のパラメータによる陽関数表現 形状普遍性 座標独立性 曲線上の点を直接に計算可能 多価の曲線も表現可能 gx 低次の多項式は 計

学習指導要領

統計学的画像再構成法である

13章 回帰分析

Microsoft Word - Stattext07.doc

Microsoft Word - Chap17

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

学習指導要領

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Transcription:

第 13 章系列データ 2015/9/20 夏合宿 PRML 輪読ゼミ B4 三木真理子

目次 2 1. 系列データと状態空間モデル 2. 隠れマルコフモデル 2.1 定式化とその性質 2.2 最尤推定法 2.3 潜在変数の系列を知るには 3. 線形動的システム この章の目標 : 系列データを扱う際に有効な状態空間モデルのうち 代表的な 2 例である隠れマルコフモデルと線形動的システムの性質を知り パラメータ推定 推論を行えるようになる! 線形動的システム追いつけませんでした すみません

1.1. 系列データとは 3 系列データ (sequential data) って? 同質のデータを直列に並べたデータ ( 朱鷺の杜 Wiki 参照 ) Ex. 文字列 DNA 系列 時系列の測定を通して得られる様々なデータ 系列データの特徴データ点とデータ点が互いに相関する (Ex. 今日雨が降る事象と明日雨が降る事象は独立ではない ) 各々のデータ点が独立同分布に従うという仮定が使えない! データ点の相関構造 ( 直感的には ) 時間的に近い観測値同士ほど 強い相関があるだろう過去の全ての観測値に依存しているというのは現実的ではない 未来の予測値が直近の観測値以外の過去の観測値に対して独立だと仮定したマルコフモデルについて考える

1.2. マルコフモデル 4 ここからは 確率的グラフィカルモデル (8 章 ) の枠組みを用いながら考察していくまず 確率の積の規則を用いて 系列データの同時確率は以下のようにかける p x 1,, x N = p(x 1 ) p(x n x 1,, x n 1 ) N n=2 独立同分布として扱う x 1 x 2 x 3 x 4 N p x 1,, x N = p(x n ) n=1 一次マルコフモデルで考える N x 1 x 2 x 3 x 4 p x 1,, x N = p(x 1 ) p(x n x n 1 ) n=2 p(x n x n 1 ) が n に限らず一定 ( 定常時系列の仮定 ) 均一マルコフ連鎖

1.2. マルコフモデル 5 一次の均一マルコフ連鎖は まだかなり制限の強いモデル データがより過去のデータからも影響を受けるようにモデルを変更 高次マルコフ連鎖 二次マルコフ連鎖 同時確率の式 p x 1,, x N = p x 1 p(x 2 x 1 ) p(x n x n 1, x n 2 ) まったく同様に M 次マルコフ連鎖に拡張することができる しかし 仮にx k をK 個の状態をもつ離散変数とする p(x k x k 1 ) はのパラメータ数はK(K-1) 個! x k 1 のK 個の状態の各々に対して (K-1) 個のパラメータをもつ このとき M 次マルコフ連鎖によって表されるモデルのパラメータはK M (K 1) 個! Mに対して指数的に増大するので Mが大きいと実用的ではない N n=2

1.3. 状態空間モデル 6 1 次数のあるマルコフ性の仮定 (M 次以前のデータからは独立 ) に制限されない 2 自由パラメータの数がある程度制限されるこの2つの性質を満たすモデルを作りたい! 状態空間モデル (state space model) 状態空間モデル 観測値 x n に対し 対応する潜在変数 z n を導入 x n とz n の型 次元は異なっていても構わない 潜在変数でマルコフ連鎖を構成する 同時分布を表す式 p x 1,, x N, z 1,, z N = p z 1 p z n z n 1 N n=2 N n=1 グラフィカルモデルの形から z n を観測したとき z n 1 と z n+1 は独立 p(x n z n )

1.3. 状態空間モデル 7 有向分離の基準を用いると 2 つの観測変数 x n と x m をつなぐ経路は常に存在するが 経由するのは潜在変数のみであり 決して遮断されない よって 過去の観測値すべてをあたえたときの観測 x n+1 の予測分布 p(x n+1 x 1,, x n ) は条件付き独立の性質を何も持たない x n+1 の予測はすべての過去の観測値に依存するが どの次数のマルコフ性も満 たさない ( 次数をもつマルコフ性の仮定に制限されない ) 潜在変数が離散変数であるような状態空間モデル 隠れマルコフモデル (HMM) 潜在変数と観測変数の両方がガウス分布に従う場合 線形動的システム

2.1 隠れマルコフモデルの記述 8 隠れマルコフモデル (HMM; hidden Markov model) は 潜在変数が離散変数である状態空間モデル 観測変数は離散変数でも連続変数でもよい ある1つの時刻に注目すると 成分密度 p(x n z n ) で与えられる混合分布に対応する 潜在変数は離散的な多項変数 z n であり どの混合成分が対応する観測 x n を生成するかを記述する ( 目標 1)

2.1 隠れマルコフモデルの記述目標 1: 離散的な多項変数 z n のどの混合成分が対応する観測 x n を生成するかを記述する 9 一対 K 符号化法を用いる z n の確率分布は p(z n z n 1 ) を通して z n 1 の状態に依存する z n は K 次元の二値変数なので p(z n z n 1 ) は遷移確率を要素に持つ数表 A に対応する 遷移確率は で定義される 確率なので 0 A jk 1 と k A jk = 1 を満たす したがって行列 AはK(K-1) 個の独立したパラメータをもつ このとき 条件付き分布は 以下のようにかける 最初の潜在ノードz 1 は 要素れる周辺分布 p(z 1 ) をもつ π k p(z 1k = 1) をもつ確率のベクトル π で表さ ただし k π k = 1 である

2.1 隠れマルコフモデルの記述 10 遷移行列の表し方いろいろ 1 状態遷移図 2 格子図 ( トレリス図 )

2.1 隠れマルコフモデルの記述 11 目標 2: 観測変数の条件付き確率分布 Φ は分布を支配するパラメータの集合 を定義する : 出力確率 (emission diagram) x n は観測されるので Φの値が与えられたとき 分布は二値ベクトルz n のK 個の可能な状態に対応したK 個の要素をもつベクトルからなり 出力確率は以下の形式で表現される モデルが均一 (homogeneous) であるとき つまり A と Φ が全時刻を通じて一定のとき 潜在変数と観測変数の同時確率分布は以下のようになる

2.1 定式化とその性質 12 この間の話題 生成モデルの観点から見た理解 遷移行列に制限を加えて変異形を作れる Ex. Left to right HMM これを用いた数字の識別を通して HMM には時間軸上での局所的な伸縮にたいしてある程度まで普遍性を保つ能力があることを見る

2.2 最尤推定法 13 データ集合 X = {x 1,, x N } が観測された時 HMM のパラメータを最尤推定で決定することができる 尤度関数は 同時分布の式 (13.10) を潜在変数について周辺化して得られるので 同時分布の式 尤度関数 これは潜在変数 z n についての和演算 ( 格子図にある全経路について和を取ることに相当 ) 変数が N 個 それぞれが K 個の状態をもつため 和を取る対象は全部で K N 項! EM アルゴリズムを使って効率的に尤度関数を最大化しよう!

2.2EM アルゴリズム概観 14 1モデルパラメータθをある初期集合 θ old に限定する 2Eステップ 2-1. θ old の値を用いて 潜在変数 p(z X, θ old ) の事後分布を求める 2-2. 求めた事後分布を用いて パラメータ集合 θ の関数として 完全データに対する尤度関数の対数の期待値 Q(θ, θ old ) を求める これを求めるために以下を定義し これらを効率的に求めることを考える 3M ステップ γ z n, ξ(z n 1, z n ) を定数と見なし パラメータ θ = {π, A, φ} に関して Q(θ, θ old ) を最大化し θ new へ更新

2. E ステップ 15 Eステップを説明する流れ 1 先ほど定義したγ z n, ξ(z n 1, z n ) を使って目的関数 Q(θ, θ old ) を表す 2フォワード バックワードアルゴリズム ( 特にα βアルゴリズム ) により γ z n, ξ(z n 1, z n ) を効率的に求められることを確認するということで 1γ z n, ξ(z n 1, z n ) を使って目的関数 Q(θ, θ old ) を表す γ z n は潜在変数 z n の周辺事後分布であり ξ(z n 1, z n ) は 2 つの連続した潜在変数に対する同時周辺事後分布

2.E ステップ 16 γ z n は潜在変数 z n の周辺事後分布なので 各々の n の値について γ z n は和が 1 となる K 個の非負の数の集合を用いて記憶できる ξ(z n 1, z n ) は 2 つの連続した潜在変数に対する同時周辺事後分布なので 和が 1 となるような非負の数を成分とする K K 行列を用いて記憶することができる ここで とする. ξ z n 1,j, z nk γ z nk :z nk = 1 の条件付き確率 :z n 1,j = 1 かつ z nk = 1 の条件付き確率 z nk は二値の確率変数なので それらの期待値は単にそれが値 1 をもつ確率であり

2. E ステップ 17 これらの式を使って (13.12) を整理すると 次式が得られる E ステップ第 1 段階クリア!

2. E ステップ 18 次の目標は 潜在変数の周辺事後確率 γ z n, ξ(z n 1, z n ) の値を効率的に求めること フォワード バックワードアルゴリズム ( 特に α β アルゴリズム ) を使う! 注意 : 出力密度 p(x z) の関数形は何でも良い 必要なのは各 nに対するp(x n z n ) の 値 のみ本節ではモデルパラメータθ old は一定なので このパラメータへの依存性は明示しない ステップ 1: グラフィカルモデルの有向分離を用いて条件付き独立性を書き下す ステップ 2: 新たに定義する条件付き同時確率 α z n,β z n を再帰的に求める ステップ 3: 条件付き独立性と α z n,β z n を用いて γ z n, ξ(z n 1, z n ) を求める

2. E ステップ 条件付き独立性の書き下し 19 有向分離の考え方より 以下の式がかける

E ステップ α z n,β z n の定義 20 求めたいものを 確認! γ z nk :z nk = 1 の条件付き確率 ξ z n 1,j, z nk :z n 1,j = 1 かつ z nk = 1 の条件付き確率 ベイズの定理より ここで p(x) はパラメータ θ old に依存することから 尤度関数である (13.24) 式を p(x z n ) に代入し 確率の乗法定理を用いることで ただし

E ステップ α z n を求める 21 α(z n ) は時刻 n までの全ての観測データと z n の値の同時確率. 条件付き独立性 加法定理 乗法定理より再帰的に定義できる

E ステップ α z n を求める 22 z nk = 1 に対応する α(z n ) の値を α(z nk ) と表す. 和を取る項 : 右辺の z n の K 個の値それぞれについて求めた z n 1 の K 個の状態数 α 再帰の各ステップは O(K 2 ) オーダーの計算量 再帰の開始に必要な初期値は以下で与える. 鎖の長さを N とすると α 再帰により鎖全体の値を求めるコストは O(NK 2 )

E ステップ β z n を求める 23 同様に β z n に関する再帰式を求める. β z n は z n の値を与えたときの 時刻 n+1 から N までの全てのデータの条件付き確率

E ステップ β z n を求める 24 z nk = 1 に対応する β(z n ) の値を β(z nk ) と表す 初期値は (13.33) 式について n=n とし α(z n ) の定義により得られる以下の式から得られる. z n の全ての値について β z n この式は正しい式となる. = 1 とすると

E ステップ γ z n, ξ z n 1, z n を求める 25 最後に ξ z n 1, z n を求める. ξ z n 1, z n = z n 1, z n の K K 個の値の組各々についての条件付き確率 p z n 1, z n X ベイズの定理より 以下のように展開できる. 再帰の結果を使って ξ z n 1, z n を計算できる! E ステップの目標クリア!

有意義な寄り道ー尤度関数 p X ー 26 α 再帰を使えば 鎖の長さに対して線形の計算量で 尤度を計算できる!

2. M ステップ Q(θ, θ old ) の最大化 27 最大化の目的関数は E ステップによって以下のように書ける π と A に関してはラグランジュ乗数を使うことで簡単に求められ 初期値において 0 だった要素はずっと 0 のまま残ることに注意!

2. M ステップ Q(θ, θ old ) の最大化 28 φ k に関して最大化することを考える. 最後の項のみφ k に依存している. γ(z nk ) が負担率の役割を果たす混合分布に対するデータ依存項と同じ! パラメータφ k が成分ごとに独立な場合 1kの各々の値ごとの項の和に分解し それぞれを独立に最大化 2 重みγ(z nk ) で重みづけられた出力確率 p(x φ k ) の重み付き対数尤度関数を最大化

2. M ステップ Q(θ, θ old ) の最大化 29 出力確率がガウス密度分布 離散多項分布

EM アルゴリズムによる最尤推定のお話 30 観測データはEステップでの再帰式において p(x n z n ) の形を通してしか影響を与えない 観測変数の種類 次元 条件付き分布の形には影響されない 最尤推定法が有効なのは データ点数がパラメータ数に比べて大きいとき 学習系列が十分に長い場合に限り 最尤法による隠れマルコフモデルの学習が有効 left-to-rightアルゴリズムに注意

予測の仕方 31 予測分布 x 1 から x N までのデータ影響が α(z N ) の K 個の値にまとめられている 限られた記憶領域でずっと先まで予測分布の計算をし続けることができる

2.2 最尤推定法 ( 積和アルゴリズム ver) 32 積和アルゴリズムでもっと簡単に解けるのでその紹介 出力確率を遷移確率因子に吸収することで 因子グラフを単純化 ここでの因子は以下で表せる 最後の潜在変数 z n を根ノードとし 葉ノード h からメッセージを伝播 変数ノードでは和を取ることもない.

2.2 最尤推定法 ( 積和アルゴリズム ver) 33 上の二式から を消去すると 以下の再帰式が出てくる ここで α を次のように定義する. 因子の定義 (13.46) と再帰式 (13.49) より 先ほどの α 再帰と同一のものを得ることができる!

2.2 最尤推定法 ( 積和アルゴリズム ver) 34 根ノードから葉ノードへのメッセージの伝播 (β 再帰 ) を考える. α 再帰と同様 演算を行わない変数ノードを消去して以下の再帰式を得る さらに以下のように β(zn) を定義する. 因子の定義 (13.46) と再帰式より β 再帰と同一のものが得られる このとき 同時確率は式 (13.53) で表される.

2.3 潜在変数の系列を知るには 35 隠れマルコフモデルでは多くの場合 潜在変数に何らかの意味があると思われる. 与えられた観測系列に対して 隠れ状態の最も確からしい系列を求めたい! max-sum アルゴリズム 直感的な説明 (Dial っぽい ) 葉ノードからメッセージを終点 z n まで伝播 もっとも確からしい経路をたどるには z n 1 のどの状態数を通ればいいかわかる z n 1 にとって z n 2 のどの状態数からの経路がもっともらしいかわかる 以下繰り返し

隠れマルコフいろいろ 36 自己回帰隠れマルコフモデル 観測変数が 2 つ以前の観測変数と潜在変数に依存している 観測変数間のより長い期間の相関をとることができる

隠れマルコフいろいろ 37 input-output 隠れマルコフモデル 出力変数以外の観測変数系列が 潜在変数や出力変数に影響を与える 潜在変数のマルコフ性に関して 条件付き独立性が成り立つため 計算量の面で効率的な学習アルゴリズムを組むことができる

隠れマルコフいろいろ 38 階乗隠れマルコフモデル お互いに独立な 複数の潜在変数のマルコフ連鎖があり 与えられた時刻のステップの観測変数の分布が同じ時刻ステップにおけるすべての潜在変数の状態に依存するようなモデル 潜在状態をかなり少なく抑えることができるが 条件付き独立性が 成り立たないため 学習が複雑になってしまう

3. 線形動的システム 39 線形動的システムとは? 状態空間モデルのうち 潜在変数と観測変数の両方が連続変数 特にガウス分布に従う というモデル 隠れマルコフモデルとの重要なちがいは 潜在変数が離散か連続 ( ガウス分布 ) か ということ 直感的な説明 時間軸上で変化している未知の量 {z1...zn} の値 ( 位置とか ) を 平均がゼロのガウスノイズを載せた観測値 {x1...xn} で返すセンサ (GPS とか ) で計測したいとき zn の値の推定のために いちばん最近の数回の観測値を平均するとよいように思える! もしセンサのノイズレベルが高い場合には 平均をとるときに比較的長い観測窓幅をとったほうがよいだろうし ノイズレベルが低い場合には観測値を比較的そのまま使うほうがよいだろうし というあたりを定式化したモデル

3. 線形動的システム 40 遷移確率分布と出力確率分布はどちらもガウス分布であり 以下の一般的な形に書くことができる このモデルパラメータ推定に対しては EM アルゴリズムを使うのが一般的である この E ステップについては 線形動的システムにおけるフォワード - バックワード再帰のような効率的な推論アルゴリズムが積和アルゴリズムより導かれ 以下のように呼ばれる フォワード再帰についてはカルマンフィルタ方程式 バックワード再帰についてはカルマンスムーザ方程式あるいは Rauch-Tung-Striebel (RTS) 方程式くわしいメッセージの形については省略

粒子フィルタ 41 もちろん線形ガウスでない動的システムも考えられる これは 以下のような状況下で効果を発揮する 時系列に急激な構造変化が見られるとき 異常値が存在するとき 分布に非対称性や非正規性があるとき 非線形システム このような非線形 非ガウスの状態空間モデルに対する扱いやすい推論アルゴリズムとしてサンプリング手法による定式化を用いたものが粒子フィルタ ( ブートストラップフィルタ モンテカルロフィルタ等とも呼ばれる )