工学応用の観点からのデータ同化とその特徴明治大学中村和幸 1

目次データ同化と適用例データ同化とは適用例データ同化における定式化とアルゴリズムデータ同化と状態空間モデルベイズ更新データ同化アルゴリズム工学応用に向けたデータ同化の位置づけ他の類似手法との比較まとめ 2

データ同化の目的情報を詳細にできる数値シミュレーション現実の情報の反映格子を細かくできる? 現実の情報? 観測データ離散化誤差, モデル化誤差誤差計測誤差良いところ取りをしたい! 3

データ同化でできること予測のための初期条件の構成予報精度の向上を目指す現業の天気予報ですでに行われている観測できない物理変数や状態の推定 3 次元,4 次元的な再構成シミュレーションモデルと組み合わせることで, 適切な力学的制約が入る感度解析効率のよい計測点データの設計経験的パラメータの推定境界条件の推定 4

データ同化例 1 津波データ同化データ同化による解析津波モデル潮位計データ樋口統数研, 広瀬九大,B.H. ChoiSung Kyun Kwan 大各氏との共同研究不確かな海底地形の推定 5

データ同化例 2 神戸空港地盤沈下データ同化地盤変形モデル沈下量データ直接見ることができない地中の土の状態がわかる予測精度の向上で, 中途での工法変更が可能に村上藤澤京大, 珠玖西村岡大各氏との共同研究 6

データ同化例 2 神戸空港地盤沈下確率計測データと地盤変形モデルの融合により, 予測がからに改善する同じような確率データが少ないのでよくわからない確率実際の値はこの辺りのはず! 通しにくい透水係数通しやすい A. Murakami e al., In. J. Numer. Anal. Mehods Geomech. 2012 7

データ同化例 3 遺伝子ネットワークモデル Simulaion model Biological daa データ同化現実の系を表すには不完全未知パラメータノイズ, 欠測など生体プロセスの予測生体システムに関する新たな知見長崎東北大, 宮野東大, 吉田, 樋口統数研各氏との共同研究 8

データ同化例 3 遺伝子ネットワークモデル初期状態の推定結果 Hybrid Funcional Peri Ne によって表現されたシミュレーションモデル次元は低いが非線形性が強いパラメータの分布を推定できる予測精度が上がるだけでなく, 興味ある事象が起こる確率を適切に評価できる 9

データ同化と状態空間モデリング 10

数値シミュレーションモデル基礎となる偏微分方程式の離散化等により構成基礎ダイナミクスから現実を再現することを目的とするシミュレーションコード極端な場合, ライブラリの形でのみアクセス可能な場合がある偏微分方程式物理を反映, 連続時空間シミュレーションモデル離散時間空間 T o T o T o T o T o T o T o uo vo u y o 1 1 1 vo1 y T T T M M o M o e T o wos wos wos z wos wos uo h y vo g r uo o H 0 h y y uo g 0 r y vo o H h H uo vo rh y H s 時間空間離散化コーディング 11

シミュレーションモデルとシステムモデルシミュレーションモデルの誤差, 初期境界条件などによる状態の誤差が反映されていないこのような誤差まで含めたモデルとして, システムモデルを定式化を状態ベクトル, をシステムノイズと呼ぶ v 形式的にこのように書ける : f 1 シミュレーションモデル離散時間空間全シミュレーション変数コーディング誤差も含める : f, v 1 モデル化誤差など 12

方程式からシステムモデルへ日本周辺の簡易化した気象モデルの例を用いて説明 2 c f 1 各格子点は物理量 i i Ti, Hi, Ui, Vi i を持つ湿度温度風速ベクトル v i 1 f 1, v i1,,..., ] [ 2 1 k T k は格子点数 13

観測情報と観測モデルほとんどの場合, 観測情報はシミュレーションの情報に比べて圧倒的に不足. ダイナミクスを伴う逆問題. さらに, 時点間で独立な観測ノイズもある観測情報は, その時点の全物理変数 = 全シミュレーション変数, および観測ノイズが与えられれば, 説明できるという定式化全観測変数観測ノイズ y h, w dim dim y 全シミュレーション変数 10 4 ~10 6 y 10~10 5 14

両者をつなぐ鍵非線形状態空間モデルシミュレーションモデルから自然に書き下すことができるほとんど数値シミュレーションモデルは, マルコフ性を満たすか, 満たすように変形できる逐次ベイズ更新の式により, のオンライン推定観測を得る毎の推定が可能 = 逐次データ同化全シミュレーション変数 f 1, v y h, w 全観測変数モデル化誤差など観測ノイズ dim dim y 15

非線形非ガウス状態空間モデル非線形非ガウス状態空間モデル : システムモデル観測モデル y 1, v, w 状態ベクトル y 観測ベクトル v : システムノイズ w : 観測ノイズは任意の分布でよい v, w f h 0 1 y1 1 アンサンブルカルマンフィルタ, 粒子フィルタ ec. により, フィルタ分布の計算が原理的には可能... y 1 y y 1 f 1 v h y 1 w もこのクラスに含まれる... yt T 16

逐次データ同化逐次データ同化では一期先予測とフィルタリングを繰り返して, 観測を得る毎にシミュレーション変数の値分布をオンライン推定する y p 1 y1: 1 y 1 時間を進める時刻 -1 までの全観測を一期先予測使ったときの時刻 -1 のシミュレーション変数の推定値時刻 -1 までの全観測を使ったときの時刻 -1 のシミュレーション変数の推定値 p y p y, y,, y i 1: k i 1 2 k p y1 : 1 p y 1 : 非線形状態空間モデルでのフィルタリングの手法で実現可 y 時刻 -1 までの全観測を使ったときの, 時刻のシミュレーション変数の推定値時間を進める y 観測を反映フィルタリング p y1 : 1 y 1 17

ベイズ更新 18

少しわき道 : ベイズの定理の問題 PA C=0.95,PA c C c =0.95,PC=0.005 のとき,PC A の確率を求めよ. 例えば,A/A c はある病気の検査結果の陽性 / 陰性,C/C c は実際に病気 / 病気でないを表す 19

確率はどのくらいでしょうか? Y p X p X Y p Y X p S S p S Y p Y p c c S C P C A P C P C A P C P C A p S P S A P C P C A p A C p ベイズの定理 20

どうして確率が低い? PA C=0.95,PA c C c =0.95,PC=0.005 のとき,PC A の確率を求めよ. もともとの確率が低いから. 仮に PC A を 90 パーセント以上にしようとすると, 検査の精度は 99.95 パーセント以上にしないといけない例えば,A/A c はある病気の検査結果の陽性 / 陰性,C/C c は実際に病気 / 病気でないを表す 21

一方で... PA C=0.95,PA c C c =0.95,PC=0.005 のとき,PC A の確率を求めよ. もともとの確率は 0.5 パーセントこれが,8.7 パーセントになったのだから, A という情報により C の確率が更新された! 例えば,A/A c はある病気の検査結果の陽性 / 陰性,C/C c は実際に病気 / 病気でないを表す 22

ベイズ更新現象 X が発生した条件下でデータ Y が得られる確率 p X Y データ Y が得られた時に現象が X である確率 p Y X p Y p X データ Y の生成確率現象 X が発生するもともとの確率 p Y p Y S p S より, S 必要なのは p Y X と px. ベイズの定理現象生成データデータ生成モデルと現象の発生確率を与えれば, データから現象の説明が可能! 因果の反転ができる! : 事前知識や数理モデル : 観測を表す式 23

逐次データ同化再掲逐次データ同化では一期先予測とフィルタリングを繰り返して, 観測を得る毎にシミュレーション変数の値分布をオンライン推定する y p 1 y1: 1 y 1 時間を進める時刻 -1 までの全観測を一期先予測使ったときの時刻 -1 のシミュレーション変数の推定値時刻 -1 までの全観測を使ったときの時刻 -1 のシミュレーション変数の推定値 p y p y, y,, y i 1: k i 1 2 k p y1 : 1 p y 1 : 非線形状態空間モデルでのフィルタリングの手法で実現可 y 時刻 -1 までの全観測を使ったときの, 時刻のシミュレーション変数の推定値時間を進める y 観測を反映フィルタリング p y1 : 1 y 1 24

データ同化アルゴリズム 25

データ同化アルゴリズム一覧 Kalman filer Eended Kalman filer Ensemble Kalman filer EnKF EAKF,ETKF, Paricle filer or SIR filer, Mone Carlo filer SIR でなく SIS filer もある Merging paricle filer, Kernel paricle filer, 逐次型 4DVAR 変分非逐次型 3DVAR Nudging, OI, 1 時点の補間と隠れ変数の推定のみ原始的 26

カルマンフィルタ 1960 年に Kalman によって提案されるもともとは衛星の位置の同定のために開発された線形の状態空間モデルの状態推定に用いられる F G v 1 y H w 27

KF 2 次元の場合のイメージ図 0 0 0, V0 0 1 1, V 0 1 0 1 1, V1 1 y 1 2 2, V2 2 3 3, V 2 1, V2 1 2 3 2, V3 2 3 3 3 4 4 4, V4 4 4 3, V4 3 観測ノイズなしの値観測値 1 期先予測値フィルタ推定値カルマンフィルタでは, 観測ノイズなし値に近い推定値を得ることその分散 = 誤差の範囲の値も得ることが目的 28

アンサンブルカルマンフィルタそれまでの拡張カルマンフィルタの欠点である線形化モデル構築 = 微分計算の必要性や, 分散共分散行列の推定が不安定である点を克服するために導入気象海洋の分野特に研究分野では, 変種も含めて広く使われている分布を実現値の集合 = シナリオの集合で表現, 計算はカルマンフィルタ 1 F 1 y H G v w y f h 1, v w 29

状態一期先予測 EnKF,PFSIR,SIS 共通 1 1 1 2 1 1 f i 1 1, v i i N 1 1 i1 シミュレーション i 1 i N 1 i1 2 1 N 1 1 1 1 N 1 一期先予測からのサンプルフィルタ分布からのサンプル一期先予測 1 条件の違うシミュレーションを複数 N パターン繰り返す時刻

EnKF におけるフィルタリング状態 i NN 1i i 1 1 2 1 サンプル分散共分散行列 : 一期先予測からのサンプルフィルタ分布からのサンプル Vˆ 1 観測 : y 1 1 N 1 Kˆ i Vˆ ' ' 1 1 1 i 1 H カルマンゲイン H Vˆ ˆ i i y w H 1 K H Rˆ フィルタリング修正しました! 時刻

EnKF 2 次元の場合のイメージ図 0 i N 0 0 i1 1 i 0 1 i 1 1 y 1 i 2 1 i 2 2 2 i 3 3 i 3 2 3 4 i 4 3 i 4 4 観測ノイズなしの値観測値 1 期先予測値フィルタ推定値 32

粒子フィルタカメラによる物体追跡に広く使われているアルゴリズム画像処理の分野では Condensaion としても知られる他に経済時系列, ロボットの状態推定などに使われるデータ同化では, 系によるが限定的特に気象海洋系では任意のモデルで適用可能 w h y v f 1, ~ ~ 1 R y Q 33

sae i N 1 i1 2 1 フィルタリング PFSIR 1 1 尤度 i N i1 2 1 観測 : y 各サンプルの尤度データへのあてはまり N 一期先予測からのサンプルフィルタ分布からのサンプル j p y p y i 1 j 1 N 1 フィルタリング尤度に比例して復元抽出時刻

sae i N 1 i1 2 1 フィルタリング PFSIS 1 1 尤度 i N i1 2 1 一期先予測からのサンプルフィルタ分布からのサンプル j 観測 : p y p y i 1 j 1 y 各サンプルの尤度データへのあてはまり N 1 N フィルタリング各サンプルの重みを積で蓄積していく時刻

PF 2 次元の場合のイメージ図 0 i N 0 0 i1 1 i 0 1 i 1 1 y 1 i 2 1 i 2 2 2 i 3 3 i 3 2 3 4 i 4 3 i 4 4 観測ノイズなしの値観測値 1 期先予測値フィルタ推定値 37

4 次元変分法 Adjoin 法 1980 年代に開発一定区間について, ダイナミクスを保持したまま, データとモデルから決まるコスト関数を最小化する初期値を探す方法 y f h 1 w 38

手法間の特徴比較連続性非線形性への対応アンサンブルの効率性 Eended KF 保たれない弱非線形のみ N/A EnKF モデル次第 / 保たれないモデル次第 PFSIR モデル次第状況次第 PFSIS 低い 4DVAR モデル次第 N/A

工学応用に向けたデータ同化の位置づけ 40

類似手法との比較 1: 最適設計同じところ : 境界条件推定とすると, 対象となる不確かさを持つ部分あるいは自由度を持つ部分は同じ違うところ : 隠れている物理状態特に時変の状態や 4 次元大浪玖薄の推定最適値か確率分布か 41

類似手法との比較 2: システム同定同じところ : パラメータ推定の場合には, 決める対象は同一確率的なシステム同定モデル同定の場合には, 分布で考える点も同一違うところ : モデルや計測の想定規模対象にもよるが中心的に想定している不確かさの対象特にモデル同定の場合にはモデルそのものの不確かさ通常のデータ同化の場合には, モデルの不確かさは小さく, 状態の不確かさが大きい 42

データ同化を工学の道具とした時の良さ推定対象の確率分布を陽に使用するロバストネスやリスクの評価に使用できる確率実際の値はこの辺りのはず! 透水係数通しにくい通しやすい計測誤差とシステムシミュレータの誤差を陽に考える両者を定量的にバランスすることができる 43

まとめ 44

まとめデータ同化について説明目的状態パラメータ推定予測精度向上アルゴリズム類似手法との比較計測とシステムの両方にノイズを定量的に想定してバランス 45

さらなる発展違うもの観測ノイズとシステムノイズをバランスできているので, 他のものも含めることができそう例えばコストやそのバラツキもバランスできる CFD/EFD 融合計測融合シミュレーションの各方法との融合数理的な整理 CAE ツールへの融合につながるのでは? 46

Email : knaka@meiji.ac.jp 47

工学応用の観点からのデータ同化とその特徴 明治大学 中村和幸 1

工学応用の観点からのデータ同化とその特徴明治大学中村和幸 1