memo

Similar documents
Microsoft Word - 補論3.2

Probit , Mixed logit

DVIOUT

様々なミクロ計量モデル†

行列、ベクトル

パソコンシミュレータの現状

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - 10.pptx

景気指標の新しい動向

航空機の運動方程式

Microsoft Word - Time Series Basic - Modeling.doc

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

PowerPoint Presentation

Microsoft Word - reg2.doc

航空機の運動方程式

Microsoft PowerPoint - mp11-02.pptx

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

ベイズ統計入門

喨微勃挹稉弑

Microsoft Word - thesis.doc

PowerPoint Presentation

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

Microsoft PowerPoint - 10.pptx

Excelを用いた行列演算

数学の世界

数学 Ⅲ 微分法の応用 大学入試問題 ( 教科書程度 ) 1 問 1 (1) 次の各問に答えよ (ⅰ) 極限 を求めよ 年会津大学 ( 前期 ) (ⅱ) 極限値 を求めよ 年愛媛大学 ( 前期 ) (ⅲ) 無限等比級数 が収束するような実数 の範囲と そのときの和を求めよ 年広島市立大学 ( 前期

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

Microsoft PowerPoint - H21生物計算化学2.ppt

スライド 1

横浜市環境科学研究所

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

1/17 平成 29 年 3 月 25 日 ( 土 ) 午前 11 時 37 分第 7 章 : 量子力学とディラック方程式 ( 学部 4 年次向 ) 第 7 章量子力学とディラック方程式 Ⅰ. クライン ゴルドン方程式の完全平方化 素粒子場 : y ( x,t ) の従うクライン ゴルドン方程式は

09.pptx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

数学 ⅡB < 公理 > 公理を論拠に定義を用いて定理を証明する 1 大小関係の公理 順序 (a > b, a = b, a > b 1 つ成立 a > b, b > c a > c 成立 ) 順序と演算 (a > b a + c > b + c (a > b, c > 0 ac > bc) 2 図

スライド 1

Microsoft PowerPoint - H22制御工学I-2回.ppt

スライド 1

固体物理2018-1NKN.key

Microsoft Word - 非線形計画法 原稿

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft Word - NumericalComputation.docx

構造方程式モデリング Structural Equation Modeling (SEM)

memo

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

DVIOUT-SS_Ma

Microsoft Word - 断面諸量

Microsoft Word - å“Ÿåłžå¸°173.docx

DVIOUT

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - 三次元座標測定 ppt

データ解析

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17)

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

<4D F736F F D2094F795AA95FB92F68EAE82CC89F082AB95FB E646F63>

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二

memo

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

統計的データ解析

Microsoft Word - 1B2011.doc

統計学的画像再構成法である

3 数値解の特性 3.1 CFL 条件 を 前の章では 波動方程式 f x= x0 = f x= x0 t f c x f =0 [1] c f 0 x= x 0 x 0 f x= x0 x 2 x 2 t [2] のように差分化して数値解を求めた ここでは このようにして得られた数値解の性質を 考

位相最適化?

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Microsoft Word - Chap17

Microsoft Word - mathtext8.doc

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

1/17 平成 29 年 3 月 25 日 ( 土 ) 午前 11 時 1 分量子力学とクライン ゴルドン方程式 ( 学部 3 年次秋学期向 ) 量子力学とクライン ゴルドン方程式 素粒子の満たす場 y ( x,t) の運動方程式 : クライン ゴルドン方程式 : æ 3 ö ç å è m= 0

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

Microsoft Word - ㅎ㇤ㇺå®ı璃ㆨAIã†®æŁ°ç’ƒ.docx

untitled

補足 中学で学習したフレミング左手の法則 ( 電 磁 力 ) と関連付けると覚えやすい 電磁力は電流と磁界の外積で表される 力 F 磁 電磁力 F li 右ねじの回転の向き電 li ( l は導線の長さ ) 補足 有向線分とベクトル有向線分 : 矢印の位

行列の反復解法 1. 点 Jacobi 法 数値解法の重要な概念の一つである反復法を取り上げ 連立一次方程式 Au=b の反復解法を調べる 行列のスペクトル半径と収束行列の定義を与える 行列のスペクトル半径行列 Aの固有値の絶対値の最大値でもって 行列 Aのスペクトル半径 r(a) を与える 収束行

FEM原理講座 (サンプルテキスト)

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - 13.ppt [互換モード]

vecrot

平成 年 月 7 日 ( 土 第 75 回数学教育実践研究会アスティ 45 ビル F セミナールーム A 札幌医科大学 年 P ab, を正の定数とする 平面上において ( a, を中心とする円 Q 4 C と (, b を中心とする円 C が 原点 O で外接している また P を円 C 上の点と

2015年度 信州大・医系数学

DVIOUT

1999年度 センター試験・数学ⅡB

PowerPoint プレゼンテーション

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

1.民営化

2-1 / 語問題 項書換え系 4.0. 準備 (3.1. 項 代入 等価性 ) 定義 3.1.1: - シグネチャ (signature): 関数記号の集合 (Σ と書く ) - それぞれの関数記号は アリティ (arity) と呼ばれる自然数が定められている - Σ (n) : アリ

Microsoft Word - reg.doc

レッスン15  行列とグラフ

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

SAP11_03

カイ二乗フィット検定、パラメータの誤差

代数 幾何 < ベクトル > 1 ベクトルの演算 和 差 実数倍については 文字の計算と同様 2 ベクトルの成分表示 平面ベクトル : a x e y e x, ) ( 1 y1 空間ベクトル : a x e y e z e x, y, ) ( 1 1 z1

特殊なケースでの定式化技法

Microsoft PowerPoint - ad11-09.pptx

<4D F736F F D F2095A F795AA B B A815B837D839382CC95FB92F68EAE2E646F63>

Laplace2.rtf

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

国土技術政策総合研究所 研究資料

Microsoft PowerPoint - 応用数学8回目.pptx

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

Transcription:

数理情報工学特論第一 機械学習とデータマイニング 4 章 : 教師なし学習 3 かしまひさし 鹿島久嗣 ( 数理 6 研 ) kashima@mist.i.~ DEPARTMENT OF MATHEMATICAL INFORMATICS 1

グラフィカルモデルについて学びます グラフィカルモデル グラフィカルラッソ グラフィカルラッソの推定アルゴリズム 2

グラフィカルモデル 3

教師なし学習の主要タスクは 4 つあるのでした 教師なし学習においては通常 データ上の確率分布 P(Á(x)) を何らかの形で推定することが行われる 確率分布の使い道としては主に以下の 4 つが挙げられる : タスク 1: 確率分布そのものを用いた分析 ( 今日はコレ ) タスク 2: データの確率評価 タスク 3: 未観測値 ( 欠損値 ) の推定 ( 前々回 ) タスク 4: 潜在変数の推定 ( 前回 ) 4

今回は データの特徴ベクトルの要素間の関係を調べるために 精度行列が疎であるような多次元確率分布を考えます 4 つのタスクのひとつ 確率分布そのものを用いた分析 では 確率分布そのものを用いてデータに対する知見を得ることが目的 1. パラメータ ( もしくは確率分布 P(Á(x)) の形 ) を 鑑賞 することによって データ全体がどのような形で分布しているかを知る 2. 2 つのデータ集合から推定された 2 つの確率分布が異なるか 異なるとしたらどのように異なるのかを調べる 多次元正規分布モデルの場合 精度行列 の各要素は 任意の 2 要素の積にかかる係数であるから 要素間の直接的な関係を表している この要素間の関係は 精度行列の非零要素の数 つまり 直接的な関係の数が尐ない方が 解釈が容易になる そのため 今回は 精度行列が疎 ( 多くの要素が 0) で 要素間の関係がよりはっきりと示されているような 多次元正規分布を扱う 5

一般に パラメータがグラフ構造 ( 疎な構造 ) をもつと解釈できるようなモデルをグラフィカルモデルと呼びます ( 多次元正規分布に限らず ) 一般に 疎なパラメータ構造をもち その構造がある種のグラフ構造として解釈できるような確率モデルをグラフィカルモデルと呼ぶ 連続の場合の代表的モデル : グラフィカルラッソ ( 疎な多次元正規分布 ) 離散の場合の代表的モデル : ベイジアンネットワーク 広い意味では 教師つき学習のところで紹介した条件付き確率場 ( CRF) もグラフィカルモデルの範疇に入る 6

グラフィカルラッソ 7

精度行列の最尤推定量は通常 密 になります 多次元正規分布の精度行列を観測されたデータからの最尤推定する方法については以前述べた たとえ 真の精度行列が疎である場合でも 通常は推定された精度行列は密になってしまう 精度行列 を用いた多次元正規分布の密度関数 : パラメータ ¹ および を 訓練データ集合 {x (i) } i=1n から最尤推定によって求めることにすると その最適化問題は : このままでは精度行列の推定量 * が (=Σ *-1 ) 密行列になってしまう 8

精度行列の推定量を 疎 にするために L 1 正則化を行ったものをグラフィカルラッソと呼びます パラメータ ¹ および を 訓練データ集合 {x (i) } i=1n から最尤推定によって求めることにすると その最適化問題は : このままでは 精度行列の推定量 * が密行列になってしまう 精度行列の推定量 * を疎にするために 精度行列について L 1 正則化を行うことにすると 最適化問題は : k k 1 は行列の L 1 - ノルムであり 以下のように各要素の絶対値の和 9

L 1 正則化を行うと 精度行列の推定量は閉じた形では求まりません 平均パラメータの推定量 ¹ * については正則化項が存在しないため 最尤推定の場合と同じになり その推定量は : 全データの特徴ベクトルの平均 一方で 精度行列のほうは L 1 正則化項の存在により 平均パラメータのように閉じた形では求まらない 従って グラフィカルラッソの本質は いかにして精度行列の推定を行うかということになる 10

グラフィカルラッソの目的関数はシンプルに書けます についてのみ最適化することにして 多次元正規分布の密度関数の定義を代入して書き下すと : この最適化問題の目的関数は以下のように書き換えられる : ここで 以下を使った : 標本分散共分散行列 S: 11

グラフィカルラッソのアルゴリズム 12

まずは目的関数を精度行列で微分します グラフィカルラッソの目的関数を最大化する を求めたい 実は この最適化問題は精度行列 についてではなく その逆行列である分散共分散行列 Σ = -1 について解くことになる この目的関数を の各 (k,l)- 要素 [ ] k,l で微分すると : ここで行列の微分の公式をもちいた : と Σ の逆行列を通じた等価性から の式において ( についての微分 )=0 の成立は 対応する Σ が最適解であることも意味する 13

対角成分は閉じた形で求まります まず 微分を の対角成分についてみてみる 精度行列 は正定行列であることに注意すると その対角成分は必ず正 つまり [ ] k,k >0 であることから 微分の対角成分は : これを 0 と置くと 分散共分散行列 Σ の対角成分を閉じた形で得る : これで分散共分散行列 Σ の対角成分については最適解が求まった 今後は Σ の非対角成分についてのみの最適化を考えればよい 14

非対角成分は 閉じた形で求まりませんが 実は L 1 正則化回帰 ( の繰り返し ) に帰着されます 分散共分散行列 Σ の対角成分以外の成分の最適解を求める 精度行列 の最適解は = Σ -1 の関係によって自動的に定まる しかし 対角成分全てについての最適化は難しい そこで 分散共分散行列のある行 ( 対称なので ある列としても同じ ) のみについての最適化を行い これを選ぶ行を変えながら繰り返すという戦略をとることにする これから示すように 実は 分散共分散行列のある行 ( 列 ) についての最適化は 回帰問題のときに紹介した L 1 正則化回帰に帰着されることがわかる 15

分散共分散行列を部分的に最適化するため 各行列の分割を考えます 分散共分散行列を部分的に最適化するため 分散共分散行列の分割を考える : は (D-1) (D-1) の行列 は長さD-1のベクトル ¾ D はスカラー Σ の最後の行 ( 列 ) について最適化するとすれば は定数であり ¾ D は対角成分なので既に最適解が求まっており 定数とみなせる 従って ここでパラメータはとなる Σと同様に 精度行列と標本分散共分散行列の分割をそれぞれ : 16

分散共分散行列と精度行列の関係式がブロックごとに導かれます Σ = I であることから 分割した行列の各ブロックについて : 特に 右上のブロックから : すなわち : 17

分散共分散行列の現在注目しているブロックが最適解になる条件を導きます 先の微分の ( 精度行列の現在注目しているブロック ) に関連する部分だけを取り出すと : となっているので ここからを ( 前頁 ) を用いて消去すれば : 結果 微分が ( と D) によって表される これが =0 になるのが最適解の条件 しかし このままでは 場合分けの条件式がややこしい 18

パラメータを置き換えて 最適解の条件を簡単に書きます この微分を簡単にしたい : 新たなパラメータ を導入する : つまり : であること また 精度行列 は正定であるので その対角成分である D は正であることに注意すると 微分の式は : のみを使って書くことができる 場合分けの丌等式の向きが変わったことに注意する 19

同じ微分をもつ 別の最適化問題に書き換えます 最終的に得られた微分 : これは 以下の目的関数の についての微分と一致する : もともとの最大化問題の目的関数を の関数としてみたものと この最小化問題の目的関数は同一 連続で 微分丌可能な点が同じで それ以外の場所では微分が一致 つまり もともとの目的関数のかわりに 新たな目的関数を用いて を求めても差し支えないということを意味する 20

新しい目的関数を 変数ごとに最適化することを考えます さらに 目的関数 : を の第 k 成分 [ ] k についてのみ最適化することを考える 目的関数を [ ] k についての関数だと思って整理すると : 21

ちょうどL 1 正則化回帰のときに出てきた目的関数と同じ形であることに気付きます 結局 [ ] k の最適解 [ ] k* は 以下の最適化問題を解くことで求まる これはまさに L 1 正則化回帰の次元ごとの逐次解法のときに出てきた最適化問題 と同じ形をしている 22

L 1 正則化回帰のときの解を利用して 解を導きます L 1 正則化回帰の次元ごとの逐次解法のときに出てきた最適化問題 : この解は : これを利用すると いま解きたい最適化問題 : の最適解 [ ] k* は : これを k を変えながら繰り返すことによって が求まる 23

L 1 正則化回帰を繰り返すことによって グラフィカルラッソの推定ができます 一旦 が得られると を用いて を求めることができる この一連の手続きによって Σ の最後の行 ( 列 ) を求めるのがグラフィカルラッソのアルゴリズムにおける 1 ステップである このステップを 行 ( 列 ) の順番を入れ替えて最後にくるものを適当に変えながら繰り返し行い 収束するまで繰り返す つまり L 1 正則化回帰問題を繰り返し解く グラフィカルラッソのアルゴリズムは : ブロック分割で最後にもってくる行 ( 列 ) を変えながら 最後の行 ( 列 ) についての最適化を繰り返す外側のループ 最後の行 ( 列 ) についての最適化を行うために のある次元についての最適化を 選ぶ次元を変えながら繰り返す内側のループ の 2 つのループで構成されている 24

このアルゴリズムは逆行列の計算を必要としないため効率的です このアルゴリズムの効率的なところは Σ = -1 という関係をもつ 2 つの行列 Σ と を扱っていながら 逆行列の計算がまったく出てこないところである Σ = I をブロック分割した式 ( 右上と右下 ) およびの連立方程式を解くことでから の最後の行 ( 列 ) が求まる : また 得られた解は条件 Σ = I を満たすように作られるため 得られる Σ と は正定であることが保証される 25