Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Similar documents
0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

PowerPoint Presentation

ベイズ統計入門

Microsoft PowerPoint - 資料04 重回帰分析.ppt

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - e-stat(OLS).pptx

Probit , Mixed logit

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft PowerPoint - OsakaU_1intro.pptx

スライド 1

スライド 1

統計的データ解析

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - H18早稲田大学講義.ppt

スライド 1

Microsoft Word - 補論3.2

untitled

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft Word - Time Series Basic - Modeling.doc

1.民営化

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

PowerPoint プレゼンテーション

講義「○○○○」

横浜市環境科学研究所

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - 10.pptx

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

memo

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習

SAP11_03

Microsoft PowerPoint - 三次元座標測定 ppt

untitled

Microsoft PowerPoint - H21生物計算化学2.ppt

PowerPoint プレゼンテーション

様々なミクロ計量モデル†

日心TWS

パソコンシミュレータの現状

Microsoft Word doc

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

スライド 1

09.pptx

PowerPoint Presentation

PowerPoint プレゼンテーション

Microsoft PowerPoint - LectureB1handout.ppt [互換モード]

Microsoft Word - reg2.doc

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

13章 回帰分析

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

ボルツマンマシンの高速化


タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft Word - SDA2012kadai07.doc

PowerPoint プレゼンテーション

景気指標の新しい動向

Microsoft PowerPoint - 10.pptx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Presentation Title

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word - reg.doc

スライド 1

スライド 1

線形システム応答 Linear System response

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

基礎統計

狭山デポ様IBM移設予定機器 _ppt [Compatibility Mode]

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

構造方程式モデリング Structural Equation Modeling (SEM)

Medical3

Presentation Title

Microsoft PowerPoint - Statistics[B]

Hara-statistics

第6章 実験モード解析

相関分析・偏相関分析

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - LectureB1_17woAN.pptx

画像解析論(2) 講義内容

多次元レーザー分光で探る凝縮分子系の超高速動力学

情報工学概論

航空機の運動方程式

PowerPoint Presentation

主成分分析 -因子分析との比較-

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

画像工学入門

生命情報学

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

因子分析

( 前半 ) 目次 1. 辞書学習の導入と先行研究の紹介. 辞書学習の応用事例 3. 辞書学習のサンプル複雑度とは ( 後半 ) 4. 既存の辞書学習のアルゴリズム 5.Bayes 推定を用いた辞書学習のアルゴリズム /53

Microsoft PowerPoint - 基礎・経済統計6.ppt

目次 ガウス過程 (Gaussian Process; GP) 序論 GPによる回帰 GPによる識別 GP 状態空間モデル 概括 GP 状態空間モデルによる音楽ムードの推定

【補足資料】確率・統計の基礎知識

Microsoft PowerPoint - データ解析発表2用パワポ

ハートレー近似(Hartree aproximation)

Transcription:

パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出

パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を 特徴とクラスの関係に関する知識に基づいて どのクラスに属するかを決定 判定 する過程 パターン空間 特徴抽出識別,,, M C,, C, C 概念空間 識別に有効な特徴の抽出 パターンを計測して得られる特徴は 必ずしも識別に有効とは限らない > 識別に有効な特徴を取り出すには? 有効な特徴を抽出する方法 方法 : 統計的特徴抽出法 重回帰分析 主成分分析 判別分析 方法 : 特徴選択法

統計的特徴抽出 パターンの変形 実際のパターンは不規則な変形を伴っている また 観測にノイズが混入することもある > 内の理想的な点の回りの確率的な散らばり 分布 となる 統計的特徴抽出 で特徴ベクトルの確率統計的な構造を利用して パターンを識別するのに有効な特徴を抽出する過程 Ψ から認識に有効なより低次元の判別への最適な写像は での良さを表す評価基準とでのパターンの確率統計的構造に依存して決まる パターン空間 特徴抽出 Ψ 判別空間 C,, C, C 概念空間 線形多変量データ解析手法 線形特徴抽出 Ψ b 多変量データ解析手法 線形判別分析 線形重回帰分析 主成分分析など 多変量を線形結合した新変量に関する評価基準として 平均 乗誤差最小 分散最大などの 次の統計量に基づく評価基準を考える データの空間 の確率統計的構造が 次までの統計量 平均ベクトル 相関行列 共分散行列など に要約され 線形代数の範囲で最適解が陽に求まる 3

線形重回帰分析 線形回帰による直線の当てはめ 個のデータ モデル 評価基準 平均 乗誤差最小,,,, + b + ε b ε ε b 4

5 最適解 直線の当てはめ 最適なパラメータ 最適な直線 r b r * * r + 達成される平均 乗誤差 この時 達成される平均 乗誤差 ρ ε r r

訓練データ 線形重回帰分析,,,, 線形写像 Ψ 予測空間 教師 平均 乗誤差基準 入力と望みの出力の対が学習データとして与えられている時 線形モデルの出力と望みの出力との平均 乗誤差が最小となるような係数行列を求める ε 線形重回帰分析の最適解 最適解 R XX R XY R R XX XY 達成される平均 乗誤差 ε tr R YY tr R XY R XX R XY 6

最小 乗線形判別写像 理想出力を各クラスの代表ベクトルとする 平均 乗誤差 ε t ω 最適な係数行列 R XX ω μ e 最適写像 最小 乗線形判別写像 j C e j ω μ R XX e 教師 e 判別空間 主成分分析 7

8 主成分分析 訓練データ 与えられたデータの変動を最もよく表す新たな特徴量を求める 新特徴の統計量 { } X,, b b M j j j + + X b b + + 分散最大主成分空間 評価基準 新特徴の分散最大 制約条件 最適化問題 Lgrnge 乗数 主成分分析 導出 M j j X X Q λ λ

主成分分析 導出 Q のパラメータに関する偏微分 Q X λ 0 これから X の分散共分散行列の固有値問題が得られる X λ 最適なパラメータは Xの分散共分散行列の最大固有値として求まる ただし その大きさについては 制約条件を満たす必要がある M j j 直線の当てはめ 重回帰分析 ε 主成分分析 b ε d, r 0 9

主成分分析 多次元の場合 主成分分析 Prncpl Component nlss 多変量の計測値から変量間の相関を無くし しかも より低次元の変量によって元の計測値の特性を記述 最適な係数行列 最小二乗近似 ~ Λ, I X ~ ˆ~ ε, ˆ~ ~ 分散最大 主成分空間 最小 乗近似 主成分分析と最小 乗近似 ˆ~ ε ~ ˆ~ ~ 主成分空間 ˆ~ 0

固有顔による顔画像の認識 主成分分析 Prncpl Component nlss 多変量の計測値から変量間の相関を無くし しかも より低次元の変量によって元の計測値の特性を記述 ~ Λ, I 固有顔 Egen Fce X 最小二乗近似 ~ ˆ~, ˆ~ ε ~ ~ 各画像を画素の値をならべたベクトルとして表現し 画像集合を主成分分析して得られる固有ベクトル 主成分スコア間の距離 ˆ~ ˆ~ ~ ~ 線形判別分析

線形判別分析 歴史 英国の統計学者フィシャーが 多くの変量に基づく クラスの判別問題に対して 線形モデルによる解析的な手法を提案 936 年 次の統計量に基づく判別基準を最大化 フィシャーの線形判別分析 Lner Dscrmnnt nlss LD 確率分布を仮定しないノンパラメトリックな統計手法としての多変量データ解析の誕生 線形判別写像 Ψ 判別空間 線形判別分析 次元の場合 訓練データ <, l >,, 各クラスの分離度 判別基準 が最大となる新たな特徴量を求める 新特徴の統計量 { } l C l C 0 判別基準最大 主成分空間

3 線形判別分析 次元の場合 新特徴の統計量 平均クラス間分散 平均クラス内分散 C l C l 判別基準最大化 等価な問題 制約条件 最大化 最適化問題 Lgrnge 乗数 線形判別分析 導出 η Q λ λ

線形判別分析 導出 Q のパラメータに関する偏微分 Q λ 0 これから 一般化固有値問題が得られる λ 最適なパラメータは Xの分散共分散行列の最大固有値として求まる ただし その大きさについては 制約条件を満たす必要がある 線形判別分析 多次元の場合 判別基準 同じクラスに属す点はなるべく近く 異なるクラスに属す点は離れる ただし J [ ] tr Ψ Y Y : 平均クラス内共分散行列 : 平均クラス間共分散行列 Y, 最適解 最適な係数行列は 固有値問題, Y Λ, I の最大 n 個の固有値に対応する固有ベクトルを列とする行列として求められる ただし Yの次元 nは行列のランクの関係から n mn, m 4

線形判別分析の例 アヤメのデータの場合 Fsher のアヤメのデータ 3 種類のアヤメの花から 4 種類の特徴を測定 4 次元の特徴ベクトル 各種類 50 個のサンプル ここまでのまとめ ベイズ識別の理論 事後確率が重要 事後確率最大のクラスに識別すればよい そのためには 確率密度関数の推定が必要 パラメトリックモデル ノンパラメトリックな手法 セミパラメトリック 各クラスの条件付確率が正規分布の場合 事後確率の対数をとると 特徴量に関して 次の関数 識別関数 クラスの分散共分散行列が等しい場合には 次 線形 の識別関数 線形識別関数の学習 訓練データから直接識別関数のパラメータを求める パーセプトロン 最小 乗判別関数の学習 ロジスティック回帰 多層パーセプトロン 汎化性能 訓練データに対する識別性能ではなく 未学習データに対する性能が重要 汎化性能の評価 Cross-Vldton ブートストラップ 情報量基準 汎化性能の向上 Shrnge 法 ノイズの付加 変数選択 統計的特長抽出 最小 乗判別関数 主成分分析 判別分析 5

質問等 電子メール to-urt@st.go.jp ホームページ http://stff.st.go.jp/to-urt/nde-j.html 連絡先 305-8568 茨城県つくば市梅園 -- つくば中央第 産業技術総合研究所栗田多喜夫 電話 FX 電話 09-86-5838 FX 09-86-584 5 限目終了 6