MATLAB®製品紹介セミナー

Similar documents
Presentation Title

MATLAB ではじめる画像処理とロボットビジョン ~ 機械学習による物体認識と SLAM~ MathWorks Japan アプリケーションエンジニアリング部信号処理 通信 木川田亘 2015 The MathWorks, 1Inc.

SimulinkによるReal-Time Test環境の構築

f2-system-requirement-system-composer-mw

AI技術の紹介とセンサーデータ解析への応用

PowerPoint Presentation

Presentation Title

SimscapeプラントモデルのFPGAアクセラレーション

Presentation Title

Presentation Title

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習

Introduction to System Identification

Expo 2014

いまからはじめる、MATLABによる 画像処理・コンピュータビジョン

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

PowerPoint プレゼンテーション

b4-deeplearning-embedded-c-mw

ディープラーニングの組み込み機器実装ソリューション ~GPC/CPU編~

Adobe Acrobat DC 製品比較表

はじめての機械学習

機械学習のご紹介

Microsoft PowerPoint - EXPO2012_AKASAKA_rev.2.pptx

Presentation Title

Microsoft PowerPoint - 【最終提出版】 MATLAB_EXPO2014講演資料_ルネサス菅原.pptx

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Presentation Title

Presentation Title

AMS Expoコンテンツ

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

PowerPoint Presentation

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

Microsoft Word - HowToSetupVault_mod.doc

24 SPAM Performance Comparison of Machine Learning Algorithms for SPAM Discrimination

信用リスクモデリング ケーススタディ

MATLAB®によるビッグデータ解析

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

制御のためのSimulink入門

Signal Processing Toolbox

Microsoft PowerPoint SIGAL.ppt

PowerPoint プレゼンテーション

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

2D/3D CAD データ管理導入手法実践セミナー Autodesk Vault 最新バージョン情報 Presenter Name 2013 年 4 月 2013 Autodesk

f3-power-train-simulation-mw

センサーデータアナリティクスの開発から運用まで

スライド 1

Microsoft Word - QlikView Server Memory Management and CPU Utilization_Technical Brief_Jpn.docx

Managing and Sharing MATLAB Code

日心TWS

CLEFIA_ISEC発表

SAP11_03

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

いまからはじめる組み込みGPU実装

OpRisk VaR3.2 Presentation

スライド 1

d4-automated-driving-mw

ボルツマンマシンの高速化


Model-Based Calibration Toolbox 4.0

正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 220

MATLAB EXPO 2019 Japan プレゼン資料の検討

Presentation Title

Presentation Title

プリント

HEVの車両全体シミュレーションによるシステム最適化

スライド 1

医用画像を題材とした3次元画像解析とディープラーニング

PowerPoint Presentation

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

AutoCAD メッシュ ソリッド モデリング

dlshogiアピール文章

Xpand! Plug-In Guide

X-Form Plug-in Guide

PowerPoint Presentation

TOOLS for UR44 Release Notes for Windows

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

ソフト活用事例③自動Rawデータ管理システム

memo

スライド 1

Presentation Title

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

名称未設定

PowerPoint プレゼンテーション

プリント

Medical3

Microsoft PowerPoint - Civil3D_3dsMaxD_Workflow_Public.pptx

ベイズ統計入門

ベース0516.indd

Veritas System Recovery 18 System Recovery Disk

Microsoft PowerPoint _MATLAB_EXPOè¬łæ¼flrev3

PowerPoint Presentation

Microsoft PowerPoint - LAB-03-SR18-ã…Łã‡¡ã‡¤ã…«ã…ªã‡¹ã…‹ã‡¢-v1

(速報) Xeon E 系モデル 新プロセッサ性能について

Microsoft PowerPoint - NA03-09black.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

三者ミーティング

サーバに関するヘドニック回帰式(再推計結果)

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

Microsoft PowerPoint SCOPE-presen

PowerPoint プレゼンテーション

AutoCAD WS Mobile アプリケーション

Transcription:

MATLAB における分類 パターン認識 - 入門編 - MathWorks Japan アプリケーションエンジニアリング部 ( テクニカルコンピューティング部 ) アプリケーションエンジニア大開孝文 2012 The MathWorks, Inc. 1

アジェンダ 回帰モデルと分類モデルについて 分類手法を使ったワインの品質モデリング まとめ 2

分類手法を使ったワインの品質モデリング アプローチ 膨大なデータから 分類モデリング 線形判別 単純ベイズ分類器 Tree Bagger 並列演算による計算の高速化 パラメータの選択 利用製品 MATLAB Statistics Toolbox Parallel Computing Toolbox 3

予測モデル ( 回帰モデル ) Y = F(X 1, X 2, X 3, X n ) 数値 4

予測モデル ( 分類モデル ) Y = F(X 1, X 2, X 3, X n ) 数値 ( 名義尺度 順序尺度 ) 5

アプリケーション例金融分野 格付けの割り当て 格付け離散値 AAA AA BB 経営状況による格付けの予測 内部留保 総資産 運転資金 6

分類 パターン認識における課題 市販のプログラムでは解析手法がよくわからない 分類される訓練について時間がかかる よく分かる専門家が必要 7

分類手法を使ったワインの品質モデリング 各種データ量からグルーピングを行う ( 分類 ) 白ワインの糖分 PH 濃さなどデータ量から 品質のいいワインの傾向をつかむ 本デモのダウンロード http://www.mathworks.co.jp/matlabcentral/fileexchange/28770-introduction-to-classification 8

分類 パターン認識のワークフロー 分類手法の選択 訓練 学習 精度の測定 ( 検定 ) 分類モデルの完成 モデルの単純化 9

MATLAB で可能な分類 パターン認識のアルゴリズム Statistics Toolbox 判別分析 ロジスティック回帰 単純ベイズ分類器 バギングされた決定木 Bioinformatics Toolbox サポートベクターマシーン Neural Network Toolbox ニューラルネットワーク 10

アルゴリズム選択 アルゴリズム複雑さ バギングされた決定木 線形判別分析 前提条件の厳しさ 11

アルゴリズム選択大雑把なやり方 シンプルな方法が ( たいてい ) いい シンプルなモデル 解釈が簡単 説明がかんたん メモリ消費量少なくて 高速に学習 単純なモデルは前提条件となる過程が厳しい 前提条件に違反しているかどうかチェック 予備となるデータ解析が重要 12

アルゴリズム選択 アルゴリズム複雑さ バギングされた決定木 単純ベイズ 線形判別分析 前提条件の厳しさ 13

Naïve Bayes ( 単純ベイズ ) を使った分類器 ベイズの定理 P(C E) = P(E C)*P(C)/P(E) P(C) : 事前確率 P(C E): 事後確率 P(E C): 尤度 P(E) : 証拠 Naïve Bayes P(C E) = P(C)*P(F 1, F 2,..., F n C) = P(C)P(F 1 C) P(F 2,..., F n C,F 1 ) = P(C)*P(F 1 C) P(F 2 C) P(F 3 C) *P(F n C) F: 属性値 ( 特徴 ) 各属性が独立 Bayesian Network F1 F2 F3 C1 F1 F2 F4 F1 F2 F3 F3 14

分類 パターン認識のワークフロー 分類手法の選択 訓練 学習 正確性の測定 ( 検定 ) 分類モデルの完成 モデルの単純化 15

訓練 学習 特徴を持ったデータと出力となるクラスをもったデータセット の作成 クラス : 予測子 (Y) 特徴 : 応答データ (X) このデータを使って訓練 学習 特徴とクラスとの関係を繰り返し作成するルールを発展 通常 データを 2 種類に分割 訓練データ ( モデルのルールを構築 ) X_train/Y_train 検証用データ ( アルゴリズムの正確性のバリデーション ) X_test/Y_test fit/train : 学習 predict : 予測 16

分類 パターン認識のワークフロー 分類手法の選択 訓練 学習 正確性の測定 ( 検定 ) 分類モデルの完成 モデルの単純化 17

実際のクラス 分類器の正確性の測定 - 混同行列 - 予測したクラス A B C D E F G A 0 1 1 2 1 0 0 B 0 9 16 15 10 0 0 C 4 22 275 146 43 0 0 D 6 16 198 283 240 3 2 E 1 0 39 59 181 7 0 F 0 0 8 7 31 5 0 G 0 0 0 0 1 1 0 18

分類 パターン認識のワークフロー 分類手法の選択 訓練 学習 正確性の測定 ( 検定 ) 分類モデルの完成 モデルの単純化 19

モデルの単純化 目標 : 特徴情報を最小化 できるだけ同じ結果を得る 理由 オーバーフィッティングの回避 ( ロバスト性が失われる ) サイズ モデルをシンプルに ( 重要なパラメータが分かりやすい ) 手法 前方逐次特徴選択 sequentialfs Out of Bag における特徴の重要度 Treebagger で有効 20

モデルの単純化 [fs,history] = sequentialfs( fun, X,Y,'cv',c2) fun=@(xtrain,ytrain,xtest,ytest)... sum(ytest~=predict(naivebayes.fit(xtrain,ytrain),xtest)); fun : 基準 尺度関数分類モデルの誤判別された観測総数 Ytest と Xtest を入力して予測した結果との誤差の和を計算する関数 例 ) 実際 : 予測 2 : 1 一致していない 3 : 3 5 : 4 一致していない fun : 2 回帰モデルにも活用可 21

分類 パターン認識のワークフロー 分類手法の選択 訓練 学習 正確性の測定 ( 検定 ) 分類モデルの完成 モデルの単純化 22

TreeBagger とは? 分類木 TreeBagger Y 1 = F 1 (X 1, X 2, X 3, X n ) Y 2 = F 2 (X 1, X 2, X 3, X n ) Y = F(X 1, X 2, X 3, X n ) 一つだけの学習器だとロバスト性が悪い Yk = Fk(X 1, X 2, X 3, X n ) 分類木でモデリングしたものの拡張版 弱学習器を多数作成して 結果の多数決を取る 23

Parallel Computing Toolbox を使った最適化 TreeBagger 関数の計算は時間が掛かりますが 以下の環境で 高速化が実現 Windows XP 64 bit Intel Xeon CPU W3550 @3.07GHz ( クアッドコア ) Memory 12.0G 136 sec 39 sec ( 約 3.4 倍 ) 24

分類器の正確性の測定 ROC 曲線 平行座標プロット 感度 ( 陽性 /+)/ 偽陽性率 ( 陽性 /-) との関係曲線 AUC は 曲線で分けられた下側の面積 色付きの線 : 実際のクラス各曲線のピーク : 推定クラス高さ : 尤度 25

分類モデルの完成 GUI アプリケーションに分類器を統合 格付けアプリケーション アプリケーションとして システムに実装 センサーネットワーク 自動トレーディングシステム スパムメールフィルター 26

分類 パターン認識における課題の解決 市販のプログラムでは解析手法がよくわからない 様々なアルゴリズムを提供 Statistics Toolbox Bioinformatics Toolbox Neural Network Toolbox 分類される訓練について時間がかかる Parallel Computing Toolbox による並列処理 よく分かる専門家が必要 ヘルプドキュメント記載を参照 テクニカルサポート 弊社トレーニングサービス 弊社コンサルティングサービス 27

まとめ MATLAB における分類 パターン識別のワークフローを紹介 Statistics Toolbox では 多種な分類器を提供 判別分析 単純ベイズ 分類木 バギング ブースティング etc Parallel Computing Toolbox との相性がよく 高速処理が可能 サポートベクターマシーンは Bioinformatics Toolbox ニューラルネットワークは Neural Network Toolbox 28

まとめ関数一覧 (Statistics Toolbox) 判別分析 Classify 単純ベイズ (Naïve Bayes) NaiveBayes K 近傍分類 ClassificationKNN 分類木 ClassificationTree バギング TreeBagger ブースティング fitensamble (Bioinformatics Toolbox) サポートベクターマシーン svmtrain (Neural Network Toolbox) ニューラルネットワーク train 29

お問い合わせ 営業部へのお問い合わせ http://www.mathworks.co.jp/contact_us/ TEL: 03-6367-6700 メールアドレス : service@mathworks.co.jp 本日のご参加ありがとうございました 2012 The MathWorks, Inc. MATLAB and Simulink are registered trademarks of The MathWorks, Inc. See www.mathworks.com/trademarks for a list of additional trademarks. Other product or brand names may be trademarks or registered trademarks of their respective holders. 30