自動車開発におけるビッグデータ / クラウド時代のデータ解析

Similar documents
MATLAB®によるビッグデータ解析

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

センサーデータアナリティクスの開発から運用まで

Presentation Title

PowerPoint Presentation

データセンターの効率的な資源活用のためのデータ収集・照会システムの設計

Managing and Sharing MATLAB Code

AI技術の紹介とセンサーデータ解析への応用

IoT時代のアナリティクス ~センサーデータからの価値発見~

Presentation Title

MATLAB ではじめる画像処理とロボットビジョン ~ 機械学習による物体認識と SLAM~ MathWorks Japan アプリケーションエンジニアリング部信号処理 通信 木川田亘 2015 The MathWorks, 1Inc.

Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行

ITdumpsFree Get free valid exam dumps and pass your exam test with confidence

Joint Content Development Proposal Tech Docs and Curriculum

CDM Studio

MATLAB EXPO 2019 Japan プレゼン資料の検討

Introduction to System Identification

MATLAB®製品紹介セミナー

Presentation Title

Oracle SQL Developer Data Modeler

OTデータとITデータの双方を統合的に分析可能な社会・産業インフラ分野向けのデータ分析基盤を提供開始

スライド 1

~ アドレス収集くん ~ セキュリティ対策御説明資料

SimscapeプラントモデルのFPGAアクセラレーション

製品概要

Microsoft Azure Microsoft Corporation Global Blackbelt Sales Japan OSS TSP Rio Fujita

d4-automated-driving-mw

SinfonexIDaaS機能概要書

f2-system-requirement-system-composer-mw

PowerPoint Presentation

PowerPoint Presentation

NGSデータ解析入門Webセミナー

商用監視ソフトウェアユーザの Zabbix 移行へ朗報 Zabbix Event Viewer のご紹介 【本邦初公開】


Microsoft PowerPoint - Logstorage镣撺ㅂㅅ㇯_for_SKYSEA_Client_View_ pptx

9 WEB監視

CLUSTERPROXSingleServerSafe SingleServerSafe ご紹介 2007 年 10 月

Microsoft PowerPoint - 【最終提出版】 MATLAB_EXPO2014講演資料_ルネサス菅原.pptx

OSSTechプレゼンテーション

PowerPoint プレゼンテーション

Symantec AntiVirus の設定

CONTEC DIOプロバイダ ユーザーズガイド

2D/3D CAD データ管理導入手法実践セミナー Autodesk Vault 最新バージョン情報 Presenter Name 2013 年 4 月 2013 Autodesk

2017/8/2 HP SiteScope software 監視機能対応表 この監視機能対応表は HP SiteScope software v11.33) に対応しています モニタ モニタ説明 モニタ説明 SiteScope for Windows SiteScope for Linux ネット

RADIUS サーバを使用して NT のパスワード期限切れ機能をサポートするための Cisco VPN 3000 シリーズ コンセントレータの設定

ソフト活用事例③自動Rawデータ管理システム

ArcGIS for Server 機能比較表

Simulinkモデル開発における工夫事例

Power BI 最新情報と活用方法

勉強会の流れ Google API の概要 デモ curl で実際に体験 Copyright 2010 SRA OSS, Inc. Japan All rights reserved. 2

提案書

1.SqlCtl クラスリファレンス SqlCtl クラスのリファレンスを以下に示します メソッドの実行中にエラーが発生した場合は標準エラー出力にメッセージを出力します (1)Connect() メソッド データベースへ connect 要求を行います boolean Connect(String

ディープラーニングの組み込み機器実装ソリューション ~GPC/CPU編~

今さら聞けない!? Oracle入門 ~前編~

CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

IBM Cognos 10 Upgrade FAQ

PowerPoint プレゼンテーション

Oracle Solaris 仮想環境とプロビジョン環境の構築

Signal Processing Toolbox

JACi400のご紹介~RPGとHTMLで簡単Web化~

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

Hyper-V 仮想マシンの設定

Client Management Solutions および Mobile Printing Solutions ユーザガイド

AI1608AYUSB手順V3

(Microsoft PowerPoint - HP\227pWASABI\217\320\211\356\216\221\227\277.ppt)

Python によるジオプロセシング スクリプト入門

New:Oracle BI Publisher 11g Release が新登場

intra-mart Accel Platform

MotionBoard総合カタログ Ver.5.5

【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus

モータ HILS の概要 1 はじめに モータ HILS の需要 自動車の電子化及び 電気自動車やハイブリッド車の実用化に伴い モータの使用数が増大しています 従来行われていた駆動用モータ単体のシミュレーション レシプロエンジンとモータの駆動力分配制御シミュレーションの利用に加え パワーウインドやサ

いまからはじめる、MATLABによる 画像処理・コンピュータビジョン

統合運用管理ソフトウェア Systemwalker 総合カタログ

b4-deeplearning-embedded-c-mw

Transcription:

自動車開発におけるビッグデータ / クラウド時代のデータ解析 MathWorks Japan アプリケーションエンジニアリング部テクニカルコンピューティング 吉田剛士 2015 The MathWorks, Inc. 1

Agenda Introduction デモンストレーション Data Summary on Amazon Redshift Triggered Data Capturing & Calibration 終わりに まとめ 2

刻々と増え続けるデータ量 データが膨大になる理由 データソースの多様化と高性能化 スマートフォン位置情報監視カメラ検索情報 SNS IC 構造物センサー 交通情報 IC カード情報金融情報買物履歴 3

どのようにビッグデータを扱うのか? 2 つの流派 Batch Processing Batch Processing ある程度のデータをためて処理する 対象データは大規模 処理に時間をかけてもよい ポイントはデータストレージへのアクセス Stream Processing 次々生成されるデータを処理する 対象データは小規模 処理に時間はかけられない ポイントは低遅延性 Stream Processing 4

Agenda Introduction デモンストレーション Data Summary on Amazon Redshift Triggered Data Capturing & Calibration 終わりに まとめ 5

データ解析ワークフロー データへのアクセス ファイル アルゴリズムの探求 データ解析 結果の共有 /IP 化 ドキュメント生成 ソフトウェア 数理モデリング x E = V2 R y アプリケーション配布 コードやアプリケーション ハードウェア アルゴリズム開発 ウェブサービス JSON XML HTML アプリケーション開発 組み込み開発 Integrate 6

データ解析ワークフロー データへのアクセス ファイル アルゴリズムの探求 データ解析 結果の共有 /IP 化 ドキュメント生成 ソフトウェア 数理モデリング x E = V2 R y アプリケーション配布 コードやアプリケーション ハードウェア アルゴリズム開発 ウェブサービス JSON XML HTML アプリケーション開発 組み込み開発 Integrate 7

データ解析ワークフロー データへのアクセス アルゴリズムの探求 結果の共有 /IP 化 ファイルソフトウェアハードウェアウェブサービス データ解析アルゴリズム開発数理モデリングアプリケーション開発 ドキュメント生成 アプリケーション配布 組み込み開発 Amazon Redshift MATLAB Amazon EC2 8

Amazon Redshift Access Database Toolbox Amazon Redshift >> setdbprefs( DataReturnFormat, table ); % Table 型でインポート >> % Redshiftへ接続 >> conn = database( <DBName>', <UserName>', <Password>', 'org.postgresql.driver', 'jdbc:postgresql://<jdbc_url>'); >> curs = exec(conn, select * from sensor ); % Select 文の発行 >> curs = fetch(curs); % インポート >> GPSData = curs.data; >> close(curs); >> close(conn); >> clear curs conn 9

データの前処理と解析 Discover & Explore 論理配列を使った異常値の除去 >> Longitude(GPSData.horizontalAccuracy >= 100) = NaN; >> Latitude(GPSData.horizontalAccuracy >= 100) = NaN; N 次元配列までサポートする補間関数 interp1 / interp2 / interp3 / intern シンプルな文法による移動平均フィルタ 10 点移動平均フィルタの計算 Curve Fitting Toolbox >> Latitude2 = smooth(latitude, 10, moving ); >> Longitude2 = smooth(longitude, 10, 'moving'); 10

様々な地図サービス / データとの連携 Discover & Explore Mapping Toolbox 地図解析および可視化 ベクタ / ラスタデータのインポート エクスポート 2D/3D 地図表示 WMS (Web Map Service) へのアクセス デジタル地形や標高の分析 地図フォーマットの変換 OpenStreetMap のインタラクティブな Web 地図表示 11

様々な解析方法が試せる! Discover & Explore 専門 非専門分野の手法を手軽に適用できる環境 Statistics Toolbox Signal Processing Toolbox Wavelet Toolbox Optimization Toolbox Global Optimization Toolbox Control System Toolbox System Identification Toolbox Econometrics Toolbox 12

HTML レポートの作成 Share MATLAB Report Generator グラフや表を埋め込んだレポート生成 章や節といった構成の設定 HTML の他に RTF/XMLPDF/Word をサポート 13

まとめ MATLAB Solutions MATLAB Access ODBC/JDBC ドライバをサポート Amazon Redshift Discover & Explore 地図情報専用製品を提供 高速で柔軟なデータの前処理 豊富なフィルタ機能 Share HTML を含めた様々なファイル形式でのレポート生成 Amazon Web Service / Bring Your Own License 14

Scalability MapReduce を含め並列実行による解析作業の高速化 Scale-up ローカルホスト上のマルチコア / マルチ CPU を利用した解析作業の並列化 Parallel Computing Toolbox Scale-out ネットワークを介したクラスタ環境上での大規模な解析作業 MATLAB Distributed Computing Server Desktop Computer Local MATLAB Desktop (Client) Computer Cluster Scheduler 15

車両計測データ解析エコシステム豊富な計算機能と柔軟な API を活かした解析システムの構築 16

異常検出とは? データの中に潜む珍妙な振る舞いを見つけ出す 異常 もいろいろ 外れ値 (Outlier) 変化点 (Change point) 逸脱 (Deviation) 誤作動 (Fault) 侵入 (Intrusion) 詐欺 (Fraud) : センサーデータから非破壊で異常を発見した様子 目標は 自動 検出 17

時系列データの異常検出人の目には明らかな異常たち どこを異常と判断しますか? 自動判定したい!! 参考文献 : 井手剛 (2015) 入門機械学習による異常検知 18

時系列の異常検出 最近傍法を応用した変化点検出 ( 上 ) 主成分分析を応用した変化点 + 逸脱検出 ( 下 ) 19

事例 :Daimler AG データベースへのアクセス 解析 マップ上の可視化まで MATLAB の 1 ツールのみで完結 現場からの様々な解析要求に迅速に応答 100 時間以上かかっていたマニュアルによる解析が自動化 http://www.mathworks.co.jp/company/newsletters/articles/analyzing-test-data-from-a-worldwide-fleet-of-fuel-cell-vehicles-at-daimler-ag.html 20

Agenda Introduction デモンストレーション Data Summary on Amazon Redshift Triggered Data Capturing & Calibration 終わりに まとめ 21

データ解析ワークフロー データへのアクセス ファイル アルゴリズムの探求 データ解析 結果の共有 /IP 化 ドキュメント生成 ソフトウェア 数理モデリング x E = V2 R y アプリケーション配布 コードやアプリケーション ハードウェア アルゴリズム開発 ウェブサービス JSON XML HTML アプリケーション開発 組み込み開発 Integrate 22

データ解析ワークフロー データへのアクセス アルゴリズムの探求 結果の共有 /IP 化 ファイルソフトウェアハードウェアウェブサービス データ解析アルゴリズム開発数理モデリングアプリケーション開発 ドキュメント生成 アプリケーション配布 組み込み開発 計測機器 Calibration (Track Optimization) 大規模テキストファイル 非 MATLAB ユーザへの配布 23

データへのアクセス特定のイベントを捕らえるためのストリーミング処理 Triggered Data Capturing 2 つのチャンネルを流れる信号を必要な分だけ捕捉 CH1 : ギアポジション (1~6) を示す離散的な波形 CH2 : 別のセンサーが出力する連続的な波形 ストリーミング処理 計測機器と繋げたオンライン処理 エクスポートされた CSV ファイルに対するオフライン処理 24

オンライン ストリーミング処理をサポートする様々な製品計測ハードウェアとのインターフェース Data Acquisition Toolbox プラグインデータ収集ボード Instrument Control Toolbox オシロスコープ 信号発生器 etc. Image Acquisition Toolbox イメージキャプチャーデバイス Others Vehicle Network Toolbox DSP System Toolbox MATLAB 25

Demo : オンライン ストリーミング処理 Triggered Data Capturing CH1 を流れる信号が特定の状態に変化した時刻前後の CH1/CH2 の信号を捕捉 CH1 が 3 4 に変化した際の CH1 および CH2 を流れる信号を捕らえた様子 デモへ 26

データ解析ワークフローデータへのアクセス データへのアクセス アルゴリズムの探求 結果の共有 /IP 化 ファイルソフトウェアハードウェアウェブサービス データ解析アルゴリズム開発数理モデリングアプリケーション開発 ドキュメント生成 アプリケーション配布 組み込み開発 計測機器 Calibration (Track Optimization) 大規模テキストファイル 非 MATLAB ユーザへの配布 27

オフライン ストリーミング処理をサポートする様々な機能 テキストファイルならば MATLAB datastore 大規模データ向けに設計されたオブジェクト データベースにも対応 ReadSize プロパティと read メソッド reset メソッドで初期化 ( 巻き戻し ) >> ds = datastore('sampleascii.csv'); >> whos ds Name Size Bytes Class ds 1x1 112 matlab.io.datastore.tabulartextdatastore >> ds.readsize = 3; >> while hasdata(ds) read(ds); : end >> >> reset(ds); データストアを作成してもデータは未取得 Time Position 0 0 0.01 0 0.02 0 0.03 0 0.04 0 cursor メモリに余裕があれば readall メソッドで全てインポート バイナリファイルの場合は 音声であれば DSP System Toolbox 動画であれば Computer Vision System Toolbox その他であれば MATLAB ImageDatastore 登場 (R2015b~) 0.05 0 0.06 0 0.07 0 : : : 199.99 0 200.00 0 28

Demo : オフライン ストリーミング処理 10KHz で 30 分間サンプリングされた 2 チャンネル分のセンサーデータをストリーミング処理 CH1 側で発生したイベントを監視し イベント発生時刻前後の CH2 側のデータを抽出 29

データ解析ワークフローアルゴリズムの探求 データへのアクセス アルゴリズムの探求 結果の共有 /IP 化 ファイルソフトウェアハードウェアウェブサービス データ解析アルゴリズム開発数理モデリングアプリケーション開発 ドキュメント生成 アプリケーション配布 組み込み開発 計測機器 Calibration (Track Optimization) 大規模テキストファイル 非 MATLAB ユーザへの配布 30

Demo: Calibration (Tracking Problem) Optimization Toolbox Global Optimization Toolbox Simulink Design Optimization 理想波形に近づけるためのパラメータ最適化 31

データ解析ワークフロー結果の共有 /IP 化 データへのアクセス アルゴリズムの探求 結果の共有 /IP 化 ファイルソフトウェアハードウェアウェブサービス データ解析アルゴリズム開発数理モデリングアプリケーション開発 ドキュメント生成 アプリケーション配布 組み込み開発 計測機器 Calibration (Track Optimization) 大規模テキストファイル 非 MATLAB ユーザへの配布 32

Application Deployment アプリケーション展開を支える製品群 MATLAB MATLAB Compiler MATLAB Compiler SDK Standalone Application Excel Add-in C/C ++ Java.NET Python MATLAB Production Server MATLAB アプリケーションの再配布は Royalty-free 各アプリケーションはランタイム上で動作 管理は ローカルまたはサーバの両方に対応 33

サーバで管理する場合の構成 Web Browser Microsoft Excel MATLAB Production Server Load Balancer End User License Manager MATLAB Toolboxes MATLAB Compiler MATLAB Compiler SDK Shared Directory Java C/C++ 34

まとめ製品開発のためのセンサーデータ解析 ストリーミング処理を取り入れたデータ解析 次々送信されるデータに対するオンライン処理 取り溜めた巨大ファイルへのオフライン処理 最適化 / 機械学習など豊富な解析機能 横展開を支えるアプリケーション配布機能 スタンドアロン / サーバ運用 既存システムとの統合 Standalone Application MATLAB Production Server 35

Agenda Introduction デモンストレーション Data Summary on Amazon Redshift Triggered Data Capturing & Calibration 終わりに まとめ 36

まとめ Batch vs. Streaming Batch Processing Batch Processing ある程度のデータをためて処理する 対象データは大規模 処理に時間をかけてもよい ポイントはデータストレージへのアクセス Stream Processing 次々生成されるデータを処理する 対象データは小規模 処理に時間はかけられない ポイントは低遅延性 Stream Processing 37

IoT を使った遠隔診断 DEMO ~ 心電図のリモート (Cloud) 診断 ~ 生体信号モニタリング デバイス Kinesis JAVA SDK MATLAB Amazon EC2 MATLAB Kinesis JAVA SDK Amazon Kinesis ニューラルネットワークによる機械学習 (MATLAB からの実装 ) Edge 処理 心拍データのキャプチャ 特徴の抽出 38