PowerPoint Presentation

Similar documents
Presentation Title

f2-system-requirement-system-composer-mw

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

SimulinkによるReal-Time Test環境の構築

MATLAB ではじめる画像処理とロボットビジョン ~ 機械学習による物体認識と SLAM~ MathWorks Japan アプリケーションエンジニアリング部信号処理 通信 木川田亘 2015 The MathWorks, 1Inc.

MATLAB®製品紹介セミナー

SimscapeプラントモデルのFPGAアクセラレーション

MATLAB®によるビッグデータ解析

Presentation Title

Joint Content Development Proposal Tech Docs and Curriculum

Managing and Sharing MATLAB Code

センサーデータアナリティクスの開発から運用まで

MATLAB EXPO 2019 Japan プレゼン資料の検討

ArcPad の代替となる現地調査ソリューションについて

2D/3D CAD データ管理導入手法実践セミナー Autodesk Vault 最新バージョン情報 Presenter Name 2013 年 4 月 2013 Autodesk

d4-automated-driving-mw

tokyo_t3.pdf

Presentation Title

PowerPoint プレゼンテーション

Expo 2014

Presentation Title

AI技術の紹介とセンサーデータ解析への応用

データセンターの効率的な資源活用のためのデータ収集・照会システムの設計

いまからはじめる、MATLABによる 画像処理・コンピュータビジョン

Presentation Title

Presentation Title

Presentation Title

IoT時代のアナリティクス ~センサーデータからの価値発見~

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

Microsoft Word - HowToSetupVault_mod.doc

b4-deeplearning-embedded-c-mw

AWS Client VPN - ユーザーガイド

OSSTechプレゼンテーション

はじめての機械学習

Presentation Title

Microsoft PowerPoint - 【最終提出版】 MATLAB_EXPO2014講演資料_ルネサス菅原.pptx

Apache Arrow 須藤功平株式会社クリアコード RubyData Tokyo Meetup Apache Arrow Powered by Rabbit 2.2.2

エンジニアと科学者が 科学技術計算に MATLAB を 選ぶ理由 飛躍的な進化を遂げた MATLAB が提供する価値とは?

Hortonworks Kitase

AutoCAD WS Mobile アプリケーション

Introduction

機械学習のご紹介

PowerPoint Presentation

PowerPoint プレゼンテーション

無料セミナー資料:ビッグデータ管理基盤ソフトウェアHadoop入門

AWSSummitTokyo2018

Oracle Real Application Clusters 10g: 第4世代

AutoCAD道場-なぜ「レイアウト」がいいのか?

PGRelief C/C++ 強化ポイント説明書

自動車開発におけるビッグデータ / クラウド時代のデータ解析

AutoCAD のCitrix XenApp 対応

PowerPoint Presentation

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

PowerPoint Presentation

Presentation Title

制御のためのSimulink入門

Presentation Title


KSforWindowsServerのご紹介

Microsoft Word - JDBCドラバーの設定.doc

Oracle Data Pumpのパラレル機能

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

Signal Processing Toolbox

WebEx を使用したリモート調査とは お客様のデスクトップ画面を共有し 障害調査を共同で実施するサービスです リモート調査は 精度の高い調査により 障害の早期解決を図るために実施します 対象の機器にアクセスできる中継端末をご用意頂く必要があります インターネット接続が可能な中継端末を経由して調査を

モバイルアプリを Azure で作る - データを扱う Azure Storage を利 してデータを保存する 本稿では PHP と Windows Azure を使って 画像などのファイルを扱うアプリケーションを開発する方法を説明します Windows Azure Platform では データの

f3-power-train-simulation-mw

JACi400のご紹介~RPGとHTMLで簡単Web化~

日立とアシストが情報システム運用のレポーティングソフトウェアを共同開発

Adobe Acrobat DC 製品比較表

ビッグデータアナリティクス - 第3回: 分散処理とApache Spark

Elastic MapReduce bootcamp

CouchbaseLiveTokyo2015 講演資料

Autodesk Fusion 360 Autodesk Fusion 360 Honda 3D Fusion 360 CAD Honda EV Autodesk Fusion 360 Honda D 3D Web Rinkak 3D 2016 Honda 3D CEATEC JAPAN

ディープラーニングの組み込み機器実装ソリューション ~GPC/CPU編~

データ仮想化と NOSQL データ ストア

PowerPoint プレゼンテーション

PowerPoint Presentation

(Microsoft PowerPoint - Hadoop\225\224\211\357.ppt)

Source Insight

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2013/03/ OverAction と DiskStallAction の値変更 (ActionNone ServiceCmdDisable ProcessOfRdmstatKillEnable ServiceCmdEnable)

WagbySpec7

Model-Based Calibration Toolbox 4.0

使える! IBM Systems Director Navigator for i の新機能

XML Consortium 2009/5/8 XML Consortium Enterprise2.0 アプリを支えるクラウド基盤としての Windows Azure XML コンソーシアム Web 2.0 部会 日立ソフト宮崎昭世 Microsoft MVP for Development Pl

Hadoop LZO圧縮機能の検証

PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部

EnSightのご紹介

ITdumpsFree Get free valid exam dumps and pass your exam test with confidence

目次 はじめに Introduction Analyzing Big Data Vectorwise and Hadoop Environments Vectorwise Hadoop Connector Perform

医用画像を題材とした3次元画像解析とディープラーニング

タイトル

2017/8/2 HP SiteScope software 監視機能対応表 この監視機能対応表は HP SiteScope software v11.33) に対応しています モニタ モニタ説明 モニタ説明 SiteScope for Windows SiteScope for Linux ネット

SinfonexIDaaS機能概要書

本書の説明 本書は ConMas i-reporter の外部システムとの連携について 標準パッケージの機能で可能なことと オプション機能 : 外部連携 API セットで可能なこと について 概要をまとめたものです Copyright 2015 CIMTOPS CORPORATION - All R

IBM クラウド事例から考える OSS による企業向けクラウドの可能性 日本アイ ビー エム株式会社 Linux/OSS エバンジェリスト中井悦司 Feb. 27, IBM Corporation

見えざる課題に直面する 仮想化は従来のワークロードを支援するタスクに取り組むための最良の方法の 1 つとして認知されています 仮想化で複数のワークロードを統合することにより 使用率の低いアプリケーションを少ないリソースやインフラストラクチャーで運用することができます しかしながら 仮想化でインフラス

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2015/03/31 Page 2 NEC Corporation 2015

The Microsoft Conference 2014 ROOM F

Infor 10 ERP Enterprise Overview

Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行

Transcription:

MATLAB による 大規模フリートデータ解析 アプリケーションエンジニアリング部齊藤甲次朗 2015 The MathWorks, Inc. 1

アジェンダ はじめに ビッグデータ解析の課題 MATLAB を活用したフリートデータ解析事例 フリートデータ解析実践 デスクトップでの解析 クラスターへのスケールアウト MATLAB 解析のシステムへの統合 まとめ 2

25 GB / 1hour 4

フリートデータ解析を含むビッグデータ解析の課題 1. ビッグデータのための新しいツールを学ぶコストが掛かる 2. 大規模な計算に移行するために プロトタイプで書いたコードの書き直しが必要になる 3. データ解析をシステム化するのに時間と工数が掛かる 5

MATLABを活用したフリートデータ解析事例 Volkswagen Data Lab 目的 運転行動から個々の運転者を特定し 運転者の安全性の向上や自動車保険 などに役立つサービスを開発 課題 少ない学習データを使って多くの 運転者を分類 環境状況に依らない解析の堅牢性 計算時間 Connected Car Fahrererkennung mit MATLAB Julia Fumbarev, Volkswagen Data Lab (2017年6月MATLAB EXPO Germanyでの講演) 6

フリートデータ解析実践 7

フリートデータ解析実践使用するデータ 車に OBD ドングルを付け走行データを記録 トリップ数 :1300 以上車両 : 21 台チャネル数 :39 データ収集期間 : 約 1.5 年 8

フリートデータ解析実践使用するデータ 4G LTE MATLAB Production Server TM Request Broker & Program Manager データの整形 ファイル生成 データベース OBD II スマートフォン 全てのデータをダウンロードして MAT ファイルに変換 Bluetooth 9

フリートデータ解析のワークフロー データへのアクセス データの前処理 予測モデルの開発 システムへの統合 ファイル 異常 欠損データの扱い モデルの作成 ( 機械学習 ) デスクトップアプリケーション データベース データ削減 / 変換 パラメータ最適化 エンタープライズシステム センサー 特徴抽出 モデルの検証 組込デバイスとハードウェア 10

ビッグデータの扱いフリートデータ解析 サマリー ステップ 1 ステップ 2 デスクトップ PC での解析 Hadoop クラスターでの解析 11

フリートデータ解析実践デスクトップでの解析 ステップ 1 フリートデータ解析アルゴリズムを検討するために まずはデスクトップで試行錯誤 今後のクラスターへのスケールアウトを意識してコードを書く 12

フリートデータ解析実践データへのアクセス 生データを見てみる 1 ファイル 経度 MATLAB 上でファイルをダブルクリック 13

フリートデータ解析実践データへのアクセス 約 1300 のファイルを読み込むには? 14

フリートデータ解析実践クイズ どれが一番良いアプローチでしょうか? 15

フリートデータ解析実践データへのアクセス datastore: データ ファイルの集合体を読み取るオブジェクト特に機械学習やディープラーニングで使用 対象データ表形式のテキストファイル (CSVなど) Excel 形式のスプレッドシート (XLSXなど) 画像リレーショナルデータベースのデータカスタム形式のファイル MDF 形式のファイル データストアの種類 TabularTextDatastore SpreadsheetDatastore ImageDatastore DatabaseDatastore FileDatastore mdfdatastore など https://jp.mathworks.com/help/matlab/import_export/what-is-a-datastore.html 16

フリートデータ解析実践データへのアクセス カスタムの読込関数 ワイルドカードで指定可能 datastore の作成 17

フリートデータ解析実践データへのアクセス tall 1 台のメモリ tall 配列 処理 1 台のメモリ メモリに収まる小さな塊にデータを自動的に分割 処理 1 台のメモリ データアクセスを最適化して実行 並列演算もサポート クラスターのメモリ 処理 1 台のメモリ 処理 1 台のメモリ 18

フリートデータ解析実践データへのアクセス tall MATLAB 関連ツール + Parallel Computing Toolbox tall 処理 tall でできること ローカルマシンでの並列 tall 処理 + MATLAB Distributed Computing Server TM クラスターでの並列 tall 処理 + Apache TM Hadoop / Apache Spark TM ( サードパーティ ) Hadoop/Spark クラスター上での並列 tall 処理 ステップ 1 ステップ 2 19

フリートデータ解析実践ビッグデータの可視化 データ全てを使って可視化 histogram tall 配列の可視化 https://www.mathworks.com/help/matlab/import_export/tall-data-visualization.html 20

フリートデータ解析実践 tall 配列の保存 ビッグデータ処理において 生データの読み込みを繰り返したくない ローカルフォルダー Hadoop Distributed File System (HDFS ) Amazon S3 Azure Storage Blob に保存 22

フリートデータ解析実践保存した tall 配列の読み込み TallDatastore として読み込み 23

フリートデータ解析実践ビッグデータの可視化 データの散らばりを見たい scatter メンバーを抽出 24

フリートデータ解析実践ビッグデータの可視化 地図上にプロットするにはメモリに取り込んでから geoscatter tall 配列をメモリに取り込み 25

フリートデータ解析実践ビッグデータの可視化 全トリップのトリップ時間を調べる 26

フリートデータ解析実践ビッグデータの可視化 不自然なトリップ時間を詳しく見てみる 半年ほど間隔が空いている 27

フリートデータ解析実践ビッグデータの前処理 前処理 28

フリートデータ解析実践ビッグデータの前処理 時刻が異なるデータを同期 (synchronize) 29

フリートデータ解析実践クラスターへのスケールアウト ステップ 2 デスクトップの限界 処理時間 データコピーの手間 ディスク容量 30

フリートデータ解析実践クラスターへのスケールアウト Hadoop ビッグデータのためのプラットフォーム HDFS: 分散ファイルシステム YARN: リソース管理やスケジューリング Hadoop MapReduce: MapReduce フレームワークの実装 Spark クラスター計算のフレームワーク フォールトトレラントな分散処理 機械学習のような繰り返し演算に適性あり Hadoop YARN と連携可能 31

フリートデータ解析実践クラスターへのスケールアウト Hadoop/Spark との 2 つの連携方法 用途使用する製品対象ユーザー MATLAB から tall 配列の処理を Spark で実行 MATLAB Distributed Computing Server 試行錯誤でアルゴリズムを検討するユーザー tall 配列の処理を Spark 上でスタンドアロンアプリで実行 MATLAB Compiler TM 定形処理を利用するユーザー Spark API を使ったスタンドアロンアプリの実行 MATLAB Runtime Spark の API を詳細に制御した処理を作成したいユーザー 32

フリートデータ解析実践クラスターへのスケールアウト 凡例 MDCS を使った Hadoop/Spark 連携 Edge ノード MATLAB クライアントライブラリ ジョブの投入 Master Name ノード YARN Worker ノード Executor Cache Worker ノード Executor Cache Worker ノード Executor Cache Task Task Task ワーカー ワーカー ワーカー データノード データノード データノード HDFS 33

フリートデータ解析実践クラスターへのスケールアウト MATLAB デスクトップでの処理 Hadoop/Spark クラスターでの処理 クラスターの設定とファイルパスの変更だけで MATLAB の処理は書き直さずにスケールアウト 34

フリートデータ解析実践クラスターへのスケールアウト 35

フリートデータ解析実践走行データ解析 目的 : 停止イベントを検出する 停止したイベント 36

フリートデータ解析実践走行データ解析 目的 : ドライバーの運転の特徴を調べる 39

MATLAB 解析のシステムへの統合 40

MATLAB 解析のシステムへの統合 MATLAB で作成したアルゴリズムを広く使ってもらいたい 41

MATLAB 解析のシステムへの統合コンパイル コンパイル スタンドアロンアプリ Excel Add-in Hadoop/ Spark Web アプリ MATLAB Compiler C/C++ Java ++ Python.NET MATLAB Production Server TM MATLAB Runtime MATLAB Runtime MATLAB Compiler SDK TM 42

MATLAB 解析のシステムへの統合エンタープライズへの展開 Web ブラウザからアクセス.m コンパイル MATLAB Compiler SDK でパッケージ化 MATLAB Production Server Request Broker & Program Manager MATLAB Runtime Web サーバー Excel や BI ツールからアクセス 43

まとめ 44

Key Takeaways 1. 大規模なフリートデータを datastore や tall を用いて簡単に処理 2. デスクトップ PC から Hadoop/Spark クラスターへ コードを書き直さずに スケールアウトが容易 3. MATLAB によるデータ解析をすぐにエンタープライズシステムに統合 眠っているビッグデータを MATLAB で解析してみませんか? 45

2018 The MathWorks, Inc. MATLAB and Simulink are registered trademarks of The MathWorks, Inc. See www.mathworks.com/trademarks for a list of additional trademarks. Other product or brand names may be trademarks or registered trademarks of their respective holders. 2018 The MathWorks, Inc. 46

参考 : 使用した Toolbox 項目 datastoreでのデータ読み込み tall 配列を用いた処理データのプロット Hadoop/Sparkクラスターでの処理 (MATLAB) 使用した製品 (MATLAB) Parallel Computing Toolbox Statistics and Machine Learning Toolbox TM (MATLAB) Mapping Toolbox TM MATLAB Distributed Computing Server 47