PowerPoint プレゼンテーション - PDF 無料ダウンロード

次世代 IoT に向けた AI の組み込み実装への取り組み AI の推論機能を FPGA に実装するための技術とソリューション提案 Embedded Product Business Development Department

Agenda 1. エッジAIの現状 2. 組み込みAIのニーズ 3.FPGAとエッジAI 4. 組み込み向けエッジAI 実装の特性 (GPUとFPGA) 5. エッジAI 導入に向けた計画と検証の重要性 6. エッジAI 設計とFPGA 実装の提案 7. 富士ソフトのエッジAI 実装サービス - 1 -

エッジ AI の現状 -1 推論アクセラレーション機能特化 SW-AI アプリ WebDNN 対人向けエッジ AI クラウド型 AI サービス多種多様で従量課金高速推論常時推論低遅延定常性機能特化小クラス分類マシン向けエッジ AI デバイス組み込み型モデル ( ローカルで用途特化限定カテゴリ分類 ) エッジ AI サービス型ビジネスモデル (Cloud で多用途多数カテゴリ分類 ) クラウド AI エッジ AI: 特定機能特化型小型軽量最適化スタンドアロン動作省電力 - 2 -

エッジ AI の現状 -2 今どういう課題がありなぜエッジ AI が必要とされているのか? 第 1 位 : コストリアルタイムセンサーデータを使ったクラウド AI ベースの傾向予測 : 運用費 : 月額 5~3 万円 + 通信費 / 件 ~50 万円 / 件の年間運用コスト第 2 位 : レイテンシー ( 遅延 ) 自動作業工程での AI 機能導入を検討したがクラウド AI ではネットワーク遅延等で成立不可第 3 位 : 高速処理と最小化 AI による画像の数種類分類 ( 軽い AI) を安定的に高速処理 ( マシンスピード ) で推論と十分な処理帯域が必要 - 3 -

エッジ AI の現状 -3 AI 技術進化の追従性がポイント日々進化途中の技術 6 カ月後には新しいブレークスルーの可能性多様性と最適化目的や規模ごとに AI 最適化が進み進化が細分化最大の資産は学習データ学習データがあれば随時新しい AI 技術へ乗り換え可能既存サービスでの落とし穴囲い込まれていませんか? 標準開発環境オープンスタンダードは? ノウハウの流出の懸念 - 4 -

組み込みの AI のニーズ -1 クラウドサーバー非依存型 AI 推論機能を機器に組み込むレイテンシー ( 遅延 ) 最小化ニューラルネットワーク構成の最適化運用コスト削減学習済みモデルデータを反映 CNN 推論環境 Input 推論 $ AI $ AI 用途に合った適正な精度と最小構成のバランス重視型 - 5 -

組み込み AI のニーズ -2 低遅延で確立された安定したレスポンスが必要セキュリティ重視のインターネットを使わない環境既存システムの流用連携省電力省スペース特定の用途に特化した最適化 AI 設計マシン制御系連携の処理速度に準じた推論速度と帯域使用環境の自由度 ( ファンレス温度拡張対応連続運用長期供給 ) 組み込み AI のニーズにはエッジ AI の形態が有効 FPGA の有効性 - 6 -

FPGA とエッジ AI -1 CNN の特徴は畳み込みとプーリング畳み込み : 特徴マップカーネルなどと呼ばれる 2 次元フィルタを 1 ピクセルづつずらしながら元画像に重ね合わせ特徴を検出するプーリング : 近隣の特徴量を一つの特徴量としてまとめてニューロンの数を減らす ( 低解像度化する ) いずれも 2 次元のデータ配列を何十万回もスキャンして積和演算する極めて大量の並列演算畳み込み (Convolution) プーリング (Pooling) FPGA による CNN の高速推論処理が有効膨大な行列積和演算を FPGA で高速並列処理 CNN の高速演算を実現 - 7 -

FPGA とエッジ AI -2 CNN での並列演算は 1 つ 1 つの演算は単純だが回数が膨大コア数規模メモリーアクセスを自由にデザインできる FPGA は並列演算を最適できる組み込まれたコアを常に動かし外部メモリーへの常時アクセスが必要な GPU より最適な数のコアを生成する FPGA の方が消費電力を最適化できる Input CNN 学習環境推論学習 Output OK!! Alert!! 学習時の除算はロジック消費が大きい FPGA では非効率学習はサーバ側で時間をかけて行う必要がありエッジ側ではリアルタイムに学習処理するニーズは薄いサーバー処理が有効エッジ側は性能保証低コスト省電力省スペースが求められる Input 学習済みモデルを反映 CNN 推論環境推論 Output OK!! Alert!! 学習はパフォーマンス重視のサーバ側で実施エッジ側では FPGA が推論だけを実施電力効率が求められ長期的な利用を想定した IoT エッジ端末には FPGA が適している -8-

組み込み向けエッジ AI 実装の特性 (GPU と FPGA) - AI の推論機能を組み込むには? 1 2 3 AI 推論機能をプログラム実装し機器内のプロセッサ (CPU) でSW 処理追加のHW 不要で容易に実装推論機能の制限と処理速度の問題既存処理とプロセッシングリソースの食い合い GPU& メモリーをモジュール化して機器に組み込む一般的に学習と近い環境で学習済みネットワークモデルを利用できる高速推論性能発熱対策の考慮が必要サーマルスロットリングによる処理速度の低下製品のライフサイクルを考慮した運用 FPGAで実装する省電力省スペースでの実装が可能安定高速推論性能安心感 : 組み込み市場での実績長期供給拡張温度対応 FPGAの規模に応じたDNNの設計や調整が必要組み込み特有のニーズと制約 FPGA が優位 - 9 -

組み込み向けエッジ AI 実装の特性 (GPU と FPGA) - 組み込みでの有効性比較 FPGA GPU CPU 安定した性能電力効率 ( 発熱 ) 省スペース推論速度と帯域〇温度拡張品〇〇工業用使用実績長期供給価格〇組み込み向けエッジ AI では FPGA の有効性が高い - 10 -

エッジ AI 導入に向けた計画と検証の重要性 -1 AI 開発時の選択学習データ AIアルゴリズムフレームワーク学習環境 ( オンプレミス or クラウド ) FPGA の選択回路規模や動作速度パッケージや動作温度範囲メーカー高位合成環境の選択 FPGAデバイスメーカにより開発環境が異なるオンプレミス環境 or クラウド環境最適な実装には多くの選択肢多種多様な専門知識が必要 - 11 -

エッジ AI 導入に向けた計画と検証の重要性 -2 AI 導入には大きな費用が発生事前の費用対効果検証が重要学習データの収集と作成が精度に大きく影響 AI 技術は日々革新の連続最新 AI 技術へ短期間で移行が前提製品開発の前に AI 導入の効果検証を最小限のリソースで短期間に実現することが重要適切な AI 性能機能の見極め短期間での実装改良アップデート適切な回路規模の FPGA デバイスの選択 FPGA で費用対効果検証ニーズに合ったエッジ AI 設計が有効 - 12 -

Agenda 1. エッジAIの現状 2. 組み込みAIのニーズ 3.FPGAとエッジAI 4. 組み込み向けエッジAI 実装の特性 (GPUとFPGA) 5. エッジAI 導入に向けた計画と検証の重要性 6. エッジAI 設計とFPGA 実装の提案 7. 富士ソフトのエッジAIソリューション - 13 -

エッジ AI 設計と FPGA 実装方法学習サーバー + 一般的な Deep Learning フレームワーク学習データ + 学習済みネットワークモデル精度評価 FPGA や AI 規模に応じた DNN のデザイン学習データの再利用標準ツール ( インテル FPGA SDK for OpenCL ) で高位合成高位合成後の実行ファイルを FCGW で検証ラベルデータ学習データ FPGA 毎に最適化した DNN をデザイン C++ のヘッダファイルに変換 SoC FPGA 実行ファイル推論 Binary aocx インテル Arria 10 SoC FPGA 内蔵 IoT フォグコンピューティングゲートウェイ FPGA 用再学習で重み生成標準のインテル FPGA SDK for OpenCL でコンパイル開発機能 / 性能検証 POC 製作を同時進行 - 14 -

富士ソフトのエッジ AI ソリューション : IoT フォグコンピューティングゲートウェイフォグコンピューティングを想定した高性能ゲートウェイを開発エッジ AI 向け POC プラットフォーム FPGA 評価キットインテル Arria 10 SoC FPGA 搭載 ARM : 800MHz Dual Core FPGA : 160K LE (320 にマイグレーション可 ) ネットワーク I/F GbEthernet x 2 ポート Wi-Fi (Option) LTE/3G (Option) 高い拡張性 mini PCIe オプションボードによってインターフェースの追加が可能組み込み OS Ubuntu 16.04 LTS, Kernel 4.1.33 省スペース省電力筐体サイズ 220 156 90 組み込み機器ならではの省電力センサー I/F USB 2.0 Host x 4 ポート日々進化する脅威に対応し異変を検知防御するセキュリティ TrendMicro 社の IoT Security (Option) 現在限定サンプル (Beta 版 ). 製品版 : 量産 Q1 18 予定 - 15 -

IoT フォグコンピューティングゲートウエイ - SW 実装例ゲートウェイとしての通信機能は SoC FPGA の ARM 部分で処理フォグコンピューティングのデータ制御 AI 推論の演算処理を FPGA にオフロード FPGA ハードウェアオフロードエンジン ( OpenCL, HLS, IP Core, オリジナルロジック等 ) SoC FPGA デバイス I/F プロトコル USB データ変換クレンジングデータ解析クラウド接続セキュリティネットワーク I/F プロトコル MQTT センサー RS-232C 拡張 I/F データベース (Embedded SQL) Web Server Embedded Linux HTTP Web Socket クラウド ARM Core -16-

エッジ AI 設計と FPGA 実装の提案内容 : 推論エンジンを FPGA に実装するための AI 開発者向けセット目的 :POC( 概念実証 ) の組み込みAIシステム実装開発エッジAI 開発評価環境 POC 開発を集約 FPGA 内蔵 IoT フォグコンピューティングゲートウェイ開発キット FPGA 向け推論 CNN 開発実装ツール Deep Learning 学習環境一式エッジ AI の実装開発環境をパッケージで提供 (2018 年 1H 予定 ) -17-

AI-ON-FPGA エッジ AI 実装サポートサービスエッジ AI 実装コンサルテーション (12 月予定 ) AI-ON-FPGA 実装技術サポート AI 技術者によるメニューに沿った技術サポート提供商用ライセンス販売各種 NN モデルの RTL ライブラリー推論用 DNN の IP 推論 FCGW 提供 <https://www.fsi-embedded.jp> FPGA 内蔵フォグコンピューティングゲートウェイ (FCGW) - 18 -