AI 人工知能高度なプログラミングをすることなく人間の心理と関連した認識機能を実行するために経験を基にした機械の学習する能力人工知能マシンラーニング長期間にわたってより多くのデータを使用することにより性能が向上するアルゴリズムディープラーニング多層ニューラルネットワークが膨大な量のデ

AI 人工知能高度なプログラミングをすることなく人間の心理と関連した認識機能を実行するために経験を基にした機械の学習する能力人工知能マシンラーニング長期間にわたってより多くのデータを使用することにより性能が向上するアルゴリズムディープラーニング多層ニューラルネットワークが膨大な量のデータから学ぶマシンラーニングのサブセット 2

マシンラーニング技術の分析訓練モデル構築のための訓練モデル構築時間は重要マシンラーニング経験 ( データ ) から自主的に学ぶ計算手法ディープラーニング多くの隠れたレイヤーへの階層的アプローチ画像や音声自然言語などの正確に分類されたデータからフレームを得る特徴は学習されるその他 ( 従来 ) の ML 極めて少ない (1 つまたは 2 つの ) 隠れたレイヤーを使ってクラスタリング回帰分類を行う従来のマシンラーニングの手法特徴エンジニアリングが必要推論モデルを分類予測認識に適用 dog 簡単に分散処理基準 : スループット TCO @ scale 代表的なユーザー : CSP HPC 代表的なユーザー : Enterprise HPC 3

AI 人知工能ソリューションソリューションアーキテクトツールキットアプリケーション開発者ライブラリーデータサイエンティスト AI ソリューションカタログ (Public ( 英語 ) & Internal ( 英語 )) 人工知能 (ARTIFICIAL INTELLIGENCE) プラットフォーム金融ヘルスケアエネルギー産業輸送小売家庭その他ディープラーニングのデプロイメント OpenVINO ツールキット 1 インテル Movidius SDK ( 英語 ) TensorFlow* Caffe MXNet* を使った CPU プロセッサーグラフィックス FPGA & VPU 向けの推論デプロイメント用 Open Visual Inference & Neural Network Optimization ツールキットマシンラーニングライブラリー Python* R Distributed scikit-learn ( 英語 ) pandas ( 英語 ) NumPy* ( 英語 ) Cart ( 英語 ) Random Forest ( 英語 ) e1071 ( 英語 ) MlLib (Spark*) ( 英語 ) Mahout ( 英語 ) * TensorFlow* & Caffe を使ってすべてのインテル Movidius VPU に最適化された推論エンジンデイープラーニングフレームワーク CPU に最適化済み最適化作業中 * * FOR * ディープラーニングインテル Deep Learning Studio ディープラーニング開発サイクルを効率化するオープンソースのツール * * * * * * * * TensorFlow* MXNet* Caffe BigDL/Spark* ( 英語 ) Caffe2 PyTorch* PaddlePaddle* ファウンデーションライブラリー開発者ハードウェア IT システムアーキテクト分析マシンラーニング & ディープラーニング用プリミティブ Python* 2 インテル DAAL インテル MKL-DNN cldnn マシンラーニングに最適化されたインテルのディストリビューションインテルデータアナリティクスアクセラレーションライブラリー ( マシンラーニング用 ) AI ファウンデーション 1 旧インテルコンピュータービジョン SDK 2 インテル Distribution for Python* すべての製品コンピューターシステム日付図は現在の予想に基づくものであり予告なく変更されることがあります CPU とインテルグラフィックスをサポートするオープンソースのディープニューラルネットワーク関数データセンター端末デバイス NNP L-1000 Ai.intel.com ( 英語 ) ディープラーニンググラフコンパイラーインテル ngraph コンパイラー (Alpha) 複数のフレームワーク (TensorFlow* MXNet* ONNX*) を使用して複数のデバイス (CPU GPU NNP) に最適化されたディープラーニングのモデルを計算するオープンソースのコンパイラーディープラーニングアクセラレーター推論 4

インテルディープラーニングブースト将来のインテル Xeon スケーラブルプロセッサー ( 開発コード名 Cascade Lake) インテル Xeon スケーラブルプロセッサーでは数値精度の低い命令を使って組み込まれたディープラーニングのアクセラレーションが可能 Q3 2017-Q3 2018 Q3 2018-Q4 2018 Q4 2018-2019 推論 FP32 精度 INT8 精度 VNNI サポート INT8 インテル Xeon スケーラブルプロセッサー ( 開発コード名 Skylake) INT8 将来のインテル Xeon スケーラブルプロセッサー ( 開発コード名 Cascade Lake) インテル Xeon スケーラブルプロセッサー https://www.intel.com/content/www/us/en/now/your-data-on-intel/deep-learning-boost-video.html ( 英語 ) https://software.intel.com/en-us/articles/lower-numerical-precision-deep-learning-inference-and-training ( 英語 ) 将来のインテルディープラーニングブースト対応インテル Xeon スケーラブルプロセッサー 5

ソフトウェアスタック

HPC AI? 7

ResNet-50 Inception-V3 インテル Xeon プラットフォームにおけるディープラーニング性能の向上システムレベルの最適化最適化されたソフトウェアで性能向上最適化後フレームワーク vs 最適化前のフレームワークの性能 1 つのノードでフレームワークの複数のインスタンスを走らせることにより CPU 使用率を上げる 14x 訓練のスループットが改善 3.2x 推論のスループットが改善ソフトウェアの最適化 Algorithm improvements 6 Caffe ResNet-50 推論のスループット性能 4 TensorFlow* ResNet-50 推論のスループット性能 Improve load balancing 4 2 0 12 カ月で 5.4x At Launch (July 2017) INT8 + SW 最適化 Aug-18 3 2 1 0 8 カ月で 3.3x FP32 SW 最適化 At Sep 2017 May 2018 FURTHER PERFORMANCE BOOST EXPECTED WITH INT8 OPTIMIZATIONS 9

インテル Distribution for Python* 2019 による Python* の性能向上高性能の Python* ディストリビューション高速な NumPy* SciPy* scikit-learn は科学技術計算マシンラーニングデータ解析に最適使用している Python* にドロップインで置き換えコードの変更は必要ない最新のインテルプロセッサー向けに高度に最適化プライオリティーサポート ( 英語 ) の利用技術的な問題はインテルのエンジニアに直接質問 1 インテル Distribution for Python* の線形代数関数は従来の Python* 関数よりも高速新機能 scikit-learn でより高速のマシンラーニング : サポートベクトルマシン (SVM) と K 平均法予測はインテル DAAL で高速化インテル Parallel Studio XE 2019 インストーラーに統合簡単なコマンドラインのスタンドアロンインストール可能 XGBoost パッケージの同梱 (Linux* のみ ) 1 有償バージョンのみ性能に関するテストに使用されるソフトウェアとワークロードは性能がインテルマイクロプロセッサー用に最適化されていることがあります SYSmark* や MobileMark* などの性能テストは特定のコンピューターシステムコンポーネントソフトウェア操作機能に基づいて行ったものです結果はこれらの要因によって異なります製品の購入を検討される場合は他の製品と組み合わせた場合の本製品の性能などほかの情報や性能テストも参考にしてパフォーマンスを総合的に評価することをお勧めします詳細については http://www.intel.com/performance ( 英語 ) を参照してください : インテルコンパイラーではインテルマイクロプロセッサーに限定されない最適化に関して他社製マイクロプロセッサー用に同等の最適化を行えないことがありますこれにはインテルストリーミング SIMD 拡張命令 2 インテルストリーミング SIMD 拡張命令 3 インテルストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当しますインテルは他社製マイクロプロセッサーに関していかなる最適化の利用機能または効果も保証いたしません本製品のマイクロプロセッサー依存の最適化はインテルマイクロプロセッサーでの使用を前提としていますインテルマイクロアーキテクチャーに限定されない最適化のなかにもインテルマイクロプロセッサー用のものがありますこの注意事項で言及した命令セットの詳細については該当する製品のユーザーリファレンスガイドを参照してください注意事項の改訂 #20110804 11

Python* 向けの最も使われるマシンラーニングパッケージ 12

インテル DAAL で scikit-learn の最適化 scikit-learn マシンラーニングで最も使用されるパッケージ異なるパラメーターで数百ものアルゴリズムとても融通が利いて使いやすいインターフェイス DAAL4Py インテル DAAL は Python* API ( ミドルウェア ) を備えるインテル DAAL インテルアーキテクチャーにおける高性能な分析とマシンラーニングアルゴリズム 13

インテル Distribution for Python* 2019 のインストールスタンドアロンのインストーラー Anaconda.org Anaconda.org/intel channel フルインストーラーのダウンロード https://software.intel.com/en-us/intel-distribution-for-python ( 英語 ) > conda config --add channels intel > conda install intelpython3_full > conda install intelpython3_core 2.7 & 3.6 (3.7 coming soon) PyPI > pip install intel-numpy > pip install intel-scipy > pip install mkl_fft > pip install mkl_random + インテルライブラリーのランタイムパッケージ + インテルの開発パッケージ Docker* Hub docker pull intelpython/intelpython3_full YUM/APT yum/apt でアクセス https://software.intel.com/en-us/articles/installing-intel-free-libs-andpython ( 英語 ) 14

Python* + ネイティブコードのチューニングインテル VTune Amplifier で性能解析 ( インテル Parallel Studio XE に同梱 ) 課題 Python* とネイティブコードが混在するアプリケーションを 1 つのツールでプロファイル非効率なランタイム実行を検出ソリューション Python*/C/C++ 混在コードと拡張を自動検出パフォーマンス hotspot を行レベルで正確に識別低オーバーヘッド実行中のアプリケーションへのアタッチ / デタッチパフォーマンスへの影響が大きい箇所をチューニング Insert screenshot image Python* とネイティブ関数の自動検出およびパフォーマンス解析インテル VTune Amplifier とインテル Parallel Studio XE で可能 15

Numpy/random 16

サンプルプログラムやベンチマーク等 https://github.com/intelpython 17

インテルパフォーマンスライブラリーインテルマスカーネルライブラリー ( インテル MKL) インテルデータアナリティクスアクセラレーションライブラリー ( インテル DAAL)

インテルマスカーネルライブラリー ( インテル MKL)

インテル MKL の機能線形代数 FFT ベクトル RNG サマリー統計ベクトル演算その他 BLAS LAPACK ScaLAPACK スパース BLAS 反復法スパースソルバー PARDISO クラスタースパースソルバー多次元 FFTW インターフェイスクラスター FFT 合同数 Wichmann- Hill メルセンヌツイスター Sobol Neiderreiter 非決定的尖度変化係数順序統計量最小 / 最大分散 / 共分散三角双曲線指数対数累乗累乗根スプライン補間信頼領域高速ポアソンソルバー 20

インテル DAAL によるエッジでの解析のスピードアップマシンラーニングおよびビッグデータ解析のパフォーマンスを高速化アプリケーションがより速くより優れた予測を行えるように支援最高のパフォーマンスを引き出せるようにデータの取り込みとアルゴリズムの計算を最適化広範なアプリケーションのニーズを満たすオフラインストリーミング分散型使用モデルをサポートエッジデバイスとクラウドサービス間で解析ワークロードを分割してアプリケーション全体のスループットを最適化詳細 : isus.jp/intel-daal/ バージョン 2019 の新機能新しいアルゴリズムハイパフォーマンスロジスティック回帰最も広く利用されている分類アルゴリズム拡張勾配ブースティング機能ユーザー定義のコールバックによる不正確な分割計算およびアルゴリズムレベルの計算のキャンセルにより柔軟性を拡張ユーザー定義の CSV/IDBC データソースのデータ変更プロシージャー広範な特徴抽出および変換手法を実装前処理変換解析モデリング検証意思決定展開フィルタリング正規化集計次元縮小サマリー統計クラスタリングなどマシンラーニング ( 訓練 ) パラメーター推定シミュレーション仮説検証モデルエラー予測決定木など 22

処理モデルバッチ処理オンライン処理分散処理 R 1 D 1 D k D k- 1 D 1 D 2 R 2 R 追加 D 3 D 2 D 1 S i,r i D k R = F(D 1,,D k ) S i+1 = T(S i,d i ) R i+1 = F(S i+1 ) R k R = F(R 1,,R k ) 23

データ変換および解析アルゴリズムインテル DAAL データセットの基礎統計相関と依存関係行列の因数分解次元縮小外れ値検出低次モーメントコサイン距離 SVD PCA 単変量分位数相関距離 QR 相関ルールマイニング ( アプリオリ ) 多変量順序統計量分散共分散行列コレスキー最適化ソルバー (SGD AdaGrad lbfgs) 数学関数 (exp log ) バッチ処理をサポートするアルゴリズムバッチオンライン分散処理をサポートするアルゴリズム 24

マシンラーニングアルゴリズムインテル DAAL 回帰ロジスティクス回帰リッジ回帰線形回帰ランダムフォレスト K 平均法教師あり訓練決定木教師なし訓練 EM (GMM) ブースティング (Ada Brown Logit) ニューラルネットワーク分類ナイーブベイズ弱学習器 K 近傍法協調フィルタリング交互最小 2 乗 (ALS) バッチ処理をサポートするアルゴリズムサポートベクトルマシンバッチオンライン分散処理をサポートするアルゴリズム 25

インテル DAAL による性能のスケール CPU コア内 SIMD ベクトル化 : 最新の命令セットに最適化インテル AVX2 インテル AVX-512... 内部的にはインテル MKL のシーケンシャル部分を採用マルチコアやメニーコアへのスケールスレッディングビルディングブロックによるスレッド化クラスターへのスケールユーザーのアプリケーションによる分散処理 (MPI MapReduce など ) インテル DAAL の利用部分的で中間的な計算結果をサポートするデータ構造部分的で中間的な計算結果を全体の計算結果にまとめる関数 26

さあ始めよう最適化に役立つ情報 isus (IA Software User Society) インテルソフトウェア開発製品の日本語版や日本語ヘルプの提供インテルコーポレーションのインテルソフトウェアネットワークの記事の日本語化インテル Parallel Studio XE 概要機能サポートコードサンプル ( 英語 ) トレーニング資料 Tech.Decoded ウェビナー ( 英語 ) HOW TO ビデオと記事 ( 英語 ) お客様の声 ( 英語 ) & ケーススタディーその他のインテルソフトウェア開発製品 29 インテル Code Modernization Program 概要 ( 英語 ) ライブトレーニング ( 英語 ) TECH ウェビナーの視聴 https://intel.ly/2pdknhn ( 英語 ) 29

法務上の注意書きとパフォーマンス結果は 2018 年 9 月時点のテスト結果に基づいたものであり公開されている利用可能なすべてのセキュリティーアップデートが適用されていない可能性があります詳細については構成の開示を参照してください絶対的なセキュリティーを提供できる製品はありません性能に関するテストに使用されるソフトウェアとワークロードは性能がインテルマイクロプロセッサー用に最適化されていることがあります SYSmark* や MobileMark* などの性能テストは特定のコンピューターシステムコンポーネントソフトウェア操作機能に基づいて行ったものです結果はこれらの要因によって異なります製品の購入を検討される場合は他の製品と組み合わせた場合の本製品の性能などほかの情報や性能テストも参考にしてパフォーマンスを総合的に評価することをお勧めします詳細については www.intel.com/benchmarks ( 英語 ) を参照してください本資料の情報は現状のまま提供され本資料は明示されているか否かにかかわらずまた禁反言によるとよらずにかかわらずいかなる知的財産権のライセンスも許諾するものではありません製品に付属の売買契約書 Intel's Terms and Conditions of Sale に規定されている場合を除きインテルはいかなる責任を負うものではなくまたインテル製品の販売や使用に関する明示または黙示の保証 ( 特定目的への適合性商品性に関する保証第三者の特許権著作権その他知的財産権の侵害への保証を含む ) をするものではありません Intel インテル Intel ロゴ Intel Inside Intel Inside ロゴ Arria Intel Atom Intel Core Iris Stratix Xeon Movidius Myriad Intel Nervana OpenVINO はアメリカ合衆国および / またはその他の国における Intel Corporation またはその子会社の商標ですインテルコンパイラーではインテルマイクロプロセッサーに限定されない最適化に関して他社製マイクロプロセッサー用に同等の最適化を行えないことがありますこれにはインテルストリーミング SIMD 拡張命令 2 インテルストリーミング SIMD 拡張命令 3 インテルストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当しますインテルは他社製マイクロプロセッサーに関していかなる最適化の利用機能または効果も保証いたしません本製品のマイクロプロセッサー依存の最適化はインテルマイクロプロセッサーでの使用を前提としていますインテルマイクロアーキテクチャーに限定されない最適化のなかにもインテルマイクロプロセッサー用のものがありますこの注意事項で言及した命令セットの詳細については該当する製品のユーザーリファレンスガイドを参照してください注意事項の改訂 #20110804 30