ムーアの法則後の世界 年間のマイクロプロセッサのトレンド トランジスタ数 ( 千単位 ) 年率 1.1 倍 シングルスレッド性能 年率 1.5 倍 Original data up t

Size: px
Start display at page:

Download "ムーアの法則後の世界 年間のマイクロプロセッサのトレンド トランジスタ数 ( 千単位 ) 年率 1.1 倍 シングルスレッド性能 年率 1.5 倍 Original data up t"

Transcription

1 エヌビディアが加速する AI 革命 エヌビディア合同会社 エンタープライズマーケティング本部長林憲一 1

2 ムーアの法則後の世界 年間のマイクロプロセッサのトレンド トランジスタ数 ( 千単位 ) 年率 1.1 倍 シングルスレッド性能 年率 1.5 倍 Original data up to the year 2010 collected and plotted by M. Horowitz, F. Labonte, O. Shacham, K. Olukotun, L. Hammond, and C. Batten New plot and data collected for by K. Rupp 2

3 GPU コンピューティングの登場 アプリケーション GPU コンピューティング性能年率 1.5 倍 2025 年までに 1000 倍 アルゴリズム 10 5 年率 1.1 倍 システム 10 4 CUDA アーキテクチャ 10 3 年率 1.5 倍 10 2 シングルスレッド性能 Original data up to the year 2010 collected and plotted by M. Horowitz, F. Labonte, O. Shacham, K. Olukotun, L. Hammond, and C. Batten New plot and data collected for by K. Rupp 3

4 GPU コンピューティングの登場 7, ,000 1,000, GTC 参加者 5 年で 3 倍 GPU コンピューティング開発者 5 年で 11 倍 1 年間の CUDA ダウンロード数 2016 年 4

5 マシンラーニングの時代 The Master Algorithm Pedro Domingos A Quest for Intelligence Fei-Fei Li 5

6 現代の AI のビッグバン Google Photo Arterys FDA Approved Reinforcement Learning AlphaGo Super Resolution Deep Voice Transfer Learning ImageNet Stanford & NVIDIA Large-scale DNN on GPU NVIDIA BB8 Captioning BRETT Auto Encoders Style Transfer NMT IDSIA CNN on GPU U Toronto AlexNet on GPU Baidu DuLight LSTM Superhuman ASR GAN 6

7 現代 AI のビッグバン 13,000 20,000 $5B 50 億ドル NIPS ICML CVPR ICLR 参加者数 2 年で 2 倍 Udacity での AI プログラム 2 年で 100 倍 AI スタートアップ投資 4 年で 9 倍 7

8 エヌビディアが加速する AI 革命 フレームワーク GPU システム GPU AAS HGX-1 NVAIL インターネットサービス ヘルスケア DGX-1 NVIDIA ディープラーニング SDK NVIDIA RESEARCH INCEPTION エンタープライズ TESLA 8

9 NVIDIA INCEPTION プログラム 1300 のディープラーニングスタートアップを支援 ヘルスケア リテール e テール 金融 セキュリティ プラットフォーム及び API データマネージメント IOT 及び製造 自律動作機械 サイバー 建築 開発プラットフォーム ビジネスインテリジェンス及び可視化 9

10 エンタープライズのための SAP AI SAP から提供される最初の商業的 AI オファリング Brand Impact Service Ticketing Invoice-to-Record アプリケーション DGX-1 と AWS で NVIDIA GPU を利用 10

11 年々複雑さを増すモデル 1.05 垓回の計算量 87 億パラメータ 700 京回の計算量 6000 万パラメータ 2000 京回の計算量 3 億パラメータ 2015 Microsoft ResNet 2016 Baidu Deep Speech Google NMT 11

12 発表 Tesla V100 AI と HPC のための大きな飛躍 Tensor コアを搭載した Volta アーキテクチャ 210 億トランジスタ TSMC 12nm FFN 815mm CUDA コア 7.5 FP64 TFLOPS 15 FP32 TFLOPS 120 Tensor TFLOPS 総レジスタファイル 20MB 16MB キャッシュ 900 GB/s の 16GB HBM2 300 GB/s NVLink 12

13 新開発 Tensor コア CUDA Tensor 演算命令及びデータフォーマット 4x4 行列処理配列 D[FP32] = A[FP16] * B[FP16] + C[FP32] ディープラーニングに最適化 アクティベーション入力重み入力出力結果 13

14 発表 Tesla V100 AI と HPC のための大きな飛躍 Tensor コアを搭載した Volta アーキテクチャ Pascal 世代と比較して HPC のための汎用演算性能 1.5 倍 ディープラーニングトレーニングのための Tensor 演算性能 12 倍 ディープラーニング推論のための Tensor 演算性能 6 倍 14

15 発表 Volta 対応フレームワーク CNN トレーニング (ResNet-50) NCCL 2.0 を利用したマルチノードトレーニング (ResNet-50) LSTM トレーニング ( ニューラル機械翻訳 ) 8x K80 8x P100 K80 8x P100 8x V100 P100 8x V100 64x V100 V 時間 時間 時間 15

16 発表 Tesla V100 搭載 NVIDIA DGX-1 AI 研究に必須の道具 960 Tensor TFLOPS Tesla V100 8 基 NVLink ハイブリッドキューブ TITAN X で 8 日かかる計算が 8 時間に CPU サーバー 400 台分の性能がワンボックスに 16

17 発表 Tesla V100 搭載 NVIDIA DGX-1 AI 研究に必須の道具 960 Tensor TFLOPS Tesla V100 8 基 NVLink ハイブリッドキューブ TITAN X で 8 日かかる計算が 8 時間に CPU サーバー 400 台分の性能がワンボックスに ご注文は : nvidia.com/dgx-1 17

18 発表 NVIDIA DGX ステーションパーソナル DGX 480 Tensor TFLOPS Tesla V100 4 基 NVLink 全結合 3 つの DisplayPort 1500W 水冷 18

19 発表 NVIDIA DGX ステーションパーソナル DGX 480 Tensor TFLOPS Tesla V100 4 基 NVLink 全結合 3 つの DisplayPort 1500W 水冷 ご注文は : nvidia.com/dgx-station 19

20 発表ハイパースケール推論のための Tesla V100 Skylake に対して 15~25 倍の推論性能 150W FHHL PCIE 20

21 GPU で加速されたデータセンターの例 データセンター全体で300,000 推論 / 秒 CPU 当り 300 推論 / 秒 1000 CPU 1000 CPU 500 ノードノード 3000ドル 150 万ドルノード 500W 250KW 500 ノードの CPU サーバー Tesla V100 によって 1/15に 33 ノードの GPU で加速されたサーバー 21

22 NVIDIA ディープラーニングスタック ディープラーニングフレームワーク ディープラーニングライブラリ NVIDIA cudnn, NCCL, cublas, TensorRT CUDA ドライバ オペレーティングシステム GPU システム 22

23 発表 NVIDIA GPU クラウド ディープラーニングに最適化された GPU で加速されたクラウドプラットフォーム NVIDIA GPU クラウド コンテナ データセット 事前学習済みのモデルのレポジトリ CSP NVDocker のコンテナとして提供 フルスタックで最適化常に最新 エヌビディアによって完全にテストおよびメンテナンス 7 月にベータ提供 23

24 GPU コンピューティング性能 AMBER 性能 (ns/day) GoogleNet 性能 (i/s) AMBER 16 CUDA cudnn 7 CUDA 9 NCCL AMBER 14 CUDA 5 AMBER 14 CUDA cudnn 6 CUDA 8 NCCL AMBER 12 CUDA cudnn 2 CUDA 6 cudnn 4 CUDA 7 0 K20 K40 K80 P x K80 8x Maxwell DGX-1 DGX-1V

25 エヌビディアが加速する AI 革命 エッジでの AI フレームワーク GPU システム GPU AAS HGX-1 NVAIL インターネットサービス ヘルスケア 自動車 DGX-1 NVIDIA ディープラーニング SDK DRIVE PX NVIDIA ディープラーニング SDK NVIDIA RESEARCH INCEPTION エンタープライズ AI シティ ロボット TESLA JETSON TX 25

26 AI が革新するトランスポーテーション 年間 4500 億キロ 米国では 2 億 5000 万台の車のために 8 億の駐車場 ドミノピザ : 一日 100 万個のピザを配達 26

27 NVIDIA DRIVE AI カープラットフォーム 100 TOPS DRIVE PX Xavier Level 4/5 自己位置推定 認識 AI パスプランニング 10 TOPS DRIVE PX 2 Parker Level 2/3 コンピュータビジョンライブラリ 1 TOPS CUDA cudnn TensorRT OS 27

28 NVIDIA DRIVE マッピングから運転へ コパイロット ガーディアンエンジェル 28

29 発表トヨタ 自動運転車向けに NVIDIA DRIVE PX を選択 29

30 自動運転のための AI プロセッサ CPU 汎用アーキテクチャ FPGA CUDA GPU Volta Pascal 特定用途アクセラレータ DLA XAVIER 30 TOPS DL 30W カスタム ARM64 CPU 512 コア Volta GPU 10 TOPS DL アクセラレータ エネルギー効率 30

31 自動運転のための AI プロセッサ + CPU CUDA GPU Volta 汎用アーキテクチャ 特定用途アクセラレータ DLA XAVIER 30 TOPS DL 30W カスタム ARM64 CPU 512 コア Volta GPU 10 TOPS DL アクセラレータ エネルギー効率 31

32 発表 Xavier DLA オープンソース化 Command Interface Tensor Execution Micro-controller Input DMA (Activations and Weights) Unified 512KB Input Buffer Activations and Weights Sparse Weight Decompression Native Winograd Input Transform MAC Array 2048 Int8 or 1024 Int16 or 1024 FP16 Output Accumulators Output Postprocess or (Activation Function, Pooling etc.) Output DMA Memory Interface アーリーアクセス予定 : 7 月 一般リリース予定 : 9 月 32

33 エヌビディアが加速する AI 革命 NVIDIA GPU CLOUD CSPs 全てのクラウドに NVIDIA GPU NVIDIA GPU クラウド Tensor コア TensorRT Xavier DLA オープンソース化 Tesla V100 DGX-1 及び DGX ステーション 33

34 34

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10 NVIDIA TESLA V100 CUDA 9 のご紹介 森野慎也, シニアソリューションアーキテクト (GPU-Computing) NVIDIA Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ

More information

はじめに AI は 感染症の早期発見と治療法の探索 交通事故死の削減 事故発生前の重大なインフラ欠陥の発見など 人類が直面する複雑な > 問題を解決するのに役立てられています AI とディープラーニング利用における 2 つの大きな課題は パフォーマンスの最大化と 絶え間なく変化する基盤技術の管理です

はじめに AI は 感染症の早期発見と治療法の探索 交通事故死の削減 事故発生前の重大なインフラ欠陥の発見など 人類が直面する複雑な > 問題を解決するのに役立てられています AI とディープラーニング利用における 2 つの大きな課題は パフォーマンスの最大化と 絶え間なく変化する基盤技術の管理です 技術概要 NVIDIA GPU CLOUD ディープラーニングソフトウェア 最適化されたディープラーニングコンテナーのガイド はじめに AI は 感染症の早期発見と治療法の探索 交通事故死の削減 事故発生前の重大なインフラ欠陥の発見など 人類が直面する複雑な > 問題を解決するのに役立てられています AI とディープラーニング利用における 2 つの大きな課題は パフォーマンスの最大化と 絶え間なく変化する基盤技術の管理です

More information

VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12

VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 アジェンダ Tensorコアとトレーニングの概要 混合精度 (Tensorコア) で FP32と同等の精度を得る方法 ウェイトをFP16とFP32を併用して更新する ロス スケーリング DLフレームワーク対応状況 ウェイトをFP16で更新する

More information

PowerPoint Presentation

PowerPoint Presentation ディープラーニングの 実践的な適用ワークフロー MathWorks Japan テクニカルコンサルティング部縣亮 2015 The MathWorks, Inc. 1 アジェンダ ディープラーニングとは?( おさらい ) ディープラーニングの適用ワークフロー ワークフローの全体像 MATLAB によるニューラルネットワークの構築 学習 検証 配布 MATLAB ではじめるメリット 試行錯誤のやりやすさ

More information

Slide 1

Slide 1 ディープラーニング最新動向と技術情報 なぜ GPU がディープラーニングに向いているのか エヌビディアディープラーニングソリューションアーキテクト兼 CUDAエンジニア村上真奈 ディープラーニングとは AGENDA なぜ GPU がディープラーニングに向いているか NVIDIA DIGITS 2 ディープラーニングとは 3 Google I/O 2015 基調講演 ディープラーニングのおかげで わずか一年で音声認識の誤認識率が

More information

b4-deeplearning-embedded-c-mw

b4-deeplearning-embedded-c-mw ディープラーニングアプリケーション の組み込み GPU/CPU 実装 アプリケーションエンジニアリング部町田和也 2015 The MathWorks, Inc. 1 アジェンダ MATLAB Coder/GPU Coder の概要 ディープニューラルネットワークの組み込み実装ワークフロー パフォーマンスに関して まとめ 2 ディープラーニングワークフローのおさらい Application logic

More information

マネージド AI サービスと GPU IaaS クラウドで GPU が活きる二つの選択肢 マネージド AI サービス GPU IaaS Amazon AI Google Cloud Vision API 等 IBM Watson Microsoft Cognitive Services Amazon

マネージド AI サービスと GPU IaaS クラウドで GPU が活きる二つの選択肢 マネージド AI サービス GPU IaaS Amazon AI Google Cloud Vision API 等 IBM Watson Microsoft Cognitive Services Amazon GPU クラウド コンピューティング エンタープライズマーケティング部 佐々木邦暢 (@_ksasaki) マネージド AI サービスと GPU IaaS クラウドで GPU が活きる二つの選択肢 マネージド AI サービス GPU IaaS Amazon AI Google Cloud Vision API 等 IBM Watson Microsoft Cognitive Services Amazon

More information

VOLTA ARCHITECTURE DEEP DIVE 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12

VOLTA ARCHITECTURE DEEP DIVE 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 VOLTA ARCHITECTURE DEEP DIVE 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 TESLA V100 の概要 Volta Architecture Improved NVLink & HBM2 Volta MPS Improved SIMT Model Tensor Core Most Productive GPU Efficient Bandwidth

More information

Jetson and Azure ハンズオン

Jetson and Azure ハンズオン DLLAB Japan Tour 2019 AI と IoT が出合う日 : IoT 編 エヌビディア合同会社 本日の全体像 USB メモリ jetson-inference のビルド用ファイルなど Jetson TX2 開発者キット Jetson でビルド / 実行 VNC/SSH 接続 jetsoninference GitHub NVIDIA GPU Cloud (NGC) DIGITS コンテナイメージ

More information

WP _v1.1 目次 NVIDIA Tesla V100 GPU アーキテクチャ概論... 1 Tesla V100: AI コンピューティングと HPC の主戦力... 3 主な機能... 3 AI および HPC 向けの究極のパフォーマンス... 7 NVIDIA GPU -

WP _v1.1 目次 NVIDIA Tesla V100 GPU アーキテクチャ概論... 1 Tesla V100: AI コンピューティングと HPC の主戦力... 3 主な機能... 3 AI および HPC 向けの究極のパフォーマンス... 7 NVIDIA GPU - NVIDIA TESLA V100 GPU アーキテクチャ 世界最先端のデータセンター GPU WP-08608-001_v1.1 August 2017 WP-08608-001_v1.1 目次 NVIDIA Tesla V100 GPU アーキテクチャ概論... 1 Tesla V100: AI コンピューティングと HPC の主戦力... 3 主な機能... 3 AI および HPC 向けの究極のパフォーマンス...

More information

半世紀以上にわたり コンピューター科学者の夢であった人工知能 (AI) は もはや SF ではなくなりました 数年後 AI はあらゆる業界に変革をもたらすことでしょう 例えば自動運転車によって渋滞が緩和され 交通の安全性が向上するのも そう遠い未来ではありません 旅行代理店は顧客の好みを把握し あな

半世紀以上にわたり コンピューター科学者の夢であった人工知能 (AI) は もはや SF ではなくなりました 数年後 AI はあらゆる業界に変革をもたらすことでしょう 例えば自動運転車によって渋滞が緩和され 交通の安全性が向上するのも そう遠い未来ではありません 旅行代理店は顧客の好みを把握し あな エヌビディア AI コンピューティングカンパニー 半世紀以上にわたり コンピューター科学者の夢であった人工知能 (AI) は もはや SF ではなくなりました 数年後 AI はあらゆる業界に変革をもたらすことでしょう 例えば自動運転車によって渋滞が緩和され 交通の安全性が向上するのも そう遠い未来ではありません 旅行代理店は顧客の好みを把握し あなたの家族旅行を綿密にアレンジするでしょう 医療機器が患者の

More information

GPU n Graphics Processing Unit CG CAD

GPU n Graphics Processing Unit CG CAD GPU 2016/06/27 第 20 回 GPU コンピューティング講習会 ( 東京工業大学 ) 1 GPU n Graphics Processing Unit CG CAD www.nvidia.co.jp www.autodesk.co.jp www.pixar.com GPU n GPU ü n NVIDIA CUDA ü NVIDIA GPU ü OS Linux, Windows, Mac

More information

第 1 回ディープラーニング分散学習ハッカソン <ChainerMN 紹介 + スパコンでの実 法 > チューター福 圭祐 (PFN) 鈴 脩司 (PFN)

第 1 回ディープラーニング分散学習ハッカソン <ChainerMN 紹介 + スパコンでの実 法 > チューター福 圭祐 (PFN) 鈴 脩司 (PFN) 第 1 回ディープラーニング分散学習ハッカソン チューター福 圭祐 (PFN) 鈴 脩司 (PFN) https://chainer.org/ 2 Chainer: A Flexible Deep Learning Framework Define-and-Run Define-by-Run Define Define by Run Model

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 次世代 IoT に向けた AI の組み込み実装への 取り組み AI の推論機能を FPGA に実装するための技術とソリューション提案 Embedded Product Business Development Department Agenda 1. エッジAIの現状 2. 組み込みAIのニーズ 3.FPGAとエッジAI 4. 組み込み向けエッジAI 実装の特性 (GPUとFPGA) 5. エッジAI

More information

ディープラーニングの最新トレンドとエヌビディアの最新GPU

ディープラーニングの最新トレンドとエヌビディアの最新GPU ディープラーニング最新事情報ならびにその進化を支える NVIDIA の GPU と戦略 エンタープライズ事業部事業部長 井﨑武士 創業 1993 年 共同創立者兼 CEO ジェンスン フアン (Jen-Hsun Huang) 1999 年 NASDAQ に上場 (NVDA) 1999 年に GPU を発明その後の累計出荷台数は 1 億個以上 218 会計年度の売上高は 97 億ドル 社員は世界全体で

More information

Presentation Title

Presentation Title ディープラーニングの システムへの展開 ~ エッジからクラウドまで ~ アプリケーションエンジニアリング部福本拓司 2015 The MathWorks, Inc. 1 機械学習 ディープラーニング関連セッション 2 ディープラーニング学習のイメージできましたでしょうか? カメラ データベースでのデータ取得 簡潔なコーディングで学習 & 検証 豊富なサンプルコード ユーザー成功事例 Deep Dream

More information

GPUコンピューティング講習会パート1

GPUコンピューティング講習会パート1 GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の

More information

Jetson and Azure ハンズオン

Jetson and Azure ハンズオン DLLAB Japan Tour 2019 AI と IoT が出合う日 : IoT 編 @ 名古屋 2019/02/25 エヌビディア合同会社 本日の全体像 USB メモリ jetson-inference のビルド用ファイルなど Jetson TX2 開発者キット SSH 接続 Jetson でビルド / 実行 jetsoninference GitHub NVIDIA GPU Cloud (NGC)

More information

Fujitsu Standard Tool

Fujitsu Standard Tool LSI とシステムのワークショップ 2017 2017 年 5 月 16 日 Deep Learning 向け高効率化技術 について 富士通研究所コンピュータシステム研究所池敦 0 アウトライン はじめに 背景 富士通のAIへの取り組みについて 富士通 Zinrai ディープラーニング Deep Learning 向け高効率化技術 Deep Learningとは Deep Learning 向け高効率化技術とは

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース2] データ蓄積 2-5: 多様化が進展するクラウドサービス [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学本講座の学習内容 (2-5: 多様化が進展するクラウドサービス ) 講座概要 近年 注目されているクラウドの関連技術を紹介します PCやサーバを構成するパーツを紹介後

More information

ユニットコム、AI開発・ディープラーニング専用パソコンを発売

ユニットコム、AI開発・ディープラーニング専用パソコンを発売 News Release 平成 19 年 12 月 20 日 2018 年 5 月 10 日株式会社 MCJ ユニットコム AI 開発 ディープラーニング専用パソコンを発売! DEEP シリーズ iiyama PC SOLUTION より 当社グループでは 2016 年 5 月 13 日に発表しました 2017-2019 年度中期経営計画 にて掲げた通り 市場トレンドやユーザーニーズを捉えた製品の開発

More information

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ K20 GPU2 個に対するスピードアップ NVIDIA は Fermi アーキテクチャ GPU の発表により パフォーマンス エネルギー効率の両面で飛躍的な性能向上を実現し ハイパフォーマンスコンピューティング (HPC) の世界に変革をもたらしました また 実際に GPU

More information

ディープラーニングによって加速する AI 競争 100% 90% 80% 従来 CV 手法 IMAGENET 正答率 ディープラーニング 70% 60% IBM Watson が自然言語処理のブレークスルーを実現 Facebook が Big Sur を発表 Baidu の Deep Speech

ディープラーニングによって加速する AI 競争 100% 90% 80% 従来 CV 手法 IMAGENET 正答率 ディープラーニング 70% 60% IBM Watson が自然言語処理のブレークスルーを実現 Facebook が Big Sur を発表 Baidu の Deep Speech エヌビディアのディープラーニング戦略 エヌビディア合同会社プラットフォームビジネス本部部長 林憲一 ディープラーニングによって加速する AI 競争 100% 90% 80% 従来 CV 手法 IMAGENET 正答率 ディープラーニング 70% 60% IBM Watson が自然言語処理のブレークスルーを実現 Facebook が Big Sur を発表 Baidu の Deep Speech 2

More information

hpc141_shirahata.pdf

hpc141_shirahata.pdf GPU アクセラレータと不揮発性メモリ を考慮した I/O 性能の予備評価 白幡晃一 1,2 佐藤仁 1,2 松岡聡 1 1: 東京工業大学 2: JST CREST 1 GPU と不揮発性メモリを用いた 大規模データ処理 大規模データ処理 センサーネットワーク 遺伝子情報 SNS など ペタ ヨッタバイト級 高速処理が必要 スーパーコンピュータ上での大規模データ処理 GPU 高性能 高バンド幅 例

More information

米国ICT状況視察

米国ICT状況視察 画像処理 AI 技術の利活用動向について 株式会社日立製作所 社会イノベーション事業推進本部 柿本真吾 発表内容 1. Google Cloud 面談概要 1-1. GCP Overview 1-2. Big Data & Machine Learning 1-3. Daydream 1-4. IoT 2. NVIDIA 面談概要 2-1. NVIDIA Corporate Profile 2-2.

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information

Catalog_Quadro_Series_ のコピー2

Catalog_Quadro_Series_ のコピー2 NVIDIA Quadro Series NVIDIA Quadro Design, Built, and Tested by NVIDIA NVIDIA QUADRO シリーズ 総合カタログ BREAKTHROUGH IN EVERY FORM. 比類なきパワー 比類なき創造的自由 NVIDIA のこ れ ま で で 最 も 強 力 な GPU アー キ テ クチャであ る NVIDIA Pascal

More information

Slide 1

Slide 1 GPU コンピューティング研究会ディープラーニング ハンズオン講習 エヌビディア合同会社 ディープラーニングソリューションアーキテクト兼 CUDA エンジニア村上真奈 追記 ハンズオンのおさらいを後日行いたい方へ MNIST データセットは以下からダウンロードする事が可能です (gz 形式 ) http://yann.lecun.com/exdb/mnist/ 下記スクリプトでも簡単にデータをダウンロード可能です

More information

HPEハイパフォーマンスコンピューティング ソリューション

HPEハイパフォーマンスコンピューティング ソリューション HPE HPC / AI Page 2 No.1 * 24.8% No.1 * HPE HPC / AI HPC AI SGIHPE HPC / AI GPU TOP500 50th edition Nov. 2017 HPE No.1 124 www.top500.org HPE HPC / AI TSUBAME 3.0 2017 7 AI TSUBAME 3.0 HPE SGI 8600 System

More information

AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン

AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン ハンズオンラボ2 DIGITS による物体検出入門 村上真奈 NVIDIA CUDA & Deep Learning Solution Architect NVIDIA Corporation 1 AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン ディープラーニングとは 機械学習とディープラーニングの関係

More information

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~ MATLAB における並列 分散コンピューティング ~ Parallel Computing Toolbox & MATLAB Distributed Computing Server ~ MathWorks Japan Application Engineering Group Takashi Yoshida 2016 The MathWorks, Inc. 1 System Configuration

More information

gworksctl コマンドマニュアル 2019/6/17 株式会社 GDEP アドバンス 本書は GDEP Advance gworksctl コマンドマニュアルです G-Works G-Works Deep Learning Distribution for Linux( 以下 G-Works)

gworksctl コマンドマニュアル 2019/6/17 株式会社 GDEP アドバンス 本書は GDEP Advance gworksctl コマンドマニュアルです G-Works G-Works Deep Learning Distribution for Linux( 以下 G-Works) gworksctl コマンドマニュアル 2019/6/17 株式会社 GDEP アドバンス 本書は GDEP Advance gworksctl コマンドマニュアルです G-Works G-Works Deep Learning Distribution for Linux( 以下 G-Works) は Deep Learning に使用される主要なフレームワークを 各世代の NVIDIA GPU

More information

Slide 1

Slide 1 ハンズオン受講の為の準備講座 これから始める人の為の ディープラーニング基礎講座 村上真奈 NVIDIA CUDA & Deep Learning Solution Architect NVIDIA Corporation 1 機械学習とディープラーニングの関係 AGENDA ディープラーニングとは? ニューラルネットワークの構造 ディープラーニングの学習とは 畳み込みニューラルネットワーク 午後に予定しているハンズオンの為の基礎講座ディープラーニングをこれから始める方を対象に基礎概念や用語の解説を行います

More information

AW-SF200 導入手順書

AW-SF200 導入手順書 Auto Tracking Server Software 導入手順書 目次 目次... 2 はじめに... 3 動作環境... 3 ネットワーク... 4 本ファイルの記載について... 4 登録および登録商標について... 5 サーバーの構成について... 6 リモートカメラの設定について... 7 ソフトウェアのインストール... 9 ソフトウェアのダウンロード... 9 ソフトウェアのインストール...

More information

GPUコンピューティング講習会パート1

GPUコンピューティング講習会パート1 GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の

More information

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 理化学研究所 共通コードプロジェクト

GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 理化学研究所 共通コードプロジェクト GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 勉強会 @ 理化学研究所 共通コードプロジェクト Contents Hands On 環境について Introduction to GPU computing Introduction

More information

ディープラーニングの組み込み機器実装ソリューション ~GPC/CPU編~

ディープラーニングの組み込み機器実装ソリューション ~GPC/CPU編~ ディープラーニングの組み込み機器実装ソリューション ~GPU/CPU 編 ~ MathWorks Japan アプリケーションエンジニアリング部大塚慶太郎 Kei.Otsuka@mathworks.co.jp 2018 The MathWorks, Inc. 1 自動運転 : 車 歩行者等の物体認識 白線検出 組み込み GPU への実装 モデル GPU 実装 / 配布 3 医用画像 : 腫瘍等 特定の部位の検出

More information

ディープラーニングの現在 AGENDA ディープラーニング SDK NVIDIA DIGITS ディープラーニング フレームワーク / ディープラーニングの基礎

ディープラーニングの現在 AGENDA ディープラーニング SDK NVIDIA DIGITS ディープラーニング フレームワーク / ディープラーニングの基礎 エヌビディアが加速するディープラーニング ~ 進化するニューラルネットワークとその開発方法について ~ ディープラーニングソリューションアーキテクト兼 CUDA エンジニア 村上真奈 ディープラーニングの現在 AGENDA ディープラーニング SDK NVIDIA DIGITS ディープラーニング フレームワーク / ディープラーニングの基礎 ディープラーニングの現在 人工知能にとって驚くべき一年

More information

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h 23 FPGA CUDA Performance Comparison of FPGA Array with CUDA on Poisson Equation (lijiang@sekine-lab.ei.tuat.ac.jp), (kazuki@sekine-lab.ei.tuat.ac.jp), (takahashi@sekine-lab.ei.tuat.ac.jp), (tamukoh@cc.tuat.ac.jp),

More information

2 1,384,000 2,000,000 1,296,211 1,793,925 38,000 54,500 27,804 43,187 41,000 60,000 31,776 49,017 8,781 18,663 25,000 35,300 3 4 5 6 1,296,211 1,793,925 27,804 43,187 1,275,648 1,753,306 29,387 43,025

More information

スピーカースライド作成前の確認シート例

スピーカースライド作成前の確認シート例 IoT に AI を組み込む ~ 最新技術と実践方法解説 AI08 IoTの開発 運用コストは AIの活用で回収する AI = Big Data Big Data from IoT Edges AI Create Excellent Value IoT は 膨大なデバイスと膨大なデータを扱う Azure で IoT+AI を実践するときの基本骨格 IoT で使われる AI 要素 IoT のスケール感

More information

GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer

GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer Chainer のミッション Deep Learning とその応用の研究開発を加速させる 環境セットアップが速い すぐ習熟 素早いコーディング 実験の高速化 結果をさっと公開 論文化

More information

システムソリューションのご紹介

システムソリューションのご紹介 HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ

More information

dlshogiアピール文章

dlshogiアピール文章 第 28 回世界コンピュータ将棋選手権 dlshogi アピール文章 山岡忠夫 2018 年 5 月 1 日更新 下線部分は 第 5 回将棋電王トーナメントからの差分を示す 1 特徴 ディープラーニングを使用 指し手を予測する Policy Network 局面の勝率を予測する Value Network 入力特徴にドメイン知識を活用 モンテカルロ木探索 並列化 自己対局による強化学習 既存将棋プログラムの自己対局データを使った事前学習

More information

Qlik Sense のシステム要件

Qlik Sense のシステム要件 Qlik Sense のシステム要件 Qlik Sense February 2018 Copyright 1993-2018 QlikTech International AB. 無断複写 転載を禁じます Copyright 1993-2018 QlikTech International AB. All rights reserved. Qlik QlikTech Qlik Sense QlikView

More information

スライド 1

スライド 1 Nehalem 新マイクロアーキテクチャ スケーラブルシステムズ株式会社 はじめに 現在も続く x86 マイクロプロセッサマーケットでの競合において Intel と AMD という 2 つの会社は 常に新しい技術 製品を提供し マーケットでのシェアの獲得を目指しています この技術開発と製品開発では この 2 社はある時は 他社に対して優位な技術を開発し 製品面での優位性を示すことに成功してきましたが

More information

PowerPoint Presentation

PowerPoint Presentation グローバルバンクにおける最新クラウド活用事例 AWS で実現する ハイパフォーマンスコンピューティング Pawan Agnihotri Global Financial Services Solutions Architect 2017, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 金融サービスにおけるリスク管理

More information

Microsoft PowerPoint - KSano_PCClusterシンポ_基調講演_ _配布資料.pptx

Microsoft PowerPoint - KSano_PCClusterシンポ_基調講演_ _配布資料.pptx FPGA を いた 性能計算の可能性とデータフロープログラミング 佐野 健太郎 理化学研究所計算科学研究機構プロセッサ研究チーム 東北 学 学院情報科学研究科 概要 マルチコアアーキテクチャの今後 ポストムーア時代を き延びる 法とは? FPGAを いた 性能計算 最近の話題 データフロー計算システム 密結合 FPGAクラスタ データフローに基づくプログラミング 事例 まとめ 2 ムーアの法則 微細化により

More information

IBM 次世代クラウド・プラットフォーム コードネーム “BlueMix”ご紹介

IBM 次世代クラウド・プラットフォーム コードネーム “BlueMix”ご紹介 IBM Bluemix www.bluemix.net IBM Bluemix オンラインセミナー今からはじめる Bluemix シリーズ第 3 期進化する Bluemix 第 2 回 プライベート API カタログ 日本アイ ビー エムシステムズ エンジニアリング株式会社 クラウド ソリューション 松井学 2014 年 11 月 20 日の Global アナウンス 1. DevOps に関する更なる機能拡張

More information

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2 ! OpenCL [Open Computing Language] 言 [OpenCL C 言 ] CPU, GPU, Cell/B.E.,DSP 言 行行 [OpenCL Runtime] OpenCL C 言 API Khronos OpenCL Working Group AMD Broadcom Blizzard Apple ARM Codeplay Electronic Arts Freescale

More information

Untitled

Untitled NVIDIA 世界初の 載 知能スーパーコンピュータで 律 動 の IQ をパワーアップ 新しい DRIVE PX 2- ディープラーニング機能とスーパーコンピューティング能 で 両周辺環境の検出やナビゲーションを実現 2016 年 1 月 4 日 - ネバダ州ラスベガス コンシューマー エレクトロニクス ショー (CES) - NVIDIA( 本社 : 国カリフォルニア州サンタクララ 社 兼 CEO:

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

FX10利用準備

FX10利用準備 π-computer(fx10) 利用準備 2018 年 3 月 14 日理化学研究所計算科学研究機構八木学 1 KOBE HPC Spring School 2018 2018/3/14 内容 本スクールの実習で利用するスーパーコンピュータ神戸大学 π-computer (FX10) について システム概要 ログイン準備 2 神戸大学 π-computer: システム概要 富士通 PRIMEHPC

More information

VOLTA AND TURING: ARCHITECTURE Akira Naruse, Developer Technology, 2018/9/14

VOLTA AND TURING: ARCHITECTURE Akira Naruse, Developer Technology, 2018/9/14 VOLTA AND TURING: ARCHITECTURE AND PERFORMANCE OPTIMIZATION Akira Naruse, Developer Technology, 2018/9/14 VOLTA AND TURING: ARCHITECTURE Akira Naruse, Developer Technology, 2018/9/14 For HPC and Deep Learning

More information

ディープラーニングとオープンサイエンス ~研究の爆速化が引き起こす摩擦なき情報流通へのシフト~

ディープラーニングとオープンサイエンス ~研究の爆速化が引き起こす摩擦なき情報流通へのシフト~ KITAMOTO Asanobu http://researchmap.jp/kitamoto/ KitamotoAsanob u 1 2 3 4 5 1. 2. 3. 6 Lawrence Lessig (Founder of Creative Commons), Code: And Other Laws of Cyber Space (first edition 1999) 7 NSF Data

More information

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始 2013 年 9 月 19 日 株式会社日立製作所 ビッグデータやクラウドのシステム基盤向けに処理性能を強化した BladeSymphony および HA8000 シリーズ の新製品を販売開始 運用管理工数の削減を実現するサーバ管理ソフトウェア Hitachi Compute Systems Manager を標準添付 BS520H サーバブレード / PCI 拡張ブレード HA8000/RS220-h

More information

Microsoft Word - HOKUSAI_system_overview_ja.docx

Microsoft Word - HOKUSAI_system_overview_ja.docx HOKUSAI システムの概要 1.1 システム構成 HOKUSAI システムは 超並列演算システム (GWMPC BWMPC) アプリケーション演算サーバ群 ( 大容量メモリ演算サーバ GPU 演算サーバ ) と システムの利用入口となるフロントエンドサーバ 用途の異なる 2 つのストレージ ( オンライン ストレージ 階層型ストレージ ) から構成されるシステムです 図 0-1 システム構成図

More information

スライド 1

スライド 1 計算科学が拓く世界スーパーコンピュータは何故スーパーか 学術情報メディアセンター中島浩 http://www.para.media.kyoto-u.ac.jp/jp/ username=super password=computer 講義の概要 目的 計算科学に不可欠の道具スーパーコンピュータが どういうものか なぜスーパーなのか どう使うとスーパーなのかについて雰囲気をつかむ 内容 スーパーコンピュータの歴史を概観しつつ

More information

catalog_quadro_series_2018

catalog_quadro_series_2018 Quadro 2018.0 NVIDIA Quadro NVIDIA Quadro NVIDIA NVIDIA QUADRO BREAKTHROUGH IN EVERY FORM. NVIDIA Quadro GV100VoltaGPU32GBHBM2 CUDA5120 32GB Tensor Core60Deep Learning NVLink 2 NVIDIA Quadro GV100GPU PCIe

More information

supercomputer2010.ppt

supercomputer2010.ppt nanri@cc.kyushu-u.ac.jp 1 !! : 11 12! : nanri@cc.kyushu-u.ac.jp! : Word 2 ! PC GPU) 1997 7 http://wiredvision.jp/news/200806/2008062322.html 3 !! (Cell, GPU )! 4 ! etc...! 5 !! etc. 6 !! 20km 40 km ) 340km

More information

Deep learning leaflet FA_View

Deep learning leaflet FA_View アドバンテック AI ソリューションディープラーニング 人工知能へのアプローチ AIアーキテクチャの概要 ディープ ラーニング アーキテクチャ 推論システムのシナリオ アプリケーション ソリューションについてのご紹介 AIは ロボットに人間と同様の能力を持たせるという最終的な目標を持った 機械そのものを知的な状態へと進化させる1つの科学技術です 現実には AIは人の健康 安全 生産性を向上させる方法で

More information

新技術説明会 様式例

新技術説明会 様式例 1 ロボットへの FPGA 導入を 容易化する コンポーネント技術 宇都宮大学大学院工学研究科情報システム科学専攻助教大川猛 2 従来技術とその問題点 FPGA(Field Programmable Gate Array) は 任意のディジタル論理回路をプログラム可能な LSI ソフトウェアでは時間がかかる画像認識処理等を ハードウェア化して 高速化 低消費電力化可能 問題点 FPGA 上の回路設計が難しい

More information

HPE HPC & AI フォーラム 2018 講演資料

HPE HPC & AI フォーラム 2018 講演資料 HPE HPC & AI フォーラム 2018 HPC & AI 特化型サーバー最前線! 世界初!HPC 向け Arm サーバー商用ホスティングサービスとは? プラナスソリューションズ株式会社代表取締役社長さくらインターネット株式会社営業部担当部長臼井宏典 日本ヒューレット パッカード株式会社ハイブリッド IT 製品統括本部カテゴリーマネージャー高橋健 HPC & AI に最適化された HPE 製品のポートフォリオ

More information

Presentation Title

Presentation Title ディープラーニングによる画像認識の基礎と実践ワークフロー MathWorks Japan アプリケーションエンジニアリング部アプリケーションエンジニア福本拓司 2018 The MathWorks, Inc. 1 一般的におこなわれる目視による評価 製造ライン 医用データ 作業現場 インフラ 研究データ 現場での目視 大量画像の収集 専門家によるチェック 2 スマートフォンで撮影した映像をその場で評価

More information

CUDA 9 AND MORE 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12

CUDA 9 AND MORE 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 CUDA 9 AND MORE 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 CUDA 9 の概要 VOLTA に対応 ライブラリの高速化 Tesla V100 Volta アーキテクチャ Tensor コア NVLink Independent スレッドスケジューリング cublas ( 主に DL 向け ) NPP ( 画像処理 ) cufft ( 信号処理 ) cusolver

More information

CheckPoint Endpoint Security メトロリリース製品について 株式会社メトロ 2018 年 07 月 25 日

CheckPoint Endpoint Security メトロリリース製品について 株式会社メトロ 2018 年 07 月 25 日 CheckPoint Endpoint Security メトロリリース製品について 株式会社メトロ 2018 年 07 月 25 日 製品ラインナップについて リリースするバージョンと機能について バージョン表記タイプ利 可能機能 Endpoint Security E80.83 (R77.30 サーバ ) E80.83 クライアントサーバ FDE ME Remote Access Anti-Malware

More information

表面RTX入稿

表面RTX入稿 Quadro 2019.04 NVIDIA Quadro NVIDIA Quadro NVIDIA NVIDIA QUADRO BREAKTHROUGH IN EVERY FORM. RTX NVIDIA QUADRO RTX QUADRO RTX FAMILY QUADRO RTX 6000 24 GB 10 Giga Rays/sec QUADRO RTX 4000 8 GB 6 Giga Rays/sec

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

it-ken_open.key

it-ken_open.key 深層学習技術の進展 ImageNet Classification 画像認識 音声認識 自然言語処理 機械翻訳 深層学習技術は これらの分野において 特に圧倒的な強みを見せている Figure (Left) Eight ILSVRC-2010 test Deep images and the cited4: from: ``ImageNet Classification with Networks et

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.09.10 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 1 / 59 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 2 / 59 Windows, Mac Unix 0444-J furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 3 / 59 Part I Unix GUI CUI:

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 第 15 回 PC クラスタシンポジウム Microsoft Azure for Researcher 日本マイクロソフト株式会社パブリックセクター統括本部 中田 寿穂 Agenda 1 Researcher 向けの Microsoft Azure の機能 2 ハイブリット HPC クラスタ環境を提供する HPC Pack 3 Linux も利用可能な Microsoft Azure 4 HPC 向けインスタンス

More information

TCC は Tesla Compute Cluster を意味します NVidia for Windows によって開発された特別なドライバです Windows Display Driver Model(WDDM) をバイパスし GPU が CPU とより高速で通信できるようにします TCC の欠点

TCC は Tesla Compute Cluster を意味します NVidia for Windows によって開発された特別なドライバです Windows Display Driver Model(WDDM) をバイパスし GPU が CPU とより高速で通信できるようにします TCC の欠点 Redshift ハードウェアに関する考慮事項 本資料は Redshift の Forum Hardware for Redshift に記載された以下の資料を翻訳したものです https://docs.google.com/document/d/1rp5nkypqbpm-5tlvdelgct93rjgh4vexyhzsqhr1xri/edit?usp=sharing 目次 GPU... 1 必要な

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.06.04 2018.06.04 1 / 62 2018.06.04 2 / 62 Windows, Mac Unix 0444-J 2018.06.04 3 / 62 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 2018.06.04 4 / 62 0444-J ( : ) 6 4 ( ) 6 5 * 6 19 SX-ACE * 6

More information

Microsoft PowerPoint - SWoPP2010_Shirahata

Microsoft PowerPoint - SWoPP2010_Shirahata GPU を考慮した MapReduce の タスクスケジューリング 白幡晃一 1 佐藤仁 1 松岡聡 1 2 3 1 東京工業大学 2 科学技術振興機構 3 国立情報学研究所 大規模データ処理 情報爆発時代における 大規模データ処理 気象 生物学 天文学 物理学など様々な科学技術計算での利用 MapReduce 大規模データ処理のためのプログラミングモデルデ スケーラブルな並列データ処理 GPGPU

More information

CuPy とは何か?

CuPy とは何か? GTC Japan 2018 CuPy NumPy 互換 GPU ライブラリによる Python での高速計算 Preferred Networks 取締役最高技術責任者奥田遼介 okuta@preferred.jp CuPy とは何か? CuPy とは GPU を使って NumPy 互換の機能を提供するライブラリ import numpy as np X_cpu = np.zeros((10,))

More information

ムーアの法則に関するレポート

ムーアの法則に関するレポート 情報理工学実験レポート 実験テーマ名 : ムーアの法則に関する調査 職員番号 4570 氏名蚊野浩 提出日 2019 年 4 月 9 日 要約 大規模集積回路のトランジスタ数が 18 ヶ月で2 倍になる というムーアの法則を検証した その結果 Intel 社のマイクロプロセッサに関して 1971 年から 2016 年の平均で 26.4 ヶ月に2 倍 というペースであった このことからムーアの法則のペースが遅くなっていることがわかった

More information

Jetson を活かす最強の PaaS とは 設立 :2000 年 所在地 オプティム 本店 : 佐賀県佐賀市与賀町 4 番 18 号 東京本社 : 東京都港区海岸 1 丁目 2 番 20 号 汐留ビルディング 21 階 九工大前オフィス : 福岡県飯塚市川津 680-41 飯塚研究開発センター 103 号室 従業員数 :120 名 ( 他 臨時従業員数 60 名 ) 平均年齢 33.3 歳 スタッフの8

More information

2017 (413812)

2017 (413812) 2017 (413812) Deep Learning ( NN) 2012 Google ASIC(Application Specific Integrated Circuit: IC) 10 ASIC Deep Learning TPU(Tensor Processing Unit) NN 12 20 30 Abstract Multi-layered neural network(nn) has

More information

ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン

ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン ハンズオンラボ DIGITS による物体検出入門 山崎和博 ディープラーニング ソリューションアーキテクト エヌビディア ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン ディープラーニングとは 様々な分野でディープラーニングを応用 インターネットとクラウド 医学と生物学 メディアとエンターテイメント セキュリティと防衛 機械の自動化

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2016.06.06 2016.06.06 1 / 60 2016.06.06 2 / 60 Windows, Mac Unix 0444-J 2016.06.06 3 / 60 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 0444-J 2016.06.06 4 / 60 ( : ) 6 6 ( ) 6 10 6 16 SX-ACE 6 17

More information

GPUを用いたN体計算

GPUを用いたN体計算 単精度 190Tflops GPU クラスタ ( 長崎大 ) の紹介 長崎大学工学部超高速メニーコアコンピューティングセンターテニュアトラック助教濱田剛 1 概要 GPU (Graphics Processing Unit) について簡単に説明します. GPU クラスタが得意とする応用問題を議論し 長崎大学での GPU クラスタによる 取組方針 N 体計算の高速化に関する研究内容 を紹介します. まとめ

More information

HPC143

HPC143 研究背景 GPUクラスタ 高性能 高いエネルギー効率 低価格 様々なHPCアプリケーションで用いられている TCA (Tightly Coupled Accelerators) 密結合並列演算加速機構 筑波大学HA-PACSクラスタ アクセラレータ GPU 間の直接通信 低レイテンシ 今後のHPCアプリは強スケーリングも重要 TCAとアクセラレータを搭載したシステムに おけるプログラミングモデル 例

More information

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1 GPU 4 2010 8 28 1 GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1 Register & Shared Memory ( ) CPU CPU(Intel Core i7 965) GPU(Tesla

More information

07-二村幸孝・出口大輔.indd

07-二村幸孝・出口大輔.indd GPU Graphics Processing Units HPC High Performance Computing GPU GPGPU General-Purpose computation on GPU CPU GPU GPU *1 Intel Quad-Core Xeon E5472 3.0 GHz 2 6 MB L2 cache 1600 MHz FSB 80 GFlops 1 nvidia

More information

iphone GPGPU GPU OpenCL Mac OS X Snow LeopardOpenCL iphone OpenCL OpenCL NVIDIA GPU CUDA GPU GPU GPU 15 GPU GPU CPU GPU iii OpenMP MPI CPU OpenCL CUDA OpenCL CPU OpenCL GPU NVIDIA Fermi GPU Fermi GPU GPU

More information

untitled

untitled 3 1968 19681978 B RC11 1979 19791220121999 801 1985 1985100 40 1987 1987TZ 802900g 60 1991 NTT 19911999 150 cc230g 4 1993 1999 19932012 9600bps 0.01 Mbps* * 2001 20011064384 kbps 2006 2006 3.6Mbps14Mbps

More information

HPC (pay-as-you-go) HPC Web 2

HPC (pay-as-you-go) HPC Web 2 ,, 1 HPC (pay-as-you-go) HPC Web 2 HPC Amazon EC2 OpenFOAM GPU EC2 3 HPC MPI MPI Courant 1 GPGPU MPI 4 AMAZON EC2 GPU CLUSTER COMPUTE INSTANCE EC2 GPU (cg1.4xlarge) ( N. Virgina ) Quadcore Intel Xeon 5570

More information

New Interface Photo by hiroohi http://flickr.com/photos/rainboweyes/2747484161/ New Standard Photo by hiroohi http://flickr.com/photos/rainboweyes/2747484331/ New Technology Photo

More information

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2016-HPC-155 No /8/8 1,a) Convolutional Neural Network (CNN) CNN Stochastic Gradient Descent

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2016-HPC-155 No /8/8 1,a) Convolutional Neural Network (CNN) CNN Stochastic Gradient Descent 1,a) 1 3 3 1 Convolutional Neural Network (CNN) CNN Stochastic Gradient Descent (SGD) SGD GPU CNN SGD SGD CNN SPRINT CNN TSUBAME-KFC/DL 116 CNN 8% 1. Deep Learning (DL) Deep Neural Network (DNN) [1] []

More information

main.dvi

main.dvi PC 1 1 [1][2] [3][4] ( ) GPU(Graphics Processing Unit) GPU PC GPU PC ( 2 GPU ) GPU Harris Corner Detector[5] CPU ( ) ( ) CPU GPU 2 3 GPU 4 5 6 7 1 toyohiro@isc.kyutech.ac.jp 45 2 ( ) CPU ( ) ( ) () 2.1

More information

スライド 1

スライド 1 GPU クラスタによる格子 QCD 計算 広大理尾崎裕介 石川健一 1.1 Introduction Graphic Processing Units 1 チップに数百個の演算器 多数の演算器による並列計算 ~TFLOPS ( 単精度 ) CPU 数十 GFLOPS バンド幅 ~100GB/s コストパフォーマンス ~$400 GPU の開発環境 NVIDIA CUDA http://www.nvidia.co.jp/object/cuda_home_new_jp.html

More information

(速報) Xeon E 系モデル 新プロセッサ性能について

(速報) Xeon E 系モデル 新プロセッサ性能について ( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690

More information

スライド 1

スライド 1 ディープラーニングへの Ruby 適用試行に関する報告 2017 年 2 月 15 日 Japan OSS Promotion Forum アプリケーション部会 サイオステクノロジー株式会社 手塚拓 0 目次 1. ディープラーニングとは 2. ディープラーニングに Ruby を利用する価値 3. Ruby でディープラーニング の問題点 4. 現状報告 I. 予備知識 II. 検証 III. 報告

More information

人工知能(AI)時代、企業は、何をすべきか?

人工知能(AI)時代、企業は、何をすべきか? 情報テクノロジーの進展がもたらす近未来社会の姿を考える AI AI AI: artificial intelligence 1983 8 nontenure-track AI AI AI 1983 AI A* A star Dijkistra Prolog (deductive method) 3 3 A B B C A C 2 3 Prolog 2 2 man(socrates). mortal(x)

More information

Rev.6.0 Autodesk Certified Workstations HP Z840 HP Z8 G4 Dell T7920 と TITAN 240 G3 TITAN 240 G4 システム構成比較

Rev.6.0 Autodesk Certified Workstations HP Z840 HP Z8 G4 Dell T7920 と TITAN 240 G3 TITAN 240 G4 システム構成比較 Rev.6.0 Autodesk Certified Workstations HP Z840 HP Z8 G4 Dell T7920 と TITAN 240 G3 TITAN 240 G4 システム構成比較 HP Z840 スロット構成と配置 Dual GPU 構成 (CPU は Dual 構成のみ ) PCIe 3.0 x4 (Link x4) 1 Mellanox FDR 10Gb/IB ネットワークカード

More information