PowerPoint プレゼンテーション

Size: px

Start display at page:

Download "PowerPoint プレゼンテーション"

ゆいとじゅふく
3 years ago
Views:

1 HPC ソリューションの紹介と技術トピックス ~ エクサスケールコンピュータを目指して ~ 基盤イノベーション技術部中谷光裕 1

2 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 2

3 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 3

1.1 HPC の概要 HPC(High Performance Computing) とは大規模な解析対象 ( 地球全球

京コンピュータ:http://www.aics.riken.jp/jp/k/about.

jp/j/about/press_release/20101117/(JAMSTEC) TSUBAME2.

html( 東京工業大学 ) ヘリコプタ運転時に発生する音のシミュレーション:http://www.gasdecool.

4 1.1 HPC の概要 HPC(High Performance Computing) とは大規模な解析対象 ( 地球全球多自由度系ビッグデータなど ) に対する数値計算処理およびこれら処理の高度化効率化を目的とする学問分野画像出典情報京コンピュータ: 理化学研究所 ) 地球シミュレータ: TSUBAME2.5: 東京工業大学 ) ヘリコプタ運転時に発生する音のシミュレーション: ガス冷暖房推進室 ) 全球シミュレーション 4 : 理化学研究所 )

1.1 HPC の概要 HPC(High Performance Computing) とは大規模な解析対象 ( 地球全球多自由度系ビッグデータなど ) に対する数値計算処理およびこれら処理の高度化効率化を目的とする学問分野気象予報地球全球シミュレーションエルニーニョ影響予測

5 1.1 HPC の概要 HPC(High Performance Computing) とは大規模な解析対象 ( 地球全球多自由度系ビッグデータなど ) に対する数値計算処理およびこれら処理の高度化効率化を目的とする学問分野気象予報地球全球シミュレーションエルニーニョ影響予測熱帯域のマッデンジュリアン振動を再現! メッシュ高密度化ゲリラ雷雨や竜巻など極限定エリアの気象現象の把握が可能に!! 5 画像出典情報大気海洋結合モデル : いのちを守る WEB.11)

数週間など!) に短縮オーダーメイド医療予測医療! 6 画像出典情報トランスポーターと DNA ヒストン複合系 :http://www.islim.

ac.jp/event/bio_expert/2013/program/bioinfo.

6 1.1 HPC の概要 HPC(High Performance Computing) とは大規模な解析対象 ( 地球全球多自由度系ビッグデータなど ) に対する数値計算処理およびこれら処理の高度化効率化を目的とする学問分野医療タンパク質構造解析血流シミュレーション数か月から数年単位の実験期間を大幅 ( 数週間など!) に短縮オーダーメイド医療予測医療! 6 画像出典情報トランスポーターと DNA ヒストン複合系 : データベース検索と配列解析 : ( 横浜市立大学生命医科学研究科 ) 血小板一次凝集に向けた解析の模式図 :

7 世界での取り組みアメリカ中国 1.1 HPC の概要 1991 年 HPC 法策定国家的投資と開発 Sequoia, Titan など世界トップシステムを開発世界のスパコンの総計算能力の半分を占める 2013 年 6 月世界のスパコンの総計算能力の 20% を占める 2013 年 6 月 ~2014 年 6 月スパコン世界一位独自プロセッサ開発 HPC 重点投資ヨーロッパ 2008 年から欧州各国のスパコンを欧州全体の計算基盤として利用 (PRACE) 2014 年から HPC 関連予算の倍増と取組強化を計画 7

8 日本での取り組み 1.1 HPC の概要 2011 年 6 月 11 月京がスパコン世界 1 位 2004 年 6 月地球シミュレータの世界 1 位から 7 年ぶり HPCI( ハイパフォーマンスコンピューティングインフラ ) の推進京と全国の大学や研究機関に設置されたスパコンを高速ネットワークで結び多様なユーザーニーズに応える革新的な教養計算環境を実現する基盤システム産学連携の推進世界的な割合 ( 性能台数 ) は減少傾向大学などの学術施設におけるスパコンの性能が世界に比べて低い傾向 8

9 スーパーコンピュータ ( 参考 ) スーパーコンピュータ一定以上の性能を持つ計算機もしくは計算機クラスタ日本では 50TFlop/s 以上を政府調達の必要なスパコンと定義される Rank Name Computer 1 Total Rmax 専用機 ( 京 Cray 等 ) によるスパコンと Cores IA(GFlop/s) サーバを組合せたス (GFlop/s) (kw) TH-IVB-FEP Cluster, Intel Xeon E5- Tianhe-2 パコン (TSUBAME C 2.200GHz, 等 ) が存在 TH Express-2, 2 Titan (MilkyWay-2) 3 Sequoia 4 K Computer 5 Mira Intel Xeon Phi 31S1P Cray XK7, Opteron C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x 33PFlop/s 技術展開モデルは専用機 IA サーバの双方向あり BlueGene/Q, Power BQC 16C 1.60 GHz, Custom K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect BlueGene/Q, Power BQC 16C 1.60GHz, Custom Rpeak Power 3,120,000 33,862,700 54,902,400 17, ,640 17,590,000 27,112,550 8,209 1,572,864 17,173,224 20,132,659 7, ,024 10,510,000 11,280,384 12, ,432 8,586,612 10,066,330 3,945 9 画像出典情報 Performance Development: Performance Development)

10 GPGPU XeonPhi ( 参考 )HPC における H/W CPU ManyCore GPU や XeonPhi 等のアクセラレータ行列演算などを高速に実現 InfiniBand 高速なインターコネクト現在 FDR(56Gbps) まで FileSystem GPFS や Lustre 等の分散共有ファイルシステムが主流 HPSS など大容量特化システムも 10

によって使い分けが必要 CUDA 例 :CUDA Fortran:PGI Compiler XeonPhi:Intel

11 ジョブスケジューラ ( 参考 )HPC における M/W & S/W 計算機のリソース及びプログラムの実行スケジュールを管理 LSF や PBS などからシステム規模や管理するリソースに応じた適切な選択が必要 Compiler 言語や H/W によって使い分けが必要 CUDA 例 :CUDA Fortran:PGI Compiler XeonPhi:Intel Compiler GPU による計算を行うために必要なフリーライブラリ MPI 並列コンピューティングを実行するために標準化された規格 11

12 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 12

13 1.2 HPC の歴史スーパーコンピュータの歴史は短く 30 年スーパーコンピュータの世界ランキングである Top500 は始まって 20 年コンピュータの歴史でよく話題に上る ENIAC は 70 年前 (1944 年 ) 最初のランキングで 1 位になったスパコンは 1024 プロセッサ 59.7GFlop/s 現在のワークステーションと同程度日本で初めてスパコン 1 位になったのは 1996 年 HITACHI 製の東京大学のスパコン 2002 年には地球シミュレータが 2 位に 5 倍の性能差で 1 位その後 5 回連続で世界 1 位 2011 年には 10PFlop/s の高性能で京が世界 1 位に! 13

14 1.2 HPC の歴史地球 HITACTI シミュレータ SR2201/1024 京全世界にスパコン性能シェアはアメリカがトップ ( 約 50%) 日本のシェアは減少傾向 (30% 10%) 新規スパコンが完成した際には一時的に増加 14

15 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 15

16 1.3 HPC の有用性シミュレーションは理論実験と並ぶ第 3の研究手法気象気候地震などの実際には実験できない現象の研究高温高圧微小スケールなどの極限環境での現象の研究銀河の形成といった実時間では再現できない現象の研究 etc 理論の理解未来未知の予測! 16

17 京の成果 1.3 HPC の有用性 2011 年京によるシリコンナノワイヤの第一原理計算がゴードンベル賞を受賞世界で初めてナノレベルの高精度シミュレーションを可能に! 従来システムで 30 年以上京で 1 週間 2012 年約 2 兆個のダークマター粒子の宇宙初期における重力進化の計算がゴードンベル賞を受賞世界最大規模である数兆個に及ぶダークマター粒子の重力進化を計算! アプリケーションも他国の研究グループと比べ 6 倍程効率が高い 17

18 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 18

19 そんな HPC の世界でエクサは 2. エクサの HPC HPC HPC に特化したシステム構築プログラムの高速化最適化チューニング GPGPU システム運用リソース管理 XeonPhi 19

20 年月ビジネス概要 1980 年代後半 ~ 1990 年代中盤 1990 年代後半 ~ 2000 年代後半 2.1 エクサの HPC の歴史シリコングラフィックス社のグラフィックスワークステーション販売ビジネスコンベックス社のミニスーパーコンピュータ販売ビジネス地球シミュレータ利用に向けた大気海洋気象シミュレーションソフトウェアの並列化プロジェクトに参画超並列計算機クラスター型計算機システムの実用普及グラフィックス処置の高度化に関してお客様をリードクレイリサーチ社のベクトル型スーパーコンピュータの 10 分の 1 の価格で半分の性能を実現し中規模高速計算の分野で活躍プログラムのベクトル高速化に関してお客様へのサポートを実施コンベックス社に SE を派遣しリアルタイム OS の共同開発も実施シリコングラフィックス社コンベックス /HP 社の超並列システムの販売並列処理を用いたプログラム高速化に関してお客様へのサポートを実施 20 スパコンセンターの運用サポート業務 2010 年代 IBM HW を用いた HPC システムを積極展開ビッグデータソリューションの展開開始プログラム高速化対応ビジネスの展開障害対応だけでなく大規模 HPC システムとしての運用に合わせた改善を提案具現化 GPGPU の黎明期に実システムでユーザをサポート高速共有ファイルシステムの構築中規模 ~ 超大規模 HSM システムの構築

21 2.1 エクサの HPC の歴史 NKK NK-EXA 時代にはお客様や内部向けに技術誌も発刊! 画像出典情報 SPP 技術情報誌 Octave Vol.16(NKK 情報システム部 1999 年 8 月発行 ) Route 17(NK-EXA)

22 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 22

PBS コンパイラ :Intel PGI 高速化 : スレッド並列 MPI 並列大規模化 : 省メモリ領域分割サポート : プログラム作成システム利用マニュアル作成

23 2.2 エクサの HPC ソリューションとビジネス体系前述分野を対象としたソリューションを HPC ソリューションと呼称スーパーコンピュータ提案プログラムチューニングファイルシステム構築 etc 計算クラスタプログラムエンドユーザ ManyCore:GPU XeonPhi インターコネクト :InfiniBand ジョブスケジューラ :LSF PBS コンパイラ :Intel PGI 高速化 : スレッド並列 MPI 並列大規模化 : 省メモリ領域分割サポート : プログラム作成システム利用マニュアル作成ファイルシステム高速分散ファイルシステム :GPFS Lustre 階層型ストレージ :GPFS+TSM HPSS 対象顧客 : 民間製造業各種研究機関大学 ( 基盤センター ~ 研究室まで ) 他 23

24 2.2 エクサの HPC ソリューションとビジネス体系設備工事からお客様プログラムのチューニングまでそうだ高速処理しようと思った全ての方へ設計フェーズ導入フェーズ運用フェーズ導入前コンサルティングボトルネック調査ベンチマークバックアップ計画設備工事からアプリ高速化まで並列計算ライブラリジョブスケジューラ等設計導入調整高速ネットワーク設計設定 ISV アプリケーションユーザプログラム実行環境最適化 F/W ドライバ OS 基盤設計設定大規模ファイルシステム設計設定電源空調防音耐震 / 免震工事アクセラレータ (GPGPU など ) 保守サポート障害切り分け運用支援導入後コンサルティング 24

25 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 25

26 2.3 エクサの HPC スキル ~ ジョブスケジューラ ~ ジョブスケジューラ HPC で利用しているシステムのリソースを最大限有効に活用するためジョブを管理 LSF, PBS Pro, Univa Grid Engine, SLURM 26

27 2.3 エクサの HPC スキル ~ ジョブスケジューラ ~ ジョブスケジョブスケジューラがない場合 CPU 10 個で計算開始 ~ CPU CPU CPU CPU CPU CPU CPU CPU 大容量メモリ消費するアプリを 1 ノード内で計算開始 ~ Memory Memory Memory Memory GPGPU 使って高速計算するぜ ~ CPU CPU CPU CPU CPU CPU CPU CPU ユーザが好きなところで計算するためリソースが衝突! Memory Memory Memory GPGPU Memory GPGPU 27

28 2.3 エクサの HPC スキル ~ ジョブスケジューラ ~ ジョブスケジョブスケジューラを導入した場合 CPU 10 個で計算開始 ~ CPU CPU CPU CPU CPU CPU CPU CPU 大容量メモリ消費するアプリを 1 ノード内で計算開始 ~ Memory Memory Memory Memory GPGPU 使って高速計算するぜ ~ CPU CPU CPU CPU CPU CPU CPU CPU ジョブスケジューラが上手にリソースを管理してくれる! Memory Memory Memory GPGPU Memory GPGPU 28

29 2.3 エクサの HPC スキル ~ チューニング ~ 普通に作ったプログラムでは高性能なハードウェア性能を使いこなせない! メモリのキャッシング CPU の複数コア複数ノードにまたがる計算 etc スパコンで計算開始 ~ CPU CPU CPU CPU CPU CPU CPU CPU スパコンで計算開始 ~ Memory Memory Memory Memory GPGPU 使って高速計算するぜ ~ ユーザが少しずつ使うだけではリソースがもったいない! CPU CPU Memory CPU CPU 未使用リソース Memory CPU CPU Memory GPGPU CPU CPU Memory GPGPU 29

( 参考 )MPI(Message Passing Interface) 並列コンピューティング利用するための標準化された規格 MPI ライブラリ (OpenMPI MVAPICH など ) が必要プログラム内に開始終了送信受信などの指示を記述プロセス間でデータをやり取りして計算処理を分割プロセス 0 プロセス 1 プロセス 2 /* Start up MPI */

30 ( 参考 )MPI(Message Passing Interface) 並列コンピューティング利用するための標準化された規格 MPI ライブラリ (OpenMPI MVAPICH など ) が必要プログラム内に開始終了送信受信などの指示を記述プロセス間でデータをやり取りして計算処理を分割プロセス 0 プロセス 1 プロセス 2 /* Start up MPI */ MPI_Init(&argc, &argv); /* Find out process rank */ MPI_Comm_rank(MPI_COMM_WORLD, &my_rank); /* Find out number of processes */ MPI_Comm_size(MPI_COMM_WORLD, &p); 30 プロセス 3 プロセス 4 プロセス 5 /* Shut down MPI */ MPI_Finalize();

31 ( 参考 )OpenMP 並列コンピューティング利用するための規格 OpenMP 対応のコンパイラが必要 (GCC も対応 ) プログラム内に並列化開始並列化終了同期などの指示をコメント形式で記述スレッド間で計算処理を分散 CPU スレッド 0 スレッド 1 Core Core スレッド2 スレッド3 Core Core int main(int argc, char *argv[]) { int i; #pragma omp parallel for for(i = 0; i <= 10000; i++) { // ( 並列処理させたいプログラム ) } } 31

32 2.3 エクサの HPC スキル ~ チューニング ~ A 大学様案件地震後の耐震性を解析するプログラムが対象スーパーコンピュータ上 (16 コア 8 ノード =128 並列 ) で高速に計算できるようにプログラムをチューニングスレッド並列 MPI 並列ライブラリ利用 32

33 B 社様案件 2.3 エクサの HPC スキル ~ チューニング ~ 河川氾濫解析用プログラムが対象お客様のワークステーション環境で高速に計算できるようにプログラムをチューニング高速化予測スレッド並列 33

34 2.3 エクサの HPC スキル ~GPU/XeonPhi 対応 ~ ManyCore 1 つのプロセッサデバイスの中に複数コアを搭載したデバイス GPU: 本来画像処理向けに利用されるデバイスを計算に利用最新の K40 では 2880 コア 1.43TFlop/s XeonPhi:Intel 社から販売されている高速計算用デバイス 7120D では 61 コア 1.2TFlop/s GPGPU XeonPhi 34

( 参考 )GPGPU&CUDA GPGPU GPU を汎用的な計算に利用する方法及びデバイスを指すフリーの nvidia 製 GPGPU ライブラリ CUDA Feature Tesla K40 Tesla K20 倍精度 1.43 Tflops 1.17 Tflops 単精度 4.29 Tflops 3.

35 ( 参考 )GPGPU&CUDA GPGPU GPU を汎用的な計算に利用する方法及びデバイスを指すフリーの nvidia 製 GPGPU ライブラリ CUDA Feature Tesla K40 Tesla K20 倍精度 1.43 Tflops 1.17 Tflops 単精度 4.29 Tflops 3.52 Tflops メモリバンド幅 (ECC off) 288 GB/sec 208 GB/sec Memory 12 GB 5 GB CUDA cores 画像出典情報 GK110 Block: GK110-Architecture-Whitepaper.pdf(WhitePaper NVIDIA s Next Generation CUDA Compute Architecture:Kepler)

36 ( 参考 )GPGPU&CUDA GPGPU GPU を汎用的な計算に利用する方法及びデバイスを指すフリーの nvidia 製 GPGPU ライブラリ CUDA 36 画像出典情報 CUDA Sample: PARALLEL COMPUTING)

2.3 エクサの HPC スキル ~XeonPhi~ Intel が販売しているメニーコアプロセッサ Larrabee から派生した MIC アーキテクチャ x86 互換のコプロセッサを搭載しているため x86 CPU 向けのプログラムをほぼそのまま利用可能実行ファイルを Phi に転送するネイティブ実行と実行時に指定部のみ Phi に渡すオフロード実行がある

37 2.3 エクサの HPC スキル ~XeonPhi~ Intel が販売しているメニーコアプロセッサ Larrabee から派生した MIC アーキテクチャ x86 互換のコプロセッサを搭載しているため x86 CPU 向けのプログラムをほぼそのまま利用可能実行ファイルを Phi に転送するネイティブ実行と実行時に指定部のみ Phi に渡すオフロード実行がある Intel Compiler が必須画像出典情報 Xeon Phi Block Diagram: Higher Efficiency 37 for Parallel Processing)

38 2.3 エクサの HPC スキル ~GPU/XeonPhi 対応 ~ C 様案件別案件にて高速化していたプログラムでの XeonPhi での検証を実施! 1. プログラム全体の X64 化 ( 利用ライブラリ含む ) 2.offload プラグマを利用したオフロード実行手順検証 3. プログラム全体の Linux 対応化 ( 利用ライブラリ含む ) 4.Native 実行による性能計測 38

39 2.3 エクサの HPC スキル HPC 技術紹介 ~HSM~ HSM 階層型のストレージ管理利用例 : 頻繁に使うデータのみを高速ディスクにおき, 頻度の低いデータは低速の大容量ストレージにおくことでディスク利用の効率化 GPFS/TSM 利用頻度の低いデータをテープ装置へ移すことで高速アクセス領域を有効利用ユーザからは単一のファイルシステムとして利用可能 39

40 2.3 エクサの HPC スキル HPC 技術紹介 ~HSM~ HSM 階層型のストレージ管理利用例 : 頻繁に使うデータのみを高速ディスクにおき, 頻度の低いデータは低速の大容量ストレージにおくことでディスク利用の効率化 HPSS ディスクとテープの一体型大規模ストレージシステムディスク装置のキャッシュ利用やテープにより高速かつ大規模なシステムを実現 40

ハードウェア管理障害切り分けパーツ交換管理ノード障害時における継続運用処理などのあらゆる障害対応窓口を完遂ジョブスケジューラ運用支援機能追加 1,000

41 2.3 エクサの HPC スキル HPC 技術紹介 ~ 運用 ~ 某スパコン運用支援案件一部アクセラレータ搭載の 700 台以上の計算ノード (100TFlop/s 以上 ) 1.6PB の大規模高速分散ストレージ InfiniBand による高速通信環境により構成された大規模スパコンシステムの運用支援を提供! ハードウェア管理障害切り分けパーツ交換管理ノード障害時における継続運用処理などのあらゆる障害対応窓口を完遂ジョブスケジューラ運用支援機能追加 1,000 人以上の利用者を抱えるシステムにおいて 20 種類のアプリケーションやユーザプログラムを最適なノードへ投入されるよう設定柔軟な課金設計各種イベント等への対応法定停電イベント時スケジュール調整停電前後の停止起動における分単位のスケジュール立案および関係各所への調整バックアップ機能追加作業 41

42 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 42

43 3.1 エクサスケールスーパーコンピュータエクサ 10の18 乗を示す単位京の100 倍の性能! 2020 年を目指して各国開発推進中実現に向けての課題消費電力の増大現行の方法ではスパコン設備の隣に発電所が必要!? アルゴリズム / アプリケーションの並列化規模が大きくノード間通信にかかる処理時間が大きなボトルネックになってしまう! 膨大な計算結果データのハンドリング計算結果が膨大な量になるため I/O 処理がボトルネックとなる可能性が高い! 結果の把握や成果の確認のためのシステムが必要! 43

44 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 44

45 本日のまとめ 3.2 エクサの HPC の目指すもの HPC 分野の研究は将来的な生活の発展や危機管理に利用されているエクサでは HW から SW まで幅広い技術領域で HPC 分野に貢献している今後のエクサの HPC ビジネス展開多方面へのビジネス展開を目指す! HPC における技術をその他分野のシステムに応用する! ex. ビッグデータグリッドコンピューティングエクサスケールの実現に向けて新規技術を取り込んだチャレンジ! 45

46 年 6 月発表最新スパコン情報 HPC に関する大きなシンポジウムが年に 2 回 (ISC/SC) 実施 Top500 LINPACK による Flop/s で比較 3 期連続で中国のスパコンが世界 1 位トップ 5 はスパコン専用機が独占 Rank Name Computer 1 2 Titan Tianhe-2 (MilkyWay-2) 3 Sequoia 4 K Computer 5 Mira TH-IVB-FEP Cluster, Intel Xeon E C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P Cray XK7, Opteron C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x BlueGene/Q, Power BQC 16C 1.60 GHz, Custom K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect BlueGene/Q, Power BQC 16C 1.60GHz, Custom Total Cores Rmax (GFlop/s) Rpeak (GFlop/s) Power (kw) 3,120,000 33,862,700 54,902,400 17, ,640 17,590,000 27,112,550 8,209 1,572,864 17,173,224 20,132,659 7, ,024 10,510,000 11,280,384 12, ,432 8,586,612 10,066,330 3,945

47 Green 年 6 月発表最新スパコン情報ワットあたりの Flop/s で比較東工大の油冷式スパコン :TSUBAME-KFC が世界 1 位 Rank MFLOPS/W Site* Computer* 1 4, GSIC Center, Tokyo Institute of Technology 2 3, Cambridge University 3 3, , SURFsara 5 3, Center for Computational Sciences, University of Swiss National Supercomputing Centre (CSCS) TSUBAME-KFC - LX 1U-4GPU/104Re- 1G Cluster, Intel Xeon E5-2620v2 6C 2.100GHz, Infiniband FDR, NVIDIA K20x Wilkes - Dell T620 Cluster, Intel Xeon E5-2630v2 6C 2.600GHz, Infiniband FDR, NVIDIA K20 HA-PACS TCA - Cray 3623G4-SM Cluster, Intel Xeon E5-2680v2 10C 2.800GHz, Infiniband QDR, NVIDIA K20x Cartesius Accelerator Island - Bullx B515 cluster, Intel Xeon E5-2450v2 8C 2.5GHz, InfiniBand 4 FDR, Nvidia K40m Piz Daint - Cray XC30, Xeon E C 2.600GHz, Aries interconnect, NVIDIA K20x Total Power (kw) ,

48 Graph 年 6 月発表最新スパコン情報大規模データ解析性能による比較京が実用計算分野のランキングでは世界 1 位! Rank Machine Installation Site Number of nodes Number of cores Problem Scale GTEPS C_time (sec) 1 K computer RIKEN Advanced Institute for Computational Science (AICS) 65, , , DOE/NNSA/LLNL Lawrence Livermore Sequoia National Laboratory 65,536 1,048, ,599 1,357 3 DOE/SC/Argonne Argonne National National Laboratory Laboratory Mira 49, , , JUQUEEN Forschungszentrum Juelich (FZJ) 16, , , Fermi CINECA 8, , ,

49 免責事項 Intel Xeon Xeon Phi は米国およびその他の国におけるインテルコーポレーションの商標または登録商標です Cray Cray XK7 Cray Gemini interconnect は米国その他の国における Cray Inc. の商標または登録商標です PBS は米国およびその他の国における Altair Engineering, Inc の商標または登録商標です IBM Blue Gene Power BQC GPFS LSF は米国およびその他の国における International Business Machines Corporation の商標または登録商標です SPARC64 は米国およびその他の国における SPARC International, Inc. の商標または登録商標です NVIDIA CUDA は米国およびその他の国における NVIDIA Corporation の商標または登録商標です InfiniBand は米国またはその他の国における InfiniBand Trade Association の商標またはサービスマークですその他の社名製品名などは一般に各社の商標または登録商標です 49

50 ご清聴ありがとうございました 50

GPU n Graphics Processing Unit CG CAD

GPU 2016/06/27 第 20 回 GPU コンピューティング講習会 ( 東京工業大学 ) 1 GPU n Graphics Processing Unit CG CAD www.nvidia.co.jp www.autodesk.co.jp www.pixar.com GPU n GPU ü n NVIDIA CUDA ü NVIDIA GPU ü OS Linux, Windows, Mac