PowerPoint プレゼンテーション

Size: px
Start display at page:

Download "PowerPoint プレゼンテーション"

Transcription

1 HPC ソリューションの紹介と 技術トピックス ~ エクサスケールコンピュータを目指して ~ 基盤イノベーション技術部 中谷光裕 1

2 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 2

3 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 3

4 1.1 HPC の概要 HPC(High Performance Computing) とは 大規模な解析対象 ( 地球全球 多自由度系 ビッグデータなど ) に対する数値計算処理 およびこれら処理の高度化 効率化を目的とする学問分野 画像出典情報 京コンピュータ: 理化学研究所 ) 地球シミュレータ: TSUBAME2.5: 東京工業大学 ) ヘリコプタ運転時に発生する音のシミュレーション: ガス冷暖房推進室 ) 全球シミュレーション 4 : 理化学研究所 )

5 1.1 HPC の概要 HPC(High Performance Computing) とは 大規模な解析対象 ( 地球全球 多自由度系 ビッグデータなど ) に対する数値計算処理 およびこれら処理の高度化 効率化を目的とする学問分野 気象予報地球全球シミュレーション エルニーニョ影響予測 熱帯域のマッデン ジュリアン振動を再現! メッシュ高密度化 ゲリラ雷雨や竜巻など 極限定エリアの気象現象の把握が可能に!! 5 画像出典情報 大気海洋結合モデル : いのちを守る WEB.11)

6 1.1 HPC の概要 HPC(High Performance Computing) とは 大規模な解析対象 ( 地球全球 多自由度系 ビッグデータなど ) に対する数値計算処理 およびこれら処理の高度化 効率化を目的とする学問分野 医療タンパク質構造解析 血流シミュレーション 数か月から数年単位の実験期間を大幅 ( 数週間など!) に短縮 オーダーメイド医療 予測医療! 6 画像出典情報 トランスポーターと DNA ヒストン複合系 : データベース検索と配列解析 : ( 横浜市立大学生命医科学研究科 ) 血小板一次凝集に向けた解析の模式図 :

7 世界での取り組み アメリカ 中国 1.1 HPC の概要 1991 年 HPC 法策定国家的投資と開発 Sequoia, Titan など世界トップシステムを開発 世界のスパコンの総計算能力の半分を占める 2013 年 6 月世界のスパコンの総計算能力の 20% を占める 2013 年 6 月 ~2014 年 6 月スパコン世界一位 独自プロセッサ開発 HPC 重点投資 ヨーロッパ 2008 年から欧州各国のスパコンを欧州全体の計算基盤として利用 (PRACE) 2014 年から HPC 関連予算の倍増と取組強化を計画 7

8 日本での取り組み 1.1 HPC の概要 2011 年 6 月 11 月京がスパコン世界 1 位 2004 年 6 月地球シミュレータの世界 1 位から 7 年ぶり HPCI( ハイパフォーマンスコンピューティングインフラ ) の推進 京 と全国の大学や研究機関に設置されたスパコンを高速ネットワークで結び 多様なユーザーニーズに応える革新的な教養計算環境を実現する基盤システム 産学連携の推進 世界的な割合 ( 性能 台数 ) は減少傾向 大学などの学術施設におけるスパコンの性能が世界に比べて低い傾向 8

9 スーパーコンピュータ ( 参考 ) スーパーコンピュータ 一定以上の性能を持つ計算機もしくは計算機クラスタ 日本では 50TFlop/s 以上を政府調達の必要なスパコンと定義される Rank Name Computer 1 Total Rmax 専用機 ( 京 Cray 等 ) によるスパコンと Cores IA(GFlop/s) サーバを組合せたス (GFlop/s) (kw) TH-IVB-FEP Cluster, Intel Xeon E5- Tianhe-2 パコン (TSUBAME C 2.200GHz, 等 ) が存在 TH Express-2, 2 Titan (MilkyWay-2) 3 Sequoia 4 K Computer 5 Mira Intel Xeon Phi 31S1P Cray XK7, Opteron C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x 33PFlop/s 技術展開モデルは専用機 IA サーバの双方向あり BlueGene/Q, Power BQC 16C 1.60 GHz, Custom K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect BlueGene/Q, Power BQC 16C 1.60GHz, Custom Rpeak Power 3,120,000 33,862,700 54,902,400 17, ,640 17,590,000 27,112,550 8,209 1,572,864 17,173,224 20,132,659 7, ,024 10,510,000 11,280,384 12, ,432 8,586,612 10,066,330 3,945 9 画像出典情報 Performance Development: Performance Development)

10 GPGPU XeonPhi ( 参考 )HPC における H/W CPU ManyCore GPU や XeonPhi 等のアクセラレータ 行列演算などを高速に実現 InfiniBand 高速なインターコネクト 現在 FDR(56Gbps) まで FileSystem GPFS や Lustre 等の分散共有ファイルシステムが主流 HPSS など大容量特化システムも 10

11 ジョブスケジューラ ( 参考 )HPC における M/W & S/W 計算機のリソース及びプログラムの実行スケジュールを管理 LSF や PBS などからシステム規模や管理するリソースに応じた適切な選択が必要 Compiler 言語や H/W によって使い分けが必要 CUDA 例 :CUDA Fortran:PGI Compiler XeonPhi:Intel Compiler GPU による計算を行うために必要なフリーライブラリ MPI 並列コンピューティングを実行するために標準化された規格 11

12 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 12

13 1.2 HPC の歴史 スーパーコンピュータの歴史は短く 30 年 スーパーコンピュータの世界ランキングである Top500 は始まって 20 年 コンピュータの歴史でよく話題に上る ENIAC は 70 年前 (1944 年 ) 最初のランキングで 1 位になったスパコンは 1024 プロセッサ 59.7GFlop/s 現在のワークステーションと同程度 日本で初めてスパコン 1 位になったのは 1996 年 HITACHI 製の東京大学のスパコン 2002 年には地球シミュレータが 2 位に 5 倍の性能差で 1 位 その後 5 回連続で世界 1 位 2011 年には 10PFlop/s の高性能で京が世界 1 位に! 13

14 1.2 HPC の歴史 地球 HITACTI シミュレータ SR2201/1024 京 全世界にスパコン性能シェアはアメリカがトップ ( 約 50%) 日本のシェアは減少傾向 (30% 10%) 新規スパコンが完成した際には一時的に増加 14

15 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 15

16 1.3 HPC の有用性 シミュレーションは理論 実験と並ぶ第 3の研究手法 気象 気候 地震などの実際には実験できない現象の研究 高温 高圧 微小スケールなどの極限環境での現象の研究 銀河の形成といった実時間では再現できない現象の研究 etc 理論の理解 未来 未知の予測! 16

17 京の成果 1.3 HPC の有用性 2011 年 京によるシリコン ナノワイヤの第一原理計算 がゴードン ベル賞を受賞 世界で初めてナノレベルの高精度シミュレーションを可能に! 従来システムで 30 年以上 京で 1 週間 2012 年 約 2 兆個のダークマター粒子の宇宙初期における重力進化の計算 がゴードン ベル賞を受賞 世界最大規模である数兆個に及ぶダークマター粒子の重力進化を計算! アプリケーションも他国の研究グループと比べ 6 倍程効率が高い 17

18 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 18

19 そんな HPC の世界でエクサは 2. エクサの HPC HPC HPC に特化したシステム構築 プログラムの高速化 最適化チューニング GPGPU システム運用リソース管理 XeonPhi 19

20 年月ビジネス概要 1980 年代後半 ~ 1990 年代中盤 1990 年代後半 ~ 2000 年代後半 2.1 エクサの HPC の歴史 シリコングラフィックス社のグラフィックスワークステーション販売ビジネス コンベックス社のミニスーパーコンピュータ販売ビジネス 地球シミュレータ利用に向けた大気海洋気象シミュレーションソフトウェアの並列化プロジェクトに参画 超並列計算機 クラスター型計算機システムの実用普及 グラフィックス処置の高度化に関してお客様をリード クレイリサーチ社のベクトル型スーパーコンピュータの 10 分の 1 の価格で半分の性能を実現し 中規模高速計算の分野で活躍プログラムのベクトル高速化に関して お客様へのサポートを実施コンベックス社に SE を派遣し リアルタイム OS の共同開発も実施 シリコングラフィックス社 コンベックス /HP 社の超並列システムの販売並列処理を用いたプログラム高速化に関して お客様へのサポートを実施 20 スパコンセンターの運用サポート業務 2010 年代 IBM HW を用いた HPC システムを積極展開 ビッグデータソリューションの展開開始 プログラム高速化対応ビジネスの展開 障害対応だけでなく 大規模 HPC システムとしての運用に合わせた改善を提案 具現化 GPGPU の黎明期に実システムでユーザをサポート 高速共有ファイルシステムの構築中規模 ~ 超大規模 HSM システムの構築

21 2.1 エクサの HPC の歴史 NKK NK-EXA 時代にはお客様や内部向けに技術誌も発刊! 画像出典情報 SPP 技術情報誌 Octave Vol.16(NKK 情報システム部 1999 年 8 月発行 ) Route 17(NK-EXA)

22 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 22

23 2.2 エクサの HPC ソリューションとビジネス体系 前述分野を対象としたソリューションを HPC ソリューションと呼称 スーパーコンピュータ提案 プログラムチューニング ファイルシステム構築 etc 計算クラスタ プログラム エンドユーザ ManyCore:GPU XeonPhi インターコネクト :InfiniBand ジョブスケジューラ :LSF PBS コンパイラ :Intel PGI 高速化 : スレッド並列 MPI 並列大規模化 : 省メモリ 領域分割 サポート : プログラム作成 システム利用 マニュアル作成 ファイルシステム 高速分散ファイルシステム :GPFS Lustre 階層型ストレージ :GPFS+TSM HPSS 対象顧客 : 民間製造業 各種研究機関 大学 ( 基盤センター ~ 研究室まで ) 他 23

24 2.2 エクサの HPC ソリューションとビジネス体系 設備工事からお客様プログラムのチューニングまで そうだ高速処理 しよう と思った全ての方へ 設計フェーズ 導入フェーズ 運用フェーズ 導入前コンサルティング ボトルネック調査 ベンチマーク バックアップ計画 設備工事からアプリ高速化まで 並列計算ライブラリ ジョブスケジューラ等設計 導入 調整 高速ネットワーク設計 設定 ISV アプリケーション ユーザプログラム実行環境最適化 F/W ドライバ OS 基盤設計 設定 大規模ファイルシステム設計 設定 電源 空調 防音 耐震 / 免震工事 アクセラレータ (GPGPU など ) 保守サポート 障害切り分け 運用支援 導入後コンサルティング 24

25 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 25

26 2.3 エクサの HPC スキル ~ ジョブスケジューラ ~ ジョブスケジューラ HPC で利用しているシステムのリソースを最大限有効に活用するためジョブを管理 LSF, PBS Pro, Univa Grid Engine, SLURM 26

27 2.3 エクサの HPC スキル ~ ジョブスケジューラ ~ ジョブスケ ジョブスケジューラがない場合 CPU 10 個で計算開始 ~ CPU CPU CPU CPU CPU CPU CPU CPU 大容量メモリ消費するアプリを 1 ノード内で計算開始 ~ Memory Memory Memory Memory GPGPU 使って高速計算するぜ ~ CPU CPU CPU CPU CPU CPU CPU CPU ユーザが好きなところで計算するためリソースが衝突! Memory Memory Memory GPGPU Memory GPGPU 27

28 2.3 エクサの HPC スキル ~ ジョブスケジューラ ~ ジョブスケ ジョブスケジューラを導入した場合 CPU 10 個で計算開始 ~ CPU CPU CPU CPU CPU CPU CPU CPU 大容量メモリ消費するアプリを 1 ノード内で計算開始 ~ Memory Memory Memory Memory GPGPU 使って高速計算するぜ ~ CPU CPU CPU CPU CPU CPU CPU CPU ジョブスケジューラが上手にリソースを管理してくれる! Memory Memory Memory GPGPU Memory GPGPU 28

29 2.3 エクサの HPC スキル ~ チューニング ~ 普通に作ったプログラムでは高性能なハードウェア性能を使いこなせない! メモリのキャッシング CPU の複数コア 複数ノードにまたがる計算 etc スパコンで計算開始 ~ CPU CPU CPU CPU CPU CPU CPU CPU スパコンで計算開始 ~ Memory Memory Memory Memory GPGPU 使って高速計算するぜ ~ ユーザが少しずつ使うだけではリソースがもったいない! CPU CPU Memory CPU CPU 未使用リソース Memory CPU CPU Memory GPGPU CPU CPU Memory GPGPU 29

30 ( 参考 )MPI(Message Passing Interface) 並列コンピューティング利用するための標準化された規格 MPI ライブラリ (OpenMPI MVAPICH など ) が必要 プログラム内に 開始 終了 送信 受信 などの指示を記述 プロセス間でデータをやり取りして計算処理を分割 プロセス 0 プロセス 1 プロセス 2 /* Start up MPI */ MPI_Init(&argc, &argv); /* Find out process rank */ MPI_Comm_rank(MPI_COMM_WORLD, &my_rank); /* Find out number of processes */ MPI_Comm_size(MPI_COMM_WORLD, &p); 30 プロセス 3 プロセス 4 プロセス 5 /* Shut down MPI */ MPI_Finalize();

31 ( 参考 )OpenMP 並列コンピューティング利用するための規格 OpenMP 対応のコンパイラが必要 (GCC も対応 ) プログラム内に 並列化開始 並列化終了 同期 などの指示をコメント形式で記述 スレッド間で計算処理を分散 CPU スレッド 0 スレッド 1 Core Core スレッド2 スレッド3 Core Core int main(int argc, char *argv[]) { int i; #pragma omp parallel for for(i = 0; i <= 10000; i++) { // ( 並列処理させたいプログラム ) } } 31

32 2.3 エクサの HPC スキル ~ チューニング ~ A 大学様案件 地震後の耐震性を解析するプログラムが対象 スーパーコンピュータ上 (16 コア 8 ノード =128 並列 ) で高速に計算できるようにプログラムをチューニング スレッド並列 MPI 並列 ライブラリ利用 32

33 B 社様案件 2.3 エクサの HPC スキル ~ チューニング ~ 河川氾濫解析用プログラムが対象 お客様のワークステーション環境で高速に計算できるようにプログラムをチューニング 高速化予測 スレッド並列 33

34 2.3 エクサの HPC スキル ~GPU/XeonPhi 対応 ~ ManyCore 1 つのプロセッサデバイスの中に複数コアを搭載したデバイス GPU: 本来画像処理向けに利用されるデバイスを計算に利用最新の K40 では 2880 コア 1.43TFlop/s XeonPhi:Intel 社から販売されている高速計算用デバイス 7120D では 61 コア 1.2TFlop/s GPGPU XeonPhi 34

35 ( 参考 )GPGPU&CUDA GPGPU GPU を汎用的な計算に利用する方法及びデバイスを指す フリーの nvidia 製 GPGPU ライブラリ CUDA Feature Tesla K40 Tesla K20 倍精度 1.43 Tflops 1.17 Tflops 単精度 4.29 Tflops 3.52 Tflops メモリバンド幅 (ECC off) 288 GB/sec 208 GB/sec Memory 12 GB 5 GB CUDA cores 画像出典情報 GK110 Block: GK110-Architecture-Whitepaper.pdf(WhitePaper NVIDIA s Next Generation CUDA Compute Architecture:Kepler)

36 ( 参考 )GPGPU&CUDA GPGPU GPU を汎用的な計算に利用する方法及びデバイスを指す フリーの nvidia 製 GPGPU ライブラリ CUDA 36 画像出典情報 CUDA Sample: PARALLEL COMPUTING)

37 2.3 エクサの HPC スキル ~XeonPhi~ Intel が販売しているメニーコアプロセッサ Larrabee から派生した MIC アーキテクチャ x86 互換のコプロセッサを搭載しているため x86 CPU 向けのプログラムをほぼそのまま利用可能 実行ファイルを Phi に転送する ネイティブ実行 と実行時に指定部のみ Phi に渡す オフロード実行 がある Intel Compiler が必須 画像出典情報 Xeon Phi Block Diagram: Higher Efficiency 37 for Parallel Processing)

38 2.3 エクサの HPC スキル ~GPU/XeonPhi 対応 ~ C 様案件 別案件にて高速化していたプログラムでの XeonPhi での検証を実施! 1. プログラム全体の X64 化 ( 利用ライブラリ含む ) 2.offload プラグマを利用したオフロード実行手順検証 3. プログラム全体の Linux 対応化 ( 利用ライブラリ含む ) 4.Native 実行による性能計測 38

39 2.3 エクサの HPC スキル HPC 技術紹介 ~HSM~ HSM 階層型のストレージ管理 利用例 : 頻繁に使うデータのみを高速ディスクにおき, 頻度の低いデータは低速の大容量ストレージにおくことでディスク利用の効率化 GPFS/TSM 利用頻度の低いデータをテープ装置へ移すことで高速アクセス領域を有効利用ユーザからは単一のファイルシステムとして利用可能 39

40 2.3 エクサの HPC スキル HPC 技術紹介 ~HSM~ HSM 階層型のストレージ管理 利用例 : 頻繁に使うデータのみを高速ディスクにおき, 頻度の低いデータは低速の大容量ストレージにおくことでディスク利用の効率化 HPSS ディスクとテープの一体型大規模ストレージシステムディスク装置のキャッシュ利用やテープにより高速かつ大規模なシステムを実現 40

41 2.3 エクサの HPC スキル HPC 技術紹介 ~ 運用 ~ 某スパコン運用支援案件 一部アクセラレータ搭載の 700 台以上の計算ノード (100TFlop/s 以上 ) 1.6PB の大規模高速分散ストレージ InfiniBand による高速通信環境により構成された大規模スパコンシステムの運用支援を提供! ハードウェア管理 障害切り分けパーツ交換管理 ノード障害時における継続運用処理などのあらゆる障害対応窓口を完遂 ジョブ スケジューラ運用支援 機能追加 1,000 人以上の利用者を抱えるシステムにおいて 20 種類のアプリケーションやユーザ プログラムを最適なノードへ投入されるよう設定 柔軟な課金設計 各種イベント等への対応 法定停電 イベント時スケジュール調整停電前後の停止 起動における分単位のスケジュール立案および関係各所への調整 バックアップ 機能追加作業 41

42 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 42

43 3.1 エクサスケールスーパーコンピュータ エクサ 10の18 乗を示す単位 京の100 倍の性能! 2020 年を目指して各国開発推進中 実現に向けての課題 消費電力の増大 現行の方法ではスパコン設備の隣に発電所が必要!? アルゴリズム / アプリケーションの並列化 規模が大きくノード間通信にかかる処理時間が大きなボトルネックになってしまう! 膨大な計算結果データのハンドリング 計算結果が膨大な量になるため I/O 処理がボトルネックとなる可能性が高い! 結果の把握や成果の確認のためのシステムが必要! 43

44 目次 1.HPCとは 1.1 HPCの概要 1.2 HPCの歴史 1.3 HPCの有用性 2. エクサのHPC 2.1 エクサのHPCの歴史 2.2 エクサのHPCソリューションとビジネス体系 2.3 エクサのHPCスキル 3. 今後のHPCとエクサ 3.1 エクサスケールスーパーコンピュータ 3.2 エクサのHPCの目指すもの 44

45 本日のまとめ 3.2 エクサの HPC の目指すもの HPC 分野の研究は将来的な生活の発展や危機管理に利用されている エクサでは HW から SW まで幅広い技術領域で HPC 分野に貢献している 今後のエクサの HPC ビジネス展開 多方面へのビジネス展開を目指す! HPC における技術をその他分野のシステムに応用する! ex. ビッグデータ グリッドコンピューティング エクサスケールの実現に向けて新規技術を取り込んだチャレンジ! 45

46 年 6 月発表最新スパコン情報 HPC に関する大きなシンポジウムが年に 2 回 (ISC/SC) 実施 Top500 LINPACK による Flop/s で比較 3 期連続で中国のスパコンが世界 1 位 トップ 5 はスパコン専用機が独占 Rank Name Computer 1 2 Titan Tianhe-2 (MilkyWay-2) 3 Sequoia 4 K Computer 5 Mira TH-IVB-FEP Cluster, Intel Xeon E C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P Cray XK7, Opteron C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x BlueGene/Q, Power BQC 16C 1.60 GHz, Custom K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect BlueGene/Q, Power BQC 16C 1.60GHz, Custom Total Cores Rmax (GFlop/s) Rpeak (GFlop/s) Power (kw) 3,120,000 33,862,700 54,902,400 17, ,640 17,590,000 27,112,550 8,209 1,572,864 17,173,224 20,132,659 7, ,024 10,510,000 11,280,384 12, ,432 8,586,612 10,066,330 3,945

47 Green 年 6 月発表最新スパコン情報 ワットあたりの Flop/s で比較 東工大の油冷式スパコン :TSUBAME-KFC が世界 1 位 Rank MFLOPS/W Site* Computer* 1 4, GSIC Center, Tokyo Institute of Technology 2 3, Cambridge University 3 3, , SURFsara 5 3, Center for Computational Sciences, University of Swiss National Supercomputing Centre (CSCS) TSUBAME-KFC - LX 1U-4GPU/104Re- 1G Cluster, Intel Xeon E5-2620v2 6C 2.100GHz, Infiniband FDR, NVIDIA K20x Wilkes - Dell T620 Cluster, Intel Xeon E5-2630v2 6C 2.600GHz, Infiniband FDR, NVIDIA K20 HA-PACS TCA - Cray 3623G4-SM Cluster, Intel Xeon E5-2680v2 10C 2.800GHz, Infiniband QDR, NVIDIA K20x Cartesius Accelerator Island - Bullx B515 cluster, Intel Xeon E5-2450v2 8C 2.5GHz, InfiniBand 4 FDR, Nvidia K40m Piz Daint - Cray XC30, Xeon E C 2.600GHz, Aries interconnect, NVIDIA K20x Total Power (kw) ,

48 Graph 年 6 月発表最新スパコン情報 大規模データ解析性能による比較 京が実用計算分野のランキングでは世界 1 位! Rank Machine Installation Site Number of nodes Number of cores Problem Scale GTEPS C_time (sec) 1 K computer RIKEN Advanced Institute for Computational Science (AICS) 65, , , DOE/NNSA/LLNL Lawrence Livermore Sequoia National Laboratory 65,536 1,048, ,599 1,357 3 DOE/SC/Argonne Argonne National National Laboratory Laboratory Mira 49, , , JUQUEEN Forschungszentrum Juelich (FZJ) 16, , , Fermi CINECA 8, , ,

49 免責事項 Intel Xeon Xeon Phi は米国およびその他の国におけるインテルコーポレーションの商標または登録商標です Cray Cray XK7 Cray Gemini interconnect は米国その他の国における Cray Inc. の商標または登録商標です PBS は米国およびその他の国における Altair Engineering, Inc の商標または登録商標です IBM Blue Gene Power BQC GPFS LSF は米国およびその他の国における International Business Machines Corporation の商標または登録商標です SPARC64 は米国およびその他の国における SPARC International, Inc. の商標または登録商標です NVIDIA CUDA は米国およびその他の国における NVIDIA Corporation の商標または登録商標です InfiniBand は米国またはその他の国における InfiniBand Trade Association の商標またはサービスマークです その他の社名 製品名などは 一般に各社の商標または登録商標です 49

50 ご清聴ありがとう ございました 50

GPU n Graphics Processing Unit CG CAD

GPU n Graphics Processing Unit CG CAD GPU 2016/06/27 第 20 回 GPU コンピューティング講習会 ( 東京工業大学 ) 1 GPU n Graphics Processing Unit CG CAD www.nvidia.co.jp www.autodesk.co.jp www.pixar.com GPU n GPU ü n NVIDIA CUDA ü NVIDIA GPU ü OS Linux, Windows, Mac

More information

ÊÂÎó·×»»¤È¤Ï/OpenMP¤Î½éÊâ¡Ê£±¡Ë

ÊÂÎó·×»»¤È¤Ï/OpenMP¤Î½éÊâ¡Ê£±¡Ë 2015 5 21 OpenMP Hello World Do (omp do) Fortran (omp workshare) CPU Richardson s Forecast Factory 64,000 L.F. Richardson, Weather Prediction by Numerical Process, Cambridge, University Press (1922) Drawing

More information

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始 2014 年 1 月 31 日 国立大学法人九州大学 株式会社日立製作所 九州大学がスーパーコンピュータ 高性能アプリケーションサーバシステム の本格稼働を開始 日立のテクニカルサーバ HA8000-tc/HT210 などを採用 従来システム比で 約 28 倍の性能を実現し 1TFLOPS あたりの消費電力は約 17 分の 1 に低減 九州大学情報基盤研究開発センター ( センター長 : 青柳睦 /

More information

Microsoft Word - HOKUSAI_system_overview_ja.docx

Microsoft Word - HOKUSAI_system_overview_ja.docx HOKUSAI システムの概要 1.1 システム構成 HOKUSAI システムは 超並列演算システム (GWMPC BWMPC) アプリケーション演算サーバ群 ( 大容量メモリ演算サーバ GPU 演算サーバ ) と システムの利用入口となるフロントエンドサーバ 用途の異なる 2 つのストレージ ( オンライン ストレージ 階層型ストレージ ) から構成されるシステムです 図 0-1 システム構成図

More information

スライド 1

スライド 1 計算科学が拓く世界スーパーコンピュータは何故スーパーか 学術情報メディアセンター中島浩 http://www.para.media.kyoto-u.ac.jp/jp/ username=super password=computer 講義の概要 目的 計算科学に不可欠の道具スーパーコンピュータが どういうものか なぜスーパーなのか どう使うとスーパーなのかについて雰囲気をつかむ 内容 スーパーコンピュータの歴史を概観しつつ

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション vsmp Foundation スケーラブル SMP システム スケーラブル SMP システム 製品コンセプト 2U サイズの 8 ソケット SMP サーバ コンパクトな筐体に多くのコアとメモリを実装し SMP システムとして利用可能 スイッチなし構成でのシステム構築によりラックスペースを無駄にしない構成 将来的な拡張性を保証 8 ソケット以上への拡張も可能 2 システム構成例 ベースシステム 2U

More information

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~ MATLAB における並列 分散コンピューティング ~ Parallel Computing Toolbox & MATLAB Distributed Computing Server ~ MathWorks Japan Application Engineering Group Takashi Yoshida 2016 The MathWorks, Inc. 1 System Configuration

More information

supercomputer2010.ppt

supercomputer2010.ppt nanri@cc.kyushu-u.ac.jp 1 !! : 11 12! : nanri@cc.kyushu-u.ac.jp! : Word 2 ! PC GPU) 1997 7 http://wiredvision.jp/news/200806/2008062322.html 3 !! (Cell, GPU )! 4 ! etc...! 5 !! etc. 6 !! 20km 40 km ) 340km

More information

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード] 200/0/9 数値流体解析の並列効率とその GPU による高速化の試み 清水建設 ( 株 ) 技術研究所 PHAM VAN PHUC ( ファムバンフック ) 流体計算時間短縮と GPU の活用の試み 現 CPUとの比較によりGPU 活用の可能性 現 CPU の最大利用 ノード内の最大計算資源の利用 すべてCPUコアの利用 適切なアルゴリズムの利用 CPU コア性能の何倍? GPU の利用の試み

More information

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日 TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日 目次 1. TSUBAMEのGPU 環境 2. プログラム作成 3. プログラム実行 4. 性能解析 デバッグ サンプルコードは /work0/gsic/seminars/gpu- 2011-09- 28 からコピー可能です 1.

More information

SC SC10 (International Conference for High Performance Computing, Networking, Storage and Analysis) (HPC) Ernest N.

SC SC10 (International Conference for High Performance Computing, Networking, Storage and Analysis) (HPC) Ernest N. SC10 2010 11 13 19 SC10 (International Conference for High Performance Computing, Networking, Storage and Analysis) (HPC) 1 2005 8 8 2010 4 Ernest N. Morial Convention Center (ENMCC) Climate Simulation(

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information

CCS HPCサマーセミナー 並列数値計算アルゴリズム

CCS HPCサマーセミナー 並列数値計算アルゴリズム 大規模系での高速フーリエ変換 2 高橋大介 daisuke@cs.tsukuba.ac.jp 筑波大学計算科学研究センター 2016/6/2 計算科学技術特論 B 1 講義内容 並列三次元 FFT における自動チューニング 二次元分割を用いた並列三次元 FFT アルゴリズム GPU クラスタにおける並列三次元 FFT 2016/6/2 計算科学技術特論 B 2 並列三次元 FFT における 自動チューニング

More information

資料8-3 今後のHPCI計画推進のあり方に関する検討ワーキンググループの中間報告について(その5)

資料8-3 今後のHPCI計画推進のあり方に関する検討ワーキンググループの中間報告について(その5) 1. 国際的な状況 1 TOP500 の各国 1 位の推移 LINPACK 性能 [FLOPS] 10 ペタ 1 ペタ 100 テラ 10 テラ 地球シミュレータ 35.8TF 日本 BlueGene/L 70.7TF 世界で初めて 10 ヘ タフロッフ スの壁を突破 RoadRunner 1.0PF アメリカ 10.5PF Tianhe-1A 2.5PF 中国 Titan 17.5PF Tianhe-2

More information

09中西

09中西 PC NEC Linux (1) (2) (1) (2) 1 Linux Linux 2002.11.22) LLNL Linux Intel Xeon 2300 ASCIWhite1/7 / HPC (IDC) 2002 800 2005 2004 HPC 80%Linux) Linux ASCI Purple (ASCI 100TFlops Blue Gene/L 1PFlops (2005)

More information

HPC可視化_小野2.pptx

HPC可視化_小野2.pptx 大 小 二 生 高 方 目 大 方 方 方 Rank Site Processors RMax Processor System Model 1 DOE/NNSA/LANL 122400 1026000 PowerXCell 8i BladeCenter QS22 Cluster 2 DOE/NNSA/LLNL 212992 478200 PowerPC 440 BlueGene/L 3 Argonne

More information

PCC hanawa

PCC hanawa メニーコア型大規模スーパー コンピュータシステム Oakforest-PACSの現状と動向 東京大学 情報基盤センター 最先端共同HPC基盤施設 (JCAHPC) 塙 敏博 HPCI: High Performance Computing Infrastructure 日本全体におけるスパコンインフラ 9 大学 ( 北大 東北大 筑波大 東大 東工大 名大 京大 阪大 九大 ) の情報基盤センター

More information

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ K20 GPU2 個に対するスピードアップ NVIDIA は Fermi アーキテクチャ GPU の発表により パフォーマンス エネルギー効率の両面で飛躍的な性能向上を実現し ハイパフォーマンスコンピューティング (HPC) の世界に変革をもたらしました また 実際に GPU

More information

RICCについて

RICCについて RICC 1 RICC 2 RICC 3 RICC GPU 1039Nodes 8312core) 93.0GFLOPS, 12GB(mem), 500GB (hdd) DDR IB!1 PC100Nodes(800core) 9.3 GPGPU 93.3TFLOPS HPSS (4PB) (550TB) 0.24 512GB 1500GB MDGRAPE33TFLOPS MDGRAPE-3 64

More information

GPUコンピューティング講習会パート1

GPUコンピューティング講習会パート1 GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の

More information

最新の並列計算事情とCAE

最新の並列計算事情とCAE 1 大島聡史 ( 東京大学情報基盤センター助教 / 並列計算分科会主査 ) 最新の並列計算事情と CAE アウトライン 最新の並列計算機事情と CAE 世界一の性能を達成した 京 について マルチコア メニーコア GPU クラスタ 最新の並列計算事情と CAE MPI OpenMP CUDA OpenCL etc. 京 については 仕分けやら予算やら計画やらの面で問題視する意見もあるかと思いますが

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション スーパーコンピュータのネットワーク 情報ネットワーク特論 南里豪志 ( 九州大学情報基盤研究開発センター ) 1 今日の講義内容 スーパーコンピュータとは どうやって計算機を速くするか スーパーコンピュータのネットワーク 2 スーパーコンピュータとは? " スーパー " な計算機 = その時点で 一般的な計算機の性能をはるかに超える性能を持つ計算機 スーパーコンピュータの用途 主に科学技術分野 創薬

More information

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx シングルコアとマルチコア 長岡技術科学大学電気電子情報工学専攻出川智啓 今回の内容 前々回の授業の復習 CPUの進化 半導体集積率の向上 CPUの動作周波数の向上 + 複雑な処理を実行する回路を構成 ( 前々回の授業 ) マルチコア CPU への進化 均一 不均一なプロセッサ コプロセッサ, アクセラレータ 210 コンピュータの歴史 世界初のデジタルコンピュータ 1944 年ハーバードMark I

More information

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料) 今後の HPC 技術に関する 研究開発の方向性について 2012 年 5 月 30 日 ( 株 ) 日立製作所情報 通信システム社 IT プラットフォーム事業本部 Hitachi, Hitachi, Ltd. Ltd. Hitachi 2012. 2012. Ltd. 2012. All rights All rights All rights reserved. reserved. reserved.

More information

openmp1_Yaguchi_version_170530

openmp1_Yaguchi_version_170530 並列計算とは /OpenMP の初歩 (1) 今 の内容 なぜ並列計算が必要か? スーパーコンピュータの性能動向 1ExaFLOPS 次世代スハ コン 京 1PFLOPS 性能 1TFLOPS 1GFLOPS スカラー機ベクトル機ベクトル並列機並列機 X-MP ncube2 CRAY-1 S-810 SR8000 VPP500 CM-5 ASCI-5 ASCI-4 S3800 T3E-900 SR2201

More information

hpc141_shirahata.pdf

hpc141_shirahata.pdf GPU アクセラレータと不揮発性メモリ を考慮した I/O 性能の予備評価 白幡晃一 1,2 佐藤仁 1,2 松岡聡 1 1: 東京工業大学 2: JST CREST 1 GPU と不揮発性メモリを用いた 大規模データ処理 大規模データ処理 センサーネットワーク 遺伝子情報 SNS など ペタ ヨッタバイト級 高速処理が必要 スーパーコンピュータ上での大規模データ処理 GPU 高性能 高バンド幅 例

More information

スライド 1

スライド 1 GPU クラスタによる格子 QCD 計算 広大理尾崎裕介 石川健一 1.1 Introduction Graphic Processing Units 1 チップに数百個の演算器 多数の演算器による並列計算 ~TFLOPS ( 単精度 ) CPU 数十 GFLOPS バンド幅 ~100GB/s コストパフォーマンス ~$400 GPU の開発環境 NVIDIA CUDA http://www.nvidia.co.jp/object/cuda_home_new_jp.html

More information

システムソリューションのご紹介

システムソリューションのご紹介 HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ

More information

HPEハイパフォーマンスコンピューティング ソリューション

HPEハイパフォーマンスコンピューティング ソリューション HPE HPC / AI Page 2 No.1 * 24.8% No.1 * HPE HPC / AI HPC AI SGIHPE HPC / AI GPU TOP500 50th edition Nov. 2017 HPE No.1 124 www.top500.org HPE HPC / AI TSUBAME 3.0 2017 7 AI TSUBAME 3.0 HPE SGI 8600 System

More information

<4D F736F F D B B B835E895E97708A4A8E6E82C A98418C6782CC8E6E93AE2E646F63>

<4D F736F F D B B B835E895E97708A4A8E6E82C A98418C6782CC8E6E93AE2E646F63> 京都大学学術情報メディアセンター 新スーパーコンピュータ運用開始と T2K 連携の始動 アピールポイント 61.2 テラフロップスの京大版 T2K オープンスパコン運用開始 東大 筑波大との T2K 連携による計算科学 工学分野におけるネットワーク型研究推進 人材育成 アプリケーション高度化支援の活動を開始概要国立大学法人京都大学 ( 総長 尾池和夫 ) 学術情報メディアセンター ( センター長 美濃導彦

More information

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司 4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司 3 1 1 日本原子力研究開発機構システム計算科学センター 2 理科学研究所計算科学研究機構 3 東京大学新領域創成科学研究科

More information

スライド 1

スライド 1 期間限定販売プログラム vsmp Foundation クラスタを仮想化して運用と管理の容易なシングルシステムを構築様々なリソースを柔軟に統合化 Panasas ActiveStor 研究開発やエンタープライズクラスのワークロードに理想的なハイブリッドスケールアウト NAS アプライアンス 販売プログラム PANASAS ACTIVESTORE 仮想化ソフトウエア無償提供 2 販売プログラムの内容

More information

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

Microsoft PowerPoint PCクラスタワークショップin京都.ppt PC クラスタシステムへの富士通の取り組み 富士通株式会社株式会社富士通研究所久門耕一 29 年度に富士通が提供する ( した ) 大規模クラスタ 今年度はCPUとしてメモリバンド幅がNehalem, QDR- IB( 片方向 4GB/s) などPCクラスタにとって期待できる多くのコモディティコンポーネントが出現 これら魅力ある素材を使ったシステムとして 2つのシステムをご紹介 理化学研究所様 RICC(Riken

More information

HPC143

HPC143 研究背景 GPUクラスタ 高性能 高いエネルギー効率 低価格 様々なHPCアプリケーションで用いられている TCA (Tightly Coupled Accelerators) 密結合並列演算加速機構 筑波大学HA-PACSクラスタ アクセラレータ GPU 間の直接通信 低レイテンシ 今後のHPCアプリは強スケーリングも重要 TCAとアクセラレータを搭載したシステムに おけるプログラミングモデル 例

More information

Microsoft PowerPoint - ★13_日立_清水.ppt

Microsoft PowerPoint - ★13_日立_清水.ppt PC クラスタワークショップ in 京都 日立テクニカルコンピューティングクラスタ 2008/7/25 清水正明 日立製作所中央研究所 1 目次 1 2 3 4 日立テクニカルサーバラインナップ SR16000 シリーズ HA8000-tc/RS425 日立自動並列化コンパイラ 2 1 1-1 日立テクニカルサーバの歴史 最大性能 100TF 10TF 30 年間で百万倍以上の向上 (5 年で 10

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Dell PowerEdge C6320 スケーラブルサーバアプライアンス 仮想化アプライアンスサーバ 最新のプロセッサを搭載したサーバプラットフォーム vsmp Foundation によるサーバ仮想化と統合化の適用 システムはセットアップを完了した状態でご提供 基本構成ではバックプレーン用のスイッチなどが不要 各ノード間を直接接続 冗長性の高いバックプレーン構成 利用するサーバプラットフォームは

More information

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015 ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ 本セッションの目的 本セッションでは ERDAS IMAGINEにおける処理速度向上を目的として機器 (SSD 等 ) 及び並列処理の比較 検討を行った 1.SSD 及び RAMDISK を利用した処理速度の検証 2.Condorによる複数 PCを用いた並列処理 2.1 分散並列処理による高速化試験 (ERDAS IMAGINEのCondorを使用した試験

More information

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8 Web キャンパス資料 超音波シミュレーションの基礎 ~ 第 4 回 ComWAVEによる超高速超音波解析 ~ 科学システム開発部 Copyright (c)2006 ITOCHU Techno-Solutions Corporation 本日の説明内容 ComWAVEの概要および特徴 GPGPUとは GPGPUによる解析事例 CAE POWER 超音波研究会開催 (10 月 3 日 ) のご紹介

More information

HP High Performance Computing(HPC)

HP High Performance Computing(HPC) ACCELERATE HP High Performance Computing HPC HPC HPC HPC HPC 1000 HPHPC HPC HP HPC HPC HPC HP HPCHP HP HPC 1 HPC HP 2 HPC HPC HP ITIDC HP HPC 1HPC HPC No.1 HPC TOP500 2010 11 HP 159 32% HP HPCHP 2010 Q1-Q4

More information

Microsoft Word - koubo-H26.doc

Microsoft Word - koubo-H26.doc 平成 26 年度学際共同利用プログラム 計算基礎科学プロジェクト 公募要項 - 計算基礎科学連携拠点 ( 筑波大学 高エネルギー加速器研究機構 国立天文台 ) では スーパーコンピュータの学際共同利用プログラム 計算基礎科学プロジェクト を平成 22 年度から実施しております 平成 23 年度からは HPCI 戦略プログラム 分野 5 物質と宇宙の起源と構造 の協力機関である京都大学基礎物理学研究所

More information

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始 2013 年 9 月 19 日 株式会社日立製作所 ビッグデータやクラウドのシステム基盤向けに処理性能を強化した BladeSymphony および HA8000 シリーズ の新製品を販売開始 運用管理工数の削減を実現するサーバ管理ソフトウェア Hitachi Compute Systems Manager を標準添付 BS520H サーバブレード / PCI 拡張ブレード HA8000/RS220-h

More information

GPUコンピューティング講習会パート1

GPUコンピューティング講習会パート1 GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション みんなの ベクトル計算 たけおか @takeoka PC クラスタ コンソーシアム理事でもある 2011/FEB/20 ベクトル計算が新しい と 2008 年末に言いました Intelに入ってる! (2008 年から見た 近未来? ) GPU 計算が新しい (2008 年当時 ) Intel AVX (Advanced Vector Extension) SIMD 命令を進めて ベクトル機構をつける

More information

XACCの概要

XACCの概要 2 global void kernel(int a[max], int llimit, int ulimit) {... } : int main(int argc, char *argv[]){ MPI_Int(&argc, &argc); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm_size(MPI_COMM_WORLD, &size); dx

More information

<4D6963726F736F667420506F776572506F696E74202D20834B8343835F83938358815C8FEE95F183568358836583808A7793C195CA8D758B608252816932303134944E348C8E3893FA816A202D2048502E70707478>

<4D6963726F736F667420506F776572506F696E74202D20834B8343835F83938358815C8FEE95F183568358836583808A7793C195CA8D758B608252816932303134944E348C8E3893FA816A202D2048502E70707478> ガイダンス 東 京 大 学 情 報 基 盤 センター 准 教 授 片 桐 孝 洋 204 年 4 月 8 日 ( 火 )4:40-6:0 ガイダンスの 流 れ. 講 義 の 目 的 2. 講 師 紹 介 3. 講 義 日 程 の 確 認 4. 成 績 の 評 価 方 法 5. イントロダクション(30 分 ) 2 本 講 義 の 目 的 近 年 京 コンピュータに 代 表 される 世 界 トップクラスのスーパーコンピュータが

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース2] データ蓄積 2-5: 多様化が進展するクラウドサービス [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学本講座の学習内容 (2-5: 多様化が進展するクラウドサービス ) 講座概要 近年 注目されているクラウドの関連技術を紹介します PCやサーバを構成するパーツを紹介後

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Foundation アプライアンス スケーラブルシステムズ株式会社 サーバ クラスタの課題 複数のシステムを一つの だけで容易に管理することは出来ないだろうか? アプリケーションがより多くのメモリを必要とするのだけど ハードウエアの増設なしで対応出来ないだろうか? 現在の利用環境のまま 利用できるコア数やメモリサイズの増強を図ることは出来ないだろうか? 短時間で導入可能で また 必要に応じて 柔軟にシステム構成の変更が可能なソリューションは無いだろうか?...

More information

(速報) Xeon E 系モデル 新プロセッサ性能について

(速報) Xeon E 系モデル 新プロセッサ性能について ( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690

More information

GPUを用いたN体計算

GPUを用いたN体計算 単精度 190Tflops GPU クラスタ ( 長崎大 ) の紹介 長崎大学工学部超高速メニーコアコンピューティングセンターテニュアトラック助教濱田剛 1 概要 GPU (Graphics Processing Unit) について簡単に説明します. GPU クラスタが得意とする応用問題を議論し 長崎大学での GPU クラスタによる 取組方針 N 体計算の高速化に関する研究内容 を紹介します. まとめ

More information

PassMark PerformanceTest ™

PassMark PerformanceTest ™ KRONOS S ライン 性能ベンチマーク オーバークロックモニター OCCT OverClock Checking Tool i7z (A better i7 (and now i3, i5) reporting tool for Linux) KRONOS S800 CATIA Benchmark Aerospace - 8/17 passengers Jet - Mid Fuse DELL Precision

More information

独立行政法人理化学研究所 日本で唯一の自然科学の総合研究所 ( 文部科学省所管 ) 物理学 工学 化学 ライフサイエンス 脳科学 拠点 : 埼玉県和光市以外にも 国内 6 箇所 海外 3 箇所 人員 : 約 3000 名 ( これ以外に外来研究者等が約 3000 名 )

独立行政法人理化学研究所 日本で唯一の自然科学の総合研究所 ( 文部科学省所管 ) 物理学 工学 化学 ライフサイエンス 脳科学 拠点 : 埼玉県和光市以外にも 国内 6 箇所 海外 3 箇所 人員 : 約 3000 名 ( これ以外に外来研究者等が約 3000 名 ) 理研 新スパコン システム (RICC) の紹介 重谷隆之理化学研究所情報基盤センター 独立行政法人理化学研究所 日本で唯一の自然科学の総合研究所 ( 文部科学省所管 ) 物理学 工学 化学 ライフサイエンス 脳科学 拠点 : 埼玉県和光市以外にも 国内 6 箇所 海外 3 箇所 人員 : 約 3000 名 ( これ以外に外来研究者等が約 3000 名 ) 情報基盤センター 全理研を対象とする研究支援部門

More information

2 09:30-10:00 受付 10:00-12:00 HA-PACS ログイン GPU 入門 13:30-15:00 OpenACC 入門 15:15-16:45 OpenACC 最適化入門と演習 17:00-18:00 OpenACC の活用 (CUDA 連携とライブラリの活用 )

2 09:30-10:00 受付 10:00-12:00 HA-PACS ログイン GPU 入門 13:30-15:00 OpenACC 入門 15:15-16:45 OpenACC 最適化入門と演習 17:00-18:00 OpenACC の活用 (CUDA 連携とライブラリの活用 ) 担当 大島聡史 ( 助教 ) ohshima@cc.u-tokyo.ac.jp 星野哲也 ( 助教 ) hoshino@cc.u-tokyo.ac.jp 質問やサンプルプログラムの提供についてはメールでお問い合わせください 1 2016 年 10 月 17 日 ( 月 ) 東京大学情報基盤センター 2 09:30-10:00 受付 10:00-12:00 HA-PACS ログイン GPU 入門 13:30-15:00

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション PC クラスタシンポジウム 日立のテクニカルコンピューティングへの取り組み 2010/12/10 株式会社日立製作所中央研究所清水正明 1 目次 1 2 3 日立テクニカルサーバラインナップ 日立サーバラインナップ GPU コンピューティングへの取り組み 4 SC10 日立展示 2 1-1 日立テクニカルサーバ : History & Future Almost 30 Years of Super

More information

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc Article ID: NVSI-050110JP Created: 2005/10/19 Revised: - NetVault 仮想テープ ライブラリのパフォーマンス検証 : dothill SANnetⅡSATA 編 1. 検証の目的 ドットヒルシステムズ株式会社の SANnetll SATA は 安価な SATA ドライブを使用した大容量ストレージで ディスクへのバックアップを行う際の対象デバイスとして最適と言えます

More information

untitled

untitled taisuke@cs.tsukuba.ac.jp http://www.hpcs.is.tsukuba.ac.jp/~taisuke/ CP-PACS HPC PC post CP-PACS CP-PACS II 1990 HPC RWCP, HPC かつての世界最高速計算機も 1996年11月のTOP500 第一位 ピーク性能 614 GFLOPS Linpack性能 368 GFLOPS (地球シミュレータの前

More information

並列・高速化を実現するための 高速化サービスの概要と事例紹介

並列・高速化を実現するための 高速化サービスの概要と事例紹介 第 4 回 AVS 可視化フォーラム 2019 並列 高速化を実現するための 高速化サービスの概要と事例紹介 株式会社アーク情報システム営業部仮野亮ソリューション技術部佐々木竜一 2019.08.30 はじめに アーク情報システムの紹介 高速化サービスとは? 事例紹介 コンサルティングサービスについて アーク情報システムの紹介 設立 資本金 :1987 年 10 月 :3 億 600 万円 従業員数

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 並列アルゴリズム 2005 年後期火曜 2 限 高見利也 ( 青柳睦 ) Aoyagi@cc.kyushu-u.ac.jp http://server-500.cc.kyushu-u.ac.jp/ 12 月 20 日 ( 火 ) 9. PC クラスタによる並列プログラミング ( 演習 ) つづき 1 もくじ 1. 序並列計算機の現状 2. 計算方式およびアーキテクチュアの分類 3. 並列計算の目的と課題

More information

HPCS

HPCS 会社紹介 Gfarm ワークショップ 2018 2018 年 3 2 株式会社 HPCソリューションズ河野証 事業概要 HPC ソリューションプロバイダ HPC 製品ハードウェアソフトウェア パブリッククラウド コンサルティングアプラインス等 2 事業概要 HPC ソリューションプロバイダ HPC 製品ハードウェアソフトウェア 3 事業概要 HPC ソリューションプロバイダ Analyze-IT/Predict-IT

More information

1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU

1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU GPGPU (I) GPU GPGPU 1 GPU(Graphics Processing Unit) GPU GPGPU(General-Purpose computing on GPUs) GPU GPGPU GPU ( PC ) PC PC GPU PC PC GPU GPU 2008 TSUBAME NVIDIA GPU(Tesla S1070) TOP500 29 [1] 2009 AMD

More information

スライド 1

スライド 1 High Performance Computing Infrastructure と学認 合田憲人 国立情報学研究所 背景と目的 2 HPCI 京コンピュータと国内のスーパーコンピュータや大規模ストレージを連携して利用するための革新的ハイパフォーマンス コンピューティング インフラ ロードマップ 2011/03 基本仕様策定 ( ネットワーク, 認証, ユーザ管理支援, 共用ストレージ, 先端ソフトウェア運用

More information

富士通のHPC向けクラウドサービス『TCクラウド』のご紹介

富士通のHPC向けクラウドサービス『TCクラウド』のご紹介 富士通の HPC 向けクラウドサービス TC クラウド のご紹介 2015 年 6 月富士通株式会社テクニカルコンピューティングソリューション事業本部松本孝之 富士通の HPC 製品ラインナップ スーパーコンピュータ PRIMEHPC FX100 PC クラスタ PC サーバ PRIMERGY ブレードサーバ マルチノードサーバ SPARC64 XIfx プロセッサ採用 32 コア +2 アシスタントコア

More information

Microsoft PowerPoint - HPCフォーラム 新庄Final

Microsoft PowerPoint - HPCフォーラム 新庄Final 富士通の HPC に向けた取り組み 2015 年 8 月 28 日富士通株式会社次世代テクニカルコンピューティング開発本部新庄直樹 1 アウトライン HPCシステムの動向 富士通の取り組み ハイエンドシステムPRIMEHPC FX100とポスト京への取り組み エクサスケール時代を見据えてハード / ソフトからアプローチ PRIMEHPC FX100 での評価とまとめ 2 HPC システムの動向 (1/2)

More information

TopSE並行システム はじめに

TopSE並行システム はじめに はじめに 平成 23 年 9 月 1 日 トップエスイープロジェクト 磯部祥尚 ( 産業技術総合研究所 ) 2 本講座の背景と目標 背景 : マルチコア CPU やクラウドコンピューティング等 並列 / 分散処理環境が身近なものになっている 複数のプロセス ( プログラム ) を同時に実行可能 通信等により複数のプロセスが協調可能 並行システムの構築 並行システム 通信 Proc2 プロセス ( プログラム

More information

Microsoft PowerPoint - ITC [互換モード]

Microsoft PowerPoint - ITC [互換モード] 情報基盤センターの スパコン 東京大学情報基盤センター 人間の全ての行動において 情報 と無縁なものは無い 学問, 研究もその例外では無い 東京大学における様々な 情報 に関わる活動を支援する 学術情報メディア 図書館電子化, 学術情報 ネットワーク スーパーコンピューティング 大量で多様な情報 : コンピュータ + ネットワーク CSE 2 スーパーコンピューティング部門 (1/2) http://www.cc.u-tokyo.ac.jp/

More information

担当 大島聡史 ( 助教 ) 星野哲也 ( 助教 ) 質問やサンプルプログラムの提供についてはメールでお問い合わせください 年 03 月 14 日 ( 火 )

担当 大島聡史 ( 助教 ) 星野哲也 ( 助教 ) 質問やサンプルプログラムの提供についてはメールでお問い合わせください 年 03 月 14 日 ( 火 ) 担当 大島聡史 ( 助教 ) ohshima@cc.u-tokyo.ac.jp 星野哲也 ( 助教 ) hoshino@cc.u-tokyo.ac.jp 質問やサンプルプログラムの提供についてはメールでお問い合わせください 1 2017 年 03 月 14 日 ( 火 ) 2 09:30-10:00 受付 10:00-12:00 Reedbush-H ログイン GPU 入門 13:30-15:00

More information

高性能計算研究室の紹介 High Performance Computing Lab.

高性能計算研究室の紹介 High Performance Computing Lab. 高性能計算研究室 (HPC Lab) の紹介 High Performance Computing Lab. 静岡理工科大学総合情報学部コンピュータシステム学科 ( 兼 Web デザイン特別プログラム ) 幸谷智紀 543 研究室 幸谷研究室 @ 静岡 検索 概要 1. 幸谷智紀 個人の研究テーマ 2. 3 年生ゼミ ( 情報セミナー II) 3. 卒研テーマ 4. 過去の卒研 5. 今後について

More information

高性能計算研究室の紹介 High Performance Computing Lab.

高性能計算研究室の紹介 High Performance Computing Lab. 高性能計算研究室 (HPC Lab) の紹介 High Performance Computing Lab. 静岡理工科大学総合情報学部コンピュータシステム学科 ( 兼 Web デザイン特別プログラム ) 幸谷智紀 http://na-inet.jp/ 概要 1. 幸谷智紀 個人の研究テーマ 2. 3 年生ゼミ ( 情報セミナー II) 3. 卒研テーマ 4. Webデザイン特別プログラム 5. 今後について

More information

スーパーコンピュータ「京」の概要

スーパーコンピュータ「京」の概要 Overview of the K computer System 宮崎博行 草野義博 新庄直樹 庄司文由 横川三津夫 渡邊貞 あらまし HPCI CPUOS LINPACK 10 PFLOPSCPU 8 Abstract RIKEN and Fujitsu have been working together to develop the K computer, with the aim of beginning

More information

スライド 1

スライド 1 1 2 (National Research Grid Initiative) 4 3 flops 4 (Electrical Power Grid) Virtual Organization) Software catalogs Sensor nets Computing Resources Colleagues Data archives 5 グリッド の概念 アプリケーション アプリケーション

More information

チューニング講習会 初級編

チューニング講習会 初級編 GPU のしくみ RICC での使い方 およびベンチマーク 理化学研究所情報基盤センター 2013/6/27 17:00 17:30 中田真秀 RICC の GPU が高速に! ( 旧 C1060 比約 6.6 倍高速 ) RICCのGPUがC2075になりました! C1060 比 6.6 倍高速 倍精度 515GFlops UPCに100 枚導入 : 合計 51.5TFlops うまく行くと5 倍程度高速化

More information

名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL アライアンスパートナー コアテクノロジーパートナー NVIDIA JAPAN ソリュ

名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL   アライアンスパートナー コアテクノロジーパートナー NVIDIA JAPAN ソリュ GPUDirect の現状整理 multi-gpu に取組むために G-DEP チーフエンジニア河井博紀 (kawai@gdep.jp) 名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL http://www.gdep.jp アライアンスパートナー コアテクノロジーパートナー

More information

<4D F736F F D F B835E82CC8D8291AC8F88979D82F08FAC8C5E82A982C288C089BF82C88D5C90AC82C AC82B782E996A78C8B8D878C5E836E815B C695C097F18F88979D82F091678D8782B982BD8C768E5A8B

<4D F736F F D F B835E82CC8D8291AC8F88979D82F08FAC8C5E82A982C288C089BF82C88D5C90AC82C AC82B782E996A78C8B8D878C5E836E815B C695C097F18F88979D82F091678D8782B982BD8C768E5A8B テーマ名ビッグデータの高速処理を小型かつ安価な構成で達成する密結合型ハードウェアと並列処理を組合せた計算機システム組織名国立大学法人電気通信大学情報システム学研究科吉永務教授技術分野 IT 概要ビッグデータの高速処理を実現するために ストレージ 光通信ネットワーク FPGA SSD 等を密接に結合させたハードウェアと高効率の並列処理を組合せ 小型かつ安価なシステム構成でありながら Hadoop Impala

More information

Microsoft PowerPoint 知る集い(京都)最終.ppt

Microsoft PowerPoint 知る集い(京都)最終.ppt 次世代スパコンについて知る集い 配布資料 世界最高性能を目指すシステム開発について ー次世代スパコンのシステム構成と施設の概要 - 平成 22 年 1 月 28 日 理化学研究所次世代スーパーコンピュータ開発実施本部横川三津夫 高性能かつ大規模システムの課題と対応 演算性能の向上 CPU のマルチコア化,SIMD( ベクトル化 ) 機構 主記憶へのアクセス頻度の削減 - CPU 性能とメモリアクセス性能のギャップ

More information

0..Campus の利用.Campusに登録確認木曜 4 限にPCリテラシーがあるか確認ショートコード : Campusをお気に入りに追加.Campusから講義ファイル取得.Campusにレポート提出 2

0..Campus の利用.Campusに登録確認木曜 4 限にPCリテラシーがあるか確認ショートコード : Campusをお気に入りに追加.Campusから講義ファイル取得.Campusにレポート提出 2 PC リテラシー NO.2 情報処理入門 2012 年 4 月 19 日 後保範 1 0..Campus の利用.Campusに登録確認木曜 4 限にPCリテラシーがあるか確認ショートコード : 86311.Campusをお気に入りに追加.Campusから講義ファイル取得.Campusにレポート提出 2 1. 講義で使用するもの (1) オペレーションシステム Windows XP,Vista 使用しない

More information

Microsoft PowerPoint - endo-hokke13-kfc.pptx

Microsoft PowerPoint - endo-hokke13-kfc.pptx TSUBAME-KFC: 液 浸 冷 却 を 用 いた ウルトラグリーンスパコン 研 究 設 備 遠 藤 敏 夫 額 田 彰 松 岡 聡 東 京 工 業 大 学 学 術 国 際 情 報 センター 現 在 ~ 将 来 のスパコンは 電 力 あ たり 性 能 で 決 まる 現 実 的 なスパコンセンターの 電 力 の 限 界 は20MW 程 度 とされる Exaflopsのシステムを 実 現 する には

More information

ガイダンス(2016年4月19日)-HP

ガイダンス(2016年4月19日)-HP スパコンプログラミング(), (I) ガイダンス 東 京 大 学 情 報 基 盤 センター 准 教 授 塙 敏 博 206 年 4 月 9 日 ( 火 )0:25-2:0 206/4/9 スパコンプログラミング (), (I) 2 ガイダンスの 流 れ. 講 義 の 目 的 2. 講 師 紹 介 3. 講 義 日 程 の 確 認 4. 成 績 の 評 価 方 法 5. 計 算 機 利 用 申 請 6.

More information

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約 ANSYS Mechanical Distributed ANSYS( 領域分割法 ) 2011 年 1 月 17 日 富士通株式会社 ANSYS Mechanical ベンチマーク測定結果 目次 測定条件 1 標準問題モデル 2 総括 3 ベンチマーク測定について 3 留意事項 9 商標について 9 測定条件 測定に使用した環境は下記のとおりです System PRIMERGY BX922 S2

More information

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc 2.3. アプリ性能 2.3.1. Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア

More information

01-introduction.ppt

01-introduction.ppt オペレーティングシステム ~ イントロダクション ~ 山田浩史 hiroshiy @ cc.tuat.ac.jp 2015/04/10 オペレーティングシステム 担当 : 山田浩史 ( やまだひろし ) mail: hiroshiy @ cc.tuat.ac.jp 質問等ありましたら気軽にメールをしてください 専門分野 オペレーティングシステムや仮想マシンモニタといった システムソフトウェア と呼ばれる分野

More information

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP InfiniBand ACP 1,5,a) 1,5,b) 2,5 1,5 4,5 3,5 2,5 ACE (Advanced Communication for Exa) ACP (Advanced Communication Primitives) HPC InfiniBand ACP InfiniBand ACP ACP InfiniBand Open MPI 20% InfiniBand Implementation

More information

Microsoft PowerPoint - 講習 _kido.pptx[読み取り専用]

Microsoft PowerPoint - 講習 _kido.pptx[読み取り専用] スパコンの概要と CMC のスパコンの紹介 大阪大学サイバーメディアセンター講師木戸善之 2015/1/15 目次 1. スパコンの略歴 2. 計算機の概要 3. 並列計算 4. CMCのスパコン 1 1. スパコンの略歴 計算機ってなんだ? 計算機 計算に用いる機械 ( デジタル大辞泉 ) 計算のための機械 器具のこと コンピュータや電卓を指すことが多い (Wikipedia) 人が不得意な 正確な演算やルーチンワークを肩代わりするための道具

More information

GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 理化学研究所 共通コードプロジェクト

GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 理化学研究所 共通コードプロジェクト GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 勉強会 @ 理化学研究所 共通コードプロジェクト Contents Hands On 環境について Introduction to GPU computing Introduction

More information

11 月発表の Green500 最新結果の顛末 本来は Green500 で 1-4 位独占を実現する目論見であった 7 月の ISC で 計測ルールが v2.0 になることが予告された ( 現行の v1.2 ルールでの計測値改善には注力せず v2.0 対応作業のみ進めていた ) 最後まで v1.

11 月発表の Green500 最新結果の顛末 本来は Green500 で 1-4 位独占を実現する目論見であった 7 月の ISC で 計測ルールが v2.0 になることが予告された ( 現行の v1.2 ルールでの計測値改善には注力せず v2.0 対応作業のみ進めていた ) 最後まで v1. ZettaScaler-1.5 による HPC システム構築と ZettaScaler-2.0 構想 2015 年 12 月 18 日 齊藤元章 ( 株式会社 PEZY Computing/ 株式会社 ExaScaler/UltraMemory 株式会社 ) 11 月発表の Green500 最新結果の顛末 本来は Green500 で 1-4 位独占を実現する目論見であった 7 月の ISC で

More information

AMD/ATI Radeon HD 5870 GPU DEGIMA LINPACK HD 5870 GPU DEGIMA LINPACK GFlops/Watt GFlops/Watt Abstract GPU Computing has lately attracted

AMD/ATI Radeon HD 5870 GPU DEGIMA LINPACK HD 5870 GPU DEGIMA LINPACK GFlops/Watt GFlops/Watt Abstract GPU Computing has lately attracted DEGIMA LINPACK Energy Performance for LINPACK Benchmark on DEGIMA 1 AMD/ATI Radeon HD 5870 GPU DEGIMA LINPACK HD 5870 GPU DEGIMA LINPACK 1.4698 GFlops/Watt 1.9658 GFlops/Watt Abstract GPU Computing has

More information

アドバンストサーバ「HA8000シリーズ」において最新テクノロジーを採用しシステム性能を強化

アドバンストサーバ「HA8000シリーズ」において最新テクノロジーを採用しシステム性能を強化 1 月 16 日 アドバンストサーバ HA8000 シリーズ において最新テクノロジーを採用しシステム性能を強化 HA8000/130W HA8000/270 日立製作所情報 通信グループ ( グループ長 &CEO: 篠本学 以下日立 ) は アドバンストサーバ HA8000 シリーズ において プロセッサーをはじめとする最新のマルチコア (*1) プロセッサーや高速なシリアルディスクインタフェースなど最新テクノロジーを採用し

More information

about MPI

about MPI 本日 (4/16) の内容 1 並列計算の概要 並列化計算の目的 並列コンピュータ環境 並列プログラミングの方法 MPI を用いた並列プログラミング 並列化効率 2 並列計算の実行方法 Hello world モンテカルロ法による円周率計算 並列計算のはじまり 並列計算の最初の構想を イギリスの科学者リチャードソンが 1922 年に発表 < リチャードソンの夢 > 64000 人を円形の劇場に集めて

More information

Microsoft PowerPoint - 5-重谷.ppt

Microsoft PowerPoint - 5-重谷.ppt 理化学研究所スーパーコンピュータシステム RICC について 理化学研究所情報基盤センター重谷隆之 これまでの理研スーパーコンピュータシステム ~1994 年 2 月 : メインフレーム (FUJITSU M シリーズなど ) 1994 年 2 月 ~: ベクトル計算機 (Fujitsu VPP500) 1999 年 2 月 ~: ベクトル計算機 (Fujitsu VPP700E) 2004 年 3

More information

富士通HPCフォーラム.key

富士通HPCフォーラム.key & & RIKEN&ADVANCED&INSTITUTE&FOR&COMPUTATIONAL&SCIENCE はじめに LINPACK HPCGとは HPCGベンチマークプログラム HPCGのチューニングと性能 2 3 4 5 6 Jun. 2011 Nov.2011 Jun. 2012 Nov. 2012 Jun. 2013 Jun. 2014 System country PFLOPS System

More information

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2 ! OpenCL [Open Computing Language] 言 [OpenCL C 言 ] CPU, GPU, Cell/B.E.,DSP 言 行行 [OpenCL Runtime] OpenCL C 言 API Khronos OpenCL Working Group AMD Broadcom Blizzard Apple ARM Codeplay Electronic Arts Freescale

More information

資料2-1 計算科学・データ科学融合へ向けた東大情報基盤センターの取り組み(中村委員 資料)

資料2-1 計算科学・データ科学融合へ向けた東大情報基盤センターの取り組み(中村委員 資料) 資料 2-1 計算科学 データ科学融合へ向けた 東大情報基盤センターの取り組み 東京大学情報基盤センター中村宏 東大情報基盤センターのスパコン FY 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 Hitachi SR11K/J2 IBM Power-5+ 18.8TFLOPS, 16.4TB Hitachi HA8000 (T2K) AMD Opteron

More information

スライド 1

スライド 1 本日 (4/25) の内容 1 並列計算の概要 並列化計算の目的 並列コンピュータ環境 並列プログラミングの方法 MPI を用いた並列プログラミング 並列化効率 2 並列計算の実行方法 Hello world モンテカルロ法による円周率計算 並列計算のはじまり 並列計算の最初の構想を イギリスの科学者リチャードソンが 1922 年に発表 < リチャードソンの夢 > 64000 人を円形の劇場に集めて

More information

TSUBAME2.0におけるGPUの 活用方法

TSUBAME2.0におけるGPUの 活用方法 GPU プログラミング 基礎編 東京工業大学学術国際情報センター 1. GPU コンピューティングと TSUBAME2.0 スーパーコンピュータ GPU コンピューティングとは グラフィックプロセッサ (GPU) は グラフィック ゲームの画像計算のために 進化を続けてきた 現在 CPU のコア数は 2~12 個に対し GPU 中には数百コア その GPU を一般アプリケーションの高速化に利用! GPGPU

More information

Silk Central Connect 15.5 リリースノート

Silk Central Connect 15.5 リリースノート Silk Central Connect 15.5 リリースノート Micro Focus 575 Anton Blvd., Suite 510 Costa Mesa, CA 92626 Copyright Micro Focus 2014. All rights reserved. Silk Central Connect は Borland Software Corporation に由来する成果物を含んでいます,

More information

GPGPU によるアクセラレーション環境について

GPGPU によるアクセラレーション環境について GPGPU によるアクセラレーション環境について 長屋貴量 自然科学研究機構分子科学研究所技術課計算科学技術班 概要 GPGPU とは 単純で画一的なデータを一度に大量に処理することに特化したグラフィックカードの演算資源を 画像処理以外の汎用的な目的に応用する技術の一つである 近年 その演算能力は CPU で通常言われるムーアの法則に則った場合とは異なり 飛躍的に向上しており その演算性能に魅力を感じた各分野での応用が広がってきている

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション スーパーコンピュータ 京 で シミュレーションする生命科学 ~SCLS 計算機システムへの期待 ~ 理化学研究所 HPCI 計算生命科学推進プログラム企画調整グループパブリックアウトリーチ担当神内衣里香 (HPCI 戦略プログラム分野 1) 内容 京 革新的ハイパフォーマンス コンピューティング インフラ (HPCI) の構築 HPCI 戦略プログラム 分野 1 HPCI システム利用研究課題公募

More information

Microsoft PowerPoint - GPU_computing_2013_01.pptx

Microsoft PowerPoint - GPU_computing_2013_01.pptx GPU コンピューティン No.1 導入 東京工業大学 学術国際情報センター 青木尊之 1 GPU とは 2 GPGPU (General-purpose computing on graphics processing units) GPU を画像処理以外の一般的計算に使う GPU の魅力 高性能 : ハイエンド GPU はピーク 4 TFLOPS 超 手軽さ : 普通の PC にも装着できる 低価格

More information

Vol.214-HPC-145 No /7/3 C #pragma acc directive-name [clause [[,] clause] ] new-line structured block Fortran!$acc directive-name [clause [[,] c

Vol.214-HPC-145 No /7/3 C #pragma acc directive-name [clause [[,] clause] ] new-line structured block Fortran!$acc directive-name [clause [[,] c Vol.214-HPC-145 No.45 214/7/3 OpenACC 1 3,1,2 1,2 GPU CUDA OpenCL OpenACC OpenACC High-level OpenACC CPU Intex Xeon Phi K2X GPU Intel Xeon Phi 27% K2X GPU 24% 1. TSUBAME2.5 CPU GPU CUDA OpenCL CPU OpenMP

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2016.06.06 2016.06.06 1 / 60 2016.06.06 2 / 60 Windows, Mac Unix 0444-J 2016.06.06 3 / 60 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 0444-J 2016.06.06 4 / 60 ( : ) 6 6 ( ) 6 10 6 16 SX-ACE 6 17

More information