Microsoft Word - HOKUSAI_system_overview_ja.docx

Similar documents
インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

製品価格 ( 新規購入 ) INT6531 インテル VTune Amplifier XE 2017 for Windows Floating 1-275, ,000 INT6532 インテル VTune Amplifier XE 2017 for Linux Floating 1-27

Microsoft PowerPoint - スパコン説明会 HP.pptx

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

製品型番 商用版特定ユーザーライセンス INT7001 インテル System Studio 2018 FreeBSD \163,080 INT6673 インテル Media Server Studio 2017 Essentials \84,000 \90,720 Edit INT6674 インテ

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日

チューニング講習会 初級編

システムソリューションのご紹介

HPEハイパフォーマンスコンピューティング ソリューション

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し

アカ版特定ユーザーライセンス INT7006 INT7007 INT7008 INT6685 インテル System Studio 2018 Ultimate on \217,080 r インテル System Studio 2018 Ultimate on \217,080 r インテル Syst

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

( 4 ) GeoFEM ( 5 ) MDTEST ( 6 ) IOR 2 Oakleaf-FX 3 Oakleaf-FX 4 Oakleaf-FX Oakleaf-FX Oakleaf-FX 1 Oakleaf-FX 1 Oakleaf- FX SR11000/J2 HA8000 T

Microsoft Word - nvsi_100222jp_oracle_exadata.doc

hpc141_shirahata.pdf

untitled

untitled

CCS HPCサマーセミナー 並列数値計算アルゴリズム

FX10利用準備

appli_HPhi_install

Microsoft PowerPoint 知る集い(京都)最終.ppt

最新の並列計算事情とCAE

富士通のHPC向けクラウドサービス『TCクラウド』のご紹介

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

(速報) Xeon E 系モデル 新プロセッサ性能について

VXPRO R1400® ご提案資料

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

Click to edit title

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

RICCについて

Intel MPI Library Linux

PRIMERGY RX200 S8/RX350 S7とETERNUS LT40でのAcronis Backup & Recovery 11.5 Advanced Serverによるイメージバックアップ動作検証

GPU n Graphics Processing Unit CG CAD

HP High Performance Computing(HPC)

Microsoft Word - appli_SMASH_tutorial_2.docx

資料2-1 計算科学・データ科学融合へ向けた東大情報基盤センターの取り組み(中村委員 資料)

富士通PRIMERGYサーバ/ETERNUSストレージとXsigo VP560/VP780の接続検証

Windows Server 2016 Hyper-V ストレージQoS機能の強化

Microsoft Word - nvsi_050090jp_oracle10g_vlm.doc

スライド 1

GPUコンピューティング講習会パート1

THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHug

PRIMERGY TX1310 M1 未サポートOS動作検証確認情報

製品型番 アカデミック版フローティング ライセンス インテル Parallel Studio XE 2018 Composer INT6991 \232,000 \250,560 Floating 2-Pack アカデミック日本語版インテル Parallel Studio XE 2018 Compo

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx

PRIMERGY RX4770 M4 ご使用上の留意・注意事項

Fujitsu Standard Tool

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現

<4D F736F F F696E74202D20834B F C8FEE95F A7793C195CA8D758B E348C8E3893FA816A202D E >

スパコンに通じる並列プログラミングの基礎

日立アドバンストサーバ「HA8000シリーズ」の2プロセッサーモデル3機種を強化

インテル® Parallel Studio XE 2016 Update 1 for Linux* インストール・ガイド

PowerPoint プレゼンテーション

1. 京 の概要 システムの概要 ソフトウェアの概要 システムの信頼性 1

supercomputer2010.ppt

Parallel Studio XE Parallel Studio XE hotspot ( )

スライド 1

東北大学金属材料研究所 並列計算 インフォマティクスサーバ マニュアル 2019 年 10 月 3 日 東北大学金属材料研究所計算材料学センター

COBOL Enterprise Edition V2 for Linux COBOL Enterprise Edition V2 は以下のソフトウェアによって構成されています COBOL Enterprise Edition Developer V2.0 COBOL Enterprise Edit

1重谷.PDF

「BladeSymphony」「HA8000 シリーズ」において最新OS Windows Server 2008 プレインストールモデルを販売開始

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

(Microsoft Word - WhitePaper_EvaluationAvanceNVBU__rev2_\203t\203H\201[\203\200\211\374\222\371\224\305_.doc)

インテル® Parallel Studio XE 2013 Linux* 版インストール・ガイドおよびリリースノート

PowerPoint プレゼンテーション

Microsoft PowerPoint - RBU-introduction-J.pptx

情報処理概論(第二日目)

Intel Integrated Performance Premitives 4.1 Linux

PowerPoint プレゼンテーション

スライド 1

CELSIUSカタログ(2012年7月版)

KEK 技術研究会 2010/3/ /03/19 JPARC 実験データの共通計算機システムへの転送 高エネルギー加速器研究機構技術研究会 2010 年 3 月 19 日 KEK 共通基盤研究施設計算科学センター八代茂夫 2010/3/19 1/27 KEK 技術研究会 報告集の修正が入

インテル® Parallel Studio XE 2017 for Linux* インストール・ガイド

CLUSTERPRO SSS 動作環境編

untitled

Hphi実行環境導入マニュアル_v1.1.1

目次 1 はじめに 登録商標 商標 注意事項 免債事項 SR-IOV の機能概要 性能検証事例 測定環境 測定結果 各方式による共有 NIC 性能比較 ( ポートあ

スパコンに通じる並列プログラミングの基礎

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10

クラウド基盤向けに処理性能や拡張性を強化した「HA8000シリーズ」の2プロセッサーサーバを販売開始

東大センターのスパコン 2 基の大型システム,6 年サイクル (?) FY Yayoi: Hitachi SR16000/M1 IBM Power TFLOPS, 1152 TB T2K To

ÊÂÎó·×»»¤È¤Ï/OpenMP¤Î½éÊâ¡Ê£±¡Ë

Microsoft PowerPoint - ★13_日立_清水.ppt

独立行政法人理化学研究所 日本で唯一の自然科学の総合研究所 ( 文部科学省所管 ) 物理学 工学 化学 ライフサイエンス 脳科学 拠点 : 埼玉県和光市以外にも 国内 6 箇所 海外 3 箇所 人員 : 約 3000 名 ( これ以外に外来研究者等が約 3000 名 )

インテル Parallel Studio XE 2017 Composer Edition for Fortran Windows* インストール ガイド Rev (2017/06/08) エクセルソフト株式会社

Reedbush-U の概要 ログイン方法 東京大学情報基盤センタースーパーコンピューティング研究部門

当社の紹介 社名 代表取締役会長 代表取締役社長 株式会社森村設計 [ 英文社名 :P.T.Morimura & Associates, Ltd.] 森村武雄 森村潔 設立 本社 主な業務 1965 年 2 月 23 日 東京都目黒区中目黒 1 丁目 8 番 8 号 MEGURO F2 BUILDI

JPARC 実験データの共通計算機システムへの転送 八代茂夫 高エネルギー加速器研究機構共通基盤研究施設計算科学センター 概要 KEKCC のストレージシステム HPSS にアクセスするために用意されている各種のインターフェイスとそれぞれの特徴を述べる 次に HPSS への KEK 内からのアクセス

Microsoft PowerPoint - HPCフォーラム 新庄Final

理研スーパーコンピュータ・システム

本仕様はプロダクトバージョン Ver 以降に準じています

CELSIUSカタログ(2012年5月版)

sanboot-whitepaper.pdf

StoreEasy 1x40 RAID構成ガイド

本仕様はプロダクトバージョン Ver 以降に準じています

Transcription:

HOKUSAI システムの概要 1.1 システム構成 HOKUSAI システムは 超並列演算システム (GWMPC BWMPC) アプリケーション演算サーバ群 ( 大容量メモリ演算サーバ GPU 演算サーバ ) と システムの利用入口となるフロントエンドサーバ 用途の異なる 2 つのストレージ ( オンライン ストレージ 階層型ストレージ ) から構成されるシステムです 図 0-1 システム構成図 HOKUSAI GreatWave の超並列演算システム (GWMPC) は FUJITSU Supercomputer PRIMEHPC FX100 で構成します FX100 は高性能プロセッサ (SPARC64 XIfx) と高速メモリを採用し 1 ノードあたり 32 コア /CPU で 1TFLOPS( 倍精度 ) の理論演算性能と 480GB/s の高いメモリバンド幅を有します 超並列演算システムは 1,080 ノード ( 総理論演算性能 1PFLOPS 総主記憶容量 33.7TB) で構成され 6 次元メッシュ / トーラスインターコネクト (Torus Fusion インターコネクト 2* 1 ) により ノード間は 12.5GB/s 双方向で高速かつ低レイテンシに密結合されます * 1 Torus Fusion インターコネクト 2 は 富士通の高速インターコネクトの呼称です 1

大容量メモリ演算サーバ (ACSL) は PRIMERGY RX4770 M1 を 2 ノードで構成します 1 ノードの理論演算性能は 1.2TFLOPS 主記憶容量は 1.5TB です GPU 演算サーバ (ACSG) は SGI C2108-GP5 を 30 ノードで構成します 1 ノードの理論演算性能は 883.2GFLOPS 主記憶容量は 64GB です GPU 演算サーバ (ACSG) の各ノードにはアクセラレータ (NVIDIA Tesla K20X) を 4 枚搭載します 各ノードは InfiniBand FDR(6.8GB/s 双方向 ) で接続され 高速なノード間通信とファイル共有を実現します HOKUSAI BigWaterfall の超並列演算システム (BWMPC) は PRIMERGY CX2550 M4 を 840 ノードで構成します 1 ノードの理論演算性能は 3.07TFLOPS 主記憶容量は 96GB です 各ノードは InfiniBand EDR(12.6GB/s 双方向 ) で接続され 高速なノード間通信とファイル共有を実現します ストレージ環境は オンライン ストレージ (OFS) 階層型ストレージ (HSM) で構成します オンライン ストレージ (OFS) は 各ユーザーのホームディレクトリや課題グループ用の共有ディレクトリなど 広帯域でオンライン性のあるファイルシステムであり 超並列演算システム (GWMPC BWMPC) アプリケーション演算サーバ群およびフロントエンドサーバから参照可能です 利用可能容量は合計 7.2PB です 階層型ストレージ (HSM) は 長期保存が必要な大容量のデータ ファイルを格納するファイルシステムであり 1 次ストレージ ( キャッシュディスク )300TB 2 次ストレージ ( テープライブラリ装置 )7.9PB( 非圧縮 ) を用意しています ユーザーはテープライブラリ装置を操作することなく データのテープ書込み 読み出し操作が可能となります HOKUSAI システムへのアクセスは ssh/scp によるアクセスと HTTPS アクセス ( 利用者ポータル プログラミング支援ツール ) が可能です ユーザーはフロントエンドサーバ上にて プログラムの編集 コンパイル / リンク バッチジョブの操作 インタラクティブジョブの実行 チューニング デバッグ等の作業を行うことが可能です 2

1.2 ハードウェア概要 1.2.1 超並列演算システム (GWMPC) CPU: SPARC64 XIfx (1.975GHz) 1,080 台 (1,080CPU, 34,560 コア ) 理論ピーク性能 : 1.092PFLOPS (1.975GHz 16 演算 32 コア 1,080CPU) l メモリメモリ容量 : 33.7TB(32GB 1,080 台 ) メモリバンド幅 : 480GB/s/CPU メモリバンド幅 /FLOP: 0.47Byte/FLOP l インターコネクト (Tofu インターコネクト 2) 6 次元メッシュ / トーラス通信性能 : ノード間 12.5GB/s 双方向 1.2.2 アプリケーション演算サーバ (ACS) アプリケーション演算サーバは 大容量メモリ演算サーバ (ACSL) と GPU 演算サーバ (ACSG) で構成されます 1.2.2.1 大容量メモリ演算サーバ (ACSL) CPU: Intel Xeon E7-4880v2 (2.50GHz) 2 台 (8CPU, 120 コア ) 理論ピーク性能 : 2.4TFLOPS (2.5GHz 8 演算 15 コア 8CPU) l メモリメモリ容量 : 3TB(1.5TB 2 台 ) メモリバンド幅 : 42.7GB/s/CPU メモリバンド幅 /FLOP: 0.14Byte/FLOP l 内蔵ディスクディスク容量 : 3.6TB ((300GB 2 + 1.2TB) 2 台 ) l インターコネクト FDR InfiniBand 通信性能 : ノード間 6.8GB/s 2 本 双方向 3

1.2.2.2 GPU 演算サーバ (ACSG) CPU: Intel Xeon E5-2670 v3 (2.30GHz) 30 台 (60CPU, 720 コア ) 理論ピーク性能 : 26.4TFLOPS (2.3GHz 16 演算 12 コア 60CPU) l 主記憶メモリ容量 : 1.8TB(64GB 30 台 ) メモリバンド幅 : 68.2GB/s/CPU メモリバンド幅 /FLOP: 0.15Byte/FLOP l 内蔵ディスクディスク容量 : 18TB ((300GB 2) 30 台 ) l インターコネクト FDR InfiniBand 通信性能 : ノード間 6.8GB/s 双方向 l アクセラレータ NVIDIA Tesla K20X 4 枚 / ノード 1.2.3 超並列演算システム (BWMPC) CPU: Intel Xeon Gold 6148 (2.4GHz) 840 台 (1680CPU, 33,600 コア ) 理論ピーク性能 : 2.58 PFLOPS (2.4GHz 32 演算 20 コア 1680CPU) l 主記憶メモリ容量 : 78.7TB(96GB 840 台 ) メモリバンド幅 : 255GB/s/NODE メモリバンド幅 /FLOP: 0.08Byte/FLOP l 内蔵ディスクディスク容量 : 100.8TB (120GB 840 台 ) l インターコネクト EDR InfiniBand 通信性能 : ノード間 12.6GB/s 双方向 4

1.3 ソフトウェア構成 HOKUSAI システムで利用可能なソフトウェア一覧を以下に示します 項目 OS コンパイラライブラリツールジョブ管理システム 表 0-1 ソフトウェア一覧 超並列演算システム (GWMPC) 超並列演算システム (BWMPC) アプリケーション演算サーバ群 (ACS) XTCOS(FX100 用 OS) Red Hat Enterprise Red Hat Enterprise (Linux kernel version Linux 7(x 56 台 ) Linux 7 2.6) CentOS7(x 784 台 ) (Linux kernel (Linux kernel version 3.10) version 3.10) Technical Computing インテル Parallel Studio XE Cluster Edition Language(Fujitsu) インテル C/C++ および Fortran コンパイラ インテル TBB インテル Distribution for Python Technical Computing インテル Parallel Studio XE Cluster Edition Language(Fujitsu) インテル MKL - BLAS, LAPACK, インテル MPI ライブラリ ScaLAPACK, MPI, インテル MPI SSLII, C-SSLII, インテル IPP SSLII/MPI 高速 4 インテル DAAL 倍精度基本演算ライ ブラリ プログラミング支援ツー プログラミング支援ツール ル インテル Parallel Studio XE Cluster Edition インテル VTunr Amplifier XE インテル Advisor インテル Inspector インテル Trace Analyzer & Collector Technical Computing Suite フロントエンドサーバ Red Hat Enterprise Linux 7 (Linux kernel version 3.10) Technical Computing Language(Fujitsu) インテル Parallel Studio XE Cluster Edition インテル C/C++ および Fortran コンパイラインテル TBB インテル Distribution for Python Technical Computing Language(Fujitsu) インテル Parallel Studio XE Cluster Edition インテル MKL インテル MPI ライブラリインテル MPI インテル IPP インテル DAAL 5

アプリ ケーシ ョン Gaussian, GROMACS Gaussian(Red Hat Enterprise Linux 7(x 56 台 ) のみサポート ), ADF, AMBER, GAMESS, Q-Chem, GROMACS, NAMD, ROOT Gaussian, ADF, AMBER, ANSYS(gwacsl のみ ), GAMESS, MATLAB(gwacsg のみ ) Q-Chem, GROMACS, NAMD, ROOT GaussView, ANSYS(preppost) VMD, ROOT GWMPC(SPARC) と BWMP(Intel) アプリケーション演算サーバ群は (Intel) は異なる CPU アーキテクチャですが フロントエンドサーバにて両システムのプログラム開発が可能です 6