Microsoft PowerPoint PCクラスタワークショップin京都.ppt

Similar documents
システムソリューションのご紹介

Microsoft Word - HOKUSAI_system_overview_ja.docx

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

RICCについて

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

BX900 S1/S2/BX400 S1シャーシの搭載制限について

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

独立行政法人理化学研究所 日本で唯一の自然科学の総合研究所 ( 文部科学省所管 ) 物理学 工学 化学 ライフサイエンス 脳科学 拠点 : 埼玉県和光市以外にも 国内 6 箇所 海外 3 箇所 人員 : 約 3000 名 ( これ以外に外来研究者等が約 3000 名 )

スライド 1

1重谷.PDF

<4D F736F F D B B B835E895E97708A4A8E6E82C A98418C6782CC8E6E93AE2E646F63>

Microsoft PowerPoint - 5-重谷.ppt

hpc141_shirahata.pdf

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

PowerPoint プレゼンテーション

ServerView Resource Orchestrator V3.0 Cloud Edition サポート機種情報

目次 1 はじめに 登録商標 商標 注意事項 免債事項 SR-IOV の機能概要 性能検証事例 測定環境 測定結果 各方式による共有 NIC 性能比較 ( ポートあ

Microsoft Word - nvsi_100222jp_oracle_exadata.doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word - koubo-H26.doc

スーパーコンピュータ「京」の概要

富士通PRIMERGYサーバ/ETERNUSストレージとXsigo VP560/VP780の接続検証

スライド 1

(速報) Xeon E 系モデル 新プロセッサ性能について

Windows Server 2016 Hyper-V ストレージQoS機能の強化

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

sanboot-whitepaper.pdf

PRIMERGY スイッチブレード(10Gbps 18/8)

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(6\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\).ppt)

Microsoft PowerPoint - ★13_日立_清水.ppt

1.システム構成図

CELSIUSカタログ(2012年7月版)

PRIMERGY RX4770 M4 ご使用上の留意・注意事項

富士通のHPC向けクラウドサービス『TCクラウド』のご紹介

PowerPoint プレゼンテーション

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(5\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\201j.ppt)

Microsoft Word ●MPI性能検証_志田_ _更新__ doc

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

ご使用上の留意事項 / ドキュメント修正事項

チューニング講習会 初級編

VXPRO R1400® ご提案資料

アドバンストサーバ「HA8000シリーズ」において最新テクノロジーを採用しシステム性能を強化

ご使用上の留意・注意事項

PRIMERGYマネジメントブレード

富士通セミコンダクタープレスリリース 2009/05/19

PRIMERGY RX200 S8/RX350 S7とETERNUS LT40でのAcronis Backup & Recovery 11.5 Advanced Serverによるイメージバックアップ動作検証

11 月発表の Green500 最新結果の顛末 本来は Green500 で 1-4 位独占を実現する目論見であった 7 月の ISC で 計測ルールが v2.0 になることが予告された ( 現行の v1.2 ルールでの計測値改善には注力せず v2.0 対応作業のみ進めていた ) 最後まで v1.

相続支払い対策ポイント

150423HC相続資産圧縮対策のポイント

ハピタス のコピー.pages

Copyright 2008 All Rights Reserved 2

PRIMERGY LANパススルーブレード(10Gbps 18/18) ハンドブック

最新の並列計算事情とCAE

PRIMERGYの遠隔管理 リモートマネジメントご紹介

GPGPUクラスタの性能評価

CELSIUSカタログ(2012年5月版)

Microsoft PowerPoint - SS研200911姫野_最新.ppt

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

Microsoft PowerPoint - DELL EMC PowerEdge 選定ガイド_ [読み取り専用]

スライド 1

別紙 2 ハードウエア詳細仕様 (1 ハードウェア一覧 ) No. 設置場所 物理 HW/ サーバ番号 物理 HW/ サーバ名称 台数 台数 備考 想定製品 ( 型名 ) 想定製品 ( 品名 ) 菊水分庁舎 P-SVR001 APサーバ #1 1 1 アクティブ PYR2544R2N PRIMERG

Microsoft PowerPoint - CCS学際共同boku-08b.ppt

IAサーバ:PRIMERGY

PowerPoint プレゼンテーション

 

PRIMERGY SX960 S1 ストレージブレード(PY-S96AD2)

MAGNIA Storage Server Configuration Guide

インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美

富士通PCサーバ「PRIMERGY RX2530 M4」における「TeraStation TS5010 / TS3010」シリーズ動作検証報告

PRIMERGY RX300 S5 ご使用上の注意

HP_PPT_Standard_16x9_JP

サーバプラットフォーム「BladeSymphony」、「HA8000シリーズ」の新モデルを販売開始

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

PowerPoint プレゼンテーション

untitled

世界の技術を日本の品質で すべてはお客様の ベストパートナーであるために 1 2 納入分野 斬 新な 企画 展開力 高 品質 ダックスが持つ つの特長 3 交通機器 金融機器 医療機器 製造機器 工作機器 あらゆる分野へ 高信頼性 3 最 新 最適な 技術と開発 主な開発 生産製品 ダックスは産業用

untitled

Arcserve Backup r16 新機能 テープブロックサイズの拡張 効果実測 Arcserve Japan 1.5 版

ハードディスクキャビネット PRIMERGY SX30 [ PG-R1DC7, PG-DC107 ]

Fujitsu Standard Tool

PRIMERGY スイッチブレード(1Gbps 36/12)

Microsoft Word - 2.機器仕様書_251011修正

<4D F736F F F696E74202D204E505F8E9F90A291E E815B CFC82AF B838B B838B C5E B8D5C91A E E4E41532E7

目次 1. はじめに SSL 通信を使用する上での課題 SSL アクセラレーターによる解決 SSL アクセラレーターの導入例 SSL アクセラレーターの効果... 6 富士通の SSL アクセラレーター装置のラインナップ... 8

FUJITSU Storage ETERNUS DX 構築ガイド(サーバ接続編) FCoE/Windows®用

1 本体 2.5 型ドライブモデル ( フレームモデル ) 製品名称 / 概要 Express5800/R110i-1(4C/E3-1220v6) 1 x インテル Xeon プロセッサー E3-1220v6 (3GHz, 4C/4T, 8 MB), メモリセレクタブル, ディスクレス, ODD レ

GPUコンピューティング講習会パート1

技術が生み出す魔法!最新ハードウェアとチューニングで激速データベース

仮想ファイルプラットフォーム「Hitachi Virtual File Platform」のラインアップを刷新

初心者にもできるアメブロカスタマイズ新2016.pages

Windows Server 2008 R2とPRIMERGYによる消費電力削減効果

FUJITSU Server PRIMERGY / FUJITSU Storage ETERNUS NR1000 F2240とSophos Anti-Virus for NetAppの連携におけるウイルス検知の動作検証

「BladeSymphony」「HA8000 シリーズ」において最新OS Windows Server 2008 プレインストールモデルを販売開始

- 2 Copyright (C) All Rights Reserved.

PowerPoint プレゼンテーション

ms_2.pptx

スライド 1

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

Transcription:

PC クラスタシステムへの富士通の取り組み 富士通株式会社株式会社富士通研究所久門耕一 29 年度に富士通が提供する ( した ) 大規模クラスタ 今年度はCPUとしてメモリバンド幅がNehalem, QDR- IB( 片方向 4GB/s) などPCクラスタにとって期待できる多くのコモディティコンポーネントが出現 これら魅力ある素材を使ったシステムとして 2つのシステムをご紹介 理化学研究所様 RICC(Riken Integrated Cluster of Cluster) 特徴 : Nehalem1+1(w/GPU) ノードクラスタ 上位スイッチのバンド幅を1/5に絞り コスト圧縮スケジューラによりバンド幅有効利用のジョブ割付 124 ノード超並列 合計 1156 ノード 1 ノード多目的 1/5FBB IB Ethernet 日本原子力研究開発機構様新スパコンシステム特徴 : ブレードサーバ BX9 と内蔵 QDR-InfiniBand による PC クラスタ 32 ノード多目的 1

理化学研究所様新スパコンシステム 29 年 8 月から稼働開始 Riken Integrated Cluster of Cluster (RICC) 超並列 PC クラスタ (96.TFLOPS 12TB メモリ ) PRIMERGY RX2S5 1 ノード (8 コア ) 多目的 PC クラスタ (1 ノード 8 コア w/ GPU) 多目的 PC クラスタ [MDGRAPE-3 接続用 ] (32 ノード 256 コア ) 大容量メモリ計算機 (239GFLOPS 512GB メモリ ) 管理者システム管理利用状況確認 Ethernet 系ネットワーク 計算系ネットワーク SPARC Enterprise M9 ETERNUS2 利用者ターミナル /Web PRIMERGY RX2S5 ネットワーク機器等 フロントエンド システム 磁気ディスク装置 (55TB) アーカイブ装置 (4PB) 2 日本原子力研究開発機構様新スパコンシステム概要 21 年 3 月稼動予定 次世代コード開発部 FX1 32 ノード 12TFLOPS 4.6TB メモリ 大規模並列演算部 PRIMERGY BX9 2,157 ノード 2TFLOPS 5TB メモリ 119+1 シャーシ 共用メモリ型演算サーバ SPARC Enterprise M9 1.9TFLOPS 384GB メモリ 25TB 122.4TF 以上なら国内最速システムになる?(= 効率 62% 以上なら ) InfiniBand スイッチ ギガビットイーサネットスイッチ 磁気ディスク装置 ETERNUS4 M6 磁気ディスク装置 [ 物理容量 : 1.2PB] I/O ノード SPARC Enterprise M9(2 台 ) 1PB LAN ETERNUS DX8 (36 台 ) 磁気テープライブラリ装置 ETERNUS LT27(2 台 ) 3

29 年度大規模スパコン商談 合計 75 ノード 53TFlopw 4 ミッドレンジを重視するため PC クラスタビジネス推進室を設置 (29.12.21) ~ 数千ノード ~1ノード程度 ~3ノード程度 ~8ノード程度 ハイエンド市場 ミッドレンジ市場 ハイエンド市場においては 当社は国内トップの実績 民間企業での CAE 利用を中心にミッドレンジ市場が高成長 ミッドレンジ市場に本格参入 PC クラスタのエキスパートによる専任組織化 ハイエンド市場で培った高度なノウハウを裾野へ拡大 おすすめモデルによる簡単導入 OSS などを活用した新たなサービス提供 FTS( 富士通テクノロジーソリューション ) との連携によるグローバル展開 5 All Rights Reserved, Copyright 21 FUJITSU FUJITSU LIMITED LIMITED 29

ブレードサーバ PRIMERGY BX9 1U に 18 ノード搭載可能大規模クラスタや 部門間サーバ集約などに最適なブレードサーバ 業界最高クラスの実装効率と設置性 18 ブレード (2CPU/ ブレード ) /1U シャーシ 高効率部品の採用による低電力設計 新静音ファンの開発による高い静粛性を実現 最先端の HPC 向け仕様 Intel Xeon55 シリーズ (Nehalem) を 2 ソケット搭載 InfiniBand QDR(4GB/s) をメザニンカードで搭載 1Gb シリアル通信可能な高品質ハ ックフ レーンで接続 内蔵 36 ポート SW により外部 18 ポート出力 数シャーシまでの小中規模クラスタを外部 SW レスで構築可能 高信頼設計 ECC メモリ (SDDC 対応 ) RAID ディスク 冗長電源 リモート管理機能等 SDDC (Single Device Data Correction) 6 PRIMERGY BX9 BX92 S1 サーバブレード SX94 S1 ストレージブレード 理研システム新システムの性能 (LINPACK) 29 年 6 月 4 位 132 ノード (8256 コア ) 87.89TF(9.83%) 国内 PC クラスタ一位 ( 発表時 ) 富士通研開発の DGEMM を用い 事業部が HPL をチューニング 29 年 11 月 47 位 1131 ノード (948 コア ) 97.94TFlops(92.36%) Nehalem のターボモードを使い単体性能向上 Nehalem のターボモードとは CPU に熱的余裕があるときに コアクロック周波数を自動で上げ性能を向上させる Nehalem CPU の機能 どのぐらいよくなる? 性能は増加するが 電力も増加 どのぐらい増える? 7

周波数と性能電力の関係 ( 姫野 )BMT ターボモード時の実効周波数は不明 性能から見て 1ステップ分 (3.6GHz 相当 ) 向上 電力は性能向上以上に増加 その理由は? Nehalemの低消費電力性は アイドル時のクロック停止とパワーゲーティング (C6ステート) による ( 逆に言うとC6に入らないと電力はあまり減らない ) CPU Voltage[mV] 12 Watt 1 8 6 4 2 45 4 35 3 25 2 15 1 5 実行時消費電力 CPU 周波数とコア電圧 クロック固定のアイドル時消費電力 姫野 BMT 性能 Idle 1.57 1.73 1.86 2 2.13 2.26 2.39 2.53 2.66 2.79 2.93 Turbo CPU Frequency [GHz] Disabled Power (W) 8 335 (+16.1%) 4 359 1.6 1.73 1.86 2. 2.13 2.26 2.4 2.53 2.66 2.8 2.93 Turbo CPU Freq (GHz) PCクラスタワークショップin 京都 (21 年 2 月 19 日 ) 8 Idle 11.56 Himeno Enabled 12.25 389 Linpack TurboBoost 増分 Disabled Enabled 増分 GFLOPS (+6.%) 86.57 88.7 (+2.5%) 381 (+6.1%) 14 12 1 6 2 GFLOPS GPU 搭載 PC クラスタの課題 GPU CPU NIC NIC CPU GPU GPU メモリ メインメモリ メインメモリ GPU メモリ CPU だけ利用する PC クラスタでのクラスタ間データ転送 メインメモリ (CPU) NIC NIC (CPU) メインメモリ GPU を使う PC クラスタでのクラスタ間データ転送 GPU メモリ (GPU) (CPU) メインメモリ (CPU) NIC NIC (CPU) メインメモリ (CPU) (GPU) GPU メモリ GPUクラスタでは GPU 演算性能は高い が レイテンシは長い 計算時間 通信時間 Embarrassingly Parallelでないと 並列効果が出にくい 通信と計算のオーバラップによる通信時間隠蔽も限界 9

GPU himenobmt on RICC himenobmt のように 通信が多いプログラムでも 大きな問題 (XXL) を解けば性能は出る 1 理研新システム (RICC) ジョブ実行率状況 1/1-1/3-1/5-1/7-1/9-1/11-1/13-1/15-1/17-1/19-1/21-1/23-1/27-21 1/29-21 1/31-23 11/2-23 11/4-23 11/6-23 11/8-23 11/1-23 11/12-23 1 9 8 7 6 5 4 3 2 1 正式運用移行期間 新システム (RICC) は 21/1/1 に正式運用移行 全クラスタのノードをメタジョブスケジューラで統一管理 ユーザ間フェアシェア 連成実行 順序実行 リソース指定 ( メモリ量 GPU, その他 ) 従来のメタジョブスケジューラをマルチコア用に改良 コア ソケット ノード単位と局所性を保ちながら 空間 + 時間軸上で割付 高効率に実行 特定 rank だけメモリ量を増大させる割り当ても可能 超大規模並列ジョブ (2 コア以上 ) 実行前の稼働率低下防止が今後の課題 バックフィルできるジョブが十分には見つからない node512 node256 node64 node16 node4 node1 socket core 11

理研新システム (RICC) ジョブ実行率状況 1 9 8 7 6 5 4 3 2 1 1/27-5 1/29-5 新システム (RICC) は 21/1/1 に正式運用移行 全クラスタのノードをメタジョブスケジューラで統一管理 ユーザ間フェアシェア 連成実行 順序実行 リソース指定 ( メモリ量 GPU, その他 ) 従来のメタジョブスケジューラをマルチコア用に改良 コア ソケット ノード単位と局所性を保ちながら 空間 + 時間軸上で割付 高効率に実行 特定 rank だけメモリ量を増大させる割り当ても可能 超大規模並列ジョブ (2 コア以上 ) 実行前の稼働率低下防止が今後の課題 バックフィルできるジョブが十分には見つからない 1/31-7 11/2-7 node512 node256 node64 node16 node4 node1 socket core 12 おわりに 今後 HPC 計算は学術的計算 技術計算だけでなく 社会のあらゆる活動を支える基盤技術になると考えています 富士通は BX9のようなコモディティであるシステム素材をベースに コンパクトで高性能なHPCシステムの提供を行っていきます また 高性能演算ルーチンの開発 新たなGPUの利用技術の開発 構築運用管理の簡素化と高効率化を図る管理システムの提供を行ってゆきたいと思います 13

14