資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

Similar documents
Microsoft PowerPoint - ★13_日立_清水.ppt

システムソリューションのご紹介

PowerPoint プレゼンテーション

日立アドバンストサーバ「HA8000シリーズ」の2プロセッサーモデル3機種を強化

HA8000xH ハードウェア アーキテクチャーガイド

サーバプラットフォーム「BladeSymphony」、「HA8000シリーズ」の新モデルを販売開始

PowerPoint プレゼンテーション

(速報) Xeon E 系モデル 新プロセッサ性能について

Microsoft Word - アーキテクチャガイドxL_r1.doc

性能を強化した 第 12 世代 Dell PowerEdge サーバの RAID コントローラ Dell PERC H800 と PERC H810 の OLTP ワークロード性能比較 ソリューション性能分析グループ Luis Acosta アドバンストストレージエンジニアリング Joe Noyol

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

最新の並列計算事情とCAE

目次 日立テクニカルサーバラインナップ 日立サーバラインナップ 物理乱数発生カードの紹介 4 GPU コンピューティングへの取り組み 5 TOP50 状況 2

MAGNIA Storage Server Configuration Guide

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

「BladeSymphony」「HA8000 シリーズ」において最新OS Windows Server 2008 プレインストールモデルを販売開始

<4D F736F F F696E74202D204E505F8E9F90A291E E815B CFC82AF B838B B838B C5E B8D5C91A E E4E41532E7

1 本体 2.5 型ドライブモデル ( フレームモデル ) 製品名称 / 概要 Express5800/R110i-1(4C/E3-1220v6) 1 x インテル Xeon プロセッサー E3-1220v6 (3GHz, 4C/4T, 8 MB), メモリセレクタブル, ディスクレス, ODD レ

仮想ファイルプラットフォーム「Hitachi Virtual File Platform」のラインアップを刷新

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(6\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\).ppt)

Software-Defined Storage ware Virtual SAN ware Virtual SAN

Red Hat Enterprise Linux Server 7 動作確認表

Hadoop LZO圧縮機能の検証

Microsoft PowerPoint Quality-sama_Seminar.pptx

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

CELSIUSカタログ(2012年7月版)

Microsoft PowerPoint - (WEB)01-0_iStorage_M_ pptx

別紙 2 ハードウエア詳細仕様 (1 ハードウェア一覧 ) No. 設置場所 物理 HW/ サーバ番号 物理 HW/ サーバ名称 台数 台数 備考 想定製品 ( 型名 ) 想定製品 ( 品名 ) 菊水分庁舎 P-SVR001 APサーバ #1 1 1 アクティブ PYR2544R2N PRIMERG

CELSIUSカタログ(2012年5月版)

Microsoft Word - Dolphin Expressによる10Gbpソケット通信.docx

情報解禁日時 :12 月 20 日 ( 木 )11:00 以降 株式会社マウスコンピューター News Release MousePro 第 9 世代インテル CPU 搭載ビジネス向けデスクトップパソコンを 12 月 20 日 ( 木 ) 販売開始! ビジネス向けデスクトップパソコン MousePr

openmp1_Yaguchi_version_170530

Microsoft PowerPoint - (WEB)01-0_iStorage_M_ _r2.pptx

世界の技術を日本の品質で すべてはお客様の ベストパートナーであるために 1 2 納入分野 斬 新な 企画 展開力 高 品質 ダックスが持つ つの特長 3 交通機器 金融機器 医療機器 製造機器 工作機器 あらゆる分野へ 高信頼性 3 最 新 最適な 技術と開発 主な開発 生産製品 ダックスは産業用

Microsoft PowerPoint - (WEB)01-0_iStorage_M_ pptx

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

PowerPoint プレゼンテーション

修士論文

JP1 Version 11

AD-PROCYON システムが提供する機能とは? Next Generation Real-time Simulator/System Controller Platform 現行のシステムの問題点 プロセッサーの演算能力の制限 I/O インターフェースのレイテンシー AD-PROCYON システ

資料4 実証方法の詳細(案)

EMC ISILON S シリーズノードの仕様 ISILON S200 ノードの 特長とオプション 300 GB HDD 600 GB HDD 900 GB HDD 1.2 TB HDD (Isilon OneFS 以降が必要 ) 容量 (HDD/SSD) 5.4~7.2 TB/ 10.

Express5800シリーズ モジュラーサーバラインナップガイド

JP1 Version 12

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

untitled

GPUコンピューティング講習会パート1

目次 1. はじめに 用語説明 対象アダプタ P HBA/2P HBAで異なる性能 付録 ( 性能測定環境 ) P HBAでの性能測定環境 P HBAでの性能測定環境 本書の

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

CCS HPCサマーセミナー 並列数値計算アルゴリズム

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

Microsoft PowerPoint - CCS学際共同boku-08b.ppt

Express5800/GT110d スペック表 製品名称 Express5800/GT110d 製品型名 N Y N Y N Y 搭載 CPU インテル Celeron プロセッサー G530 インテル Pentium プロセッサー G630 インテ

スライド 1

HP xw9400 Workstation

Microsoft PowerPoint - DELL EMC PowerEdge 選定ガイド_ [読み取り専用]

Transcription:

今後の HPC 技術に関する 研究開発の方向性について 2012 年 5 月 30 日 ( 株 ) 日立製作所情報 通信システム社 IT プラットフォーム事業本部 Hitachi, Hitachi, Ltd. Ltd. Hitachi 2012. 2012. Ltd. 2012. All rights All rights All rights reserved. reserved. reserved.

1. 日立のテクニカルサーバ

1-1 日立テクニカルサーバの歴史 ベクトル型 S-820 S-810 単体 CPUの理論性能 3GFlops 達成日本国産初のヘ クトル型スハ コン スカラ並列型 SR2201 S-3800 単体 CPUの理論性能 8GFlops 達成 ( 世界初 ) ベクトル スカラ融合型 商用ヘ ース日本初の分散メモリ型並列機 SR8000 世界初のヘ クトル スカラ融合型 HPCマシン SR11000 ノート 当り理論性能 147.2GFlops( モテ ル K2) SR16000 クラスタシステム向け高性能サーバ HA8000Series(Xeon Base) Power7 フ ロセッサ採用 複数モテ ルをラインナッフ ( モテ ル XM1,M1,VM1) HA8000-tc/HT225 HA8000-tc/RS425 (Opteron Base) (Opteron Base) HA8000/RS210 (Xeon Base) PC サーバ Next Generation HPC Servers ハイエント の Itanium( 日立独自設計 ) サーハ 含め幅広いラインナッフ 1980 1985 1990 1995 2000 2005 2010 2015 :Xeon Itanium は アメリカ合衆国およびその他の国における Intel Corporation の商標です :POWER7 は米国およびその他の国における International Business Machines Corporation の登録商標です :AMD, Opteron は Advanced Micro Devices, Inc の商標または登録商標です 3

1-2 アーキテクチャの変遷 スカラ並列型 SR2000 SR2201 HA8000-tc PC サーバ HA8000 Commodity プロセッサ 分散メモリ型並列 RISC プロセッサ ベクトル型 S-810 S-820 ベクトル スカラ融合型 SR8000 SR11000 分散共有メモリ型並列 RISC プロセッサ S-3800 SR16000 4

1-3 テクニカルサーバに対する考え方 プログラムの特性 利用目的に応じたサーバをご提案 プログラム及び利用目的 ご提案サーバ ベクトル機時代のプログラムを継承 共有メモリの範囲で高演算性能 大規模共有メモリ空間 共有メモリ型並列を優先 SR16000/M1 1ノード当たり 理論演算性能 :980.48GFLOPS 最大メモリ容量 :256Gbyte 最大構成:512ノード 理論演算性能 :502TFLOPS 最大メモリ容量 :128TByte システムのトータル性能を重視 分散メモリ型並列での性能加速 PC との互換性重視 ISV ソフトウェアを利用 OSS を利用 HA8000-tc/HT225 1ノード当たり 理論演算性能 :294.40GFLOPS 最大メモリ容量 :32Gbyte 使用プロセッサ AMD Opteron TM プロセッサー 6276 5

1-4 ベクトル スカラ融合型 SR16000 POWER7 を搭載する大規模並列向けハイエンド HPC サーバ POWER7 3.83GHz 搭載と水冷技術より高密度実装を実現 従来機 SR16000/L2と比較し実装密度を約 7 倍に向上 980.48GFLOPSの高性能ノードを超高速ノード間 NWで密結合 高次元でバランスしたHPCサーバを実現 電力性能比は SR16000/L2 と比較し約 4.6 倍に向上 水冷技術によりサーバの発熱量全てを水で排熱 - モデル M1 専用筐体 - ( 最大 96 ノード搭載 ) プロセッサ周波数コア数 / ノード理論演算性能 / ノード最大メモリ / ノードシステム最大ノード数 POWER7 3.83GHz 32way 980.48GFLOPS 256GB 512 ノード (500.2TFLOPS, 128TB) 6

1-5 SR16000 のノード構成概略図 8MCM(8 ノード, 256 コア ) で 1 物理ノードを構成 1 物理ノード上の 8 ノード間は専用 NW で完全結合 ハブ チップ MCM: ノード 物理ノード上ハブ間 : 24GB/s/dir./Path バイセクション B/W : 768GB/s 物理ノード (256 コア = 大規模 JOB クラスタ ) 7

1-6 SR16000 のノード構成外観 8

1-7 PC サーバ HA8000-tc/HT225 プロセッサ : AMD Opteron 6140/ 6276 (2.3GHz 16 コア Interlagos) 2 294.4 GF メモリ : 最大 64GB (DDR3-1600) HDD : 2.5 SAS-2.0 HDD 4 (RAID 0,1,10) 拡張 I/O : PCI-Express(x16) 1 スロット, PCI-Express (x8) 2 スロット 電源 : シャーシ内 2 ノードで共用冗長構成 サーモサイフォン冷却 気化熱で CPU を冷却 Gas phases Radiator Cohesion Cooling Fan Coolant (Water) Vaporization Liquid phases Processor Mother board ラジエータで液化 冷却用ファンの回転数低減により 省電力 低騒音を実現 9

2. スーパーコンピュータの現状課題

2-1 Byte/Flop 演算性能とメモリ帯域の向上速度の乖離 100.00 10.00 8.00 8.00 8.00 4.00 1.00 1.38 0.52 0.10 S810 S820 S3800 SR8000 SR11000 SR16000 0.63GFLOPS 5Gbyte/ 秒 ベクトル型 約 1500 倍 約 100 倍 ベクトル スカラ融合型 980.48GFLOPS 512Gbyte/ 秒 プログラムの実行効率 ( 実効性能 / 理論性能 ) の低下 11

2-2 LINPACK 性能 トップ性能領域とボリュームゾーンの差異 100Pflops 10Pflops 1Pflops TOP500(11 月 ) の順位別性能の推移 1 位 100 位 200 位 300 位 400 位 500 位 第 1 位の性能 100Tflops 10Tflops 1Tflops ボリュームゾーン ボリュームゾーン 2005 2006 2007 2008 2009 2010 2011 年 第 1 位に対してボリュームゾーンは 1/100~1/1000 の性能 12

2-3 性能向上で必要なプログラム最適化技術 アプリケーションプログラムに要求されるプログラム最適化技術 キャッシュメモリ向け最適化 DMP( 分散メモリ向け並列 : ノード間通信 ) SMP( 共有メモリ向け並列 : 並列化指示文 ) スーパスカラ SIMD( ベクトル命令 ) SIMD 命令 S810 S820 S3800 SR8000 SR11000 SR16000 HA8000-tc 対応可能なプログラム ( 分野 ) のみ性能向上 高速フーリエ変換や疎行列解法などは性能向上が困難 DMP やキャッシュメモリ向け最適化は利用者の負担大 13

2-4 産業分野での利用を拡大する上での課題 構造解析や流体解析等の ISV ソフトウェアのサポート 業界標準 ISV ソフトウェアの多くが米国製で Commodity 計算機上で稼動 ISV に対して, 専用計算機に対する最適化を依頼するのは困難 プログラム開発及び性能向上 並列化及びキャッシュメモリ向けの複雑なプログラミング技術 計算機アーキテクチャ毎に異なるプログラム最適化技術 外部記憶装置への高性能な入出力処理 ゲノム分野など, 外部記憶装置への高性能な入出力処理が必須 14

3. 今後の HPC 技術に関する研究開発の方向性

3-1 HPC 技術に関する今後の方向性 実行効率 ( 実行性能 / 理論性能 ) の向上 実効演算性能 ( 自動チューニング ) プログラム開発容易性向上 通信性能 ( ネットワーク帯域 レイテンシ ) 外部記憶装置への高速な入出力性能 ISV ソフトウェアの高速化による産業分野への適用拡大 Commodity 計算機に add-on 可能な技術 疎行列の直接解法等の高速な数値計算ライブラリ 16

3-2 今後の HPC 関連技術とその展開 演算器 ネットワークアダプタ 数値計算ライブラリ アクセラレータ ハイエンド HPC サーバ 横展開 ボリュームゾーン向け HPC サーバ 並列ファイルシステム Commodity HPC サーバ プログラム開発容易性向上 外部記憶装置への高速な I/O ストレージシステム ISV ソフトウェアの性能加速 17

4. まとめ

4-1 まとめ 1. 実行効率向上 アプリケーション分野に合わせた複数のアーキテクチャ設計 ボリュームゾーンの性能を持つ計算機は実行効率を重視 低レイテンシ通信 入出力性能向上のためのファイルシステム, ストレージ設計 2. 開発技術の横展開 ボリュームゾーン,Commodity 計算機に応用可能な技術の開発 Commodity 計算機への適用で ISV ソフトウェアの性能を加速 3. プログラム開発の容易性向上 自動チューニング, 自動並列化 数値計算ライブラリ : その他記載の製品名 会社名は 各社の商標または登録商標です 19

20