PowerPoint プレゼンテーション

Similar documents
【資料3】エクサスケール時代に向けたソフトウェアベンダの産業利用に対する考え方・将来展望

アニュアルレポート2004

(速報) Xeon E 系モデル 新プロセッサ性能について

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

EPSON Safety Instructions Manual

環境報告書


EnSightのご紹介

CAE/CFD Revolution2007セミナー社長挨拶

サステナビリティ報告書

PowerPoint プレゼンテーション

2

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

DIGITAL IMAGE INNOVATION Colorio me p4 LP-9000C p6 TV LIVINGSTATION p8

RISO P ‘C’³

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP

修士論文

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

C O N T E N T S

(株)ソフトウェアクレイドル

PREFACE: The Origins of Quality A I D A E n g i n e e r i n g, LT D.

PowerPoint プレゼンテーション

はじめての OpenFOAM その 3 富 県 学 中川慎二 オープンCAE 富 2014 年 1 月 25 日 Disclaimer: OPENFOAM is a registered trade mark of OpenCFD Limited, the producer of the

PowerPoint Presentation

電気・電子用RTVシリコーンゴム

スライド 1

熱流体解析ソフトウェア|製品カタログ


MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

STAR-CCM+ の大規模並列化仕様とクラウドライセンス (PoD) ソリューション 株式会社 CD-adapco 吉田稔彦

NX10_150223J16AB_0116.ai

スライド 1

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

目次 LS-DYNA 利用の手引き 1 1. はじめに 利用できるバージョン 概要 1 2. TSUBAME での利用方法 使用可能な LS-DYNA の実行 4 (1) TSUBAMEにログイン 4 (2) バージョンの切り替え 4 (3) インタラ

年 3 月期

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

Microsoft Word - (Fix)Formlabs、オートデスクが協業.docx

GC-X3

ParkOptions&ACC_2001_Jap.ai

システムソリューションのご紹介

目次 1. CAD インターフェイス (3D_Analyzer&3D_Evolution) ユーザーインターフェイス機能強化 (3D_Analyzer&3D_Evolution)... 3 レポート... 3 クリッピング機能... 4 言語... 4 表示オプション

untitled

HPC可視化_小野2.pptx

TopSE並行システム はじめに


MISUMI It s about TIME QCT 8 12 CSR

( 作成方法 ) 1 メーカーの取扱説明書に記載されている 2 PC 購入店で作成してもらう (PC デポで6000 円 ) 3 リカバリー作成ソフトがインストールされている ⑵ PC 丸ごと ( システムイメージ ) のバックアップ バックアップ方法 注 4 USB 接続の外付け HDD を使用

三菱日立パワーシステムズのグループ会社について


aishin00_100608

6.indd

CELSIUSカタログ(2012年7月版)

CELSIUSカタログ(2012年5月版)

95 SMBC

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

CLEFIA_ISEC発表

技術資料 JARI Research Journal OpenFOAM を用いた沿道大気質モデルの開発 Development of a Roadside Air Quality Model with OpenFOAM 木村真 *1 Shin KIMURA 伊藤晃佳 *2 Akiy

GPGPUクラスタの性能評価

FFT

東北大学金属材料研究所 並列計算 インフォマティクスサーバ マニュアル 2019 年 10 月 3 日 東北大学金属材料研究所計算材料学センター

富士通セミコンダクタープレスリリース 2009/05/19

15690B_表紙1-4.pdf

?? 1 DTU



Ł\”ƒ1

IBM Rational Software Delivery Platform v7.0 What's

Microsoft PowerPoint Quality-sama_Seminar.pptx

日立アドバンストサーバ「HA8000シリーズ」の2プロセッサーモデル3機種を強化

Transcription:

PC クラスタワークショップ in 柏 2015 クレイドルの最新情報と CPU 事情 2015 年 06 月 株式会社ソフトウェアクレイドル技術部阿部 1

会社紹介 2

事業内容 主な事業内容 パッケージソフトウェアの開発 販売 テクニカルサポート eメール 電話 FAX 修正プログラムの配布 教育 各種セミナー 定期講習会の開催 受託解析 エンジニアリングサービス カスタマイズサービス 3

クレイドル及び関連会社 大阪本社 東京支社 JR大阪駅から徒歩5分 JR大崎駅前 China Japan USA France Spain India Taiwan Italy Cradle North America Inc. Ohio, USA Applied Thermal Fluid Analysis Center, Ltd. ( A.T.A.C ) Taipei, Taiwan Cradle North America Inc. (France Office) ContraVolts InfoTech Pvt. Ltd Lyon, France Bangalore, India 4

ビジネスパートナー 販売代理店 アジア 日本 三菱重工マシナリーテクノロジー株式会社 http://www.mhimt.co.jp/ アジア 韓国 CEDIC Co., Ltd. CEDIC www.cedic.biz/ 中国 Shanghai HongYuan Information Tech. Co., Ltd. www.hongyuantek.com/ Nanjing Tianfu Software Co., Ltd. www.njtf.cn/ Shanghai Union Building Technology Co., Ltd. www.yntec.cn Beijing FEAonline Nanjing Tianfu Shanghai HongYuan Shanghai Union Building 三菱重工マシナリー テクノロジー株式会社 Beijing FEAonline Engineering Co., Ltd www.feaonline.com.cn 5

ビジネスパートナー 販売代理店 欧米 欧州 中東 欧州 中東 ヨーロッパ ハンガリー イタリア スペイン 英国 CFD Engineering Hungary Ltd.(Hungary) Flow Computing Technologies Ltd. KITE www.cfdengineering.hu KITE GROUP s.r.l (Italy) www.kitegroup.eu Cosmos Italia s.r.l (Italy) www.cosmositalia.it ANALYSIS Y SIMULACION S.L.(Spain) www.analisisysimulacion.com ANALYSUS Y SIMULACION Cosmos Italia CFD Engineering RMC MUHENDISLIK Flow Computing Technologies Ltd. (UK) www.cfdengineering.co.uk 中東 RMC MUHENDISLIK Ltd. (Turkey) 欧米 www.rmc.com.tr アメリカ Global Computing S.A. de C.V. http://www.globalcomputing.com.mx/index.html Global Computing 6

ソフトウェア製品 7

製品紹介 :STREAM Click on figure クレイドル設立以来 20 年以上の実績を誇る汎用流体解析プログラム 圧倒的な使い易さと高速演算が特徴です 適用分野建築土木 ビル風 都市計画 床下換気 防波効果 環境設備 室内温熱対策 室内換気効率 クリーンルーム清浄度 工場設備空調他 輻射 日射 熱回路網モデル 空調特化機能 ( 空調機モデル 換気効率 ) ファンモデル 多種流体 自由表面 粒子追跡 湿度 / 結露 凝固 / 融解 拡散 化学反応 非ニュートン流体 ( せん断発熱考慮 ) 多孔質体 伝熱パネル 流体騒音 8

製品紹介 :SCRYU/Tetra Click on figure 表面形状を的確に捉えるためにハイブリッドメッシュを採用した汎用流体解析プログラム 洗練されたメッシュ生成機能と高速演算 低メモリー消費 そして総合的な使い易さが特徴的です 適用分野自動車 ( 空力 エンジン 各種部品 ) 回転機器 ( ファン ポンプ タービン ) 電気 電子 ( 放熱設計 家電製品 ) 化学 (CVD 装置 攪拌槽 ) 他 移動メッシュ ( 重合格子 6 自由度 ) 解適合メッシュ 混相流 ( 自由表面 キャビテーションモデル ) 流体音 流体 - 構造連成 大規模並列処理 9

トピックス 10

新バージョン V12 リリース 2015 年 6 月 12 日 STREAM, 熱設計 PAC, SCRYU/Tetra の新バージョン V12 がリリースされました 新機能は多数ありますが その中で STREAM に実装された MPI OpenMP のハイブリッド並列についてご紹介します 11

並列手法について V11まで MPIのみで並列(フラットMPI) 解析領域を分割し それぞれのランクが分割された部分領域を 演算している 2並列の例 rank0が演算 rank1が演算 並列無しの場合 並列演算のために 解析領域を分割 V12から MPI x OpenMPのハイブリッド並列 MPIでの分割に加え 各ランクに割り当てられた部分領域内にお いて ループレベルでスレッドに演算を割り当てている 12

フラットMPIでの問題点 処理量の偏り STREAMは構造格子 解析領域の分割を均等に行えない場合 があり 各rankの処理量が不均一になってしまう rank0が演算 rank1が演算 rank2が演算 rank3が演算 分割 メッシュが密な部分 他のrank(コア)より処理量が多 くなり ここが終わるまで他は 待つことに 実際はできるだけ均等になるように分割されます 分割数が増えたりモデルが複雑になってくると 均等に分割することが難しくなってくるため ハイブリッド並列によりMPIでの解析領域の分割数をなるべく減らすことで均等な分割をし易く しつつ スレッド並列によって演算速度を確保することを期待しました 13

平均処理量を 1 とした場合の比 処理量 ( フラット MPI 28 並列 ) 1.8 10 秒間の各コアの処理量 ( フラット MPI ) 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0.8~1.25 程の間に散らばっている 0 1 2 3 4 5 6 7 8 9 10 時間 [sec] core00 core01 core02 core03 core04 core05 core06 core07 core08 core09 core10 core11 core12 core13 core14 core15 core16 core17 core18 core19 core20 core21 core22 core23 core24 core25 core26 core27 14

平均処理量を 1 とした場合の比 処理量 ( ハイブリッド 4MPI x 7T) 1.8 10 秒間の各コアの処理量 ( ハイブリッド ) 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 フラット MPI に比べて処理量のばらつきが小さい 0 1 2 3 4 5 6 7 8 9 10 時間 [sec] core00 core01 core02 core03 core04 core05 core06 core07 core08 core09 core10 core11 core12 core13 core14 core15 core16 core17 core18 core19 core20 core21 core22 core23 core24 core25 core26 core27 15

ExecTime [sec] ハイブリッド並列の効果 領域分割で偏りの出やすいモデルでもハイブリッド並列では各コアの処理量の偏りを小さくできる -> CPU リソースの有効利用 同一のモデル 同一コア数で 実際の解析速度においてもハイブリッド並列の方が大幅に高速な場合がある 200 180 160 140 120 100 80 60 40 20 0 フラット MPI 28 vs ハイブリッド 4p 7t x1.7 FlatMPI Hybrid その他にも 領域分割以外でも処理量の偏りは発生 その偏りの軽減 メモリ消費量の軽減 多並列時の通信量の低減 メニーコアへの対応 等メリットは他にも期待できる マルチブロック機能を使った場合の事例 16

ライセンス HPC 版ライセンスをお持ちのユーザーには 2 スレッドまで自動的にご利用いただけます => 並列数が倍! 但し 1 プロセス 2 スレッドまでの固定 解析状況に合うように スレッド数はオプションで増やすことができます => スレッド数を自由に設定できる 17

メニーコアな CPU は早いのか? ~ 過去数年間にリリースされた CPU とクレイドル製品の関係 ~ 2007 年 ~2014 年に発売された CPU が搭載された 2CPU 構成のマシンで STREAM V11 および SCRYU/Tetra V11 を実行し 解析速度を比較して見ました 18

STREAM 全て Intel Xeon プロセッサーです 発売年 動作周波数 Core [GHz] メモリ帯域幅 EXEC [GB/s] TIME [s] CPU コードネーム X5482 Harpertown 2007 3.20 8 12.8 1260 1.00 W5590 Nehalem 2009 3.33 8 64.0 354 3.56 3.56 W5680 Westwere 2010 3.33 12 64.0 332 3.80 1.07 E5-2690 SandyBridge 2012 2.90 16 102.4 199 6.33 1.67 E5-2697v2 IvyBridge 2013 2.70 24 119.4 148 8.51 1.34 E5-2697v3 Haswell 2014 2.60 28 136.0 112 11.25 1.32 要素数1000万 X5482基準 前世代基準 各CPUがメモ リコントロー ラーを持つ NUMA構成へ 空力 温度解析 CPU単位での性能向上は見られますが 基本的にメモリ帯域幅に依存しています 19

SCRYU/Tetra 全て Intel Xeon プロセッサーです 発売年 動作周波数 Core [GHz] メモリ帯域幅 CPU TIME X5482基準 [GB/s] [s] CPU コードネーム X5482 Harpertown 2007 3.20 8 12.8 614 1.00 W5590 Nehalem 2009 3.33 8 64.0 243 2.52 2.52 W5680 Westwere 2010 3.33 12 64.0 195 3.15 1.25 E5-2690 SandyBridge 2012 2.90 16 102.4 118 5.22 1.66 E5-2697v2 IvyBridge 2013 2.70 24 119.4 87 7.05 1.35 E5-2697v3 Haswell 2014 2.60 28 136.0 70 8.77 1.24 要素数1000万 前世代基準 空力 温度解析 STREAMよりはメモリ帯域幅への依存は小さいですが やはり 依存します モデルによっては速度は完全にメモリ帯域幅で決 まります コア数(並列数)を増やすことで伸びるモデルもあり ます 20

ご清聴ありがとうございました 21