(速報) Xeon E 系モデル 新プロセッサ性能について

Similar documents
― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

VXPRO R1400® ご提案資料

性能を強化した 第 12 世代 Dell PowerEdge サーバの RAID コントローラ Dell PERC H800 と PERC H810 の OLTP ワークロード性能比較 ソリューション性能分析グループ Luis Acosta アドバンストストレージエンジニアリング Joe Noyol

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

VMware ESXiサポート版数一覧表(PRIMERGY機種別)

シナリオ6:自動再起動(ServerView ASR&R)

Windows Server 2008 R2とPRIMERGYによる消費電力削減効果

Red Hat Enterprise Linux OSの手動インストール

PowerPoint プレゼンテーション

システムソリューションのご紹介

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

PassMark PerformanceTest ™

SASカード (PG-228B/BL, PG-224B) 取扱説明書 追補版

富士通PCサーバ「PRIMERGY RX2530 M4」における「TeraStation TS5010 / TS3010」シリーズ動作検証報告

富士通株式会社製サーバ「PRIMERGY TX200 S6」とVIRIDENT社製「tachIOn」接続検証結果

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

sanboot-whitepaper.pdf

PowerPoint プレゼンテーション

PGRelief C/C++ 強化ポイント説明書

PRIMERGY RX200 S5 システム構成図 (2010年4月版) 樹系図

Quad port LANカード(10GBASE-T) 取扱説明書

目次 1 はじめに 登録商標 商標 注意事項 免債事項 SR-IOV の機能概要 性能検証事例 測定環境 測定結果 各方式による共有 NIC 性能比較 ( ポートあ

HA8000 シリーズハードウェアアーキテクチャーガイド (2012 年 11 月 ~ モデル ) 本アーキテクチャーガイドの注意事項について 本書の内容の一部 または全部を無断で転載したり 複写することは固くお断りします 本書の内容については 改良のため予告なしに変更することがあります 本書の内容

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

LANカード(PG-2871) 取扱説明書

Microsoft Word - HOKUSAI_system_overview_ja.docx

PRIMERGY TX120 S2 システム構成図 (2010年9月版) 樹系図

PRIMERGY TX120 S2 システム構成図 (2010年5月版) 樹系図

日立アドバンストサーバ「HA8000シリーズ」の2プロセッサーモデル3機種を強化

Windows Server 2016 Hyper-V ストレージQoS機能の強化

Microsoft PowerPoint - JANOG19-u10-GigaPcap(NonAnim).ppt

Microsoft Word - Dolphin Expressによる10Gbpソケット通信.docx

Microsoft Word - アーキテクチャガイドxL_r1.doc

PRIMERGY RX300 S5 ご使用上の注意

ServerView Suite V

また 64 ビット プロセッサー PowerPC GHz を 2 個 標準装備した BladeCenter JS20 もラインアップ 多数の CPU を同時使用して演算処理を行うような HPC 分野や Tier-2 アプリケーション サーバーをはじめオールラウンドに使用いただけるハイ

HA8000xH ハードウェア アーキテクチャーガイド

rx600_s3_sas.pdf

FUJITSU Software Systemwalker for Oracle V15 (15.1) 紹介資料

HP xw9400 Workstation

PRIMERGY BX620 S4 システム構成図 (2008年5月版) 樹系図

PRIMERGY TX120 S2 システム構成図 (2011年2月版) 樹系図

Red Hat Enterprise Linux Server 7 動作確認表

パフォーマンスレポート PRIMERGY TX100 S3

PRIMEQUEST 1000シリーズ Linux運用ガイド

HP Z200 Intel i5 CPU 3.33GHz Low Profile 仕様 380 LP Assist 2.2 Instinct v3.0 以降 いいえいいえはいいいえ 4GB および 8GB DDR ECC (2 枚構成の DIMM) ISIS へ接続するにはオンボードの

FUJITSU Software Systemwalker for ERPパッケージ ジョブ連携 V16.0 紹介資料

VMware ESXiサポート版数一覧表(PRIMERGY機種別)

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

高速インメモリデータ管理ソフトウェア「Primesoft Server」ご紹介

増設メモリ (2006/11/20)

PRIMERGY TX200 S5 システム構成図 (2010年4月版) 樹系図

t20s3-fn09.pdf

PRIMERGY RX4770 M4 ご使用上の留意・注意事項

PRIMERGY TX100 S3 システム構成図 (2012年5月版) 樹系図

r10s4-fn03.pdf

Microsoft Word ●書式付IO性能_杉崎_ _更新__ doc

ServerView Resource Orchestrator V3.0 Cloud Edition サポート機種情報

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

PRIMERGY TX100 S3 システム構成図 (2011年10月版) 樹系図

PRIMERGY BX620 S4 システム構成図 (2008年9月版) 樹系図

Quad port LANカード(10GBASE) 取扱説明書

rx600_s2.pdf

PRIMERGY TX100 S3 未サポートOS動作検証確認情報

rx600_s3.pdf

Server Core適用ガイド

Arcserve Backup r16 新機能 テープブロックサイズの拡張 効果実測 Arcserve Japan 1.5 版

PRIMERGY TX100 S2 システム構成図 (2011年6月版) 樹系図

東芝 MAGNIA R3320b での SSD 性能の検証 2012 年 8 月 株式会社東芝 クラウド & ソリューション事業統括部 目次 1. はじめに ソリッドステートドライブの概要 使用機器一覧 単体性能について サーバー用途別のテスト

Dual port LANカード(25GBASE) 取扱説明書

テクニカルガイド「増設メモリ」(2006/09/15)

CA Federation ご紹介資料

blade.pdf

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

PRIMERGY TX100 S3 システム構成図 (2012年5月版) 樹系図

サーバプラットフォーム「BladeSymphony」、「HA8000シリーズ」の新モデルを販売開始

アドバンストサーバ「HA8000シリーズ」において最新テクノロジーを採用しシステム性能を強化

バトルカードでゲーマーやエンスージアストへの販売促進

技術が生み出す魔法!最新ハードウェアとチューニングで激速データベース

Microsoft Word - gori_web原稿:TrusSPSにおけるNAS OSのパフォーマンス評価.docx

PRIMERGY TX120 S2 システム構成図 (2010年3月版) 樹系図

rx600_s2.pdf

▼ RealSecure Desktop Protector 7

スライド 1

第一章 本書の概要 ( ア ) はじめにいわゆるサーバ用プロセッサである Xeon と いわゆるデスクトップ用プロセッサである Core i7 の違いを性能の観点からまとめました 性能とは例えば速さなどの数値のことで 機能 ( できること ) の違いについては立ち入りません Xeon の方がなんとな

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

Cisco Prime LAN Management Solution 4.2 紹介資料

テクニカルガイド

トラブルシューティング集

PRIMERGY TX120 S3 システム構成図 (2011年11月版) 樹系図

PRIMERGY TX120 S3 システム構成図 (2012年3月版) 樹系図

CLUSTERPRO SSS 動作環境編

富士通PRIMERGYサーバ/ETERNUSストレージとXsigo VP560/VP780の接続検証

PRIMERGY システム構成図 (2007年12月版) ハードウェア一覧

Xeon 5500(Nehalem EP)搭載 PRIMERGY サーバのメモリパフォーマンス

PRIMERGY システム構成図 (2008年5月版) ハードウェア一覧

PRIMERGY RX200 S6 システム構成図 (2010年6月版) 樹系図

CELSIUSカタログ(2012年7月版)

Transcription:

( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690 クロック周波数 2.90GHz Core/Socket 8 Core/System 16 搭載可能最大メモリ周波数 L3 キャッシュ 1600MHz 20MB 1. システム構成 インテル社の新プロセッサについて 各解析アプリケーション等を用いて既存製品との比較を行いました 新プロセッサ搭載システムと既存プロセッサ搭載システム ( 比較対象 ) の構成は下記の通りです Xeon E5-2600 系モデル Xeon X5600 系モデル ( 比較対象 ) CPU E5-2690 X5690 クロック周波数 2.90GHz 3.46GHz Core/Socket 8 6 Core/System 16 12 システム PRIMERGY RX200 S7 PRIMERGY RX300 S6 OS Red Hat Enterprise Linux 5.7 Red Hat Enterprise Linux 5.4 メモリ 8GB DDR3 1600 Registered DIMM 8 (Dual RANK) 4GB DDR3 1333 Registered DIMM 12 (Dual RANK) STREAM Benchmark ( メモリスループット性能 ) LS-DYNA 測定アプリ等 Poynting SCRYU/Tetra 1 Copyright 2012 FUJITSU LIMITED

2. メモリスループット性能 (STREAM benchmark (TRIAD)) メモリスループット性能の差異を判定するために STREAM benchmark(triad) で Xeon E5-2600 系新プロセッサ E5-2690 と Xeon X5600 系既存プロセッサ X5690 の比較測定を実施しました ( 単位 :GB/s) E5-2690 10.2 (0.98) 22.3 (1.10) 42.7 (1.13) 73.3 (1.75) 78.9 (1.88) 78.6 (1.88) * X5690 10.4 20.3 37.6 41.8 41.9 - * はノード内フルコア同士の比較 (E5-2690 16 並列 / X5690 12 並列 ) E5-2690 : 2.90GHz 8GB DDR3 1600 RDIMM 8 (Dual RANK) RHEL5.7 Turbo Boost ON X5690 : 3.46GHz 4GB DDR3 1333 RDIMM 12 (Dual RANK) RHEL5.4 Turbo Boost ON 4 並列まではそれほど大きな差は出ていませんが 8 並列からは E5-2690 が X5690 を大きく上回る結果となっています Xeon X5600 系モデルから Xeon E5-2600 系モデルへの世代アップでメモリバス本数が 6 から 8 へ増加された効果と 搭載可能メモリ が DDR3 1333 から DDR3 1600 へと改善された効果が表れ メモリスループット性能が大きく向上しています 2 Copyright 2012 FUJITSU LIMITED

3. LS-DYNA 性能測定 代表的な衝突解析アプリケーション LS-DYNA で新プロセッサ E5-2690 の測定を行い 既存プロセッサ X5690 との性能比較を 行いました 測定環境 条件 Xeon E5-2600 系モデル Xeon X5600 系モデル ( 比較対象 ) CPU E5-2690 X5690 クロック周波数 2.90GHz 3.46GHz Core/Socket 8 6 Core/System 16 12 システム PRIMERGY RX200 S7 1 PRIMERGY RX300 S6 1 OS Red Hat Enterprise Linux 5.7 Red Hat Enterprise Linux 5.4 AVX 命令 未使用 Turbo Boost ON ON Hyper Threading OFF OFF メモリ 8GB DDR3 1600 Registered DIMM 8 4GB DDR3 1333 Registered DIMM 12 LS-DYNA Ver. mpp971sr3.2.1 ( 単精度版 ) neon_refined_revised (535,057 要素 ) 標準ワークロード car2car (2,448,597 要素 ) 3 Vehicle Collision (794,780 要素 ) 3 Copyright 2012 FUJITSU LIMITED

Elapsed Time( 秒 ) 測定値 neon_refined_revised Elapsed Time ( 単位 : 秒 ) E5-2690 4191 (1.07) 2062 (1.10) 1127 (1.09) 640 (1.15) 475 (1.28) 394 (1.55) * X5690 4500 2258 1226 739 609 - car2car Elapsed Time ( 単位 : 秒 ) E5-2690 - - - 83287 (1.19) 58481 (1.37) 47014 (1.71) * X5690 - - - 99287 80190-3 Vehicle Collision Elapsed Time ( 単位 : 秒 ) E5-2690 - - - 8306 (1.18) 6724 (1.29) 5498 (1.58) * X5690 - - - 9792 8691-10000 30000 50000 70000 90000 110000 car2car 83287 99287 58481 80190 2 並列 4 並列 8 並列 12 並列 16 並列 並列数 47014 E5-2690 X5690 E5-2690 が有利な結果となっています 比較的メモリ負荷が厳しくない LS-DYNA ですが 8 並列以上ではメモリバス本数の増加と 搭載可能メモリが DDR3 1333 から DDR3 1600 に改善されたことによるメモリアクセス向上の効果が表れる形となりました また 平常時はクロック周波数が X5690 に劣る E5-2690 ですが E5-2690 の Turbo Boost ON 時のクロック周波数上昇幅は従来のプロセッサに比べて大きく 1 並列でも X5690 を上回る結果となりました 4 Copyright 2012 FUJITSU LIMITED

4. Poynting 性能測定 電磁波解析アプリケーション Poynting で 新プロセッサ E5-2690 と既存プロセッサ X5690 の比較測定を実施しました Poynting はメモリ負荷が厳しく 演算性能よりもメモリスループットのボトルネックが先に見えてくるのが一般的です 測定環境 条件 Xeon E5-2600 系モデル Xeon X5600 系モデル ( 比較対象 ) CPU E5-2690 X5690 クロック周波数 2.90GHz 3.46GHz Core/Socket 8 6 Core/System 16 12 システム PRIMERGY RX200 S7 1 PRIMERGY RX300 S6 1 OS Red Hat Enterprise Linux 5.7 Red Hat Enterprise Linux 5.4 AVX 命令 未使用 Turbo Boost ON ON Hyper Threading OFF OFF メモリ 8GB DDR3 1600 Registered DIMM 8 4GB DDR3 1333 Registered DIMM 12 Poynting Ver. V01L20.1.001 Dipole antenna Mur 1GB (250 250 250 = 1.56E+7 セル ) 標準ワークロード Dipole antenna Mur 8GB (500 500 500 = 1.25E+8 セル ) PCB (2058 1027 48 = 1.01E+8 セル ) Whole_car (409 644 340 = 8.96E+7 セル ) 5 Copyright 2012 FUJITSU LIMITED

測定値 Dipole antenna Mur 1GB ( 単位 : 秒 ) 1 並列 2 並列 4 並列 6 並列 8 並列 12 並列 16 並列 E5-2690 - 139 (1.45) 81 (1.86) 69 (2.00) 69 (1.99) 68 (1.96) 68 (1.96) * X5690-201 151 138 137 133 - Dipole antenna Mur 8GB ( 単位 : 秒 ) 1 並列 2 並列 4 並列 6 並列 8 並列 12 並列 16 並列 E5-2690 - 1061 (1.42) 594 (1.89) 496 (2.14) 484 (2.09) 485 (2.09) 487 (2.08) * X5690-1507 1125 1062 1013 1013 - PCB ( 単位 : 秒 ) 1 並列 2 並列 4 並列 6 並列 8 並列 12 並列 16 並列 E5-2690 - 26795 (1.35) 17107 (1.77) 15579 (1.68) 14927 (1.73) 15091 (1.73) 15169 (1.72) * X5690-36055 30340 26201 25808 26137 - Whole_car ( 単位 : 秒 ) 1 並列 2 並列 4 並列 6 並列 8 並列 12 並列 16 並列 E5-2690 - 4398 (1.43) 2707 (1.77) 2223 (1.98) 2118 (2.02) 2089 (1.99) 2099 (1.98) * X5690-6308 4781 4406 4268 4154-6 Copyright 2012 FUJITSU LIMITED

秒 0 200 400 600 800 1000 1200 1400 1600 1061 1507 594 1125 Dipole antenna Mur 8GB 496 1062 484 1013 485 1013 2 並列 4 並列 6 並列 8 並列 12 並列 16 並列並列数 487 E5-2690 X5690 E5-2690 が有利な結果となっています Poynting はメモリ負荷が厳しいアプリであり メモリアクセス性能が解析実行時間に大 きく影響してきます そのため メモリアクセス性能が従来のプロセッサから向上した E5-2690 が有利となり X5690 との解析 実行時間の差が大きく表れる形となりました 7 Copyright 2012 FUJITSU LIMITED

5. SCRYU/Tetra 性能測定 汎用熱流体解析アプリケーション SCRYU/Tetra で新プロセッサ E5-2690 の測定を行い 既存プロセッサ X5690 との性能比較を 行いました 測定環境 条件 Xeon E5-2600 系モデル Xeon X5600 系モデル ( 比較対象 ) CPU E5-2690 X5690 クロック周波数 2.90GHz 3.46GHz Core/Socket 8 6 Core/System 16 12 システム PRIMERGY RX200 S7 1 PRIMERGY RX300 S6 1 OS Red Hat Enterprise Linux 5.7 Red Hat Enterprise Linux 5.4 AVX 命令 未使用 Turbo Boost ON ON Hyper Threading OFF OFF メモリ 8GB DDR3 1600 Registered DIMM 8 4GB DDR3 1333 Registered DIMM 12 SCRYU/Tetra Ver. V9 ( 単精度版 ) 18 100 200 400 800 標準ワークロード 1600 3200 6400 12800 Full05g_1500 sted_model_1112 yk_240 8 Copyright 2012 FUJITSU LIMITED

測定値 18 ( 単位 : 秒 ) E5-2690 87 (1.16) 45 (1.16) 27 17 14 (1.14) 12 (1.33)* X5690 101 52 27 17 16-100 ( 単位 : 秒 ) E5-2690 187 (1.21) 96 (1.14) 51 (1.08) 27 (1.11) 20 (1.25) 17 (1.47)* X5690 226 109 55 30 25-200 ( 単位 : 秒 ) E5-2690 362 (1.16) 175 (1.06) 93 (1.09) 49 (1.12) 35 (1.20) 28 (1.50)* X5690 421 186 101 55 42-400 ( 単位 : 秒 ) E5-2690 752 (1.16) 356 (1.13) 190 (1.09) 100 (1.13) 69 (1.23) 55 (1.55)* X5690 871 401 208 113 85-800 ( 単位 : 秒 ) E5-2690 772 (1.18) 345 (1.14) 184 (1.13) 96 (1.16) 67 (1.25) 53 (1.58)* X5690 910 393 207 111 84-1600 ( 単位 : 秒 ) E5-2690 1583 (1.17) 712 (1.13) 377 (1.14) 194 (1.19) 134 (1.29) 107 (1.62)* X5690 1848 805 428 230 173-3200 ( 単位 : 秒 ) E5-2690 3263 (1.16) 1432 (1.14) 741 (1.14) 391 (1.16) 267 (1.30) 216 (1.60)* X5690 3774 1627 847 454 346-9 Copyright 2012 FUJITSU LIMITED

6400 ( 単位 : 秒 ) E5-2690 7038 (1.16) 3028 (1.17) 1548 (1.18) 815 (1.21) 566 (1.31) 453 (1.64)* X5690 8129 3546 1819 990 741-12800 ( 単位 : 秒 ) E5-2690 7295 (1.17) 3096 (1.18) 1590 (1.17) 860 (1.21) 586 (1.33) 460 (1.70)* X5690 8554 3647 1868 1039 781 - Full05g_1500 ( 単位 : 秒 ) E5-2690 1462 (1.15) 707 (1.15) 361 (1.12) 193 (1.12) 128 (1.20) 98 (1.57)* X5690 1683 815 404 217 154 - sted_model_1112 ( 単位 : 秒 ) E5-2690 3759 (1.16) 1842 (1.15) 930 (1.09) 468 (1.10) 323 (1.13) 256 (1.43)* X5690 4374 2110 1014 513 366 - yk_240 ( 単位 : 秒 ) E5-2690 279 (1.15) 133 (1.16) 73 (1.15) 38 (1.11) 28 (1.18) 23 (1.43)* X5690 321 154 84 42 33-10 Copyright 2012 FUJITSU LIMITED

秒 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 7295 8554 3096 3647 1590 1868 12800 860 1039 並列数 586 781 460 E5-2690 X5690 E5-2690 の Turbo Boost ON 時のクロック周波数上昇幅は従来のプロセッサに比べて大きく その効果が表れ 1 並列からすでに E5-2690 が有利な結果となっています また 標準ワークロードの大小や種類にもよりますが 高並列ではさらに E5-2690 が有 利な結果となっています メモリスループット向上の効果が表れる形となりました 11 Copyright 2012 FUJITSU LIMITED

6. まとめ 今回 STREAM benchmark(triad)( メモリスループット性能 ) ならびに 3 種類の解析アプリケーションにて Xeon E5-2600 系新プロセッサ E5-2690 と Xeon X5600 系既存プロセッサ X5690 の性能比較を行いましたが メモリアクセス性能が従来のプロセッサから向上し さらに Turbo Boost ON 時のクロック周波数上昇幅が拡大された E5-2690 が総じて有利な検証結果となりました メモリアクセス性能の向上については 具体的には従来のプロセッサと比較してメモリバス本数が 6 から 8 へ増加されたこと 搭載可能メモリが DDR3 1333 から DDR3 1600 に改善されたことが大きな要因と考えられます このことは STREAM benchmark(triad) 性能が X5690 とのノード内フルコア比較で 1.88 倍に向上していること また メモリアクセス性能が実行速度に大きく影響する Poynting において 低並列時で X5690 の 1.25 倍以上 6 並列以上では 2 倍前後の性能が出ていることからうかがえます Turbo Boost の効果については CPU 性能が大きく影響する LS-DYNA をはじめ SCRYU/Tetra でも低並列時から E5-2690 が X5690 を上回る性能を発揮しており E5-2690 については Turbo Boost を ON にすることを推奨します 今回のベンチマークテストを行った ISV アプリケーションは 新 CPU で新たに追加された AVX(Advanced Vector Extension) 機能を使用しない 従来のバージョンで測定しました 今後 各アプリケーションの新バージョンで AVX 機能を使用するようになれば さらなる高速化が期待できます 以上より 解析アプリケーションの実行時間短縮の観点から Xeon E5-2600 系新プロセッサ E5-2690 を使用するメリットは大いにあると言えます 12 Copyright 2012 FUJITSU LIMITED

留意事項 本資料を無断で他に転載しないようにお願いします 商標について Intel Xeon は米国インテル社の登録商標または商標です Red Hat RPMおよびRed Hatをベースとしたすべての商標とロゴは Red Hat, Inc. の米国およびその他の国における登録商標または商標です LS-DYNAは Livermore Software Technology Corporationの登録商標または商標です SCRYU/Tetraは 株式会社ソフトウェアクレイドルの登録商標または商標です その他の記載されている会社名 製品名等は各社の登録商標または商標です その他 本書で記載されている会社名 システム名 製品名等には必ずしも商標表示 ( ) を付記しておりません 13 Copyright 2012 FUJITSU LIMITED