パフォーマンスレポート PRIMERGY RX600 S6

Similar documents
パフォーマンスレポート PRIMERGY BX924 S2

パフォーマンスレポート PRIMERGY TX120 S3

パフォーマンスレポート PRIMERGY BX960 S1

パフォーマンスレポート PRIMERGY TX100 S2

パフォーマンスレポート PRIMERGY RX100 S7

パフォーマンスレポート PRIMERGY TX140 S1

パフォーマンスレポート PRIMERGY RX200 S6

パフォーマンスレポート PRIMERGY TX100 S3

パフォーマンスレポート PRIMERGY BX922 S2

パフォーマンスレポート PRIMERGY TX300 S6

パフォーマンスレポート PRIMERGY RX600 S5

パフォーマンスレポート PRIMERGY RX300 S6

パフォーマンスレポート PRIMERGY TX120 S2

パフォーマンスレポート PRIMERGY TX120 S3p

パフォーマンスレポート PRIMERGY RX200 S7

パフォーマンスレポート PRIMERGY TX200 S5

パフォーマンスレポート PRIMERGY RX200 S5

パフォーマンスレポート PRIMERGY BX920 S3

パフォーマンスレポート PRIMERGY BX620 S5

パフォーマンスレポート PRIMERGY RX100 S6

パフォーマンスレポート PRIMERGY TX100 S1

パフォーマンスレポート PRIMERGY RX300 S5

パフォーマンスレポート PRIMERGY TX150 S7

性能を強化した 第 12 世代 Dell PowerEdge サーバの RAID コントローラ Dell PERC H800 と PERC H810 の OLTP ワークロード性能比較 ソリューション性能分析グループ Luis Acosta アドバンストストレージエンジニアリング Joe Noyol

パフォーマンスレポート PRIMERGY BX920 S1

パフォーマンスレポート PRIMERGY RX350 S7

パフォーマンスレポート PRIMERGY RX500 S7

パフォーマンスレポート PRIMERGY TX150 S8

パフォーマンスレポート PRIMERGY RX300 S7

Windows Server 2016 Hyper-V ストレージQoS機能の強化

(速報) Xeon E 系モデル 新プロセッサ性能について

ホワイト ペーパー EMC VFCache により Microsoft SQL Server を高速化 EMC VFCache EMC VNX Microsoft SQL Server 2008 VFCache による SQL Server のパフォーマンスの大幅な向上 VNX によるデータ保護 E

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

Microsoft Word - JP-AppLabs-MySQL_Update.doc

パフォーマンスレポート PRIMERGY TX300 S7

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

VXPRO R1400® ご提案資料

システムソリューションのご紹介

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

アドバンスト・フォーマットディスクのパフォーマンス

PowerPoint プレゼンテーション

目次 1 はじめに 登録商標 商標 注意事項 免債事項 SR-IOV の機能概要 性能検証事例 測定環境 測定結果 各方式による共有 NIC 性能比較 ( ポートあ

パフォーマンスレポート PCIe-SSDs

PowerPoint プレゼンテーション

Silk Central Connect 15.5 リリースノート

PowerPoint プレゼンテーション

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

Control Manager 6.0 Service Pack 3 System Requirements

パフォーマンスレポート PCIe-SSDs ioDrive®2

目次 1. はじめに 用語説明 対象アダプタ P HBA/2P HBAで異なる性能 付録 ( 性能測定環境 ) P HBAでの性能測定環境 P HBAでの性能測定環境 本書の

KSforWindowsServerのご紹介

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

Windows Server 2008 R2とPRIMERGYによる消費電力削減効果

proventia_site_protector_sp8_sysreq

富士通PRIMERGYサーバ/ETERNUSストレージとXsigo VP560/VP780の接続検証

IBM Internet Security Systems NTFS ファイルシステム必須 一覧の 以後にリリースされた Service Pack (Release 2 等は除く ) は特に記載の無い限りサポートいたします メモリ 最小要件 512MB 推奨要件 1GB 最小要件 9GB 推奨要件

はじめに Dell PowerVault DL2000 Powered by Symantec Backup Exec は シンプルで管理しやすいデータ保護機能を提供する 柔軟かつ経済的なバックアップソリューションです 本ホワイトペーパーでは PowerVault DL2000 の バリューシリーズ

変更履歴 項番版数内容更新日 版新規作成 2013 年 11 月 18 日 1

PRIMERGY システム構成図 (2007年12月版) ハードウェア一覧

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

Xeon 5600(Westmere-EP)搭載システムのメモリパフォーマンス

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

東芝 MAGNIA R3320b での SSD 性能の検証 2012 年 8 月 株式会社東芝 クラウド & ソリューション事業統括部 目次 1. はじめに ソリッドステートドライブの概要 使用機器一覧 単体性能について サーバー用途別のテスト

HP Z200 Intel i5 CPU 3.33GHz Low Profile 仕様 380 LP Assist 2.2 Instinct v3.0 以降 いいえいいえはいいいえ 4GB および 8GB DDR ECC (2 枚構成の DIMM) ISIS へ接続するにはオンボードの

PRIMERGY システム構成図 (2008年5月版) ハードウェア一覧

目次 1. はじめに 用語説明 対象アダプタ P HBA/2P HBA/4P HBA で異なる性能 付録 P HBA での性能測定環境 P HBA での性能測定環境 P

提案書

Microsoft Word - nvsi_100222jp_oracle_exadata.doc

(Microsoft Word - WhitePaper_EvaluationAvanceNVBU__rev2_\203t\203H\201[\203\200\211\374\222\371\224\305_.doc)

InfiniDB最小推奨仕様ガイド

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

使用する前に

1. はじめに (1) 本書の位置づけ 本書ではベジフルネット Ver4 の導入に関連した次の事項について記載する ベジフルネット Ver4 で改善された機能について 新機能の操作に関する概要説明 ベジフルネット Ver4 プログラムのインストールについて Ver4 のインストール手順についての説明

PRIMERGY システム構成図 (2009年1月版) ハードウェア一覧

CELSIUSカタログ(2012年7月版)

PRIMERGY システム構成図 (2008年9月版) ハードウェア一覧

Windows Server 2016 ライセンス体系に関するデータシート 製品の概要 Windows Server 2016 は 準備が整った時点でクラウドコンピューティングへ簡単に移行できる新しいテクノロジを導入すると同時に 現在のワークロードをサポートするクラウドレディのオペレーティングシステ

VMware ESXiサポート版数一覧表(PRIMERGY機種別)

スライド 1

MAGNIA Storage Server Configuration Guide

hard.pdf

PRIMERGY システム構成図 (2010年3月版) ハードウェア一覧

JP1 Version 11

Xeon 5500(Nehalem EP)搭載 PRIMERGY サーバのメモリパフォーマンス

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

PowerPoint プレゼンテーション

1 本体 2.5 型ドライブモデル ( フレームモデル ) 製品名称 / 概要 Express5800/R110i-1(4C/E3-1220v6) 1 x インテル Xeon プロセッサー E3-1220v6 (3GHz, 4C/4T, 8 MB), メモリセレクタブル, ディスクレス, ODD レ

Xeon E5-2600/4600 搭載システムのメモリパフォーマンス

Ver. 3.8 Ver NOTE E v3 2.4GHz, 20M cache, 8.00GT/s QPI,, HT, 8C/16T 85W E v3 1.6GHz, 15M cache, 6.40GT/s QPI,

ライセンスの注意事項 サーババンドル版のライセンスについてサーババンドル版では 通常のサーバライセンスおよび 4 コアライセンスを ベースライセンス 追加サーバライセンスおよび追加 2 コアライセンスを 追加ライセンス と呼びます 1 台の物理サーバに対してベースライセンスは 1 つしか購入すること

目次 Windows 2003 への新規インストール... 3 Windows 2008 への新規インストール... 4 Windows 2012 への新規インストール... 6 Microsoft SQL のサポート... 8 IPv4/IPv6 のサポート... 8 制限事項... 9 Web

PRIMERGY RX4770 M4 ご使用上の留意・注意事項

HP ProLiant サーバー Generation 8 ~AMD Opteron™ 6300シリーズプロセッサー搭載製品カタログ~

Veritas System Recovery 16 Management Solution Readme

スライド 1

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

ご使用上の留意事項 / ドキュメント修正事項

業務用コンピュータサーバーに関する

富士通製プラットフォーム 「PRIMEPOWER/PRIMERGY」及び、富士通製ミドルウェア 「Interstage」とVantage Analyzer 動作検証完了報告書

Transcription:

ホワイトペーパー パフォーマンスレポート PRIMERGY RX600 S6 ホワイトペーパー FUJITSU PRIMERGY サーバパフォーマンスレポート PRIMERGY RX600 S6 本書では PRIMERGY RX600 S6 で実行したベンチマークの概要について説明します PRIMERGY RX600 S6 のパフォーマンスデータを 他の PRIMERGY モデルと比較して説明しています ベンチマーク結果に加え ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています バージョン 1.2 2011-12-06 目次 ドキュメントの履歴... 2 製品データ... 3 SPECcpu2006... 4 SPECjbb2005... 11 OLTP-2... 14 SAP SD... 19 vservcon... 22 VMmark V2... 32 STREAM... 35 LINPACK... 38 関連資料... 41 お問い合わせ先... 42 Fujitsu Technology Solutions 2011 1/42 ページ

ドキュメントの履歴 バージョン 1.0 ベンチマークを含むレポートの初版 SPECcpu2006 Xeon E7-2803 E7-4807 E7-4820 E7-4830 E7-8837 E7-2850 E7-4850 E7-4860 E7-4870 で測定 SPECjbb2005 Xeon E7-4870 で測定 vservcon Xeon E7-8800 シリーズ E7-4800 シリーズ E7-2800 シリーズで測定 VMmark V2 Xeon E7-4870 で測定 バージョン 1.1 以下のベンチマークを追加 OLTP-2 Xeon E7-2803 E7-4807 E7-4820 E7-4830 E7-8837 E7-2850 E7-4850 E7-4860 E7-4870 で測定 SAP SD 認証番号 2011026 STREAM Xeon E7-2803 E7-2850 E7-4807 E7-4820 E7-4830 E7-4850 E7-4860 E7-4870 E7-8837 で測定 LINPACK Xeon E7-2803 E7-2850 E7-4807 E7-4820 E7-4830 E7-8837 E7-4850 E7-4860 E7-4870 で測定 以下のベンチマークを更新 SPECcpu2006 Xeon E7-4807 E7-4820 E7-4830 E7-8837 E7-4850 E7-4860 で測定 バージョン 1.2 以下のベンチマークを更新 VMmark V2 Xeon E7-4870 で測定 2/42 ページ Fujitsu Technology Solutions 2011

製品データ PRIMERGY RX600 S6 は 4 U の 4 ソケットラックサーバで PRIMERGY RX600 S5 の後継製品です Intel 7500 チップセット Intel Xeon プロセッサ E7-4800 シリーズまたは E7-8800 シリーズ 2 ~ 4 基または Intel Xeon プロセッサ E7-2800 シリーズ 2 基を搭載し 最大 1 TB の DDR3-SDRAM が搭載可能な 2 ~ 8 枚のメモリボード ( それぞれ 8 本の DIMM スロット ) 2 基のオンボード 2 ポート 1 Gbit イーサネットコントローラー 10 本の PCI スロット (PCI-Express 2.0 x4(3 本 ) PCI-Express 2.0 x8(4 本 ) PCI- Express 2.0 x16(1 本 ) および PCI-Express x4(2 本 )) を装備 最大 8 台の内蔵 2.5 インチドライブ (SSD または SAS HDD) または PCle SSD を搭載可能です 詳細な製品データについては PRIMERGY RX600 S6 データシートを参照してください Fujitsu Technology Solutions 2011 3/42 ページ

SPECcpu2006 ベンチマークの説明 SPECcpu2006 は 整数演算および浮動小数点演算でシステム性能を測定するベンチマークです このベンチマークは 12 本のアプリケーションから成る整数演算テストセット (SPECint2006) および 17 本のアプリケーションから成る浮動小数点演算テストセット (SPECfp2006) で構成されています これらのアプリケーションは大量の演算を実行し CPU およびメモリを集中的に使用します 他のコンポーネント ( ディスク I/O ネットワークなど ) は このベンチマークでは測定しません SPECcpu2006 は 特定のオペレーティングシステムに依存しません このベンチマークは ソースコードとして利用可能で 実際に測定する前にコンパイルする必要があります したがって 使用するコンパイラーのバージョンやその最適化設定が 測定結果に影響を与えます SPECcpu2006 には 2 つのパフォーマンス測定方法が含まれています 1 つ目の方法 (SPECint2006 および SPECfp2006) では 1 つのタスクの処理に必要な時間を測定します 2 つ目の方法 (SPECint_rate2006 および SPECfp_rate2006) では スループット ( 並列処理できるタスク数 ) を測定します いずれの方法も さらに 2 つの測定の種類 ベース と ピーク に分かれています これらは コンパイラー最適化を使用するかどうかという点で異なります ベース 値は常に公開されていますが ピーク 値はオプションです ベンチマーク演算タイプコンパイラー最適化測定結果アプリケーション SPECint2006 整数ピークアグレッシブ速度単体実行 SPECint_base2006 整数ベース標準 SPECint_rate2006 整数ピークアグレッシブスループット多重実行 SPECint_rate_base2006 整数ベース標準 SPECfp2006 浮動小数点ピークアグレッシブ速度単体実行 SPECfp_base2006 浮動小数点ベース標準 SPECfp_rate2006 浮動小数点ピークアグレッシブスループット多重実行 SPECfp_rate_base2006 浮動小数点ベース標準 測定結果は 個々のベンチマークで得られた正規化比の幾何平均です 算術平均と比較して 幾何平均の方が ひとつの飛び抜けて高い値に左右されない平均値です 正規化 とは テストシステムがリファレンスシステムと比較してどの程度高速であるかを測定することです 例えば リファレンスシステムの SPECint_base2006 SPECint_rate_base2006 SPECfp_base2006 および SPECfp_rate_base2006 の結果が 値 1 と判定されたとします このとき SPECint_base2006 の値が 2 の場合は 測定システムがこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します SPECfp_rate_base2006 の値が 4 の場合は 測定対象システムがリファレンスシステムの約 4/[ ベースコピー数 ] 倍の速さでこのベンチマークを実行したことを意味します ベースコピー数 とは 実行されたベンチマークの並行インスタンスの数です 弊社では SPEC の公開用に SPECcpu2006 のすべての測定値を提出しているわけではありません そのため SPEC の Web サイトに公開されていない結果が一部あります 弊社では すべての測定のログファイルをアーカイブしているので 測定の内容に関していつでも証明できます 4/42 ページ Fujitsu Technology Solutions 2011

ベンチマーク結果 PRIMERGY RX600 S6 で Xeon E7 シリーズのプロセッサを測定しました ベンチマークプログラムは インテル C++/Fortran コンパイラー 12.0.1 または 12.0.4 でコンパイルし SUSE Linux Enterprise Server 11 SP1(64 ビット ) で実行しました すべての結果は http://www.spec.org で公開されています プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_base2006 SPECint2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 21.0 22.5 Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 23.0 24.4 Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 27.5 29.5 Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 29.5 31.6 Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 34.0 36.7 Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 29.3 31.5 Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 28.7 31.4 Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 32.4 34.7 Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 34.5 37.2 すべての測定でインテル C++/Fortran コンパイラー 12.0.4 を使用しています プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_rate_base2006 SPECint_rate2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 219 1) 237 1) Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 239 462 1) 253 499 1) Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 353 685 1) 372 737 1) Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 380 737 1) 409 794 1) Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 383 742 1) 400 789 1) Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 427 1) 459 1) Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 436 849 1) 468 913 1) Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 488 949 1) 515 1020 1) Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 518 1030 542 1110 1) インテル C++/Fortran コンパイラー 12.0.1 を使用しています プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_base2006 SPECfp2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 31.4 34.4 Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 38.7 41.2 Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 45.7 50.7 Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 47.0 51.9 Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 55.6 60.2 Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 43.5 47.0 Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 44.0 49.6 Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 47.7 53.8 Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 51.4 57.5 すべての測定でインテル C++/Fortran コンパイラー 12.0.4 を使用しています Fujitsu Technology Solutions 2011 5/42 ページ

プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_rate_base2006 SPECfp_rate2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 178 188 Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 188 1) 373 198 1) 394 Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 265 1) 527 277 1) 551 Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 278 1) 554 291 1) 579 Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 296 1) 591 319 1) 637 Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 307 318 Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 130 W 307 1) 610 319 1) 634 Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 349 1) 692 363 1) 720 Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 363 1) 724 378 1) 752 1) インテル C++/Fortran コンパイラー 12.0.1 を使用しています 整数演算テストセットおよび浮動小数点演算テストセットの両方で 4 プロセッサのスループットは 2 プロセッサの約 2 倍です SPECcpu2006: 整数演算性能 PRIMERGY RX600 S6(4 ソケットと 2 ソケットの比較 ) 1110 1200 1030 1000 542 800 600 518 400 SPECint_rate2006 200 SPECint_rate_base2006 0 2 x Xeon E7-4870 4 x Xeon E7-4870 6/42 ページ Fujitsu Technology Solutions 2011

SPECcpu2006: 浮動小数点演算性能 PRIMERGY RX600 S6(4 ソケットと 2 ソケットの比較 ) 752 800 724 700 600 500 400 300 200 100 363 378 SPECfp_rate2006 SPECfp_rate_base2006 0 2 x Xeon E7-4870 4 x Xeon E7-4870 次の 4 つのグラフは PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較したものです それぞれ最大のパフォーマンス構成になっています SPECcpu2006: 整数演算性能 PRIMERGY RX600 S6 と旧モデルとの比較 31.9 32.3 36.7 40 35 30 25 20 28.9 28.8 34.0 15 SPECint2006 10 5 SPECint_base2006 0 PRIMERGY RX600 S5 4 x Xeon X7542 PRIMERGY RX600 S5 4 x Xeon X7560 PRIMERGY RX600 S6 4 x Xeon E7-8837 Fujitsu Technology Solutions 2011 7/42 ページ

SPECcpu2006: 整数演算性能 PRIMERGY RX600 S6 と旧モデルとの比較 1110 1200 766 1030 1000 800 714 600 400 SPECint_rate2006 200 SPECint_rate_base2006 0 PRIMERGY RX600 S5 4 x Xeon X7560 PRIMERGY RX600 S6 4 x Xeon E7-4870 SPECcpu2006: 浮動小数点演算性能 PRIMERGY RX600 S6 と旧モデルとの比較 60.2 70 60 38.7 39.2 55.6 50 40 36.0 35.8 30 SPECfp2006 20 10 SPECfp_base2006 0 PRIMERGY RX600 S5 4 x Xeon X7542 PRIMERGY RX600 S5 4 x Xeon X7560 PRIMERGY RX600 S6 4 x Xeon E7-8837 8/42 ページ Fujitsu Technology Solutions 2011

SPECcpu2006: 浮動小数点演算性能 PRIMERGY RX600 S6 と旧モデルとの比較 752 800 700 600 500 400 538 559 724 300 SPECfp_rate2006 200 100 SPECfp_rate_base2006 0 PRIMERGY RX600 S5 4 x Xeon X7560 PRIMERGY RX600 S6 4 x Xeon E7-4870 Fujitsu Technology Solutions 2011 9/42 ページ

ベンチマーク環境 SPECcpu2006 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました ハードウェア モデル CPU CPU 数 PRIMERGY RX600 S6 Xeon E7-2803 E7-4807 E7-4820 E7-4830 E7-8837 E7-2850 E7-4850 E7-4860 E7-4870 2 チップ Xeon E7-2803 E7-4807: 12 コア ( チップあたり 6 コア ) Xeon E7-4820 E7-4830 E7-8837: 16 コア ( チップあたり 8 コア ) その他すべて : 20 コア ( チップあたり 10 コア ) 4 チップ Xeon E7-4807: 24 コア ( チップあたり 6 コア ) Xeon E7-4820 E7-4830 E7-8837: 32 コア ( チップあたり 8 コア ) Xeon E7-4850 E7-4860 E7-4870: 40 コア ( チップあたり 10 コア ) 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ ソフトウェア Xeon E7-2803 E7-4807 E7-4820: 18 MB ( 命令 + データ ) オンチップ ( チップあたり ) Xeon E7-4830 E7-8837 E7-2850 E7-4850 E7-4860: 24 MB ( 命令 + データ ) オンチップ ( チップあたり ) Xeon E7-4870: 30 MB ( 命令 + データ ) オンチップ ( チップあたり ) オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット ) コンパイラーインテル C++/Fortran コンパイラー 12.0.1 および 12.0.4 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 10/42 ページ Fujitsu Technology Solutions 2011

SPECjbb2005 ベンチマークの説明 SPECjbb2005 は Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークです これは 本質的には SPECjbb2000 をアップデートしたものです 主な違いは次のとおりです トランザクションは 多様な機能範囲に対応するために より複雑になっています ベンチマークのワーキングセットは システムの負荷の増大に対応するために 拡大されています SPECjbb2000 では アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが SPECjbb2005 では複数のインスタンスが許可され 特に大規模なシステムで実環境との高い近似性を得ることができます SPECjbb2005 は ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と スレッドおよびガーベージコレクションの実装のパフォーマンスを測定します 使用されるオペレーティングシステムの機能も評価します ハードウェアについては CPU およびキャッシュの効率 メモリサブシステム 共有メモリシステム (SMP) のスケーラビリティを評価します ディスクおよびネットワーク I/O は無関係です SPECjbb2005 は 最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント / サーバシステムをエミュレートしたもので 中間層システムに重点を置いています クライアントは TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し データベースへの OLTP アクセスを思考時間ゼロで行います 中間層システムは ビジネスプロセスおよびデータベースの更新を実装します データベースはデータ管理を行い メモリ内の Java オブジェクトによりエミュレートされます トランザクションのログ記録は XML ベースで実装されます このベンチマークの主な利点は シングルホスト上で 3 つの層すべてを実行できることです 中間層のパフォーマンスが測定されます このため 大規模なハードウェアの設置は不要となり 異なるシステムの SPECjbb2005 の結果を直接比較できます クライアントとデータベースのエミュレーションも Java で記述されています SPECjbb2005 には オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要です スケーリングの単位は 約 25 MB の Java オブジェクトから成るウェアハウスです 1 つのウェアハウスにつき 1 つの Java スレッドがオペレーションを実行します これらのビジネスオペレーションは TPC-C で次の項目を前提としています 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート ただし これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません 2 つのベンチマークの結果は比較できません SPECjbb2005 には 次の 2 つの性能指標があります bops(1 秒あたりのビジネスオペレーション ) は 1 秒あたりのすべてのビジネスオペレーションの処理レートです bops/jvm は 上記の性能指標 (bops) とアクティブな JVM インスタンス数の比率です SPECjbb2005 のさまざまな結果の比較では 両方の性能指標を考慮する必要があります これらの性能指標の測定は 次のようなベンチマークのルールに準拠しています ベンチマーク測定は ウェアハウス数 ( スレッド数 ) が増加する一連の測定ポイントで構成され それぞれにおいてウェアハウス数は 1 つずつ増加します 測定は 1 ウェアハウスで開始され 2*MaxWh( 尐なくとも 8 ウェアハウス ) まで実行されます MaxWh は ベンチマークで予想される秒あたりの処理レートが最 Fujitsu Technology Solutions 2011 11/42 ページ

高になるウェアハウス数です デフォルトでは MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます 性能指標の bops は MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレーション速度の算術平均です ベンチマーク結果 2011 年 4 月 4 基の Xeon E7-4870 プロセッサおよび 512 GB の PC3-8500R DDR3-SDRAM メモリの構成で PRIMERGY RX600 S6 を測定しました 測定には Windows Server 2008 R2 Enterprise SP1 を使用しました Oracle から提供されている Java HotSpot(TM) Server VM バージョン 1.6.0_25(Windows 64 ビット版 ) の 8 つのインスタンスを JVM として使用しました 測定結果は次のとおりです SPECjbb2005 bops = 2708886 SPECjbb2005 bops/jvm = 677222 PRIMERGY RX600 S6 は すべての 4 ソケットサーバで最高の結果を得ました 1 次のグラフは PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較したものです それぞれ最大のパフォーマンス構成になっています SPECjbb2005 bops: PRIMERGY RX600 S6 と旧モデルとの比較 SPECjbb2005 bops: PRIMERGY RX600 S6 と旧モデルとの比較 1 上記の比較結果は 2011 年 5 月 4 日現在のものです また この比較は 4 ソケットサーバの SPECjbb2005 の結果に基づいています SPECjbb2005 ベンチマークの最新の結果は http://www.spec.org/jbb2005/results を参照してください 12/42 ページ Fujitsu Technology Solutions 2011

ベンチマーク環境 SPECjbb2005 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました ハードウェア モデル PRIMERGY RX600 S6 CPU Xeon E7-4870 CPU 数 4 チップ 40 コア チップあたり 10 コア コアあたり 2 スレッド 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB( 命令 + データ ) オンチップ ( コアあたり ) 3 次キャッシュ 30 MB( 命令 + データ ) オンチップ ( チップあたり ) メモリ 8 GB PC3-8500R DDR3-SDRAM 64 枚 ソフトウェア オペレーティングシステム Windows Server 2008 R2 Enterprise SP1 JVM バージョン Oracle Java HotSpot(TM) 64-Bit Server VM on Windows, version 1.6.0_25 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2011 13/42 ページ

OLTP-2 ベンチマークの説明 OLTP とは Online Transaction Processing( オンライントランザクション処理 ) の略です OLTP-2 ベンチマークは データベースソリューションの標準的なアプリケーションシナリオを基にしています OLTP- 2 では データベースアクセスがシミュレートされ 1 秒あたりに実行されるトランザクションの数 (tps) が測定されます 独立した機関によって標準化され その規則を順守して測定しているかを監視される SPECint や TPC-E のようなベンチマークとは異なり OLTP-2 は 富士通が開発した固有のベンチマークです OLTP-2 は データベースのベンチマークとしてよく知られている TPC-E を基に開発されました そして CPU やメモリの構成に応じてシステムがスケーラブルな性能を示すことを実証するために さまざまな構成で測定できるように設計されています OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシナリオをシミュレートしても この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートするため 結果を比較したり同等のものとして扱うことはできません 通常 OLTP-2 の値は TPC-E に近い値となります しかし 価格性能比が算出されないため 直接比較できないだけでなく OLTP-2 の結果を TPC-E として利用することも許可されません 詳細情報は ベンチマークの概要 OLTP-2 を参照してください ベンチマーク結果 PRIMERGY RX600 S6 の OLTP-2 の値は Xeon E7-48xx E7-28xx および E7-8837 プロセッサシリーズを使用して 256 GB 512 GB および 1024 GB のメモリ構成で測定しました これらの結果は オペレーティングシステム Microsoft Windows Server 2008 R2 Enterprise SP1 とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです データベースのパフォーマンスは ハードディスクとコントローラーを含むシステムの構成オプションによって 大幅に異なります ここに記載されている次元のスループットは 通常の外部ディスクサブシステムがボトルネックでない場合に実現されます システム構成の詳細については ベンチマーク環境 を参照してください 次の表は PRIMERGY RX600 S6 に搭載可能な各プロセッサの仕様を示しています プロセッサ コア数 / チップ HT TM プロセッサ周波数 L3 キャッシュ QPI スピード メモリ周波数 E7-4870 10 2.4 GHz 30 MB 6.4 GT/s 1066 MHz 130 W E7-4860 10 2.27 GHz 24 MB 6.4 GT/s 1066 MHz 130 W E7-4850 10 2.0 GHz 24 MB 6.4 GT/s 1066 MHz 130 W E7-4830 8 2.13 GHz 24 MB 6.4 GT/s 1066 MHz 105 W E7-4820 8 2.0 GHz 18 MB 5.86 GT/s 978 MHz 105 W E7-4807 6 1.87 GHz 18 MB 4.8 GT/s 800 MHz 95 W E7-8837 8 2.67GHz 24 MB 6.4 GT/s 1066 MHz 130 W E7-2850 10 2.0 GHz 24 MB 6.4 GT/s 1066 MHz 130 W HT = ハイパースレッディング TM = ターボモード QPI = QuickPath インターコネクト GT = ギガトランスファー TDP = 熱設計電力 TDP メモリに関しては 16 GB モジュールの最大構成と 8 GB モジュールおよび 4 GB モジュールの別構成で測定しました ここでは 周波数はプロセッサタイプによってのみ変わり 使用したメモリモジュールのタイプおよび数には影響されません メモリパフォーマンスの詳細については ホワイトペーパー Xeon E7-8800/4800/2800(WESTMERE-EX) 搭載システムのメモリパフォーマンス を参照してください データベース環境でメインメモリを選択するときのガイドラインとして メモリアクセス速度よりも メモリ容量が十分にあることが重要です 14/42 ページ Fujitsu Technology Solutions 2011

次のグラフは Intel Xeon シリーズのプロセッサ (2 基または 4 基 ) とさまざまなメモリ構成で得られる PRIMERGY RX600 S6 の OLTP-2 パフォーマンスデータを示しています PRIMERGY RX600 S6 : OLTP-2 [tps] 3000 2500 2710 2825 2786 2589 2701 2662 2330 2425 2395 2099 2147 2129 1941 2001 1968 太字 斜体の数字 : 実測値その他 : 計算値 1914 1977 1941 2000 1500 1000 500 0 1552 1540 E7-4870 10Core 1484 1463 E7-4860 10Core 1332 1316 E7-4850 10Core 1179 1170 E7-4830 8Core 1100 1081 E7-4820 8Core 770 759 1362 E7-4807 6Core 1402 1381 1087 1066 E7-8837 8Core 1332 1316 E7-2850 10Core 699 689 E7-2803 6Core 4CPUs-1024GB 4CPUs-512GB 4CPUs-256GB 2CPUs-512GB 2CPUs-256GB 搭載可能なプロセッサの種類が多いため PRIMERGY RX600 S6 では広範にわたるレベルのパフォーマンスが実現されていることがわかります 同じ最大メモリ構成で プロセッサを 4 基搭載して比較すると パフォーマンスが最も低いプロセッサ (E7-4807) を使用した場合 (1402 tps) に比べ パフォーマンスが最も高いプロセッサ (E7-4870) を使用した場合 (2825 tps) は OLTP-2 値は 2 倍になっています 測定結果が示す性能に基づき プロセッサをいくつかのグループに分類できます CPU あたり 10 コアのプロセッサである E7-4870 E7-4860 および E7-4850 は パフォーマンスの最上位にランクされます その次にランクされるのは 8 コアプロセッサの E7-4830 E7-4820 です 最下位にランクされるのは ターボモードをサポートしていない わずか 6 コアのプロセッサである E7-4807 です これらのプロセッサはすべて ハイパースレッディング機能をサポートしています データベースアプリケーションをシミュレートした OLTP-2 の負荷の下では特に 論理的なプロセッサコア数を 2 倍にするハイパースレッディングのメリットを受けます E7-8837 プロセッサは例外で 8 コアでクロック周波数は高いものの ハイパースレッディング機能をサポートしていないため E7-4820 プロセッサとほぼ同等のパフォーマンスとなります E7-2850 プロセッサと E7-2803 プロセッサは特殊な位置付けにあり プロセッサ 4 基ではなく プロセッサ 2 基の構成専用に設計されています メインメモリを増設すると すべてのプロセッサタイプでデータベースのスループットを尐しだけ向上させることができました 一方で 4 ソケットサーバでは プロセッサを 2 基から 4 基に増やしたときに どの程度パフォーマンスが向上するかという疑問もあります スケーリングが向上すれば サーバ内のリソース共有によって通常生じるオーバーヘッドは減尐します スケーリングの係数はアプリケーションによっても変わります サーバをデータベースサーバとして使用する場合は CPU 数を 2 基から 4 基に倍増することで パフォーマンスを 80 % 程度向上させることができます Fujitsu Technology Solutions 2011 15/42 ページ

PRIMERGY RX600 S6 をその旧モデルである PRIMERGY RX600 S3 PRIMERGY RX600 S4 および PRIMERGY RX600 S5 の最大構成と比較すると スループットはそれぞれ 747 %(RX600 S3) 283 % (RX600 S4) 38 %(RX600 S5) 向上しています 3000 2750 2500 2250 OLTP-2: PRIMERGY RX600 S3 vs. RX600 S4 vs. RX600 S5 vs.rx600 S6 +38.40% 2825.49 2000 1750 1500 1250 1000 750 500 +746.72% +283.41% 736.94 2041.56 250 0 333.7 PRIMERGY RX600 S3 4 Xeon 7140M 64 GB RAM PRIMERGY RX600 S4 4 Xeon 7460 256 GB RAM PRIMERGY RX600 S5 4 Xeon X5680 512 GB RAM PRIMERGY RX600 S6 4 E7-4870 1024 GB RAM 16/42 ページ Fujitsu Technology Solutions 2011

ベンチマーク環境 一般的な測定環境を以下に示します ドライバ A 層 B 層 ネットワーク ネットワーク クライアント ストレージサブシステム アプリケーションデータベースサーバサーバ SUT(System Under Test: テスト対象システム ) データベースサーバ (B 層 ) ハードウェア システム PRIMERGY RX600 S6 プロセッサ E7-4870(10 コア 2.4 GHz) 4 基 E7-4860(10 コア 2.27 GHz) 4 基 E7-4850(10 コア 2.0 GHz) 4 基 E7-4830(8 コア 2.13 GHz) 4 基 E7-4820(8 コア 2.0 GHz) 4 基 メモリ 設定 ( デフォルト ) ネットワークインターフェース ディスクサブシステム ソフトウェア E7-4807(6 コア 1.87 GHz) 4 基 E7-8837(8 コア 2.67 GHz) 4 基 E7-2850(10 コア 2.0 GHz) 2 基 E7-2803(6 コア 1.73 GHz) 2 基 1024 GB 512 GB および 256 GB Registered ECC DDR3(16 GB 8 GB および 4 GB DIMM) ターボモード有効 NUMA サポート有効 ハイパースレッディング有効 オンボード LAN 1 Gbps 4 基 RX600 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB 146 GB 15K rpm SAS ドライブ 2 台 RAID1(OS) 450 GB 10K rpm SAS ドライブ 6 台 RAID10( ログ ) LSI MegaRAID SAS 9280-8e 10 基 JX40 10 台 : 各 64 GB SSD ドライブ 24 台 RAID5( データ ) オペレーティングシステム Windows Server 2008 R2 Enterprise SP1 データベース SQL Server 2008 R2 Enterprise x64 Fujitsu Technology Solutions 2011 17/42 ページ

アプリケーションサーバ (A 層 ) ハードウェア システム プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX200 S6 2 台 Xeon E5647(4 コア 2.93 GHz) 2 基 12 GB 1333 MHz Registered ECC DDR3 オンボード LAN 1 Gbps 2 基 デュアルポート LAN 1 Gbps 2 基 73 GB 15K rpm SAS ドライブ 1 台 オペレーティングシステム Windows Server 2008 R2 Standard クライアント ハードウェア システム プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX200 S5 2 台 Xeon X5570(4 コア 2.93 GHz) 2 基 24 GB 1333 MHz Registered ECC DDR3 オンボード LAN 1 Gbps 2 基 73 GB 15K rpm SAS ドライブ 1 台 オペレーティングシステム Windows Server 2008 R2 Standard OLTP-2 ソフトウェア EGen バージョン 1.12.0 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 18/42 ページ Fujitsu Technology Solutions 2011

SAP SD ベンチマークの説明 SAP アプリケーションソフトウェアは 標準的な業務プロセスを管理するためのモジュールで構成されています モジュールには 受注組立 (ATO) 財務会計 (FI) 人事管理 (HR) 在庫購買管理 (MM) 生産計画 (PP) 販売管理 (SD) などの ERP( 企業資源計画 ) 用のものや SCM( サプライチェーンマネジメント ) 小売 銀行業務 公益事業 BI( ビジネスインテリジェンス ) CRM( 顧客関係管理 ) PLM( 製品ライフサイクル管理 ) 用のものがあります SAP アプリケーションソフトウェアは必ずデータベースと関連しています したがって SAP の構成には ハードウェアに加え ソフトウェアコンポーネントであるオペレーティングシステムとデータベース および SAP ソフトウェア自体も含まれます SAP アプリケーションシステムのパフォーマンス 安定性およびスケーラビリティを評価するために SAP AG は SAP 標準アプリケーションベンチマークを開発しました 中でも 最も広く使用されており最も重要なのは SD ベンチマークです これらのベンチマークでは システム全体のパフォーマンスが分析されるため コンポーネントの統合品質を測定できます ベンチマークは 2 層の構成と 3 層の構成で異なります 2 層の構成では SAP アプリケーションとデータベースを 1 台のサーバにインストールします 3 層の構成では SAP アプリケーションの各コンポーネントを数台のサーバに分散でき 別のサーバでデータベースを処理します SAP AG( ドイツ Walldorf) によって開発されたベンチマークの詳細な仕様は http://www.sap.com/benchmark を参照してください Fujitsu Technology Solutions 2011 19/42 ページ

ベンチマーク結果 2011 年 7 月 15 日に Xeon E7-4870 プロセッサ 4 基を搭載した PRIMERGY RX600 S6(Windows Server 2008 R2 Datacenter で SAP Enhancement Package 4 for SAP ERP 6.0 と SQL Server 2008 を使用 ) で次の結果を得たことが認証されました ( 認証番号 2011026) 認証番号 2011026 Number of SAP SD benchmark users 13,285 Average dialog response time Throughput Fully processed order line items/hour dialog steps/hour SAPS Average database request time (dialog/update) CPU utilization of central server 99% Operating system, central server 0.97 seconds 1,453,000 4,359,000 72,650 0.034 sec / 0.028 sec RDBMS SQL Server 2008 Windows Server 2008 R2 Datacenter SAP Business Suite software SAP enhancement package 4 for SAP ERP 6.0 Configuration Central server PRIMERGY RX600 S6 4 processors / 40 cores / 80 threads Xeon E7-4870 256 GB main memory 次のグラフは PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを比較したものです それぞれ最大のパフォーマンス構成になっています SAP SD:PRIMERGY RX600 S6 と旧モデルとの比較 PRIMERGY RX600 S6 4 x Xeon E7-4870 256 GB RAM 13285 PRIMERGY RX600 S5 4 x Xeon X7560 512 GB RAM 10055 0 2000 4000 6000 8000 10000 12000 14000 Number of Benchmark Users 20/42 ページ Fujitsu Technology Solutions 2011

ベンチマーク環境 2 層環境 テスト対象システム 負荷ジェネレーター SUT(System Under Test: テスト対象システム ) ハードウェア サーバ プロセッサ メモリ ディスクサブシステム ソフトウェア オペレーティングシステム データベース PRIMERGY RX600 S6 Xeon E7-4870 4 基 4 GB PC3-10600R DDR3-SDRAM 64 枚 PRIMERGY RX600 S6 1 台 : RAID Ctrl SAS 6G 5/6 512MB (D2616) 2 基 RAID Contr BBU Upgrade for RAID 5/6 V70 2 基 HD SAS 6G 73GB 15K HOT PL 2.5" EP 5 台 HD SAS 6G 146GB 15K HOT PL 2.5" EP 1 台 HD SAS 6G 300GB 15K HOT PL 2.5" EP 1 台 FC Ctrl 8Gb/s 1 Chan LPe1250 MMF LC 2 基 FibreCAT CX4-480 Storage Unit 1 台 Windows Server 2008 R2 Datacenter + SP1 SQL Server 2008 Enterprise Edition SAP Business Suite ソフトウェア SAP Enhancement Package 4 for SAP ERP 6.0 負荷ジェネレーターハードウェアモデル PRIMERGY RX300 S4 プロセッサ Xeon X5460(3.17 GHz 12 MB L2 キャッシュ ) 2 基メモリ 12 GB PC2-5300F DDR2-SDRAM ソフトウェアオペレーティングシステム Linux 2.6.32 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2011 21/42 ページ

vservcon ベンチマークの説明 vservcon は 富士通テクノロジー ソリューションズが ハイパーバイザーを使用するサーバ構成について サーバ統合の適合性の比較に使用するベンチマークです これにより システム プロセッサ および I/O テクノロジーの比較に加え ハイパーバイザー 仮想化形式 および仮想マシン用の追加ドライバの比較も可能になります vservcon は 厳密に言えば新しいベンチマークではありません これは 言うなればフレームワークであり すでに確立されたベンチマークをワークロードとして集約し 統合され仮想化されたサーバ環境の負荷を再現します データベース アプリケーションサーバ Web サーバというアプリケーションシナリオを対象とする 3 つの実証済みのベンチマークが使用されます アプリケーションシナリオベンチマーク論理 CPU コアの数メモリ データベース Sysbench( 補正済み ) 2 1.5 GB Java アプリケーションサーバ SPECjbb( 補正済み 50~60 % の負荷 ) 2 2 GB Web サーバ WebBench 1 1.5 GB 3 つのアプリケーションシナリオのそれぞれが 1 つの専用の仮想マシン (VM) に割り当てられます これらに加えてアイドル VM という 4 番目の仮想マシンが追加されます これら 4 つの VM が 1 つの タイル を構成します 最大の性能値を引き出すためには 測定対象となるサーバの処理能力に応じて いくつかのタイルを並行して開始しなければならない場合もあります テスト対象システム データベース VM Java VM Web VM アイドル VM タイル n データベース VM データベース VM データベース VM Java VM Java VM Java VM Web VM Web VM Web VM アイドル VM アイドル VM アイドル VM タイル 3 タイル 2 タイル 1 3 つの vservcon アプリケーションシナリオのそれぞれが 各 VM のアプリケーション固有のトランザクションレートという形でベンチマーク結果を提供します スコアを正規化するために 1 つのタイルのそれぞれのベンチマーク結果とリファレンスシステムの結果との比を求めます その相対性能値に適切な重み付けを行い すべての VM とすべてのタイルについて加算します 最終的な計算結果が このタイル数に対するスコアになります 原則として 1 つのタイルから始めて vservcon スコアの大幅な増加が見られなくなるまで タイル数を増やしながらこの手順が実行されます 最終的な vservcon スコアは すべてのタイル数から得られた vservcon スコアの最大値です したがって このスコアは CPU リソースを最大限まで使用する構成で達成される最大スループットを反映しています このため vservcon の測定環境は CPU のみが制限要因となるように設計されており 他のリソースによる制限は発生しないように設計されています タイル数の増加に対する vservcon スコアの伸びは テスト対象システムのスケーリング特性を知るための有益な情報となります さらに vservcon では ホストの合計 CPU 負荷 (VM および他のすべての CPU 処理 ) を記録し 可能な場合は電力消費量も記録します vservcon の詳細については ベンチマークの概要 vservcon を参照してください 22/42 ページ Fujitsu Technology Solutions 2011

E7-8800 シリーズ E7-4800 シリーズ 2800 ベンチマーク結果 PRIMERGY の 4 ソケットおよび 8 ソケット現行世代は Intel Xeon プロセッサ E7-2800 シリーズ E7-4800 シリーズ および E7-8800 シリーズをベースにしています 次のようなさまざまなシステム構成に対応しています プロセッサ RX600 S6 RX900 S2 6 コア HT E7-2803 最大 2 10 コア HT TM E7-2850 最大 2 6 コア HT E7-4807 最大 4 8 コア HT TM 10 コア HT TM E7-4820 最大 4 E7-4830 最大 4 E7-4850 最大 4 E7-4860 最大 4 E7-4870 最大 4 8 コア TM E7-8837 最大 4 最大 8 HT TM E7-8830 最大 8 E7-8850 最大 8 10 コア HT TM E7-8860 最大 8 E7-8870 最大 8 HT = ハイパースレッディング TM = ターボモード PRIMERGY の 4 ソケットモデルおよび 8 ソケットモデル現行世代は プロセッサテクノロジーの進歩により アプリケーションの仮想化に最適なシステムとなっています 10 コアプロセッサにも対応しているため 前世代のプロセッサをベースとするシステムと比較して 仮想化性能が約 22 % 向上しています (vservcon スコアで測定 ) 10 コアプロセッサを 8 基搭載したシステムで 前述の vservcon プロファイルを基にして 176 のアプリケーション VM(44 のタイルに相当 ) を使用した場合 CPU リソースの最大活用をほぼ実現できます Fujitsu Technology Solutions 2011 23/42 ページ

2 E7-2803 2 E7-4807 4 E7-8837 4 E7-4820 2 E7-8837 2 E7-4820 2 E7-4830 4 E7-4830 2 E7-2850/E7-4850 2 E7-8867L 2 E7-4860 2 E7-4870 4 E7-4807 4 E7-4850 4 E7-8867L 4 E7-4860 4 E7-4870 8 E7-8837 8 E7-8830 8 E7-8850 Final vservcon Score 8 E7-8860 8 E7-8870 次のグラフは 各プロセッサで達成可能な仮想化性能値を比較したものです ここでは 発売済みの 6 コア 8 コア 10 コアのプロセッサを対象に幅広く測定しました 7 8 5 10 11 12 12 12 12 15 10 19 21 24 24 24 24 18 36 44 44 44 #Tiles 44 40 36 32 28 24 20 16 12 8 4 0 このグラフに示されているプロセッサ間の大きな性能差は その機能と CPU の数が影響していると考えられます 同数の CPU を搭載したサーバ間では コア数 L3 キャッシュのサイズ CPU クロック周波数によって値が変わります また プロセッサ間のデータ転送速度 ( QPI スピード ) も仮想化性能に影響します Xeon E7-8837 プロセッサのパフォーマンスが比較的低めなのは ハイパースレッディング (HT) 機能をサポートしていないためです この測定結果により CPU の数を 2 倍にすると 仮想化性能が約 2 倍向上することが明らかになりました メモリパフォーマンスと QPI アーキテクチャーの詳細については ホワイトペーパー Xeon E7-8800/ 4800/2800(WESTMERE-EX) 搭載システムのメモリパフォーマンス を参照してください 仮想化環境のメインメモリを選択するときのガイドラインとして メモリアクセス速度よりも メモリ容量が十分にあることが重要です 各プロセッサの製品データについて再度簡潔にまとめ 次の表に示します 24/42 ページ Fujitsu Technology Solutions 2011

2800 E7-4800 シリーズ E7-8800 シリーズ プロセッサ コア数 / チップ L3 キャッシュ プロセッサ周波数 QPI スピード HT TM TDP タイル数スコア 6 コア HT E7-2803(2 ) 6 18 MB 1.73 GHz 4.8 GT/s 105 W 7 4.96 10 コア HT TM E7-2850(2 ) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 12 10.10 6 コア HT 8 コア HT TM 10 コア HT TM E7-4807(2 ) 6 18 MB 1.87 GHz 4.8 GT/s 95 W 8 5.46 E7-4807(4 ) 6 18 MB 1.87 GHz 4.8 GT/s 95 W 15 10.70 E7-4820(2 ) 8 18 MB 2.00 GHz 5.86 GT/s 105 W 10 8.01 E7-4820(4 ) 8 18 MB 2.00 GHz 5.86 GT/s 105 W 19 15.70 E7-4830(2 ) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 11 8.93 E7-4830(4 ) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 21 17.50 E7-4850(2 ) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 12 10.10 E7-4850(4 ) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 24 19.80 E7-4860(2 ) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 12 11.10 E7-4860(4 ) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 24 21.70 E7-4870(2 ) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 12 12.30 E7-4870(4 ) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 24 23.90 8 コア TM HT TM E7-8837(2 ) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 5 7.90 E7-8837(4 ) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 10 15.80 E7-8837(8 ) 8 24 MB 2.67 GHz 6.4 GT/s 130 W 18 30.60 E7-8830(4 ) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 21 16.70 E7-8830(8 ) 8 24 MB 2.13 GHz 6.4 GT/s 105 W 36 32.10 10 コア HT TM E7-8850(4 ) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 24 18.70 E7-8850(8 ) 10 24 MB 2.00 GHz 6.4 GT/s 130 W 44 35.80 E7-8860(4 ) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 24 20.60 E7-8860(8 ) 10 24 MB 2.27 GHz 6.4 GT/s 130 W 44 39.40 E7-8870(4 ) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 24 22.70 E7-8870(8 ) 10 30 MB 2.40 GHz 6.4 GT/s 130 W 44 43.90 QPI = QuickPath インターコネクト GT = ギガトランスファー HT = ハイパースレッディング TM = ターボモード TDP = 熱設計電力 Fujitsu Technology Solutions 2011 25/42 ページ

8.26 10.2 12.1 13.8 15.5 16.7 18.2 19.1 19.9 20.6 20.8 21.6 21.7 21.9 22.3 22.5 22.6 23.0 23.3 23.7 23.9 2.12 4.15 vservcon score 6.18 5.70 7.58 9.17 10.8 12.2 13.3 13.9 14.6 15.1 15.5 16.0 16.2 16.4 16.7 17.0 17.1 17.3 17.4 17.5 1.94 3.77 vservcon score 次の 2 つのグラフは Xeon E7-4830(8 コア ) プロセッサまたは E7-4870(10 コア ) プロセッサを搭載した PRIMERGY RX600 S6 で VM 数の増加に伴う仮想化性能の推移を調べたものです ホストのそれぞれの CPU 負荷も示されています CPU 負荷が 90 % のときが最適なタイル数です 90 % を超えると過負荷となり 仮想化のパフォーマンスは停滞または低下します Scores and CPU utilization 20 18 16 14 12 10 8 6 4 2 0 4 x E7-4830 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 vservconv score (left axis) CPU Util (right axis) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% # Tiles Scores and CPU utilization 30 27 24 21 18 15 12 9 6 3 0 4 x E7-4870 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 vservconv score (left axis) CPU Util (right axis) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% # Tiles 上記のように多数の VM を稼動できるのは 物理コア数の増加に加えて Xeon E7 プロセッサ (E7-8837 を除く ) がハイパースレッディング機能をサポートしているためです ハイパースレッディング機能では 1 つの物理プロセッサコアが結果的に 2 つの論理コアに分割されるため ハイパーバイザーが利用できるコア数は 2 倍になります そのため ハイパースレッディング機能は 一般的にシステムの仮想化性能を向上させます ハイパースレッディング機能を使用するシステムでは 前のグラフに示されているタイル数のスケーリング曲線が明確に見られます Xeon E7-4870 プロセッサには 40 個の物理コア すなわち 80 個の論理コアがあり 1 つのタイルにつき 4 個程度の論理コアが使用されます ( ベンチマークの説明 を参照 ) つまり ほぼ 10 タイルまでは 複数の VM が同じ物理コアを並行して使用することを回避できます そのため この範囲ではほぼ理想的にパフォーマンスが上昇します その後 CPU 使用率が限界に達するまでのパフォーマンス曲線は 傾きが緩やかになっていきます 26/42 ページ Fujitsu Technology Solutions 2011

前のグラフでは ホストの全アプリケーション VM の総合的なパフォーマンスを測定しました しかし 個々のアプリケーション VM のパフォーマンスも興味深いものです この情報は 前のグラフから読み取れます 例えば 高負荷で全体最適化された状態と 低負荷の状態での 個々のアプリケーション VM の仮想化性能を考えます 上記の Xeon E7-4870 環境では 72 のアプリケーション VM(24 タイル アイドル状態の VM を除く ) を使用した場合が全体最適化された状態で 3 つのアプリケーション VM(1 タイル アイドル状態の VM を除く ) を使用した場合が低負荷の状態です 1 タイルあたりの vservcon スコアは vservcon の 3 つのアプリケーションシナリオを通じた平均値です 1 タイルあたりの平均パフォーマンスは vservcon スコアが低負荷のケース (2.12) から全体最適化された状態 (0.99=23.90/24) へ変化すると 47 % へと大幅に低下します 個々のアプリケーション VM の反応は 高負荷の状況では全く違ったものになります ある特定の状況下では 仮想ホストの VM 数に関して 全体的なパフォーマンス要件と 個々のアプリケーションのパフォーマンス要件のバランスをとる必要があります Fujitsu Technology Solutions 2011 27/42 ページ

6 Tiles 18 Tiles 19 Tiles 24 Tiles vservcon Score 2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は 一方では個別の VM に影響し 他方では CPU をフル活用したときの使用可能な最大 VM 数に影響しています 次のグラフでは この 2 つの側面における向上の割合を示します ここでは Xeon X7460 を 4 基搭載した PRIMERGY RX600 S4(2008 年 ) Xeon X7550 を 4 基搭載した PRIMERGY RX600 S5(2010 年 ) Xeon E7-4820 を 4 基搭載した PRIMERGY RX600 S6(2011 年 ) Xeon E7-4850 を 4 基搭載した PRIMERGY RX600 S6(2011 年 ) といった 4 つの構成を比較しています Virtualization relevant improvements for 4-way servers 25 Few VMs (1 Tile) Score at optimum Tile count 20 x 2.97 x 1.26 15 10 x 2.34 5 0 2008 X7460 4 x 6 2.67 GHz 2010 X7550 4 x 8 2.00 GHz 2011 E7-4820 4 x 8 2.00 GHz 2011 E7-4850 4 x 10 2.00 GHz 2008 X7460 4 x 6 2.67 GHz 2010 X7550 4 x 8 2.00 GHz 2011 E7-4820 4 x 8 2.00 GHz 2011 E7-4850 4 x 10 2.00 GHz Year CPU #Cores Freq. 2008 年のシステムと Xeon E7-4850 プロセッサを搭載した現在のシステムを比較すると VM の数が尐ないケース (1 タイル ) での進歩は明らかです プロセッサ周波数が 25 % 低いにも関わらず (2.67 GHz に対して 2.0 GHz) 現在のシステムの vservcon スコアはわずかに高くなっています この主な理由の 1 つが プロセッサの新しい機能である EPT(Extended Page Tables: 拡張ページテーブル ) です 2 VM でシステムを完全負荷状態にすると Xeon E7-4820 8 コアプロセッサを搭載した現行システムの仮想化のパフォーマンスは プロセッサ周波数が 25 % 低いにも関わらず 約 2 倍になります その理由の 1 つは 個々の VM で実現できるパフォーマンスの向上です ( グラフ左側の Few VMs のスコアを参照 ) もう 1 つの理由は 全体最適化された状態で実行可能な VM の数が 3 倍以上に増加していることです ( ハイパースレッディング機能の使用やメモリ帯域幅の拡大などによる ) ただし VM の数を増やすことで個々の VM のパフォーマンスは低下しているため 全体としての性能向上は VM の数が 6 タイルに対して 19 タイルになったことによってもたらされたものと言えます 前世代のプロセッサをベースとするシステムとの比較においては 完全負荷状態での現在のシステムのスコアの向上に加えて 消費電力の削減も考慮すべきです TDP(Thermal Design Power: 熱設計電力 ) が この指針となります 2010 年に使用されていた Xeon X7550 プロセッサの TDP は 130 W でしたが 現行の E7-4820 プロセッサでは 同程度の仮想化性能を持ちながら TDP はわずか 105 W です 2 EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高 速化します 28/42 ページ Fujitsu Technology Solutions 2011

vservcon score さらにコア数の多いプロセッサを使用することによって 仮想化性能をさらに向上させることができます ( 完全負荷状態で )8 コアプロセッサではなく 10 コアプロセッサの現在のシステムで同じ測定を行うと 2008 年のシステムよりも明らかにパフォーマンスが向上していることがわかります 仮想化パフォーマンスの増加は 個別の VM の性能向上によるものがすべてではありません 2010 年以降の仮想化環境におけるパフォーマンス向上の大部分は 実行できる最大 VM 数が増大したことによって達成されたものです 8 ソケットサーバでは プロセッサを 4 基から 8 基に増やしたときに どの程度パフォーマンスが向上するかという疑問もあります パフォーマンスの向上度が増せば サーバ内のリソース共有によるオーバーヘッドは減尐します プロセッサ追加時の性能向上度を示すスケーリング係数は サーバの用途によって異なります サーバ統合用の仮想化プラットフォームとしてサーバを使用する場合 プロセッサの追加で性能は 1.93 倍になります 次のグラフからわかるように PRIMERGY RX900 S2 で Xeon E7-8870 を使用する場合 プロセッサを 4 基から 8 基に増やすと 仮想化性能は約 2 倍になります 50 45 40 1.84 35 30 25 1.93 20 15 10 5 0 RX600 S6 4 E7-4870 RX900 S2 4 E7-8870 RX900 S2 8 E7-8870 また 4 基のプロセッサで完全構成した PRIMERGY RX600 S6 と比較しても PRIMERGY RX900 S2 は非常に優れたパフォーマンスを示しています 8 基のプロセッサを搭載した PRIMERGY RX900 S2 のパフォーマンスは 4 基のプロセッサを搭載した PRIMERGY RX600 S6 と比べて 83.68 %(1.84 倍 ) 向上しています プロセッサ 4 基で完全構成した PRIMERGY RX600 S6 は プロセッサ 4 基を搭載した PRIMERGY RX900 S2 よりも若干パフォーマンスが高いですが これは PRIMERGY RX600 S6 が 4 基のプロセッサ搭載時に最適化するよう設計されているのに対し PRIMERGY RX900 S2 は 最大 8 基のプロセッサ搭載時に高パフォーマンスとなるように設計されているためです Fujitsu Technology Solutions 2011 29/42 ページ

ベンチマーク環境 測定は次のような環境で行いました フレームワークコントローラー サーバ ストレージシステム 複数の 1 Gb または 10 Gb ネットワーク SUT(System Under Test: テスト対象システム ) 負荷ジェネレーター Intel Xeon プロセッサ E7-8800 シリーズ E7-4800 シリーズ E7-2800 シリーズのすべての vservcon スコアは PRIMERGY RX600 S6 および PRIMERGY RX900 S2 を使用して測定しました SUT ハードウェア モデル プロセッサ PRIMERGY RX600 S6 Xeon E7-2803 (6 コア 1.73 GHz) 2 基 Xeon E7-2850 (10 コア 2.00 GHz) 2 基 Xeon E7-4807 (6 コア 1.87 GHz) 2 基 Xeon E7-4820 (8 コア 2.00 GHz) 2 基 Xeon E7-4830 (8 コア 2.13 GHz) 2 基 Xeon E7-4850 (10 コア 2.00 GHz) 2 基 Xeon E7-4860 (10 コア 2.27 GHz) 2 基 Xeon E7-4870 (10 コア 2.40 GHz) 2 基 Xeon E7-8837 (8 コア 2.67 GHz) 2 基 Xeon E7-4807 (6 コア 1.87 GHz) 4 基 Xeon E7-4820 (8 コア 2.00 GHz) 4 基 Xeon E7-4830 (8 コア 2.13 GHz) 4 基 Xeon E7-4850 (10 コア 2.00 GHz) 4 基 Xeon E7-4860 (10 コア 2.27 GHz) 4 基 Xeon E7-4870 (10 コア 2.40 GHz) 4 基 Xeon E7-8837 (8 コア 2.67 GHz) 4 基 メモリ 2 CPU:256 GB 4 CPU:512 GB(8 GB DIMM を使用した完全構成 ) ネットワークインターフェース ディスクサブシステム ストレージの接続 SUT ソフトウェア オペレーティングシステム 1 Gbit LAN 1 基 ( 制御用 ) 10 Gbit LAN 1 基 ( 負荷用 ) 内蔵ハードディスクは使用せず ストレージシステム ETERNUS DX80 のみを使用 VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN 各 LUN は 2 つの Seagate ST3300657SS ディスク (15 krpm) で構成された RAID 0 アレイ FC コントローラー Emulex LPe12002 を使用 ハイパーバイザー VMware ESX Server リリースバージョン 4.1 U1 ビルド 348481 BIOS SUT: 仮想化に関する詳細 ESX 設定 一般的な詳細 バージョン Aptio 0.99G デフォルト設定からの変更 :Performance/Watt=Traditional デフォルト ベンチマークの概要 vservcon を参照 30/42 ページ Fujitsu Technology Solutions 2011

SUT ハードウェア モデル プロセッサ PRIMERGY RX900 S2 Xeon E7-8830(8 コア 2.13 GHz) 4 基 Xeon E7-8837(8 コア 2.67 GHz) 4 基 Xeon E7-8850(10 コア 2.00 GHz) 4 基 Xeon E7-8860(10 コア 2.27 GHz) 4 基 Xeon E7-8870(10 コア 2.40 GHz) 4 基 Xeon E7-8830(8 コア 2.13 GHz) 8 基 Xeon E7-8837(8 コア 2.67 GHz) 8 基 Xeon E7-8850(10 コア 2.00 GHz) 8 基 Xeon E7-8860(10 コア 2.27 GHz) 8 基 Xeon E7-8870(10 コア 2.40 GHz) 8 基 メモリ 4 CPU:512 GB 8 CPU:1024 GB(8 GB DIMM を使用した完全構成 ) ネットワークインターフェース ディスクサブシステム ストレージの接続 SUT ソフトウェア オペレーティングシステム 1 Gbit LAN 1 基 ( 制御用 ) 10 Gbit LAN 1 基 ( 負荷用 ) 内蔵ハードディスクは使用せず ストレージシステム ETERNUS DX80 のみを使用 VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN 各 LUN は 2 つの Seagate ST3300657SS ディスク (15 krpm) で構成された RAID 0 アレイ FC コントローラー Emulex LPe12002 を使用 ハイパーバイザー VMware ESX Server リリースバージョン 4.1 U1 ビルド 348481 BIOS SUT: 仮想化に関する詳細 ESX 設定 一般的な詳細 バージョン 00.17 デフォルト設定 デフォルト ベンチマークの概要 vservcon を参照 負荷ジェネレーターのハードウェア モデル プロセッサ メモリ ネットワークインターフェース オペレーティングシステム PRIMERGY BX920 S1 サーバブレード (PRIMERGY BX900 シャーシ ) 17 台 それぞれ Xeon X5570(2.93 GHz) 2 基 12 GB それぞれ 1 Gbit LAN 3 基 Windows Server 2008 R2 Enterprise with Hyper-V 負荷ジェネレーター VM( タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作 ) プロセッサ メモリ ネットワークインターフェース オペレーティングシステム 論理 CPU 1 基 512 MB それぞれ 1 Gbit LAN 2 基 Windows Server 2003 Enterprise 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2011 31/42 ページ

VMmark V2 ベンチマークの説明 VMmark V2 は ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行うために VMware が開発したベンチマークです ベンチマークは 負荷生成用のソフトウェアに加えて 定義済み負荷プロファイルおよび規定されたルールで構成されます VMmark V2 によって得られたベンチマーク結果は VMware に提出しレビューを経た後に VMware のサイト上で公開されます 実績あるベンチマークである VMmark V1 の使用は 2010 年 10 月に中止され 代わって後継の VMmark V2 が使用されるようになりました VMmark V2 では 2 台以上のサーバのクラスタが必要であり 仮想マシン (VM) のクローン作成とデプロイ 負荷分散 vmotion や Storage vmotion による VM の移動といった データセンター機能も評価できます VMmark V2 は 実際には新しいベンチマークではありません VMmark V2 は 既存の アプリケーションシナリオ負荷ツール VM の数 ベンチマークをワークロードとして統合するフレームワークで これにより仮想化さ メールサーバ Web 2.0 LoadGen Olio クライアント 1 2 れた統合サーバ環境の負荷をシミュレート e コマース DVD Store 2 クライアント 4 します 3 つの実績あるベンチマーク ( それスタンバイサーバ (IdleVMTest) 1 ぞれ メールサーバ Web 2.0 e コマース のアプリケーションシナリオに対応 ) が VMmark V2 に統合されています これらの 3 つのアプリケーションシナリオは 合計 7 つの仮想マシンに 1 つずつ割り当てられます さらに スタンバイサーバという 8 番目の VM がこれらに追加されます これらの 8 つの VM が タイル を形成します 測定対象となるサーバの処理能力によっては 全体として最大のパフォーマンスを達成するために複数のタイルを並列して開始する必要があります VMmark V2 の新機能に ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントがあります これにより VM のクローン作成やデプロイ vmotion Storage vmotion によるデータセンター運用の効率性が評価されます このとき DRS(Distributed Resource Scheduler) によるデータセンターの負荷分散機能も使用されます VMmark V2 の結果は スコア と呼ばれる数値であり テスト対象システムの仮想化パフォーマンスを表します スコアは サーバ集約によるメリットの最大合計値で さまざまなハードウェアプラットフォームの比較基準として使用されます このスコアは VM の個々の結果とインフラストラクチャーコンポーネントの結果から導かれます 5 つの VMmark V2 アプリケーション VM またはフロントエンド VM のそれぞれが 各 VM でのアプリケーション固有のトランザクションレートという形でベンチマーク結果を示します スコアを正規化するために 各タイルのベンチマーク結果とリファレンスシステムでの結果との比率を求め 得られた値の幾何平均を算出します さらに すべての VM について 同じ手順で求めた値を加算します この値は 総合スコアの 80 % を決定します また ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントによるワークロードが 結果の 20 % を決定します インフラストラクチャーコンポーネントのスコアは 1 時間あたりのトランザクション数と 秒単位の平均持続時間で示されます 実際にはスコアに加えて タイル数がスコアと共に示されます 例えば 4.20@5 タイル のように スコア @ タイル数 と表します VMmark V2 の詳細については ベンチマークの概要 VMmark V2 を参照してください 32/42 ページ Fujitsu Technology Solutions 2011

18.20@18 tiles 18.00@18 tiles 17.98@18 tiles 17.11@21 tiles 16.89@18 tiles 16.89@20 tiles 16.68@18 tiles VMmark V2 Score ベンチマーク結果 2011 年 11 月 29 日 富士通は Xeon E7-4870 プロセッサを搭載した PRIMERGY RX600 S6 と VMware ESX 4.1 U1 を使用して VMmark V2 スコアで 18.20@18 タイル を達成しました このときは 合計 2 40 のプロセッサコアを搭載するシステム構成で テスト対象システム (SUT) には同一のサーバを 2 台使用しました これにより 富士通は 2011 年 7 月 12 日に同じハードウェア上で獲得した 17.98@18 タイル を上回る結果を達成しました このスコアおよび詳細な結果と構成データについては http://www.vmware.com/a/vmmark/ を参照してください 上記の結果により PRIMERGY RX600 S6 は VMmark V2 の観点から 80 コアサーバのカテゴリにおいて 2 台の同一ホストによる マッチドペア 構成で最も強力なサーバと評価されています ( ベンチマーク結果の公表日現在 ) 次のグラフは PRIMERGY RX600 S6 と競合他社の該当するシステムの測定結果を比較 3 したものです 同等のハードウェアでテストした Cisco の結果と比較すると PRIMERGY RX600 S6 の方が 1.11 % 上回っています 2 x 40 Cores 20 +1.11% 16 12 8 4 0 Fujitsu PRIMERGY RX600 S6 4 Xeon E7-4870 Cisco UCS C460 M2 4 Xeon E7-4870 Fujitsu PRIMERGY RX600 S6 4 Xeon E7-4870 HP ProLiant DL580 G7 4 Xeon E7-4870 Cisco UCS C460 M2 4 Xeon E7-4870 HP ProLiant DL580 G7 4 Xeon E7-4870 Cisco UCS C460 M2 4 Xeon E7-4870 使用したプロセッサでは 優れたハイパーバイザー設定によってプロセッサの機能を最適に利用できます そのため これらのプロセッサの使用は PRIMERGY RX600 S6 がこの結果を達成するための重要な前提条件でした プロセッサの機能には 拡張ページテーブル (EPT 4 ) とハイパースレッディングが含まれます これらはすべて 仮想化に対して有効に機能します すべての VM それらのアプリケーションデータ ホストオペレーティングシステム および追加で必要なデータは ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました このディスクサブシステムは ベンチマークの特定の要件を考慮して構成することもできます SSD (Solid State Drive: 半導体ドライブ ) の使用によって 使用するハードディスクの数や応答時間が向上しました 負荷ジェネレーターのネットワーク接続とホスト間のインフラストラクチャー負荷接続は 10Gb LAN ポートで実装しました 使用したすべてのコンポーネントは それぞれが最適に動作するように調整しました 3 4 上記の競合他社製品との比較は 2011 年 11 月 29 日現在のものです VMmark V2 の結果は http://www.vmware.com/a/vmmark/ を参照してください EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高速化します Fujitsu Technology Solutions 2011 33/42 ページ

ベンチマーク環境 一般的な測定環境を次に示します クライアントと管理サーバ サーバ ストレージシステム 複数の 1Gb または 10Gb ネットワーク プライムクライアントを含む負荷ジェネレーターとデータセンター管理サーバ vmotion ネットワーク テスト対象システム (System Under Test:SUT) SUT ハードウェア サーバ数 モデル プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ストレージ接続 SUT ソフトウェア オペレーティングシステム 2 台 PRIMERGY RX600 S6 Xeon E7-4870(10 コア 2.40 GHz) 4 基 512 GB(8 GB DIMM 64 枚 クアッドランク ) 1066 MHz Registered ECC DDR3 内蔵 Intel 82575EB クアッドポート 1 GbE アダプター 1 基富士通 D2755 デュアルポート 10 GbE アダプター 1 基 ストレージシステム ETERNUS DX80 10 台 SSD を含む合計 220 のハードディスクを搭載 ( 複数の RAID-0 アレイを構成 ) デュアルチャネル FC コントローラー Emulex LPe12002 1 基 ハイパーバイザー VMware ESX Server ESX バージョン VMware ESX v4.1 U1 ビルド 348481 BIOS バージョン 負荷ジェネレーターのハードウェア モデル プロセッサ メモリ ネットワークインターフェース オペレーティングシステム 詳細 公開 URL Rev. R0.99I / Rev. R1.00.3141 サーバブレード PRIMERGY BX620 S4 19 基 Intel Xeon 5130(2 GHz) 2 基 ( ただし プライムクライアントでは Intel Xeon X5470 (3.33 GHz) 2 基を使用 ) 4 GB それぞれ 1 Gbit LAN 1 基 Microsoft Windows Server 2003 R2 Enterprise SP2 および KB955839 を適用 http://vmware.com/a/assets/vmmark/pdf/2011-07-12-fujitsu-rx600s6.pdf http://vmware.com/a/assets/vmmark/pdf/2011-11-29-fujitsu-rx600s6.pdf 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 34/42 ページ Fujitsu Technology Solutions 2011

STREAM ベンチマークの説明 STREAM は メモリのスループットを測定するために長年使用されてきた総合的なベンチマークで John McCalpin 氏がデラウェア大学に教授として在職中に 氏によって開発されました 現在はバージニア大学でサポートされており ソースコードを Fortran または C のいずれでもダウンロードできます STREAM は 特に HPC( ハイパフォーマンスコンピューティング ) 分野で 重要な役割を担っています 例えば STREAM は HPC Challenge ベンチマークスイートの一部として使用されています このベンチマークは PC とサーバシステムの両方で使用できるように設計されています 測定単位は [GB/s] であり 1 秒あたりにリード / ライト可能なギガバイト数です STREAM では シーケンシャルアクセスでのメモリスループットを測定します メモリ上のシーケンシャルアクセスは CPU キャッシュが使用されるため 一般にランダムアクセスより高速です ベンチマーク実行前に 測定環境に合わせて STREAM のソースコードを調整します また CPU キャッシュによる測定結果への影響ができるだけ尐なくなるよう データ領域のサイズは 全 CPU キャッシュの総容量の 4 倍以上にする必要があります ベンチマーク中にプログラムの一部を並列実行するために OpenMP プログラムライブラリを使用します これにより 利用可能なプロセッサコアに対して最適な負荷分散が行われます STREAM ベンチマークでは 8 バイトの要素で構成されるデータ領域が 4 つの演算タイプに連続的にコピーされます COPY 以外の演算タイプでは 算術演算も行われます 演算タイプ演算ステップあたりのバイト数ステップあたりの浮動小数点演算 COPY a(i) = b(i) 16 0 SCALE a(i) = q b(i) 16 1 SUM a(i) = b(i) + c(i) 24 1 TRIAD a(i) = b(i) + q c(i) 24 2 スループットは 演算タイプ別に GB/s で表されます しかし最近のシステムでは 通常 演算タイプによる値の差はほんのわずかです そのため 一般的に 性能比較には TRIAD の測定値だけが使用されます 測定結果は 主にメモリモジュールのクロック周波数によって変わります また 算術演算は CPU によって影響を受けます 結果の精度は約 5 % です 本章では スループットを 10 のべき乗で表しています (1 GB/s = 10 9 Byte/s) Fujitsu Technology Solutions 2011 35/42 ページ

ベンチマーク結果 PRIMERGY RX600 S6 の STREAM の値は Xeon E7 シリーズのプロセッサを使用して測定しました ベンチマークプログラムは インテル C コンパイラー 12.0 でコンパイルし SUSE Linux Enterprise Server 11 SP1(64 ビット ) で実行しました データ領域は 12,000 万個の要素で構成されます これは約 900 MB に相当します プロセッサコア GHz L3 キャッシュ QPI スピード TDP Xeon E7-2803 6 1.73 18 MB 4.80 GT/s 105 W 32.6 Xeon E7-2850 10 2.00 24 MB 6.40 GT/s 130 W 46.2 TRIAD [GB/s] 2 チップ 4 チップ Xeon E7-4807 6 1.87 18 MB 4.80 GT/s 95 W 65.0 Xeon E7-4820 8 2.00 18 MB 5.86 GT/s 105 W 80.8 Xeon E7-4830 8 2.13 24 MB 6.40 GT/s 105 W 86.9 Xeon E7-4850 10 2.00 24 MB 6.40 GT/s 105 W 88.2 Xeon E7-4860 10 2.27 24 MB 6.40 GT/s 130 W 94.6 Xeon E7-4870 10 2.40 30 MB 6.40 GT/s 130 W 101 Xeon E7-8837 8 2.67 24 MB 6.40 GT/s 130 W 102 次のグラフは PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを 最大パフォーマンス構成で比較したものです GB/s 120 100 102 80 70.3 60 40 20 0 PRIMERGY RX600 S5 4 Xeon X7560 PRIMERGY RX600 S6 4 Xeon E7-8837 STREAM TRIAD 36/42 ページ Fujitsu Technology Solutions 2011

ベンチマーク環境 STREAM の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました ハードウェア モデル CPU コア数 PRIMERGY RX600 S6 Xeon E7-2803 E7-2850 E7-4807 E7-4820 E7-4830 E7-8837 E7-4850 E7-4860 E7-4870 2 チップ Xeon E7-2803: 12 コア Xeon E7-2850: 20 コア 4 チップ Xeon E7-4807: 24 コア Xeon E7-4820 E7-4830 E7-8837: 32 コア その他すべて : 40 コア 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ メモリ ソフトウェア オペレーティングシステム Xeon E7-2803 E7-4807 E7-4820: 18 MB( 命令 + データ ) オンチップ ( チップあたり ) Xeon E7-4870: 30 MB( 命令 + データ ) オンチップ ( チップあたり ) その他すべて : 24 MB( 命令 + データ ) オンチップ ( チップあたり ) 8 GB PC3-8500R DDR3-SDRAM 64 枚 SUSE Linux Enterprise Server 11 SP1(64 ビット ) コンパイラーインテル C コンパイラー 12.0 ベンチマーク Stream.c バージョン 5.9 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2011 37/42 ページ

LINPACK ベンチマークの説明 LINPACK は 1970 年代に Jack Dongarra 氏他数名によって スーパーコンピュータの性能を評価するために開発されました このベンチマークは 線形方程式系の解析および求解用のライブラリ関数を集めたものです 詳細は次のドキュメントで参照できます http://www.netlib.org/utk/people/jackdongarra/papers/hplpaper.pdf LINPACK では N 次元の線形方程式系を解く速度を測定します 結果は GFlops(Giga Floating Point Operations per Second:10 億浮動小数点演算 / 秒 ) で示されます これは浮動小数点演算を 1 秒間に 10 億回実行することを示す単位です 求解に必要な浮動小数点演算の回数は次の式によって決定されます 2 / 3 N 3 + 2 N 2 LINPACK の演算では メインメモリに N N サイズの行列データを配置する必要があります ( 値 N は求解する方程式の数です ) 使用可能なメインメモリを十分に利用できるような最大値を N に設定した場合に 最大の性能が達成されます しかし このような最大値の決定には非常に時間がかかるうえ 期待される結果の向上はごくわずかです また システムのメモリ帯域幅は結果にほとんど影響しません これは ベンチマークの実行中は主に浮動小数点演算が実行され データ交換は並列プロセス間でほとんど起こらないためです そのため ベンチマーク結果は 最大値より若干低い N の値から求められます LINPACK は HPC(High Performance Computing: 高性能計算 ) の分野で代表的なベンチマークの 1 つです また LINPACK は HPC チャレンジベンチマーク (HPC 環境における他の性能的側面を考慮に入れたベンチマーク ) を構成する 7 つのベンチマークの 1 つです PRIMERGY サーバの測定では インテルが最適化した 個別システム用の LINPACK バージョンを使用しました これはインテルコンパイラーに含まれています また 次のアドレスから直接ダウンロードすることもできます http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/ LINPACK の結果は http://www.top500.org/ で公表される可能性があります 公開にあたっての前提条件は MPI(Message Passing Interface) ベースのバージョンを使用することです (http://www.netlib.org/benchmark/hpl を参照 ) プロセッサコアの理論的な最大性能は 1 クロックサイクル内に実行される浮動小数点演算の回数から得られます 例えば クロック周波数が 2.4 GHz で 1 サイクルあたり 4 回の浮動小数点演算を実行するプロセッサの最大性能は 9.6 GFlops になります 測定結果と最大値の比率は 浮動小数点演算に関するシステムの効率を示します 演算中のメモリアクセス回数が尐ないほど この比率は高くなります これまでの測定結果から 現在のプロセッサアーキテクチャーの効率は およそ 90 % であることがわかっています 38/42 ページ Fujitsu Technology Solutions 2011

ベンチマーク結果 PRIMERGY RX600 S6 で Xeon E7 シリーズのプロセッサを測定しました ベンチマークプログラムは インテルコンパイラー 12.0 に付属するものを使用し これを SUSE Linux Enterprise Server 11 SP1(64 ビット ) で実行しました 測定対象のプロセッサのうち新しい SSE4.2 テクノロジーに対応したものは 1 クロックサイクルあたり 4 回の浮動小数点演算を達成します したがって 理論的最高値は次のとおりです GFlops max = 4 プロセッサコアの数 CPU 周波数 (GHz 単位 ) 使用可能なメインメモリは 512 GB なので 次元数を N = 200000 としました 2 プロセッサコア GHz L3 キャッシュ [MB] QPI スピード TDP 理論的最高値 [GFlops] LINPACK [GFlops] Xeon E7-2803 6 1.73 18 4.80 GT/s 105 W 83.0 78.2 94.2 Xeon E7-2850 10 2.00 24 6.40 GT/s 130 W 160 156 97.5 4 プロセッサコア GHz L3 キャッシュ [MB] QPI スピード TDP 理論的最高値 [GFlops] LINPACK [GFlops] Xeon E7-4807 6 1.87 18 4.80 GT/s 95 W 179 163 91.1 Xeon E7-4820 8 2.00 18 5.86 GT/s 105 W 256 245 95.7 Xeon E7-4830 8 2.13 24 6.40 GT/s 105 W 273 264 96.7 Xeon E7-8837 8 2.67 24 6.40 GT/s 130 W 342 324 94.7 Xeon E7-4850 10 2.00 24 6.40 GT/s 105 W 320 304 95.0 Xeon E7-4860 10 2.27 24 6.40 GT/s 130 W 362 339 93.6 Xeon E7-4870 10 2.40 30 6.40 GT/s 130 W 384 359 93.5 上記の結果では すべてのプロセッサが理論値の 90 % 以上を達成しており PRIMERGY RX600 S6 の浮動小数点演算の性能が良好であることを示しています 次のグラフは PRIMERGY RX600 S6 とその旧モデルである PRIMERGY RX600 S5 のスループットを 最大パフォーマンス構成で比較したものです 効率 [%] 効率 [%] LINPACK: PRIMERGY RX600 S6 と旧モデルとの比較 GFlops 400 359 350 300 269 250 200 150 100 50 0 PRIMERGY RX600 S5 4 Xeon X7560 PRIMERGY RX600 S6 4 Xeon E7-4870 Fujitsu Technology Solutions 2011 39/42 ページ

ベンチマーク環境 LINPACK の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S6 で行いました ハードウェア モデル CPU コア数 PRIMERGY RX600 S6 Xeon E7-2803 E7-2850 E7-4807 E7-4820 E7-4830 E7-8837 E7-4850 E7-4860 E7-4870 2 チップ Xeon E7-2803: 12 コア Xeon E7-2850: 20 コア 4 チップ Xeon E7-4807: 24 コア Xeon E7-4820 E7-4830 E7-8837: 32 コア その他すべて : 40 コア 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ メモリ ソフトウェア オペレーティングシステム ベンチマーク Xeon E7-2803 E7-4807 E7-4820: 18 MB( 命令 + データ ) オンチップ ( チップあたり ) Xeon E7-4870: 30 MB( 命令 + データ ) オンチップ ( チップあたり ) その他すべて : 24 MB( 命令 + データ ) オンチップ ( チップあたり ) 8 GB PC3-8500R DDR3-SDRAM 64 枚 SUSE Linux Enterprise Server 11 SP1(64 ビット ) インテルコンパイラー 12.0 に付属の xlinpack_xeon64 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 40/42 ページ Fujitsu Technology Solutions 2011

関連資料 PRIMERGY システム http://ts.fujitsu.com/primergy PRIMERGY RX600 S6 データシート ( 英語 ) http://docs.ts.fujitsu.com/dl.aspx?id=368e2f3f-028f-413d-9ce8-2ca13d5b1419 Xeon E7-8800/4800/2800(WESTMERE-EX) 搭載システムのメモリパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=e943109a-eeba-42b3-82a1-927b01ae319a RAID コントローラーのパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b 単一ディスクのパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c PRIMERGY のパフォーマンス http://ts.fujitsu.com/products/standard_servers/primergy_bov.html LINPACK http://www.netlib.org/linpack/ OLTP-2 ベンチマークの概要 OLTP-2 http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a SAP SD http://www.sap.com/benchmark ベンチマークの概要 SAP SD http://docs.ts.fujitsu.com/dl.aspx?id=ab13a8c0-44d8-40ee-9415-695d372e2e7b SPECcpu2006 http://www.spec.org/osg/cpu2006 ベンチマークの概要 SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157 SPECjbb2005 http://www.spec.org/jbb2005 ベンチマークの概要 SPECjbb2005 http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba STREAM http://www.cs.virginia.edu/stream/ vservcon ベンチマークの概要 vservcon http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71 Fujitsu Technology Solutions 2011 41/42 ページ

VMmark V2 ベンチマークの概要 VMmark V2 http://docs.ts.fujitsu.com/dl.aspx?id=a083d947-8a41-45d1-a112-8cd295595a95 VMmark V2 http://www.vmmark.com VMmark V2 結果 http://www.vmware.com/a/vmmark/ PC サーバ PRIMERGY( プライマジー ) http://jp.fujitsu.com/platform/server/primergy/ お問い合わせ先 富士通テクノロジー ソリューションズ Web サイト :http://ts.fujitsu.com PRIMERGY のパフォーマンスとベンチマーク mailto:primergy.benchmark@ts.fujitsu.com 知的所有権を含むすべての権利は弊社に帰属します 製品データは変更される場合があります 納品までの時間は在庫状況によって異なります データおよび図の完全性 事実性 または正確性について 弊社は一切の責任を負いません 本書に記載されているハードウェアおよびソフトウェアの名称は それぞれのメーカーの商標等である場合があります 第三者が各自の目的でこれらを使用した場合 当該所有者の権利を侵害することがあります 詳細については http://ts.fujitsu.com/terms_of_use.html を参照してください 2011-12-06 WW JA Copyright Fujitsu Technology Solutions GmbH 2011 42/42 ページ Fujitsu Technology Solutions 2011