ホワイトペーパー パフォーマンスレポート PRIMERGY BX960 S1 ホワイトペーパー FUJITSU PRIMERGY サーバパフォーマンスレポート PRIMERGY BX960 S1 本書では PRIMERGY BX960 S1 で実行したベンチマークの概要について説明します PRIMERGY BX960 S1 のパフォーマンスデータを 他の PRIMERGY モデルと比較して説明しています ベンチマーク結果に加え ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています バージョン 1.1a 2011-12-05 目次 ドキュメントの履歴... 2 製品データ... 3 SPECcpu2006... 4 SPECjbb2005... 8 OLTP-2... 11 SAP SD... 15 vservcon... 18 mark V1... 24 関連資料... 28 お問い合わせ先... 29 Fujitsu Technology Solutions 2010-2011 1/29 ページ
ドキュメントの履歴 バージョン 1.0 以下のベンチマークを含むレポートの初版 SPECcpu2006 Xeon E7520 E7530 L7545 E7540 X7542 X7550 L7555 X7560 で測定 SPECjbb2005 Xeon L7555 で測定 SAP SD 認証番号 2010038 vservcon Xeon E7520 E7530 L7545 E7540 X7542 L7555 X7550 X7560 で測定 mark V1 Xeon E7540 E7520 で測定 バージョン 1.1 以下のベンチマークを追加 OLTP-2 Xeon E7520 E7530 E7540 L7545 L7555 X7542 X7550 X7560 で測定 以下のベンチマークを更新 mark V1 Xeon X7560 で新規測定 バージョン 1.1a 軽微な訂正 2/29 ページ Fujitsu Technology Solutions 2010-2011
製品データ 4 ソケットサーバブレード PRIMERGY BX960 S1 には Intel 7500 チップセット Intel Xeon プロセッサ 7500 シリーズ (4 コア 6 コア 8 コア )2 ~ 4 基 最大 512 GB の DDR3-SDRAM が搭載可能な DIMM スロット 32 本 2 ポート 10 Gbit LAN コントローラー 1 基 SSD 最大 2 台に対応するオンボードコントローラー 1 基が搭載されています 詳細な製品データについては 次のデータシートを参照してください PRIMERGY BX900 S1 データシート PRIMERGY BX960 S1 データシート Fujitsu Technology Solutions 2010-2011 3/29 ページ
SPECcpu2006 ベンチマークの説明 SPECcpu2006 は 整数演算および浮動小数点演算でシステム性能を測定するベンチマークです このベンチマークは 12 本のアプリケーションから成る整数演算テストセット (SPECint2006) および 17 本のアプリケーションから成る浮動小数点演算テストセット (SPECfp2006) で構成されています これらのアプリケーションは大量の演算を実行し CPU およびメモリを集中的に使用します 他のコンポーネント ( ディスク I/O ネットワークなど ) は このベンチマークでは測定しません SPECcpu2006 は 特定のオペレーティングシステムに依存しません このベンチマークは ソースコードとして利用可能で 実際に測定する前にコンパイルする必要があります したがって 使用するコンパイラーのバージョンやその最適化設定が 測定結果に影響を与えます SPECcpu2006 には 2 つのパフォーマンス測定方法が含まれています 1 つ目の方法 (SPECint2006 および SPECfp2006) では 1 つのタスクの処理に必要な時間を測定します 2 つ目の方法 (SPECint_rate2006 および SPECfp_rate2006) では スループット ( 並列処理できるタスク数 ) を測定します いずれの方法も さらに 2 つの測定の種類 ベース と ピーク に分かれています これらは コンパイラー最適化を使用するかどうかという点で異なります ベース 値は常に公開されていますが ピーク 値はオプションです ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション SPECint2006 整数ピークアグレッシブ SPECint_base2006 整数ベース標準 速度 単体実行 SPECint_rate2006 整数ピークアグレッシブ SPECint_rate_base2006 整数ベース標準 スループット 多重実行 SPECfp2006 浮動小数点ピークアグレッシブ SPECfp_base2006 浮動小数点ベース標準 速度 単体実行 SPECfp_rate2006 浮動小数点ピークアグレッシブ SPECfp_rate_base2006 浮動小数点ベース標準 スループット 多重実行 測定結果は 個々のベンチマークで得られた正規化比の幾何平均です 算術平均と比較して 幾何平均の方が ひとつの飛び抜けて高い値に左右されない平均値です 正規化 とは テストシステムがリファレンスシステムと比較してどの程度高速であるかを測定することです 例えば リファレンスシステムの SPECint_base2006 SPECint_rate_base2006 SPECfp_base2006 および SPECfp_rate_base2006 の結果が 値 1 と判定されたとします このとき SPECint_base2006 の値が 2 の場合は 測定システムがこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します SPECfp_rate_base2006 の値が 4 の場合は 測定対象システムがリファレンスシステムの約 4/[ ベースコピー数 ] 倍の速さでこのベンチマークを実行したことを意味します ベースコピー数 とは 実行されたベンチマークの並行インスタンスの数です 弊社では SPEC の公開用に SPECcpu2006 のすべての測定値を提出しているわけではありません そのため SPEC の Web サイトに公開されていない結果が一部あります 弊社では すべての測定のログファイルをアーカイブしているので 測定の内容に関していつでも証明できます ベンチマーク結果 PRIMERGY BX960 S1 で Xeon 7500 シリーズのプロセッサを測定しました ベンチマークプログラムは インテル C++/Fortran コンパイラー 11.1 でコンパイルし SUSE Linux Enterprise Server 11(64 ビット ) で実行しました 4/29 ページ Fujitsu Technology Solutions 2010-2011
プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_base2006 SPECint2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7520 4 1.87 18 MB 4.80 GT/s 95 W 20.6 22.4 Xeon E7530 6 1.87 12 MB 5.86 GT/s 105 W 22.2 24.3 Xeon L7545 6 1.87 18 MB 5.86 GT/s 95 W 25.0 28.0 Xeon E7540 6 2 18 MB 6.40 GT/s 105 W 24.2 26.7 Xeon X7542 6 2.67 18 MB 5.86 GT/s 130 W 28.1 N/A 31.0 N/A Xeon X7550 8 2 18 MB 6.40 GT/s 130 W 24.6 N/A 27.2 N/A Xeon L7555 8 1.87 24 MB 5.86 GT/s 95 W 25.9 29.5 Xeon X7560 8 2.27 24 MB 6.40 GT/s 130 W 28.0 N/A 31.3 N/A プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_rate_base2006 SPECint_rate2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7520 4 1.87 18 MB 4.80 GT/s 95 W 155 311 165 335 Xeon E7530 6 1.87 12 MB 5.86 GT/s 105 W 221 441 237 473 Xeon L7545 6 1.87 18 MB 5.86 GT/s 95 W 227 454 244 489 Xeon E7540 6 2 18 MB 6.40 GT/s 105 W 243 487 259 524 Xeon X7542 6 2.67 18 MB 5.86 GT/s 130 W 247 N/A 265 N/A Xeon X7550 8 2 18 MB 6.40 GT/s 130 W 315 N/A 338 N/A Xeon L7555 8 1.87 24 MB 5.86 GT/s 95 W 298 595 321 638 Xeon X7560 8 2.27 24 MB 6.40 GT/s 130 W 348 N/A 375 N/A プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_base2006 SPECfp2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7520 4 1.87 18 MB 4.80 GT/s 95 W 26.6 28.4 Xeon E7530 6 1.87 12 MB 5.86 GT/s 105 W 28.7 31.0 Xeon L7545 6 1.87 18 MB 5.86 GT/s 95 W 31.0 34.3 Xeon E7540 6 2 18 MB 6.40 GT/s 105 W 30.7 33.3 Xeon X7542 6 2.67 18 MB 5.86 GT/s 130 W 33.8 N/A 36.0 N/A Xeon X7550 8 2 18 MB 6.40 GT/s 130 W 31.0 N/A 33.2 N/A Xeon L7555 8 1.87 24 MB 5.86 GT/s 95 W 32.1 35.8 Xeon X7560 8 2.27 24 MB 6.40 GT/s 130 W 34.0 N/A 36.5 N/A プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_rate_base2006 SPECfp_rate2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7520 4 1.87 18 MB 4.80 GT/s 95 W 132 262 138 274 Xeon E7530 6 1.87 12 MB 5.86 GT/s 105 W 174 338 180 356 Xeon L7545 6 1.87 18 MB 5.86 GT/s 95 W 182 353 189 375 Xeon E7540 6 2 18 MB 6.40 GT/s 105 W 196 376 202 399 Xeon X7542 6 2.67 18 MB 5.86 GT/s 130 W 203 N/A 210 N/A Xeon X7550 8 2 18 MB 6.40 GT/s 130 W 240 N/A 247 N/A Xeon L7555 8 1.87 24 MB 5.86 GT/s 95 W 225 449 233 467 Xeon X7560 8 2.27 24 MB 6.40 GT/s 130 W 257 N/A 265 N/A Fujitsu Technology Solutions 2010-2011 5/29 ページ
整数演算テストセットおよび浮動小数点演算テストセットの両方で 4 プロセッサのスループットは 2 プロセッサの 2 倍です SPECcpu2006: 整数演算性能 PRIMERGY BX960 S1(4 ソケットと 2 ソケットの比較 ) 638 700 600 500 321 595 400 300 200 100 0 298 2 x Xeon L7555 4 x Xeon L7555 SPECint_rate2006 SPECint_rate_base2006 SPECcpu2006: 浮動小数点演算性能 PRIMERGY BX960 S1(4 ソケットと 2 ソケットの比較 ) 467 500 450 400 350 300 250 200 150 100 50 0 449 233 225 2 x Xeon L7555 4 x Xeon L7555 SPECfp_rate2006 SPECfp_rate_base2006 6/29 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 SPECcpu2006 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY BX960 S1 で行いました ハードウェア モデル CPU CPU 数 PRIMERGY BX960 S1 Xeon E7520 E7530 L7545 E7540 X7542 X7550 L7555 X7560 2 チップ Xeon E7520: 8 コア 4 コア ( チップあたり ) Xeon E7530 L7545 E7540 X7542: 12 コア 6 コア ( チップあたり ) Xeon L7555 X7550 X7560: 16 コア 8 コア ( チップあたり ) 4 チップ Xeon E7520: 16 コア 4 コア ( チップあたり ) Xeon E7530 L7545 E7540: 24 コア 6 コア ( チップあたり ) Xeon L7555: 32 コア 8 コア ( チップあたり ) 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ ソフトウェア Xeon E7530: 12 MB( 命令 + データ ) オンチップ ( チップあたり ) Xeon E7520 L7545 E7540 X7542 X7550: 18 MB( 命令 + データ ) オンチップ ( チップあたり ) Xeon L7555 X7560: 24 MB( 命令 + データ ) オンチップ ( チップあたり ) オペレーティングシステム SUSE Linux Enterprise Server 11(64 ビット ) コンパイラーインテル C++/Fortran コンパイラー 11.1 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 7/29 ページ
SPECjbb2005 ベンチマークの説明 SPECjbb2005 は Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークです これは 本質的には SPECjbb2000 をアップデートしたものです 主な違いは次のとおりです トランザクションは 多様な機能範囲に対応するために より複雑になっています ベンチマークのワーキングセットは システムの負荷の増大に対応するために 拡大されています SPECjbb2000 では アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが SPECjbb2005 では複数のインスタンスが許可され 特に大規模なシステムで実環境との高い近似性を得ることができます SPECjbb2005 は ソフトウェアについては主にジャストインタイムコンパイラーで使用される J と スレッドおよびガーベージコレクションの実装のパフォーマンスを測定します 使用されるオペレーティングシステムの機能も評価します ハードウェアについては CPU およびキャッシュの効率 メモリサブシステム 共有メモリシステム (SMP) のスケーラビリティを評価します ディスクおよびネットワーク I/O は無関係です SPECjbb2005 は 最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント / サーバシステムをエミュレートしたもので 中間層システムに重点を置いています クライアントは TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し データベースへの OLTP アクセスを思考時間ゼロで行います 中間層システムは ビジネスプロセスおよびデータベースの更新を実装します データベースはデータ管理を行い メモリ内の Java オブジェクトによりエミュレートされます トランザクションのログ記録は XML ベースで実装されます このベンチマークの主な利点は シングルホスト上で 3 つの層すべてを実行できることです 中間層のパフォーマンスが測定されます このため 大規模なハードウェアの設置は不要となり 異なるシステムの SPECjbb2005 の結果を直接比較できます クライアントとデータベースのエミュレーションも Java で記述されています SPECjbb2005 には オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要です スケーリングの単位は 約 25 MB の Java オブジェクトから成るウェアハウスです 1 つのウェアハウスにつき 1 つの Java スレッドがオペレーションを実行します これらのビジネスオペレーションは TPC-C で次の項目を前提としています 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート ただし これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません 2 つのベンチマークの結果は比較できません SPECjbb2005 には 次の 2 つの性能指標があります bops(1 秒あたりのビジネスオペレーション ) は 1 秒あたりのすべてのビジネスオペレーションの処理レートです bops/j は 上記の性能指標 (bops) とアクティブな J インスタンス数の比率です SPECjbb2005 のさまざまな結果の比較では 両方の性能指標を考慮する必要があります これらの性能指標の測定は 次のようなベンチマークのルールに準拠しています ベンチマーク測定は ウェアハウス数 ( スレッド数 ) が増加する一連の測定ポイントで構成され それぞれにおいてウェアハウス数は 1 つずつ増加します 測定は 1 ウェアハウスで開始され 2*MaxWh( 少なくとも 8 ウェアハウス ) まで実行されます MaxWh は ベンチマークで予想される秒あたりの処理レートが最 8/29 ページ Fujitsu Technology Solutions 2010-2011
高になるウェアハウス数です デフォルトでは MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます 性能指標の bops は MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレーション速度の算術平均です ベンチマーク結果 2010 年 8 月 4 基の Xeon L7555 プロセッサおよび 128 GB の PC3-10600R DDR3-SDRAM メモリの構成で PRIMERGY BX960 S1 を測定しました 測定には Windows Server 2008 Enterprise x64 Edition SP2 を使用しました IBM から提供されている J9 の 16 のインスタンスを使用しました 測定結果は次のとおりです SPECjbb2005 bops = 1662995 SPECjbb2005 bops/j = 103937 1800000 SPECjbb2005 bops: PRIMERGY BX960 S1 (Xeon L7555 を 4 基搭載 ) 1600000 1400000 1200000 1000000 800000 600000 400000 200000 0 1 2 3 4 5 6 7 8 warehouses Fujitsu Technology Solutions 2010-2011 9/29 ページ
ベンチマーク環境 SPECjbb2005 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY BX960 S1 で行いました ハードウェア モデル CPU PRIMERGY BX960 S1 Xeon L7555 CPU 数 4 チップ 32 コア ( チップあたり 8 コア ) 1 次キャッシュ 32 KB( 命令 )+ 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB( 命令 + データ ) オンチップ ( コアあたり ) その他のキャッシュ 24 MB( 命令 + データ ) オンチップ ( チップあたり ) メモリ ソフトウェア オペレーティングシステム J バージョン 4 GB PC3-10600R DDR3-SDRAM 32 枚 Windows Server 2008 Enterprise x64 Edition SP2 IBM J9 (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924 (JIT enabled, AOT enabled) 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 10/29 ページ Fujitsu Technology Solutions 2010-2011
OLTP-2 ベンチマークの説明 OLTP とは Online Transaction Processing( オンライントランザクション処理 ) の略です OLTP-2 ベンチマークは データベースソリューションの標準的なアプリケーションシナリオを基にしています OLTP- 2 では データベースアクセスがシミュレートされ 1 秒あたりに実行されるトランザクションの数 (tps) が測定されます 独立した機関によって標準化され その規則を順守して測定しているかを監視される SPECint や TPC-E のようなベンチマークとは異なり OLTP-2 は 富士通が開発した固有のベンチマークです OLTP-2 は データベースのベンチマークとしてよく知られている TPC-E を基に開発されました そして CPU やメモリの構成に応じてシステムがスケーラブルな性能を示すことを実証するために さまざまな構成で測定できるように設計されています OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシナリオをシミュレートしても この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートするため 結果を比較したり同等のものとして扱うことはできません 通常 OLTP-2 の値は TPC-E に近い値となります しかし 価格性能比が算出されないため 直接比較できないだけでなく OLTP-2 の結果を TPC-E として利用することも許可されません 詳細情報は ベンチマークの概要 OLTP-2 を参照してください ベンチマーク結果 PRIMERGY BX960 S1 の OLTP-2 の値は Intel Xeon 75xx プロセッサシリーズを使用して 64 GB 128 GB 256 GB および 512 GB のメモリ構成で測定しました これらの結果は オペレーティングシステム Microsoft Windows Server 2008 R2 Enterprise とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです データベースのパフォーマンスは ハードディスクとコントローラーを含むシステムの構成オプションによって 大幅に異なります ここに記載されている次元のスループットは 通常の外部ディスクサブシステムがボトルネックでない場合に実現されます システム構成の詳細については ベンチマークの環境 を参照してください 次の表は PRIMERGY BX960 S1 に搭載可能な各プロセッサの仕様を示しています プロセッサ コア数 / チップ HT TM プロセッサ周波数 L3 キャッシュ QPI スピード メモリ周波数 E7520( 4 基 ) 4 1.86 GHz 18 MB 4.8 GT/s 800 MHz 95 W E7530( 4 基 ) 6 1.86 GHz 12 MB 5.86 GT/s 978 MHz 105 W E7540( 4 基 ) 6 2.0 GHz 18 MB 6.4 GT/s 1066 MHz 105 W L7545( 4 基 ) 6 1.86 GHz 18 MB 5.86 GT/s 978 MHz 95 W L7555( 4 基 ) 8 1.86 GHz 24 MB 5.86 GT/s 978 MHz 95 W X7542( 2 基 ) 6 2.66 GHz 18 MB 5.86 GT/s 978 MHz 130 W X7550( 2 基 ) 8 2.0 GHz 18 MB 6.4 GT/s 1066 MHz 130 W X7560( 2 基 ) 8 2.26 GHz 24 MB 6.4 GT/s 1066 MHz 130 W HT = ハイパースレッディング TM = ターボモード QPI = QuickPath インターコネクト GT = ギガトランスファー TDP = 熱設計電力 メモリに関しては 16 GB モジュールの最大構成 および 2 つの別構成で測定しました ここでは 周波数はプロセッサタイプによってのみ変わり 使用したメモリモジュールのタイプおよび数には影響されません メモリパフォーマンスの詳細については ホワイトペーパー Xeon 7500(Nehalem-EX) 搭載システムのメモリパフォーマンス を参照してください TDP Fujitsu Technology Solutions 2010-2011 11/29 ページ
データベース環境でメインメモリを選択するときのガイドラインとして メモリアクセス速度よりも メモリ容量が十分にあることが重要です 次のグラフは 2 基または 4 基の Intel Xeon シリーズプロセッサとさまざまなメモリ構成で得られる PRIMERGY BX960 S1 の OLTP-2 パフォーマンスデータを示しています 太字 斜体の数字 : 実測値その他 : 計算値 PRIMERGY BX960 S1 : OLTP-2 1745 [tps] 1718 2000 1800 1600 1247 1332 1311 1367 1459 1437 1373 1352 1286 1635 1400 1200 1000 800 600 400 453 511 494 869 927 913 650 734 710 712 804 778 670 756 732 852 962 930 626 707 684 967 884 1006 1057 969 1093 4CPUs-512GB 4CPUs-256GB 4CPUs-128GB 200 2CPUs-256GB 2CPUs-128GB 0 2CPUs-64GB E7520 4Core E7530 6Core E7540 6Core L7545 6Core L7555 8Core X7542 6Core X7550 8Core X7560 8Core 搭載可能なプロセッサの種類が多いため PRIMERGY BX960 S1 では広範にわたるレベルのパフォーマンスが実現されていることがわかります 同じ最大メモリ構成で比較すると パフォーマンスが最も低いプロセッサ (E7520) を使用した場合 (927 tps) に比べ パフォーマンスが最も高いプロセッサ (L7555) を使用した場合 (1745 tps) は OLTP-2 値は 1.9 倍になっています 測定結果に基づき プロセッサをいくつかのグループに分類できます 最下位にランクするのはターボモードをサポートしていない わずか 4 コアのプロセッサである E7520 です ハイパースレッディングとターボモードの両方をサポートする 6 コアのプロセッサ (E7530 E7540 L7545) では パフォーマンスが向上しています CPU あたり 8 コアのプロセッサである L7555 X7550 および X7560 は パフォーマンスの最上位にランクします 6 コアでクロック周波数は高いものの ハイパースレッディング機能をサポートしていない X7542 プロセッサは例外です データベースアプリケーションをシミュレートした OLTP-2 の負荷の下では特に 論理的なプロセッサコア数を 2 倍にするハイパースレッディングのメリットを受けます メインメモリを増設すると すべてのプロセッサタイプでデータベースのスループットを向上させることができました 一方で 4 ソケットサーバでは プロセッサを 2 基から 4 基に増やしたときに どの程度パフォーマンスが向上するかという疑問もあります スケーリングが向上すれば サーバ内のリソース共有によって通常生じるオーバーヘッドは減少します スケーリングの係数はアプリケーションによっても変わります サーバを 12/29 ページ Fujitsu Technology Solutions 2010-2011
データベースサーバとして使用する場合は CPU 数を 2 基から 4 基に倍増することで パフォーマンスを 82 %~ 92 % 程度向上させることができます ベンチマーク環境 ドライバ A 層 B 層 ネットワーク ネットワーク クライアント 一般的な測定環境を以下に示します ストレージサブシステム アプリケーションデータベースサーバサーバ SUT(System Under Test: テスト対象システム ) データベースサーバ (B 層 ) ハードウェア システム プロセッサ メモリ 設定 ( デフォルト ) ネットワークインターフェース PRIMERGY BX960 S1 Xeon E7520(4 コア 1.86 GHz) 4 基 Xeon E7530(6 コア 1.86 GHz) 4 基 Xeon L7545(6 コア 1.86 GHz) 4 基 Xeon E7540(6 コア 2.0 GHz) 4 基 Xeon X7542(6 コア 2.66 GHz) 2 基 Xeon L7555(8 コア 1.86 GHz) 4 基 Xeon X7550(8 コア 2.0 GHz) 2 基 Xeon X7560(8 コア 2.26 GHz) 2 基 64 GB~512 GB 1333 MHz Registered ECC DDR3(8 GB DIMM) または 1066 MHz Registered ECC DDR3(16 GB DIMM) ターボモード有効 NUMA サポート有効 ハイパースレッディング有効 LAN 1 Gbps 4 ディスクサブシステム RAID 1(OS 用 ) オペレーティングシステムおよびデータベースアプリケーション RAID 10( ログ用 ) シーケンシャルアクセス 応答時間を短縮するよう最適化 RAID 5( データ用 ) ランダムアクセス スループットを最適化 ソフトウェア オペレーティングシステム Windows Server 2008 R2 Enterprise データベース SQL Server 2008 R2 Enterprise x64 Fujitsu Technology Solutions 2010-2011 13/29 ページ
アプリケーションサーバ (A 層 ) ハードウェア システム プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX200 S6 Xeon E5620(4 コア 2.40 GHz) 2 基 12 GB 1333 MHz Registered ECC DDR3 オンボード LAN 1 Gbps 2 基 デュアルポート LAN 1 Gbps 2 基 73 GB 15k rpm SAS ドライブ 1 台 オペレーティングシステム Windows Server 2008 R2 Standard クライアント ハードウェア システム プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX200 S5 Xeon X5570(4 コア 2.93 GHz) 2 基 24 GB 1333 MHz Registered ECC DDR3 オンボード LAN 1 Gbps 2 基 73 GB 15k rpm SAS ドライブ 1 台 オペレーティングシステム Windows Server 2008 R2 Standard OLTP-2 ソフトウェア EGen バージョン 1.10.0 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 14/29 ページ Fujitsu Technology Solutions 2010-2011
SAP SD ベンチマークの説明 SAP アプリケーションソフトウェアは 標準的な業務プロセスを管理するためのモジュールで構成されています モジュールには 受注組立 (ATO) 財務会計 (FI) 人事管理 (HR) 在庫購買管理 (MM) 生産計画 (PP) 販売管理 (SD) などの ERP( 企業資源計画 ) 用のものや SCM( サプライチェーンマネジメント ) 小売 銀行業務 公益事業 BI( ビジネスインテリジェンス ) CRM( 顧客関係管理 ) PLM( 製品ライフサイクル管理 ) 用のものがあります SAP アプリケーションソフトウェアは必ずデータベースと関連しています したがって SAP の構成には ハードウェアに加え ソフトウェアコンポーネントであるオペレーティングシステムとデータベース および SAP ソフトウェア自体も含まれます SAP アプリケーションシステムのパフォーマンス 安定性およびスケーラビリティを評価するために SAP AG は SAP 標準アプリケーションベンチマークを開発しました 中でも 最も広く使用されており最も重要なのは SD ベンチマークです これらのベンチマークでは システム全体のパフォーマンスが分析されるため コンポーネントの統合品質を測定できます ベンチマークは 2 層の構成と 3 層の構成で異なります 2 層の構成では SAP アプリケーションとデータベースを 1 台のサーバにインストールします 3 層の構成では SAP アプリケーションの各コンポーネントを数台のサーバに分散でき 別のサーバでデータベースを処理します SAP AG( ドイツ Walldorf) によって開発されたベンチマークの詳細な仕様は http://www.sap.com/benchmark を参照してください Fujitsu Technology Solutions 2010-2011 15/29 ページ
ベンチマーク結果 2010 年 8 月 31 日に Xeon L7555 プロセッサ 4 基を搭載した PRIMERGY BX960 S1(Windows Server 2008 R2 Datacenter で SAP Enhancement Package 4 for SAP ERP 6.0 と SQL Server 2008 を使用 ) で次の結果を得たことが認証されました ( 認証番号 2010038) 認証番号 2010038 Number of SAP SD benchmark users 8,470 Average dialog response time Throughput Fully processed order line items/hour dialog steps/hour SAPS Average database request time (dialog/update) CPU utilization of central server 96% Operating system, central server RDBMS 0.99 seconds 924,330 2,773,000 46,220 0.022 sec / 0.029 sec Windows Server 2008 R2 Datacenter SQL Server 2008 Enterprise Edition SAP Business Suite software SAP enhancement package 4 for SAP ERP 6.0 Configuration Central server PRIMERGY BX960 S1 4 processors / 32 cores / 64 threads Xeon L7555 256 GB main memory 次のグラフは PRIMERGY BX960 S1 と高性能な PRIMERGY 2 ソケットサーバのスループットを比較したものです それぞれ最大のパフォーマンス構成になっています SAP SD:PRIMERGY RX600 S5 と PRIMERGY 2 ソケットサーバの比較 Fujitsu PRIMERGY BX960 S1 4 x Xeon L7555 256 GB RAM 8470 Windows Server 2008 R2 Datacenter SQL Server 2008 Enterprise Edition Fujitsu PRIMERGY BX922 S2 4 x Xeon X5680 72 GB RAM Windows Server 2008 R2 Enterprise SQL Server 2008 Enterprise Edition 4910 0 2000 4000 6000 8000 Number of Benchmark Users 日付 :2010 年 9 月 22 日 16/29 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 2 層環境 負荷ジェネレーター テスト対象システム SUT(System Under Test: テスト対象システム ) ハードウェア サーバ プロセッサ メモリ ディスクサブシステム ソフトウェア オペレーティングシステム データベース SAP Business Suite ソフトウェア PRIMERGY BX960 S1 Xeon L7555 4 基 8 GB PC3-10600R DDR3-SDRAM 32 枚 PRIMERGY BX960 S1 1 台 : PY FC Mezz Card 8Gb 2 Port(MC-FC82E) PRIMERGY SX940 S1 1 台 : RAID Ctrl SAS 6G 5/6 512MB(D2616) 1 基 RAID Contr BBU Upgrade for RAID 5/6 V16 1 基 HD SAS 6G 73GB 15K HOT PLUG 2.5" EP 2 台 HD SAS 6G 300GB 10K HOT PLUG 2.5" EP 1 基 FibreCAT CX4-480 1 台 Windows Server 2008 R2 Datacenter SQL Server 2008 Enterprise Edition SAP Enhancement Package 4 for SAP ERP 6.0 負荷ジェネレーター ハードウェア モデル プロセッサ メモリ ソフトウェア オペレーティングシステム PRIMERGY RX300 S4 Xeon X5460(3.17 GHz 12 MB L2 キャッシュ ) 2 基 12 GB PC2-5300F DDR2-SDRAM Linux 2.6.32 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 17/29 ページ
vservcon ベンチマークの説明 vservcon は 富士通テクノロジー ソリューションズが ハイパーバイザーを使用するサーバ構成について サーバ統合の適合性の比較に使用するベンチマークです これにより システム プロセッサ および I/O テクノロジーの比較に加え ハイパーバイザー 仮想化形式 および仮想マシン用の追加ドライバの比較も可能になります vservcon は 厳密に言えば新しいベンチマークではありません これは 言うなればフレームワークであり すでに確立されたベンチマークをワークロードとして集約し 統合され仮想化されたサーバ環境の負荷を再現します データベース アプリケーションサーバ Web サーバというアプリケーションシナリオを対象とする 3 つの実証済みのベンチマークが使用されます アプリケーションシナリオベンチマーク論理 CPU コアの数メモリ データベース Sysbench( 補正済み ) 2 1.5 GB Java アプリケーションサーバ SPECjbb( 補正済み 50~60 % の負荷 ) 2 2 GB Web サーバ WebBench 1 1.5 GB 3 つのアプリケーションシナリオのそれぞれが 1 つの専用の仮想マシン () に割り当てられます これらに加えてアイドル という 4 番目の仮想マシンが追加されます これら 4 つの が 1 つの タイル を構成します 最大の性能値を引き出すためには 測定対象となるサーバの処理能力に応じて いくつかのタイルを並行して開始しなければならない場合もあります テスト対象システム データベース Java Web アイドル タイル n データベース データベース データベース Java Java Java Web Web Web アイドル アイドル アイドル タイル 3 タイル 2 タイル 1 3 つの vservcon アプリケーションシナリオのそれぞれが 各 のアプリケーション固有のトランザクションレートという形でベンチマーク結果を提供します スコアを正規化するために 1 つのタイルのそれぞれのベンチマーク結果とリファレンスシステムの結果との比を求めます その相対性能値に適切な重み付けを行い すべての とすべてのタイルについて加算します 最終的な計算結果が このタイル数に対するスコアになります 原則として 1 つのタイルから始めて vservcon スコアの大幅な増加が見られなくなるまで タイル数を増やしながらこの手順が実行されます 最終的な vservcon スコアは すべてのタイル数から得られた vservcon スコアの最大値です したがって このスコアは CPU リソースを最大限まで使用する構成で達成される最大スループットを反映しています このため vservcon の測定環境は CPU のみが制限要因となるように設計されており 他のリソースによる制限は発生しないように設計されています タイル数の増加に対する vservcon スコアの伸びは テスト対象システムのスケーリング特性を知るための有益な情報となります さらに vservcon では ホストの合計 CPU 負荷 ( および他のすべての CPU 処理 ) を記録し 可能な場合は消費電力も記録します vservcon の詳細については ベンチマークの概要 vservcon を参照してください 18/29 ページ Fujitsu Technology Solutions 2010-2011
2 X7542 4 E7520 2 X7550 2 X7560 4 E7530 4 L7545 4 E7540 4 L7555 Final vservcon Score ホワイトペーパー パフォーマンスレポート PRIMERGY BX960 S1 バージョン : 1.1A 2011-12-05 ベンチマーク結果 PRIMERGY BX960 S1 は 最大 32 個のプロセッサコア 512 GB メインメモリ 4 つの 10 GbE ポート ( オンボード ) さらに進歩したプロセッサテクノロジーなど 多様な拡張性を備え 多数のアプリケーション の実行に適しています 前世代のプロセッサをベースとするシステムと比較して 仮想化性能が最高約 130 % 向上しています (vservcon スコアで測定 ) プロセッサを 4 基搭載したシステムで 前述の vservcon プロファイルを基にして 54 のアプリケーション (18 のタイルに相当 ) を使用した場合 CPU リソースの最大活用をほぼ実現できます 16 14 12 10 8 6 4 9 10 10 14 14 14 18 #Tiles 4 2 0 12 total cores 16 total cores 24 total cores 32 total cores 上記のグラフは 各プロセッサで達成可能な仮想化性能値を比較したものです このシステム用にリリースされたプロセッサには 4 コア 6 コア 8 コアがあり 技術的な仕様が異なります 次の表は 各プロセッサの主な違いとベンチマーク結果を示しています ( 略号 :QPI = QuickPath インターコネクト GT = ギガトランスファー TDP = 熱設計電力 ) プロセッサ コア数 L3 キャッシュ プロセッサ周波数 QPI スピード ハイパー スレッディング ターボ モード TDP タイル数スコア E7520(4 基 ) 4 18 MB 1.86 GHz 4.8 GT/s 95 W 9 7.58 E7530(4 基 ) 6 12 MB 1.86 GHz 5.86 GT/s 105 W 14 10.23 E7540(4 基 ) 6 18 MB 2.0 GHz 6.4 GT/s 105 W 14 11.93 X7542(2 基 ) 6 18 MB 2.66 GHz 5.86 GT/s 130 W 4 5.29 X7550(2 基 ) 8 18 MB 2.0 GHz 6.4 GT/s 130 W 10 7.90 X7560(2 基 ) 8 24 MB 2.26 GHz 6.4 GT/s 130 W 10 9.02 L7545(4 基 ) 6 18 MB 1.86 GHz 5.86 GT/s 95 W 14 11.17 L7555(4 基 ) 8 24 MB 1.86 GHz 5.86 GT/s 95 W 18 15.34 メモリ構成のパフォーマンスに対する影響は 比較的複雑です 4 基未満のプロセッサを構成する場合は 搭載したプロセッサに接続された DIMM スロットのみ使用できます 詳細は ホワイトペーパー Xeon 7500(Nehalem-EX) 搭載システムのメモリパフォーマンス を参照してください このホワイトペーパーでは 上の表で使用されている用語 (QPI および GT) についても詳細を掲載しています 仮想化環境のメインメモリを選択するときのガイドラインとして メモリアクセス速度よりも メモリ容量が十分にあることが重要です Fujitsu Technology Solutions 2010-2011 19/29 ページ
3.53 5.17 6.60 8.15 9.33 9.87 10.10 10.33 10.97 11.29 11.76 11.87 11.93 5.03 6.59 7.93 9.50 10.76 11.83 12.30 12.67 12.93 13.44 13.82 14.38 14.70 14.88 15.06 15.34 1.75 1.70 3.31 vservcon score CPU utilization ホワイトペーパー パフォーマンスレポート PRIMERGY BX960 S1 バージョン : 1.1A 2011-12-05 次のグラフは Xeon E7540(6 コア ) プロセッサまたは L7555(8 コア ) プロセッサを搭載した PRIMERGY BX960 S1 で 数の増加に伴う仮想化性能の推移を調べたものです ホストのそれぞれの CPU 負荷も示されています CPU 負荷が 90 % のときが最適なタイル数です 90 % を超えると過負荷となり 仮想化のパフォーマンスは停滞または低下します 4 x E7540 4 x L7555 18 100% 16 90% 14 12 10 8 6 4 2 80% 70% 60% 50% 40% 30% 20% 10% 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 vservcon score (left axis) CPU utilization of host (right axis) 0% # Tiles 上記のように多数の を実行できるのは 物理コア数の増加に加えて 7500 シリーズのほとんどすべての Xeon プロセッサがハイパースレッディング機能をサポートしているためです ハイパースレッディング機能では 1 つの物理プロセッサコアが結果的に 2 つの論理コアに分割されるため ハイパーバイザーが利用できるコア数は 2 倍になります そのため ハイパースレッディング機能は 一般的にシステムの仮想化性能を向上させます ハイパースレッディング機能を使用するシステムでは 前のグラフに示されているタイル数のスケーリング曲線が明確に見られます Xeon E7540 プロセッサには 24 個の物理コア すなわち 48 個の論理コアがあり 1 つのタイルにつき 4 個程度の論理コアが使用されます ( ベンチマークの説明 を参照 ) つまり ほぼ 6 タイルまでは 複数の が同じ物理コアを並行して使用することを回避できます そのため この範囲ではほぼ理想的にパフォーマンスが上昇します その後 CPU 使用率が限界に達するまでのパフォーマンス曲線は 傾きが緩やかになっていきます 前のグラフでは ホストの全アプリケーション の総合的なパフォーマンスを測定しました しかし 個々のアプリケーション のパフォーマンスも興味深いものです この情報は 前のグラフから読み取れます 例えば 高負荷で全体最適化された状態と 低負荷の状態での 個々のアプリケーション の仮想化性能を考えます 上記の Xeon E7540 環境では 42 のアプリケーション (14 タイル ) を使用した場合が全体最適化された状態で 3 つのアプリケーション (1 タイル ) を使用した場合が 低負荷の状態です 1 タイルあたりの vservcon スコアは vservcon の 3 つのアプリケーションシナリオを通じた平均値です 1 タイルあたりの平均パフォーマンスは vservcon スコアが低負荷のケース (1.75) から全体最適化された状態 (0.85=11.93/14) へ変化すると 49 % へと大幅に低下します 個々のアプリケーション の反応は 高負荷の状況では全く違ったものになります ある特定の状況下では 仮想ホストの 数に関して 全体的なパフォーマンス要件と 個々のアプリケーションのパフォーマンス要件のバランスをとる必要があります 20/29 ページ Fujitsu Technology Solutions 2010-2011
vservcon Score ホワイトペーパー パフォーマンスレポート PRIMERGY BX960 S1 バージョン : 1.1A 2011-12-05 2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は 一方では個別の に影響し 他方では CPU をフル活用したときの使用可能な最大 数に影響しています 次のグラフでは この 2 つの側面における向上の度合いを比較しています ここでは プロセッサ周波数が異なる 3 つの構成を選択し 比較しています Xeon X7460 を 4 基搭載した 2008 年の 4 ソケットシステムと Xeon E7540 を 4 基 および Xeon L7555 を 4 基搭載した PRIMERGY BX960 S1 です Virtualization relevant improvements for 4-way servers 18 Few s Overall Optimum 16 2.30 14 1.79 12 10 8 6 4 2 0 2008 X7460 4 6 2.67 GHz 2010 E7540 4 6 2.0 GHz 2010 L7555 4 8 1.86 GHz 2008 X7460 4 6 2.67 GHz 2010 E7540 4 6 2.0 GHz 2010 L7555 4 8 1.86 GHz Year CPU #Cores Freq. 2008 年のシステムと Xeon E7540 プロセッサを搭載した現在のシステムを比較すると の数が少ないケース (1 タイル ) での進歩は明らかです プロセッサ周波数が 25 % 低いにも関わらず (2.67 GHz に対して 2.0 GHz) 現在のシステムの vservcon スコアはわずかに高くなっています この主な理由の 1 つが プロセッサの新しい機能である EPT(Extended Page Tables: 拡張ページテーブル ) です 1 でシステムを完全負荷状態にすると Xeon E7540 6 コアプロセッサを搭載した現行システムの仮想化のパフォーマンスは プロセッサ周波数が 25 % 低いにも関わらず 約 2 倍になります その理由の 1 つは 個々の で実現できるパフォーマンスの向上です ( グラフ左側の Few s のスコアを参照 ) もう 1 つの理由は 全体最適化された状態で実行可能な の数が 2 倍以上に増加していることです ( ハイパースレッディング機能の使用やメモリ帯域幅の拡大などによる ) ただし の数を増やすことで個々の のパフォーマンスは低下しているため 全体としての性能向上は の数が 6 タイルに対して 14 タイルになったことによってもたらされたものと言えます 1 EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高 速化します Fujitsu Technology Solutions 2010-2011 21/29 ページ
前世代のプロセッサをベースとするシステムとの比較においては 完全負荷状態での現在のシステムのスコアの向上に加えて 消費電力の削減も考慮すべきです TDP(Thermal Design Power: 熱設計電力 ) が この指針となります 2008 年に使用されていた Xeon X7460 プロセッサの TDP は 130 W でしたが 現行の Xeon E7540 プロセッサの TDP はわずか 105 W です さらにコア数の多いプロセッサを使用することによって 仮想化性能をさらに向上させることができます ( 完全負荷状態で )6 コアプロセッサではなく 8 コアプロセッサの現在のシステムで同じ測定を行うと 2008 年のシステムよりも明らかにパフォーマンスが向上していることがわかります この例では プロセッサクロック周波数が 30 % 低いのにも関わらず 仮想化のパフォーマンスは 2.30 倍に向上しています また プロセッサの TDP は 95 W に低下し エネルギー効率も高まっています 仮想化パフォーマンスの増加は 個別の の性能向上によるものがすべてではありません 個別の の性能向上だけでは Xeon 7400 世代 (2008 年 ) の同一クロックのプロセッサと比較して 30 %~ 50 % を超えるスループットの増加は不可能です 2009 年以降の仮想化環境におけるパフォーマンス向上の大部分は 実行できる最大 数が増大したことによって達成されたものです 22/29 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 測定は次のような環境で行いました フレームワークコントローラー サーバ ストレージシステム 複数の 1 Gb または 10 Gb ネットワーク SUT(System Under Test: テスト対象システム ) 負荷ジェネレーター SUT ハードウェア モデル プロセッサ PRIMERGY BX960 S1 Xeon E7520(4 コア 1.86 GHz) 4 基 Xeon E7530(6 コア 1.86 GHz) 4 基 Xeon L7545(6 コア 1.86 GHz) 4 基 Xeon E7540(6 コア 2.0 GHz) 4 基 メモリ 256 GB(8 GB DIMM を使用した完全構成 ) Xeon X7542(6 コア 2.66 GHz) 2 基 Xeon L7555(8 コア 1.86 GHz) 4 基 Xeon X7550(8 コア 2.0 GHz) 2 基 Xeon X7560(8 コア 2.26 GHz) 2 基 ネットワークインターフェース 10 Gbit LAN オンボード 3: 負荷用 1 制御用 1 ホスト OS 用 1 ディスクサブシステム ストレージの接続 SUT ソフトウェア オペレーティングシステム 内蔵ハードディスクは使用せず ストレージシステム FibreCAT CX500 のみを使用 の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN 各 LUN は 5 つの Seagate ST373454 ディスク (15 krpm) で構成された RAID 0 アレイ FC コントローラー Emulex LPe12002 を使用 ハイパーバイザー ware ESX Server バージョンバージョン 4.0 U2 ビルド 261974 BIOS SUT: 仮想化に関する詳細 ESX 設定 一般的な詳細 負荷ジェネレーターのハードウェア モデル プロセッサ メモリ バージョン Aptio 3.6 R1.01C.2873 デフォルト設定 デフォルト ベンチマークの概要 vservcon を参照 PRIMERGY BX600 S3 シャーシ内にタイルあたり 2 台のサーバブレード それぞれ Xeon 5130 2 基 2000 MHz 1~2 GB ネットワークインターフェースそれぞれ 1 Gbit LAN 2 オペレーティングシステム W2K3 EE 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 23/29 ページ
mark V1 ベンチマークの説明 このセクションの内容は mark ベンチマークバージョン 1.1.1( 以降 mark V1 ) に基づいています mark V1 は ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行うために ware が開発したベンチマークです ベンチマークは 負荷生成用のソフトウェアに加えて 定義済み負荷プロファイルおよび規定されたルールで構成されます 長い間 mark V1 は ベンダー間の比較が可能な唯一の確立された仮想化ベンチマークでした mark V1 のベンチマーク結果は ware 社のレビュー後に ware サイトで公開されていました 現在では mark V2 に置き換えられており mark V1 は研究目的でのみ使用可能です mark V1 のようなベンチマークは サーバ統合の観点から実際のデータセンターを模倣します 言い方を変えると 実際にサーバ上で仮想化されているアプリケーションシナリオを考慮しなければなりません 目標は 稼動率が低いサーバをできるだけ多く として集約することです そのため ベンチマークによって さまざまなアプリケーション の全体的なスループットと 効率よく運用できる仮想マシンの個数を評価することが必要になります これらの 2 つの目的のために次のようなソリューションコンセプトが確立されています まず アプリケーションシナリオの代表的なグループが選択されます これらは 測定時に仮想ホスト上で同時に開始されます 各 には 適切な負荷ツールを使用して低い負荷がかけられるようになっています このような をグループ化したものを タイル と呼びます mark V1 のタイルは 6 つの で構成され そのうち 5 つは特定のアプリケーションシナリオに割り当てられます これらの に加え スタンバイサーバという 6 番目の が追加されます mark V1 では 論理的なプロセッサ メモリ ハードディスクスペースといった特定のリソースが各 に強制的に割り当てられます 右の表に 6 つの とそれらを測定するために使用する負荷ツールを示します アプリケーションシナリオ データベースサーバ 負荷ツール Sysbench ファイルサーバ Dbench( 変更済み ) Java アプリケーションサーバ SPECjbb2005( 変更済み ) メールサーバ Loadsim 2003 Web サーバ SPECweb2005( 変更済み ) スタンバイサーバ - 測定対象となるサーバの処理能力によっては 全体として最大のパフォーマンスを達成するために複数のタイルを並列して開始する必要があります テスト対象システム データベース ファイルサーバ Java メール Web スタンバイ タイル n データベース データベース データベース ファイルサーバ ファイルサーバ ファイルサーバ Java Java Java メール メール メール Web Web Web スタンバイ スタンバイ スタンバイ タイル 3 タイル 2 タイル 1 5 つの mark V1 アプリケーションシナリオのそれぞれから ごとのベンチマーク結果が得られます これらの結果から単一のスコアを取得するために すべての結果が適切に集約されます 結果は あるタイル数に対する mark V1 スコアで表し 12.34@5 タイル のように実際のスコアに加えてタイル数が示されます mark V1 の詳細については ベンチマークの概要 mark V1 を参照してください 24/29 ページ Fujitsu Technology Solutions 2010-2011
32.44@22 tiles 30.96@22 tiles 30.60@21 tiles 29.95@20 tiles 29.51@20 tiles 29.19@20 tiles 20.50@14 tiles 55.88@39 tiles 52.27@35 tiles mark Score ホワイトペーパー パフォーマンスレポート PRIMERGY BX960 S1 バージョン : 1.1A 2011-12-05 ベンチマーク結果 2010 年 6 月 29 日 富士通は PRIMERGY BX960 S1 と ware ESX v4.0 Update 2 を使用して 52.27@35 タイル の mark V1 スコアを達成し 2 位のシステムを 60 % 以上引き離して 24 コアカテゴリで 1 位を獲得しました 2010 年 10 月に PRIMERGY RX600 S5 で行われた測定では さらなる最適化を行いパフォーマンスが 7 % 向上しました PRIMERGY RX600 S5 と PRIMERGY BX960 S1 が同等の構成の場合 同等のパフォーマンスを実現することは 次のセクションの 16 プロセッサコア のベンチマーク結果にも表れています 次のグラフは PRIMERGY BX960 S1 および PRIMERGY RX600 S5 と競合他社のシステムを比較 2 した結果で 24 コアカテゴリの上位を示しています 60 24 Cores 50 40 30 20 10 0 Fujitsu PRIMERGY RX600 S5 4 Xeon E7540 Fujitsu PRIMERGY BX960 S1 4 Xeon E7540 Dell PowerEdge R715 2 Opteron 6176 SE HP ProLiant DL385 G7 2 Opteron 6176 SE HP ProLiant DL385 G7 2 Opteron 6176 SE HP ProLiant DL585 G6 4 Opteron 8439 SE Dell PowerEdge R905 4 Opteron 8439 SE HP ProLiant BL685c G6 4 Opteron 8435 IBM System x3850 M2 4 Xeon X7460 すべてのスコアおよび詳細な結果と構成データについては http://www.vmware.com/products/vmmark/v1/results.html を参照してください 仮想化性能の向上を実現するために極めて重要なものは Xeon 7500 シリーズプロセッサと そのプロセッサの機能を最適に使用できるバージョンのハイパーバイザーです プロセッサの機能には 拡張ページテーブル (EPT) 3 ハイパースレッディング およびこのプロセッサアーキテクチャーで採用されている高速なメモリ接続が含まれます これらはすべて 仮想化に対して有効に機能します システムを最適なパフォーマンスで稼動させるために 最大のメモリ構成 (512 GB:16 GB DIMM 32 枚 ) が必要でした すべての それらのアプリケーションデータ および追加で必要なデータは 合計で 49 個の LUN を備えた ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました ホストオペレーティングシステムは オンボード SATA コントローラーの SSD にインストールしました 使用したすべてのコンポーネントは それぞれが最適に動作するように調整しました 2 3 上記の競合他社製品との比較は 2010 年 10 月 19 日現在のものです また この比較は 24 コアサーバカテゴリの mark V1 の結果に基づいています mark V1 の結果は http://www.vmware.com/products/vmmark/v1/results.html を参照してください EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高速化します Fujitsu Technology Solutions 2010-2011 25/29 ページ
40.52@28 tiles 40.49@28 tiles 39.19@27 tiles 37.92@28 tiles 37.28@26 tiles 37.11@26 tiles 32.82@22 tiles 22.90@17 tiles 22.70@16 tiles mark Score ホワイトペーパー パフォーマンスレポート PRIMERGY BX960 S1 バージョン : 1.1A 2011-12-05 2010 年 10 月 19 日 富士通は PRIMERGY BX960 S1 と ware ESX v4.0 Update 2 を使用して mark V1 スコア 40.49@28 タイル を達成し 同じ Nehalem-EX ベースのラックサーバ PRIMERGY RX600 S5 との激戦の結果 16 コアカテゴリで 2 位を獲得しました 2010 年 10 月 19 日 富士通は PRIMERGY BX960 S1 と ware ESX v4.0 Update 2 を使用して 40.49@28 タイル の mark V1 スコアを達成し 16 コアカテゴリにおいて同じ Nehalem-EX ベースのラックサーバである PRIMERGY RX600 S5 と僅差で 2 位を獲得しました 次のグラフは PRIMERGY BX960 S1 および PRIMERGY RX600 S5 と競合他社のシステムを比較 4 した結果で 16 コアカテゴリの上位を示しています 40 16 Cores 35 30 25 20 15 10 5 0 Fujitsu Fujitsu PRIMERGY PRIMERGY RX600 S5 BX960 S1 2 2 Xeon Xeon X7560 X7560 Cisco UCS B230 M1 2 Xeon X7560 HP ProLiant BL620c G7 2 Xeon X7560 Dell PowerEdge R810 2 Xeon X7560 Dell PowerEdge M910 2 Xeon X7560 Fujitsu PRIMERGY BX960 S1 4 Xeon E7520 Dell PowerEdge M905 4 Opteron 8393 SE Dell PowerEdge R905 4 Opteron 8393 SE すべてのスコアおよび詳細な結果と構成データについては http://www.vmware.com/products/vmmark/v1/results.html を参照してください 24 コアシステムの結果と同様に 16 コアカテゴリのパフォーマンスが向上した主な理由として Xeon 7500 シリーズ ( ハイパースレッディングおよび EPT などの機能を搭載 ) の最新のプロセッサアーキテクチャーとその高速メモリ接続 およびハイパーバイザー ware ESX v4.0 Update 2 の使用が挙げられます PRIMERGY BX960 S1 では 合計 16 プロセッサコア (8 コアプロセッサ 2 基または 4 コアプロセッサ 4 基 ) を使った構成が可能です Nehalem-EX プロセッサファミリーのハイエンドである Xeon X7560 プロセッサを 2 基使った構成の方が ベーシッククラスの Xeon E7520 プロセッサを 4 基使った構成よりも大幅にパフォーマンスを向上できます mark V1 ベンチマークの 16 プロセッサコア構成では 256 GB のメモリ構成が必要です このメモリ構成は Xeon E7520 プロセッサを 4 基使った構成の場合 8 GB 32 枚で実現できます 一方 プロセッサが 2 基の構成では そのアーキテクチャーの理由から 半分のメモリスロットしか割り当てることができないため 16 GB 16 枚のメモリ構成にする必要があります すべての それらのアプリケーションデータ および追加で必要なデータは 合計で 33 個 または 41 個の LUN を備えた ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました ホストオペレーティングシステムは オンボード SATA コントローラーの SSD にインストールしました 使用したすべてのコンポーネントは それぞれが最適に動作するように調整しました 4 上記の競合他社製品との比較は 2010 年 10 月 19 日現在のものです また この比較は 16 コアサーバカテゴリの mark V1 の結果に基づいています mark V1 の結果は http://www.vmware.com/products/vmmark/v1/results.html を参照してください 26/29 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 一般的な測定環境を次に示します サーバ ストレージシステム 1 Gb または 10 Gb の複数のネットワーク プライムクライアントを含む負荷ジェネレーター SUT(System Under Test: テスト対象システム ) SUT ハードウェア モデル プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ストレージ接続 SUT ソフトウェア オペレーティングシステム PRIMERGY BX960 S1 Xeon X7560(8 コア 2.27 GHz) 2 基 Xeon E7540(6 コア 2.0 GHz) 4 基 Xeon E7520(4 コア 1.87 GHz) 4 基 512 GB(16 GB DIMM 32 枚 クアッドランク ) 1333 MHz Registered ECC DDR3 または 256 GB(16 GB DIMM 16 枚 クアッドランク ) 1333 MHz Registered ECC DDR3 または 256 GB(8 GB DIMM 32 枚 デュアルランク ) 1333 MHz Registered ECC DDR3 内蔵 Intel 82599EB デュアルポート 10 GbE アダプター 2 基 内蔵 : ホスト OS 用として Intel SATA SSD 32 GB( オンボードコントローラー ICH10R を使用 ) 8/9/11 ETERNUS DX80 ストレージシステムで複数の RAID-0 アレイに合計 172/196/244 のハードディスク デュアルチャネル MC-FC82E(Emulex LPe12002 ベース ) 1 基 ハイパーバイザー ware ESX Server ESX バージョン ware ESX v4.0 Update 2 ビルド 257240 またはビルド 261974 BIOS バージョン Aptio 3.6 R1.01C.2873 負荷ジェネレーターのハードウェア モデルサーバブレード PRIMERGY BX620 S4( タイルごとに 1 台 ) プロセッサ メモリ ネットワークインターフェース オペレーティングシステム 詳細 公開 URL Intel Xeon 5130(2 GHz) 2 基 3 GB それぞれ 1 Gbit LAN 1 基 Microsoft Windows Server 2003 R2 Enterprise SP2 および KB955839 を適用 http://www.vmware.com/files/pdf/vmmark/mark-fujitsu-2010-10-18-bx960.pdf http://www.vmware.com/files/pdf/vmmark/mark-fujitsu-2010-06-29bx960s1-24core.pdf http://www.vmware.com/files/pdf/vmmark/mark-fujitsu-2010-06-29bx960s1.pdf 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 27/29 ページ
関連資料 PRIMERGY システム http://ts.fujitsu.com/primergy PRIMERGY BX900 S1 データシート ( 英語 ) http://docs.ts.fujitsu.com/dl.aspx?id=0a5dcae5-f5a2-42dc-9039-7f887182bc5e パフォーマンスレポート PRIMERGY BX900 S1 http://docs.ts.fujitsu.com/dl.aspx?id=03d09581-3a16-4b48-bacf-38cbc3058790 PRIMERGY BX960 S1 データシート ( 英語 ) http://docs.ts.fujitsu.com/dl.aspx?id=f0e1190f-1a96-4a40-9cf4-29ca90e08c24 Xeon 7500(Nehalem-EX) 搭載システムのメモリパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=d9613ce4-223a-45e8-8f59-c39a831f2d18 RAID コントローラーのパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b 単一ディスクのパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c PRIMERGY のパフォーマンス http://ts.fujitsu.com/products/standard_servers/primergy_bov.html OLTP-2 ベンチマークの概要 OLTP-2 http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a SAP SD http://www.sap.com/benchmark ベンチマークの概要 SAP SD http://docs.ts.fujitsu.com/dl.aspx?id=ab13a8c0-44d8-40ee-9415-695d372e2e7b SPECcpu2006 http://www.spec.org/osg/cpu2006 ベンチマークの概要 SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157 SPECjbb2005 http://www.spec.org/jbb2005 ベンチマークの概要 SPECjbb2005 http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba mark V1 ベンチマークの概要 mark V1 http://docs.ts.fujitsu.com/dl.aspx?id=253a2cc2-b824-4ff4-85a4-8b55c0a265d5 mark V1 http://www.vmware.com/products/vmmark/v1/overview.html mark V1 結果 http://www.vmware.com/products/vmmark/v1/results.html 28/29 ページ Fujitsu Technology Solutions 2010-2011
vservcon ベンチマークの概要 vservcon http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71 PC サーバ PRIMERGY( プライマジー ) http://jp.fujitsu.com/platform/server/primergy/ お問い合わせ先 富士通テクノロジー ソリューションズ Web サイト :http://ts.fujitsu.com PRIMERGY のパフォーマンスとベンチマーク mailto:primergy.benchmark@ts.fujitsu.com 知的所有権を含むすべての権利は弊社に帰属します 製品データは変更される場合があります 納品までの時間は在庫状況によって異なります データおよび図の完全性 事実性 または正確性について 弊社は一切の責任を負いません 本書に記載されているハードウェアおよびソフトウェアの名称は それぞれのメーカーの商標等である場合があります 第三者が各自の目的でこれらを使用した場合 当該所有者の権利を侵害することがあります 詳細については http://ts.fujitsu.com/terms_of_use.html を参照してください 2011-12-05 WW JA Copyright Fujitsu Technology Solutions GmbH 2010-2011 Fujitsu Technology Solutions 2010-2011 29/29 ページ