ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 ホワイトペーパー FUJITSU PRIMERGY サーバパフォーマンスレポート PRIMERGY RX200 S6 本書では PRIMERGY RX200 S6 で実行したベンチマークの概要について説明します PRIMERGY RX200 S6 のパフォーマンスデータを 他の PRIMERGY モデルと比較して説明しています ベンチマーク結果に加え ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています バージョン 2.0a 2011-12-05 目次 ドキュメントの履歴... 2 製品データ... 3 SPECcpu2006... 4 SPECjbb2005... 15 SPECpower_ssj2008... 18 OLTP-2... 22 vservcon... 29 mark V1... 37 mark V2... 40 STREAM... 43 関連資料... 46 お問い合わせ先... 47 Fujitsu Technology Solutions 2010-2011 1/47 ページ
ドキュメントの履歴 バージョン 1.1 以下のベンチマークを含むレポートの初版 SPECcpu2006 Xeon E5503 E5506 E5507 L5609 L5630 E5620 E5630 E5640 X5667 X5677 L5640 X5650 X5660 X5670 X5680 で測定 SPECjbb2005 Xeon X5680 で測定 SPECpower_ssj2008 Xeon X5670 および SSD 2.5 インチ 64GB(1 台 ) で測定 vservcon Xeon E5507 L5609 L5630 E5620 E5630 E5640 X5667 X5677 L5640 X5650 X5660 X5670 X5680 で測定 mark V1 Xeon X5680 で測定 バージョン 1.2 以下のベンチマークを追加 OLTP-2 Xeon E5503 E5506 E5507 E5620 E5630 E5640 L5609 L5630 L5640 X5650 X5660 X5667 X5670 X5677 X5680 で測定 バージョン 2.0 以下のベンチマークを追加 mark V2 Xeon X5680 X5690 で測定 STREAM Xeon E5603 E5606 E5607 E5645 E5649 X5647 X5675 X5687 X5690 で測定 以下のベンチマークを更新 SPECcpu2006 Xeon E5603 E5606 E5607 E5645 E5649 X5647 X5675 X5687 X5690 で測定 ( インテル C++/Fortran コンパイラー 12.0) SPECjbb2005 Xeon X5690 で測定 SPECpower_ssj2008 Xeon X5675 および SSD 2.5 インチ 32GB(1 台 ) で測定 OLTP-2 Xeon 55xx および 56xx プロセッサシリーズで測定 vservcon Xeon 55xx および 56xx プロセッサシリーズで測定 バージョン 2.0a 軽微な訂正 2/47 ページ Fujitsu Technology Solutions 2010-2011
製品データ PRIMERGY RX200 S6 は 1 U の省スペース 2 ソケットラックサーバで PRIMERGY RX200 S5 の後継製品です Intel 5500 チップセット Intel Xeon 5500 または 5600 シリーズのプロセッサ (2 コア 4 コア 6 コア )2 基を搭載し 最大 192 GB の DDR3-SDRAM が搭載可能な 12 本の DIMM スロット オンボード 2 ポート 1 Gbit イーサネットコントローラー および 3 本の PCI スロット (PCI-Express 2.0 x4(1 本 ) および PCI-Express 2.0 x8(2 本 )) が装備されています PRIMERGY RX200 S6 は ドライブベイの種類によって 2 つのバージョンが提供されています ドライブベイには 最大 6 台または最大 8 台の 2.5 インチドライブ (SSD SATA または SAS HDD) を搭載できます 詳細な製品データについては PRIMERGY RX200 S6 データシートを参照してください Fujitsu Technology Solutions 2010-2011 3/47 ページ
SPECcpu2006 ベンチマークの説明 SPECcpu2006 は 整数演算および浮動小数点演算でシステム性能を測定するベンチマークです このベンチマークは 12 本のアプリケーションから成る整数演算テストセット (SPECint2006) および 17 本のアプリケーションから成る浮動小数点演算テストセット (SPECfp2006) で構成されています これらのアプリケーションは大量の演算を実行し CPU およびメモリを集中的に使用します 他のコンポーネント ( ディスク I/O ネットワークなど ) は このベンチマークでは測定しません SPECcpu2006 は 特定のオペレーティングシステムに依存しません このベンチマークは ソースコードとして利用可能で 実際に測定する前にコンパイルする必要があります したがって 使用するコンパイラーのバージョンやその最適化設定が 測定結果に影響を与えます SPECcpu2006 には 2 つのパフォーマンス測定方法が含まれています 1 つ目の方法 (SPECint2006 および SPECfp2006) では 1 つのタスクの処理に必要な時間を測定します 2 つ目の方法 (SPECint_rate2006 および SPECfp_rate2006) では スループット ( 並列処理できるタスク数 ) を測定します いずれの方法も さらに 2 つの測定の種類 ベース と ピーク に分かれています これらは コンパイラー最適化を使用するかどうかという点で異なります ベース 値は常に公開されていますが ピーク 値はオプションです ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション SPECint2006 整数ピークアグレッシブ SPECint_base2006 整数ベース標準 速度 単体実行 SPECint_rate2006 整数ピークアグレッシブ SPECint_rate_base2006 整数ベース標準 スループット 多重実行 SPECfp2006 浮動小数点ピークアグレッシブ SPECfp_base2006 浮動小数点ベース標準 速度 単体実行 SPECfp_rate2006 浮動小数点ピークアグレッシブ SPECfp_rate_base2006 浮動小数点ベース標準 スループット 多重実行 測定結果は 個々のベンチマークで得られた正規化比の幾何平均です 算術平均と比較して 幾何平均の方が ひとつの飛び抜けて高い値に左右されない平均値です 正規化 とは テストシステムがリファレンスシステムと比較してどの程度高速であるかを測定することです 例えば リファレンスシステムの SPECint_base2006 SPECint_rate_base2006 SPECfp_base2006 および SPECfp_rate_base2006 の結果が 値 1 と判定されたとします このとき SPECint_base2006 の値が 2 の場合は 測定システムがこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します SPECfp_rate_base2006 の値が 4 の場合は 測定対象システムがリファレンスシステムの約 4/[ ベースコピー数 ] 倍の速さでこのベンチマークを実行したことを意味します ベースコピー数 とは 実行されたベンチマークの並行インスタンスの数です 弊社では SPEC の公開用に SPECcpu2006 のすべての測定値を提出しているわけではありません そのため SPEC の Web サイトに公開されていない結果が一部あります 弊社では すべての測定のログファイルをアーカイブしているので 測定の内容に関していつでも証明できます ベンチマーク結果 測定 1 2010 年 4 月から 9 月にかけて Xeon 5500 および 5600 シリーズのプロセッサを使用して PRIMERGY RX200 S6 を測定しました ベンチマークプログラムは インテル C++/Fortran コンパイラー 11.1 でコンパイルし SUSE Linux Enterprise Server 11 ( 64 ビット ) で実行しました すべての結果は http://www.spec.org で公開されています 4/47 ページ Fujitsu Technology Solutions 2010-2011
プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 20.8 22.4 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 22.0 23.9 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 23.0 25.1 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 21.2 22.7 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 26.1 28.2 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 29.6 31.9 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 30.7 33.2 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 32.0 34.5 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 37.8 40.8 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 40.1 43.5 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 30.6 33.2 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 34.3 36.9 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 35.4 38.3 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 36.7 39.6 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 38.9 41.9 プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.0 73.0 40.2 79.2 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 71.2 139 76.2 148 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 74.1 144 79.2 154 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 70.0 135 75.7 146 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 94.5 181 101 193 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 107 209 114 223 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 112 218 118 232 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 116 225 123 239 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 137 268 145 284 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 145 284 153 300 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 144 275 154 295 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 165 322 176 344 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 170 331 181 354 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 174 338 185 362 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 182 353 194 379 Fujitsu Technology Solutions 2010-2011 5/47 ページ
プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 24.2 26.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 26.3 28.3 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 27.5 29.5 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 25.7 27.5 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 30.7 32.9 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 34.2 37.0 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 35.5 38.2 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 36.7 39.5 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 43.4 46.9 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 45.8 49.2 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 36.2 39.1 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 40.3 43.3 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 41.1 44.3 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 42.2 45.5 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 45.0 48.3 プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.4 72.6 38.7 75.1 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 60.5 117 62.3 120 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 62.2 120 64.1 123 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 63.1 116 65.3 120 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 72.9 133 75.9 139 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 83.9 162 87.3 168 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 87.0 167 90.2 174 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 88.8 171 92.2 177 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 105 205 109 212 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 110 214 114 222 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 107 198 110 205 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 119 232 123 241 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 122 237 126 245 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 123 240 128 249 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 128 246 132 255 6/47 ページ Fujitsu Technology Solutions 2010-2011
測定 2 2010 年 12 月から 2011 年 3 月にかけて Xeon 5600 シリーズのプロセッサを使用して PRIMERGY RX200 S6 を測定しました 2011 年 2 月 23 日 Xeon X5690 プロセッサ 2 基を搭載した PRIMERGY RX200 S6 は SPECint_rate_base2006 ベンチマークのインテルベースの 2 ソケットサーバカテゴリで第 1 位を獲得しました 1 結果は次の 4 つの表に示すとおりです ベンチマークプログラムは インテル C++/Fortran コンパイラー 12.0 でコンパイルし SUSE Linux Enterprise Server 11 SP1(64 ビット ) で実行しました 次の表の太字の値は http://www.spec.org で公開されています 予測 という印付きの値は 予測値です プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 22.7( 予測 ) 23.7( 予測 ) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 19.3 20.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 24.0( 予測 ) 25.3( 予測 ) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 25.1( 予測 ) 26.6( 予測 ) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 25.6 26.7 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 26.8 28.1 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 23.1( 予測 ) 24.0( 予測 ) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 28.5( 予測 ) 30.2( 予測 ) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 32.4( 予測 ) 34.2( 予測 ) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 33.6( 予測 ) 35.6( 予測 ) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 35.0( 予測 ) 37.0( 予測 ) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 37.5 39.5 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 41.5( 予測 ) 43.8( 予測 ) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 44.0( 予測 ) 46.7( 予測 ) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 45.0 47.6 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 33.5( 予測 ) 35.6( 予測 ) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 33.7 35.7 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 34.9 37.1 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 37.7( 予測 ) 39.6( 予測 ) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 38.9( 予測 ) 41.1( 予測 ) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 40.3( 予測 ) 42.5( 予測 ) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 41.8 43.9 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 42.9 45.2 Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 44.1 46.5 1 上記の競合他社製品との比較は 2011 年 2 月 23 日現在のものです また この比較は インテルベースの 2 ソケットサーバにおける SPECint_rate_base2006 の結果に基づいています 最新の結果は http://www.spec.org/cpu2006/results を参照してください Fujitsu Technology Solutions 2010-2011 7/47 ページ
プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 39.1( 予測 ) 76.7( 予測 ) 41.9( 予測 ) 82.9( 予測 ) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 61.2 118 65.0 125 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 75.3( 予測 ) 146( 予測 ) 79.5( 予測 ) 155( 予測 ) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 78.4( 予測 ) 151( 予測 ) 82.6( 予測 ) 161( 予測 ) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 79.8 154 84.4 163 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 83.5 161 88.6 170 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 74.3( 予測 ) 143( 予測 ) 79.4( 予測 ) 153( 予測 ) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 100( 予測 ) 192( 予測 ) 106( 予測 ) 203( 予測 ) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 113( 予測 ) 222( 予測 ) 119( 予測 ) 234( 予測 ) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 118( 予測 ) 231( 予測 ) 123( 予測 ) 243( 予測 ) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 123( 予測 ) 239( 予測 ) 129( 予測 ) 251( 予測 ) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 130 253 137 266 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 145( 予測 ) 285( 予測 ) 152( 予測 ) 298( 予測 ) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 154( 予測 ) 302( 予測 ) 161( 予測 ) 315( 予測 ) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 157 308 165 324 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 153( 予測 ) 292( 予測 ) 162( 予測 ) 310( 予測 ) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 153 294 163 314 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 159 304 169 324 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 177( 予測 ) 347( 予測 ) 188( 予測 ) 369( 予測 ) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 183( 予測 ) 357( 予測 ) 194( 予測 ) 380( 予測 ) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 187( 予測 ) 364( 予測 ) 198( 予測 ) 388( 予測 ) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 191 372 203 397 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 196( 予測 ) 380( 予測 ) 208( 予測 ) 406( 予測 ) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 200 389 213 416 8/47 ページ Fujitsu Technology Solutions 2010-2011
プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 32.8( 予測 ) 34.2( 予測 ) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 29.8 31.3 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 35.7( 予測 ) 37.2( 予測 ) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 37.3( 予測 ) 38.8( 予測 ) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 37.0 39.1 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 38.5 40.6 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 34.9( 予測 ) 36.1( 予測 ) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 40.8( 予測 ) 43.2( 予測 ) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 45.5( 予測 ) 48.6( 予測 ) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 47.2( 予測 ) 50.2( 予測 ) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 48.8( 予測 ) 51.9( 予測 ) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 51.2 54.1 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 58.6( 予測 ) 62.8( 予測 ) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 61.9( 予測 ) 65.9( 予測 ) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 61.7 65.5 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 48.1( 予測 ) 51.4( 予測 ) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 48.0 51.4 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 49.3 53.0 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 54.0( 予測 ) 58.0( 予測 ) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 55.1( 予測 ) 59.3( 予測 ) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 56.6( 予測 ) 60.9( 予測 ) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 57.3 61.5 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 58.5 62.4 Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 60.3 64.3 Fujitsu Technology Solutions 2010-2011 9/47 ページ
プロセッサコア GHz L3 キャッシュ QPI スピード TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 40.0( 予測 ) 75.5( 予測 ) 41.3( 予測 ) 79.9( 予測 ) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 58.6 107 60.6 113 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 64.6( 予測 ) 122( 予測 ) 66.6( 予測 ) 128( 予測 ) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 66.3( 予測 ) 124( 予測 ) 68.4( 予測 ) 131( 予測 ) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 70.9 127 73.5 133 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 73.0 131 75.6 138 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 67.3( 予測 ) 125( 予測 ) 68.9( 予測 ) 128( 予測 ) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 79.5( 予測 ) 146( 予測 ) 81.9( 予測 ) 151( 予測 ) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 90.4( 予測 ) 173( 予測 ) 93.0( 予測 ) 179( 予測 ) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 93.0( 予測 ) 180( 予測 ) 95.5( 予測 ) 186( 予測 ) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 94.9( 予測 ) 182( 予測 ) 97.6( 予測 ) 188( 予測 ) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 98.8 189 102 195 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 112( 予測 ) 215( 予測 ) 115( 予測 ) 222( 予測 ) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 117( 予測 ) 225( 予測 ) 120( 予測 ) 233( 予測 ) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 119 230 122 237 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 114( 予測 ) 208( 予測 ) 116( 予測 ) 215( 予測 ) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 114 211 117 216 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 116 215 119 220 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 127( 予測 ) 244( 予測 ) 130( 予測 ) 253( 予測 ) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 130( 予測 ) 249( 予測 ) 133( 予測 ) 257( 予測 ) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 131( 予測 ) 252( 予測 ) 135( 予測 ) 261( 予測 ) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 134 259 137 266 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 136( 予測 ) 262( 予測 ) 139( 予測 ) 269( 予測 ) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 138 266 141 273 10/47 ページ Fujitsu Technology Solutions 2010-2011
整数演算テストセットおよび浮動小数点演算テストセットの両方で 2 プロセッサのスループットは 1 プロセッサの約 2 倍です SPECcpu2006: 整数演算性能 PRIMERGY RX200 S6(2 ソケットと 1 ソケットの比較 ) 416 450 400 350 300 250 200 150 100 50 0 389 213 200 1 x Xeon X5690 2 x Xeon X5690 SPECint_rate2006 SPECint_rate_base2006 SPECcpu2006: 浮動小数点演算性能 PRIMERGY RX200 S6(2 ソケットと 1 ソケットの比較 ) 273 300 266 250 141 200 150 100 138 SPECfp_rate2006 50 0 1 x Xeon X5690 2 x Xeon X5690 SPECfp_rate_base2006 Fujitsu Technology Solutions 2010-2011 11/47 ページ
次のグラフは PRIMERGY RX200 S6 とその旧モデルである PRIMERGY RX200 S5 のスループットを比較したものです それぞれ最大のパフォーマンス構成になっています SPECcpu2006: 整数演算性能 PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較 47.6 50 45 40 35 30 25 31.8 35.3 45.0 20 15 10 5 SPECint2006 SPECint_base2006 0 PRIMERGY RX200 S5 PRIMERGY RX200 S6 2 x Xeon X5570 2 x Xeon X5687 SPECcpu2006: 整数演算性能 PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較 416 450 400 350 300 250 252 266 389 200 150 SPECint_rate2006 100 50 SPECint_rate_base2006 0 PRIMERGY RX200 S5 2 x Xeon X5570 PRIMERGY RX200 S6 2 x Xeon X5690 12/47 ページ Fujitsu Technology Solutions 2010-2011
SPECcpu2006: 浮動小数点演算性能 PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較 65.5 70 60 40.1 61.7 50 40 37.4 30 SPECfp2006 20 10 SPECfp_base2006 0 PRIMERGY RX200 S5 PRIMERGY RX200 S6 2 x Xeon X5570 2 x Xeon X5687 SPECcpu2006: 浮動小数点演算性能 PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較 273 300 199 266 250 200 193 150 100 SPECfp_rate2006 50 SPECfp_rate_base2006 0 PRIMERGY RX200 S5 2 x Xeon X5570 PRIMERGY RX200 S6 2 x Xeon X5690 Fujitsu Technology Solutions 2010-2011 13/47 ページ
ベンチマーク環境 測定 1 SPECcpu2006 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いました ハードウェア モデル CPU CPU 数 PRIMERGY RX200 S6 Xeon E5503 E5506 E5507 L5609 L5630 E5620 E5630 E5640 X5667 X5677 L5640 X5650 X5660 X5670 X5680 1 チップ : Xeon E5503: Xeon E5506 E5507 L5609 L5630 E5620 E5630 E5640 X5667 X5677: その他すべて : 2 チップ : Xeon E5503: Xeon E5506 E5507 L5609 L5630 E5620 E5630 E5640 X5667 X5677: その他すべて : 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ ソフトウェア Xeon E5503 E5506 E5507: 4 MB( 命令 + データ ) オンチップ ( チップあたり ) その他すべて : 12 MB( 命令 + データ ) オンチップ ( チップあたり ) オペレーティングシステム SUSE Linux Enterprise Server 11(64 ビット ) コンパイラーインテル C++/Fortran コンパイラー 11.1 2 コア 4 コア 6 コア 4 コア 8 コア 12 コア 測定 2 SPECcpu2006 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いました ハードウェア モデル CPU CPU 数 PRIMERGY RX200 S6 Xeon E5603 E5606 E5607 E5645 E5649 X5647 X5675 X5687 X5690 1 チップ : Xeon E5603 E5606 E5607 X5647 X5687: 4 コアその他すべて : 6 コア 2 チップ : Xeon E5603 E5606 E5607 X5647 X5687: 8 コアその他すべて : 12 コア 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ ソフトウェア Xeon E5603 E5606 E5607: 8 MB( 命令 + データ ) オンチップ ( チップあたり ) その他すべて : 12 MB( 命令 + データ ) オンチップ ( チップあたり ) オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット ) コンパイラーインテル C++/Fortran コンパイラー 12.0 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 14/47 ページ Fujitsu Technology Solutions 2010-2011
SPECjbb2005 ベンチマークの説明 SPECjbb2005 は Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークです これは 本質的には SPECjbb2000 をアップデートしたものです 主な違いは次のとおりです トランザクションは 多様な機能範囲に対応するために より複雑になっています ベンチマークのワーキングセットは システムの負荷の増大に対応するために 拡大されています SPECjbb2000 では アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが SPECjbb2005 では複数のインスタンスが許可され 特に大規模なシステムで実環境との高い近似性を得ることができます SPECjbb2005 は ソフトウェアについては主にジャストインタイムコンパイラーで使用される J と スレッドおよびガーベージコレクションの実装のパフォーマンスを測定します 使用されるオペレーティングシステムの機能も評価します ハードウェアについては CPU およびキャッシュの効率 メモリサブシステム 共有メモリシステム (SMP) のスケーラビリティを評価します ディスクおよびネットワーク I/O は無関係です SPECjbb2005 は 最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント / サーバシステムをエミュレートしたもので 中間層システムに重点を置いています クライアントは TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し データベースへの OLTP アクセスを思考時間ゼロで行います 中間層システムは ビジネスプロセスおよびデータベースの更新を実装します データベースはデータ管理を行い メモリ内の Java オブジェクトによりエミュレートされます トランザクションのログ記録は XML ベースで実装されます このベンチマークの主な利点は シングルホスト上で 3 つの層すべてを実行できることです 中間層のパフォーマンスが測定されます このため 大規模なハードウェアの設置は不要となり 異なるシステムの SPECjbb2005 の結果を直接比較できます クライアントとデータベースのエミュレーションも Java で記述されています SPECjbb2005 には オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要です スケーリングの単位は 約 25 MB の Java オブジェクトから成るウェアハウスです 1 つのウェアハウスにつき 1 つの Java スレッドがオペレーションを実行します これらのビジネスオペレーションは TPC-C で次の項目を前提としています 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート ただし これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません 2 つのベンチマークの結果は比較できません SPECjbb2005 には 次の 2 つの性能指標があります bops(1 秒あたりのビジネスオペレーション ) は 1 秒あたりのすべてのビジネスオペレーションの処理レートです bops/j は 上記の性能指標 (bops) とアクティブな J インスタンス数の比率です SPECjbb2005 のさまざまな結果の比較では 両方の性能指標を考慮する必要があります これらの性能指標の測定は 次のようなベンチマークのルールに準拠しています ベンチマーク測定は ウェアハウス数 ( スレッド数 ) が増加する一連の測定ポイントで構成され それぞれにおいてウェアハウス数は 1 つずつ増加します 測定は 1 ウェアハウスで開始され 2*MaxWh( 尐なくとも 8 ウェアハウス ) まで実行されます MaxWh は ベンチマークで予想される秒あたりの処理レートが最 Fujitsu Technology Solutions 2010-2011 15/47 ページ
高になるウェアハウス数です デフォルトでは MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます 性能指標の bops は MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレーション速度の算術平均です ベンチマーク結果 測定 1 2010 年 3 月 2 基の Xeon X5680 プロセッサおよび 48 GB の PC3-10600R DDR3-SDRAM メモリの構成で PRIMERGY RX200 S6 を測定しました 測定には Windows Server 2008 R2 Enterprise を使用しました IBM から提供されている J9 の 6 つのインスタンスを使用しました 測定結果は次のとおりです SPECjbb2005 bops = 927067 SPECjbb2005 bops/j = 154511 測定 2 2010 年 11 月 2 基の Xeon X5690 プロセッサ構成で PRIMERGY RX200 S6 を測定しました その他の構成は 2010 年 3 月の測定と同じです 測定結果は次のとおりです SPECjbb2005 bops = 946596 SPECjbb2005 bops/j = 157766 1000000 800000 SPECjbb2005 bops: PRIMERGY RX200 S6 と旧モデルとの比較 1000000 800000 SPECjbb2005 bops: PRIMERGY RX200 S6 と旧モデルとの比較 927067 946597 600000 600000 400000 200000 0 PRIMERGY RX200 S6 2 x Xeon X5690 PRIMERGY RX200 S6 2 x Xeon X5680 PRIMERGY RX200 S5 2 x Xeon X5570 1 2 3 4 5 6 7 8 warehouses 400000 200000 0 568875 PRIMERGY RX200 S5 2 x Xeon X5570 PRIMERGY RX200 S6 PRIMERGY RX200 S6 2 x Xeon X5680 2 x Xeon X5690 16/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 SPECjbb2005 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いました ハードウェア モデル CPU PRIMERGY RX200 S6 Xeon X5680 X5690 CPU 数 2 チップ 12 コア ( チップあたり 6 コア ) 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB( 命令 + データ ) オンチップ ( コアあたり ) その他のキャッシュ 12 MB( 命令 + データ ) オンチップ ( チップあたり ) メモリ ソフトウェア オペレーティングシステム J バージョン 4 GB PC3-10600R DDR3-SDRAM 12 枚 Windows Server 2008 R2 Enterprise IBM J9 (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924 (JIT enabled, AOT enabled) 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 17/47 ページ
SPECpower_ssj2008 ベンチマークの説明 SPECpower_ssj2008 は サーバクラスのコンピュータを対象とした 消費電力とパフォーマンスの特性を評価する業界標準の SPEC ベンチマークです SPEC は SPECpower_ssj2008 をリリースし パフォーマンスの評価と同じ手法で サーバの消費電力測定の標準を定義しました ベンチマークのワークロードは 典型的なサーバサイド Java ビジネスアプリケーションの負荷をシミュレートします ワークロードはスケーラブルで マルチスレッド化されており さまざまなプラットフォームで利用でき 簡単に実行できます ベンチマークは CPU キャッシュ SMP ( symmetric multiprocessor systems: 対称型マルチプロセシングシステム ) のメモリ階層とスケーラビリティに加え J(Java Virtual Machine:Java 仮想マシン ) JIT(Just In Time: ジャストインタイム ) コンパイラー ガーベージコレクション スレッドなどの実装や オペレーティングシステムのいくつかの機能をテストします SPECpower_ssj2008 では 100 % から アクティブアイドル まで 10 % 区切りで さまざまなパフォーマンスレベルにおける一定時間の消費電力をレポートします この段階的なワークロードは サーバの処理負荷および消費電力が 日や週によって大きく変化することを反映しています すべてのレベルにおける電力効率指標を計算するには 各パフォーマンスレベル ( セグメント ) で測定したトランザクションスループットを合計し 各セグメントの平均消費電力の合計で割ります 結果は overall ssj_ops/watt という性能指数です この値から測定対象サーバのエネルギー効率に関する情報が得られます 測定標準が定義されていることにより SPECpower_ssj2008 で測定される値を他の設定やサーバと比較することができます ここで示すグラフは SPECpower_ssj2008 の標準的な結果のグラフです 本構造とさまざまなコンポーネントの概要を示しています ベンチマークは さまざまなオペレーティングシステムおよびハードウェアアーキテクチャーで実行され 大がかりなクライアントやストレージインフラストラクチャーを必要としません SPEC に準拠したテストで必要な最低限の機材は ネットワークで接続された 2 台のコンピュータと 電力アナライザと温度センサーが 1 台ずつです コンピュータの 1 台は SUT ( System Under Test: テスト対象システム ) で サポート対象のオペレーティングシステムと J が実行されます J は Java で実装されている SPECpower_ssj2008 ワークロードを実行するために必要な環境を提供します もう 1 台のコンピュータは CCS (Control & Collection System: 収集および制御システム ) で ベンチマークの動作を制御し レポートに使用する電力 パフォーマンス および温度のデータを取得します この図は ベンチマーク構成の基 18/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク結果 2010 年 11 月 2 基の Intel Xeon X5675 プロセッサおよび 12 GB の PC3L-10600E DDR3-SDRAM メモリの構成で PRIMERGY RX200 S6 を測定しました 測定には Windows Server 2008 R2 Enterprise および IBM J9 2.4 を使用しました Intel Xeon X5675 プロセッサを搭載した PRIMERGY RX200 S6 は 2,961 overall ssj_ops/watt の結果を達成しました 左のグラフは PRIMERGY RX200 S6 の測定結果を示しています 赤い横棒は グラフの y 軸で示された各目標負荷レベルに対する電力性能比 ( 単位 :ssj_ops/watt x 軸の上目盛 ) を表しています 青い線は 小さなダイヤで示された各目標負荷レベルにおける平均消費電力 (x 軸の下目盛 ) が描く曲線を表しています 黒い縦線は PRIMERGY RX200 S6 の出したベンチマーク結果である 2,961 overall ssj_ops/watt を表しています これは 各測定におけるトランザクションスループットの合計を各測定での平均消費電力の合計で割ったものです 次の表は 各負荷レベルにおけるスループット ( 単位 : ssj_ops) 平均消費電力 ( 単位 : W) およびエネルギー効率の詳細を表しています パフォーマンス電力エネルギー効率 目標負荷 ssj_ops 平均消費電力 (W) ssj_ops/watt 100 % 932,989 239 3,904 90 % 837,478 218 3,842 80 % 746,900 197 3,786 70 % 651,878 179 3,640 60 % 558,298 165 3,388 50 % 467,230 153 3,059 40 % 371,128 142 2,618 30 % 276,339 131 2,103 20 % 187,218 122 1,538 10 % 94,027 109 859 アクティブアイドル 0 74.8 0 ssj_ops / power = 2,961 サーバは 最大限のエネルギー効率を得られるようチューニングしました メモリについては 最小の消費電力で最高のパフォーマンスを得られるように 2 GB の LV-DIMM(Low Voltage DIMM: 低電圧 DIMM) 計 6 枚を 利用可能な各メモリチャネルに 1 枚ずつ装着する構成としました この構成では 1 つのメモリ Fujitsu Technology Solutions 2010-2011 19/47 ページ
チャネルに 2 枚または 3 枚のメモリを装着した場合に比べ 消費電力を抑えることができ さらに利用可能なメモリ帯域幅を最大限に活用できます ただし ハードウェア構成で最も重要なことは 適切なプロセッサの選択です プロセッサは メモリサブシステムと並んで サーバで最も電力を消費する部品だからです PRIMERGY RX200 S6 では TDP(Thermal Design Power: 熱設計電力 )95 W の 6 コア Xeon X5675 プロセッサ搭載時に最高の値を記録しました 次のグラフは 各負荷レベルでの消費電力 ( 右の Y 軸 ) とスループット ( 左の Y 軸 ) について PRIMERGY RX200 S6 に Intel Xeon X5675 プロセッサを搭載した場合と Intel Xeon X5670 プロセッサを搭載した場合 (2010 年 3 月に測定済み ) を比較したものです 新しい Intel Xeon X5675 プロセッサは 同じ 95 W の TDP にもかかわらず 消費電力はやや低いことがわかります また Xeon X5675 プロセッサは Xeon X5670 プロセッサと比較してスループットが高くなっています これはクロック周波数が高いためです この 2 つの要素によって PRIMERGY RX200 S6 のエネルギー効率は全体で 3.9 % 向上しています 20/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 SPECpower_ssj2008 の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で Yokogawa WT210 電力アナライザを使用して行いました ハードウェア モデル プロセッサ (TDP) PRIMERGY RX200 S6 Xeon X5675(95 W) CPU 数 6 コアプロセッサ 2 基 ( コアあたり 2 スレッド ) 1 次キャッシュ 32 KB( 命令 ) + 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB( 命令 + データ ) オンチップ ( コアあたり ) 3 次キャッシュ 12 MB( 命令 + データ ) オンチップ ( チップあたり ) メモリ ネットワークインターフェース ディスクサブシステム 電源ユニット ソフトウェア オペレーティングシステム J バージョン 2 GB PC3L-10600E DDR3-SDRAM 6 枚 1 Gbit LAN Intel 82575EB ギガビットネットワーク接続 ( オンボード ) 2 基 内蔵 SATA コントローラー 1 基 2.5 インチ SATA SSD 1 台 32 GB JBOD 450 W Fujitsu Technology Solutions S26113-F570-E1 1 基 Windows Server 2008 R2 Enterprise IBM J9 (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924 (JIT enabled, AOT enabled) J アフィニティ start /affinity [0xF,0xF0,0xF00,0xF000,0xF0000,0xF00000] J オプション -Xaggressive -Xcompressedrefs -Xgcpolicy:gencon -Xmn1300m -Xms1500m - Xmx1500m -XlockReservation -Xnoloa -XtlhPrefetch -Xlp 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 21/47 ページ
6 コア HT TM 5600 シリーズ 4 コア HT TM 4 コア 5500 ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 OLTP-2 ベンチマークの説明 OLTP とは Online Transaction Processing( オンライントランザクション処理 ) の略です OLTP-2 ベンチマークは データベースソリューションの標準的なアプリケーションシナリオを基にしています OLTP- 2 では データベースアクセスがシミュレートされ 1 秒あたりに実行されるトランザクションの数 (tps) が測定されます 独立した機関によって標準化され その規則を順守して測定しているかを監視される SPECint や TPC-E のようなベンチマークとは異なり OLTP-2 は 富士通が開発した固有のベンチマークです OLTP-2 は データベースのベンチマークとしてよく知られている TPC-E を基に開発されました そして CPU やメモリの構成に応じてシステムがスケーラブルな性能を示すことを実証するために さまざまな構成で測定できるように設計されています OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシナリオをシミュレートしても この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートするため 結果を比較したり同等のものとして扱うことはできません 通常 OLTP-2 の値は TPC-E に近い値となります しかし 価格性能比が算出されないため 直接比較できないだけでなく OLTP-2 の結果を TPC-E として利用することも許可されません 詳細情報は ベンチマークの概要 OLTP-2 を参照してください ベンチマーク結果 PRIMERGY RX300 S6 の OLTP-2 の値は Xeon 55xx および 56xx プロセッサシリーズを使用して 48 GB 72 GB 96 GB 144 GB および 192 GB のメモリ構成で測定しました 次の表は 測定対象のプロセッサの仕様を示しています プロセッサ コア数 / チップ L3 キャッシュプロセッサ周波数 QPI スピード HT TM TDP E5503 2 4 MB 2.00 GHz 4.8 GT/s - - 80 W E5506 4 4 MB 2.13 GHz 4.8 GT/s - - 80 W E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W E5603 4 4 MB 1.60 GHz 4.8 GT/s - - 80 W E5606 4 8 MB 2.13 GHz 4.8 GT/s - - 80 W E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W QPI=Quick Path インターコネクト GT= ギガトランスファー HT= ハイパースレッディング TM= ターボモード TDP= 熱設計電力 22/47 ページ Fujitsu Technology Solutions 2010-2011
6 コア HT TM 5600 シリーズ 4 コア HT TM 4 コア 5500 ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 データベースのパフォーマンスは CPU やメモリの構成と データベースで使用するディスクサブシステムの接続性によって 大きく異なります Xeon 55xx および 56xx プロセッサシリーズは 次のようなさまざまなシステム構成に対応しています プロセッサ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 E5503 E5506 E5507 E5603 E5606 E5607 L5609 L5630 E5620 E5630 E5640 X5647 X5667 X5672 X5677 X5687 L5640 E5645 E5649 X5650 X5660 X5670 X5675 X5680 X5690 最大メモリ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 CPU 1 48 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB CPU 2 96 GB 192 GB 192 GB 192 GB 192 GB 144 GB 192 GB 96 GB 144 GB *) 192 GB 288 GB *) *) 16 GB デュアルランクメモリモジュールの特別リリース Fujitsu Technology Solutions 2010-2011 23/47 ページ
次に示す CPU およびメモリの性能評価では ディスクサブシステムは適切であり ボトルネックにならないものとします PRIMERGY RX300 S6 の OLTP-2 の値は オペレーティングシステム Microsoft Windows Server 2008 R2 Enterprise とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです システム構成の詳細については ベンチマーク環境 を参照してください データベース環境でメインメモリを選択するときのガイドラインとして メモリアクセス速度よりも メモリ容量が十分にあることが重要です そのため 16 GB モジュールの最大構成 8 GB モジュールの最大構成 および 8 GB モジュールの別構成で測定しました 周波数は プロセッサと メモリモジュールの種類および数によって変わります メモリパフォーマンスの詳細については ホワイトペーパー Xeon 5600 (Westmere-EP) 搭載システムのメモリパフォーマンス を参照してください 次のグラフは Intel Xeon 5600 および 5500 シリーズのプロセッサ (1 基または 2 基 ) と さまざまなメモリ構成で測定した OLTP-2 トランザクションレートを示しています 多種類のプロセッサにより 広範にわたるレベルのパフォーマンスが実現されていることがわかります 同じ最大メモリ構成で比較すると パフォーマンスが最も低いプロセッサ (Xeon E5503) を使用した場合に比べ パフォーマンスが最も高いプロセッサ (Xeon X5690) を使用した場合は OLTP-2 値は 5.4 倍になっています 測定結果が示す性能に基づき プロセッサをいくつかのグループに分類できます 最もパフォーマンスが低いのは わずか 2 コアのプロセッサである Xeon E5503 です その次のグループのプロセッサは OLTP-2 でほぼ 2 倍のパフォーマンスを達成しています ハイパースレッディングをサポートしていない 4 コアプロセッサ (Xeon E5506 Xeon E5507 Xeon E5603 Xeon E5606 Xeon E5607 および Xeon L5609) が このグループです OLTP-2 の測定では コア数を 2 倍にすると パフォーマンスもほぼ 2 倍になります ハイパースレッディングとターボモードの両方をサポートする 4 コアプロセッサでは さらに高いパフォーマンスが得られます Xeon L5630 Xeon E5620 Xeon E5630 Xeon E5640 および Xeon X5647 がこのグループです このグループでは ハイパースレッディングによって論理的なプロセッサコア数が 2 倍になるため OLTP-2 の測定では特に優れた結果が得られます Xeon X5667 Xeon X5672 Xeon X5677 Xeon X5687 は 同じくハイパースレッディングとターボモードをサポートする 4 コアプロセッサですが 高レベルのターボモードを利用可能で QPI スピードも 5.86 GT/s よりさらに高速の 6.4 GT/s です これにより このグループの 4 コアプロセッサは 下位の 6 コアプロセッサであるクロック周波数 ターボモードレベル QPI スピードが低いモデル (Xeon E5645 および Xeon E5649) に近いスループットを達成できます 最高のパフォーマンスを発揮するのは QPI スピード 6.4 GT/s を実現する 6 コアプロセッサ Xeon X5650 Xeon X5660 Xeon X5670 Xeon X5675 Xeon X5680 および Xeon X5690 のグループです このグループでは 2 基の CPU を使用した OLTP-2 の測定のほとんどで 96 GB(8 GB DIMM 12) で周波数 1333 MHz のメモリ構成の方が 144 GB(8 GB DIMM 18) で周波数 800 MHz のメモリ構成より優れた結果が得られました 24/47 ページ Fujitsu Technology Solutions 2010-2011
OLTP-2 tps 2CPUs-192GB 2CPUs-144GB 2CPUs-96GB 1CPU-96GB 1CPU-72GB 1CPU-48GB X5690-6Core X5680-6Core X5675-6Core X5670-6Core X5660-6Core X5650-6Core E5649-6Core E5645-6Core L5640-6Core X5687-4Core X5677-4Core X5672-4Core X5667-4Core X5647-4Core E5640-4Core E5630-4Core E5620-4Core L5630-4Core L5609-4Core E5607-4Core E5606-4Core E5603-4Core E5507-4Core E5506-4Core E5503-2Core 0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 tps Fujitsu Technology Solutions 2010-2011 25/47 ページ
PRIMERGY 現行モデルでの OLTP-2 の最高値は 旧モデルの最高値と比較して約 50 % 向上しています tps 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0 2 X5570 96 GB RAM 旧モデル 2 W5590 96 GB RAM OLTP-2 tps の最高値システム世代間の比較 + ~ 50% 2 X5670 96 GB RAM 2 X5690 96 GB RAM 現行モデル 現行モデル TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 旧モデル TX200 S5 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - - 26/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 一般的な測定環境を以下に示します ドライバ A 層 B 層 ネットワーク ネットワーク クライアント ストレージサブシステム アプリケーションデータベースサーバサーバ SUT(System Under Test: テスト対象システム ) Intel Xeon 55xx および 56xx プロセッサシリーズの OLTP-2 のすべての値は PRIMERGY RX300 S6 を使用して測定しました データベースサーバ (B 層 ) ハードウェア システム プロセッサ メモリ 設定 ( デフォルト ) ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX300 S6 Xeon E5503(2 コア 2.00 GHz) 2 基 Xeon E5506(4 コア 2.13 GHz) 2 基 Xeon E5507(4 コア 2.27 GHz) 2 基 Xeon E5603(4 コア 1.60 GHz) 2 基 Xeon E5606(4 コア 2.13 GHz) 2 基 Xeon E5607(4 コア 2.27 GHz) 2 基 Xeon L5609(4 コア 1.87 GHz) 2 基 Xeon L5630(4 コア 2.13 GHz) 2 基 Xeon E5620(4 コア 2.40 GHz) 2 基 Xeon E5630(4 コア 2.53 GHz) 2 基 Xeon E5640(4 コア 2.67 GHz) 2 基 Xeon X5647(4 コア 2.93 GHz) 2 基 Xeon X5667(4 コア 3.07 GHz) 2 基 Xeon X5672(4 コア 3.20 GHz) 2 基 Xeon X5677(4 コア 3.46 GHz) 2 基 Xeon X5687(4 コア 3.60 GHz) 2 基 Xeon L5640(6 コア 2.27 GHz) 2 基 Xeon E5645(6 コア 2.40 GHz) 2 基 Xeon E5649(6 コア 2.53 GHz) 2 基 Xeon X5650(6 コア 2.67 GHz) 2 基 Xeon X5660(6 コア 2.80 GHz) 2 基 Xeon X5670(6 コア 2.93 GHz) 2 基 Xeon X5675(6 コア 3.06 GHz) 2 基 Xeon X5680(6 コア 3.33 GHz) 2 基 Xeon X5690(6 コア 3.46 GHz) 2 基 48 GB~192 GB 1333 MHz Registered ECC DDR3(8 GB DIMM) または 1066 MHz Registered ECC DDR3(16 GB DIMM) ターボモード有効 NUMA サポート有効 ハイパースレッディング有効 オンボード LAN 1 Gbps 2 基 RX300 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB 73 GB 15k rpm SAS ドライブ 2 台 RAID1(OS) 147 GB 15k rpm SAS ドライブ 6 台 RAID10( ログ ) LSI MegaRAID SAS 9280-8e 5 基 JX40 5 台 : 各 64 GB SSD ドライブ 24 台 RAID5( データ ) オペレーティングシステム Windows Server 2008 R2 Enterprise データベース SQL Server 2008 R2 Enterprise x64 Fujitsu Technology Solutions 2010-2011 27/47 ページ
アプリケーションサーバ (A 層 ) ハードウェア システム プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX200 S6 Xeon E5640 (6 コア 2.66 GHz) 1 基 12 GB 1333 MHz Registered ECC DDR3 オンボード LAN 1 Gbps 2 基 デュアルポート LAN 1 Gbps 2 基 73 GB 15k rpm SAS ドライブ 1 台 オペレーティングシステム Windows Server 2008 R2 Standard クライアント ハードウェア システム プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ソフトウェア PRIMERGY RX200 S5 Xeon X5570(4 コア 2.93 GHz) 2 基 24 GB 1333 MHz Registered ECC DDR3 オンボード LAN 1 Gbps 2 基 73 GB 15k rpm SAS ドライブ 1 台 オペレーティングシステム Windows Server 2008 R2 Standard OLTP-2 ソフトウェア EGen バージョン 1.12.0 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 28/47 ページ Fujitsu Technology Solutions 2010-2011
vservcon ベンチマークの説明 vservcon は 富士通テクノロジー ソリューションズが ハイパーバイザーを使用するサーバ構成について サーバ統合の適合性の比較に使用するベンチマークです これにより システム プロセッサ および I/O テクノロジーの比較に加え ハイパーバイザー 仮想化形式 および仮想マシン用の追加ドライバの比較も可能になります vservcon は 厳密に言えば新しいベンチマークではありません これは 言うなればフレームワークであり すでに確立されたベンチマークをワークロードとして集約し 統合され仮想化されたサーバ環境の負荷を再現します データベース アプリケーションサーバ Web サーバというアプリケーションシナリオを対象とする 3 つの実証済みのベンチマークが使用されます アプリケーションシナリオベンチマーク論理 CPU コアの数メモリ データベース Sysbench( 補正済み ) 2 1.5 GB Java アプリケーションサーバ SPECjbb( 補正済み 50~60 % の負荷 ) 2 2 GB Web サーバ WebBench 1 1.5 GB 3 つのアプリケーションシナリオのそれぞれが 1 つの専用の仮想マシン () に割り当てられます これらに加えてアイドル という 4 番目の仮想マシンが追加されます これら 4 つの が 1 つの タイル を構成します 最大の性能値を引き出すためには 測定対象となるサーバの処理能力に応じて いくつかのタイルを並行して開始しなければならない場合もあります テスト対象システム データベース Java Web アイドル タイル n データベース データベース データベース Java Java Java Web Web Web アイドル アイドル アイドル タイル 3 タイル 2 タイル 1 3 つの vservcon アプリケーションシナリオのそれぞれが 各 のアプリケーション固有のトランザクションレートという形でベンチマーク結果を提供します スコアを正規化するために 1 つのタイルのそれぞれのベンチマーク結果とリファレンスシステムの結果との比を求めます その相対性能値に適切な重み付けを行い すべての とすべてのタイルについて加算します 最終的な計算結果が このタイル数に対するスコアになります 原則として 1 つのタイルから始めて vservcon スコアの大幅な増加が見られなくなるまで タイル数を増やしながらこの手順が実行されます 最終的な vservcon スコアは すべてのタイル数から得られた vservcon スコアの最大値です したがって このスコアは CPU リソースを最大限まで使用する構成で達成される最大スループットを反映しています このため vservcon の測定環境は CPU のみが制限要因となるように設計されており 他のリソースによる制限は発生しないように設計されています タイル数の増加に対する vservcon スコアの伸びは テスト対象システムのスケーリング特性を知るための有益な情報となります さらに vservcon では ホストの合計 CPU 負荷 ( および他のすべての CPU 処理 ) を記録し 可能な場合は消費電力も記録します vservcon の詳細については ベンチマークの概要 vservcon を参照してください Fujitsu Technology Solutions 2010-2011 29/47 ページ
6 コア HT TM 5600 シリーズ 4 コア HT TM 4 コア ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 ベンチマーク結果 PRIMERGY の 2 ソケットモデル現行世代は Intel Xeon シリーズ 5600( または 5500) プロセッサをベースにしています 次のようなさまざまなシステム構成に対応しています プロセッサ TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 5500 E5507 E5607 L5609 L5630 E5620 E5630 E5640 X5647 X5667 X5672 X5677 X5687 L5640 E5645 E5649 X5650 X5660 X5670 X5675 X5680 X5690 HT = ハイパースレッディング TM = ターボモード PRIMERGY の 2 ソケットモデル現行世代は プロセッサテクノロジーの進歩により アプリケーションの仮想化に最適なシステムとなっています 6 コアプロセッサにも対応しているため 前世代のプロセッサをベースとするシステムと比較して 仮想化性能が約 50 % 向上しています (vservcon スコアで測定 ) 6 コアプロセッサを 2 基搭載したシステムで 前述の vservcon プロファイルを基にして 27 のアプリケーション (9 つのタイルに相当 ) を使用した場合 CPU リソースの最大活用をほぼ実現できます 30/47 ページ Fujitsu Technology Solutions 2010-2011
E5507 L5609 E5607 L5630 E5620 E5630 E5640 X5647 X5667 X5672 X5677 X5687 L5640 E5645 E5649 X5650 X5660 X5670 X5675 X5680 X5690 Final vservcon Score ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 次のグラフは 各プロセッサで達成可能な仮想化性能値を比較したものです 発売済みの 4 コアまたは 6 コアのプロセッサを対象に幅広く測定しました 10 9 8 7 6 5 4 3 2 1 0 4 4 4 6 6 6 6 6 7 7 7 7 9 9 9 9 9 9 9 9 9 #Tiles 4 Cores / 4 Threads 4 Cores / 8 Threads 6 Cores / 12 Threads このグラフに示されているプロセッサ間の大きな性能差は その機能が影響していると考えられます グラフの左側のグループのプロセッサは エントリーモデルです グラフ中央のグループのプロセッサは ハイパースレッディングとターボモードに対応しているため パフォーマンスが大幅に向上していることがわかります グラフの中央と右側のグループのプロセッサでは それぞれのプロセッサのメモリクロック周波数が徐々に上がっています このとき パフォーマンスは プロセッサのメモリクロック周波数とプロセッサ間のデータ転送速度 ( QPI スピード ) の組み合わせで決まります グラフの右側のグループは 6 コアプロセッサで構成されています 6 コアプロセッサの場合 同機能の 4 コアプロセッサと比較すると 期待どおりにパフォーマンスが約 50 % 向上しています グラフの右側のグループでは E5649 から X5650 への大幅な向上が特に目立っています X5650 以降は 最高の QPI スピードと強力なターボモードを備えたアドバンストプロセッサというカテゴリであるためです メモリパフォーマンスと QPI アーキテクチャーの詳細については ホワイトペーパー Xeon 5600 (Westmere-EP) 搭載システムのメモリパフォーマンス を参照してください 仮想化環境のメインメモリを選択するときのガイドラインとして メモリアクセス速度よりも メモリ容量が十分にあることが重要です 各プロセッサの製品データについて再度簡潔にまとめ 次の表に示します Fujitsu Technology Solutions 2010-2011 31/47 ページ
2.18 3.84 4.47 5.01 5.30 5.40 2.12 4.23 5.69 6.37 7.08 7.34 7.45 7.55 7.60 vservcon Score CPU utilization 6 コア HT TM 5600 シリーズ 4 コア HT TM 4 コア ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 プロセッサ コア数 / チップ L3 キャッシュ プロセッサ周波数 QPI スピード HT TM TDP タイル数スコア 5500 E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.02 E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.39 L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W 4 3.06 L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W 6 4.61 E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W 6 5.40 E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W 6 5.56 E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W 6 5.79 X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W 6 6.23 X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W 7 6.93 X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W 7 7.20 X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W 7 7.24 X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W 7 7.57 L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W 9 7.36 E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W 9 7.40 E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W 9 7.60 X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W 9 8.63 X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W 9 8.87 X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W 9 9.02 X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W 9 9.29 X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W 9 9.41 X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W 9 9.61 QPI = QuickPath インターコネクト GT = ギガトランスファー HT = ハイパースレッディング TM = ターボモード TDP = 熱設計電力 次のグラフは Xeon E5620(4 コア ) プロセッサおよび E5649(6 コア ) プロセッサを搭載した時の 数の増加に対する仮想化性能を示しています ホストのそれぞれの CPU 負荷も示されています CPU 負荷 が 90 % のときが最適なタイル数で す 90 % を超えると過負荷となり E5620 E5649 仮想化のパフォーマンスは停滞または低下します 8 7 100% 90% 物理コア数の増加に加えて ハイ 80% 6 パースレッディング機能によって 70% 多数の の稼動が可能になります 5 60% ハイパースレッディング機能では 4 50% 1 つの物理プロセッサコアが結果的 40% に 2 つの論理コアに分割されるた 3 30% め ハイパーバイザーが利用できる 2 コア数は 2 倍になります そのた 20% 1 め ハイパースレッディング機能は 10% 一般的にシステムの仮想化性能を向 0 0% 上させます 1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 # Tiles vservcon Score (left axis) CPU utilization of host (right axis) ハイパースレッディング機能を使用するシステムでは 前のグラフに示されているタイル数のスケーリング曲線が明確に見られます Xeon E5649 プロセッサには 12 個の物理コア すなわち 24 個の論理コアがあり 1 つのタイルにつき 4 個程度の論理コアが使用されます ( ベンチマークの説明 を参照 ) つまり ほぼ 3 タイルまでは 複数の が同じ物理コアを並行して使用することを回避できます そのため この範囲ではほぼ理想的にパフォーマンスが上昇します その後 CPU 使用率が限界に達するまでのパフォーマンス曲線は 傾きが緩やかになっていきます 32/47 ページ Fujitsu Technology Solutions 2010-2011
vservcon Score Relative performance compared with RefSys ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 これまでは システムの仮想化性能を全体的に分析してきました ここからは 仮想化環境での個別アプリケーション の観点でパフォーマンスについて説明します ここでは例として Xeon E5649 プロセッサのシステムを取り上げています システム総体としてのパフォーマンスを重視してアプリケーション の数を全体最適化 ( 例として 6 タイル ) すると 部分最適化 ( 例として 1 タイル ) して負荷が尐ない状況に比べ 個別の のパフォーマンスはかなり低くなります 次のグラフ ( の数が増加したときの 3 種類の各アプリケーション のリファレンスシステムに対する相対的なパフォーマンス ) により この点を明らかにしています 各アプリケーション (Java Web DB) のグラフの最初の列には 1 つのタイルを構成する合計 3 つの がアプリケーション別に 1 つずつ表示されています 2 番目の列には 2 つのタイルを構成する合計 6 つの がアプリケーション別に 2 つずつ表示され 以降も同様に タイルを構成する がアプリケーション別に表示されています 各グラフから 個々のアプリケーション の値 およびアプリケーション種別ごとの合計値が読み取れます Relative performance of single for increasing tile count 10 9 9th 8th 7th 6th 5th 4th 3rd 2nd 1st 8 7 Java Web DB 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 #Tiles 仮想ホスト上の の数に関して 全体的なパフォーマンスよりも個別のアプリケーションのパフォーマンス要件を重視すべき場合もあります はじめに 完全に構成されたシステムの仮想化性能について見てきました 一方で プロセッサを 1 基から 2 基に増やしたときに どの程度パフォーマンスが向上するかという疑問もあります パフォーマンスの向上度が増せば サーバ内のリソース共有によるオー 9 バーヘッドは減尐します プロセッサ追加時の性能 8 向上度を示すスケーリング係数は サーバの用途に 1.95 よって異なります サーバ統合用の仮想化プラット 7 フォームとしてサーバを使用する場合 プロセッサ 6 の追加で性能は 1.95 倍になります つまり Xeon 5 E5649 のグラフに示したように 2 基のプロセッサ 4 を使用すると 1 基のプロセッサを使用した場合に比 3 べて 仮想化性能が約 2 倍になります 2 1 0 1 E5649 2 E5649 Fujitsu Technology Solutions 2010-2011 33/47 ページ
vservcon Score ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は 一方では個別の に影響し 他方では CPU をフル活用したときの使用可能な最大 数に影響しています 次のグラフでは この 2 つの側面における向上の度合いを比較しています ここでは 2008 年の Xeon E5420 2 基のシステム 2009 年の Xeon X5540 2 基のシステム そして Xeon E5649 2 基の現行システムといった ほぼ同じプロセッサ周波数を持つ 3 つのシステムを比較しています 9 8 Few s Overall Optimum 7 1.47 6 5 4 2.02 3 1.30 2 1 0 2008 E5420 2.5 GHz 4C 2009 E5540 2.53 GHz 4C 2011 E5649 2.53 GHz 6C 2008 E5420 2.5 GHz 4C 2009 E5540 2.53 GHz 4C 2011 E5649 2.53 GHz 6C Year CPU Frequency #Cores 2011 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 2009 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - - 2008 TX300 S4 RX200 S4 RX300 S4 BX620 S4 - - - パフォーマンスの向上は Xeon 5500 プロセッサ世代が登場した 2008 年から 2009 年にかけて最も顕著です ( 拡張ページテーブル (EPT) 機能の実装などによる 2 ) の数が尐ないケース (1 タイル ) では vservcon スコアが 1.30 倍に増加しています 全体最適化した CPU フル稼動時のケースでは vservcon スコアは 2.02 倍に増加しています その理由の 1 つは 個々の で実現できるパフォーマンスの向上です ( グラフ左側の Few s のスコアを参照 ) もう 1 つの理由は 全体最適化された状態で実行可能な の数の向上です ( ハイパースレッディング機能の使用および物理コア数の増加による ) ただし の数を増やすことで個々の のパフォーマンスは低下しているため 全体としての性能向上は の数が 3 倍になったことによってもたらされたものと言えます 2009 年から 2011 年にかけて テクノロジーは 厳密にはどの点で進歩を遂げたのでしょうか ここでは クロック周波数が同じで キャッシュのサイズとメモリアクセス速度が異なるプロセッサを比較していますが 低負荷状態における個々の のパフォーマンスについては プロセッサによる違いはほとんどありません 決定的に進歩を遂げた点は 物理コア数の増加と それに関連した仮想化性能値の向上 ( グラフでは 1.47 倍 ) および CPU 最大使用時における電力あたりの性能効率の向上です ここで比較している 2009 年のプロセッサと 2011 年のプロセッサは TDP(Thermal Design Power: 熱設計電力 ) が 80 W で等しいため CPU 最大使用時の消費電力はほぼ同じです したがって 電力あたりの性能も約 1.47 倍に向上しています 仮想化パフォーマンスの増加は 個別の の性能向上によるものがすべてではありません 個別の の性能向上だけでは Xeon 5400 世代 (2008 年 ) の同一クロックのプロセッサと比較して 30 %~50 % を超えるスループットの増加は不可能です 2009 年以降の仮想化環境におけるパフォーマンス向上の大部分は 利用可能な論理コアまたは物理コアが増加した結果として 実行できる 数が増大したことによって達成されたものです 2 EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高 速化します 34/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 測定は次のような環境で行いました フレームワークコントローラー サーバ ストレージシステム 複数の 1 Gb または 10 Gb ネットワーク SUT(System Under Test: テスト対象システム ) 負荷ジェネレーター Intel Xeon 55xx と 56xx プロセッサシリーズのすべての vservcon スコアは PRIMERGY TX300 S6 を使用して測定しました SUT ハードウェア モデル プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ストレージの接続 SUT ソフトウェア オペレーティングシステム PRIMERGY TX300 S6 1 チップ : Xeon E5649(6 コア 2.53 GHz) 2 チップ : Xeon E5507(4 コア 2.27 GHz) Xeon L5609(4 コア 1.87 GHz) Xeon E5607(4 コア 2.27 GHz) Xeon L5630(4 コア 2.13 GHz) Xeon E5620(4 コア 2.40 GHz) Xeon E5630(4 コア 2.53 GHz) Xeon E5640(4 コア 2.67 GHz) Xeon X5647(4 コア 2.93 GHz) Xeon X5667(4 コア 3.07 GHz) Xeon X5672(4 コア 3.20 GHz) 2 チップ : Xeon X5677(4 コア 3.47 GHz) Xeon X5687(4 コア 3.60 GHz) Xeon L5640(6 コア 2.27 GHz) Xeon E5645(6 コア 2.40 GHz) Xeon E5649(6 コア 2.53 GHz) Xeon X5650(6 コア 2.67 GHz) Xeon X5660(6 コア 2.80 GHz) Xeon X5670(6 コア 2.93 GHz) Xeon X5675(6 コア 3.07 GHz) Xeon X5680(6 コア 3.33 GHz) Xeon X5690(6 コア 3.46 GHz) 96 GB( それぞれ PC3-10600R 8 GB DIMM-1A~DIMM-1F および DIMM-2A~DIMM-2F に搭載 ) 1 Gbit LAN 2 基 : 負荷用 (2 基の LAN アダプター経由 ) 1 基 制御用 1 基 内蔵ハードディスクは使用せず ストレージシステム FibreCAT CX500 のみを使用 の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN 各 LUN は 5 つの Seagate ST373454 ディスク (15 krpm) で構成された RAID 0 アレイ FC コントローラー Qlogic QLE 2462 を使用 ハイパーバイザー ware ESX Server リリースバージョン 4.0 U1 ビルド 236512 BIOS バージョン 6.00 R1.08..2619.N1 隣接キャッシュラインプリフェッチ : 無効 ハードウェアプリフェッチ : 無効 DCU ストリーマープリフェッチ : 無効 データ再利用の最適化 : 無効 Fujitsu Technology Solutions 2010-2011 35/47 ページ
SUT: 仮想化に関する詳細 ESX 設定 デフォルト 一般的な詳細 ベンチマークの概要 vservcon を参照 負荷ジェネレーターのハードウェア モデル プロセッサ メモリ ネットワークインターフェース オペレーティングシステム PRIMERGY BX920 S1 サーバブレード (PRIMERGY BX900 シャーシ ) 17 台 それぞれ Xeon X5570(2.93 GHz) 2 基 12 GB それぞれ 1 Gbit LAN 3 基 Windows Server 2008 R2 Enterprise with Hyper-V 負荷ジェネレーター ( タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作 ) プロセッサ メモリ ネットワークインターフェース オペレーティングシステム 論理 CPU 1 基 512 MB それぞれ 1 Gbit LAN 2 基 Windows Server 2003 Enterprise 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 36/47 ページ Fujitsu Technology Solutions 2010-2011
mark V1 ベンチマークの説明 このセクションの内容は mark ベンチマークバージョン 1.1.1( 以降 mark V1 ) に基づいています mark V1 は ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行うために ware が開発したベンチマークです ベンチマークは 負荷生成用のソフトウェアに加えて 定義済み負荷プロファイルおよび規定されたルールで構成されます 長い間 mark V1 は ベンダー間の比較が可能な唯一の確立された仮想化ベンチマークでした mark V1 のベンチマーク結果は ware 社のレビュー後に ware サイトで公開されていました 現在では mark V2 に置き換えられており mark V1 は研究目的でのみ使用可能です mark V1 のようなベンチマークは サーバ統合の観点から実際のデータセンターを模倣します 言い方を変えると 実際にサーバ上で仮想化されているアプリケーションシナリオを考慮しなければなりません 目標は 稼動率が低いサーバをできるだけ多く として集約することです そのため ベンチマークによって さまざまなアプリケーション の全体的なスループットと 効率よく運用できる仮想マシンの個数を評価することが必要になります これらの 2 つの目的のために次のようなソリューションコンセプトが確立されています まず アプリケーションシナリオの代表的なグループが選択されます これらは 測定時に仮想ホスト上で同時に開始されます 各 には 適切な負荷ツールを使用して低い負荷がかけられるようになっています このような をグループ化したものを タイル と呼びます mark V1 のタイルは 6 つの で構成され そのうち 5 つは特定のアプリケーションシナリオに割り当てられます これらの に加え スタンバイサーバという 6 番目の が追加されます mark V1 では 論理的なプロセッサ メモリ ハードディスクスペースといった特定のリソースが各 に強制的に割り当てられます 右の表に 6 つの とそれらを測定するために使用する負荷ツールを示します アプリケーションシナリオ データベースサーバ 負荷ツール Sysbench ファイルサーバ Dbench( 変更済み ) Java アプリケーションサーバ SPECjbb2005( 変更済み ) メールサーバ Loadsim 2003 Web サーバ SPECweb2005( 変更済み ) スタンバイサーバ - 測定対象となるサーバの処理能力によっては 全体として最大のパフォーマンスを達成するために複数のタイルを並列して開始する必要があります テスト対象システム データベース ファイルサーバ Java メール Web スタンバイ タイル n データベース データベース データベース ファイルサーバ ファイルサーバ ファイルサーバ Java Java Java メール メール メール Web Web Web スタンバイ スタンバイ スタンバイ タイル 3 タイル 2 タイル 1 5 つの mark V1 アプリケーションシナリオのそれぞれから ごとのベンチマーク結果が得られます これらの結果から単一のスコアを取得するために すべての結果が適切に集約されます 結果は あるタイル数に対する mark V1 スコアで表し 12.34@5 タイル のように実際のスコアに加えてタイル数が示されます mark V1 の詳細については ベンチマークの概要 mark V1 を参照してください Fujitsu Technology Solutions 2010-2011 37/47 ページ
ベンチマーク結果 2010 年 8 月 10 日 富士通は 合計 12 プロセッサコアを搭載した PRIMERGY RX200 S6 と ware ESX 4.0 Update 2 を使用して 35.09@27 タイル の mark V1 スコアを達成しました このスコアおよび詳細な結果と構成データについては http://www.vmware.com/products/vmmark/v1/results.html を参照してください 35.09@27 タイル というスコアを達成したことで PRIMERGY RX200 S6 は mark V1 の観点から最も強力な 12 コアのラックサーバと評価され mark V1 ランキングの 12 コアサーバのカテゴリでは 2 位 ( ベンチマーク結果の公表現在 ) になっています この記録を達成するために必要な主な条件は プロセッサ ( 動作周波数が最適化された 6 コアプロセッサ Xeon X5680) と プロセッサの機能を最適に使用できるバージョンのハイパーバイザーです プロセッサの機能には 拡張ページテーブル (EPT) 3 とハイパースレッディングが含まれます これらはすべて 仮想化に対して有効に機能します ベンチマークで定められた要件を満たすために 27 タイルの稼動時にはメモリを 192 GB(16 GB 12 枚 ) に拡張する必要があります 16 GB DIMM のメモリアーキテクチャーにより 速度は 800 MHz に低下します すべての それらのアプリケーションデータ ホストオペレーティングシステム および追加で必要なデータは 合計で 41 個の LUN を備えた ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました 使用したすべてのコンポーネントは それぞれが最適に動作するように調整しました 3 EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高 速化します 38/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 一般的な測定環境を次に示します サーバ ストレージシステム 1 Gb または 10 Gb の複数のネットワーク プライムクライアントを含む負荷ジェネレーター SUT(System Under Test: テスト対象システム ) SUT ハードウェア モデル プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ストレージ接続 SUT ソフトウェア オペレーティングシステム PRIMERGY RX200 S6 Xeon X5680(6 コア 3.33 GHz) 2 基 192 GB(16 GB DIMM 12 枚 ) 1333 MHz Registered ECC DDR3 内蔵 Intel 82575EB デュアルポート 1 GbE アダプター 1 基 Intel 10 Gbit X520-DA2 デュアルポートサーバアダプター 1 基 内蔵ハードディスクは使用しません ストレージシステム ETERNUS DX80 9 台 合計 196 台のハードディスクを搭載 ( 複数の RAID-0 アレイを構成 ) デュアルチャネル FC コントローラー Emulex LPe12002 1 基 ハイパーバイザー ware ESX Server ESX バージョン ware ESX v4.0 Update 2 ビルド 261974 BIOS バージョン 負荷ジェネレーターのハードウェア モデル プロセッサ メモリ ネットワークインターフェース オペレーティングシステム 詳細 公開 URL Rev R1.02.3031 サーバブレード PRIMERGY BX620 S4 27 基 Intel Xeon 5130(2 GHz) 2 基 3 GB それぞれ 1 Gbit LAN 1 基 Microsoft Windows Server 2003 R2 Enterprise SP2 および KB955839 を適用 http://www.vmware.com/files/pdf/vmmark/mark-fujitsu-2010-08-09-rx200s6.pdf 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 39/47 ページ
mark V2 ベンチマークの説明 mark V2 は ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行うために ware が開発したベンチマークです ベンチマークは 負荷生成用のソフトウェアに加えて 定義済み負荷プロファイルおよび規定されたルールで構成されます mark V2 によって得られたベンチマーク結果は ware に提出しレビューを経た後に ware のサイト上で公開されます 実績あるベンチマークである mark V1 の使用は 2010 年 10 月に中止され 代わって後継の mark V2 が使用されるようになりました mark V2 では 2 台以上のサーバのクラスタが必要であり 仮想マシン () のクローン作成とデプロイ 負荷分散 vmotion や Storage vmotion による の移動といった データセンター機能も評価できます mark V2 は 実際には新しいベンチマークではありません mark V2 は 既存の アプリケーションシナリオ負荷ツール の数 ベンチマークをワークロードとして統合するフレームワークで これにより仮想化さ メールサーバ Web 2.0 LoadGen Olio クライアント 1 2 れた統合サーバ環境の負荷をシミュレート e コマース DVD Store 2 クライアント 4 します 3 つの実績あるベンチマーク ( それスタンバイサーバ (IdleTest) 1 ぞれ メールサーバ Web 2.0 e コマース のアプリケーションシナリオに対応 ) が mark V2 に統合されています これらの 3 つのアプリケーションシナリオは 合計 7 つの仮想マシンに 1 つずつ割り当てられます さらに スタンバイサーバという 8 番目の がこれらに追加されます これらの 8 つの が タイル を形成します 測定対象となるサーバの処理能力によっては 全体として最大のパフォーマンスを達成するために複数のタイルを並列して開始する必要があります mark V2 の新機能に ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントがあります これにより のクローン作成やデプロイ vmotion Storage vmotion によるデータセンター運用の効率性が評価されます このとき DRS(Distributed Resource Scheduler) によるデータセンターの負荷分散機能も使用されます mark V2 の結果は スコア と呼ばれる数値であり テスト対象システムの仮想化パフォーマンスを表します スコアは サーバ集約によるメリットの最大合計値で さまざまなハードウェアプラットフォームの比較基準として使用されます このスコアは の個々の結果とインフラストラクチャーコンポーネントの結果から導かれます 5 つの mark V2 アプリケーション またはフロントエンド のそれぞれが 各 でのアプリケーション固有のトランザクションレートという形でベンチマーク結果を示します スコアを正規化するために 各タイルのベンチマーク結果とリファレンスシステムでの結果との比率を求め 得られた値の幾何平均を算出します さらに すべての について 同じ手順で求めた値を加算します この値は 総合スコアの 80 % を決定します また ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントによるワークロードが 結果の 20 % を決定します インフラストラクチャーコンポーネントのスコアは 1 時間あたりのトランザクション数と 秒単位の平均持続時間で示されます 実際にはスコアに加えて タイル数がスコアと共に示されます 例えば 4.20@5 タイル のように スコア @ タイル数 と表します mark V2 の詳細については ベンチマークの概要 mark V2 を参照してください 40/47 ページ Fujitsu Technology Solutions 2010-2011
mark V2 Score 7.02@7 tiles 6.81@7 tiles 6.51@6 tiles ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン : 2.0A 2011-12-05 ベンチマーク結果 2011 年 1 月 19 日 富士通は Xeon X5680 プロセッサを搭載した PRIMERGY RX200 S6 と ware ESX 4.1 を使用して mark V2 スコアで 6.81@7 タイル を達成しました このときは 合計 2 12 のプロセッサコアを搭載するシステム構成で テスト対象システム (SUT) には同一のサーバを 2 台使用しました 2011 年 2 月 14 日には PRIMERGY RX200 S6 を使用して mark V2 スコアで 7.02@7 タイル を達成し さらに向上しました このときも 合計 2 12 のプロセッサコアを搭載するシステム構成で テスト対象システム (SUT) に 2 台のサーバを使用しましたが 搭載したプロセッサは Xeon X5690 でした このスコアおよび詳細な結果と構成データについては http://www.vmware.com/a/vmmark/ を参照してください 上記の結果により PRIMERGY RX200 S6 は mark V2 の観点から 2 台の同一ホストによる マッチドペア 構成で最も強力なサーバと評価されると同時に mark V2 のランキングで上位 2 つを占めています ( ベンチマーク結果の公表日現在 ) このグラフは PRIMERGY RX200 S6 と競合他社の該当するシステムの測定結果を比較 4 したものです 同等のハードウェアでテストした Cisco の結果と比較すると Xeon X5680 プロセッサを搭載した構成では PRIMERGY RX200 S6 の方が 4.61 % 上回っています 8 7 6 5 4 3 2 1 0 2 Fujitsu PRIMERGY RX200 S6 2 Xeon X5690 2 12 Cores 2 Fujitsu PRIMERGY RX200 S6 2 Xeon X5680 2 Cisco UCS B200 M2 2 Xeon X5680 使用したプロセッサ ( 最初は Xeon X5680 次に Xeon X5690) では 優れたハイパーバイザー設定によってプロセッサの機能を最適に利用できます そのため これらのプロセッサの使用は PRIMERGY RX200 S6 がこの結果を達成するための重要な前提条件でした プロセッサの機能には 拡張ページテーブル (EPT 5 ) とハイパースレッディングが含まれます これらはすべて 仮想化に対して有効に機能します すべての それらのアプリケーションデータ ホストオペレーティングシステム および追加で必要なデータは ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました このディスクサブシステムは ベンチマークの特定の要件を考慮して構成することもできます 2 番目の mark V2 の公表結果では Xeon X5690 のプロセッサ周波数が若干高いことに加えて SSD(Solid State Drive: 半導体ドライブ ) の使用によってハードディスクの数や応答時間が向上したことが 全体としてスコアを多尐引き上げています 負荷ジェネレーターのネットワーク接続とホスト間のインフラストラクチャー負荷接続は 10Gb LAN ポートで実装しました 使用したすべてのコンポーネントは それぞれが最適に動作するように調整しました 4 5 上記の競合他社製品との比較は 2011 年 2 月 14 日現在のものです mark V2 の結果は http://www.vmware.com/a/vmmark/ を参照してください EPT は ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで メモリの仮想化を高速化します Fujitsu Technology Solutions 2010-2011 41/47 ページ
ベンチマーク環境 一般的な測定環境を次に示します クライアントと管理サーバ サーバ ストレージシステム 複数の 1Gb または 10Gb ネットワーク プライムクライアントを含む負荷ジェネレーターとデータセンター管理サーバ vmotion ネットワーク テスト対象システム (System Under Test:SUT) SUT ハードウェア サーバ数 モデル プロセッサ メモリ ネットワークインターフェース ディスクサブシステム ストレージ接続 SUT ソフトウェア オペレーティングシステム 2 台 PRIMERGY RX200 S6 Xeon X5680(6 コア 3.33 GHz) 2 基 Xeon X5690(6 コア 3.46 GHz) 2 基 96 GB(8 GB DIMM 12 枚 ) 1333 MHz Registered ECC DDR3 内蔵 Intel 82575EB デュアルポート 1 GbE アダプター 1 基 Intel 10 Gbit X520-DA2 デュアルポートサーバアダプター 1 基 内蔵ハードディスクは使用しません Xeon X5680: ストレージシステム ETERNUS DX80 7 台 合計 126 台のハードディスクを搭載 ( 複数の RAID-0 アレイを構成 ) Xeon X5690: ストレージシステム ETERNUS DX80 5 台 SSD を含む合計 73 台のハードディスクを搭載 ( 複数の RAID-0 アレイを構成 ) デュアルチャネル Emulex LPe12002 1 基 ハイパーバイザー ware ESX Server ESX バージョン ware ESX v4.1 ビルド 260247 BIOS バージョン 負荷ジェネレーターのハードウェア モデル プロセッサ メモリ ネットワークインターフェース オペレーティングシステム 詳細 公開 URL Rev R1.06.3031 サーバブレード PRIMERGY BX620 S4 7 基 Intel Xeon 5130(2 GHz) 2 基 4 GB それぞれ 1 Gbit LAN 1 基 Microsoft Windows Server 2003 R2 Enterprise SP2 および KB955839 を適用 http://vmware.com/a/assets/vmmark/pdf/2011-01-25-fujitsu-rx200s6.pdf http://vmware.com/a/assets/vmmark/pdf/2011-02-08-fujitsu-rx200s6.pdf 国または販売地域によっては 一部のコンポーネントが利用できない場合があります 42/47 ページ Fujitsu Technology Solutions 2010-2011
STREAM ベンチマークの説明 STREAM は メモリのスループットを測定するために長年使用されてきた総合的なベンチマークで John McCalpin 氏がデラウェア大学に教授として在職中に 氏によって開発されました 現在はバージニア大学でサポートされており ソースコードを Fortran または C のいずれでもダウンロードできます STREAM は 特に HPC( ハイパフォーマンスコンピューティング ) 分野で 重要な役割を担っています 例えば STREAM は HPC Challenge ベンチマークスイートの一部として使用されています このベンチマークは PC とサーバシステムの両方で使用できるように設計されています 測定単位は [GB/s] であり 1 秒あたりにリード / ライト可能なギガバイト数です STREAM では シーケンシャルアクセスでのメモリスループットを測定します メモリ上のシーケンシャルアクセスは CPU キャッシュが使用されるため 一般にランダムアクセスより高速です ベンチマーク実行前に 測定環境に合わせて STREAM のソースコードを調整します また CPU キャッシュによる測定結果への影響ができるだけ尐なくなるよう データ領域のサイズは 全 CPU キャッシュの総容量の 4 倍以上にする必要があります ベンチマーク中にプログラムの一部を並列実行するために OpenMP プログラムライブラリを使用します これにより 利用可能なプロセッサコアに対して最適な負荷分散が行われます STREAM ベンチマークでは 8 バイトの要素で構成されるデータ領域が 4 つの演算タイプに連続的にコピーされます COPY 以外の演算タイプでは 算術演算も行われます 演算タイプ演算ステップあたりのバイト数ステップあたりの浮動小数点演算 COPY a(i) = b(i) 16 0 SCALE a(i) = q b(i) 16 1 SUM a(i) = b(i) + c(i) 24 1 TRIAD a(i) = b(i) + q c(i) 24 2 スループットは 演算タイプ別に GB/s で表されます しかし最近のシステムでは 通常 演算タイプによる値の差はほんのわずかです そのため 一般的に 性能比較には TRIAD の測定値だけが使用されます 測定結果は 主にメモリモジュールのクロック周波数によって変わります また 算術演算は CPU によって影響を受けます 結果の精度は約 5 % です 本章では スループットを 10 のべき乗で表しています (1 GB/s = 10 9 Byte/s) Fujitsu Technology Solutions 2010-2011 43/47 ページ
ベンチマーク結果 PRIMERGY RX200 S6 の STREAM の値は Xeon 5600 シリーズのプロセッサを使用して測定しました ベンチマークプログラムは インテル C コンパイラー 12.0 でコンパイルし SUSE Linux Enterprise Server 11 SP1(64 ビット ) で実行しました データ領域は 4,000 万個の要素で構成されます これは約 305 MB に相当します プロセッサ コア GHz L3 キャッシュ メモリ周波数 TDP TRIAD [GB/s] Xeon E5603 4 1.60 4 MB 1067 MHz 80 W 27.2 Xeon E5606 4 2.13 8 MB 1067 MHz 80 W 27.2 Xeon E5607 4 2.27 8 MB 1067 MHz 80 W 27.2 Xeon X5647 4 2.93 12 MB 1067 MHz 130 W 33.4 Xeon E5645 6 2.40 12 MB 1333 MHz 80 W 35.9 Xeon E5649 6 2.53 12 MB 1333 MHz 80 W 35.8 Xeon X5675 6 3.07 12 MB 1333 MHz 95 W 39.8 Xeon X5690 6 3.47 12 MB 1333 MHz 130 W 39.8 Xeon X5687 4 3.60 12 MB 1333 MHz 130 W 40.7 測定結果から 最大メモリ周波数が 1067 MHz のプロセッサと 1333 MHz のプロセッサの違いがはっきりとわかります Xeon X5647 は 高クロック周波数と大容量 L3 キャッシュにより メモリ周波数 1067 MHz のプロセッサの中でも優れたパフォーマンスを示しています 6 コアのプロセッサでも 4 コアのプロセッサと同程度のスループットになっています これは CPU あたり 4 スレッドで メモリコントローラーの容量の上限に達しているためです 次のグラフは PRIMERGY RX200 S6 とその旧モデルである PRIMERGY RX200 S5 のスループットを 最大パフォーマンス構成で比較したものです GB/s 45 40.7 40 36.6 35 30 25 20 15 10 5 0 PRIMERGY RX200 S5 2 Xeon X5570 PRIMERGY RX200 S6 2 Xeon X5687 STREAM TRIAD 44/47 ページ Fujitsu Technology Solutions 2010-2011
ベンチマーク環境 STREAM の測定は 次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いました ハードウェア モデル CPU コア数 PRIMERGY RX200 S6 Xeon E5603 E5606 E5607 E5645 E5649 X5647 X5675 X5687 X5690 2 チップ Xeon E5603 E5606 E5607 X5647 X5687: 8 コアその他すべて : 12 コア 1 次キャッシュ 32 KB( 命令 )+ 32 KB( データ ) オンチップ ( コアあたり ) 2 次キャッシュ 256 KB オンチップ ( コアあたり ) その他のキャッシュ メモリ ソフトウェア オペレーティングシステム Xeon E5603: 4 MB( 命令 + データ ) オンチップ ( チップあたり ) Xeon E5606 E5607: 8 MB( 命令 + データ ) オンチップ ( チップあたり ) その他すべて : 12 MB( 命令 + データ ) オンチップ ( チップあたり ) 4 GB PC3-10600R DDR3-SDRAM 12 枚 SUSE Linux Enterprise Server 11 SP1(64 ビット ) コンパイラーインテル C コンパイラー 12.0 ベンチマーク Stream.c バージョン 5.9 国または販売地域によっては 一部のコンポーネントが利用できない場合があります Fujitsu Technology Solutions 2010-2011 45/47 ページ
関連資料 PRIMERGY システム http://ts.fujitsu.com/primergy PRIMERGY RX200 S6 データシート ( 英語 ) http://docs.ts.fujitsu.com/dl.aspx?id=64834ad8-2320-412d-97ad-e93162eadead Xeon 5600(Westmere-EP) 搭載システムのメモリパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=e88beb76-a61b-4fad-8081-9f941d12476b RAID コントローラーのパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b 単一ディスクのパフォーマンス http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c PRIMERGY のパフォーマンス http://ts.fujitsu.com/products/standard_servers/primergy_bov.html OLTP-2 ベンチマークの概要 OLTP-2 http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a SPECcpu2006 http://www.spec.org/osg/cpu2006 ベンチマークの概要 SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157 SPECjbb2005 http://www.spec.org/jbb2005 ベンチマークの概要 SPECjbb2005 http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba SPECpower_ssj2008 http://www.spec.org/power_ssj2008 ベンチマークの概要 SPECpower_ssj2008 http://docs.ts.fujitsu.com/dl.aspx?id=a133cf86-63be-4b5a-8b0f-a27621c8d3c5 STREAM http://www.cs.virginia.edu/stream/ mark V1 ベンチマークの概要 mark V1 http://docs.ts.fujitsu.com/dl.aspx?id=253a2cc2-b824-4ff4-85a4-8b55c0a265d5 mark V1 http://www.vmware.com/products/vmmark/v1/overview.html mark V1 結果 http://www.vmware.com/products/vmmark/v1/results.html 46/47 ページ Fujitsu Technology Solutions 2010-2011
mark V2 ベンチマークの概要 mark V2 http://docs.ts.fujitsu.com/dl.aspx?id=a083d947-8a41-45d1-a112-8cd295595a95 mark V2 http://www.vmmark.com mark V2 結果 http://www.vmware.com/a/vmmark/ vservcon ベンチマークの概要 vservcon http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71 PC サーバ PRIMERGY( プライマジー ) http://jp.fujitsu.com/platform/server/primergy/ お問い合わせ先 富士通テクノロジー ソリューションズ Web サイト :http://ts.fujitsu.com PRIMERGY のパフォーマンスとベンチマーク mailto:primergy.benchmark@ts.fujitsu.com 知的所有権を含むすべての権利は弊社に帰属します 製品データは変更される場合があります 納品までの時間は在庫状況によって異なります データおよび図の完全性 事実性 または正確性について 弊社は一切の責任を負いません 本書に記載されているハードウェアおよびソフトウェアの名称は それぞれのメーカーの商標等である場合があります 第三者が各自の目的でこれらを使用した場合 当該所有者の権利を侵害することがあります 詳細については http://ts.fujitsu.com/terms_of_use.html を参照してください 2011-12-05 WW JA Copyright Fujitsu Technology Solutions GmbH 2010-2011 Fujitsu Technology Solutions 2010-2011 47/47 ページ