PowerPoint Presentation

Similar documents
PowerPoint Presentation

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し

インテル® Parallel Studio XE 2013 Linux* 版インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2013 Windows* 版インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2015 Composer Edition for Linux* インストール・ガイドおよびリリースノート

Click to edit title

インテル® Fortran Studio XE 2011 SP1 Windows* 版インストール・ガイドおよびリリースノート

インテル® VTune™ Amplifier XE を使用したストレージ向けの パフォーマンス最適化

Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx

バトルカードでゲーマーやエンスージアストへの販売促進

Microsoft PowerPoint Quality-sama_Seminar.pptx

議題 プロセッサーの動向とコード モダナイゼーション インテル アドバンスト ベクトル エクステンション 512 ( インテル AVX-512) 命令と演算性能 ベクトル化を支援するインテル Advisor ループの性能を可視化するルーフライン表示 姫野ベンチマークを用いたインテル Xeon Phi

内容 インテル Advisor ベクトル化アドバイザー入門ガイド Version インテル Advisor の利用 ワークフロー... 3 STEP1. 必要条件の設定... 4 STEP2. インテル Advisor の起動... 5 STEP3. プロジェクトの作成

Tutorial-GettingStarted

PowerPoint プレゼンテーション

(速報) Xeon E 系モデル 新プロセッサ性能について

Intel Software Presentation Template

目次 1 はじめに 製品に含まれるコンポーネント 動作環境... 4 オペレーティング システム... 4 Microsoft Visual Studio* 製品 製品のダウンロード 製品版をインストールする場合 評価版を

Microsoft* Windows* 10 における新しい命令セットの利用

Jackson Marusarz 開発製品部門

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド

Microsoft PowerPoint - Intel Parallel Studio XE 2019 for Live

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現

VXPRO R1400® ご提案資料

インテル Parallel Studio XE 2017 Composer Edition for Fortran Windows* インストール ガイド Rev (2017/06/08) エクセルソフト株式会社

Parallel Studio XE Parallel Studio XE hotspot ( )

インテル C++ および Fortran コンパイラー for Linux*/OS X*/Windows

for (int x = 0; x < X_MAX; x++) { /* これらの 3 つの行は外部ループの自己データと * 合計データの両方にカウントされます */ bar[x * 2] = x * ; bar[(x * 2) - 1] = (x - 1.0) *

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows 日本語版 : インストール・ガイド

Click to edit title

Presentation title

テクノロジーのビッグトレンド 180 nm nm nm nm nm On 2007 Track 32 nm には 150 億台の端末がネットワーク接続 * * "Gantz, John. "The Embedded

Microsoft Word - HOKUSAI_system_overview_ja.docx

高速なコードを素早く開発 インテル Parallel Studio XE 設計 ビルド 検証 チューニング C++ C Fortran Python* Java* 標準規格に基づく並列モデル : OpenMP* MPI インテル TBB バージョン 2017 の主な機能 インテル Distribut

インテル® VTune™ Amplifier : Windows 環境向けスタートガイド

InfiniDB最小推奨仕様ガイド

PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部

インテル(R) Visual Fortran コンパイラ 10.0

修士論文

SetupVerup_dl_M

インテル® キャッシュ・アクセラレーション・ソフトウェア (インテル® CAS) Linux* 版 v2.8 (GA)

チュートリアル: インテル® MPI ライブラリー向け MPI Tuner (Windows*)

Microsoft PowerPoint - 1_コンパイラ入門セミナー.ppt

ジョブ管理ソフトウェア LoadStar Scheduler ご紹介資料 ~ システム運用品質の向上とコスト削減を実現 ~

インテル(R) Visual Fortran Composer XE

インテル® Xeon Phi™ プロセッサー上で MPI for Python* (mpi4py) を使用する

Introduction to OpenMP* 4.0 for SIMD and Affinity Features with Intel® Xeon® Processors and Intel® Xeon Phi™ Coprocessors

2.1 インテル マイクロアーキテクチャー Haswell インテル マイクロアーキテクチャー Haswell は インテル マイクロアーキテクチャー Sandy Bridge とインテル マイクロアーキテクチャー Ivy Bridge の成功を受けて開発された この新しいマイクロアーキテクチャーの

Oracle Cloud Adapter for Oracle RightNow Cloud Service

PowerPoint プレゼンテーション

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

PowerPoint Presentation

PowerPoint プレゼンテーション

PixeBurn! for HD Instruction Guide JPN

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

並列アプリケーション向けインテル® TBB スケーラブル・メモリー・アロケーターの活用

ホワイト ペーパー EMC VFCache により Microsoft SQL Server を高速化 EMC VFCache EMC VNX Microsoft SQL Server 2008 VFCache による SQL Server のパフォーマンスの大幅な向上 VNX によるデータ保護 E

インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster

新しい 自律型データ ウェアハウス

情報解禁日時 :12 月 20 日 ( 木 )11:00 以降 株式会社マウスコンピューター News Release MousePro 第 9 世代インテル CPU 搭載ビジネス向けデスクトップパソコンを 12 月 20 日 ( 木 ) 販売開始! ビジネス向けデスクトップパソコン MousePr

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

AI 人工知能 高度なプログラミングをすることなく 人間の心理と関連した認識機能を実行するために 経験を基にした機械の学習する能力 人工知能 マシンラーニング長期間にわたってより多くのデータを使用することにより 性能が向上するアルゴリズム ディープラーニング多層ニューラル ネットワークが膨大な量のデ

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

IntelR Compilers Professional Editions

1 つのツールを実行するだけで違いが出るのでしょうか? はい 多くの場合 複雑なバグを発見して アプリケーションの安定性を向上させることができます このガイドでは インテル Inspector XE 解析ツールを使用して コードの問題を排除する方法を説明します これにより コードの信頼性が向上し 開

SetupVerup_dl_M

並列・高速化を実現するための 高速化サービスの概要と事例紹介

Silk Central Connect 15.5 リリースノート

パソコン工房、インテル® Core™ X搭載ハイエンドパソコンをiiyama 4つの∞シリーズにて発売開始

QNAP vsphere Client 用プラグイン : ユーザーガイド 2012 年 12 月更新 QNAP Systems, Inc. All Rights Reserved. 1

目次 1 はじめに 製品コンポーネント 動作環境 インストールを行う前に 製品版と評価版 製品のインストール手順 製品の登録 製品のダウンロード ライセンスファイルの取得

WithMIRACLE登録方法

KSforWindowsServerのご紹介

N08

Microsoft(R) Office XP Professional/Personalモデル アプリケーション補足説明書

CELSIUSカタログ(2012年5月版)

製品概要新しい X シリーズ ファミリー X シリーズ ファミリーあらゆるエンスージアストが満足するパフォーマンスがここにあります 新しい X シリーズ ファミリーは 4 コアから 18 コアまでのオプションによりお客様のパフォーマンス要求に合わせて究極のパフォーマンスを発揮し 最新テクノロジーの進

Microsoft Word - IVF15.0.1J_Install.doc

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

Insert your Title here

免責事項 Samsung Electronics は 製品 情報 および仕様を予告なく変更する権利を留保します 本書に記載されている製品および仕様は 参照のみを目的としています 本書に記載されているすべての情報は 現状有姿 のまま 何らの保証もない条件で提供されます 本書および本書に記載されているす

Touch Panel Settings Tool

PowerPoint プレゼンテーション

高速なコードを 迅速に開発 インテル Parallel Studio XE 2016 最適化に関する注意事項 2015 Intel Corporation. 無断での引用 転載を禁じます * その他の社名 製品名などは 一般に各社の表示 商標または登録商標です パフォーマンスを最大限に引き出そう

性能を強化した 第 12 世代 Dell PowerEdge サーバの RAID コントローラ Dell PERC H800 と PERC H810 の OLTP ワークロード性能比較 ソリューション性能分析グループ Luis Acosta アドバンストストレージエンジニアリング Joe Noyol

Apache Arrow 須藤功平株式会社クリアコード RubyData Tokyo Meetup Apache Arrow Powered by Rabbit 2.2.2

Control Manager 6.0 Service Pack 3 System Requirements

Introducing Intel® Parallel Studio XE 2015

システム imac 21.5 インチディスプレイ 3.6GHz i5 Dual core / HT 2.8GHz i7 Quad core / HT ATI Radeon 4850 ATI Radeon HD はいいいえいいえはいいいえ ATI はいいいえ

本文ALL.indd

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

インテル® ソフトウェア・カンファレンス福岡 インテル® コンパイラーを使用する際に直面するよくある問題と課題

Microsoft Word - nvsi_090198_quantum dxi7500_nvb.doc

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

インテル MKL を使用した小行列乗算の高速化 インテル MKL チーム

Total Disc Makerサイレントインストールガイド

DPD Software Development Products Overview

Yamaha News Release

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

Transcription:

インテル ソフトウェア開発製品によるソースコードの近代化 エクセルソフト株式会社黒澤一平

ソースコードの近代化 インテル Xeon Phi プロセッサーや 将来のインテル Xeon プロセッサー上での実行に向けた準備と適用

インテル ソフトウェア製品 名称インテル Composer XE for Fortran and C++ インテル VTune Amplifier XE インテル Advisor インテル Trace Analyzer & Collector インテル Performance Snapshot 概要 Fortran, C/C++ 言語に対応した最適化コンパイラー CPU 内部の 処理の効率性やさまざまな情報を取得ベクトル化 マルチスレッド化の解析を行い 最適化アドバイスを提供 MPI アプリケーションの動作状況やボトルネックを解析アプリケーション全体の性能をシンプルに解析 インテル VTune Amplifier XE インテル Xeon Phi プロセッサー ( 開発コード名 : Knights Landing) 対応 2

最新ツールを使用する利点 より高度な最適化を行えるようになります 初心者でも上級者に近い最適化を行えるようになります 時間を大幅に短縮することができます ツールからアドバイスを得ることができます 数年先まで有効なコードを作ることができるようになります 3

ソフトウェア開発者が考慮するべき並列性 ベクトル化 コアの命令セットを利用 1 コアごとの性能向上 複数のデータ要素を同時に処理 (SIMD) スレッド並列化 複数コアを利用 1 プロセッサーの性能向上 複数タスクの同時実行 MPI 並列化 複数マシンを利用 複数のマシンを使用 複数プロセスの同時実行 4

1 秒あたりの 2 項オプション SP ( 値が大きいほうが良い ) ベクトル化とマルチスレッド化 最適化の効果マルチスレッド化 + ベクトル化はより良い効果が得られる ベクトル化とスレッド化 179 倍 2007 インテル Xeon プロセッサー X5472 ( 開発コード名 Harpertown) 2009 インテル Xeon プロセッサー X5570 ( 開発コード名 Nehalem) 2010 インテル Xeon プロセッサー X5680 ( 開発コード名 Westmere) 2012 インテル Xeon プロセッサー E5-2600 製品ファミリー ( 開発コード名 Sandy Bridge) 2013 インテル Xeon プロセッサー E5-2600 v2 製品ファミリー ( 開発コード名 Ivy Bridge) 2014 インテル Xeon プロセッサー E5-2600 v3 製品ファミリー ( 開発コード名 Haswell) スレッド化ベクトル化シリアル 性能に関するテストに使用されるソフトウェアとワークロードは 性能がインテル マイクロプロセッサー用に最適化されていることがあります SYSmark* や MobileMark* などの性能テストは 特定のコンピューター システム コンポーネント ソフトウェア 操作 機能に基づいて行ったものです 結果はこれらの要因によって異なります 製品の購入を検討される場合は 他の製品と組み合わせた場合の本製品の性能など ほかの情報や性能テストも参考にして パフォーマンスを総合的に評価することをお勧めします 詳細については http://www.intel.com/performance/ ( 英語 ) を参照してください 5

AVX-512 AVX-512 AVX2 SSE XMM0-15 0 YMM0-15 16- bytes 32 bytes Vector Registers IA32 (32bit) Intel64 (64bit) 15 SSE (1999) 8 x 128bit 16 x 128bit 31 ZMM0-31 64 bytes AVX and AVX-2 (2011 / 2013) AVX-512 (2014 KNL) 8 x 256bit 16 x 256bit 8 x 512bit 32 x 512bit 7

Common Instruction Set AVX-512 KNL と将来のインテル Xeon プロセッサーとの違い KNL と将来のインテル Xeon プロセッサーは多くの互換命令を有しています AVX-512PR AVX-512ER AVX- 512CD MPX,SHA, AVX-512VL AVX- 512BW AVX- 512DQ AVX-512CD コンパイラオプション ターゲット AVX-512F AVX-512F -xmic-avx512 -xcore-avx512 KNL のみ 将来の XEON のみ AVX2 AVX2* AVX2 -xcommon-avx512 KNL および将来の XEON AVX AVX AVX AVX -mmic KNC 用 SSE* SSE* SSE* SSE* SSE* NHM SNB HSW Future Xeon Phi (KNL) Future Xeon 8

KNL に向けた準備 作業対応ツール実施内容 コンパイル / リンクインテル コンパイラーインテル Xeon プロセッベクトル化インテル コンパイラーサーの場合と同じようにコンインテル Advisor パイル 実装 解析することができます マルチスレッド化 ベクトル / マルチスレッド性能解析 MPI 性能解析 インテル コンパイラーインテル Advisor インテル Advisor インテル VTune Amplifier XE インテル Trace Analyzer & Collector ただし 512 ビットのベクトル化と 高並列性を目指す必要があります インテル ソフトウェア開発製品は初心者でも上級者に近い最適化を行えるような様々な補助機能を提供します 9

OpenMP* アドバイス機能 インテル VTune Amplifier XE の OpenMP* 解析機能を使用することで OpenMP* を用いたマルチスレッド化のパフォーマンス問題と 改善点を確認することができ 修正した場合のパフォーマンスの向上度合いが表示されます 6

OpenMP* のパフォーマンス問題 仕事の不均一性 ロックなどによるスピン時間と OpenMP* スレッドの生成 スケジューリング リダクション アトミック演算 などのオーバーヘッド時間の問題を特定することができます 7

インテル Distribution for Python* または Go と性能解析ツール パフォーマンスが問題なく発揮されているか インテル VTune Amplifier XE で素早く確認することができます 処理が Python* または Go コード側で行われているのか C ライブラリーやインテル MKL に置換されているのかをすぐ確認することができ Hotspots を即座に発見することができます インテル Distribution for Python* は通常の Python* コードと使用して内部でインテル MKL などを呼び出して処理するため より短時間で演算を行うことができるようになっています 8

インテル VTune Amplifier XE による Python* コードの性能解析 Python* または Go アプリケーションのパフォーマンス問題を確認することができます また Cython やインテル MKL のネイティブ ライブラリーと Python* または Go の混在も同様に解析することができます 9

インテル DAAL DAAL : (Data Analytics Acceleration Library) インテル プロセッサー上で動作するビッグデータ解析処理を最適化するためのライブラリー 主な問題をカバー 大量のデータを取り扱う問題分析や意思決定の高速化 知識発見データマイニングマシンラーニング予測分析 AI パターン認識 ニューロ コンピューティング 14

ビッグデータ ( 数百テラ ~ ペタ規模のデータ ) 一般的に市販されている管理ツールや データベースでは解析 保管が困難なデータ集合体 ビッグデータの特徴 データサイズが膨大 データの種類が多い データが頻繁に更新される データ例 : 単純なテキスト 画像 動画 音楽 センサーから送られてくるデータ 利用者の趣味趣向 金融 15

インテル DAAL データ分析で行われる全てのステージをカバー可能 データソース ビジネス科学工学 Web/SNS それぞれのステージに対して最適化されたアルゴリズムを提供 16

インテル DAAL の特徴 メジャーな解析プラットフォームの解析処理からインテル DAAL のアルゴリズムを接続して使用 解析処理の開発にかかる時間を短縮 17

DAAL 対応プロセッサー - インテル Atom プロセッサー - インテル Core プロセッサー - インテル Xeon プロセッサー - インテル Xeon Phi プロセッサー DAAL の内部実装は IPP と MKL が提供する関数 18

インテル DAAL 対応言語 Java Python, C++ 言語に対応 Java などのマネージドコード環境でも ネイティブコードの性能が得られます インテル DAAL 19

インテル MKL に追加された機能ディープ ニューラル ネットワーク (DNN) 人間の脳細胞を模倣した構成を持つ機械学習システム 幾つかの層に分けられ それぞれで異なる処理を実装 従来のニューラル ネットワークでは判断基準を教える必要がある例 : パンダの画像を認識 人間がパンダの特徴を教える DNN ではコンピューター自身が判断基準を学習することができる例 : パンダの画像を認識 マシン自身がパンダの特徴を学習 活用例 : 日本語翻訳 より 日本語らしい 文章を作成検索エンジン より検索意図に近い情報を表示 出典 : NTT DATA ( 本格化する 人工頭脳 のビジネス活用 ) (http://www.nttdata.com/jp/ja/insights/trend_keyword/2013110701.html) 20

DNN の実装に使用される一般的なフレームワーク Caffe: ディープラーニング向けフレームワーク 画像認識に関するコミュニティーが活発 Caffe 上でインテル MKL の数学関数を利用することが可能 出典 :http://caffe.berkeleyvision.org/ 21

インテル MKL (DNN) の性能 2 つの処理を高速化 ベクトル化と並列化により 学習スピードの最適化 特徴の分類スピードの最適化 AVX 2 以上の命令セットを有するプロセッサーをサポート (Haswell 以降 ) 22

インテル DAAL とインテル MKL の違い インテル DAAL: データ分析に即使用できる様々なアルゴリズムを提供 インテル MKL: ニューラル ネットワークの実装を支援する関数群を提供 23

ディスクアクセスに関する解析を行う SSD や HDD への読み書きに関する解析を行う Disk Input and Output Analysis が追加されています この機能を使用することで 読み込み遅延 書き込み遅延の発生を検出し どのプロセス / モジュール / スレッドが発生原因であるかを素早く特定することができます SSD デバイスが複数ある場合や ドライブが複数ある場合 それらを区別して表示させることができるようになっています 10

HPC 向けの新しい解析タイプ HPC Performance Characterization Analysis は HPC 分野で有用な情報である GFLOPs や 関数 / ループごとの CPU 使用率や CPU 使用効率 メモリー / キャッシュに関する情報 1 サイクルあたりの FLOPs ベクトル化状況を確認することができます 11

詳細な解析をする前のスナップショット Step 1 スナップショット Step 2 詳細な解析 Application MPI Intel VTune Amplifier Intel Advisor Intel Trace Analyzer & Collector Storage Application & Storage Profiling & Analysis Vectorization Optimization & Thread Prototyping MPI Profiling & Analysis 26

よりシンプルに全体のパフォーマンスを確認 インテル Performance Snapshot はアプリケーション全体のパフォーマンスを簡単に表示することができます そもそも本格的な解析が必要かを 事前に素早く確認することができます インテル Performance Snapshot コードの近代化に関する情報を表示 MPI Performance Snapshot パフォーマンスのスケールを表示 12

インテル AVX512 向けの最適化 インテル Xeon Phi プロセッサー ( 開発コード名 : Knights Landing) を始めに 今後多くのインテル AVX512 命令セットをサポートするプロセッサーがリリースされていきます 今日 コードの近代化を行うことでインテル AVX512 命令セットや多くのコアが搭載されたプロセッサー向けの 将来にも有効な最適化を行うことができます 必要な作業はベクトル化 + マルチスレッド化 13

高速なコードを素早く開発 : インテル Advisor 最新プロセッサーで性能を出すためにはベクトル化とマルチスレッド化が必須 さらに 将来のプロセッサーではより差が顕著に ベクトル化でおきる問題 : インテル AVX2 を使用したのに速くならない そもそもどこをベクトル化すれば良い? 最新プロセッサー用の組込み関数を使用する必要がある? コンパイラーのベクトル化レポートのどこを見れば良い? マルチスレッド化でおきる問題 : マルチスレッド化したけれど速くならない スレッド数を増やしたら性能劣化する マルチスレッド化に時間がかかってしまう これらの問題 疑問をインテル Advisor が解決します 14

正しいベクトル化のためには正しい情報を ベクトル化されたループをフィルター トリップカウントを表示 ベクトル化を妨げる原因を特定 ホットループを表示 ベクトル化の問題を表示 ベクトル命令の世代を表示 ベクトル化後の効率を表示 高速なコードを素早く開発 15

ベクトル化したコードの効率性をインテル Advisor で評価 16

ベクトル化の効率性に関する情報を一度に表示 17

ループのベクトル化 1. ベクトル化可能だがベクトル化できていないループ少しの修正でベクトル化できる可能性があります 2. ベクトル化されているがあまり性能が上がらない性能を容易に向上できる可能性があります 3. ベクトル化されているがデータレイアウトの影響で性能がでない高速なデータ参照方法を使用します 4. ベクトル化されていて 正しく性能を発揮するほかの個所の最適化に進みます 18

ベクトル化できていないループの例 メモリーの場所 ループの依存関係の存在 エイリアスによる依存関係の可能性なのか 実際に依存関係があるか確認します 10 for(i=0; i<num; i++){ 11 a[i] = i%10; 12 } 13 14 for(j=1; j<num; j++){ 15 a[j] = a[j-1] + x; 16 } a 1 void addvec(int num, float *c, float *a, float *b) 2 { 3 int i; 4 for(i=0; i<num; i++){ 5 c[i] = a[i] + b[i]; 6 } 7 } b 19

インテル Advisor によるアドバイス機能 エイリアスによる依存関係の可能性がベクトル化を妨げている場合 インテル Advisor は修正案を提供します ここでは #pragma simd や #pragma ivdep の使用を提案されました 20

メモリー アクセス パターン解析 対象ループのチェックボックスにチェックを入れ [Check Memory Access Patterns] を使用して メモリー アクセス パターンを解析します 21

データレイアウトが問題でベクトル化の性能が発揮できない例この例では 84% が非ユニットストライドと検出されたため 構造体を Structure of Array に変更することを検討 22

ベクトル化個所が性能を発揮しているか インテル Advisor を用いて確認 インテル AVX でベクトル化され 効率が高く 短時間で処理できるループになりました 数値的 視覚的に 最適化の効果を確認することで作業効率を高めることができます 23

まとめ より高度な最適化を短時間で行うことができます 初心者も上級者もツールを使う大きなメリットがあります 数年先まで有効なコードを作ることができるようになります 24

法務上の注意書きと最適化に関する注意事項 本資料の情報は 現状のまま提供され 本資料は 明示されているか否かにかかわらず また禁反言によるとよらずにかかわらず いかなる知的財産権のライセンスも許諾するものではありません 製品に付属の売買契約書 Intel's Terms and Conditions of Sale に規定されている場合を除き インテルはいかなる責任を負うものではなく またインテル製品の販売や使用に関する明示または黙示の保証 ( 特定目的への適合性 商品性に関する保証 第三者の特許権 著作権 その他 知的財産権の侵害への保証を含む ) をするものではありません 性能に関するテストに使用されるソフトウェアとワークロードは 性能がインテル マイクロプロセッサー用に最適化されていることがあります SYSmark* や MobileMark* などの性能テストは 特定のコンピューター システム コンポーネント ソフトウェア 操作 機能に基づいて行ったものです 結果はこれらの要因によって異なります 製品の購入を検討される場合は 他の製品と組み合わせた場合の本製品の性能など ほかの情報や性能テストも参考にして パフォーマンスを総合的に評価することをお勧めします 2016 Intel Corporation. 無断での引用 転載を禁じます Intel インテル Intel ロゴ Xeon Intel Xeon Phi VTune は アメリカ合衆国および / またはその他の国における Intel Corporation の商標です * その他の社名 製品名などは 一般に各社の商標または登録商標です 最適化に関する注意事項 インテル コンパイラーでは インテル マイクロプロセッサーに限定されない最適化に関して 他社製マイクロプロセッサー用に同等の最適化を行えないことがあります これには インテル ストリーミング SIMD 拡張命令 2 インテル ストリーミング SIMD 拡張命令 3 インテル ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します インテルは 他社製マイクロプロセッサーに関して いかなる最適化の利用 機能 または効果も保証いたしません 本製品のマイクロプロセッサー依存の最適化は インテル マイクロプロセッサーでの使用を前提としています インテル マイクロアーキテクチャーに限定されない最適化のなかにも インテル マイクロプロセッサー用のものがあります この注意事項で言及した命令セットの詳細については 該当する製品のユーザー リファレンス ガイドを参照してください 注意事項の改訂 #20110804 25

補足資料 : 2 項オプション SP のシステム構成 最適化に関する注意事項インテル コンパイラーでは インテル マイクロプロセッサーに限定されない最適化に関して 他社製マイクロプロセッサー用に同等の最適化を行えないことがあります これには インテル ストリーミング SIMD 拡張命令 2 インテル ストリーミング SIMD 拡張命令 3 インテル ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します インテルは 他社製マイクロプロセッサーに関して いかなる最適化の利用 機能 または効果も保証いたしません 本製品のマイクロプロセッサー依存の最適化は インテル マイクロプロセッサーでの使用を前提としています インテル マイクロアーキテクチャーに限定されない最適化のなかにも インテル マイクロプロセッサー用のものがあります この注意事項で言及した命令セットの詳細については 該当する製品のユーザー リファレンス ガイドを参照してください 注意事項の改訂 #20110804 システム構成 インテル社内での測定値 H/W / L1 L1 L2 L3 HT Xeon 5472 3GHz 4 2 32K 32K 12MB 32GB 800MHz UMA Y N N Xeon X5570 2.90GHz 4 2 32K 32K 256K 8MB 48GB 1333MHz NUMA Y Y Y Xeon X5680 3.33GHz 6 2 32K 32K 256K 12MB 48MB 1333MHz NUMA Y Y Y Xeon E5-2690 2.90GHz 8 2 32K 32K 256K 20MB 64GB 1600MHz NUMA Y Y Y Xeon C OS Fedora* 20 Fedora* 20 Fedora* 20 Fedora* 20 3.11.10-301.fc20 icc 14.0.1 3.11.10-301.fc20 icc 14.0.1 3.11.10-301.fc20 icc 14.0.1 3.11.10-301.fc20 icc 14.0.1 E5-2697v2 2.70GHz 12 2 32K 32K 256K 30MB 64GB 1867MHz NUMA Y Y Y Haswell 2.20GHz 14 2 32K 32K 256K 35MB 64GB 2133MHz NUMA Y Y Y Fedora* 20 Fedora* 20 3.11.10-301.fc20 icc 14.0.1 3.13.5-202.fc20 icc 14.0.1 26