Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx

Similar documents
インテル(R) Visual Fortran Composer XE

インテル® Fortran コンパイラー 17.0 Update 4 for Linux* リリースノート (インテル® Parallel Studio XE 2017)

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し

製品価格 ( 新規購入 ) INT6531 インテル VTune Amplifier XE 2017 for Windows Floating 1-275, ,000 INT6532 インテル VTune Amplifier XE 2017 for Linux Floating 1-27

THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHug

インテル® Visual Fortran コンパイラー 17.0 Update 1 for Windows® リリースノート (インテル® Parallel Studio XE 2017)

DPD Software Development Products Overview

Click to edit title

インテル® Fortran Composer XE 2011 Linux* 版インストール・ガイドおよび リリースノート

インテル® Visual Fortran コンパイラー 16.0 for Windows* リリースノート (インテル® Parallel Studio XE 2016)

インテル(R) Visual Fortran Composer XE 2013 Windows版 入門ガイド

インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster

インテル® Visual Fortran Composer XE 2011 Windows* 版インストール・ガイドおよびリリースノート

インテル® Visual Fortran Composer XE 2011 Windows* 版インストール・ガイドおよびリリースノート

インテル® Fortran Composer XE 2011 Linux* 版インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2015 Composer Edition for Linux* インストール・ガイドおよびリリースノート

製品型番 商用版特定ユーザーライセンス INT7001 インテル System Studio 2018 FreeBSD \163,080 INT6673 インテル Media Server Studio 2017 Essentials \84,000 \90,720 Edit INT6674 インテ

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現

インテル(R) C++ Composer XE 2011 Windows版 入門ガイド

Intel® Compilers Professional Editions

インテル® Visual Fortran コンパイラー 17.0 Update 4 for Windows® リリースノート (インテル® Parallel Studio XE 2017)

PowerPoint Presentation

アカ版特定ユーザーライセンス INT7006 INT7007 INT7008 INT6685 インテル System Studio 2018 Ultimate on \217,080 r インテル System Studio 2018 Ultimate on \217,080 r インテル Syst

Contents Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C Microsoft* Windows* CE.NET Platform Builder C IP

インテル® Parallel Studio XE 2013 Linux* 版インストール・ガイドおよびリリースノート

インテル(R) Visual Fortran Composer XE 2011 Windows版 入門ガイド

インテル® Fortran Composer XE 2011 Linux* 版インストール・ガイドおよびリリースノート

インテル® VTune™ パフォーマンス・アナライザー 9.1 Windows* 版

Parallel Studio XE Parallel Studio XE hotspot ( )

Pentium 4

Introducing Intel® Parallel Studio XE 2015

インテル® Parallel Studio XE 2013 Windows* 版インストール・ガイドおよびリリースノート

製品型番 アカデミック版フローティング ライセンス インテル Parallel Studio XE 2018 Composer INT6991 \232,000 \250,560 Floating 2-Pack アカデミック日本語版インテル Parallel Studio XE 2018 Compo

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2

Microsoft PowerPoint - Intel Parallel Studio XE 2019 for Live

PowerPoint Presentation

インテル® Fortran Studio XE 2011 SP1 Windows* 版インストール・ガイドおよびリリースノート

01_OpenMP_osx.indd

Microsoft Word - HOKUSAI_system_overview_ja.docx

インテル® VTune™ Amplifier XE を使用したストレージ向けの パフォーマンス最適化

Presentation title

HP Workstation 総合カタログ

高速なコードを素早く開発 インテル Parallel Studio XE 設計 ビルド 検証 チューニング C++ C Fortran Python* Java* 標準規格に基づく並列モデル : OpenMP* MPI インテル TBB バージョン 2017 の主な機能 インテル Distribut

hotspot の特定と最適化

FFTSS Library Version 3.0 User's Guide

Intel Software Presentation Template

Code Modernization Online training plan

インテル C++ および Fortran コンパイラー for Linux*/OS X*/Windows

v10 IA-32 64¹ IA-64²

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18

インテル® Visual Fortran Composer XE 2013 Windows* 版インストール・ガイドおよびリリースノート

Click to edit title

高速なコードを 迅速に開発 インテル Parallel Studio XE 2016 最適化に関する注意事項 2015 Intel Corporation. 無断での引用 転載を禁じます * その他の社名 製品名などは 一般に各社の表示 商標または登録商標です パフォーマンスを最大限に引き出そう

ムーアの法則 : インテルでは順調に存続中 65nm 2005 製造中 45nm nm nm 2011 * 開発中 15nm 2013 * リサーチ 11nm 2015 * 8nm 2017 * インテルの革新的技術を順次適用予定 2 インテル製品は 予告なく

HP Workstation 総合カタログ

インテル® Parallel Studio XE 2019 Update 4 リリースノート

Jackson Marusarz 開発製品部門

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日

Copyright 2009, SofTek Systems, Inc. All rights reserved.

install_guide.PDF

Emacs ML let start ::= exp (1) exp ::= (2) fn id exp (3) ::= (4) (5) ::= id (6) const (7) (exp) (8) let val id = exp in

橡Webcamユーザーガイド03.PDF

インテル® Parallel Studio XE 2016 Update 1 for Linux* インストール・ガイド

インテル® Parallel Studio XE 2017 for Linux* インストール・ガイド

議題 プロセッサーの動向とコード モダナイゼーション インテル アドバンスト ベクトル エクステンション 512 ( インテル AVX-512) 命令と演算性能 ベクトル化を支援するインテル Advisor ループの性能を可視化するルーフライン表示 姫野ベンチマークを用いたインテル Xeon Phi

HP Workstation Xeon 5600

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2

Microsoft Word - w_mkl_build_howto.doc

Microsoft PowerPoint - handai.pptx

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows 日本語版 : インストール・ガイド


HP Business Desktopシリーズ

高速なコードを 素早く開発 インテル Parallel Studio XE 2017 最適化に関する注意事項 2016 Intel Corporation. 無断での引用 転載を禁じます * その他の社名 製品名などは 一般に各社の表示 商標または登録商標です パフォーマンスを最大限に引き出そう

H.264/AVC 2 H.265/HEVC 1 H.265 JCT-VC HM(HEVC Test Model) HM 5 5 SIMD HM 33%

目次 1 はじめに 製品に含まれるコンポーネント 動作環境... 4 オペレーティング システム... 4 Microsoft Visual Studio* 製品 製品のダウンロード 製品版をインストールする場合 評価版を


Click to edit title

インテル® System Studio 2017

11042 計算機言語7回目 サポートページ:

2. OpenMP OpenMP OpenMP OpenMP #pragma#pragma omp #pragma omp parallel #pragma omp single #pragma omp master #pragma omp for #pragma omp critica

rzat10pdf.ps

07-二村幸孝・出口大輔.indd

インテル(R) Xeon(R) プロセッサーおよびインテル(R) Pentium(R) 4 プロセッサーのパフォーマンス・カウンター

内容 インテル Advisor ベクトル化アドバイザー入門ガイド Version インテル Advisor の利用 ワークフロー... 3 STEP1. 必要条件の設定... 4 STEP2. インテル Advisor の起動... 5 STEP3. プロジェクトの作成

PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 P

HP High Performance Computing(HPC)

PGI 6

インテル® Parallel Studio XE 2013 入門ガイド

workshop Eclipse TAU AICS.key

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

Xeon Phi MICROSOFT* WINDOWS* 1.4 1

FY14Q4 SMB Magalog December - APJ Version

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. [ ] I/O Abstr

XcalableMP入門

インテル Parallel Studio XE 2017 Composer Edition for Fortran Windows* インストール ガイド Rev (2017/06/08) エクセルソフト株式会社

untitled

Transcription:

Parallel Studio XE 2013 Cluster Studio XE 2013

) ( Intel s Terms and Conditions of Sale Sandy Bridge SYSmark MobileMark http://www.intel.com/performance/ Intel Intel Intel Atom Intel Core Intel Xeon Phi Xeon Cilk VTune / Intel Corporation ( HT ): HT PC HT Core http://www.intel.co.jp/content/www/jp/ja/architecture-and-technology/hyper-threading/hyper-threading-technology.html 64 :64 BIOS PC http://www.intel.com/content/www/jp/ja/architecture-andtechnology/microarchitecture/intel-64-architecture-general.html : PC http://www.intel.co.jp/content/www/jp/ja/architecture-and-technology/turbo-boost/turbo-boosttechnology.html 2

Parallel Studio XE 2013 Cluster Studio XE 2013 50+ / 128 256 512 3

Parallel Studio XE 2013 Cluster Studio XE 2013 Advisor XE (Studio ) Composer XE C/C++ Fortran Cilk Plus MPI MPI VTune Amplifier XE & Inspector XE / / / Trace Analyzer & Collector MPI MPI hotspot 4

C++11 Linux Fortran C# Ivy Bridge Java Fortran 2008 (Windows ) C/C++ Haswell CPU MPI MPI 2.2 Xeon Phi Cluster Studio XE Windows Linux 5

Parallel Studio XE 2013/ Cluster Studio XE 2013 Intel Parallel Studio XE Intel Cluster Studio & XE 3 Core ( : Ivy Bridge) ( : Haswell) Xeon Phi C++ Fortran OS: Windows 8 Desktop Linux IDE: Visual Studio 2008 2010 2012 GNU : C99 C++11 Fortran 2003 Fortran 2008 MPI 2.2 6

7

Ivy Bridge Haswell Xeon Phi C++/Fortran AVX AVX2 FMA3 IMCI MPI MKL AVX AVX2 FMA3 MPI VTune Amplifier XE Inspector XE & & & / 開発コード名 8

Windows Linux Mac OS X C++ Composer XE 2013 Cilk Plus C++ XE 13.0 TBB MKL IPP Xeon Phi (Linux) Fortran Composer XE 2013 Fortran XE 13.0 MKL Compaq Visual Fortran Fortran 2003/2008 Xeon Phi (Linux) Composer XE 2013 C++ Composer XE Fortran Composer XE C++ Fortran Windows (Visual Studio ) Linux Windows: C++ /Visual C++ & Microsoft Visual Studio Linux: C++ /gcc & Eclipse CDT Mac OS X: C++ /gcc & XCode : Fortran Compaq Visual Fortran : : 1 9

C++ AVX AVX2 Xeon Phi Linux: Cilk Plus: SYSmark MobileMark : SIMD 2 ( SSE2) SIMD 3 ( SSE3) SIMD 3 (SSSE3) #20110804 10

Fortran Xeon Phi : Linux AVX AVX2 (-xa /Qxa) SIMD & Co-Array & : VECTOR PARALLEL SIMD (align arraynbyte) SYSmark MobileMark : SIMD 2 ( SSE2) SIMD 3 ( SSE3) SIMD 3 (SSSE3) #20110804 11

C++ Windows 5 Intel Parallel Studio XE Intel Cluster Studio & XE 12

( MKL) Windows Linux Mac OS gcc MSFT PGI Parallel Studio XE Cluster Studio XE : North American Development Survey 2011 Volume II Evans Data Corp 33% MKL MKL 13

MKL LAPACK コンパイラー & ライブラリー SYSmark MobileMark : SIMD 2 ( SSE2) SIMD 3 ( SSE3) SIMD 3 (SSSE3) #20110804 14

( IPP) & OS SSE AVX Windows Linux Mac OS X Atom Core Xeon : : intel.com/software/products/eval 15

IPP AVX SYSmark MobileMark : SIMD 2 ( SSE2) SIMD 3 ( SSE3) SIMD 3 (SSSE3) #20110804 16

VTune Amplifier XE Intel VTune Amplifier XE? 時間がかかっている関数を重点的にチューニングする コールスタックを確認する ソースレベルで時間を確認する ソースレベルでキャッシュミスを確認する 関数をキャッシュミスの回数でソートして確認する 待機時間ごとにロックを確認する 待機中の CPU 利用率は赤または緑で示される Windows Linux Amplifier XE 3 VTune SAS Institute Inc. Claire Cates 17 17

12 VTune Amplifier XE 2013 Intel VTune Amplifier XE 1) & 2) + 3) hotspot 7) ( GCC ) 8) Java Java 9) API 10) 4) Ivy Bridge 5) Haswell 6) Xeon Phi 11) 12) ( : ) / 開発コード名 18

Java VTune Amplifier XE 2013 Intel VTune Amplifier XE ( ) (...) JVM Java / C++ / Fortran Java 19

CPU VTune Amplifier XE 2013 Intel VTune Amplifier XE CPU H/W ( CPU ) 1 : Linux 20

21

Intel Advisor XE Advisor XE : Advisor XE! Linux Windows! C C++ Fortran C# 22

Advisor XE 2013 Intel Advisor XE 1) 2) ( ) 3) 4) 5)! 23

Xeon Phi Compilers & Libraries Xeon Cilk Plus ( TBB) C/C++ C++ Xeon Phi 標準規格のサポート OpenMP Co-Array Fortran MPI! 24

Cilk Plus ( TBB) Compilers & Libraries Cilk Plus TBB What 3 & / C++ Why Windows/Linux C/C++ C++ Windows Linux Mac OS X OS / 25

( TBB) C++ C++ OS TBB Golaem, CTO Michaël Rouillé 26

Xeon Phi Cilk Plus : Cilk Plus (C/C++ ) / 3 : cilk_for cilk_spawn cilk_sync Cilk Plus 27

28

Intel Parallel Studio XE Intel Cluster Studio & XE (Microsoft gdb ) { } char p, q; p = malloc(10); q = p; free(p); q = 0; { } char my_chp = "abc"; char an_chp = (char ) malloc (strlen((char )my_chp)); memset (an_chp, '@', sizeof(my_chp)); CHKP: トレースバック :./a.out(main+0x1b2) [0x402d7a] in file mems.c at line 13 29

Compilers & Libraries ( MKL) : C++ Fortran OpenMP: MKL ( TBB) / MSTC Modern Software Technology CEO Franz Bernasek 30

C++ 11 Compilers & Libraries ( ) ( ) noexcept ( ) for Windows Linux ++11 31

Fortran 2008 Compilers & Libraries 31 (Fortran 2008 15 ) ALLOCATABLE Co-Array CODIMENSION SYNC ALL SYNC IMAGES SYNC MEMORY CRITICAL END CRITICAL LOCK UNLOCK ERROR STOP ALLOCATE DEALLOCATE Co-Array IMAGE_INDEX LCOBOUND NUM_IMAGES THIS_IMAGE UCOBOUND CONTIGUOUS ALLOCATE MOLD G0 G0.d CONTAINS : BESSEL_J0 BESSEL_J1 BESSEL_JN BESSEL_YN BGE BGT BLE, BLT DSHIFTL DSHIFTR ERF ERFC ERFC_SCALED GAMMA HYPOT IALL IANY IPARITY IS_CONTIGUOUS LEADZ LOG_GAMMA MASKL MASKR MERGE_BITS NORM2 PARITY POPCNT POPPAR SHIFTA SHIFTL SHIFTR STORAGE_SIZE TRAILZ ISO_FORTRAN_ENV : ATOMIC_INT_KIND ATOMIC_LOGICAL_KIND CHARACTER_KINDS INTEGER_KINDS INT8 INT16 INT32 INT64 LOCK_TYPE LOGICAL_KINDS REAL_KINDS REAL32 REAL64 REAL128 STAT_LOCKED STAT_LOCKED_OTHER_IMAGE STAT_UNLOCKED DO CONCURRENT OPEN NEWUNIT : ATOMIC_DEFINE ATOMIC_REF INTENT(OUT) G 0 Co-Array ( ) Linux Windows OSX F2008 32

Inspector XE 2013 / Intel Inspector XE... & MPI / 33

Inspector XE 2013 Intel Inspector XE? API 34

Parallel Studio XE 2013 / Intel Parallel Studio XE Intel Cluster Studio & XE 250 : : - - Parallel Studio XE 35

36

Intel Cluster Studio & XE MPI - MPI - MPI 6.5 C/C++ Fortran MPI 12 / Inspector XE MPI VTune Amplifier XE hotspot MPI 37

MPI Cluster Studio XE 2013 Intel MPI Library 18000 Ivy Bridge Haswell Xeon Phi 16000 14000 12000 10000 8000 90K 60K 120K Intel MPI Library, K processes Doubling, K processes 120000 6000 4000 2000 Exascale, K processes (estimated ) MPI 2.2 0 2010 2011 2012 2013 2014 2015 2016 2017 2018 MPI 38

MPI Intel MPI Library Berkeley Lab / BLCR Xeon MPI 39

MPI 2.2 Intel MPI Library MPI 2.1 MPI MPI MPI MPI 2.2 40

Processes MPI Trace Analyzer/Collector ( Cluster Studio XE 2013 ) Intel ITAC Hotspot MPI MPI 6 7000 6000 5000 4000 3000 2000 1000 0 Intel Trace Analyzer and Collector (processes) 2010 2011 2012 Year MPI 41

Intel s Terms and Conditions of Sale http://www.intel.com/performance/ ( ) Intel Intel Intel Atom Intel Core Intel Xeon Phi Xeon Xeon Inside Cilk VTune / Intel Corporation SIMD 2 ( SSE2) SIMD 3 ( SSE3) SIMD 3 (SSSE3) #20110804