THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHug

Size: px
Start display at page:

Download "THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHug"

Transcription

1 THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHugh

2 JAMES REINDERS 3 Parallel Studio XE Cluster Studio SANJAY GOIL JOHN MCHUGH 5 Parallel Studio XE Cluster Studio Windows* Linux* C/C++ Fortran Parallel Building Blocks: DAVID SEKOWSKI 17 3 TBB Cilk Plus Array Building Blocks ArBB Array Building Blocks MICHAEL MCCOOL 23 Array Building Blocks ArBB SIMD MKL GREG HENRY SHANE STORY 29 MKL hotspot Print : DON GUNNING NICK MENG PAUL BESL 31 / print 2010 Intel Corporation. Intel Intel Intel Core Itanium Xeon Intel Corporation * 2

3 James Reinders Intel Threading Building Blocks: Outfitting C++ for Multicore Processor Parallelism Parallel Universe 1 SIMD 2010 / 3

4 Parallel Studio XE Cluster Studio 2 Parallel Studio XE C C++ Fortran Cluster Studio MPI C C++ Fortran 12.0 VTune MPI C/C++ Parallel Building Blocks Co-Array Fortran.NET Parallel Studio XE Linux* Windows* Composer XE VTune Amplifier XE Inspector XE Cluster Studio Linux* Windows* Composer XE MPI MPI / OpenMP* MPI Co-Array Fortran MKL IPP TBB Cilk Plus Array Building Blocks ArBB Parallel Building Blocks PBB Parallel Building Blocks Fortran MKL / Intel Inspector XE: An essential tool during development along with Intel Composer XE Inspector XE: Composer XE Inspector XE hotspot hotspot VTune Amplifier XE MPI MPI On a path to petascale with commodity clusters and Intel MPI MPI HPC MPI / Parallel Studio XE Cluster Studio JAMES REINDERS

5 Parallel Studio XE Cluster Studio Sanjay Goil John McHugh 5

6 Parallel Studio XE 2011 Composer XE Inspector XE VTune Amplifier XE Parallel Studio 2011 Microsoft* Visual Studio* Windows* C++ Parallel Building Blocks PBB C/C++ Windows*/Linux* C/C++ Fortran Parallel Studio XE 2011 C/C++ Fortran MKL IPP PBB TBB Cilk Plus ArBB Inspector XE / VTune Amplifier XE HPC 10 HPC Cluster Studio MPI HPC MPI / C/C++ Fortran 1 / 1 IA MPI HPC HPC 2 / 6

7 Composer XE C/C++ Fortran > / Inspector XE / > VTune Amplifier XE > 2 Parallel Studio XE 2011 > : Parallel Studio XE Windows* Linux* Mac OS* X C/C++ Fortran > : Inspector XE / > : VTune Amplifier XE MKL IPP / > : Parallel Studio XE > : Composer XE AVX C/ C++ PBB Fortran Fortran 2008 Co-Array Fortran > : Parallel Studio XE 1 hotspot / 7

8 Composer XE C++ C++ XE Visual Fortran Visual Fortran Composer XE Visual Fortran IMSL* Visual Fortran Composer XE IMSL* VTune VTune Amplifier XE Inspector XE Cluster Studio 3 Parallel Studio XE 2011 Windows*/Linux* x86 C/C++ Fortran 3 8

9 Parallel Studio XE 2011 Windows* C++ Cilk Plus Parallel Studio XE 2011 BR&E Inc. Jorge Martinis 4 SIMD 5 9

10 hotspot BlueJeans Network IPP 7.0 / IPP IPP 7.0 CPU BlueJeans Network Emmanuel Weber 6 Composer XE Composer XE C/C++ Fortran (v12.0) MKL 10.3 IPP 7.0 TBB C/C++ C++ XE 12.0 AVX Sandy Bridge PBB Cilk Plus TBB ArBB 4 AVX SIMD x86 (GAP) Windows* Visual Studio* 2010 Fortran XE 12.0 x86 Fortran 2003 Fortran 2008 (Co-Array Fortran AVX ) 5 / MKL 10.3 AVX LAPACK C IPP 7.0 AVX AES 10

11 Inspector XE > Inspector XE 2011 OTRADA Inc. CEO CTO Alex Migdalski 7 / Parallel Studio XE 2011 Parallel Studio Linux* Windows* Windows* Linux* 6 Inspector XE / 7 / / C/C++ Fortran Inspector XE / : > > > > > > Windows*/Linux* GUI > 11

12 8 VTune Amplifier XE - hotspot > > CPU VTune Amplifier XE - VTune Amplifier XE 2011 VTune... > > {+} 9 VTune Amplifier XE 2011 VTune Windows*/Linux* 8 9 VTune : > > hotspot > > > > Windows* > > > > Visual Studio > root (Linux*) > EBS root 12

13 Inspector XE - > > (SSA) SSA Envivio Mikael Le Guerroue Parallel Studio XE 10 Parallel Studio XE Parallel Studio XE (SSA) > > > > 250 > > > > Windows*/Linux* GUI 13

14 Linux* Windows* Windows* Linux* C/C++ Parallel Building Blocks C/C++ Co-Array Fortran (CAF) Fortran 2008 Fortran Fortran Cluster Studio 2011 Fortran 1 GUI 11 Cluster Studio > Composer XE > MPI > / HPC Cluster Studio 2011 IA MPI MPI 4.0 / 8.0 MPI C/C++ Fortran MKL 10.3 IPP 7.0 PBB Composer XE Cluster Studio 2011 Co-Array Fortran (CAF) (ICR) IA (TCO) Cluster Studio 2011 MPI MPI OpenMP* PBB Cluster Studio 2011 C/C++ Fortran Linux* Windows* 1 14

15 PO 12 / > > > > hotspot Cluster Studio 2011 > : MPI > : Composer XE C/C++ PBB Fortran Fortran 2008 Co-Array Fortran SIMD > MPI : / MPI > : Windows* Linux* > : IA HPC (TCO) > : Cluster Studio

16 MPI MPI InfiniBand* (IB) MPI MPI 1 InfiniBand (IB) C/C++ Parallel Building Blocks SMP C/ C++ Coarray Fortran (CAF) Fortran 2008 Fortran Linux* Windows* Fortran Fortran 2008 Fortran 2003 MKL IPP Linux* Windows* Windows* Linux* 13 Parallel Studio XE Cluster Studio Windows* Linux* C/C++ Fortran Parallel Studio XE 2011 C/C++ Fortran MKL IPP PBB TBB Cilk Plus ArBB Inspector XE / VTune Amplifier XE Cluster Studio 2011 MPI / C/C++ Fortran MKL IPP PBB TBB Cilk Plus ArBB : 16

17 Parallel Building Blocks David Sekowski 17

18 : 5 C++ TBB Adobe* TBB TBB Parallel Building Blocks PBB > > HPC Andy Grove Only the Paranoid Survive 1 / CPU / > > CPU > > > 1 1 > 1 > 18

19 1 / MPI 3 2 AI I/O for for ( ) : SIMD (Single Instruction Multiple Data) & SIMD

20 2 : (1) (2) 3 OS 3 ( ) 20

21 Parallel Building Blocks - OS - Parallel Amplifier Parallel Inspector OS HW IDE 4 OpenMP* OpenCL OpenMP* Fortran C OpenMP* OpenMP* Web OpenMP* Parallel Building Blocks TBB TBB C++ TBB API TBB (1) (2) Cilk Plus Array Building Blocks ArBB 5 Cilk Plus C/C++ C/C

22 TBB Cilk Plus Windows* Microsoft* C++ Linux* GCC Cilk ++ SDK ArBB intel-array-building-blocks 5 ArBB Ct TBB C++ JIT CPU C++ ArBB ArBB 3 TBB Cilk Plus ArBB Parallel Building Blocks PBB Parallel Studio 2011 Parallel Studio XE 2011 PBB ArBB Ct TBB C++ 22

23 Array Michael McCool Building Blocks

24 Array Building Blocks ArBB Parallel Building Blocks ArBB Microsoft* GNU C++ ArBB Windows* Linux* ArBB?? ArBB SIMD ArBB API SIMD 2 SIMD SIMD SIMD SIMD Parallel Building Blocks PBB SIMD SIMD SSE 1 SSE 4 AVX SIMD 8 (MIC) SIMD 16 24

25 Parallel Building Blocks PBB 3 SIMD SIMD 2 1 SIMD 2 SIMD SSE AVX MIC AVX SSE SSE AVX 2 1 C++ 1 SSE AVX AVX SIMD SIMD SIMD C/C++ Parallel Building Blocks PBB 3 1 MKL IPP 2 1 C/C++ Cilk Plus C/C++ 2 ArBB ArBB C++ API ISO C++ C++ - C/C++ ArBB ArBB ArBB C++ API ArBB C++ float) integer) f32 i32 32 C++ ArBB dense<t,d> T D D 1 T ArBB ArBB 25

26 ArBB 2 A B C D 4 dense<f32> A += (B/C) * D; ArBB call void doit(dense<f32>& A, dense<f32> B, dense<f32> C, dense<f32> D) { A += (B/C) * D; }... call(doit)(a,b,c,d); call 1 ArBB call C++ ArBB C++ C++ ArBB ArBB ArBB call capture call C++ ArBB call BLOG highlights Cilk Plus ABI JAMES REINDERS Cilk Plus Cilk Plus ABI cilk.com Cilk Plus Windows* Linux* Cilk Plus Cilk Plus 2009 Cilk Arts JAMES Go-Parallel.com Go Parallel : Translating Multicore Power into Application Performance 26

27 void doit dense<f32>& A, f32 b, f32 c, dense<f32> D) { map(kernel)(a, b, c, D); } call(doit)(a,b,c,d); ArBB void kernel(f32& a, f32 b, f32 c, f32 d) { a += (b/c)*d; } kernel b c f32 kernel A D b c call map 2 ArBB prefix scan) / / ) A B map call map f32 A _ dot _ B = add _ reduce A * B); void doit(dense<f32>& A, dense<f32> B, dense<f32> C, dense<f32> D) { map(kernel)(a, B, C, D); } call(doit)(a,b,c,d); C++ 1 ArBB ArBB 27

28 capture ArBB C++ ArBB (_end_for ) _for (;) (,) ArBB / ArBB STL bind ArBB C++ call doit map ArBB int max _ count = MAX _ COUNT; void mandel(i32& d, std::complex<f32> c) { i32 i; std::co m plex<f32> z = 0.0f; _ for (i = 0, i < max _ count, i++) { _ if (abs z) >= 2.0f) { _ break; } _ end _ if; z = z*z + c; } _ end _ for; d = i; } v o i d doit(dense<i32,2>& D, dense<std::co m plex<f32>,2> P) { map(mandel)(d,p); } dense<std::co m plex<f32>,2> pos; bind(pos, c _ pos, cols, rows) dense<i32,2> dest; bind(dest, c _ dest, cols, rows) call(doit)(dest, pos); Array Building Blocks ArBB ArBB ArBB C++ C++ ArBB ArBB std::complex ArBB C++ max_count call 28

29 MKL MKL Greg Henry Shane Story MKL MKL hotspot MKL BLAS (Basic Linear Algebra Subroutines) LAPACK (Linear Algebra PACKage) (FFT) (VML) (VSL) (PARDISO) BLAS MKL ScaLAPACK BLAS (PBLAS) FFT IA-32/ 64 AMD* Linux* Windows* Mac OS* X MKL DGEMM BLAS MKL MKL Core 2 Duo Core i7 MKL MKL OpenMP* LAPACK BLAS BLAS VML FFT FFT LAPACK BLAS LAPACK MKL 29

30 MKL OpenMP* MKL MKL_NUM_THREADS OpenMP* MKL MKL OpenMP* MKL OpenMP* / OpenMP* OpenMP* MKL MKL Microsoft* GNU OpenMP* OpenMP* MKL_DOMAIN_NUM_THREADS mkl_domain_set_num_threads() MKL MKL 2 BLAS 4 MKL_ALL=2, MKL_BLAS=4 Cilk Plus TBB pthreads (Linux*) OpenMP* MKL MKL MKL_NUM_THREADS 1 MKL LAPACK BLAS LAPACK BLAS BLAS LAPACK DGETRF BLAS LAPACK (MPI) MKL MP LINPACK (DGETRF ) MPI-OpenMP* 1 1 MPI OpenMP* MPI MKL OpenMP* MPI MKL 1 OpenMP* 1 OpenMP* MKL MKL MKL_DYNAMIC FALSE TRUE mkl_set_dynamic() FFT 2 MKL Web : [BLAS] [LAPACK] [MKL] [MPI] [MPI] [OPENMP] [SCALAPACK] 30

31 print : Don Gunning Nick Meng Paul Besl MPI 4.0 / / print MPI % LSTC dyna 1,500 fluent 3, / ISV

32 (H) k 5k 7.5k 10k 15k 20k 1. source /opt/intel/itac/ /bin/itacvars.sh export LD _ PRELOAD=/opt/intel/itac/ /slib/libVT.so # 8p run runexec small _ model.pre -np 8 --mpi-options -trace --machines-file $PBS _ NODEFILE #256p run runexec large _ model.pre -np mpi-options -trace --machines-file $PBS _ NODEFILE / MPI trace mpi-options trace ITAC / STF P0 P1 P7 P0 P1 32

33 MPI BCAST 2. / MPI MPI : [ ] : [ ] MPI BCAST 3. / MPI MPI : : 33

34 4. / 256 : MPI : 5. / MPI MPI 3 MPI_Bcast MPI MPI MPI 6 7 MPI_BCAST 6 7 MPI MPI 34

35 6. / / : MPI : MPI / 35

36 MPI 4 MPI MPI MPI _BCAST MPI_BCAST MPI_BCAST I_MPI_ADJUST_BCAST=4 / ISV 64 Livermore Software Technology Corporation (LSTC) LSTC OpenMP* MPI / LSTC DYNA : LSTC LS-DYNA 1, LSTC DEVELOPER SPOTLIGHT & UNIX System V (ISS) IA 32 IA IA 32 IA ERP Sparc* Sun* Solaris* IA Linux* Larrabee Larrabee IA-32 Itanium Larrabee 36

37 8. / 4 9. /

38 Xeon Xeon MPP (MPI) MPI OpenMP* LSTC CYL1E6 : LSTC / print 100 MPP DYNA MPI LSTC / 8 9 MPI OpenMP* MPI MPI MPI 100 : LSTC LS DYNA MPP DYNA HYBRID LS-DYNA > OpenMP* MPI 1 OpenMP* LS-DYNA > MPI I/O 10 38

39 11. / MPI_BCAST MPI MPI_RECV 12. /

40 13. / ITAC MPI 4.0 HYBRID LS-DYNA 100 / MPI_RECV MPI_BCAST / MPI_RECV 40

41 SIMD SIMD 2 SSE2 SIMD 3 SSE3 SIMD 3 (SSSE3) # Web

インテル(R) Visual Fortran Composer XE

インテル(R) Visual Fortran Composer XE Visual Fortran Composer XE 1. 2. 3. 4. 5. Visual Studio 6. Visual Studio 7. 8. Compaq Visual Fortran 9. Visual Studio 10. 2 https://registrationcenter.intel.com/regcenter/ w_fcompxe_all_jp_2013_sp1.1.139.exe

More information

Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx

Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx Parallel Studio XE 2013 Cluster Studio XE 2013 ) ( Intel s Terms and Conditions of Sale Sandy Bridge SYSmark MobileMark http://www.intel.com/performance/ Intel Intel Intel Atom Intel Core Intel Xeon Phi

More information

DPD Software Development Products Overview

DPD Software Development Products Overview 2 2007 Intel Corporation. Core 2 Core 2 Duo 2006/07/27 Core 2 precise VTune Core 2 Quad 2006/11/14 VTune Core 2 ( ) 1 David Levinthal 3 2007 Intel Corporation. PC Core 2 Extreme QX6800 2.93GHz, 1066MHz

More information

インテル® VTune™ パフォーマンス・アナライザー 9.1 Windows* 版

インテル® VTune™ パフォーマンス・アナライザー 9.1 Windows* 版 VTune 9.1 Windows* ................................. 3...................... 3.................................................. 3............................................ 4 :.........................4................................................

More information

製品価格 ( 新規購入 ) INT6531 インテル VTune Amplifier XE 2017 for Windows Floating 1-275, ,000 INT6532 インテル VTune Amplifier XE 2017 for Linux Floating 1-27

製品価格 ( 新規購入 ) INT6531 インテル VTune Amplifier XE 2017 for Windows Floating 1-275, ,000 INT6532 インテル VTune Amplifier XE 2017 for Linux Floating 1-27 製品価格 ( 新規購入 ) INT6499 インテル Parallel Studio XE 2017 Cluster Edition for Windows Floating 2- INT6500 インテル Parallel Studio XE 2017 Cluster Edition for Windows Floating 5-2,478,000 2,676,240 INT6501 インテル Parallel

More information

インテル(R) C++ Composer XE 2011 Windows版 入門ガイド

インテル(R) C++ Composer XE 2011 Windows版 入門ガイド C++ Composer XE 2011 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.2 (2011/05/03) Copyright 1998-2011 XLsoft Corporation. All Rights Reserved. 1 / 70 ... 4... 5... 6... 8 /... 8... 10 /... 11... 11 /... 13

More information

インテル(R) Visual Fortran Composer XE 2013 Windows版 入門ガイド

インテル(R) Visual Fortran Composer XE 2013 Windows版 入門ガイド Visual Fortran Composer XE 2013 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.1 (2012/12/10) Copyright 1998-2013 XLsoft Corporation. All Rights Reserved. 1 / 53 ... 3... 4... 4... 5 Visual Studio... 9...

More information

Contents Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C Microsoft* Windows* CE.NET Platform Builder C IP

Contents Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C Microsoft* Windows* CE.NET Platform Builder C IP Windows*/Linux* VTune TM Contents... 1... 2 Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C++... 9 Microsoft* Windows* CE.NET Platform Builder C++... 11 IPP... 13 PCA IPP... 15 GPP...

More information

インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster

インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ アカデミック版特定ユーザーライセンス INT5744 インテル Parallel Studio XE 2016 Cluster Edition 273,000 for 294 Win INT5745 インテル Parallel Studio XE 2016 Cluster

More information

製品型番 商用版特定ユーザーライセンス INT7001 インテル System Studio 2018 FreeBSD \163,080 INT6673 インテル Media Server Studio 2017 Essentials \84,000 \90,720 Edit INT6674 インテ

製品型番 商用版特定ユーザーライセンス INT7001 インテル System Studio 2018 FreeBSD \163,080 INT6673 インテル Media Server Studio 2017 Essentials \84,000 \90,720 Edit INT6674 インテ インテルソウトウェア開発製品 2018 (C++ Fotran コンパイラ ) 商用版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2017 年 12 月 7 日 ~ 製品型番 商用版特定ユーザーライセンス INT6759 インテル Parallel Studio XE 2018 Cluster \495,000 \534,600 Edition INT6760 インテル Parallel

More information

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2 FFT 1 Fourier fast Fourier transform FFT FFT FFT 1 FFT FFT 2 Fourier 2.1 Fourier FFT Fourier discrete Fourier transform DFT DFT n 1 y k = j=0 x j ω jk n, 0 k n 1 (1) x j y k ω n = e 2πi/n i = 1 (1) n DFT

More information

FFTSS Library Version 3.0 User's Guide

FFTSS Library Version 3.0 User's Guide : 19 10 31 FFTSS 3.0 Copyright (C) 2002-2007 The Scalable Software Infrastructure Project, (CREST),,. http://www.ssisc.org/ Contents 1 4 2 (DFT) 4 3 4 3.1 UNIX............................................

More information

インテル(R) Visual Fortran Composer XE 2011 Windows版 入門ガイド

インテル(R) Visual Fortran Composer XE 2011 Windows版 入門ガイド Visual Fortran Composer XE 2011 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.0 (2010/12/20) Copyright 1998-2011 XLsoft Corporation. All Rights Reserved. 1 / 36 ... 3... 4... 5... 7 /... 7... 9 /... 9...

More information

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定した並列コードの作成を簡略化するツールセットです : 最先端のコンパイラー ライブラリー 並列モデル インテル

More information

アカ版特定ユーザーライセンス INT7006 INT7007 INT7008 INT6685 インテル System Studio 2018 Ultimate on \217,080 r インテル System Studio 2018 Ultimate on \217,080 r インテル Syst

アカ版特定ユーザーライセンス INT7006 INT7007 INT7008 INT6685 インテル System Studio 2018 Ultimate on \217,080 r インテル System Studio 2018 Ultimate on \217,080 r インテル Syst インテルソウトウェア開発製品 2018 (C++ Fotran コンパイラ ) アカ版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2017 年 12 月 7 日 ~ 製品型番 アカ版特定ユーザーライセンス INT6794 インテル Parallel Studio XE 2018 Cluster \252,000 \272,160 on INT6795 インテル Parallel Studio

More information

01_OpenMP_osx.indd

01_OpenMP_osx.indd OpenMP* / 1 1... 2 2... 3 3... 5 4... 7 5... 9 5.1... 9 5.2 OpenMP* API... 13 6... 17 7... 19 / 4 1 2 C/C++ OpenMP* 3 Fortran OpenMP* 4 PC 1 1 9.0 Linux* Windows* Xeon Itanium OS 1 2 2 WEB OS OS OS 1 OS

More information

Second-semi.PDF

Second-semi.PDF PC 2000 2 18 2 HPC Agenda PC Linux OS UNIX OS Linux Linux OS HPC 1 1CPU CPU Beowulf PC (PC) PC CPU(Pentium ) Beowulf: NASA Tomas Sterling Donald Becker 2 (PC ) Beowulf PC!! Linux Cluster (1) Level 1:

More information

Click to edit title

Click to  edit title インテル VTune Amplifier 2018 を 使用した最適化手法 ( 初級編 ) 久保寺 陽子 内容 アプリケーション最適化のプロセス インテル VTune Amplifier の紹介 インテル VTune Amplifier の新機能 インテル VTune Amplifier を用いた最適化例 (1) インテル VTune Amplifier を用いた最適化例 (2) まとめ 2 インテル

More information

Microsoft Word - w_mkl_build_howto.doc

Microsoft Word - w_mkl_build_howto.doc MKL 10.0 2007/12/18 XLsoft - 2 - 1....- 4-2. MKL...- 4-3....- 5-3-1....- 5-3-1-1. Microsoft Visual C++ 2005...- 5-3-1-2. C/C++...- 9-3-1-3. Fortran...- 11-3-2. Microsoft Visual Studio...- 13-3-2-1. Microsoft

More information

HP High Performance Computing(HPC)

HP High Performance Computing(HPC) ACCELERATE HP High Performance Computing HPC HPC HPC HPC HPC 1000 HPHPC HPC HP HPC HPC HPC HP HPCHP HP HPC 1 HPC HP 2 HPC HPC HP ITIDC HP HPC 1HPC HPC No.1 HPC TOP500 2010 11 HP 159 32% HP HPCHP 2010 Q1-Q4

More information

Microsoft Word - HOKUSAI_system_overview_ja.docx

Microsoft Word - HOKUSAI_system_overview_ja.docx HOKUSAI システムの概要 1.1 システム構成 HOKUSAI システムは 超並列演算システム (GWMPC BWMPC) アプリケーション演算サーバ群 ( 大容量メモリ演算サーバ GPU 演算サーバ ) と システムの利用入口となるフロントエンドサーバ 用途の異なる 2 つのストレージ ( オンライン ストレージ 階層型ストレージ ) から構成されるシステムです 図 0-1 システム構成図

More information

HP Workstation 総合カタログ

HP Workstation 総合カタログ HP Workstation E5 v2 Z Z SFF E5 v2 2 HP Windows Z 3 Performance Innovation Reliability 3 HPZ HP HP Z820 Workstation P.11 HP Z620 Workstation & CPU P.12 HP Z420 Workstation P.13 17.3in WIDE HP ZBook 17

More information

hotspot の特定と最適化

hotspot の特定と最適化 1 1? 1 1 2 1. hotspot : hotspot hotspot Parallel Amplifier 1? 2. hotspot : (1 ) Parallel Composer 1 Microsoft* Ticker Tape Smoke 1.0 PiSolver 66 / 64 / 2.76 ** 84 / 27% ** 75 / 17% ** 1.46 89% Microsoft*

More information

HPEハイパフォーマンスコンピューティング ソリューション

HPEハイパフォーマンスコンピューティング ソリューション HPE HPC / AI Page 2 No.1 * 24.8% No.1 * HPE HPC / AI HPC AI SGIHPE HPC / AI GPU TOP500 50th edition Nov. 2017 HPE No.1 124 www.top500.org HPE HPC / AI TSUBAME 3.0 2017 7 AI TSUBAME 3.0 HPE SGI 8600 System

More information

MKL10.3 Win_UsageGuide

MKL10.3 Win_UsageGuide Intel Math Kernel Library Version 11.1 (Windows 版 ) ~ 活 用 ガイド~ 2014 年 8 月 8 日 作 成 版 インテル MKL について 最 適 化 各 世 代 のインテル プロセッサーがサポートする 拡 張 命 令 セット(SSE また はインテル AVX など)の 使 用 キャッシュメモリの 活 用 など 実 行 環 境 に 応 じて 適

More information

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現 はじめに 本ガイドは インテル Parallel Studio XE を使用してアプリケーション中の hotspot ( 多くの時間を費やしているコード領域 ) を見つけ それらの領域を再コンパイルすることでアプリケーション全体のパフォーマンスを向上する方法について説明します 1 つのファイルを再コンパイルするだけで違いが出るのでしょうか? はい 多くの場合 インテル Parallel Studio

More information

製品型番 アカデミック版フローティング ライセンス インテル Parallel Studio XE 2018 Composer INT6991 \232,000 \250,560 Floating 2-Pack アカデミック日本語版インテル Parallel Studio XE 2018 Compo

製品型番 アカデミック版フローティング ライセンス インテル Parallel Studio XE 2018 Composer INT6991 \232,000 \250,560 Floating 2-Pack アカデミック日本語版インテル Parallel Studio XE 2018 Compo インテルソウトウェア開発製品 2018 株式会社アークブレイン (C++ Fotran コンパイラ ) 2017 年 12 月 7 日 ~ アカデミック版フローティング ライセンス標準価格表 製品型番 アカデミック版フローティング ライセンス INT6874 インテル Parallel Studio XE 2018 Cluster 1,243,000 \1,342,440 Pack アカデミック INT6875

More information

v10 IA-32 64¹ IA-64²

v10 IA-32 64¹ IA-64² v10 IA-32 64¹ IA-64² 1. 2. 3. 4. 5. 6. /Od (-O0) Windows* /O1 /O2 /O3 Linux* Mac OS* -O1 -O2 -O3 /O2 ( O2) /O3 (-O3) IA-64 Core 2 /QxT ( xt) IA-32 64 IA-32 64 Itanium 2 9000 /G2-p9000 ( mtune=itanium2-p9000)

More information

HP High Performance Computing(HPC)

HP High Performance Computing(HPC) HP High Performance Computing HPC HPC HPC HPC HPC 1000 HPHPC HPC HP HPC HPC HPCHP HPC HP HPHPC HPC HP HPC HP IT IDCHP HPC 4 1 HPC HPCNo.1 HPCTOP5002008 6 HP 183 37% HP HPCHP B 1 Other 2Q08 HPC 2 20% 27%

More information

develop

develop SCore SCore 02/03/20 2 1 HA (High Availability) HPC (High Performance Computing) 02/03/20 3 HA (High Availability) Mail/Web/News/File Server HPC (High Performance Computing) Job Dispatching( ) Parallel

More information

XcalableMP入門

XcalableMP入門 XcalableMP 1 HPC-Phys@, 2018 8 22 XcalableMP XMP XMP Lattice QCD!2 XMP MPI MPI!3 XMP 1/2 PCXMP MPI Fortran CCoarray C++ MPIMPI XMP OpenMP http://xcalablemp.org!4 XMP 2/2 SPMD (Single Program Multiple Data)

More information

Intel® Compilers Professional Editions

Intel® Compilers Professional Editions 2007 6 10.0 * 10.0 6 5 Software &Solutions group 10.0 (SV) C++ Fortran OpenMP* OpenMP API / : 200 C/C++ Fortran : OpenMP : : : $ cat -n main.cpp 1 #include 2 int foo(const char *); 3 int main()

More information

untitled

untitled taisuke@cs.tsukuba.ac.jp http://www.hpcs.is.tsukuba.ac.jp/~taisuke/ CP-PACS HPC PC post CP-PACS CP-PACS II 1990 HPC RWCP, HPC かつての世界最高速計算機も 1996年11月のTOP500 第一位 ピーク性能 614 GFLOPS Linpack性能 368 GFLOPS (地球シミュレータの前

More information

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5]

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5] MPI ( ) snozawa@env.sci.ibaraki.ac.jp 1 ( ) MPI MPI Message Passing Interface[2] MPI MPICH[3],LAM/MPI[4] (MIMDMultiple Instruction Multipule Data) Message Passing ( ) (MPI (rank) PE(Processing Element)

More information

Parallel Studio XE Parallel Studio XE hotspot ( )

Parallel Studio XE Parallel Studio XE hotspot ( ) Parallel Studio XE Parallel Studio XE hotspot ( ) 1 つのファイルを再コンパイルするだけで違いが出るのでしょうか? はい 多くの場合 Parallel Studio XE の最適化コンパイラーを使用して 1 つのファイルを再コンパイルするだけでパフォーマンスが大幅に向上します 必ずしもアプリケーション全体を再コンパイルする必要はありません これは シリアル

More information

09中西

09中西 PC NEC Linux (1) (2) (1) (2) 1 Linux Linux 2002.11.22) LLNL Linux Intel Xeon 2300 ASCIWhite1/7 / HPC (IDC) 2002 800 2005 2004 HPC 80%Linux) Linux ASCI Purple (ASCI 100TFlops Blue Gene/L 1PFlops (2005)

More information

1重谷.PDF

1重谷.PDF RSCC RSCC RSCC BMT 1 6 3 3000 3000 200310 1994 19942 VPP500/32PE 19992 VPP700E/128PE 160PE 20043 2 2 PC Linux 2048 CPU Intel Xeon 3.06GHzDual) 12.5 TFLOPS SX-7 32CPU/256GB 282.5 GFLOPS Linux 3 PC 1999

More information

インテル® Parallel Studio XE 2013 Linux* 版インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2013 Linux* 版インストール・ガイドおよびリリースノート インテル Parallel Studio XE 2013 Linux* 版インストール ガイドおよびリリースノート 資料番号 : 323804-003JA 2012 年 7 月 30 日 目次 1 概要... 2 1.1 新機能... 2 1.1.1 インテル Parallel Studio XE 2011 からの変更点... 2 1.2 製品の内容... 2 1.3 動作環境... 2 1.4 ドキュメント...

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.09.10 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 1 / 59 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 2 / 59 Windows, Mac Unix 0444-J furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 3 / 59 Part I Unix GUI CUI:

More information

インテル® Parallel Studio XE 2015 Composer Edition for Linux* インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2015 Composer Edition for Linux* インストール・ガイドおよびリリースノート インテル Parallel Studio XE 2015 Composer Edition for Linux* インストール ガイドおよびリリースノート 2014 年 10 月 14 日 目次 1 概要... 1 1.1 製品の内容... 2 1.2 インテル デバッガー (IDB) を削除... 2 1.3 動作環境... 2 1.3.1 SuSE Enterprise Linux 10* のサポートを終了...

More information

HP Workstation 総合カタログ

HP Workstation 総合カタログ HP Workstation Z HP 6 Z HP HP Z840 Workstation P.9 HP Z640 Workstation & CPU P.10 HP Z440 Workstation P.11 17.3in WIDE HP ZBook 17 G2 Mobile Workstation P.15 15.6in WIDE HP ZBook 15 G2 Mobile Workstation

More information

Introducing Intel® Parallel Studio XE 2015

Introducing  Intel® Parallel Studio XE 2015 インテル Parallel Studio XE 205 の概要 James Reinders インテルコーポレーションのソフトウェア エバンジェリスト兼ディレクター james.r.reinders@intel.com 高速なコードを迅速に開発インテル Parallel Studio XE 205 高速なコード 明示的なベクトル プログラミングでより多くのコードをスピードアップ インテル Xeon

More information

ストリーミング SIMD 拡張命令2 (SSE2) を使用した SAXPY/DAXPY

ストリーミング SIMD 拡張命令2 (SSE2) を使用した SAXPY/DAXPY SIMD 2(SSE2) SAXPY/DAXPY 2.0 2000 7 : 248600J-001 01/12/06 1 305-8603 115 Fax: 0120-47-8832 * Copyright Intel Corporation 1999, 2000 01/12/06 2 1...5 2 SAXPY DAXPY...5 2.1 SAXPY DAXPY...6 2.1.1 SIMD C++...6

More information

IBM PureData

IBM PureData IBM Software Information Management IBM PureData System for Analytics 2 IBM PureData System for Analytics 2 2 3 2 5 - S-Blade 6 S-Blade - IBM FAST 7 7 8 10 11 11 IBM PureData System for Analytics 11 IBM

More information

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2 ! OpenCL [Open Computing Language] 言 [OpenCL C 言 ] CPU, GPU, Cell/B.E.,DSP 言 行行 [OpenCL Runtime] OpenCL C 言 API Khronos OpenCL Working Group AMD Broadcom Blizzard Apple ARM Codeplay Electronic Arts Freescale

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2016.06.06 2016.06.06 1 / 60 2016.06.06 2 / 60 Windows, Mac Unix 0444-J 2016.06.06 3 / 60 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 0444-J 2016.06.06 4 / 60 ( : ) 6 6 ( ) 6 10 6 16 SX-ACE 6 17

More information

1 OpenCL OpenCL 1 OpenCL GPU ( ) 1 OpenCL Compute Units Elements OpenCL OpenCL SPMD (Single-Program, Multiple-Data) SPMD OpenCL work-item work-group N

1 OpenCL OpenCL 1 OpenCL GPU ( ) 1 OpenCL Compute Units Elements OpenCL OpenCL SPMD (Single-Program, Multiple-Data) SPMD OpenCL work-item work-group N GPU 1 1 2 1, 3 2, 3 (Graphics Unit: GPU) GPU GPU GPU Evaluation of GPU Computing Based on An Automatic Program Generation Technology Makoto Sugawara, 1 Katsuto Sato, 1 Kazuhiko Komatsu, 2 Hiroyuki Takizawa

More information

ACE Associated Computer Experts bv

ACE Associated Computer Experts bv CoSy Application CoSy Marcel Beemster/Yoichi Sugiyama ACE Associated Compiler Experts & Japan Novel Corporation contact: yo_sugi@jnovel.co.jp Parallel Architecture 2 VLIW SIMD MIMD 3 MIMD HW DSP VLIW/ILP

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.06.04 2018.06.04 1 / 62 2018.06.04 2 / 62 Windows, Mac Unix 0444-J 2018.06.04 3 / 62 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 2018.06.04 4 / 62 0444-J ( : ) 6 4 ( ) 6 5 * 6 19 SX-ACE * 6

More information

PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 P

PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 P PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 PC PC PC PC PC Key Words:Grid, PC Cluster, Distributed

More information

Po w eredge M000e Index? & 00% 5 32CPU 256 0U PowerEdge M000e PowerEdge M000eI/O 6

Po w eredge M000e Index? & 00% 5 32CPU 256 0U PowerEdge M000e PowerEdge M000eI/O 6 PowerEdge M Designed for Efficiency Built to reduce total economic impact. PowerEdge M000e PowerEdge M90 / M70 / M70HD / M60 / M60x Xeon 2 9 0 3 4 2 5 6 3 4 7 8 5 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Po

More information

卒業論文

卒業論文 PC OpenMP SCore PC OpenMP PC PC PC Myrinet PC PC 1 OpenMP 2 1 3 3 PC 8 OpenMP 11 15 15 16 16 18 19 19 19 20 20 21 21 23 26 29 30 31 32 33 4 5 6 7 SCore 9 PC 10 OpenMP 14 16 17 10 17 11 19 12 19 13 20 1421

More information

インテル® Fortran Studio XE 2011 SP1 Windows* 版インストール・ガイドおよびリリースノート

インテル® Fortran Studio XE 2011 SP1 Windows* 版インストール・ガイドおよびリリースノート インテル Fortran Studio XE 2011 SP1 Windows* 版インストール ガイドおよびリリースノート 資料番号 : 325583-001JA 2011 年 8 月 5 日 目次 1 概要... 1 1.1 新機能... 2 1.2 製品の内容... 2 1.3 動作環境... 2 1.3.1 Microsoft* Visual Studio* 2005 のサポート終了予定...

More information

Presentation title

Presentation title インテル Xeon Phi コプロセッサー搭載システムの紹介およびオフロード プログラミングとネイティブ実行の概要 インテル ソフトウェア開発製品の紹介 インテル ソフトウェア開発製品 Advanced Performance C++ および Fortran コンパイラーインテル MKL/ インテル IPP ライブラリーと解析ツール IA ベース マルチコア ノード上の Windows* および Linux*

More information

今から間にあう仮想化入門とXenについて

今から間にあう仮想化入門とXenについて Xen Linux 2006 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice Agenda IA Xen. Xen 4. Xen 2 19 10 1 IA IA Server Linux Windows Linux Linux

More information

64bit SSE2 SSE2 FPU Visual C++ 64bit Inline Assembler 4 FPU SSE2 4.1 FPU Control Word FPU 16bit R R R IC RC(2) PC(2) R R PM UM OM ZM DM IM R: reserved

64bit SSE2 SSE2 FPU Visual C++ 64bit Inline Assembler 4 FPU SSE2 4.1 FPU Control Word FPU 16bit R R R IC RC(2) PC(2) R R PM UM OM ZM DM IM R: reserved (Version: 2013/5/16) Intel CPU (kashi@waseda.jp) 1 Intel CPU( AMD CPU) 64bit SIMD Inline Assemler Windows Visual C++ Linux gcc 2 FPU SSE2 Intel CPU double 8087 FPU (floating point number processing unit)

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. [ ] I/O Abstr

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. [ ] I/O Abstr THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. [ ] 466-8555 E-mail: fukushima@nitech.ac.jp I/O Abstract [Invited] High-Performance Computing Programming

More information

倍々精度RgemmのnVidia C2050上への実装と応用

倍々精度RgemmのnVidia C2050上への実装と応用 .. maho@riken.jp http://accc.riken.jp/maho/,,, 2011/2/16 1 - : GPU : SDPA-DD 10 1 - Rgemm : 4 (32 ) nvidia C2050, GPU CPU 150, 24GFlops 25 20 GFLOPS 15 10 QuadAdd Cray, QuadMul Sloppy Kernel QuadAdd Cray,

More information

インテル® Parallel Studio XE 2013 Windows* 版インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2013 Windows* 版インストール・ガイドおよびリリースノート インテル Parallel Studio XE 2013 Windows* 版インストール ガイドおよびリリースノート 資料番号 : 323803-003JA 2012 年 8 月 8 日 目次 1 概要... 2 1.1 新機能... 2 1.1.1 インテル Parallel Studio XE 2011 からの変更点... 2 1.2 製品の内容... 2 1.3 動作環境... 2 1.4

More information

SAP Solution in Detail SAP Business One SAP Business One 1 SAP Business One 5 SAP Business One 5 1 5 5 5 6 6 SAP Business One 6 / 6 / 6 / 7 / 7 / 7 / 7 SAP Business One 8 8 9 9 CRM 9 CRM 10 10 SAP Business

More information

( CUDA CUDA CUDA CUDA ( NVIDIA CUDA I

(    CUDA CUDA CUDA CUDA (  NVIDIA CUDA I GPGPU (II) GPGPU CUDA 1 GPGPU CUDA(CUDA Unified Device Architecture) CUDA NVIDIA GPU *1 C/C++ (nvcc) CUDA NVIDIA GPU GPU CUDA CUDA 1 CUDA CUDA 2 CUDA NVIDIA GPU PC Windows Linux MaxOSX CUDA GPU CUDA NVIDIA

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

imai@eng.kagawa-u.ac.jp No1 No2 OS Wintel Intel x86 CPU No3 No4 8bit=2 8 =256(Byte) 16bit=2 16 =65,536(Byte)=64KB= 6 5 32bit=2 32 =4,294,967,296(Byte)=4GB= 43 64bit=2 64 =18,446,744,073,709,551,615(Byte)=16EB

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

π-VizStudio User Manual

π-VizStudio User Manual -VizStudio User Manual 2018-07-26 -CAVE -VizStudio () -CAVE -VizStudio User Manual -VizStudio -CAVE -VizStudio User Manual -VizStudio -VizStudio Manual -VizStudio -CAVE -VizStudio Admin Manual -CAVE -VizStudio

More information

Pentium 4

Pentium 4 Pentium 4 Pentium 4... 2... 2... 2... 3... 3... 3... 3... 4 TMPGEnc Plus2.5 Ver.2.59... 5... 8... 9... 9 VTune TM... 9 C++/Fortran... 9 1 Pentium 4 HT Xeon TM Pentium 4 3.06GHz HT Pentium 4 NetBurst TM

More information

RaVioli SIMD

RaVioli SIMD RaVioli SIMD 17 17115074 i RaVioli SIMD PC PC PC PC CPU RaVioli RaVioli CPU RaVioli CPU SIMD RaVioli RaVioli SIMD RaVioli SIMD RaVioli SIMD 1 1 2 RaVioli 2 2.1 RaVioli.......................................

More information

WinDriver を使用して、簡単にデバイス ドライバを作成

WinDriver を使用して、簡単にデバイス ドライバを作成 WinDriver Jungo WinDriver OS 1 2 OS WinDriver OS Windows Linux Solaris VxWorks OS WinDriver ( ) Web http://www.xlsoft.com/jp/products/downloa d/ WinDriver Ring-0 API I/O PCI/ISA USB 1 WinDriver 1. WinDriver

More information

WinHPC ppt

WinHPC ppt MPI.NET C# 2 2009 1 20 MPI.NET MPI.NET C# MPI.NET C# MPI MPI.NET 1 1 MPI.NET C# Hello World MPI.NET.NET Framework.NET C# API C# Microsoft.NET java.net (Visual Basic.NET Visual C++) C# class Helloworld

More information

02_C-C++_osx.indd

02_C-C++_osx.indd C/C++ OpenMP* / 2 C/C++ OpenMP* OpenMP* 9.0 1... 2 2... 3 3OpenMP*... 5 3.1... 5 3.2 OpenMP*... 6 3.3 OpenMP*... 8 4OpenMP*... 9 4.1... 9 4.2 OpenMP*... 9 4.3 OpenMP*... 10 4.4... 10 5OpenMP*... 11 5.1

More information

Microsoft PowerPoint - sales2.ppt

Microsoft PowerPoint - sales2.ppt 最適化とは何? CPU アーキテクチャに沿った形で最適な性能を抽出できるようにする技法 ( 性能向上技法 ) コンパイラによるプログラム最適化 コンパイラメーカの技量 経験量に依存 最適化ツールによるプログラム最適化 KAP (Kuck & Associates, Inc. ) 人によるプログラム最適化 アーキテクチャのボトルネックを知ること 3 使用コンパイラによる性能の違い MFLOPS 90

More information

untitled

untitled OS 2007/4/27 1 Uni-processor system revisited Memory disk controller frame buffer network interface various devices bus 2 1 Uni-processor system today Intel i850 chipset block diagram Source: intel web

More information

workshop Eclipse TAU AICS.key

workshop Eclipse TAU AICS.key 11 AICS 2016/02/10 1 Bryzgalov Peter @ HPC Usability Research Team RIKEN AICS Copyright 2016 RIKEN AICS 2 3 OS X, Linux www.eclipse.org/downloads/packages/eclipse-parallel-application-developers/lunasr2

More information

ムーアの法則 : インテルでは順調に存続中 65nm 2005 製造中 45nm nm nm 2011 * 開発中 15nm 2013 * リサーチ 11nm 2015 * 8nm 2017 * インテルの革新的技術を順次適用予定 2 インテル製品は 予告なく

ムーアの法則 : インテルでは順調に存続中 65nm 2005 製造中 45nm nm nm 2011 * 開発中 15nm 2013 * リサーチ 11nm 2015 * 8nm 2017 * インテルの革新的技術を順次適用予定 2 インテル製品は 予告なく HPC 向け次世代 Intel プロセッサ / ツールの紹介 インテル株式会社 ソフトウェア & サービス統括部 池井満 1 2010,IntelCorporation. 無断での引用 転載を禁じます ムーアの法則 : インテルでは順調に存続中 65nm 2005 製造中 45nm 2007 32nm 2009 22nm 2011 * 開発中 15nm 2013 * リサーチ 11nm 2015 *

More information

Dell Precision CADCG Dell Precision if 2012 if2012 T7600T5600T36003 ISV 2

Dell Precision CADCG Dell Precision if 2012 if2012 T7600T5600T36003 ISV 2 Dell Precision T7600 T5600 T3600 T1650 M6700 M4700 R5500 www.dell.co.jp September / 2012 Dell Precision CADCG Dell Precision if 2012 if2012 T7600T5600T36003 ISV 2 Dell Precision CADCG Dell Precision Dell

More information

FileMaker Server Getting Started Guide

FileMaker Server Getting Started Guide FileMaker Server 11 2004-2010 FileMaker, Inc. All Rights Reserved. FileMaker, Inc. 5201 Patrick Henry Drive Santa Clara, California 95054 FileMaker FileMaker, Inc. FileMaker, Inc. FileMaker FileMaker,

More information

インテル® Parallel Studio XE 2019 Update 4 リリースノート

インテル® Parallel Studio XE 2019 Update 4 リリースノート インテル Parallel Studio XE 2019 2019 年 4 月 22 日 内容 1 概要... 2 2 製品の内容... 3 2.1 インテルが提供するデバッグ ソリューションの追加情報... 5 2.2 インテル Visual Fortran コンパイラー用 Microsoft* Visual Studio* Shell の追加情報... 5 2.3 インテル Software Manager...

More information

インテル® C++ コンパイラー 11.1 Mac OS* X 版プロフェッショナル・エディション インストール・ガイドおよびリリースノート

インテル® C++ コンパイラー 11.1 Mac OS* X 版プロフェッショナル・エディション インストール・ガイドおよびリリースノート C++ 11.1 Mac OS* X : 321413-002JA 2009 7 1... 3 1.1...3 1.2...3 1.3...3 1.4...3 1.5...3 2... 4 2.1...4 2.2 ( IPP)...5 2.3...5 2.4 /...5 3 C++... 5 3.1...6 3.2...6 3.2.1 O0 mp...6 3.3...6 3.3.1...6 3.3.2...6

More information

PowerPoint Presentation

PowerPoint Presentation インテル ソフトウェア開発製品によるソースコードの近代化 エクセルソフト株式会社黒澤一平 ソースコードの近代化 インテル Xeon Phi プロセッサーや 将来のインテル Xeon プロセッサー上での実行に向けた準備と適用 インテル ソフトウェア製品 名称インテル Composer XE for Fortran and C++ インテル VTune Amplifier XE インテル Advisor

More information

(Basic Theory of Information Processing) 1

(Basic Theory of Information Processing) 1 (Basic Theory of Information Processing) 1 10 (p.178) Java a[0] = 1; 1 a[4] = 7; i = 2; j = 8; a[i] = j; b[0][0] = 1; 2 b[2][3] = 10; b[i][j] = a[2] * 3; x = a[2]; a[2] = b[i][3] * x; 2 public class Array0

More information

MPI MPI MPI.NET C# MPI Version2

MPI MPI MPI.NET C# MPI Version2 MPI.NET C# 2 2009 2 27 MPI MPI MPI.NET C# MPI Version2 MPI (Message Passing Interface) MPI MPI Version 1 1994 1 1 1 1 ID MPI MPI_Send MPI_Recv if(rank == 0){ // 0 MPI_Send(); } else if(rank == 1){ // 1

More information

インテル(R) Xeon(R) プロセッサーおよびインテル(R) Pentium(R) 4 プロセッサーのパフォーマンス・カウンター

インテル(R) Xeon(R) プロセッサーおよびインテル(R) Pentium(R) 4 プロセッサーのパフォーマンス・カウンター Core Intel Intel Intel Itanium Pentium Xeon Intel Corporation 2007Intel Corporation. VTune 9.0 VTune 1 Randy Camp R&D MUSICMATCH Inc. Core 2 Duo Core 2 Quad Windows: Microsoft Vista* Linux: hotspot Windows*

More information

Excel97関数編

Excel97関数編 Excel97 SUM Microsoft Excel 97... 1... 1... 1... 2... 3... 3... 4... 5... 6... 6... 7 SUM... 8... 11 Microsoft Excel 97 AVERAGE MIN MAX SUM IF 2 RANK TODAY ROUND COUNT INT VLOOKUP 1/15 Excel A B C A B

More information

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日 TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日 目次 1. TSUBAMEのGPU 環境 2. プログラム作成 3. プログラム実行 4. 性能解析 デバッグ サンプルコードは /work0/gsic/seminars/gpu- 2011-09- 28 からコピー可能です 1.

More information

ViewSonic Corporation, Macintosh Power Macintosh Microsoft Windows Windows ViewSonic 3 OnView ViewMatch ViewMeter ViewSonic ViewSonic, ViewSonic

ViewSonic Corporation, Macintosh Power Macintosh Microsoft Windows Windows ViewSonic 3 OnView ViewMatch ViewMeter ViewSonic ViewSonic, ViewSonic PJ-PEN-003 IR VS15219 ViewSonic Corporation, 2013. Macintosh Power Macintosh Microsoft Windows Windows ViewSonic 3 OnView ViewMatch ViewMeter ViewSonic ViewSonic, ViewSonic ViewSonic i ViewSonic ViewSonic

More information

untitled

untitled Oracle Direct Seminar IT Agenda 1. Oracle RAC on Oracle VM 2. Oracle Database 11gR2 3. Oracle Exadata Oracle Direct Concierge SQL Server MySQL PostgreSQL Access

More information

07-二村幸孝・出口大輔.indd

07-二村幸孝・出口大輔.indd GPU Graphics Processing Units HPC High Performance Computing GPU GPGPU General-Purpose computation on GPU CPU GPU GPU *1 Intel Quad-Core Xeon E5472 3.0 GHz 2 6 MB L2 cache 1600 MHz FSB 80 GFlops 1 nvidia

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 応用数理概論 準備 端末上で cd ~/ mkdir cppwork cd cppwork wget http://271.jp/gairon/main.cpp wget http://271.jp/gairon/matrix.hpp とコマンドを記入. ls とコマンドをうち,main.cppとmatrix.hppがダウンロードされていることを確認. 1 準備 コンパイル c++ -I. -std=c++0x

More information

Myrinet2000 ご紹介

Myrinet2000 ご紹介 34 HPC -Myrinet- ES HPC http://www.sse.co.jp/myrinet/ Out Line Myrinet HPC 50 2 4 O.S. Computer Computer Computer Computer Computer Low-level Interconnection Network (transport & switching) 2-4 / / OS

More information

FileMaker Server 9 Getting Started Guide

FileMaker Server 9 Getting Started Guide FileMaker Server 10 2007-2009 FileMaker, Inc. All rights reserved. FileMaker, Inc. 5201 Patrick Henry Drive Santa Clara, California 95054 FileMaker Bento Bento FileMaker, Inc. Mac Mac Apple Inc. FileMaker

More information

統合汎用スーパーコンピュータシステムの設計状況と施設整備状況

統合汎用スーパーコンピュータシステムの設計状況と施設整備状況 81 200942 2142 1 A B / HPC Challenge Award 2009/4/2 1 1 2009/4/2 1 2 2009/4/2 1 3 11PB CPU 88,128 705,024 11.28PFLOPS 1.34PB 16MW 1,470 CPU 12,288 49,152 3.1PFLOPS 0.375PB 7MW 1,070 7.6PB 30PB 2MW 1000

More information

rzat10pdf.ps

rzat10pdf.ps IBM i 7.2 IBM Navigator for i IBM IBM i 7.2 IBM Navigator for i IBM 9 IBM i 7.2 ( 5770-SS1) RISC CISC IBM IBM i Version 7.2 Connecting to your system Connecting to IBM Navigator for i Copyright IBM Corporation

More information

The 3 key challenges in programming for MC

The 3 key challenges in programming for MC Aug 3 06 Software &Solutions group Intel Intel Centrino Intel NetBurst Intel XScale Itanium Pentium Xeon Intel Core VTune Intel Corporation Intel NetBurst Pentium Xeon Pentium M Core 64 2 Intel Software

More information

HP Workstation Xeon 5600

HP Workstation Xeon 5600 HP Workstation Xeon 5600 HP 2 No.1 HP 5 3 Z 2No.1 HP :IDC's Worldwide Quarterly Workstation Tracker, 2009 Q4 14.0in Wide HP EliteBook 8440w/CT Mobile Workstation 15.6in Wide HP EliteBook 8540w Mobile Workstation

More information

Copyright Oracle Parkway, Redwood City, CA U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated softw

Copyright Oracle Parkway, Redwood City, CA U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated softw Oracle Solaris Studio 12.3 Part No: E26466 2011 12 Copyright 2011 500 Oracle Parkway, Redwood City, CA 94065 U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated software,

More information

NEC All rights reserved 1

NEC All rights reserved 1 NEC All rights reserved 1 NEC All rights reserved 2 NEC All rights reserved 3 (Founder) (Langchao Langchao) NEC All rights reserved 4 2.1 GB/s 64 bits wide 266 MHz 4 MB L3 on board, 96k L2, 32k L1 on -die

More information

Xeon Phi MICROSOFT* WINDOWS* 1.4 1

Xeon Phi MICROSOFT* WINDOWS* 1.4 1 Xeon Phi MICROSOFT* WINDOWS* 1.4 1 Xeon Phi MICROSOFT* WINDOWS*... 4... 4 :... 4 :... 4... 4... 5 Xeon Phi... 5 ( MIC)... 7... 8... 8... 8... 12 Xeon Phi... 13 Xeon Phi... 13 Xeon Phi uos... 14... 18...

More information

MPI usage

MPI usage MPI (Version 0.99 2006 11 8 ) 1 1 MPI ( Message Passing Interface ) 1 1.1 MPI................................. 1 1.2............................... 2 1.2.1 MPI GATHER.......................... 2 1.2.2

More information

Code Modernization Online training plan

Code Modernization Online training plan Windows* 環境での MPI プログラムの作成と実行 2016 年 4 月 内容 必要要件と各ツール インストール コンパイルと実行 必要なツールと環境 プロセッサーと Windows* OS コンパイラーとリンカー MPI ライブラリー クラスター診断 / 最適化ツール プロセッサーと Windows* OS インテル 64 アーキテクチャー ベースのシステム 1 コアあたり 1GB のメモリーと

More information

OpenMP (1) 1, 12 1 UNIX (FUJITSU GP7000F model 900), 13 1 (COMPAQ GS320) FUJITSU VPP5000/64 1 (a) (b) 1: ( 1(a))

OpenMP (1) 1, 12 1 UNIX (FUJITSU GP7000F model 900), 13 1 (COMPAQ GS320) FUJITSU VPP5000/64 1 (a) (b) 1: ( 1(a)) OpenMP (1) 1, 12 1 UNIX (FUJITSU GP7000F model 900), 13 1 (COMPAQ GS320) FUJITSU VPP5000/64 1 (a) (b) 1: ( 1(a)) E-mail: {nanri,amano}@cc.kyushu-u.ac.jp 1 ( ) 1. VPP Fortran[6] HPF[3] VPP Fortran 2. MPI[5]

More information