インテル® Parallel Studio XE 2013 入門ガイド

Size: px
Start display at page:

Download "インテル® Parallel Studio XE 2013 入門ガイド"

Transcription

1 Parallel Studio XE 2013 エクセルソフト 株 式 会 社 Rev. 1.0 (2012/10/30) 1 / 59

2 ... 4 Parallel Studio XE Composer XE... 9 Advisor XE Composer XE Composer XE Inspector XE Composer XE VTune Amplifier XE VTune Amplifier XE Composer XE Inspector XE vs Tips VTune Amplifier XE CPI / 59

3 N-Queens OpenMP Intel Cilk Plus Intel TBB / 59

4 Parallel Studio XE 2013 C++ Parallel Studio XE 2013 Parallel Studio XE 2013 Microsoft* Visual Studio* 4 Advisor XE 2013 Composer XE 2013 Composer XE 2013 C IA-32 Intel 64 Fortran 13.0 IA-32 Intel IPP 11.0 MKL 4.1 TBB Inspector XE 2013 VTune Amplifier XE 2013 CPU 4 / 59

5 Visual Studio Composer XE VS2008 Advisor XE VTune Amplifier XE Inspector XE 4 Advisor XE Composer XE Inspector XE VTune Amplifier XE Intel(R) Core(TM) i CPU 3.4GHz Sandy Bridge 8 OS Microsoft Windows 7 Professional (x64) IDE Microsoft Visual Studio 2010 Professional VS / 59

6 Advisor XE Composer XE Inspector XE VTune Amplifier XE Advisor XE Advisor XE Composer XE Inspector XE VTune Amplifier XE 6 / 59

7 Advisor XE N-Queens N-Queens Zip C: Program Files (x86) Intel Advisor XE 2013 samples en C++ nqueens_advisor.zip Zip Zip 1_nqueens_serial nqueens_advisor 1_nqueens_serial nqueens_serial.cpp N-Queens Queen Queen Queen Queen N-Queens Advisor XE N-Queens N-Queens 1_nqueens_serial nqueens_serial.cpp main() N N 14 main() N-Queens solve() timegettime() solve() setqueen() N i Queen 0 i setqueen() setqueen() Queen setqueen() nrofsolutions 7 / 59

8 int main(int argc, char*argv[]) { if(argc!=2) { cerr << "Usage: 1_nqueens_serial.exe boardsize [default is 14]. n"; size = 14; // チェスボードのデフォルトサイズ else { size = atoi(argv[1]); if (size < 4 size > 15) { cerr << "Boardsize should be between 4 and 15; setting it to 14. n" << endl; size = 14; // チェスボードのデフォルトサイズ ( 中 略 ) DWORD starttime=timegettime(); solve(); // N-Queens 問 題 を 解 く 関 数 をコール DWORD endtime=timegettime(); ( 中 略 ) return 0; void solve() { int * queens = new int[size]; for(int i=0; i<size; i++) { setqueen(queens, 0, i); // 計 算 エンジン 関 数 をNマス 回 コール void setqueen(int queens[], int row, int col) { //check all previously placed rows for attacks for(int i=0; i<row; i++) { // vertical attacks if (queens[i]==col) { return; // diagonal attacks if (abs(queens[i]-col) == (row-i) ) { return; // column is ok, set the queen queens[row]=col; if(row==size-1) { nrofsolutions++; //N-Queens 問 題 の 解 答 を 格 納 else { // try to fill next row for(int i=0; i<size; i++) { setqueen(queens, row+1, i); // 次 の 行 を 計 算 する 再 帰 関 数 8 / 59

9 Composer XE VS2010 C++ 1. nqueens_advisor.zip 2. nqueens_advisor.sln VS C++ 1_nqueens_serial [ ] [ (R) Composer XE 2013] [ (R) C++ ] 9 / 59

10 4. Release 5. [ ] [ ] / 59

11 Advisor XE Advisor XE Advisor XE Advisor XE Workflow Survey Target Hotspot Hotspot Annotate Sources Advisor XE Check Suitability Check Correctness Add Parallel Framework Survey Target Survey Report Hotspot Top Loops Total Time 11 / 59

12 Summary Top Loops solve nqueens_serial.cpp / 59

13 solve solve void solve() { int * queens = new int[size]; //ANNOTATE_SITE_BEGIN(solve); このコメントを 外 す for(int i=0; i<size; i++) { // try all positions in first row //ANNOTATE_ITERATION_TASK(setQueen); このコメントを 外 す setqueen(queens, 0, i); //ANNOTATE_SITE_END(); このコメントを 外 す ANNOTATE_SITE_BEGIN ANNOTATE_SITE_END setqueen ANNOTATE_ITERATION_TASK Check Suitability setqueen size advisor-annotate.h nqueens_serial.cpp //#include <advisor-annotate.h> 13 / 59

14 $(ADVISOR_XE_2013_DIR)/include Check Suitability Suitability Report Suitability Report All Sites Selected Site All Sites All Sites Selected Site 14 / 59

15 Check Correctness Check Correctness Debug Debug 8 Check Correctness 15 / 59

16 Correctness Report Problems and Messages P2 Data Communication P3 Memory reuse 2 Summary 16 / 59

17 Composer XE Composer XE Win 32 API OpenMP 3.1 Cilk Plus Threading Building Blocks TBB Win 32 API CreateThread _beginthread Win 32 API OpenMP OpenMP #pragma omp Win 32 API OpenMP OpenMP #pragma #pragma OS OpenMP Fork-Join Cilk Plus C++ Cilk Plus cilk_spawn cilk_sync cilk_for 17 / 59

18 TBB C++ TBB STL TBB TBB OpenMP C++ solve OpenMP OpenMP OpenMP #pragma omp parallel { printf printf OS for #pragma omp for For( i=0; i<n; i++ ) // 0 N { Advisor XE void solve() { int * queens = new int[size]; #pragma omp parallel for for(int i=0; i<size; i++) { // try all positions in first row setqueen(queens, 0, i); 18 / 59

19 OpenMP for size setqueen size 14 i= Intel(R) Core(TM) i i= setqueen solve() int * queens = new int[size]; #pragma omp parallel for Fork <スレッド0> setqueen(queens,0,0) setqueen(queens,0,1) <スレッド1> setqueen(queens,0,2) setqueen(queens,0,3) <スレッド2> setqueen(queens,0,4) setqueen(queens,0,5) <スレッド7> setqueen(queens,0,13) Join #pragma omp parallel for for Release OpenMP #pragma omp C++ /Qopenmp 1_nqueens_serial OpenMP 19 / 59

20 N-Queens Advisor XE Check Correctness Composer XE Inspector XE 20 / 59

21 Composer XE Composer XE OpenMP* Intel Cilk Plus Inspector XE GUI 1. 1_nqueens_serial [ ] 2. Release 21 / 59

22 2 Critical Error Warning Critical Error Warning Critical Error Warning False Positive False Negative [OK] Inspector XE Critical 1 Warning 1 2 Problems Weight nrofsolutions solve() 22 / 59

23 Complexity Metrics Cyclomatic complexity Intel_SSA 23 / 59

24 Inspector XE Inspector XE Inspector XE Inspector XE Debug Inspector XE Inspector XE Debug [C/C++] [ (R) C++] [OpenMP ] /Qopenmp [ ] - [ ] [ ] 8 Inspector XE New Analysis Configure Analysis Type Threading Error Analysis 3 Locate Deadlocks and Data Races Stack frame depth Scope Normal Extremely Thorough 24 / 59

25 [Start] Summary Summary Problems Data race 2 P1 P2 Problems P1 queens queens Write Timeline P2 nrofsolutions 25 / 59

26 Inspector XE queens nrofsolutions 26 / 59

27 Composer XE queens nrofsolutions OpenMP OpenMP queens nrofsolutions int nrofsolutions=0; void solve() { int * queens = new int[size]; #pragma omp parallel for for(int i=0; i<size; i++) { // try all positions in first row setqueen(queens, 0, i); A nrofsolutions OpenMP queens solve OpenMP B void setqueen(int queens[], int row, int col) { // column is ok, set the queen queens[row]=col; void setqueen(int queens[], int row, int col) { // column is ok, set the queen queens[row]=col; if(row==size-1) { nrofsolutions++; if(row==size-1) { nrofsolutions++; queens setqueen() Queen solve() setqueen() setqueen() queens solve() for queens setqueen nrofsolutions setqueen() Queen 27 / 59

28 nrofsolutions++ OpenMP critical nrofsolutions++ int nrofsolutions=0; void solve() { //int * queens = new int[size]; #pragma omp parallel for for(int i=0; i<size; i++) { int * queens = new int[size]; // try all positions in first row setqueen(queens, 0, i); void setqueen(int queens[], int row, int col) { // column is ok, set the queen queens[row]=col; nrofsolutions if(row==size-1) { #pragma omp critical nrofsolutions++; //N-Queens 問 題 の 解 答 を 格 納 else { // try to fill next row for(int i=0; i<size; i++) { setqueen(queens, row+1, i); solve() setqueen() queens setqueen() 28 / 59

29 solve() #pragma omp parallel for Fork <スレッド0> {int * queens = new []; setqueen(queens,0,0) <スレッド1> {int * queens = new []; setqueen(queens,0,2) <スレッド2> {int * queens = new []; setqueen(queens,0,4) <スレッド7> {int * queens = new []; setqueen(queens,0,13) {int * queens = new []; setqueen(queens,0,1) {int * queens = new []; setqueen(queens,0,3) {int * queens = new []; setqueen(queens,0,5) Join Debug Inspector XE Release [ ] [C/C++] [Language] - [OpenMP Support] /Qopenmp VTune AmplifierXE 29 / 59

30 VTune Amplifier XE CPU Release VTune Amplifier XE VTune Amplifier XE [New Analysis] [Analysis Type] [Analysis Type] [Concurrency] [Start] [Summary] Histogram Thread Concurrency Histogram Ideal Poor CPU Usage Histogram CPU CPU Ideal Poor 30 / 59

31 CPU [Bottom-up] [Bottom-up] 3 Hotspot CPU setqueen Hotspot CPU Poor Transitions Transition CPU Time CPU CPU Usage Thread Concurrency CPU [Summary] CPU 31 / 59

32 CPU Time [Zoom In on Selection] 1ms Running Waits Transitions ON 32 / 59

33 [Grouping] Function / Thread / Call Stack setqueen setqueen CPU CPU [Locks and Waits] [Bottom-up] Grouping Sync Object / Function / Call Stack 33 / 59

34 Sync Object OMP Critical setqueen:# Object OpenMP 34 / 59

35 ID solve() setqueen() #include <iostream> #include <windows.h> #include <mmsystem.h> #include "omp.h" // OpenMP 関 数 を 使 用 するためのヘッダー using namespace std; int solcnt[32]; // スレッド 単 位 の 解 答 を 格 納 する 配 列 ( 最 大 32スレッド) void solve() { int thrd_max = omp_get_max_threads(); #pragma omp parallel { int thrd_id = omp_get_thread_num(); #pragma omp for for(int i=0; i<size; i++) { int * queens = new int[size]; // try all positions in first row setqueen(queens, 0, i, thrd_id); // 利 用 可 能 なスレッド 数 の 最 大 値 の 取 得 // 本 関 数 を 実 行 するスレッドIDの 取 得 // スレッドID を 引 数 に 追 加 // pragma omp parallel(join) for(int i=0; i<thrd_max; i++) { nrofsolutions += solcnt[i] ; // スレッド 単 位 での 結 果 の 合 計 が 解 答 void setqueen(int queens[], int row, int col, int thrd_id) { // スレッドIDを 引 数 に 追 加 // column is ok, set the queen queens[row]=col; if(row==size-1) { solcnt[thrd_id]++; // スレッド 単 位 に 独 立 した 変 数 ( 同 期 処 理 不 要 ) else { // try to fill next row for(int i=0; i<size; i++) { setqueen(queens, row+1, i, thrd_id); // スレッドIDを 引 数 に 追 加 35 / 59

36 void solve( void ) int thrd_max = omp_get_max_threads(); // 8 #pragma omp parallel Fork thrd_id ( 0 ) = omp_get_thread_num(); thrd_id ( 1 ) = omp_get_thread_num(); thrd_id ( 6 ) = omp_get_thread_num(); thrd_id ( 7 ) = omp_get_thread_num(); #pragma omp for setqueen(queens,0,0, thrd_id(=0)) setqueen(queens,0,1 thrd_id(=0)) setqueen(queens,0,2, thrd_id(=1)) setqueen(queens,0,3 thrd_id(=1)) setqueen(queens,0,12, thrd_id(=6)) setqueen(queens,0,13, thrd_id(=7)) setqueen( ) { setqueen( ) { setqueen( ) { setqueen( ) { // solcnt[thrd_id(=0)]++; // solcnt[thrd_id(=1)]++; // solcnt[thrd_id(=6)]++; // solcnt[thrd_id(=7)]++; Join for(int i=0; i<thrd_max; i++) { nrofsolutions += solcnt[i] ; // Release VTune Amplifier XE setqueen() 36 / 59

37 VTune Amplifier XE CPU CPU CPU VTune Amplifier XE EBS PMU CPU CPU CPU L1 / L2 / LLC ITLB / DTLB FP / MMX / SIMD / LOAD / STORE OP CPU VTune Amplifier XE EBS CPU CPU CPU / 59

38 CPU Intel(R) Core(TM) i Sandy Bridge Sandy Bridge [Analysis Type] [Sandy Bridge Analysis] [Access Contention] 6 MEM_LOAD_UOPS_LLC_HIT_RETIRED.XSNP_HITM_PS [Start] [PMU Events] setqueen queens col solcnt 2 38 / 59

39 queens cmp EBS queens mov 39 / 59

40 queens solcnt solcnt inc solcnt queens solve() OpenMP for (size(int) * 14) _mm_malloc _mm_free solcnt int queens solcnt 64 queens 0x00 0x40 0x80 solcnt 40 / 59

41 #include <iostream> #include <windows.h> #include <mmsystem.h> #include "omp.h" using namespace std; //int solcnt[32]; // コメントアウト(キャッシュラインの 共 有 を 避 ける) declspec(align(64)) int solcnt[32][16]; // 64バイトの 要 素 間 隔 と64バイト 境 界 で 宣 言 void solve() { int thrd_max = omp_get_max_threads(); #pragma omp parallel { int thrd_id = omp_get_thread_num(); #pragma omp for for(int i=0; i<size; i++) { //int * queens = new int[size]; // コメントアウト int * queens = (int *) _mm_malloc(sizeof(int)*size, 64); // try all positions in first row setqueen(queens, 0, i, thrd_id); _mm_free(queens); // メモリー 解 放 // 64バイト 境 界 for(int i=0; i<thrd_max; i++) { nrofsolutions += solcnt[i][0] ; // 解 答 ( 配 列 宣 言 に 合 わせて 変 更 ) void setqueen(int queens[], int row, int col, int thrd_id) { // column is ok, set the queen queens[row]=col; if(row==size-1) { solcnt[thrd_id][0]++; // キャッシュラインの 共 有 を 避 ける else { // try to fill next row for(int i=0; i<size; i++) { setqueen(queens, row+1, i, thrd_id); VTune Amplifier XE EBS CPU 41 / 59

42 Composer XE /O3 IDE [C/C++] [ ] [ ] /O2 /O2 > icl /O3 main.cpp IPO /Qipo IDE [C/C++] [ [ (R) C++]] [ ] Release /Qx{SSE2 SSE3 SSSE3 SSE4.1 SSE4.2 AVX CORE-AVX2 CORE-AVX-I Host IDE [C/C++] [ [ (R) C++]] [ ] SSE SSE AVX AVX CPU > icl /O2 /QxAVX main.cpp AVX2 AVX2 CPU > icl /O2 /QxCORE-AVX2 main.cpp /QxHost Host SSE main.exe > icl /O2 /QxHost main.cpp 42 / 59

43 /Qax{SSE2 SSE3 SSSE3 SSE4.1 SSE4.2 AVX CORE-AVX2 CORE-AVX-I IDE [C/C++] [ [ (R) C++]] [ ] SSE2 /Qx AVX SSE2 > icl /O2 /QaxAVX main.cpp AVX SSE4.2 > icl /O2 /QaxAVX /QxSSE4.2 main.cpp SSE4.2 IA-32 x86/x87 > icl /O2 /QaxSSE4.2 /arch:ia32 main.cpp /arch:{sse2 SSE3 SSSE3 SSE4.1 SSE4.2 AVX IA-32 IDE [C/C++] [ ] [ ] CPU SSE2 /O2 Release > icl /O2 /arch:sse2 main.cpp /Qparallel IDE [C/C++] [ [ (R) C++]] [ ] > icl /Qparallel main.cpp /Qpar-threshold[n] (n = 0 100) IDE [C/C++] [ ] [ ] 100 > icl /Qparallel /Qpar-threshold:90 main.cpp 43 / 59

44 OpenMP /Qopenmp IDE [C/C++] [ [ (R) C++]] [OpenMP ] OpenMP #pragma omp OpenMP libiomp5md.dll > icl /Qopenmp main-omp.cpp /Qopenmp-stubs IDE [C/C++] [ [ (R) C++]] [OpenMP ] OpenMP OpenMP OpenMP > icl /Qopenmp-stubs main-omp.cpp /Qopt-report{0-3 IDE [C/C++] [ [ (R) C++]] [ ] 0 3 > icl /O3 /Qipo /Qopt-report2 main.cpp /Qvec-report{0-6 IDE [C/C++] [ [ (R) C++]] [ ] /Qpar-report{ > icl /O2 /QxAVX /Qvec-report3 main.cpp > icl /O2/Qvec-report2 main.cpp ( /arch:sse2) IDE [C/C++] [ ] [ ] /Qopenmp-report{0-2 IDE [C/C++] [ ] [ ] 0 3 > icl /Qparallel /Qpar-report3 main.cpp OpenMP 0 2 > icl /Qopenmp /Qopenmp-report2 main-omp.cpp < > Composer XE 2013 Documentation en_us ssadiag_docs problem_type_reference.chm 44 / 59

45 Inspector XE Inspector XE Analysis Type Memory Error Analysis Start [Explain Problem] 45 / 59

46 Inspector XE Intel Inspector XE Problem Type Reference Cross-thread Stack Access Data Race Deadlock GDI Resource Leak GDI Incorrect memcpy Call memcpy Linux Invalid Deallocation Invalid Memory Access Invalid Partial Memory Access Kernel Resource Leak Lock Hierarchy Violation Memory Growth Memory Leak Memory Not Deallocated Mismatched Allocation/Deallocation Missing Allocation Thread Start Information Unhandled Application Exception Uninitialized Memory Access Uninitialized Partial Memory Access Inspector XE 3 46 / 59

47 [Debug This Problem] Analysis Type [Enable debugger when problem detected] Analysis Type [Select analysis start location with debugger] Visual Studio [ ] [Continue With Intel Inspector XE Analysis] 47 / 59

48 [Problem Details] [Disable Breakpoint] [Re-enable Breakpoints] Inspector XE Advanced Modules: [Modify ] Include only the following module(s) Exclude the following module(s) 48 / 59

49 Inspector XE Inspector XE Advanced Enable Collection progress information Show details 49 / 59

50 Inspector XE /Zi /ZI /debug /Od Release /MDd /MD /RTC[su1] Inspector XE false positives false negatives Inspector XE vs. Parallel Studio XE Inspector XE 50 / 59

51 Tips Visual Studio [ ] [ ] Collection Log window Inspector XE [Application Output] Summary Create Problem Report 51 / 59

52 VTune Amplifier XE VTune Amplifier XE 10ms 5% 3 Hotspots CPU Concurrency Lock and Waits PMU PMU Sample After Value 1ms 2% PMU Core Microarchitecture Hotspots Concurrency Locks and Waits PMU 52 / 59

53 CPI Lightweight Hotspots CPI CPI Clockticks per Instructions Retired CPU CPU CPI CPI = CPU Core Microarchitecture 1 CPI 0.25 = / CPI 0.25 VTune Amplifier XE CPI 1.00 CPU 5% multiply2 CPI CPI Lightweight Hotspots CPU_CLK_UNHALTED.THREAD CPU INST_RETIRED.ANY CPI CPU_CLK_UNHALTED.THREAD INST_RETIRED.ANY CPI CPI CPU CPU_CLK_UNHALTED.THREAD 53 / 59

54 VTune Amplifier XE /Zi /debug /O2 Release /MD /MDd C TBB /D"TBB_USE_THREADING_TOOLS" /debug:inline-debug-info /Ob0 VTune Amplifier XE TBB VTune Amplifier XE inline mode VTune Amplifier XE Hotspot CPU Hotspot Pause Resume VTune Amplifier XE API [Start] [Start Paused] [Resume] 54 / 59

55 API VTune Amplifier XE Resume itt_resume Pause itt_pause Resume Pause API #include ittnotify.h Func() { // API // itt_resume(); A itt_pause(); itt_resume(); B itt_pause(); // // // // // // // // ittnotify.h x86 C: Program Files Intel VTune Amplifier XE 2013 include x64 C: Program Files (x86) Intel VTune Amplifier XE 2013 include 55 / 59

56 x86 C: Program Files Intel VTune Amplifier XE 2013 lib32 x64 C: Program Files (x86) Intel VTune Amplifier XE 2013 lib32 Intel64 lib32 lib64 libittnotify.lib [Start Paused] Resume Pause Resume 56 / 59

57 Windows Visual Studio [ ] Visual Studio* IDE [ ] F1 57 / 59

58 N-Queens N-Queens 1_nqeens_serial OpenMP N-Queens N-Queens OpenMP 3.0 Intel Cilk Plus Intel TBB OpenMP OpenMP OpenMP* OpenMP* C Fortran OpenMP Intel Cilk Plus Intel Cilk Plus Intel Cilk Plus Intel TBB TBB TBB TBB / 59

59 / 59

インテル® Parallel Studio 入門ガイド

インテル® Parallel Studio 入門ガイド Parallel Studio エクセルソフト株式会社 www.xlsoft.com Rev. 1.1 (2010/04/08) 1 / 48 ... 3 Parallel Studio... 3... 4... 5... 6 Parallel Composer... 8 Parallel Amplifier... 12 Parallel Composer... 16 Parallel Composer...

More information

インテル(R) C++ Composer XE 2011 Windows版 入門ガイド

インテル(R) C++ Composer XE 2011 Windows版 入門ガイド C++ Composer XE 2011 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.2 (2011/05/03) Copyright 1998-2011 XLsoft Corporation. All Rights Reserved. 1 / 70 ... 4... 5... 6... 8 /... 8... 10 /... 11... 11 /... 13

More information

インテル(R) Visual Fortran Composer XE 2011 Windows版 入門ガイド

インテル(R) Visual Fortran Composer XE 2011 Windows版 入門ガイド Visual Fortran Composer XE 2011 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.0 (2010/12/20) Copyright 1998-2011 XLsoft Corporation. All Rights Reserved. 1 / 36 ... 3... 4... 5... 7 /... 7... 9 /... 9...

More information

インテル(R) Visual Fortran Composer XE 2013 Windows版 入門ガイド

インテル(R) Visual Fortran Composer XE 2013 Windows版 入門ガイド Visual Fortran Composer XE 2013 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.1 (2012/12/10) Copyright 1998-2013 XLsoft Corporation. All Rights Reserved. 1 / 53 ... 3... 4... 4... 5 Visual Studio... 9...

More information

インテル(R) Visual Fortran Composer XE

インテル(R) Visual Fortran Composer XE Visual Fortran Composer XE 1. 2. 3. 4. 5. Visual Studio 6. Visual Studio 7. 8. Compaq Visual Fortran 9. Visual Studio 10. 2 https://registrationcenter.intel.com/regcenter/ w_fcompxe_all_jp_2013_sp1.1.139.exe

More information

2. 目次 1. 目次 はじめに マルチスレッド化の最適化チュートリアル... 5 Visual Studio にサンプルプログラムのプロジェクトをロードする... 6 インテル コンパイラーを使用してソースコードをビルドする... 7 Visual Studio か

2. 目次 1. 目次 はじめに マルチスレッド化の最適化チュートリアル... 5 Visual Studio にサンプルプログラムのプロジェクトをロードする... 6 インテル コンパイラーを使用してソースコードをビルドする... 7 Visual Studio か インテル Parallel Studio XE 2017 Professional Edition エクセルソフト株式会社 www.xlsoft.com Rev 1.0.0 2. 目次 1. 目次... 2 2. はじめに... 4 3. マルチスレッド化の最適化チュートリアル... 5 Visual Studio にサンプルプログラムのプロジェクトをロードする... 6 インテル コンパイラーを使用してソースコードをビルドする...

More information

Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx

Intel_ParallelStudioXE2013_ClusterStudioXE2013_Introduction.pptx Parallel Studio XE 2013 Cluster Studio XE 2013 ) ( Intel s Terms and Conditions of Sale Sandy Bridge SYSmark MobileMark http://www.intel.com/performance/ Intel Intel Intel Atom Intel Core Intel Xeon Phi

More information

hotspot の特定と最適化

hotspot の特定と最適化 1 1? 1 1 2 1. hotspot : hotspot hotspot Parallel Amplifier 1? 2. hotspot : (1 ) Parallel Composer 1 Microsoft* Ticker Tape Smoke 1.0 PiSolver 66 / 64 / 2.76 ** 84 / 27% ** 75 / 17% ** 1.46 89% Microsoft*

More information

01_OpenMP_osx.indd

01_OpenMP_osx.indd OpenMP* / 1 1... 2 2... 3 3... 5 4... 7 5... 9 5.1... 9 5.2 OpenMP* API... 13 6... 17 7... 19 / 4 1 2 C/C++ OpenMP* 3 Fortran OpenMP* 4 PC 1 1 9.0 Linux* Windows* Xeon Itanium OS 1 2 2 WEB OS OS OS 1 OS

More information

Intel® Compilers Professional Editions

Intel® Compilers Professional Editions 2007 6 10.0 * 10.0 6 5 Software &Solutions group 10.0 (SV) C++ Fortran OpenMP* OpenMP API / : 200 C/C++ Fortran : OpenMP : : : $ cat -n main.cpp 1 #include 2 int foo(const char *); 3 int main()

More information

v10 IA-32 64¹ IA-64²

v10 IA-32 64¹ IA-64² v10 IA-32 64¹ IA-64² 1. 2. 3. 4. 5. 6. /Od (-O0) Windows* /O1 /O2 /O3 Linux* Mac OS* -O1 -O2 -O3 /O2 ( O2) /O3 (-O3) IA-64 Core 2 /QxT ( xt) IA-32 64 IA-32 64 Itanium 2 9000 /G2-p9000 ( mtune=itanium2-p9000)

More information

製品価格 ( 新規購入 ) INT6531 インテル VTune Amplifier XE 2017 for Windows Floating 1-275, ,000 INT6532 インテル VTune Amplifier XE 2017 for Linux Floating 1-27

製品価格 ( 新規購入 ) INT6531 インテル VTune Amplifier XE 2017 for Windows Floating 1-275, ,000 INT6532 インテル VTune Amplifier XE 2017 for Linux Floating 1-27 製品価格 ( 新規購入 ) INT6499 インテル Parallel Studio XE 2017 Cluster Edition for Windows Floating 2- INT6500 インテル Parallel Studio XE 2017 Cluster Edition for Windows Floating 5-2,478,000 2,676,240 INT6501 インテル Parallel

More information

02_C-C++_osx.indd

02_C-C++_osx.indd C/C++ OpenMP* / 2 C/C++ OpenMP* OpenMP* 9.0 1... 2 2... 3 3OpenMP*... 5 3.1... 5 3.2 OpenMP*... 6 3.3 OpenMP*... 8 4OpenMP*... 9 4.1... 9 4.2 OpenMP*... 9 4.3 OpenMP*... 10 4.4... 10 5OpenMP*... 11 5.1

More information

THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHug

THE PARALLEL Issue UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHug THE PARALLEL Issue 5 2010 11 UNIVERSE James Reinders Parallel Building Blocks: David Sekowski Parallel Studio XE Cluster Studio Sanjay Goil John McHugh JAMES REINDERS 3 Parallel Studio XE Cluster Studio

More information

Microsoft Word - w_mkl_build_howto.doc

Microsoft Word - w_mkl_build_howto.doc MKL 10.0 2007/12/18 XLsoft - 2 - 1....- 4-2. MKL...- 4-3....- 5-3-1....- 5-3-1-1. Microsoft Visual C++ 2005...- 5-3-1-2. C/C++...- 9-3-1-3. Fortran...- 11-3-2. Microsoft Visual Studio...- 13-3-2-1. Microsoft

More information

64bit SSE2 SSE2 FPU Visual C++ 64bit Inline Assembler 4 FPU SSE2 4.1 FPU Control Word FPU 16bit R R R IC RC(2) PC(2) R R PM UM OM ZM DM IM R: reserved

64bit SSE2 SSE2 FPU Visual C++ 64bit Inline Assembler 4 FPU SSE2 4.1 FPU Control Word FPU 16bit R R R IC RC(2) PC(2) R R PM UM OM ZM DM IM R: reserved (Version: 2013/5/16) Intel CPU (kashi@waseda.jp) 1 Intel CPU( AMD CPU) 64bit SIMD Inline Assemler Windows Visual C++ Linux gcc 2 FPU SSE2 Intel CPU double 8087 FPU (floating point number processing unit)

More information

Microsoft Word - Meta70_Preferences.doc

Microsoft Word - Meta70_Preferences.doc Image Windows Preferences Edit, Preferences MetaMorph, MetaVue Image Windows Preferences Edit, Preferences Image Windows Preferences 1. Windows Image Placement: Acquire Overlay at Top Left Corner: 1 Acquire

More information

Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for

Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for embedded systems that use microcontrollers (MCUs)

More information

インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster

インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ 製品型番 アカデミック版特定ユーザーライセンス 税別標準価格 税込標準価格 INT5744 インテル Parallel Studio XE 2016 Cluster インテルソウトウェア開発製品アカデミック版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2016 年 5 月 10 日 ~ アカデミック版特定ユーザーライセンス INT5744 インテル Parallel Studio XE 2016 Cluster Edition 273,000 for 294 Win INT5745 インテル Parallel Studio XE 2016 Cluster

More information

64bit SSE2 SSE2 FPU Visual C++ 64bit Inline Assembler 4 FPU SSE2 4.1 FPU Control Word FPU 16bit R R R IC RC(2) PC(2) R R PM UM OM ZM DM IM R: reserved

64bit SSE2 SSE2 FPU Visual C++ 64bit Inline Assembler 4 FPU SSE2 4.1 FPU Control Word FPU 16bit R R R IC RC(2) PC(2) R R PM UM OM ZM DM IM R: reserved (Version: 2013/7/10) Intel CPU (kashi@waseda.jp) 1 Intel CPU( AMD CPU) 64bit SIMD Inline Assemler Windows Visual C++ Linux gcc 2 FPU SSE2 Intel CPU double 8087 FPU (floating point number processing unit)

More information

Click to edit title

Click to  edit title インテル VTune Amplifier 2018 を 使用した最適化手法 ( 初級編 ) 久保寺 陽子 内容 アプリケーション最適化のプロセス インテル VTune Amplifier の紹介 インテル VTune Amplifier の新機能 インテル VTune Amplifier を用いた最適化例 (1) インテル VTune Amplifier を用いた最適化例 (2) まとめ 2 インテル

More information

DPD Software Development Products Overview

DPD Software Development Products Overview 2 2007 Intel Corporation. Core 2 Core 2 Duo 2006/07/27 Core 2 precise VTune Core 2 Quad 2006/11/14 VTune Core 2 ( ) 1 David Levinthal 3 2007 Intel Corporation. PC Core 2 Extreme QX6800 2.93GHz, 1066MHz

More information

連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa

連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa 連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 16 1.1 問題の定義 16 1.2 αβ 法 16 2 αβ 法の並列化 17 2.1 概要 17 2.2 Young Brothers Wait Concept 17 2.3 段数による逐次化 18 2.4 適応的な待機 18 2. 強制終了

More information

r07.dvi

r07.dvi 19 7 ( ) 2019.4.20 1 1.1 (data structure ( (dynamic data structure 1 malloc C free C (garbage collection GC C GC(conservative GC 2 1.2 data next p 3 5 7 9 p 3 5 7 9 p 3 5 7 9 1 1: (single linked list 1

More information

ohp07.dvi

ohp07.dvi 19 7 ( ) 2019.4.20 1 (data structure) ( ) (dynamic data structure) 1 malloc C free 1 (static data structure) 2 (2) C (garbage collection GC) C GC(conservative GC) 2 2 conservative GC 3 data next p 3 5

More information

fx-9860G Manager PLUS_J

fx-9860G Manager PLUS_J fx-9860g J fx-9860g Manager PLUS http://edu.casio.jp k 1 k III 2 3 1. 2. 4 3. 4. 5 1. 2. 3. 4. 5. 1. 6 7 k 8 k 9 k 10 k 11 k k k 12 k k k 1 2 3 4 5 6 1 2 3 4 5 6 13 k 1 2 3 1 2 3 1 2 3 1 2 3 14 k a j.+-(),m1

More information

HA8000シリーズ ユーザーズガイド ~BIOS編~ HA8000/RS110/TS10 2013年6月~モデル

HA8000シリーズ ユーザーズガイド ~BIOS編~ HA8000/RS110/TS10 2013年6月~モデル P1E1M01500-3 - - - LSI MegaRAID SAS-MFI BIOS Version x.xx.xx (Build xxxx xx, xxxx) Copyright (c) xxxx LSI Corporation HA -0 (Bus xx Dev

More information

(Version: 2017/4/18) Intel CPU 1 Intel CPU( AMD CPU) 64bit SIMD Inline Assemler Windows Visual C++ Linux gcc 2 FPU SSE2 Intel CPU do

(Version: 2017/4/18) Intel CPU 1 Intel CPU( AMD CPU) 64bit SIMD Inline Assemler Windows Visual C++ Linux gcc 2 FPU SSE2 Intel CPU do (Version: 2017/4/18) Intel CPU (kashi@waseda.jp) 1 Intel CPU( AMD CPU) 64bit SIMD Inline Assemler Windows Visual C++ Linux gcc 2 FPU SSE2 Intel CPU double 8087 FPU (floating point number processing unit)

More information

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2 FFT 1 Fourier fast Fourier transform FFT FFT FFT 1 FFT FFT 2 Fourier 2.1 Fourier FFT Fourier discrete Fourier transform DFT DFT n 1 y k = j=0 x j ω jk n, 0 k n 1 (1) x j y k ω n = e 2πi/n i = 1 (1) n DFT

More information

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現

スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現 はじめに 本ガイドは インテル Parallel Studio XE を使用してアプリケーション中の hotspot ( 多くの時間を費やしているコード領域 ) を見つけ それらの領域を再コンパイルすることでアプリケーション全体のパフォーマンスを向上する方法について説明します 1 つのファイルを再コンパイルするだけで違いが出るのでしょうか? はい 多くの場合 インテル Parallel Studio

More information

C

C C 1 2 1.1........................... 2 1.2........................ 2 1.3 make................................................ 3 1.4....................................... 5 1.4.1 strip................................................

More information

インテル® VTune™ パフォーマンス・アナライザー 9.1 Windows* 版

インテル® VTune™ パフォーマンス・アナライザー 9.1 Windows* 版 VTune 9.1 Windows* ................................. 3...................... 3.................................................. 3............................................ 4 :.........................4................................................

More information

インテル® VTune™ Amplifier : Windows 環境向けスタートガイド

インテル® VTune™ Amplifier : Windows 環境向けスタートガイド インテル VTune Amplifier Windows 環境向けスタートガイド エクセルソフト株式会社 Version 1.0.0-20180829 目次 1. インテル VTune Amplifier の使用.......................................................... 1 2. インテル VTune Amplifier の基本..........................................................

More information

Quickstart Guide 3rd Edition

Quickstart Guide 3rd Edition 10 QNX QNX 1 2 3 4 5 QNX Momentics QNX Neutrino RTOS QNX Neutrino 6 7 8 QNX Neutrino 9 10 1 1 QNX Neutrino RTOS QNX Momentics Windows Vista Windows 2000 Windows XP Linux QNX Neutrino QNX Momentics CD http://www.qnx.co.jp/

More information

Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool

Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool for developing software for embedded systems that

More information

Nios® II HAL API を使用したソフトウェア・サンプル集 「Modular Scatter-Gather DMA Core」

Nios® II HAL API を使用したソフトウェア・サンプル集 「Modular Scatter-Gather DMA Core」 ALTIMA Company, MACNICA, Inc Nios II HAL API Modular Scatter-Gather DMA Core Ver.17.1 2018 8 Rev.1 Nios II HAL API Modular Scatter-Gather DMA Core...3...3...4... 4... 5 3-2-1. msgdma... 6 3-2-2. On-Chip

More information

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co 072 DB Magazine 2007 September ~~~~~~~~~~~~~~~~~~ wait Call CPU time 1,055 34.7 latch: library cache 7,278 750 103 24.7 latch: library cache lock 4,194 465 111 15.3 job scheduler coordinator slave wait

More information

第5回お試しアカウント付き並列プログラミング講習会

第5回お試しアカウント付き並列プログラミング講習会 qstat -l ID (qstat -f) qscript ID BATCH REQUEST: 253443.batch1 Name: test.sh Owner: uid=32637, gid=30123 Priority: 63 State: 1(RUNNING) Created at: Tue Jun 30 05:36:24 2009 Started at: Tue Jun 30 05:36:27

More information

ProVAL Recent Projects, ProVAL Online 3 Recent Projects ProVAL Online Show Online Content on the Start Page Page 13

ProVAL Recent Projects, ProVAL Online 3 Recent Projects ProVAL Online Show Online Content on the Start Page Page 13 ProVAL Unit System Enable Recording Log Preferred Language Default File Type Default Project Path ProVAL : Unit SystemUse SI Units SI SI USCS Enable Recording Log Language Default File Type Default Project

More information

Nios II ハードウェア・チュートリアル

Nios II ハードウェア・チュートリアル Nios II ver. 7.1 2007 8 1. Nios II FPGA Nios II Quaruts II 7.1 Nios II 7.1 Nios II Cyclone II count_binary 2. 2-1. http://www.altera.com/literature/lit-nio2.jsp 2-2. Nios II Quartus II FEATURE Nios II

More information

1 つのツールを実行するだけで違いが出るのでしょうか? はい 多くの場合 複雑なバグを発見して アプリケーションの安定性を向上させることができます このガイドでは インテル Inspector XE 解析ツールを使用して コードの問題を排除する方法を説明します これにより コードの信頼性が向上し 開

1 つのツールを実行するだけで違いが出るのでしょうか? はい 多くの場合 複雑なバグを発見して アプリケーションの安定性を向上させることができます このガイドでは インテル Inspector XE 解析ツールを使用して コードの問題を排除する方法を説明します これにより コードの信頼性が向上し 開 インテル Parallel Studio 評価ガイド メモリーエラーの排除と プログラムの安定性の向上 インテル Parallel Studio XE 1 つのツールを実行するだけで違いが出るのでしょうか? はい 多くの場合 複雑なバグを発見して アプリケーションの安定性を向上させることができます このガイドでは インテル Inspector XE 解析ツールを使用して コードの問題を排除する方法を説明します

More information

HA8000-bdシリーズ RAID設定ガイド HA8000-bd/BD10X2

HA8000-bdシリーズ RAID設定ガイド HA8000-bd/BD10X2 HB102050A0-4 制限 補足 Esc Enter Esc Enter Esc Enter Main Advanced Server Security Boot Exit A SATA Configuration SATA Controller(s) SATA Mode Selection [Enabled] [RAID] Determines how

More information

Parallel Studio XE Parallel Studio XE hotspot ( )

Parallel Studio XE Parallel Studio XE hotspot ( ) Parallel Studio XE Parallel Studio XE hotspot ( ) 1 つのファイルを再コンパイルするだけで違いが出るのでしょうか? はい 多くの場合 Parallel Studio XE の最適化コンパイラーを使用して 1 つのファイルを再コンパイルするだけでパフォーマンスが大幅に向上します 必ずしもアプリケーション全体を再コンパイルする必要はありません これは シリアル

More information

I I / 47

I I / 47 1 2013.07.18 1 I 2013 3 I 2013.07.18 1 / 47 A Flat MPI B 1 2 C: 2 I 2013.07.18 2 / 47 I 2013.07.18 3 / 47 #PJM -L "rscgrp=small" π-computer small: 12 large: 84 school: 24 84 16 = 1344 small school small

More information

Code Modernization Online training plan

Code Modernization Online training plan Windows* 環境での MPI プログラムの作成と実行 2016 年 4 月 内容 必要要件と各ツール インストール コンパイルと実行 必要なツールと環境 プロセッサーと Windows* OS コンパイラーとリンカー MPI ライブラリー クラスター診断 / 最適化ツール プロセッサーと Windows* OS インテル 64 アーキテクチャー ベースのシステム 1 コアあたり 1GB のメモリーと

More information

連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 分子 ( 粒子 ) セル 系の状態 ステップ 18

連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 分子 ( 粒子 ) セル 系の状態 ステップ 18 連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 17 2.1 分子 ( 粒子 ) 17 2.2 セル 17 2.3 系の状態 18 2.4 1ステップ 18 2.5 力の計算 19 2.6 速度と位置の更新 20 2.7 セル間の分子の移動 21 3 OpenMP

More information

製品型番 商用版特定ユーザーライセンス INT7001 インテル System Studio 2018 FreeBSD \163,080 INT6673 インテル Media Server Studio 2017 Essentials \84,000 \90,720 Edit INT6674 インテ

製品型番 商用版特定ユーザーライセンス INT7001 インテル System Studio 2018 FreeBSD \163,080 INT6673 インテル Media Server Studio 2017 Essentials \84,000 \90,720 Edit INT6674 インテ インテルソウトウェア開発製品 2018 (C++ Fotran コンパイラ ) 商用版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2017 年 12 月 7 日 ~ 製品型番 商用版特定ユーザーライセンス INT6759 インテル Parallel Studio XE 2018 Cluster \495,000 \534,600 Edition INT6760 インテル Parallel

More information

1 138

1 138 5 1 2 3 4 5 6 7 8 1 138 BIOS Setup Utility MainAdvancedSecurityPowerExit Setup Warning Item Specific Help Setting items on this menu to incorrect values may cause your system to malfunction. Select 'Yes'

More information

WinDriver PCI Quick Start Guide

WinDriver PCI Quick Start Guide WinDriver PCI/PCI Express/PCMCIA 5! WinDriver (1) DriverWizard (2) DriverWizard WinDriver (1) Windows 98/Me/2000/XP/Server 2003/Vista Windows CE.NET Windows Embedded CE v6.00 Windows Mobile 5.0/6.0 Linux

More information

untitled

untitled FutureNet Microsoft Corporation Microsoft Windows Windows 95 Windows 98 Windows NT4.0 Windows 2000, Windows XP, Microsoft Internet Exproler (1) (2) (3) COM. (4) (5) ii ... 1 1.1... 1 1.2... 3 1.3... 6...

More information

2. OpenMP OpenMP OpenMP OpenMP #pragma#pragma omp #pragma omp parallel #pragma omp single #pragma omp master #pragma omp for #pragma omp critica

2. OpenMP OpenMP OpenMP OpenMP #pragma#pragma omp #pragma omp parallel #pragma omp single #pragma omp master #pragma omp for #pragma omp critica C OpenMP 1. OpenMP OpenMP Architecture Review BoardARB OpenMP OpenMP OpenMP OpenMP OpenMP Version 2.0 Version 2.0 OpenMP Fortran C/C++ C C++ 1997 10 OpenMP Fortran API 1.0 1998 10 OpenMP C/C++ API 1.0

More information

内容 インテル Advisor ベクトル化アドバイザー入門ガイド Version インテル Advisor の利用 ワークフロー... 3 STEP1. 必要条件の設定... 4 STEP2. インテル Advisor の起動... 5 STEP3. プロジェクトの作成

内容 インテル Advisor ベクトル化アドバイザー入門ガイド Version インテル Advisor の利用 ワークフロー... 3 STEP1. 必要条件の設定... 4 STEP2. インテル Advisor の起動... 5 STEP3. プロジェクトの作成 内容 インテル Advisor ベクトル化アドバイザー入門ガイド Version 1.0 1. インテル Advisor の利用... 2 2. ワークフロー... 3 STEP1. 必要条件の設定... 4 STEP2. インテル Advisor の起動... 5 STEP3. プロジェクトの作成と設定... 7 STEP4. ベクトル化に関する情報を取得する... 9 STEP5. ループ処理の詳細を取得する...

More information

OpenCV IS Report No Report Medical Information System Labratry

OpenCV IS Report No Report Medical Information System Labratry OpenCV 2014 8 25 IS Report No. 2014090201 Report Medical Information System Labratry Abstract OpenCV OpenCV 1............................ 2 1.1 OpenCV.......................... 2 1.2......................

More information

インテル(R) Xeon(R) プロセッサーおよびインテル(R) Pentium(R) 4 プロセッサーのパフォーマンス・カウンター

インテル(R) Xeon(R) プロセッサーおよびインテル(R) Pentium(R) 4 プロセッサーのパフォーマンス・カウンター Core Intel Intel Intel Itanium Pentium Xeon Intel Corporation 2007Intel Corporation. VTune 9.0 VTune 1 Randy Camp R&D MUSICMATCH Inc. Core 2 Duo Core 2 Quad Windows: Microsoft Vista* Linux: hotspot Windows*

More information

FFTSS Library Version 3.0 User's Guide

FFTSS Library Version 3.0 User's Guide : 19 10 31 FFTSS 3.0 Copyright (C) 2002-2007 The Scalable Software Infrastructure Project, (CREST),,. http://www.ssisc.org/ Contents 1 4 2 (DFT) 4 3 4 3.1 UNIX............................................

More information

Introduction Purpose The course describes library configuration and usage in the High Performance Embedded Workshop (HEW), which speeds development of

Introduction Purpose The course describes library configuration and usage in the High Performance Embedded Workshop (HEW), which speeds development of Introduction Purpose The course describes library configuration and usage in the High Performance Embedded Workshop (HEW), which speeds development of software for embedded systems. Objectives Learn the

More information

RX600 & RX200シリーズ アプリケーションノート RX用仮想EEPROM

RX600 & RX200シリーズ アプリケーションノート RX用仮想EEPROM R01AN0724JU0170 Rev.1.70 MCU EEPROM RX MCU 1 RX MCU EEPROM VEE VEE API MCU MCU API RX621 RX62N RX62T RX62G RX630 RX631 RX63N RX63T RX210 R01AN0724JU0170 Rev.1.70 Page 1 of 33 1.... 3 1.1... 3 1.2... 3

More information

cpp1.dvi

cpp1.dvi 2017 c 1 C++ (1) C C++, C++, C 11, 12 13 (1) 14 (2) 11 1 n C++ //, [List 11] 1: #include // C 2: 3: int main(void) { 4: std::cout

More information

XMPによる並列化実装2

XMPによる並列化実装2 2 3 C Fortran Exercise 1 Exercise 2 Serial init.c init.f90 XMP xmp_init.c xmp_init.f90 Serial laplace.c laplace.f90 XMP xmp_laplace.c xmp_laplace.f90 #include int a[10]; program init integer

More information

untitled

untitled WIL (Visual C++ 2005 MFC ) WIL (Visual C++ 2005) Visual C++ 2005 Visual C++ WIL MFC 0 Visual C++ 2005 WIL Visual C++ WIL 1. Microsoft Visual Studio 2005 2. 3. VC 4. WIL EVC C: Program Files FAST WIL Include

More information

. IDE JIVE[1][] Eclipse Java ( 1) Java Platform Debugger Architecture [5] 3. Eclipse GUI JIVE 3.1 Eclipse ( ) 1 JIVE Java [3] IDE c 016 Information Pr

. IDE JIVE[1][] Eclipse Java ( 1) Java Platform Debugger Architecture [5] 3. Eclipse GUI JIVE 3.1 Eclipse ( ) 1 JIVE Java [3] IDE c 016 Information Pr Eclipse 1,a) 1,b) 1,c) ( IDE) IDE Graphical User Interface( GUI) GUI GUI IDE View Eclipse Development of Eclipse Plug-in to present an Object Diagram to Debug Environment Kubota Yoshihiko 1,a) Yamazaki

More information

SystemC言語概論

SystemC言語概論 SystemC CPU S/W 2004/01/29 4 SystemC 1 SystemC 2.0.1 CPU S/W 3 ISS SystemC Co-Simulation 2004/01/29 4 SystemC 2 ISS SystemC Co-Simulation GenericCPU_Base ( ) GenericCPU_ISS GenericCPU_Prog GenericCPU_CoSim

More information

strtok-count.eps

strtok-count.eps IoT FPGA 2016/12/1 IoT FPGA 200MHz 32 ASCII PCI Express FPGA OpenCL (Volvox) Volvox CPU 10 1 IoT (Internet of Things) 2020 208 [1] IoT IoT HTTP JSON ( Python Ruby) IoT IoT IoT (Hadoop [2] ) AI (Artificial

More information

XcalableMP入門

XcalableMP入門 XcalableMP 1 HPC-Phys@, 2018 8 22 XcalableMP XMP XMP Lattice QCD!2 XMP MPI MPI!3 XMP 1/2 PCXMP MPI Fortran CCoarray C++ MPIMPI XMP OpenMP http://xcalablemp.org!4 XMP 2/2 SPMD (Single Program Multiple Data)

More information

programmingII2019-v01

programmingII2019-v01 II 2019 2Q A 6/11 6/18 6/25 7/2 7/9 7/16 7/23 B 6/12 6/19 6/24 7/3 7/10 7/17 7/24 x = 0 dv(t) dt = g Z t2 t 1 dv(t) dt dt = Z t2 t 1 gdt g v(t 2 ) = v(t 1 ) + g(t 2 t 1 ) v v(t) x g(t 2 t 1 ) t 1 t 2

More information

DocuWide 2051/2051MF 補足説明書

DocuWide 2051/2051MF 補足説明書 ëêèõ . 2 3 4 5 6 7 8 9 0 2 3 4 [PLOTTER CONFIGURATION] [DocuWide 2050/205 Version 2.2.0] [SERIAL] BAUD_RATE =9600 DATA_BIT =7 STOP_BIT = PARITY =EVEN HANDSHAKE =XON/XOFF EOP_TIMEOUT_VALUE =0 OUTPUT RESPONSE

More information

OpenMP (1) 1, 12 1 UNIX (FUJITSU GP7000F model 900), 13 1 (COMPAQ GS320) FUJITSU VPP5000/64 1 (a) (b) 1: ( 1(a))

OpenMP (1) 1, 12 1 UNIX (FUJITSU GP7000F model 900), 13 1 (COMPAQ GS320) FUJITSU VPP5000/64 1 (a) (b) 1: ( 1(a)) OpenMP (1) 1, 12 1 UNIX (FUJITSU GP7000F model 900), 13 1 (COMPAQ GS320) FUJITSU VPP5000/64 1 (a) (b) 1: ( 1(a)) E-mail: {nanri,amano}@cc.kyushu-u.ac.jp 1 ( ) 1. VPP Fortran[6] HPF[3] VPP Fortran 2. MPI[5]

More information

Copyright Oracle Parkway, Redwood City, CA U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated softw

Copyright Oracle Parkway, Redwood City, CA U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated softw Oracle Solaris Studio 12.3 Part No: E26466 2011 12 Copyright 2011 500 Oracle Parkway, Redwood City, CA 94065 U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated software,

More information

1.... 1 2.... 1 2.1. RATS... 1 2.1.1. expat... 1 2.1.2. expat... 1 2.1.3. expat... 2 2.2. RATS... 2 2.2.1. RATS... 2 2.2.2.... 3 3. RATS... 4 3.1.... 4 3.2.... 4 3.3.... 6 3.3.1.... 6 3.3.2.... 6 3.3.3....

More information

I117 II I117 PROGRAMMING PRACTICE II 2 SOFTWARE DEVELOPMENT ENV. 2 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara yasu

I117 II I117 PROGRAMMING PRACTICE II 2 SOFTWARE DEVELOPMENT ENV. 2 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara yasu I117 II I117 PROGRAMMING PRACTICE II 2 SOFTWARE DEVELOPMENT ENV. 2 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara yasu@jaist.ac.jp / SCHEDULE 1. 2011/06/07(Tue) / Basic

More information

Pentium 4

Pentium 4 Pentium 4 Pentium 4... 2... 2... 2... 3... 3... 3... 3... 4 TMPGEnc Plus2.5 Ver.2.59... 5... 8... 9... 9 VTune TM... 9 C++/Fortran... 9 1 Pentium 4 HT Xeon TM Pentium 4 3.06GHz HT Pentium 4 NetBurst TM

More information

I117 II I117 PROGRAMMING PRACTICE II SOFTWARE DEVELOPMENT ENV. 1 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara

I117 II I117 PROGRAMMING PRACTICE II SOFTWARE DEVELOPMENT ENV. 1 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara I117 II I117 PROGRAMMING PRACTICE II SOFTWARE DEVELOPMENT ENV. 1 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara yasu@jaist.ac.jp / SCHEDULE 1. 2011/06/07(Tue) / Basic of

More information

SystemC 2.0を用いた簡易CPUバスモデルの設計

SystemC 2.0を用いた簡易CPUバスモデルの設計 SystemC 2.0 CPU CPU CTD&SW CT-PF 2002/1/23 1 CPU BCA UTF GenericCPU IO (sc_main) 2002/1/23 2 CPU CPU CQ 1997 11 Page 207 4 Perl Verilog-HDL CPU / Verilog-HDL SystemC 2.0 (asm) ROM (test.hex) 2002/1/23

More information

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し

Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定し Product Brief 高速なコードを素早く開発 インテル Parallel Studio XE 2017 インテル ソフトウェア開発ツール 概要 高速なコード : 現在および次世代のプロセッサーでスケーリングする優れたアプリケーション パフォーマンスを実現します 迅速に開発 : 高速かつ安定した並列コードの作成を簡略化するツールセットです : 最先端のコンパイラー ライブラリー 並列モデル インテル

More information

RAID RAID 0 RAID 1 RAID 5 RAID * ( -1) * ( /2) * RAID A. SATA B. BIOS SATA ( 1) C. RAID BIOS RAID D. SATA RAID/AHCI 2 SATA M.2 SSD ( 2) ( (

RAID RAID 0 RAID 1 RAID 5 RAID * ( -1) * ( /2) * RAID A. SATA B. BIOS SATA ( 1) C. RAID BIOS RAID D. SATA RAID/AHCI 2 SATA M.2 SSD ( 2) ( ( RAID RAID 0 RAID 1 RAID 5 RAID 10 2 2 3 4 * ( -1) * ( /2) * RAID A. SATA B. BIOS SATA ( 1) C. RAID BIOS RAID D. SATA RAID/AHCI 2 SATA M.2 SSD ( 2) ( ( 3) 2 ) Windows USB 1 SATA A. SATA SATA Intel SATA

More information

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド インテル Parallel Studio XE 2019 Composer Edition for Fortran Windows インストール ガイド エクセルソフト株式会社 Version 1.0.0-20180918 目次 1. はじめに....................................................................................

More information

( CUDA CUDA CUDA CUDA ( NVIDIA CUDA I

(    CUDA CUDA CUDA CUDA (  NVIDIA CUDA I GPGPU (II) GPGPU CUDA 1 GPGPU CUDA(CUDA Unified Device Architecture) CUDA NVIDIA GPU *1 C/C++ (nvcc) CUDA NVIDIA GPU GPU CUDA CUDA 1 CUDA CUDA 2 CUDA NVIDIA GPU PC Windows Linux MaxOSX CUDA GPU CUDA NVIDIA

More information

新版明解C言語 実践編

新版明解C言語 実践編 2 List - "max.h" a, b max List - max "max.h" #define max(a, b) ((a) > (b)? (a) : (b)) max List -2 List -2 max #include "max.h" int x, y; printf("x"); printf("y"); scanf("%d", &x); scanf("%d", &y); printf("max(x,

More information

WinHPC ppt

WinHPC ppt MPI.NET C# 2 2009 1 20 MPI.NET MPI.NET C# MPI.NET C# MPI MPI.NET 1 1 MPI.NET C# Hello World MPI.NET.NET Framework.NET C# API C# Microsoft.NET java.net (Visual Basic.NET Visual C++) C# class Helloworld

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 高性能計算基盤 第 7 回 CA1003: 主記憶共有型システム http://arch.naist.jp/htdocs-arch3/ppt/ca1003/ca1003j.pdf Copyright 2019 奈良先端大中島康彦 1 2 3 4 マルチスレッディングとマルチコア 5 6 7 主記憶空間の数が 複数 か 1 つ か 8 ただしプログラムは容易 9 1 つの主記憶空間を共有する場合 10

More information

MOTIF XF 取扱説明書

MOTIF XF 取扱説明書 MUSIC PRODUCTION SYNTHESIZER JA 2 (7)-1 1/3 3 (7)-1 2/3 4 (7)-1 3/3 5 http://www.adobe.com/jp/products/reader/ 6 NOTE http://japan.steinberg.net/ http://japan.steinberg.net/ 7 8 9 A-1 B-1 C0 D0 E0 F0 G0

More information

アカ版特定ユーザーライセンス INT7006 INT7007 INT7008 INT6685 インテル System Studio 2018 Ultimate on \217,080 r インテル System Studio 2018 Ultimate on \217,080 r インテル Syst

アカ版特定ユーザーライセンス INT7006 INT7007 INT7008 INT6685 インテル System Studio 2018 Ultimate on \217,080 r インテル System Studio 2018 Ultimate on \217,080 r インテル Syst インテルソウトウェア開発製品 2018 (C++ Fotran コンパイラ ) アカ版特定ユーザーライセンス標準価格表 株式会社アークブレイン 2017 年 12 月 7 日 ~ 製品型番 アカ版特定ユーザーライセンス INT6794 インテル Parallel Studio XE 2018 Cluster \252,000 \272,160 on INT6795 インテル Parallel Studio

More information

(1/2) 2/45 HPC top runner application programmer PC-9801F N88-BASIC Quick BASIC + DOS ( ) BCB Windows Percolation, Event-driven MD ActionScript Flash

(1/2) 2/45 HPC top runner application programmer PC-9801F N88-BASIC Quick BASIC + DOS ( ) BCB Windows Percolation, Event-driven MD ActionScript Flash 1/45 8 Outline 1. 2. 3. 4. Jun. 6, 2013@ A (1/2) 2/45 HPC top runner application programmer PC-9801F N88-BASIC Quick BASIC + DOS ( ) BCB Windows Percolation, Event-driven MD ActionScript Flash MPI MD (2/2)

More information

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18 OpenMP* 4.x における拡張 OpenMP 4.0 と 4.5 の機能拡張 内容 OpenMP* 3.1 から 4.0 への拡張 OpenMP* 4.0 から 4.5 への拡張 2 追加された機能 (3.1 -> 4.0) C/C++ 配列シンタックスの拡張 SIMD と SIMD 対応関数 デバイスオフロード task 構 の依存性 taskgroup 構 cancel 句と cancellation

More information

スライド 1

スライド 1 インテル コンパイラー入門 ~ 機能概要のご紹介 ~ エクセルソフト株式会社安晃生 ~ 内容 ~ 1. インテル コンパイラーの概要 2. インテル コンパイラーの基本使用方法 3. 最適化オプションについて 4. 高速インテルライブラリーの利用 5. 最後に 2 ~ 内容 ~ 1. インテル コンパイラーの概要 インテル コンパイラーとは? インテル コンパイラーの開発環境概要 製品紹介 2. インテル

More information

インテル® Parallel Studio XE 2013 Windows* 版インストール・ガイドおよびリリースノート

インテル® Parallel Studio XE 2013 Windows* 版インストール・ガイドおよびリリースノート インテル Parallel Studio XE 2013 Windows* 版インストール ガイドおよびリリースノート 資料番号 : 323803-003JA 2012 年 8 月 8 日 目次 1 概要... 2 1.1 新機能... 2 1.1.1 インテル Parallel Studio XE 2011 からの変更点... 2 1.2 製品の内容... 2 1.3 動作環境... 2 1.4

More information

RAID RAID 0 RAID 1 RAID 5 RAID * ( -1) * ( /2) * RAID A. SATA SSD B. BIOS SATA ( 1) C. RAID BIOS RAID D. RAID/AHCI 2 SATA SSD ( 1) ( ( 3) 2

RAID RAID 0 RAID 1 RAID 5 RAID * ( -1) * ( /2) * RAID A. SATA SSD B. BIOS SATA ( 1) C. RAID BIOS RAID D. RAID/AHCI 2 SATA SSD ( 1) ( ( 3) 2 RAID SATA... 2 RAID/AHCI... 16 Intel Optane... 19 Intel Virtual RAID on CPU Intel VROC... 21 RAID RAID 0 RAID 1 RAID 5 RAID 10 2 2 3 4 * ( -1) * ( /2) * RAID A. SATA SSD B. BIOS SATA ( 1) C. RAID BIOS

More information

/ SCHEDULE /06/07(Tue) / Basic of Programming /06/09(Thu) / Fundamental structures /06/14(Tue) / Memory Management /06/1

/ SCHEDULE /06/07(Tue) / Basic of Programming /06/09(Thu) / Fundamental structures /06/14(Tue) / Memory Management /06/1 I117 II I117 PROGRAMMING PRACTICE II 2 MEMORY MANAGEMENT 2 Research Center for Advanced Computing Infrastructure (RCACI) / Yasuhiro Ohara yasu@jaist.ac.jp / SCHEDULE 1. 2011/06/07(Tue) / Basic of Programming

More information

チュートリアル XP Embedded 入門編

チュートリアル XP Embedded 入門編 TUT-0057 Ver. 1.0 www.interface.co.jp Ver 1.0 2005 6 (,), Web site () / () 2004 Interface Corporation. All rights reserved. ...1...1 1. XP Embedded...2 2....3 2.1....3 2.2....4 2.2.1. SLD...4 2.3....5

More information

1 C STL(1) C C C libc C C C++ STL(Standard Template Library ) libc libc C++ C STL libc STL iostream Algorithm libc STL string vector l

1 C STL(1) C C C libc C C C++ STL(Standard Template Library ) libc libc C++ C STL libc STL iostream Algorithm libc STL string vector l C/C++ 2007 6 18 1 C STL(1) 2 1.1............................................... 2 1.2 stdio................................................ 3 1.3.......................................... 10 2 11 2.1 sizeof......................................

More information

FileMaker Server Getting Started Guide

FileMaker Server Getting Started Guide FileMaker Server 11 2004-2010 FileMaker, Inc. All Rights Reserved. FileMaker, Inc. 5201 Patrick Henry Drive Santa Clara, California 95054 FileMaker FileMaker, Inc. FileMaker, Inc. FileMaker FileMaker,

More information

3.1 stdio.h iostream List.2 using namespace std C printf ( ) %d %f %s %d C++ cout cout List.2 Hello World! cout << float a = 1.2f; int b = 3; cout <<

3.1 stdio.h iostream List.2 using namespace std C printf ( ) %d %f %s %d C++ cout cout List.2 Hello World! cout << float a = 1.2f; int b = 3; cout << C++ C C++ 1 C++ C++ C C++ C C++? C C++ C *.c *.cpp C cpp VC C++ 2 C++ C++ C++ [1], C++,,1999 [2],,,2001 [3], ( )( ),,2001 [4] B.W. /D.M.,, C,,1989 C Web [5], http://kumei.ne.jp/c_lang/ 3 Hello World Hello

More information

Condition DAQ condition condition 2 3 XML key value

Condition DAQ condition condition 2 3 XML key value Condition DAQ condition 2009 6 10 2009 7 2 2009 7 3 2010 8 3 1 2 2 condition 2 3 XML key value 3 4 4 4.1............................. 5 4.2...................... 5 5 6 6 Makefile 7 7 9 7.1 Condition.h.............................

More information

P3FY-A JP.PDF

P3FY-A JP.PDF P3FY-A002-03 SCSI GP5-148 GP5-148(AcceleRAID 352) 1 1.1 2001 11 OS ( OS ) 4GByte 2 2.1 EzAssist RAID EzAssist Configure RAID Drive Automatic ( )Assisted( ) Custom ( ) 2.2 2000 7 EzAssist Perform Administration

More information

1 Table 1: Identification by color of voxel Voxel Mode of expression Nothing Other 1 Orange 2 Blue 3 Yellow 4 SSL Humanoid SSL-Vision 3 3 [, 21] 8 325

1 Table 1: Identification by color of voxel Voxel Mode of expression Nothing Other 1 Orange 2 Blue 3 Yellow 4 SSL Humanoid SSL-Vision 3 3 [, 21] 8 325 社団法人人工知能学会 Japanese Society for Artificial Intelligence 人工知能学会研究会資料 JSAI Technical Report SIG-Challenge-B3 (5/5) RoboCup SSL Humanoid A Proposal and its Application of Color Voxel Server for RoboCup SSL

More information

Express5800/320Fc-MR

Express5800/320Fc-MR 7 7 Phoenix BIOS 4.0 Release 6.0.XXXX : CPU=Pentium III Processor XXX MHz 0640K System RAM Passed 0127M Extended RAM Passed WARNING 0212: Keybord Controller Failed. : Press to resume, to setup

More information

1 CUI CUI CUI 1.1 cout cin 1.1.1 redirect.cpp #i n c l u d e <s t r i n g > 3 using namespace std ; 5 6 i n t main ( void ) 7 { 8 s t r i n g s ; 10 c

1 CUI CUI CUI 1.1 cout cin 1.1.1 redirect.cpp #i n c l u d e <s t r i n g > 3 using namespace std ; 5 6 i n t main ( void ) 7 { 8 s t r i n g s ; 10 c C/C++ 007 6 11 1 CUI 1.1....................................... 1................................ 3 1.3 argc argv................................. 5.1.............................................. 5...............................................

More information

Contents Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C Microsoft* Windows* CE.NET Platform Builder C IP

Contents Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C Microsoft* Windows* CE.NET Platform Builder C IP Windows*/Linux* VTune TM Contents... 1... 2 Windows* /Linux* C++/Fortran... 3 Microsoft* embedded Visual C++* C++... 9 Microsoft* Windows* CE.NET Platform Builder C++... 11 IPP... 13 PCA IPP... 15 GPP...

More information

Step 1 Feature Extraction Featuer Extraction Feature Extraction Featuer Extraction Image Analysis Start>Programs>Agilent-Life Sciences>Feature Extract

Step 1 Feature Extraction Featuer Extraction Feature Extraction Featuer Extraction Image Analysis Start>Programs>Agilent-Life Sciences>Feature Extract Agilent G2565AA Feature Extraction Step 1 Feature Extraction Step 2 Step 3 Step 4 ( ) Step 5 ( ) Step 6 Step 7 Step 8 Feature Extraction Step 9 Step 10 Feature Extraction Step 11 Feature Extraction Step

More information