I I / 47

Size: px

Start display at page:

Download "I I / 47"

みちしげてらわ
5 years ago
Views:

1 I I / 47

2 A Flat MPI B 1 2 C: 2 I / 47

3 I / 47

4 #PJM -L "rscgrp=small" π-computer small: 12 large: 84 school: = 1344 small school small large 2 2 large I / 47

5 I / 47

6 MPI + OpenMP = MPI MPI OpenMP do-loop OpenMP 3 fork 3 π-computer 1 16 I / 47

7 3 I / 47

8 プロセッサ 0 プロセッサ 1 プロセッサ 0 コア 00 コア 01 コア 15 プロセッサ 1 コア 00 コア 01 コア 15 プロセッサ N-1 コア 00 コア 01 コア 15 MPI プロセス 0 プロセッサ 2 MPI プロセス 1 プロセッサ N-1 MPI プロセス N-1 Fork & Join Fork & Join Fork & Join OpenMP スレッド 00 OpenMP スレッド 01 OpenMP スレッド 15 プロセッサ 1 OpenMP スレッド 00 OpenMP スレッド 01 OpenMP スレッド 15 プロセッサ N-1 OpenMP スレッド 00 OpenMP スレッド 01 OpenMP スレッド 15 I / 47

9 I / 47

10 CPU Fortran95 cpu time() (wall clock time) MPI MPI WTIME() OpenMP omp get wtime() Fortran90 system clock() I / 47

11 heat5.f90 heat4...f90 system clock() stopwatch m!! heat5.f90! + module stopwatch, to monitor time.! + many calls to stopwatch stt and.. stp.! - data output calls for profile 1d and 2d (commented out.)!! usage (on pi-computer)!! 1) mkdir../data (unless there is already.)!! 2) mpifrtpx -O3 heat5.f90 (copy un to u is slow in default.)!! 3) pjsub heat5.sh I / 47

12 heat5.f90 4 -O3 5 u(1:ngrid,jj%stt:jj%end)=un(1:ngrid,jj%stt:jj%end) 4 usage 5 stopwatch copy un to u I / 47

13 ################################################## job start at Tue Jul 16 21:07:29 JST 2013 ################################################## # myrank= 3 jj%stt & jj%end = # myrank= 0 jj%stt & jj%end = # myrank= 2 jj%stt & jj%end = # myrank= 1 jj%stt & jj%end = //=============<stop watch>===============\\ profile 1d: sec main loop: sec mpi sendrecv: sec jacobi: sec copy un to u: sec Total: sec \\=============<stop watch>===============// ################################################## job end at Tue Jul 16 21:07:39 JST 2013 I / 47

14 I / 47

15 OpenMP heat6.f90!! heat6.f90! + OpenMP (now this is a hybrid parallel code, with MPI.)! - array calc of u(:,:)=un(:,:). see below.! + double do-loops of u(i,j)=un(i,j), for OpenMP.! usage (on pi-computer)! 1) mkdir../data (unless there is already.)! 2) mpifrtpx -Kopenmp heat6.f90! 3) pjsub heat6.sh I / 47

16 OpenMP program main!$ use omp_lib!$omp parallel do do j = jj%stt, jj%end do i = 1, NGRID un(i,j)=(u(i-1,j)+u(i+1,j)+u(i,j-1)+u(i,j+1))*0.25_dp+heat_h end do end do!$omp end parallel do I / 47

17 OpenMP! u(1:ngrid,jj%stt:jj%end)=un(1:ngrid,jj%stt:jj%end)!$omp parallel do do j = jj%stt, jj%end do i = 1, NGRID u(i,j)=un(i,j) end do end do!$omp end parallel do I / 47

18 mpifrtpx -Kopenmp heat6.f90 heat6.sh school pjsub heat6.sh I / 47

19 heat6.sh #!/bin/bash #PJM -N "heat6" #PJM -L "rscgrp=small" #PJM -L "node=4" #PJM -L "elapse=02:00" #PJM -j export FLIB_CNTL_BARRIER_ERR=FALSE.. for opn in do export OMP_NUM_THREADS=$opn echo "# omp_num_threads = " $opn mpiexec -n 4./a.out done.. I / 47

20 x x 2x = 0 x 0 6 x = 2 β β a: b: c: gnuplot y = x x y = 2x x set xrange [xmin:xmax] I / 47

21 a b Emacs M-x animate 1st name M-x zone M-x zone c Emacs M-x dunnet help get shovel, look shovel, e, e, dig, look, get cpu,... I / 47

22 heat6.f90 1 M ( 16) N ( 84) P (= M N) v.s. S 8 gnuplot 9 8 S stopwatch module Total 9 NGRID I / 47

23 (a) (b) NGRID, N, M =OMP NUM THREADS (c) gnuplot (d) (e) I 10 gmail kageyama.lecture@gmail.com pdf x227x Yamada (e) I / 47

24 A Flat MPI A Flat MPI I / 47

25 A Flat MPI Flat MPI MPI OpenMP MPI = 64 MPI Flat MPI OpenMP I / 47

コア 01 コア 15 プロセッサ 2 MPI プロセス 16 MPI プロセス 17 MPI プロセス 31 プロセッサ N-1

26 A Flat MPI FLAT MPI プロセッサ 0 コア 00 コア 01 コア 15 プロセッサ 1 MPI プロセス 0 MPI プロセス 1 MPI プロセス 15 プロセッサ 1 コア 00 コア 01 コア 15 プロセッサ N-1 コア 00 コア 01 コア 15 プロセッサ 2 MPI プロセス 16 MPI プロセス 17 MPI プロセス 31 プロセッサ N-1 MPI プロセス 16*N-16 MPI プロセス 16*N-15 MPI プロセス 16*N-1 I / 47

27 B 1 2 B 1 2 I / 47

28 C: 2 C: 2 I / 47

29 C: : 16 I / 47

30 C: I / 47

31 C: 2 1 NGRID I / 47

32 C: NGRID 1 2 I / 47

33 C: 2 1 MPI I / 47

34 C: MPI 2 I / 47

35 C: I / 47

36 C: MPI 1 46 I / 47

37 C: MPI 38 I / 47

38 C: 2 2 I / 47

39 C: 2 2 I / 47

40 C: 2 2 I / 47

41 C: 2 2 MPI I / 47

42 C: ,3,5,7 I / 47

43 C: ,2,6,8 I / 47

44 C: 2 MPI CART CREATE MPI MPI CART CREATE I / 47

45 C: 2 π-computer I / 47

46 C: 2 MPI I / 47

47 C: I / 47

I

I 1 2016.07.21 MPI OpenMP 84 1344 gnuplot Xming Tera term cp -r /tmp/160721 chmod 0 L x L y 0 k T (x, t) k: T t = k 2 T x 2 T t = s s : heat source 1D T (x, t) t = k 2 T (x, t) x 2 + s(x) 2D T (x,