- PDF 無料ダウンロード

Size: px

Start display at page:

Download ""

ふじよしのたけ
5 years ago
Views:

1 MPI

3 ( 2) MPI iii

5 MPI_BCAST MPI_GATHER MPI_REDUCE MPI_MAXLOC/MPI_MINLOC MPI MPI_TYPE_CREATE_SUBARRAY C MPI MPI MPI_IN_PLACE v

6 (I/O ) (I/O ) MPI_GATHERV MPI_ALLGATHERV MPI_ALLTOALLV (ICCG ) (ADI ) MPMD MPI LU ICCG SOR SOR vi

7 MPI 265 MPI_INIT MPI_FINALIZE MPI_COMM_SIZE MPI_COMM_RANK MPI_ABORT MPI_WTIME MPI_BCAST MPI_SCATTER MPI_SCATTERV MPI_GATHER MPI_GATHERV MPI_ALLGATHER MPI_ALLGATHERV MPI_ALLTOALL MPI_ALLTOALLV MPI-2 MPI_ALLTOALLW MPI_REDUCE MPI_ALLREDUCE MPI_SCAN MPI-2 MPI_EXSCAN MPI_REDUCE_SCATTER MPI_OP_CREATE MPI_BARRIER MPI-2 MPI_IN_PLACE MPI_SCATTER MPI-2 MPI_IN_PLACE MPI_SCATTERV MPI-2 MPI_IN_PLACE MPI_GATHER MPI-2 MPI_IN_PLACE MPI_GATHERV MPI-2 MPI_IN_PLACE MPI_ALLGATHER MPI-2 MPI_IN_PLACE MPI_ALLGATHERV MPI-2 MPI_IN_PLACE MPI_REDUCE MPI-2 MPI_IN_PLACE MPI_ALLREDUCE MPI-2 MPI_IN_PLACE MPI_SCAN MPI-2 MPI_IN_PLACE MPI_REDUCE_SCATTER MPI_SEND MPI_RECV MPI_SENDRECV MPI_ISEND MPI_IRECV MPI_WAIT MPI_GET_COUNT MPI_TYPE_SIZE vii

8 MPI_TYPE_CONTIGUOUS MPI_TYPE_VECTOR/HVECTOR MPI-2 MPI_TYPE_CREATE_INDEXED_BLOCK MPI_TYPE_INDEXED/HINDEXED MPI_TYPE_STRUCT MPI-2 MPI_TYPE_CREATE_SUBARRAY MPI_TYPE_COMMIT MPI-2 MPI_TYPE_CREATE_RESIZED MPI_COMM_SPLIT viii

9 1 OS Fortran C Fortran I J K L M N (4 ) (8 ) IMPLICIT REAL*8(A-H,O-Z) IMPLICIT REAL*8(A-H,O-Z) REAL A REAL*8 B DIMENSION C(10) D Fortran AA Aa aa aa Fortran 1 Fortran REAL A(2): A(1) A(2) C float a[2]: a[0] a[1] Fortran Fortran REAL A(2,2): A(1,1) A(2,1) A(1,2) A(2,2) C float a[2][2]: a[0][0] a[0][1] a[1][0] a[1][1] 1

10 1 1-1 (1) CPU CPU UNIX Linux ( OS) ( I/O) 1 2 ( DO 1 2 ) (2) CPU OS CPU 2 CPU CPU CPU 2 CPU (3) CPU 1 OS 1 SMP (Symmetric Multi-Processing) 2 CPU UNIX

11 (1) (2) CPU (3) (4-7-2 ) (4) CPU PE (Processing Element) (1) (3) (2) (4) (1) (2) (3) ABAQUS LS-DYNA3D PAM-CRASH MARC NASTRAN RADIOSS STAR-CD FLUENT STREAM SCRYU DISCOVER HONDO GAMESS GAUSSIAN 3 3

12 1 1-2 SPMD MPMD (1) a.out 3 A SPMD (Single Program Multiple Data) MPMD (Multiple Program Multiple Data) 2 SPMD (2) 1 a.out (ID) ( ) A (1) (1) SPMD MPMD (3) a.out b.out 2 4 ( + ) (4) 1 a.out b.out MPMD SPMD SPMD MPMD ( MPMD ) (1) (2) ) (SPMD (3) (MPMD ) (4) (MPMD ) 4

13 1-2 SPMD (1) SPMD 1 1 (1) (1) IS IE 3 IS IE ( 6 ) 3 DO (Fortran ) for (C ) 4 (2) SPMD (1) SPMD (2) a.out a.out 3 (ID) ( 0 1 2) SPMD 3 SPMD IS IE IS IE 4 3 IS IE SPMD 4 5

14 (1) (2) SPMD 6

15 1-2 (1) 3 ( (2) 5 ) = (2) 4 1/3 4 1/n ( n ) (2) ( (2) 5 ) (2) 4 1/ (1) 5 0 7

16 1 SPMD (2) SPMD (1) SPMD (2) (2) IS IE 1/ (2) ( ) 0 0 ( = 45) (2) ( ) (1) (2) SPMD 8

17 2 9

18 hello.f 1 MPI MPI_INIT MPI_FINALIZE 2 hello.f 3 a.out a.out 4 a.out 2 5 a.out CPU 0 1 CPU 6 7 PRINT (WRITE(6) PRINT ) 0 (4-4-2 )

19 2-1 (3) (5) (1) (2) MPI (3) dbx Fortran PRINT (4) CPU UNIX prof gprof (5) 11

21 3 1 13

22 3 3-1 MPI 2 MPI MPI PVM (Parallel Virtual Machine) MPI MPI (Message-Passing Interface) 1995 ( [15] [27] ) MPI-1 MPI-1 MPI-2 MPI-1 MPI-1 MPI-2 MPI Fortran C ( Fortran ) MPI No! 128 MPI 20 ( 10 ) 20 14

23 3-1 MPI [15] [27] Fortran MPI Fortran C C [15] [27] C Fortran MPI ( MPI_TYPE_CREATE_RESIZED ) INTEGER(KIND=MPI_ADDRESS_KIND) N CALL MPI_xxx(,N, ) (1) Fortran 2 2 A(3,4) (2) (1) (2) 3 C Fortran 2 2 a[3][4] (2) (1) (Fortran) 2 A(3,4) (1) (C ) 2 a[3][4] (2) (Fortran) A(3,4) (2) (C ) a[3][4] 15

24 3 3-2 Fortran Fortran (1) (2) 3 SPMD (1) MPI (1) (2) mpif.h (2) 1 mpif.h /usr MPI mpif.h (1) MPI_xxx ( MPI_COMM_WORLD ) MPI PARAMETER MPI_xxx MPI PARAMETER MPI_ PMPI_ MPI (1) mpif.h 16

25 3-2 mpif.h (1) CALL MPI_ ( ) MPI MPI 1 INCLUDE mpif.h Fortran INCLUDE MPIF.H mpif.h (2) a ( USE IMPLICIT ) b MPI_STATUS_SIZE ( 3-4 ) MPI MPI_STATUS_SIZE a PARAMETER b a (3) c INCLUDE mpif.h MODULE (Fortran 90 ) (4-8-1 ) (2) (3) MPI_INIT MPI_INIT (1) 2 MPI MPI 1 MPI_INIT MPI_INIT ierror ( (1) IERR) MPI IERR IERR MPI MPI_SUCCESS ( mpif.h ) MPI MPI IERR IERR segmentation fault IERR IERR MPI_SUCCESS CALL MPI_ERROR_STRING MPI_FINALIZE MPI_FINALIZE (1) 6 MPI MPI 1 MPI_FINALIZE MPI_INIT MPI_FINALIZE MPI_FINALIZE (STOP END ) 1 MPI_FINALIZE 17

26 3 MPI_COMM_SIZE/MPI_COMM_RANK MPI_COMM_SIZE MPI_COMM_RANK mpirun -np 3 a.out MPI_COMM_WORLD ( MPI_COMM_WORLD MPI mpif.h PARAMETER ) IWORLD2 0 1 ( ) (1) 3 3 MPI_COMM_SIZE MPI_COMM_WORLD (1) 3 NPROCS 3 NPROCS IWORLD2 3 MPI_COMM_WORLD IWORLD2 NPROCS 2 1 (4-8-2 (1) ) (NPROCS) 1 (4-8-1 (5) ) (1) 4 MPI_COMM_RANK MYRANK 0 2 MYRANK IWORLD2 4 MPI_COMM_WORLD IWORLD2 MYRANK NPROCS MYRANK (2) (1) (NPROCS) (MYRANK) MPI 1 4 MPI_ABORT MPI_ABORT

27 SPMD CALL MPI_COMM_RANK (MYRANK) 1 MYRANK 1 MYRANK IF (1) MYRANK IF IF (1) (2) 19

28 3 2 MYRANK DO MYRANK DO (1) N 9 ISUM ( (2) ) DO DO I=1, DO I=1,3 DO I=4,6 DO I=7, (1) (2) MYRANK DO (3) 1 2 MYRANK ISTA IEND DO I=1,9 I=ISTA,IEND 3 ISUM (4) DO DO (9) (3) N1 N2 NPROCS (3) 1/n ( n ) ISUM ISUM (3)

29 (3) (4) 21

30 3 3-3 MPI (1) (2) 3 CALL MPI_BCAST (1) MPI_COMM_WORLD CALL MPI_BCAST MPI_COMM_WORLD (2) IWORLD2 IWORLD2 2 SPMD (2) (1) (2) 22

31 (1) A A B 1 2 B (2) (3) ( 2 B ) 0 B 1 2 B 0 1 MPI MPI_BARRIER MPI_BARRIER MPI_BARRIER (1) (2) (3) 23

32 MPI MPI (* MPI-2 ) ( 1) ( 3) ( 1) MPI_BCAST ( 2) MPI_GATHER MPI_SCATTER MPI_ALLGATHER MPI_ALLTOALL MPI_GATHERV MPI_SCATTERV MPI_ALLGATHERV MPI_ALLTOALLV *MPI_ALLTOALLW ( 3) MPI_REDUCE MPI_ALLREDUCE MPI_SCAN *MPI_EXSCAN MPI_REDUCE_SCATTER MPI_BARRIER MPI_OP_CREATE MPI_OP_FREE MPI-1 ( ) 24

33 MPI_BCAST MPI_BCAST (1) 4 IMSG 0 IMSG 1 4 IMSG 0 MPI_BCAST 0 IMSG IMSG MPI_BCAST (1) (2) (3) (1) (2) (3) 25

34 (2) 1 3 (NPROCS) (MYRANK) NPROCS IMSG 1 4 IMSG 0 5 IMSG MPI_BCAST 7 MPI_BCAST 1 (IMSG) MPI_BCAST 1 ( 0 ) ( 0 ) 7 IMSG (4) (5) 7 ( 6 8 ) IMSG (4) (5) (6) (7) (8) 26

35 3-3 MPI MPI_BCAST 2 3 MPI MPI (3-5 ) MPI Fortran (9) C (9) (1) (2) MPI_INTEGER (4) (5) (6) (7) (8) 1 ( ) MPI 2 1 MPI (3-5 ) 27

36 3 MPI_BCAST (1) 0 0 SPMD (2) CALL MPI_BCAST MPI_BCAST (10) 4 MYRANK MYRANK (10) MPI_BCAST (2) MPI_COMM_WORLD 5 CALL MPI_BCAST SPMD (2) CALL MPI_BCAST CALL MPI_BCAST SPMD (11) CALL MPI_BCAST (11) ( 0 IMSG KMSG) (11) (12) (11) (12) MPI Segmentation fault MPI MPI ( [15]) MPI MPI MPI_BCAST (ierror) MPI_SUCCESS 28

37 MPI_GATHER MPI_GATHER MPI_GATHER (1) MPI_GATHER MPI_GATHER MPI_BCAST MPI_GATHER 1 MPI _BCAST 1 1 MPI_BCAST (MPI_BARRIER ) 2 ( 2) V MPI_SCATTER(V) MPI_ALLGATHER(V) MPI_ALLTOALL(V)(W) ( 2) MPI_GATHER MPI_SCATTER MPI_ALLGATHER MPI_ALLTOALL MPI_GATHERV MPI_SCATTERV MPI_ALLGATHERV MPI_ALLTOALLV MPI_ALLTOALLW V (MPI_GATHER ) (1) (1) (2) V (MPI_GATHERV ) (1) (2) (2) (1) MPI_GATHER (2) MPI_GATHERV 29

38 3 ( 2) MPI_GATHER MPI_SCATTER MPI_ALLGATHER MPI_ALLTOALL MPI_GATHERV MPI_SCATTERV MPI_ALLGATHERV MPI_ALLTOALLV(W) ( 3) MPI_REDUCE MPI_ALLREDUCE MPI_SCAN MPI_REDUCE_SCATTER (4-5-7 ) ( (2) ) (1) A A ( (1) A(1) A(2) A(3)) 0 0 A A(1) 1 A(2) 2 A(3) MPI_GATHER (1) 0 MPI_GATHER (2) B MPI_SEND MPI_RECV (1) MPI-2 MPI_IN_PLACE (1) (2) 30

39 MPI_REDUCE MPI_REDUCE MPI_ALL REDUCE MPI_SCAN MPI_REDUCE_SCATTER MPI_REDUCE MPI_REDUCE (1) (2) (3) (1) (2) (3) 31

40 (1) N ISUM ISUM (15 24) MPI_GATHER MPI_REDUCE (2) MPI_REDUCE MPI (MPI ) (1) (2) (C 3-7 ) (2) 2 ISUM MPI_SUM (1) (2) MPI (1) (2) MPI MPI_SUM MPI_MAX MPI_MIN MPI_PROD MPI_MAXLOC MPI_MINLOC ( 1) MPI_INTEGER4 ( 2) MPI_REAL4 ( 3) MPI_REAL8 ( 4) MPI_COMPLEX16 MPI_DOUBLE_COMPLEX ( 5) MPI_2REAL (1) MPI_2INTEGER = {MPI_INTEGER, MPI_INTEGER} MPI_2REAL = {MPI_REAL, MPI_REAL} MPI_2DOUBLE_PRECISION = {MPI_DOUBLE_PRECISION, MPI_DOUBLE_PRECISION} (2) ( 1) (1) ( 1) DO MPI_REDUCE ( MPI_ALLREDUCE) MPI (2) 2 MPI_SUM MPI_REDUCE MPI_ALLREDUCE MPI_MAX (MPI_MIN) MPI_REDUCE MPI_ALLREDUCE 32

41 3-3 MPI_GATHER MPI-2 MPI_IN_PLACE (2) ISUM ITMP 4 ISUM ITMP 4 ISUM ISUM ITMP 3 ITMP ISUM ISUM DO a b c (a + b) + c = a + (b + c) (a + b) + c a + (b + c) A(1) A(8) (2 ) (4 ) (A) (B) (C) [ ] (A) A(1) + A(2) + A(3) + A(4) + A(5) + A(6) + A(7) + A(8) (B) (2 ): [A(1) } + A(2) {{ + A(3) + A(4) } ] + [A(5) } + A(6) {{ + A(7) + A(8) } ] 0 1 (C) (4 ): [A(1) }{{ + A(2) } ] + [A(3) }{{ + A(4) } ] + [A(5) }{{ + A(6) } ] + [A(7) }{{ + A(8) } ] (C) MPI_REDUCE (MPI_SUM ) [1] [2] (CG ) DO (2 ) (4 ) [2] (4 ) MPI_ALLREDUCE MPI_ALLGATHER MPI_ALLREDUCE 33

42 MPI_MAXLOC/MPI_MINLOC (1) MPI_MAXLOC MPI_MINLOC (2) DO (1) N (IMAX = 90) (LOC = 4) (3) 2 N (ISTA IEND) 4 MPI_REDUCE MPI_MAX 1 2 ISEND 3 ISEND 1 2 (IMAX) (ILOC) 4 MPI_MAXLOC MPI_2INTEGER (1) 0 IRECV 1 2 MPI_MAXLOC MPI_MAXLOC (1) 2 MPI MPI_2INTEGER C MPI MPI (MPI_FLOAT_INT ) (3-7 ) Fortran MPI (4) 1 MPI (1) MPI_2REAL MPI_2DOUBLE_PRECISION ( ) (4) (1) (2) (3) 34

43 (1) (2) (0 1) 2 = 0 (1 2) (0 1) [ ] (0 1 = 1 0 ) TRUE..TRUE. 0 (1 2) (1 2) 0 1 (0 2) (0 2) 1 2 (0 1) (0 1) 2 0 (2 1) (2 1) 0 1 (2 0) (2 0) 1 2 (1 0) (1 0) 2 [ ] ( ) FALSE. 3 A B C (A B) C = A (B C) A B B A 0 (1 2) (0 1) 2 ( (1) MPI_SUM ) MPI MPI_OP_CREATE EXTERNAL 2 [ ].TRUE. [ ].FALSE. 3 3 ( (1) MPI_SUM ) 2 MPI ID ISUM ISUM COMMON MODULE 3 4 IN INOUT LEN ITYPE C 4 ANSI-C ( [15] [27] ) typedef void (void *invec, void *inoutvec, int *len, MPI_Datatype *datatype); 35

44 3 SAMPLE.TRUE. 2 2.TRUE. 5 IN INOUT 3 4 IN INOUT ( 3 ISEND) ( (1) (2) ) LEN 3 3 ( 1) ITYPE 3 4 ( MPI_INTEGER) Fortran 6 IN INOUT (1) (2) INOUT INOUT 4 MPI MPI_ABORT.FALSE. 2 2.FALSE..TRUE. ( ISEND ) IN INOUT (3) (4) IN INOUT 6.FALSE (1) (3) (2) (4) 36

45 3-3 MPI Fortran MPI_REDUCE MPI_MAXLOC MPI_MAXLOC (2) (1) A I KOUZOUTAI (2) 1 X XX 4 9 PARA_MAXLOC MPI_MAXLOC XINOUT (1) (60.) (9 6) MPI_MAXLOC (6) PARA_MAXLOC IMAXLOC MPI 3 6 (3-5-4 ) IKOUZOU IKOUZOU 8 7 X 8 IMAXLOC MPI_REDUCE (1) ( 60.0) ( 9 6 6) 0 XX (1) (2) 37

46 (1) 2 Z ( 60.0) MPI_REDUCE MPI_MAXLOC 1 2 MPI_MAXLOC (3) (2) 1 J 3 2 (3-5-4 ) 4 J (60.) (2) MPI_MAXLOC FALSE. 5 XIN XINOUT (1) (2) (3) 38

47 (1) MPI ( [15] [27]) MPI_SUM MPI_PROD (MPI_COMPLEX16 MPI_DOUBLE_COMPLEX) (1) (2) (1) (2) 4 1 MPI_REDUCE 2 1 (4-1-2 ) (1) (2) (1) (2) 39

48 ( 1 1 ) MPI_SEND MPI_RECV SPMD 1 1 MPI 1 2 MPI ( MPI_SEND) MPI_SEND MPI ( MPI_RECV) MPI_RECV

49 MPI 1 1 MPI 1 1 MPI_SEND MPI_RECV MPI_SENDRECV MPI_ISEND MPI_IRECV + MPI_WAIT + MPI_WAIT (MPI_SEND) MPI_SEND MPI_SEND MPI_SEND MPI_SEND 4 2 MPI_SEND MPI_SEND buf buf 2 MPI_RECV ( MPI_IRECV) MPI_ISEND

50 3 (MPI_ISEND) MPI_ISEND MPI_WAIT MPI_ISEND MPI_WAIT MPI_ISEND 4 2 MPI_SEND MPI_WAIT 6 MPI_ISEND 2 MPI_WAIT 3 (ID) MPI_ISEND 3 request request 3 5 MPI_ISEND MPI_WAIT MPI_ISEND MPI_WAIT request MPI_WAIT MPI_ISEND MPI_WAIT MPI_SEND MPI_ISEND 2 (1) (1) MPI_SEND MPI_ISEND + MPI_WAIT 2 (3-4-4 ) (2) CPU CPU ( 2 2 )

51 (MPI_RECV) MPI_RECV MPI_RECV buf MPI_RECV 2 6 MPI_RECV buf buf

52 3 (MPI_IRECV) MPI_IRECV MPI_WAIT MPI_IRECV MPI_WAIT MPI_IRECV 3 8 MPI_RECV buf 8 4 MPI_WAIT 5 MPI_IRECV 3 MPI_WAIT 2 (ID) MPI_IRECV 2 request request 2 4 MPI_IRECV MPI_WAIT MPI_IRECV MPI_WAIT request MPI_WAIT MPI_IRECV MPI_WAIT MPI_RECV MPI_RECV MPI_IRECV + MPI_WAIT MPI_ISEND 2 (3-4-4 ) ( CPU CPU )

53 (1) 0 ISEND 1 IRECV (1) SPMD 1 1 MPI_SEND MPI_ISEND MPI_RECV MPI_IRECV MPI_SEND MPI_ISEND MPI_RECV MPI_IRECV (2) (2) 45

54 MPI_(I)SEND MPI_SEND MPI_ISEND MPI_WAIT

55 (1) MPI_SEND (2) 2 MPI_ISEND MPI_WAIT (3) 3 MPI_WAIT (1) (2) (3) MPI_SEND MPI_SEND (1) (2) 1 4 MPI_(I)RECV (3) (2) 1 MPI_SEND 0 2 [2] 4 MPI_(I)RECV 0 MPI_SEND (2) 0 1 MPI_SEND 4 4 MPI_(I)RECV MPI_SEND MPI_ISEND MPI_WAIT (3) MPI_ISEND MPI_(I)RECV

56 (1) MPI_RECV (2) 2 MPI_IRECV MPI_WAIT (3) 3 MPI_WAIT (1) (2) (3) MPI_RECV (1) 1 4 MPI_(I)SEND (2) (1) 1 MPI_RECV 0 2 [1] 4 MPI_(I)SEND 0 MPI_RECV (1) 0 1 MPI_RECV 4 4 MPI_(I)SEND MPI_RECV MPI_IRECV MPI_WAIT (3) MPI_IRECV MPI_(I)SEND

57 (1) (1) ( MPI_WAIT ) IF (2) (2) (1) (2) (2) (1) MPI_SENDRECV 1 1 MPI_SENDRECV (1) (2) ( ) MPI_SEND MPI_RECV MPI_ISEND MPI_IRECV MPI_SENDRECV (1) (2) 49

58 ( ) (MPI_SEND ) 2 1 MPI (4-6-2 ) (1) (2) ( 1 3) (1) (2) 50

59 (1) 0 A 1 B (1) (2) MPI (1) 0 A TEMP 1 TEMP B TEMP (2) TEMP (1) (2) (1) (2) 51

60 (1) IBUF MPI INEWTYPE1 MPI_INTEGER MPI MPI (3-3-4 ) INEWTYPE1 INEWTYPE1 MPI_BCAST (1) IBUF(4) 1 INEWTYPE1 0 IBUF IBUF (1) (2) INEWTYPE2 IBUF(4) 3 INEWTYPE (2) (3) (3) 52

61 MPI MPI MPI_TYPE_SIZE MPI (MPI_INTEGER ) (1) MPI_TYPE_CONTIGUOUS ( 3 ) (2) MPI_TYPE_VECTOR/MPI_TYPE_HVECTOR (2) (5) (1 ) MPI_TYPE_VECTOR MPI_TYPE_HVECTOR (3) MPI_TYPE_CREATE_INDEXED_BLOCK MPI-2 ( (7) ) ( ) (4) MPI_TYPE_INDEXED/MPI_TYPE_HINDEXED ( (7) ) MPI_TYPE_INDEXED MPI_TYPE_HINDEXED 53

62 3 (5) MPI_TYPE_STRUCT ( (7) ) (3-5-4 ) (6) MPI_TYPE_COMMIT (2) (1) MPI_TYPE_CONTIGUOUS 2 MPI_TYPE_COMMIT MPI 1 1 MPI_TYPE_COMMIT (7) MPI (MPI_INTEGER ) (1) (2) (8) (9) (3) (4) (5) (1) 2 MPI_TYPE_CONTIGUOUS (1) (2) (8) (9) (1) (2) 54

63 3-5 (8) (1) (MPI_TYPE_STRUCT ) (5) MPI_TYPE_STRUCT (3) 1 0 MPI_LB (LB Lower Bound ) 1 0 MPI_UB (UB Upper Bound ) 2 MPI_TYPE_CONTIGUOUS (3) (3) MPI (MPI_INTEGER ) (1) (4) (1) (4) (4) MPI_TYPE_STRUCT MPI_LB MPI_UB (3) (4) (9) (2) (MPI_TYPE_CREATE_RESIZED ) MPI-2 MPI_TYPE_CREATE_RESIZED MPI (MPI_INTEGER ) (1) (5) (5) (7) (3) (4) (5) (6) (6) MPI_TYPE_CREATE_RESIZED (5) (6) 55

64 (1) 0 Fortran 2 1 (C ) (3-1 ) (2) (3) (4) (4-5-7 ) (5) (6) 1 ( 1 ) (6) (7) (1) (2) (3) (4) (1) (5) (6) (7) (2) (2) (3) (6) (7) (2) (3) (6) (7) (1) (2) (1) (2) MPI 1 MPI-2 MPI_TYPE_CREATE_SUBARRAY MPI-2 MPI_TYPE_CREATE_SUBARRAY (Fortran ) MPI_TYPE_CREATE_SUBARRAY MPI-1 MPI-2 MPI-2 MPI_TYPE_CREATE_SUBARRAY 56

65 MPI_TYPE_CREATE_SUBARRAY MPI-2 MPI_TYPE_CREATE_SUBARRAY (1) N(2:5,-1:4) (2) MPI_TYPE_CREATE_SUBARRAY MPI (2) 1 MPI_TYPE_CREATE_SUBARRAY (1) ISIZE ISUBSIZE 4 [0] ( (1) ) ISTART 5 2 C MPI_ORDER_C 5 N INEWTYPE 6 INEWTYPE MPI INEWTYPE 7 INEWTYPE N ( N(2,-1)) 7 3 N 1 INEWTYPE (1) (2) 57

66 MPI_TYPE_CREATE_SUBARRAY MPI-2 MPI-2 MPI-1 (Fortran ) PARA_TYPE_BLOCK2A PARA_TYPE_BLOCK2 PARA_TYPE_BLOCK2A (1) 2 N INEWTYPE PARA_TYPE_BLOCK2A (2) (1) PARA_TYPE_BLOCK2A (1) INEWTYPE ( MPI_TYPE_CREATE_SUBARRAY ) INEWTYPE 2 N(3,1) 2 3 N(3,1) 1 INEWTYPE (1) (2) PARA_TYPE_BLOCK2 MPI_TYPE_BLOCK (2) (1) (1) INEWTYPE N ( MPI_TYPE_CREATE_SUBARRAY ) INEWTYPE 4 N ( N(2,-1)) 2 3 N 1 INEWTYPE (1) (2) 3 PARA_TYPE_BLOCK3A PARA_TYPE_BLOCK3 58

67 (2) (4) MPI_TYPE_SIZE MPI_TYPE_EXTENT MPI_TYPE_SIZE (MPI_TYPE_EXTENT ) PARA_TYPE_BLOCK2A ioldtype 2 (imin:imax, ) ilen jlen 2 inewtype MPI CALL PARA_TYPE_BLOCK2A(imin, imax, ilen, jlen, ioldtype, inewtype) imin: 2 1 imax: 2 1 ilen: 2 1 jlen: 2 2 ioldtype: MPI_INTEGER inewtype: (1) 59

68 3 PARA_TYPE_BLOCK (2) MPI_TYPE_SIZE MPI_TYPE_EXTENT MPI_TYPE_SIZE (MPI_TYPE_EXTENT ) ioldtype 2 (imin:imax, jmin: ) (ista:iend, jsta: jend) inewtype MPI CALL PARA_TYPE_BLOCK2(imin, imax, jmin, ista, iend, jsta, jend, ioldtype, inewtype) imin: 2 1 imax: 2 1 jmin: 2 2 ista: 2 1 iend: 2 1 jsta: 2 2 jend: 2 2 ioldtype: MPI_INTEGER inewtype: (2) 60

69 3-5 PARA_TYPE_BLOCK3A (3) MPI_TYPE_SIZE MPI_TYPE_EXTENT MPI_TYPE_SIZE (MPI_TYPE_EXTENT ) ioldtype 3 (imin:imax, jmin:jmax, ) ilen jlen klen 3 inewtype MPI CALL PARA_TYPE_BLOCK3A(imin, imax, jmin, jmax, ilen, jlen, klen, ioldtype, inewtype) imin: 3 1 imax: 3 1 jmin: 3 2 jmax: 3 2 ilen: 3 1 jlen: 3 2 klen: 3 3 ioldtype: MPI_INTEGER inewtype: (3) 61

70 3 PARA_TYPE_BLOCK (4) MPI_TYPE_SIZE MPI_TYPE_EXTENT MPI_TYPE_SIZE (MPI_TYPE_EXTENT ) ioldtype 3 (imin:imax, jmin:jmax, kmin: ) (ista: iend, jsta:jend, ksta:kend) 3 inewtype MPI CALL PARA_TYPE_BLOCK3(imin, imax, jmin, jmax, kmin, ista, iend, jsta, jend, ksta, kend, ioldtype, inewtype) imin: 3 1 imax: 3 1 jmin: 3 2 jmax: 3 2 kmin: 3 3 ista: 3 1 iend: 3 1 jsta: 3 2 jend: 3 2 ksta: 3 3 kend: 3 3 ioldtype: MPI_INTEGER inewtype: 62

71 (4) 63

72 MPI (MPI_INTEGER ) (1) (2) (1) KOUZOUTAI 2 WORK 3 8 WORK IKOUZOU MPI MPI_TYPE_STRUCT MPI_TYPE_STRUCT (1) KOUZOUTAI 3 3 MPI_TYPE_STRUCT 3 (= ) [ 1] 4 2 [ 2] 8 1 [ 3] IBLOCK 5 IDISP ( (1) ) 6 ITYPE 7 MPI MPI_TYPE_STRUCT IKOUZOU KOUZOUTAI 8 IKOUZOU MPI IKOUZOU MPI 9 0 WORK 10 IKOUZOU 10 WORK(2) 2 CALL MPI_BCAST (WORK,2,IKOUZOU, ) (1) (2) 64

73 MPI MPI_COMM_WORLD 3-1 MPI MPI_COMM_SPLIT MPI_COMM_SPLIT MPI_COMM_SPLIT ( 1995 ) MPI ( ) MPI_COMM_SPLIT ( IKOUZOU) ( IRYUTAI) ( 0 1 2) IKOUZOU MPI_COMM_WORLD

74 3 3-7 C MPI C MPI MPI_BCAST C Fortran C MPI Fortran MPI Fortran C C [15] [27] C C MPI [37] [38] C MPI MPI (MPI_COMM_WORLD ) Fortran C Fortran ierror C MPI int ierr; ierr = MPI_Finalize(); Fortran mpif.h C mpi.h Fortran INTEGER ISTATUS(MPI_STATUS_SIZE) C MPI_Status istatus; MPI 66

75 3-7 C MPI C MPI MPI MPI_FLOAT_INT (Fortran MPI _2REAL ) 2 (3-3-6 ) (1) (2) MPI_FLOAT_INT = {MPI_FLOAT, MPI_INT} MPI_DOUBLE_INT = {MPI_DOUBLE, MPI_INT} MPI_LONG_INT = {MPI_LONG, MPI_INT} MPI_2INT = {MPI_INT, MPI_INT} MPI_SHORT_INT = {MPI_SHORT, MPI_INT} MPI_LONG_DOUBLE_INT = {MPI_LONG_DOUBLE, MPI_INT} 67

76 3 3-8 MPI MPI MPI-2 MPI MPI_IN_PLACE ( 2) MPI_GATHER MPI_SCATTER MPI_ALLGATHER MPI_ALLTOALL MPI_GATHERV MPI_SCATTERV MPI_ALLGATHERV MPI_ALLTOALLV MPI_ALLTOALLW ( 3) MPI_REDUCE MPI_ALLREDUCE MPI_SCAN MPI_EXSCAN MPI_REDUCE_SCATTER MPI-2 MPI_ALLREDUCE (1) S MPI_ALLREDUCE (2) SS S SS MPI (1) 1 MPI-2 MPI_IN_PLACE (2) S MPI_ALLREDUCE S SS MPI_IN_PLACE MPI_IN_PLACE MPI MPI-2 MPI_IN_PLACE MPI-2 MPI MPI-2 MPI_IN_PLACE MPI_IN_PLACE (1) (2) (1) (2) 68

77 4 3 69

78 (%) P (%) ( 75%) ( P (%) N ( 3 ) 100 P (%) P (%) N P/N (%) (100 P ) + P/N (%) 1 N (1) (2) (1) (2) (1) 70% % % % N (3) 80% (1) (2) (3) 70

79 (1) 4 80% % 1 15% 4 25% (1) (1) (2) (3) (1) SOR (5-6 ) (4-6-9 ) (2) (DO 4 1/4 ) (3) CPU ( 3 3 ) (2) ( [6] 4 ) (3) (2) (3) 71

80 (latency) (1) 2 (1) A 1 (I ) ( ) (a) (b) 1 I/O CPU

81 4-1 MPI (3-5 ) (1) DO CALL MPI_BCAST DO (2) DO (1) (2) (2) 2 (2) (1) (2) (2) (2 ) (3 ) (1) (2) 73

82 (1) n αn 2 βn 2 n 2 I/O α β / = β/α (1) (2) 1 βn n / = β/αn n (1) (2) % 20% 2 1/2 4 1/ CPU

83 MPI DO DO (1) (2) A(1) 4-8 (2) (1) (2) A(1) (2) (2) 1 0 A(2) A(2) DO ( (1) (4-6-9 )) S = S + A(I) X = MAX(X,A(I)) (4-6-4 ) (1) (1) (2) (2) 75

84 4 DO (1) A(I) A(I-1) (2) ( DO I=10,1,-1) DO (1) (2) DO (1) 1/n (2) (3) (1) (2) (3) 76

85 4-2 (2) DO DO (2) (1) (2) (3) I/O DO I/O DO ( I/O DO ) (2) I/O I/O (1) (2) (4) (1) 1 3 DO (1) (2) (2) ( 3 ) (1) (2) 77

86 4 4-3 DO (1) A 2 A 1 3 W A DO (2) 5 5 1/n 5 A 5 6 A ( (4) ) MPI_ALLGATHER(V) ( ) 6 ( 2 ) W W (4) n n

87 (1) (2) (3) (4) 79

88 4 2 DO (1) (1) (2) ( (4)) /n A B CALL SHIFT ( ) B ( 4 ) 5 B ( OpenMP ) MPI 2 2 DO OpenMP MPI 80

89 (1) (2) (3) (4) 81

90 (1) (1) DO (2) (1) (3) (2) (3) (1) (2) (3)

91 4-3 ( 1 m 2 m... ) (2) (3) 83

92 (READ ) MPI ( 5 ) (1) (3) READ (1) (3) (2) rcp (2) (1) (2) (3) 84

93 (1) (2) 0 MPI_BCAST (3) (4) 0 MPI_SCATTER MPI_SCATTER X Y Y ( ) (1) (3) (2) (4) (5) (6) 0 0 STOP (7) MPI_ABORT (8) STOP MPI_ABORT (5) (6) (7) (8) 85

94 (1) [1] [2] (2) NFS [1] [2] [2] (2) (1) (1) (2) (1) (2) 86

95 (1) (2) (3) (4) (5) (4) (2) (1) (3) (5) MPI MPI-2 MPI-IO I/O MPI-1 MPI-IO 87

96 (WRITE PRINT ) (1) (WRITE(6) PRINT ) (2) (3) (1) MPI (1) (2) (3) (1) (2) (1) (2) MPI_GATHER(V) 0 0 MPI_GATHER Y Y 0 X ( ) X (4-5-7 ) (2) (1) (1) (2) 88

97 (1) 10 1 err= (2) 10 1 err= ( 1) (3) 9 MPI_BARRIER ( 1 ) (1) (2) (3) (1) [1] (2) [2] cat 1 NFS [1] [2] [2] (2) (1) 89

98 (1) (2) (1) (2) 4 6 MPI-2 MPI-IO I/O MPI-1 MPI-IO 90

99 I/O CPU I/O 4-2 I/O I/O I/O I/O WRITE 0 IF WRITE IF IF MPI_FINALIZE ( MPI_FINALIZE )

100 DO DO (1) (3) = (1) DO A B C 1 1 ( (2) ) (3) N DO A (4) DO (5) A DO (1) 1 1 DO (3) (4) (1) (2) (3) (4) (5) 92

101 / (1) 2 1 (4-5-8 ) (1) (2) 1 (4-5-8 ) (2) (3) (4-5-3 ) (3) 93

102 (4) (4) (1) (5) (4-5-7 ) A B A B ( [6] ) (6) (5) (6) (2) (5) (6) 94

103 (2) (2) (1) (2) (3) (3) (2) (1) (2) (3) 95

104 (1) (1) (2) (1) (2) (3) (4) (5) (3) (4) (5) 96

105 (1) ( 5-3 LU ) (2) (1) (2) (1) (12) (1) (2) (1) (2) 97

106 DO ( (1)) (2) DO (1) (2) ( 0 3) (1) (3) (4) (3) (3) (4) (2) (5) (6) ( 2) (5) (6) (3) (5) 98

107 4-5 n1 (= 1) n2 (= 20) nprocs (= 4) irank (= 0) ista (= 1) iend (= 5) (1) (2) CALL PARA_RANGE(, n2, nprocs, irank, ista, iend ) n1 }{{} 1 }{{} 20 }{{} 4 }{{} 0 }{{} 1 }{{} 5 n1: n2: nprocs: irank: 0 irank (nprocs-1) ista: irank iend: irank (1) (2) 2 1 (IEND-ISTA+1) (4-8-2 (2) ) (4-8-1 (5) ) 99

108 (1) A(1) A(N) (N = 1000) PARA_RANGE ( 1) (2) (3) (1) (3) (2) (4) 1 ISTA IEND (5) ( (6) ) (4) (5) (6) 100

109 (1) DO NPROCS (2) (3) MYRANK+N1 1 NPROCS (1) (3) (2) 2 DO I=N1,N (4) (5-3 ) 1 I (MAP) 1 2 DO 3 IF 1 (MYRANK) 4 4 DO 3 IF 4 DO 3 IF (4) MAP (5) (4) (5) 101

110 (IRANK) (6) (1) (1) (2) 102

111 (1) DO NPROCS (2) (3) 1 IBLOCK ( 2) (2) DO II (3) DO I (1) (3) (2) 2 2 (MAP) (4) MAP (5) IF (4) (5) 103

112 (6) (7) MAP ICOUNT (6) 2 MAP ICOUNT (6) (7) 104

113 (1) 256 MB (1) 256 MB A (2) A 1/ (3) A (1) (1) (2) (3) 105

114 Fortran 90 ( [6] 2-6 ) (ALLOCATE ) (DEALLOCATE ) (1) DO N1 N (2) 3 A (1) 106

115 (2) (3) (2) (3) /2 = /4 = 25 A 5 (NCPU) 6 7 A NCPU (NCPU) mpirun -np 3 a.out (NPROCS) (2) 1 3 (ISTA IEND) A I I ISTA A ISTA-ISTA (2) 2 1 I I (2) (3) 107

116 (3) (2) 1 3 A A (4) (4) (3) IEND-ISTA A I I 13 1 I I = 1 14 I+ISTA-1 ISTA 9 I = ISTA 10 ISTA (3) (4) (3) DO (4) STA IEND-STA (4) 108

117 4-5 3 Fortran 90 (C malloc ) (1) [6] REAL*8 A B 1 A(:) 2 B(:,:) 2 A B IMAX JMAX IMAX JMAX 3 A B A B 3 IERR ALLOCATE 3 A B A B (2) (1) (2) COMMON COMMON Fortran 90 MODULE USE MODULE COMMON INCLUDE USE INCLUDE (3) 7 MODULE ( COM) MODULE END USE MODULE USE ( [6] 2-6 ) USE MODULE END INCLUDE USE MODULE END IMPLICIT MODULE END USE IMPLICIT 109

118 4 8 IMAX JMAX SUB IMAX JMAX MODULE COMMON INCLUDE INCLUDE (3) (1) (1) (1) 1 A 2 (ISTA) (IEND) 3 1 A(ISTA:IEND) (2) A (3) (4) DO (2) 110

119 (1) (1) (1) (2) (1) (1) (2) 111

120 (I/O ) I/O (1) A B 1 2 A B (2) (1) (2) DO (1) (2) 5 A (3) (1) (2) (3) 112

121 4-5 (3-5 ) (1) 2 A(6,2) (1) PARA_TYPE_BLOCK2A (1) ITYPE (2) 3 PARA_TYPE_BLOCK2 (MPI-2 MPI-2 MPI_TYPE_CREATE_SUBARRAY ( ) ) (2) ITYPE A (3) (3) 5 6 A (1) (1) (2) (2) (3) (3) 113

122 (I/O ) I/O (1) 1 X(2,6) 2 1 WRITE (2) READ Y(2,6) 4 2 X Y (1) (2) (1) MPI-IO temp temp 2 ( 3 ) (1) X (1) (2) (1) (2) (3) (1) (1) [1] X(2,6) PARA_RANGE 2 JJSTA JJEND [2] 2 JSTA JEND [3] X [4] [5] 0 ( (2) [5] ) (1) X 1 WRITE [5] 1 [6] DO IRANK = ( 0 ) [11] 0 0 [7] 1 temp [8] [9] 10 [10] temp [6] DO IRANK = 2 2 [5] [9] 1 WRITE (1) (2) 1 WRITE 1 ( 3 3 ) (1) (2) (1) 114

123 (2) (1) (2) (1) (2) (3) (2) 115

124 (1) 1 temp 1 temp (1) (2) temp (2) (1) (2) (1) (1) (1) [1] 2 [2] 2 JSTA JEND [3] Y [4] 1 [5] Y 1 [6] (1) (2) (1) (2) (2) (2) 116

125 DO (1) (2) Fortran 2 A A(1,1) A(2,1) (1) C (2) ( [6] 4 ) (1) (2) (1) ( 1/n ) J (1) I (2) (2) (1) (1) (1) (2) 117

126 (1) (2) A B (3) J (4) I 3 Z DO X Y Z (1) (2) (3) (4) (5) (6) (7) (8) (5) (6) (7) (8) 118

127 (1) (2) A B I J (3 ) (3 ) I J (3) J (4) I (1) (2) (3) (4) 119

128 4 2 I J I J (1) (2) (3) ( 2 1 ) 2 ( 4 2 = 8) (1) (2) (3) 120

129 /n (1) DO A DO 1 A(6) (4) (2) (5) A(6) 2 ( 0 1 ) (3) DO 2 2 A(6) DO 1/n ( n ) DO (1) (2) (3) (4) (5) (6) 121

130 (1 ) (1) 1 A 2 A B (2) 3 A B (3) 1 1 A(5) A(8) 2 B(5) B(8) 2 A(4) A(9) A(4) 1 0 A(9) A(4) 0 A(9) 2 1 A(5) 0 A(8) A(4) A(9) (2) (1) (3) (1) (1) (4) ( (1) (4) 6 9 ) A B (3) A B A ( 1 ) 1 N B ( 2 ) 2 N-1 A B 122

131 (1) 3 PARA_RANGE (4-5-4 ) A (1 N) A ( 1 ) (ISTA) (IEND) 3 B ( 2 ) (ISTA2) (IEND1) (3) ISTA2 ISTA IEND2 IEND 0 ISTA2 ISTA 2 IEND1 IEND 0 ISTA IEND ISTA2 IEND (3) A B B (N) 3 ISTA IEND ISTA2 IEND (1) (1) (4) (1) 4 IUP IDOWN ( NPROCS-1) IUP MPI_PROC_NULL ( MPI_ISEND MPI_IRECV ) ( 0) IDOWN MPI_PROC_NULL (1) IUP (4) A(IEND) 8 IDOWN (4) A(ISTA-1) MPI_WAIT MPI_WAIT ISTATUS ISTATUS (1) DO A(I-1) A(I+1) A(I-1) (4) 6 8 MPI_WAIT (1) (1) (2) MPI 1 1 MPI_SENDRECV (3) (3) (2) (1) 123

132 (2) (3) (1) (4) 124

133 (1) 1 A(1) (2) A(1) 0 2 IF (1) (2) (1) (1) (2) A(0) A(1) 0 A(N) A(N+1) (2) ( ) (2) 1 4 ElSEIF (3) ELSEIF IF (3) ( 1 ) (4) (4) WAIT WAIT WAIT 15 ( ) (5) WAIT (5) (6) (1) (3) (4) (2) 125

134 (1) (4) (2) (5) (3) (6) 126

135 MPI_GATHERV 0 (4-4-2 ) ( 1) MPI-2 MPI_IN_PLACE (1) 0 A (3-3-5 ) (2) B MPI-2 MPI_IN_PLACE (3-8-1 ) (MPI-2 ) (3) M N 2 A 2 MPI_GATHER MPI_GATHERV (4) [1] 2 0 [2] [3] MPI_GATHERV ( MPI_IN_PLACE ) [2] MPI_IN_PLACE [3] [3] IRCNT(i): i IDISP(i): i (0 8 (14)) (1) (2) (3) (4) 127

136 4 ( 2) MPI-2 MPI_IN_PLACE MPI-2 MPI_IN_PLACE 1 B A MPI_GATHERV (2) [1] JJSTA(i): i 2 JJLEN(i): i [2] [3] MPI_GATHERV (1) 0 [3] 0 0 [2] A [2] DO (1) (2) 128

137 4-6 ( 3) (1) A 1 (Fortran ) (3) [1] MPI_TYPE_CREATE_SUBARRAY ( ) (MPI-2 ) i ITYPE(i) ( (2) ) 1 MPI_GATHERV 1 2 [2] MPI_IRECV IRANK A 1 ITYPE(IRANK) [3] MPI_ISEND A 1 ITYPE(MYRANK) (1) (2) (3) 129

138 MPI_ALLGATHERV (4-8-1 ) ( 4) MPI-2 MPI_IN_PLACE (1) A (3-3-5 ) (2) B 1 MPI-2 MPI_IN_PLACE (3-8-1 ) (MPI-2 ) (3) M N 2 A 2 MPI_ALLGATHER MPI_ALLGATHERV (4) [1] 2 [2] MPI_ALLGATHERV ( MPI_IN_PLACE ) [2] MPI_IN_PLACE IRCNT(i): i IDISP(i): i (0 8 (14)) (1) (2) (3) (4) 130

139 4-6 ( 5) MPI-2 MPI_IN_PLACE MPI-2 MPI_IN_PLACE 4 B A MPI_ALLGATHERV MPI_BCAST (2) [1] JJSTA(i): i 2 JJLEN(i): i [2] MPI_ALLGATHERV (1) MPI_BCAST [2] (1) (2) 131

140 4 ( 6) (1) A 1 (Fortran ) (3) [1] MPI_TYPE_CREATE_SUBARRAY ( ) (MPI-2 ) i ITYPE(i) ( (2) ) 4 MPI_ALLGATHERV 1 5 [2] MPI_BCAST ( IRANK) A 1 ITYPE(IRANK) IRANK A 1 ITYPE(IRANK) (1) (2) (3) 132

141 MPI_ALLTOALLV FFT ADI (6 ) FFT (4-6-7 ) (4-6-8 ) (1) A (2) B ( A) 1 A B ( A) (1) (2) (1) (2) 133

142 MPI MPI_ALLTOALLV (4-5-7 ) (1) (3-5 ) (1) ISTYPE(i) i IRTYPE(i) i MPI_ALLTOALLV (sendtype recvtype) 1 MPI-2 MPI_ALLTOALLW (MPI-2 ) (2) A A B (3-3-5 ) A A A B (MPI_ALLTOALLW MPI-2 MPI_IN_PLACE (3-8 ) ) (1) (1) [1] (1) PARA_TYPE_BLOCK2 (MPI-2 MPI-2 MPI_TYPE_CREATE_SUBARRAY ( ) ) ISTYPE IRTYPE [2] MPI_ALLTOALLW ISCNT(i) i IRCNT(i) i 1 ISDISP(i) A i IRDISP(i) B i ISTYPE IRTYPE A B (3-5-3 ) 0 [3] B (2) B A A (2) [5] (1) (1) ISTYPE IRTYPE [6] [7] [8] IREQ1 IREQ2 [4] [9] [7] [8] MPI_WAIT (2) (3) [10] I = (2) 1 ( 2 0 ) 1 [10] I = (2) 2 2 [10] I (3) MPI_SENDRECV (4-6-2 ) (4) 134

143 (2) (1) (3) (4) 4 135

144 (1) (2) (2) 2 3 MPI_SUM MPI_REDUCE MPI_ALLREDUCE SUM1 SUM2 MPI_ALLREDUCE SUM1 SUM2 MPI_ALLREDUCE WORKS WORKR (2) 4 MPI_MAX (MPI_MIN) MPI_REDUCE MPI_ALLREDUCE MPI_ALLREDUCE 10 MPI_REDUCE (1) (2) 136

145 (3) (4) 1 MPI_REDUCE 2 1 MPI_REDUCE 3 SUM3 TEMP SUM3 MPI_REDUCE SSUM3 TEMP SUM (3) (4) 137

146 (1) I ( 1 ) (2) 1 0 A(1) 3 A(1) 1 2 A(1) A(1) ( (4) ) (3) 1 2 A(1) 2 0 A(1) (5) 1 2 A(1) 0 A(1) 4 TEMP 5 6 TEMP (1) (2) (3) (4) (5) 138

147 MPI_(ALL)REDUCE (4-6-4 ) (1) DO (2) MAP MAP (3) MAP DO 3 DO X (4) X (4) MPI_GAHTERV 0 0 X MPI_TYPE_CREATE_INDEXED_BLOCK (2) (1) (3) (4) (5) (7) (5) 1 X 2 3 X MPI_REDUCE X 0 XX (4) MPI_REDUCE X XX ( MPI-2 MPI_IN_PLACE ) 139

148 (5) 1 X (6) 4 X (5) (6) (7) (1) (3) (4) (4) (1) (2) (3) 140

149 (1) (2) (1) A X A X ( IND ) A X (3) A X A (5) A MPI_ALLTOALLV A A X (3) (1) (2) (4) 141

150 (4) (6) (4) 1 X 2 A X 4 MPI_REDUCE_SCATTER (MPI_REDUCE MPI_SCATTER ) MPI_REDUCE X (6) MPI_SCATTER 2 ( 3 ) XX (5) MPI_REDUCE_SCATTER X XX ( MPI-2 MPI_IN_PLACE ) (5) (6) 142

151 (ICCG ) (1) (2) (2) ICCG (5-4-1 ) (1) (2) (1) (2) (1) (2) 143

152 (1) X (IBLOCK) ( ) (1) 0 1 (2) (3) (1) [1] 2 JSTA JEND [3] 1 IBLOCK IBLOCK [4] II II 1 1 ( ) [5] IBLKLEN IBLKLEN IBLOCK MX IBLOCK IBLOCK [6] [8] (1) ( 0) 1 ( 2 ) ( [6]) (2) 3 ( [7]) (3) 1 ( 3) ( 2) ( [8]) 1 ( 0 2 ) [2] 144

153

154 4 1 2 ( (2) (4)) (3) (1) (2) (4) (IBLOCK) (1) (2) (3) (1) (3) (1) (2) (3) (1) (3) (3) IBLOCK (1) (2) (3) 146

155 (ADI ) [31] ADI DO (1) (4) 1 ( ) 2 ( ) X DO 3 4 DO X (1) (2) (1) (3) (2) (4) (1) (2) 147

156 (1) (1) (4) (1) (1) 1 IUP IDOWN (2) (1) (2) II JJ JJJ JJ II III III JJJ (3) (1) I J ISTA IEND JSTA JEND PARA_RANGE (4) (5) PARA_TYPE _BLOCK2 (MPI-2 MPI-2 MPI_TYPE_CREATE_SUBARRAY ( ) ) X (1,1) (1) (4) I ITSTA ITEND ITSTAM ITENDP (5) J JTSTA JTEND JTSTAM JTENDP (1) ITSTAM(1,1) 1 ITEND(0,1) X (4-5-7 ) (6) (12) (13) (14) DO (1) (4) (6) DO (1) (6) DO I II (1) 2 3 II = 0 (7) II = 0 J JJ 0 JJ = (1) (8) (10) 1 ( (1) A) ( 2) 1 ITEND ( 1) (11) ( (1) B) 1 ITSTAM (6) II = 2, (10) (11) (9) IF (4-6-7 ) = 2 (1/3) 4 3 =

157 (2) (1) 149

158

159 (1) (6) (3) (13) (4) (14) (2) (12) 151

160 (1) X(I) X(I-1) (4-2 ) (1) X(I) = X(I-1) + ( [18] ) (1) (2) (3) ( [4] ) (1) (2) (3) (1) (1) (2) (1) X(0) Y(1) Y(12) (1) (2) X(0) X(1) X(1) X(2) (1) (2) 152

161 4-6 ( [4] [18] ) X(1) X(12) 4 X (1) (1) (1) (2) (3) (2) (3) 1 N (= 12) X ISTA IEND PARA_RANGE 2 SUM 0 X(0) 3 Y SUM 4 MPI-2 MPI_EXSCAN SUM SSUM MPI_EXSCAN (3) SUM SSUM 4 SUM 0 SSUM MPI-1 MPI_SCAN 5 SSUM 0 X(0) SSUM X(1) X(4) X(7) X(10) ( (1) ) X(1) X(4) X(7) X(10) 7 ( (1) ) 2 m m (2 m )/ (1) (2) 153

162 (3) 154

163 MPI_ALLTOALLV (1) 0 2 MPI_ALLTOALLV ( ) [3] (2) i ISCNT(i) 0 [3] [2] [4] (3) i ISBUF(*,i) [5] MPI_ALLTOALL (2) i IRCNT(i) [6] (3) ISBUF i ISDISP(i) [1] ISBUF 1 10 [6] 10 IRBUF [6] IRDISP [7] MPI_ALLTOALLV [5] IRCNT (3) ISCNT IRCNT (1) (2) (3) 155

164 ( ) (3-4-5 ) MPI_GET_COUNT MPI_GET_COUNT SBUF RBUF [2] [3] 1 0 RBUF RBUF 3 1 [4] MPI_GET_COUNT MPI_GET_COUNT [1] [3] ISTATUS ICOUNT [3] ( 3)

165 MPMD 1 MPMD (Multiple Program Multiple Data) (1-2 ) MPMD 1 MPI (1) (a.out b.out) 0 a.out 1 b.out 2 1 MPMD 1 MPMD (2) a.out a.out MPMD (3) 2 COMMON 4 MPI-1 MPI-2 (3-1 ) (2) (1) (3) 157

166 (1) (2) A 1 5 ( A ) AA 4 MPI_SEND A MPI_RECV 0 AA X A MPI_SEND MPI_RECV MPI_ISEND MPI_IRECV MPI_WAIT (1) (2) ( IKOUZOU IRYUTAI) MPI _COMM_WORLD

167 DO (1) (2) (3) (4) (2) (1) (3) (4) (1) 9 DO (2) (1) (2) 159

168 [0 1 ] 1 10 NSLEEP NSLEEP NSLEEP 0 9 [0 1 ] (1) (2) ( ) (1) (2) END (1) (1) 4 MPI_ANY_SOURCE 4 (IDUMMY) 4 ISTATUS 5 IDEST 6 NSLEEP 7 IDEST ( 4 ) NSLEEP 3 DO 10 8 DO 9 10 NSLEEP DO (= 1) MPI_RECV MPI_IRECV MPI_WAIT 160

169 4-7 (2) (2) 15 ( DO Fortran 90 ) NSLEEP NSLEEP 18 NSLEEP NSLEEP 4 ( ) (2) (1) 161

170 MPI (1) CPU ( SMP) 2 CPU (1) DO CPU 2 CPU (1) MPI 2 CPU DO (2) SMP 2 CPU SMP DO 1 DO SMP DO (DO ) CPU ( CPU ) (3) MPI 2 CPU CPU MPI 2 CPU (2) ( CPU ) (1) (2) (3) 162

171 4-7 4 CPU (1) 4 CPU (4) MPI 4 MPI MPI ( CPU ) (5) MPI 2 DO SMP MPI SMP (2) ( CPU ) A B (4-5-7 ) A (4) (5) (4) A 25% (5) 50% MPI (4) (5) SMP (4) (4) (5) 163

172 (1) (CPU ) prof (2) ( [6] ) CPU prof CPU (3) prof 4-3 CPU CPU 400 n n 4 10 CPU 4 1/ ( ) = 3.64 (4) 164

173 4-8 (5) (1) SUB ( 7 ) N (2) (2) 10 NPROCS MYRANK ( SUB ) Fortran 90 MODULE 8 PARA MODULE NPROCS MYRANK INCLUDE mpif.h 1 1 ISTATUS MODULE MODULE MAIN SUBROUTINE 9 17 USE MODULE (4-8-2 (1) ) 11 1 MPI_FINALIZE MPI_FINALIZE 1 MPI_FINALIZE 2 5 (OPEN CLOSE ) IF ( 4-4 ) 4 IF STOP IF (3) 22 CALL MPI_ABORT 0 18 IF PRINT 21 IF (4-5-4 ) 7 (ISTA) (IEND) ( IEND-ISTA+1) (4-8-2 (2) ) 13 ( 2)

174 (1) (3) (2) 166

175 4-8 (6) (1) (2) P 1 1 P(I-1,J) P(I,J) P(I+1,J) P(I,J) 3 (A B ) (2) (1)

176 4 1 SOR (5-6 ) (1) P (2) II = II = (3) (4) (2) (4) ( 3) (1) (2) (3) (4) 168

177 4-8 ( ) (1) (1) 3 DO (2) 1 ( ISTA IEND ) (1) SHIFT (4-6-2 ) 1 1 A A 1 (4-3 1 ) (2) A DEBUG ( ) A 1 SHIFT DEBUG DEBUG (3) 2 W B DEBUG (2) CALL DEBUG(A) CALL DEBUG (4) 3 X DEBUG W 2 3 W 2 3 CALL DEBUG(W) CALL DEBUG(A) CALL DEBUG(B) (4) CALL DEBUG 5 X (5) (3) GATHER ( ) 0 ( ) CALL DEBUG CALL DEBUG 169

178 (1) (2) (3) (4) (5) (1) SHIFT (2) DEBUG (3) GATHER 170

179 (1) a.out a.out a.out DO (3-3-6 ) MPI MPI MPI MPI MPI ( 10 ) 171

180 4 MPI (4-4-1 ) ( 5 ) ( ) 1 1 (3-4-5 ) 1 1 MPI MPI [15] (3-2 ) MPI_ PMPI_ MPI (3-2 ) MPI_FINALIZE (STOP END ) 1 MPI_FINALIZE (3-3-4 ) MPI Segmentation fault MPI CALL MPI_xxx(,IERR) IERR MPI_RECV MPI_WAIT status INTEGER ISTATUS(MPI_STATUS_SIZE) INCLUDE mpif.h (3-3-4 ) MPI ( [15] MPI MPI MPI_BCAST (ierror) MPI_SUCCESS (3-4-2 ) MPI_ISEND MPI_IRECV MPI_WAIT MPI_ISEND MPI_IRECV MPI_WAIT request MPI_WAIT (3-4-4 ) 1 1 PRINT ( ) 1 1 ( ) 172

181 4-8 (1) 1 ( ) 1 1 (4-8-1 (5) ) (2) (2) (1) A 3 B (3) (4-5-4 ) ISTA IEND (4) ( ) (5) (4-8-1 (5) ) (1) (2) (3) (4) (5) (3) (ISTA) (IEND) ISTA IEND PRINT (4) 173

182 (1) (1) (2) (2) CPU = (1 )/(n ) (1 ) 1 a.out (1) (2) (3) (2) (1) (3) (1) (3) (1) (3) (2) (2) 174

すべて見る

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5]

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5] MPI ( ) snozawa@env.sci.ibaraki.ac.jp 1 ( ) MPI MPI Message Passing Interface[2] MPI MPICH[3],LAM/MPI[4] (MIMDMultiple Instruction Multipule Data) Message Passing ( ) (MPI (rank) PE(Processing Element)