Vol.-HPC- No. // 情報処理学会研究報告 integer :: array():[*] integer :: tmp() if (this_image() == ) then array(:)[] = tmp(:) tmp(:) = arrray(:)[] end if! Put co

Size: px

Start display at page:

Download "Vol.-HPC- No. // 情報処理学会研究報告 integer :: array():[*] integer :: tmp() if (this_image() == ) then array(:)[] = tmp(:) tmp(:) = arrray(:)[] end if! Put co"

たいちみやまる
5 years ago
Views:

1 Vol.-HPC- No. // PGAS NICAM,,a),, PGAS XcalableMP NICAM MPI NICAM XcalableMP coarray XcalableMP coarray RDMA XcalableMP NICAM %. [] Message Passing Interface MPI [] MPI Partitioned Global Address Space PGAS [] PGAS Remote Direct Memory Access RDMA PGAS MPI PGAS XcalableMP XMP [] NICAM Nonhydrostatic ICosahedral Center for Computational Sciences, University of Tsukuba RIKEN Advanced Institute for Computational Science Graduate School of Systems and Information Engineering, University of Tsukuba a) Atmospheric Model [] PGAS NICAM XMP NICAM. Partitioned Global Address Space PGAS XMP PGAS SHMEM[] Global Arrays[] Coarray Fortran CAF [] Titanium[] Unified Parallel C[] Chapel[] X[] CAF Fortran CAF image CAF CAF integer coarray image image coarray Put image image coarray Get c Information Processing Society of Japan

Vol.-HPC- No. // 情報処理学会研究報告 integer :: array():[*] integer :: tmp() if (this_image() == ) then array(:)[] = tmp(:) tmp(:) = arrray(:)[] end if! Put communication! Get communication sync all!

Define coarray Glevel-, Rlevel- Coarray Fortran における通信の記述方法図 Glevel- NICAM の領域分割領域の一部のみ太枠で囲んでいる [] Glevel- を正二十面体に分割する次にその正二十面体の三角形をつずつ合わせて四角形の領域を作成するこの領域が各プロセスが担当する領域であるそして Glevel と同様に

それより前に行われた片信通信を完了別に設定することが可能である Rlevel-n の場合の領域数させかつバリア同期を行う命令である本稿では図は n の式で計算することができる並列計算に用いの行目と行目に示したような片側通信の記述方法をるプロセス数は Rlevel によって設定された領域数の約数 coarray 記法と呼ぶである必要がある例えば Rlevel-

2 Vol.-HPC- No. // 情報処理学会研究報告 integer :: array():[*] integer :: tmp() if (this_image() == ) then array(:)[] = tmp(:) tmp(:) = arrray(:)[] end if! Put communication! Get communication sync all! Synchronization 図 Glevel-, Rlevel-! Define coarray Glevel-, Rlevel- Coarray Fortran における通信の記述方法図 Glevel- NICAM の領域分割領域の一部のみ太枠で囲んでいる [] Glevel- を正二十面体に分割する次にその正二十面体の三角形をつずつ合わせて四角形の領域を作成するこの領域が各プロセスが担当する領域であるそして Glevel と同様に再帰的に領域を分割していくことで多くの領域を設定することが可能である最初の分割された領域を Rlevel- と呼び次に分割された領域を Rlevel- と呼ぶ図 NICAM の格子点 [] Rlevel- の場合の領域数はであり Rlevel- の場合の領域数はである図に例を示す Glevel と Rlevel は個の sync all 文はそれより前に行われた片信通信を完了別に設定することが可能である Rlevel-n の場合の領域数させかつバリア同期を行う命令である本稿では図は n の式で計算することができる並列計算に用いの行目と行目に示したような片側通信の記述方法をるプロセス数は Rlevel によって設定された領域数の約数 coarray 記法と呼ぶである必要がある例えば Rlevel- の場合の領域数は XMP は並列アプリケーションで広く用いられている Fortran と C 言語のそれぞれの言語拡張であり XMP が提供する指示文もしくは coarray 記法を用いて通信を表現するまた Fortran 版の XMP は CAF の上位互換となるように設計されているため CAF で記述されたプログラムを XMP として動作させることが可能である. NICAM であるためユーザが利用できるプロセス数はとなる. XcalableMP による NICAM の実装. 関連研究 NICAM は地球シミュレータを用いて開発が行われてきたため NICAM のコードはベクトル計算機用に最適化されているそのため京の性能を引き出すための NICAM NICAM は全球雲解像モデルのつであり Fortran とに対する最適化作業が現在進められている [] では地 MPI ライブラリで記述されている NICAM が行う通信の球シミュレータで動作していたコードに対してキャッシュ多くは一対一の隣接通信であるためスケーラビリティが最適化などを行うことにより京上における NICAM の性非常に高いという特徴がある本章では主に並列計算に能効率を倍以上に高めているまた [] では京の次必要な事柄について説明する元トーラスネットワークに対して通信のホップ数が少な NICAM では全球に対して正二十面体格子を用いることで計算対象の点水平格子点を決定する図にくなるようなプロセスの割り当て手法の提案が行われている NICAM の水平格子点の概念図を示すまず全球を正二十面体に分割するこの状態を Glevel- と呼ぶ図. 最適化の方針左その三角形のそれぞれの頂点が水平格子点である NICAM の一対一通信を XMP の coarray 記法による片 Glevel- のそれぞれの三角形を分割した格子を Glevel- 側通信によって記述することでコードの簡易化を図ると呼ぶ図右このように再帰的に三角形を分割しまた XMP の実装において京の RDMA 機能を用いて片ていくことで目的に応じた解像度をユーザが設定するこ側通信を実行させることにより高速化も図る表にとができる再帰回数が n の場合の格子を Glevel-n と呼京が提供している拡張 RDMA インタフェースの一覧を示ぶ Glevel-n の場合の水平格子点数は n + の式です [] この RDMA インタフェースは C 言語の関数とし計算することができるて定義されている C 言語で実装された XMP のランタイ次に並列化を行う場合の各プロセスが担当する領域の設定方法について説明するまず Glevel と同様に全球 Information Processing Society of Japan ムライブラリから表の各関数を呼び出すことによって京の RDMA 機能を直接用いることができる

3 Vol.-HPC- No. // RDMA [] FJMPI Rdma init RDMA FJMPI Rdma finalize RDMA FJMPI Rdma reg mem FJMPI Rdma dereg mem FJMPI Rdma get remote addr DMA FJMPI Rdma put RDMA WRITE FJMPI Rdma get RDMA READ FJMPI Rdma poll cq RDMA Bandwidth (GByte/s) Performance Ratio. RDMA. MPI Isend/Irecv Transfer Size (Byte) RDMA MPI..... MPI (Original) do i=, recv_num call mpi_irecv(recvbuf(,i), recv_count(i), mpi_double_precision, sourcerank(i), ) do i=, send_num call mpi_isend(sendbuf(,i), send_count(i), mpi_double_precision, destrank(i) ) call mpi_waitall() XcalableMP real() :: recvbuf(maxdatasize_r, romax(halomax)):[*] real() :: sendbuf(maxdatasize_s, somax(halomax)):[*]! Obtain information of destination position -> dest_position() do i=, send_num recvbuf(:send_count(i), dest_position(i))[destrank(i)] = sendbuf(:send_count(i), i) sync all XcalableMP NICAM. RDMA Bandwidth/ MPI_Isend/Irecv Bandwidth Transfer Size (Byte) RDMA MPI. NICAM MPI Isend/Irecv RDMA MPI Isend/Irecv pingpong RDMA MPI Isend/Irecv. RDMA RDMA MPI Isend/Irecv Byte RDMA. XcalableMP NICAM NICAM Fortran Fortran XMP NICAM NICAM Fortran XMP XMP recvbuf sendbuf Coarray XMP CAF sendbuf Coarray RDMA sendbuf Coarray c Information Processing Society of Japan

4 MPI Allgather dest position MPI NICAM Put XMP NICAM NICAM recvbuf sendbuf NICAM recvbuf sendbuf XMP CAF Coarray Coarray recvbuf sendbuf.. coarray XMP NICAM MPI XMP coarray. XMP NICAM NICAM Fortran XMP XMP XMP RDMA NICAM Glevel Rlevel Rlevel NICAM OpenMP Time (s) (.) (.) Rlevel- ( nodes) RDMA RDMA.. (.) (.) Rlevel- ( nodes).. (.) (.) Rlevel- ( nodes) MPI MPI NICAM Glevel XMP NICAM NICAM XMP % % NICAM Rlevel / / Rlevel Rlevel Rlevel- KByte Rlevel- KByte Rlevel- KByte RDMA MPI.. Vol.-HPC- No. // c Information Processing Society of Japan

5 Vol.-HPC- No. // CPU Memory Network Compiler Communication Library SPARC VIIIfx.GHz, Cores/Socket, GFlops DDR SDRAM GB, GB/s/Socket Torus fusion six-dimensional mesh/torus network, GB/s Fujitsu Fortran Compiler Version K-..- Fujitsu MPI Version K-..-. PGAS XMP NICAM MPI XMP coarray RDMA % coarray Fortran XMP Coarray sync all XMP CAF sync images [] NICAM NICAM NICAM [] : b gaiyo.html [] M. Snir, S. Otto, S. Huss-Lederman, D. Walker, and J. Dongarra, MPI-The Complete Reference, Volume : The MPI Core, nd ed. Cambridge, MA, USA: MIT Press,. [] PGAS - Partitioned Global Address Space Languages [] [] Satoh, M., T. Matsuno, H. Tomita, H. Miura, T. Nasuno, S. Iga (), Nonhydrostatic Icosahedral Atmospheric Model (NICAM) for global cloud resolving simulations. Journal of Computational Physics, the special issue on Predicting Weather, Climate and Extreme events,, -, doi:./j.jcp... [] B. Chapman, T. Curtis, S. Pophale, S. Poole, J. Kuehn, C. Koelbel, and L. Smith, Introducing openshmem: Shmem for the pgas community, in Proceedings of the Fourth Conference on Partitioned Global Address Space Programming Model, ser. PGAS. New York, NY, USA: ACM,, pp. : :. [] J. Nieplocha, R. J. Harrison, and R. J. Littlefield, Global arrays: A non-uniform-memory-access programming model for high-performance computers, THE JOURNAL OF SUPERCOMPUTING, vol., pp.,. [] R. W. Numrich and J. Reid, Co-array fortran for parallel programming, SIGPLAN Fortran Forum, vol., no., pp., Aug.. [] K. Yelick, L. Semenzato, G. Pike, C. Miyamoto, B. Liblit, A. Krish- namurthy, P. Hilfinger, S. Graham, D. Gay, P. Colella, and A. Aiken, Titanium: A highperformance Java dialect, in ACM Workshop on Java for High-Performance Network Computing. New York, NY, USA: ACM Press,. [] U. Consortium, UPC Language Specifications, Berkeley National Laboratory, Tech. Rep. LBNL-,. [] B. Chamberlain, D. Callahan, and H. Zima, Parallel programmability and the chapel language, Int. J. High Perform. Comput. Appl., vol., no., pp., Aug.. [] V. Saraswat, B. Bloom, I. Peshansky, O. Tardieu, and D. Grove, X language specification,, languagespec/x-.pdf. [] NICAM workshop/--/yashiro.pdf [] [] Parallelnavi for MP V. Parallelnavi Technical Computing Language MPI c Information Processing Society of Japan

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP InfiniBand ACP 1,5,a) 1,5,b) 2,5 1,5 4,5 3,5 2,5 ACE (Advanced Communication for Exa) ACP (Advanced Communication Primitives) HPC InfiniBand ACP InfiniBand ACP ACP InfiniBand Open MPI 20% InfiniBand Implementation