PowerPoint プレゼンテーション

Similar documents
Microsoft PowerPoint _MPI-01.pptx

Microsoft PowerPoint - KHPCSS pptx

演習準備

untitled

Microsoft PowerPoint - 演習2:MPI初歩.pptx

演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 RIKEN AICS HPC Spring School /3/5

<4D F736F F F696E74202D D F95C097F D834F E F93FC96E5284D F96E291E85F8DE391E52E >

Microsoft PowerPoint - 講義:片方向通信.pptx

Microsoft PowerPoint _MPI-03.pptx

(Microsoft PowerPoint \211\211\217K3_4\201i\216R\226{_\211\272\215\342\201j.ppt [\214\335\212\267\203\202\201[\203h])

openmp1_Yaguchi_version_170530

コードのチューニング

NUMAの構成

untitled

並列計算導入.pptx

Microsoft PowerPoint - 演習1:並列化と評価.pptx

Microsoft PowerPoint - 講義:コミュニケータ.pptx

スライド 1

演習1: 演習準備

±é½¬£²¡§£Í£Ð£É½éÊâ

about MPI

第8回講義(2016年12月6日)

スライド 1

120802_MPI.ppt

演習 II 2 つの講義の演習 奇数回 : 連続系アルゴリズム 部分 偶数回 : 計算量理論 部分 連続系アルゴリズム部分は全 8 回を予定 前半 2 回 高性能計算 後半 6 回 数値計算 4 回以上の課題提出 ( プログラム + 考察レポート ) で単位

演習1

Microsoft PowerPoint - S1-ref-F.ppt [互換モード]

OpenMP¤òÍѤ¤¤¿ÊÂÎó·×»»¡Ê£±¡Ë

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5]

OpenMP¤òÍѤ¤¤¿ÊÂÎó·×»»¡Ê£±¡Ë

コードのチューニング

<4D F736F F F696E74202D C097F B A E B93C782DD8EE682E890EA97705D>

Microsoft PowerPoint - 第10回講義(2015年12月22日)-1 .pptx

内容に関するご質問は まで お願いします [Oakforest-PACS(OFP) 編 ] 第 85 回お試しアカウント付き並列プログラミング講習会 ライブラリ利用 : 科学技術計算の効率化入門 スパコンへのログイン テストプログラム起動 東京大学情報基盤セ

課題 S1 解説 Fortran 編 中島研吾 東京大学情報基盤センター

Microsoft PowerPoint - exp2-02_intro.ppt [互換モード]

Microsoft PowerPoint MPI.v...O...~...O.e.L.X.g(...Q..)

2 T 1 N n T n α = T 1 nt n (1) α = 1 100% OpenMP MPI OpenMP OpenMP MPI (Message Passing Interface) MPI MPICH OpenMPI 1 OpenMP MPI MPI (trivial p

MPI usage

Fujitsu Standard Tool

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並

I I / 47

memo

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

PowerPoint プレゼンテーション

情報処理概論(第二日目)

Microsoft PowerPoint ppt

目 目 用方 用 用 方

2007年度 計算機システム演習 第3回

Fortran 勉強会 第 5 回 辻野智紀

Microsoft PowerPoint - prog03.ppt

PowerPoint プレゼンテーション

情報処理概論(第二日目)

ÊÂÎó·×»»¤È¤Ï/OpenMP¤Î½éÊâ¡Ê£±¡Ë

chap2.ppt

nakao

Microsoft PowerPoint - compsys2-06.ppt

Microsoft PowerPoint - OpenMP入門.pptx

書式に示すように表示したい文字列をダブルクォーテーション (") の間に書けば良い ダブルクォーテーションで囲まれた文字列は 文字列リテラル と呼ばれる プログラム中では以下のように用いる プログラム例 1 printf(" 情報処理基礎 "); printf("c 言語の練習 "); printf

Microsoft PowerPoint - 阪大CMSI pptx

Microsoft Word _001b_hecmw_PC_cluster_201_howtodevelop.doc

memo

演習問題の構成 ディレクトリ構成 MPI/ --practice_1 演習問題 1 --practice_2 演習問題 2 --practice_3 演習問題 3 --practice_4 演習問題 4 --practice_5 演習問題 5 --practice_6 演習問題 6 --sample

プログラミング基礎

Microsoft PowerPoint - sales2.ppt

UNIX 初級講習会 (第一日目)

Microsoft Word - 3new.doc

Microsoft PowerPoint Java基本技術PrintOut.ppt [互換モード]

Microsoft PowerPoint 並列アルゴリズム04.ppt

MPI コミュニケータ操作

コードのチューニング

memo

PowerPoint プレゼンテーション

C 言語の式と文 C 言語の文 ( 関数の呼び出し ) printf("hello, n"); 式 a a+4 a++ a = 7 関数名関数の引数セミコロン 3 < a "hello" printf("hello") 関数の引数は () で囲み, 中に式を書く. 文 ( 式文 ) は

Microsoft PowerPoint ppt

Microsoft PowerPoint - 講義10改.pptx

MPI MPI MPI.NET C# MPI Version2

目次 LS-DYNA 利用の手引き 1 1. はじめに 利用できるバージョン 概要 1 2. TSUBAME での利用方法 使用可能な LS-DYNA の実行 4 (1) TSUBAMEにログイン 4 (2) バージョンの切り替え 4 (3) インタラ

OpenMP¤òÍѤ¤¤¿ÊÂÎó·×»»¡Ê£²¡Ë

Microsoft PowerPoint - MPIprog-F2.ppt [互換モード]

スライド 1

Microsoft PowerPoint - CproNt02.ppt [互換モード]

1.overview

Microsoft PowerPoint - program.ppt [互換モード]

Microsoft PowerPoint - 計算機言語 第7回.ppt

Microsoft PowerPoint ppt

2 /83

情報処理演習 II

並列計算プログラミング超入門

PowerPoint プレゼンテーション

第1回 プログラミング演習3 センサーアプリケーション

PowerPoint Presentation

プログラミングA

Page 2 本資料は, 東北大学サイバーサイエンスセンターと NEC の共同により作成され, 大阪大学サイバーメディアセンターの環境で実行確認を行い, 修正を加えたものです. 無断転載等は, ご遠慮下さい.

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること

Total View Debugger 利用の手引 東京工業大学学術国際情報センター version 1.0

Reedbush-Uアカウントの発行

プログラミングI第10回

Transcription:

計算科学演習 I 第 8 回講義 MPI を用いた並列計算 (I) 2013 年 6 月 6 日 システム情報学研究科計算科学専攻 山本有作

今回の講義の概要 1. MPI とは 2. 簡単な MPI プログラムの例 (1) 3. 簡単な MPI プログラムの例 (2):1 対 1 通信 4. 簡単な MPI プログラムの例 (3): 集団通信

共有メモリ型並列計算機 ( 復習 ) 共有メモリ型並列計算機 複数のプロセッサ (PU) がバスを通してメモリを共有 どの PU も同じメモリ領域にアクセスできる 特徴 メモリ空間が単一のためプログラミングが容易 PU の数が多すぎると, アクセス競合により性能が低下 2~16 台程度の並列が多い プログラミング言語 OpenMP (FORTRAN/C/C++ + 指示文 ) を使用 メモリ領域を分割し,MPI を利用することも可能 前回, 前々回 キャッシュ バス PU0 PU1 PU2 PU3 メモリ

分散メモリ型並列計算機 ( 復習 ) アーキテクチャ 各々がメモリを持つ複数の PU をネットワークで接続 各 PU はそれぞれ自分の持つメモリのみにアクセス可能 特徴 数千 ~ 数万 PU 規模の並列が可能 キャッシュ メモリ PU0 PU1 PU2 PU3 ネットワーク PU 間へのデータ分散を意識したプログラミングが必要 プログラミング言語 FORTRAN/C/C++ + MPI を使用 今回 ~ 次々回

MPI とは Message Passing Interface 余談ですが,OpenMP:Open Multi-Processing 分散メモリ型並列計算機上での並列プログラミングのためのプロセッサ間通信の標準規格 ( ライブラリを指すこともある ) 1992 年頃より米国の計算機メーカー 大学を中心に標準化 MPI の規格と歴史 1994 MPI-1 1997 MPI-2 2012 MPI-3 http://www.mpi-forum.org/docs/mpi-3.0/mpi30-report.pdf 852 ページ (2.7MB)

MPI の実行モデル (1/3) 実行モデル SPMD : Single Program Multiple Data 複数のプロセスにより並列実行 OpenMP では複数スレッド 実行開始から終了まで, 全プロセスが同じプログラムを実行 各プロセスは固有のプロセス番号 ( ランク ) を持つ P 個のプロセスで実行するとき, ランクは 0 から P-1 までの整数 演算対象データや IF 文による分岐などは, プロセスごとに異なってよい rank=0 rank=1 rank=2 rank=3 プロセス プロセス プロセス プロセス a.out a.out a.out a.out 実行開始 並列実行部分 実行終了

MPI の実行モデル (2/3) メモリ空間 プロセスごとに独立したメモリ空間を保持 プログラム中で定義された変数 配列は, 同じ名前で独立に各プロセスのメモリ上に割り当てられる 同じ変数 配列に対して, プロセスごとに違う値を与えることは可能 他のプロセスの持つ変数 配列にはアクセスできない 実行開始 rank=0 プロセス a.out rank=1 プロセス a.out integer :: k real(dp) :: x(100) integer :: k real(dp) :: x(100) アクセス不可能 実行終了

MPI の実行モデル (3/3) プロセス間通信 他のプロセスの持つ変数 配列のデータにアクセスできない プロセス間通信によりデータを送ってもらう メッセージパッシング方式 : メッセージ ( データ ) の送り手と受け手 この方式によるプロセス間通信関数の集合 MPI 実行開始 rank=0 プロセス a.out rank=1 プロセス a.out データを送る ( 例 :mpi_send) integer :: k real(dp) :: x(100) integer :: k real(dp) :: x(100) MPI 関数によるプロセス間通信 データを受取る ( 例 :mpi_send) 実行終了

MPI の実行環境 分散メモリ型並列計算機 MPI がもともと想定している環境 各プロセスが 1 個の PU に割り当てられる キャッシュ メモリ PU0 PU1 PU2 PU3 ネットワーク 共有メモリ型並列計算機 メモリを分割して各 PU に割り当て, 仮想的な分散メモリ環境を作る 既存の MPI プログラムを共有メモリ型並列計算機で実行するときに便利 キャッシュ バス PU0 PU1 PU2 PU3 メモリ SMP クラスタ PU0 PU1 PU2 PU3 PU0 PU1 PU2 PU3 各ノードのメモリを分割して各 PU に割り当て, 仮想的な分散メモリ環境を作る 本講義でもこの環境を用いる メモリ ネットワーク メモリ

MPI プログラムの実行までの一例 ( 元となる ) 逐次版のプログラム 通常の FORTRAN または C/C++ で書かれたプログラム MPI プログラム 通常のFORTRAN または C/C++ で書かれたプログラム 分散環境を意識した修正 ( データ分散や処理の分岐など ) MPI 関数の追加 ( プロセス間通信など ) MPI プログラム用のコンパイラでコンパイル MPI プログラム用の実行コマンドで実行 プログラムの実行に用いるプロセス数を指定

MPI プログラムの構成要素 プログラムのベース 通常の FORTRAN または C/C++ で書かれたプログラム 分散メモリを意識して書かれている必要あり 処理の範囲, 保持するデータの範囲, 処理の分岐,... MPI 関数 環境設定 環境取得のための関数 初期化, 終了処理, 総プロセス数の取得, ランクの取得,... 通信関数 1 対 1 通信, 集団通信 基本データ型 定義済み演算 通信時のデータ型の指定, リダクション演算 ( 後述 ) の指定,... インクルードファイル プログラムの最初で use mpi と記述

MPI の特徴 移植性 MPI でプログラムを書くことで, 様々な分散メモリ型並列計算機での実行が可能 共有メモリ型並列計算機でも実行可能 スケーラビリティー 適切なアルゴリズムに基づいて並列プログラムを書けば, 数千 ~ 数万個のプロセッサを持つ並列計算機の能力を引き出すことが可能 多様な集団通信 総和, ブロードキャストなど多様な通信関数が予め用意されている 性能解析ツール 負荷分散, 通信時間等の詳細な情報を取得するツールが使用可能

現在利用可能な MPI の実装 MPICH 米国のアルゴンヌ国立研究所が提供しているフリーな MPI 現在では MPICH2 が主流 http://www.mcs.anl.gov/research/projects/mpich2/ OpenMPI MPI に関する様々な先行プロジェクトの成果を基に開発された MPI http://www.open-mpi.org/ 各計算機メーカーの提供する MPI 並列計算機メーカー各社が, 自社の計算機向けに, それぞれ MPI の実装を提供している ( 例 )Π コンピュータでは富士通製の MPI ライブラリを使用

MPI プログラムの例 (1) 並列版 Hello World program hello use mpi implicit none integer :: nprocs, myrank, ierr call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) print *, 'Hello, World. My rank is', myrank call mpi_finalize(ierr) end program hello 青字が MPI 関数など ( 詳細は後で説明 )

MPI プログラムの実行方法 (1/3) プログラムのコンパイル mpifrtpx コマンドを使用 Fortran の場合 mpifrtpx hello.f90 実行ファイルa.outができる mpifrtpx o hello hello.f90 実行ファイルhelloができる プログラムの実行 キューイングシステムにより実行 OpenMP の演習の時と同じ 注意 1. ジョブスクリプトを作成 2. ジョブを投入 3. ( ジョブの状態を確認 ) 4. 実行結果を確認 今回の演習の内容は神戸大の Π コンピュータを想定したものです 使用する計算機システムによってコンパイルコマンド等は異なります

MPI プログラムの実行方法 (2/3) ジョブスクリプトの作成 (4 プロセスで実行する例 ) #!/bin/bash #PJM N jobname #PJM L rscgrp=small #PJM L node=4 #PJM L elapse=2:00 #PJM j シェル名ジョブ名投入先のキュー使用ノード数最大実行時間 mpiexec n 4./a.out 並列数を指定して MPI プログラムを実行 重要 今回の演習では 1 ノードに 1 プロセスとして実行する 使用ノード数 = 使用プロセス数 としてスクリプトを作成する ( 注意 ) 最大実行時間は必要以上に長く設定しない!

MPI プログラムの実行方法 (3/3) ジョブの投入 pjsub ( ジョブファイル名 ) ジョブの状態確認 pjstat JOB_ID JOB_NAME MD ST USER START_DATE ELAPSE_LIM NODE_REQUIRED 17583 job_1 NM RUN user (06/06 12:00) 0000:02:00 4 17584 job_2 NM QUE user (06/06 13:00) 0000:10:00 12 ジョブのキャンセル pjdel ( ジョブ番号 ) 実行結果の確認 うまく実行できれば ジョブ名.o? (? はジョブ番号 ) というファイルが作成され, その中に実行結果が出力される

演習 1-1 並列版 Hello World を 2,4 プロセスで実行し, 結果を確認せよ! (1) 今日の演習用のディレクトリ ( 例 :mpi_20130606) を作成 mkdir mpi_20130606 cd mpi_20130606 (2) 演習 1-1 用のディレクトリ ( 例 :enshu_1_1) を作成 mkdir enshu_1_1 cd enshu_1_1 (3) ソースコードをコピーし, 中身を確認 編集の必要はなし cp /tmp/mpi_20130606/1_1/hello.f90./ emacs 等で確認 (4) ソースコードをコンパイル mpifrtpx hello.f90 (5) ジョブスクリプトをコピーし, 必要な部分 ( プロセス数 ) を編集 cp /tmp/mpi_20130606/1_1/go.sh./ emacs 等で編集 (6) ジョブを投入し, 実行結果を確認 pjsub go.sh pjstat xxxx.o? の中身を確認

演習 1-1 の実行結果 2 プロセスでの実行結果 Hello, World. My rank is 0 Hello, World. My rank is 1 4 プロセスでの実行結果 Hello, World. My rank is 0 Hello, World. My rank is 2 Hello, World. My rank is 3 Hello, World. My rank is 1 ( 注意 ) 両者ともランク順に並ぶとは限らず, 実行ごとに順番が異なることもある ポイント 各プロセスが同じ処理 (Hello World) を実行している 各プロセスが持っているランク (myrank の値 ) が異なっている

MPI プログラム (1) の解説 (1/2) 並列版 Hello World ( 再掲 ) program hello mpif.hのインクルード use mpi implicit none 初期化 integer :: nprocs, myrank, ierr call mpi_init(ierr) 総プロセス数を取得 call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) print *, 'Hello, World. My rank is', myrank call mpi_finalize(ierr) 自分のプロセス番号を取得 end program hello 終了処理

MPI プログラム (1) の解説 (2/2) mpi_init(ierr) プログラムの最初にコールして MPI の初期化処理を行う mpi_finalize(ierr) プログラムの最後にコールして MPI の終了処理を行う mpi_comm_world(comm, nprocs, ierr) comm 内の全プロセスが nprocs に入る comm はプロセスグループを指定する変数 ( コミュニケータと呼ぶ ) (MPI_COMM_WORLD とすると全てのプロセスを含むグループを指す ) mpi_comm_rank(comm, myrank, ierr) comm 内での自分のプロセス番号 ( ランク ) が myrank に入る ierr は integer の変数でエラーコードが入る

典型的な MPI プログラムの構成 program mpi_sample use mpi implicit none 変数宣言 call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) プロセスごとの処理 (myrank に応じて分岐など ) プロセス間通信 (MPI 関数 ) この後で説明の繰り返し call mpi_finalize(ierr) end program mpi_sample

MPI プログラムの例 (2):1 対 1 通信 1 から 100 までの整数の和を 2 並列で求めるプログラム program sum100 use mpi implicit none integer :: i,istart,iend,isum,isum1 integer :: nprocs,myrank,ierr integer, dimension(mpi_status_size) :: istat call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) istart=myrank*50+1 iend=(myrank+1)*50 isum=0 do i=istart, iend isum=isum+i end do if (myrank==1) then call mpi_send(isum,1,mpi_integer,0,100,mpi_comm_world,ierr) else call mpi_recv(isum1,1,mpi_integer,1,100,mpi_comm_world,istat,ierr) end if if (myrank==0) print *, 'sum =', isum+isum1 call mpi_finalize(ierr) end program sum100

MPI プログラム (2) の解説 (1/4) 1 から 100 までの整数の和を 2 並列で求めるプログラム program sum100 use mpi implicit none integer :: i,istart,iend,isum,isum1 integer :: nprocs,myrank,ierr integer, dimension(mpi_status_size) :: istat call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) istart=myrank*50+1 iend=(myrank+1)*50 isum=0 do i=istart, iend isum=isum+i end do if (myrank==1) then call mpi_send(isum,1,mpi_integer,0,100,mpi_comm_world,ierr) else call mpi_recv(isum1,1,mpi_integer,1,100,mpi_comm_world,istat,ierr) end if if (myrank==0) print *, 'sum =', isum+isum1 call mpi_finalize(ierr) end program sum100 青 :MPI プログラムのお約束 緑 : プロセス番号 ( ランク ) に応じた処理 赤 :MPI 関数によるプロセス間通信 ランクの値から自分の計算範囲を求める 各プロセスが部分和を計算 プロセス 0 は結果を出力 プロセス 1 はプロセス 0 に部分和を送信 プロセス 0 はプロセス 1 から部分和を受信

MPI プログラム (2) の解説 (2/4) mpi_send 他のプロセスにデータを送信 ブロッキング通信 データが送信バッファから送り出された後にリターンする mpi_recv 他のプロセスからデータを受信 ブロッキング通信 データが受信バッファに完全に格納された後にリターンする

MPI プログラム (2) の解説 (3/4) mpi_send(buff, count, datatype, dest, tag, comm, ierr) buff : 送信バッファの先頭アドレス count : 送信するデータの要素数 datatype : 送信するデータの型 dest : 送信相手のプロセスのランク tag : メッセージID comm : コミュニケータ ierr : エラーコード ( 出力 ) mpi_recv(buff, count, datatype, source, tag, comm, status, ierr) buff : 受信バッファの先頭アドレス count : 受信するデータの要素数 datatype : 受信するデータの型 source : 受信相手のプロセスのランク tag : メッセージID comm : コミュニケータ status : 状況オブジェクトの配列を指定 サイズはMPI_STATUS_SIZE ierr : エラーコード ( 出力 )

MPI プログラム (2) の解説 (4/4) 引数に関する諸注意 buff 送信する領域は, メモリ上で連続アドレスでなければならない 他の通信関数でも同じ datatype tag MPI_INTEGER,MPI_REAL,MPI_DOUBLE_PRECISION などが使用できる 同じ相手プロセスに対して複数の mpi_send を行うとき, それらを区別するために使用する 対応する mpi_recv では同じ tag を使わなければならない 送受信の順番などによって複数の通信を区別できる場合は,tag の値は同じでもよい

演習 1-2 1 から 100 までの整数の和を 2 並列で求めるプログラム (sum100.f90) を 2 プロセスで実行し, 結果を確認せよ 注意事項など プログラムの所在 : /tmp/mpi_20130606/1_2/sum100.f90 ジョブスクリプト : 演習 1-1 のものを適切に修正して使用 結果の確認 ( プロセス 0 が ) 正しい答え (1 から 100 までの和 ) を出力することを確認

演習 1-3( 提出課題その 1) 1 から 100 までの整数の和を 2 並列で求めるプログラム (sum100.f90) を 4 プロセス用に書き換えて,4 プロセスで実行せよ ポイント 各プロセスが部分和を計算する範囲は? プロセス 0 は部分和を三回受信 ( プロセス 1, 2, 3 からそれぞれ ) 集団通信関数 ( 後述 ) を使わないで実現しましょう 課題の提出方法については最後にまとめて説明します

MPI プログラムの例 (3): 集団通信 1 から n までの整数の和を並列で求めるプログラム program sumn use mpi implicit none integer :: n,i,istart,iend,isum,isum1 integer :: nprocs,myrank,ierr call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) if (myrank==0) n=10000 call mpi_bcast(n,1,mpi_integer,0,mpi_comm_world,ierr) istart=n*myrank/nprocs+1 iend=n*(myrank+1)/nprocs isum=0 do i=istart, iend isum=isum+i end do call mpi_reduce(isum,isum1,1,mpi_integer,mpi_sum,0,mpi_comm_world,ierr) if (myrank==0) print *, 'sum =', isum1 call mpi_finalize(ierr) end program sumn

MPI プログラム (3) の解説 (1/3) 1 から n までの整数の和を並列で求めるプログラム program sumn use mpi implicit none integer :: n,i,istart,iend,isum,isum1 integer :: nprocs,myrank,ierr call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,nprocs,ierr) call mpi_comm_rank(mpi_comm_world,myrank,ierr) if (myrank==0) n=10000 call mpi_bcast(n,1,mpi_integer,0,mpi_comm_world,ierr) istart=n*myrank/nprocs+1 iend=n*(myrank+1)/nprocs isum=0 do i=istart, iend isum=isum+i end do 各プロセスが部分和を計算 青 :MPI プログラムのお約束 緑 : プロセス番号 ( ランク ) に応じた処理 赤 :MPI 関数によるプロセス間通信 プロセス 0 が n を読み込む call mpi_reduce(isum,isum1,1,mpi_integer,mpi_sum,0,mpi_comm_world,ierr) if (myrank==0) print *, 'sum =', isum1 call mpi_finalize(ierr) end program sumn プロセス 0 は結果を出力 n の値を放送 ランクの値から自分の計算範囲を求める 部分和の総和を計算 ( プロセス 0 に集める )

MPI プログラム (3) の解説 (2/3) mpi_bcast 1 個のプロセス (root) から他の全てのプロセスにデータを送信 ブロッキング通信 root はデータが送信バッファから送り出された後にリターン 他のプロセスはデータが受信バッファに完全に格納された後にリターン mpi_reduce 全プロセスの持つデータに対してリダクション演算を行い, 結果を root に送る ブロッキング通信

MPI プログラム (3) の解説 (3/3) mpi_bcast(buff, count, datatype, root, comm, ierr) buff : ( 送信プロセス ) 送信バッファの先頭アドレス ( 受信プロセス ) 受信バッファの先頭アドレス count : データの要素数 datatype : データの型 root : 送信元のプロセスのランク comm : コミュニケータ ierr : エラーコード ( 出力 ) mpi_reduce(sendbuff, recvbuff, count, datatype, op, root, comm, ierr) sendbuff : 送信バッファの先頭アドレス recvbuff : 受信バッファの先頭アドレス (rootでのみ使用) count : 送信するデータの要素数 datatype : 送信するデータの型 op : リダクション演算の種類 root : リダクション演算の結果が送られるプロセスのランク comm : コミュニケータ ierr : エラーコード ( 出力 )

リダクション演算とは リダクション演算 加算, 乗算, 最大値のように, 複数のデータを入力として 1 個の出力データを求める演算 MPI で使えるリダクション演算 MPI_SUM( 和 ),MPI_PROD( 積 ), MPI_MAX( 最大値 ),MPI_MIN( 最小値 ) 他にも論理和などがある ベクトルに対するリダクション演算も可能 ベクトルの各要素に対してリダクション演算を行い, その結果を要素とするベクトルを生成 x 1,x 2,,x m をそれぞれ長さ n のベクトルとするとき, それらの和 x = x 1 + x 2 + + x m を求める計算など 引数 count に, ベクトルの長さ n を入れればよい

演習 1-4 1 から n までの整数の和を並列で求めるプログラム (sumn.f90) を 4,8 プロセスで実行し, 結果を確認せよ 注意事項など プログラムの所在 : /tmp/mpi_20130606/1_4/sumn.f90 ジョブスクリプト : 演習 1-1 のものを適切に修正して使用 n について : スライドと同じで,n=10000 で実行 結果の確認 ( プロセス 0 が ) 正しい答え (1 から n までの和 ) を出力することを確認

演習 1-5( 提出課題その 2) 1 から n までの整数の和を並列で求めるプログラム (sumn.f90) を以下のように書き換え,8 プロセスで実行せよ 変数 isum, isum1 を倍精度実数 sum, sum1 に変更 mpi_reduce での計算も倍精度で行うように変更 ポイント 倍精度実数型の定義 ( 臼井先生の講義を参照 ) mpi_reduce 内の datatype を MPI_DOUBLE_PRECISION に変更 課題の提出方法については次のスライドで説明

課題の提出方法と提出期限 課題 演習 1-3 および演習 1-5 提出方法 課題ごとにプログラムと実行結果を 1 つのファイルにまとめる まとめ方の例 : 1. cat program.f90 > report_1_x.txt 2. cat result.o? >> report_1_x.txt 3. report_1_x.txtの中身を確認 以下の方法でメールにより提出 (x は演習 1-3 なら 3,1-5 なら 5) nkf Lu report_1_x.txt mail s mpi_1_x comprampi@gmail.com 改行コードの関係で nkf コマンドを使用しています 期限 :6 月 12 日 ( 水 ) 午後 5 時

参考文献 P. パチェコ ( 秋葉博訳 ): MPI 並列プログラミング, 培風館,2001. 青山幸也 : 並列プログラミング入門 MPI 版, http://accc.riken.jp/hpc/training.html 片桐孝洋 : スパコンプログラミング入門 - 並列処理と MPI の学習 -, 東大出版会,2013. 質問は以下のアドレスにお願いします 山本 :yamamoto@cs.kobe-u.ac.jp 深谷 :fukaya@people.kobe-u.ac.jp