2002 avidemux MPEG-4 : : : G99P045-1

Size: px
Start display at page:

Download "2002 avidemux MPEG-4 : : : G99P045-1"

Transcription

1 2002 avidemux MPEG-4 : : : G99P045-1

2 MPEG-4 MPEG-4 PC MPEG-4 MPI XviD MPEG-4 MPEG avidemux MPI MPEG-4 PE

3 MPEG MPEG PE Myrinet OS SCore avidemux avidemux 29 i

4 Pass ii

5 MPEG-4 VOP Folon-III/Folon-IV SCore avidemux iii

6 2.1 MPEG FOLON-III FOLON-IV MPI DivX 640x frames to DivX CQ Avi 320x frames to DivX CQ iv

7 1 1.1 MPEG-4 MPEG-4 PC MPEG-4 PC Cluster Folon3 Folon4 MPEG-4 avidemux MPI(Message Passing Interface) RWCP(: Real World Computing Partnership) SCore MPEG-4 avidemux 3 PC Cluster folon3 folon4 4 avidemux 5 avidemux 6 1

8 2 avidemux MPEG-4 MPE MPEG-4 MPEG Moving Picture Expert Group ISO( ) MPEG MPEG MPEG-4 MPEG-4 / MPEG-4 MPEG-1/2 MPEG-4 2.1: MPEG MPEG-1 384kbps 4Mbps VideoCD MPEG-2 1Mbps 100Mbps DVD MPEG-4 10Mbps MPEG-7 - EPG 2

9 I B B P I I P : 2.1: (AC/DC 8x8 ) ( ) ( ) MPEG-4 VO(Video Object) VO VOP(Video Object Plane) VOP 4 I-VOP( VOP) P-VOP( VOP) B-VOP( VOP) S-VOP( VOP) VOP I-VOP VOP P-VOP I P-VOP VOP B-BOP I P-VOP I P-VOP VOP S-VOP VOP 3

10 2.2 MPEG-4 API ( ) MPEG-4 XviD API 1. API PE PE 1 1PE ( ) 4

11 2.2: MPEG-4 VOP 2.4 MPEG-4 GOV(Group Of Video Object Plane) I,B,P,S-VOP MPEG-4 GOV 2-Pass ( 1-Pass 2-Pass ) I-VOP I-VOP MPEG-4 5

12 3 PC FOLON-III FOLON-IV PE FOLON-III 9 CPU PC Myrinet BASE-TX Ethernet Pentium-III 1GHz 1152MB FOLON-IV 17 CPU PC FOLON-III Myrinet BASE- TX Ethernet Myrinet2000 FOLON-III serial FOLON-IV fiber CPU Pentium-III-S 1.26GHz 4096MB MB FOLON-III Myrinet Myrinet Myricom Gigabit LAN Ethernet Myrinet 1. Ethernet 6

13 3.1: FOLON-III CPU L2 chache main memory PE0 roquefort Pentium-III 1GHz 256kB 1152MB PE1 roquefort01 Pentium-III 1GHz 256kB 1152MB PE2 roquefort02 Pentium-III 1GHz 256kB 1152MB PE3 roquefort03 Pentium-III 1GHz 256kB 1152MB PE4 roquefort04 Pentium-III 1GHz 256kB 1152MB PE5 roquefort05 Pentium-III 1GHz 256kB 1152MB PE6 roquefort06 Pentium-III 1GHz 256kB 1152MB PE7 roquefort07 Pentium-III 1GHz 256kB 1152MB PE8 roquefort08 Pentium-III 1GHz 512kB 1152MB 3.2: FOLON-IV CPU L2 chache main memory comte Pentium-III 1.26GHz 512kB 4096MB PE0, PE1 comte00 Pentium-III 1.26GHz 512kB 2048MB PE2, PE3 comte01 Pentium-III 1.26GHz 512kB 2048MB PE4, PE5 comte02 Pentium-III 1.26GHz 512kB 2048MB PE6, PE7 comte03 Pentium-III 1.26GHz 512kB 2048MB PE8, PE9 comte04 Pentium-III 1.26GHz 512kB 2048MB PE10, PE11 comte05 Pentium-III 1.26GHz 512kB 2048MB PE12, PE13 comte06 Pentium-III 1.26GHz 512kB 2048MB PE14, PE15 comte07 Pentium-III 1.26GHz 512kB 2048MB PE16, PE17 comte08 Pentium-III 1.26GHz 512kB 2048MB PE18, PE19 comte09 Pentium-III 1.26GHz 512kB 2048MB PE20, PE21 comte10 Pentium-III 1.26GHz 512kB 2048MB PE22, PE23 comte11 Pentium-III 1.26GHz 512kB 2048MB PE24, PE25 comte12 Pentium-III 1.26GHz 512kB 2048MB PE26, PE27 comte13 Pentium-III 1.26GHz 512kB 2048MB PE28, PE29 comte14 Pentium-III 1.26GHz 512kB 2048MB PE30, PE31 comte15 Pentium-III 1.26GHz 512kB 2048MB 7

14 backborn network NIS Server, NFS Server, Router comte15 Ethernet Hub Myrinet Switch comte00 comte folon-iv Ethernet Hub roquefort07 Myrinet Switch roquefort folon-iii 3.1: Folon-III/Folon-IV 8

15 Myrinet 16 Myrinet Myrinet 2. NIC Myrinet NIC LANai LANai NIC NIC NIC NIC NIC NIC 4 3. Gigabit Ethernet 1Gbps Myrinet Gbps 4Gbps OS FOLON Redhat Linux7.3 SCore5.2 SCore SCore 5.2 Score (RCWP) PC PC SCore SCore 9

16 3.2: SCore PMv2 PMv2 PMv2 Myrinet Ethernet UDP Shmem SCore-D SCore-D Linux PM SCore-D SCore-D SCore-D MPICH-SCore MPICH-SCore MPI MPICH PMv2 MPI MPICH-SCore Version 1.0 Version 2.0 MPICH MPICH MPICH-SCore Version

17 MPICH-SCore Version 1.0 Version 1.0 PVM-SCore PVM SCore PVM3.4 PVM PVM-SCore SCore PVM SCACH SCACH PMv2 PBS MRJ ( : ) NASA PBS(Protable Batch System) SCore MPC++ C++ C++ / Omni OpenMP OpenMP API RWCP Omni OpenMP SCASH OpenMP TACO C++ TACO 11

18 4 avidemux 4.1 PE PE GUI PE PE avidemux pre MPI MPI MPI C++ mpic++ mpic++ [ options ] filename... mpic++ MPICH-SCore MPI PATH 4.2 configure make./configure CC=mpicc CXX=mpic++ 12

19 mpicc mpic++ mpif77 mpif90 C MPI C++ MPI Fortran77 MPI Fortran90 4.1: MPI /usr/bin/ld: BFD assertion fail elf-strtab.c:262 make SCore checkpointing SCore checkpointing static avidemux static configure./configure CC="mpicc -nostatic" CXX="mpic++ -nostatic" source= oss_out.cpp object= oss_out.o libtool=no \ depfile=.deps/oss_out.po tmpdepfile=.deps/oss_out.tpo \ depmode=gcc3 /bin/sh../../admin/depcomp \ mpic++ -DHAVE_CONFIG_H -I. -I. -I../.. -I/usr/include/kde/ar ( ) -fno-check-new -c -o oss_out.o test -f oss_out.cpp echo./ oss_out.cpp mv: cannot stat.deps/oss_out.tpo : ar cru libadm_audiodevice.a ADM_deviceArts.o ADM_audiodevice.o ADM_deviceoss.o oss_out.o ar: oss_out.o: gcc 2.96 dependency style gcc3 configure Makefile avidemux/adm audiodevice/ MPI configure avidemux/adm audiodevice/makefile 13

20 CC = gcc CPP = gcc -E CXX = g++ CXXXPP = g++ -E 4.3 avidemux GTK+ Gtk-WARNING **: cannot open display: localhost:10.0 ssh X Forwarding ssh ( :4.3) DISPLAY scout scout ( :4.3) MPI C++ #include <mpi++.h> C #include <mpi.h> include MPI PE PE main.cpp myid( ),nprocs( PE ) 14

21 ssh login user s console cluster host DISPLAY=localhost:10.0 cluster host DISPLAY=localhost:10.0 "scout -g pcc" environment variables copied cluster host DISPLAY=localhost:10.0 X Forwarding user s console cluster host "scrun avidemux" DISPLAY=localhost:10.0 cluster host avidemux DISPLAY=localhost:10.0 cluster host avidemux DISPLAY=localhost: : 15

22 ssh login user s console cluster host DISPLAY=user s console:10.0 "scout -g pcc" cluster host DISPLAY=user s console:10.0 environment variables cop cluster host DISPLAY=user s console:10.0 user s console cluster host "scrun avidemux" DISPLAY=user s console:10.0 cluster host avidemux DISPLAY=user s console:10.0 cluster host avidemux DISPLAY=use s console: : 16

23 int myid,nprocs; int main(int argc, char *argv[]) { extern int myid; // extern int nprocs; // PE MPI MPI Init MPI PE main MPI Init MPI Comm rank MPI Comm size int main(int argc, char *argv[]) { pthread_t tid; FCT_VOID *thread; MPI_Init(&argc,&argv); MPI_Comm_rank(MPI_COMM_WORLD,&myid); MPI_Comm_size(MPI_COMM_WORLD,&nprocs); dll GTK+ gtk init PE avidemux GTK+ atexit 17

24 atexit(onexit); gtk_set_locale(); gtk_init(&argc, &argv); gdk_rgb_init(); PE gtk main PE PE children main PE gtk widget show PE0 window1 if(myid==0) { gtk_widget_show(window1); gtk_main(); } else { children_main(); } return 0; } PE GUI avidemux/gtk gui.cpp void HandleAction(Action action) (avidemux/gui action.hxx enum ) switch PE action MPI Isend PE GUI 18

25 void HandleAction(Action action) { uint32_t nf=0; mybcast_pe0(null, 0, MPI_CHAR, (int)action, MPI_COMM_WORLD); switch(action) { case ACT_LoadWork: GUI_FileSelRead("Select workbench to load ", A_loadWorkbench); updateloaded(); return; break; case ACT_VideoConfigure: printf("\n **\n"); videocodecconfigure(); return; break; PE PE switch gtk main children main HandleAction event switcher void children_main(void) { int eventtag; printf("node %d stand by ok.\n",myid); while(1){ eventtag = MPI_ANY_TAG; mybcast_children(null, 0, MPI_CHAR, &eventtag, MPI_COMM_WORLD); event_switcher(eventtag); } } 19

26 void event_switcher(int eventtag) { uint32_t nf=0; switch(eventtag) { case : exit(0); case ACT_LoadWork: recvfile(eventtag); updateloaded(); return; case ACT_VideoConfigure: videocodecconfigure(); return; event switcher HandleAction case GUI FileSelRead recvfile mybcast pe0 mybcast children MPI MPI Isend, MPI Irecv PE0 void mybcast_pe0(void *buff, int count, MPI_Datatype datatype, int tag, MPI_Comm MPI_Request mpirequest; MPI_Status mpistatus; int dest = 1; while(1) { if(dest > nprocs -1) break; MPI_Isend(buff, count, datatype, dest, tag, comm, &mpirequest); MPI_Wait(&mpirequest, &mpistatus); dest = dest * 2; } } 20

27 void mybcast_children(void *buff, int buffsize, MPI_Datatype datatype, int *retu MPI_Request mpirequest; MPI_Status mpistatus; int tag, count, distance, dest; tag = *returntag; MPI_Irecv(buff, buffsize, datatype, MPI_ANY_SOURCE, tag, comm, &mpirequest); MPI_Wait(&mpirequest, &mpistatus); if(tag== MPI_ANY_TAG) { *returntag=mpistatus.mpi_tag; } distance = myid-mpistatus.mpi_source; MPI_Get_count(&mpistatus, datatype, &count); while(1) { distance = distance * 2; dest = myid + distance; if(dest > nprocs -1) break; MPI_Isend(buff, count, datatype, dest, *returntag, comm, &mpirequest); MPI_Wait(&mpirequest, &mpistatus); } } atexit atexit onexit PE PE

28 void onexit( void ) { MPI_Request mpirequest; MPI_Status mpistatus; if(myid==0) mybcast_pe0(null,0,mpi_char,444444,mpi_comm_world); filtercleanup(); printf("node %d exiting...\n",myid); MPI_Finalize(); } PE exit(0) onexit PE PE PE PE PE PE PE PE PE avidemux case ACT_LoadWork: GUI_FileSelRead("Select workbench to load ", A_loadWorkbench); GUI FileSelRead GUI FileSelRead A loadworkbench GUI FileSelRead avidemux/adm tookkit/filesel.cpp start thread PE 22

29 void start_thread(void *ptr) { ( ) fd=fopen(selected_file,"rb"); if(!fd) { GUI_Alert("Cannot open this file!"); /* PE */ filesize = -1; mybcast_pe0(&filesize, 1, MPI_INT, 0, MPI_COMM_WORLD); return; } else { fseek(fd, 0, SEEK_END); filesize = ftell(fd); fseek(fd, 0, SEEK_SET); buff = (char *)malloc(filesize); fread(buff, filesize, 1, fd); // mybcast_pe0(&filesize, 1, MPI_INT, 0, MPI_COMM_WORLD); // mybcast_pe0(buff, filesize, MPI_CHAR, 1, MPI_COMM_WORLD); free(buff); } fclose(fd); _callback(selected_file); PE GUI FileSelRead recvfile recvfile PE switch GUI FileSelRead 23

30 void recvfile(int action) { ( ) mpitag = 0; // mybcast_children(&buffsize,1,mpi_int,&mpitag,mpi_comm_world); // if(buffsize < 0) return; buff = (char *)malloc(buffsize); mpitag = 1; // mybcast_children(buff,buffsize,mpi_char,&mpitag,mpi_comm_world); ( ) fd = fopen(tmpfilename, "wb"); if(!fd) { printf("node: %d can t make the tmpfile\n", myid); return; } if(!(fwrite(buff, buffsize, 1, fd))) { return; } free(buff); fclose(fd); switch(action) { case ACT_LoadWork: A_loadWorkbench(tmpfilename); break; ( ) } return; } Save AVI PE PE 24

31 avidemux/gui savenew.cpp A SaveAudioNVideo PE 1PE = ( - ) / PE PE = + (1PE x ) PE = PE + 1PE - 1 PE PE PE PE PE PE PE PE if(myid==0)filegather_recvfiles(); else filegather_sendfile(); PE filegather sendfile 1. PE ( PE ) 2. PE 25

32 void filegather_recvfiles(void) { ( ) for(i = 1; i<nprocs; i++) { // MPI_Recv(&buffsize,1,MPI_INT,MPI_ANY_SOURCE,0,MPI_COMM_WORLD,&mpistatus); source = mpistatus.mpi_source; ( ) buff = (char *)malloc(buffsize); // MPI_Recv(buff,buffsize,MPI_CHAR,source,1,MPI_COMM_WORLD,&mpistatus); ofstream out(tmpsaveavifilename, ios::out ios::binary); out.write(buff,buffsize); out.close(); free(buff); } } PE filegather recvfiles 1. PE ( PE ) 2. PE 3. PE 1 26

33 void filegather_sendfile(void) { ( ) ifstream in(tmpsaveavifilename, ios::in ios::binary); in.seekg(0,ios::end); filesize = in.tellg(); in.seekg(0,ios::beg); buff = (char *)malloc(filesize); in.read(buff,filesize); MPI_Send(&filesize,1,MPI_INT,0,0,MPI_COMM_WORLD); // MPI_Send(buff,filesize,MPI_CHAR,0,1,MPI_COMM_WORLD); // free(buff); in.close(); } MPI Gather PE PE avidemux A openavi(avi ) A appendavi( AVI ) A SaveAudioNVideo( audioprocessmode videoprocessmode 0 AVI ) 27

34 A_openAvi_pe0(tmpsaveavifilename00); for(i=1;i<nprocs;i++) { tmpsaveavifilename[filename_length] = 0 + (int)(i / 10); tmpsaveavifilename[filename_length+1] = 0 +(i % 10); tmpsaveavifilename[filename_length+2] = \0 ; A_appendAvi_pe0(tmpsaveavifilename); } tmpsaveavifilename[filename_length] = \0 ; framestart = tmpframestart; frameend = tmpframeend; A_SaveAudioNVideo_pe0(realname); 28

35 5 avidemux avidemux 640x360, DivX 320x240, 900 AVI DivX CQ( ) 4 3 folon4 SMP 1 1PE 5.1 PE PE 1 / PE 5.1 sec total bcasting merging gathering PE0 enctime max PE enctime min PE enctime pe0 PE0 enctime avg PE waittime max PE PE0 PE DivX PE PE avidemux Avi PE 29

36 PE total bcasting merging gathering enctime max enctime min PE enctime pe0 enctime avg waittime max : DivX 640x frames to DivX CQ4 30

37 PE total bcasting merging gathering enctime max enctime min PE enctime pe0 enctime avg waittime max : Avi 320x frames to DivX CQ4 31

38 5.1: avidemux 32

39 6 6.1 PE PE MPEG PE PE MPEG-1/2/4 GOP(GOV) 1/ PE I/O I/O MPEG AVI I/O mmap HDD 33

40 Pass 2-Pass PE 1-Pass 1-Pass PE 1-Pass PE GUI GUI PE 34

41 Folon avidemux mean 35

42 [1] P., :MPI,,2001. [2],,,,, : Linux,, [3] PC Cluster Consortium, 2001, [4] : GIMP,, [5] : MPI GIMP core,, [6] avidemux, 2002, [7] MPEG Home Page, 2003, [8] ISO/IEC JTC1/SC29/WG11 N2564 Overview of the MPEG-4 Standard, [9] PIONEER R&D, 2002, 36

para02-2.dvi

para02-2.dvi 2002 2 2002 4 23 : MPI MPI 1 MPI MPI(Message Passing Interface) MPI UNIX Windows Machintosh OS, MPI 2 1 1 2 2.1 1 1 1 1 1 1 Fig. 1 A B C F Fig. 2 A B F Fig. 1 1 1 Fig. 2 2.2 Fig. 3 1 . Fig. 4 Fig. 3 Fig.

More information

卒業論文

卒業論文 PC OpenMP SCore PC OpenMP PC PC PC Myrinet PC PC 1 OpenMP 2 1 3 3 PC 8 OpenMP 11 15 15 16 16 18 19 19 19 20 20 21 21 23 26 29 30 31 32 33 4 5 6 7 SCore 9 PC 10 OpenMP 14 16 17 10 17 11 19 12 19 13 20 1421

More information

WinHPC ppt

WinHPC ppt MPI.NET C# 2 2009 1 20 MPI.NET MPI.NET C# MPI.NET C# MPI MPI.NET 1 1 MPI.NET C# Hello World MPI.NET.NET Framework.NET C# API C# Microsoft.NET java.net (Visual Basic.NET Visual C++) C# class Helloworld

More information

develop

develop SCore SCore 02/03/20 2 1 HA (High Availability) HPC (High Performance Computing) 02/03/20 3 HA (High Availability) Mail/Web/News/File Server HPC (High Performance Computing) Job Dispatching( ) Parallel

More information

MPI usage

MPI usage MPI (Version 0.99 2006 11 8 ) 1 1 MPI ( Message Passing Interface ) 1 1.1 MPI................................. 1 1.2............................... 2 1.2.1 MPI GATHER.......................... 2 1.2.2

More information

44 6 MPI 4 : #LIB=-lmpich -lm 5 : LIB=-lmpi -lm 7 : mpi1: mpi1.c 8 : $(CC) -o mpi1 mpi1.c $(LIB) 9 : 10 : clean: 11 : -$(DEL) mpi1 make mpi1 1 % mpiru

44 6 MPI 4 : #LIB=-lmpich -lm 5 : LIB=-lmpi -lm 7 : mpi1: mpi1.c 8 : $(CC) -o mpi1 mpi1.c $(LIB) 9 : 10 : clean: 11 : -$(DEL) mpi1 make mpi1 1 % mpiru 43 6 MPI MPI(Message Passing Interface) MPI 1CPU/1 PC Cluster MPICH[5] 6.1 MPI MPI MPI 1 : #include 2 : #include 3 : #include 4 : 5 : #include "mpi.h" 7 : int main(int argc,

More information

NUMAの構成

NUMAの構成 メッセージパッシング プログラミング 天野 共有メモリ対メッセージパッシング 共有メモリモデル 共有変数を用いた単純な記述自動並列化コンパイラ簡単なディレクティブによる並列化 :OpenMP メッセージパッシング 形式検証が可能 ( ブロッキング ) 副作用がない ( 共有変数は副作用そのもの ) コストが小さい メッセージパッシングモデル 共有変数は使わない 共有メモリがないマシンでも実装可能 クラスタ

More information

橡3_2石川.PDF

橡3_2石川.PDF PC RWC 01/10/31 2 1 SCore 1,024 PC SCore III PC 01/10/31 3 SCore SCore Aug. 1995 Feb. 1996 Oct. 1996 1997-1998 Oct. 1999 Oct. 2000 April. 2001 01/10/31 4 2 SCore University of Bonn, Germany University

More information

2 T 1 N n T n α = T 1 nt n (1) α = 1 100% OpenMP MPI OpenMP OpenMP MPI (Message Passing Interface) MPI MPICH OpenMPI 1 OpenMP MPI MPI (trivial p

2 T 1 N n T n α = T 1 nt n (1) α = 1 100% OpenMP MPI OpenMP OpenMP MPI (Message Passing Interface) MPI MPICH OpenMPI 1 OpenMP MPI MPI (trivial p 22 6 22 MPI MPI 1 1 2 2 3 MPI 3 4 7 4.1.................................. 7 4.2 ( )................................ 10 4.3 (Allreduce )................................. 12 5 14 5.1........................................

More information

演習 II 2 つの講義の演習 奇数回 : 連続系アルゴリズム 部分 偶数回 : 計算量理論 部分 連続系アルゴリズム部分は全 8 回を予定 前半 2 回 高性能計算 後半 6 回 数値計算 4 回以上の課題提出 ( プログラム + 考察レポート ) で単位

演習 II 2 つの講義の演習 奇数回 : 連続系アルゴリズム 部分 偶数回 : 計算量理論 部分 連続系アルゴリズム部分は全 8 回を予定 前半 2 回 高性能計算 後半 6 回 数値計算 4 回以上の課題提出 ( プログラム + 考察レポート ) で単位 演習 II ( 連続系アルゴリズム ) 第 1 回 : MPI 須田研究室 M2 本谷徹 motoya@is.s.u-tokyo.ac.jp 2012/10/05 2012/10/18 補足 訂正 演習 II 2 つの講義の演習 奇数回 : 連続系アルゴリズム 部分 偶数回 : 計算量理論 部分 連続系アルゴリズム部分は全 8 回を予定 前半 2 回 高性能計算 後半 6 回 数値計算 4 回以上の課題提出

More information

Microsoft PowerPoint - KHPCSS pptx

Microsoft PowerPoint - KHPCSS pptx KOBE HPC サマースクール 2018( 初級 ) 9. 1 対 1 通信関数, 集団通信関数 2018/8/8 KOBE HPC サマースクール 2018 1 2018/8/8 KOBE HPC サマースクール 2018 2 MPI プログラム (M-2):1 対 1 通信関数 問題 1 から 100 までの整数の和を 2 並列で求めなさい. プログラムの方針 プロセス0: 1から50までの和を求める.

More information

1重谷.PDF

1重谷.PDF RSCC RSCC RSCC BMT 1 6 3 3000 3000 200310 1994 19942 VPP500/32PE 19992 VPP700E/128PE 160PE 20043 2 2 PC Linux 2048 CPU Intel Xeon 3.06GHzDual) 12.5 TFLOPS SX-7 32CPU/256GB 282.5 GFLOPS Linux 3 PC 1999

More information

±é½¬£²¡§£Í£Ð£É½éÊâ

±é½¬£²¡§£Í£Ð£É½éÊâ 2012 8 7 1 / 52 MPI Hello World I ( ) Hello World II ( ) I ( ) II ( ) ( sendrecv) π ( ) MPI fortran C wget http://www.na.scitec.kobe-u.ac.jp/ yaguchi/riken2012/enshu2.zip unzip enshu2.zip 2 / 52 FORTRAN

More information

目 目 用方 用 用 方

目 目 用方 用 用 方 大 生 大 工 目 目 用方 用 用 方 用 方 MS-MPI MPI.NET MPICH MPICH2 LAM/MPI Ver. 2 2 1 2 1 C C++ Fortan.NET C# C C++ Fortan 用 行 用 用 用 行 用 言 言 言 行 生 方 方 一 行 高 行 行 文 用 行 If ( rank == 0 ) { // 0 } else if (rank == 1) {

More information

Microsoft PowerPoint - 講義:片方向通信.pptx

Microsoft PowerPoint - 講義:片方向通信.pptx MPI( 片方向通信 ) 09 年 3 月 5 日 神戸大学大学院システム情報学研究科計算科学専攻横川三津夫 09/3/5 KOBE HPC Spring School 09 分散メモリ型並列計算機 複数のプロセッサがネットワークで接続されており, れぞれのプロセッサ (PE) が, メモリを持っている. 各 PE が自分のメモリ領域のみアクセス可能 特徴数千から数万 PE 規模の並列システムが可能

More information

演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 RIKEN AICS HPC Spring School /3/5

演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 RIKEN AICS HPC Spring School /3/5 演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 演習準備の内容 神戸大 FX10(π-Computer) 利用準備 システム概要 ログイン方法 コンパイルとジョブ実行方法 MPI 復習 1. MPIプログラムの基本構成 2. 並列実行 3. 1 対 1 通信 集団通信 4. データ 処理分割 5. 計算時間計測 2 神戸大 FX10(π-Computer) 利用準備

More information

PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 P

PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 P PC Development of Distributed PC Grid System,,,, Junji Umemoto, Hiroyuki Ebara, Katsumi Onishi, Hiroaki Morikawa, and Bunryu U PC WAN PC PC WAN PC 1 PC PC PC PC PC Key Words:Grid, PC Cluster, Distributed

More information

Microsoft PowerPoint - 講義:コミュニケータ.pptx

Microsoft PowerPoint - 講義:コミュニケータ.pptx コミュニケータとデータタイプ (Communicator and Datatype) 2019 年 3 月 15 日 神戸大学大学院システム情報学研究科横川三津夫 2019/3/15 Kobe HPC Spring School 2019 1 講義の内容 コミュニケータ (Communicator) データタイプ (Datatype) 演習問題 2019/3/15 Kobe HPC Spring School

More information

chap2.ppt

chap2.ppt 2. メッセージ通信計算 2.1 メッセージ通信プログラミングの基本 プログラミングの選択肢 特別な並列プログラミング言語を設計する occam (Inmos, 1984, 1986) 既存の逐次言語の文法 / 予約語をメッセージ通信を処理できるように拡張する 既存の逐次言語を用い メッセージ通信のための拡張手続のライブラリを用意する どのプロセスを実行するのか メッセージ通信のタイミング 中身を明示的に指定する必要がある

More information

( CUDA CUDA CUDA CUDA ( NVIDIA CUDA I

(    CUDA CUDA CUDA CUDA (  NVIDIA CUDA I GPGPU (II) GPGPU CUDA 1 GPGPU CUDA(CUDA Unified Device Architecture) CUDA NVIDIA GPU *1 C/C++ (nvcc) CUDA NVIDIA GPU GPU CUDA CUDA 1 CUDA CUDA 2 CUDA NVIDIA GPU PC Windows Linux MaxOSX CUDA GPU CUDA NVIDIA

More information

スライド 1

スライド 1 Parallel Programming in MPI part 2 1 1 Today's Topic ノンブロッキング通信 Non-Blocking Communication 通信の完了を待つ間に他の処理を行う Execute other instructions while waiting for the completion of a communication. 集団通信関数の実装 Implementation

More information

Microsoft PowerPoint 並列アルゴリズム04.ppt

Microsoft PowerPoint 並列アルゴリズム04.ppt 並列アルゴリズム 2005 年後期火曜 2 限 青柳睦 Aoyagi@cc.kyushu-u.ac.jp http://server-500.cc.kyushu-u.ac.jp/ 11 月 8 日 ( 火 ) 5. MPI の基礎 6. 並列処理の性能評価 1 もくじ 1. 序並列計算機の現状 2. 計算方式およびアーキテクチュアの分類 3. 並列計算の目的と課題 4. 数値計算における各種の並列化

More information

86 8 MPIBNCpack 15 : int n, myid, numprocs, i; 16 : double pi, start_x, end_x; 17 : double startwtime = 0.0, endwtime; 18 : int namelen; 19 : char pro

86 8 MPIBNCpack 15 : int n, myid, numprocs, i; 16 : double pi, start_x, end_x; 17 : double startwtime = 0.0, endwtime; 18 : int namelen; 19 : char pro 85 8 MPIBNCpack 1CPU BNCpack MPIBNCpack 1 1 8.1 5.2 (5.1) f (a), f (b), f (x i ) PE reduce 1 0 1 1 + x 2 dx = π 4 mpi-int.c mpi-int-gmp.c mpi-int.c 2 : #include 3 : #include "mpi.h" 5 : 6 : #include

More information

A B 1: Ex. MPICH-G2 C.f. NXProxy [Tanaka] 2:

A B 1: Ex. MPICH-G2 C.f. NXProxy [Tanaka] 2: Java Jojo ( ) ( ) A B 1: Ex. MPICH-G2 C.f. NXProxy [Tanaka] 2: Java Jojo Jojo (1) :Globus GRAM ssh rsh GRAM ssh GRAM A rsh B Jojo (2) ( ) Jojo Java VM JavaRMI (Sun) Horb(ETL) ( ) JPVM,mpiJava etc. Send,

More information

install

install SCore SCore 5.0 2001.03.19 devel@pccluster.org SCore Backbone LAN Ethernet EEPRO100 Myrinet-2000 Fibre 02/03/20 2 1 NIC (Network Interface Card) NIC 100Mbps Ethernet EEPRO100 Tulip 3C905B Network Trunking

More information

MPI MPI MPI.NET C# MPI Version2

MPI MPI MPI.NET C# MPI Version2 MPI.NET C# 2 2009 2 27 MPI MPI MPI.NET C# MPI Version2 MPI (Message Passing Interface) MPI MPI Version 1 1994 1 1 1 1 ID MPI MPI_Send MPI_Recv if(rank == 0){ // 0 MPI_Send(); } else if(rank == 1){ // 1

More information

untitled

untitled OpenMP MPI OpenMPI 1 2 http://www.es.jamstec.go.jp/ 3 4 http://www.top500.org/ CPU 3GHz, 10GHz 90nm 65nm, 45nm VLIW L3 Intel Hyperthreading CPU Pentium 5 6 7 8 Cell 23400 90nm 221mm2 SPU 1.52Moore s Law

More information

スライド 1

スライド 1 目次 2.MPI プログラミング入門 この資料は, スーパーコン 10 で使用したものである. ごく基本的な内容なので, 現在でも十分利用できると思われるものなので, ここに紹介させて頂く. ただし, 古い情報も含まれているので注意が必要である. 今年度版の解説は, 本選の初日に配布する予定である. 1/20 2.MPI プログラミング入門 (1) 基本 説明 MPI (message passing

More information

Krylov (b) x k+1 := x k + α k p k (c) r k+1 := r k α k Ap k ( := b Ax k+1 ) (d) β k := r k r k 2 2 (e) : r k 2 / r 0 2 < ε R (f) p k+1 :=

Krylov (b) x k+1 := x k + α k p k (c) r k+1 := r k α k Ap k ( := b Ax k+1 ) (d) β k := r k r k 2 2 (e) : r k 2 / r 0 2 < ε R (f) p k+1 := 127 10 Krylov Krylov (Conjugate-Gradient (CG ), Krylov ) MPIBNCpack 10.1 CG (Conjugate-Gradient CG ) A R n n a 11 a 12 a 1n a 21 a 22 a 2n A T = =... a n1 a n2 a nn n a 11 a 21 a n1 a 12 a 22 a n2 = A...

More information

Microsoft PowerPoint - 演習2:MPI初歩.pptx

Microsoft PowerPoint - 演習2:MPI初歩.pptx 演習 2:MPI 初歩 - 並列に計算する - 2013 年 8 月 6 日 神戸大学大学院システム情報学研究科計算科学専攻横川三津夫 MPI( メッセージ パッシング インターフェース ) を使おう! [ 演習 2 の内容 ] はじめの一歩課題 1: Hello, world を並列に出力する. 課題 2: プロセス 0 からのメッセージを受け取る (1 対 1 通信 ). 部分に分けて計算しよう課題

More information

untitled

untitled taisuke@cs.tsukuba.ac.jp http://www.hpcs.is.tsukuba.ac.jp/~taisuke/ CP-PACS HPC PC post CP-PACS CP-PACS II 1990 HPC RWCP, HPC かつての世界最高速計算機も 1996年11月のTOP500 第一位 ピーク性能 614 GFLOPS Linpack性能 368 GFLOPS (地球シミュレータの前

More information

SystemC言語概論

SystemC言語概論 SystemC CPU S/W 2004/01/29 4 SystemC 1 SystemC 2.0.1 CPU S/W 3 ISS SystemC Co-Simulation 2004/01/29 4 SystemC 2 ISS SystemC Co-Simulation GenericCPU_Base ( ) GenericCPU_ISS GenericCPU_Prog GenericCPU_CoSim

More information

nakayama15icm01_l7filter.pptx

nakayama15icm01_l7filter.pptx Layer-7 SDN SDN NFV 50 % 3 MVNO 1 2 ICM @ 2015/01/16 2 1 1 2 2 1 2 2 ICM @ 2015/01/16 3 2 Service Dependent Management (SDM) SDM Simple Management of Access-Restriction Translator Gateway (SMART-GW) ICM

More information

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5]

C/C++ FORTRAN FORTRAN MPI MPI MPI UNIX Windows (SIMD Single Instruction Multipule Data) SMP(Symmetric Multi Processor) MPI (thread) OpenMP[5] MPI ( ) snozawa@env.sci.ibaraki.ac.jp 1 ( ) MPI MPI Message Passing Interface[2] MPI MPICH[3],LAM/MPI[4] (MIMDMultiple Instruction Multipule Data) Message Passing ( ) (MPI (rank) PE(Processing Element)

More information

double float

double float 2015 3 13 1 2 2 3 2.1.......................... 3 2.2............................. 3 3 4 3.1............................... 4 3.2 double float......................... 5 3.3 main.......................

More information

コードのチューニング

コードのチューニング ハイブリッド並列 八木学 ( 理化学研究所計算科学研究機構 ) 謝辞 松本洋介氏 ( 千葉大学 ) KOBE HPC Spring School 2017 2017 年 3 月 14 日神戸大学計算科学教育センター MPI とは Message Passing Interface 分散メモリのプロセス間の通信規格(API) SPMD(Single Program Multi Data) が基本 -

More information

21 20 20413525 22 2 4 i 1 1 2 4 2.1.................................. 4 2.1.1 LinuxOS....................... 7 2.1.2....................... 10 2.2........................ 15 3 17 3.1.................................

More information

¥Ñ¥Ã¥±¡¼¥¸ Rhpc ¤Î¾õ¶·

¥Ñ¥Ã¥±¡¼¥¸ Rhpc ¤Î¾õ¶· Rhpc COM-ONE 2015 R 27 12 5 1 / 29 1 2 Rhpc 3 forign MPI 4 Windows 5 2 / 29 1 2 Rhpc 3 forign MPI 4 Windows 5 3 / 29 Rhpc, R HPC Rhpc, ( ), snow..., Rhpc worker call Rhpc lapply 4 / 29 1 2 Rhpc 3 forign

More information

Second-semi.PDF

Second-semi.PDF PC 2000 2 18 2 HPC Agenda PC Linux OS UNIX OS Linux Linux OS HPC 1 1CPU CPU Beowulf PC (PC) PC CPU(Pentium ) Beowulf: NASA Tomas Sterling Donald Becker 2 (PC ) Beowulf PC!! Linux Cluster (1) Level 1:

More information

<4D F736F F F696E74202D C097F B A E B93C782DD8EE682E890EA97705D>

<4D F736F F F696E74202D C097F B A E B93C782DD8EE682E890EA97705D> 並列アルゴリズム 2005 年後期火曜 2 限 青柳睦 Aoyagi@cc.kyushu-u.ac.jp http://server-500.cc.kyushu-u.ac.jp/ 10 月 18( 火 ) 4. 数値計算における各種の並列化 5. MPI の基礎 1 講義の概要 並列計算機や計算機クラスターなどの分散環境における並列処理の概論 MPI および OpenMP による並列計算 理工学分野の並列計算アルゴリズム

More information

120802_MPI.ppt

120802_MPI.ppt CPU CPU CPU CPU CPU SMP Symmetric MultiProcessing CPU CPU CPU CPU CPU CPU CPU CPU CPU CPU CPU CPU CP OpenMP MPI MPI CPU CPU CPU CPU CPU CPU CPU CPU CPU CPU MPI MPI+OpenMP CPU CPU CPU CPU CPU CPU CPU CP

More information

スライド 1

スライド 1 計算科学演習 MPI 基礎 学術情報メディアセンター情報学研究科 システム科学専攻中島浩 目次 プログラミングモデル SPMD 同期通信 / 非同期通信 MPI 概論 プログラム構造 Communicator & rank データ型 タグ 一対一通信関数 1 次元分割並列化 : 基本 基本的考え方 配列宣言 割付 部分領域交換 結果出力 1 次元分割並列化 : 高速化 通信 計算のオーバーラップ 通信回数削減

More information

main() {... } main() { main() { main() {......... } } } main() { main() { main() {......... } } } main() { if(rank==)... } main() { if(rank==)... } main() { if(rank==x)... } P(N) P(N) / P(M) * ( M / N

More information

86

86 86 86 86 main() {... } main() { main() { main() {......... } } } 86 main() { main() { main() {......... } } } main() { if(rank==)... } main() { if(rank==)... } main() { if(rank==x)... } 86 P(N) P(N) /

More information

C

C C 1 2 1.1........................... 2 1.2........................ 2 1.3 make................................................ 3 1.4....................................... 5 1.4.1 strip................................................

More information

Microsoft PowerPoint MPI.v...O...~...O.e.L.X.g(...Q..)

Microsoft PowerPoint MPI.v...O...~...O.e.L.X.g(...Q..) MPI プログラミング Information Initiative Center, Hokkaido Univ. MPI ライブラリを利用した分散メモリ型並列プログラミング 分散メモリ型並列処理 : 基礎 分散メモリマルチコンピュータの構成 プロセッサエレメントが専用のメモリ ( ローカルメモリ ) を搭載 スケーラビリティが高い 例 :HITACHI SR8000 Interconnection

More information

スライド 1

スライド 1 計算科学演習 MPI 基礎 学術情報メディアセンター 情報学研究科 システム科学専攻 中島浩 目次 プログラミングモデル SPMD 同期通信 / 非同期通信 MPI 概論 プログラム構造 Communicator & rank データ型 タグ 一対一通信関数 1 次元分割並列化 : 基本 基本的考え方 配列宣言 割付 部分領域交換 結果出力 1 次元分割並列化 : 高速化 通信 計算のオーバーラップ

More information

XcalableMP入門

XcalableMP入門 XcalableMP 1 HPC-Phys@, 2018 8 22 XcalableMP XMP XMP Lattice QCD!2 XMP MPI MPI!3 XMP 1/2 PCXMP MPI Fortran CCoarray C++ MPIMPI XMP OpenMP http://xcalablemp.org!4 XMP 2/2 SPMD (Single Program Multiple Data)

More information

Gfarm/MPI-IOの 概要と使い方

Gfarm/MPI-IOの 概要と使い方 MPI-IO/Gfarm のご紹介と現在の開発状況 鷹津冬将 2018/3/2 Gfarm ワークショップ 2018 1 目次 MPI-IO/Gfarm 概要 MPI-IO/Gfarm の開発状況 MVAPICH2 向け MPI-IO/Gfarm MPI-IO/Gfarm の使い方 かんたんなサンプルプログラムと動作確認の方法 既知の不具合 まとめと今後の展望 2018/3/2 Gfarm ワークショップ

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション AICS 公開ソフトウェア講習会 15 回 表題通信ライブラリと I/O ライブラリ 場所 AICS R104-2 時間 2016/03/23 ( 水 ) 13:30-17:00 13:30-13:40 全体説明 13:40-14:10 PRDMA 14:10-14:40 MPICH 14:40-15:10 PVAS 15:10-15:30 休憩 15:30-16:00 Carp 16:00-16:30

More information

第5回お試しアカウント付き並列プログラミング講習会

第5回お試しアカウント付き並列プログラミング講習会 qstat -l ID (qstat -f) qscript ID BATCH REQUEST: 253443.batch1 Name: test.sh Owner: uid=32637, gid=30123 Priority: 63 State: 1(RUNNING) Created at: Tue Jun 30 05:36:24 2009 Started at: Tue Jun 30 05:36:27

More information

VNSTProductDes3.0-1_jp.pdf

VNSTProductDes3.0-1_jp.pdf Visual Nexus Secure Transport 2005/10/18 Visual Nexus http:// www.visualnexus.com/jp/support.htm Visual Nexus Secure Transport 2005/02/25 1 2005/10/18 Ver3.0-1 2005 10 18 108-0075 21119 2 Visual Nexus

More information

SystemC 2.0を用いた簡易CPUバスモデルの設計

SystemC 2.0を用いた簡易CPUバスモデルの設計 SystemC 2.0 CPU CPU CTD&SW CT-PF 2002/1/23 1 CPU BCA UTF GenericCPU IO (sc_main) 2002/1/23 2 CPU CPU CQ 1997 11 Page 207 4 Perl Verilog-HDL CPU / Verilog-HDL SystemC 2.0 (asm) ROM (test.hex) 2002/1/23

More information

£Ã¥×¥í¥°¥é¥ß¥ó¥°ÆþÌç (2018) - Â裵²ó ¨¡ À©¸æ¹½Â¤¡§¾ò·ïʬ´ô ¨¡

£Ã¥×¥í¥°¥é¥ß¥ó¥°ÆþÌç (2018) - Â裵²ó  ¨¡ À©¸æ¹½Â¤¡§¾ò·ïʬ´ô ¨¡ (2018) 2018 5 17 0 0 if switch if if ( ) if ( 0) if ( ) if ( 0) if ( ) (0) if ( 0) if ( ) (0) ( ) ; if else if ( ) 1 else 2 if else ( 0) 1 if ( ) 1 else 2 if else ( 0) 1 if ( ) 1 else 2 (0) 2 if else

More information

<4D F736F F F696E74202D C097F B A E B93C782DD8EE682E890EA97705D>

<4D F736F F F696E74202D C097F B A E B93C782DD8EE682E890EA97705D> 並列アルゴリズム 2005 年後期火曜 2 限青柳睦 Aoyagi@cc.kyushu-u.ac.jp http//server-500.cc.kyushu-u.ac.jp/ 11 月 29( 火 ) 7. 集団通信 (Collective Communication) 8. 領域分割 (Domain Decomposition) 1 もくじ 1. 序並列計算機の現状 2. 計算方式およびアーキテクチュアの分類

More information

Quickstart Guide 3rd Edition

Quickstart Guide 3rd Edition 10 QNX QNX 1 2 3 4 5 QNX Momentics QNX Neutrino RTOS QNX Neutrino 6 7 8 QNX Neutrino 9 10 1 1 QNX Neutrino RTOS QNX Momentics Windows Vista Windows 2000 Windows XP Linux QNX Neutrino QNX Momentics CD http://www.qnx.co.jp/

More information

第3回戦略シンポジウム緑川公開用

第3回戦略シンポジウム緑川公開用 2010 5 15 - - (SDSM) SMS MpC DLM Top500 Top 500 list of Supercomputers (http://www.top500.org) Top 500 list of Supercomputers (http://www.top500.org) 1998 11 SMP Symmetric Multiprocessor CPU CPU CPU CPU

More information

情報処理演習 II

情報処理演習 II 2004 年 6 月 15 日 長谷川秀彦 情報処理演習 II Parallel Computing on Distributed Memory Machine 1. 分散メモリ方式並列計算の基礎 複数の CPU がそれぞれのメモリを持ち 独立に動作するコンピュータを分散メモリ方式並列コンピュータ 正確には Distributed Memory Parallel Computer という これには複数の

More information

programmingII2019-v01

programmingII2019-v01 II 2019 2Q A 6/11 6/18 6/25 7/2 7/9 7/16 7/23 B 6/12 6/19 6/24 7/3 7/10 7/17 7/24 x = 0 dv(t) dt = g Z t2 t 1 dv(t) dt dt = Z t2 t 1 gdt g v(t 2 ) = v(t 1 ) + g(t 2 t 1 ) v v(t) x g(t 2 t 1 ) t 1 t 2

More information

untitled

untitled CPU CPU PC 1 3GHz, 10GHz 0.13m VLIW L3 Intel Hyperthreading Intel IA32: Xeon, P4 PC Intel IA64: Itanium2 64 Itanium2 (Deerfield) AMD x86-64: Opteron x8664 x86 Sun SPARC,IBM Power, Alpha, MIPS, PCPDA P

More information

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの ( 財 ) 計算科学振興財団 大学院 GP 大学連合による計算科学の最先端人材育成 第 1 回社会人向けスパコン実践セミナー資料 29 年 2 月 17 日 13:15~14:45 九州大学情報基盤研究開発センター 南里豪志 1 講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法

More information

Intel® Compilers Professional Editions

Intel® Compilers Professional Editions 2007 6 10.0 * 10.0 6 5 Software &Solutions group 10.0 (SV) C++ Fortran OpenMP* OpenMP API / : 200 C/C++ Fortran : OpenMP : : : $ cat -n main.cpp 1 #include 2 int foo(const char *); 3 int main()

More information

コードのチューニング

コードのチューニング MPI による並列化実装 ~ ハイブリッド並列 ~ 八木学 ( 理化学研究所計算科学研究センター ) KOBE HPC Spring School 2019 2019 年 3 月 14 日 MPI とは Message Passing Interface 分散メモリのプロセス間の通信規格(API) SPMD(Single Program Multi Data) が基本 - 各プロセスが 同じことをやる

More information

slide5.pptx

slide5.pptx ソフトウェア工学入門 第 5 回コマンド作成 1 head コマンド作成 1 早速ですが 次のプログラムを head.c という名前で作成してください #include #include static void do_head(file *f, long nlines); int main(int argc, char *argv[]) { if (argc!=

More information

115 9 MPIBNCpack 9.1 BNCpack 1CPU X = , B =

115 9 MPIBNCpack 9.1 BNCpack 1CPU X = , B = 115 9 MPIBNCpack 9.1 BNCpack 1CPU 1 2 3 4 5 25 24 23 22 21 6 7 8 9 10 20 19 18 17 16 X = 11 12 13 14 15, B = 15 14 13 12 11 16 17 18 19 20 10 9 8 7 6 21 22 23 24 25 5 4 3 2 1 C = XB X dmat1 B dmat2 C dmat

More information

£Ã¥×¥í¥°¥é¥ß¥ó¥°ÆþÌç (2018) - Â裶²ó ¨¡ À©¸æ¹½Â¤¡§·«¤êÊÖ¤· ¨¡

£Ã¥×¥í¥°¥é¥ß¥ó¥°ÆþÌç (2018) - Â裶²ó  ¨¡ À©¸æ¹½Â¤¡§·«¤êÊÖ¤· ¨¡ (2018) 2018 5 24 ( ) while ( ) do while ( ); for ( ; ; ) while int i = 0; while (i < 100) { printf("i = %3d\n", i); i++; while int i = 0; i while (i < 100) { printf("i = %3d\n", i); i++; while int i =

More information

AutoTuned-RB

AutoTuned-RB ABCLib Working Notes No.10 AutoTuned-RB Version 1.00 AutoTuned-RB AutoTuned-RB RB_DGEMM RB_DGEMM ( TransA, TransB, M, N, K, a, A, lda, B, ldb, b, C, ldc ) L3BLAS DGEMM (C a Trans(A) Trans(B) b C) (1) TransA:

More information

I. Backus-Naur BNF : N N 0 N N N N N N 0, 1 BNF N N 0 11 (parse tree) 11 (1) (2) (3) (4) II. 0(0 101)* (

I. Backus-Naur BNF : N N 0 N N N N N N 0, 1 BNF N N 0 11 (parse tree) 11 (1) (2) (3) (4) II. 0(0 101)* ( 2016 2016 07 28 10:30 12:00 I. I VI II. III. IV. a d V. VI. 80 100 60 1 I. Backus-Naur BNF : 11011 N N 0 N N 11 1001 N N N N 0, 1 BNF N N 0 11 (parse tree) 11 (1) 1100100 (2) 1111011 (3) 1110010 (4) 1001011

More information

2 2 Gtk+ GUI (widget ) GUI Gtk+ GUI Gtk+ GUI 2.2 Gtk GUI sample1.c Web (http://www.cyber.t.u-tokyo.ac.jp/ tani/class/mech enshu/) enshu2009gui1.tar.gz

2 2 Gtk+ GUI (widget ) GUI Gtk+ GUI Gtk+ GUI 2.2 Gtk GUI sample1.c Web (http://www.cyber.t.u-tokyo.ac.jp/ tani/class/mech enshu/) enshu2009gui1.tar.gz 1 2009 B4 GUI TA http://www.cyber.t.u-tokyo.ac.jp/ tani/class/mech enshu/ 2008 6 11 1 1 1 4 C GUI(Graphical User Interface) X Window System GUI 5 GUI 2 Gtk+ GUI 2.1 GUI GUI GUI (event driven) GUI GUI GUI

More information

II ( ) prog8-1.c s1542h017%./prog8-1 1 => 35 Hiroshi 2 => 23 Koji 3 => 67 Satoshi 4 => 87 Junko 5 => 64 Ichiro 6 => 89 Mari 7 => 73 D

II ( ) prog8-1.c s1542h017%./prog8-1 1 => 35 Hiroshi 2 => 23 Koji 3 => 67 Satoshi 4 => 87 Junko 5 => 64 Ichiro 6 => 89 Mari 7 => 73 D II 8 2003 11 12 1 6 ( ) prog8-1.c s1542h017%./prog8-1 1 => 35 Hiroshi 2 => 23 Koji 3 => 67 Satoshi 4 => 87 Junko 5 => 64 Ichiro 6 => 89 Mari 7 => 73 Daisuke 8 =>. 73 Daisuke 35 Hiroshi 64 Ichiro 87 Junko

More information

課題 S1 解説 C 言語編 中島研吾 東京大学情報基盤センター

課題 S1 解説 C 言語編 中島研吾 東京大学情報基盤センター 課題 S1 解説 C 言語編 中島研吾 東京大学情報基盤センター 内容 課題 S1 /a1.0~a1.3, /a2.0~a2.3 から局所ベクトル情報を読み込み, 全体ベクトルのノルム ( x ) を求めるプログラムを作成する (S1-1) file.f,file2.f をそれぞれ参考にする 下記の数値積分の結果を台形公式によって求めるプログラムを作成する

More information

TA tani/class/mech enshu/ X Window System GUI(Graphical User Interface) GUI (event driven) 2 Gtk

TA   tani/class/mech enshu/ X Window System GUI(Graphical User Interface) GUI (event driven) 2 Gtk 1 2011 8 TA http://www.cyber.t.u-tokyo.ac.jp/ tani/class/mech enshu/ 2011 7 7 1 X Window System GUI(Graphical User Interface) GUI (event driven) 2 Gtk+ GUI 2.1 GUI GUI GUI (event driven) GUI GUI GUI GUI

More information

Northern Lights Server

Northern Lights Server FirstStep Guide Northern Lights Server Intel Management Module (Advanced Module / ISM 8.4) 2 www.nlcomputer.com 1 FirstStep Guide 1.1. INTEL MANAGEMENT MODULE 2... 5 1.2.... 9 1.3.... 10 2.1. BMC...11

More information

:30 12:00 I. I VI II. III. IV. a d V. VI

:30 12:00 I. I VI II. III. IV. a d V. VI 2018 2018 08 02 10:30 12:00 I. I VI II. III. IV. a d V. VI. 80 100 60 1 I. Backus-Naur BNF N N y N x N xy yx : yxxyxy N N x, y N (parse tree) (1) yxyyx (2) xyxyxy (3) yxxyxyy (4) yxxxyxxy N y N x N yx

More information

XACCの概要

XACCの概要 2 global void kernel(int a[max], int llimit, int ulimit) {... } : int main(int argc, char *argv[]){ MPI_Int(&argc, &argc); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm_size(MPI_COMM_WORLD, &size); dx

More information

Microsoft Word - C.....u.K...doc

Microsoft Word - C.....u.K...doc C uwêííôöðöõ Ð C ÔÖÐÖÕ ÐÊÉÌÊ C ÔÖÐÖÕÊ C ÔÖÐÖÕÊ Ç Ê Æ ~ if eíè ~ for ÒÑÒ ÌÆÊÉÉÊ ~ switch ÉeÍÈ ~ while ÒÑÒ ÊÍÍÔÖÐÖÕÊ ~ 1 C ÔÖÐÖÕ ÐÊÉÌÊ uê~ ÏÒÏÑ Ð ÓÏÖ CUI Ô ÑÊ ÏÒÏÑ ÔÖÐÖÕÎ d ÈÍÉÇÊ ÆÒ Ö ÒÐÑÒ ÊÔÎÏÖÎ d ÉÇÍÊ

More information

ネットワークビデオレコーダー VK-64/VK-16/VK-Lite v2.2 セットアップガイド

ネットワークビデオレコーダー VK-64/VK-16/VK-Lite v2.2 セットアップガイド VK-64/VK-16/VK-Lite Ver. 2.2 VK-64 v2.2 VK-16 v2.2 ( VK-64/VK-16) VK-Lite v2.2 ( VK-Lite) VK-64/VK-16 VK-Lite 2 1. 2. 3. 4. 2. 3. ( ) ( ) canon.jp/webview Canon Canon Microsoft Windows Microsoft Internet

More information

XMPによる並列化実装2

XMPによる並列化実装2 2 3 C Fortran Exercise 1 Exercise 2 Serial init.c init.f90 XMP xmp_init.c xmp_init.f90 Serial laplace.c laplace.f90 XMP xmp_laplace.c xmp_laplace.f90 #include int a[10]; program init integer

More information

58 7 MPI 7 : main(int argc, char *argv[]) 8 : { 9 : int num_procs, myrank; 10 : double a, b; 11 : int tag = 0; 12 : MPI_Status status; 13 : 1 MPI_Init

58 7 MPI 7 : main(int argc, char *argv[]) 8 : { 9 : int num_procs, myrank; 10 : double a, b; 11 : int tag = 0; 12 : MPI_Status status; 13 : 1 MPI_Init 57 7 MPI MPI 1 1 7.1 Bcast( ) allocate Bcast a=1 PE0 a=1 PE1 a=1 PE2 a=1 PE3 7.1: Bcast 58 7 MPI 7 : main(int argc, char *argv[]) 8 : { 9 : int num_procs, myrank; 10 : double a, b; 11 : int tag = 0; 12

More information

インテル® MPI ライブラリー・ランタイム環境入門ガイド

インテル® MPI ライブラリー・ランタイム環境入門ガイド MPI Intel's Terms and Conditions of Sales ( ) 2 IntelIntel Intel Corporation * 2006 Intel Corporation. MPI MPI * (ANL) MPI MPICH2* NBCL (Network-Based Computing Laboratory) MVAPICH2* InfiniBand* RDMA 3

More information

ProLiant ML110 Generation 4 システム構成図

ProLiant ML110 Generation 4 システム構成図 HP ProLiant ML110 Generation 5 2010 4 16 1 OVERVIEW ProLiant ML110 Generation 5 ProLiant ML110 Generation 5 1, 2 LED LED ( ) ( ) ( ) Lights-Out 100c ( ) 2 3 6 USB SATA ML110 G5 ProLiant ML110 G5 SATA /

More information

I. Backus-Naur BNF S + S S * S S x S +, *, x BNF S (parse tree) : * x + x x S * S x + S S S x x (1) * x x * x (2) * + x x x (3) + x * x + x x (4) * *

I. Backus-Naur BNF S + S S * S S x S +, *, x BNF S (parse tree) : * x + x x S * S x + S S S x x (1) * x x * x (2) * + x x x (3) + x * x + x x (4) * * 2015 2015 07 30 10:30 12:00 I. I VI II. III. IV. a d V. VI. 80 100 60 1 I. Backus-Naur BNF S + S S * S S x S +, *, x BNF S (parse tree) : * x + x x S * S x + S S S x x (1) * x x * x (2) * + x x x (3) +

More information

DKA ( 1) 1 n i=1 α i c n 1 = 0 ( 1) 2 n i 1 <i 2 α i1 α i2 c n 2 = 0 ( 1) 3 n i 1 <i 2 <i 3 α i1 α i2 α i3 c n 3 = 0. ( 1) n 1 n i 1 <i 2 < <i

DKA ( 1) 1 n i=1 α i c n 1 = 0 ( 1) 2 n i 1 <i 2 α i1 α i2 c n 2 = 0 ( 1) 3 n i 1 <i 2 <i 3 α i1 α i2 α i3 c n 3 = 0. ( 1) n 1 n i 1 <i 2 < <i 149 11 DKA IEEE754 11.1 DKA n p(x) = a n x n + a n 1 x n 1 + + a 0 (11.1) p(x) = 0 (11.2) p n (x) q n (x) = x n + c n 1 x n 1 + + c 1 x + c 0 q n (x) = 0 (11.3) c i = a i a n (i = 0, 1,..., n 1) (11.3)

More information

ProLiant ML110 Generation 4 システム構成図

ProLiant ML110 Generation 4 システム構成図 HP ProLiant ML110 Generation 4 2008 1 24 OVERVIEW ProLiant ML110 Generation 4 ProLiant ML110 Generation 4 1 2 SCSI USB 3 6 SATA SAS LED LED 4 Lights-Out 100c ( ) ProLiant ML110 G4 SATA / SAS ( ) Celeron

More information

「産業上利用することができる発明」の審査の運用指針(案)

「産業上利用することができる発明」の審査の運用指針(案) 1 1.... 2 1.1... 2 2.... 4 2.1... 4 3.... 6 4.... 6 1 1 29 1 29 1 1 1. 2 1 1.1 (1) (2) (3) 1 (4) 2 4 1 2 2 3 4 31 12 5 7 2.2 (5) ( a ) ( b ) 1 3 2 ( c ) (6) 2. 2.1 2.1 (1) 4 ( i ) ( ii ) ( iii ) ( iv)

More information

Condition DAQ condition condition 2 3 XML key value

Condition DAQ condition condition 2 3 XML key value Condition DAQ condition 2009 6 10 2009 7 2 2009 7 3 2010 8 3 1 2 2 condition 2 3 XML key value 3 4 4 4.1............................. 5 4.2...................... 5 5 6 6 Makefile 7 7 9 7.1 Condition.h.............................

More information

1 (bit ) ( ) PC WS CPU IEEE754 standard ( 24bit) ( 53bit)

1 (bit ) ( ) PC WS CPU IEEE754 standard ( 24bit) ( 53bit) GNU MP BNCpack tkouya@cs.sist.ac.jp 2002 9 20 ( ) Linux Conference 2002 1 1 (bit ) ( ) PC WS CPU IEEE754 standard ( 24bit) ( 53bit) 10 2 2 3 4 5768:9:; = %? @BADCEGFH-I:JLKNMNOQP R )TSVU!" # %$ & " #

More information

A Responsive Processor for Parallel/Distributed Real-time Processing

A Responsive Processor for Parallel/Distributed Real-time Processing E-mail: yamasaki@{ics.keio.ac.jp, etl.go.jp} http://www.ny.ics.keio.ac.jp etc. CPU) I/O I/O or Home Automation, Factory Automation, (SPARC) (SDRAM I/F, DMAC, PCI, USB, Timers/Counters, SIO, PIO, )

More information

MPI

MPI 筑波大学計算科学研究センター CCS HPC サマーセミナー MPI 建部修見 tatebe@cs.tsukuba.ac.jp 筑波大学大学院システム情報工学研究科計算科学研究センター 分散メモリ型並列計算機 (PC クラスタ ) 計算ノードはプロセッサとメモリで構成され, 相互結合網で接続 ノード内のメモリは直接アクセス 他ノードとはネットワーク通信により情報交換 いわゆるPCクラスタ 相互結合網

More information

I J

I J I 065763J 8 7 7 31 jikken/ +----- accumulation_demupa.c +----- accumulation_rain.c +----- frequency_demupa.c +----- frequency_rain.c +----- go.sh +----- graph_maker.sh +----- mesure-ryudai/ 2007/4/1 2007/6/30

More information

RedHat OpenFOAM OpenFOAM ver 2.3 RedHat(RHEL)

RedHat OpenFOAM OpenFOAM ver 2.3 RedHat(RHEL) RedHat Linux OpenFOAM (OpenFOAM 2.2.x, 2.3.x) y.imagawa 14.3.8 RedHat OpenFOAM OpenFOAM ver 2.3 RedHat(RHEL) OpenFOAM OpenFOAM Linux git Repository RedHat Linux OpenFOAM centfoam? OpenFOAM OS CentOS 6.5

More information

Microsoft PowerPoint - ★04_HP_原田rev.ppt

Microsoft PowerPoint - ★04_HP_原田rev.ppt 新情報処理開発機構 (RWCP) で開発されたクラスタ計算機用並列プログラム実行環境 RWCP 1992 年から 10 年間の研究プロジェクト 2001 年 10 月に最後の研究成果発表会を開催 現在は PC クラスタコンソーシアム (PCCC) が開発 普及活動を行っています ギャングスケジューリングを用いたマルチユーザ環境 対話型実行環境 高速通信ライブラリ :PMv2 MPI,OpenMP,MPC++

More information

smpp_resume.dvi

smpp_resume.dvi 2 MPI sin@mikilab.doshisha.ac.jp MPIMPI(Message Passing Interface) MPI UNIX WindowsMac OS, MPI MPI MPI 2 MPI i j j i MPI 34. MPI PVM MPI PVM MPI PVM(Parallel Virtual Machine) PVM MPI MPI PVM MPI MPI Message

More information

00.目次_ope

00.目次_ope 816XL ii iii iv iv User Entry 1 3 v vi vii viii 1 1 C: >VTTERM 1- 1 1-3 1 1-4 1 1-5 1 1-6 1 1-7 1 1-8 1 1-9 1 1-10 C: >VTN 1 Host Name: 1-11 1 01 1-1 0.0.0.0 1 1-13 1 1-14 - -3 Port status and configuration

More information

ARM gcc Kunihiko IMAI 2009 1 11 ARM gcc 1 2 2 2 3 3 4 3 4.1................................. 3 4.2............................................ 4 4.3........................................

More information

[user@linux tmp]$ tar xzvf utvpn-src-unix-v100-7092-beta-2010.06.25.tar.gz [user@linux tmp]$ cd utvpn-unix-v100-7092-beta [user@linux utvpn-unix-v100-7092-beta]$ ls License-ja.txt configure makefiles src

More information

Java updated

Java updated Java 2003.07.14 updated 3 1 Java 5 1.1 Java................................. 5 1.2 Java..................................... 5 1.3 Java................................ 6 1.3.1 Java.......................

More information

r07.dvi

r07.dvi 19 7 ( ) 2019.4.20 1 1.1 (data structure ( (dynamic data structure 1 malloc C free C (garbage collection GC C GC(conservative GC 2 1.2 data next p 3 5 7 9 p 3 5 7 9 p 3 5 7 9 1 1: (single linked list 1

More information

09中西

09中西 PC NEC Linux (1) (2) (1) (2) 1 Linux Linux 2002.11.22) LLNL Linux Intel Xeon 2300 ASCIWhite1/7 / HPC (IDC) 2002 800 2005 2004 HPC 80%Linux) Linux ASCI Purple (ASCI 100TFlops Blue Gene/L 1PFlops (2005)

More information

II 3 yacc (2) 2005 : Yacc 0 ~nakai/ipp2 1 C main main 1 NULL NULL for 2 (a) Yacc 2 (b) 2 3 y

II 3 yacc (2) 2005 : Yacc 0 ~nakai/ipp2 1 C main main 1 NULL NULL for 2 (a) Yacc 2 (b) 2 3 y II 3 yacc (2) 2005 : Yacc 0 ~nakai/ipp2 1 C 1 6 9 1 main main 1 NULL NULL 1 15 23 25 48 26 30 32 36 38 43 45 47 50 52 for 2 (a) 2 2 1 Yacc 2 (b) 2 3 yytext tmp2 ("") tmp2->next->word tmp2 yytext tmp2->next->word

More information