rank ”«‘‚“™z‡Ì GPU ‡É‡æ‡éŁÀŠñ›»

Size: px
Start display at page:

Download "rank ”«‘‚“™z‡Ì GPU ‡É‡æ‡éŁÀŠñ›»"

Transcription

1 rank GPU ERATO / 26

2 GPU rank/select wavelet tree balanced parenthesis GPU rank 2 / 26

3 GPU rank/select wavelet tree balanced parenthesis GPU rank 2 / 26

4 GPU rank/select wavelet tree balanced parenthesis GPU rank 2 / 26

5 1 2 3 CUDA / 26

6 1 2 3 CUDA / 26

7 x {0, 1} n b {0, 1} rank b (x, i) := x[1i] b rank 1 (x 1, 4) = 2 rank 0 (x 2, 7) = x 1 = x 2 = / 26

8 x {0, 1} n b {0, 1} rank b (x, i) := x[1i] b rank 1 (x 1, 4) = 2 rank 0 (x 2, 7) = x 1 = x 2 = / 26

9 x {0, 1} n b {0, 1} rank b (x, i) := x[1i] b x {0, 1} n rank b (x, i) O(1) o(n) GPU 6 / 26

10 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

11 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

12 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

13 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

14 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

15 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

16 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

17 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

18 Jacobson 89 rank 0 (B, i) = i rank 1 (B, i) rank 1 (B, i) B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST rank 1 (B, i) = LT[i/L] + ST[i/S] + rank 7 / 26

19 1 2 3 CUDA / 26

20 CUDA GPU NVIDIA GPU C / C++ Single Instruction Multiple Thread SIMT 32 9 / 26

21 10 / 26

22 4GB 1 49kB 11 / 26

23 CUDA = = / 26

24 1 2 3 CUDA / 26

25 1 Population count (Popcount) 32bit / 64bit 1 GPU 2 Prefix sum (x ( 1, x 2,, x k,, x n ) x 1, x 1 + x 2,, k i=1 x k,, ) n i=1 x i O(log n) 14 / 26

26 Prefix Sum 1 1 i 2 i / 26

27 Prefix Sum 1 1 i 2 i / 26

28 Prefix Sum 1 1 i 2 i / 26

29 Prefix Sum 1 1 i 2 i / 26

30 Prefix Sum 1 1 i 2 i / 26

31 Prefix Sum 1 1 i 2 i / 26

32 B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST / 26

33 B LT ST B L L = log 2 n LT 2 B S S = log n/2 ST / 26

34 B Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

35 B Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

36 B (Prefix sum) Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

37 B (Prefix sum) ST Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

38 B (Prefix sum) ST LT Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

39 B (Prefix sum) ST LT (Prefix sum) Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

40 B ST LT Popcount 2 Prefix Sum 3 1 ST 4 1 LT 5 LT Prefix Sum 17 / 26

41 LT n = MB GPU CPU Prefix sum 18 / 26

42 LT n = MB GPU CPU Prefix sum 18 / 26

43 Prefix Sum 1 2 Prefix Sum Prefix Sum 6 Prefix Sum 19 / 26

44 1 2 3 CUDA / 26

45 CPU AMD Phenom X (25GHz) GPU Tesla C GHz 4 GB 49 kb Sux: Implementing Succinct Data Structures Broadword Implementation of Rank / Select Queries S Vigna WEA 2008: 7th International Workshop on Experimental Algorithms (pp ) 21 / 26

46 (1) 2 log n ,194, Mbit 1Gbit 3Gbit Sux(CPU) s s s GPU s s s CPU/GPU = 04 s n = 3G 22 / 26

47 (1) 2 log n ,194, Mbit 1Gbit 3Gbit Sux(CPU) s s s GPU s s s CPU/GPU = 04 s n = 3G 22 / 26

48 (1) 2 log n ,194, Mbit 1Gbit 3Gbit Sux(CPU) s s s GPU s s s CPU/GPU = 04 s n = 3G 22 / 26

49 (1) 2 log n ,194, Mbit 1Gbit 3Gbit Sux(CPU) s s s GPU s s s CPU/GPU = 04 s n = 3G 22 / 26

50 (1) 2 log n ,194, Mbit 1Gbit 3Gbit Sux(CPU) s s s GPU s s s CPU/GPU = 04 s n = 3G 22 / 26

51 (2) n = 3G 2 log n 64 m / 26

52 (2) n = 3G 2 log n 64 m / 26

53 (3) n = 3G k 2 log n 64k m / 26

54 (3) n = 3G k 2 log n 64k m / 26

55 1 2 3 CUDA / 26

56 GPU 28 GPU 26 / 26

57 GPU 28 GPU 26 / 26

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1 GPU 4 2010 8 28 1 GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1 Register & Shared Memory ( ) CPU CPU(Intel Core i7 965) GPU(Tesla

More information

main.dvi

main.dvi PC 1 1 [1][2] [3][4] ( ) GPU(Graphics Processing Unit) GPU PC GPU PC ( 2 GPU ) GPU Harris Corner Detector[5] CPU ( ) ( ) CPU GPU 2 3 GPU 4 5 6 7 1 toyohiro@isc.kyutech.ac.jp 45 2 ( ) CPU ( ) ( ) () 2.1

More information

imai@eng.kagawa-u.ac.jp No1 No2 OS Wintel Intel x86 CPU No3 No4 8bit=2 8 =256(Byte) 16bit=2 16 =65,536(Byte)=64KB= 6 5 32bit=2 32 =4,294,967,296(Byte)=4GB= 43 64bit=2 64 =18,446,744,073,709,551,615(Byte)=16EB

More information

07-二村幸孝・出口大輔.indd

07-二村幸孝・出口大輔.indd GPU Graphics Processing Units HPC High Performance Computing GPU GPGPU General-Purpose computation on GPU CPU GPU GPU *1 Intel Quad-Core Xeon E5472 3.0 GHz 2 6 MB L2 cache 1600 MHz FSB 80 GFlops 1 nvidia

More information

iphone GPGPU GPU OpenCL Mac OS X Snow LeopardOpenCL iphone OpenCL OpenCL NVIDIA GPU CUDA GPU GPU GPU 15 GPU GPU CPU GPU iii OpenMP MPI CPU OpenCL CUDA OpenCL CPU OpenCL GPU NVIDIA Fermi GPU Fermi GPU GPU

More information

supercomputer2010.ppt

supercomputer2010.ppt nanri@cc.kyushu-u.ac.jp 1 !! : 11 12! : nanri@cc.kyushu-u.ac.jp! : Word 2 ! PC GPU) 1997 7 http://wiredvision.jp/news/200806/2008062322.html 3 !! (Cell, GPU )! 4 ! etc...! 5 !! etc. 6 !! 20km 40 km ) 340km

More information

マルチコアPCクラスタ環境におけるBDD法のハイブリッド並列実装

マルチコアPCクラスタ環境におけるBDD法のハイブリッド並列実装 2010 GPGPU 2010 9 29 MPI/Pthread (DDM) DDM CPU CPU CPU CPU FEM GPU FEM CPU Mult - NUMA Multprocessng Cell GPU Accelerator, GPU CPU Heterogeneous computng L3 cache L3 cache CPU CPU + GPU GPU L3 cache 4

More information

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2 ! OpenCL [Open Computing Language] 言 [OpenCL C 言 ] CPU, GPU, Cell/B.E.,DSP 言 行行 [OpenCL Runtime] OpenCL C 言 API Khronos OpenCL Working Group AMD Broadcom Blizzard Apple ARM Codeplay Electronic Arts Freescale

More information

10D16.dvi

10D16.dvi D IEEJ Transactions on Industry Applications Vol.136 No.10 pp.686 691 DOI: 10.1541/ieejias.136.686 NW Accelerating Techniques for Sequence Alignment based on an Extended NW Algorithm Jin Okaze, Non-member,

More information

RaVioli SIMD

RaVioli SIMD RaVioli SIMD 17 17115074 i RaVioli SIMD PC PC PC PC CPU RaVioli RaVioli CPU RaVioli CPU SIMD RaVioli RaVioli SIMD RaVioli SIMD RaVioli SIMD 1 1 2 RaVioli 2 2.1 RaVioli.......................................

More information

野岩鉄道の旅

野岩鉄道の旅 29th 5:13 5:34 5:56 6:00 6:12 6:20 6:21 6:25 6:29 6:31 6:34 6:38 6:40 6:45 6:52 6:56 7:01 7:07 7:11 7:32 7:34 7:50 7:58 8:03 8:17 8:36 8:44 5:50 5:54 6:15 6:38 6:39 6:51 6:59 6:59 7:03 7:08 7:08 7:11 7:15

More information

73 p.1 22 16 2004p.152

73 p.1 22 16 2004p.152 1987 p.80 72 73 p.1 22 16 2004p.152 281895 1930 1931 12 28 1930 10 27 12 134 74 75 10 27 47.6 1910 1925 10 10 76 10 11 12 139 p.287 p.10 11 pp.3-4 1917 p.284 77 78 10 13 10 p.6 1936 79 15 15 30 80 pp.499-501

More information

29 2011 3 4 1 19 5 2 21 6 21 2 21 7 2 23 21 8 21 1 20 21 1 22 20 p.61 21 1 21 21 1 23

29 2011 3 4 1 19 5 2 21 6 21 2 21 7 2 23 21 8 21 1 20 21 1 22 20 p.61 21 1 21 21 1 23 29 2011 3 pp.55 86 19 1886 2 13 1 1 21 1888 1 13 2 3,500 3 5 5 50 4 1959 6 p.241 21 1 13 2 p.14 1988 p.2 21 1 15 29 2011 3 4 1 19 5 2 21 6 21 2 21 7 2 23 21 8 21 1 20 21 1 22 20 p.61 21 1 21 21 1 23 1

More information

() L () 20 1

() L () 20 1 () 25 1 10 1 0 0 0 1 2 3 4 5 6 2 3 4 9308510 4432193 L () 20 1 PP 200,000 P13P14 3 0123456 12345 1234561 2 4 5 6 25 1 10 7 1 8 10 / L 10 9 10 11 () ( ) TEL 23 12 7 38 13 14 15 16 17 18 L 19 20 1000123456

More information

戦後の補欠選挙

戦後の補欠選挙 1 2 11 3 4, 1968, p.429., pp.140-141. 76 2005.12 20 14 5 2110 25 6 22 7 25 8 4919 9 22 10 11 12 13 58154 14 15 1447 79 2042 21 79 2243 25100 113 2211 71 113 113 29 p.85 2005.12 77 16 29 12 10 10 17 18

More information

日経テレコン料金表(2016年4月)

日経テレコン料金表(2016年4月) 1 2 3 4 8,000 15,000 22,000 29,000 5 6 7 8 36,000 42,000 48,000 54,000 9 10 20 30 60,000 66,000 126,000 166,000 50 100 246,000 396,000 1 25 8,000 7,000 620 2150 6,000 4,000 51100 101200 3,000 1,000 201

More information

122011pp.139174 18501933

122011pp.139174 18501933 122011pp.139174 18501933 122011 1850 3 187912 3 1850 8 1933 84 4 1871 12 1879 5 2 1 9 15 1 1 5 3 3 3 6 19 9 9 6 28 7 7 4 1140 9 4 3 5750 58 4 3 1 57 2 122011 3 4 134,500,000 4,020,000 11,600,000 5 2 678.00m

More information

2 2 3 4 5 5 2 7 3 4 6 1 3 4 7 4 2 2 2 4 2 3 3 4 5 1932 A p. 40. 1893 A p. 224, p. 226. 1893 B pp. 1 2. p. 3.

2 2 3 4 5 5 2 7 3 4 6 1 3 4 7 4 2 2 2 4 2 3 3 4 5 1932 A p. 40. 1893 A p. 224, p. 226. 1893 B pp. 1 2. p. 3. 1 73 72 1 1844 11 9 1844 12 18 5 1916 1 11 72 1 73 2 1862 3 1870 2 1862 6 1873 1 3 4 3 4 7 2 3 4 5 3 5 4 2007 p. 117. 2 2 3 4 5 5 2 7 3 4 6 1 3 4 7 4 2 2 2 4 2 3 3 4 5 1932 A p. 40. 1893 A p. 224, p. 226.

More information

Microsoft Word - 映画『東京裁判』を観て.doc

Microsoft Word - 映画『東京裁判』を観て.doc 1 2 3 4 5 6 7 1 2008. 2 2010, 3 2010. p.1 4 2008 p.202 5 2008. p.228 6 2011. 7 / 2008. pp.3-4 1 8 1 9 10 11 8 2008, p.7 9 2011. p.41 10.51 11 2009. p. 2 12 13 14 12 2008. p.4 13 2008, p.7-8 14 2008. p.126

More information

308 ( ) p.121

308 ( ) p.121 307 1944 1 1920 1995 2 3 4 5 308 ( ) p.121 309 10 12 310 6 7 ( ) ( ) ( ) 50 311 p.120 p.142 ( ) ( ) p.117 p.124 p.118 312 8 p.125 313 p.121 p.122 p.126 p.128 p.156 p.119 p.122 314 p.153 9 315 p.142 p.153

More information

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h 23 FPGA CUDA Performance Comparison of FPGA Array with CUDA on Poisson Equation (lijiang@sekine-lab.ei.tuat.ac.jp), (kazuki@sekine-lab.ei.tuat.ac.jp), (takahashi@sekine-lab.ei.tuat.ac.jp), (tamukoh@cc.tuat.ac.jp),

More information

円借款案件事後評価報告書2000(全文版・第3巻)

円借款案件事後評価報告書2000(全文版・第3巻) (1(2 1999 9 1999 5 (1 (2 ( ( 1992 10 1992 10 1993 8 1993 8 1997 11 1998 9 3,145 2,778 4,055 3,258 2.6% 30 ( 10 43 (1 (Yuan (2 (IFS 1990 1991 1992 1993 1994 1995 1996 1997 1998 US$ 5.2 5.4 5.8 5.8 8.4 8.3

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information

1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU

1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU GPGPU (I) GPU GPGPU 1 GPU(Graphics Processing Unit) GPU GPGPU(General-Purpose computing on GPUs) GPU GPGPU GPU ( PC ) PC PC GPU PC PC GPU GPU 2008 TSUBAME NVIDIA GPU(Tesla S1070) TOP500 29 [1] 2009 AMD

More information

第122号.indd

第122号.indd -1- -2- -3- 0852-36-5150 0852-36-5163-4- -5- -6- -7- 1st 1-1 1-2 1-3 1-4 1-5 -8- 2nd M2 E2 D2 J2 C2-9- 3rd M3 E3 D3 J3 C3-10- 4th M4 E4 D4 J4 C4-11- -12- M5 E5 J5 D5 C5 5th -13- -14- NEWS NEWS -15- NEWS

More information

main.dvi

main.dvi GameDeep GameDeep Game is (not) social /... 3 /... 11 /... 17 AMD : 2013 /... 21 GameDeep Propaganding License GameDeep GameDeep 2 Game is (not) social Not Social : 3 GameDeep 4 Game is (not) social Game

More information

音声読み上げブラウザの読み上げかた

音声読み上げブラウザの読み上げかた IBM 3.01, 1,234 1 HTML 2 1+1 1+1= 1 1 1 1= 1 1 1 1= 1X1 3 2004 11 14 10 2004 11 14 2004-11-14 2004/11/14 11/14 10:00 10:00am am pm a.m.p.m. 4 10 5 1 1 1 10 1 100 10 1 10 10 113 10 1 5 6 23 5372 0859 23

More information

EGunGPU

EGunGPU Super Computing in Accelerator simulations - Electron Gun simulation using GPGPU - K. Ohmi, KEK-Accel Accelerator Physics seminar 2009.11.19 Super computers in KEK HITACHI SR11000 POWER5 16 24GB 16 134GFlops,

More information

GPU Computing on Business

GPU Computing on Business GPU Computing on Business 2010 Numerical Technologies Incorporated http://www.numtech.com/ 1 2 3 4 5 6 7 8 9 GPU Computing $$$ Revenue Total Cost low BEP Quantity 10 11 12 13 14 15 GPU Computing $$$ Revenue

More information

CPU CPU CPU CPU CPU 5-1 PRAM logp π c /(17)

CPU CPU CPU CPU CPU 5-1 PRAM logp π c /(17) 6 -- 3 5 2012 7 CPU CPU CPU CPU CPU 5-1 PRAM logp π 5-2 5-3 c 2012 1/(17) 6 -- 3 -- 5 5--1 2012 7 5--1--1 CPU sequetial computatio Fly 2) SISD sigle istructio, sigle data SIMD sigle istructio, multiple

More information

Excel97関数編

Excel97関数編 Excel97 SUM Microsoft Excel 97... 1... 1... 1... 2... 3... 3... 4... 5... 6... 6... 7 SUM... 8... 11 Microsoft Excel 97 AVERAGE MIN MAX SUM IF 2 RANK TODAY ROUND COUNT INT VLOOKUP 1/15 Excel A B C A B

More information

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10 NVIDIA TESLA V100 CUDA 9 のご紹介 森野慎也, シニアソリューションアーキテクト (GPU-Computing) NVIDIA Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ

More information

ProLiant ML115 Generation 1 システム構成図

ProLiant ML115 Generation 1 システム構成図 HP ProLiant ML115 Generation 5 2010 4 16 1 OVERVIEW ProLiant ML115 Generation 5 ProLiant ML115 Generation 5 1 USB 2 3 6 SATA LED LED () Lights-Out 100c () 365W ML115 G5 ProLiant ML115 G5 SATA / AMD Athlon

More information

HPC (pay-as-you-go) HPC Web 2

HPC (pay-as-you-go) HPC Web 2 ,, 1 HPC (pay-as-you-go) HPC Web 2 HPC Amazon EC2 OpenFOAM GPU EC2 3 HPC MPI MPI Courant 1 GPGPU MPI 4 AMAZON EC2 GPU CLUSTER COMPUTE INSTANCE EC2 GPU (cg1.4xlarge) ( N. Virgina ) Quadcore Intel Xeon 5570

More information

1 4 1.1........................................... 4 1.2.................................. 4 1.3................................... 4 2 5 2.1 GPU.....

1 4 1.1........................................... 4 1.2.................................. 4 1.3................................... 4 2 5 2.1 GPU..... CPU GPU N Q07-065 2011 2 17 1 1 4 1.1........................................... 4 1.2.................................. 4 1.3................................... 4 2 5 2.1 GPU...........................................

More information

HPC可視化_小野2.pptx

HPC可視化_小野2.pptx 大 小 二 生 高 方 目 大 方 方 方 Rank Site Processors RMax Processor System Model 1 DOE/NNSA/LANL 122400 1026000 PowerXCell 8i BladeCenter QS22 Cluster 2 DOE/NNSA/LLNL 212992 478200 PowerPC 440 BlueGene/L 3 Argonne

More information

23_33.indd

23_33.indd 23 16 26 25 24 2 30 2 19 20 1 21 1 22 9 11 15 14 23 2 3 5 1 6 12 14 29 P.26 P.26 P.26 P.26 P.2 P.26 P.2 P.2 P.2 P.2 P.2 P.2 P.24 P.24 P.24 P.24 P.24 MAC 10. 10.6 10.5 1TB 2TB XP XP MAC 10. 10. 10.6 10.5

More information

情報量・音声画像動画のA/D変換

情報量・音声画像動画のA/D変換 L06(2014-10-29 Wed), A/D..... http://hig3.net ( ) L06 A/D (2014) 1 / 24 : L05-S1 Quiz :int 16 2 15 x 2 15 1, 16 0 x 2 16 1. L05-S5 Quiz : 2 17 < 200000 2 18, 18. 2 10 = 1024, 2 16 = 65536. log 10 2, log

More information

倍々精度RgemmのnVidia C2050上への実装と応用

倍々精度RgemmのnVidia C2050上への実装と応用 .. maho@riken.jp http://accc.riken.jp/maho/,,, 2011/2/16 1 - : GPU : SDPA-DD 10 1 - Rgemm : 4 (32 ) nvidia C2050, GPU CPU 150, 24GFlops 25 20 GFLOPS 15 10 QuadAdd Cray, QuadMul Sloppy Kernel QuadAdd Cray,

More information

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2 FFT 1 Fourier fast Fourier transform FFT FFT FFT 1 FFT FFT 2 Fourier 2.1 Fourier FFT Fourier discrete Fourier transform DFT DFT n 1 y k = j=0 x j ω jk n, 0 k n 1 (1) x j y k ω n = e 2πi/n i = 1 (1) n DFT

More information

GPU n Graphics Processing Unit CG CAD

GPU n Graphics Processing Unit CG CAD GPU 2016/06/27 第 20 回 GPU コンピューティング講習会 ( 東京工業大学 ) 1 GPU n Graphics Processing Unit CG CAD www.nvidia.co.jp www.autodesk.co.jp www.pixar.com GPU n GPU ü n NVIDIA CUDA ü NVIDIA GPU ü OS Linux, Windows, Mac

More information

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード] 200/0/9 数値流体解析の並列効率とその GPU による高速化の試み 清水建設 ( 株 ) 技術研究所 PHAM VAN PHUC ( ファムバンフック ) 流体計算時間短縮と GPU の活用の試み 現 CPUとの比較によりGPU 活用の可能性 現 CPU の最大利用 ノード内の最大計算資源の利用 すべてCPUコアの利用 適切なアルゴリズムの利用 CPU コア性能の何倍? GPU の利用の試み

More information

名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL アライアンスパートナー コアテクノロジーパートナー NVIDIA JAPAN ソリュ

名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL   アライアンスパートナー コアテクノロジーパートナー NVIDIA JAPAN ソリュ GPUDirect の現状整理 multi-gpu に取組むために G-DEP チーフエンジニア河井博紀 (kawai@gdep.jp) 名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL http://www.gdep.jp アライアンスパートナー コアテクノロジーパートナー

More information

Fuzzy Multiple Discrimminant Analysis (FMDA) 5) (SOM) 6) SOM 3 6) SOM SOM SOM SOM SOM SOM 7) 8) SOM SOM SOM GPU 2. n k f(x) m g(x) (1) 12) { min(max)

Fuzzy Multiple Discrimminant Analysis (FMDA) 5) (SOM) 6) SOM 3 6) SOM SOM SOM SOM SOM SOM 7) 8) SOM SOM SOM GPU 2. n k f(x) m g(x) (1) 12) { min(max) SOM 1 2 2 3 1 (SOM: Self-Organizing Maps) 3 SOM SOM SOM SOM GPU A Study on Visualization of Pareto Solutions by Spherical Self-Organizing Maps MASATO YOSHIMI, 1 KANAME NISHIMOTO, 2 LUYI WANG, 2 TOMOYUKI

More information

untitled

untitled 16 4 1 17 1 50 -1- -2- -3- -4- -5- -6- -7- 1 2-8- -9- -10- -11- Web -12- (1) (2)(1) (3) (4) (1)()(2) (3)(4) -13- -14- -15- -16- -17- -18- -19- -20- -21- -22- -23- (2)(1) (3) -24- -25- -26- -27- -28- -29-

More information

459

459 459 40 5 200606-1,940 7 - - - 480.2 3.6+0.8 40 4,00010 0.791 50 5 200608-2,740 5 - - - 600.2 4.1+0.8 51 4,00010 1.122 65 5 200610-3,500 5 - - - 760.3 4.1+0.8 67 4,00010 1.445 75 5 200611-5,360 3 - - -

More information

周辺機器_高解像_1

周辺機器_高解像_1 & UPS December / 2012 www.dell.co.jp Dell PC Citrix Systems, Inc. Microsoft Corporation Sky CA Technologies AOS 2 26 F5 Aruba Networks, Inc. Microsoft Corporation PC Microsoft Corporation Targus Group

More information

( CUDA CUDA CUDA CUDA ( NVIDIA CUDA I

(    CUDA CUDA CUDA CUDA (  NVIDIA CUDA I GPGPU (II) GPGPU CUDA 1 GPGPU CUDA(CUDA Unified Device Architecture) CUDA NVIDIA GPU *1 C/C++ (nvcc) CUDA NVIDIA GPU GPU CUDA CUDA 1 CUDA CUDA 2 CUDA NVIDIA GPU PC Windows Linux MaxOSX CUDA GPU CUDA NVIDIA

More information

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi DEIM Forum 2019 H2-2 SuperSQL 223 8522 3 14 1 E-mail: {terui,goto}@db.ics.keio.ac.jp, toyama@ics.keio.ac.jp SuperSQL SQL SuperSQL Web SuperSQL DBMS PipelineDB SuperSQL Web Web 1 SQL SuperSQL HTML SuperSQL

More information

2

2 GPU 2008/11/30 GPU GPU UniformGrid GPU CPU GeForce6 9 kd-tree GPU GPU UG kd-tree GPU CPU GPU GPU GPU I/O PCI-Express DMA DirectX9 DirectX 3D OpenGL CUDA Larrabee Mac 2008/11/28 Mac(Carbon) Carbon.framework/QuickTime.framework

More information

フカシギおねえさん問題の高速計算アルゴリズム

フカシギおねえさん問題の高速計算アルゴリズム JST ERATO 2013/7/26 Joint work with 1 / 37 1 2 3 4 5 6 2 / 37 1 2 3 4 5 6 3 / 37 : 4 / 37 9 9 6 10 10 25 5 / 37 9 9 6 10 10 25 Bousquet-Mélou (2005) 19 19 3 1GHz Alpha 8 Iwashita (Sep 2012) 21 21 3 2.67GHz

More information

211 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium 211 HPCS /1/18 a a 1 a 2 a 3 a a GPU Graphics Processing Unit GPU CPU GPU GPGPU G

211 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium 211 HPCS /1/18 a a 1 a 2 a 3 a a GPU Graphics Processing Unit GPU CPU GPU GPGPU G 211 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium 211 HPCS211 211/1/18 GPU 4 8 BLAS 4 8 BLAS Basic Linear Algebra Subprograms GPU Graphics Processing Unit 4 8 double 2 4 double-double DD 4 4 8 quad-double

More information

-1-1 1 1 1 1 12 31 2 2 3 4

-1-1 1 1 1 1 12 31 2 2 3 4 2007 -1-1 1 1 1 1 12 31 2 2 3 4 -2-5 6 CPU 3 Windows98 1 -3-2. 3. -4-4 2 5 1 1 1 -5- 50000 50000 50000 50000 50000 50000 50000 50000 50000 50000-6- -7-1 Windows 2 -8-1 2 3 4 - - 100,000 200,000 500,000

More information

DO 時間積分 START 反変速度の計算 contravariant_velocity 移流項の計算 advection_adams_bashforth_2nd DO implicit loop( 陰解法 ) 速度勾配, 温度勾配の計算 gradient_cell_center_surface 速

DO 時間積分 START 反変速度の計算 contravariant_velocity 移流項の計算 advection_adams_bashforth_2nd DO implicit loop( 陰解法 ) 速度勾配, 温度勾配の計算 gradient_cell_center_surface 速 1 1, 2 1, 2 3 2, 3 4 GP LES ASUCA LES NVIDIA CUDA LES 1. Graphics Processing Unit GP General-Purpose SIMT Single Instruction Multiple Threads 1 2 3 4 1),2) LES Large Eddy Simulation 3) ASUCA 4) LES LES

More information

An Interactive Visualization System of Human Network for Multi-User Hiroki Akehata 11N F

An Interactive Visualization System of Human Network for Multi-User Hiroki Akehata 11N F An Interactive Visualization System of Human Network for Multi-User Hiroki Akehata 11N8100002F 2013 3 ,.,.,.,,., (, )..,,,.,,.,, SPYSEE. SPYSEE,,., 2,,.,,.,,,,.,,,.,, Microsoft Microsoft PixelSense Samsung

More information

IPSJ SIG Technical Report Vol.2014-ARC-213 No.24 Vol.2014-HPC-147 No /12/10 GPU 1,a) 1,b) 1,c) 1,d) GPU GPU Structure Of Array Array Of

IPSJ SIG Technical Report Vol.2014-ARC-213 No.24 Vol.2014-HPC-147 No /12/10 GPU 1,a) 1,b) 1,c) 1,d) GPU GPU Structure Of Array Array Of GPU 1,a) 1,b) 1,c) 1,d) GPU 1 GPU Structure Of Array Array Of Structure 1. MPS(Moving Particle Semi-Implicit) [1] SPH(Smoothed Particle Hydrodynamics) [] DEM(Distinct Element Method)[] [] 1 Tokyo Institute

More information

パーソナルコンピュータのヘドニック回帰式

パーソナルコンピュータのヘドニック回帰式 2002 8 2002 8 1 HDD 2 2 8 1 wp01-24 1 BP 6 PC 2 DELL SOTEC IBM IBM Net Vista Series IBM 1 PC IBM Net Vista Series 2 2001 2002 246 293 2 2 1 2 CPU HDD CRT TFT CPU HDD CRT TFT CPU HDD 1 2.0kg 2.0kg 1 0 TFT

More information

( ) 1

( ) 1 / (2014 04 09 ) E-mail: sekido@amp.i.kyoto-u.ac.jp (2014 04 09 ) 1 3 20%7528 50%15 30% 1572372888 (2014 04 09 ) 2 http://www-is.amp.i.kyoto-u.ac.jp/lab/sekido/ (2014 04 09 ) 3 (2014 04 09 ) 4 2006 IT J.

More information

HPEハイパフォーマンスコンピューティング ソリューション

HPEハイパフォーマンスコンピューティング ソリューション HPE HPC / AI Page 2 No.1 * 24.8% No.1 * HPE HPC / AI HPC AI SGIHPE HPC / AI GPU TOP500 50th edition Nov. 2017 HPE No.1 124 www.top500.org HPE HPC / AI TSUBAME 3.0 2017 7 AI TSUBAME 3.0 HPE SGI 8600 System

More information

HP Workstation 総合カタログ

HP Workstation 総合カタログ HP Workstation Z HP 6 Z HP HP Z840 Workstation P.9 HP Z640 Workstation & CPU P.10 HP Z440 Workstation P.11 17.3in WIDE HP ZBook 17 G2 Mobile Workstation P.15 15.6in WIDE HP ZBook 15 G2 Mobile Workstation

More information

DEIM Forum 2017 H ,

DEIM Forum 2017 H , DEIM Forum 217 H5-4 113 8656 7 3 1 153 855 4 6 1 3 2 1 2 E-mail: {satoyuki,haya,kgoda,kitsure}@tkl.iis.u-tokyo.ac.jp,.,,.,,.,, 1.. 1956., IBM IBM RAMAC 35 IBM 35 24 5, 5MB. 1961 IBM 131,,, IBM 35 13.,

More information

単位、情報量、デジタルデータ、CPUと高速化 ~ICT用語集~

単位、情報量、デジタルデータ、CPUと高速化  ~ICT用語集~ CPU ICT mizutani@ic.daito.ac.jp 2014 SI: Systèm International d Unités SI SI 10 1 da 10 1 d 10 2 h 10 2 c 10 3 k 10 3 m 10 6 M 10 6 µ 10 9 G 10 9 n 10 12 T 10 12 p 10 15 P 10 15 f 10 18 E 10 18 a 10 21

More information

FIT2013( 第 12 回情報科学技術フォーラム ) I-032 Acceleration of Adaptive Bilateral Filter base on Spatial Decomposition and Symmetry of Weights 1. Taiki Makishi Ch

FIT2013( 第 12 回情報科学技術フォーラム ) I-032 Acceleration of Adaptive Bilateral Filter base on Spatial Decomposition and Symmetry of Weights 1. Taiki Makishi Ch I-032 Acceleration of Adaptive Bilateral Filter base on Spatial Decomposition and Symmetry of Weights 1. Taiki Makishi Chikatoshi Yamada Shuichi Ichikawa Gaussian Filter GF GF Bilateral Filter BF CG [1]

More information

4.11 4 55 4.12 11 56 4.13 0 57 4.14 1 58 4.15 4 59 4.16 11 60 5 5.1 5.1 5.2 1 (1983) Q = K A I v = Q / A = K I v = v / o n o Q A L 3 T -1 I : K : LT -1 v LT -1 v LT -1 o n o 61 (3) 5.3 1 5.1 K=10-1 10-3

More information

GPUコンピューティング講習会パート1

GPUコンピューティング講習会パート1 GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の

More information

56 OS OS OS OS 1 OS HDD OS 1 OS HDD HDD OS OS OSOS HDD 図 1 二重キャッシュ環境 3. 負の参照の時間的局所性 3.1 参照の局所性 Locality of Reference Temporal locality Spatial localit

56 OS OS OS OS 1 OS HDD OS 1 OS HDD HDD OS OS OSOS HDD 図 1 二重キャッシュ環境 3. 負の参照の時間的局所性 3.1 参照の局所性 Locality of Reference Temporal locality Spatial localit 116 26 4 1 2 2 1 3 An Analysis of Locality of Reference in Virtualized Environment Hiroki SUGIMOTO 1, Kousuke TAKEUCHI 2, Kouya HINAGAWA 2 and Saneyasu YAMAGUCHI 1 3 Abstract As cloud computing has spread

More information