untitled

Similar documents
九州大学学術情報リポジトリ Kyushu University Institutional Repository マッスル サーバー ( 汎用 PC クラスタ + 特定計算向けハードウェア ) の開発 : 分子軌道法を例にして 村上, 和彰九州大学大学院システム情報科学研究院 九州大学情報基盤センタ

HPCマシンの変遷と 今後の情報基盤センターの役割

プロセッサ・アーキテクチャ

Express5800/120Ed


Microsoft PowerPoint - 03_murakami(参照)_ pptx[読み取り専用]

untitled

Express5800/110Rc-1 1. Express5800/110Rc-1 N N Express5800/110Rc-1 Express5800/110Rc-1 ( /1BG(256)) (C/850(128)) CPU Pentium (1BGHz) 1

Express5800/110Ee (2002/01/22)

Express5800/110Ee Pentium 1. Express5800/110Ee N N Express5800/110Ee Express5800/110Ee ( /800EB(256)) ( /800EB(256) 20W) CPU L1 L2 CD-

A Responsive Processor for Parallel/Distributed Real-time Processing

Express5800/120Lf 1. Express5800/120Lf N N N Express5800/120Lf Express5800/120Lf Express5800/120Lf ( /1BG(256)) ( /1BG(256)) (

Express5800/120Ra-1

Express5800/120Rb-1 (2002/01/22)

Express5800/120Rc-2 Workgroup/Department 1. Express5800/120Rc-2 N N N Express5800/120Rc-2 Express5800/120Rc-2 Express5800/120R

Express5800/120Lc

NEC All rights reserved 1

卒業論文

テストコスト抑制のための技術課題-DFTとATEの観点から

Express5800/120Rb-2

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1

Itanium2ベンチマーク

1 M32R Single-Chip Multiprocessor [2] [3] [4] [5] Linux/M32R UP(Uni-processor) SMP(Symmetric Multi-processor) MMU CPU nommu Linux/M32R Linux/M32R 2. M

Express5800/140Hb (2002/01/22)

ProLiant ML110 Generation 4 システム構成図

HP ProLiant 500シリーズ

supercomputer2010.ppt

2005 1

1重谷.PDF

Express5800/120Le

26 FPGA FPGA (Field Programmable Gate Array) ASIC (Application Specific Integrated Circuit) FPGA FPGA FPGA FPGA Linux FreeDOS skewed way L1

Express5800/120Mc

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2

Express5800/140Ma

Source: Intel.Config: Pentium III Processor-Intel Seattle SE440BX-2, 128MB PC100 CL2 SDRAM Intel 440BX-2 Chipset Platform- Diamond Viper 550 /

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h

HP ProLiant サーバー Generation 8 ~AMD Opteron™ 6300シリーズプロセッサー搭載製品カタログ~

2nd-1.dvi

02_Matrox Frame Grabbers_1612

HP ProLiant ML110 Generation 5 システム構成図

ProLiant BL460c システム構成図

ストリーミング SIMD 拡張命令2 (SSE2) を使用した、倍精度浮動小数点ベクトルの最大/最小要素とそのインデックスの検出

ProLiant BL25p Generation 2システム構成図

CTA 82: CTA A A B B A B A, C A A A D A B Max-Planck-Inst. fuer Phys. C D

HPEハイパフォーマンスコンピューティング ソリューション

ProLiant ML115 Generation 1 システム構成図

橡3_2石川.PDF

単位、情報量、デジタルデータ、CPUと高速化 ~ICT用語集~

システムソリューションのご紹介

ProLiant BL20p Generation 4 システム構成図

Microsoft PowerPoint - ★13_日立_清水.ppt


3 SIMPLE ver 3.2: SIMPLE (SIxteen-bit MicroProcessor for Laboratory Experiment) 1 16 SIMPLE SIMPLE 2 SIMPLE 2.1 SIMPLE (main memo

main.dvi

untitled


Microsoft Word - 2TXL実施要綱 doc

Express5800/140Ma

matrox0

BRANCH SRX <2010Q3 > 2 Copyright 2010 Juniper Networks, Inc.


LinuxDeviceDriver2003-PDF.PDF

1 2

PROLIANT ML

Second-semi.PDF

ProLiant ML110 Generation 4 システム構成図

VLSI工学

システムユニット構成ツリーの見方

HPE StoreEasy 1000/3000 Storage 第5世代


はじめに

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

OVERVIEW hp StorageWorks NAS 2000s hp StorageWorks NAS 2000s A 3.5 B 3.5 IDE DVD-ROM C LED LED Ultra320 SCSI ( ) NAS 2000s NAS 2000s NAS

The 3 key challenges in programming for MC

353 ISO/IEC JTC1 SC LSI 1 1 ASIC RISC SPARC 4 Fig. 1 1 Fig. 1 Diagram of Responsive Processor [2] [6] [7] [8] [9] 4 PCI USB RS 232C A/D D/A PWM

次世代スーパーコンピュータのシステム構成案について

Microsoft PowerPoint - GPU_computing_2013_01.pptx

IPSJ SIG Technical Report Vol.2013-ARC-206 No /8/1 Android Dominic Hillenbrand ODROID-X2 GPIO Android OSCAR WFI 500[us] GPIO GP

untitled

スライド 1

HPE Moonshot System ~ビッグデータ分析&モバイルワークプレイスを新たなステージへ~

IO Linux Vyatta PC

HP ProLiant ML310 Generation 3 システム構成図

Vol. 45 No. SIG 3(ACS 5) Responsive Link 51 Responsive Link Responsive Link WG6 2) IPSJ-TS 0006:2003 ISO/IEC JTC1 SC25 WG4 3) [µs

ProLiant BL35p システム構成図

IPSJ SIG Technical Report Vol.2013-ARC-203 No /2/1 SMYLE OpenCL (NEDO) IT FPGA SMYLEref SMYLE OpenCL SMYLE OpenCL FPGA 1

OVERVIEW ProLiant ML110 G2 Storage Server ProLiant ML110 G2 Storage Server A C D SATA NH 320GB 01 (1TB) (1TB) Ultra320 SCSI 6 SATA RAID Serial


Chip Size and Performance Evaluations of Shared Cache for On-chip Multiprocessor Takahiro SASAKI, Tomohiro INOUE, Nobuhiko OMORI, Tetsuo HIRONAKA, Han

スパコンに通じる並列プログラミングの基礎

ProLiant ML110 システム構成図

「FPGAを用いたプロセッサ検証システムの製作」

PRIMERGY BX620 S4 システム構成図 (2008年5月版) 樹系図

FINAL PROGRAM 22th Annual Workshop SWoPP / / 2009 Sendai Summer United Workshops on Parallel, Distributed, and Cooperative Processing

GPU n Graphics Processing Unit CG CAD

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

Microsoft Word _BFnUxx_rev10.doc

mate10„”„õŒì4

ProLiant DL380 SAN Storageモデル システム構成図

HP High Performance Computing(HPC)

Transcription:

PC murakami@cc.kyushu-u.ac.jp

muscle server blade server PC PC +

EHPC/Eric (Embedded HPC with Eric) 1216 Compact PCI Compact PCIPC Compact PCISH-4 Compact PCISH-4 Eric Eric

EHPC/Eric

EHPC/Eric Gigabit Ethernet CompactPCI CompactPCI LSI Eric LSI Eric LSI Eric CompactPCI PC CPU SH-4 PCI

Compact PCI Compact PCI Eric LSI SDRAM Eric1GB MPU SH4 PCII/F Ethrenet

vs. HPC MPP SMP PC Ethernet, etc. Compact PCI, Ethernet, etc.

PC Compute Intensive +

p 0 p 1 o 0 o 1 N H S PC S = (1 p) + p N 1 (1 o) + o H

etc.

PCXeon (2.8GHz) 80 512GB/processor2 STO-3G 1 HIV-1 protease

10 4 27 RNA 10 6 2740 110 500010

(1) (2) (3) (4) (6) (5)C = = = N I a ai IJ N I ai IJ C S C F 1 1 ε + + = K L KL IJ IJ IJ JL IK KL IJ P V T F ), ( 2 1 ), (

(1) (2) (3) (4) (6) (5)C 75 58 37 20 10 427 316 207 110 55 27.5 9.15 2.2 0.3 0.1 23614.5 8584.9 1892.7 272.9 23.7 Total 211.7 60.9 11.0 1.7 0.2 23284.3 (98.6%) 8482.1 (98.8%) 1871.0 (98.6%) 269.4 (98.7%) 22.9 (96.6%) 10.1 5.0 1.5 0.3 0.1 57.3 18.9 4.4 0.6 0.1 GAQMY GAQM GAQ GA G 98 LSI

for(i = 0; I < Nshell; I++) for( J = 0; J < I; J++) for (K = 0; K < I; K ++) for( L = 0; L < I; L++) for(i = 0; i < N i ; i++) for(j = 0; j < N j ; j++) for (k = 0; k < N k ; k++) for(l = 0; l < N l ; l++) <s i s j s k s l > forend forend forend forend <a I a J a K a L >() forend forend forend forend

Eric LSI LSI: IIC RC

Eric:LSI 32b SH-4 I/F 64b 64b 64b 64b IIC Program Memory (64KB) ERF Table (128KB) RC Microprogram Memory (64KB) 16b 64b 64b 64b 64b 64b IIC Engine RC Engine 0 RC Engine 1 RC Engine 2 RC Engine 3 IALU FMUL &ADD FDIV &SQRT EXP &ERF IALU FMUL &ADD IALU FMUL &ADD IALU FMUL &ADD IALU FMUL &ADD Register File Register File Register File Register File Register File 64b 64b 64b 64b 64b Data Memory (32KB/bank 8banks) 64b IIC (RISC ) 64b SDRAM I/F 64b RC ( CMP )

LSI Eric vs. Intel P4 LSI Eric CMP 200MHz Intel P4 3.2GHz 2003 10

GAQMY Pentium 1100 ( 19 ) Pentium 640 ( 11 )

(704KB) Eric LSI (3.6M) 5mm 10mm TSMC 0.13µm 3.6M 704KB 5mm 10mm :200MHz 10W 2GFlop/s()

Compact PCI Compact PCI Eric LSI SDRAM Eric1GB MPU SH4 PCII/F Ethrenet

EHPC/Eric =Eric 28 PC Ethernet Eric112

EHPC/Eric GFlop/s MO ( ) W D H:mm KW M$ EHPC/Eric 112 224 ()) 2 1200 650 1010 () 2 () 0.1 SR8000/64 512 512 4 4720 3274 1785 212 15

HPC PCI I/O SDRAM GPIO UART Interrupt Controller PCI I/O

300 MHz, 32-bit Xtensa-based processor 16- and 24-bit instructions FPU MMU with TLB Stretch Instruction Set Extension Fabric Aligned load and store 8, 16, 32, 64, and 128 bit Unaligned load and store Up to 16 bytes variable byte streaming I/O Up to 32 bits variable bit streaming I/O User-defined extensions to the core ISA Defined in C/C++ Fully pipelined and interlocked Low power consumption Support for standard operating systems Stretch

CRAY XD1 Compute Processors Chassis 12 Each Rack 144 Performance Aggregate Switching Capacity Interprocessor Latency Aggregate Memory Bandwidth Maximum Memory Maximum Disk Storage 53 GFlop/s 96 GB/s 1.6 us 77 GB/s 96 GB 296 GB 633 GFlop/s 1152 GB/s 1.8 us 922 GB/s 1152 GB

PC murakami@cc.kyushu-u.ac.jp