PowerPoint プレゼンテーション

Similar documents
PowerPoint プレゼンテーション

supercomputer2010.ppt

スライド 1

GPU n Graphics Processing Unit CG CAD

計算機アーキテクチャ

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

スライド 1

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

修士論文

SC SC10 (International Conference for High Performance Computing, Networking, Storage and Analysis) (HPC) Ernest N.

Microsoft PowerPoint - 11Web.pptx

COMET II のプログラミング ここでは機械語レベルプログラミングを学びます 1

GPUコンピューティング講習会パート1

スライド 1

インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美

untitled

HP High Performance Computing(HPC)

スライド 1

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法

0..Campus の利用.Campusに登録確認木曜 4 限にPCリテラシーがあるか確認ショートコード : Campusをお気に入りに追加.Campusから講義ファイル取得.Campusにレポート提出 2

最新の並列計算事情とCAE

1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU

スライド 1

チューニング講習会 初級編

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法

スライド 1

Microsoft* Windows* 10 における新しい命令セットの利用

スライド 1

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

ガイダンス(2016年4月19日)-HP

N08

<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074>

スライド 1

Microsoft Word - SSTC_Intel_Core.doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

cmpsys13w03_cpu_hp.ppt

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

HPCマシンの変遷と 今後の情報基盤センターの役割

27_02.indd

<4D F736F F F696E74202D20834B F C8FEE95F A7793C195CA8D758B E348C8E3893FA816A202D E >


CELSIUSカタログ(2012年7月版)

< B8CDD8AB B83685D>

CELSIUSカタログ(2012年5月版)

PowerPoint プレゼンテーション

untitled

VXPRO R1400® ご提案資料

コンピュータ工学Ⅰ

コンピュータ工学Ⅰ

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

熊本大学学術リポジトリ Kumamoto University Repositor Title GPGPU による高速演算について Author(s) 榎本, 昌一 Citation Issue date Type URL Presentation

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

Intel Integrated Performance Premitives 4.1 Linux

システムソリューションのご紹介

スライド 1

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

GPUコンピューティング講習会パート1

Microsoft Word - HOKUSAI_system_overview_ja.docx

WebNACCS

Microsoft PowerPoint - SWoPP2010_Shirahata

Microsoft PowerPoint - ★13_日立_清水.ppt

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

適応フィルタのSIMD最適化

スライド 1

untitled

openmp1_Yaguchi_version_170530

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1

スライド 1

(速報) Xeon E 系モデル 新プロセッサ性能について

main.dvi

! 行行 CPUDSP PPESPECell/B.E. CPUGPU 行行 SIMD [SSE, AltiVec] 用 HPC CPUDSP PPESPE (Cell/B.E.) SPE CPUGPU GPU CPU DSP DSP PPE SPE SPE CPU DSP SPE 2

スライド 1

研究報告用MS-Wordテンプレートファイル

HPC可視化_小野2.pptx

GPGPUイントロダクション

Microsoft Word ●書式付IO性能_杉崎_ _更新__ doc

スライド 1

hpc141_shirahata.pdf

bc0710_010_015.indd

Microsoft PowerPoint - Lec ppt [互換モード]

製造したスーパーコンピュータに並ぶ省電力性能を示し 省電力スーパーコンピューティ ングへの GRAPE-DR システム基本設計の優位性を示しました 4) 消費電力低減が第一の技術的課題である次々世代スーパーコンピュータの基礎技術とし て 省電力型アクセラレータが優れていることを実証し 基礎技術として

HP Z200 Intel i5 CPU 3.33GHz Low Profile 仕様 380 LP Assist 2.2 Instinct v3.0 以降 いいえいいえはいいいえ 4GB および 8GB DDR ECC (2 枚構成の DIMM) ISIS へ接続するにはオンボードの

並列計算

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

HPEハイパフォーマンスコンピューティング ソリューション

Hphi実行環境導入マニュアル_v1.1.1

GPGPU によるアクセラレーション環境について

PowerPoint プレゼンテーション

Microsoft PowerPoint - ICD2011UenoSlides.pptx

Microsoft PowerPoint - Sol7 [Compatibility Mode]

kantan_C_1_iro3.indd

EnSightのご紹介

PowerPoint プレゼンテーション

資料8-3 今後のHPCI計画推進のあり方に関する検討ワーキンググループの中間報告について(その5)

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

スライド 1

TSUBAME2.0 における GPU の 活用方法 東京工業大学学術国際情報センター丸山直也第 10 回 GPU コンピューティング講習会 2011 年 9 月 28 日

PowerPoint プレゼンテーション

Transcription:

みんなの ベクトル計算 たけおか @takeoka PC クラスタ コンソーシアム理事でもある 2011/FEB/20

ベクトル計算が新しい と 2008 年末に言いました Intelに入ってる! (2008 年から見た 近未来? ) GPU 計算が新しい (2008 年当時 ) Intel AVX (Advanced Vector Extension) SIMD 命令を進めて ベクトル機構をつける http://softwareprojects.intel.com/avx/ AVXは遅れているが Intelではありがち NEC( 半導体部門ではない ) と提携 NECといえばベクトルマシン

GPU= ベクトル ユニット GPU 計算 天河, TSUBAME2.0 など TOP500 の 1, 3, 4 位は GPU+x86 2, 5 位は Cray で x86 コア数がとても多い PC マンセー ベクトル死亡 \(^^)/ という 一般人の皆さんが多数 *** しかし *** GPU は まさにベクトル計算機 ベクトル計算機が コモディティ技術になっただけ Intel も それに気づいていた AVX を入れようとして遅れ GPU+CPU(Larrabee) も失敗中

TOP500 中の TOP5 名前 ( サイト, 開発 ) コア数 Rmax (TFlops) Rpeak 電力 (KW) 天河 1a( 天津 ) 186,368 2,566.00 4,701.00 4,040.00 NUDT TH MPP, X5670 2.93Ghz 6C, NVIDIA GPU, FT-1000 8C Jaguar ( オークリッジ研究所,Cray) 224,162 1,759.00 2,331.00 6,950.60 Cray XT5-HE Opteron 6-core 2.6 GHz 星雲 ( 深圳 ) 120,640 1,271.00 2,984.30 2,580.00 Dawning TC3600 Blade, Intel X5650, NVidia Tesla C2050 GPU TSUBAME2.0( 東工大 ) 73,278 1,192.00 2,287.63 1,398.60 HP ProLiant SL390s G7 Xeon 6C X5670, Nvidia GPU, Linux/Windows Hopper ( エネルギー研究科学計算センタ,Cray) 153,408 1,054.00 1,288.63 2,910.00 Cray XE6 12-core 2.1 GHz

昔のスーパコンピュータ ベクトルは今でも速い ベクトル計算機とは 日本メーカが強くなりすぎて 政治的にアメリカはベクトル スパコンを買わなくした 技術的に古くなったのではない 過去に一度も古くなっていない ( 重要 ) 地球シミュレータは ベクトル マシンを 4000 台並べた スパコン クラスタ ベクトル命令を 1 つフェッチして データ列 ( ベクトル ) に 同じ演算を繰り返す 演算器 - ベクトル レジスタ - 外部 I/F のバランスを正しく設計する キャッシュ メモリは必ずしも必要ない

Intel AVX の特徴 Intel AVXの特徴 キー 恩恵 ワイド ベクトル 128から256bit へ増加 最大 2 倍のFLOPs 強化されたデータの配置 - ブロードキャスト マスクロード データの転置のための新しい 256bit プリミティブ 必要なデータだけを 高速で効果的にアクセスし引っ張ってきて 構成 3つか4 つのオペランド出鱈目でない文法 - より少ないレジスタのコピー ベクトルでもスカ効果的で将来の拡張性があるように設計ラでもよりよいレジスタの使用柔軟な整列していないメモリのアクセスのサポートロードと計算操作の融合をもっと図る 拡張性ある新しいオペコード (VEX) コードサイズの縮小 Intel AVX は汎用アーキテクチャである 今日のすべてのアプリケーション中の SSE に取って代わる事が期待される

Intel AVX 対応コンパイラ模索中 Gcc は対応作業中 Intel Compiler AVX の動作する実機も模索中

ARM もベクトル命令 VFP (Vector Floating Point) 短ベクトル命令 実際には シーケンシャルに処理される ベクトル長が短いので SIMD に比して性能が出ない コンパイラもろくにサポートしていない Advanced SIMD (NEON) 実 SIMD codec で使われ 性能がそれなりに出ているらしい

GPGPU ベクトル計算機 CUDA OpenCL 専用プロセッサを汎用として公開するのは やはりなかなか難しい GPU メーカも計算ユニットとして意識している GPU メーカは 高速計算を得意とする会社が多い 座標変換 ソートなどをパイプラインで行う

ベクトル計算機の オープンなドキュメント CRAY X-MP などのマニュアルがフリーに CRAY X-MP とは CRAY-1 を 2 台接続 メインメモリ共有

ベクトル計算機のオープンなドキュメント CRAY X-MP などのマニュアルがフリーに http://www.bitsavers.org/pdf/cray/ HR-0032_CRAY_X-MP_Series_Model_22_24_Mainframe_Ref_Man_Jul84.pdf CRAY X-MPについて詳しく述べてある 非常に勉強になる ベクトル計算機の使用方法が分かる ベクトル計算機の作り方もわかる 日本語翻訳一人プロジェクト CRAY X-MPについて http://www.takeoka.org/~take/supercom/cray-xmp.html

ベクトル計算機とは ベクトル命令を 1 つフェッチして データ列 ( ベクトル ) に 同じ演算を繰り返す 演算器 - ベクトル レジスタ - 外部 I/F のバランスを正しく設計する キャッシュ メモリは必ずしも必要ない ベクトル マスクを利用して 条件によっては結果をストアしない 条件分岐無しで 条件ごとに結果を変えられる

ベクトル計算機とは 命令デコーダ 命令バッファ ベクトル演算ユニット ベクトル レジスタ 64bit 64 語 64 個 (SRAM) 中央メモリ (DRAM) メモリ I/O ユニット スカラユニット

X-MP シミュレータもある XMPSIM CRAY X-MP のパイプラインをシミュレートするソフトウェアがあり 命令セットと各命令のパイプラインをシミュレート バイナリ供給で PC/AT の DOS 用 日本語 Windows の DOS 窓でも 支障なく使用可能 枠の線などに文字化けが発生するが 使用には まったく問題なし http://www.utdallas.edu/ ~cantrell/ee2310/xmpsim.html

無料ではない教科書 The Cray X-Mp/Model 24: A Case Study in Pipelined Architecture and Vector Processing 出版社 : Springer (1989/09) ISBN-10: 0387970894 発売日 : 1989/09 非常にいい教科書 Cray X-MP がどうしてそのように作られているか, がわかる シュプリンガーのレクチャーノートなのに 英語が非常に口語的で泣きそうに これの全和訳もした 5 人程度の有志で

ベクトル計算バンザイ \(^^)/ 来るべき新時代に向け勉強しよう マニュアルを読むだけで非常に勉強になる 浮動小数点演算についても詳しく書いてある 4 章までアーキテクチャの説明 5 章は命令の個別の説明で これも興味深い

ベクトル雑談 姫野氏 CRAYで遊んでいた ビジュアライゼーション A0サイズのプロッタ 一枚に何コマも作図 ( 作画 ) 紙をコマ撮り

URL CRAY X-MP などのマニュアルがフリーに http://www.bitsavers.org/pdf/cray/ HR-0032_CRAY_X-MP_Series_Model_22_24_Mainframe_Ref_Man_Jul84.pdf http://www.takeoka.org/~take/supercom/cray-xmp.html