Microsoft PowerPoint - 【講演資料】渡邊様 松山-.ppt

Similar documents
Microsoft PowerPoint 知る集い-02.ppt [互換モード]

スライド 1

資料8-3 今後のHPCI計画推進のあり方に関する検討ワーキンググループの中間報告について(その5)

Microsoft PowerPoint 知る集い(京都)最終.ppt

supercomputer2010.ppt

openmp1_Yaguchi_version_170530

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

PowerPoint プレゼンテーション

Microsoft Word - HOKUSAI_system_overview_ja.docx

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

スライド 1

Microsoft Word - koubo-H26.doc

0..Campus の利用.Campusに登録確認木曜 4 限にPCリテラシーがあるか確認ショートコード : Campusをお気に入りに追加.Campusから講義ファイル取得.Campusにレポート提出 2

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法

SC SC10 (International Conference for High Performance Computing, Networking, Storage and Analysis) (HPC) Ernest N.

<4D F736F F F696E74202D20834B F C8FEE95F A7793C195CA8D758B E348C8E3893FA816A202D E >

PowerPoint プレゼンテーション

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法

PowerPoint プレゼンテーション

ガイダンス(2016年4月19日)-HP

<4D F736F F D B B B835E895E97708A4A8E6E82C A98418C6782CC8E6E93AE2E646F63>

GPU n Graphics Processing Unit CG CAD

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

システムソリューションのご紹介

ガイダンス 可視化入門A 2011年4月11日

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

地球シミュレータ開発の現状 平成 14 年 2 月 22 日 横川三津夫 地球シミュレータ研究開発センター 1

Microsoft PowerPoint - ★13_日立_清水.ppt

(速報) Xeon E 系モデル 新プロセッサ性能について

1. 京 の概要 システムの概要 ソフトウェアの概要 システムの信頼性 1

HPC可視化_小野2.pptx

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

Microsoft PowerPoint 京シンポジウム-08.pptx

製造したスーパーコンピュータに並ぶ省電力性能を示し 省電力スーパーコンピューティ ングへの GRAPE-DR システム基本設計の優位性を示しました 4) 消費電力低減が第一の技術的課題である次々世代スーパーコンピュータの基礎技術とし て 省電力型アクセラレータが優れていることを実証し 基礎技術として

資料2 中間報告案の取りまとめに向けた検討用資料(別冊)

Microsoft PowerPoint - 全体討議座長冒頭発現用2009_ ppt

PowerPoint プレゼンテーション

untitled

スライド 1

FX10利用準備

RICCについて

Microsoft PowerPoint - ITC [互換モード]

次世代スーパーコンピュータのシステム構成案について

Microsoft PowerPoint - 11Web.pptx

Microsoft PowerPoint - arc12

_計算科学が拓く世界.key

VXPRO R1400® ご提案資料

スーパーコンピュータ「京」の概要

ComputerArchitecture.ppt

スライド 1

チューニング講習会 初級編

Microsoft PowerPoint - 藤木審議官講v5.ppt

HPCの過去、現在、将来

4.7講義.key

untitled

-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

1 All Rights Reserved, Copyright 2004, NEC Corporation 2 All Rights Reserved, Copyright 2004, NEC Corporation

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

11 月発表の Green500 最新結果の顛末 本来は Green500 で 1-4 位独占を実現する目論見であった 7 月の ISC で 計測ルールが v2.0 になることが予告された ( 現行の v1.2 ルールでの計測値改善には注力せず v2.0 対応作業のみ進めていた ) 最後まで v1.

CELSIUSカタログ(2012年7月版)

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

hpc141_shirahata.pdf

CELSIUSカタログ(2012年5月版)

09中西

1重谷.PDF

スライド 1

ohpr.dvi

develop

HPCマシンの変遷と 今後の情報基盤センターの役割

最新の並列計算事情とCAE

平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には,

<4D F736F F F696E74202D E291AB92B B1C3DECADEB2BD2E B8CDD8AB B83685D>

スライド 1

PowerPoint プレゼンテーション

スライド 1

スパコンに通じる並列プログラミングの基礎

RN201511_cs5_1021.indd

記者発表開催について

6 ZettaScaler-1.x Supercomputer systems

スパコンに通じる並列プログラミングの基礎

ムーアの法則に関するレポート

スパコンに通じる並列プログラミングの基礎

CCS HPCサマーセミナー 並列数値計算アルゴリズム

untitled

統合汎用スーパーコンピュータシステムの設計状況と施設整備状況

Microsoft Word - Dolphin Expressによる10Gbpソケット通信.docx

SimscapeプラントモデルのFPGAアクセラレーション

ha ha km2 15cm 5 8ha 30km2 8ha 30km2 4 14

GPUコンピューティング講習会パート1

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

先進的計算基盤システムシンポジウム DMA Tofu 6 MPI RDMA 6 3 (1 ) RDMA (2 ) 3 MPI MPI 3 MPI 127us, 47GB/s 9,216 MPI Bcast 106GB/s 31 MPI 2 MPI 2 Tofu Eager : 6 7 2

PowerPoint プレゼンテーション

HPCの過去、現在、将来

2 曙光 4000A / 曙光 3 上海スーパーコンピュ ータセンター /200 4 HP BL20p G3 Blades 大慶油田 /200 6 cluster/h P 4 深騰 6800 / 聯想 中国科学院コンピュー タネットワーク応用セ ンター /200 3 科学計算 / 工業 ー / 地球

スライド 1

ÊÂÎó·×»»¤È¤Ï/OpenMP¤Î½éÊâ¡Ê£±¡Ë

PowerPoint プレゼンテーション

Transcription:

スーパーコンピュータ 京 を知る集い 世界最速スーパーコンピュータ 京 平成 24 年 2 月 25 日 理化学研究所次世代スーパーコンピュータ開発実施本部渡辺貞 0

内容 スーパーコンピュータとは? スーパーコンピュータの応用例スーパーコンピュータの歴史世界のスーパーコンピュータ開発スーパーコンピュータの高速化と 京 スーパーコンピュータの施設 1

スーパーコンピュータとは? 2

スーパーコンピュータとは? Wikipedia より スーパーコンピュータとは 加減算などの数値演算が一般的なコンピュータよりも桁違いに速いコンピュータで 主として科学技術計算に使われるコンピュータ 3

どのくらい速いか? 10PF 1PF 京 天河 1A( 中国 ) Jaguar( 米 ) 10 5 km/h 100TF 10 4 km/h 地球シミュレータ ( 初代 ) 10TF 1000 km/h 1TF サーバ 100 km/h 100GF PC 10 km/h 1GFlops=1,000,000,000 演算 / 秒 1TFlops=1,000,000,000,000 演算 / 秒 1PFlops=1,000,000,000,000,000 演算 / 秒 4

第 3 の科学 : 計算科学 理論 実験 計算 ( 数値シミュレーション ) 超長時間の現象 : 宇宙, 気候, 環境超短時間の現象 : 核融合, 衝突, 燃焼実験不可能 : 結晶 / 分子構造, 安全解析, 気象 計算機実験 = 数値シミュレーション 膨大な計算量 超高速コンピュータ ( スーパーコンピュータ ) 5

スーパーコンピュータで何ができるか? スーパーコンピュータを使った数値シミュレーションで対象物を拡大 / 縮小あるいは時間を延長 / 短縮することにより 目に見えないもの 予測できないもの実験不可能なものを目で見 予測し 実験を行うことができる 6

スーパーコンピュータの応用例 7

気候変動予測 ( 地球温暖化 ) 提供 :AORI/NIES/JAMSTEC/MEXT 8

Ground motion and tsunami simulations using the tsunami-coupled equation of motion in 3D Maeda and Furumura (2011) Pure and Applied Geophysics under review [Present] Resolution: 1km CPU Time: 2 hour (ES 64 node) [Expected] Resolution: 0.25 km CPU Time: < 10 min (K Computer) 提供 : 東大前田 古村 9

膜たんぱく質と水分子 提供 : 高田 (MEXT) 10

スーパーコンピュータの歴史 11

スーパーコンピュータの歴史 1P 1000000.0000 100000.0000 100T システム性能 Earth Simulator SX-8 ASCI Roadrunner BlueGene/L 京 Jaguar Tianhe-1A FLOPS 10T 10000.0000 1T 1000.0000 100G 100.0000 10G 10.0000 1G 1.0000 100M 0.1000 10M 0.0100 S-810/20 X-MP SX-2 VP-200 SX-3 CRAY-2 Y-MP8 S-820/80 VP-400 Paragon NWT/166 CM-5 C90 VP2600/1 0 ASCI Red SX-4 VPP500 T3D SX-3R S-3800 ASCI Q ASCI White SX-6 VPP5000 SX-5 SR8000G1 VPP800 ASCI Blue VPP700 ASCI Blue Mountain T3E SR8000 SR2201/2K T90 SR2201 CPU 性能 CPU 周波数 並列度の増大 10GHz 1GHz 100MHz 1M 0.0010 1980 1985 1990 1995 2000 2005 2010 Year 10MHz 12

Cray-1 (1976) Seymour Cray 13

70 年代のスパコンと現在のスパコン Cray-1 (1976) Sourced from http://www.thocp.net/hardware/cray_1.htm 単一 CPU システム 地球シミュレータ (2002) 超並列システム 技術の進歩 (Cray-1と京) Cray-1(1976) 京 (2012) 倍率 性能 160MFlops >10PFlops 6,000 万倍以上 メモリ容量 8Mバイト >1Pバイト 1 億 2000 万倍以上 14

世界のスーパーコンピュータ開発 15

世界第一位の評価 TOP500 リストで 2 期連続世界第一位! (LINPACK 性能テストで 10PFlops 達成 ) H23.6 H23.11 性能値 8.16PFlops 10.51PFlops 抜群の高性能 第 2 位の 3 倍以上の性能 2 位 ~6 位を足した性能を上回る 第 2 位の 4 倍以上の性能 2 位 ~8 位を足した性能を上回る 順位 システム名称 サイトベンダー国名 Linpack 演算回数 ( テラ FLOPS) 1 K computer 理研計算科学研究機構 Fujitsu 日 10,510 2 天河 1A 号天津スパコンセンタ NUDT 中 2,566 高い信頼性 高負荷下 28 時間連続走行 高負荷下 29.5 時間連続走行 3 Jaguar オークリッジ研 Cray 米 1,759 4 Nebulae( 星雲 ) 深圳スパコンセンタ Dawning 中 1,271 5 TSUBAME2.0 東京工業大学 NEC/HP 日 1,192 6 Cielo ロスアラモス研 ( サンテ ィア 研 ) Cray 米 1110 7 Pleiades NASA エイムス 研究センタ SGI 米 1,088 高効率システム効率 93.0% 効率 93.2% 8 Hopper ローレンス ハ ークレイ研 Cray 米 1,054 9 Tera-100 原子力庁 ( エネルキ ー研 ) Bull 仏 1,050 1 0 Roadrunner ロスアラモス研 IBM 米 1,042 16

世界のスーパーコンピュータ開発ピーク性能 我が国のスパコン性能は, 京 が 7 年ぶりに第 1 位 (2011 年 6 月 ) を奪還.2011 年 11 月に 2 期連続第 1 位を獲得. 米国は, 軍事利用を中心に産業, 科学技術 学術研究での利用のため, 複数の大規模プロジェクトを並行して推進 中国がスーパーコンピュータの開発で力をつけてきている. 昨年 (2010 年 )11 月には, 国防科学技術大学 (NUDT) の天河 1A (Tianhe-1A) が, TOP500 で世界第 1 位になった. 1 ペタ 1 テラ ( 兆速 ) 設置済 計画 ASC 計画 Red 数値風洞 ( 航技研 ) 日米中 CP-PACS( 筑波大 ) 地球シミュレータ ( 海洋機構 ) ASC 計画 White ASC 計画 Q ASC 計画 Purple ASC 計画 Road Runner BlueGene/L ASC 計画 Red Storm 京 Cyber Infrastructure 計画 Blue Waters 米国が開発を加速 天河 1A 星雲 NLCF 計画 Jaguar ASC 計画 BlueGene/P ( 注 ) ASC 計画 :Advanced Simulation and Computing 計画 ( 米国エネルギー省 ) NLCF 計画 :National Leadership Computing Facility 計画 ( 米国エネルギー省 ) HPCS 計画 :High Productivity Computing System 計画 ( 米国国防省 ) Cyber Infrastructure 計画 : 米国科学財団 Pleiades 計画 : 米国航空宇宙局 ASC 計画 Sequoia Titan Pleiades 計画 Pleiades HPCS 計画 PERCS 地球シミュレータ 2 ( 海洋機構 ) [ 年 ] '94 '96 '98 '00 '02 '04 '06 '08 '10 '12 17

スーパーコンピュータの高速化と 京 18

コンピュータの性能 ( 計算速度 ) を高めるには 速度 (S) = 処理量 (Q) 時間 (T) 大 小 並列度を増大 処理時間を短縮 並列度を増大 : 沢山並べる (CPU 数 演算器数 メモリバンド幅など ) 処理時間を短縮 : 個々の処理を速くする (CPU の高速化 クロック時間短縮 ( 周波数大 ) データ呼出し時間短縮など ) 19

CPU の高速演算の仕組み ( 代表的な CPU の高速化例 ) パイプラン演算 ( 処理 ) 加算 (c=a+b): 車の組み立てラインと同様 下記処理を連続して実行する データ読出し ( 回路 ) 桁合わせ ( 回路 ) 加算 ( 仮数部 )( 回路 ) 正規化 ( 精度調整 )( 回路 ) 結果格納 ( 回路 ) a: 0.9876x10 3 a: 0.9876x10 3 a: 0.9876x10 3 b: 0.5678x10 2 b: 0.05678x10 3 +) b: 0.05678x10 3 1.04438x10 3 バケツリレー 池 =メモリ人 = 演算器 0.1044x10 4 C: 0.1044x10 4 a c 高速化 : バケツの引渡しピッチを速くする クロック高速化 ( 周波数を高める ) 人と人との距離を詰める 高密度実装 ( 半導体の集積度を高める ) b 読出し 桁合わせ加算正規化 結果格納 バケツリレーを複数同時に行う 並列化 ( 演算器を複数備える ) 20

京 の CPU( プロセッサ ) SPARC64 VIIIfx(45 ナノメートル半導体プロセス 富士通製 ) CPU の内部構成 乗加算器 x4 乗加算器 x4 x 8 コア =64 個の演算器 45 ナノメートル半導体技術! ピーク性能 : 128ギガフロップス (1 秒間に1280 億回の演算性能 ) コア数 : 8 動作周波数 : 2GHz チップサイズ : 22.7mm x 22.6mm トランジスタ数 : 7 億 6 千万トランジスタ 消費電力 : 58W( 水冷 30 ) 東京ドームにおよそ 0.5mm の電気配線を引くのと等価な技術 21

並列度の増大 ( 並列化 ) 演算器数を増やす 制御部 制御部 +-x / +-x / CPU CPU 数を増やす CPU +-x / +-x / CPU NETWORK メモリ メモリバンド幅を増やす CPU CPU CPU CPU... CPU メモリメモリメモリメモリ CPU メモリ メモリ 22

超並列システム 京 CPU チップ CPU 数 :88,128 個! (IO ノード含む ) CPU 間接続ネットワークケーブル総本数 : 約 200,000 本 ( 総延長 : 約 1,000Km) 性能 : パソコンの数十万倍! 23

超並列システム 京 の構成 計算ノード数 (CPU 数 ): 82,944 IOノード数 : 5,184 総ノード数 : 88,128 ピーク演算性能 :11.3 PFLOPS メモリ総容量 : 1.27PiB( ノード当り16GB) 6 次元メッシュトーラスネットワーク (TOFU) ユーザービューは 3 次元トーラス帯域 : 3 次元の正負各方向にそれぞれ 5GB/s x 2( 双方向 ) 理論ピーク ケーブル : 約 200,000 本, 総延長 約 1,000km SPARC64 TM VIIIfx 5GB/s x 双方向 ( 理論ピーク ) z 5GB/s x 双方向 ( 理論ピーク ) ノード CPU: 128GFLOPS (8cores) Core Core SIMD(4FMA) Core SIMD(4FMA) Core SIMD(4FMA) Core SIMD(4FMA) Core SIMD(4FMA) Core16GFlops SIMD(4FMA) Core16GFlops 16GFlops SIMD(4FMA) 16GFlops SIMD(4FMA) 16GFlops 16GFlops 16GFLOPS 16GFlops L2$: 6MB ( 理論ピーク ) 64GB/s MEM: 16GB 5GB/s x 双方向 5GB/s x 双方向 ( 理論ピーク ) 5GB/s x 双方向 ( 理論ピーク ) y x ( 理論ピーク ) 5GB/s x 双方向 3 次元トーラスのイメージ 提供 : 富士通 ( 株 ) 24

京 のハードウェア構造 システム全体 計算ラック 864 計算ラック群 計算ラック 計算ラック 8 システムボード 24 IO システムボード 6 計算速度 :1 京回 / 秒 =10 ペタフロップスメモリ容量 :.1.27PiB ノード CPU 1 ICC 1 メモリ システムボード ノード 4 計算速度 :98.4 兆回 / 秒メモリ容量 :12TB 計算速度 :1280 億回 / 秒メモリ容量 :16GB 計算速度 :5120 億回 / 秒メモリ容量 :64GB 計算速度 :12.3 兆回 / 秒メモリ容量 :1.5TB 25

スーパーコンピュータの施設 26

計算科学研究機構の立地 計算科学研究機構 < 機構長 > 平尾公彦 < 設立 > 平成 22 年 7 月 1 日 < 職員数 > 88 人 ( 非常勤含む ) ( 平成 23 年 7 月 1 日現在 ) 京コンピュータ前駅 < 所在地 > 兵庫県神戸市中央区港島南町 7-1-26 < 敷地面積 > 約 2ha( 準工業地域 ) < 総電力 > 最大約 20MW( 計算機システム ) < 電力設備 > 70kV 特高受電 コージェネレーション発電併用 < 冷却設備 > 計算機棟空調機台数 :B1F 計 14 台 2F 計 50 台 27 27

計算科学研究機構の施設 研究棟 延床面積 約 9,000m2 建築面積 約 1,800m2 構 造 鉄骨造地上 6 階地下 1 階 研究棟 熱源機械棟 計算機棟 研究棟 計算機棟 延床面積 約 10,500m2 建築面積 約 4,300m2 構 造 鉄骨造 地上 3 階地下 1 階 計算機棟 特高施設 居室居室 計算機室 50m 60mの無柱の大空間計算機筐体 居室 空調機械室 居室 空調機 居室居室 居室 計算機室グローバルファイルシステム 熱源機械棟 特別高圧電源施設 空調機械室等 空調機械室 空調機 研究棟 計算機棟の断面図 28

施設のしくみ 研究棟 地上 6 階, 地下 1 階 ( 鉄骨造り ) 建築面積 ~1,800m 2, 延床面積 ~9,000m 2 計算機棟 地上 3 階, 地下 1 階 ( 鉄骨造り ) 建築面積 ~4,300m 2, 延床面積 ~10,500m 2 50m 60m の無柱の大空間 熱源機械棟 ( 面積 1900m 2 ) 特別高圧変電施設 ( 面積 200m 2 ) 蒸気吸収式冷凍機 x4 ターボ型冷凍機 x3 CGS (5MW) x2 30MW 77,000V( 受電 ) 6,600V 29

施設の特長 地盤改良と基礎免震構造液状化に備えて地盤改良免震構造の建屋 無柱のコンピュータ室 (60m x 60m) 自由な筐体配置とケーブル配線長の短縮床加重 : 1 ton/m 2 床上げ : 1.5m ( ケーブル配線と水パイプ ) 省エネと環境への配慮コジェネ (5MW x 2) の廃熱利用雨水と冷却用水の再利用屋上に太陽光パネル ( 約 50KW) 屋上緑化消音効果を高める建屋形状 30

システム設置状況 31

ご静聴ありがとうございました 32