スライド 1

Size: px

Start display at page:

Download "スライド 1"

れいなちゃわんや
4 years ago
Views:

1 計算科学が拓く世界スーパーコンピュータは何故スーパーか学術情報メディアセンター中島浩提供科目 > 計算科学が拓く世界 > 後期 #-

2 科目の概要 (/) 計算科学 : 理論 & 実験科学に続く第の科学実施困難不可能な実験を ( スーパー ) コンピュータの中で仮想的に実施 ( シミュレーション ) 観測困難不可能な空間 ( 星の内部, 原子分子レベル...) 到達困難不可能な時間 ( 過去の再現, 未来の予測...) 構築困難不可能な実験規模 ( 宇宙, 地球, 日本全土...) 科目の内容最新の計算科学の研究事例をさまざまな分野の第一線研究者がなるべく数式を使わずに紹介解説

3 科目の概要 (/) 0~0 中島浩 ACCMS 高性能システムとプログラミング中島浩 ACCMS スーパーコンピュータは何故スーパーか () 中島浩 ACCMS スーパーコンピュータは何故スーパーか () 小山田耕二 ACCMS データ分析と可視化木村欣司情数理 ( 偏 ) 微分方程式の差分解析 05~08 牛島省 ACCMS 応用計算力学 09~ 大村善治生存圏研地球惑星宇宙と計算科学 ~ 佐藤彰洋情報学計算経済学

4 講義の概要目的計算科学に不可欠の道具スーパーコンピュータがどうスーパーなのかどういうものかなぜスーパーなのかどう使うとスーパーなのかについて雰囲気をつかむ内容スーパーコンピュータの歴史を概観しつつスーパーである基本原理を知りどういう計算が得意であるかを学んでそれについてレポートを書く

5 どのぐらいスーパー? (/) はの 7 万倍も高速速さの単位 FLOPS ( フロップス ) FLotig-poit Opertios Per Secod 浮動小数点演算毎秒秒間に実行可能な浮動小数点数の加減乗算回数浮動小数点数 0-08 ~0 08 の実数を近似的に (0 進 6 桁精度 ) 表現したもの (m/s), (kg).5 P( ペタ 0 5 )FLOPS (.5 ) 67. G( ギガ 0 9 ) FLOPS (67 億 ) 67,86 5

6 どのぐらいスーパー? (/) 7 万とは話が違う同じ土俵で比べるなら N700 系 : 00km/h 人 96,900 人 km/h B : 880km/h 70 人 7,600 人 km/h.67 ( 倍も新幹線は飛行機より高速 ) 80 万倍を細かく見ると :.0GHz8888,8 :.GHz6,797,0 Core i7-600u ここがスーパー 6

7 スーパーコンピュータ ( スパコン ) とは (/) パソコンの数千倍 ~ 数万倍の規模性能を持つ巨大な超高速コンピュータ世界最大最高速マシンパソコン 87 万京大スーパーコンピュータパソコン万パソコンでヶ月かかる計算. 秒 ~ 秒 ( ただしスパコン向きの問題をうまくプログラムしたら ) スパコンが高速な理由個々の部品 (CPU, メモリなど ) パソコン非常に多数のパソコン ( のようなもの ) の集合体パソコン ~6 CPU 京大スパコン 87,89 CPU 世界最高速スパコン 0,69,600 CPU 世界最大規模スパコン 0,69,600 CPU 7

8 スーパーコンピュータ ( スパコン ) とは (/) スパコンが得意な計算大量 CPU による分担計算超大量のデータを対象とする計算地球全体の気象気候海洋現象の予測 km あたりデータデータ数 5 億 ( 高さ方向 ) 生体物質化学物質材料の解析膨大な分子原子数 (e.g. 水 ml. 兆 00 億 ) 自動車の空力衝突解析 mm or cm あたりデータデータ数 ~0 億 We 文書の解析 ( 自動翻訳用データ作成など ) 文書数数 000 億 ~ 数兆 8

9 スーパーにする方法リフトの輸送能力コンピュータの速度ーー 9

10 スーパーにする方法 :~970 移動速度周波数移動速度危ない機械力学的に無理周波数特に危なくはない電子工学的に無理ではない? ーー 0

11 スーパーにする方法 : 周波数の歴史 0G PIV Core i G PII PIII 00M P 熱密度が高すぎて (> 電磁調理器 ) 周波数頭打ちに 0M 86 86/ 86.5 倍 / 年で伸びてきたが M

12 ちょっと話を変えて : スーパーコンピュータの歴史そもそもの始まり : ベクトルマシン () 976 年 : 最初のスパコン Cry- 登場動作周波数 80MHz (< 携帯電話 ) 演算性能 60MFlops (< 携帯電話 ) 消費電力 5kW 大量の数値データ ( ベクトル ) に対する同種演算が得意 976 年 ( 中島 0 歳 ) でのスーパー度京大 ( 富士通 F0-75) < 5MFlops 京大情報工学科 ( 日立 H850) < MFlops Itel 8086/87(978/80) 50KFlops

13 スーパーコンピュータの歴史そもそもの始まり : ベクトルマシン ().98m.7m.7m source:

14 少し話を戻してスーパーにする方法 :970~ 搬器数 ( 命令 / 演算 ) パイプラインーー zy ( 加算命令 ) の手順命令を取ってくる加算だと判ると y を取ってくる加算をする結果を z に入れるこれをつずつずらして行うー

15 スーパーにする方法 : ベクトル計算の原理 () 大量数値データの同種演算を高速に行う方法例 : z i i y i (i,,...) つの乗算をいくつか ( たとえばつ ) の小さい操作に分ける z i i y i 多数の乗算を小操作ずつずらして行う z y z y z y z y 倍の速度で計算できる ( ように見える ) ( 演算 ) パイプライン処理 5

16 スーパーにする方法 : ベクトル計算の原理 () 乗算を分割してずらす考え方 ( たとえ話真実 ) X

17 スーパーコンピュータの歴史 ( に戻って ) もう一つの方法 : 並列マシン 980 年代 : スカラーマルチプロセッサ台頭多数のパソコン ( のようなもの ) の集合体 Sequet Blce : 0 NS06 ( 8) Itel ipsc/: 8 i8086 ( 85) 共有メモリ (SM) メモリ分散メモリ (DM) 結合網キャッシュプロセッサ共有 & 分散メモリ階層型 7

18 また話を戻してスーパーにする方法 :990~ 座席数スーパースカラー /SIMD GHz88888 加減算をつと乗算をつが同時にできる同時にできる演算って? ーー 8

19 スーパーにする方法 : 並列演算元連立一次方程式 9 8 z y z y z y 9 8 z y z y z y z y z y z y z y y z z z 同時にできる除 ( 乗 ) 算同時にできる加減算 9

20 スーパーにする方法 :000~ (980~) リフト数マルチコア / 共有メモリ並列マシン並列演算 GHz88888 並列計算ーー 0

21 スーパーにする方法 : のプロセッサ SPARC 6 VIIIf DDR 8GB DDR Iterfce Core5 Core MAC MAC Core L$ Dt L$ Cotrol Core7 Core6 MAC MAC Core DDR Iterfce DDR 8GB 共有メモリ 6GB L: 6MB Core0 L$ Dt Core L KB CPU コア

22 スーパーにする方法京大スパコンのプロセッサ (/) Cmphor Xeo Phi 750 (Kights Ldig) L L KB 8 MB KB 8 6GB 96GB

23 スーパーにする方法京大スパコンのプロセッサ (/) Lurel L: 5MB Xeo E5-695 v (Brodwell) L: 5MB 6GB 6GB L 56KB Cimo L: 0MB Xeo E v (Hswell) L: 0MB L KB 8 L L 56KB KB 8 768GB 768GB L: 0MB L: 0MB 768GB 768GB

24 スーパーにする方法 : 連立方程式の並列計算 j i ij ij j j / / 行目担当のコアが書いて i 行目担当のコアが読む

25 スーパーにする方法 :980~ リフト数超並列コンピューターーーーーーーーーーーー GHz 共有メモリ分散メモリ 5

26 スーパーにする方法 : の全体像 70 6 冷蔵庫 60l ,8 6 (60m) 8860 京計算機室 60m 50m 京大体育館 56m 5m (50m) 6

27 スーパーにする方法 : の通信路 (/) 6 次元メッシュ / トーラス結合網 Tofu って意味不明 ~ 次元メッシュ次元トーラス ( ドーナツの表面 ) 7

28 スーパーにする方法 : の通信路 (/) 6 次元メッシュ / トーラス結合網 Tofu z6 ( トーラス ) ( トーラス ) 8(6) 88,8 8

29 スーパーにする方法京大スパコンの全体像 (/) Cmphor XC0 (6 ー )

30 スーパーにする方法京大スパコンの全体像 (/) Lurel CS00 80XT 7 ー 850 0

31 スーパーにする方法京大スパコンの全体像 (/) Cimo CS00 80X

32 スーパーにする方法 : 連立方程式の並列計算 j i ij ij j j / / 行目担当のプロセッサから全てのプロセッサへ通信 ( 放送 )

33 スーパーコンピュータの歴史 ( にまた戻って ) ベクトル vs 並列 990 年代 : ベクトル並列 vs スカラー並列 TOP mchie #proc Rm Rpek TMC CM TMC CM TMC CM TMC CM NEC SX NEC SX TMC CM Itel Delt Cry Y-MP Cry Y-MP 巨大で (>00 万元 ) 密な連立一次方程式の求解性能に基づく世界中のスパコン順位表 99.6 から毎年回発表 (6 月 & 月 ) Rm: 求解性能 Rpek: 理論最大性能 ( 単位 GFlops: 毎秒 0 億演算 )

#CPU ; GFLOPS 0 8 0 7 0 6 0 5 0 0 CM5 XP/S0 スーパーコンピュータの歴史 Top of ベクトルマシンスカラーマシン SR0 CP-PACS

Tit XE6 GB8K Tihe XC0 XE6 GB8K TihuLight XC0 CS00 XC0 Ter0 0 0 NWT VPP500,558,000/ 年.

34 #CPU ; GFLOPS CM5 XP/S0 スーパーコンピュータの歴史 Top of ベクトルマシンスカラーマシン SR0 CP-PACS Pet0 5 ASCI-R ASCI-W VPP800 Rpek ES Rm Rodruer BGL HPC500 HX600 M9000 #CPU Jgur Tihe K BGQ Tit XE6 GB8K Tihe XC0 XE6 GB8K TihuLight XC0 CS00 XC0 Ter0 0 0 NWT VPP500,558,000/ 年.8/ 年 >Moore の法則 (.58) source:

35 スーパーコンピュータの原理 ( いきなり & とりあえず ) まとめベクトルマシンつの演算を k 個の小さい操作に分割する多数の同種演算を小操作ずつずらして行う k 倍の速度で計算できる ( ように見える ) 大量 ( k) の同種演算が得意並列マシン多数の同じ ( ような ) 演算を p 個のCPUに分割それぞれのCPUが割当てられた計算をする p 倍の速度で計算できる ( ように見える ) 大量 ( p) の同じ ( ような ) 演算が得意スパコンは大量の同じ ( ような ) 演算 ( や処理 ) が得意 5

36 スーパーコンピュータの原理大量同種演算は何でも得意か? (/) 超得意 z i i y i 普通に得意 z i ( i i i ) / 微妙に得意 z 何とかなる z i f(i) s.t. z z z 全然ダメ z f(,0), z i f( i,z i ) 6

37 スーパーコンピュータの原理大量同種演算は何でも得意か? (/) 京大スパコン (Cmphor ) の通信速度.05TFlops.05TFlops μsec 8.TB/sec7Tit/secGit/sec7,000 個の数値 (8B) の通信時間 μsec,050,000 個分の演算時間 0 億個の数値 (8GB) の通信時間 0.5 秒 5,9 億個分の演算時間 5.75GB/sec 6Git/sec Git/sec6 では 00 万 7

38 まとめ & 課題スーパーコンピュータは... 大量の同じ ( ような ) 演算 ( や処理 ) が得意ただし演算どうしの依存性が少ないことが必要そんな都合のよい問題はあるのか? そこでレポート課題 ( できればスパコンに適する大規模な ) 並列計算により高い性能が期待できる実際的な問題を一つ挙げなぜその問題が並列計算に適するのかを説明せよ 8

スライド 1

スライド 1 計算科学が拓く世界スーパーコンピュータは何故スーパーか学術情報メディアセンター中島浩 http://www.pr.medi.kyoto-u.c.jp/jp/ usermesuper psswordcomputer 講義の概要目的計算科学に不可欠の道具スーパーコンピュータがどうスーパーなのかどういうものかなぜスーパーなのかどう使うとスーパーなのかについて雰囲気をつかむ内容スーパーコンピュータの歴史を概観しつつ