スライド 1

Size: px
Start display at page:

Download "スライド 1"

Transcription

1 計算科学が拓く世界 スーパーコンピュータは何故スーパーか 学術情報メディアセンター中島浩 提供科目 > 計算科学が拓く世界 > 後期 #-

2 科目の概要 (/) 計算科学 : 理論 & 実験科学に続く第 の科学 実施困難 不可能な実験を ( スーパー ) コンピュータの中で仮想的に実施 ( シミュレーション ) 観測困難 不可能な空間 ( 星の内部, 原子 分子レベル...) 到達困難 不可能な時間 ( 過去の再現, 未来の予測...) 構築困難 不可能な実験規模 ( 宇宙, 地球, 日本全土...) 科目の内容 最新の計算科学の研究事例を さまざまな分野の第一線研究者が なるべく数式を使わずに紹介 解説

3 科目の概要 (/) 0~0 中島浩 ACCMS 高性能システムとプログラミング 中島浩 ACCMS スーパーコンピュータは何故スーパーか () 中島浩 ACCMS スーパーコンピュータは何故スーパーか () 小山田耕二 ACCMS データ分析と可視化 木村欣司 情 数理 ( 偏 ) 微分方程式の差分解析 05~08 牛島省 ACCMS 応用計算力学 09~ 大村善治 生存圏研 地球 惑星 宇宙と計算科学 ~ 佐藤彰洋 情報学 計算経済学

4 講義の概要 目的 計算科学に不可欠の道具スーパーコンピュータが どうスーパーなのか どういうものか なぜスーパーなのか どう使うとスーパーなのかについて雰囲気をつかむ 内容 スーパーコンピュータの歴史を概観しつつ スーパーである基本原理を知り どういう計算が得意であるかを学んで それについてレポートを書く

5 どのぐらいスーパー? (/) はの 7 万倍も高速 速さの単位 FLOPS ( フロップス ) FLotig-poit Opertios Per Secod 浮動小数点演算毎秒 秒間に実行可能な浮動小数点数の加減乗算回数 浮動小数点数 0-08 ~0 08 の実数を近似的に (0 進 6 桁精度 ) 表現したもの (m/s), (kg).5 P( ペタ 0 5 )FLOPS (.5 ) 67. G( ギガ 0 9 ) FLOPS (67 億 ) 67,86 5

6 どのぐらいスーパー? (/) 7 万と は話が違う 同じ土俵で比べるなら N700 系 : 00km/h 人 96,900 人 km/h B : 880km/h 70 人 7,600 人 km/h.67 ( 倍も新幹線は飛行機より高速 ) 80 万倍を細かく見ると :.0GHz8888,8 :.GHz6,797,0 Core i7-600u ここがスーパー 6

7 スーパーコンピュータ ( スパコン ) とは (/) パソコンの数千倍 ~ 数万倍の規模 性能を持つ 巨大な超高速コンピュータ 世界最大 最高速マシン パソコン 87 万 京大スーパーコンピュータ パソコン 万 パソコンでヶ月かかる計算. 秒 ~ 秒 ( ただしスパコン向きの問題をうまくプログラムしたら ) スパコンが高速な理由 個々の部品 (CPU, メモリなど ) パソコン 非常に多数のパソコン ( のようなもの ) の集合体 パソコン ~6 CPU 京大スパコン 87,89 CPU 世界最高速スパコン 0,69,600 CPU 世界最大規模スパコン 0,69,600 CPU 7

8 スーパーコンピュータ ( スパコン ) とは (/) スパコンが得意な計算 大量 CPU による分担計算 超大量のデータを対象とする計算 地球全体の気象 気候 海洋現象の予測 km あたり データ データ数 5 億 ( 高さ方向 ) 生体物質 化学物質 材料の解析 膨大な分子 原子数 (e.g. 水 ml. 兆 00 億 ) 自動車の空力 衝突解析 mm or cm あたり データ データ数 ~0 億 We 文書の解析 ( 自動翻訳用データ作成など ) 文書数 数 000 億 ~ 数兆 8

9 スーパーにする方法 リフトの輸送能力 コンピュータの速度 ー ー 9

10 スーパーにする方法 :~970 移動速度 周波数 移動速度 危ない 機械力学的に無理 周波数 特に危なくはない 電子工学的に無理ではない? ー ー 0

11 スーパーにする方法 : 周波数 の歴史 0G PIV Core i G PII PIII 00M P 熱密度が高すぎて (> 電磁調理器 ) 周波数 頭打ちに 0M 86 86/ 86.5 倍 / 年で伸びてきたが M

12 ちょっと話を変えて : スーパーコンピュータの歴史 そもそもの始まり : ベクトルマシン () 976 年 : 最初のスパコン Cry- 登場 動作周波数 80MHz (< 携帯電話 ) 演算性能 60MFlops (< 携帯電話 ) 消費電力 5kW 大量の数値データ ( ベクトル ) に対する同種演算が得意 976 年 ( 中島 0 歳 ) での スーパー 度 京大 ( 富士通 F0-75) < 5MFlops 京大情報工学科 ( 日立 H850) < MFlops Itel 8086/87(978/80) 50KFlops

13 スーパーコンピュータの歴史そもそもの始まり : ベクトルマシン ().98m.7m.7m source:

14 少し話を戻してスーパーにする方法 :970~ 搬器数 ( 命令 / 演算 ) パイプライン ー ー zy ( 加算命令 ) の手順 命令を取ってくる 加算だと判る と y を取ってくる 加算をする 結果を z に入れる これを つずつずらして行う ー

15 スーパーにする方法 : ベクトル計算の原理 () 大量数値データの同種演算を高速に行う方法 例 : z i i y i (i,,...) つの乗算をいくつか ( たとえば つ ) の小さい操作に分ける z i i y i 多数の乗算を 小操作ずつずらして行う z y z y z y z y 倍の速度で計算できる ( ように見える ) ( 演算 ) パイプライン処理 5

16 スーパーにする方法 : ベクトル計算の原理 () 乗算を 分割してずらす考え方 ( たとえ話 真実 ) X

17 スーパーコンピュータの歴史 ( に戻って ) もう一つの方法 : 並列マシン 980 年代 : スカラーマルチプロセッサ台頭 多数のパソコン ( のようなもの ) の集合体 Sequet Blce : 0 NS06 ( 8) Itel ipsc/: 8 i8086 ( 85) 共有メモリ (SM) メモリ 分散メモリ (DM) 結合網 キャッシュ プロセッサ 共有 & 分散メモリ階層型 7

18 また話を戻してスーパーにする方法 :990~ 座席数 スーパースカラー /SIMD GHz88888 加減算を つと 乗算を つが 同時にできる 同時にできる演算って? ー ー 8

19 スーパーにする方法 : 並列演算 元連立一次方程式 9 8 z y z y z y 9 8 z y z y z y z y z y z y z y y z z z 同時にできる除 ( 乗 ) 算同時にできる加減算 9

20 スーパーにする方法 :000~ (980~) リフト数 マルチコア / 共有メモリ並列マシン 並列演算 GHz88888 並列計算 ー ー 0

21 スーパーにする方法 : のプロセッサ SPARC 6 VIIIf DDR 8GB DDR Iterfce Core5 Core MAC MAC Core L$ Dt L$ Cotrol Core7 Core6 MAC MAC Core DDR Iterfce DDR 8GB 共有メモリ 6GB L: 6MB Core0 L$ Dt Core L KB CPU コア

22 スーパーにする方法京大スパコンのプロセッサ (/) Cmphor Xeo Phi 750 (Kights Ldig) L L KB 8 MB KB 8 6GB 96GB

23 スーパーにする方法京大スパコンのプロセッサ (/) Lurel L: 5MB Xeo E5-695 v (Brodwell) L: 5MB 6GB 6GB L 56KB Cimo L: 0MB Xeo E v (Hswell) L: 0MB L KB 8 L L 56KB KB 8 768GB 768GB L: 0MB L: 0MB 768GB 768GB

24 スーパーにする方法 : 連立方程式の並列計算 j i ij ij j j / / 行目担当のコアが書いて i 行目担当のコアが読む

25 スーパーにする方法 :980~ リフト数 超並列コンピュータ ー ー ー ー ー ー ー ー ー ー ー ー GHz 共有メモリ分散メモリ 5

26 スーパーにする方法 : の全体像 70 6 冷蔵庫 60l ,8 6 (60m) 8860 京計算機室 60m 50m 京大体育館 56m 5m (50m) 6

27 スーパーにする方法 : の通信路 (/) 6 次元メッシュ / トーラス結合網 Tofu って意味不明 ~ 次元メッシュ 次元トーラス ( ドーナツの表面 ) 7

28 スーパーにする方法 : の通信路 (/) 6 次元メッシュ / トーラス結合網 Tofu z6 ( トーラス ) ( トーラス ) 8(6) 88,8 8

29 スーパーにする方法京大スパコンの全体像 (/) Cmphor XC0 (6 ー )

30 スーパーにする方法京大スパコンの全体像 (/) Lurel CS00 80XT 7 ー 850 0

31 スーパーにする方法京大スパコンの全体像 (/) Cimo CS00 80X

32 スーパーにする方法 : 連立方程式の並列計算 j i ij ij j j / / 行目担当のプロセッサから全てのプロセッサへ通信 ( 放送 )

33 スーパーコンピュータの歴史 ( にまた戻って ) ベクトル vs 並列 990 年代 : ベクトル並列 vs スカラー並列 TOP mchie #proc Rm Rpek TMC CM TMC CM TMC CM TMC CM NEC SX NEC SX TMC CM Itel Delt Cry Y-MP Cry Y-MP 巨大で (>00 万元 ) 密な連立一次方程式の求解性能に基づく世界中のスパコン順位表 99.6 から毎年 回発表 (6 月 & 月 ) Rm: 求解性能 Rpek: 理論最大性能 ( 単位 GFlops: 毎秒 0 億演算 )

34 #CPU ; GFLOPS CM5 XP/S0 スーパーコンピュータの歴史 Top of ベクトルマシンスカラーマシン SR0 CP-PACS Pet0 5 ASCI-R ASCI-W VPP800 Rpek ES Rm Rodruer BGL HPC500 HX600 M9000 #CPU Jgur Tihe K BGQ Tit XE6 GB8K Tihe XC0 XE6 GB8K TihuLight XC0 CS00 XC0 Ter0 0 0 NWT VPP500,558,000/ 年.8/ 年 >Moore の法則 (.58) source:

35 スーパーコンピュータの原理 ( いきなり & とりあえず ) まとめ ベクトルマシン つの演算を k 個の小さい操作に分割する 多数の同種演算を 小操作ずつずらして行う k 倍の速度で計算できる ( ように見える ) 大量 ( k) の同種演算が得意 並列マシン 多数の同じ ( ような ) 演算を p 個のCPUに分割 それぞれのCPUが割当てられた計算をする p 倍の速度で計算できる ( ように見える ) 大量 ( p) の同じ ( ような ) 演算が得意 スパコンは大量の同じ ( ような ) 演算 ( や処理 ) が得意 5

36 スーパーコンピュータの原理大量同種演算は何でも得意か? (/) 超得意 z i i y i 普通に得意 z i ( i i i ) / 微妙に得意 z 何とかなる z i f(i) s.t. z z z 全然ダメ z f(,0), z i f( i,z i ) 6

37 スーパーコンピュータの原理大量同種演算は何でも得意か? (/) 京大スパコン (Cmphor ) の通信速度.05TFlops.05TFlops μsec 8.TB/sec7Tit/secGit/sec7,000 個の数値 (8B) の通信時間 μsec,050,000 個分の演算時間 0 億個の数値 (8GB) の通信時間 0.5 秒 5,9 億個分の演算時間 5.75GB/sec 6Git/sec Git/sec6 では 00 万 7

38 まとめ & 課題 スーパーコンピュータは... 大量の同じ ( ような ) 演算 ( や処理 ) が得意 ただし演算どうしの依存性が少ないことが必要 そんな都合のよい問題はあるのか? そこでレポート課題 ( できればスパコンに適する大規模な ) 並列計算により高い性能が期待できる実際的な問題を一つ挙げ なぜその問題が並列計算に適するのかを説明せよ 8

スライド 1

スライド 1 計算科学が拓く世界 スーパーコンピュータは 何故スーパーか 学術情報メディアセンター 中島浩 http://www.pr.medi.kyoto-u.c.jp/jp/ usermesuper psswordcomputer 講義の概要 目的 計算科学に不可欠の道具スーパーコンピュータが どうスーパーなのか どういうものか なぜスーパーなのか どう使うとスーパーなのかについて雰囲気をつかむ 内容 スーパーコンピュータの歴史を概観しつつ

More information

スライド 1

スライド 1 計算科学が拓く世界スーパーコンピュータは何故スーパーか 学術情報メディアセンター中島浩 http://www.para.media.kyoto-u.ac.jp/jp/ username=super password=computer 講義の概要 目的 計算科学に不可欠の道具スーパーコンピュータが どういうものか なぜスーパーなのか どう使うとスーパーなのかについて雰囲気をつかむ 内容 スーパーコンピュータの歴史を概観しつつ

More information

スライド 1

スライド 1 計算科学演習 スーパーコンピュータ & 並列計算 概論 学術情報メディアセンター 情報学研究科 システム科学専攻 中島浩 目次 科目概要 目標 スケジュール スタッフ 講義資料 課題 スーパーコンピュータ概論 一般のスーパーコンピュータ 京大のスーパーコンピュータ スーパーコンピュータの構造 並列計算概論 並列計算の類型 条件 Scaling & Scalability 問題分割 落し穴 プロセス並列

More information

スライド 1

スライド 1 目次 計算科学演習スーパーコンピュータ & 並列計算概論 学術情報メディアセンター情報学研究科 システム科学専攻中島浩 科目概要 目標 スケジュール スタッフ 講義資料 課題 スーパーコンピュータ概論 一般のスーパーコンピュータ 京大のスーパーコンピュータ スーパーコンピュータの構造 並列計算概論 並列計算の類型 条件 Scalng & Scalablty 問題分割 落し穴 プロセス並列 & スレッド並列

More information

<4D F736F F D B B B835E895E97708A4A8E6E82C A98418C6782CC8E6E93AE2E646F63>

<4D F736F F D B B B835E895E97708A4A8E6E82C A98418C6782CC8E6E93AE2E646F63> 京都大学学術情報メディアセンター 新スーパーコンピュータ運用開始と T2K 連携の始動 アピールポイント 61.2 テラフロップスの京大版 T2K オープンスパコン運用開始 東大 筑波大との T2K 連携による計算科学 工学分野におけるネットワーク型研究推進 人材育成 アプリケーション高度化支援の活動を開始概要国立大学法人京都大学 ( 総長 尾池和夫 ) 学術情報メディアセンター ( センター長 美濃導彦

More information

openmp1_Yaguchi_version_170530

openmp1_Yaguchi_version_170530 並列計算とは /OpenMP の初歩 (1) 今 の内容 なぜ並列計算が必要か? スーパーコンピュータの性能動向 1ExaFLOPS 次世代スハ コン 京 1PFLOPS 性能 1TFLOPS 1GFLOPS スカラー機ベクトル機ベクトル並列機並列機 X-MP ncube2 CRAY-1 S-810 SR8000 VPP500 CM-5 ASCI-5 ASCI-4 S3800 T3E-900 SR2201

More information

<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074>

<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074> 発表の流れ SSE を用いた反復解法ライブラリ Lis 4 倍精度版の高速化 小武守恒 (JST 東京大学 ) 藤井昭宏 ( 工学院大学 ) 長谷川秀彦 ( 筑波大学 ) 西田晃 ( 中央大学 JST) はじめに 4 倍精度演算について Lisへの実装 SSEによる高速化 性能評価 スピード 収束 まとめ はじめに クリロフ部分空間法たとえば CG 法は, 理論的には高々 n 回 (n は係数行列の次元数

More information

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc 2.3. アプリ性能 2.3.1. Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア

More information

Microsoft PowerPoint - 1章 [互換モード]

Microsoft PowerPoint - 1章 [互換モード] 1. 直線運動 キーワード 速さ ( 等速直線運動, 変位 ) 加速度 ( 等加速度直線運動 ) 重力加速度 ( 自由落下 ) 力学 I 内容 1. 直線運動 2. ベクトル 3. 平面運動 4. 運動の法則 5. 摩擦力と抵抗 6. 振動 7. 仕事とエネルギー 8. 運動量と力積, 衝突 9. 角運動量 3 章以降は, 運動の向きを考えなければならない 1. 直線運動 キーワード 速さ ( 等速直線運動,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション みんなの ベクトル計算 たけおか @takeoka PC クラスタ コンソーシアム理事でもある 2011/FEB/20 ベクトル計算が新しい と 2008 年末に言いました Intelに入ってる! (2008 年から見た 近未来? ) GPU 計算が新しい (2008 年当時 ) Intel AVX (Advanced Vector Extension) SIMD 命令を進めて ベクトル機構をつける

More information

supercomputer2010.ppt

supercomputer2010.ppt nanri@cc.kyushu-u.ac.jp 1 !! : 11 12! : nanri@cc.kyushu-u.ac.jp! : Word 2 ! PC GPU) 1997 7 http://wiredvision.jp/news/200806/2008062322.html 3 !! (Cell, GPU )! 4 ! etc...! 5 !! etc. 6 !! 20km 40 km ) 340km

More information

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8 Web キャンパス資料 超音波シミュレーションの基礎 ~ 第 4 回 ComWAVEによる超高速超音波解析 ~ 科学システム開発部 Copyright (c)2006 ITOCHU Techno-Solutions Corporation 本日の説明内容 ComWAVEの概要および特徴 GPGPUとは GPGPUによる解析事例 CAE POWER 超音波研究会開催 (10 月 3 日 ) のご紹介

More information

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始 2014 年 1 月 31 日 国立大学法人九州大学 株式会社日立製作所 九州大学がスーパーコンピュータ 高性能アプリケーションサーバシステム の本格稼働を開始 日立のテクニカルサーバ HA8000-tc/HT210 などを採用 従来システム比で 約 28 倍の性能を実現し 1TFLOPS あたりの消費電力は約 17 分の 1 に低減 九州大学情報基盤研究開発センター ( センター長 : 青柳睦 /

More information

本文ALL.indd

本文ALL.indd Intel Xeon プロセッサにおける Cache Coherency 時間の性能測定方法河辺峻田口成美古谷英祐 Intel Xeon プロセッサにおける Cache Coherency 時間の性能測定方法 Performance Measurement Method of Cache Coherency Effects on an Intel Xeon Processor System 河辺峻田口成美古谷英祐

More information

音声読み上げブラウザの読み上げかた

音声読み上げブラウザの読み上げかた IBM 3.01, 1,234 1 HTML 2 1+1 1+1= 1 1 1 1= 1 1 1 1= 1X1 3 2004 11 14 10 2004 11 14 2004-11-14 2004/11/14 11/14 10:00 10:00am am pm a.m.p.m. 4 10 5 1 1 1 10 1 100 10 1 10 10 113 10 1 5 6 23 5372 0859 23

More information

行列、ベクトル

行列、ベクトル 行列 (Mtri) と行列式 (Determinnt). 行列 (Mtri) の演算. 和 差 積.. 行列とは.. 行列の和差 ( 加減算 ).. 行列の積 ( 乗算 ). 転置行列 対称行列 正方行列. 単位行列. 行列式 (Determinnt) と逆行列. 行列式. 逆行列. 多元一次連立方程式のコンピュータによる解法. コンピュータによる逆行列の計算.. 定数項の異なる複数の方程式.. 逆行列の計算

More information

Microsoft Word - koubo-H26.doc

Microsoft Word - koubo-H26.doc 平成 26 年度学際共同利用プログラム 計算基礎科学プロジェクト 公募要項 - 計算基礎科学連携拠点 ( 筑波大学 高エネルギー加速器研究機構 国立天文台 ) では スーパーコンピュータの学際共同利用プログラム 計算基礎科学プロジェクト を平成 22 年度から実施しております 平成 23 年度からは HPCI 戦略プログラム 分野 5 物質と宇宙の起源と構造 の協力機関である京都大学基礎物理学研究所

More information

計算機アーキテクチャ

計算機アーキテクチャ 計算機アーキテクチャ 第 11 回命令実行の流れ 2014 年 6 月 20 日 電気情報工学科 田島孝治 1 授業スケジュール ( 前期 ) 2 回日付タイトル 1 4/7 コンピュータ技術の歴史と コンピュータアーキテクチャ 2 4/14 ノイマン型コンピュータ 3 4/21 コンピュータのハードウェア 4 4/28 数と文字の表現 5 5/12 固定小数点数と浮動小数点表現 6 5/19 計算アーキテクチャ

More information

スライド 1

スライド 1 本日 (4/25) の内容 1 並列計算の概要 並列化計算の目的 並列コンピュータ環境 並列プログラミングの方法 MPI を用いた並列プログラミング 並列化効率 2 並列計算の実行方法 Hello world モンテカルロ法による円周率計算 並列計算のはじまり 並列計算の最初の構想を イギリスの科学者リチャードソンが 1922 年に発表 < リチャードソンの夢 > 64000 人を円形の劇場に集めて

More information

FX10利用準備

FX10利用準備 π-computer(fx10) 利用準備 2018 年 3 月 14 日理化学研究所計算科学研究機構八木学 1 KOBE HPC Spring School 2018 2018/3/14 内容 本スクールの実習で利用するスーパーコンピュータ神戸大学 π-computer (FX10) について システム概要 ログイン準備 2 神戸大学 π-computer: システム概要 富士通 PRIMEHPC

More information

羽藤.pptx

羽藤.pptx 11 / / @ hato0816@gmail.com A 1928 / 1958OD 1960 1967PT " /() 土木計画 ( 主に交通計画 ) のための観測と理論 1960s PT 調査 紙調査票回答, ゾーン単位, 集計モデル ( 四段階推定法 ) (1955 CATS, 1967 広島都市圏など ) 計算機性能の向上 1980s Activity based model 非集計モデル

More information

Microsoft PowerPoint - CCS学際共同boku-08b.ppt

Microsoft PowerPoint - CCS学際共同boku-08b.ppt マルチコア / マルチソケットノードに おけるメモリ性能のインパクト 研究代表者朴泰祐筑波大学システム情報工学研究科 taisuke@cs.tsukuba.ac.jp アウトライン 近年の高性能 PC クラスタの傾向と問題 multi-core/multi-socket ノードとメモリ性能 メモリバンド幅に着目した性能測定 multi-link network 性能評価 まとめ 近年の高性能 PC

More information

about MPI

about MPI 本日 (4/16) の内容 1 並列計算の概要 並列化計算の目的 並列コンピュータ環境 並列プログラミングの方法 MPI を用いた並列プログラミング 並列化効率 2 並列計算の実行方法 Hello world モンテカルロ法による円周率計算 並列計算のはじまり 並列計算の最初の構想を イギリスの科学者リチャードソンが 1922 年に発表 < リチャードソンの夢 > 64000 人を円形の劇場に集めて

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 音響解析プログラム WAON 最新開発動向と適用例のご紹介 サイバネットシステム株式会社 メカニカル CAE 事業部 WAON 推進室 アジェンダ 1. 会社紹介 2. WAON とは? 3. なぜ WAON なのか? 4. 各種適用例のご紹介 5. 最新開発動向 2 1. 会社紹介サイバネットシステム ( 株 ) メカニカル CAE 事業部 音響 構造 熱 電磁場 熱流体 衝突 板成形 樹脂流動などの各種解析

More information

Microsoft Word - HOKUSAI_system_overview_ja.docx

Microsoft Word - HOKUSAI_system_overview_ja.docx HOKUSAI システムの概要 1.1 システム構成 HOKUSAI システムは 超並列演算システム (GWMPC BWMPC) アプリケーション演算サーバ群 ( 大容量メモリ演算サーバ GPU 演算サーバ ) と システムの利用入口となるフロントエンドサーバ 用途の異なる 2 つのストレージ ( オンライン ストレージ 階層型ストレージ ) から構成されるシステムです 図 0-1 システム構成図

More information

(速報) Xeon E 系モデル 新プロセッサ性能について

(速報) Xeon E 系モデル 新プロセッサ性能について ( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690

More information

4.7講義.key

4.7講義.key スーパーコンピュータとアプリケーションの性能 2016 年 4 月 国立研究開発法人理化学研究所 計算科学研究機構 運用技術部門 ソフトウェア技術チーム チームヘッド 南 一生 minami_kaz@riken.jp RIKEN ADVANCED INSTITUTE FOR COMPUTATIONAL SCIENCE 講義の概要 スーパーコンピュータとアプリケーションの性能 アプリケーションの性能最適化

More information

高性能計算研究室の紹介 High Performance Computing Lab.

高性能計算研究室の紹介 High Performance Computing Lab. 高性能計算研究室 (HPC Lab) の紹介 High Performance Computing Lab. 静岡理工科大学総合情報学部コンピュータシステム学科 ( 兼 Web デザイン特別プログラム ) 幸谷智紀 543 研究室 幸谷研究室 @ 静岡 検索 概要 1. 幸谷智紀 個人の研究テーマ 2. 3 年生ゼミ ( 情報セミナー II) 3. 卒研テーマ 4. 過去の卒研 5. 今後について

More information

平成9年度水道事業年報 1概況 2施設

平成9年度水道事業年報 1概況 2施設 () (mm) 12 3 31 12 3 31 4 5 6 7 8 9 10 11 12 1 2 3 145,085 146,117 146,352 146,409 146,605 146,685 146,807 147,014 147,002 147,277

More information

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ K20 GPU2 個に対するスピードアップ NVIDIA は Fermi アーキテクチャ GPU の発表により パフォーマンス エネルギー効率の両面で飛躍的な性能向上を実現し ハイパフォーマンスコンピューティング (HPC) の世界に変革をもたらしました また 実際に GPU

More information

多次元レーザー分光で探る凝縮分子系の超高速動力学

多次元レーザー分光で探る凝縮分子系の超高速動力学 波動方程式と量子力学 谷村吉隆 京都大学理学研究科化学専攻 http:theochem.kuchem.kyoto-u.ac.jp TA: 岩元佑樹 iwamoto.y@kuchem.kyoto-u.ac.jp ベクトルと行列の作法 A 列ベクトル c = c c 行ベクトル A = [ c c c ] 転置ベクトル T A = [ c c c ] AA 内積 c AA = [ c c c ] c =

More information

処理効率

処理効率 処理効率 処理効率の改善 : 基本関数複数メモリ領域線形代数の並列処理並列ガベージコレクタ多項式演算疎な行列とベクトル Maplesoft は 新しいリリースのたびに数学計算の効率と速度の改善を追求してきました これには 頻繁にコールされるルーチンやアルゴリズムの改善だけでなく ローレベルの基礎構造の改善も含まれます Maple では 複素数を含む数値計算を高速化する新しいアル 17 ゴリズムおよび疎な行列とベクトルをより実用的に結合するためのローレベルルーチンが導入されました

More information

TopSE並行システム はじめに

TopSE並行システム はじめに はじめに 平成 23 年 9 月 1 日 トップエスイープロジェクト 磯部祥尚 ( 産業技術総合研究所 ) 2 本講座の背景と目標 背景 : マルチコア CPU やクラウドコンピューティング等 並列 / 分散処理環境が身近なものになっている 複数のプロセス ( プログラム ) を同時に実行可能 通信等により複数のプロセスが協調可能 並行システムの構築 並行システム 通信 Proc2 プロセス ( プログラム

More information

s ss s ss = ε = = s ss s (3) と表される s の要素における s s = κ = κ, =,, (4) jωε jω s は複素比誘電率に相当する物理量であり ここで PML 媒質定数を次のように定義する すなわち κξ をPML 媒質の等価比誘電率 ξ をPML 媒質の

s ss s ss = ε = = s ss s (3) と表される s の要素における s s = κ = κ, =,, (4) jωε jω s は複素比誘電率に相当する物理量であり ここで PML 媒質定数を次のように定義する すなわち κξ をPML 媒質の等価比誘電率 ξ をPML 媒質の FDTD 解析法 (Matlab 版 2 次元 PML) プログラム解説 v2.11 1. 概要 FDTD 解析における吸収境界である完全整合層 (Perfectl Matched Laer, PML) の定式化とプログラミングを2 次元 TE 波について解説する PMLは異方性の損失をもつ仮想的な物質であり 侵入して来る電磁波を逃さず吸収する 通常の物質と接する界面でインピーダンスが整合しており

More information

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料)

資料3 今後のHPC技術に関する研究開発の方向性について(日立製作所提供資料) 今後の HPC 技術に関する 研究開発の方向性について 2012 年 5 月 30 日 ( 株 ) 日立製作所情報 通信システム社 IT プラットフォーム事業本部 Hitachi, Hitachi, Ltd. Ltd. Hitachi 2012. 2012. Ltd. 2012. All rights All rights All rights reserved. reserved. reserved.

More information

Microsoft PowerPoint - sales2.ppt

Microsoft PowerPoint - sales2.ppt 最適化とは何? CPU アーキテクチャに沿った形で最適な性能を抽出できるようにする技法 ( 性能向上技法 ) コンパイラによるプログラム最適化 コンパイラメーカの技量 経験量に依存 最適化ツールによるプログラム最適化 KAP (Kuck & Associates, Inc. ) 人によるプログラム最適化 アーキテクチャのボトルネックを知ること 3 使用コンパイラによる性能の違い MFLOPS 90

More information

Microsoft PowerPoint - 11Web.pptx

Microsoft PowerPoint - 11Web.pptx 計算機システムの基礎 ( 第 10 回配布 ) 第 7 章 2 節コンピュータの性能の推移 (1) コンピュータの歴史 (2) コンピュータの性能 (3) 集積回路の進歩 (4) アーキテクチャ 第 4 章プロセッサ (1) プロセッサの基本機能 (2) プロセッサの構成回路 (3) コンピュータアーキテクチャ 第 5 章メモリアーキテクチャ 1. コンピュータの世代 計算する機械 解析機関 by

More information

チューニング講習会 初級編

チューニング講習会 初級編 GPU のしくみ RICC での使い方 およびベンチマーク 理化学研究所情報基盤センター 2013/6/27 17:00 17:30 中田真秀 RICC の GPU が高速に! ( 旧 C1060 比約 6.6 倍高速 ) RICCのGPUがC2075になりました! C1060 比 6.6 倍高速 倍精度 515GFlops UPCに100 枚導入 : 合計 51.5TFlops うまく行くと5 倍程度高速化

More information

各学科 課程 専攻別開設授業科目 ( 教職関係 ) 総合情報学科 ( 昼間コース ) 中学校教諭 1 種免許状 ( 数学 ) 高等学校教諭 1 種免許状 ( 数学 ) 代数学 線形代数学第一 2 線形代数学第二 2 離散数学 2 応用代数学 2 オペレーションズ リサーチ基礎 2 数論アルゴリズム

各学科 課程 専攻別開設授業科目 ( 教職関係 ) 総合情報学科 ( 昼間コース ) 中学校教諭 1 種免許状 ( 数学 ) 高等学校教諭 1 種免許状 ( 数学 ) 代数学 線形代数学第一 2 線形代数学第二 2 離散数学 2 応用代数学 2 オペレーションズ リサーチ基礎 2 数論アルゴリズム 免許状取得に必要な履修科目 教育職員免許法施行規則に 左に該当する本学の 履修 高等学校教諭 高等学校教諭 中学校教諭 定める修得を要する科目 開設科目及び単位数 年次 専修免許状 1 種免許状 1 種免許状 教職の意義等に関する科目教職論 2 1 年 2 単位 2 単位 2 単位 教 教育原理 2 1 年 職 に教育の基礎理論に関する科教育心理学 2 1 年 6 単位 6 単位 6 単位 関目 す

More information

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx シングルコアとマルチコア 長岡技術科学大学電気電子情報工学専攻出川智啓 今回の内容 前々回の授業の復習 CPUの進化 半導体集積率の向上 CPUの動作周波数の向上 + 複雑な処理を実行する回路を構成 ( 前々回の授業 ) マルチコア CPU への進化 均一 不均一なプロセッサ コプロセッサ, アクセラレータ 210 コンピュータの歴史 世界初のデジタルコンピュータ 1944 年ハーバードMark I

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 多倍長計算手法 平成 年度第 四半期 今回はパラメータ の設定と精度に関してまとめて記述しました ループ積分と呼ばれる数値積分計算では 質量 の光子や質量が非常に小さい事はわかっているが その値は不明なニュートリノに対して赤外発散を防ぐため微小量を与えて計算しています この設定する微少量の値により 結果の精度及び反復に要する時間が大きく作用したり 誤った値を得る事があります ここでは典型的な つのケースで説明します

More information

Microsoft PowerPoint - qcomp.ppt [互換モード]

Microsoft PowerPoint - qcomp.ppt [互換モード] 量子計算基礎 東京工業大学 河内亮周 概要 計算って何? 数理科学的に 計算 を扱うには 量子力学を計算に使おう! 量子情報とは? 量子情報に対する演算 = 量子計算 一般的な量子回路の構成方法 計算って何? 計算とは? 計算 = 入力情報から出力情報への変換 入力 計算機構 ( デジタルコンピュータ,etc ) 出力 計算とは? 計算 = 入力情報から出力情報への変換 この関数はどれくらい計算が大変か??

More information

地球シミュレータ開発の現状 平成 14 年 2 月 22 日 横川三津夫 地球シミュレータ研究開発センター 1

地球シミュレータ開発の現状 平成 14 年 2 月 22 日 横川三津夫 地球シミュレータ研究開発センター 1 地球シミュレータ開発の現状 平成 14 年 2 月 22 日 横川三津夫 地球シミュレータ研究開発センター ESRDC@JAERI 1 地球シミュレータ 計画の背景 地球規模の複雑な諸現象の理解, 予測の必要性 地球温暖化 異常気象 エルニーニョエルニーニョ,, 冷夏冷夏,, 暖冬暖冬,, 豪雨豪雨,, 豪雪豪雪,, 干ばつ干ばつ 地殻活動 地震地震,, 火山活動火山活動 大気汚染 酸性雨酸性雨,,

More information

32 100 34 51 16,300

32 100 34 51 16,300 32 100 34 51 16,300 - 7 - - 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 1 3 3 5 5 B 6 2 2 4 4 6 10 - - 8 - - - 9 - 20 80 1/3 - - 10 - 0.7 0.9kg 21 147 70-11 - - 50 10cm 50 100 30cm kg 100

More information

ComputerArchitecture.ppt

ComputerArchitecture.ppt 1 人間とコンピュータの違い コンピュータ 複雑な科学計算や膨大な量のデータの処理, さまざまな装置の制御, 通信などを定められた手順に従って間違いなく高速に実行する 人間 誰かに命令されなくても自発的に処理したり, 条件が変化しても臨機応変に対処できる 多くの問題解決を経験することで, より高度な問題解決法を考え出す 数値では表しにくい情報の処理ができる 2 コンピュータの構成要素 構成要素 ハードウェア

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 各種計算機アプリケーション性能比較 目次. はじめに. 行列積計算.QDR 積計算 4.N 体問題計算 5. 多次元積分計算 5. 次元積分計算 5. 次元積分計算 5. 4 次元積分計算 5.4 5 次元積分計算 5.5 6 次元積分計算 平成 6 年度第 四半期 . はじめに 今までと少し性質の異なるグラフィックボードが使用できる様になったので従来のアプリケーションで性能比較を実施しました 主に使用した計算機は以下のものです

More information

Itanium2ベンチマーク

Itanium2ベンチマーク HPC CPU mhori@ile.osaka-u.ac.jp Special thanks Timur Esirkepov HPC 2004 2 25 1 1. CPU 2. 3. Itanium 2 HPC 2 1 Itanium2 CPU CPU 3 ( ) Intel Itanium2 NEC SX-6 HP Alpha Server ES40 PRIMEPOWER SR8000 Intel

More information

EnSightのご紹介

EnSightのご紹介 オープン CAE シンポジウム 2014 汎用ポストプロセッサー EnSight の大規模データ対応 CEI ソフトウェア株式会社代表取締役吉川慈人 http://www.ceisoftware.co.jp/ 内容 大規模データで時間のかかる処理 クライアント サーバー機能 マルチスレッドによる並列処理 サーバーの分散処理 クライアントの分散処理 ( 分散レンダリング ) EnSightのOpenFOAMインターフェース

More information

解析力学B - 第11回: 正準変換

解析力学B - 第11回: 正準変換 解析力学 B 第 11 回 : 正準変換 神戸大 : 陰山聡 ホームページ ( 第 6 回から今回までの講義ノート ) http://tinyurl.com/kage2010 2011.01.27 正準変換 バネ問題 ( あえて下手に座標をとった ) ハミルトニアンを考える q 正準方程式は H = p2 2m + k 2 (q l 0) 2 q = H p = p m ṗ = H q = k(q

More information

<4D6963726F736F667420506F776572506F696E74202D20834B8343835F83938358815C8FEE95F183568358836583808A7793C195CA8D758B608252816932303134944E348C8E3893FA816A202D2048502E70707478>

<4D6963726F736F667420506F776572506F696E74202D20834B8343835F83938358815C8FEE95F183568358836583808A7793C195CA8D758B608252816932303134944E348C8E3893FA816A202D2048502E70707478> ガイダンス 東 京 大 学 情 報 基 盤 センター 准 教 授 片 桐 孝 洋 204 年 4 月 8 日 ( 火 )4:40-6:0 ガイダンスの 流 れ. 講 義 の 目 的 2. 講 師 紹 介 3. 講 義 日 程 の 確 認 4. 成 績 の 評 価 方 法 5. イントロダクション(30 分 ) 2 本 講 義 の 目 的 近 年 京 コンピュータに 代 表 される 世 界 トップクラスのスーパーコンピュータが

More information

スライド 1

スライド 1 知能制御システム学 画像処理の高速化 OpenCV による基礎的な例 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2007.07.03 リアルタイム処理と高速化 リアルタイム = 高速 ではない 目標となる時間制約が定められているのがリアルタイム処理である.34 ms かかった処理が 33 ms に縮んだだけでも, それによって与えられた時間制約が満たされるのであれば,

More information

修士論文

修士論文 AVX を用いた倍々精度疎行列ベクトル積の高速化 菱沼利彰 1 藤井昭宏 1 田中輝雄 1 長谷川秀彦 2 1 工学院大学 2 筑波大学 1 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算 - 4. 実験 - 倍々精度疎行列ベクトル積 - 5. まとめ 多倍長精度計算フォーラム 2 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算

More information

Microsoft PowerPoint - arc12

Microsoft PowerPoint - arc12 工学部講義 (12) 坂井 修一 東京大学大学院情報理工学系研究科電子情報学専攻東京大学工学部電子情報工学科 / 電気電子工学科 はじめに コンピュータの歴史 デバイス技術とコンピュータ はじめに 本講義の目的 の基本を学ぶ 時間 場所 火曜日 8:40-10:10 工学部 2 号館 241 ホームページ ( ダウンロード可能 ) url: http://www.mtl.t.u-tokyo.ac.jp/~sakai/hard/

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 応用数理概論 準備 端末上で cd ~/ mkdir cppwork cd cppwork wget http://271.jp/gairon/main.cpp wget http://271.jp/gairon/matrix.hpp とコマンドを記入. ls とコマンドをうち,main.cppとmatrix.hppがダウンロードされていることを確認. 1 準備 コンパイル c++ -I. -std=c++0x

More information

N08

N08 CPU のキモチ C.John 自己紹介 英語きらい 絵かけない 人の話を素直に信じない CPUにキモチなんてない お詫び 予告ではCとC# とありましたがやる気と時間の都合上 C++のみを対象とします 今日のネタ元 MSDN マガジン 2010 年 10 月号 http://msdn.microsoft.com/ja-jp/magazine/cc850829.aspx Windows と C++

More information

高性能計算研究室の紹介 High Performance Computing Lab.

高性能計算研究室の紹介 High Performance Computing Lab. 高性能計算研究室 (HPC Lab) の紹介 High Performance Computing Lab. 静岡理工科大学総合情報学部コンピュータシステム学科 ( 兼 Web デザイン特別プログラム ) 幸谷智紀 http://na-inet.jp/ 概要 1. 幸谷智紀 個人の研究テーマ 2. 3 年生ゼミ ( 情報セミナー II) 3. 卒研テーマ 4. Webデザイン特別プログラム 5. 今後について

More information

平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には,

平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には, 平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には, 直方体領域 (2m 2m 4m 程度 ) の室内音場を想定し, 音声周波数帯域 (3kHz まで )

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

hpc141_shirahata.pdf

hpc141_shirahata.pdf GPU アクセラレータと不揮発性メモリ を考慮した I/O 性能の予備評価 白幡晃一 1,2 佐藤仁 1,2 松岡聡 1 1: 東京工業大学 2: JST CREST 1 GPU と不揮発性メモリを用いた 大規模データ処理 大規模データ処理 センサーネットワーク 遺伝子情報 SNS など ペタ ヨッタバイト級 高速処理が必要 スーパーコンピュータ上での大規模データ処理 GPU 高性能 高バンド幅 例

More information

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司 4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司 3 1 1 日本原子力研究開発機構システム計算科学センター 2 理科学研究所計算科学研究機構 3 東京大学新領域創成科学研究科

More information

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法 PC リテラシー NO.2 情報処理入門 2017 年 4 月 20 日後保範 0. dotcampus の利用 dotcampus に登録確認木曜 4 限に PC リテラシーがあるか確認ショートコード : 179047 dotcampus をお気に入りに追加 dotcampus から講義ファイル取得 dotcampus にレポート提出 1 2 1. 講義で使用するもの 1.1 の構成 (1) オペレーションシステム

More information

Microsoft PowerPoint - å®�æ−•è©¦é¨fi3ㆮ対ç�Œ.pptx

Microsoft PowerPoint - å®�æ−•è©¦é¨fi3ㆮ対ç�Œ.pptx C言語の繰り返し処理 for文と while文と do文 臼杵 潤 0) 準備 変数の加減算 int a, b=10; // a= a = 0; a = a+1; // a= a += 1; // a= // a= a ++; a = a + b; // a= a += b; // a= // a= a --; 下を1行ずつ実行すると それぞれ aの値はどう変わるか 0 1 2 3 13 23 22

More information

差分スキーム 物理 化学 生物現象には微分方程式でモデル化される例が多い モデルを使って現実の現象をコンピュータ上で再現することをシミュレーション ( 数値シミュレーション コンピュータシミュレーション ) と呼ぶ そのためには 微分方程式をコンピュータ上で計算できる数値スキームで近似することが必要

差分スキーム 物理 化学 生物現象には微分方程式でモデル化される例が多い モデルを使って現実の現象をコンピュータ上で再現することをシミュレーション ( 数値シミュレーション コンピュータシミュレーション ) と呼ぶ そのためには 微分方程式をコンピュータ上で計算できる数値スキームで近似することが必要 差分スキーム 物理 化学 生物現象には微分方程式でモデル化される例が多い モデルを使って現実の現象をコンピュータ上で再現することをシミュレーション ( 数値シミュレーション コンピュータシミュレーション ) と呼ぶ そのためには 微分方程式をコンピュータ上で計算できる数値スキームで近似することが必要になる その一つの方法が微分方程式を差分方程式におき直すことである 微分方程式の差分化 次の 1 次元境界値問題を考える

More information

enshu5_1.key

enshu5_1.key 情報知能工学演習V (前半第1週) 政田洋平 システム情報学研究科計算科学専攻 TA : 菅 新 菅沼智史 水曜 新行紗弓 馬淵隼 木曜 演習 V( 前半 ) の内容 第 1 週 : 高性能計算 (High Performance Computing = HPC) 向けプログラミングの基礎 第 2 週 : シミュレーションの基礎 第 3 週 : 波の移流方程式のシミュレーション 第 4,5 週 :

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション スーパーコンピュータ 京 で シミュレーションする生命科学 ~SCLS 計算機システムへの期待 ~ 理化学研究所 HPCI 計算生命科学推進プログラム企画調整グループパブリックアウトリーチ担当神内衣里香 (HPCI 戦略プログラム分野 1) 内容 京 革新的ハイパフォーマンス コンピューティング インフラ (HPCI) の構築 HPCI 戦略プログラム 分野 1 HPCI システム利用研究課題公募

More information

Microsoft PowerPoint PCクラスタワークショップin京都.ppt

Microsoft PowerPoint PCクラスタワークショップin京都.ppt PC クラスタシステムへの富士通の取り組み 富士通株式会社株式会社富士通研究所久門耕一 29 年度に富士通が提供する ( した ) 大規模クラスタ 今年度はCPUとしてメモリバンド幅がNehalem, QDR- IB( 片方向 4GB/s) などPCクラスタにとって期待できる多くのコモディティコンポーネントが出現 これら魅力ある素材を使ったシステムとして 2つのシステムをご紹介 理化学研究所様 RICC(Riken

More information

Stage 並列プログラミングを習得するためには : 1 計算機リテラシ, プログラミング言語 2 基本的な数値解析 3 実アプリケーション ( 例えば有限要素法, 分子動力学 ) のプログラミング 4 その並列化 という 4 つの段階 (stage) が必要である 本人材育成プログラムでは1~4を

Stage 並列プログラミングを習得するためには : 1 計算機リテラシ, プログラミング言語 2 基本的な数値解析 3 実アプリケーション ( 例えば有限要素法, 分子動力学 ) のプログラミング 4 その並列化 という 4 つの段階 (stage) が必要である 本人材育成プログラムでは1~4を コンピュータ科学特別講義 科学技術計算プログラミング I ( 有限要素法 ) 中島研吾 東京大学情報基盤センター 1. はじめに本稿では,2008 年度冬学期に実施した, コンピュータ科学特別講義 I 科学技術計算プログラミング ( 有限要素法 ) について紹介する 計算科学 工学, ハードウェアの急速な進歩, 発達を背景に, 第 3 の科学 としての大規模並列シミュレーションへの期待は, 産学において一層高まっている

More information

ic3_cf_p1-70_1018.indd

ic3_cf_p1-70_1018.indd 章オペレーティングシステム()の基いソフトウェアで 基本ソフトウェア とも呼ばれます 第礎第 章 オペレーティングシステム () の基礎 - の役割と動作 ここでは コンピューターの基本的な構成やオペレーティングシステムの基本的な役割と操作を学習します -- コンピューターの基本構成 現代社会では さまざまな種類のコンピューター機器が各分野で利用されています 身近なものでは パソコン タブレット スマートフォンなどがありますが

More information

無印良品 2012 自転車 カタログ

無印良品 2012 自転車 カタログ 26 897895321,000 140cm 76.0cm 16.0kg H LED 3 263 897896025,000 140cm 76.0cm 16.5kg H 3 LED 20 8978984 8978977 19,800 134cm 73.0cm 15.0kg LED 2620 2620 8486656550 5536207483 14512372,100 8279999840 26 77342561,417

More information

ガイダンス(2016年4月19日)-HP

ガイダンス(2016年4月19日)-HP スパコンプログラミング(), (I) ガイダンス 東 京 大 学 情 報 基 盤 センター 准 教 授 塙 敏 博 206 年 4 月 9 日 ( 火 )0:25-2:0 206/4/9 スパコンプログラミング (), (I) 2 ガイダンスの 流 れ. 講 義 の 目 的 2. 講 師 紹 介 3. 講 義 日 程 の 確 認 4. 成 績 の 評 価 方 法 5. 計 算 機 利 用 申 請 6.

More information

ムーアの法則に関するレポート

ムーアの法則に関するレポート 情報理工学実験レポート 実験テーマ名 : ムーアの法則に関する調査 職員番号 4570 氏名蚊野浩 提出日 2019 年 4 月 9 日 要約 大規模集積回路のトランジスタ数が 18 ヶ月で2 倍になる というムーアの法則を検証した その結果 Intel 社のマイクロプロセッサに関して 1971 年から 2016 年の平均で 26.4 ヶ月に2 倍 というペースであった このことからムーアの法則のペースが遅くなっていることがわかった

More information

64 3 g=9.85 m/s 2 g=9.791 m/s 2 36, km ( ) 1 () 2 () m/s : : a) b) kg/m kg/m k

64 3 g=9.85 m/s 2 g=9.791 m/s 2 36, km ( ) 1 () 2 () m/s : : a) b) kg/m kg/m k 63 3 Section 3.1 g 3.1 3.1: : 64 3 g=9.85 m/s 2 g=9.791 m/s 2 36, km ( ) 1 () 2 () 3 9.8 m/s 2 3.2 3.2: : a) b) 5 15 4 1 1. 1 3 14. 1 3 kg/m 3 2 3.3 1 3 5.8 1 3 kg/m 3 3 2.65 1 3 kg/m 3 4 6 m 3.1. 65 5

More information

今後の予定 6/29 パターン形成第 11 回 7/6 データ解析第 12 回 7/13 群れ行動 ( 久保先生 ) 第 13 回 7/17 ( 金 ) 休講 7/20 まとめ第 14 回 7/27 休講?

今後の予定 6/29 パターン形成第 11 回 7/6 データ解析第 12 回 7/13 群れ行動 ( 久保先生 ) 第 13 回 7/17 ( 金 ) 休講 7/20 まとめ第 14 回 7/27 休講? 今後の予定 6/29 パターン形成第 11 回 7/6 データ解析第 12 回 7/13 群れ行動 ( 久保先生 ) 第 13 回 7/17 ( 金 ) 休講 7/20 まとめ第 14 回 7/27 休講? 数理生物学演習 第 11 回パターン形成 本日の目標 2 次元配列 分子の拡散 反応拡散モデル チューリングパタン 拡散方程式 拡散方程式 u t = D 2 u 拡散が生じる分子などの挙動を記述する.

More information

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の 計算機システム Ⅱ 演習問題学科学籍番号氏名 1. 以下の分の空白を埋めなさい. CPUは, 命令フェッチ (F), 命令デコード (D), 実行 (E), 計算結果の書き戻し (W), の異なるステージの処理を反復実行するが, ある命令の計算結果の書き戻しをするまで, 次の命令のフェッチをしない場合, ( 単位時間当たりに実行できる命令数 ) が低くなる. これを解決するために考案されたのがパイプライン処理である.

More information

Microsoft Word - note02.doc

Microsoft Word - note02.doc 年度 物理化学 Ⅱ 講義ノート. 二原子分子の振動. 調和振動子近似 モデル 分子 = 理想的なバネでつながった原子 r : 核間距離, r e : 平衡核間距離, : 変位 ( = r r e ), k f : 力の定数ポテンシャルエネルギー ( ) k V = f (.) 古典運動方程式 [ 振動数 ] 3.3 d kf (.) dt μ : 換算質量 (m, m : 原子, の質量 ) mm

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information

RICCについて

RICCについて RICC 1 RICC 2 RICC 3 RICC GPU 1039Nodes 8312core) 93.0GFLOPS, 12GB(mem), 500GB (hdd) DDR IB!1 PC100Nodes(800core) 9.3 GPGPU 93.3TFLOPS HPSS (4PB) (550TB) 0.24 512GB 1500GB MDGRAPE33TFLOPS MDGRAPE-3 64

More information

cmpsys13w03_cpu_hp.ppt

cmpsys13w03_cpu_hp.ppt 情報システム論 第 3 章! CPU! 根来 均 Outline! u CPU の主な働き! u CPU での命令実行処理! u CPU の高速化技術! u CPU の性能評価方法 手段! u 並列計算機! u 現在の CPU の動向 CPU の主な働き u 制御装置 (Control Unit, CU)! プログラム制御 ( 命令の解読 実行 分岐命令 データ転送命令 )! 入出力制御 ( 入出力動作と内部処理

More information

Microsoft Word - t30_西_修正__ doc

Microsoft Word - t30_西_修正__ doc 反応速度と化学平衡 金沢工業大学基礎教育部西誠 ねらい 化学反応とは分子を構成している原子が組み換り 新しい分子構造を持つことといえます この化学反応がどのように起こるのか どのような速さでどの程度の分子が組み換るのかは 反応の種類や 濃度 温度などの条件で決まってきます そして このような反応の進行方向や速度を正確に予測するために いろいろな数学 物理的な考え方を取り入れて化学反応の理論体系が作られています

More information

-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR

-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR 第 回マイクロプロセッサのしくみ マイクロプロセッサの基本的なしくみについて解説する. -1 マイクロプロセッサと周辺回路の接続 制御バス プロセッサ データ バス アドレス バス メモリ 周辺インタフェース バスの基本構成 Fig.-1 バスによる相互接続は, 現在のコンピュータシステムのハードウェアを特徴づけている. バス (Bus): 複数のユニットで共有される信号線システム内の データの通り道

More information

< B8CDD8AB B83685D>

< B8CDD8AB B83685D> () 坂井 修一 東京大学大学院情報理工学系研究科電子情報学専攻東京大学工学部電子情報工学科 / 電気電子工学科 はじめに アウトオブオーダ処理 工学部講義 はじめに 本講義の目的 の基本を学ぶ 場所 火曜日 8:40-0:0 工学部 号館 4 ホームページ ( ダウンロード可能 ) url: http://www.mtl.t.u-tokyo.ac.jp/~sakai/hard/ 教科書 坂井修一

More information

PowerPoint Presentation

PowerPoint Presentation OpenFOAM を用いた 超大規模計算モデル作成とその性能の評価 清水建設株式会社 PHAM VAN PHUC 内山学 京 での OpenFOAM に関する取組み 第 1 回 OpenFOAM ワークショップ (2013) コード移植 10 億格子計算の壁 解決策 ( プリ ポスト ) 第 2 回 OpenFOAM ワークショップ (2014) 1 万並列計算の壁 解決策 (MPI プラットフォーム

More information

コンピュータ工学Ⅰ

コンピュータ工学Ⅰ コンピュータ工学 Ⅰ Rev. 2018.01.20 コンピュータの基本構成と CPU 内容 ➊ CPUの構成要素 ➋ 命令サイクル ➌ アセンブリ言語 ➍ アドレッシング方式 ➎ CPUの高速化 ➏ CPUの性能評価 コンピュータの構成装置 中央処理装置 (CPU) 主記憶装置から命令を読み込み 実行を行う 主記憶装置 CPU で実行するプログラム ( 命令の集合 ) やデータを記憶する 補助記憶装置

More information

Microsoft PowerPoint - シミュレーション工学-2010-第1回.ppt

Microsoft PowerPoint - シミュレーション工学-2010-第1回.ppt シミュレーション工学 ( 後半 ) 東京大学人工物工学研究センター 鈴木克幸 CA( Compter Aded geerg ) r. Jaso Lemo (SC, 98) 設計者が解析ツールを使いこなすことにより 設計の評価 設計の質の向上を図る geerg の本質の 計算機による支援 (CA CAM などより広い名前 ) 様々な汎用ソフトの登場 工業製品の設計に不可欠のツール 構造解析 流体解析

More information

Microsoft PowerPoint - 【講演資料】渡邊様 松山-.ppt

Microsoft PowerPoint - 【講演資料】渡邊様 松山-.ppt スーパーコンピュータ 京 を知る集い 世界最速スーパーコンピュータ 京 平成 24 年 2 月 25 日 理化学研究所次世代スーパーコンピュータ開発実施本部渡辺貞 0 内容 スーパーコンピュータとは? スーパーコンピュータの応用例スーパーコンピュータの歴史世界のスーパーコンピュータ開発スーパーコンピュータの高速化と 京 スーパーコンピュータの施設 1 スーパーコンピュータとは? 2 スーパーコンピュータとは?

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 多倍長精度演算の性能評価 日時 年 月 日 :3-: 場所工学院大学新宿校舎 8 階第 4 会議室 高エネルギー加速器研究機構 濱口信行 hgu@post.kek.jp // 第 回多倍長精度計算フォーラム . はじめに 計算センター => ユーザプログラムの実行効率は何 % です よく出ています or 改善してください 実行性能 = 演算量 / 実行時間実行効率 = 実行性能 / 理論性能 ユーザ実行時間

More information

COMET II のプログラミング ここでは機械語レベルプログラミングを学びます 1

COMET II のプログラミング ここでは機械語レベルプログラミングを学びます 1 COMET II のプログラミング ここでは機械語レベルプログラミングを学びます 1 ここでは機械命令レベルプログラミングを学びます 機械命令の形式は学びましたね機械命令を並べたプログラムを作ります 2 その前に プログラミング言語について 4 プログラミング言語について 高級言語 (Java とか C とか ) と機械命令レベルの言語 ( アセンブリ言語 ) があります 5 プログラミング言語について

More information

Microsoft Word - no02.doc

Microsoft Word - no02.doc 使い方 1ソースプログラムの入力今回の講義では C++ 言語用の統合環境ソフトといわれるプログラムを利用します デスクトップにある CPad for C++ のアイコン ( 右参照 ) をダブルクリ ックしましょう ( 同じアイコンで Java_pad とかい エディタ部 てあるものもありますので気をつけてください ) これで 起 動します 統合環境を立ち上げると エディタ部とメッセージ部をもった画面が出てきます

More information

ニュートン重力理論.pptx

ニュートン重力理論.pptx 3 ニュートン重力理論 1. ニュートン重力理論の基本 : 慣性系とガリレイ変換不変性 2. ニュートン重力理論の定式化 3. 等価原理 4. 流体力学方程式とその基礎 3.1 ニュートン重力理論の基本 u ニュートンの第一法則 = 力がかからなければ 等速直線運動を続ける u 等速直線運動に見える系を 慣性系 と呼ぶ ² 直線とはどんな空間の直線か? ニュートン理論では 3 次元ユークリッド空間

More information

Microsoft Word ●書式付IO性能_杉崎_ _更新__ doc

Microsoft Word ●書式付IO性能_杉崎_ _更新__ doc 2.2.3. 書式付 I/O 性能 上智大学南部伸孝富士通株式会社内藤俊也 杉崎由典 1. はじめに I/O 処理に要する時間の内訳は システムの実 I/O 時間 + ランタイムの書式処理時間となっている プログラムを用いた書式付 I/O 時間を富士通コンパイラで評価した所 システム時間が約 12% であり ランタイム時間が約 88% ということが確認された 即ち 書式付 I/O 性能は ランタイムの性能に大きく影響される

More information

<4D F736F F D20332E322E332E819C97AC91CC89F090CD82A982E78CA982E9466F E393082CC8D5C91A291CC90AB945C955D89BF5F8D8296D85F F8D F5F E646F63>

<4D F736F F D20332E322E332E819C97AC91CC89F090CD82A982E78CA982E9466F E393082CC8D5C91A291CC90AB945C955D89BF5F8D8296D85F F8D F5F E646F63> 3.2.3. 流体解析から見る Fortran90 の構造体性能評価 宇宙航空研究開発機構 高木亮治 1. はじめに Fortran90 では 構造体 動的配列 ポインターなど様々な便利な機能が追加され ユーザーがプログラムを作成する際に選択の幅が広がりより便利になった 一方で 実際のアプリケーションプログラムを開発する際には 解析対象となる物理現象を記述する数学モデルやそれらを解析するための計算手法が内包する階層構造を反映したプログラムを作成できるかどうかは一つの重要な観点であると考えられる

More information

数値計算で学ぶ物理学 4 放物運動と惑星運動 地上のように下向きに重力がはたらいているような場においては 物体を投げると放物運動をする 一方 中心星のまわりの重力場中では 惑星は 円 だ円 放物線または双曲線を描きながら運動する ここでは 放物運動と惑星運動を 運動方程式を導出したうえで 数値シミュ

数値計算で学ぶ物理学 4 放物運動と惑星運動 地上のように下向きに重力がはたらいているような場においては 物体を投げると放物運動をする 一方 中心星のまわりの重力場中では 惑星は 円 だ円 放物線または双曲線を描きながら運動する ここでは 放物運動と惑星運動を 運動方程式を導出したうえで 数値シミュ 数値計算で学ぶ物理学 4 放物運動と惑星運動 地上のように下向きに重力がはたらいているような場においては 物体を投げると放物運動をする 一方 中心星のまわりの重力場中では 惑星は 円 だ円 放物線または双曲線を描きながら運動する ここでは 放物運動と惑星運動を 運動方程式を導出したうえで 数値シミュレーションによって計算してみる 4.1 放物運動一様な重力場における放物運動を考える 一般に質量の物体に作用する力をとすると運動方程式は

More information

システムソリューションのご紹介

システムソリューションのご紹介 HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ

More information

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果 Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7

More information

Microsoft PowerPoint - 発表II-3原稿r02.ppt [互換モード]

Microsoft PowerPoint - 発表II-3原稿r02.ppt [互換モード] 地震時の原子力発電所燃料プールからの溢水量解析プログラム 地球工学研究所田中伸和豊田幸宏 Central Research Institute of Electric Power Industry 1 1. はじめに ( その 1) 2003 年十勝沖地震では 震源から離れた苫小牧地区の石油タンクに スロッシング ( 液面揺動 ) による火災被害が生じた 2007 年中越沖地震では 原子力発電所内の燃料プールからの溢水があり

More information

CCS HPCサマーセミナー 並列数値計算アルゴリズム

CCS HPCサマーセミナー 並列数値計算アルゴリズム 大規模系での高速フーリエ変換 2 高橋大介 daisuke@cs.tsukuba.ac.jp 筑波大学計算科学研究センター 2016/6/2 計算科学技術特論 B 1 講義内容 並列三次元 FFT における自動チューニング 二次元分割を用いた並列三次元 FFT アルゴリズム GPU クラスタにおける並列三次元 FFT 2016/6/2 計算科学技術特論 B 2 並列三次元 FFT における 自動チューニング

More information

Microsoft PowerPoint 知る集い-02.ppt [互換モード]

Microsoft PowerPoint 知る集い-02.ppt [互換モード] 京速コンピュータ 京 を知る集い 世界最速スーパーコンピュータ 京 平成 23 年 12 月 17 日 理化学研究所次世代スーパーコンピュータ開発実施本部渡辺貞 0 内容 スーパーコンピュータとは? スーパーコンピュータの応用例スーパーコンピュータの歴史スーパーコンピュータの高速化世界のスーパーコンピュータ開発と日本の位置づけスーパーコンピュータプロジェクト - 世界最速 京速コンピュータ : 京

More information

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法

情報1(化学科)NO.1 コンピュータシステムの基礎と データの表現方法 PC リテラシー NO.2 情報処理入門 2017 年 9 月 28 日 後保範 1 0. dotcampus の利用 dotcampusに登録確認木曜 4 限にPCリテラシーがあるか確認ショートコード : 221136 dotcampusをお気に入りに追加 dotcampusから講義ファイル取得 dotcampusにレポート提出 2 1. 講義で使用するもの (1) オペレーションシステム Windows

More information