研究成果報告書(一部基金分)

Similar documents

技術資料 JARI Research Journal OpenFOAM を用いた沿道大気質モデルの開発 Development of a Roadside Air Quality Model with OpenFOAM 木村真 *1 Shin KIMURA 伊藤晃佳 *2 Akiy

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

Microsoft PowerPoint - pr_12_template-bs.pptx

並列・高速化を実現するための 高速化サービスの概要と事例紹介

システムソリューションのご紹介

GPUを用いたN体計算

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

本文ALL.indd

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

パソコンシミュレータの現状

EnSightのご紹介

FEM原理講座 (サンプルテキスト)

Microsoft PowerPoint - EMPro_ADS_co_design_draft.ppt [互換モード]

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft PowerPoint - shikoku8jst.ppt

モデリングとは

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

hpc141_shirahata.pdf

3 数値解の特性 3.1 CFL 条件 を 前の章では 波動方程式 f x= x0 = f x= x0 t f c x f =0 [1] c f 0 x= x 0 x 0 f x= x0 x 2 x 2 t [2] のように差分化して数値解を求めた ここでは このようにして得られた数値解の性質を 考


<4D F736F F D2091B28BC68CA48B8695F18D908F912E646F63>

PowerPoint プレゼンテーション

高性能計算研究室の紹介 High Performance Computing Lab.

NVIDIA Tesla K20/K20X GPU アクセラレータ アプリケーション パフォーマンス テクニカル ブリーフ

Microsoft PowerPoint - ARCICD07FukumotoSlides.pptx

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

今後の予定 6/29 パターン形成第 11 回 7/6 データ解析第 12 回 7/13 群れ行動 ( 久保先生 ) 第 13 回 7/17 ( 金 ) 休講 7/20 まとめ第 14 回 7/27 休講?

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

コンピュータグラフィックス第8回

<4D F736F F D20332E322E332E819C97AC91CC89F090CD82A982E78CA982E9466F E393082CC8D5C91A291CC90AB945C955D89BF5F8D8296D85F F8D F5F E646F63>

CELSIUSカタログ(2012年7月版)

フジタ技術研究報告第 48 号 2012 年 CUDA を用いた並列数値解析手法の一考察 仲沢武志 概 要 従来 大規模な問題や複雑な形状が計算対象の場合では スーパーコンピュータのような高価な計算リソースを使用する必要があった これに対し コンピュータのハード的な進化によって 現在では市販のパーソ

Presentation Title Arial 28pt Bold Agilent Blue

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

Coding theorems for correlated sources with cooperative information

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

Microsoft PowerPoint - 2_FrontISTRと利用可能なソフトウェア.pptx

GPGPU

CLEFIA_ISEC発表

目次 1. CAD インターフェイス (3D_Analyzer&3D_Evolution) ユーザーインターフェイス機能強化 (3D_Analyzer&3D_Evolution)... 3 レポート... 3 クリッピング機能... 4 言語... 4 表示オプション

平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には,

スライド 1

スライド 1

PowerPoint プレゼンテーション

Microsoft Word - NumericalComputation.docx

IBM Cloud Social Visual Guidelines

粒子画像流速測定法を用いた室内流速測定法に関する研究

スライド 1

Microsoft PowerPoint - ARCEMB08HayashiSlides.ppt [互換モード]

コンピュータグラフィックス第6回

<4D F736F F D F B835E82CC8D8291AC8F88979D82F08FAC8C5E82A982C288C089BF82C88D5C90AC82C AC82B782E996A78C8B8D878C5E836E815B C695C097F18F88979D82F091678D8782B982BD8C768E5A8B

風力発電インデックスの算出方法について 1. 風力発電インデックスについて風力発電インデックスは 気象庁 GPV(RSM) 1 局地気象モデル 2 (ANEMOS:LAWEPS-1 次領域モデル ) マスコンモデル 3 により 1km メッシュの地上高 70m における 24 時間の毎時風速を予測し

PowerPoint プレゼンテーション

研究報告用MS-Wordテンプレートファイル

160311_icm2015-muramatsu-v2.pptx

PowerPoint Presentation

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

CCS HPCサマーセミナー 並列数値計算アルゴリズム

Microsoft PowerPoint _OpenCAE並列計算分科会.pptx

10年オンプレで運用したmixiをAWSに移行した10の理由

NS NS Scalar turbulence 5 6 FEM NS Mesh (A )

Microsoft Word - koubo-H26.doc

ComputerArchitecture.ppt

TopSE並行システム はじめに

CELSIUSカタログ(2012年5月版)

計算機アーキテクチャ

SimscapeプラントモデルのFPGAアクセラレーション

07-二村幸孝・出口大輔.indd

研究成果報告書

PowerPoint プレゼンテーション

工学院大学建築系学科近藤研究室2000年度卒業論文梗概

高性能計算研究室の紹介 High Performance Computing Lab.

DO 時間積分 START 反変速度の計算 contravariant_velocity 移流項の計算 advection_adams_bashforth_2nd DO implicit loop( 陰解法 ) 速度勾配, 温度勾配の計算 gradient_cell_center_surface 速

Microsoft PowerPoint - ICD2011TakadaSlides.pptx

Microsoft Word - report_public.doc

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx

Microsoft PowerPoint - シミュレーション工学-2010-第1回.ppt

Overview Simulation Kleisli Simulation Contribution 1. Implementation 2. Increasing the Chance of Simulation Experimental Results and Comparison 2

共有辞書を用いた 効率の良い圧縮アルゴリズム

             論文の内容の要旨

熊本大学学術リポジトリ Kumamoto University Repositor Title GPGPU による高速演算について Author(s) 榎本, 昌一 Citation Issue date Type URL Presentation

PowerPoint プレゼンテーション

スライド 1

PowerPoint プレゼンテーション

大域照明計算手法開発のためのレンダリングフレームワーク Lightmetrica: 拡張 検証に特化した研究開発のためレンダラ 図 1: Lightmetrica を用いてレンダリングした画像例 シーンは拡散反射面 光沢面を含み 複数の面光 源を用いて ピンホールカメラを用いてレンダリングを行った

スライド 1

サーバプラットフォーム「BladeSymphony」、「HA8000シリーズ」の新モデルを販売開始

Microsoft PowerPoint SCOPE-presen

Coding theorems for correlated sources with cooperative information

CANapeを用いたラピッドコントロールプロトタイピングのバイパス手法による制御モデル開発

クラウド基盤向けに処理性能や拡張性を強化した「HA8000シリーズ」の2プロセッサーサーバを販売開始

レイアウト 1

PowerPoint プレゼンテーション

Microsoft Word - nvsi_100207jp_quantumi40.doc

Transcription:

様式 C-19 F-19 Z-19( 共通 ) 1. 研究開始当初の背景近年 測定技術の発展により 細胞内における分子局在や濃度勾配などの定量的な解析が可能となった これに伴い 分子の空間的な偏りが細胞のダイナミクスに与える影響の解析が盛んに行われている このような生命システムのダイナミクスを理解する手法の一つとして 空間情報を考慮した数理モデルによる空間モデルシミュレーションが挙げられる 空間モデルシミュレーションでは偏微分方程式モデルを扱う際 シミュレーション空間を格子状に離散化し 各格子で数値計算を行う その際 個々の格子について逐次的に計算を行うため 計算時間が膨大になるという問題点が存在する この問題を解決するためには計算機による演算処理高速化の必要があり その手法として PC クラスタをはじめとする並列計算機はスーパーコンピュータや専用ハードウェアに比べ低コストで高い処理能力を得られることから広く用いられている しかし PC クラスタはトータルとしての発熱量が多く 空調が整った専用のサーバ ルーム内に設置する必要があり 省エネルギー 省スペース性の面において問題がある また PC クラスタ全体の性能向上が必要となった場合 構成要素である PC をすべて入れ替える必要があり 性能向上を達成するために必要となる人的 金銭的コストが高い さらに PC クラスタの運用は計算機に関する高度の知識を必要とし 誰にでも容易に取り扱えるものではない また 構成する部品点数も多いことから維持 管理に要するコストが高い 等の問題点がある 一方で PC 上で描画を担当する の性能向上はめざましく GP(General Purpose computation on ) と呼ばれる科学技術計算を高速な 上で行う技術が脚光を浴びており バイオイメージング 分子動力学計算 信号処理といった分野において を科学計算分野へ利用しようとする動きが急速に広がりつつある GP は PC クラスタなど他の並列計算の手法よりも価格性能比 電力性能比などの面において優れているため 個人レベル 研究室レベルでの高速なシミュレーション環境の構築が容易である 2. 研究の目的本研究課題では GP による低コスト且つ超高速空間モデルシミュレーション環境の構築を目指した 具体的には 上で逐次的に数値計算を行う空間モデルシミュレータを GP によって並列化し 高速化を試みた 3. 研究の方法 (1) 偏微分方程式ソルバの理解と による並列化の検討 偏微分方程式ソルバ ( シミュレーションエンジン ) の理解を進め 並列化による高速化の可能性について十分に検討を行った 図 1 に細胞 組織レベルの空間モデルシミュレーションで対象となる空間モデルの概念図 及び主要構成要素を示す ( 図 1 は細胞内での空間モデルの例を示す ) : : 図 1: 空間モデルの概念図 空間モデルには 反応区画の形状 位置関係 分子の空間分布 分子の移流 拡散 境界での輸送 分子間の反応に関する情報が含まれており 各区画には区画内に存在する各分子のダイナミクスが偏微分方程式 及び常微分方程式で記述される 空間モデルシミュレータは上記空間モデルより必要な情報を抽出し 分子濃度の時空間発展に関する数値積分を行う必要がある そのため 偏微分方程式で記述された空間モデルの数値解析を行う際に必要となるのが 1. 空間の離散化 2. 時間積分の 2 点である 本研究課題では上記 2 点のアルゴリズムについて を用いた高速化を行った 検討対象とするのは空間の離散化に関しては有限差分法と有限体積法を 時間積分に関してはオイラー法 ルンゲクッタ法の数値積分アルゴリズムとした (2) 数値積分の並列化数値積分の並列化には (a) 粗粒度並列化 (b) 細粒度並列化の 2 通りのアプローチが考えられる (a) 粗粒度並列化は一般的な PC クラスタ上で実装されている並列化アルゴリズムであり 各プロセッサ () に異なる演算を行わせる方式である 数値積分の場合 複数回実行する必要があるシミュレーションを各 が分担して実行する方式が一般的である 粗粒度並列処理は文字通り並列化の粒度が粗いため 並列化が容易である半面 パフォーマンス向上に限界がある 一方 (b) 細粒度並列化は一つのタスクを細かく分割し 各プロセッサが分割された小問題を担当する方式である

細粒度並列処理の簡単な例として 図 2 に, の演算ユニットのイメージ図を示す は多数の演算ユニット ( 図中では人形で示されている ) を持ち 各演算ユニットが個別の演算を実行できる り 既に レベルのシミュレータにて SBML の空間モデルの読み込みを達成している 本研究課題ではこの成果を活用し 空間モデルシミュレータの SBML 対応を行った SBML では空間モデルの記述に 3 種類の方法が提案されており 本研究課題では空間モデルシミュレーションで広く利用されている Analytic Volume ( 数式により表現されたシミュレーション空間 ) と Sampled Volume ( 顕微鏡画像から構築されたシミュレーション空間 ) の対応を行った Sampled Volume の空間モデル構築のため 細胞の 3 次元構造を蛍光顕微鏡画像にて取得する実験系を構築した 図 3 に蛍光顕微鏡画像から構築した細胞の 3 次元空間モデルを示す 図 2:, の演算ユニット数の比較 は多数の演算ユニットを持つ 粗粒度並列処理では 各演算ユニットが独立の演算を行う一方 細粒度並列処理では一つの大きな問題 ( シミュレーション ) を細かいパーツに分割し 各演算ユニットは個々のパーツの演算を行う 細粒度並列処理では一つの大きな問題を複数の演算ユニットが協力して解くことが可能であるため 本研究課題に最適なアプローチである 細粒度並列処理は高度な並列アルゴリズムが必要となるが 大幅な性能向上を達成する可能性を秘める 本研究課題では高速シミュレーション処理を 上で達成するため 粗粒度並列化と細粒度並列化を組み合わせたハイブリッドアプローチを検討した オイラー法 ルンゲクッタ法等 各数値積分アルゴリズムによって並列化のアプローチは異なるため 個別の細粒度並列化アルゴリズムを構築した なお シミュレータは NVIDIA 社が提供する C 言語による統合開発環境である CUDA (Compute Unified Device Architecture) を用いて実装を行った (3) 標準モデル記述言語への対応本研究課題で開発した空間モデルシミュレータが広く普及するためには空間モデルの構築が容易であること 及び他の空間モデルシミュレータで作成した空間モデルを読み込むことが可能であることが非常に重要な要素である 特に後者に対応することはソフトウェアの普及を左右する要因であるため 本研究課題では標準モデル記述言語である SBML(Systems Biology Markup Language) への対応を行うことが必須であると考えた 申請者は SBML の空間モデル拡張を行なってお 図 3: 3 次元画像再構成により構築した 空間モデル (4) 効率的なメモリアクセスアルゴリズムの構築 CUDA で のパフォーマンスを十分に引き出すには コンピューティングに適したプログラミングが不可欠である 例えば CUDA のメモリ階層とその特性を十分に理解した上でアルゴリズムの構築を進める必要がある 図 4 は の構造と内部メモリの模式図である 2. 1. 1. 1. 図 4: の構造と内部メモリ 3. 3. 4.

は内部的に並列計算機と同等の機能を有しており 並列に演算を実行することが可能である ( 図 4 Processor 部分 ) 内部メモリはアクセス速度の順に (a) レジスタ (b) 共有メモリ (c) キャッシュ (d) ビデオメモリと分かれており 同様の順番でメモリサイズが大きくなる シミュレーション対象となるモデルが巨大になることもあるため モデル内のすべての演算対象を一番サイズが大きい (d) ビデオメモリに置くことが安全だと考えられるが その場合アクセス速度が遅いため全体のパフォーマンス向上が望めない そのため 極めて高速に動作する (a) レジスタ (b) 共有メモリを有効活用することを検討した 具体的には シミュレーションを行う前に対象となるモデルを分割し パラメータを (a) のレジスタに 必要となる生化学反応方程式 分子濃度を (b) の共有メモリに配置した 4. 研究成果 (1) 拡散方程式の高速化図 5 に拡散方程式のシミュレーションを (Intel Xeon X5687, 3.60 GHz) (NVIDIA Tesla K40) 上で計算した実行時間とその内訳を示す グラフ中の領域は左から順に 拡散方程式の数値積分 境界条件の計算 計算結果の更新 メモリ確保 に費やした時間を示す 実装では拡散反応の数値積分に大部分の計算時間を費やしていたが 実装では効率的に並列化を行い 計算時間の削減が行われていることがわかる diffusion boundary update memory allocation 当研究課題の実装により 移流方程式のシミュレーションを最大で 52 倍高速化することに成功した 図 6: / での実行時間とその内訳 (3) 反応方程式の高速化図 7 に反応方程式のシミュレーションを (Intel Xeon X5687, 3.60 GHz) (NVIDIA Tesla K40) 上で計算した実行時間とその内訳を示す advection update memory allocation 0 37.5 75.0 112.5 150.0 0 0.75 1.50 2.25 3.00 reaction boundary update memory allocation 0 125 250 375 500 0 175 350 525 700 0 1.75 3.50 5.25 7.00 0 3.75 7.50 11.25 15.00 図 5: / での実行時間とその内訳 当研究課題の実装により 拡散方程式のシミュレーションを最大で 63 倍高速化することに成功した (2) 移流方程式の高速化図 6 に移流方程式のシミュレーションを (Intel Xeon X5687, 3.60 GHz) (NVIDIA Tesla K40) 上で計算した実行時間とその内訳を示す 移流方程式の 実装では 実行時間の大部分をメモリ確保に占められているが これは を使用開始する際に必要となるオーバーヘッドの 2 秒間であり むしろ移流方程式の数値積分 及び値の更新に関しての並列化が効果的に行えていることを表している 図 7: / での実行時間とその内訳 拡散方程式 移流方程式と同様 高速化の効果が得られた 当研究課題の実装により 反応方程式のシミュレーションを最大で 64 倍高速化することに成功した 5. 主な発表論文等 ( 研究代表者 研究分担者及び連携研究者には下線 ) 雑誌論文 ( 計 3 件 ) 1. K Sumiyoshi, H Hirata, N Hiroi, A Funahashi, Acceleration of discrete stochastic biochemical simulation using GP, Frontiers in Physiology, 査読有,6, 2015. doi: 10.3389/fphys.2015.00042 2. Y Nakai, M Ozeki, T Hiraiwa, R Tanimoto, A Funahashi, N Hiroi, et al. High-speed microscopy with an electrically tunable lens to image the

dynamics of in vivo molecular complexes, Review of Scientific Instruments, 査読有, 86, 2015. doi: 10.1063/1.4905330 3. R Keller, A Dorr, A Tabira, A Funahashi, MJ Ziller, R Adams, N Rodriguez, NL Novere, N Hiroi, H Planatscher, A Zell, A Drager, The systems biology simulation core algorithm, BMC Systems Biology, 査読有, 7, 2013 doi: 10.1186/1752-0509-7-55 学会発表 ( 計 16 件 ) 1. A Funahashi, Computational Platform for Systems Biology, Dagstuhl Seminar on Multiscale Spatial Computational Systems Biology, 23 rd -28 th Dec. 2014, Wadern (Germany) 2. Y Nakai, N Tamura, T Hiraiwa, T Okuhara, VM Draviam, A Funahashi, N Hiroi, Development of High-speed 3D imaging system with electrically tunable lenses for deeper probing of subcellular structures, International Workshop on Quantitative Biology 2013, 25 th Nov. 2013, Icho-kaikan(Osaka, Suita). 3. T Matsui, N Hiroi, A Funahashi, Implementation of a spatial model simulator and its SBML support, HARMONY 2012, 21 st -25 th May 2012, Maastricht (The Netherlands) 図書 ( 計 0 件 ) その他 ホームページ等 http://fun.bio.keio.ac.jp/ 6. 研究組織 (1) 研究代表者舟橋啓 (FUNAHASHI, Akira) 慶應義塾大学 理工学部 生命情報学科 准教授研究者番号 :70324548 (2) 連携研究者広井賀子 (HIROI, Noriko) 慶應義塾大学 理工学部 生命情報学科 専任講師研究者番号 :20548408