スライド 1

Similar documents
FEM原理講座 (サンプルテキスト)

Microsoft PowerPoint - 10.pptx

09.pptx

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

行列の反復解法 1. 点 Jacobi 法 数値解法の重要な概念の一つである反復法を取り上げ 連立一次方程式 Au=b の反復解法を調べる 行列のスペクトル半径と収束行列の定義を与える 行列のスペクトル半径行列 Aの固有値の絶対値の最大値でもって 行列 Aのスペクトル半径 r(a) を与える 収束行

<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074>

PowerPoint Presentation

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - H21生物計算化学2.ppt

Microsoft PowerPoint - Eigen.ppt [互換モード]

NS NS Scalar turbulence 5 6 FEM NS Mesh (A )

行列、ベクトル

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

untitled

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

本日の講義内容 固有値 ( 線形代数 ) と応用問題 振動問題 ネットワーク定常問題 固有値計算アルゴリズム 密行列 べき乗法 ヤコビ法 ハウスホルダー三重対角 + 分割統治法 + 逆変換 疎行列 ランチョス法 ヤコビ デビッドソン法 その他 固有値計算ソフトウェア ScaLAPACK EigenE

PowerPoint プレゼンテーション

パソコンシミュレータの現状

memo

SAP11_03

数学 ⅡB < 公理 > 公理を論拠に定義を用いて定理を証明する 1 大小関係の公理 順序 (a > b, a = b, a > b 1 つ成立 a > b, b > c a > c 成立 ) 順序と演算 (a > b a + c > b + c (a > b, c > 0 ac > bc) 2 図

PowerPoint Presentation

Microsoft PowerPoint - H22制御工学I-2回.ppt

(Microsoft PowerPoint - \221\34613\211\361)

差分スキーム 物理 化学 生物現象には微分方程式でモデル化される例が多い モデルを使って現実の現象をコンピュータ上で再現することをシミュレーション ( 数値シミュレーション コンピュータシミュレーション ) と呼ぶ そのためには 微分方程式をコンピュータ上で計算できる数値スキームで近似することが必要

ボルツマンマシンの高速化

DVIOUT

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

Microsoft PowerPoint - シミュレーション工学-2010-第1回.ppt

ペタスケール計算環境に向けたFFTライブラリ

2012年度HPCサマーセミナー_多田野.pptx

åłºæœ›å•¤ï¼„åłºæœ›ã…Žã‡¯ã…‹ã…«ã†®æ±‡ã‡†æŒ¹

(Jacobi Gauss-Seidel SOR ) 1. (Theory of Iteration Method) Jacobi Gauss-Seidel SOR 2. Jacobi (Jacobi s Iteration Method) Jacobi 3. Gauss-Seide

多次元レーザー分光で探る凝縮分子系の超高速動力学

Microsoft PowerPoint - mp11-06.pptx

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

<4D F736F F F696E74202D A A814590DA904796E291E882C991CE82B782E946726F6E CC95C097F190FC8C60835C838B836F815B82C982C282A282C42E >

Microsoft PowerPoint - 2_FrontISTRと利用可能なソフトウェア.pptx

Stage 並列プログラミングを習得するためには : 1 計算機リテラシ, プログラミング言語 2 基本的な数値解析 3 実アプリケーション ( 例えば有限要素法, 分子動力学 ) のプログラミング 4 その並列化 という 4 つの段階 (stage) が必要である 本人材育成プログラムでは1~4を

スライド 1

Microsoft Word - 補論3.2

Microsoft PowerPoint - 7

リソース制約下における組込みソフトウェアの性能検証および最適化方法

Microsoft PowerPoint - 第3回2.ppt

Microsoft PowerPoint - mp13-07.pptx

Microsoft PowerPoint - H22制御工学I-10回.ppt

tabaicho3mukunoki.pptx

Microsoft Word - NumericalComputation.docx

vecrot

スライド タイトルなし

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

航空機の運動方程式

<4D F736F F F696E74202D208D E9197BF288CF68A4A B8CDD8AB B83685D>

12.pptx

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - NA03-09black.ppt

代数 幾何 < ベクトル > 1 ベクトルの演算 和 差 実数倍については 文字の計算と同様 2 ベクトルの成分表示 平面ベクトル : a x e y e x, ) ( 1 y1 空間ベクトル : a x e y e z e x, y, ) ( 1 1 z1

線型代数試験前最後の 3 日間 できるようになっておきたい計算問題 ( 特に注意 まぁ注意 ) シュミットの直交化とその行列表示 (P5) ユニタリ行列による行列の対角化 (P8) 数列, 微分方程式の解法 対角可能な条件もおさえておきたい とりあえず次の問題を ( まだやっていない人は ) やって

Microsoft PowerPoint SIGAL.ppt

Microsoft PowerPoint rev.pptx

板バネの元は固定にします x[0] は常に0です : > x[0]:=t->0; (1.2) 初期値の設定をします 以降 for 文処理のため 空集合を生成しておきます : > init:={}: 30 番目 ( 端 ) 以外については 初期高さおよび初速は全て 0 にします 初期高さを x[j]

Microsoft PowerPoint - CSA_B3_EX2.pptx

Chap2.key

Microsoft Word - 201hyouka-tangen-1.doc

PowerPoint プレゼンテーション

Microsoft PowerPoint - 夏の学校(CFD).pptx

<4D F736F F F696E74202D208CB48E7197CD8A7789EF F4882CC91E589EF8AE989E A2E B8CDD8AB B83685D>

Microsoft PowerPoint - 三次元座標測定 ppt

PowerPoint プレゼンテーション

<4D F736F F D2094F795AA95FB92F68EAE82CC89F082AB95FB E646F63>

スライド 1

Microsoft Word - thesis.doc

Microsoft PowerPoint - qcomp.ppt [互換モード]

第6章 実験モード解析

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft PowerPoint - 9.pptx

計算機シミュレーション

eq2:=m[g]*diff(x[g](t),t$2)=-s*sin(th eq3:=m[g]*diff(z[g](t),t$2)=m[g]*g-s* 負荷の座標は 以下の通りです eq4:=x[g](t)=x[k](t)+r*sin(theta(t)) eq5:=z[g](t)=r*cos(the

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

解析力学B - 第11回: 正準変換

Microsoft PowerPoint - 13approx.pptx

航空機の運動方程式

Microsoft PowerPoint - 資料04 重回帰分析.ppt

DVIOUT-SS_Ma

PowerPoint プレゼンテーション

航空機の運動方程式

<4D F736F F F696E74202D20906C8D488AC28BAB90DD8C7689F090CD8D488A D91E F1>

2011年度 筑波大・理系数学

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17)

数学の世界

画像解析論(2) 講義内容

構造力学Ⅰ第12回

工業数学F2-04(ウェブ用).pptx

連立方程式の解法

航空機の縦系モデルに対する、非線形制御の適用例

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

Transcription:

大規模連立一次方程式に対する 高並列前処理技術について 今倉暁筑波大学計算科学研究センター 共同研究者櫻井鉄也 ( 筑波大学 ), 住吉光介 ( 沼津高専 ), 松古栄夫 (KEK) 1 /49

本日のトピック 大規模連立一次方程式 のための ( 前処理付き )Krylov 部分空間法の概略について紹介する. 高並列性を考慮した前処理として, 反復法を用いた重み付き定常反復型前処理を導入し, そのパラメータを最適化手法を提案 有効性の検証を行う. 2 /49

第 1 トピック 前処理付き Krylov 部分空間法の 概略について 3 /49

連立一次方程式とその数値解法 連立一次方程式 >> 入力 : 出力 : = 連立一次方程式の数値解法 >> 直接法 : 有限回の演算で解を計算 = = A x b L U x b >> 反復法 : 解に収束する近似解列を逐次的に生成 x 0 x 1 x 2 x k-1 x k x 4 /49

連立一次方程式とその数値解法 連立一次方程式に対する反復法 >> 定常反復法 ex) Jacobi 法, Gauss-Seidel 法, SOR 法,... >> Krylov 部分空間法 ex) 共役勾配法 (CG 法 ), GMRES 法, BiCGSTAB 法,... >> その他 ex) 幾何的 / 代数的マルチグリッド法,... 5 /49

Krylov 部分空間法の概略 Krylov 部分空間法 >> 定義 :Krylov 部分空間に基づく射影法 >> 入力 : 初期近似解, 初期残差 >> 出力 : >> 反復のイメージ 6 /49

Krylov 部分空間法の概略 Krylov 部分空間法 >> アルゴリズム Input Krylov basis Approximate solution Output 7 /49

Krylov 部分空間法の概略 Krylov 部分空間法 >> アルゴリズム Input Krylov basis Krylov 部分空間 ( の基底ベクトル ) を生成 収束するまで反復 Approximate solution 何らかの条件に基づき近似解を構築 Output Krylov basis Lanczos 過程 Arnoldi 過程 双 Lanczos 過程 Approximate solution Ritz-Galerkin 条件 Petrov-Galerkin 条件 最小残差条件 8 /49

relative residual norm 宇宙磁気流体 プラズマシミュレーションワークショップ @ 千葉大学 Krylov 部分空間法の前処理の概略 Krylov 部分空間法の前処理 >> Krylov 部分空間法の収束性 一般に, 係数行列の固有値分布に依存 >> 前処理 ( 収束性の改善を図る ) 係数行列の固有値分布 収束履歴 Im Re Number of iteration 9 /49

前処理付き Krylov 部分空間法 Krylov 部分空間法 宇宙磁気流体 プラズマシミュレーションワークショップ @ 千葉大学 Krylov 部分空間法の前処理の概略 Krylov 部分空間法に対する前処理の適用 A x = x 0 x 1 x 2 x k-1 x k 1 反復の計算 (A の行列ベクトル積 + 内積, AXPY) b = A K -1 y b, x = K -1 y y 0 y 1 y k 事前準備 1 反復の計算後処理 (Aの行列ベクトル積 + Kの方程式の求解 + 内積, AXPY) 10 /49

Krylov 部分空間法の前処理の概略 理想的な前処理 >> 高速 -- 各反復での K の方程式が高速に解けること -- 事前準備 後処理のコストが小さいこと >> 高精度 -- 収束性を大きく改善出来ること ( ) >> 高並列 ( 大規模並列化を行う場合 ) -- 事前準備 後処理および前処理の適用の際の並列化効率が高いこと 11 /49

Krylov 部分空間法の前処理の概略 前処理の分類 >> 直接法に基づく前処理 -- 各反復での K の方程式が容易に解けるよう, またはを事前に計算する. 反復あたりの計算コスト小 事前準備コスト大, 行列の構造が陽的に必要 ex) ILU 前処理, 近似逆行列前処理, 多項式前処理,... >> 反復法に基づく前処理 -- 各反復でを解く代わりに, を反復法で近似的に計算する. 事前準備コスト小 or 無し, 行列の構造は不要な場合も 多くのパラメータを持つ ex) 定常反復法, GMRES 法,... 12 /49

第 2 トピック 重み付き定常反復型前処理 に対するパラメータ最適化手法の 提案 13 /49

第 2 トピックの目次 反復法に基づく前処理 重み付き定常反復型解法 >> 定常反復型解法の概略 >> 重み付き定常反復型解法の導入 パラメータ最適化手法 >> 重み付き定常反復型解法の収束性解析 >> 重み付き定常反復型前処理に対するパラメータ最適化手法の提案 数値実験 14 /49

反復法に基づく前処理 反復法に基づく前処理の概略 ( 再掲 ) >> 各反復での計算 -- 各反復でを解く代わりに, を反復法で近似的に計算する. >> メリット デメリット 事前準備コスト小 or 無し, 行列の構造は不要な場合も 多くのパラメータを持つ >> 使用される反復法の例 -- 定常反復法 : Jacobi 法, Gauss-Seidel 法, SOR 法,... -- Krylov 部分空間法 : CGNE 法, GMRES 法,... 15 /49

反復法に基づく前処理 前処理で用いる理想的な反復法 >> 高速 -- 反復法として高い収束性を持つこと ( 低精度までの収束性が良ければ OK) -- 反復あたりの計算コストが小さいこと >> 高安定 -- 残差が大きく振動しないこと ( 少ない反復回数で停止するため ) >> 高並列性 ( 大規模並列化を行う場合 ) -- 反復あたりの計算が高い並列化効率を持つこと 16 /49

第 2 トピックの目次 反復法に基づく前処理 重み付き定常反復型解法 >> 定常反復型解法の概略 >> 重み付き定常反復型解法の導入 パラメータ最適化手法 >> 重み付き定常反復型解法の収束性解析 >> 重み付き定常反復型前処理に対するパラメータ最適化手法の提案 数値実験 17 /49

重み付き定常反復型解法 定常反復型解法 >> 基本的アイディア -- 線形方程式と同値な不動点方程式 の不動点を以下の反復により求める. -- 一般には, とし, ベクトル値関数 f を と置くことで, 反復式は以下のように書かれる. 18 /49

重み付き定常反復型解法 定常反復型解法 >> 収束性 -- 反復行列のスペクトル半径に依存する. >> 収束定理 -- 定常反復型解法が任意のに対して収束するための必要十分条件は, 以下の不等式を満たすことである. -- また, その収束性は のように書ける. 19 /49

重み付き定常反復型解法 理想的な定常反復型解法 >> 高速 -- 高い収束性を持つこと ( が小さいこと ) -- 反復当たりの計算コストが小さいこと >> 高並列性 ( 大規模並列化を行う場合 ) -- 反復あたりの計算が高い並列化効率を持つこと 20 /49

重み付き定常反復型解法 定常反復型解法の例 >> 標準的な定常反復型解法 ( 定常反復法 ) -E -F D -E -F D A 解法 M N Jacobi 法 Gauss-Seidel 法 SOR 法 >> 標準的でない定常反復型解法 解法 M N ILU 型 近似逆行列型 21 /49

重み付き定常反復型解法 重み付き定常反復型解法の導入 >> 基本的アイディア : 重みパラメータを用いて収束を改善 -- 定常反復型解法の反復式 を重みパラメータを用い, のように変更することで, 収束を加速する >> 定常反復型解法の拡張 -- パラメータの時, 定常反復型解法に帰着 22 /49

第 2 トピックの目次 反復法に基づく前処理 重み付き定常反復型解法 >> 定常反復型解法の概略 >> 重み付き定常反復型解法の導入 パラメータ最適化手法 >> 重み付き定常反復型解法の収束性解析 >> 重み付き定常反復型前処理に対するパラメータ最適化手法の提案 数値実験 23 /49

重み付き定常反復型解法 重み付き定常反復型解法の収束性 >> 行列の分割 -- 係数行列を と分割した定常反復型解法とみることが出来る. >> 収束性 反復行列のスペクトル半径に依存 24 /49

重み付き定常反復型解法 重み付き定常反復型解法の収束性 >> 重みパラメータの最適値 Proposition 1: Optimal parameter を複素平面上の中心半径の円で囲まれた領域あるとし, を と定義する. この時, 以下が成り立つ. 25 /49

重み付き定常反復型解法 重み付き定常反復型解法の収束性 >> 重みパラメータの最適値 Proposition 2: Convergence condition 重み付き定常反復型解法におけるとする. この時, の最適値を となるための, 必要十分条件は, または, が満たされることである. 26 /49

パラメータ最適化手法 重み付き定常反復型前処理に対するパラメータ最適化 >> 重み付き定常反復型前処理の収束性 ( 再掲 ) Remark of Propositions 1 and 2 または 27 /49

パラメータ最適化手法 重み付き定常反復型前処理に対するパラメータ最適化 >> 重み付き定常反復型前処理の収束性 ( 再掲 ) Rough sketch 固有値分布から重みパラメータは最適化可能 28 /49

パラメータ最適化手法 重み付き定常反復型前処理に対するパラメータ最適化 >> 基本的アイディア : オフラインチューニング Input 初期近似解 行列の分割 Optimization I の固有値分布を ( 近似的に ) 計算 Optimization II 計算された固有値分布を元に, を計算 Preconditioned 近似最適パラメータを用いた重み付き定常 Krylov 反復型前処理付きKrylov 部分空間法を適用 29 /49

パラメータ最適化手法 最適化 I >> 最適化に必要な固有値 Rough sketch 外部固有値のみから重みパラメータは最適化可能固有値分布から重みパラメータは最適化可能 外部固有値の近似値を用いて最適化可能 30 /49

パラメータ最適化手法 最適化 I >> 外部固有値の近似 -- 反復法である Arnoldi 法 を利用 >> Arnoldi 法で計算される近似固有値 -- 真の固有値, 近似固有値 (10 (20 (30 (40 反復目 ) 31 /49

パラメータ最適化手法 重み付き定常反復型前処理に対するパラメータ最適化 >> 基本的アイディア : オフラインチューニング Input 初期近似解 行列の分割 Optimization I Arnoldi 法によりの固有値分布を ( の外部固有値を近似近似的に ) 計算 Optimization II 計算された固有値分布を元に, を計算 Preconditioned 近似最適パラメータを用いた重み付き定常 Krylov 反復型前処理付きKrylov 部分空間法を適用 32 /49

パラメータ最適化手法 最適化 II >> 最適な円の計算 1.0 で離散化して最適値を探す 33 /49

パラメータ最適化手法 重み付き定常反復型前処理に対するパラメータ最適化 >> 基本的アイディア : オフラインチューニング Input 初期近似解 行列の分割 Optimization I Optimization II Arnoldi 法によりの固有値分布を ( の外部固有値を近似近似的に ) 計算 計算された固有値分布を元にで離散化して最適な円, を書くを計算 Preconditioned 近似最適パラメータを用いた重み付き定常 Krylov 反復型前処理付きKrylov 部分空間法を適用 34 /49

パラメータ最適化手法 重み付き定常反復型前処理に対するパラメータ最適化 >> 具体的なアルゴリズム Optimization I 1: For l = 1, 2,, lmax の固有値分布を ( 近似的に ) 計算 2: Operate lth step of the Arnoldi method and get l approx. extreme eigenvalues 3: Compute and from computed eigenvalues 4: IF then exit 5: End For 6: Set >> 実用上のアイディア -- Arnoldi 法の反復はωの相対誤差で停止 -- 予めMの候補を設定し, M 毎にωを最適化することで, Mの選択を行うことも可能. 35 /49

第 2 トピックの目次 反復法に基づく前処理 重み付き定常反復型解法 >> 定常反復型解法の概略 >> 重み付き定常反復型解法の導入 パラメータ最適化手法 >> 重み付き定常反復型解法の収束性解析 >> 重み付き定常反復型前処理に対するパラメータ最適化手法の提案 数値実験 36 /49

数値実験 数値実験 I >> 目的 : 最適化手法の有効性を検証する >> モデル問題 -- 単位正方領域上の偏微分方程式 離散化して得られる 2500 次の実非対称連立一次方程式 37 /49

数値実験 数値実験 I >> 比較解法 -- Jacobi 法, 重み付き Jacobi 法, -- Gauss-Seidel 法, 重み付き Gauss-Seidel 法 >> 各種パラメータ -- 初期近似解 : -- Arnoldi 法の最小 / 最大反復回数 : 10 回 /20 回 -- Arnoldi 法の停止条件 : 10^-2 >> 計算機環境 -- OS: CentOS, CPU: Intel Xeon X5550 (2.67GHz), Memory: 48GB -- Compiler: GNU Fortran ver.4.1.2, Compile option: -O3 38 /49

数値実験 実験結果 I >> 収束履歴 (J, GS, W-J, W-GS) 39 /49

数値実験 数値実験 II >> 目的 : 前処理としての性能を評価する >> 比較前処理 (Krylov 部分空間解法 : BiCGSTAB 法 ) -- Jacobi 法, 重み付きJacobi 法, -- Gauss-Seidel 法, 重み付きGauss-Seidel 法 >> 各種パラメータ -- 初期近似解 : -- 前処理の反復回数 : 10 回 -- Arnoldi 法の最小 / 最大反復回数 : 10 回 /20 回 -- Arnoldi 法の停止条件 : 10^-2 40 /49

数値実験 実験結果 II >> 収束履歴 (non, J, GS, W-J, W-GS) 41 /49

数値実験 数値実験 III >> 目的 : 超新星爆発計算における有効性を検証する >> 3 次元ニュートリノ輻射輸送 [K.Sumiyoshi, 2012] -- ニュートリノ分布 ( 空間 3 次元 + ニュートリノの運動量 3 次元 ) -- Boltzmann 方程式 -- 3 次元球座標系で表現 -> 保存系に変形 42 /49

数値実験 超新星爆発計算 >> 概略 -- 時間発展 : 陰解法 -> 時間ステップ毎に大規模線形方程式の求解が必要 n 1600 万, Nnz 12.8 億, Nnz/n 80 -- 要求される時間発展 : 実時間で約 1 秒 -> 時間ステップを大きくとりたい (Δt 10-5 程度 ) -- 時間ステップを大きくすると方程式が解きにくくなる. >> 従来手法 ( 高並列性を考慮 ) -- 対角スケーリング前処理付き BiCGSTAB 法 43 /49

Number of iterations 宇宙磁気流体 プラズマシミュレーションワークショップ @ 千葉大学 数値実験 超新星爆発計算 >> 対角スケーリング前処理付き BiCGSTAB 法の収束性 did not converge Time step (Δt) 44 /49

数値実験 提案法の概略 >> 重み付き Jacobi 型前処理 -- 重みパラメータ ω を最適化 -- 対角行列 D は事前に準備した候補の中からを最小化するものを選択 45 /49

数値実験 提案法の概略 >> 各種パラメータ -- 前処理の反復回数 :10 回 -- Arnoldi 法の最小 / 最大反復回数 :10 回 / 20 回 -- Arnoldi 法の停止条件 :10^-2 -- 対角行列の候補 : 計算環境 >> KEK SR16000/M1 -- 1 node 32 cores (logical 64 cores) 46 /49

Number of iterations 宇宙磁気流体 プラズマシミュレーションワークショップ @ 千葉大学 数値実験 超新星爆発計算 >> 提案する前処理法の収束性 did not converge 100 倍程度大きな Δt の問題を同程度の反復回数で解けるようになった. Time step (Δt) >> 計算時間 -- 対角スケーリング :0.24 秒 / 反復 -- 提案前処理 :1.75 秒 / 反復 ( 最適化 4~7 秒 ) 47 /49

まとめ 今後の課題 48 /49

まとめ 今後の課題 まとめ Conclusion 高並列性を考慮した前処理として, 反復法を用いた重み付き定常反復型前処理を導入し, そのパラメータ最適化手法を提案 有効性の検証を行った. 数値実験から, 少ない計算コストで重みパラメータを最適化でき, また超新星爆発計算に対して前処理の有効性が確認された. 今後の課題 Future works 並列化効率の測定 他の前処理との比較 49 /49