HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実

Size: px
Start display at page:

Download "HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実"

Transcription

1 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 帯行列の一般化固有値問題向け分割統治法 廣田 悠輔,,a) 今村 俊幸, 概要 本稿では 実対称正定値帯行列向けの一般化固有値解法を提案する 提案法は Elsner らによって 提案された三重対角行列の一般化固有値問題の分割統治法の拡張であり 三重対角行列向け解法の統治 フェーズを繰り返し適用することで一般の帯幅の帯行列の固有値問題を解く 近年のマルチコア CPU の 普及と性能向上により マルチコア計算機に適した数値解法の重要性はますます高くなっているが 問題 を標準固有値問題に変換して解く従来法はデータ再利用性の低い演算を多く含むため マルチコア計算機 上で高い性能を実現することが難しい 一方 提案法では演算の殆どが行列積として実行され 従来法に 比べて高い実行性能が実現できる Intel Xeon E5-66 ソケットを備えるマルチコア計算機における性 能評価では 次数 の五重対角行列の一般化固有値問題を解くとき 提案法は 従来法の. 倍高速 であり 9 GFLOPS ピーク性能比 77.6% の高い性能を示すことが確認された キーワード 一般化固有値問題 三重対角行列 帯行列 分割統治法 マルチコア Divide-and-Conquer Method for Banded Generalized Eigenvalue Problems Yusue Hirota,,a) Toshiyui Imamura, Abstract: In this aer, we resent a new solution method for symmetric-ositive definite generalized eigenvalue roblems of banded matrices. The roosed method is an extension of the divide and conquer method roosed by Elsner et al., which reeats the conquer hase of the divide and conquer method for a roblem of tridiagonal matrices. Recently, numerical solution methods are required to wor efficiently on modern multicore rocessors. However, the conventional methods show on such environment since they contain many cache inefficient oerations. On the hand, the roosed method is dominated by matrix roducts thus it shows higher erformance than the conventional methods. The roosed method is. times faster than the conventional method, achieving 9 GFLOPS (77.6% of the ea erformance) on a multicore environment (two octa-core Intel Xeon E5-66 CPUs). Keywords: generalized eigenvalue roblem, tridiagonal matrix, banded matrix, divide and conquer method, multicore. はじめに ピーク性能で動作する CPU に対してデータを供給し続け るだけのメモリ帯域をもたないことが一般的である した 近年 多くの計算機においてマルチコア CPU が利用さ がって マルチコア計算機において高い性能で演算を実行 れている マルチコア CPU を備える計算機 マルチコア するためには 度メモリから読み込んだデータを CPU の 計算機 では CPU は高いピーク演算性能をもつ一方 キャッシュメモリに蓄えて再利用し メモリからのデータ のロード回数をできるだけ削減する必要がある a) 理化学研究所 計算科学研究機構 RIKEN Advanced Institute for Comutational Science, Kobe, Jaan 科学技術推進機構 戦略的創造研究推進事業 Jaan Science and Technology Agency CREST yusue.hirota@rien.j 5 Information Processing Society of Jaan 行列やベクトルの計算のデータ再利用性について考え ると ベクトルの内積や加算などのベクトル同士の演算 Level- 演算 や 行列ベクトル積 行列のランク 更新 9

2 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実現することが難しい 一方 行列 積などの行列同士の演算 演算 は 演算回数に 対して必要となるデータ量が少なく 適切にキャッシュメ モリを利用すれば 高い実行性能が実現できる したがっ て 数値計算アルゴリズムを基本行列演算の組み合わせと して構築する場合 できるだけ 演算が中心的とな るようにアルゴリズムを構築することが マルチコア計算 図 帯行列一般化固有値問題に対する解法アプローチ Fig. Solution aroaches for banded generalized eigenvalue roblems. 機で高い性能を実現するために必須となる 本稿では 半帯幅 が小さな値の実対称帯行列 A Rn n および 同じ半帯幅の実対称正定値帯行列 B R n n の一 題向けの分割統治法について述べる その中で 帯行列向 け分割統治法を提案する また 演算量 演算の種類につ いて分析し 従来法との比較を行う 第 節では 従来法 般化固有値問題 および提案法の精度および性能についてマルチコア計算機 Ax = λbx の固有値 λ 固有ベクトル x をすべて求める数値解法につ いて考える は n 組の固有値 固有ベクトル 固有 対 をもつ したがって の全固有対を求めることは を満たす対角行列 Λ R. 標準固有値問題を経由する解法 なく 両辺に左から S B-直交行列 X R n n を求 めることに等しく Λ の対角項 X の各列ベクトルがそれ ぞれ についてまとめる 一般化固有値問題 X (A λb)x = Λ λi n n 上で評価し 評価結果をもとに議論を行う 第 5 節で本稿 は A, B が帯行列か否かに関係 をかけることで (S AS )y = λy, y = S x の固有値 固有ベクトルとなる このような問 という標準固有値問題に変換することができる ただし 題に対する解法は 帯化前処理と組み合わせた密行列向け S は B = SS を満たす任意の行列である したがって 解法の部品 [] として応用可能であるほか 電子状態計算 一般化固有値問題 は コレスキー分解などにより に利用できる B SS と分解し C S AS を構成し C の標 問題 に対する解法は 図 に示されるように 様々 準固有値 固有ベクトルを求め 固有ベクトルを逆変換 なアプローチが考えられる 従来法では 赤や緑の線で示 することで解くことができる この原理に基づく解法は されるように 与えられた一般化固有値問題を標準固有値 数値計算ライブラリ LAPACK[6] に採用され DSBGV 問題に変換し 標準固有値問題を解いた結果を 一般化固 DSBGVD DSYGVD ルーチンとして実装されている 有値問題の固有ベクトルに逆変換するという手順が取ら 本節では を標準固有値問題を経由して解く つの れる しかしながら これらの解法は Level- Level- 演 解法について述べ その演算量および演算の種類について 算を多く含み マルチコア計算機で十分な性能を引き出す 分析する ことが難しい そこで 青の線で示される 中間形を経ず に直接 の一般化固有値 固有ベクトルを求めること. 行列の帯構造を利用する解法 を考える このような方法は = すなわち三重対角 本副節では 上述の原理に基づく解法のうち 行列 A, B 行列 の場合には Elsner らによって解法が提案されてお の帯構造を利用する解法について述べる このような帯構 り [] そのアルゴリズムは 演算が支配的となる 造を利用する解法は LAPACK では DSBGV DSBGVD 本研究では Elsner らの解法を の場合に拡張するこ などとして実装されている DSBGVD の解法は以下のよ とで 演算が支配的となる数値解法を新たに提案 うになる する なお Elsner らの方法とは別に [], [] で = の (i) 帯行列 B を B = SS と slit Cholesy 分解する 場合の解法が提案されているが 固有ベクトルの高精度化 手段 [5] の適用手段が確立されておらず また その解法 DPBSTF ルーチン (ii) A を C Z AZ と合同変換する ただし Z = S P の性質上 への拡張が困難であるなどの理由により であり P は C の帯幅が A に等しくなるように fill- 本稿ではこれらについては取り扱わない in を消去するような直交行列である また 同時に 本稿の構成は以下のとおりである 第 節では 標準固 Z S P を計算する DSBGST ルーチン 有値問題を経由する従来法について述べ その演算量 演 (iii) 帯行列 C を直交行列 Q によって T Q CQ と三 算の種類について分析する 第 節では 一般化固有値問 重対角行列に変換し 同時に X ZQ を計算する 5 Information Processing Society of Jaan

3 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 表 行列の帯構造を利用する解法の演算量内訳および演算の種類 表 密行列として扱う解法の演算量内訳および演算の種類 Table The number of FLOPs and the comutational attern Table The number of FLOPs and the comutational attern in the conventional method which exloits the band in the conventional method which does not exloit the structure of the matrix. band structure of the matrix. 演算量 種類 演算量 種類 ( + ) n Level- (i) /n A の変換 6n Level- および Level- (ii) n Z の計算 Level- および Level- (iii) 三重対角化 /n Level- が半分ずつ 6n Level- 分割統治法 /n Level- 逆変換 n (/)n n (i) (ii) (iii) 三重対角化 X の計算 (iv) 分割統治法 行列積 (/)n n n (iv) 変換する DTRSM ルーチン (i) から (iv) の演算量および支配的となる演算の種類を表 DSBTRD ルーチン (iv) T Q DQ と分割統治法により標準固有値問題を 解き DSTEDC ルーチン その後 行列積ルーチン DGEMM ルーチン により X X Q を計算する ことで の固有ベクトルに変換する ただし = すなわち A, B が三重対角行列 である場 合にはステップ (iii) はスキップされる (i) から (iv) の演 算量および支配的となる演算の種類を表 に示す 総演算 量は = の場合には (9/6)n + O(n ) の場合 には (/6)n + O(n ) となる そのうち 演算 は (/)n であり いずれの半帯幅 でも多くの Leve- Level- 演算が含まれる このため マルチコア計算機上 において高い性能 FLOPS 値 が得られない可能性があ る なお DSBGV は DSBGVD と同様に帯構造を利用 するが DSTEDC および DGEMM ルーチンの代わりに QR 法ルーチン DSTEQR を用いて (iv) のステップを実 行している したがって DSBGVD と同様に (ii) (iii) に おいて Level- Level- 演算が必要となり これらの部分 は同様の性能を示すと考えられる に示す 行列の帯構造を利用する解法と比べると演算量が 増大するが 標準固有値解法の三重対角化以外が 演算となるためマルチコア計算機などでより高い性能が得 られると予想され 結果的に帯構造を利用する解法より高 速に問題を解ける可能性がある. 一般化固有値問題向け分割統治法 本節では まず Elsner らによって提案された = の 帯行列 三重対角行列 向けの分割統治法アルゴリズムに ついて説明する 続いて その拡張である半帯幅が の帯行列向けの分割統治法アルゴリズムを提案し 提案法 および従来法のアルゴリズムの性質について高性能計算の 観点から議論する. 三重対角行列向け分割統治法 本副節では Elsner らの分割統治法について述べる.. 原理 三 重 対 角 行 列 A, B は 任 意 の 分 割 点 m を 定 め て bm,m+ = であれば A λb. 行列を密行列として扱う解法 問題 の A, B が帯行列であっても その疎構造を無 視して密行列として問題を解くことも可能である そのよ うな方法は LAPACK では DSYGVD などとして実装さ れており 以下の手順で の固有対を求める (i) 実対称正定値行列 B を密行列として B LL コレ スキー分解する DPOTRF ルーチン (ii) B の分解結果を A に作用させて C L AL を計 算する DSYGST ルーチン (iii) C QDQ と標準固有値問題を解く DSYGVD で 用いられる解法 DSYEVD ルーチン は C をブロッ ク化されたハウスホルダーによって三重対角化し 三 重対角行列を標準固有値問題向け分割統治法によって 固有値分解し 逆変換によって C の固有値分解に戻す という手順が取られる (iv) X = L Q を計算することで の固有ベクトルに 5 Information Processing Society of Jaan = (A A ρvv ) λ(b B vv ) () と ブ ロ ッ ク 対 角 行 列 と 共 通 の ベ ク ト ル v に よ っ て 表 現 さ れ る ラ ン ク 行 列 に 分 解 で き る た だ し A, B Rm m, A, B R(n m) (n m) であり ρ = am+,m /bm+,m v = bm+,m em sign(bm+,m ) bm+,m em+ である このような分解によって得られる B, B は正定 値行列であり A, A, B, B はそれぞれ対称三重対角行 列となる A, A, B, B が実対称かつ B, B は正定値行列である ので Yi (Ai λbi )Yi = Di λi (i =, ) () を満たす B -直交行列 Y B -直交行列 Y が存在する た

4 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 A λb = だし D, D は対角行列である したがって () の右 辺は Y = Y Y の合同変換によって (A A V EV ) λ(b B V V ) Y [(A A ρvv ) λ(b B vv )]Y = (D ρww ) λ(i ww ) を満たす 正整数 半帯幅 の実対称帯行列 A, B () Rm m A, B R(n m) (n m) 行列 V Rn 対角行 列 E R が存在する 具体的な, A, A, B, B, V, E と対角行列とランク 摂動の和に変換できる ただし D = D D w = Y v である の構成法については後述する 分解 (6) () の右辺を を満たす B, B はいずれも正定値行列である ことを示す ブロック対角行列 B B は B B = B + W [(D ρww ) λ(i ww )]W = D λi と対角化すれば () () (5) (5) より 正定値行列である B, B のいずれかが正定値行列でない と仮定する 行列 B が正定値でない場合 z B z を満 と定義すれば z (B B )z = z B z となり の解が X = Y W, Λ = D として表さ れる なお 一般化固有値問題 (5) V V T と正定値行列 B と半正定値行列 V V の和であるので たす z Rm が存在する このとき z := [z, ] Rn (Y W ) (A λb)(y W ) = D λi が成り立ち (6) は 必要に応じて減 次 デフレーション を行った後 一変数非線型方程式 secular 方程式 を解いて固有値を求め その後に対応す る固有ベクトルを計算することで解くことができる 具体 的な方法については [] を参照されたい.. アルゴリズム B B が正定値であることに矛盾する 行列 B が正定 値でない場合も同様である したがって B, B はいずれ も正定値行列である A, A, B, B が実対称かつ B, B は正定値行列である ので (Xi ) (Ai λbi )Xi = Di λi (i =, ) 以上の原理に基づく Elsner らの分割統治法は以下の手 順にまとめられる (i) 行列 A, B を () の形に分解する (ii) もとの行列よりも次数の小さな固有値問題 () を Elsner らの解法によって再帰的に解く (iii) 小さな固有値問題を解いた結果をもちいて w = Y v を計算する を満たす B -直交行列 X B -直交行列 X る ただし D, D (6) の右辺は X は対角行列である したがって := X X による合同変換で λ(b B V V )]X ei,i ui (ui ) ] = [D λ[i を求める ui (ui ) ] () (v) の固有ベクトル X = Y W を計算する と対角行列と 個のランク 行列の和に変換できる た の演算量は Y のブロック対角性を考慮する場合には だし U = (X ) V ul nm + n(n m) である したがって 常に m n/ D = D D である ここで として行列を中心付近で分割して再帰的に問題を解く場 合 総演算量は (/)n + O(n ) となる なお (iv) でデ フレーションが行われる場合 W を陽に計算せずに低次 が存在す (X ) [(A A V EV ) (iv) secular 方程式を解くことにより (5) を満たす W, D (i), (iii), (iv) の演算量はいずれも O(n ) であり (v) (7) は U の第 l 列ベクトル (W ) {[D e, u (u ) ] λ[i u (u ) ]}W = D λi (9) 元の密行列と特殊な構造をもつ疎行列の積として陰的に求 と [D e, u (u ) ] λ[i u (u ) ] を対角化 めることで (v) の行列積の演算量の削減が可能であるが する W により () の右辺を合同変換すると 本稿では W を陽に計算する場合について考えている (W ) {[D. 帯行列向け分割統治法 本副節では 一般の半帯幅 の帯行列に適用可能な分割 統治法を提案する 最初の副々節で提案法の原理について 述べ 次の副々節でアルゴリズムについて述べる = [D.. 原理 帯行列 A, B に対して m n を満たす分割点 m を定めたとき 5 Information Processing Society of Jaan ei,i ui (ui ) ] λ[i ui (ui ) ]}W ei,i ui (ui ) ] λ[i ui (ui ) ] i= i= と ランク 行列が つ少ない式に変換できる 同様の 変換

5 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 (W ) {[D ej,j uj λ[i uj ) ] ) ]}W = D λi, (uj (W ) {[D ei,i uj = X D X, D, X R (uj () が存在する ただし M (i : j, : l) は行列 M の第 i 行から (ui ) ] 第 j 行 第 列から第 l 列を取り出した (j i+) (l +) i=j λ[i ui 部分行列を意味する また D は対角行列 X は正則行列 ) ]}W (ui である このとき i=j = [D ei,i ui (ui ) ] i=j+ λ[i ui (ui ) ] V := i=j+ を j =,,..., と繰り返すことで 最終的に (X W W () W () O(m ) V S V S E := D,, V = X, V = X O(n m ) ) [(A A V EV ) λ(b B V V )](X W W () W () ) とおき A, A をそれぞれ A + V EV の B, B をそれ λi ぞれ B + V V の対角ブロックとおけば = を満たす =D という関係が得られ () (6) が成り立つことがわかる ただし S は任意の正則な の固有値 固有ベクトルは 実対角行列である Λ = D(), X = X W W () W () () 行列 S の決定方法の一つとして A, B のブロック対角 要素の修正量 と表されることがわかる.. つの帯行列の同時分割法 (6) を満たす, A, A, B, B V E の構成法につい f (S) := A( : m, : m) A F て述べる + A(m + : n, m + : n) A F 帯行列 A の分解 + B( : m, : m) B F A = A A VA VA, VA Rn () + B(m + : n, m + : n) B F = V S EV F + V () S EV () F は常に存在し 帯行列の標準固有値問題の分割統治法で用 いられており [7], [], [9] などで言及されている + V S V F + V () S V () F () B + VA VA = B B VB VB, VB Rn の自然な拡張として得られる こ をできるだけ小さくすることを考える 帯行列の標準固有 のとき A, A, B, B V = [VA, VB ] E = I O 値問題の分割統治法では 帯行列のブロック対角行列と摂 を満たす ただし I, O はそれぞれ 動行列への分解において ブロック対角要素への修正量が の単位行列 ゼロ行列を意味する したがって 上記の分 大きくなる場合に解の精度が悪化することが経験的に知ら 解を行うことで = である分解を構成できる れている 我々は予備実験で 帯行列の一般化固有値問題 を満たす分解は () は (6) 分解 () は一意ではなく また (6) 一意ではない また () を満たす分解も に示されるとおり固有ベクトル の分割統治法においても () が増大するほど解の残差ノ ルム X は + 個の行列の積として表現されるため 実際に固有 ベクトルを計算する際の演算量を減らすことを考えると ができるだけ小さな値となる分解が望まれる そこで 実 AX BXΛ F 上三角行列 := B(m+ : m+, m+ : m) の対角要 素がすべて非ゼロ すなわち が正則 であり の逆 が増大する傾向を確認しており 一般化固有値問題にお 行列と実上三角行列 := A(m + : m +, m + : m) いても修正量 () の積 の標準固有値が重複しない すなわち を防ぐために有効であると考えている そこで () が異なる対角要素をもつ という仮定の元では ヒューリスティック最小化する S の決定方法を考える は を小さく抑えることが解の精度悪化 () 非対称行列だが 固有値の重複しない実三角行列であるの V, V () の i 番目の列ベクトルをそれぞれ vi, vi で 分解 くと f (S) について 5 Information Processing Society of Jaan を とお

6 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 f (S) () () ( ei,i si,i vi (vi ) F + ei,i s i,i vi (vi ) F ) +( si,i vi (vi ) F + = s i,i vi (vi ) F ) () () ( ) () () ( ei,i + ) si,i vi (vi ) F +s i,i vi (vi ) F Algorithm Divide-and-conquer algorithm for banded generalized eigenvalue roblems : : : : 5: 6: = ( ei,i + ) ( () si,i vi F +s i,i vi F ) が成り立つ ここで 右辺が厳密に最小化されるように S uj (uj ) ]}W = D λi X X W ui (W ) ui (i = j +, j +,..., ) end for X := X (), Λ := D() A A A V EV, B B B V V Solve (Xi ) (Ai λbi )Xi = Di λi (i =, ) X := X X, D := D D, E := E ui (X ) vi (i =,,..., ) for j =,,..., do Solve (W ) {[D ej,j uj (uj ) ] λ[i 7: : 9: : を選ぶことで f (S) をヒューリスティックに最小化する 右辺の最小化は 最右辺の総和の各項を個別に最小化する (i =,..., ) を計算する ように si,i を決定すれば達成できる したがって () si,i = vi / vi (i =,,..., ) と S の対角要素を選べば 修正量 () (iv) 以下の手順を j =,,..., について繰り返すことに より 順番に W,..., W () を求め () はヒューリスティッ 繰り返し行い () の変換を に示される + 個の行列の積 の計算を進める ク最小化される が対角にゼロ要素を持つ場合や に重複固有値 ( a ) 一般化固有値問題 (9) () を [] に示され た反復法により解き D, W を求める が存在する場合でも ゼロ要素の個数や固有値の重複度に応 じたランクの分解が得られる 今 の対角要素のうち 第 ( b ) 行列積 X X W を計算する i 対角要素のみがゼロであるとする このとき B と同じ帯 ( c ) ui 構造をもつ B := B +α(em +i +em+i )(em +i +em+i ) を考えると := B (m + : m, m + + αei e i となり の第 i 対角要素に α を加えたも のになっている したがって α が非ゼロかつ が を満たす行列 V R (i = j +, j +,..., ) を 上記の手順により 最終的に Λ=D () X = X () の固有値 固有ベクトル が計算できる 以上をまとめたもの を alg. に示す なお = の場合 三重対角行列の場 味で提案法は Elsner らの分割統治法の拡張となっている A = A A V E (V ), B = B B V (V ) 次に アルゴリズムの演算量 演算の種類について考え, 対角行列 E R が存在す る したがって V = [V, α (em +i + sign(α)em+i )] n 合 に 提案法は Elsner らの分割統治法と一致し その意 重複固有値をもたない値にとられていれば (W ) ui 計算する : m + ) = る 行目は の計算 の固有値問題の求 解 A, A, B, B の計算から構成され いずれも E = E とおけば = + を満たす (6) が成り 型の演算によって求められ 演算量は O( ) となる 立つことがわかる が対角に 数のゼロ要素を持つ 行目は行列積として実行され 演算量はそれぞれ O(n ) 場合には 個だけ同様のランク 行列を加えることで となる 6 行目では 反復法による secular 方程式の求解が を満たす分解が可能である また の 支配的な演算となり [] で述べられる反復法が少ない反復 第 i 第 i 対角要素のみが重複する 重複固有値が存在す 回数で収束すれば 演算量は O(n ) となる 7 行目の行 る 場合 の第 i 対角要素がゼロである場合と同じ方 列積は j = のとき X のブロック対角性を考慮すれば 法で = + の分解を得ることができる 複数の重複が 演算量は nm + n(n m) で計算でき j のときは 存在する場合にはその重複度に応じた個数のランク 行列 密行列同士の積となり演算量は n となる = + 常に m n/ として行列を中心付近で分割して を加えることで 同様の分解が実現できる 行目の次数の低い固有値問題を提案法によって再帰的.. アルゴリズム.. で述べた原理に基づく 提案法の手順を以下に示す (i).. で述べた原理に基づき の計算を計算し の固有値問題を解いて E, V を求め (6) の A, A, B, B を計算する X, D を計算する (iii) 得られた X により () 右辺の 5 Information Processing Society of Jaan なる演算の種類をまとめたものを表 に示す このとき の総演算量は (/)( )n + O( n ) となる = となるように 行目の分解を行う場合には 総演算量は (ii) も と の 行 列 よ り 小 さ な 固 有 値 問 題 (7) を 解 き に問題を解く場合の各ステップの演算量および支配的と (/)( )n + O( n ) となる n である場合 総 演算量の第 項は無視できるため 演算の殆どすべてが 7 ui = (X ) vj 行目の行列積として実行されることになる

7 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 表 提案法の演算量内訳および演算の種類 表 Table The number of FLOPs and the comutational attern in the roosed method. Intel Xeon E5-66 コア. GFLOPS CPU 演算量 計算機環境 Table Comutational environment. Hyer-Threading 無効 ソケット 種類 の計算 O( ) メモリ の固有値問題 O( ) コンパイラ O( ) LAPACK Intel Math Kernel Library. 行目 O( ) 6 行目 O( ) 反復法 BLAS Intel Math Kernel Library. 7 行目 (/)( )n 行目 O( ) 行目 A, A, B, B の計算 6 GB Intel Fortran Comiler.. および LAPACK.5. 装で内部的に呼び出される LAPACK ルーチン DPBSTF や DSBGST など は Intel による実装 Intel を使 用している また 精度評価を行う際には 問題を帯行列. アルゴリズムの比較 表 にまとめられた つのアルゴリズムの演算量 の標準固有値問題に変換し標準固有値問題を QR 法によっ と演算の種類について比較する まず 提案法で = を て解く解法の Intel 実装 DSBGV も使用した 提 満たす分解が可能であると仮定すると 帯構造を用いる従来 案法は 行列積などの基本行列計算については BLAS ライ 法 密行列として扱う従来法 提案法の演算量はそれぞれ ブラリを用いて実装し alg. は Fortran および OenMP (/6)n +O(n ) = の場合のみ (9/6)n +O(n ) によって独自に実装した ただし alg. の 6 行目は W (/)n (/)( )n + O( n ) となる 帯構造を用 が陽に計算されるように実装した また 分割点は m と問 いる従来法の演算量は 最高次の項は 三重対角化ステッ 題を二等分するように選び alg. の 行目の小問題につ プが不要な = の場合を例外として に対して一定で いては 提案法を再帰的に適用して解いた ただし 行列 あり 低次の項のみが に伴って増大する また 密行列 の次数が 未満になった問題については LAPACK の として扱う従来法の演算量は の影響を受けない これに DSBGVD を適用して解いた 対して 提案法の演算量は最高次の項が に対して線形に テスト行列は A が半帯幅 の実対称行列 B が半帯幅 増大しており 従来法と比べて半帯幅 に対して強い依存 の実対称正定値行列を満たすようにするため 以下のよ 性がある n を仮定して演算量の最高次の項のみを比 うに乱数を用いて生成を行った { [, ) 乱数 ( i j ) ai,j =, (wise) (i = j) 較すると では提案法の演算量が最小になり では最大となる また それぞれ 演算として実行 される演算量は (/)n (/)n (/)( )n であ り 提案法のみ演算量の殆どすべてが 型演算とし て実行されることがわかる 半帯幅 では 提案法がもっとも演算量が少なく bi,j = [, ) 乱数 ( i j ). (wise) 性能面でも有利であるため 提案法の実行時間は つの従 このように生成される問題は 固有値分布がクラスタを持 来法よりも短くなると考えられる 一方 では 提 ちにくく 絶対値の極めて小さな固有値をもつ確率が低い 案法は 問題を密行列として問題を扱う従来法と比較し ため 分割統治法を適用する際に精度面で有利に働く可能 て Level- 演算の演算量が (/)n 少なく 演算 性がある しかしながら 任意の固有値分布をもつ帯構造 が (/)n n だけ多い したがって ある値以上の半 正定値性を備えたテスト行列 A, B を生成する方法が確立 帯幅の行列に対しては 従来法の実行時間がより短くなる されていないため 本実験では上記の方法で生成されたテ と予想される スト行列を使用する. 数値実験 マルチコア CPU 上で従来法および提案法の精度および 実験で使用する計算機環境は表 のとおりである. 精度評価 性能を評価する 標準固有値問題を経由する従来法の実装 本副節では Intel のみを使用した従来法の実装 には それぞれ Intel による LAPACK 実装 Intel [] DSBGV DSBGVD DSYGVD および提案法の各実装 に含まれる DSBGVD DSYGVD ルーチンを使用した について精度評価を行う n = = および = また 実行時間の内訳を評価するため 上記の実装とは としてテスト行列を作成し 求めた近似固有対の精度を 別に による LAPACK 実装の DSBGVD および 以下に定義される相対残差 近似固有ベクトルの B-直交 DSYGVD 各ルーチンのソースコードを修正して時間計測 性 QR 法を利用する従来法 DSBGV を基準にした解法 機能を付加した実装を作成した ただし 時間計測付き実 間の近似固有値の最大相対誤差 5 Information Processing Society of Jaan 5

8 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 Relative residual B-orthogonality Maximum error.e-9.e-.e-.e-.e-.e- TOTAL E-5.E-6 DSBGV 図 DSBGVD DSYGVD Proosed method 固有値 固有ベクトルの精度 n =, = DPBSTF DSBGST DSTEDC DGEMM 6 図 DSBGVD の実行時間 n =, = Fig. The execution time of DSBGVD (n =, = ). Fig. The accuracy of the comuted eigenvalues and eigenvectors (n =, = ). TOTAL 6 DPOTRF DSYGST DSYEVD DTRSM Relative residual B-orthogonality Maximum error 5.E-.E-9.E-.E-.E-.E-.E-5 図 5.E-6 DSBGV DSYGVD Proosed method 固有値 固有ベクトルの精度 n =, = Fig. The accuracy of the comuted eigenvalues and eigenvectors (n =, = ). (DSBGV) λj λj max j (DSBGV) λj (DSBGV) によって評価する ここで λj (j =,,..., n) は DSBGV によって求められた近似固有値である 6 DSYGVD の実行時間 n =, = DGEMM solution of seqular equations AX BXΛ F X BX I F,, A F n Fig. 5 The execution time of DSYGVD (n =, = ). 図 DSBGVD 6 図 6 6 提案法の実行時間 n =, = Fig. 6 The execution time of the roosed method (n =, = ). く増大しており 実行時間の強い 依存性が確認できる 次に スレッド数の増大による加速についてみてみる 評価結果を図 に示す いずれの解法も同程度の相 と 帯構造を用いる従来法の実装は殆ど加速されないこと 対残差 B-直交性 固有値の最大相対誤差を示しており が確認できる また DSYGVD では スレッド数の増加 提案法は 三重対角行列 五重対角行列のいずれに対して によって性能は向上しているものの Level- 演算を含む も実用的な精度の解が得られていることが確認できる DSYEVD が性能上のボトルネックになり 6 スレッド実 行時の逐次実行時に対する加速率は = の場合に 9. 倍. 性能評価 となっている 一方 提案法は順調にスケールし 6 ス 半帯幅を =, 行列の次数 n = として 各実 レッド実行時の加速率は = の場合に. 倍となって 装を 6 スレッドで実行し 実行時間およびそ いる 従来法に対する加速率は 並列実行時に逐次実行時 の内訳を調べる = の場合の各実装の評価結果を図, よりも高く 提案法のマルチコア計算機における優位性を 5, 6 に = の場合の結果を図 7,, 9 に示す 確認できる 半帯幅の異なる つのテスト問題の実行結果を比較する また いずれのスレッド数で比較した場合でも 提案法 と DSBGVD 図 7 では = の場合に比べて = は =, の両問題で実行時間が従来法より短く での実行時間が増大しているが これは = の場合のみ では従来法より高速であるという副節. の予想に合致す スキップされる三重対角化ステップ DSBTRD ルーチン る結果となった の実行時間が = では加わったことが大きく影響してい る また DSYGVD 図 5 の実行時間は殆ど半帯幅 5. おわりに の影響を受けないことが確認できる 提案法 図 6 9 三重対角行列の一般化固有値問題向け分割統治法をもと は = のときの実行時間が = の場合に比べて大き に 帯行列の一般化固有値問題向け分割統治法を提案した 5 Information Processing Society of Jaan 6

9 HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 TOTAL DPBSTF DSBGST DSBTRD DSTEDC DGEMM ンジンの開発 の援助を受けている スケールに対応した階層モデルによる超並列固有値解析エ 6 参考文献 [] 6 図 7 DSBGVD の実行時間 n =, = [] Fig. 7 The execution time of DSBGVD (n =, = ). TOTAL 6 DPOTRF DSYGST DSYEVD DTRSM [] 5 [] 図 6 DSYGVD の実行時間 n =, = Fig. The execution time of DSYGVD (n =, = ). DGEMM solution of seqular equations [6] 5 [5] 5 5 図 9 6 [7] 提案法の実行時間 n =, = Fig. 9 The execution time of the roosed method (n = [], = ). [9] 提案法の演算量は問題の半帯幅 に比例して増大するが では 帯行列の標準固有値問題を経由して解く従来 法と比べても演算量が少ない また 演算の殆どが行列積 として実行される 次数 の三重対角行列 五重対角 行列の一般化固有値問題をマルチコア計算機上で解いて性 能を評価し 提案法は従来法に対して三重対角行列では 6.6 [] Du, L. and Imaura, A.: Reducing Two Symmetric Matrices to Band Form by Congruence Transformations, 日 本応用数理学会 年度年会 予稿集 (). Elsner, L., Fasse, A. and Langmann, E.: A divide-andconquer method for the tridiagonal generalized eigenvalue roblem, Journal of comutational and alied mathematics, Vol. 6, No.,. (997). Beattie, C., Ribbens, C. J., Dongarra, J., Kennedy, K., Mesina, P., Sorensen, D. and Voight, R.: Parallel solution of a generalized symmetric matrix eigenvalue roblem, Proceedings of the Fifth SIAM Conference on Parallel Processing for Scientific Comuting, Society for Industrial and Alied Mathematics,. 6 (99). Borges, C. F. and Gragg, W. B.: A arallel divide and conquer algorithm for the generalized real symmetric definite tridiagonal eigenroblem, Technical reort, DTIC Document (99). Gu, M. and Eisenstat, S. C.: A stable and efficient algorithm for the ran-one modification of the symmetric eigenroblem, SIAM Journal on Matrix Analysis and Alications, Vol. 5, No., (99). Anderson, E., Bai, Z., Bischof, C., Blacford, S., Demmel, J., Dongarra, J., Du Croz, J., Greenbaum, A., Hammarling, S., McKenney, A. and Sorensen, D.: LAPACK Users Guide, Society for Industrial and Alied Mathematics, Philadelhia, PA, third edition (999). Arbenz, P.: Divide and conquer algorithms for the bandsymmetric eigenvalue roblem, Parallel comuting, Vol., No.,. 5 (99). Gansterer, W. N., Schneid, J. and Ueberhuber, C. W.: A Divide-and-Conquer Method for Symmetric Banded Eigenroblems-Part I: Theoretical Results (999). Pham, H. P., Imamura, T., Yamada, S. and Machida, M.: Novel aroach in a divide and conquer algorithm for eigenvalue roblems of real symmetric band matrices, Proc. Joint Int. Conf. Suecomuting in Nuclear Alications + Monte Carlo (SNA+MC),. 7 (). Intel Math Kernel Library (online): htts://software. intel.com/en-us/intel-ml (5..5). 倍 五重対角行列では約. 倍高速であり その優位性が 確認できた 今後の課題としては 任意の固有値分布のテスト行列生 成手法の確立後 固有値が密集する問題や 絶対値の小さ な固有値が存在する問題に対する提案法の精度評価があげ られる 謝辞 本論文に対して数々の貴重なコメントを頂いた匿 名の査読者に深い感謝の意を表す 本稿執筆にあたり多く の有用な意見を頂いた深谷猛氏 北海道大学 に深く感謝 する 本稿の図の作成の一部を支援して頂いた椋木大地氏 理化学研究所計算科学研究機構 にお礼申し上げる 本研究は 科学技術振興機構戦略的創造研究推進事業研 究領域 ポストペタスケール高性能計算に資するシステム ソフトウェア技術の創出 における研究課題 ポストペタ 5 Information Processing Society of Jaan 7

09.pptx

09.pptx 講義内容 数値解析 第 9 回 5 年 6 月 7 日 水 理学部物理学科情報理学コース. 非線形方程式の数値解法. はじめに. 分法. 補間法.4 ニュートン法.4. 多変数問題への応用.4. ニュートン法の収束性. 連立 次方程式の解法. 序論と行列計算の基礎. ガウスの消去法. 重対角行列の場合の解法項目を変更しました.4 LU 分解法.5 特異値分解法.6 共役勾配法.7 反復法.7. ヤコビ法.7.

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

行列、ベクトル

行列、ベクトル 行列 (Mtri) と行列式 (Determinnt). 行列 (Mtri) の演算. 和 差 積.. 行列とは.. 行列の和差 ( 加減算 ).. 行列の積 ( 乗算 ). 転置行列 対称行列 正方行列. 単位行列. 行列式 (Determinnt) と逆行列. 行列式. 逆行列. 多元一次連立方程式のコンピュータによる解法. コンピュータによる逆行列の計算.. 定数項の異なる複数の方程式.. 逆行列の計算

More information

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 10.pptx m u. 固有値とその応用 8/7/( 水 ). 固有値とその応用 固有値と固有ベクトル 行列による写像から固有ベクトルへ m m 行列 によって線形写像 f : R R が表せることを見てきた ここでは 次元平面の行列による写像を調べる とし 写像 f : を考える R R まず 単位ベクトルの像 u y y f : R R u u, u この事から 線形写像の性質を用いると 次の格子上の点全ての写像先が求まる

More information

Microsoft PowerPoint - Eigen.ppt [互換モード]

Microsoft PowerPoint - Eigen.ppt [互換モード] 固有値解析 中島研吾 東京大学情報基盤センター同大学院情報理工学系研究科数理情報学専攻数値解析 ( 科目番号 58) 行列の固有値問題 べき乗法 対称行列の固有値計算法 Eige Eige A 行列の固有値問題 標準固有値問題 (Stdrd Eigevle Problem を満足する と を求める : 固有値 (eigevle) : 固有ベクトル (eigevetor) 一般固有値問題 (Geerl

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

本日の講義内容 固有値 ( 線形代数 ) と応用問題 振動問題 ネットワーク定常問題 固有値計算アルゴリズム 密行列 べき乗法 ヤコビ法 ハウスホルダー三重対角 + 分割統治法 + 逆変換 疎行列 ランチョス法 ヤコビ デビッドソン法 その他 固有値計算ソフトウェア ScaLAPACK EigenE

本日の講義内容 固有値 ( 線形代数 ) と応用問題 振動問題 ネットワーク定常問題 固有値計算アルゴリズム 密行列 べき乗法 ヤコビ法 ハウスホルダー三重対角 + 分割統治法 + 逆変換 疎行列 ランチョス法 ヤコビ デビッドソン法 その他 固有値計算ソフトウェア ScaLAPACK EigenE Computer simulations create the future 固有値計算法 RIKEN AICS HPC Spring School 今村俊幸理化学研究所 AICS 2014/3/6 9:00~12:00 本日の講義内容 固有値 ( 線形代数 ) と応用問題 振動問題 ネットワーク定常問題 固有値計算アルゴリズム 密行列 べき乗法 ヤコビ法 ハウスホルダー三重対角 + 分割統治法 +

More information

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 10.pptx 0. 固有値とその応用 固有値と固有ベクトル 2 行列による写像から固有ベクトルへ m n A : m n n m 行列によって線形写像 f R R A が表せることを見てきた ここでは 2 次元平面の行列による写像を調べる 2 = 2 A 2 2 とし 写像 まず 単位ベクトルの像を求める u 2 x = v 2 y f : R A R を考える u 2 2 u, 2 2 0 = = v 2 0

More information

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司 4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司 3 1 1 日本原子力研究開発機構システム計算科学センター 2 理科学研究所計算科学研究機構 3 東京大学新領域創成科学研究科

More information

12.pptx

12.pptx 数値解析 第 1 回 15 年 7 月 8 日 水 ) 理学部物理学科情報理学コース 1 講義内容 1. 非線形方程式の数値解法 1.1 はじめに 1. 分法 1.3 補間法 1.4 ニュートン法 1.4.1 多変数問題への応用 1.4. ニュートン法の収束性. 連立 1 次方程式の解法.1 序論と行列計算の基礎. ガウスの消去法.3 3 重対角行列の場合の解法.4 LU 分解法.5 特異値分解法.6

More information

航空機の運動方程式

航空機の運動方程式 可制御性 可観測性. 可制御性システムの状態を, 適切な操作によって, 有限時間内に, 任意の状態から別の任意の状態に移動させることができるか否かという特性を可制御性という. 可制御性を有するシステムに対し, システムは可制御である, 可制御なシステム という言い方をする. 状態方程式, 出力方程式が以下で表されるn 次元 m 入力 r 出力線形時不変システム x Ax u y x Du () に対し,

More information

Microsoft Word - thesis.doc

Microsoft Word - thesis.doc 剛体の基礎理論 -. 剛体の基礎理論初めに本論文で大域的に使用する記号を定義する. 使用する記号トルク撃力力角運動量角速度姿勢対角化された慣性テンソル慣性テンソル運動量速度位置質量時間 J W f F P p .. 質点の並進運動 質点は位置 と速度 P を用いる. ニュートンの運動方程式 という状態を持つ. 但し ここでは速度ではなく運動量 F P F.... より質点の運動は既に明らかであり 質点の状態ベクトル

More information

memo

memo 数理情報工学特論第一 機械学習とデータマイニング 4 章 : 教師なし学習 3 かしまひさし 鹿島久嗣 ( 数理 6 研 ) kashima@mist.i.~ DEPARTMENT OF MATHEMATICAL INFORMATICS 1 グラフィカルモデルについて学びます グラフィカルモデル グラフィカルラッソ グラフィカルラッソの推定アルゴリズム 2 グラフィカルモデル 3 教師なし学習の主要タスクは

More information

tabaicho3mukunoki.pptx

tabaicho3mukunoki.pptx 1 2 はじめに n 目的 4倍精度演算より高速な3倍精度演算を実現する l 倍精度では足りないが4倍精度は必要ないケースに欲しい l 4倍精度に比べてデータサイズが小さい Ø 少なくともメモリ律速な計算では4倍精度よりデータ 転送時間を減らすことが可能 Ø PCIeやノード間通信がボトルネックとなりやすい GPUクラスタ環境に有効か n 研究概要 l DD型4倍精度演算 DD演算 に基づく3倍精度演算

More information

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17)

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17) 経済数学演習問題 8 年 月 9 日 I a, b, c R n に対して a + b + c a + b + c + a, b + b, c + a, c が成立することを示しましょう. 線型代数学 教科書 ページ 演習.7 II a R n がすべての x R n に対して垂直, すなわち a, x x R n が成立するとします. このとき a となることを示しましょう. 線型代数学 教科書

More information

修士論文

修士論文 AVX を用いた倍々精度疎行列ベクトル積の高速化 菱沼利彰 1 藤井昭宏 1 田中輝雄 1 長谷川秀彦 2 1 工学院大学 2 筑波大学 1 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算 - 4. 実験 - 倍々精度疎行列ベクトル積 - 5. まとめ 多倍長精度計算フォーラム 2 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算

More information

年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium HPCS // v i R n λ i [], [], [], [] 3 BI [6] MRRR (Multiple Relatively Robust Representation

年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium HPCS // v i R n λ i [], [], [], [] 3 BI [6] MRRR (Multiple Relatively Robust Representation 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium HPCS //,,a),b),c) 3 - Multiple Relatively Robust Representation MRRR MRRR Reorthogonalized Bloc Inverse Iteration Algorithm for Parallel Computation of

More information

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint - mp11-06.pptx 数理計画法第 6 回 塩浦昭義情報科学研究科准教授 shioura@dais.is.tohoku.ac.jp http://www.dais.is.tohoku.ac.jp/~shioura/teaching 第 5 章組合せ計画 5.2 分枝限定法 組合せ計画問題 組合せ計画問題とは : 有限個の もの の組合せの中から, 目的関数を最小または最大にする組合せを見つける問題 例 1: 整数計画問題全般

More information

Matrix and summation convention Kronecker delta δ ij 1 = 0 ( i = j) ( i j) permutation symbol e ijk = (even permutation) (odd permutation) (othe

Matrix and summation convention Kronecker delta δ ij 1 = 0 ( i = j) ( i j) permutation symbol e ijk = (even permutation) (odd permutation) (othe Matr ad summato covto Krockr dlta δ ( ) ( ) prmutato symbol k (v prmutato) (odd prmutato) (othrs) gvalu dtrmat dt 6 k rst r s kt opyrght s rsrvd. No part of ths documt may b rproducd for proft. 行列 行 正方行列

More information

Microsoft Word - NumericalComputation.docx

Microsoft Word - NumericalComputation.docx 数値計算入門 武尾英哉. 離散数学と数値計算 数学的解法の中には理論計算では求められないものもある. 例えば, 定積分は, まずは積分 ( 被積分関数の原始関数をみつけること できなければ値を得ることはできない. また, ある関数の所定の値における微分値を得るには, まずその関数の微分ができなければならない. さらに代数方程式の解を得るためには, 解析的に代数方程式を解く必要がある. ところが, これらは必ずしも解析的に導けるとは限らない.

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

PowerPoint Presentation

PowerPoint Presentation 付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像

More information

( ) 5 Reduction ( ) A M n (C) Av = λv (v 0) (11.1) λ C A (eigenvalue) v C n A λ (eigenvector) M n (R) A λ(a) A M n (R) n A λ

( ) 5 Reduction ( ) A M n (C) Av = λv (v 0) (11.1) λ C A (eigenvalue) v C n A λ (eigenvector) M n (R) A λ(a) A M n (R) n A λ 125 11 ( ) 5 Reduction 11.1 11.1.1 ( ) A M n (C) Av = λv (v 0) (11.1) λ C A (eigenvalue) v C n A λ (eigenvector) M n (R) A λ(a) 11.1.2 A M n (R) n A λi = 0 A C n 5 126 11 A n λ 1 (A) λ 2 (A) λ n (A) A

More information

<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074>

<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074> 発表の流れ SSE を用いた反復解法ライブラリ Lis 4 倍精度版の高速化 小武守恒 (JST 東京大学 ) 藤井昭宏 ( 工学院大学 ) 長谷川秀彦 ( 筑波大学 ) 西田晃 ( 中央大学 JST) はじめに 4 倍精度演算について Lisへの実装 SSEによる高速化 性能評価 スピード 収束 まとめ はじめに クリロフ部分空間法たとえば CG 法は, 理論的には高々 n 回 (n は係数行列の次元数

More information

A Feasibility Study of Direct-Mapping-Type Parallel Processing Method to Solve Linear Equations in Load Flow Calculations Hiroaki Inayoshi, Non-member

A Feasibility Study of Direct-Mapping-Type Parallel Processing Method to Solve Linear Equations in Load Flow Calculations Hiroaki Inayoshi, Non-member A Feasibility Study of Direct-Mapping-Type Parallel Processing Method to Solve Linear Equations in Load Flow Calculations Hiroaki Inayoshi, Non-member (University of Tsukuba), Yasuharu Ohsawa, Member (Kobe

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP InfiniBand ACP 1,5,a) 1,5,b) 2,5 1,5 4,5 3,5 2,5 ACE (Advanced Communication for Exa) ACP (Advanced Communication Primitives) HPC InfiniBand ACP InfiniBand ACP ACP InfiniBand Open MPI 20% InfiniBand Implementation

More information

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�) Cellulr uo nd heir eigenlues 東洋大学総合情報学部 佐藤忠一 Tdzu So Depren o Inorion Siene nd rs Toyo Uniersiy. まえがき 一次元セルオ-トマトンは数学的には記号列上の行列の固有値問題である 固有値問題の行列はふつう複素数体上の行列である 量子力学における固有値問題も無限次元ではあるが関数環上の行列でその成分は可換環である

More information

【FdData中間期末過去問題】中学数学2年(連立方程式計算/加減法/代入法/係数決定)

【FdData中間期末過去問題】中学数学2年(連立方程式計算/加減法/代入法/係数決定) FdData 中間期末 : 中学数学 年 : 連立方程式計算 [ 元 1 次方程式 / 加減法 / 代入法 / 加減法と代入法 / 分数などのある連立方程式 / A=B=C, 元連立方程式 / 係数の決定 ] [ 数学 年 pdf ファイル一覧 ] 元 1 次方程式 次の方程式ア~カの中から, 元 1 次方程式をすべて選べ ア y = 6 イ x y = 5 ウ xy = 1 エ x + 5 = 9

More information

スライド タイトルなし

スライド タイトルなし 線形代数 演習 (008 年度版 ) 008/5/6 線形代数 演習 Ⅰ コンピュータ グラフィックス, 次曲面と線形代数指南書第七の巻 直交行列, 実対称行列とその対角化, 次曲線池田勉龍谷大学理工学部数理情報学科 実行列, 正方行列, 実対称行列, 直交行列 a a N A am a MN 実行列 : すべての成分 a が実数である行列 ij ji ij 正方行列 : 行の数と列の数が等しい (

More information

ペタスケール計算環境に向けたFFTライブラリ

ペタスケール計算環境に向けたFFTライブラリ A01 高橋班 大規模並列環境における 数値計算アルゴリズム 研究代表者 : 高橋大介 筑波大学大学院システム情報工学研究科 研究組織 研究代表者 高橋大介 ( 筑波大学 ): 研究統括および高速アルゴリズム 研究分担者 今村俊幸 ( 電気通信大学 ): 性能チューニング 多田野寛人 ( 筑波大学 ): 大規模線形計算 連携研究者 佐藤三久 ( 筑波大学 ): 並列システムの性能評価 朴泰祐 ( 筑波大学

More information

Microsoft PowerPoint - H21生物計算化学2.ppt

Microsoft PowerPoint - H21生物計算化学2.ppt 演算子の行列表現 > L いま 次元ベクトル空間の基底をケットと書くことにする この基底は完全系を成すとすると 空間内の任意のケットベクトルは > > > これより 一度基底を与えてしまえば 任意のベクトルはその基底についての成分で完全に記述することができる これらの成分を列行列の形に書くと M これをベクトル の基底 { >} による行列表現という ところで 行列 A の共役 dont 行列は A

More information

PowerPoint Presentation

PowerPoint Presentation 応用数学 Ⅱ (7) 7 連立微分方程式の立て方と解法. 高階微分方程式による解法. ベクトル微分方程式による解法 3. 演算子による解法 連立微分方程式 未知数が複数個あり, 未知数の数だけ微分方程式が与えられている場合, これらを連立微分方程式という. d d 解法 () 高階微分方程式化による解法 つの方程式から つの未知数を消去して, 未知数が つの方程式に変換 のみの方程式にするために,

More information

DVIOUT

DVIOUT 最適レギュレータ 松尾研究室資料 第 最適レギュレータ 節時不変型無限時間最適レギュレータ 状態フィードバックの可能な場合の無限時間問題における最適レギュレータについて確定系について説明する. ここで, レギュレータとは状態量をゼロにするようなコントローラのことである. なぜ, 無限時間問題のみを述べるかという理由は以下のとおりである. 有限時間の最適レギュレータ問題の場合の最適フィードバックゲインは微分方程式の解から構成される時間関数として表現される.

More information

アルゴリズムとデータ構造

アルゴリズムとデータ構造 講義 アルゴリズムとデータ構造 第 2 回アルゴリズムと計算量 大学院情報科学研究科情報理工学専攻情報知識ネットワーク研究室喜田拓也 講義資料 2018/5/23 今日の内容 アルゴリズムの計算量とは? 漸近的計算量オーダーの計算の方法最悪計算量と平均計算量 ポイント オーダー記法 ビッグオー (O), ビッグオメガ (Ω), ビッグシータ (Θ) 2 お風呂スケジューリング問題 お風呂に入る順番を決めよう!

More information

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生 0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生まれ, コンピューテーショナルフォトグラフィ ( 計算フォトグラフィ ) と呼ばれている.3 次元画像認識技術の計算フォトグラフィへの応用として,

More information

COMPUTING THE LARGEST EMPTY RECTANGLE

COMPUTING THE LARGEST EMPTY RECTANGLE COMPUTING THE LARGEST EMPTY RECTANGLE B.Chazelle, R.L.Drysdale and D.T.Lee SIAM J. COMPUT Vol.15 No.1, February 1986 2012.7.12 TCS 講究関根渓 ( 情報知識ネットワーク研究室 M1) Empty rectangle 内部に N 個の点を含む領域長方形 (bounding

More information

行列の反復解法 1. 点 Jacobi 法 数値解法の重要な概念の一つである反復法を取り上げ 連立一次方程式 Au=b の反復解法を調べる 行列のスペクトル半径と収束行列の定義を与える 行列のスペクトル半径行列 Aの固有値の絶対値の最大値でもって 行列 Aのスペクトル半径 r(a) を与える 収束行

行列の反復解法 1. 点 Jacobi 法 数値解法の重要な概念の一つである反復法を取り上げ 連立一次方程式 Au=b の反復解法を調べる 行列のスペクトル半径と収束行列の定義を与える 行列のスペクトル半径行列 Aの固有値の絶対値の最大値でもって 行列 Aのスペクトル半径 r(a) を与える 収束行 行列の反復解法 1. 点 Jacobi 法 数値解法の重要な概念の一つである反復法を取り上げ 連立一次方程式 Au=b の反復解法を調べる 行列のスペクトル半径と収束行列の定義を与える 行列のスペクトル半径行列 Aの固有値の絶対値の最大値でもって 行列 Aのスペクトル半径 r(a) を与える 収束行列 B が正方行列で のとき B を収束行列と呼ぶ 定理収束行列のスペクトル半径は である 簡単な証明もし

More information

Microsoft PowerPoint rev.pptx

Microsoft PowerPoint rev.pptx 研究室紹介 卒業研究テーマ紹介 木村拓馬 佐賀大学理工学部知能情報システム学科第 2 研究グループ 第 2 研究グループ -- 木村拓馬 : 卒業研究テーマ紹介 (2016/2/16) 1/15 木村の専門分野 応用数学 ( 数値解析 最適化 ) 内容 : 数学 + 計算機 数学の理論に裏付けされた 良い 計算方法 良さ を計算機で検証する方法について研究 目標は でかい 速い 正確 第 2 研究グループ

More information

H AB φ A,1s (r r A )Hφ B,1s (r r B )dr (9) S AB φ A,1s (r r A )φ B,1s (r r B )dr (10) とした (S AA = S BB = 1). なお,H ij は共鳴積分 (resonance integra),s ij は重

H AB φ A,1s (r r A )Hφ B,1s (r r B )dr (9) S AB φ A,1s (r r A )φ B,1s (r r B )dr (10) とした (S AA = S BB = 1). なお,H ij は共鳴積分 (resonance integra),s ij は重 半経験量子計算法 : Tight-binding( 強結合近似 ) 計算の基礎 1. 基礎 Tight-binding 近似 ( 強結合近似, TB 近似あるいは TB 法などとも呼ばれる ) とは, 電子が強く拘束されており隣り合う軌道へ自由に移動できない, とする近似であり, 自由電子近似とは対極にある. 但し, 軌道間はわずかに重なり合っているので, 全く飛び移れないわけではない. Tight-binding

More information

211 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium 211 HPCS /1/18 a a 1 a 2 a 3 a a GPU Graphics Processing Unit GPU CPU GPU GPGPU G

211 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium 211 HPCS /1/18 a a 1 a 2 a 3 a a GPU Graphics Processing Unit GPU CPU GPU GPGPU G 211 年ハイパフォーマンスコンピューティングと計算科学シンポジウム Computing Symposium 211 HPCS211 211/1/18 GPU 4 8 BLAS 4 8 BLAS Basic Linear Algebra Subprograms GPU Graphics Processing Unit 4 8 double 2 4 double-double DD 4 4 8 quad-double

More information

スライド 1

スライド 1 大規模連立一次方程式に対する 高並列前処理技術について 今倉暁筑波大学計算科学研究センター 共同研究者櫻井鉄也 ( 筑波大学 ), 住吉光介 ( 沼津高専 ), 松古栄夫 (KEK) 1 /49 本日のトピック 大規模連立一次方程式 のための ( 前処理付き )Krylov 部分空間法の概略について紹介する. 高並列性を考慮した前処理として, 反復法を用いた重み付き定常反復型前処理を導入し, そのパラメータを最適化手法を提案

More information

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1> 3 三次における行列 要旨高校では ほとんど 2 2 の正方行列しか扱ってなく 三次の正方行列について考えてみたかったため 数 C で学んだ定理を三次の正方行列に応用して 自分たちで仮説を立てて求めていったら 空間における回転移動を表す行列 三次のケーリー ハミルトンの定理 三次における逆行列を求めたり 仮説をたてることができた. 目的 数 C で学んだ定理を三次の正方行列に応用する 2. 概要目的の到達点として

More information

受信機時計誤差項の が残ったままであるが これをも消去するのが 重位相差である. 重位相差ある時刻に 衛星 から送られてくる搬送波位相データを 台の受信機 でそれぞれ測定する このとき各受信機で測定された衛星 からの搬送波位相データを Φ Φ とし 同様に衛星 からの搬送波位相データを Φ Φ とす

受信機時計誤差項の が残ったままであるが これをも消去するのが 重位相差である. 重位相差ある時刻に 衛星 から送られてくる搬送波位相データを 台の受信機 でそれぞれ測定する このとき各受信機で測定された衛星 からの搬送波位相データを Φ Φ とし 同様に衛星 からの搬送波位相データを Φ Φ とす RTK-GPS 測位計算アルゴリズム -FLOT 解 - 東京海洋大学冨永貴樹. はじめに GPS 測量を行う際 実時間で測位結果を得ることが出来るのは今のところ RTK-GPS 測位のみである GPS 測量では GPS 衛星からの搬送波位相データを使用するため 整数値バイアスを決定しなければならず これが測位計算を複雑にしている所以である この整数値バイアスを決定するためのつの方法として FLOT

More information

テンソル ( その ) テンソル ( その ) スカラー ( 階のテンソル ) スカラー ( 階のテンソル ) 階数 ベクトル ( 階のテンソル ) ベクトル ( 階のテンソル ) 行列表現 シンボリック表現 [ ]

テンソル ( その ) テンソル ( その ) スカラー ( 階のテンソル ) スカラー ( 階のテンソル ) 階数 ベクトル ( 階のテンソル ) ベクトル ( 階のテンソル ) 行列表現 シンボリック表現 [ ] Tsor th-ordr tsor by dcl xprsso m m Lm m k m k L mk kk quott rul by symbolc xprsso Lk X thrd-ordr tsor cotrcto j j Copyrght s rsrvd. No prt of ths documt my b rproducd for proft. テンソル ( その ) テンソル ( その

More information

2017 (413812)

2017 (413812) 2017 (413812) Deep Learning ( NN) 2012 Google ASIC(Application Specific Integrated Circuit: IC) 10 ASIC Deep Learning TPU(Tensor Processing Unit) NN 12 20 30 Abstract Multi-layered neural network(nn) has

More information

レッスン15  行列とグラフ

レッスン15  行列とグラフ レッスン 15 行列とグラフ このレッスンでは行列のグラフを定義し 簡単な応用例として 行列のグラフの強連結性 ( 各頂点から他のすべての頂点に至る道が存在する ) 行列の既約性 ( 順列行列相似変換による ブロック三角行列化が不可能 ) およびこの事実の 2 次元境界値問題の差分法による解法への応用をのべる グラフ理論入門のつもりで読んで頂きたい 15.1 行列のグラフ 与えられた次正方行列 =

More information

Microsoft PowerPoint - H22制御工学I-2回.ppt

Microsoft PowerPoint - H22制御工学I-2回.ppt 制御工学 I 第二回ラプラス変換 平成 年 4 月 9 日 /4/9 授業の予定 制御工学概論 ( 回 ) 制御技術は現在様々な工学分野において重要な基本技術となっている 工学における制御工学の位置づけと歴史について説明する さらに 制御システムの基本構成と種類を紹介する ラプラス変換 ( 回 ) 制御工学 特に古典制御ではラプラス変換が重要な役割を果たしている ラプラス変換と逆ラプラス変換の定義を紹介し

More information

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 = / 平成 9 年 月 日 ( 金 午前 時 5 分第三章フェルミ量子場 : スピノール場 ( 次元あり 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (.8 より ˆ ( ( ( q -, ( ( c ( H c c ë é ù û - Ü + c ( ( - に限る (. である 一方 フェルミ型は 成分をもち その成分を,,,,

More information

Microsoft PowerPoint SIGAL.ppt

Microsoft PowerPoint SIGAL.ppt アメリカン アジアンオプションの 価格の近似に対する 計算幾何的アプローチ 渋谷彰信, 塩浦昭義, 徳山豪 ( 東北大学大学院情報科学研究科 ) 発表の概要 アメリカン アジアンオプション金融派生商品の一つ価格付け ( 価格の計算 ) は重要な問題 二項モデルにおける価格付けは計算困難な問題 目的 : 近似精度保証をもつ近似アルゴリズムの提案 アイディア : 区分線形関数を計算幾何手法により近似 問題の説明

More information

C言語による数値計算プログラミング演習

C言語による数値計算プログラミング演習 5. 行列の固有値問題 n n 正方行列 A に対する n 個の固有値 λ i (i=1,,,n) と対応する固有ベクトル u i は次式を満たす Au = λ u i i i a11 a1 L a1 n u1i a1 a a n u i A =, ui = M O M M an 1 an L ann uni これらはまとめて, つぎのように書ける 5.1 ヤコビ法 = Λ, = [ u1 u u

More information

数学の世界

数学の世界 東京女子大学文理学部数学の世界 (2002 年度 ) 永島孝 17 6 行列式の基本法則と効率的な計算法 基本法則 三次以上の行列式についても, 二次の場合と同様な法則がなりたつ ここには三次の場合を例示するが, 四次以上でも同様である 1 単位行列の行列式の値は 1 である すなわち 1 0 0 0 1 0 1 0 0 1 2 二つの列を入れ替えると行列式の値は 1 倍になる 例えば a 13 a

More information

4.1 % 7.5 %

4.1 % 7.5 % 2018 (412837) 4.1 % 7.5 % Abstract Recently, various methods for improving computial performance have been proposed. One of these various methods is Multi-core. Multi-core can execute processes in parallel

More information

DVIOUT-SS_Ma

DVIOUT-SS_Ma 第 章 微分方程式 ニュートンはリンゴが落ちるのを見て万有引力を発見した という有名な逸話があります 無重力の宇宙船の中ではリンゴは落ちないで静止していることを考えると 重力が働くと始め静止しているものが動き出して そのスピードはどんどん大きくなる つまり速度の変化が現れることがわかります 速度は一般に時間と共に変化します 速度の瞬間的変化の割合を加速度といい で定義しましょう 速度が変化する, つまり加速度がでなくなるためにはその原因があり

More information

1 対 1 対応の演習例題を解いてみた 微分法とその応用 例題 1 極限 微分係数の定義 (2) 関数 f ( x) は任意の実数 x について微分可能なのは明らか f ( 1, f ( 1) ) と ( 1 + h, f ( 1 + h)

1 対 1 対応の演習例題を解いてみた   微分法とその応用 例題 1 極限 微分係数の定義 (2) 関数 f ( x) は任意の実数 x について微分可能なのは明らか f ( 1, f ( 1) ) と ( 1 + h, f ( 1 + h) 微分法とその応用 例題 1 極限 微分係数の定義 () 関数 ( x) は任意の実数 x について微分可能なのは明らか ( 1, ( 1) ) と ( 1 + h, ( 1 + h) ) の傾き= ( 1 + h ) - ( 1 ) ( 1 + ) - ( 1) = ( 1 + h) - 1 h ( 1) = lim h ( 1 + h) - ( 1) h ( 1, ( 1) ) と ( 1 - h,

More information

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X ( 第 週ラプラス変換 教科書 p.34~ 目標ラプラス変換の定義と意味を理解する フーリエ変換や Z 変換と並ぶ 信号解析やシステム設計における重要なツール ラプラス変換は波動現象や電気回路など様々な分野で 微分方程式を解くために利用されてきた ラプラス変換を用いることで微分方程式は代数方程式に変換される また 工学上使われる主要な関数のラプラス変換は簡単な形の関数で表されるので これを ラプラス変換表

More information

橡固有値セミナー2_棚橋改.PDF

橡固有値セミナー2_棚橋改.PDF 1 II. 2003 5 14 2... Arnoldi. Lanczos. Jacobi-Davidson . 3 4 Ax = x A A Ax = Mx M: M 5 Householder ln ln-1 0 l3 0 l2 l1 6 Lanczos Lanczos, 1950 Arnoldi Arnoldi, 1951 Hessenberg Jacobi-Davidson Sleijpen

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 応用数理概論 準備 端末上で cd ~/ mkdir cppwork cd cppwork wget http://271.jp/gairon/main.cpp wget http://271.jp/gairon/matrix.hpp とコマンドを記入. ls とコマンドをうち,main.cppとmatrix.hppがダウンロードされていることを確認. 1 準備 コンパイル c++ -I. -std=c++0x

More information

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

vecrot

vecrot 1. ベクトル ベクトル : 方向を持つ量 ベクトルには 1 方向 2 大きさ ( 長さ ) という 2 つの属性がある ベクトルの例 : 物体の移動速度 移動量電場 磁場の強さ風速力トルクなど 2. ベクトルの表現 2.1 矢印で表現される 矢印の長さ : ベクトルの大きさ 矢印の向き : ベクトルの方向 2.2 2 個の点を用いて表現する 始点 () と終点 () を結ぶ半直線の向き : ベクトルの方向

More information

1

1 半剛節が部材上の任意点にある部材剛性方程式 米子高専 川端康洋 稲田祐二. ピン半剛節を有する部材の解析の歴史 ()940 二見秀雄材の途中にピン接合点を有するラーメン材の算式とその応用建築学会論文集 つのピン節を含む部材の撓角法基本式と荷重項ピン節を含む部材の撓角法基本式と荷重項が求められている 以降 固定モーメント法や異形ラーメンの解法への応用が研究された 戦後には 関連する論文は見当たらない

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

Microsoft PowerPoint - ロボットの運動学forUpload'C5Q [互換モード]

Microsoft PowerPoint - ロボットの運動学forUpload'C5Q [互換モード] ロボットの運動学 順運動学とは 座標系の回転と並進 同次座標変換行列 Denavit-Hartenberg の表記法 多関節ロボットの順運動学 レポート課題 & 中間試験について 逆運動学とは ヤコビアン行列 運動方程式 ( 微分方程式 ) ロボットの運動学 動力学 Equation of motion f ( ( t), ( t), ( t)) τ( t) 姿勢 ( 関節角の組合せ ) Posture

More information

平成○○年度知能システム科学専攻修士論文

平成○○年度知能システム科学専攻修士論文 A Realization of Robust Agents in an Agent-based Virtual Market Makio Yamashige 3 7 A Realization of Robust Agents in an Agent-based Virtual Market Makio Yamashige Abstract There are many people who try

More information

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - 9.pptx 9/7/8( 水 9. 線形写像 ここでは 行列の積によって 写像を定義できることをみていく また 行列の積によって定義される写像の性質を調べていく 拡大とスカラー倍 行列演算と写像 ( 次変換 拡大後 k 倍 k 倍 k 倍拡大の関係は スカラー倍を用いて次のように表現できる p = (, ' = k ' 拡大前 p ' = ( ', ' = ( k, k 拡大 4 拡大と行列の積 拡大後 k 倍

More information

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc 2.3. アプリ性能 2.3.1. Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア

More information

景気指標の新しい動向

景気指標の新しい動向 内閣府経済社会総合研究所 経済分析 22 年第 166 号 4 時系列因子分析モデル 4.1 時系列因子分析モデル (Stock-Watson モデル の理論的解説 4.1.1 景気循環の状態空間表現 Stock and Watson (1989,1991 は観測される景気指標を状態空間表現と呼ば れるモデルで表し, 景気の状態を示す指標を開発した. 状態空間表現とは, わ れわれの目に見える実際に観測される変数は,

More information

に対して 例 2: に対して 逆行列は常に存在するとは限らない 逆行列が存在する行列を正則行列 (regular matrix) という 正則である 逆行列が存在する 一般に 正則行列 A の逆行列 A -1 も正則であり (A -1 ) -1 =A が成り立つ また 2 つの正則行列 A B の積

に対して 例 2: に対して 逆行列は常に存在するとは限らない 逆行列が存在する行列を正則行列 (regular matrix) という 正則である 逆行列が存在する 一般に 正則行列 A の逆行列 A -1 も正則であり (A -1 ) -1 =A が成り立つ また 2 つの正則行列 A B の積 2 逆行列 逆行列の計算は 連立一次方程式を数値的に解くために利用される 気象学の分野では線形系の応答問題を数値的に解くときに用いられることも多い ここでは計算機を用いて逆行列を求める方法を学ぶ 2.1 はじめにたとえば 次のような連立一次方程式を解くことを考える このような 2 元連立一次方程式は 代入法や消去法によって容易に解くことができる 解法をプログラミング言語によって記述することも困難ではない

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

PowerPoint Presentation

PowerPoint Presentation . カーネル法への招待 正定値カーネルによるデータ解析 - カーネル法の基礎と展開 - 福水健次統計数理研究所 / 総合研究大学院大学 統計数理研究所公開講座 0 年 月 34 日 概要 カーネル法の基本 線形データ解析と非線形データ解析 カーネル法の原理 カーネル法の つの例 カーネル主成分分析 : PCA の非線形拡張 リッジ回帰とそのカーネル化 概要 カーネル法の基本 線形データ解析と非線形データ解析

More information

Taro-再帰関数Ⅲ(公開版).jtd

Taro-再帰関数Ⅲ(公開版).jtd 0. 目次 1 1. ソート 1 1. 1 挿入ソート 1 1. 2 クイックソート 1 1. 3 マージソート - 1 - 1 1. ソート 1 1. 1 挿入ソート 挿入ソートを再帰関数 isort を用いて書く 整列しているデータ (a[1] から a[n-1] まで ) に a[n] を挿入する操作を繰り返す 再帰的定義 isort(a[1],,a[n]) = insert(isort(a[1],,a[n-1]),a[n])

More information

政策課題分析シリーズ16(付注)

政策課題分析シリーズ16(付注) 基本月額+総報酬月額相当額 が28 万円超付注 付注 1: 在職老齢年金制度の仕組みについて既述の通り 在職老齢年金制度とは 60 歳以降に厚生年金保険に加入しつつ老齢厚生年金を受給する場合において 基本月額 74 と総報酬月額相当額 75 に応じ 老齢厚生年金の受給額の一部あるいは全部が支給停止される制度である 支給停止額が決定される仕組みは 60 歳から 64 歳までの場合と 65 歳以上の場合で異なっており

More information

OCW-iダランベールの原理

OCW-iダランベールの原理 講義名連続体力学配布資料 OCW- 第 2 回ダランベールの原理 無機材料工学科准教授安田公一 1 はじめに今回の講義では, まず, 前半でダランベールの原理について説明する これを用いると, 動力学の問題を静力学の問題として解くことができ, さらに, 前回の仮想仕事の原理を適用すると動力学問題も簡単に解くことができるようになる また, 後半では, ダランベールの原理の応用として ラグランジュ方程式の導出を示す

More information

Microsoft PowerPoint - 13.ppt [互換モード]

Microsoft PowerPoint - 13.ppt [互換モード] 13. 近似アルゴリズム 1 13.1 近似アルゴリズムの種類 NP 困難な問題に対しては多項式時間で最適解を求めることは困難であるので 最適解に近い近似解を求めるアルゴリズムが用いられることがある このように 必ずしも厳密解を求めないアルゴリズムは 大きく分けて 2 つの範疇に分けられる 2 ヒューリスティックと近似アルゴリズム ヒュ- リスティクス ( 発見的解法 経験的解法 ) 遺伝的アルゴリズム

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

代数 幾何 < ベクトル > 1 ベクトルの演算 和 差 実数倍については 文字の計算と同様 2 ベクトルの成分表示 平面ベクトル : a x e y e x, ) ( 1 y1 空間ベクトル : a x e y e z e x, y, ) ( 1 1 z1

代数 幾何 < ベクトル > 1 ベクトルの演算 和 差 実数倍については 文字の計算と同様 2 ベクトルの成分表示 平面ベクトル : a x e y e x, ) ( 1 y1 空間ベクトル : a x e y e z e x, y, ) ( 1 1 z1 代数 幾何 < ベクトル > ベクトルの演算 和 差 実数倍については 文字の計算と同様 ベクトルの成分表示 平面ベクトル :, 空間ベクトル : z,, z 成分での計算ができるようにすること ベクトルの内積 : os 平面ベクトル :,, 空間ベクトル :,,,, z z zz 4 ベクトルの大きさ 平面上 : 空間上 : z は 良く用いられる 5 m: に分ける点 : m m 図形への応用

More information

板バネの元は固定にします x[0] は常に0です : > x[0]:=t->0; (1.2) 初期値の設定をします 以降 for 文処理のため 空集合を生成しておきます : > init:={}: 30 番目 ( 端 ) 以外については 初期高さおよび初速は全て 0 にします 初期高さを x[j]

板バネの元は固定にします x[0] は常に0です : > x[0]:=t->0; (1.2) 初期値の設定をします 以降 for 文処理のため 空集合を生成しておきます : > init:={}: 30 番目 ( 端 ) 以外については 初期高さおよび初速は全て 0 にします 初期高さを x[j] 機械振動論固有振動と振動モード 本事例では 板バネを解析対象として 数値計算 ( シミュレーション ) と固有値問題を解くことにより振動解析を行っています 実際の振動は振動モードと呼ばれる特定パターンが複数組み合わされますが 各振動モードによる振動に分けて解析を行うことでその現象を捉え易くすることが出来ます そこで 本事例では アニメーションを活用した解析結果の可視化も取り入れています 板バネの振動

More information

B. モル濃度 速度定数と化学反応の速さ 1.1 段階反応 ( 単純反応 ): + I HI を例に H ヨウ化水素 HI が生成する速さ は,H と I のモル濃度をそれぞれ [ ], [ I ] [ H ] [ I ] に比例することが, 実験により, わかっている したがって, 比例定数を k

B. モル濃度 速度定数と化学反応の速さ 1.1 段階反応 ( 単純反応 ): + I HI を例に H ヨウ化水素 HI が生成する速さ は,H と I のモル濃度をそれぞれ [ ], [ I ] [ H ] [ I ] に比例することが, 実験により, わかっている したがって, 比例定数を k 反応速度 触媒 速度定数 反応次数について. 化学反応の速さの表し方 速さとは単位時間あたりの変化の大きさである 大きさの値は 0 以上ですから, 速さは 0 以上の値をとる 化学反応の速さは単位時間あたりの物質のモル濃度変化の大きさで表すのが一般的 たとえば, a + bb c (, B, は物質, a, b, c は係数 ) という反応において,, B, それぞれの反応の速さを, B, とし,

More information

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2014-HPC-144 No /5/ CRS 2 CRS Performance evaluation of exclusive version of preconditioned ite

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2014-HPC-144 No /5/ CRS 2 CRS Performance evaluation of exclusive version of preconditioned ite 1 2 3 CRS 2 CRS Performance evaluation of exclusive version of preconditioned iterative method for dense matrix Abstract: As well known, only nonzero entries of a sparse matrix are stored in memory in

More information

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - 9.pptx 9. 線形写像 ここでは 行列の積によって 写像を定義できることをみていく また 行列の積によって定義される写像の性質を調べていく 行列演算と写像 ( 次変換 3 拡大とスカラー倍 p ' = ( ', ' = ( k, kk p = (, k 倍 k 倍 拡大後 k 倍拡大の関係は スカラー倍を用いて次のように表現できる ' = k ' 拡大前 拡大 4 拡大と行列の積 p ' = ( ', '

More information

IPSJ SIG Technical Report Vol.2016-CE-137 No /12/ e β /α α β β / α A judgment method of difficulty of task for a learner using simple

IPSJ SIG Technical Report Vol.2016-CE-137 No /12/ e β /α α β β / α A judgment method of difficulty of task for a learner using simple 1 2 3 4 5 e β /α α β β / α A judgment method of difficulty of task for a learner using simple electroencephalograph Katsuyuki Umezawa 1 Takashi Ishida 2 Tomohiko Saito 3 Makoto Nakazawa 4 Shigeichi Hirasawa

More information

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二

OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 富山富山県立大学中川慎二 OpenFOAM(R) ソースコード入門 pt1 熱伝導方程式の解法から有限体積法の実装について考える 前編 : 有限体積法の基礎確認 2013/11/17 オープンCAE 勉強会 @ 富山富山県立大学中川慎二 * OpenFOAM のソースコードでは, 基礎式を偏微分方程式の形で記述する.OpenFOAM 内部では, 有限体積法を使ってこの微分方程式を解いている. どのようにして, 有限体積法に基づく離散化が実現されているのか,

More information

CLEFIA_ISEC発表

CLEFIA_ISEC発表 128 ビットブロック暗号 CLEFIA 白井太三 渋谷香士 秋下徹 盛合志帆 岩田哲 ソニー株式会社 名古屋大学 目次 背景 アルゴリズム仕様 設計方針 安全性評価 実装性能評価 まとめ 2 背景 AES プロジェクト開始 (1997~) から 10 年 AES プロジェクト 攻撃法の進化 代数攻撃 関連鍵攻撃 新しい攻撃法への対策 暗号設計法の進化 IC カード, RFID などのアプリケーション拡大

More information

n 2 n (Dynamic Programming : DP) (Genetic Algorithm : GA) 2 i

n 2 n (Dynamic Programming : DP) (Genetic Algorithm : GA) 2 i 15 Comparison and Evaluation of Dynamic Programming and Genetic Algorithm for a Knapsack Problem 1040277 2004 2 25 n 2 n (Dynamic Programming : DP) (Genetic Algorithm : GA) 2 i Abstract Comparison and

More information

Microsoft PowerPoint - Eigen.pptx

Microsoft PowerPoint - Eigen.pptx 固有値解析 中島研吾 東京大学情報基盤センター同大学院情報理工学系研究科数理情報学専攻数値解析 ( 科目番号 -58) 行列の固有値問題 べき乗法 対称行列の固有値計算法 : ヤコビ法 A 行列の固有値問題 標準固有値問題 (Stndrd vlue Prolem を満足する と を求める : 固有値 (eigenvlue) : 固有ベクトル (eigenvector) 一般固有値問題 (Generl

More information

( ) [1] [4] ( ) 2. [5] [6] Piano Tutor[7] [1], [2], [8], [9] Radiobaton[10] Two Finger Piano[11] Coloring-in Piano[12] ism[13] MIDI MIDI 1 Fig. 1 Syst

( ) [1] [4] ( ) 2. [5] [6] Piano Tutor[7] [1], [2], [8], [9] Radiobaton[10] Two Finger Piano[11] Coloring-in Piano[12] ism[13] MIDI MIDI 1 Fig. 1 Syst 情報処理学会インタラクション 2015 IPSJ Interaction 2015 15INT014 2015/3/7 1,a) 1,b) 1,c) Design and Implementation of a Piano Learning Support System Considering Motivation Fukuya Yuto 1,a) Takegawa Yoshinari 1,b) Yanagi

More information

ボルツマンマシンの高速化

ボルツマンマシンの高速化 1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,

More information

Microsoft PowerPoint - 第3回2.ppt

Microsoft PowerPoint - 第3回2.ppt 講義内容 講義内容 次元ベクトル 関数の直交性フーリエ級数 次元代表的な対の諸性質コンボリューション たたみこみ積分 サンプリング定理 次元離散 次元空間周波数の概念 次元代表的な 次元対 次元離散 次元ベクトル 関数の直交性フーリエ級数 次元代表的な対の諸性質コンボリューション たたみこみ積分 サンプリング定理 次元離散 次元空間周波数の概念 次元代表的な 次元対 次元離散 ベクトルの直交性 3

More information

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing 1,a) 1,b) 1,c) 2012 11 8 2012 12 18, 2013 1 27 WEB Ruby Removal Filters Using Genetic Programming for Early-modern Japanese Printed Books Taeka Awazu 1,a) Masami Takata 1,b) Kazuki Joe 1,c) Received: November

More information

27 VR Effects of the position of viewpoint on self body in VR environment

27 VR Effects of the position of viewpoint on self body in VR environment 27 VR Effects of the position of viewpoint on self body in VR environment 1160298 2015 2 25 VR (HMD), HMD (VR). VR,.. HMD,., VR,.,.,,,,., VR,. HMD VR i Abstract Effects of the position of viewpoint on

More information

カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し 評価に使用する 対象計算アルゴリズム 固有値計算 ( 実数密行列 標準固有値計

カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し 評価に使用する 対象計算アルゴリズム 固有値計算 ( 実数密行列 標準固有値計 カーネルベンチマークコードの開発について EigenExa について EigenExa ベンチマークコードについてベンチマーク結果に基づく性能推定について 2/24/2014 理化学研究所三上和徳 1 カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し

More information

Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth

Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth and Foot Breadth Akiko Yamamoto Fukuoka Women's University,

More information

i

i 14 i ii iii iv v vi 14 13 86 13 12 28 14 16 14 15 31 (1) 13 12 28 20 (2) (3) 2 (4) (5) 14 14 50 48 3 11 11 22 14 15 10 14 20 21 20 (1) 14 (2) 14 4 (3) (4) (5) 12 12 (6) 14 15 5 6 7 8 9 10 7

More information

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において

More information

Microsoft Word - 非線形計画法 原稿

Microsoft Word - 非線形計画法 原稿 非線形計画法条件付き最適化問題は目的関数と制約条件で示すが この中に一つでも 次式でないものが含まれる問題を総称して非線形計画法いう 非線形計画問題は 多くの分野で研究されているが 複雑性により十分汎用的なものは確立されておらず 限定的なものに限り幾つかの提案がなされている ここでは簡単な解法について紹介する. 制約なし極値問題 単純問題の解法 変数で表される関数 の極値は を解くことによって求められる

More information

Microsoft PowerPoint - 05DecisionTree-print.ppt

Microsoft PowerPoint - 05DecisionTree-print.ppt あらためて : 決定木の構築 決定木その 4 ( 改めて ) 決定木の作り方 慶應義塾大学理工学部櫻井彰人 通常の手順 : 上から下に ( 根から葉へ ) 再帰的かつ分割統治 (divide-and-conquer) まずは : 一つの属性を選び根とする 属性値ごとに枝を作る 次は : 訓練データを部分集合に分割 ( 枝一本につき一個 ) 最後に : 同じ手順を 個々の枝について行う その場合 個々の枝に割り当てられた訓練データのみを用いる

More information

逐次近似法の基礎と各種補正方法

逐次近似法の基礎と各種補正方法 逐次近似法の基礎と各種補正方法 横浜創英大学橋本雄幸 画像再構成における逐次近似法の歴史は長く,X 線 CT においても解析的方法が見つかる前は, 逐次近似法を用いて画像を再構成していた. 解析的方法が見つかってからは, 計算時間の長さから逐次近似法はあまり使われなくなった. しかし, コンピュータの発展に伴い, 繰り返しても計算時間がそれほどかからなくなったこともあり, 解析的方法が確立できない

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information