1. はじめに 15 パズルは 4 x 4 の盤面に1から 15 までの数字を順序良く揃えるパズルであり, 良く知られているパズルの1つである. このパズルの最短手数が最長となる問題 ( 最長手数問題 ) が 80 手であることは Cenju というスパコンを使って既に求められている ( 文献 1)
|
|
|
- えみ うなだ
- 7 years ago
- Views:
Transcription
1 IDA* 探索を用いた 15 パズル Solver の GPU に適した並列探索法について 萩野谷一二古宮嘉那子 Iterative Deeping A* Search (IDA* 探索 ) を用いた 15 パズル Solver を Graphic Processing Unit(GPU) に単純移植すると, 手数の長い問題の探索において, 性能が向上するどころか劣化するという深刻な問題が発生する場合がある. その原因は, IDA* 探索の内部で行っている深さ優先探索でスレッド分散が多発しているためと考えられる. 本発表では,IDA* 探索の内部探索処理に幅優先探索法の考えを導入してスレッド分散を解消すると共に, その際発生する作業域不足を共有メモリを用いたソフトキャッシュ機能により回避する方式を提案する. また, 提案方式を実現した Solver の作成 評価を行った結果,NVIDIA GeForce GTX580 と Intel Core i GHz CPU を使用した場合,15 パズルの最長手数に近い問題 ( 約 80 手 ) において,CPU のみの逐次探索の場合と比較して実行時間を 30 分の 1 以下に短縮することができた. Parallel Search of GPU for 15-Puzzle Solver with IDA* Search Kazuji Haginoya, and Kanako Komiya When a 15-puzzle solver with Iterative Deeping A* Search (IDA*Search) was simply introduced into Graphic Processing Unit (GPU), the serious problem sometimes happens: the performance decreases on searches of some maps whose optimal solution has many moves. This is because the thread divergence becomes a serious problem in depth-first search which is used in IDA* Search. This paper proposes the method which solves this problem by introducing breadth-first search instead of depth-first search into IDA* Search and avoids shortage of the work area by soft-cache using the common memory. The results of the experiment of the solver with this method show that the 15-puzzles whose solution is almost the longest (around 80 moves) were solved 30 times as fast as the serial search of GPU using NVIDIA GeForce GTX580 and Intel Core i GHz CPU. 茨城大学工学部 Department of Computer and Information Sciences, Ibaraki University 1
2 1. はじめに 15 パズルは 4 x 4 の盤面に1から 15 までの数字を順序良く揃えるパズルであり, 良く知られているパズルの1つである. このパズルの最短手数が最長となる問題 ( 最長手数問題 ) が 80 手であることは Cenju というスパコンを使って既に求められている ( 文献 1) が, 手数の長い問題 ( 付録 A.1 の例 1,2,3 参照 ) の最短手数解を求めることはそれ程簡単ではない. 例えば, 例 1, 2 を手元の DeskTop PC(3.4GHz CPU) で解いてみると, 表 1の結果となった.Takaken 版 Solver( 文献 1) は, 通常の Solver ( 筆者の自作版 ) に較べて約 30 倍高速である. 本発表では, ごく普通の 15 パズル Solver(CPU 版 Solver) を GPU を用いた大規模並列探索によって高速化する手法を提案する. また, 提案手法の実装を行い Takaken 版 Solver と同等以上の性能を実現できたことを報告する. 表 1 Solver の簡単な性能比較 Takaken 版通常の Solver 例 1 47 秒 1223 秒例 秒約 5 時間 7 分 2. 関連技術および関連研究 その特徴は, (1) 探索の半分を CPU 側で行い, 残りの部分を GPU で探索するという役割分担 (GPU 側の探索の深さは高々 10 手となる ) (2) LBE に相当する距離テーブルの容量は,2.2G と 88G の 2 つを使用 (3) CPU と GPU の並列化による探索時間の短縮 (4) 約 50 万スレッドという大規模並列探索 である. その結果,GTX570 ( 480core, 1.46GHz) を使用し た評価実験では,CPU による逐次探索に較べて 21 倍高速 となり, グラフの最短経路問題 +IDA* 探索では,GPU が 活用可能と評価している. 次に, 文献 4 は最良優先探索 (BFS) を用いた最短経路 探索を GPU に向いた並列探索に変更した例である. GPU において並列探索を行うため,(1) Priority Queue を分 散化して各コアで分担可能とし, (2) Node Duplication Detection のために Hash 機構を採用している.( closed list ( 探索済のノードの一覧 ) の管理 ) 具体的な Hash 機構と して, Parallel Cockoo Hashing と Parallel Hashing with Replacement( ハッシュ値の衝突時は古い Node を新 Node で置き換える方式 ) を用意し, 使用可能メモリ容量 ( closed list ) からどちらかを選択する考えである. 一例として,GPU に Telsa K20c(2496core, 706MHz) を 使用した実験では, 約 60 手の 15 パズルの問題で約 30 倍強 の改善効果が得られている パズルの最短手数解を求めるアルゴリズムパズルの最短手数解を求める探索アルゴリズムとして IDA* 探索がよく使用される.IDA* 探索では, よい Lower Bound Estimater(LBE) が作れることが前提となる. しかし,15 パズルにおいて IDA* 探索を用いる場合, マンハッタン距離 (MD) はあまり精度のよい LBE ではないため, 最長手数 (80 手 ) に近い問題では探索範囲を絞り切れず時間がかかりすぎて解けないという結果になる. Takaken 版 Solver では, 高橋謙一郎氏独自の考案となる InvertDistance(ID) と WalkingDistance (WD) を用いて精度のよい LBE を得ることに成功していることが高速解法の秘密である.( 付表 A.1) しかし,ID,WD のような精度のよい LBE は, パズルに対する深い洞察力によって初めて得られるものであり, 誰でも作れるというものではない. 一方,GPU を用いた高速化の試みは多方面で行われており, 文献 2,4,5,6 では数十倍という成功事例も報告されている. 以下では,15 パズル Solver に関連する 2 つの事例を簡単に紹介する. まず, 文献 2 は IDA* 探索により Rubik キューブの最短経路を求める Solver を GPU を用いて高速化を行った例である. 3. GPU を用いた高速化への取り組み 3.1 DFS 版の実装文献 2,5,6 の事例を参考に,CPU 版 Solver を GPU に単純移植した DFS 版を作成した. なお,CPU 版 Solver の概略は付録 A.2 を参照されたい. 次に,DFS 版作成時の主な修正点について説明する. (1) CPU 側と GPU 側の役割分担 GPU は単純 大量処理に向いているので,IDA* 探索処理内部の深さ優先探索 (DFS) 処理をオフロードすることとした.GPU 側で行う探索の深さ (OLP:OffLoad Point) を設定して GPU 側の負荷の調整を行う. また,OLP は CPU から GPU 側への引き継ぎ情報 (Seed) のそれぞれの仕事量も調節する役割がある.OLP を大きくしすぎると Seed の総数が少なくなり, 個々のスレッドの仕事量のばらつきが大きくなる.( 負荷の平滑化の問題 ) これは, スレッドの終了処理のばらつきとして表面化する. 具体的には 4.5 OLP の調整の節を参照されたい. 2
3 (2) 再帰関数の変更 CPU 版では DFS 処理を再帰関数で実装しているが, GPU では再帰関数を使用できないので, 配列を用いたル ープ処理に変更した. (3) GPU 使用時の留意点の考慮 文献 5,6 で述べられている留意点を参考に, 動的負荷 バランス機能, スレッド分散対策 (if 文の削減 ), 共有メ モリアクセス時のバンク衝突の回避策などを実施した. (4) コンスタントメモリの活用 MD テーブルは, 小容量かつ全スレッドから頻繁にア クセスされるためコンスタントメモリ (Cmem) に配置し た. 3.2 DFS 版の評価 DFS 版において,Blocks=32, Threads=64 に固定して OLP を変化させて探索時間の変化 ( 図 1 参照 ) をみると,OLP が増えるに従って (GPU への offload 量が増えると ), 探索 時間が極端な増加となっていることがわかった 図 1 OLP と探索時間の関係 その原因を調べるため探索の深さ (Hand 数 ) ごとのノード 数の分布をみると, 図 2 のように中央にピークのあるグラ フとなった. 図 ノード数 (M 個 ) 探索時間 ( 秒 ) Hand 数とノード数の分布 OLP=50 の範囲 OLP MD の枝刈の効果 Hand 数 このようにノード数の分布に大きな偏りがあることが極端 なスレッド分散 を引き起こし, 性能劣化の主因となって スレッド分散とは,GPU において多数のスレッドが並行して if 文を処理する場合, 一方のスレッドのみ実行され, 他方のスレッドは休止状態となることである. スレッド分散が多発するとそれだけ効率は悪くなる. いると考え, 各スレッドの動作を分析した. 付録 A.3 の例のように, 両方のスレッドが同じ処理をす る場合は同時に実行されるが, そうでない場合は片方しか 実行されず, 他方は待たされてしまう. そのため,A の nest が極端に深い場合,B の処理はかなり待たされてしまう. 以上より, この問題の本質は, スレッドと Seed の関係が 固定されているためと判断した. また, 文献 3 には αβ 木 探索ではスレッド分散が深刻な問題となることが指摘され ており, 同様な問題と推測している. 3.3 対策案の検討 先の深さ優先探索によるスレッド分散の問題は,1 手進 める毎に Seed の assign 処理を行う幅優先探索処理では回避 できる ( 付録 A.3 を参照 ) と考え, 以下の対策案 1,2 を検 討した. 案 1 : IDA* 探索の内部探索を幅優先探索に変更した アルゴリズム 1) ブロック内の各スレッドに Seed を assign する もし,assign する Seed が不足する場合は, グローバ ルメモリ (Gmem) の Seed で補てんする Gmem の Seed がなくなれば, 処理を終了する 2) 各スレッドは,1 手先の Seed を生成し,Seed バフ ァに格納する 3) Seed バファが空きになるまで,1), 2) を繰返す 案 1 のアルゴリズムによる Seed バファ内の構成を図 3 に従って説明する.h0 は Gmem から取り出された Seed で あり, 生成元となる Seed を表している.h0 の Seed から生 成された Seed が H1(h1 を含む ) である. 以下,h1 H2, と Seed 生成を繰り返していく. 図 3 の水色の部分は生成 元となった Seed を表し, 黄色の部分はまだ生成元になって いない Seed を表している. h0 h1 * h2 * h3 * H1 H2 H3 H4 図 3 Seed バファの構成イメージ 案 1 の問題点は,h0 H1, h1 H2, と Seed 生成を繰 り返していくと, 生成元になる Seed が少なくなり,* の Seed を集める処理が必要になることである ( 水色の生成済 の Seed があるため意外と面倒な処理 ) 案 2 : 案 1 の Seed assign 処理の改善 案 1 からの変更点は, 1) において,assign した Seed を Stack から削除し, その空き領域を生成した Seed を格納 するために使用する ことである. つまり, この案 2 では GPU で行った探索の履歴をすべて破棄するという大きな トレードオフを行っている. そのため,GPU からの応答 情報は Goal に至った Seed の Gmem 上の id( 中間 Node の 3
4 位置 ) のみとなる.CPU 側では, この中間 Node から Goal までのパスを再探索しなければならない. 案 2 において Seed 生成を繰り返した場合の Seed Stack 構成を以下の図 4 に従って説明する. まず,(1) Gmem から Seed(h0) を取り出し,Seed Stack に push する. 次に,(2) h0 の seed から生成された新しい Seed(H1) は, もとの Seed (h0) を上書きして格納する. 更に,(3) h1 の seed から生成された新しい Seed(H2) は, もとの Seed(h1) を上書きして格納する. 以降, これを繰り返す.Seed Stack は, (5) までの処理を行った場合の状態を表す. 図中の黄色の部分は, まだ処理されていない Seed である. 案 1と異なり, 連続した領域となっていることに留意されたい. (1) h0 h0 GPU 側の探索の深さは OLP で調整する. また,GPU の 多重度 ( ブロック数, スレッド数 ) は, 共有メモリ資源の 制約により上限がきまる. Ans 処理の補足 ( 案 2 のトレードオフ対策 ) CPU 側では,GPU から通知された中間 Node 情報をもと に, 中間 Node Goal Node の検索を行い, 初期 Node から Goal Node までの手順を完成させる. 初期 Node 中間 Node 4.2 WIda( 仮称 ) アルゴリズム 図 6 は案 2 の GPU 側の具体的な手順である WIda アルゴ リズムの概念を示している. CPU で再検索 Goal Node (2) H1 h1 (3) H2 h2 (4) H3 h3 (5) H4 h4 Gmem (5) (1) WIda main (2) Step (3) push Seed Stack Seed Stack 図 4 案 2 の Seed Stack のイメージ (4) pop 案 1, 案 2 の選択 15 パズル Solver においては, 案 2 のトレードオフ項目は 対処法があるため大きな問題にはならないと考え,Seed の 取り出し論理が単純となりしかも作業域が少なくて済む案 2 を採用することとした. 4. 提案方式の実装 4.1 概要 図 5 は提案方式 ( 案 2) 全体の処理概要を示したもので ある. 手順 1~4 を繰り返す単純な構造となっている. CPU 側 1. 生成した Seed を GPU 側に転送する 2. GPU の起動 - ブロック数 - スレッド数 4. 結果の取り出し探索成功なら Ans 処理へ OLP 図 5 提案方式の全体構成 GPU 側 Gmem -Seed 情報 - 探索結果 3. カーネルプログラムの実行 図 6 WIda アルゴリズムの概念以下では WIda アルゴリズムの詳細を図 6 の (1) ~ (5) の順に従って説明する. まず,(1) Gmem から最大 T 個 (T は 1 ブロックあたりのスレッド数 ) の Seed を取り出す. 次に, (2) 取り出した Seed を Step 関数に渡す.(3) Step 関数は,1 手先の Seed を生成し,Seed Stack に格納する.(Goal を検出した場合は元の Seed id(gmem 上の位置 ) を検索結果として Gmem に格納し処理を終了する ) 通常,Step 関数の処理が終わると,(4) Stack に T 個以上の Seed がある場合, Stack の先頭から T 個の Seed を取り出し,(2) の処理へ戻る. ( このとき,Stack 内にその Seed は残さない )(5) Stack に T 個未満の Seed しかない場合,Seed 補てん処理を行い, Stack の先頭から最大 T 個の Seed を取り出し,(2) の処理へ戻る.(Stack の Seed が T 個になる様に Gmem から Seed を補てんする ) もし,Gmem の Seed がなくなり, かつ,Stack が空になった場合は終了となる. 4.3 Stack Cache 機構 Seed Stack を共有メモリ (Smem) に単純 mapping すると, Smem メモリ不足 ( スレッドなどの多重度の上限となること ) が懸念される. この制約を解消するため Stack Cache 機構を装備する. Stack Cache 機構は,WIda の Seed Stack を Smem を使ったソフト Cache 機能とデータ格納用の Gsave(Gmem) によっ 4
5 て実現する. 本手法では,Seed Stack と同じ大きさの Gsave を利用する. また,Cache には Seed Stack の Top データを 保持し, アクセス時間の短縮となるように制御する. Stack Cache の制御方式は, 図 7 の (1)~(4) の順で行われる. まず,(1)SeedStack への push 操作で Cache への write を行 い,(2) 同時に Gmem への Write を行う.(write through 方 式 ) 次に,(3) prepare 操作で Gsave から Cache に Load す る.(pop 操作で必要とする Seed の数は高々 T 個なので Step 処理の完了後に preload する ) 最後に (4) pop 操作により, Cache から Load する. Seed Stack Cache(Smem) Gsave(Gmem) 図 7 Cache 制御による Seed Stack の実装イメージ 4.4 WIda 版, Cache 機能付き WIda 版の評価 上記の提案方式を検証するため,WIda 版 (Seed Stack を共 有メモリに配置したもの ), および,Cache 機能付き WIda 版 (WIda 版に Stack Cache 機能を追加したもの ) を作成した. WIda 版により WIda アルゴリズムを検証する.Cache 機 能付き WIda 版は,(1) Stack Cache 機構を装備することで性 能が大幅に劣化しないか,(2) Cache 制御が有効に働くかと いう 2 点を検証する. 図 8 に,OLP=50, Threads=4 に固定した場合の WIda 版, Cache 機能付き WIda 版の測定結果を示す. 100 push pop 探索時間 ( 秒 ) (1) (4) (2) (3) CPU のみの探索時間 WIda 版 Cache 機能付き WIda 版 ブロック数 図 8 WIda 版,Cache 機能付き WIda 版の探索性能 まで短縮されており, スレッド分散は抑制できた. しか し,WIda 版は共有メモリの容量制限からスレッド数を大 きくできず, スレッド数 = 4 が最適値となった.( この 状態では, コア数は 4 / 32 = 1 / 8 しか使用していない ) (2) Stack Cache 制御の検証 Cache 機能付き WIda 版は Blocks=16 のところで性能差 がでている. これは Cache 制御の重さと考えられるが大 幅な劣化ではない. また, ブロック数が増えると解消し ているので,Seed Stack を Gmem に配置したが Cache 制 御により Gmem の大きな Latency の隠ぺいに成功したと 判断してよいであろう. 4.5 OLP の調整, その他 OLP の調整 OLP ( OffLoad Point ) は,GPU 側で行う探索の深さを指定 するものである.OLP が大きいほど GPU 側の処理は重く なる.( その分 PC 側が軽くなる ) 図 9 は,Cache 機能付き WIda 版を以下の測定条件 (Blocks=112,Threads=64) に固定 し,OLP を変化させて測定したものである. この図より,(1) OLP=55 あたりが最適値となっているこ とがわかる.(2) OLP の上昇と共に, 全体の探索時間が短 縮されているのは当然の結果である.( 減少しているのは PC 側の探索時間であるから )(3) OLP=60 で劣化している のは,Seeds が少なく負荷分散が難しくなり始めたものと 判断する.(PC 側の手順の探索を Nop にしても,7.92 秒か かっていることから明らか ) 100 探索時間 10 ( 秒 ) その他の調整 図 9 OLP と探索時間の関係 OLP GPU の能力を十分に引き出すためには, その動作環境を 最適に設定することが重要である.OLP の調整以外にも, HotSpot 対策 ( 共有メモリへの Seed 格納処理時のアクセス 負荷の集中対策 ),Cache 容量と多重度 (Blocks,Threads) の調整などがあるが, 紙面の都合で詳細は割愛する. (1) WIda アルゴリズムの検証 DFS 版で 7237 秒かかった探索が WIda 版では約 19 秒 5
6 5. 評価実験 各 Solver の性能を評価するため,3 つの Solver(CPU 版, GPU 版,Takaken 版 ) について付録 A.1 の 3 つの問題の解法を行った. その測定結果を表 2 に示す. なお, 測定に使用したハードウェアは,NVIDIA GeForce GTX580 と Intel Core i GHz CPU である. 表 2 各 Solver の探索時間 CPU 版 GPU 版 Takaken 版例 秒 38 秒 47 秒例 2 約 5 時間 7 分 521 秒 641 秒例 3 約 12 時間 37 分 1646 秒 * 2625 秒 *: 最適値 ( OLP=48) での測定値は 1221 秒 CPU 版 :MD を使用した通常の Solver( 自作版 ) GPU 版 : 最新の Cache 機能付き WIda 版を使用動作条件 :OLP=55, Blocks=144, Threads=96 Takaken 版 : 高橋謙一郎氏 HP( 文献 1) より入手この表より,(1) CPU による逐次探索 Solver の約 30 倍強の性能向上を達成し,(2) Takaken 版 Solver と比較してもそん色ないことがわかる. 6. まとめ GPU を用いて 15 パズル Solver を高速化するという取り組みは,IDA* 探索処理を単純移植するだけではスレッド分散が多発してうまくいかないという問題があったため, 本稿ではそれを回避する新たな制御方式を提案した. 本提案方式は,(1) WIda アルゴリズム (IDA* 探索の内部でよく使われる深さ優先探索を幅優先探索の変形版に変更したもの ) によりスレッド分散を大幅に抑制するとともに, (2) Stack Cache 制御 ( 共有メモリをキャッシュとして使用することによりスレッドの作業域を Gmem に配置可能とした ) によって共有メモリ容量の上限による探索の深さの制 約を解消するものである. そして, 実際に実装を行い上記の効果を検証した結果, NVIDIA GeForce GTX580 と Intel Core i GHz CPU を使用した場合,15 パズルの最長手数に近い問題 ( 約 80 手 ) において,CPU のみの場合と比較して実行時間を 30 分の 1 以下に短縮することができた. 本提案方式は, 他のパズル問題の探索にも適用できるの ではないかと考えている. 例えば,Takaken 版 Solver,24 パズル Solver への適用などが期待される. また, 今回評価に使用した GPU は 2 世代前のアーキテク チャであるため, 最新の GPU アーキテクチャを活用すれば, スレッド間の直接通信機構が可能であり, 実装が容易とな るとともに性能面でも更なる向上が期待できる. 参考文献 1) 高橋謙一郎氏の HP( コンピュータ & パズル ) 公開プログラ ム研究開発ノート / 15 パズル自動解答プログラムの作り方 2) 早川広紀, 村尾雄一, Rubik キューブの最小手数解の探索の GPU を用いた高速化, 2013 年 3 月 Risa/Asia Conference media=cm:murao-risacon13-rubik.pdf 3) Kamil Marek Rocki, GPU における大規模モンテカルロ木探索 4) Yichao Zhou, Jianyang Zeng, Massively Parallel A* Search on a GPU, 5) 田中慶悟, 藤本典幸, GPU を用いた N-Queens 問題の求解 情報処理学会シンポジウムシリーズ Vol.2011,No.6 pp.76-83,2011 6) 萩野谷一二, 田中慶悟, 藤本典幸, 対称解の特性を用いた N-Queens 問題の求解と GPU による高速化, 究報告 Vol.2012-GI-27 No.7,2012 情報処理学会研 7) NVIDIA Corp., NVIDIA CUDA C Programming Guide 3.2 8) NVIDIA Corp., Tuning CUDA Applications for Fermi 9) NVIDIA Corp., PTX:Parallel Thread Execution ISA Version 2.2 6
7 付録 付録 A.1 手数の長い問題の例 例 1: 最短手数 = 78 手例 2: 最短手数 = 80 手例 3: 最短手数 =72 手 * * * 注 :* は空きマス例 3 は解法に時間のかかる問題として高橋謙一郎氏の HP( 文献 1) に紹介されているもの 付表 A.1 LBE の比較例 1 例 2 例 3 MD WD * 注 :WD は Takaken 版 Solver の LBE *: パターン DB を使用した LBE では 54 となる WD-MD が探索の深さの差となる 付録 A.2 CPU 版 Solver(IDA* 探索 ) の疑似コードの例 IDA* のメインループの概要 for (MaxHand=MD0; ; MaxHand++) { // MD0 は最初に与えられた局面の MD MaxHand を上限とする探索 ( 深さ優先探索 :DFS) もし, 探索で解が見つかれば, 終了する ( そうでなければ,MaxHand を+1して上記の探索を繰り返す ) } 深さ優先探索 (DFS) の概要以下の Hand, M を入力として,1 手進めた局面の MD(m) を計算する. もし,Hand+m+1 > MaxHand であれば, その局面は探索範囲外なので廃棄する.(MD による枝刈 ) Hand: 既に探索済の手数 M : 現在の局面の MD m : 次の局面の MD ( M と移動した数字とその位置より以下の式で求めることができる ) m = md - md(c,p) + md(c,q) // 数字 c が位置 p から q へ移動する場合 7
8 付録 A.3 スレッド分散による待ちの発生の説明 A B A,B : 探索元の Seed A 11 A 12 B 11 B 12 T1,T2 : スレッド A 21 B 21 B 22 A 31 例 1 深さ優先探索時のスレッドの動作例 Step T1 A A11 A21 A31 a21 a11 a A12 * a12 A * * T2 B B11 * * b * * B12 B21 b12 B22 b12 b 凡例 Axx, Byy は各スレッドが Node Axx, Byy へ進む処 axx, byy は各スレッドが Node Axx, Byy に戻る処理 * は, 該当スレッド待機状態 ( スレッド分散 ) step0: スレッド T1,T2 は Gmem からそれぞれ A,B を取り出す. step1: スレッド T1 は,A から A11 を生成し, スレッド T2 は,B から B11 を生成する. step2: スレッド T1 は,A11 から A21 を生成するが, スレッド T2 は,B11 から生成できる Seed がなく, スレッド T2 は休止状態となる. step3: スレッド T1 は,A21 から A31 を生成するが, スレッド T2 は, 休止状態のまま. step4: スレッド T1 は,A31 から A21 にもどり, スレッド T2 は,B に戻る. step5: スレッド T1 は,A21 から A11 にもどり, スレッド T2 は, 休止状態となる. step6: スレッド T1 は,A11 から A にもどり, スレッド T2 は, 休止状態となる. step7: スレッド T1 は,A から A12 を生成し, スレッド T2 は,B から B12 を生成する. 以降, 同様の手順を繰り返す. 例 2 幅優先探索時のスレッドの動作例 Step T1 A A11 A12 * * b21 A31 T2 B B11 B12 B21 B22 b22 b11 * x 凡例 step0: スレッド T1,T2 は Gmem からそれぞれ A, B を取り出す. Axx, Byy は各スレッドが生成した Node axx, byy は Axx,Byy の Node から生成 Node がない状態 * は, 該当スレッドは待機状態 ( スレッド分散 は, 次の Seed の補てん処理が行われる step1: スレッド T1 は A から A11 を生成し, スレッド T2 は B から B11 を生成する. step2: スレッド T1 は A から A12 を生成し, スレッド T2 は B から B12 を生成する. step3: スレッド T1 は A12 から生成する Seed がなく休止状態, スレッド T2 は B12 から B21 を生成する. step4: スレッド T1 は A12 から生成する Seed がなく休止状態, スレッド T2 は B12 から B22 を生成する. step5: スレッド T1,T2 はそれぞれ B21,B22 を Stack から取り出すが, ともに生成する Seed がない. step6: スレッド T1,T2 はそれぞれ A11,B11 を Stack から取り出す.T1 は A21 を生成するが, T2 は生成する Seed がない. step7:stack に Seed は A21 しかないので,Seed 補てん処理を行う.(T2 は休止状態となる ) step8: スレッド T1,T2 はそれぞれ A21,@ を Stack から取り出す.T1 は A31 を生成するが, T2 から新たな Seed x を生成する. 幅優先探索の場合, 深さ優先探索に較べてスレッド分散は大幅に抑制される. 8
Microsoft PowerPoint - mp11-06.pptx
数理計画法第 6 回 塩浦昭義情報科学研究科准教授 [email protected] http://www.dais.is.tohoku.ac.jp/~shioura/teaching 第 5 章組合せ計画 5.2 分枝限定法 組合せ計画問題 組合せ計画問題とは : 有限個の もの の組合せの中から, 目的関数を最小または最大にする組合せを見つける問題 例 1: 整数計画問題全般
人工知能入門
藤田悟 黄潤和 探索とは 探索問題 探索解の性質 探索空間の構造 探索木 探索グラフ 探索順序 深さ優先探索 幅優先探索 探索プログラムの作成 バックトラック 深さ優先探索 幅優先探索 n 個の ueen を n n のマスの中に 縦横斜めに重ならないように配置する 簡単化のために 4-ueen を考える 正解 全状態の探索プログラム 全ての最終状態を生成した後に 最終状態が解であるかどうかを判定する
soturon.dvi
12 Exploration Method of Various Routes with Genetic Algorithm 1010369 2001 2 5 ( Genetic Algorithm: GA ) GA 2 3 Dijkstra Dijkstra i Abstract Exploration Method of Various Routes with Genetic Algorithm
Microsoft PowerPoint - 06graph3.ppt [互換モード]
I118 グラフとオートマトン理論 Graphs and Automata 担当 : 上原隆平 (Ryuhei UEHARA) [email protected] http://www.jaist.ac.jp/~uehara/ 1/20 6.14 グラフにおける探索木 (Search Tree in a Graph) グラフG=(V,E) における探索アルゴリズム : 1. Q:={v { 0 }
GPGPU
GPGPU 2013 1008 2015 1 23 Abstract In recent years, with the advance of microscope technology, the alive cells have been able to observe. On the other hand, from the standpoint of image processing, the
データセンターの効率的な資源活用のためのデータ収集・照会システムの設計
データセンターの効率的な 資源活用のためのデータ収集 照会システムの設計 株式会社ネットワーク応用通信研究所前田修吾 2014 年 11 月 20 日 本日のテーマ データセンターの効率的な資源活用のためのデータ収集 照会システムの設計 時系列データを効率的に扱うための設計 1 システムの目的 データセンター内の機器のセンサーなどからデータを取集し その情報を元に機器の制御を行うことで 電力消費量を抑制する
連載講座 : 高生産並列言語を使いこなす (3) ゲーム木探索問題 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 概要 17 2 ゲーム木探索 必勝 必敗 引き分け 盤面の評価値 αβ 法 指し手の順序付け (mo
連載講座 : 高生産並列言語を使いこなす (3) ゲーム木探索問題 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 概要 17 2 ゲーム木探索 17 2.1 必勝 必敗 引き分け 17 2.2 盤面の評価値 18 2.3 αβ 法 19 2.4 指し手の順序付け (move ordering) 20 3 Andersson の詰み探索およびその並列化 21 3.1 Andersson
dlshogiアピール文章
第 28 回世界コンピュータ将棋選手権 dlshogi アピール文章 山岡忠夫 2018 年 5 月 1 日更新 下線部分は 第 5 回将棋電王トーナメントからの差分を示す 1 特徴 ディープラーニングを使用 指し手を予測する Policy Network 局面の勝率を予測する Value Network 入力特徴にドメイン知識を活用 モンテカルロ木探索 並列化 自己対局による強化学習 既存将棋プログラムの自己対局データを使った事前学習
Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments
計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];
データ構造
アルゴリズム及び実習 7 馬青 1 表探索 定義表探索とは 表の形で格納されているデータの中から条件に合ったデータを取り出してくる操作である 但し 表は配列 ( 連結 ) リストなどで実現できるので 以降 表 の代わりに直接 配列 や リスト などの表現を用いる場合が多い 表探索をただ 探索 と呼ぶ場合が多い 用語レコード : 表の中にある個々のデータをレコード (record) と呼ぶ フィールド
PowerPoint Presentation
幅優先探索アルゴリズム 復習 Javaでの実装 深さ優先探索 復習 Javaでの実装 1 探索アルゴリズムの一覧 問題を解決するための探索 幅優先探索 深さ優先探索 深さ制限探索 均一コスト探索 反復深化法 欲張り探索 山登り法 最良優先探索 2 Breadth-first search ( 幅優先探索 ) 探索アルゴリズムはノードやリンクからなる階層的なツリー構造で構成された状態空間を探索するアルゴリズムです
258 5) GPS 1 GPS 6) GPS DP 7) 8) 10) GPS GPS 2 3 4 5 2. 2.1 3 1) GPS Global Positioning System
Vol. 52 No. 1 257 268 (Jan. 2011) 1 2, 1 1 measurement. In this paper, a dynamic road map making system is proposed. The proposition system uses probe-cars which has an in-vehicle camera and a GPS receiver.
ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015
ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ 本セッションの目的 本セッションでは ERDAS IMAGINEにおける処理速度向上を目的として機器 (SSD 等 ) 及び並列処理の比較 検討を行った 1.SSD 及び RAMDISK を利用した処理速度の検証 2.Condorによる複数 PCを用いた並列処理 2.1 分散並列処理による高速化試験 (ERDAS IMAGINEのCondorを使用した試験
ボルツマンマシンの高速化
1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,
グラフの探索 JAVA での実装
グラフの探索 JAVA での実装 二つの探索手法 深さ優先探索 :DFS (Depth-First Search) 幅優先探索 :BFS (Breadth-First Search) 共通部分 元のグラフを指定して 極大木を得る 探索アルゴリズムの利用の観点から 利用する側からみると 取り替えられる部品 どちらの方法が良いかはグラフに依存 操作性が同じでなければ 共通のクラスの派生で作ると便利 共通化を考える
alg2015-6r3.ppt
1 アルゴリズムとデータ 構造 第 6 回探索のためのデータ構造 (1) 補稿 : 木の巡回 ( なぞり ) 2 木の巡回 ( 第 5 回探索 (1) のスライド ) 木の巡回 * (traverse) とは 木のすべての節点を組織だった方法で訪問すること 深さ優先探索 (depth-first search) による木の巡回 *) 木の なぞり ともいう 2 3 1 3 4 1 4 5 7 10
ストリームを用いたコンカレントカーネルプログラミングと最適化 エヌビディアジャパン CUDAエンジニア森野慎也 GTC Japan 2014
ストリームを用いたコンカレントカーネルプログラミングと最適化 エヌビディアジャパン CUDAエンジニア森野慎也 GTC Japan 2014 コンカレントな処理の実行 システム内部の複数の処理を 平行に実行する CPU GPU メモリ転送 カーネル実行 複数のカーネル間 ストリーム GPU 上の処理キュー カーネル実行 メモリ転送の並列性 実行順序 DEFAULT STREAM Stream : GPU
スライド 1
GPU クラスタによる格子 QCD 計算 広大理尾崎裕介 石川健一 1.1 Introduction Graphic Processing Units 1 チップに数百個の演算器 多数の演算器による並列計算 ~TFLOPS ( 単精度 ) CPU 数十 GFLOPS バンド幅 ~100GB/s コストパフォーマンス ~$400 GPU の開発環境 NVIDIA CUDA http://www.nvidia.co.jp/object/cuda_home_new_jp.html
模擬試験問題(第1章~第3章)
基本情報技術者試験の練習問題 - 第 8 回 この問題は平成 19 年度秋期の問題から抜粋しています 問 1 次のプログラムの説明及びプログラムを読んで, 設問 1,2 に答えよ プログラムの説明 スタックを使って, 実数値を 10 進数字列 ( 文字列 ) に変換する副プログラム FloatFormat である (1) FloatFormat は, 実数 Float の値を 10 進数字列に変換し,
[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP
InfiniBand ACP 1,5,a) 1,5,b) 2,5 1,5 4,5 3,5 2,5 ACE (Advanced Communication for Exa) ACP (Advanced Communication Primitives) HPC InfiniBand ACP InfiniBand ACP ACP InfiniBand Open MPI 20% InfiniBand Implementation
Microsoft PowerPoint - mp13-07.pptx
数理計画法 ( 数理最適化 ) 第 7 回 ネットワーク最適化 最大流問題と増加路アルゴリズム 担当 : 塩浦昭義 ( 情報科学研究科准教授 ) [email protected] ネットワーク最適化問題 ( 無向, 有向 ) グラフ 頂点 (verex, 接点, 点 ) が枝 (edge, 辺, 線 ) で結ばれたもの ネットワーク 頂点や枝に数値データ ( 距離, コストなど ) が付加されたもの
人工知能論 第1回
知能システム学 第 8 回ー第 9 回 探索による問題解決 (1) ソフトウェア情報学部 David Ramamonjisoa 問題解決エージェントの例 旅行者 ( エージェント ) が, ルーマニアの都市 Arad に滞在している. エージェントは, 次の日 Bucharest から飛び立つチケットを持っている. どうすればよいか. ゴールの定式化 : ドライブして Bucharest に行く を,
Taro-スタック(公開版).jtd
0. 目次 1. 1. 1 配列によるの実現 1. 2 再帰的なデータ構造によるの実現 1. 3 地図情報処理 1. 4 問題 問題 1 グラフ探索問題 - 1 - 1. は データの出し入れが一カ所で行われ 操作は追加と削除ができるデータ構造をいう 出入口 追加 削除 操作 最初 111 追加 111 222 追加 111 222 333 追加 111 222 333 444 追加 111 222
ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社
ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において
<4D F736F F D208D C8FEE95F18DEC90AC A B D836A B2E646F63>
国土数値情報作成アプリケーション ( 指定地域データ等生成ツール ) 利用マニュアル 平成 20 年 3 月 国土交通省国土計画局 目次 1. ツール名 1 2. 機能概要 1 3. ツールのインストール 1 4. 使用方法 4 5. 動作環境 10 6. ツールのアンインストール 11 7.FAQ 12 1. ツール名 KSJ 指定地域データ等生成ツール -v#_##.exe (#_## はバージョン番号
連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa
連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 16 1.1 問題の定義 16 1.2 αβ 法 16 2 αβ 法の並列化 17 2.1 概要 17 2.2 Young Brothers Wait Concept 17 2.3 段数による逐次化 18 2.4 適応的な待機 18 2. 強制終了
bitvisor_summit.pptx
BitVisor 内蔵の lwip で Alkanet ログの送信を試みる 命館 学システムソフトウェア研究室 下雄也, 明 修平, 瀧本栄, 利公 1 はじめに (1/4) 近年, マルウェアが増加しており, マルウェアの脅威が問題となっている マルウェアの脅威に対抗するためには, 多数のマルウェアを迅速に解析する必要がある システムコールトレーサ Alkanet Windows 上で動作するマルウェアを対象とし,
2.5 トランスポート層 147
2.5 トランスポート層 147 TCP と UDP TCP (Transmission Control Protocol) コネクション型 ギャランティード マルチキャスト ブロードキャスト不可 UDP (User Datagram Protocol) コネクションレス ベストエフォート マルチキャスト ブロードキャスト可 cf. IP (Internet Protocol) コネクションレス ベストエフォート
はじめに コースの概要と目的 Oracle をより効率的に使用するための SQL のチューニング方法について説明します また 索引の有無 SQL の 記述方法がパフォーマンスにどのように影響するのかを実習を通して理解します 受講対象者 アプリケーション開発者 / データベース管理者の方 前提条件 S
はじめに コースの概要と目的 Oracle をより効率的に使用するための SQL のチューニング方法について説明します また 索引の有無 SQL の 記述方法がパフォーマンスにどのように影響するのかを実習を通して理解します 受講対象者 アプリケーション開発者 / データベース管理者の方 前提条件 SQL トレーニング データベース アーキテクチャ コースを受講された方 もしくは同等の知識をお持ちの
従業員の融通を許した シフトスケジューリング問題
フードコートにおけるアルバイト従業員の勤務シフト作成に関する研究 東京理科大学工学部第一部経営工学科 4 年 沼田研究室 4410072 日野駿 2014/01/31 卒研審査会 1 目次 1. はじめに 2. 問題 3. 定式化 4. 求解実験 5. 結果と考察 6. まとめと今後の課題参考文献 2014/01/31 卒研審査会 2 1. はじめに 1.1. 研究背景 (1) 飲食店は, 大部分の従業員をアルバイトで構成
しています. これには探索木のすべてのノードを探索する必要がありますが,αβカットなどの枝刈りの処理により探索にかかる計算時間を短縮しています. これに対して, 探索するノードを限定したり, 優先順位をつけて選択的に探索する 選択探索 という探索方式があります. 本チームはノードの選択方式としてノー
芝浦将棋 Softmax のチーム紹介 2017 年 3 月 14 日芝浦工業大学情報工学科五十嵐治一, 原悠一 1. はじめに本稿は, 第 27 回世界コンピュータ将棋選手権 (2017 年 5 月 3 日 ~5 日開催 ) に出場予定の 芝浦将棋 Softmax ( シバウラショウギソフトマックス ) のアピール文書です. 本チームは 芝浦将棋 Jr. から分離した初参加のチームです. 探索手法が従来の
PowerPoint Template
プログラミング演習 Ⅲ Linked List P. Ravindra S. De Silva e-mail: [email protected], Room F-413 URL: www.icd.cs.tut.ac.jp/~ravi/prog3/index_j.html 連結リストとは? 一つひとつの要素がその前後の要素との参照関係をもつデータ構造 A B C D 連結リストを使用する利点 - 通常の配列はサイズが固定されている
Microsoft PowerPoint - sp ppt [互換モード]
// システムプログラム概論 メモリ管理 () 今日の講義概要 ページ管理方式 ページ置換アルゴリズム 第 5 講 : 平成 年 月 日 ( 月 ) 限 S 教室 中村嘉隆 ( なかむらよしたか ) 奈良先端科学技術大学院大学助教 [email protected] http://narayama.naist.jp/~y-nakamr/ // 第 5 講メモリ管理 () ページング ( 復習
ICDE2013study.ppt
ICDE2013 勉強会 R10: Main Memory Query Processing 担当 : 山室健 1 概要 } このセクションの特徴 } in-memory を前提としたクエリ最適化 (Hash Join の高速化や MV による資源の利活用 ) に関する話題 } 紹介する論文リスト } 1. Efficient Many-Core Query Execution in Main Memory
A Feasibility Study of Direct-Mapping-Type Parallel Processing Method to Solve Linear Equations in Load Flow Calculations Hiroaki Inayoshi, Non-member
A Feasibility Study of Direct-Mapping-Type Parallel Processing Method to Solve Linear Equations in Load Flow Calculations Hiroaki Inayoshi, Non-member (University of Tsukuba), Yasuharu Ohsawa, Member (Kobe
【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus
http://www.hitachi.co.jp/soft/ask/ http://www.hitachi.co.jp/cosminexus/ Printed in Japan(H) 2014.2 CA-884R データ管 タ管理 理 ノンストップデータベース データ管 タ管理 理 インメモリデータグリッド HiRDB Version 9 ucosminexus Elastic Application
計算機アーキテクチャ
計算機アーキテクチャ 第 11 回命令実行の流れ 2014 年 6 月 20 日 電気情報工学科 田島孝治 1 授業スケジュール ( 前期 ) 2 回日付タイトル 1 4/7 コンピュータ技術の歴史と コンピュータアーキテクチャ 2 4/14 ノイマン型コンピュータ 3 4/21 コンピュータのハードウェア 4 4/28 数と文字の表現 5 5/12 固定小数点数と浮動小数点表現 6 5/19 計算アーキテクチャ
TFTP serverの実装
TFTP サーバーの実装 デジタルビジョンソリューション 佐藤史明 1 1 プレゼンのテーマ組み込みソフトのファイル転送を容易に 2 3 4 5 基礎知識 TFTP とは 実践 1 実際に作ってみよう 実践 2 組み込みソフトでの実装案 最後におさらい 2 プレゼンのテーマ 組み込みソフトのファイル転送を容易に テーマ選択の理由 現在従事しているプロジェクトで お客様からファームウェアなどのファイル転送を独自方式からTFTPに変更したいと要望があった
10年オンプレで運用したmixiをAWSに移行した10の理由
10 年オンプレで運用した mixi を AWS に移行した 10 の理由 AWS Summit Tokyo 2016 株式会社ミクシィ オレンジスタジオ mixi システム部北村聖児 自己紹介 2 名前 北村聖児 所属 株式会社ミクシィオレンジスタジオ mixiシステム部 担当サービス SNS mixi 今日話すこと 3 mixi を AWS に移行した話 mixi 2004 年 3 月 3 日にオフィシャルオープンした
hotspot の特定と最適化
1 1? 1 1 2 1. hotspot : hotspot hotspot Parallel Amplifier 1? 2. hotspot : (1 ) Parallel Composer 1 Microsoft* Ticker Tape Smoke 1.0 PiSolver 66 / 64 / 2.76 ** 84 / 27% ** 75 / 17% ** 1.46 89% Microsoft*
Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc
Article ID: NVSI-050110JP Created: 2005/10/19 Revised: - NetVault 仮想テープ ライブラリのパフォーマンス検証 : dothill SANnetⅡSATA 編 1. 検証の目的 ドットヒルシステムズ株式会社の SANnetll SATA は 安価な SATA ドライブを使用した大容量ストレージで ディスクへのバックアップを行う際の対象デバイスとして最適と言えます
離散数学
離散数学 最短経路問題 落合秀也 その前に 前回の話 深さ優先探索アルゴリズム 開始点 から深さ優先探索を行うアルゴリズム S.pu() Wl S not mpty v := S.pop() I F[v] = l Tn, F[v] := tru For no u n A[v] S.pu(u) EnFor EnI EnWl (*) 厳密には初期化処理が必要だが省略している k 時間計算量 :O(n+m)
IPSJ SIG Technical Report PIN(Personal Identification Number) An Examination of Icon-based User Authentication Method for Mobile Terminals Fum
1 2 1 3 PIN(Personal Identification Number) An Examination of Icon-based User Authentication Method for Mobile Terminals Fumio Sugai, 1 Masami Ikeda, 2 Naonobu Okazaki 1 and Mi RangPark 3 In recent years,
Microsoft Word - lec_student-chp3_1-representative
1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )
IIS RealSecure Network Sensor 6.5 IDS, IBM Proventia G200 IDS/IPS, FortiNetwork FortiGate-310B, FortiGate-620B UTM, BivioNetwork Bivio 7512 DPI Nokia
L2/L3 1 L2/L3 A study of the transparent firewalls using L2/L3 switching devices Hideaki Tsuchiya 1 The transparent firewalls are the useful security devices, that are capable to sit in-line without changing
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
Corp ENT 3C PPT Template Title
NetApp FAS シリーズ向け ストレージセキュリティのご紹介 ServerProtect for Storage on NetApp トレンドマイクロ株式会社 1 Copyright 2016 Trend Micro Incorporated. All rights reserved. Last Updated 2016/03/28 ServerProtect for Storage on NetApp
MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~
MATLAB における並列 分散コンピューティング ~ Parallel Computing Toolbox & MATLAB Distributed Computing Server ~ MathWorks Japan Application Engineering Group Takashi Yoshida 2016 The MathWorks, Inc. 1 System Configuration
修士論文
AVX を用いた倍々精度疎行列ベクトル積の高速化 菱沼利彰 1 藤井昭宏 1 田中輝雄 1 長谷川秀彦 2 1 工学院大学 2 筑波大学 1 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算 - 4. 実験 - 倍々精度疎行列ベクトル積 - 5. まとめ 多倍長精度計算フォーラム 2 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算
6 2. AUTOSAR 2.1 AUTOSAR AUTOSAR ECU OSEK/VDX 3) OSEK/VDX OS AUTOSAR AUTOSAR ECU AUTOSAR 1 AUTOSAR BSW (Basic Software) (Runtime Environment) Applicat
AUTOSAR 1 1, 2 2 2 AUTOSAR AUTOSAR 3 2 2 41% 29% An Extension of AUTOSAR Communication Layers for Multicore Systems Toshiyuki Ichiba, 1 Hiroaki Takada, 1, 2 Shinya Honda 2 and Ryo Kurachi 2 AUTOSAR, a
1 3DCG [2] 3DCG CG 3DCG [3] 3DCG 3 3 API 2 3DCG 3 (1) Saito [4] (a) 1920x1080 (b) 1280x720 (c) 640x360 (d) 320x G-Buffer Decaudin[5] G-Buffer D
3DCG 1) ( ) 2) 2) 1) 2) Real-Time Line Drawing Using Image Processing and Deforming Process Together in 3DCG Takeshi Okuya 1) Katsuaki Tanaka 2) Shigekazu Sakai 2) 1) Department of Intermedia Art and Science,
Microsoft Word - 0_0_表紙.doc
2km Local Forecast Model; LFM Local Analysis; LA 2010 11 2.1.1 2010a LFM 2.1.1 2011 3 11 2.1.1 2011 5 2010 6 1 8 3 1 LFM LFM MSM LFM FT=2 2009; 2010 MSM RMSE RMSE MSM RMSE 2010 1 8 3 2010 6 2010 6 8 2010
HULFT Series 製品における Javaの脆弱性(CVE )に対する報告
2017 年 4 月 28 日 お客様各位 株式会社セゾン情報システムズ HULFT Series 製品における Java の脆弱性 (CVE-2017-3512) に対する報告 HULFT 事業部 HULFT Series 製品における Java の脆弱性 (CVE-2017-3512) に対する報告をご案内いたします - 記 - 1. 脆弱性の内容 Java において 脆弱性が公表されました (CVE-2017-3512)
Microsoft PowerPoint - H20第10回最短経路問題-掲示用.ppt
最短経路問題とは プログラミング言語 I 第 0 回 から終点へ行く経路が複数通りある場合に 最も短い経路を見つける問題 経路の短さの決め方によって様々な応用 最短経路問題 埼玉大学工学部電気電子システム工学科伊藤和人 最短経路問題の応用例 カーナビゲーション 現在地から目的地まで最短時間のルート 経路 = 道路 交差点において走る道路を変更してもよい 経路の短さ = 所要時間の短さ 鉄道乗り換え案内
umeda_1118web(2).pptx
選択的ノード破壊による ネットワーク分断に耐性のある 最適ネットワーク設計 関西学院大学理工学部情報科学科 松井知美 巳波弘佳 選択的ノード破壊によるネットワーク分断に耐性のある最適ネットワーク設計 0 / 20 現実のネットワーク 現実世界のネットワークの分析技術の進展! ネットワークのデータ収集の効率化 高速化! 膨大な量のデータを解析できる コンピュータ能力の向上! インターネット! WWWハイパーリンク構造
Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 0 Copyright 2017 FUJITSU AD
Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 [email protected] 0 背景 リアルタイム性が必要な分野への適用 5G( 低遅延 ) による新たなサービス展開 ゲーム VoIP 動画医療金融車載 遅延がサービス品質に直結 End-to-End
1. はじめに (1) 本書の位置づけ 本書ではベジフルネット Ver4 の導入に関連した次の事項について記載する ベジフルネット Ver4 で改善された機能について 新機能の操作に関する概要説明 ベジフルネット Ver4 プログラムのインストールについて Ver4 のインストール手順についての説明
システム名称 : ベジフルネットシステム第 3 期 ベジフルネット Ver4 操作説明資料 目次 1. はじめに P1 2. 新機能の操作について (1) マスタ更新機能操作概要 P2 (2) 履歴出力機能操作概要 P6 (3) チェック機能操作概要 P7 (4)CSV 出力機能 P8 3. ベジフルネット Ver4 プログラムのインストール (1) ベジフルネット Ver4 インストール手順 P9
Microsoft PowerPoint - No6note.ppt
前回 : 管理 管理の目的 : の効率的利用 ( 固定区画方式 可変区画方式 ) しかし, いかに効率よく使ったとしても, 実行可能なプログラムサイズや同時に実行できるプロセス数は実装されているの大きさ ( 容量 ) に制限される 256kB の上で,28kB のプロセスを同時に 4 個実行させることはできないか? 2 256kB の上で,52kB のプロセスを実行させることはできないか? 方策 :
23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h
23 FPGA CUDA Performance Comparison of FPGA Array with CUDA on Poisson Equation ([email protected]), ([email protected]), ([email protected]), ([email protected]),
MMUなしプロセッサ用Linuxの共有ライブラリ機構
MMU なしプロセッサ用 Linux の共有ライブラリ機構 大谷浩司 高岡正 近藤政雄 臼田尚志株式会社アックス はじめに μclinux には 仮想メモリ機構がないので共有ライブラリ機構が使えない でもメモリ消費抑制 ストレージ消費抑制 保守性の向上のためには 欲しい 幾つかの実装があるが CPU ライセンス 機能の制限のためにそのまま利用できない RidgeRun 社 (Cadenux 社 )
intra-mart Accel Platform — IM-共通マスタ スマートフォン拡張プログラミングガイド 初版
Copyright 2012 NTT DATA INTRAMART CORPORATION 1 Top 目次 1. 改訂情報 2. IM- 共通マスタの拡張について 2.1. 前提となる知識 2.1.1. Plugin Manager 2.2. 表記について 3. 汎用検索画面の拡張 3.1. 動作の概要 3.1.1. 汎用検索画面タブの動作概要 3.2. 実装の詳細 3.2.1. 汎用検索画面タブの実装
