ICDE2013study.ppt
|
|
- せぴあ すえがら
- 4 years ago
- Views:
Transcription
1 ICDE2013 勉強会 R10: Main Memory Query Processing 担当 : 山室健 1
2 概要 } このセクションの特徴 } in-memory を前提としたクエリ最適化 (Hash Join の高速化や MV による資源の利活用 ) に関する話題 } 紹介する論文リスト } 1. Efficient Many-Core Query Execution in Main Memory Column-Stores } 2. Recycling in Pipelined Query Evaluation } 3. Main-Memory Hash Joins on Multi-Core CPUs: Tuning to the Underling Hardware 2 R10: Main Memory Query Processing 担当 : 山室健
3 Disk-less Modern Database Management から引用 3 R10: Main Memory Query Processing 担当 : 山室健
4 1. Efficient Many-Core Query Execution in Main Memory Column-Stores Jonathan Dees (SAP) Peter Sanders (KIT - Karlsruher Institut fuer Technology) 4 R10: Main Memory Query Processing 担当 : 山室健
5 1. Efficient Many-Core Query Execution in Main Memory Column-Stores } A overview } 現状提案されている様々な Modern な DB 最適化手法を用いて OLAP 向けのクエリ (TPC-H) の高速化を SAP HANA 上で実現しました という実装論文 } Contribution } Modern な DB 最適化手法が広く浅く議論されている } OLAP 向けに最適化された既存の ColumnDB(Vectorwise) と比較して 倍の高速化 (at SF100 and SF300) 5 R10: Main Memory Query Processing 担当 : 山室健
6 1. Efficient Many-Core Query Execution in Main Memory Column-Stores } 扱っている DB 最適化手法 } Just-in-time SQL Compilation } Vector-at-a-time Query Execution } Column-oriented Storage } NUMA-based Thread Schedulers/Indices } Inverted Indices } Block Summaries like Zonemaps in Netezza } Loop Unrolling/SIMD Instructions }... 6 R10: Main Memory Query Processing 担当 : 山室健
7 1. Efficient Many-Core Query Execution in Main Memory Column-Stores } Experimental } 22 Queries in TPC-H } 4 Xeon X7560 } 8-cores at 2.27 GHz. } 256GiB Mem } Mem bandwidth 50GiB/s } Memory Space Used } データ圧縮率 51% } 索引による余剰領域 19% 論文内 TableⅡから引用 7 R10: Main Memory Query Processing 担当 : 山室健
8 1. Efficient Many-Core Query Execution in Main Memory Column-Stores 処理を並列化しない場合の性能比較 8 論文内 TableⅢ から引用
9 2. Recycling in Pipelined Query Evaluation Fabian Nagel (The University of Edinburgh) Peter Boncz (CWI) Stratis Viglas (The University of Edinburgh) 9 R10: Main Memory Query Processing 担当 : 山室健
10 2. Recycling in Pipelined Query Evaluation } A overview } クエリ実行中に発生した中間結果 もしくは最終結果 (Materialized View) をクエリ間で自律的に再利用 (Recycle) することで 全体の処理性能を改善 } Contribution } パイプライン実行モデル (Volcano-style) と クエリの中間 / 最終結果を再利用するスキームを統一的に扱う手法の提案 } Recycler Graph(DAG) と Recycler Cache による MV の管理 } 利得 (Benefit) 関数によるクエリの Rewirte 処理 } 実際に Vectorwise[2][20] 上に実装し評価 10 R10: Main Memory Query Processing 担当 : 山室健
11 2. Recycling in Pipelined Query Evaluation } MV の Recycling } 最適化後のクエリ木と Recycler Graph を比較して Rewriter で書き換え } Recycle Graph を考慮した Optimizer での最適化は行わない (optional) } Execution Engine 上で発生した MV を用いて Recycler を更新 } 各 MV の参照統計情報 } Recycler Graph の更新と Cache の入れ替え 論文内 Fig.1 から引用 11 R10: Main Memory Query Processing 担当 : 山室健
12 2. Recycling in Pipelined Query Evaluation } MV の Matching と Insertion } クエリ木と Recycler Graph を Bottom-up 的に Matching } Graph の各ノードは Operator(Leaf は Relation) で ノード参照は Has h を用いることで O(1) の探索 123 } Graph 上に存在しない候補が存在した場合には クエリ実行中に新規エントリを Graph に追加 4 論文内 Fig.2 から引用 12 R10: Main Memory Query Processing 担当 : 山室健
13 2. Recycling in Pipelined Query Evaluation } TPC-H Experiments } 3 つの Recycle Strategy で評価 } HIST: 中間 / 最終結果を Cache に入れるかどうかの判断は過去のクエリ履歴のみから判断 (2 回以上使用しないと Recycle されない ) } SPEC: 初回出現時に投機的に Cache に追加 } PA: Top-k クエリや selection を投機的に Cache に追加 13 R10: Main Memory Query Processing 担当 : 山室健
14 2. Recycling in Pipelined Query Evaluation } TPC-H Experiments } 3 つの Recycle Strategy で評価 } HIST: 中間 / 最終結果を Cache に入れるかどうかの判断は過去のクエリ履歴のみから判断 (2 回以上使用しないと Recycle されない ) } SPEC: 初回出現時に投機的に Cache に追加 } PA: Top-k クエリや selection を投機的に Cache に追加 14 R10: Main Memory Query Processing 担当 : 山室健
15 3. Main-Memory Hash Joins on Multi-Core CPUs: Tuning to the Underling Hardware Cagri Balkesen (ETH Zurich) Jens Teubner (ETH Zurich) Gustavo Alonso (ETH Zurich) M. Tamer Özsu (University of Waterloo) 15 R10: Main Memory Query Processing 担当 : 山室健
16 3. Main-memory Hash Joins on Multi-Cores CPUs } A overview } cache-oblivious/conscious な HashJoins 手法の性能比較 } cache-oblivious * : HW 最適化のための knob が無い手法 } cache-conscious: ある特定の HW 環境に最適化された手法 } Contribution * } 既存手法を分析し HW 環境に適した最適化を提案 } 上記 2 つの手法 (oblivious/conscious) と HW 環境の依存関係を分析 / 再考し HW 最適化の基礎を構築 } HW 最適化の重要性を示唆 ( 考慮の有無で 3 6x の性能差 ) } SC: 16 R10: Main Memory Query Processing 担当 : 山室健
17 3. Main-memory Hash Joins on Multi-Cores CPUs } 取り扱う 2 種類の HashJoins * No-Partitioning Joins (Cache-oblivious way) 論文内 Fig.2 から引用 Radix Joins (Cache-conscious way) 論文内 Fig.4 から引用 17 R10: Main Memory Query Processing 担当 : 山室健 *1-pass Algorithm を前提
18 3. Main-memory Hash Joins on Multi-Cores CPUs } Radix Joins(Cache-conscious) } CPU キャッシュ効率を考慮して HashTable を複数分割 } 各 passで2 #radix bits に分割 } キャッシュの観点から極力小さいほうが良い } ただし 小さすぎると TLB * によるペナルティが顕在化 [4] } HW を考慮した最適化が必要 *Translation Look-aside Buffer, 物理ページ addr. の virtual/physical 変換表 18 R10: Main Memory Query Processing 担当 : 山室健
19 3. Main-memory Hash Joins on Multi-Cores CPUs } Experimental } サイズの偏りを考慮した 2 パタンのデータ A/B を用意 } 異なる CPU を 4 パタン用意 論文内 TableⅠ から引用 論文内 TableⅡ から引用 19 R10: Main Memory Query Processing 担当 : 山室健
20 3. Main-memory Hash Joins on Multi-Cores CPUs } Experimental } データ A/B における CPU 時間評価 } No-Partitioning Joinの処理比率 (B/P) は入力サイズに依存 } Radix Joinの大半の時間はPartition 処理 論文内 Fig.14 から引用 20 R10: Main Memory Query Processing 担当 : 山室健
21 3. Main-memory Hash Joins on Multi-Cores CPUs } Experimental } データ A/B における CPU 時間評価 } No-Partitioning Joinの処理比率 (B/P) は入力サイズに依存 } Radix Joinの大半の時間はParition 処理 SPARC は弱いメモリモデルを採用しているため同期コストが非常に低い (& キャッシュ効率の良し悪しの差 ) 論文内 Fig.14 から引用 21 R10: Main Memory Query Processing 担当 : 山室健
22 3. Main-memory Hash Joins on Multi-Cores CPUs } Experimental } Radix Join の Partition 処理時間と Knob の関係は? } 多少の性能の上下はあるが knob の影響は小 論文内 Fig.9 から引用 22 R10: Main Memory Query Processing 担当 : 山室健
23 3. Main-memory Hash Joins on Multi-Cores CPUs } Experimental } Radix Join の Partition 処理時間と Knob の関係は? } 多少の性能の上下はあるが knob の影響は小 HW 環境に依存する HashJoin に関しては cache-conscious な手法を用いることで多少の環境依存を犠牲に大幅な性能向上が期待できる 論文内 Fig.9 から引用 23 R10: Main Memory Query Processing 担当 : 山室健
ICDE’15 勉強会 R24-4: R27-3 (R24:Query Processing 3, R27 Indexing)
R24-4: The DBMS - your Big Data Sommelier (R24: Query Processing 3) R27-3: A Comparison of Adaptive Radix Trees and Hash Tables (R27: Indexing) 小山田 (NEC) ICDE 15 勉強会 R24-4: The DBMS - your Big Data Sommelier
More informationicde_5a_3
ICDE 2016 & WWW 2016 勉強会 Research Session 5A-3: Durable Graph Pattern Queries on Historical Graphs Konstantinos Semertzidis Evaggelia Pitoura 担当 : 楠和馬 ( 同志社大学 ) I. Introduction (1 / 2) } 背景 } 様々なドメインで時間経過につれ変化するグラフがほとんど
More informationuntitled
2004 03 06 DEWS2004 in 1. 2. Continuous Query 3. 4. GPS HTML, XML RFID DB DB Web URL TS URL Load Description 7 /echo.cgi 0.41 CGI Prog. RDB TS Load Mem 1 0.38 8688k 6 0.41 7808k TS URL IP 5 /top.html
More informationPowerPoint プレゼンテーション
Oracle GRID Center Flash SSD + 最新ストレージと Oracle Database で実現するデータベース統合の新しい形 2011 年 2 月 23 日日本オラクル Grid Center エンジニア岩本知博 進化し続けるストレージ関連技術 高速ストレージネットワークの多様化 低価格化 10GbE FCoE 8Gb FC ディスクドライブの多様化および大容量 / 低価格化
More informationbit bit bit VAST N d i d 1 <d 2 <...<d k <...<d N d k VAST d k 3 d k 3 d k 2 d k 1 d k 4 w w=4 ) HW HW 32bit γ δ [4] PForDelta [3] HW CPU VAST VAST VA
DEIM Forum 2013 F10-6 VAST CPU NTT, 180-0012 3-9-11 E-mail: {yamamuro.takeshi,onizuka.makoto,konishi.fumikazu}@lab.ntt.co.jp CPU HW HW HW VAST VAST SIMD CPU TLB bit VAST VAST VAST VAST CPU SIMD VAST-Tree
More informationMicrosoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]
200/0/9 数値流体解析の並列効率とその GPU による高速化の試み 清水建設 ( 株 ) 技術研究所 PHAM VAN PHUC ( ファムバンフック ) 流体計算時間短縮と GPU の活用の試み 現 CPUとの比較によりGPU 活用の可能性 現 CPU の最大利用 ノード内の最大計算資源の利用 すべてCPUコアの利用 適切なアルゴリズムの利用 CPU コア性能の何倍? GPU の利用の試み
More informationuntitled
c NUMA 1. 18 (Moore s law) 1Hz CPU 2. 1 (Register) (RAM) Level 1 (L1) L2 L3 L4 TLB (translation look-aside buffer) (OS) TLB TLB 3. NUMA NUMA (Non-uniform memory access) 819 0395 744 1 2014 10 Copyright
More information橡kenkyuhoukoku8.PDF
10-1- -2- 11 21 10 5 12 1 10 0 5 3-3- -4-10 75 3 10 10 75 100 10 75 5 10 (1) (2) -5- (3) -6- (4) 27 11.290 291-7- (5) 1 1-8- 1 (6) 51 (7) -9- (1) (2) -10- (3) -11- (4) -12- -13- (5) (6) (7) (1) (2) -14-
More informationPowerPoint プレゼンテーション
ICDE2013 勉強会 R9 Indexing Structures 西村祥治 NEC 2013/6/29 2013/6/29 ICDE2013 勉強会 R9:Indexing Structures 西村 @NEC 1 The Bw-Tree: A B-tree for New Hardware Platforms Justin J. Levandoski, David B. Lomet, Sudipta
More informationCPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2
FFT 1 Fourier fast Fourier transform FFT FFT FFT 1 FFT FFT 2 Fourier 2.1 Fourier FFT Fourier discrete Fourier transform DFT DFT n 1 y k = j=0 x j ω jk n, 0 k n 1 (1) x j y k ω n = e 2πi/n i = 1 (1) n DFT
More informationMicrosoft PowerPoint - sp ppt [互換モード]
システムプログラム概論 メモリ管理 (1) 第 x 講 : 平成 20 年 10 月 15 日 ( 水 ) 2 限 S1 教室 今日の講義概要 メモリ管理の必要性 静的メモリ管理と動的メモリ管理 スワッピング, 仮想記憶 ページングとセグメンテーション 中村嘉隆 ( なかむらよしたか ) 奈良先端科学技術大学院大学助教 y-nakamr@is.naist.jp http://narayama.naist.jp/~y-nakamr/
More information~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co
072 DB Magazine 2007 September ~~~~~~~~~~~~~~~~~~ wait Call CPU time 1,055 34.7 latch: library cache 7,278 750 103 24.7 latch: library cache lock 4,194 465 111 15.3 job scheduler coordinator slave wait
More informationMicrosoft PowerPoint - os ppt [互換モード]
4. メモリ管理 (1) 概要メモリ管理の必要性静的メモリ管理と動的メモリ管理スワッピング, 仮想記憶ページングとセグメンテーション 2008/5/ 20 メモリ管理 (1) 1 メモリはコンピュータの 5 大構成要素 装置 ( キーボード, マウス ) CPU ( 中央演算装置 ) 出 装置 ( モニタ, プリンタ ) 主記憶装置 ( メインメモリ ) 外部記憶装置 (HDD) 2008/5/ 20
More information4.1 % 7.5 %
2018 (412837) 4.1 % 7.5 % Abstract Recently, various methods for improving computial performance have been proposed. One of these various methods is Multi-core. Multi-core can execute processes in parallel
More information,4) 1 P% P%P=2.5 5%!%! (1) = (2) l l Figure 1 A compilation flow of the proposing sampling based architecture simulation
1 1 1 1 SPEC CPU 2000 EQUAKE 1.6 50 500 A Parallelizing Compiler Cooperative Multicore Architecture Simulator with Changeover Mechanism of Simulation Modes GAKUHO TAGUCHI 1 YOUICHI ABE 1 KEIJI KIMURA 1
More informationLinux @ S9 @ CPU #0 CPU #1 FIB Table Neighbor Table 198.51.100.0/24 fe540072d56f 203.0.113.0/24 fe54003c1fb2 TX Ring TX Ring TX Buf. Dsc. RX Buf. Dsc. TX Buf. Dsc. RX Buf. Dsc. Packet NIC #0 NIC #1 CPU
More information160311_icm2015-muramatsu-v2.pptx
Linux におけるパケット処理機構の 性能評価に基づいた NFV 導 の 検討 村松真, 川島 太, 中 裕貴, 林經正, 松尾啓志 名古屋 業 学 学院 株式会社ボスコ テクノロジーズ ICM 研究会 2016/03/11 研究 的 VM 仮想 NIC バックエンド機構 仮想化環境 仮想スイッチ パケット処理機構 物理環境 性能要因を考察 汎 IA サーバ NFV 環境に適したサーバ構成を検討
More informationOracle Database 10g Release 2を使用したデータベース・パフォーマンス
Oracle Database 10g Release 2 2005 9 Oracle Database 10g Release 2... 3... 3... 3 Automatic Workload Repository AWR... 3 Automatic Database Diagnostic Monitor ADDM... 4 Automatic SQL Tuning SQL... 4 SQL
More information3 4 SAP HANA 5 6 SAP HANA Xeon E7 v3 SAP HANA 6 8 OLTP OLAP 1 9 SAP S/4HANA SAP HANA Studio 13 14
SAP HANA SAP HANA SAP HANA SPS10 2015.07 3 4 SAP HANA 5 6 SAP HANA Xeon E7 v3 SAP HANA 6 8 OLTP OLAP 1 9 SAP S/4HANA 10 11 12 SAP HANA Studio 13 14 SAP Hasso Plattner SAP SAP HANA SAP HANASAP SAP HANA
More informationuntitled
PC murakami@cc.kyushu-u.ac.jp muscle server blade server PC PC + EHPC/Eric (Embedded HPC with Eric) 1216 Compact PCI Compact PCIPC Compact PCISH-4 Compact PCISH-4 Eric Eric EHPC/Eric EHPC/Eric Gigabit
More informationhpc141_shirahata.pdf
GPU アクセラレータと不揮発性メモリ を考慮した I/O 性能の予備評価 白幡晃一 1,2 佐藤仁 1,2 松岡聡 1 1: 東京工業大学 2: JST CREST 1 GPU と不揮発性メモリを用いた 大規模データ処理 大規模データ処理 センサーネットワーク 遺伝子情報 SNS など ペタ ヨッタバイト級 高速処理が必要 スーパーコンピュータ上での大規模データ処理 GPU 高性能 高バンド幅 例
More informationストリームを用いたコンカレントカーネルプログラミングと最適化 エヌビディアジャパン CUDAエンジニア森野慎也 GTC Japan 2014
ストリームを用いたコンカレントカーネルプログラミングと最適化 エヌビディアジャパン CUDAエンジニア森野慎也 GTC Japan 2014 コンカレントな処理の実行 システム内部の複数の処理を 平行に実行する CPU GPU メモリ転送 カーネル実行 複数のカーネル間 ストリーム GPU 上の処理キュー カーネル実行 メモリ転送の並列性 実行順序 DEFAULT STREAM Stream : GPU
More informationデータセンターの効率的な資源活用のためのデータ収集・照会システムの設計
データセンターの効率的な 資源活用のためのデータ収集 照会システムの設計 株式会社ネットワーク応用通信研究所前田修吾 2014 年 11 月 20 日 本日のテーマ データセンターの効率的な資源活用のためのデータ収集 照会システムの設計 時系列データを効率的に扱うための設計 1 システムの目的 データセンター内の機器のセンサーなどからデータを取集し その情報を元に機器の制御を行うことで 電力消費量を抑制する
More information1. 52
51 1. 52 5 2. 1 2 54 4 55 5 1 56 2 57 . 1 1 58 2 1 59 2 4 60 61 62 6 64 4. 65 66 67 5 1 2 4 68 1 69 2 70 1 2 71 72 1 2 7 1 2 74 75 1 76 2 77 1 2 78 4 79 5 80 6. 1 81 2 82 8 84 85 86 87 7. 88 89 8. column
More information1 2 2 36 8 1212 15 16 20 22 24 26 28 8 14 21 1 31 32 32 3335 37 39 43 45 48 49 5051 54 56 58 6264 6669 43 50 58 2 73 74 7779 8183 85 88 91 93 9698 100 102103 74 85 93 106 106 108 110 112 3 115 116 116
More informationrouter_cachehit.eps
人気度推定を用いたキャッシュ方式とネットワーク誘導型キャッシュ発見方式の融合 柳生智彦 (NEC / 電通大 ), 藤井厚太朗 ( 電通大 ) 情報指向ネットワーク技術時限研究会 2015/4/7 研究背景 増加するトラフィック モバイルデータトラヒック総量は 5 年間で 10 倍に [1] WEB やビデオなどコンテンツ流通が大半 現在, コンテンツ流通はトラヒックの約半分で毎年 69% 増加 増え続けるトラヒックへ対応
More informationCoding theorems for correlated sources with cooperative information
MCMC-based particle filter を用いた人間の映像注視行動の実時間推定 2009 年 7 月 21 日 宮里洸司 (2) 木村昭悟 (1) 高木茂 (2) 大和淳司 (1) 柏野邦夫 (1) (1) 日本電信電話 ( 株 )NTT コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ (2) 国立沖縄工業高等専門学校情報通信システム工学科 背景 ヒトはどのようにして
More informationPervasive PSQL v11 のベンチマーク パフォーマンスの結果
Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7
More informationcpu2007lectureno2.ppt
Cache Cache Cache cache cache 17.10.2007 1 17.10.2007 2 Cache Register:FF circuits Cache:Bipolar,CMOS SRAM Main Storage:SRAM,DRAM Disk Cache:DRAM 17.10.2007 3 SRAM Cell Structure (1 bit) 17.10.2007 4 temporal
More information第62巻 第1号 平成24年4月/石こうを用いた木材ペレット
Bulletin of Japan Association for Fire Science and Engineering Vol. 62. No. 1 (2012) Development of Two-Dimensional Simple Simulation Model and Evaluation of Discharge Ability for Water Discharge of Firefighting
More information71-78.indd
6 AMD processor feature optimized to support virtualization machines (AMD) VMware Xen x86 AMD 2006 Rev. F F CPUSempron CPU AMD Virtualization AMD-V 9 Barcelona 3 Rapid Virtualization IndexingRVI Nested
More informationMicrosoft PowerPoint mm
システムプログラム概論 Memory management 1/2 2005/4/26 門林雄基 ( インターネット工学講座 ) 奈良先端科学技術大学院大学 今日の講義のポイント 問題は何か? memory hierarchy ( メモリ階層 ) この複雑な技術を 単純なプログラミングで使いこなせるようにできないか memory management in operating system 今日の講義のポイント
More informationIPSJ SIG Technical Report Vol.2013-ARC-203 No /2/1 SMYLE OpenCL (NEDO) IT FPGA SMYLEref SMYLE OpenCL SMYLE OpenCL FPGA 1
SMYLE OpenCL 128 1 1 1 1 1 2 2 3 3 3 (NEDO) IT FPGA SMYLEref SMYLE OpenCL SMYLE OpenCL FPGA 128 SMYLEref SMYLE OpenCL SMYLE OpenCL Implementation and Evaluations on 128 Cores Takuji Hieda 1 Noriko Etani
More informationVXPRO R1400® ご提案資料
Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム
More information情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-HPC-139 No /5/29 Gfarm/Pwrake NICT NICT 10TB 100TB CPU I/O HPC I/O NICT Gf
Gfarm/Pwrake NICT 1 1 1 1 2 2 3 4 5 5 5 6 NICT 10TB 100TB CPU I/O HPC I/O NICT Gfarm Gfarm Pwrake A Parallel Processing Technique on the NICT Science Cloud via Gfarm/Pwrake KEN T. MURATA 1 HIDENOBU WATANABE
More informationはじめに コースの概要と目的 Oracle をより効率的に使用するための SQL のチューニング方法について説明します また 索引の有無 SQL の 記述方法がパフォーマンスにどのように影響するのかを実習を通して理解します 受講対象者 アプリケーション開発者 / データベース管理者の方 前提条件 S
はじめに コースの概要と目的 Oracle をより効率的に使用するための SQL のチューニング方法について説明します また 索引の有無 SQL の 記述方法がパフォーマンスにどのように影響するのかを実習を通して理解します 受講対象者 アプリケーション開発者 / データベース管理者の方 前提条件 SQL トレーニング データベース アーキテクチャ コースを受講された方 もしくは同等の知識をお持ちの
More informationメモリ階層構造を考慮した大規模グラフ処理の高速化
, CREST ERATO 0.. (, CREST) ERATO / 8 Outline NETAL (NETwork Analysis Library) NUMA BFS raph500, reenraph500 Kronecker raph Level Synchronized parallel BFS Hybrid Algorithm for Parallel BFS NUMA Hybrid
More informationSlides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments
計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];
More informationOracle White Paper
オラクル ホワイトペーパー 2010 年 2 月 上での Server Hardware Sponsored by Copyright 2010 NS Solutions and Oracle, All Rights Reserved. はじめに 新日鉄ソリューションズ株式会社 ( 以降 NSSOL) は 1991 年の米国オラクル社と新日本製鐵株式会社による戦略的提携関係締結以来 長年にわたり強力なパートナー関係を礎として
More informationVol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m
Vol.55 No.1 2 15 (Jan. 2014) 1,a) 2,3,b) 4,3,c) 3,d) 2013 3 18, 2013 10 9 saccess 1 1 saccess saccess Design and Implementation of an Online Tool for Database Education Hiroyuki Nagataki 1,a) Yoshiaki
More informationこの方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の
計算機システム Ⅱ 演習問題学科学籍番号氏名 1. 以下の分の空白を埋めなさい. CPUは, 命令フェッチ (F), 命令デコード (D), 実行 (E), 計算結果の書き戻し (W), の異なるステージの処理を反復実行するが, ある命令の計算結果の書き戻しをするまで, 次の命令のフェッチをしない場合, ( 単位時間当たりに実行できる命令数 ) が低くなる. これを解決するために考案されたのがパイプライン処理である.
More information1. 1 DBMS Unix (USP ) ( )[3] 20 UNIX [2] KISS UNIX 1. 2 (Tukubai ) Unix OS Unix USP Tukubai Tukubai 1. 3 Unix SQL Tukubai usp Tukubai Open usp Tukubai
34 (2017 ) Unix UNIX 20 RDBMS RDBMS Java Unix Unix Unix Unicage is a system development method based on UNIX philosophy and has been applied on business system integration for 20 years. In these days,
More information2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹
ネットワークシステム B- 6-164 DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹 早稲田大学基幹理工学研究科情報理工学専攻 1 研究の背景 n インターネットトラフィックが増大 世界の IP トラフィックは 2012
More informationスライド 1
Zabbix のデータベース ベンチマークレポート PostgreSQL vs MySQL Yoshiharu Mori SRA OSS Inc. Japan Agenda はじめに Simple test 大量のアイテムを設定 Partitioning test パーティションイングを利用して計測 Copyright 2013 SRA OSS, Inc. Japan All rights reserved.
More informationGPGPU
GPGPU 2013 1008 2015 1 23 Abstract In recent years, with the advance of microscope technology, the alive cells have been able to observe. On the other hand, from the standpoint of image processing, the
More informationIBM Software Group DB2 Information Management Software DB2 V8 XML SQL/XML 2 XML XML UDF XMLExtender XML XML XMLCollection, XMLColumn XML UDF Informati
IBM Software Group XML Features in DB2 UDB V8 IBM Software Group DB2 Information Management Software DB2 V8 XML SQL/XML 2 XML XML UDF XMLExtender XML XML XMLCollection, XMLColumn XML UDF Information Integrator
More informationMicrosoft PowerPoint - ICD2011TakadaSlides.pptx
キャッシュウェイ割り当てと コード配置の同時最適化による メモリアクセスエネルギーの削減 九州大学 高田純司井上弘士京都大学石原亨 2012/8/9 1 目次 研究背景 組込みプロセッサにおけるエネルギー削減の必要性 キャッシュウェイ割り当て 提案手法 キャッシュウェイ割り当てとコード配置の組み合わせ 同時最適化 評価実験 まとめ 2012/8/9 2 組込みプロセッサの課題 研究背景 低消費エネルギー化,
More informationIPSJ SIG Technical Report Vol.2016-CVIM-201 No /3/3 Brick Partitioning 1,a) Winner Update Algorithm(WUA) Multilevel Successive Elimination
Brick Partitioning 1,a) 1 1 1 Winner Update Algorithm(WUA) Multilevel Successive Elimination Algorithm(MSEA) ( ) WUA MSEA Brick Partitioning MSEA(ABPMSE+ITE) 1. [1] ( ) ( ) ( ) ( 1 Graduate School of Engineering,
More informationPowerPoint プレゼンテーション
SIGIR2014 勉強会 Think Globally, Act Locally 担当 : 大島裕明 ( 京都大学 ) Think Globally, Act Locally Who is the Barbecue King of Texas?: A Geo-Spatial Approach to Finding Local Experts on Twitter Z. Cheng, J. Caverlee,
More informationuntitled
Oracle RAC 10gRAC Agenda 1. Why Oracle on Dell Dell Oracle on Linux Dell Oracle Dell Oracle 2. Oracle Clustering Solution Oracle Real Application Cluster 3. Case Study 4. Oracle RAC Solution on Dell Oracle
More informationVMware VirtualCenter: Virtual Infrastructure Management Software
VMware : CPU 1998 VMware : 50(R&D) : Workstation1999 GSX Server 2001 ESX Server 2001 : 900 100805%VMware 200 100 10,000 2 VMware Workstation 1999 Linux x86 3 VMware GSX Server Windows Linux x86 4 VMware
More informationHP ProLiantサーバー G7 マルチプロセッサー(MP)サーバーパーフェクトガイド
BOOST HP ProLiant G7 MP Xeon E7 HP ProLiant DL980 G7 / HP ProLiant DL580 G7 / HP ProLiant BL680c G7 / HP ProLiant BL620c G7 IT IT Xeon E7 HP ProLiant MP HP ProLiant DL980 G7 / DL580 G7 / BL680c G7 / BL620c
More information[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP
InfiniBand ACP 1,5,a) 1,5,b) 2,5 1,5 4,5 3,5 2,5 ACE (Advanced Communication for Exa) ACP (Advanced Communication Primitives) HPC InfiniBand ACP InfiniBand ACP ACP InfiniBand Open MPI 20% InfiniBand Implementation
More informationWhite Paper 高速部分画像検索キット(FPGA アクセラレーション)
White Paper 高速部分画像検索キット (FPGA アクセラレーション ) White Paper 高速部分画像検索キット (FPGA アクセラレーション ) Page 1 of 7 http://www.fujitsu.com/primergy Content はじめに 3 部分画像検索とは 4 高速部分画像検索システム 5 高速部分画像検索の適用時の改善効果 6 検索結果 ( 一例 )
More informationPowerPoint プレゼンテーション
オープンソース カンファレンス 2017 OSAKA ライトニング トーク あのクラウドと比べてみたよ IBM クラウドのリアルベンチマーク 2017 年 1 月 28 日 日本アイ ビー エム株式会社 クラウド事業統括 クラウドエバンジェリスト 安田智有 @ytomoari tomoari.yasuda 話 日本 IBM クラウドマイスター 安田智有 1 お客様の よしやってみるか を応援してきました
More informationWeb Microsoft 2008 R2 Database Database!! Database 04 08
Database Database Web http://www.microsoft.com/japan/sqlserver/2008/r2/solution/comparison/default.mspx Microsoft 2008 R2 Database Database!! 03 2009 6 1 Database 04 08 vs. Database 12 2008 R2 5 14! 5!
More informationMimehand II[1] [2] 1 Suzuki [3] [3] [4] (1) (2) 1 [5] (3) 50 (4) 指文字, 3% (25 個 ) 漢字手話 + 指文字, 10% (80 個 ) 漢字手話, 43% (357 個 ) 地名 漢字手話 + 指文字, 21
1 1 1 1 1 1 1 2 transliteration Machine translation of proper names from Japanese to Japanese Sign Language Taro Miyazaki 1 Naoto Kato 1 Hiroyuki Kaneko 1 Seiki Inoue 1 Shuichi Umeda 1 Toshihiro Shimizu
More informationMicrosoft PowerPoint - sales2.ppt
最適化とは何? CPU アーキテクチャに沿った形で最適な性能を抽出できるようにする技法 ( 性能向上技法 ) コンパイラによるプログラム最適化 コンパイラメーカの技量 経験量に依存 最適化ツールによるプログラム最適化 KAP (Kuck & Associates, Inc. ) 人によるプログラム最適化 アーキテクチャのボトルネックを知ること 3 使用コンパイラによる性能の違い MFLOPS 90
More informationIPSJ SIG Technical Report Vol.2009-CVIM-167 No /6/10 Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing
Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing number of HOG Features based on Real AdaBoost Chika Matsushima, 1 Yuji Yamauchi, 1 Takayoshi Yamashita 1, 2 and
More informationマルチコアPCクラスタ環境におけるBDD法のハイブリッド並列実装
2010 GPGPU 2010 9 29 MPI/Pthread (DDM) DDM CPU CPU CPU CPU FEM GPU FEM CPU Mult - NUMA Multprocessng Cell GPU Accelerator, GPU CPU Heterogeneous computng L3 cache L3 cache CPU CPU + GPU GPU L3 cache 4
More informationDEIM Forum 2009 B4-6, Str
DEIM Forum 2009 B4-6, 305 8573 1 1 1 152 8550 2 12 1 E-mail: tttakuro@kde.cs.tsukuba.ac.jp, watanabe@de.cs.titech.ac.jp, kitagawa@cs.tsukuba.ac.jp StreamSpinner PC PC StreamSpinner Development of Data
More information2014年春 Power Systems テクニカル・セミナー POWER8超解説
Power Systems の優位性 8 と Xeon の比較 ビッグデータ / クラウド時代の ITインフラに向けたテクノロジー開発 2,400 億円の投資 9 5/5+ 130/90 nm 1.5 ~ 2.2 GHz デュアル Simultaneous Multi- Threading (SMT) Micro Partitioning 6/6+ 65/65 nm 3.5 ~ 5.0 GHz デュアル
More information2/66
1/66 9 Outline 1. 2. 3. 4. CPU 5. Jun. 13, 2013@A 2/66 3/66 4/66 Network Memory Memory Memory CPU SIMD if Cache CPU Cache CPU Cache CPU 5/66 FPU FPU Floating Processing Unit Register Register Register
More informationInput image Initialize variables Loop for period of oscillation Update height map Make shade image Change property of image Output image Change time L
1,a) 1,b) 1/f β Generation Method of Animation from Pictures with Natural Flicker Abstract: Some methods to create animation automatically from one picture have been proposed. There is a method that gives
More informationPowerPoint プレゼンテーション
OSS のカラム型データベースエンジン MariaDB ColumnStore ビッグデータ分析などに適した大規模並列処理に対応する データベースエンジン MariaDB について MySQL から派生したオープンソースリレーショナルデータベース MariaDB は MySQL のオリジナルコード開発者である Michael Monty Widenius 氏によって開発されている MySQL と MariaDB
More informationMATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~
MATLAB における並列 分散コンピューティング ~ Parallel Computing Toolbox & MATLAB Distributed Computing Server ~ MathWorks Japan Application Engineering Group Takashi Yoshida 2016 The MathWorks, Inc. 1 System Configuration
More informationDEIM Forum 2014 D3-5 DSMS DSMS DSMS 2.13% RTOS Realtime-Aware Efficient Query Processing for Automotiv
DEIM Forum 2014 D3-5 DSMS 464 8601 E-mail: {katsunuma,honda,hiro}@ertl.jp DSMS DSMS 2.13% RTOS Realtime-Aware Efficient Query Processing for Automotive DSMS Satoshi KATSUNUMA, Shinya HONDA, and Hiroaki
More information090801OSC新潟.ppt
CEO miyahara@virtualtech.jp VirtualTech Japan Inc. VTJ 2006 12 14,250,000 1-1-10 CEO CTO 8 5.5 URL http://virtualtech.jp/ 2 1 P2V Xen 3 4 2 6 3 7 2 21 32 5 1 8 4 H/W Point!! 9 A B Phy M Phy M Phy M Phy
More informationOWI(Oracle Wait Interface)の概要
日本エクセム株式会社 1 目次 OWI とは? OWI ベース診断 / 分析 Oracle アーキテクチャーと OWI OWI の構成要素 システム性能管理の必要性 2 QUIZ 以下はある期間の STATSPACK レポートの一部です データベース処理で遅延が発生しているでしょうか 性能低下現象が発生している場合 どのように診断 / 分析を行い どのような改善ポイントを提案すべきでしょうか 3 プロセスの状態と
More informationSlide 1
インメモリ パラレル処理 データ圧縮技術がもたらす超高速データベース ~ システムの運用 そしてビジネスを変える ~ 日本オラクル株式会社テクノロジー製品事業統括本部データベースビジネス推進本部 以下の事項は 弊社の一般的な製品の方向性に関する概要を説明するものです また 情報提供を唯一の目的とするものであり いかなる契約にも組み込むことはできません 以下の事項は
More informationCloud[2] (48 ) Xeon Phi (50+ ) IBM Cyclops[9] (64 ) Cavium Octeon II (32 ) Tilera Tile-GX (100 ) PE [11][7] 2 Nsim[10] 8080[1] SH-2[5] SH [8
1600 1,a) 1,b) 8080 SH-2 8080 SH-2 Simulation of a Many-Core Architecture with 16 Million Processing Cores Hisanobu Tomari 1,a) Kei Hiraki 1,b) Abstract: 8080 and SH-2 processors are evaluated as building
More informationエンタープライズデータベースカタログ
Xeon E7 v2 INDEX: HP HP NonStop HP-UX HP HP ConvergedSystem 500 for SAP HANA HP ConvergedSystem 300 for MS Analytics Platform System HP ProLiant SSD Appliance P.02 P.04 P.06 P.08 P.10 P.11 P.11 HP HP HP
More informationMicrosoft Word - wp-impq-gridcenter-nec_v1.0.doc
オラクル ホワイトペーパー 2010 年 3 月 Oracle Database 11g Release 2 In-Memory Parallel Query による NEC Express5800/ スケーラブル HA サーバ上での Data Warehouse システム全体の性能向上 はじめに 日本電気株式会社 ( 以降 NEC) は2006 年 7 月に 次世代 IT 基盤を実現するためのITプラットフォームビジョン
More information技術が生み出す魔法!最新ハードウェアとチューニングで激速データベース
技術が生み出す魔法! 最新ハードウェアとチューニングで 激速データベース 2015 年 9 月 11 日富士通株式会社プラットフォーム技術本部プロダクトソリューション技術統括部志賀真之 DB を高速化するポイント CPU は活用できているか メモリを増やして早くする ストレージで性能改善する 1 CPU は活用できているか 2 CPU 技術動向 CPU は クロックは向上せずにコア数が増える傾向 Ghz
More informationDuplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF
Partial Copy Detection of Line Drawings from a Large-Scale Database Weihan Sun, Koichi Kise Graduate School of Engineering, Osaka Prefecture University E-mail: sunweihan@m.cs.osakafu-u.ac.jp, kise@cs.osakafu-u.ac.jp
More informationPowerPoint プレゼンテーション
高性能計算基盤 第 7 回 CA1003: 主記憶共有型システム http://arch.naist.jp/htdocs-arch3/ppt/ca1003/ca1003j.pdf Copyright 2019 奈良先端大中島康彦 1 2 3 4 マルチスレッディングとマルチコア 5 6 7 主記憶空間の数が 複数 か 1 つ か 8 ただしプログラムは容易 9 1 つの主記憶空間を共有する場合 10
More informationMicrosoft Word - JP-AppLabs-MySQL_Update.doc
アダプテック MaxIQ SSD キャッシュパフォーマンスソリューション MySQL 分析 September 22, 2009 はじめにアダプテックは Adaptec 5445Z ストレージコントローラでアダプテック MaxIQ SSD キャッシュパフォーマンスソリューション使用した場合のパフォーマンス評価を依頼しました アダプテックは 5 シリーズコントローラ全製品において MaxIQ をサポートしています
More informationVLSI工学
2008/1/15 (12) 1 2008/1/15 (12) 2 (12) http://ssc.pe.titech.ac.jp 2008/1/15 (12) 3 VLSI 100W P d f clk C V 2 dd I I I leak sub g = I sub + I g qv exp nkt exp ( 5. 6V 10T 2. 5) gd T V T ox Gordon E. Moore,
More informationMCU MOS-FET [2] [3] CPU [4] MCU CPU 2.2 [5] OS 3. 1 CPU CPU CPU CPU CPU 1 Fig. 1 system structure 2 Fig. 2 Entire sequence 2
1 1 2 1 1 0 CPU RAM (NVRAM) 1. 1 [1] NVRAM NVRAM OS 1 Future University Hakodate 2 Kumamoto University 2. 2.1 [2] Geyser [3] OS PCCS Power Consumption Controlling Scheduler [4] MCU 1 MCU MOS-FET [2] [3]
More informationスライド 1
Zabbix で PostgreSQL の監視を行おう ~pg_monz のご紹介 ~ SRA OSS,Inc. 日本支社盛宣陽 Copyright 2014 SRA OSS,Inc.Japan All rights reserved. 1 PostgreSQL の課題 DB としての基本機能 性能は商用 DB と比べても引けをとらない 運用面には課題あり どのようにして運用するのか? 効果的な監視方法は?
More informationFMV取扱ガイド
1 ........................................ 5....................................... 5................................................. 10................................................. 14.................................................
More informationFMV取扱ガイド
1 ........................................ 4....................................... 4................................................. 8................................................. 12.................................................
More information取扱ガイド
........................................ 4....................................... 4................................................. 8................................................. 10.................................................
More informationFMV取扱ガイド
1 ........................................ 4....................................... 4................................................. 8................................................. 9.................................................
More informationuntitled
AMD HPC GP-GPU Opteron HPC 2 1 AMD Opteron 85 FLOPS 10,480 TOP500 16 T2K 95 FLOPS 10,800 140 FLOPS 15,200 61 FLOPS 7,200 3 Barcelona 4 2 AMD Opteron CPU!! ( ) L1 5 2003 2004 2005 2006 2007 2008 2009 2010
More information研究報告用MS-Wordテンプレートファイル
マルチコアおよび GPGPU 環境における画像処理最適化 矢野勝久 高山征大 境隆二出宮健彦 スケーラを題材として, マルチコアおよび GPGPU 各々の HW 特性に適した画像処理の最適化を図る. マルチコア環境では, 数値演算処理の削減,SIMD 化など直列性能の最適化を行った後,OpenMP を利用して並列化を図る.GPGPU(CUDA) では, スレッド並列を優先して並列処理の設計を行いブロックサイズを決める.
More information