PowerPoint Presentation - PDF 無料ダウンロード

シバタツ流! パラレルクエリーの徹底活用とチューニングの極意日本オラクル株式会社テクノロジー製品事業統括本部基盤技術本部応用技術グループプリンシパルエンジニア柴田竜典

以下の事項は弊社の一般的な製品の方向性に関する概要を説明するものですまた情報提供を唯一の目的とするものでありいかなる契約にも組み込むことはできません以下の事項はマテリアルやコード機能を提供することをコミットメント ( 確約 ) するものではないため購買決定を行う際の判断材料になさらないで下さいオラクル製品に関して記載されている機能の開発リリースおよび時期については弊社の裁量により決定されます Oracle と Java は Oracle Corporation 及びその子会社関連会社の米国及びその他の国における登録商標です文中の社名商品名等は各社の商標または登録商標である場合があります 2

Program Agenda なぜ今パラレル実行なのかパラレル実行の実行計画を読もうチューニングケーススタディ 3

シバタツって誰? 日本オラクル株式会社テクノロジー製品事業統括本部基盤技術本部応用技術グループプリンシパルエンジニア柴田竜典 Oracle Technology Network にて全 5 回でシバタツ流! DWHチューニングの極意を連載これを読めばDWHデザインを間違わない! すべての回に似顔絵がついている! シバタツ検索 4

もう少しプロフィール Oracle Exadata リリース当初からお客様の SQL やデータを使用した PoC (Proof of Concept) を実施本番稼働しているたくさんのシステムのパフォーマンスチューニングを経験 2010 年には米オラクルの開発部門の一員としてサンフランシスコのヘッドクォーターで勤務米国のお客様の PoC を実施しつつそこから見えてきた Oracle Database のパフォーマンス課題の解決に取り組む 5

なぜ今パラレル実行なのか 6

パラレル実行とは 1 個の SQL を複数プロセス ( 複数 CPU) で実行することパラレル問合せ : SELECT 文をパラレルで実行するパラレルDML: INSERT... SELECT 文などのDMLをパラレルで実行するパラレルDDL: CREATE INDEX 文などのDDLをパラレルで実行する多重実行 : 複数の SQL を複数プロセスで動かすことパラレル実行多重実行 7

どういうときにパラレル実行すべきかパラレル実行すべきとき大量の行にアクセスする (= 大量データを処理する = CPUリソースが必要 ) 多重度が低いシリアル実行すべきとき少数の行にしかアクセスしない多重度が高い 8

なぜ今パラレル実行なのか Oracle7 でパラレル実行が可能に 10 年前くらいからデータウェアハウスでの Oracle 利用が増えてきたが IO ネックだったので CPU 使用率は性能に影響しなかったここ数年で IO ネックを解消する方法ができ CPU を 1 個しか使わないと CPU ネックになってしまう状況が増えてきた Exadata フラッシュストレージパラレル実行しないと性能が出ない 9

パラレル実行の実行計画を読もう 10

実行計画に書いてあるこれはなに? --------------------------------------------- ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib --------------------------------------------- ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10002 Q1,02 P->S QC (RAND) * 3 HASH JOIN BUFFERED Q1,02 PCWP 4 PX RECEIVE Q1,02 PCWP 5 PX SEND HASH :TQ10000... Q1,00 P->P HASH 6 PX BLOCK ITERATOR Q1,00 PCWC 7 TABLE ACCESS FULL CUSTOMERS Q1,00 PCWP 8 PX RECEIVE Q1,02 PCWP 9 PX SEND HASH :TQ10001 Q1,01 P->P HASH 10 PX BLOCK ITERATOR Q1,01 PCWC * 11 TABLE ACCESS FULL SALES Q1,01 PCWP --------------------------------------------- ------------------------------ 11

リアルタイム SQL 監視に書いてあるこれはなに? 12

Producer-Consumer パターンパラレル実行で使われているデザインパターン Producer( 生産者 ) が作ったケーキをテーブルに置き Consumer( 消費者 ) がテーブルのケーキを食べる Producer Consumer 13

Producer-Consumer パターンのメリット Producer は生産することに Consumer は消費することに専念できる Producer が自分でケーキを食べると食べている間に調理場が暇になる Producer の生産は Consumer の消費の遅れに影響しないテーブルがない状況で Consumer の消費が遅れると Producer はケーキを持って待っていないといけない参考 : 結城浩増補改訂版 Java 言語で学ぶデザインパターン入門マルチスレッド編 ( ソフトバンククリエイティブ ) 14

パラレル実行の Producer-Consumer パターン Producer Consumer & Producer Consumer 表 p000 p001 スレーブセットテーブルキュー (TQ) クエリースレーブ () p002 p003 スレーブセットテーブルキュー (TQ) oracle クエリーコーディネーター (QC) 15

もう一度実行計画を見てみよう --------------------------------------------- ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib --------------------------------------------- ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10002 Q1,02 P->S QC (RAND) * 3 HASH JOIN BUFFERED Q1,02 PCWP 4 PX RECEIVE Q1,02 PCWP 5 PX SEND HASH :TQ10000... Q1,00 P->P HASH 6 PX BLOCK ITERATOR Q1,00 PCWC 7 TABLE ACCESS FULL CUSTOMERS Q1,00 PCWP 8 PX RECEIVE Q1,02 PCWP 9 PX SEND HASH :TQ10001 Q1,01 P->P HASH 10 PX BLOCK ITERATOR Q1,01 PCWC * 11 TABLE ACCESS FULL SALES Q1,01 PCWP --------------------------------------------- ------------------------------ 16

もう一度リアルタイム SQL 監視を見てみよう 17

TQ 列フォーマット : Q${IDofQC},${IDofTQ} 例 )Q01,02 各ステップで処理された行が渡されるテーブルキューの ID テーブルキューは抽象概念共有プールのメモリー上に読み取ったデータがコピーされというような SGA を経由して 2 回コピーするような実装ではない実際には各プロセスがそれぞれキューを持っておりそこに置かれたデータをキューリファレンスという番号を使ってリンクしている読み取ったデータは各プロセスのPGAからPGAに直接コピーされる 18

IN-OUT 列プロセス間通信しない方式 PCWP: Parallel Combined with Parent 次のステップも同一のが行なう PCWC: Parallel Combined with Child 前のステップと同一のが行なうプロセス間通信する方式 P->P: Parallel to Parallel が次のスレーブセットにデータを送る P->S: Parallel to Serial が QC にデータを送る S->P: Serial to Parallel QCがにデータを送るこのステップはシリアル実行 19

PQ Distrib 列 P->P での分散方式のみ抜粋 HASH 結合キーをハッシュ分散させて各へ送る PART (KEY) パーティションキーで分散させて各へ送る RANGE ソートキーで分散させて各へ送る BROADCAST 表全体をすべてのに送る 20

結合時の分散方式 PQ Distrib 詳細 21

HASH / RANGE / PART (KEY) 分散方式大きい表と大きい表を結合するとき 100 人分の顧客名簿に載っている顧客からの売上げ明細 ( 全体で1 万件 ) を 10 人がかりで抽出するときどうするか? 顧客名簿をア行で始まる人カ行で始まる人と 10グループに分ける売上げ明細を顧客名がア行で始まる人顧客名がカ行で始まる人と10グループに分けるメンバー Aはア行を担当するメンバー Bはカ行を担当する作業を分割できる ( 重複データがない ) 22

BROADCAST 分散方式大きい表と小さい表を結合するとき 3 人分の顧客名簿に載っている顧客からの売上げ明細 ( 全体で 1 万件 ) を 10 人がかりで抽出するときどうするか? 売上げ明細を無作為に 10 グループに分ける全員が同じ顧客名簿を使ってメンバー A は自分の担当分を担当するメンバー B は自分の担当分を担当するハッシュ計算コストを省略できる 23

HASH 分散方式大きい表と大きい表を結合する場合 TQ, IN-OUT, PQ Distrib からこの図が書けるようになることがパラレル実行の理解のカギ! TQ0 TAB_A TQ2 TQ1 QC TAB_B HASH ハッシュ関数で分割して TQ に置く QC (RAND) 処理が終わった順に TQ に置くハッシュの例奇数偶数 24

HASH 分散方式の実行計画例 SQL Text SELECT c.cust_email FROM sales s, customers c WHERE s.cust_id = c.cust_id AND s.amount_sold >= 1000 Execution Plan --------------------------------------------- ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib --------------------------------------------- ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10002 Q1,02 P->S QC (RAND) * 3 HASH JOIN Q1,02 PCWP 4 PX RECEIVE Q1,02 PCWP 5 PX SEND HASH :TQ10000... Q1,00 P->P HASH 6 PX BLOCK ITERATOR Q1,00 PCWC 7 TABLE ACCESS FULL CUSTOMERS Q1,00 PCWP 8 PX RECEIVE Q1,02 PCWP 9 PX SEND HASH :TQ10001 Q1,01 P->P HASH 10 PX BLOCK ITERATOR Q1,01 PCWC * 11 TABLE ACCESS FULL SALES Q1,01 PCWP --------------------------------------------- ------------------------------ 25

フルパーティションワイズ結合 2 個の表が両方とも結合キーでパーティションされている場合 TAB_A TQ0 QC TAB_B QC (RAND) 処理が終わった順に TQ に置くパーティションされている = 分割済みなので再分散しない 26

フルパーティションワイズ結合時の実行計画例 SQL Text SELECT s.prod_id, c.unit_price FROM sales s, costs c WHERE s.prod_id = c.prod_id AND s.time_id = c.time_id AND s.promo_id = c.promo_id AND s.channel_id = c.channel_id AND s.amount_sold >= 1000 AND c.unit_price >= 1000 Execution Plan --------------------------------------------- ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib --------------------------------------------- ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10000 Q1,00 P->S QC (RAND) 3 PX PARTITION RANGE ALL... Q1,00 PCWC * 4 HASH JOIN Q1,00 PCWP * 5 TABLE ACCESS FULL COSTS Q1,00 PCWP * 6 TABLE ACCESS FULL SALES Q1,00 PCWP --------------------------------------------- ------------------------------ 27

PART (KEY) 分散方式パーシャルパーティションワイズ結合 1 個の表だけが結合キーでパーティションされている場合 TQ1 TAB_A QC TAB_B TQ0 QC (RAND) 処理が終わった順に TQ に置く PART (KEY) パーティションキーごとに TQ に置く 28

PART (KEY) 分散方式の実行計画例 SQL Text SELECT s.prod_id, t.day_name FROM sales s, times t WHERE s.time_id = t.time_id AND s.amount_sold >= 1000 Execution Plan ------------------------------------------------ ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib ------------------------------------------------ ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10001 Q1,01 P->S QC (RAND) * 3 HASH JOIN Q1,01 PCWP 4 PX RECEIVE Q1,01 PCWP 5 PX SEND PARTITION (KEY) :TQ10000... Q1,00 P->P PART (KEY) 6 PX BLOCK ITERATOR Q1,00 PCWC 7 TABLE ACCESS FULL TIMES Q1,00 PCWP 8 PX PARTITION RANGE ALL Q1,01 PCWC * 9 TABLE ACCESS FULL SALES Q1,01 PCWP ------------------------------------------------ ------------------------------ 29

BROADCAST 分散方式大きな表と小さな表を結合する場合 TQ1 TAB_A QC TQ0 QC (RAND) 処理が終わった順に TQ に置く TAB_C BROADCAST コンシューマー数だけコピーして TQ に置く 30

BROADCAST 分散方式の実行計画例 SQL Text SELECT cu.cust_email FROM customers cu, countries co WHERE cu.country_id = co.country_id AND co.country_region = 'Asia' Execution Plan --------------------------------------------- ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib --------------------------------------------- ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10001 Q1,01 P->S QC (RAND) * 3 HASH JOIN Q1,01 PCWP 4 PX RECEIVE Q1,01 PCWP 5 PX SEND BROADCAST :TQ10000... Q1,00 P->P BROADCAST 6 PX BLOCK ITERATOR Q1,00 PCWC * 7 TABLE ACCESS FULL COUNTRIES Q1,00 PCWP 8 PX BLOCK ITERATOR Q1,01 PCWC 9 TABLE ACCESS FULL CUSTOMERS Q1,01 PCWP --------------------------------------------- ------------------------------ 31

HASH すべきなのに BROADCAST になっているよくあるパフォーマンス問題 3 人の顧客名簿だと思っていたのに実は 1 万人の顧客名簿だった! 何が起きるか重い作業が分割できない大きな顧客名簿が重複コピーされるので一次領域を大量に消費するなぜ起きるのか統計情報の精度が悪い 32

適応計画 (Adaptive Plans) Oracle Database 12c の新機能統計情報だけしか使えない実行計画作成時点では分散方法 ( や結合方法 ) を決定せず実行時の行数を考慮して分散方法 ( や結合方法 ) を実行時に決定する行数が多ければ HASH 行数が少なければ BROADCAST 詳しくは <http://www.oracle.com/technetwork/jp/ondemand/db12c-perf-1985161-ja.pdf> 33

結合時の分散方式を手動で制御する PQ_DISTRIBUTE ヒント PQ_DISTRIBUTE(${ 内部表 } ${ 外部表の分散処理 } ${ 内部表の分散処理 }) HASH HASH HASH 分散 NONE NONE フルパーティションワイズ結合 NONE PARTITION PARTITION NONE PART (KEY) 分散 NONE BROADCAST BROADCAST NONE BROADCAST 分散 34

パラレル実行時の GROUP-BY 35

シンプルな GROUP-BY スキャン担当 TQ0 GROUP-BY 担当 TQ1 TAB_A QC ここに注目! 6 個のデータが IPC されている 36

シンプルな GROUP-BY の実行計画例 SQL Text SELECT SUM(amount_sold) FROM sales GROUP BY prod_id Execution Plan ------------------------------------------------------------ ------------------------------ Id Operation Name Rows Bytes TQ IN-OUT PQ Distrib ------------------------------------------------------------ ------------------------------ 0 SELECT STATEMENT 72 648 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10001 72 648 Q1,01 P->S QC (RAND) 3 HASH GROUP BY 72 648... Q1,01 PCWP 4 PX RECEIVE 918K 8075K Q1,01 PCWP 5 PX SEND HASH :TQ10000 918K 8075K Q1,00 P->P HASH 6 PX BLOCK ITERATOR 918K 8075K Q1,00 PCWC 7 TABLE ACCESS FULL SALES 918K 8075K Q1,00 PCWP ------------------------------------------------------------ ------------------------------ 37

GROUP-BY Pushdown GROUP-BY を 2 回行なう代わりに IPC 転送量が減るスキャン & GROUP-BY TQ0 再度 GROUP-BY TQ1 TAB_A QC 4 個のデータに IPC 量が減った 38

GROUP-BY Pushdown している実行計画例 SQL Text SELECT SUM(amount_sold) FROM sales GROUP BY prod_id Execution Plan ------------------------------------------------------------- ------------------------------ Id Operation Name Rows Bytes TQ IN-OUT PQ Distrib ------------------------------------------------------------- ------------------------------ 0 SELECT STATEMENT 72 648 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10001 72 648 Q1,01 P->S QC (RAND) 3 HASH GROUP BY 72 648 Q1,01 PCWP 4 PX RECEIVE 72 648... Q1,01 PCWP 5 PX SEND HASH :TQ10000 72 648 Q1,00 P->P HASH 6 HASH GROUP BY 72 648 Q1,00 PCWP 7 PX BLOCK ITERATOR 918K 8075K Q1,00 PCWC 8 TABLE ACCESS FULL SALES 918K 8075K Q1,00 PCWP ------------------------------------------------------------- ------------------------------ 39

GROUP-BY Pushdown IPC 量が多いコストと 2 回 GROUP-BY するコストをオプティマイザが比較して自動で決定されるマニュアルに載っていないヒント : GBY_PUSHDOWN / NO_GBY_PUSHDOWN RAC でインターノードパラレル実行するときにインターコネクト転送量を削減できる大量の PGA 要求で一時領域読み書きが多いときにも有効バッドノウハウ : DISTINCT は GROUP-BY Pushdown されないので GROUP-BY に書き換えると速くなることがある 40

チューニングケーススタディパラレル問合せが終わらない! 41

リアルタイム SQL 監視のアクティビティタブ何の待機イベントもないのに CPU が並列度に達していない何もしていないがある並列度 42

リアルタイム SQL 監視のパラレルタブ全体が 1.3 時間の状況で 56 秒しか掛かっていないから 1.2 時間も掛かっているまであるデータの分散が偏っているどのキーで偏っているのか? 43

リアルタイム SQL 監視の計画統計 44

問題の実行計画 ------------------------------------------------------------ ------------------------------ Id Operation Name TQ IN-OUT PQ Distrib ------------------------------------------------------------ ------------------------------ 0 SELECT STATEMENT 1 PX COORDINATOR 2 PX SEND QC (RANDOM) :TQ10005 Q1,05 P->S QC (RAND) 3 HASH GROUP BY Q1,05 PCWP 4 PX RECEIVE Q1,05 PCWP 5 PX SEND HASH :TQ10004 Q1,04 P->P HASH 6 HASH GROUP BY Q1,04 PCWP 7 VIEW Q1,04 PCWC 8 UNION ALL Q1,04 PCWP 9 HASH JOIN Q1,04 PCWP 10 JOIN FILTER CREATE :BF0001... Q1,04 PCWP 11 PART JOIN FILTER CREATE :BF0000 Q1,04 PCWP 12 PX RECIVE Q1,04 PCWP 13 PX SEND HASH :TQ10000 Q1,00 P->P HASH 14 PX BLOCK ITERATOR Q1,00 PCWC 15 TABLE ACCESS STORAGE FULL FOO Q1,00 PCWP 16 PX RECEIVE Q1,00 PCWP 17 PX SEND HASH :TQ10001 Q1,01 P->P HASH 18 JOIN FILTER USE :BF0001 Q1,01 PCWP 19 PX BLOCK ITERATOR Q1,01 PCWC 20 TABLE ACCESS STORAGE FULL BAR Q1,01 PCWP.. ------------------------------------------------------------ ------------------------------ 45

問題の実行計画を図解ココの結合キーと GROUP-BY キーは同じスキャン TQ0 赤グループが偏っていたので問題点はココ FOO p000 p001 BF 作成 & 結合 & GROUP-BY p024 TQ4 GROUP-BY p000 TQ5 スキャン & BF 使用 p000 TQ1 p025 p001 BAR p001 GROUP-BY Pushdown QC HASH 46

SELECT 文を確認結合キーは YMD,P_CD つまり赤グループは YMD,P_CD でハッシュ分割されている次の青グループは YMD,S_KBN でハッシュ分割されている SELECT... FROM ( SELECT... FROM foo f INNER JOIN bar b ON f.ymd = b.ymd AND f.p_cd = b.p_cd WHERE f.k_cd = 27 AND f.flag = 0 AND f.s_kbn IN (1, 2, 3) UNION ALL... ) iv GROUP BY iv.ymd, iv.s_kbn 47

YMD,P_CD の偏り各 YMD,P_CD の組合せが全体の何パーセントを占めるか % 20 1248 通りの組合せの内 6 通りだけが極端に多い 15 10 5 0 YMD,P_CD の組合せハッシュ値 48

数量が多い上位 6 個の P_CD だけ別に実施するチューニング策 SELECT... FROM foo f INNER JOIN bar b ON f.ymd = b.ymd AND f.p_cd = b.p_cd WHERE f.k_cd = 27 AND f.flag = 0 AND f.s_kbn IN (1, 2, 3) AND (f.ymd, f.p_cd) IN ( (20131101, 3), (20131104, 71), (20131104, 612), (20131108, 18), (20131108, 2), (20131114, 287) ) UNION ALL... UNION ALL SELECT... FROM foo f INNER JOIN bar b ON f.ymd = b.ymd AND f.p_cd = b.p_cd WHERE f.k_cd = 27 AND f.flag = 0 AND f.s_kbn IN (1, 2, 3) AND (f.ymd, f.p_cd) NOT IN ( (20131101, 3), (20131104, 71), (20131104, 612), (20131108, 18), (20131108, 2), (20131114, 287) ) UNION ALL... 49

まとめデータの流れを意識する : PQ Distrib の気持ちになる IPC( プロセス間通信 ) を意識する : GROUP-BY Pushdown の気持ちになる上記をていねいに意識することでパラレル実行のチューニングの糸口が見えてくる 50

付録 A: SH スキーマ図 COSTS PRODUCTS PROMOTIONS TIMES CHANNELS SALES CUSTOMERS COUNTIRES 51

付録 B: SH スキーマの各表の行数表名行数備考 CHANNELS 5 COUNTRIES 23 PROMOTIONS 503 TIMES 1,826 CUSTOMERS 55,500 COSTS 82,112 TIME_ID 列でレンジパーティション SALES 918,843 TIME_ID 列でレンジパーティション 52