ここまでできる!! Oracle Databaseのパラレル処理

<Insert Picture Here> ここまでできる!! Oracle Database のパラレル処理日本オラクル株式会社テクノロジー製品事業統括本部アライアンス技術本部データベース製品技術部

以下の事項は弊社の一般的な製品の方向性に関する概要を説明するものですまた情報提供を唯一の目的とするものでありいかなる契約にも組み込むことはできません以下の事項はマテリアルやコード機能を提供することをコミットメント ( 確約 ) するものではないため購買決定を行う際の判断材料になさらないで下さいオラクル製品に関して記載されている機能の開発リリースおよび時期については弊社の裁量により決定されます Oracle は米国オラクルコーポレーション及びその子会社関連会社の米国及びその他の国における登録商標または商標ですその他の名称はそれぞれの会社の商標の可能性があります 2

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 3

近年の CPU はマルチコア化最近の CPU 関連に関する話題 2010/3/29 AMD は世界初の 12 コア /8 コア搭載 x86 プロセッサー AMD Opteron 6000 Series を発表 http://www.amd.com/jp/press-releases/pages/amd-sets-the-new-standard-29mar2010.aspx 2010/3/31 Intel は Intel Xeon 7500 番台を発表 1 チップ当たり最大 8 コア内臓 Hyper-Threading 機能搭載 http://www.intel.com/jp/intel/pr/press2010/100331a.htm 果たしてデータベースシステムでは CPU の性能を使いこなせているのだろうか? 4

マルチコア化とデータベースの性能 Oracle Direct のパフォーマンスクリニックの現状 CPU を追加すれば性能問題は解決? CPU がボトルネックだったケースはわずか 9%( 弊社統計 *) マルチコアを使いきることができていない性能ボトルネックの原因の傾向 CPU:9% ストレージ I/O: 43% 非効率な SQL 文索引の設計等 :48% * データ :Oracle Direct が直近で実施したパフォーマンスクリニック http://www.oracle.com/lang/jp/direct/service/pc.html 5

データベースアクセスとサーバープロセスクライアントの接続に対して一つのサーバープロセスが生成される専用サーバー構成の場合 SQL はサーバープロセスが処理を行う PGA SP データへのアクセス方法基本は以下の2パターン全表スキャン索引アクセス SGA SP Server Process 6

CPU 使用率シリアル実行では待ち時間に比例して CPU 使用率は低下大量データの検索によりディスク I/O 待ちなどより短時間にデータを検索できれば CPU 使用率は高くなるキャッシュヒット率の向上 OLTP 系システムでのチューニングキャッシュヒット率が向上しない DWH 系システムのクエリー処理 A ディスク読み込み待ち処理中処理 A ディス待クち読み込み処理中処理 B ディス待クち読み込み処理中時間 7

Oracle Database での検索行を特定する該当する行を表の最初から最後まで検索する表フルスキャン表フルスキャンでは表の行数の増加に比例して実行時間も増加してしまう SELECT 列 2, 列 3, 列 4 FROM 表 1 WHERE 列 1 = 値 8

行を短時間で特定する索引の使用索引を使用することで表フルスキャンよりもはるかに尐ないブロック数へのアクセスで済む SELECT 列 2, 列 3, 列 4 FROM 表 1 WHERE 列 1 = 値キー値を昇順でソート済キー値 ROWID キー値 ROWID キー値 ROWID B*Tree 索引表 9

複数の行にアクセスする B*Tree 索引は範囲検索は得意 SELECT 列 2, 列 3, 列 4 FROM 表 1 WHERE 列 1 = 値 BETWEEN 値 1 AND 値 2 キー値を昇順でソート済キー値 ROWID キー値 ROWID キー値 ROWID B*Tree 索引表 10

さらに多くの行にアクセスする索引ブロック表ブロックのアクセス一般的に 1 つの SQL が 10%~20% 以上の行数にアクセスするならば表フルスキャンのほうが高速とされている 11

索引アクセス 10%~20% の行にアクセスすると 1 つのブロックには複数の行が格納されている仮にアクセスする行が均等に分散しているとするとほとんどのブロックにアクセスすることになるディスク I/O の最小単位はデータブロック 1 行読むのにも 1 ブロックを取得する索引データブロック表データブロック 12

アクセスコストが逆転する 1 つの SQL が多くの行にアクセスする場合 > 索引ブロック索引アクセス ( ランダムアクセス ) 表ブロック表ブロック表フルスキャン ( シーケンシャルアクセス ) 13

表フルスキャンを早くするサーバプロセスサーバプロセス単一プロセスでの処理を分割して実行サーバプロセスパラレル処理サーバプロセス表ブロック表フルスキャン ( シリアル処理 ) 表ブロック表フルスキャン ( パラレル処理 ) 14

Oracle Database でできるパラレル処理検索処理のパラレル化パラレルクエリーメンテナンス / データロードのパラレル化パラレル DDL/ パラレル DML バックアップの取得のパラレル化 Datapump のパラレル化統計情報の取得のパラレル化 DBMS_STATS パッケージの Parallel 実行 15

Agenda 最新 CPUとデータベースシステム検索処理のパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 16

パラレルクエリーパラレルクエリーとは単一のクエリーを複数プロセスを使用して実行する機能 Oracle Database Enterprise Edition の標準機能アプリケーションからは透過的クエリーコーディネータ (QC) とクエリースレーブプロセス (QS) QC: クエリーの解析並列度の決定 QS へ命令を出す QS:QC からの命令に基づき実際に処理を実行する SP QS QS QS 17

パラレルクエリーパラレル度の向上による高速化パラレル度を X 倍すれば実行時間も約 1/X 倍になる ( リソースが許す限り ) ディスク I/O が激しい DWH 系のクエリに対して非常に有効 SP QS QC QC QS QS QS QS QS シリアル実行 2 パラレル実行 4 パラレル実行 18

スレーブプロセスのデータ読み込みの方法スキャン範囲の担当を動的に決定する各スレーブプロセスは異なるブロックを担当スレーブプロセスの実行時間を均等にする QS QC QS スキャン対象のセグメント並列度で分割さらに分割大きなブロックから処理 19

パラレルクエリーでのデータアクセスダイレクトパスリードメモリサイズとアクセスするデータ量の関係メモリサイズ < パラレルクエリーがアクセスするデータ量キャッシュされたデータがすぐにキャッシュアウトされてしまう可能性キャッシュ管理のオーバーヘッドが無駄に生じてしまうパラレルクエリー実行時には Direct Path Read によるアクセスメモリ上のデータへのアクセスをバイパスアクセスしたデータをメモリ上にキャッシュをしないキャッシュ管理のオーバーヘッドの削減 QC QS QS 20

パラレル化のアーキテクチャークエリコーディネータ (QC) パラレル問合せを発行したセッションのサーバプロセス問合せを解析し並列度を決定しクエリスレーブにパラレル処理の命令を出すクエリスレーブ (QS) バックグラウンドプロセスのパラレル実行サーバ (Pxxx) パラレル化された処理を実施メッセージバッファプロセス間の通信データのやりとりで使用デフォルトでは共有プールからパラレル実行バッファが割り当てられる SGA_TARGET が設定されている場合ラージプールから割り当てられる QC テーブルキュー QS P0002 QS P0000 QS P0003 テーブルキュー QS P0001 ソートスキャンスレーブセット 21

パラレル化のアーキテクチャーテーブルキュー (TQ) QC と QS または QS 同士がプロセス間でデータの受渡しを実装している構造の総称プロデューサー : 実行計画中のある処理を実行して TQ に結果を送るプロセスコンシューマー : TQ からデータを取得して処理を行うプロセスある QS がタイミングによってはプロデューサーの役割を担い別のタイミングではコンシューマの役割を担うスレーブセット : 同一のオペレーションをパラレルに実行する QS のグループ QC テーブルキュー QS P0002 QS P0000 QS P0003 テーブルキュー QS P0001 ソートスキャンスレーブセット 22

パラレルクエリーでの結合処理プロデューサー & コンシューマモデル SELECT c.cust_name, s.date, s.amount FROM sales s, customers c WHERE s.cust_id = c.cust_id; QC 4. Consumer は QC に結果を返す QS4 QS5 QS6 QS7 3. Consumer はハッシュジョインを実行 QS0 QS1 QS2 QS0 QS1 QS2 2. Producer のセットから Consumer のセットに行が渡される 1. パラレルサーバープロセスが (Producer) が Customer 表と sales 表を検索 Full table scan (customer 表 ) QS3 QS3 Full table scan(sales 表 ) 23

並列度 ( パラレル度 ) の決定並列度その処理で使用するスレーブプロセスの個数並列度の指定表索引のパラレル属性で定義パラレルクエリー有効化時に指定ヒント句にて指定 Oracle Databaseによる自動設定 11g R2 新機能 24

パラレル化の方法表や索引に対してパラレル属性を定義する create table tablename parallel 4; alter session force parallel でセッションに対して設定する alter session force parallel query parallel 4; -- 実行するクエリー -- ヒント句を SQL に埋め込む select /* parallel (emp) */ * from emp; 初期化パラメータを変更する alter system set parallel_degree_policy=limited; または alter system set parallel_degree_policy=auto; 25

11g R2 新機能自動並列度設定従来のパラレル度設定最適なパラレル実行のためにはコストがかかる全てのクエリーに対して単一のパラレル度が最適とは限らないそれぞれのクエリーに対して最善のパラレル度を設定データ量の増減に合わせたパラレルどの設定 DBA の大きな負担コストが高いクエリーの調査調整? Oracle Database 11g R2 以降最適なパラレル実行の容易な実行クエリーの特性に合わせた最適なパラレル度の設定 Oracle 自身がパラレル度を設定する DBA の負担の大幅な削減初期化パラメータの設定のみ 26

自動パラレル度設定設定方法 PARALLEL_DEGREE_POLICY で設定 PARALLEL_DEGREE_POLICY=LIMITED もしくは AUTO に設定 alter session 文もしくは alter system 文で変更可能 alter system 文での変更 alter system set parallel_degree_policy=auto scope=both; alter session 文での変更 alter session set parallel_degree_policy=auto; 27

自動パラレル度設定動作概要自動パラレル度設定の動作概要は以下の通り SQL 実行 SQL 文が解析されシリアルでの実行計画を作成推定した実行時間を閾値と比較オプティマイザが最適な DOP を決定長い場合短い場合シリアルで実行適用される DOP = MIN( デフォルト DOP, 最適な DOP) パラレルで実行 28

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 29

RAC 環境でのパラレルクエリー SQL を並列化することでノード追加による性能向上が可能 1つのSQLを内部的に並列化 Parallel Query/DML/DDL 1つのSQLを複数ノードで並列化 Internode Parallel Query/DML/DDL 並列度は CPU 数や負荷状況等に依存通常のパラレルクエリーインターノードパラレルクエリー QC QC QS1 QS2 QS1 QS2 QS3 QS4 30

RAC 環境でのパラレルクエリー基本的には単一インスタンス上で実行されるインターコネクト上のトラフィックを最小限にするため QS 数が単一インスタンス上では足りない場合複数ノードのインスタンスを利用し実行される例 : 単一インスタンス上で起動できる QS が 2 の場合パラレル度 4 のクエリー QC QC QS1 QS2 QS1 QS2 QS3 QS4 31

Internode Parallel Query による性能向上 http://www.nec.co.jp/middle/oracle/gc1.html Internode Parallel Query 機能によりノード追加に伴い性能が向上することを実証 32

RAC サービスとパラレルクエリー RAC サービスと組み合わせることで QS が起動するインスタンスを調整可能 srvctl add service d dwhvm -s ETL_SERVICE -n dwhvm1,dwhvm2 srvctl add service d dwhvm -s AHOC_SERVICE -n dwhvm3,dwhvm4 ETL_SERVICE ADHOC_SERVICE 33

パラレルクエリーに関する昨今の課題課題パラレルクエリーを利用した際の性能の伸び悩み背景ユーザーが所持するデータ量の大容量化 CPUの大幅な性能向上と低価格化サーバーに搭載可能なメモリの大容量化と低価格化旧世代のハードウェアに最適化されたままのアーキテクチャ 34

パラレル実行による SQL の高速化検証結果 (CPU 使用率 ) Parallel 実行の場合でもストレージの I/O 性能がボトルネックとなり CPU リソースを使い切れていない Time 35

11g R2 新機能 In-Memory Parallel Query 概要パラレルクエリー実行時のメモリ使用効率の最適化パラレルクエリーでもバッファキャッシュを利用可能にパラレルクエリー実行時メモリ上にキャッシュされたセグメントにアクセスキャッシュされたデータはユーザー間で共有されクエリレスポンスを高速化メモリや CPU リソースを有効活用 QS1 QC QS2 設定方法 PARALLEL_DEGREE_POLICY を AUTO に設定する 36

In-Memory Parallel Query 複数インスタンスの SGA 利用複数インスタンスの SGA を利用してデータをキャッシュ RAC 環境では複数インスタンスのSGAを利用可能インスタンス全体でメモリ空間を有効活用できる複数インスタンスにセグメントを分散してキャッシュ可能 SGA + SGA + SGA インスタンス 1 インスタンス 2 インスタンス 3 37

In-Memory Parallel Query 動作概要 In-Memory Parallel クエリーの動作概要は以下の通り SQL 実行参照される表のサイズを特定する表が適した大きさの場合表を各インスタンスに分散しバッファキャッシュに読み込む表が非常に小さい場合表が非常に大きい場合 QC QS1 QS2 いづれかのインスタンスのバッファキャッシュから読み込み常に Direct Path Read で読み込みを行うスレーブプロセスはメモリ上のデータにアクセスする 38

In-Memory Parallel Query メリットとオーバーヘッド高速化のためにはメモリへの読み込みが必要最初のアクセス時にバッファキャッシュ上へデータを読み込む多尐のオーバーヘッドが生じるその後のクエリーの高速化によりオーバーヘッドは相殺される大量のデータに複数回アクセスする処理に非常に効果的データをメモリへキャッシュするためのオーバーヘッド実行時間 In-Memory Parallel Query により高速化される部分従来のパラレルクエリ 1 回目の In-Memory Parallel Query 2 回目以降の In-Memory Parallel Query 39

In-Memory Parallel Query クエリー実行時間のイメージ処理時間の変化のイメージ In-Memory Parallel Query を利用した場合の処理時間のイメージキャッシュするデータ量が多くなるほど In-Memory Parallel Query によるメリットは大きくなる In-Memory Parallel Query が有効な範囲バッファキャッシュの 80% 実行時間一定サイズ以上のデータ量になると Direct Path Read によるアクセスを行うバッファキャッシュ上からデータを読み込むことでクエリの実行時間を短縮 : 従来のパラレルクエリーデータ量 :1 回目の In-Memory Parallel クエリー :2 回目の In-Memory Parallel クエリー 40

In-Memory Parallel Query と他の機能の組み合わせ RAC との組み合わせバッファキャッシュのサイズを増やすことによりキャッシュ可能なデータ量を増やすデータ圧縮との組み合わせデータサイズを圧縮することで圧縮率に応じてキャッシュできるデータ量を増やすバッファキャッシュの 80% バッファキャッシュの 80% SGA + SGA SGA データ圧縮 41

In-Memory Parallel Query の効果検証結果 ( レスポンスタイム ) 10X 40X 42

In-Memory Parallel Query の効果検証結果 (CPU 使用率 ) ストレージのボトルネックが解消することで搭載されている CPU コアのフル活用が可能となり SQL の高速化を実現 Time 43

検証結果 Oracle Grid Center での検証結果パートナー様との共同検証センターである Oracle Grid Center では In-Memory Parallel Query に関して様々な検証を実施新日鉄ソリューションズ株式会社様 Oracle Database 11g R2 Real Application Cluster 上での In- Memory Parallel Query による効率的なリソース活用 http://www.oracle.co.jp/solutions/grid_center/nssol/pdf/wp-impq-gridcenternssol_v1.0.pdf 日本電気株式会社様 Oracle Database 11g R2 In-Memory Parallel Query による NEC Express5800/ スケーラブル HA サーバー上での Data Warehouse システム全体の性能向上 http://www.nec.co.jp/middle/oracle/wp-impq-gridcenter-nec.pdf * 50 音順 44

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 45

アクセスコストが逆転する 1 つの SQL が多くの行にアクセスする場合 > 索引ブロック索引アクセス ( ランダムアクセス ) 表ブロック表ブロック表フルスキャン ( シーケンシャルアクセス ) 46

高速化のアイデア一定のルールに従って表のデータを寄せるパーティション表索引アクセス表フルスキャン 47

パラレルクエリーとパーティションパーティションとは表や索引を内部的に分割する機能分割しても一つの表として扱われる SQLなどの処理単位が扱うデータ量の削減 Oracle Database Enterprise Editionの有償オプション 48

パーティションのメリット SQL 実行の高速化パーティション単位のデータアクセスメンテナンス時間の短縮パーティション単位でのメンテナンスパーティション単位でのバックアップ取得可用性の向上障害の局所化分割してもアプリケーション SQL は変更不要 49

パーティション単位のデータアクセスパーティションパラレル処理複数パーティションを並列処理パーティションワイズジョインパーティション単位でジョインパーティションプルーニング必要なデータを持つパーティションにのみアクセス 50

インデックスとパーティションプルーニングフルテーブルスキャンと比較してどちらもアクセスブロック数を減らす効果がある SQL チューニングの基本はアクセスするブロック数を減らすことインデックスパーティションプルーニング表インデックス取り出す行数が尐ない場合に大きな効果パーティション表取り出す行数が多い場合に大きな効果 51

パーティションプルーニング 1 日単位でレンジパーティションした表保持日数によらず今日 1 日分の処理は 1 日分のパーティションへのアクセス 100 日分 200 日分フルスキャンの 1/100 フルスキャンの 1/200 52

パーティションプルーニングとパラレルクエリー処理時間オリジナルパーティションプルーニングパーティションプルーニング + パラレルクエリー Oracle はパーティションプルーニングしてから並列化する 53

スレーブプロセスのデータ読み込みの方法パーティション表の場合パーティション表に対してのアクセス方法スレーブプロセスは各パーティションもしくはサブパーティション全体を処理スキャン範囲の担当は動的には決定されない QC QS0 2010 年 4 月 QS1 2010 年 5 月 54

大量の行を処理するパーティションプルーニングによる絞込み大量の行を持つ表をジョインする 55

パーティション表同士のジョイン同じパーティション方式かつパーティションキー同士パーティションキー同士のジョインなら結合対象の行がある対象パーティションを特定できる小さな表のジョインに分解表パーティション SELECT FROM 表 1, 表 2 WHERE 表 1. 列 1 = 表 2. 列 1 パーティションを特定同じパーティション方式表 1 表 2 56

フルパーティションワイズジョイン同じパーティション方式かつパーティションキー同士フルパーティションワイズジョインとパラレルクエリー各スレーブプロセスごとにジョインを並列実行実行可能小さな表のジョインに分解 QS QS QS QC QS 表 1 表 2 同じパーティション方式 57

RAC でフルパーティションワイズジョイン同じパーティション方式かつパーティションキー同士ノード毎にパーティションのジョインを割り当てる小さな表のジョインに分解 QS QS QS QS QS QC QS QS 表 1 表 2 同じパーティション方式 QS RAC ノード 58

フルパーティションワイズジョインできない場合同じパーティションキー同士でジョイン可能とは限らない同じパーティションキー同士のジョインフルパーティションワイズジョイン列 1 列 2 列 3 列 4 列 1 列 2 列 3 列 4 表 1 表 2 パーティションキーパーティションキーパーティションキーが異なるジョインパーシャルパーティションワイズジョイン列 1 列 2 列 3 列 4 表 3 パーティションキー 59

パーシャルパーティションワイズジョインパーシャルパーティションワイズジョイン一方の表を再パーティション化するフルパーティションワイズジョインと同じメモリ上で行を再配分 QS QS QC QS QS 表 1 表 3 パーティションキーが異なる 60

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 61

パラレル DDL 非パーティション表に対して可能なパラレル処理は以下の 3 つ create index create table as select alter index rebuild パーティション表に対して可能なパラレル処理は以下の 4 つ create index create table as select alter table move/split/coalesce partition alter index rebuild/split partition メンテナンス作業の高速化を実現可能 62

DDL のパラレル化の方法 1. パラレル DDL を有効化させる alter session enable parallel ddl; 2. DDL 文をパラレル化させる各 DDL 文のパラレル化は次頁以降で紹介 create index / alter index rebuild / alter index rebuild partition の場合パラレル属性として定義される並列度の決定 alter session force parallel ddl parallel integer によって指定可能 alter session force parallel ddl parallel 6; オブジェクトで定義する 63

パラレル DDL のポイント - その 1 パラレル create index / alter index rebuild のルールパラレル化の方法パラレル句 create index ind_test on test(col1) parallel 4; ALTER SESSION FORCE PARALLEL DDL 文によってパラレル化 alter session force parallel ddl parallel 6; create index ind_test on test(col1) ; 表スキャン操作は対応する create / rebuild 処理と同じ並列度並列度が指定されていない場合 CPU 数に基づきパラレル度が自動で調整 64

パラレル DDL のポイント - その 2 パラレル MOVE/SPLIT PARTITION のルールパラレル MOVE PARTITION / SPLIT PARTITION のルールパラレル句 create index ind_test on test(col1) parallel 4; ALTER SESSION FORCE PARALLEL DDL 文によってパラレル化 alter session force parallel ddl parallel 6; alter table move partition partition_name スキャン操作は対応する MOVE / SPLIT 操作と同じ並列度並列度が指定されていない場合 CPU 数に基づきパラレル度が自動で調整 QS QS QS QS 65

パラレル DDL のポイント - その 3 create table as select のルール create 部分パラレル句 create table tmp_test parallel 4 as select * from test; ALTER SESSION FORCE PARALLEL DDL 文によってパラレル化 alter session force parallel ddl parallel 6; create table tmp_test as select * from test; 全表スキャン / 複数パーティション及び index range scan で実行される場合 select 部分もパラレル化される 66

パラレル DDL のポイント - その 3 create table as select のルール select 部分 create 部分に parallel 句が指定されている create table tmp_test parallel 4 as select * from test; select 部分にパラレルヒントが含まれる create table tmp_test as select /*+ parallel (test,4) */ * from test; 参照する表にパラレル属性が定義されている alter table test parallel 4; create table tmp_test as select * from test; create 操作がパラレル化される場合 select 操作もパラレル化されるただし以下の場合はパラレル化されない select 文に NO_PARALLEL ヒント create table tmp_test parallel 4 as select /*+ no_parallel */ * from test; 非パーティション表の索引がスキャンされる 67

検証結果パラレル DDL によるインデックス作成の高速化パラレル DDL を利用することで煩わしいメンテナンス作業も高速化可能 2x 2x 10x 68

パラレル DML パラレル DML(PARALLEL INSERT/UPDATE/DELETE および MERGE) 大規模オブジェクトにアクセスする DWH/DSS 環境に有効パラレル設定のオーバーヘッドが生じるため OLTP 系システムには向かないただし OLTP システムで実施されるバッチ処理には効果的 69

パラレル DML の設定方法 DML 実行前にパラレル DML を有効化する alter session enable parallel dml; 上記 SQL を実行しない場合 DML 文に PARALLEL ヒントを設定してもパラレル化されないただし DML 文に問い合わせ処理が入っている場合その部分のみはパラレル化される並列度の決定以下の優先順位で決定する DML 文のパラレルヒントに指定されている値 alter session enable parallel dml parallel 文で指定した値表作成時に指定したパラレル度 70

update/merge/delete のルールパラレル化されるのは以下のいずれかの場合 alter session enable parallel dml 文が発行されている更新 / 削除される表の定義でパラレル句を指定されている alter table test parallel 4; update test set col2=100 where col1 between 100 and 500; Update/merge/delete 文でパラレルヒントを有効化する update /*+ parallel */ test set col2=100 where col1 between 100 and 500; 71

Insert select のルール検索表と挿入表それぞれのアクセスに対してパラレル度を指定可能 ( パラレル DML の有効化が前提 ) 検索表文での SELECT パラレルヒントの指定選択対象表の定義でのパラレル句の指定挿入表文での INSERT パラレルヒントの指定挿入対象表の定義でのパラレル句の指定 72

パラレル DML の高速化以下の方法を用いることでパラレル DML の高速化が可能 /*+ append */ ヒント句を用いるキャッシュをバイパスして直接データファイルに書き込みダイレクトパスインサート /*+ nologging */ ヒント句を用いる REDO 生成量を抑制する 73

ダイレクトパスインサートの領域確保ダイレクトパスインサートでは High Water Mark(HWM) 以降からデータの書き込みが行われるダイレクトロード INSERT(INSERT /*+ APPEND */ INTO SELECT ;) パラレル INSERT CREATE TABLE <table_name> AS SELECT; HWM を引き下げるためには以下の処理を行う Alter table move( セグメントの再作成 ) Shrink space( セグメントの縮小 ) HWM QS1 QS2 QS3 QS4 未使用領域 (DELETE で発生 ) 使用領域新規使用領域ダイレクトパスインサートでは HWM 以降を利用 74

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 75

Datapump とは Datapump とは Oracle Database 10g 以降で利用可能なユーティリティーツール Oracle Database 9i までの exp/imp にさらなる付加機能を持つ新たな機能特徴データおよびメタデータの高速なロードアンロード Exp/imp に比べて数倍高速 Exp/imp と同等の機能とさらなる付加機能パラレル処理外部表など 76

Datapump のパラレル化 Datapump の PARALLEL オプションで使用する WORKER プロセスの数を指定するマスター制御プロセスは加算されない実行例 expdp user1/xxxx tables=batch_tbl parallel=3 DUMPFILE=dpbatch%U.dmp DIRECTORY=dp_dir; DP JOB Master Worker Worker Worker 77

Datapump パラレル化のポイント - その 1 PARALLEL 句に指定する値はダンプファイルセット内のファイル数以下にするもしくはダンプファイル指定に置換変数を指定する必要がある Worker プロセスが 1 つのダンプファイルに対して排他的アクセスを行うため DP JOB expdp user1/xxxx tables=batch_tbl parallel=3 DUMPFILE=dpbatch1.dmp,dpbatch2.dmp DIRECTORY=dp_dir; Master Worker Worker Worker ファイルの競合により一部の Worker プロセスがアイドル状態になるためパフォーマンスの向上が見込みにくい dpbatch1.dmp dpbatch2.dmp ファイルセットの値を置換変数化するなどして対処 78

Datapump パラレル化のポイント - その 2 11g R1 までの制限事項 : DataPump ジョブを実行できるのは RAC 環境の場合でも 1 インスタンスのみ Worker プロセスが起動されるのはジョブが実行されているインスタンス上のみ Oracle Database 11g R2 より DataPump ジョブを RAC 環境の複数のインスタンスで同時に実行することが可能並列実行によりより短時間で処理が完了ワーカープロセスを複数ノードで起動 Cluster/Service_name パラメータで制御 Oracle Database Enterprise Edition で使用可能 79

Datapump の RAC 対応 CLUSTER パラメータ ( デフォルト :Y) RAC のリソースを使用できるか Worker プロセスを他の RAC インスタンス上でも開始できるかどうかを指定 Datapump ジョブが大きい ( 大きな表にアクセスする ) 場合に効果的特定の RAC サービスを指定したい場合以下の SERVICE_NAME パラメータも合わせて指定する SERVICE_NAME パラメータ Workerプロセスが起動するノード (RACサービス) を指定する CLUSTER=Yとともに使用することが可能 CLUSTER=Nの場合このパラメータは無視される 80

複数ノードでの DataPump 並列実行 [oracle@node1]$ expdp user1/xxxx tables=batch_tbl parallel=3 service_name='batch' DUMPFILE=dpbatch%U.dmp DIRECTORY=dp_dir [oracle@node4]$ expdp user2/xxxx tables=hr_tbl parallel=2 service_name='hr' DUMPFILE=dphr%U.dmp DIRECTORY=dp_dir Service : batch Service : hr Worker Worker Worker Worker Worker Master DP JOB Master DP JOB 81

その他 Datapump のパラレル化についてのポイント RAC 環境で Datapump を実行する場合ディレクトリオブジェクトのパスをクラスタファイルシステム上に配置する SERVICE_NAME パラメータで指定できるのはジョブを開始する Worker プロセスを起動するノードのみ Master プロセスはあくまでも接続されたノードで起動される 82

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 83

オプティマイザ統計情報とは Oracle Database における統計情報表統計情報行数ブロック数行の平均の長さ列統計情報列内の個別値数列内の NULL 数データ配分 ( ヒストグラム ) など索引統計情報リーフブロック数クラスタ化係数システム統計情報 I/O パフォーマンス CPU パフォーマンスオプティマイザはこれらの統計情報を元に実行計画を作成正確な統計情報を取得することは最適なパフォーマンスを得るために必要 84

オプティマイザ統計情報の取得方法 Oracle Database 9i 以降 DBMS_STATS パッケージの登場 Oracle Database 8i までは analyze コマンドによる取得課題 : シリアル実行のため遅い速度向上のためサンプリング率を減らす正確な統計情報との差 Oracle Database 10g 以降 DBMS_STATS パッケージの使用を推奨以下の用途には引き続き analyze 文を使用可能 VALIDATE / LIST CHAINED ROWS 句を使用する場合空きリストブロックの情報を収集する場合 85

( 参考 )DBMS_STATS パッケージの統計収集プロシージャプロシージャ名 GATHER_INDES_STATS GATHER_TABLE_STATS GATHER_SCHEMA_STATS GATHER_DICTIONARY_STATS GATHER_DATABASE_STATS 収集対象索引統計表列及び索引の統計スキーマ内の全てのオブジェクトの統計すべてのディクショナリオブジェクトの統計データベース内の全てのオブジェクトの統計 86

統計情報の取得のパラレル化 DBMS_STATSプロシージャのDEGREE 句で指定する統計情報取得のパラレル化ができないオブジェクトクラスタ索引ドメイン索引ビットマップジョイン索引など実行例 execute dbms_stats.gather_table_stats( test, TEST_TBL degree => 4) ; 87

統計情報の取得のパラレル化 Tips DEGREE 句は DBMS_STATS.AUTO_DEGREE に設定することをお薦め AUTO_DEGREE に指定することでオブジェクトのサイズ及び初期化パラメータの設定に基づいて Oracle Database 側で適切な並列度を選択する 88

Agenda 最新 CPUとデータベースシステムクエリーのパラレル化パラレルクエリー RACでのパラレルクエリーパラレルとパーティションメンテナンス / データロードのパラレル化 Datapumpのパラレル化統計取得のパラレル化まとめ 89

まとめ CPU はマルチコア化高速化しかし CPU を使いきれていないという現実特にシリアル処理では顕著に表れる Oracle Database でのパラレル処理 Oracle Database Enterprise Edition の標準機能パラレルクエリーパラレル DDL/DML Datapump のパラレル実行統計情報取得のパラレル化 Oracle Database Enterprise Edition によりマルチコア CPU の性能向上を享受可能!! 90

関連する初期化パラメータパラメータ名デフォルト値説明 PARALLEL_MAX_SERVERS CPU_COUNT PARALLEL_THREADS_ PER_CPU および PGA_AGGREGATE_TA RGET の値から導出 1 インスタンスで起動できる QS プロセスの最大数 PARALLEL_MIN_SERVERS 0 インスタンス起動時に作成される QSの数 PARALLEL_DEGREE_POLICY MANUAL Oracle Database 11g R2のパラレル実行に関する新機能の制御 PARALLEL_EXECUTION_MESSAGE_SIZE 16384 パラレル実行時に使用されるメッセージサイズ PARALLEL_MIN_PERCENT 0 パラレル実行時のQS 要求数の最小割合 PARALLEL_MIM_TIME_THRESHOLD AUTO (10 秒 ) 自動並列度によるパラレル実行対象判別の閾値 PARALLEL_THREADS_PER_CPU 2 パラレル実行中にCPUが処理できるQSの数 91

参考資料 Oracle Database パフォーマンスチューニングガイド http://download.oracle.com/docs/cd/e16338_01/server.112/b56312/toc.htm Oracle Database VLDB およびパーティショニングガイド http://download.oracle.com/docs/cd/e16338_01/server.112/b56316/toc.htm Oracle Database ユーティリティ http://download.oracle.com/docs/cd/e16338_01/server.112/b56303/toc.htm Oracle Database SQL 言語リファレンス http://download.oracle.com/docs/cd/e16338_01/server.112/b56299/toc.htm Oracle Database PL/SQL パッケージプロシージャおよびタイプリファレンス http://download.oracle.com/docs/cd/e16338_01/appdev.112/b56262/toc.htm 92