はじめに < 本日のテーマ> 超高速データベース Hitachi Advanced Data Binder での SQLチューニング方法を情報の取得から問題点を見つけて対策するまでの流れとチューニング事例をご紹介いたします本資料

Similar documents

<4D F736F F D E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A C98AD682B782E993C195CA915B C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

(5) 給与制度の総合的見直しの実施状況について概要の給与制度の総合的見直しにおいては俸給表の水準の平均 2の引き下げ及び地域手当の支給割合の見直し等に取り組むとされている

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

平成25年度　独立行政法人日本学生支援機構の役職員の報酬・給与等について

その他事業推進体制平成 20 年 3 月 26 日に石垣島国営土地改良事業推進協議会を設立し事業を推進 ( 構成 : 石垣市石垣市議会石垣島土地改良区石垣市農業委員会沖縄県農

<4D F736F F D F8D828D5A939982CC8EF68BC697BF96B38F9E89BB82CC8A6791E52E646F63>

1 書誌作成機能 (NACSIS-CAT)の軽量化合理化電子情報資源への適切な対応のための資源 ( 人的資源,システム資源, 経費を含む) の確保のために, 書誌作成と書誌管理作業の軽量化を図

った場合など監事の任務懈怠の場合はその程度に応じて業績勘案率を減算する (8) 役員の法人に対する特段の貢献が認められる場合はその程度に応じて業績勘案率を加算することができる

●電力自由化推進法案

企業の採用予定数採用予定数は増やすと回答した企業が減らすと回答した企業を3 年連続上回り採用は増加傾向にある特に非上場非製造において採用数を増やすと回答する割合が大

預金を確保しつつ資金調達手段も確保する収益性を示す指標として営業利益率を採用し営業利益率の目安となる数値を公表する株主の皆様への還元については持続的な成長による配当可

m07 北見工業大学様式①

18 国立高等専門学校機構

Sea-NACCS 利用者研修　【通関編】

1 林地台帳整備マニュアル( 案 )について林地台帳整備マニュアル( 案 )の構成構成記載内容第 1 章はじめに本マニュアルの目的記載内容について説明しています第 2 章第 3 章第 4 章第 5 章第 6 章林地

(1)1オールゼロ記録ケース厚生年金期間 A B 及びCに係る旧厚生年金保険法の老齢年金 ( 以下旧厚老という )の受給者に時効特例法施行後厚生年金期間 Dが判明した Bは事業所記号が

Microsoft PowerPoint - 経営事項審査.ppt

<6D313588EF8FE991E58A778D9191E5834B C8EAE DC58F4992F18F6F816A F990B32E786C73>

一般競争入札について

私立大学等研究設備整備費等補助金（私立大学等

新生産管理システムご提案書２００２年１０月１５日ムラテック情報システム株式会社

<6D33335F976C8EAE CF6955C A2E786C73>

<4D F736F F F696E74202D B E E88E68C9A90DD8BC65F E DC58F4994C52E >

(4) 給与制度の総合的見直しの実施状況について概要国の給与制度の総合的見直しにおいては俸給表の水準の平均 2の引下げ及び地域手当の支給割合の見直し等に取り組むとされている.

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安

2 役員の報酬等の支給状況役名法人の長理事理事 ( 非常勤 ) 平成 25 年度年間報酬等の総額就任退任の状況報酬 ( 給与 ) 賞与その他 ( 内容 ) 就任退任 16,936 10,654 4,36

03_主要処理画面.xlsx

2 役員の報酬等の支給状況平成 27 年度年間報酬等の総額就任退任の状況役名報酬 ( 給与 ) 賞与その他 ( 内容 ) 就任退任 2,142 ( 地域手当 ) 17,205 11,580 3,311 4 月 1

03 平成28年度文部科学省税制改正要望事項

容積率制限の概要 1 容積率制限の目的地域で行われる各種の社会経済活動の総量を誘導することにより建築物と道路等の公共施設とのバランスを確保することを目的として行われており市街地環

労働時間と休日は、労働条件のもっとも基本的なものの一つです

検討検討の進め方検討状況簡易収支の世帯からサンプリング世帯名作成事務の廃止 4 5 必要な世帯数の確保が可能か簡易収支を実施している民間事業者との連絡等に伴う事務の複雑

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

接続試験実施要領【障害者総合支援法（平成２７年４月報酬改定）対応】

参加表明書・企画提案書様式

1. 決算の概要法人全体として 2,459 億円の当期総利益を計上し末をもって繰越欠損金を解消しています ( : 当期総利益 2,092 億円 ) 中期計画における収支改善項目に関して ( : 繰越

Microsoft Word - 佐野市生活排水処理構想（案）.doc

平成21年9月29日

<4D F736F F D F93878CA797708F4390B3816A819A95CA8B4C976C8EAE91E682538B4C8DDA97E12E646F6378>

Microsoft PowerPoint - 基金制度

<4D F736F F F696E74202D2082C882E982D982C DD8ED88EE688F882CC82B582AD82DD C668DDA9770>

< CF6955C976C8EAE DE82C28E73816A2E786C73>

( 別紙 ) 以下法とあるのは改正法第 5 条の規定による改正後の健康保険法を指す ( 施行期日は平成 28 年 4 月 1 日 ) 1. 標準報酬月額の等級区分の追加について問 1 法改正により追加

R4財務対応障害一覧

財政再計算結果_色変更.indd

Microsoft Word - H27概要版

セルフメディケーション推進のための一般用医薬品等に関する所得控除制度の創設（個別要望事項：ＨＰ掲載用）

ニュースリリース

概要近年研究者としてのキャリアの入り口として広く認識されつつあるポストドクターは任期付の職位である本稿ではポストドクターから任期のない正規の雇用 ( 正規職 )への移行状況及び移行パターンを文部科学省

(2) 支状況保育所 ( 定員 60 人以上 ) 支状況は次とおりです 1 総入構成比は割合が88.1% 活動外入が2.1% 特別入が9.8%でした 2 構成比は運営費入が80.1% 経常経費補助金入が17.8%

文化政策情報システムの運用等

<819A955D89BF92B28F BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

弁護士報酬規定（抜粋）

1. 中小企業等経営強化法の目的 (1) 生産性向上の必要性 (3) 業種別の経営課題への対応少子高齢化人手不足等の状況において効果的に付加価値を生み出せるよう製造業はもとより

4 承認コミュニティ組織は市長若しくはその委任を受けた者又は監査委員の監査に応じなければならない ( 状況報告 ) 第 7 条承認コミュニティ組織は市長が必要と認めるときは交付金事業の遂行の

IAF ID x:2010 International Accreditation Forum, Inc. Page 2 of 8 国際認定機関フォーラム(IAF)は適合性評価サービスを提供する機関の認定のためのプログラムを運営しているこの認定

代議員会決議内容についてお知らせしますさる3 月 4 日当基金の代議員会を開催し次の議案が審議され可決承認されました第 1 号議案 : 財政再計算について ( 概要 ) 確定給付企業年金法第

Ⅰ 調査の概要 1 目的義務教育の機会均等その水準の維持向上の観点から的な児童生徒の学力や学習状況を把握分析し教育施策の成果課題を検証しその改善を図るもに学校におけ

目次表紙... 1 目次... 2 改訂記録目的対象製造部門品質部門組織 PET 薬剤製造施設 ( 施設長 )の責務製造管理者の責務... 7

●幼児教育振興法案

(3) 善通寺市の状況善通寺市においては固定資産税の納期前前納に対する報奨金について善通寺市税条例の規定 ( 交付率 :0.1% 限度額 :2 万円 )に基づき交付を行っています参考善通寺

KINGSOFT Office 2016 動作環境対応日本語版版共通利用上記動作以上以上空容量以上他接続環境推奨必要 2

<4D F736F F F696E74202D208E9197BF322D31208C9A90DD B835E CC8A C982C282A282C4>

Microsoft Word 行革PF法案-0概要

(3) その他市長が必要と認める書類 ( 補助金の交付決定 ) 第 6 条市長は前条の申請書を受理したときは速やかにその内容を審査し補助金を交付すべきものと認めたときは規則第 7 条に規定す

2 出願資格審査前記 1の出願資格 (5) 又は(6) により出願を希望する者には, 出願に先立ち出願資格審査を行いますので, 次の書類を以下の期間に岡山大学大学院自然科学研究科等

公的年金制度について制度の持続可能性を高め将来の世代の給付水準の確保等を図るため持続可能な社会保障制度の確立を図るための改革の推進に関する法律に基づく社会経済情

PowerPoint プレゼンテーション

Taro-Ｈ１９退職金（修正版）.jtd

4 参加資格要件本提案への参加予定者は以下の条件を全て満たすこと 1 地方自治法施行令 ( 昭和 22 年政令第 16 号 ) 第 167 条の4 第 1 項各号の規定に該当しない者であること 2 会社

質問票 ( 様式 3) 質問番号 62-1 質問内容鑑定評価依頼先は千葉県などは入札制度にしているが神奈川県は入札なのか?または随契なのか?その理由は? 地価調査業務は単にそれぞれの地点の鑑定

Microsoft PowerPoint - 税制上の特例.pptx

社会保障税一体改革 ( 年金分野 )の経緯社会保障税一体改革大綱 (2 月 17 日閣議決定 ) 国年法等改正法案 (2 月 10 日提出 ) 法案を提出するまたは法案提出を検討するとされた事

様式（補助金）

[2] 控除限度額繰越欠損金を有する法人において欠損金発生事業年度の翌事業年度以後の欠損金の繰越控除にあたっては平成 27 年度税制改正により次ページ以降で解説するの特例 (

10【交付要綱】様式第5-1～13

< C8EAE81698B4C93FC8FE382CC97AF88D38E968D CA8E86816A2E786C73>

4.5. < 参加表明書を提出する> 調達案件一覧の表示対象となる案件を検索し調達案件一覧に表示させます参加したい案件の調達案件名称行 - 入札参加資格確認申請 / 技術資料 /

( 参考 ) 国家戦略特別区域法 ( 平成 25 年法律第 107 号 )( 抄 ) 国家戦略特別区域法及び構造改革特別区域法の一部を改正する法律 ( 平成 27 年法律第 56 号 ) による改正後 (

(Microsoft PowerPoint \213\306\213\226\211\302\215X\220V\220\340\226\276\211\357\201i3\201j)

2 一般行政職給料表の状況 ( 平成 24 年 4 月 1 日現在 ) 1 級 2 級 3 級 4 級 5 級 ( 単位 : ) 6 級 7 級 8 級 1 号給の給料月額 135,6 185,8 222,9 261,9 289,2 32,6 366,2 41

Microsoft Word - 目次.doc

Microsoft Word - 【溶け込み】【修正】第２章～第４章

Microsoft Word - 奨学金相談Ｑ＆A.rtf

< DB8CAF97BF97A6955C2E786C73>

SXF 仕様実装規約版 ( 幾何検定編 ) 新旧対照表 2013/3/26 文言変更 p.12(1. 基本事項 ) (5)SXF 入出力バージョン Ver.2 形式と Ver.3.0 形式および Ver.3.1 形式の入出力機能を

4. その他 (1) 期中における重要な子会社の異動 ( 連結範囲の変更を伴う特定子会社の異動 ) 無 (2) 簡便な会計処理及び四半期連結財務諸表の作成に特有の会計処理の適用有

1 総合設計一定規模以上の敷地面積及び一定割合以上の空地を有する建築計画について特定行政庁の許可により容積率斜線制限などの制限を緩和する制度である建築敷地の共同化や

2 1.ヒアリング対象 (1) 対象範囲分類年金医療保険雇用保険税備考厚生年金の資格喪失国民年金の加入老齢給付裁定請求など健康保険の資格喪失国民健康保険の加入健康保険

頸がん予防措置の実施の推進のために講ずる具体的な施策等について定めることにより子宮頸がんの確実な予防を図ることを目的とする ( 定義 ) 第二条この法律において子宮頸がん予防措置とは子宮

Taro-1-14A記載例.jtd

入札方式別操作

戦略担当者のための

Transcription:

db tech showcase 2015 Hitachi Advanced Data Binder 実践 SQLチューニング方法 2015/06/12 株式会社日立製作所情報通信システム社 ITプラットフォーム事業本部サービスイノベーション統括本部 IT 基盤ソリューション本部 DB 部山口健一

はじめに < 本日のテーマ> 超高速データベース Hitachi Advanced Data Binder での SQLチューニング方法を情報の取得から問題点を見つけて対策するまでの流れとチューニング事例をご紹介いたします本資料では Hitachi Advanced Data Binderを HADB と表記します本資料では Hitachi Advanced Data Binder 03-00を対象としていますまた製品の改良により予告なく記載されている仕様が変更になることがあります 1

Contents 1. Hitachi Advanced Data Binderの概要 2. SQLチューニング方法の概要 3. チューニング事例 4. おわりに 2

Contents 1. Hitachi Advanced Data Binderの概要 2. SQLチューニング方法の概要 3. チューニング事例 4. おわりに 3

1.1 Hitachi Advanced Data Binderの概要最先端研究開発支援プログラム (*1) において国立大学法人東京大学が推進している超高速データベースエンジンの研究開発 (*2) の成果を利用して日立が製品化したリレーショナルデータベースシステム Hitachi Advanced Data Binder プラットフォーム自社従来比 100 倍 (*3) の検索性能を誇る超高速データベースエンジン Hitachi Advanced Data Binderを搭載可用性の高い日立のサーバと高速ストレージをセット化 Hitachi Advanced Data Binder プラットフォーム超高速データベースエンジン日立ラックサーバ日立ストレージ (*1) 世界のトップを目指した先端的研究を推進することで産業安全保障等の分野における我が国の中長期的な国際的競争力底力の強化を図るとともに研究開発成果の国民および社会への確かな還元を図ることを目的として創設された国の研究開発プログラム (*2) 内閣府の最先端研究開発支援プログラム超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証評価 ( 中心研究者 : 喜連川東大教授 / 国立情報学研究所所長 )の成果を利用 (*3) 当社従来製品との比較解析系データベースに関する標準的なベンチマークを元に作成した各種のデータ解析要求の実行性能を計測データ解析要求の種類によって高速化率には差が見られるがデータベースにおいて特定の条件を満たす一定量のデータを絞り込んで解析を行うデータ解析要求を対象とした結果 4

収集 / 加工 1.2 Hitachi Advanced Data Binderプラットフォーム Hitachi Advanced Data Binder PFはDWHの中核を支えるDBサーバです大量データのローディング処理を高速化多種多様なデータ結合処理 (JOIN)を高速化契約受発注売上 SNS センサー稼働ログ多種データデータソース大量データ DWH 高速データアクセス基盤 Hitachi Advanced Data Binder プラットフォーム超高速データベースエンジン Hitachi Advanced Data Binder (RDBMS) 日立サーバ日立ストレージ高速検索価値を創造 BI ツール JDBC/ODBC/CLI (SQLインタフェース) 業務アプリケーション 5

1.2 Hitachi Advanced Data Binderの高速化技術サーバストレージの能力を最大限に使いきるソフトウェア技術東京大学との超高速データベースエンジンの共同研究開発成果の製品化自社従来比約 100 倍 (*1) のデータ検索性能 DB 検索 (SQL) 処理を並列実行単位 (I/O 単位 )に自動分割し高多重で実行従来方式 : 順序実行方式顧客情報注文情報明細履歴情報従来方式でのストレージアクセストレースサーバ検索処理 (μs) ストレージ同期 I/O 処理 (ms) 新方式 : 非順序型実行原理 (*2) 新方式でのストレージアクセストレースサーバストレージ処理時間を大幅短縮タスク割当検索処理 I/O 完了待ちディスクI/O 内閣府の最先端研究開発支援プログラム超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証評価 ( 中心研究者 : 国立大学法人東京大学喜連川教授 )の成果を利用 (*1) 当社従来製品との比較解析系データベースに関する標準的なベンチマークを元に作成した各種のデータ解析要求の実行性能を計測データ解析要求の種類によって高速化率には差が見られるがデータベースにおいて特定の条件を満たす一定量のデータを絞り込んで解析を行うデータ解析要求を対象とした結果 (*2) 喜連川東大教授 / 国立情報学研究所所長合田東大特任准教授が考案した原理 6

1.2 Hitachi Advanced Data Binderの高速化技術非順序実行原理では発行したI/Oを待たずに次々にレコード処理を行うため並列度を高めやすいレコード処理順序に依存しない集合演算や結合処理が得意 < 順序実行 > < 非順序実行 > 7

Contents 1. Hitachi Advanced Data Binderの概要 2. SQLチューニング方法の概要 3. チューニング事例 4. おわりに 8

2.1 SQLチューニングの前に画面のレスポンスが遅いこんな時にどうしますか? BIサーバ利用者 : 画面のレスポンスが遅いなあインデクスが効いていない? 検索量が多すぎる? etc DB 管理者データベース 9

2.1 SQLチューニングの前に問題箇所の切り分け利用者 : 画面のレスポンスが遅いなあ BIサーバまずは端末 BIサーバ DBサーバのどこで処理時間がかかっているかを切り分けますインデクスが効いていない? 検索量が多すぎる? etc BIサーバ DBサーバのログからSQL 発行時刻処理時間要求元へのリタン時刻等をもとに時間のかかっている箇所を調査します DBサーバで処理時間がかかっていることを確認してからチューニングに着手します DB 管理者データベース 10

2.2 SQLチューニングの流れ SQLチューニングの基本的な流れチューニング対象 SQLの特定対象 SQLのアクセスパス( ) 取得とアクセスパス観点の問題点の調査対象 SQLの統計情報の取得と統計情報観点の問題点の調査対策案の検討と検証 N 要件クリア? Y 終了 SQLの実行計画実行プランをアクセスパスと呼びます 11

2.2 SQLチューニングの流れチューニング対象 SQLの特定 SQL 処理時間を調査し画面レスポンスとSQL 処理時間を比較してレスポンスに影響しているSQLを特定します <SQL 処理時間の取得方法 > HADBの統計解析コマンド(adbstat)でSQL 文の統計情報を取得します HADBサーバ DB 管理者 adbstat -c sql -m ' 開始時刻 ',' 終了時刻 ' > log_adbstat_sql.csv データベースタイムスタンプ AP_name SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 2015/06/01 06:35:12 adbsql 1 SELECT 266,948 1 ADBDIC ##ADBOTHER#0000004096 8 100 0 0 2015/06/01 06:35:12 adbsql 1 SELECT ADBUIDX01 ADBUIDX01BUF 120,202 100 0 0 2015/06/01 06:35:25 adbsql 2 SELECT 112,899 1 ADBDIC ##ADBOTHER#0000004096 8 100 0 0 2015/06/01 06:35:25 adbsql 2 SELECT ADBUTBL01 ADBUTBL01BUF 75 100 0 0 2015/06/01 06:37:55 adbsql 3 SELECT 23,822,936 1 ADBDIC ##ADBOTHER#0000004096 16 100 0 0 2015/06/01 06:37:55 adbsql 3 SELECT ADBUIDX01 ADBUIDX01BUF 14,760,202 100 0 0 2015/06/01 06:37:55 adbsql 3 SELECT ADBUTBL01 ADBUTBL01BUF 14,520,000 100 0 0 <ポイント> 1つのSQLが原因のケースや複数のSQLで少しずつ時間がかかるケースもあります 12

2.2 SQLチューニングの流れ対象 SQLのアクセスパスの取得と調査対象 SQLのアクセスパスを取得して適切なインデクスが使われているかといったアクセスパス観点の問題点を調査します <アクセスパスの取得方法 > SQL 実行コマンド(adbsql)のサブコマンド #set opt report on type=all で対象 SQLのアクセスパスを取得します DB 管理者 adbsql -u ユーザID -p パスワード < SQL 文テキスト.txt > log_adbsql.txt HADBサーバデータベース SQL 文テキスト.txt #set opt report on type=all; select count(*) from T1 where C6='01'; log_adbsql.txtのアクセスパス部分 <<Tree View>> 1 QUERY : 1 2 SELECT STATEMENT 3 -KEY SCAN(USER01.T1) 4 +-GROUPING <ポイント> 以下のような点を調査します適切なインデクスが使用されているかジョイン方式が適切か繰り返し実行される重たい処理がないか <<Detail >> QUERY : 1 3 KEY SCAN(USER01.T1) INDEX NAME : T1_IDX03 INDEX TYPE : B-TREE INDEX COLUMN : C6 ASC (=) INDEX COLUMN : C5 ASC (none) 13

2.2 SQLチューニングの流れ対象 SQLの統計情報の取得と調査対象 SQLの統計情報を取得してバッファへのアクセス要求回数や I/O 回数といった統計情報観点の問題点を調査します < 統計情報の取得方法 (SQL 処理時間の取得と同じ)> HADBの統計解析コマンド(adbstat)でSQL 文の統計情報を取得します HADBサーバ DB 管理者 adbstat -c sql -m ' 開始時刻 ',' 終了時刻 ' > log_adbstat_sql.csv データベースタイムスタンプ AP_name SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 2015/06/01 06:40:29 adbsql 4 SELECT 266,948 1 ADBDIC ##ADBOTHER#0000004096 8 100 0 0 2015/06/01 06:40:29 adbsql 4 SELECT ADBUIDX01 ADBUIDX01BUF 120,202 100 0 0 2015/06/01 06:41:07 adbsql 5 SELECT 112,899 1 ADBDIC ##ADBOTHER#0000004096 8 100 0 0 2015/06/01 06:41:07 adbsql 5 SELECT ADBUTBL01 ADBUTBL01BUF 75 100 0 0 2015/06/01 06:42:31 adbsql 6 SELECT 23,822,936 1 ADBDIC ##ADBOTHER#0000004096 16 100 0 0 2015/06/01 06:42:31 adbsql 6 SELECT ADBUIDX01 ADBUIDX01BUF 14,760,202 100 0 0 2015/06/01 06:42:31 adbsql 6 SELECT ADBUTBL01 ADBUTBL01BUF 14,520,000 100 0 0 <ポイント> 以下のような点を調査します想定するDBへのアクセス量と比べてバッファアクセス回数が多くないかバッファヒット率が著しく低くないか(I/O 回数が極端に多くなっていないか) 14

2.2 SQLチューニングの流れ対策案の検討と検証見つけた問題点の対策案を検討し効果を検証します < 対策案の検討 > 問題点によって対策方法は様々ですが例えば以下のような方法がありますパラメタ設定の変更バッファ面数の割当の変更拡張 1SQLを処理する多重度の拡張定義の変更インデクスの構成列の追加並び順の変更インデクスの追加 SQL 文の書換えジョインする順番の変更ジョイン方式の変更副問合せの書換え(ジョイン化 ) グループ化処理のタイミングの変更対策したSQLを実行して再度統計情報を取得変更前と比較して対策の効果を検証します 15

Contents 1. Hitachi Advanced Data Binderの概要 2. SQLチューニング方法の概要 3. チューニング事例 4. おわりに 16

3.1 事例 1 -グループ化処理のタイミングー 4 月分の売上集計するSQLで名称を付加するためにマスタ表をジョインしているが処理時間がかかっている改善するポイントがありますか? 1 対 1ジョインのはずなのにずいぶん時間がかかるなあ? select U. 大分類, U. 商品コード, SUM(U. 金額 ), max(s. 商品名 ) from 売上 TBL U LEFT JOIN 商品 TBL S on U. 大分類 =S. 大分類 and U. 商品コード=S. 商品コード where U. 日付 between '2014/04/01' and '2014/04/30' and U. 大分類 in ('01', '02', '03', '04) group by U. 大分類, U. 商品コード ; 17

3.1 事例 1 -グループ化処理のタイミングー <ポイント1> 検索の対象行数がどのくらいあるかざっくりと求めて統計情報の DBアクセス量 (バッファ要求回数 )と比べてみましょう SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 1 SELECT 20,398,931 39,996 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 1 SELECT ADBUIDX01 ADBUIDX01BUF 16,450,491 100 0 0 1 SELECT ADBUTBL01 ADBUTBL01BUF 8,219,200 100 0 0 2 SELECT 7,355,184 39,996 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 2 SELECT ADBUIDX01 ADBUIDX01BUF 4,241,679 100 0 0 4 月分の売上データは410 万件あります 2 SELECT ADBUTBL01 ADBUTBL01BUF 4,149,596 100 0 0 それに対して統計情報のインデクス要求回数は1645 万回約 4 倍ですネストジョインの内側である商品 TBLを検索する際インデクス段数が 3 段として売上データ1 件当たり商品 TBLのインデクスを3 回参照売上テータ001 売上テータ002 売上テータ003 売上 TBL 商品 001 商品 002 商品 003 商品 TBL 商品 INDEX (3 段 ) 410 万件 +410 万件 3 段 1600 万回売上 TBL 商品 TBL 18

3.1 事例 1 -グループ化処理のタイミングー < 改善策 > 集計前の売上データには商品コードが重複するので集計後に商品 TBLをジョインするように変更します(グループ化処理を先に実施 ) select U. 大分類, U. 商品コード, U. 金額, S. 商品名 from (select 大分類, 商品コード, SUM( 金額 ) from 売上 TBL where 日付 between '2014/04/01' and '2014/04/30' and 大分類 in ('01', '02', '03', '04') group by 大分類, 商品コード ) U left join 商品 TBL S on U. 大分類 =S. 大分類 and U. 商品コード=S. 商品コード SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 1 SELECT 20,398,931 39,996 ADBDIC ##ADBOTHER#0000004096 14 100 0書換えたSQL 0 1 SELECT ADBUIDX01 ADBUIDX01BUF 16,450,491 100 0 の統計情 0 報 1 SELECT ADBUTBL01 ADBUTBL01BUF 8,219,200 100 0 0 2 SELECT 7,355,184 39,996 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 2 SELECT ADBUIDX01 ADBUIDX01BUF 4,241,679 100 0 0 2 SELECT ADBUTBL01 ADBUTBL01BUF 4,149,596 100 0 0 本改善でインデクスへの要求回数が1645 万回 424 万回に削減できました 4 月分の売上データは410 万件で集計結果は4 万件になるため 410 万件 +4 万件 3 段 =420 万回売上 TBL 商品 TBL 19

3.2 事例 2 -ジョインの順序ー <ポイント2> 事例 1の改善策としてジョイン順序を変更する方法もあります事例 1は売上 TBLを起点にしていましたが商品 TBLの方が件数が少ないため商品 TBLを起点としたジョインに変更します select U. 大分類, U. 商品コード, U. 金額, S. 商品名 from 商品 TBL S INNER JOIN 売上 TBL U on U. 大分類 =S. 大分類 and U. 商品コード=S. 商品コード where U. 日付 between '2014/04/01' and '2014/04/30' and S. 大分類 in ('01', '02', '03', '04') group by U. 大分類, U. 商品コード SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 1 SELECT 20,398,931 39,996 ADBDIC ##ADBOTHER#0000004096 14 100 0書換えたSQL 0 1 SELECT ADBUIDX01 ADBUIDX01BUF 16,450,491 100 0 の統計情 0 報 1 SELECT ADBUTBL01 ADBUTBL01BUF 8,219,200 100 0 0 2 SELECT 8,823,041 39,996 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 2 SELECT ADBUIDX01 ADBUIDX01BUF 4,332,134 100 0 0 2 SELECT ADBUTBL01 ADBUTBL01BUF 4,149,596 100 0 0 本改善でインデクスへの要求回数が1645 万回 433 万回に削減できました 4 月分の売上データは商品コード当たり平均 103 件あるため 4 万件 + 4 万件 (103 件 +4 段 )=432 万回商品 TBL 売上 TBL 20

3.3 事例 3 -ジョイン方式の変更ー商品 TBLと売上 TBLの突き合わせをしたいが両方とも件数が多くて処理時間がかかってしまう改善するポイントがありますか? 商品 001 商品 002 商品 003 商品 004 商品 005 商品 TBL 売上テータ001 売上テータ002 売上テータ003 売上テータ004 売上テータ005 売上 TBL 適切なインデクスを使っているけどジョインがなんだか遅いなあ? 21

3.3 事例 3 -ジョイン方式の変更ー <ポイント3> 大量データを対象とする場合内側表外側表の件数に応じて繰り返し処理の回数が増えるネストジョイン方式よりも両表を1 回ずつスキャンするハッシュジョイン方式が優位となる場合があります <ネストジョイン方式 > <ハッシュジョイン方式 > 商品 001 売上テータ001 商品 001 売上テータ001 商品 002 売上テータ002 商品 002 売上テータ002 商品 003 売上テータ003 商品 003 売上テータ003 商品 004 売上テータ004 商品 004 売上テータ004 商品 005 売上テータ005 商品 005 ハッシュテーブル売上テータ005 商品 TBL 売上 TBL 商品 TBL 売上 TBL 内側表外側表の件数に応じて結合回数が増加商品 TBLを1 回スキャンしてハッシュテーフルに登録売上 TBLを1 回スキャンしてハッシュテーフルで突き合わせ 22

3.4 事例 4 - 演算を含むIN( 副問合せ)の書換えーあるメーカーの商品の4 月 1 日分の売上集計をしたいが IN 副問合せを使うと処理時間がかかってしまう改善ポイントはありますか? IN( 副問合せ)を使うとなんか遅い気がするなあ? select 大分類, 商品コード, SUM( 金額 ) from 売上 TBL where 日付 between '2014/04/01' and '2014/04/30' and 大分類商品コード in (select 大分類商品コード from 商品 TBL where メーカーコード='000456' ) group by 大分類, 商品コード 23

3.4 事例 4 - 演算を含むIN( 副問合せ)の書換えー <ポイント4> 演算を含むIN( 副問合せ)はインデクスで評価できずに思わぬ処理時間がかかってしまうことがあります SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 1 SELECT 58,134,960 400 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 1 SELECT ADBWRK ADBWRK 54,657,604 100 0 0 1 SELECT ADBUIDX01 ADBUIDX01BUF 137,394 100 0 0 1 SELECT ADBUTBL01 ADBUTBL01BUF 137,185 100 1 0 2 SELECT 1,417,099 400 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 2 SELECT ADBUIDX01 ADBUIDX01BUF 548,355 100 0 0 演算を含むIN( 副問合せ)は副問合せの結果を作業表に格納して 2 SELECT ADBUTBL01 ADBUTBL01BUF 273,974 100 0 0 主問合せの1 件ごとに作業表と突き合わせて評価します副問合せ結果 (あるメーカの商品数 )は400 件あり 4/1の売上データは 136000 件あります 400 件 136000 件 =5400 万回の突き合わせが行われます統計情報からも作業表のバッファに5465 万回の要求回数をだしておりこの突き合わせに時間がかかっていることがわかります 24

3.4 事例 4 - 演算を含むIN( 副問合せ)の書換えー < 改善策 > 演算を含むIN( 副問合せ)は外への参照を使ったEXISTS 述語で書き換えると効率的に検索できるケースが多いです select 大分類, 商品コード, SUM( 金額 ) from 売上 TBL U where 日付 = '2014/04/01' and EXISTS( select * from 商品 TBL where メーカーコード='000456' and 大分類 =U. 大分類 and 商品コード=U. 商品コード ) group by 大分類, 商品コード SQL# SQL_type SQL 時間 [μ 秒 ] フェッチ行数 DBエリア名バッファ名要求回数ハッファヒット率 read 回数 write 回数 1 SELECT 58,134,960 400 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 1 SELECT ADBWRK ADBWRK 54,657,604 100 書換 0 えたSQL 0 1 SELECT ADBUIDX01 ADBUIDX01BUF 137,394 100 の統 0 計情報 0 1 SELECT ADBUTBL01 ADBUTBL01BUF 137,185 100 1 0 2 SELECT 1,417,099 400 ADBDIC ##ADBOTHER#0000004096 14 100 0 0 2 SELECT ADBUIDX01 ADBUIDX01BUF 548,355 100 0 0 2 SELECT ADBUTBL01 ADBUTBL01BUF 273,974 100 0 0 本改善で作業表 (ADBWRK)へのアクセスそのものがなくなり 5467 万回の突き合わせ処理が削減できましたその分は外への参照の部分でインデクスへのアクセスが増加する形になります 25

3.5 事例 5 -テーブルスキャンの活用ー B-Treeインデクスはちゃんと使っていて絞り込みも期待できるはずだけどなんとなく遅い気がします改善ポイントはありますか? インデクスはちゃんと使っているんだけどなあ? 26

3.5 事例 5 -テーブルスキャンの活用ー <ポイント5> ビッグデータの場合 B-Treeインデクスを適切に使用して条件も絞り込める ( 母体全体に対する比率として) 場合でも件数そのものが膨大なためインデクス経由のランダムI/Oよりもテーブルスキャンが優位な場合があります <インデクス経由の検索 > <テーブルスキャン> SQL 検索 SQL 検索 B-treeインデクス B-treeインデクスで絞り込みヒント句でテーブルスキャン指定ランダムI/O データ部データ部売上 TBL 売上 TBL 27

Contents 1. Hitachi Advanced Data Binderの概要 2. SQLチューニング方法の概要 3. チューニング事例 4. おわりに 28

4.おわりに 1. 超高速データベースエンジンとは Hitachi Advanced Data Binderプラットフォームと高速化の技術について概要をご説明しました 2.SQLチューニング方法の概要 SQLチューニング方法を問題のSQLの特定から問題点の調査対策案の効果の検証までをご説明しました 3.チューニング事例実際に現場で適用した際のチューニング事例をいくつかご紹介統計情報の結果も併せて定量的に効果を検証しました 29

END Hitachi Advanced Data Binder 実践 SQLチューニング方法 2015/06/12 株式会社日立製作所情報通信システム社 ITプラットフォーム事業本部サービスイノベーション統括本部 IT 基盤ソリューション本部 DB 部山口健一 30