このドキュメントに記載されている情報 (URL 等のインターネット Web サイトに関する情報を含む ) は将来予告なしに変更することがありますこのドキュメントに記載された内容は情報提供のみを目的としており明示または黙示に関わらずこれらの情報についてマイクロソフトはいかなる責任も負わないもの

2 - SQL の最適化

このドキュメントに記載されている情報 (URL 等のインターネット Web サイトに関する情報を含む ) は将来予告なしに変更することがありますこのドキュメントに記載された内容は情報提供のみを目的としており明示または黙示に関わらずこれらの情報についてマイクロソフトはいかなる責任も負わないものとしますお客様が本製品を運用した結果の影響についてはお客様が負うものとしますお客様ご自身の責任において適用されるすべての著作権関連法規に従ったご使用を願いますこのドキュメントのいかなる部分も米国 Microsoft Corporation の書面による許諾を受けることなくその目的を問わずどのような形態であっても複製または譲渡することは禁じられていますここでいう形態とは複写や記録など電子的なまたは物理的なすべての手段を含みますマイクロソフトはこのドキュメントに記載されている内容に関し特許特許申請商標著作権またはその他の無体財産権を有する場合があります別途マイクロソフトのライセンス契約上に明示の規定のない限りこのドキュメントはこれらの特許商標著作権またはその他の無体財産権に関する権利をお客様に許諾するものではありません別途記載されていない場合このソフトウェアおよび関連するドキュメントで使用している会社組織製品ドメイン名電子メールアドレスロゴ人物出来事などの名称は架空のものです実在する会社名組織名商品名個人名などとは一切関係ありません 2010 Microsoft Corporation. All rights reserved. Microsoft SQL Server は米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です記載されている会社名製品名には各社の商標のものもあります 1

目次 1. 本書の概要... 3 2. 環境作成... 3 3. 何故 SQL は遅延するのか?... 3 4. 遅延原因 1: インデックスが作成されていない... 4 4.1. カーディナリティ... 4 4.1.1. 実行プランの確認方法... 4 4.1.2. カーディナリティの低いカラムでのインデックス... 6 4.1.3. カーディナリティの低いカラムで有効なインデックス... 8 4.2. テーブルサイズ...10 4.2.1. 高度なインデックスの使用方法...10 4.2.2. カバリングインデックス...10 4.2.3. ソート用として使用... 11 5. 遅延原因 2: インデックスが使用されていない...13 5.1. SQL 文が適切に記載されていない...13 5.1.1. 関数を使用した SQL...14 5.1.2. 演算を使用した SQL...16 5.1.3. 暗黙の型変換がおこなわれている SQL...17 5.1.4. 後方一致検索の SQL...19 5.1.5.!= を使用した SQL...20 5.1.6. Is Null を使用した SQL...21 5.2. 最適ではない実行プランによる遅延...23 5.2.1. 統計情報と実行プラン...23 5.2.2. 実データと統計情報の値の乖離による遅延...23 6. チューニングサイクル...28 6.1. 情報収集...28 6.2. 分析...29 6.3. チューニング...29 6.4. テスト評価...29 2

1. 本書の概要本書はまだあまり開発経験のないアプリケーション開発者が SQL を最適に保つための SQL の書き方やインデックスを効率的に使用する方法についてまとめています 2. 環境作成本書で使用するデータベース及びテーブルインデックスは以下となります CREATE DATABASE DB_Test GO USE DB_Test GO CREATE TABLE T_Emp( ID int NOT NULL, Name Varchar(20), Status Varchar(1), Flag tinyint NOT NULL, UpdDate Datetime, CONSTRAINT PK_ID PRIMARY KEY CLUSTERED(ID)) GO CREATE INDEX IX_Name on T_Emp(Name) CREATE INDEX IX_Status on T_Emp(Status) CREATE INDEX IX_Flag on T_Emp(Flag) CREATE INDEX IX_UpdDate on T_Emp(UpdDate) GO TRUNCATE TABLE T_Emp GO DECLARE @i int = 1 DECLARE @name varchar(10) WHILE @i <= 10000 BEGIN SET @name = 'Name' + RIGHT('000000'+ CONVERT(VARCHAR,@i),6) IF @i <= 9990 INSERT INTO T_Emp VALUES( @i,@name,1,0,getdate() ) ELSE INSERT INTO T_Emp VALUES( @i,@name,2,1,null ) SET @i += 1 END GO 3. 何故 SQL は遅延するのか? SQL Server や Oracle を始めとしたリレーショナルデータベースではデータを取得する際に SQL と呼ばれるデータベース言語を使用してデータベースにアクセスしますデータベースではその SQL を受け取って SQL を解析した後に値を返しますがこの時に結果がなかなか返って来ないまま数十分から数時間が経過してしまったという経験をお持ちの方は多いのではないでしょうかでは SQL は何故遅延するのでしょうか? SQL が遅延する原因は大きく分けて 2 つあります 1 つはサーバーなどのリソースによる遅延でもう 1 つが SQL による遅延ですサーバーリソースによる遅延とは接続ユーザー数やデータ量が想定外に増加してしまったことにより CPU 使用率の高騰やメモリー不足などサーバーが高負荷状態になりデータベースサーバー自体の処理が 3

追いつかなくなってしまうようなケースでアプリケーション開発段階で考慮することが難しい現象と言えます一方 SQL による遅延とは SQL 実行時に SQL 側に問題がある為大量データの読み込みなどが発生し SQL の遅延を誘発してしまうケースですこのような遅延はほとんどの場合がアプリケーション開発時に防げるものでありアプリケーション開発者はデータの読み込み量を抑え遅延が発生しないように心掛けて開発する必要がありますさもないと運用開始後に遅延が発生してアプリケーションの改修作業が発生するだけでなくアプリケーションのテストやリリース作業リリース後の監視から評価まで多大な作業工数がかかってしまうことになりますでは大量の読み込みとはどのようなことが原因で発生してしまうのでしょうか? 4. 遅延原因 1: インデックスが作成されていない大量の読み込みが発生する原因として最も多いのが適切にインデックスが作成されてない為フルスキャンしてしまうケースです SQL には特定の行を取得する際に WHERE 句を使用して条件を指定しますが 1000 万件のテーブルに対して 1 件を抽出するような SQL を実行した場合インデックスがないと 1000 万件のデータ全てを読み込んでしまうことになりますこの為遅延している SQL の条件句にインデックスを作成することで読み込み数は大幅に改善することができますではインデックスは条件句に指定された全てのカラムに作成すればよいかというとそうではありませんインデックスはあまり作成しすぎると更新負荷が高くなってしまい同時実行性が低下してしまう可能性がある為作成しすぎには注意が必要ですそしてインデックスを効果的に作成する際のポイントとしては以下 2 つがありますカーディナリティデータ量 4.1. カーディナリティインデックスを作成する場合最も考慮すべきはその項目がカーディナリティが高いかどうかという点ですカーディナリティとは値の種類のことで性別のように男女 2 種類しかないようなカラムの場合カーディナリティが低いといい逆に顧客番号のようにユニークな値を格納するカラムの場合カーディナリティが高いといいますカーディナリティが低いカラムに対してインデックスを作成してもデータベースはインデックスを使用せずにテーブルフルスキャンを選択してしまいますこの点を SQL Server で実際に確認してみましょうこの点を確認するには SQL の実行プランを見る必要があります以下実行プランの確認方法になります 4.1.1. 実行プランの確認方法実行プランとはデータベースにアクセスする時のアクセス方法や順番のことです今回は Microsoft SQL Server Management Studio を使用して実行プランを確認します Microsoft SQL Server Management Studio を起動し SQL Server に接続 4

新しいクエリをクリック実際の実行プランを含めるを押す SQL 文を記載実行ボタンを押しクエリを実行実行プランタブをクリックして実行プランを表示実行プランの見方は以下になります SQL クエリアナライザのグラフィカルな実行プランの出力は右から左上から下に読みます分析されたバッチ内の各クエリが表示されます各クエリのコストもバッチの総コストに占める割合として表示されます 5

実行プランにマウスを置くと詳細が表示 4.1.2. カーディナリティの低いカラムでのインデックスそれではカーディナリティが低いカラムだとインデックスが使用されないことを確認してみます今回は T_Emp というテーブルの Flag カラムに 0 と 1 の 2 種類の値を 5000 件ずつ格納して SELECT 文を実行します T_Emp テーブルへのデータ挿入 TRUNCATE TABLE T_Emp GO DECLARE @i int = 1 DECLARE @name varchar(10) WHILE @i <= 10000 BEGIN SET @name = 'Name' + RIGHT('000000'+ CONVERT(VARCHAR,@i),6) IF @i <= 5000 INSERT INTO T_Emp VALUES( @i,@name,1,0,getdate() ) ELSE INSERT INTO T_Emp VALUES( @i,@name,2,1,null ) SET @i += 1 END GO 6

Status の件数確認 SELECT Flag,COUNT(*) GROUP BY Flag SQL/ 実行プラン WHERE Flag = 0 実行プラン 1. PK_ID を Clustered Index Scan で参照 T_Emp テーブルの Flag というカラムにはインデックス (IX_Flag) が作成されていますが実行プランを見るとそのインデックスではなくプライマリキー (PK_ID) だけが参照されているのがわかりますこの PK_ID というプライマリキーはクラスタインデックスというインデックスで T_Emp テーブルそのもののデータが格納されているインデックスになります ( 1) そして実行プランに Index Scan とありこの Index Scan が PK_ID を全件読み込んだことがわかりますつまりこの実行プランは PK_ID というプライマリキー ( T_Emp テーブル ) をフルスキャンしたということになります 7

1. クラスタインデックスクラスタインデックスとはリーフブロックにポインタではなく実データを格納しているインデックスのことです通常のインデックスはリーフブロックにテーブルへのポインタを格納していますがクラスタインデックスはポインタではなく実データをそのまま格納していますこの為プライマリキーを指定してテーブルデータを SELECT するような SQL で有効なインデックスと言えます SQL Server ではプライマリキーを作成すると元々存在していたテーブルデータが削除され全てのテーブルデータがプライマリキー内に格納されるようになります 4.1.3. カーディナリティの低いカラムで有効なインデックスではカーディナリティの低いカラムにはインデックスをつける必要はないかというとそうとは限らないケースがありますそれはインデックスを使用して数件のデータを抽出するような SQL です例えば先ほどの Status の件数が 0 が 9,990 件 1 が 10 件格納されていたとしますこの時に 1 の値を抽出する SELECT 文を実行した場合 10,000 件中 10 件を取得することになる為インデックスを使用した方がコストが低いと判断されますデータ作成 TRUNCATE TABLE T_Emp GO DECLARE @i int = 1 DECLARE @name varchar(10) WHILE @i <= 10000 BEGIN SET @name = 'Name' + RIGHT('000000'+ CONVERT(VARCHAR,@i),6) IF @i <= 9990 INSERT INTO T_Emp VALUES( @i,@name,1,0,getdate() ) ELSE INSERT INTO T_Emp VALUES( @i,@name,2,1,null ) SET @i += 1 END GO Status の件数 SELECT Flag,COUNT(*) GROUP BY Flag 8

SQL/ 実行プラン WHERE Flag = 1 実行プランステップ 1. IX_Flag インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合上記実行プランを見ると IX_Flag が Index Seek という実行プランで読み込まれているのが分かります Index Seek は条件に指定された値のみ抽出した場合の実行プランであり今回の場合は 10 件のみ抽出したことになりますその後で T_Emp テーブルをその 10 件と Nested Loops で結合し結果を返していますこのようにカーディナリティが低いカラムであってもインデックスを使用することで数件まで絞り込める場合インデックスが使用され不要な読み込みを回避することができます 9

4.2. テーブルサイズインデックス作成時に考慮すべきもう 1 つのポイントとしてテーブルのサイズがありますインデックスはテーブルサイズが大きいほど効果が高くなります例えば 100 件の中から 1 件を抽出するのであれば全テーブルデータを参照してもインデックスを使用しても読み込み数や処理時間はそれほどかわりませんですが 100 万件の中から 1 件のデータを抽出する場合全データを参照してしまうと読み込みが大量に発生してしまいますこのようなテーブルのデータを抽出する際はインデックスを使用することで効率的にデータを取得することができますまた 1 行のサイズが大きい場合もテーブルサイズが大きくなる為フルスキャンのコストが高くなってしまいます例えば 1 行のレコード長が 10bytes のテーブルと 1KB のテーブルでは同じ行数でもテーブルのサイズが全く異なり当然フルスキャン時のコストも高くなってしまいますこのようなテーブルに対してはインデックスの作成を検討した方がよいと言えます 4.2.1. 高度なインデックスの使用方法以上のように条件句に指定されているカラムとカーディナリティやデータ量を考慮することで効果的なインデックスを作成することができますですがさらに以下のようなインデックスを作成することでインデックスをより効果的に使用することができます 4.2.2. カバリングインデックスカバリングインデックスとは SELECT 文で使用する全てのカラムをインデックスに含めることでパフォーマンスを改善させるチューニングテクニックの 1 つです例えば以下のような Flag カラムを条件句に指定した場合実行プランは Flag のインデックスを参照した後で Name 列の値を取得する為テーブルを参照する必要があります SQL/ 実行プラン SELECT Name WHERE Flag = 1 10

実行プランステップ 1. IX_Flag インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合 Flag のインデックス (IX_Flag) が使用されている為高速に処理されていますが IX_Flag インデックスに Name 列がない為 Name を取得する為にテーブルを参照してしまっていますこの為この SQL をより効率的に処理させたい場合 SELECT 句にある項目も全てインデックスに含めることでテーブルデータの読み込みを減らすことができ処理時間も短縮させることができます CREATE INDEX IX_Flag_Name on T_Emp(Flag,Name) GO SQL/ 実行プラン SELECT Name WHERE Flag = 1 実行プランステップ 1. IX_Flag_Name インデックスを Index Seek で参照 4.2.3. ソート用として使用インデックスは値が小さい順に並んでいる為 order by 句のようなソート処理が実行される SQL の場合そのカラムにインデックスを作成しておくことでソート時の負荷が低くなり処理を高速化させることができます以下カバリングインデックスと同様の手順で確認してみます ( カバリングインデックスの項で作成したインデックスは削除して下さい ) 11

SQL/ 実行プラン SELECT Name WHERE Flag = 1 ORDER BY Name 実行プランステップ 1. IX_Flag インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合 3. Sort 処理実行 ORDER BY を使用している為テーブルデータとインデックスを結合した後 Sort 処理が実行されているのがわかりますこの為この Sort 処理のカラムもインデックスに追加するとソート処理が回避できる為高速に処理されます CREATE INDEX IX_Flag_Name on T_Emp(Flag,Name) GO SQL/ 実行プラン SELECT Name WHERE Flag = 1 ORDER BY Name 12

実行プランステップ 1. IX_Flag_Name を Index Seek で参照 Flag と Name の複合インデックスを作成することでテーブルへのアクセスと Sort 処理が回避され作成されたインデックスのみで処理されていることがわかります 5. 遅延原因 2: インデックスが使用されていないインデックスを作成することで多くの SQL 遅延は改善されますが遅延が解消されないケースがありますそれはインデックスはあるのに使用されていないようなケースです具体的に言うと SQL が適切に記載されていないケースと実行プランが最適でない場合です 5.1. SQL 文が適切に記載されていない一般的に以下のような SQL ではインデックスが作成されていても使用することができませんこの為このような SQL 文をできるだけ記述しないよう注意して SQL を記述する必要があります 1. 関数を使用した SQL 2. 演算を使用した SQL 3. 暗黙の型変換がおこなわれている SQL 4. 後方一致検索の SQL 5.!= を使用した SQL 6.Is Null を使用した SQL 5,6 については SQL Server の場合インデックスが使用されますこれらについて SQL Server で実際に確認しながら見ていくことにしましょう 13

5.1.1. 関数を使用した SQL 条件句に関数を使用したカラムを指定して実行するとインデックスが使用されず全件検索になってしまいます以下では SUBSTRING 関数を使用して Name 列の頭 6 文字が Name01 という文字列を検索しています遅延 SQL WHERE SUBSTRING(Name,1,6) = 'Name01' SQL/ 実行プラン実行プランステップ 1. IX_Name インデックスを Index Scan で参照 2. その結果と PK_ID キーを Nested Loops で結合インデックススキャンとあるのでインデックスが正しく使われているように見えますが Index Scan はインデックスの全データをスキャンする実行プランになりますそしてその中から条件に該当するデータを取得しその結果と PK_ID キーを Nested Loops で結合しています SQL の最適化この SQL をインデックスが使用されるよう記述する場合カラムに対して関数を使用しないように書き換える必要があります今回の場合 SUBSTRING 関数で 1 文字目から 6 文字のデータを取得してその値と文字列を比較していますので以下のように Like 検索に変更することで同等の結果を取得することができインデックスも使用することができます 14

変更 SQL/ 実行プラン WHERE Name Like 'Name01%' 実行プランステップ 1. X_Name インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合上記を見ると IX_Name に対する Index Scan だった実行プランが Index Seek に変わっています Index Seek は条件に指定された値のみデータを抽出した場合の実行プランです ( 内部的には SQL が範囲検索の SQL 文に変換されています ( 2)) そして Index Seek で抽出した結果は PK_ID と Nested Loops で結合されその結果が返されていますつまり IX_Name インデックスを使用してデータを抽出しているということができます 2. 範囲指定に変換されたことは Index Seek の詳細を見ることで確認することができます 15

5.1.2. 演算を使用した SQL インデックスが作成されたカラムに対して演算処理を行うとインデックスが使用されません以下は ID をマイナス 100 した値が 0 より小さいデータを抽出しています SQL/ 実行プラン WHERE ID - 100 < 0 実行プランステップ 1. ID キーを Clustered Index Scan で参照先ほどの SQL と同じように Index Scan なのでインデックスの全データをスキャンした後条件に指定したデータを抽出しています SQL の最適化本 SQL のように左辺の ID を演算するのではなく右辺の 0 の値に 100 をプラスするように書き換えることでカラムに対する演算を回避できインデックスも使用されます変更 SQL/ 実行プラン WHERE ID < 0 + 100 16

実行プランステップ 1. PK_ID キーを Index Seek で参照上記を見ると実行プランが Index Scan から Clustered Index Seek に変わっていて条件に指定された値のみ参照していることがわかりますこれによりインデックスの不要な読み込みを抑えることができます 5.1.3. 暗黙の型変換がおこなわれている SQL 暗黙の型変換 ( 文字列型から数値型に変換 ) されているような場合インデックスは使用されません #SQL Server の場合数値型から文字列型に暗黙の型変換される場合はインデックスが使用されます SQL/ 実行プラン WHERE Status = 2 17

実行プランステップ 1. PK_ID キーを Clustered Index Scan で参照本 SQL は T_Emp テーブルの Status の値が 2 のデータを抽出しています Status のカラムは文字列型であり指定した値は数値で検索している為このまま実行してしまうと暗黙的に SQL が変換されインデックスが使用されない SQL で実行されてしまいます上記の通り Status 列を CONVERT_IMPLICIT 関数を使用して数値型に変換していますこれによりフルスキャンが実行されてしまいます SQL の最適化本 SQL は暗黙の型変換が発生しないようシングルクォートで囲むことでインデックスが使用されるようになります SQL/ 実行プラン WHERE Status = '2' 18

実行プランステップ 1. IX_Status インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合上記を見ると IX_Status の Index Seek で実行されており適切にインデックスを使用していることがわかります 5.1.4. 後方一致検索の SQL 先に確認した前方一致検索であればインデックスは使用されますが後方一致検索ではインデックスが使用されません本 SQL は Name の後ろから 3 文字が 123 のデータを抽出しています SQL/ 実行プラン WHERE Name Like '%123' 19

実行プランステップ 1. IX_Name インデックスを全データ参照 2. PK_ID キーと Nested Loos を全データ参照本 SQL は IX_Name インデックスをフルスキャンした後後ろ 3 文字が 123 のデータを抽出しています後方一致検索の場合インデックスを使用するように変更することができませんこの為この SQL を高速に処理する必要がある場合別の条件を追加できないか全文検索インデックスで代用可能かなどを検討する必要があります 5.1.5.!= を使用した SQL!= (Not Equal 検索 ) で検索した場合 Oracle ではインデックスが使用されませんが SQL Server の場合インデックスが使用されるケースがありますそれはインデックスを使用した方がフルスキャンよりコストが低いと SQL Server が判断した場合です SQL/ 実行プラン (10 件取得 ) WHERE Flag!= 0 実行プランステップ 1. IX_Flag インデックスを参照 2. その結果と PK_ID キーを Nested Loops で結合 20

SQL/ 実行プラン (9,990 件取得 ) WHERE Flag!= 1 実行プランステップ 1. PK_ID キーを Clustered Index Scan で参照上記のように!= を使用した結果が 10,000 件中 10 件を取得するような結果の場合インデックスが使用されます逆に 9,990 件取得する場合テーブルを全件参照した方が速いと判断してフルスキャンが実行されます 5.1.6. Is Null を使用した SQL SQL Server の場合 Is Null を使用してもインデックスが使用されるケースがありますこれも!= 検索と同様インデックスを使用した方がフルスキャンより高速に処理可能と SQL Server が判断した場合に使用されます SQL/ 実行プラン (NULL データ抽出 :10 件 ) WHERE UpdDate Is Null 21

実行プランステップ 1. IX_UpdDate インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合 SQL/ 実行プラン (NOT NULL のデータ抽出 :9,990 件 ) WHERE UpdDate Is Not Null 実行プランステップ 1. PK_ID キーを Clustered Index Scan で参照 22

5.2. 最適ではない実行プランによる遅延以上の SQL はインデックスが使用されるよう SQL 文を書き換えればパフォーマンスが改善される可能性が高いものでしたですが SQL を書き換えてインデックスが使用される SQL を記述してもインデックスが使用されないケースがありますそれはデータベースが作成した実行プランが最適ではないケースです実行プランとはデータベースにアクセスする時のアクセス方法や順番のことで具体的に言うと複数のテーブルを指定した SQL が実行された際にどのテーブルから参照するかどのインデックスを使用するかどのような結合方法で実行するかを解析した結果のことですデータベースでは幾つかの実行プランを作成した後でその中から最も高速に処理することができる実行プランを選択し実行しますこのような実行プランの作成や選択はオプティマイザというデータベースの頭脳とも言える箇所で行われていますこのオプティマイザが高速に処理可能と判断した実行プランが実際に実行した時に遅い場合がある為遅延が発生してしまうことになってしまいますそしてこのような遅延のほとんどが統計情報に問題があるケースになります 5.2.1. 統計情報と実行プラン統計情報とは表や索引カラムがどのような状態なのかを表している情報のことで具体的にはテーブルにデータが何件格納されているか 1 行の平均サイズはどのぐらいなのかカラムにはどのような値が多く格納されているのかなどの情報が格納されています SQL Server の統計情報では行数や平均キー長ヒストグラムなどの情報が格納されていますまたインデックス作成時にインデックス列内の統計情報が作成されテーブル内のデータが更新されると統計情報も自動的に更新されます ( デフォルト ) 実行プランは SQL 文実行後オプティマイザの解析処理で作成されますオプティマイザは解析時に複数の実行プランを作成しその中で最適な実行プランを選択していますがその基準となる情報が統計情報ですこの統計情報が実データと乖離しているような場合誤った実行プランを選択してしまい処理が遅延してしまうことになります例えば 1,000 万件のデータが格納されているテーブルに対して 10 件取得する SELECT 文を実行したとしますこの時に統計情報が古くこのテーブルに 10 件しか格納されていないという情報になってしまっていた場合フルスキャンの方がインデックスを参照するより高速に処理可能と判断しフルスキャンを選択してしまう可能性があります SQL Server ではデフォルトでは自動で統計情報を収集しているのでこのように実データと統計情報の値が乖離するようなことは多くないですがこの機能を無効にしている場合や大量データを一度に更新した場合などにこのようなことになる可能性があります 5.2.2. 実データと統計情報の値の乖離による遅延統計情報による遅延について実際に SQL Server で確認してみます今回は現象を分かりやすくするために 10 件データ挿入時に統計情報を取得しその後で 20 万件挿入して実データと統計情報の値を乖離させて遅延の現象を再現させてみます 1. T_Emp のテーブルデータ作成今回は誤った統計情報を取得すると遅延してしまう現象を確認する為自動で統計情報が取得されないよう統計の自動更新を無効にします 23

2. T_Emp のテーブルデータ作成 10 件のテーブルデータを作成します TRUNCATE TABLE T_Emp GO DECLARE @i int = 1 DECLARE @name varchar(10) WHILE @i <= 10 BEGIN SET @name = 'Name' + RIGHT('000000'+ CONVERT(VARCHAR,@i),6) INSERT INTO T_Emp VALUES( @i,@name,1,0,getdate() ) SET @i += 1 END GO 3. 統計情報取得 10 件格納時の統計情報を取得します統計情報の手動取得は UPDATE STATISTICS コマンドを使用します UPDATE STATISTICS T_Emp IX_Flag 統計情報が取得されてるかどうか確認します確認は DBCC SHOW_STATISTICS コマンドで確認することができます DBCC SHOW_STATISTICS('T_Emp','IX_Flag') 24

Rows が 10 となっていることからこの統計情報ではテーブルデータが 10 行格納されていることになっています実行プランを見ると PK_ID のフルスキャンが実行されていることがわかります WHERE Flag = 0 4. 20 万件のデータ作成 T_Status テーブルに 20 万件になるようデータを挿入します DECLARE @i int = 11 DECLARE @name varchar(10) WHILE @i <= 200000 BEGIN SET @name = 'Name' + RIGHT('000000'+ CONVERT(VARCHAR,@i),6) INSERT INTO T_Emp VALUES( @i,@name,2,1,getdate() ) SET @i += 1 END GO 25

件数確認 SELECT Flag,COUNT(*) GROUP BY Flag 5. 統計情報の確認統計情報が更新されてないことを確認します DBCC SHOW_STATISTICS('T_Emp','IX_Flag') 6. SELECT 文実行統計情報が 10 件でテーブルデータが 20 万件格納されている状態で以下のような Flag を条件に 10 件取得する SQL 文を実行した時の実行プランを確認します WHERE Flag = 0 26

実行プランステップ 1. PK_ID キーを Clustered Index Scan で参照実行プランを見ると Clustered Index Scan とあり PK_ID ( T_Emp テーブル ) のフルスキャンになっていることがわかります 7. 統計情報を取得後再実行統計情報を取得して統計情報の値を最新の状態にしてから同様の SELECT 文を実行します UPDATE STATISTICS T_Emp IX_Flag DBCC SHOW_STATISTICS('T_Emp','IX_Flag') WHERE Flag = 0 27

実行プランステップ 1. IX_Flag インデックスを Index Seek で参照 2. その結果と PK_ID キーを Nested Loops で結合このようにテーブルデータと統計情報で同期が取れていないとオプティマイザが誤った実行プランを最適と判断してしまいます SQL Server では統計情報は自動更新の為あまり意識する必要は有りませんが大量データの更新処理等が実行された時は統計情報を取得してこのような遅延処理が起きないよう気をつける必要があります 6. チューニングサイクル以上の点を考慮してアプリケーションを開発することで運用が開始した後に処理遅延が発生する可能性も少なくなります但しこのように考慮して開発しても実際にはデータ量の増加により予想外に処理が遅延してしまうことがありますこのようなことにならない為に運用開始後に遅延している SQL を発見し対処するそしてまた監視というようなチューニングサイクルを実施する必要がありますチューニングサイクルのフェーズは以下の通りとなりますチューニングサイクル 1. 情報収集 2. 分析 3. チューニング 4. テスト評価 6.1. 情報収集まず最初にデータベースの稼働データや処理時間が長い SQL を取得しますデータベースの稼働データは稼働状況の傾向を把握する為に常に取得しておく必要があります 28

具体的な情報の収集方法については自習書の監視ツールの基本操作を参考にして下さい参考 : http://www.microsoft.com/japan/sqlserver/2008/self-learning/default.mspx 6.2. 分析次に取得した情報を分析します分析はデータ量や処理量の増加に伴いアプリケーションや SQL が遅延していないかデータベースの全体で読み込み量やサーバーの CPU 使用率が増加していないかなどボトルネックの原因を調査します例えば日々処理が遅延する SQL が確認された場合テーブルのフルスキャンが実行されていないかデータ量の増加に伴って読み込みが多くなる処理がないかなどをポイントにボトルネックを特定します 6.3. チューニング遅延原因が把握できたら遅延を解消する為のチューニングを行いますチューニングは本書で見てきたような観点つまりインデックスが貼ることで改善できるかインデックスが使用されない SQL の書き方になってないかデータと統計情報の値が乖離していないかなどを確認しチューニングを実施します 6.4. テスト評価チューニングした結果をテストし効果を確認します特にインデックスを作成するチューニングの場合そのインデックスと同じカラムを参照している SQL にも影響してしまう可能性がある為そのような SQL の実行プランも確認することが好ましいですまたこの処理がチューニングされたことにより別の所で新たにボトルネックが発生する可能性がある為引き続きデータを取得し情報収集する必要があります以上のチューニングサイクルを実施することでデータベースのパフォーマンスを向上させシステムを安定的に運用させることができます 29