MySQL AB - PDF Free Download

MySQL のパフォーマンスチューニングとよくある落とし穴松信嘉範 (MATSUNOBU Yoshinori) Principal MySQL Consultant, Sun Microsystems yoshinori.matsunobu@gmail.com 1

テーマハードウェア選定バージョン選定ロードなどの更新処理のパフォーマンス改善今日のセッションのメインレプリケーション全文検索その他 2

ハードウェア選定バージョン選定よくある勘違い MySQL のバージョンは古くても良い CPU コア数さえ多ければメモリサイズやディスクはどうでもいいディスクは SATA II 7200 回転の 1TB のディスクが 1 本あれば良い 3

MySQL のバージョン選定バージョンは 5.0 5.1 5.4(beta) の中から選ぶたとえ4.0までの機能しか使わなくても5.0 以降を選ぶ 5.0と5.1は 8CPUコア程度までスケールする 5.4は16CPUコア程度までスケールする 4.1 以下は 2CPUコア程度までしかスケールしない 4.0 とかそれ以前のバージョンは化石サポート対象外でありバグフィックスも行なわれない InnoDB のデータフォーマットの効率が悪くより多くのデータサイズを消費する一貫性のあるバックアップを取る手段が限られているデータ消失を防ぐことのできる手段が限られている 4

64ビット機が主流メモリサイズは極めて重要ハードウェア選定参照だけでなく更新処理でも重要 Linux を選択する場合は I/O スケジューラやファイルシステムに注意 noop, deadline, cfq, anticipatory ext3, xfs (nobarrier) 5

ストレージハードウェア RAID を使いバッテリーバックアップつきライトキャッシュを搭載する書き込み性能が大幅に向上する IOPS (I/O per second) を意識する SAS HDD 15,000 回転で 4~8 本程度が主流 1 本のディスクではせいぜい数百 iops しか出ない RAID5 はそれほど遅いわけではないサイズに制約が無ければ RAID1+0 が推奨される SSD の効果は絶大 2 本の RAID 1 SSD で HDD8 本くらいの効果がある誰か人柱になってください 6

更新性能 7

よくある勘違い INSERT 件数 ( 投入データサイズ ) が 10 倍になれば所要時間も 10 倍になると思っている INSERT は書き込みしかしないのでメモリサイズは小さくても良いと思っているインデックスが多くなると更新性能が落ちるがたいしたことは無いので気にしなくて良いと思っている履歴系ログ系などの蓄積主体のテーブルは MyISAM の方が InnoDB よりも良いと思っている更新性能を高めるにはインデックスやストレージエンジンの特性をよく理解して IOPS を減らす努力をすることが大切 8

INSERT すると何が起こるのか INSERT INTO tbl (key1) VALUES (61) Leaf Block 1 key1 RowID 1 10000 2 5 3 15321 60 431 Leaf Block 1 key1 RowID 1 10000 2 5 3 15321 60 431 Leaf Block 2 key1 RowID 61 15322 Empty Leaf がいっぱいになる新しいブロックが割り当てられる 9

シーケンシャルな INSERT INSERT INTO tbl (key1) VALUES (current_date()) Leaf Block 1 key1 RowID 2008-08-01 1 2008-08-02 2 2008-08-03 3 2008-10-29 60 Leaf Block 1 Leaf Block 2 key1 RowID key1 RowID 2008-08-01 1 2008-10-29 61 2008-08-02 2 2008-08-03 3 Empty 2008-10-29 60 auto_incrementやcurrent_datetimeなどインデックスに対してシーケンシャルに格納されるフラグメンテーションが発生しないインデックスのサイズが小さくなる InnoDB PRIMARY KEYでは強く推奨されるすべてのアクセスがここに集中する : キャッシュされる 10

ランダムな INSERT INSERT INTO message_table (user_id) VALUES (31) Leaf Block 1 user_id RowID 1 10000 2 5 3 15321 60 431 Leaf Block 1 user_id RowID 1 10000 30 333 Empty Leaf Block 2 user_id RowID 31 345 60 431 Empty 通常 INSERT の順序はインデックスに対してランダム (i.e. message テーブルの user_id) 断片化しやすい各ブロックのエントリ数が少なくなるインデックスサイズが大きくなりキャッシュされにくくなる大量のリーフブロックが更新の対象になる 11

ランダムな INSERT は read() を必要とする INSERT INTO message (user_id) VALUES (31) RDBMSのリーフブロックバッファプール user_id RowID 1 10000 2 5 3 15321 1. インデックスがキャッシュされているかどうかをチェック 3. インデックスを更新する 60 431 2. pread() ( キャッシュされていない場合 ) ディスクバッファプールにキャッシュされていなければディスクから読まなければいけないシーケンシャルなインデックス (AUTO_INC, datetime, etc) はこの影響を受けないメモリサイズを増やしたり SSD を使うことで大きく改善される 12

Insert buffer InnoDB の独自機能 : Insert Buffer 非一意インデックスにおいて更新対象のブロック InnoDB バッファプール上に無い場合 InnoDB はディスクから対象ブロックを読むのではなく Insert Buffer という専用領域に書き込む Insert Buffer はメモリ上と SYSTEM テーブルスペース上に作られる Optimized i/o 段階的にインデックス本体に統合される ( マージ ) 長所 :I/Oオーバーヘッドの削減ランダムI/Oの多くを ( 高速な ) シーケンシャルI/Oにできる短所 : 検索処理は本体インデックスと insert buffer の両方を読まなければいけないのでオーバーヘッドが増えるマージ処理に時間がかかる ( 再起動後も行なわれる場合がある ) 13

インデックス戦略と INSERT 性能の影響数億レコードを INSERT するベンチマーク Twitter のメッセージなどを想定 100 万レコードを INSERT する時間を測定 3 つのインデックスランダムに入れる場合 vs シーケンシャルに入れる場合 Random: INSERT.. VALUES (id, rand(), rand(), rand()); Sequential: INSERT.. VALUES (id, id, id, id) 主キーは AUTO INCREMENT InnoDB vs MyISAM InnoDB: buffer pool=5g, O_DIRECT, trx_commit=1 MyISAM: key buffer=2g, filesystem cache=5g インデックス数 (3 vs 1) バッファプールサイズの変更 MySQL 5.1 のパーティショニング機能の活用 14

Benchmarks (1) : Sequential order vs random order Time to insert 1 million records (InnoDB, HDD) Seconds 600 500 400 300 200 100 0 1 13 25 37 49 61 73 85 97 109 121 133 145 Existing records (millions) 2,000 rows/s Sequential order Random order 10,000 rows/s インデックスサイズがバッファプールサイズを上回るバッファプールサイズにおさまっている状態では INSERT 時間が安定バッファプールを超えてからは徐々に時間がかかるようになる (read() 時のヒット率が下がるため ) シーケンシャル INSERT では常にバッファプール内におさまるので安定データ量が増えても更新性能が落ちないのはすべてのインデックスがシーケンシャル順に INSERT される場合だけ 15

Benchmarks (2) : InnoDB vs MyISAM (HDD) Time to insert 1 million records (HDD) Seconds 5000 4000 3000 2000 1000 0 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 Existing records (millions) 250 rows/s innodb myisam MyISAM は InnoDB の insert buffer に相当する最適化機構が何も無く OS やストレージに強く依存するディスクのシークや回転待ちは HDD では深刻になる 16

Benchmarks(3) : MyISAM vs InnoDB (SSD) Time to insert 1million records (SSD) Seconds 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 Existing records (millions) 2,000 rows/s InnoDB MyISAM 5,000 rows/s ンデックサイズがバッファプールサイズを超えるインデックスサイズがファイルシステムキャッシュサイズを超える MyISAM は単に HDD を SSD に置き換えるだけで InnoDB よりも速くなったという例 17

Benchmarks (4) : SSD vs HDD (MyISAM) Time to insert 1 million records (MyISAM) Seconds 6000 5000 4000 3000 2000 1000 0 1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 Existing records (millions) MyISAM(SSD) MyISAM(HDD) MyISAM の INSERT 性能は SSD と HDD で非常に大きいディスクシークや回転待ちは SSD では発生しない 18

Benchmarks (5) : SSD vs HDD (InnoDB) Time to insert 1 million records (InnoDB) Seconds 600 500 400 300 200 100 0 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 Existing records (millions) InnoDB (SSD) InnoDB (HDD) MyISAM に比べると違いは大きくない InnoDB の Insert buffer による影響が大きい Insert buffer のマージ処理に要する時間は SSD と HDD で相当に差があった (SSD:15min / HDD:42min) 19

Benchmarks (6) : Three indexes vs Single index 600 Time to insert 1 million records (InnoDB-HDD) Seconds 400 200 three indexes one index 0 1 41 81 121 161 201 241 281 321 361 401 Existing records (millions) インデックスサイズがバッファプールを超えるインデックスが 1 個の場合はインデックスサイズが小さくなるのでパフォーマンスが遅くなる点も先延ばしにできる 1 レコードの INSERT あたりに必要なランダムリード回数も小さくなるベストプラクティス : インデックスの数は可能な限り小さくする 20

Benchmarks (7) : Increasing RAM (InnoDB) 600 Time to insert 1 million records (InnoDB-HDD) Seconds 400 200 buffer pool=5g buffer pool=10g 0 1 21 41 61 81 101 121 141 161 181 201 Existing records (millions) メモリサイズの増大 ( より多くの領域をバッファプールに割り当てる ) は損益分岐点を高める効果があるベストプラクティス : インデックスサイズは小さくする 21

1 個の巨大なテーブル ( インデックス ) インデックスサイズを小さくする Partition 1 Partition 2 Partition 3 Partition 4 すべての ( アクセス対象の ) インデックスがメモリにおさまる場合 INSERT は高速インデックスサイズを小さくするためのプラクティスに従う ( データ型の最適化等 ) アプリケーションパーティショニング (Sharding) MySQL 5.1 のレンジパーティショニングパーティショニングのキーをシーケンシャルに投入される列にする (auto_increment や登録時刻など ) インデックスもパーティショニングの対象になる (Local Index) INSERT 主体のテーブルでは最新のパーティションだけがアクセス対象になる SELECT が頻発する場合はパーティションプルーニングを考慮 22

Benchmarks(8) : Using 5.1 Range Partitioning (InnoDB) Time to insert 1 million records (InnoDB-HDD) Seconds 600 400 200 0 1 17 33 49 65 81 97 113 129 145 Existing records (millions) Normal table Range-partitioned table PARTITION BY RANGE(id) ( PARTITION p1 VALUES LESS THAN (10000000), PARTITION p2 VALUES LESS THAN (20000000),. INSERT 主体のテーブルでは直近のパーティションしか更新されないのでread() 範囲が非常に限定される 23

Benchmarks(9) : Using 5.1 Range Partitioning (MyISAM) Time to insert 1 million records (MyISAM-HDD) Seconds 5000 4000 3000 2000 1000 0 1 21 41 61 81 101 121 141 161 181 Existing records (millions) Normal table Range-partitioned table MyISAM でも同様 24

Benchmarks (10) : Linux I/O Scheduler (MyISAM-HDD) Time to insert 1 million records (HDD) Seconds 5000 4000 3000 2000 1000 0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 Existing records (millions) queue size=100000 queie size=128 (default) MyISAMは InnoDBのようなI/O 処理最適化のメカニズムが無い OSとストレージに大きく依存する LinuxのI/Oスケジューラには I/Oキューというものがあるキュー内のI/Oリクエストをソートし最適になるように並べ替えるキューサイズは変更可能 # echo 100000 > /sys/block/sdx/queue/nr_requests 25

Benchmarks (11) : Linux I/O Scheduler (MyISAM-SSD) 400 Time to insert 1 million records (SSD) Seconds 300 200 100 queue size=100000 queue size=128 (default) 0 1 9 17 25 33 41 49 57 65 73 81 89 97 Existing records (millions) SSD では大きな違いが無い 26

レプリケーションスレーブの遅延をどのように防ぐか 27

レプリケーション R R R W R W W Master W Master R R R W W W Slave R R R W W W Slave 参照処理のスケールアウトに有効更新処理のスケールアウトにはならない 28

スレーブの遅延にどう対処するか (1) レプリケーションはシングルスレッドで動く 1 本の I/O スレッドと 1 本の SQL スレッドマスターの負荷が高い場合やネットワーク回線が遅い場合 I/O スレッドがボトルネックになることがあるどちらかというと SQL スレッドがボトルネックになる方が大半レプリケーションはトランザクション単位 1 個のトランザクションが非常に長ければスレーブに伝達されるのが遅くなりその分が遅延になる LOAD DATA などで大量にレコードを処理するような場合コミット単位を小さく切るのが効果的これはクラッシュ時のリカバリを短時間で終わらせる場合にも有効 29

スレーブの遅延にどう対処するか (2) Master Server Slave Server 記録反映 SELECT 文に変換先行実行 ( キャッシュされる ) レプリケーション ( 時間差 ) mysqlbinlog で読む I/O スレッド SQL スレッドともにシングルスレッドなので複数の CPU コアを活かしきれない I/O スレッドは高速に転送するが SQL スレッドによる実行に時間がかかることが多い mysqlbinlog でリレーログファイルを読みそれを SELECT 文に変換して実行結果がキャッシュに乗るので INSERT/UPDATE/DELETE が高速になる 30

キャッシュ効率を意識した振り分け関東地方のユーザ東北北海道のユーザ中部近畿のユーザ西日本九州のユーザスレーブスレーブスレーブスレーブ関東地方の地理データがキャッシュされる東北北海道の地理データがキャッシュされる中部近畿の地理データがキャッシュされる西日本九州の地理データがキャッシュされるレプリケーションマスター関東のユーザは関東の地理データにアクセスすることが多いなどアクセスパターンに偏りがあれば単純にロードバランサーやラウンドロビンで振り分けるよりもキャッシュ効率がずっと良い全スレーブが全データを持つようにすれば関東と中部地方にまたがった検索などにも対処できる 31

スレーブのハードウェアストレージエンジン選定ハードウェア選定 CPU のコア数よりもクロック数を優先するメモリサイズは相変わらず重要ディスクは本数よりも 1 本あたりの IOPS を重視 HDD なら 15,000 回転が望ましい SSD は非常に有力な候補になるマスターとスレーブ間のネットワーク回線は GbE を推奨ストレージエンジンマスター InnoDB スレーブ MyISAM という形はよく見かけるが MyISAM はそれほど高速ではないということと MyISAM はテーブルロックかつ参照と更新が競合するので集計クエリなどが長時間走るとレプリケーション遅延が起こることに注意マスターを Blackhole にするのは有効マスターにはデータが残らず制約違反等の検知もできない 32

全文検索バージョンごとに選択肢がある MySQL デフォルトの全文検索機能は日本語に対応していない MySQL 5.0 Tritonn/Senna 住商情報システムと未来検索ブラジルによるサポート提供最も実績がある MySQL 5.1 以降 Sphinx http://www.sphinxsearch.com/ MySQL のストレージエンジンとして動作し UTF-8 であれば Bi-gram 方式により日本語の全文検索が可能分散検索エンジン非常に高速 Craigslist など海外の大規模サイトでの実績が多数利用方法がやや特殊 Fulltext Parser Plugin http://mysqlftppc.wiki.sourceforge.net/home-j mroonga/groonga Senna の後継にあたる現在開発中 33

本体にはまだ取り込まれていないが強力な機能 ( パッチは完成済み ) バイナリログのスケーラビリティ改善バイナリログを有効にしているとき同時に更新するスレッド数が増えても更新性能が伸びない ( グループコミットがきかない ) 点の修正数十倍のレベルで高速化 sync_binlog=1 の高速化耐障害性の最も高い sync-binlog=1 の性能改善これも数倍のレベルで高速化監査ログ機能いつどこから誰がログイン / ログアウトしどのクエリを実行したかを特定するプラグイン形式になっており任意にカスタマイズできる General Log に比べて非常に高速 UTF-8 の 4 バイト文字のサポート 34

Custom Build / Early Adopter Program Custom Build パッチは存在しているがまだ本家にはマージされていない機能をバックポートしプレミアム価格でサポートするメニュー Early Adopter Program まだ社内の QA 基準をクリアしていないが非常に有望な機能を持ったバージョンについてリリース前にそれを利用する機会を提供希望した有償顧客に対して応相談 35

宣伝 (1) 新書籍高性能無停止 Linux-DB 構築 ( 仮 ) 9 月下旬発売予定 LVM, Heartbeat, DRBD, mon による高可用構成 MySQL Cluster レプリケーション等による超高可用構成 RAID やライトキャッシュなど DB サーバの性能を引き出すハードウェア戦略ファイルシステムや I/O スケジューラの影響パフォーマンスを引き出すインデックス戦略 DB サーバの負荷テストの要点やケーススタディ SSD による DB サーバへの性能の変化また DB アーキテクチャはどのように変わるかの考察 36

ありがとうございました 37