ストレージの常識を変えた! ニンブルストレージのアーキテクチャー
企業システムがストレージに抱える課題 アプリケーションパフォーマンス不足 増え続けるデータ 仮想マシン アプリケーションデータ管理の複雑化 Compute Network 20X 10X 40-45% * CRM ERP CRM ERP CRM CRM ERP CRM Storage Same 年間データ増加率 CRM ERP CRM ERP ストレージパフォーマンスがデータセンターのボトルネックとなりつつあります コスト効率良くストレージを拡張する事が 企業にとって重要な鍵になりつつあります ストレージやアプリケーション管理の複雑化が多くの企業を悩ませています *IC igital Universe Study, sponsored by EMC 2
今までの常識 ( スピンドルバウンドアーキテクチャー ) IO 性能向上のために 1 早いデバイスを使う 2 数を増やす SS 15000 RPM 7200 RPM 3000 IOPS 180 IOPS 高くて買えません中途半端です 70 IOPS 70 * 24 = 1680 IOPS 容量たっぷりお得だけど遅いです スピンドルバウンド
とりあえずフラッシュ方式 ( スピンドルバウンドアーキテクチャー ) フラッシュをライトキャッシュで使ってみたが SS 結局ココが詰まるのでやっぱりスピンドルバウンド
フラッシュとディスク それぞれの特徴 Component フラッシュ ディスク Random IOPS / $ 30-100X 1X Sequential IO / $ 1X 3X Capacity / $ 1X 15X Endurance Poor Proven 5
SS の種類とその特徴 フラッシュは物 ( 値段 ) によって品質が大違い SLC MLC ensity 16 Mbit 32 Mbit 64Mbit Read Speed 100ns 120ns 150ns Block Size 64Kbyte 128 Kbyte Endurance 100,000 cycles 10,000 cycles Operating Temp Industrial Commercial Source: Super Talent SLC vs. MLC: An Analysis of Flash Memory
ニンブルの革新的アーキテクチャー CASL (Cache Accelerated Sequential Layout) 答 : ディスクに行くまでに IO 減らせばいいんじゃね? 色んなワークロード ランダム & シーケンシャル 4K 8K 16K 32K 96% ヒットするたっぷりなリードキャッシュ 数百から数千の IO を全部圧縮しながら大きなストライプを作成 SS SS SS SS Read Cache キャッシュミスの場合は再度 からキャッシュ S と SS へ同時書き込み 圧縮データで形成されたシーケンシャルな 11 IOs
CASL アーキテクチャー 書き込み処理 1 2 3 書き込み処理をアクティブコントローラーので受信スタンバイコントローラーのにコピー書き込みの完了をアプリケーションに返信
CASL アーキテクチャー 書き込み処理 4 5 様々なブロックデータをインラインで圧縮ランダムな書き込みをシーケンシャルなストライプに集約
CASL アーキテクチャー 書き込み処理 6 7 ホットデータを識別し キャッシュにコピー全てのデータをディスクにシーケンシャルに書き込み
CASL による SS への効果的な書き込み処理 フラッシュの特性に合わせて最適化 フラッシュへの書き込み処理をなるべく最小にするため 圧縮した IO ブロックをイレースブロックサイズまで束ねてから書き込み イレースブロックサイズ フラッシュへのデータ書き込みの際は1バイトづつデータが書き込まれる しかしデータが消去される場合は1ブロックづつデータが消去される もし1ビットが変更される場合でも 一度全てのブロックデータを読み出してブロック全体を消去し 再びデータを書き戻す動作を行うため 細切れのIOはパフォーマンス効率が悪いだけでなく フラッシュを劣化させる原因にもなる 1 1 1 1 bit bit bit bit 1 Erase Block cell 1 cell 1 cell 1 cell 1 bit bit bit bit ニンブルストレージは SS に なるべく書かない アーキテクチャーだから MLC を使っても SS が長持ち! 11
CASL アーキテクチャー 読み出し処理 1 アプリケーションがデータを要求 2 次の順序でデータを検索 : 1 2 3 Cache 96% がキャッシュにヒット (Nimble 実績 )
CASL アーキテクチャー 読み出し処理 3 4 最後にディスクのデータを検索しキャッシュにコピーアプリケーションにデータを返信
ディスクのデータレイアウト Write in place file system (EMC, EQL) 利点 欠点 容易に実装可能, 枯れた技術 キャッシュ無しでも良好なシーケンシャルリードパフォーマンス ランダムライトパフォーマンスが悪い 遅くオーバーヘッドの多い圧縮処理
ディスクのデータレイアウト ole filling (WAFL, ZFS) WAFL Write Anywhere File Layout ZFS Copy on write transactional model 利点 欠点 ディスク容量が埋まりだすまでは良好なランダムライトパフォーマンス 効率的なリダイレクトオンライトスナップショット 時と共にパフォーマンスが劣化 遅くオーバーヘッドの多い圧縮処理
ディスクのデータレイアウト Always write full stripes (CASL) 利点 一貫して良好なライトパフォーマンス 非常に効率的なスナップショット 高速インライン圧縮 フラッシュの効率的な使用フラッシュ寿命の延伸 フラッシュ前提でゼロから作り上げたデザイン 可変ブロックサイズを扱える スウィーピングプロセスにより常にストライプを連続書き込み
ニンブルの効果の実例 : MS Exchange Microsoft ESRP ベンチマークの結果 実際の圧縮効果 長期のスナップショット保持 NetApp FAS3220 350 Mailboxes/isk ell Compellent 251 Mailboxes/isk EMC VNX5700 238 Mailboxes/isk 3,333 Mailboxes/isk 1.8x 全てのニンブル顧客の Exchange 2010 データ圧縮率 48% Exchange 2010 を使用している全てのニンブル顧客で 1 ヶ月以上スナップショットを保持している顧客の割合 60 x 10K + Cache; 21,000 Mailboxes 199 x 10K; 50,000 Mailboxes 252 x 7.2K; 60,000 Mailboxes 12x 7.2K + 4x SS; 40,000 Mailboxes 他社と比べ 10 倍以上のパフォーマンス効率 低コストで大容量 より強力なデータ保護 17
実機で証明!18000 IOPS (CS210) ニンブルの凄さを見て触って感じて下さい!
ご清聴有り難うございました! 実機に触れてみたい方はこの後 川端まで