<4D F736F F F696E74202D2089BC917A8AC28BAB82C982A882AF82E9836F E C C835882CC8C7091B190AB82CC8A6D95DB5F F E542E D>

仮想環境におけるバックアップとビジネス継続性の確保 EMC ジャパン株式会社テクニカルコンサルティング本部プロダクトソリューションズ統括部テクノロジーコンサルタント田中宏幸 2010 年 8 月 3 日 1 アジェンダミッションクリティカルな仮想環境の登場仮想化の現状と方向性ビジネス継続性の確保の重要性 VMware 環境のバックアップバックアップ困ってませんか? VMware 環境にまつわるバックアップの課題 EMC ならではのバックアップ方式のご紹介サーバに負荷をかけないストレージベースのバックアップサーバにもネットワークにもやさしい重複除外技術 VMware 環境における災害対策災害対策の考え方 EMC ストレージによる災害対策 SRM との連携まとめ 2

アプリケーションお試しから本番業務へ仮想化の導入パターン仮想化の進展仮想マシンが標準に仮想マシンの移動性の向上まずは仮想というポリシー仮想マシン数ヘビーユースミッションクリティカル災害対策仮想環境のバックアップ性能 /QoS 仮想マシンの移動仮想デスクトップパイロット PoC テスト開発 Time ライトユースミッションクリティカルでないサーバ時間 3 仮想化環境のインフラストラクチャに求められる要件 Tier1 ミッションクリティカルなアプリケーション Tier2 ビジネスクリティカルなアプリケーション Tier3 ビジネスをサポートするインフラストラクチャ要件非常に高い可用性サービスレベルの管理サーバ / ストレージの管理インフラストラクチャ要件高可用性レプリケーション ( ローカル / リモート ) ストレージリソースの管理インフラストラクチャ要件基本的なストレージ接続テープによるバックアップとリカバリ 4

VMware 環境のバックアップ 5 バックアップ処理時間の増加とリソース負荷従来の方式では物理サーバ配下のリソースは物理サーバが任意にコントロール出来た Storage Data APP OS バックアップシステム占有の I/O 経路占有の H/W リソース LAN 仮想化環境ではリソースが共有されており競合が発生する VMFS Storage Data Data APP OS APP OS ESX APP OS APP OS バックアップシステム共有のI/O 経路共有のH/Wリソースデータ容量の増加 VMFS Data Data LAN 課題従来の方法ではバックアップが難しいバックアップ時間の延長リソース負荷の増加 6

仮想化のバックアップとリカバリに関する課題仮想化は IT の考え方を変えたバックアップはより高度な統合と価値を提供するために発展する必要がある従来の考え方物理環境 : 全般的にサーバ使用率が低くバックアップに大量の帯域幅が利用可能新しい考え方仮想環境 : 全般的にサーバ使用率が高くバックアップ用の帯域幅は少ない 100% 100% CPU 使用率 80% 60% 40% 20% 0% サーバ A サーバ B サーバ C CPU 使用率 80% 60% 40% 20% 0% 仮想サーバ A ESX Server ハードウェア共有物理リソース仮想サーバ B 仮想サーバ C リソースの 20% の使用率リソースの 80% の使用率 7 バックアップの基本的な考え業務サーバや業務ネットワークのリソースを使わないもしくは最小化する VMware 社の VCB や vstorage API for Data Protection も方向性は同じ 8

EMC の 2 大バックアップ手法 1. ストレージ機能を用いたバックアップバックアップに伴なう負荷をストレージにオフロードする 2. 重複除外技術を用いたバックアップサーバやネットワークにかかる負荷を最小化する 9 EMC の 2 大バックアップ手法 1. ストレージ機能を用いたバックアップバックアップに伴なう負荷をストレージにオフロードする 2. 重複除外技術を用いたバックアップサーバやネットワークにかかる負荷を最小化する 10

超高速なストレージのバックアップリストアリカバリリソースクローン / BCV リストア時間 ( 弊社検証結果より想定 ) 数分ディスク数十分 ~ テープ数時間時間 100GB 程度のデータをリストアする時間 11 ストレージベースのバックアップ手順 DB ストレージ 1 DB 3 業務サーバ Read/ Write 本番 Clone バックアップサーバ本番ボリュームと Clone ボリュームを同期させる本番 Clone Clone ボリュームを本番ボリュームから切り離す同期 2 切り離し 4 DB DB 静止点確保本番 Clone アプリケーション側で静止点を確保する本番マウントバックアップサーバから Cloneボリュームをマウントする Clone Cloneボリュームのデータをバックアップする課題ストレージレプリケーション機能とアプリケーションの制御を連動させたい 12

ストレージベースのバックアップ手順 ~ESX なら ~ 1 3 ストレージ業務サーバ Read/ Write 本番同期 Clone バックアップサーバ本番ボリュームと Clone ボリュームを同期させる 2 本番 Clone 切り離し Clone ボリュームを本番ボリュームから切り離す 4 静止点確保本番 Clone 同じファイルシステムを利用している仮想マシンすべてについて静止点を確保する本番マウントバックアップサーバから Cloneボリュームをマウントする Clone Cloneボリュームのデータをバックアップする課題ストレージレプリケーション機能と VMware 側の制御を連動させたい 13 ストレージ機能を用いたバックアップストレージの超高速なレプリケーション機能と vsphere の機能を連携し自動化しますストレージの複製機能 + 14

アプリケーションとバックアップ処理の連携各々の仮想マシンの静止点を保証しながらバックアップ運用の一元管理と自動化を実現する Replication Manager 仮想マシン Replication Manager Replication Manager ESX サーバ CLARiX Production Snap View SnapView アプリケーションとストレージを連携しバックアップ運用の負担を軽減スクリプト作成は不要ストレージレベルのバックアップ ( クローン ) はサーバに負荷を与えないレプリカは LUN 単位リストアはLUNもしくは仮想ディスク単位 Replica 15 アプリケーションとバックアップ処理の連携 1 操作管理 GUI Console RM Client RM Server RM Client 2 レプリカ指示 3 マウント指示 ( 業務サーバ ) ( マウントホスト ) Replica 1 STD Establish Fracture Replica 2 Replica 3 BCV Replica 4 16

VMware 環境向けの RM 利用例制御 Windows 業務 ESX マウント ESX RM Server 10VMs / ESX RM Proxy vcenter 仮想ディスクチャレンジ多数の仮想マシン /Windows ゲストの起動ボリュームのストレージベースのレプリケーション実施日々の処理の自動化結果 RM ですべてのレプリカを一元管理レプリケーションジョブの自動化 ESX の snapshot 機能とストレージのスナップショット機能の自動連携 17 EMC の 2 大バックアップ手法 1. ストレージ機能を用いたバックアップバックアップに伴なう負荷をストレージにオフロードする 2. 重複除外技術を用いたバックアップサーバやネットワークにかかる負荷を最小化する 18

重複除外技術を用いたバックアップ重複除外技術により劇的にデータ量を削減します 19 重複除外技術を用いたバックアップ重複除外技術により劇的にデータ量を削減する Avamar 日々のバックアップデータ量を最大 1/500 に縮小日々のバックアップ所要時間を最大 1/10 に短縮バックアップの保存容量を最大 1/50 に縮小簡単に設定できるレプリケーションライセンス 0 Avamar バックアップ元でデータを削減しバックアップ時間を短縮クライアント ( バックアップ元 ) 同士のデータも削減し更にバックアップ容量を縮小クライアントのライセンスは不要 vstorage API 対応バックアップ元で重複除外重複除外バックアップシステムクライアント間のデータも重複除外最大 1/500 に縮小 20

Avamar の重複除外が機能する仕組み最初のインスタンス重複するインスタンス変更されたインスタンス 2009 年 3 月 2009 年 3 月 2009 年 4 月 A B A B E B C D C D C D 固有のデータセグメントのみをバックアップ A B C D データはバックアップ済みであるため固有の ID ポインタのみを保存 (20 バイト ) E 新規データセグメントを識別してバックアップ A B C D E ディスク上に保存された固有のデータは即時のリカバリが可能 21 従来のバックアップソフトとの違い従来のバックアップソフト Avamar 凡例フル週末など : 定期フルバックアップ平日 : ファイルレベルの差分バックアップリストア : フルと差分のセットを組み合わせて復旧 ( 煩雑な作業 ) 初回 : フルバックアップを取得するが圧縮と重複除外処理でデータ量を圧縮 2 回目以降 : 毎日合成的にフルバックアップを行うが差分ブロックのみデータ保管リストア :Avamar が必要なブロックを再結合してデータを復元 ( ワンクリックリストア ) Day 1 Backup 99.x% のデータ削減 Avamar のバックアップイメージ 400GB( 全体 ) 10MB/sec で約 11 時間 Day 2 2GB 10MB/sec で約 3 分 Day 3 2GB 10MB/sec で約 3 分 Day 4 800MB 10MB/secで約 70 秒 Month 200MB 10MB/secで約 18 秒 22

従来のバックアップ vs Avamar 従来のバックアップ CPU Network Disk Traditional vs Avamar Avamar 従来型のバックアップでは Guest マシンのリソースを占有してしまいます特にフルバックアップ実行の際は長時間のリソースの占有が発生しますそれに対して Avamar は短時間でバックアップジョブが完了するため大幅に消費されるリソースを削減することが可能です 100GBのGuestマシンが計 12 台動作するESXサーバに対して Avamarのバックアップ所要時間は3~12 分で完了 ( 弊社内検証環境での結果 ) 23 Avamar 重複除外の効果データタイププライマリデータの量毎日送信されるデータの量毎日の重複除外比率 Windows ファイルシステム 3,573 GB 6.1 GB 99.8% Windows Linux UNIX の各ファイルシステムが混在 5,097 GB 11.7 GB 99.7% NAS ファイラのエンジニアリングファイル (NDMP バックアップ ) 3,265 GB 24.2 GB 99.3% 20% のデータベースと 80% のファイルシステムが混在 (Windows および UNIX) 9,583 GB 80.0 GB 99.2% Linux のファイルシステムとデータベースが混在 7,831 GB 104.2 GB 98.7% 出典 :EMC 24

Avamar が VMware 環境に適している理由 EMC の重複除外技術によりかなりのデータ量の削減とリソースの節減が期待できます VMware ESXサーバストレージデータネットワーク負荷最小 ESX サーバの負荷減少 Avamar 重複除外 Avamar バックアップサーバデータ Avamar 重複除外バックアップデータ Avamar 重複除外バックアップストレージ節減 25 Avamar クライアントバックアップソリューション VMware ゲスト OS バックアップデータ保護のための vstorage API = Avamar ソフトウェアエージェント Avamar サーバ仮想マシンリソースプール VMware 仮想化レイヤー一元的な Data Mover Avamar エージェントのある vstorage API プロキシサーバ x86 アーキテクチャ物理サーバ = Avamar ソフトウェアエージェント Avamar クライアントソフトウェアは各仮想マシンで直接実行ストレージ Avamar クライアントソフトウェアは VCB プロキシサーバで実行される 26

ここまでのまとめ 1. ストレージ機能を用いたバックアップ業務サーバネットワークに負荷をかけない超高速かつ自動化されたバックアップリストア LUN 単位のバックアップ LUN もしくは VM 単位のリストア 2. 重複除外技術を用いたバックアップ業務サーバネットワークの負荷を最小化超軽量バックアップ VM 単位ファイル単位のバックアップリストア vstorage API との互換性 27 VMware 環境の災害対策 28

災害対策を検討する要素システムの災害対策を検討する為には以下の要因のバランスを考えて災害対策範囲や手法を検討する必要がありますサービスレベル RPO( データ損失の許容量 ) RTO( リカバリ時間の許容量 ) RGO( 距離 / 想定する災害レベル ) パフォーマンス要件保護の対象対象システムの範囲優先度総データ量 I/O プロファイルコストイニシャルコスト (IT) ランニングコスト (IT) 文書化教育訓練コスト 29 想定する災害の規模に応じた設計影響範囲 ( 距離 ) 自然災害地震台風集中豪雨人為災害テロ大規模停電広域火災ウィルス感染長距離災害対策 ( 非同期型 ) 施設障害ビル停電空調障害近距離災害対策 ( 同期型 ) 筐体障害機器故障 Kernel Panic / Blue Screen 頻度 30

想定する災害の規模に応じた設計影響範囲 ( 距離 ) 自然災害地震台風集中豪雨人為災害テロ大規模停電広域火災ウィルス感染外部保管リモートレプリケーション長距離災害対策 ( 非同期型 ) 施設障害ビル停電空調障害筐体障害機器故障設備装置の多重化 Kernel Panic / バックアップ Blue Screen 近距離災害対策ローカルレプリケーション ( 同期型 ) 頻度 31 リモートサイトの構成は? 本番システムと同一を用意して常に同期できれば. LAN 課金システム会計システム本番サイト顧客管理システム請求システム商品管理システム Clients 在庫管理システムリモートサイトへの書込みによるパフォーマンス低下システム追加の際に必ず倍に発生するシステム投資 WAN Gateway Primary Storage リモートサイト Remote Storage Gateway 請求システム転送に伴う回線費用の圧迫ハードウェア制限により距離的制限商品管理システム在庫管理システム顧客管理システム課金システム会計システム Clients LAN 32

PtoV による災害対策コスト削減大規模メールシステムの例 SMTP Gateway LAN Email Archive Server Exchange Back-End Server Clusters Exchange Clients Exchange Front-End Servers Exchange Public Folders リモートサイト Remote Storage Gateway WAN Gateway Primary Storage 本番サイト SMTP Gateway Exchange Front- End Servers Email Archive Server Exchange Back-End Server Clusters Exchange Public Folders VMWare LAN VMWare Exchange Clients 33 ストレージベースでの DR( 物理 vs 仮想 ) 物理環境 OS 領域を複製しない場合は個別に OS を用意しパッチあて等のメンテも必要 OS OS OS 領域を複製するには Boot が大前提 DATA DATA 本番環境と同じ HW Source Site Target Site 仮想環境ゲスト OS ゲスト OS DATA DATA ゲスト OS は共有ストレージ上本番と同じ HW である必要はない 34

EMC が提供するビジネス機能性のフレームワーク情報保護サービEMC のレプリケーション製品 SRDF ファミリー (Symmetrix) 究極の事業継続災害対策ソリューションで様々な用途に利用できます Celerra Replicator (NAS) LAN/WAN の利用帯域を最適化し QoS に対応した IP ベースのレプリケーション FS/LUN Snaps LAN FS/LUN Snaps MirrorView (CLARiX) 同期非同期に対応した柔軟なレプリケーションソリューション RecoverPoint ( 異機種混在 ) ネットワークベースの continuous data protection (CDP), continuous remote replication (CRR), concurrent local and remote (CLR) データプロテクション 1 4 2 3 HARDWARE SOFTWARE Virtualization layer Intel architecture Production ESX Servers Windows Replica of Windows Linux Replica of Linux HARDWARE SOFTWARE Virtualization layer Intel architecture Backup Server 35 層ス型ンレプリMirrorView/A 代替案設計テクノロジー階CLARiX MirrorView/S Copy ( 数十分 ~) プランニングサービスレベルとビジネス要件許容可能なデータ消失 0 秒数秒 ~ 数分数時間 24 時間以上アプリケーションの可用性数分数分数時間 24 時間以上業務の中断非常に少ない少ない標準多い RecoverPoint CRR (Continuous remote replication) Symmetrix SRDF/S SRDF/A SRDF/AR SRDF/DM ケーショの可用性Celerra (NAS) Celerra Replicator SRM との連携 Yes 36

VMware vcenter Site Recovery Manager との連携 Storage Symmetrix: SRDF CLARiX: MirrorView Celerra: Replicator VMware Site Recovery Manager と EMC レプリケーション技術の連携により災害時のフェイルオーバ動作を自動化 RecoverPoint WAN Symmetrix: SRDF CLARiX: MirrorView Celerra: Replicator RecoverPoint Storage 37 VMware vcenter Site Recovery Manager との連携手動での管理作業 VMware ESX ESX Server 11. ローカル VM を復旧 3. 仮想マシンを shutdown 4. 複製停止 ( キャプチャされたジャーナル ) 5. 最新の snapshot を選択 6. リモート側 ESX に複製イメージへのアクセス許可 RecoverPoint WAN 7. 新しい Disk をスキャン 8. VM の登録 9. VM の電源 ON RecoverPoint VMware ESX ESX Server (disaster recovery) 10. フェイルバック 1. VM が利用している LUN と Consistency Group 2. レプリカ LUN 38

SRM がある場合の VM のフェイルオーバー VMware ESX 仮想マシン shutdown 複製停止 ( キャプチャされたジャーナル ) 最新の snapshot を選択リモート側 ESX に複製イメージへのアクセス許可新しい Disk をスキャン VM の登録 VM の電源 ON * ユーザが failback を指示データの複製の方向を逆転同期ローカル VM を復旧 VMware ESX ESX Server RecoverPoint WAN RecoverPoint ESX Server (disaster recovery) 1. VM が利用している LUN と Consistency Group 2. レプリカ LUN 39 まとめミッションクリティカルな仮想環境の登場物理環境仮想環境にかかわらずミッションクリティカルな要件が発生する相応のビジネス継続性が求められる VMwareのバックアップの考え方業務サーバに負荷をかけないストレージベースのバックアップ業務サーバにもネットワークにもやさしい重複除外技術 VMware 環境における災害対策 RPO/RTOの要件に合わせた製品技術の選定 SRM との組み合わせによる自動化 40