Copyright 2013 EMC Corporation. All rights reserved. ( 不許複製禁無断転載 ) EMC Corporation はこの資料に記載される情報が発行日時点で正確であるとみなしていますこの情報は予告なく変更されることがありますこの資料に記載さ

ホワイトペーパー EMC DATA DOMAIN データ非脆弱性アーキテクチャ : データの整合性と復旧可能性を向上詳細レビュー要約ストレージシステムにおけるデータの整合性の保証は単純なメカニズムでは実現できませんいくつものメカニズムが連携し確実な順序で行うことによりどのようなエラーにおいてもデータの復旧可能性を保証することができます従来の汎用的なストレージシステムとは異なり EMC Data Domain 重複排除ストレージシステムは最後の手段としてのストレージという明確な目的を持って設計されています Data Domain システムはリカバリを最優先にしており Data Domain データ非脆弱性アーキテクチャを通してデータの整合性の保護が組み込まれていますこのホワイトペーパーでは Data Domain Data Invulnerability Architecture( データ非脆弱性アーキテクチャ ) の 4 つの主要な要素について説明しますその 4 つの要素を組み合わせることで業界最高レベルのデータの整合性と復旧可能性を実現できますエンドツーエンドの検証故障回避と抑制継続的な故障検出と修正ファイルシステムの復旧可能性 2012 年 11 月

Copyright 2013 EMC Corporation. All rights reserved. ( 不許複製禁無断転載 ) EMC Corporation はこの資料に記載される情報が発行日時点で正確であるとみなしていますこの情報は予告なく変更されることがありますこの資料に記載される情報は現状のままの条件で提供されています EMC Corporation はこの資料に記載された情報に関していかなる種類の表明または保証をするものではなく特に市場性の暗黙の保証や特定の目的の適合性を保証していませんこの資料に記載されるいかなる EMC ソフトウェアの使用複製頒布も当該ソフトウェアライセンスが必要です最新の EMC 製品名については EMC の Web サイトで EMC Corporation の商標を参照してくださいパーツ番号 h7219-3.1-j 2

目次エグゼクティブサマリー... 4 ストレージシステムのデータ整合性... 4 はじめに... 4 対象者... 4 Data Domain データ非脆弱性アーキテクチャ... 5 エンドツーエンドの検証... 5 障害回避と抑制... 6 新規データは正しく保存されているデータを上書きしません... 7 簡素化されたデータ構造... 7 高速で安全な再起動のための NVRAM... 7 部分書き込みを行わない... 8 継続的な故障検出と修正... 8 RAID 6:2 重のディスク障害への対応とリードエラー復旧... 9 オンザフライのエラーの検出と修正... 9 スクラブによる既存データの保証... 10 ファイルシステムの復旧可能性... 10 メタデータ復旧可能性を保証するデータフォーマット... 10 高速な FSCK... 11 評価結果... 11 3

エグゼクティブサマリーストレージシステムのデータ整合性ストレージの機能に特化したシステムはより高い付加価値を提供してはいますが障害が発生しうる汎用的なハードウェアとソフトウェアで構成されていますそれらの障害の中にはディスクドライブ障害のように即座に検知できるタイプのものもありますしかしその他の多くは潜在的にシステムに内在するものやソフトウェアのバグのように定常時は見つからないものが多く知らぬ間にファイルシステム障害を起こし読み取りの時に初めて気づくというケースが尐なくありません高機能ストレージシステムではこれらの障害に直面した場合でもデータの整合性を保証するためにさまざまなデータ整合性チェックや性能可用性の向上策を盛り込んでいますがデータの完全復元性までを提供するには至っていませんその結果バックアップがとられることを想定しデータの復旧可能性よりも性能を重視した設計となっていますたとえばデータが正しく書き込めたかどうかを検証するために書き込み直後に再読み取りするようなプライマリストレージファイルシステムは広く使われてはおらずもし実際にそのように実装した場合にはパフォーマンス面で妥協しなくてはなりませんまたこの最初の書き込みが確実になされていなければデータの完全な復元性を保証することはできません専用のバックアップアプライアンスではデータの非脆弱性は性能や可用性よりも優先度が高い必要がありますデータの整合性にフォーカスしなければバックアップデータとアーカイブデータにリスクが伴いますつまりそれはデータのプライマリコピーが失われた時にそのリカバリにおいてリスクが伴うことを意味します専用のバックアップアプライアンスの多くは安価なディスクを搭載した単純なプライマリストレージシステムですそれらはこれまでのプライマリストレージでの設計思想を引き継いでいますしかしながら専用のバックアップアプライアンスと命名するからにはデータの非脆弱性に注力した設計でなければなりませんはじめにこのホワイトペーパーでは EMC Data Domain Data Invulnerability Architecture( データ非脆弱性アーキテクチャ ) の 4 つの主要な要素について説明しますその 4 つの要素を組み合わせることで業界最高レベルのデータの整合性と復旧可能性を実現できます対象者このホワイトペーパーは Data Domain Data Invulnerability Architecture の詳細に興味を持つ EMC のお客様テクニカルコンサルタントパートナー様 EMC とパートナーのプロフェッショナルサービスコミュニティのメンバーを対象としています 4

Data Domain データ非脆弱性アーキテクチャ Data Domain 重複排除ストレージシステムは設計思想が従来のストレージシステムとは根本的に異なり新しい前提を導入しています最も重要な目標がデータの整合性と復旧可能性であったらどうなるかテープレスの IT 部門を想像した場合極めて復旧可能性が高く保護されたディスクストレージを思い浮かべるのではないかという考え方です Data Domain は万が一の事態における最後の砦としてのストレージを提供するために根本から設計を見直し Data Domain 製品専用 OS を開発しました Data Domain Operating System(DDOS) はデータの非脆弱性を目的として設計されています以下の 4 つの主要領域に注力していますエンドツーエンドの検証障害回避と抑制継続的な障害検出と修復ファイルシステムの復旧可能性このような設計思想において開発された DDOS ですが DDOS はデータを受け取った後でしかその完全性を保証できないという重要な点は見落とさないでください DDOS はシステム単位でのエンドツーエンドテストを行っていますがシステムまでのネットワーク上のやり取りでデータ保護のための処置が完全に行われているかについては関知していませんまたネットワークのエラーによるデータ破損やプライマリストレージ上でデータ破損が発生した場合 DDOS によっても修復は不可能ですアプリケーションレベルのデータ復旧テストは慎重にまた定期的に実行することを強く推奨しますエンドツーエンドの検証ストレージシステムはすべてのコンポーネントでエラーが発生する可能性があるためデータの整合性を保証するエンドツーエンドテストは最もシンプルな方法となりますエンドツーエンドの検証とはデータ書き込み後に読み取りを行いディスクに送られたデータと比較することでデータに破損がないことを確かめると同時にファイルシステムから確実に読み取れることも検証します DD OS はバックアップまた図 1: エンドツーエンドの検証はすべてのファイルシステムデータとメタデータを検証します 5

はアーカイブソフトウェアから書き込み要求を受け取るとデータのチェックサムを作成しますその後システムは一意のデータをディスクに格納して再度読み取ってデータを検証し I/O エラーを即時に修正しますデータはディスクに書き込んだ後しかしメモリ /NVRAM からリリースされる前に検証されるため I/O エラーの修正のためにバックアップのジョブをやり直す必要はありませんエンドツーエンドの検証によりデータが正しくシステムのあらゆるレベルからリカバリできることが確認されますプロセスの途中で問題が発生した場合たとえばディスクドライブでビットが反転した場合は問題が検出されます次のセクションでも説明しますがエラーは自動修復によっても修正されます従来のプライマリストレージシステムではこのような厳格な検証を行うことはできませんしかし専用のバックアップアプライアンスはこの検証が必要です Data Domain Global Compression による大幅なデータ削減を実現したことで検証対象となる実データ量をも削減しこの様な検証を可能にしました障害回避と抑制データ保護における次のステップは検証された正確なデータがそれ以降も正確であり続けることを確認する点にあります中でもファイルシステムの整合性に置ける最大のリスクは新しいデータが書き込まれる時のファイルシステム上のソフトウェアエラーです既存のデータに間違って上書きされるとしたらそれは新しいデータでありファイルシ図 2: 新しく書き込まれるデータは決して古いステムメタデータへのファイルデータをリスクにさらしませんデータコンテナログは既存のデータを決して上書きしませんの新規アップデートでも既存の構し更新も行いません新しいデータは単に ( 赤造を崩す可能性があります Data で示された ) 新しいコンテナに収容されます古 Domainファイルシステムはいデータコンテナは適切に保持されソフトデータ保護を最大の目標として開ウェア的な障害やデータ書き込み中に発生しうるハードウェア的な障害からも守られています発されており既存のデータをリスクにさらしかねない自身のソフトウェアエラーに対しても保護を行う設計になっていますこれはバグの入り込む余地を最小限にする簡素化されたデザインとソフトウェアエラーによる既存のデータへの損傷を最小限に抑える何重もの封じ込め機能の組み合わせによって実現しています Data Domainシステムには特殊なログ階層ファイルシステムが実装されており 4つの利点があります 6

新規データは正しく保存されているデータを上書きしませんこれまでのファイルシステムでは古いデータブロックを使用するときにしばしばブロックを上書きしますが DDFS は新規ブロック以外には書き込みを行いませんこのためソフトウェアのバグによる不正確な上書きを最新のバックアップデータおよびアーカイブデータのみに限定することができます既存のデータは安全な状態に保たれます簡素化されたデータ構造典型的なファイルシステムにおいては高速ブロックアップデートを実現するためにフリーブロックビットマップやリファレンスカウントといった多くのデータ構造が用いられます一方でバックアップアプリケーションではワークロードは新規データのシーケンシャル書き込みであるためそれをサポートするデータ構造はとてもシンプルに構成できますログの先頭を常に監視していれば新規書き込みで既存のデータに触れる必要はありませんこのようなシンプルな設計のおかげでソフトウェアエラーによるデータ障害の可能性が激減しました高速で安全な再起動のための NVRAM システムには不揮発性の RAM 書き込みバッファがありディスクへの書き込みが完了していないすべてのデータが置かれます高速で安全な再起動を実行するためにファイルシステムはこの書き込みバッファのセキュリティを活用していますファイルシステムは多くの内部ロジックとデータ構造のヘルスチェックを使用していますもしこれらのチェックにより問題が確認された場合にはファイルシステムは自力で再起動を行いますこのチェックと再起動によりデータ障害を起こす種類のバグが早期発見されまた修復が行われますこの再起動時に Data Domain ファイルシステムは NVRAM バッファ内部のデータの整合性を検証してからファイルシステムに適用し再起動によってデータの損失がないことを保証します NVRAM は個別のハードウェアデバイスであるため RAM のデータを損傷しかねないエラーからデータを保護します RAM は不揮発性であるため電源障害からも保護されます NVRAM は最新のバックアップが完全に行えることを保証するうえで重要ですがファイルシステムは NVRAM 自体に障害が生じても以前のバックアップの整合性を保証します 7

部分書き込みを行わない従来のプライマリストレージディスクアレイで使用されている RAID 1 3 4 5 6 では書き込み時に電源障害などによるディスク障害が起きると既存のデータを失くしてしまうことがありますそれはディスクの再構成は RAID のストライプ内部の整合性に依存していることが要因ですブロック単位で書き込みが行われる場合には RAID のストライプが整合性の無い過渡的な状態になることがありその際にストライプの再構成が失敗した場合にはその中にある既存のデータは失われてしまいますエンタープライズストレージシステムではこのデータ障害を防ぐために NVRAM を用いたり UPS を導入するなどして対応しますしかし大規模な電源障害が起きた場合は復旧に失敗しデータを失うことになるでしょうこのような事態を避けるために Data Domain システムはストライプ内部のうち一部分のブロックだけを更新するようなことはしませんデータの上書きを行わないという特徴に加えてストライプ自体も常に全体を更新 1 することによりあらゆるデータ障害の可能性を排除していますこれは書き込み後の検証においてストライプ自体の完全性をも検証することを意味します新しい書き込みにより既存のデータが危険にさらされることはありません Data Domain システムは標準ストレージシステムのエラーを最小限にするよう設計されています想定外の障害が発生したときにもその検知と修正までの時間を最短にし即座に状態を管理者に通達する機能も備えています継続的な故障検出と修正突然のハードウェアの故障をソフトウェアで防ぐ手段はありませんストレージシステムにおいてはディスクドライブの障害が大半ですその他にもローカル障害や一時的な障害があります個別のディスクブロックが読み取れなくなったりストレージ相互接続や内部システムバスでのビットの反転による論理的エラーも考えられますこれらに対処するために DDOS では障害検出とリカバリを複数処理を同時に行う幾重ものデータ保護を設けデータリストア作業に妨げのないようにしています 1 外部 RAID に依存するゲートウェイ製品は部分ストライプ書き込みがないことを保証することができません 8

RAID 6:2 重のディスク障害への対応とリードエラー復旧 RAID 6 は Data Domain 製品の継続的な障害検出と修復を行うための中核的な役割を提供します強力なデュアルパリティアーキテクチャによりこれまでの RAID1( ミラーリング ) 3 4 5 で行っているシングルパリティでの対応という手法に対して圧倒的な優位性を持っています RAID 6: ディスクの 2 重障害への対応再構築のディスク読み取りエラーの排除運用者のディスク選択ミスによる障害からの保護 NVRAM や UPS が無くても電源障害から RAID ストライプの整合性を保護書き込み後のデータの整合性とストライプの一貫性の検証各シェルフには Data Domain システム内のどの場所でも障害ドライブを自動的に交換するグローバルスペアドライブがあります EMC がホットスワップ可能な障害ドライブを交換するとそれがグローバルスペアとなります対照的にこれまでの RAID 手法では 2 つのディスク障害が起きるとデータを失ってしまいます最終手段としてのストレージシステムでは RAID6 が提供するより高いレベルのデータ保護機能を搭載する必要がありますオンザフライのエラーの検出と修正図 3: 継続的な故障検出と修復の機能がストレージシステムの障害を未然に防ぎますシステムは定期的に RAID ストライプとデータコンテナの整合性を検証し RAID の冗長性を活用して障害点を修復します毎読み取り時にデータの整合性が確認されエラーがオンザフライで補正されます DDFS ではディスク上のデータ構造はスクラッピングバッファと呼ばれるデータブロックでフォーマットされていますのでリストアが正常に行われればすべてのデータは正確に復元されることを保証しますその中にはデータ検証のための強力なチェックサムが含まれていますディスクからデータを読み取るたびにディスクから読み取ったブロックが期待どおりのブロックであることを検証します次にチェックサムを使用してデータの整合性を検証しますもし何らかの障害が発見されると RAID 6 は複数レベルの冗長性を使用してデータエラーを修正します RAID のストライプは部分的にはアップデートされませんので整合性が保証されその信頼性に基づいてエラーの修正が行われます 9

スクラブによる既存データの保証オンザフライのエラーの検出が正常に稼働していたとしても数週間前または数か月前に書き込んだデータが読めないためにリカバリできないという問題には対処できませんこういった障害からデータを保護するために Data Domain システムではバックグラウンド処理ですべてのデータの整合性をアクティブに再検証していますこのスクラビングプロセスにより問題に発展する前にディスクの欠陥をインテリジェントに検出し修復します以上のようなオンザフライのエラーの検出と修正データの定期的スクラビングによりほとんどのコンピューティングシステム障害やディスクドライブ障害を見分けて修復できるためデータやシステム運用におけるリスクは大きく軽減されますファイルシステムの復旧可能性前述したデータ保護の機能があったとしても一般のストレージシステムが何らかの障害を起こす可能性は完全に否定できませんしかしながら完全復元性を持つアーキテクチャではファイルシステムのメタデータの破損や損失からの再構築機能やファイルシステムチェックのツールなどにより迅速かつ安全にシステムを復旧させることが可能ですメタデータ復旧可能性を保証するデータフォーマット DDFS におけるファイルシステムのメタデータは高速アクセスを実現するためのインデックス情報などを提供しますがそれもまたディスク上のデータ自身から復旧することができますすべてのデータはそれを表すメタデータとともに格納されていますもしメタデータに破損が発生した場合は以下の 2 つの方法で復旧が可能です 1 つ目は DDFS は数時間ごとにメタデータのスナップショットを取っていますのでそのポイントインタイムコピーを図 4: データは自己記述形式で書き込まれます必要に応じてログをスキャンしデータ領域に埋め込まれたメタデータを再構築することでファイルシステムを再生成することができます元に復旧する方法です 2 つ目は DDFS はディスクのデータをスキャンしメタデータを復旧する方法ですこれらの機能によりファイルシステムのメタデータに障害が発生するという最悪の場合でもシステムを復旧することができます 10

高速な FSCK 従来のファイルシステムではオンラインでの整合性のチェックはできません Data Domain システムでは新しく書き込まれたデータの整合性を確保するため初期インライン検証による確認を行います一般のファイルシステムでは障害復旧時のファイル復旧時間が非常に長くなるためファイルシステムの整合性チェックが現実的に可能な容量に関して制約がありますたとえば 80 TB 以上のデータを持つ従来のファイルシステムに FSCK を流すのが現実的でしょうか新しいデータが既存データの上書きを誤って行わないように空き領域を探し出す非常に長い処理のプロセスが必要になります加えてフリーブロックマップや参照カウントの再構築を行うためにすべての参照もチェックするという処理も通常は必要になりますこの処理はシステム内のデータ量が多いほど時間がかかりますこれとは反対に DDFS では既存データの上書きは行わないのでブロックマップリファレンスカウントの再構成は必要ありませんログを確認するだけで安全にシステムをオンラインヘ復旧させます評価結果ストレージシステムにおけるデータの整合性の保証は単純なメカニズムでは実現できませんいくつものメカニズムが連携し確実な順序で行うことによりどのようなエラーにおいてもデータの復旧可能性を保証することができますこれまでのストレージシステムをプライマリストレージからデータ保護ヘ単に目的を変えて利用するのとは違い Data Domain システムは最後の砦としてのデータストレージエリアという明確な目的を持って設計されました完全なデータ非脆弱性アーキテクチャは現状のデータの整合性の問題に対する最善の手法といえます高度な検証により新しいバックアップとアーカイブデータが正確に保存されます DDFS の上書きしないログ形式のアーキテクチャはフルストライプ書き込みの維持とともに新しいデータに起因するソフトウェアエラーが発生した場合でも古いデータが常に安全であることを保証しますまたシンプルで堅牢な DDFS はソフトウエア障害の可能性を最小限に抑えます以上のメカニズムによりバックアップとアーカイブデータの格納時に発生する問題からデータは保護されますがストレージ自体の障害からの復旧可能性も考慮する必要がありますこれを解決するためにデータ非脆弱性アーキテクチャには独自開発の RAID 6 が搭載されていますこれによりディスクの 2 重障害からの保護データ読み取りエラー時の障害ディスクの再構築読み取り時のオンザフライでのデータ修復を実現しましたそしてバックグラウンドでスクラブプロセスを実行することにより問題となる前に潜在的な障害をアクティブに特定して修復できます 11

DDFS ファイルシステムはデータ保護の最終手段として絶対に必要となる復旧可能性の機能を備えています独自のデータフォーマットによりメタデータ構造におけるデータの破損や損失が起きたとしてもファイルデータの再構築が可能ですまた高速のファイルシステムチェックと修復機能により数十テラバイトのデータ容量を持つシステムに何らかの問題がありオフラインになったとしても迅速な復旧を実現しています Data Domain システムはデータの整合性を徹底的に追求した唯一のソリューションで復旧可能性への最高度の信頼をもたらします 12

Copyright 2013 EMC Corporation. All rights reserved. ( 不許複製 禁無断転載 ) EMC Corporation は この資料に記載される情報が 発行日時点で正確であるとみなしています この情報は予告なく変更されることがあります この資料に記載さ

Copyright 2013 EMC Corporation. All rights reserved. ( 不許複製禁無断転載 ) EMC Corporation はこの資料に記載される情報が発行日時点で正確であるとみなしていますこの情報は予告なく変更されることがありますこの資料に記載さ