h Big Dataの保護

Similar documents
Oracleライフサイクル管理ソリューション概要

EMC Data Domain Boost for Symantec NetBackup and NetBackup Storage Unit Group Failover

ホワイト ペーパー EMC VFCache により Microsoft SQL Server を高速化 EMC VFCache EMC VNX Microsoft SQL Server 2008 VFCache による SQL Server のパフォーマンスの大幅な向上 VNX によるデータ保護 E

コース番号:

Dell EMC および Hortonworks の委託により独自に実施した Technology Adoption Profile 2016 年 9 月 Hadoop によるエンタープライズデータウェアハウスの最適化 スタート FORRESTER.COM

S

Oracle Cloud Adapter for Oracle RightNow Cloud Service

Veritas System Recovery 16 Management Solution Readme

NASのバックアップ/リカバリに関する課題の解決

Copyright 2009 EMC Corporation. All rights reserved. このドキュメントに記載されている情報は ドキュメントの出版日現時点の情報です この情報は予告なく変更されることがあります このドキュメントに記載される情報は 現状有姿 の条件で提供されています

Client Management Solutions および Mobile Printing Solutions ユーザガイド

h Dell EMC Data Domain Operating System

新製品 Arcserve Backup r17.5 のご紹介 (SP1 対応版 ) Arcserve Japan Rev. 1.4

Copyright 2015 EMC Corporation.All rights reserved.( 不許複製 禁無断転載 ) 1

EMC Data Domain Global Deduplication Array

はじめに Dell PowerVault DL2000 Powered by Symantec Backup Exec は シンプルで管理しやすいデータ保護機能を提供する 柔軟かつ経済的なバックアップソリューションです 本ホワイトペーパーでは PowerVault DL2000 の バリューシリーズ

EMC Data Domain Archiver

iStorage NSシリーズ 管理者ガイド

Veritas System Recovery 16 Management Solution Readme

ネットアップクラウドデータサービス

PowerPoint プレゼンテーション

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

EMC NetWorker が EMC Data Domain Boost との統合により重複除外のサポートを完成 THE CLIPPER GROUP ナビゲータ TM 1993 年創刊レポート番号 TCG LE 2010 年 10 月 4 日 EMC NetWorker が EMC D

【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus

使用する前に

Transitioning from Microsoft® Exchange Server 2003 to Exchange Server 2007 while using HP StorageWorks All-in-One Storage System for storage

EMC Data Domain Boost for Oracle Recovery Manager (RMAN)

Microsoft Word - BE _J_wp_bews_10_caso_v2_final_.doc

EMC Isilonスケールアウト ストレージ製品ファミリー

プラン作成ガイド ~ 仮想環境をエージェントレスで バックアップするプランの作成 ~ 年 8 月

Exam : 日本語版 Title : Enterprise Storage Sales V3 Vendor : IBM Version : DEMO 1 / 5 Get Latest & Valid J Exam's Question and Answers from

変更履歴 項番版数内容更新日 版新規作成 2013 年 11 月 18 日 1

Copyright 2015 EMC Corporation. All rights reserved.( 不許複製 禁無断転載 ) 1

JP1 Version 11

DocAve Lotus Notes Migrator v5_0 - Product Sheet

Exam4Docs Get your certification with ease by studying with our valid and latest training material.

共通マイクロアーキテクチャ 富士通はプロセッサー設計に共通マイクロアーキテクチャを導入し メインフレーム UNIX サーバーおよびスーパーコンピューターそれぞれの要件を満たすプロセッサーの継続的かつ効率的な開発を容易にしている また この取り組みにより それぞれの固有要件を共通機能として取り込むこと

フルボリュームのレプリケーションは 通常 営業時間外か週末に実施されます 一方 インクリメンタルなレプリケーションは 一日を通じて実施され 開始点としてフルボリュームのレプリケートを必要とします 主な機能 TCP 最適化標準的な TCP ウィンドウサイズと輻輳動作を変更することでスループットを改善

Insert VERITAS™ FAQ Title Here

データマネジメントを取り巻く IT の課題 大規模データの実践的活用に向けて レッドハット株式会社 Senior Solution Architect and Cloud Evangelist 中井悦司 2012/04/13 version1.0

Windows Server 2016 ライセンス体系に関するデータシート 製品の概要 Windows Server 2016 は 準備が整った時点でクラウドコンピューティングへ簡単に移行できる新しいテクノロジを導入すると同時に 現在のワークロードをサポートするクラウドレディのオペレーティングシステ

Symantec Enterprise Vault.cloudチラシ

VERITAS Backup Exec for Windows Servers Management Pack for Microsoft Operations Manager ガイド

QNAP vsphere Client 用プラグイン : ユーザーガイド 2012 年 12 月更新 QNAP Systems, Inc. All Rights Reserved. 1

Oracle Enterprise Manager 10g System Monitoring Plug-In for IBM WebSphere Application Server

Copyright 2012 EMC Corporation. All rights reserved. ( 不許複製 禁無断転載 ) EMC Corporation は この資料に記載される情報が 発行日時点で正確であるとみなしています この情報は予告なく変更されることがあります 本文書に記載され

GettingStarted.fm

Veeam_Corporate_Template_16x9

KSforWindowsServerのご紹介

BUYER CASE STUDY

DumpKiller Latest IT Exam Questions & Answers No help, Full refund!

HP StorageWorks X9000 Network Storage System

Microsoft Active Directory用およびMicrosoft Exchange用Oracle Identity Connector

EMC Isilon X シリーズ EMC Isilon X200 EMC Isilon X400 OneFS オペレーティングシステムで動作する EMC Isilon X シリーズは 優れた汎用性を持ちながらもシンプルなスケールアウトストレージアーキテクチャを採用して 大量のデータへの高速アクセス

Microsoft Word - nvsi_080188jp_r1_netvault_oracle_rac_backup_complemental_guide_j_174x217.doc

Oracle SQL Developer Data Modeler

<4D F736F F D FC8E448FEE95F1837C815B835E838B C8F92E88B608F912E646F63>

SIOS Protection Suite for Linux v9.3.2 AWS Direct Connect 接続クイックスタートガイド 2019 年 4 月

HPE Integrity NonStop NS2300 サーバー

Corp ENT 3C PPT Template Title

新しい 自律型データ ウェアハウス

White Paper EMC DATA DOMAIN BOOST と SYMANTEC NETBACKUP の分散重複除外機能によるバックアップ処理の高速化 実機による検証結果の報告 要約 EMC Data Domain Boost for Symantec OpenStorage( 以下 DD

EMC ISILON S シリーズノードの仕様 ISILON S200 ノードの 特長とオプション 300 GB HDD 600 GB HDD 900 GB HDD 1.2 TB HDD (Isilon OneFS 以降が必要 ) 容量 (HDD/SSD) 5.4~7.2 TB/ 10.

Oracle Warehouse Builder: 製品ロードマップ

ボリュームライセンスのアップグレードライセンス : Windows アップグレードライセンスは ライセンスが最初に割り当てられたデバイスでのみ使用できるため 再割り当てを行うことはできません ただし ボリュームライセンスでは 適切なライセンスを取得した交換用のデバイスにソフトウェアアシュアランスを再

MAGNIA Storage Server Configuration Guide

Symantec Endpoint Protection 12.1 の管理練習問題 例題 1. 管理外検出でネットワーク上のシステムを識別するとき 次のどのプロトコルが使用されますか a. ICMP b. TCP c. ARP a. UDP 2. ある管理者が Symantec Endpoint P

Oracle Database 12c

TITLE 44 POINT META NORMAL LF ALL CAPS

Oracle GoldenGate for Big Data

ORACLE PARTITIONING

Silk Central Connect 15.5 リリースノート

PassSureExam Best Exam Questions & Valid Exam Torrent & Pass for Sure

ORACLE TUNING PACK 11G

コースの目標 このコースを修了すると 下記のことができるようになります : 1. RAID とそのさまざまな構成の基本的理解を深める 2. RAID で新しいストレージボリュームをセットアップする 前提条件 受講前提条件 : なし 次の項目についての知識を持つ受講生を対象としています : 該当なし

目次 1. はじめに バックアップと復元の概要 Active Directoryのバックアップ Active Directoryの復元 ドメインコントローラの復元 ( 他のドメインコントローラが利用できる場合 )

Microsoft Word - ESX_Restore_R15.docx

PowerPoint プレゼンテーション

Oracle Real Application Clusters 10g: 第4世代

Backup and Recovery for VMware Using EMC Data Domain Deduplication Storage

Windows Server 2016 Active Directory環境へのドメイン移行の考え方

Microsoft Word - Retrospect Competitive Analysis 2_10 JPYEN.docx

PowerPoint プレゼンテーション

目次 はじめに... 3 仮想化環境上の仮想マシン保護方法... 4 ( 参考 )Agent for Virtual Machines での仮想マシンのバックアップ... 8 まとめ 改訂履歴 2011/04 初版リリース 2012/10 第 2 版リリース このドキュメントに含まれる特

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

ソフトウェアの説明

Enterprise Cloud + 紹介資料

データベースの近代化:シンプルなクロスプラットフォーム、最小のダウンタイムで実現するクラウド移行

McAfee SaaS Protection 統合ガイド Microsoft Office 365 と Exchange Online の保護

機能紹介:コンテキスト分析エンジン

Presentation Template Koji Komatsu

Microsoft Word - retrospect_competitive_q413_jpyen.docx

EMC Data Domain SISL Scaling Architecture

データ管理分野で 20 年以上の経験を誇る Commvault は 常に変化する お客様が実際に必要としている要件を満たすために バックアップとリカバリソリューションを強化し続けています Commvault ソフトウェアを用いることで 実際のディザスタリカバリシナリオの作成とテストを合理化 自動化し

InfiniDB最小推奨仕様ガイド

AIP2016R2 DC backup_restore

IRIS Cloud manager 2.indd

Microsoft Word - nvsi_100222jp_oracle_exadata.doc

まえがき 2011 年 11 月 1 日 ver1.0 [ 初版 ] 本手順書では vcenter サーバが管理する仮想コンピュータを Acronis Backup & Recovery 11 エージェント for ESX(i)( バーチャルアプライアンス ) を用いてバックアップする手順をご紹介し

Oracle Business Intelligence Suite

Transcription:

BIG DATA の保護 Hadoop およびビジネスデータレイク向けデータ保護ソリューション 要約 企業における Big Data 分析は急速に成熟しており 企業の革新的なビジネス上の成果を促進しています それと同時に ほとんどの場合 Big Data アプリケーションは 堅牢なデータ保護戦略がないまま本番稼動を迎えています Hadoop は 業界をリードする Big Data フレームワークです 企業は バックアップからディザスタリカバリまで 包括的なデータ保護のシナリオを Hadoop に求めています このホワイトペーパーでは Dell EMC Data Protection Suite ファミリーの一部である Dell EMC の Data Domain Boost for Enterprise Applications が Hadoop 向けの真のバックアップアプリケーション機能を業界で初めて提供し Hadoop 管理者が Data Domain 保護ストレージに対して独自のバックアップ / リカバリを実行するための CLI コマンドセットを提供する仕組みについて説明します また 他のデータレイクコンポーネントをバックアップする Isilon NetWorker ECS(Elastic Cloud Storage) のデータ保護オプションについても触れます 2017 年 5 月

この資料に記載される情報は 現状有姿 の条件で提供されています EMC Corporation は この資料に記載される情報に関する どのような内容についても表明保証条項を設けず 特に 商品性や特定の目的に対する適応性に対する黙示の保証はいたしません 本文書に記載される いかなる EMC ソフトウェアの使用 複製 頒布も 当該ソフトウェアライセンスが必要です EMC 2 EMC および EMC のロゴは EMC Corporation の登録商標または商標です その他のすべての商標は 各社の商標又は登録商標です Copyright 2016 EMC Corporation. All rights reserved.( 不許複製 禁無断転載 ) Published in the USA. 10/16 ホワイトペーパー H13932.4-J EMC Corporation は この資料に記載される情報が 発行日時点で正確であるとみなしています 予告なく変更される場合があります EMC は現在 Dell 企業グループの一社です 2

目次 エグゼクティブサマリー...5 課題... 5 ソリューションの概要... 5 はじめに...5 受講対象者... 5 バックグラウンド...5 データレイクとは... 5 Hadoop はほとんどのデータレイクの基盤... 6 Cloudera Enterprise... 6 Hortonworks Data Platform... 7 一般的な Hadoop 導入モデル... 8 データ保護は Big Data を企業に導入する際の障壁となる... 8 DELL EMC のデータ保護ソリューションによる HADOOP のバックアップ / リカバリ...9 Hadoop をバックアップする際に固有の考慮事項... 9 Dell EMC Data Domain 保護ストレージの概要情報... 9 Dell EMC DD Boost for Enterprise Applications... 9 DD Boost for Enterprise Apps による Hadoop バックアップの運用化... 11 Hadoop 向け DD Boost for Enterprise Apps のメリット... 12 DELL EMC のその他のデータレイク保護ソリューション...12 Dell EMC のその他のデータレイク保護ソリューションの概要... 12 Dell EMC のターゲットストレージオプション... 13 Dell EMC Isilon スケールアウト NAS ストレージの概要情報... 13 Dell EMC ECS(Elastic Cloud Storage) の概要情報... 13 ECS による Hadoop 分散コピーのデータ保護... 13 ECS による Hadoop 分散コピーのデータ保護を使用するメリット... 14 NetWorker Snapshot Management による Isilon スナップショットの管理の概要... 14 NetWorker Snapshot Management による Isilon から Data Domain へのスナップショットの管理... 14 NetWorker による Isilon から Data Domain へのスナップショットの管理を使用するメリット... 15 NetWorker による Isilon から Isilon へのスナップショットの管理... 15 NetWorker による Isilon 間のスナップショットの管理を使用するメリット... 16 3

NetWorker Snapshot Management による Isilon から ECS へのスナップショットの管理... 16 NetWorker による Isilon から ECS へのスナップショットの管理を使用するメリット... 17 お客様のメリット...17 まとめ...18 4

エグゼクティブサマリー 企業における Big Data 分析は急速に成熟しており 企業の革新的なビジネス上の成果を促進しています Big Data 分析が企業のビジネスの意思決定を促進し 新しいミッションクリティカルなアプリケーションになるのは時間の問題です 今日の Big Data のユースケースは急速に成熟していますが 堅牢なデータ保護戦略がないまま本番稼動を迎えるケースも少なくありません スナップショットとレプリケーションを活用する自社製のバックアップアプローチは 他のワークロードのための標準となるエンタープライズクラスの信頼性 可用性 保守性に関する期待に直面して限界を迎えています Hadoop は業界をリードする Big Data フレームワークであり そうしたソリューションを使用して環境内の他のアプリケーションを保護している企業は Hadoop 向けの真のバックアップ / ディザスタリカバリがないことをよく知っています 企業は バックアップからディザスタリカバリまでを網羅する包括的なデータ保護のシナリオを Hadoop に求めています Dell EMC は Dell EMC Data Protection Suite Family の一部である DD Boost for Enterprise Applications の課題においてさらなる進歩を遂げ Hadoop 向けの専用バックアップアプリケーションを提供します Hadoop 管理者は 市場をリードする Dell EMC の保護ストレージである Data Domain システムとのやり取りをネイティブ UI によって実行しながら Hadoop データをバックアップ / リカバリできるようになりました 課題 ネイティブの Hadoop には 真のポイントインタイムのバックアップ機能がありません スナップショット機能およびレプリケーション機能は提供されますが こうした機能ではソフトウェアエラー データ破損 人為的ミスの復旧には不十分です Hadoop にエンタープライズ対応バックアップ / ディザスタリカバリ機能が欠如していることは 企業で Hadoop を導入するうえでの大きな妨げになっています Big Data アプリケーションが主流になると ダウンタイムやデータロスによるビジネス上のリスクが大きくなります そのため企業は IT ワークロードの主流と同様の SLA に従って Hadoop データを保護したいと考えています ソリューションの概要 Dell EMC は Hadoop とその他の Big Data 環境に関連する課題に対処するため 効果的なデータ保護戦略を提供しています このホワイトペーパーでは Dell EMC Data Protection Suite ファミリーの一部としてライセンス供与される DD Boost for Enterprise Applications と Dell EMC ビジネスデータレイク向け保護ソリューションのその他のオプションについて説明します 含まれているオプションは次のとおりです Cloudera および Hortonworks ディストリビューションによって構築され コマンドラインツールと Cloudera Manager や Hortonworks Ambari などのネイティブ管理 UI を使用して管理される Hadoop システム ローカル DAS ストレージまたは Dell EMC Isilon などの共有ストレージシステムを使用して構築された Hadoop クラスタのサポート Hadoop ネイティブの構成要素の使用と Hadoop ファイルシステムへの統合 Hadoop および他の Big Data フレームワークをバックアップするための他の Dell EMC 製品 (NetWorker Isilon Data Domain 保護ストレージ ECS(Elastic Cloud Storage ) など ) はじめに このホワイトペーパーの目的は データレイク 特に Hadoop の保護が非常に重要になっている理由に関する背景情報を提供し Hadoop を保護するためのさまざまな Dell EMC 保護ソリューションについて説明することです このホワイトペーパーは データレイクの導入と Big Data フレームワークによって お客様がビジネスバリューと運用効率を高めるために役立ちます 受講対象者 このホワイトペーパーは IT および Hadoop 管理者 システムエンジニア そして Dell EMC とパートナー企業のプロフェッショナルサービスコミュニティのメンバーであり Dell EMC ビジネスデータレイク保護ソリューションについての理解を深め ソリューションの導入を検討されているパートナー様を対象としています バックグラウンド データレイクとは 簡単に言えば データレイクとは 広範なソースからデータを収集し そのデータを多くの分析アプリケーションに提供する単一のセントラルリポジトリです データレイクは構造化データ 半構造化データ 非構造化データの組み合わせで構成されます さまざまな分析アプリケーションは 5

この レイク ( 湖 ) のデータを利用することで データの再利用性と整合性を通じて効率性を高めています データレイクは EDW( エンタープライズデータウェアハウス ) から進化したものですが EDW とは違ってデータレイクには初期のスキーマは不要です そのため Hadoop や NoSQL データベースなど こうした新しいデータソースを分析できる新たな分析フレームワークをサポートすることができます この柔軟性により お客様はその他多くのデータソースを簡単に追加でき そのデータに基づいてより優れたビジネスの意思決定を行うことができます データレイクには 次の図 1 に示すように 従来型エンタープライズアプリケーションから 半構造化データと非構造化データの新しいソースまで さまざまなデータソースが集約されます 図 1: エンタープライズデータレイク HADOOP はほとんどのデータレイクの基盤 Hadoop は さまざまな規模と速度のデータソースからの大量のデータを管理するためのオープンソースのデータプラットフォームです Apache Software Foundation によって管理される Hadoop は 当初 大規模な Web 企業への急速な導入が見られました Cloudera や Hortonworks などの企業が商用サポートを提供するディストリビューションが出現したことで Hadoop は企業全体への導入が急速に進んでいます Hadoop は コモディティサーバのクラスタ全体で大規模なデータセットを分散処理する際の性能に優れています 特に 従来の構造化データソースに加えて 膨大な非構造化データや半構造化データを受信して処理し 分析するのが得意です このような点で品質が優れていることから Hadoop は分析プラットフォームとしての知名度を高めています 市場調査によると Hadoop は Big Data システムの約 60% に含まれており Big Data プラットフォームとしてもっとも普及しているものです 多くの Big Data システムには半構造化データと非構造化データも含まれており 多くの場合 Hadoop システム ( データレイク ) のデータを供給する処理と 必要に応じて処理結果をデータレイクに戻す処理も行います したがってほとんどのデータレイクの実装は Hadoop を中心に展開されています CLOUDERA ENTERPRISE CDH(Cloudera Enterprise) は 下の図 2 に示すように Apache Hadoop と他の多くのオープンソースプロジェクトがパッケージ化されたもので 企業で使用されている一般的な商用 Hadoop ディストリビューションの 1 つです クラスタのモニタリング 管理 操作は Cloudera Manager UI から実行します 6

図 2:Cloudera Enterprise HORTONWORKS DATA PLATFORM 次の図 3 に示す Hortonworks 分析プラットフォームも Apache Hadoop を基盤とした企業の間で普及しているものです バッチ処理 ストリーミング リアルタイムなど 広範な分析システムのための Apache Hadoop コンポーネントがパッケージ化されています モニタリング 管理 運用は Hortonworks Ambari UI から実行します Hortonworks は Hadoop へのセキュリティ機能の追加も重視しています 図 3:HDP(Hortonworks Data Platform) 7

一般的な HADOOP 導入モデル ディストリビューションに関係なく Hadoop を導入する一般的な方法は 3 つあります 次の図 4 にその方法を示します 図 4: 一般的な Hadoop 導入モデル データ保護は BIG DATA を企業に導入する際の障壁となる Big Data 分析が次のミッションクリティカルなエンタープライズアプリケーションになりつつある今 企業は Big Data システム 特に Hadoop のための堅牢なレベルのバックアップ リカバリ ディザスタリカバリソリューションを求めています しかしネイティブの Hadoop には 真のポイントインタイムのバックアップ機能がありません スナップショット機能およびレプリケーション機能は提供されますが こうした機能ではソフトウェアエラー データ破損 人為的ミスの復旧には不十分です 小規模で実験的なシステムでは スナップショット機能とレプリケーション機能があればバックアップと DR の戦略として十分です 企業がアプリケーションの本番稼動を口にするとき その企業にはアプリケーションの信頼性 アップタイム 復旧可能性に関する具体的な期待値があります そのような状況になると スナップショット機能とレプリケーション機能だけではデータ保護戦略として不十分です これらのアプローチの長所と短所を次にいくつか示します スナップショット レプリケーション メリット 迅速なリカバリ 人為的なミスからの保護 Hadoop への組み込み 別のシステム上のコピー Hadoop への組み込み デメリット ストレージ要求量が多い : 高価なプライマリストレージを消費 大規模環境の管理に時間がかかる プライマリストレージ上で稼動 ( 同じ障害ドメイン内 ) 同等のテクノロジーが必要 ソフトウェアのバグや人為的ミス データの破損からの防御にならない ポイントインタイムコピーでない バックアップ戦略の基本的な目的は次のとおりです 1. 別の異なるシステム上にオリジナルデータの真のポイントインタイムコピーを作成する 2. 既知の正常なポイントインタイムに戻すリカバリを実行できるようにする ご覧のように Hadoop の組み込み型プリミティブは 真のバックアップシナリオとは言えません 他の IT アプリケーション向けにバックアップ製品を使用している企業はこれを認識しており Hadoop 向けの真のバックアップ機能を求めています ビジネス上の意思決定のために分析がますます重要視され 依存度が高まっているので ダウンタイムやデータロスのコストは非常に大きくなる可能性があります そのため Hadoop にはバックアップ / リカバリ機能が必要です 8

Dell EMC のデータ保護ソリューションによる Hadoop のバックアップ / リカバリ HADOOP をバックアップする際に固有の考慮事項 Hadoop と従来のエンタープライズシステムのアーキテクチャには 次のような決定的な違いがあります Hadoop は コモディティサーバとストレージのクラスタを基盤とするスケールアウトシステムとして設計されており 個別コンポーネントの障害への耐性があります 多くのサーバ つまり ノード 間でデータを並列処理するように設計されています HDFS(Hadoop ファイルシステム ) も分散化されているという特性があります HDFS 内に格納されるファイルはブロックに分割され システム内のノード間に分散されます ほとんどの場合 Hadoop クラスタはサーバローカルディスク (DAS ストレージとも呼ばれる ) 上に導入されます Hadoop を導入するもう 1 つの方法として Dell EMC Isilon で HDFS とのネイティブ統合を利用するなど 共有 (NFS) ストレージシステムに導入する方法があります HDFS は 複数ノードの各ブロックを ( 通常は 3 回 ) レプリケートして冗長性を持たせることで 高可用性を提供します Hadoop システムは専任の管理者によって運用され 管理されます そのため ほとんどの場合 Hadoop のバックアップ / リカバリの責任者は バックアップやストレージの管理者ではなく Hadoop 管理者です したがって HDFS をバックアップするには HDFS とクラスタの管理ノード ( ネームノードとも呼ばれる ) にバックアップアプリケーションを統合する必要があります HDFS のデータボリュームは大規模になる可能性があるため バックアップウィンドウを適切なサイズにするには並列データ転送が必要です DELL EMC DATA DOMAIN 保護ストレージの概要情報 Dell EMC Data Domain 保護ストレージシステムは 業界をリードする速度と効率性によって最大 68 TB/ 時のスループットを実現し バックアップをより短時間で完了し バックアップウィンドウに対するプレッシャーを低減します Data Domain システムでは可変長重複排除を採用することにより ディスク要件を最小限に抑え あらかじめ重複排除済みのディスク上にデータを保存します このシステムにより バックアップ / アーカイブストレージの要件が平均 10 分の 1~30 分の 1 まで削減され ディスクはコストパフォーマンスに優れた テープの代替となります ディスク上のデータは長期間にわたってオンラインかつオンサイトで利用でき 高速で信頼性の高いリストアと回復が実現します この効率性により Data Domain システムは論理容量最大 150 PB のバックアップ / アーカイブデータを 1 つのシステムで保護できます DD Boost(Data Domain Boost) は バックアップパフォーマンスを最大 50% 向上させ 帯域幅の使用量を最大 99% 削減する機能です 自動リンク統合とパスフェールオーバーによってバックアップの成功率が向上するだけではなく 他にも NFS 経由のバックアップに比べていくつものメリットがあります Data Domain システムは 最終手段となるストレージとして設計されており 信頼性の高い方法で確実にデータをリカバリできるように構築されています Data Domain Data Invulnerability Architecture があらゆる DD OS(Data Domain Operating System) に組み込まれているため データ整合性の問題に対して業界でもっとも優れた防御策を提供します Data Domain システムの詳細については Dell EMC Data Domain データシート Data Domain Boost のビジネスバリュー Dell EMC Data Domain Data Invulnerability Architecture ホワイトペーパー を参照してください DELL EMC DD BOOST FOR ENTERPRISE APPLICATIONS DD Boost for Enterprise Applications は Dell EMC Data Protection Suite ファミリーのコンポーネントとして入手できます DD Boost for Enterprise Apps は DD Boost プロトコルを通じて Dell EMC Data Domain 保護ストレージに対するデータの真のポイントインタイムバックアップ / リカバリを提供し アプリケーションとの統合でアプリケーションエージェント ( Microsoft アプリケーションエージェント データベースアプリケーションエージェント Hadoop アプリケーションエージェント ) を使用します Hadoop アプリケーションエージェントは Big Data のワークロードを保護する場合に使用されます Data Domain システムのストレージ効率と信頼性に ネットワーク効率に優れた DD Boost プロトコルを組み合わせて活用している DD Boost for Enterprise Apps を利用することで Hadoop 管理者は CLI コマンドセットによって独自のバックアップ / リカバリを実行できます DD Boost for Enterprise Apps と Data Domain を基盤とする Hadoop 環境向けバックアップソリューションの技術的な特長は次のとおりです Data Domain システムに対する Hadoop データの真のポイントインタイムバックアップ / リカバリです ネイティブの管理 UI(Cloudera Manager と Hortonworks Ambari) に統合されています 9

HDFS の統合が 3 方向のストレージ冗長性を通じて透過的に動作し データの一貫性のあるコピー 1 つをバックアップします 分散型 DD Boost エージェントを生成して Data Domain システムへのデータ転送を並列処理するために 標準の Hadoop 構成要素 (MapReduce や DistCp など ) を使用します DD Boost の帯域幅効率性を備え 一意のデータのみをネットワーク経由で送信します 管理とツール使用がシンプルです 個別の DD Boost エージェントを導入または管理する必要はありません Hadoop 管理者が Hadoop クラスタ管理者コンソールからバックアップ / リカバリを実行します DD Boost for Enterprise Apps には バックアップ リカバリ ファイル検索 保存などのための Linux コマンドセットが用意されています 各 Hadoop 管理者は これらのコマンドをすぐに使用して他のワークフローに組み込むことできます Oozie を使用して バックアップ処理のスケジュールを詳細に設定したり 自動化したりできます 構成変更の監査ログ 次の表は Hadoop データ保護用の DD Boost for Enterprise Applications についての要点を示しています バックアップソース HDFS ディレクトリと HBase テーブル Cloudera Manager と Hortonworks Ambari これらのソース / ターゲット Data Domain システム間でバックアップポリシーを関連づけることができます バックアップターゲット サポートされるストレージ構成 1 つまたは複数の Data Domain システム DD Boost のライセンスを含む サーバローカル DAS( 直接接続型 ) ストレージ 共有 (NAS) ストレージシステム (Dell EMC Isilon など ) ユーザーインターフェイス サポートされるディストリビューション Linux コマンドラインアプリケーション Cloudera Enterprise 5.4 以降 Hortonworks Data Platform 2.2 以降 スケジュール設定と自動化 なし スケジュール設定は Oozie または cron を使用して実行可能 DD Boost for Enterprise Apps に必要な構成は最小限で Hadoop クラスタのネームノードにのみインストールされます Hadoop ファイルシステムと緊密に統合され Hadoop のスケールアウト分散処理アーキテクチャを活用し Hadoop から Data Domain システムへのデータ転送を並列処理します DD Boost は クライアント側重複排除を使用したネットワーク効率の高いデータ転送を提供し Data Domain は重複排除と圧縮を使用することでストレージ効率を高めます これらが一体となり Hadoop クラスタから Data Domain ターゲットシステムへ 大量のデータを移動するもっとも効率の良い方法を提供しています タスクを実行するには 分散ファイルコピーと HDFS/HBase スナップショットなど 内部標準の Hadoop 構成要素を活用します 下の図 5 は DD Boost for Enterprise Apps が導入されている Hadoop クラスタを示します 10

DD BOOST FOR ENTERPRISE APPS による HADOOP バックアップの運用化 プロビジョニングとセットアップのワークフローの概要 : Hadoop クラスタのネームノードにアプリケーションをインストールします 1 つまたは複数の Data Domain システム ( バックアップターゲット ) をプロビジョニングします 他のワークロードをバックアップしている既存の Data Domain システムで DD OS 6.0 以降が実行されていれば そのシステムに DD Boost for Enterprise Apps のバックアップを送ることができます DD Boost for Enterprise Apps のバックアップストリームを受信するには ターゲット Data Domain システムにストレージユニットが 1 つ以上プロビジョニングされている必要があります Kerberos 認証 (Hadoop クラスタで有効化されている場合 ) は この時点で有効にする必要があります バックアップとリストア処理のワークフローの概要 : バックアップ対象の HDFS ディレクトリまたは HBase テーブルを バックアップが格納されるターゲット Data Domain システムおよびストレージユニットに関連づけます これは バックアップのプロビジョニング手順です バックアップをプロビジョニングする際には 保存期間の特性も指定します 必要に応じて プライマリバックアップ Data Domain システムからレプリケートされたバックアップを受信するセカンダリ ( またはリモート ) Data Domain システムを指定できます プロビジョニングされると バックアップコマンドにより 選択した HDFS ディレクトリまたは HBase テーブルがプロビジョニングされた Data Domain システムとストレージユニットにバックアップされます バックアッププロセスでは作業の過程で HDFS スナップショットを使用するため バックアップ対象のディレクトリまたはテーブルでスナップショットが有効になっていることを確認します リストアが必要な場合 バックアップ一覧コマンドを実行するとターゲット Data Domain システム上のバックアップカタログが表示され リストアポイントを選択できます 目的の HDFS ディレクトリまたは HBase テーブルをリストアして HDFS に戻すには restore コマンドを使用します HDFS と統合されているため バックアップは実際には HDFS から Data Domain システムへの DistCp ジョブとして実行され リストアは逆方向の DistCp ジョブとして実行されます 重要な違いは このプロセスがバックグラウンドで透過的に実行され ユーザーはこのプロセスを一切管理する必要がないということです バックアップとリストアでは 重複排除 ダイナミックインターフェイスグループ TLS 暗号化という固有のメリットを備えた DD Boost を内部的に活用します Hadoop の保護のためのコマンドセットには以下があります Data Domain の構成 Data Domain システムの追加 / 削除 構成の参照 Data Domain システムへの接続テストバックアップのプロビ ソースの HDFS ディレクトリまたは HBase テーブルを Data Domain ジョニングターゲットに関連づける 保存期間の設定 セカンダリ ( オフサイト )Data Domain ターゲットシステムの設定バックアップ HDFS ディレクトリ /HBase テーブルのバックアップ マスター構成のバックアップリストア HDFS ディレクトリ /HBase テーブルのリストア 1 つのサブディレクトリをバックアップからリストア マスター構成のリストアファイルの検索 サブディレクトリ / ファイルのバックアップの検索 正規表現によるバックアップの検索 11

保存期間管理 絶対保存期間の変更 相対保存期間の変更有効期限 古いバックアップの使用期間の終了バックアップの一覧表示 単一バックアップの表示 バックアップの一覧表示 [ 範囲 / 日付フィルター ] 構成の一覧表示削除 単一バックアップの削除 バックアップの削除 [ 範囲 / 日付フィルター ] Kerberos Kerberos 認証の有効化 / 無効化 HADOOP 向け DD BOOST FOR ENTERPRISE APPS のメリット DD Boost for Enterprise Applications は Hadoop データ向けに真のバックアップ / リカバリソリューションを提供します バックアップ / リカバリの管理は Hadoop 管理者が Hadoop ネイティブツールを使用してクラスタ管理ツールから行います アプリケーション中心のバックアップワークフローであるため 習得に要する期間が短くて済みます 作業全体は スナップショットの管理やカスタムスクリプトによるレプリケーションの管理を行う場合のように煩雑ではなく バックアップアプリケーションを使用する場合のように簡単です HDFS と緊密に統合されているため Data Domain との間のデータバックアップ / リカバリでは 標準の Hadoop 構成要素と MapReduce Yarn DistCp などのツールを使用できます DD Boost は クライアント側重複排除を使用したネットワーク効率の高いデータ転送を提供し Data Domain は重複排除と圧縮を使用することでストレージ効率を高めます これらが一体となり Hadoop クラスタから Data Domain ターゲットシステムへ 大量のデータを移動するもっとも効率の良い方法を提供しています その一方で ユーザーには Boost エージェントまたは NFS マウントのいずれかを個別に管理して操作性を向上する責任はありません ノードごとにエージェントを個別に管理することは Hadoop などのスケールアウトシステム向けの拡張性に優れた戦略ではありません Dell EMC のその他のデータレイク保護ソリューション DELL EMC のその他のデータレイク保護ソリューションの概要 Dell EMC は 他にもビジネスデータレイクの保護のためにいくつかのソリューションを提供しています 共有ストレージ導入環境の Dell EMC NetWorker Snapshot Management によって管理される Isilon スナップショット および Dell EMC Elastic Cloud Storage です 次の図 6 はこれらのソリューションを示したものです これらについては このホワイトペーパーの後半で詳しく説明します 図 6:Dell EMC のその他のビジネスデータレイク保護ソリューション 12

DELL EMC のターゲットストレージオプション 次のいくつかの段落で詳しく説明するように 図 6 に示す Dell EMC のビジネスデータレイク保護ソリューションでは アクセス性 ストレージ効率 容量のニーズなどさまざまな要因に応じて Dell EMC Data Domain Dell EMC Isilon または Dell EMC ECS(Elastic Cloud Storage) をターゲットストレージとして活用できます Data Domain システムは 重複排除に適しているワークロード ( データベース ファイルなど ) に最適であり 業界をリードする可変長重複排除と圧縮によってストレージコストを削減します Isilon は重複排除に適していないデータセット ( ビデオ 音声など ) に最適であり 単一システムから効率的でコストパフォーマンスの高いストレージを提供します ECS は クラウド ( エクサバイト ) 規模のオブジェクトワークロードに適しています DELL EMC ISILON スケールアウト NAS ストレージの概要情報 Dell EMC Isilon スケールアウトストレージソリューションは ストレージの管理ではなくデータの管理に集中したい企業向けのソリューションです Isilon のストレージシステムはパワフルで しかもインストールと管理が容易で ほぼあらゆる規模に拡張できます また 従来のエンタープライズストレージとは異なり Isilon のソリューションのシンプルさは 追加されるストレージ容量 必要とされるパフォーマンス 将来のビジネスニーズがどう変化しても変わりません Isilon は企業のお客様にストレージについて違う見方をして頂くことで よりシンプルで優れた方法 つまり Dell EMC Isilon があることをお分かりになれると考えています 画期的な Isilon OneFS オペレーティングシステム 高パフォーマンスの業界標準ハードウェア 強力なデータおよびストレージ管理ソフトウェアを組み合わせた Isilon の革新的なストレージソリューションの完全なポートフォリオは ミッションクリティカルなアプリケーション ワークフロー プロセスを最適化してお客様のビジネスバリューを高めます Isilon ストレージを導入した世界中の企業や調査研究機関は 急増する大量のデータを 拡張性とコストパフォーマンスに優れた方法で簡単に管理しています すべての Isilon ソリューションは ミッションクリティカルなデータの増加に合わせてストレージをシームレスに拡張しながら ワークフローの生産性を高め 設備投資と運用コストを削減することができるように設計されています Isilon の詳細については Dell EMC Isilon データシート を参照してください DELL EMC ECS(ELASTIC CLOUD STORAGE) の概要情報 お客様は 今日のハイパースケールな拡張に対応するための より効率的なアーキテクチャを探し求めています Dell EMC ViPR を搭載した新しい ECS (Elastic Cloud Storage) アプライアンスは 最新のアプリケーションの要件に対応する 包括的なハイパースケールストレージインフラストラクチャを実現します どのような規模の組織でも ECS アプライアンスを使用することで 競争優位性が高く 拡張性に優れたクラウドストレージサービスを提供できるようになります ECS アプライアンスは パブリッククラウドサービスのコストプロファイル シンプルさ 拡張性とともに Dell EMC ならではの信頼性とサポートをあらゆるユーザーにもたらします ECS アプライアンスによって 次のことを実現できます データサイエンティスト :Big Data イニシアティブを促進 クラウドプロバイダー : 規模に応じた競争力のあるクラウドストレージサービスを実現 企業およびソフトウェア開発者 : 開発を加速 ECS アプライアンスを使用すると ViPR の機能と低コストで高密度のスケールアウトコモディティハードウェアプラットフォームを組み合わせることで あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます ECS アプライアンスは 段階的に導入して拡張できる多数のフォームファクタで使用できるため お客様はそれぞれの当面のニーズと予定される拡張に合った規模を選択できます その結果 アプリケーションとアクセスのニーズに基づいてソリューションを最適化でき 必要な柔軟性と管理性を得られます Elastic Cloud Storage の詳細については Dell EMC ECS データシート を参照してください ECS による HADOOP 分散コピーのデータ保護 このセクションでは HDFS(Hadoop File System) に組み込まれたネイティブの DistCp( 分散コピー ) ユーティリティを活用して 統合されたコンピューティングとストレージのデータレイクをオンプレミスの Elastic Cloud Storage アプライアンスにバックアップ / リストアする方法についての詳細を説明します このソリューションのターゲットストレージとして ECS を使用することは 主に次の 3 つの要因を考慮してお客様が選択します 1. Data Domain システムが提供する可変長重複排除と圧縮では データのストレージコストを大幅に削減することはできないのをすでに承知しているかどうか 2. ECS が提供するハイパースケールが必要かどうか ( エクサバイト ) 3. オブジェクト /HDFS へのアクセスが必要かどうか 13

DistCp( 分散コピー ) は すべての Hadoop ディストリビューションおよびバージョンに付属する Hadoop のディレクトリ全体をコピーするために使用できる標準ツールです DistCp は MapReduce ジョブとして実行されます 必要に応じてシステムを最大限に活用し ファイルのコピーを並列で実行します 帯域幅を制限して他のタスクへの影響を制御するオプションもあります このソリューションは 2 つの方法で使用できます 1. 1 つ目の方法では Hadoop アプリケーションから HDFS のスナップショットを取得し DistCp を使用して そのスナップショットをターゲットストレージに移動します 2. 2 つ目の方法では ターゲットストレージに対して直接 DistCp を使用します 最初のアプローチのメリットは スナップショットが終了した後にアプリケーションが解放されることです このデータレイク保護シナリオでは Hadoop 管理者は DistCp を使用し Ethernet 経由で NFS を使用してオンプレミスの ECS アプライアンスへのフルバックアップを実行します ECS から従来の Hadoop インフラストラクチャに DistCp バックアップをリストアする標準的な方法では DistCp を逆方向で実行します これを行うには ソースとターゲットのパスをスワップするだけです 一部または全体のリストアを実行でき リストア先には元の場所または別の場所を指定することができます お客様は ディザスタリカバリの保護を強化するために 2 番目のサイトにインストールされた別個の ECS アプライアンスで ECS レプリケーションを活用することを選択できます ディザスタリカバリのため 2 番目のサイトの ECS アプライアンスから DistCp のリストアを実行できます ECS による HADOOP 分散コピーのデータ保護を使用するメリット お客様は 分散コピーデータレイクを Elastic Cloud Storage で保護することで 非常に重要なメリットを達成できます まずもっとも重要なことは このビジネスデータレイク保護ソリューションが Hadoop をデータロスや破損から守るエンタープライズクラスのデータ保護を提供するということです また このソリューションは Hadoop 管理者に対して データレイクの保護に関する直接的な可視性と制御も提供します ECS アプライアンスを使用すると ViPR の機能と低コストで高密度のスケールアウトコモディティハードウェアプラットフォームを組み合わせることで あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます ECS アプライアンスは段階的に導入および拡張できるので 差し迫ったニーズや成長予測に応じた適切なサイズを選択できます ECS では アプリケーション ストレージの要件 アクセスに関するニーズに基づいてデータレイク保護ソリューションを最適化できるので 必要な柔軟性と制御を確保することができます お客様がすでに他のニーズのために Elastic Cloud Storage を使用している場合は データレイクを保護するために同じプロセスと専門技術を活用できます NETWORKER SNAPSHOT MANAGEMENT による ISILON スナップショットの管理の概要 NetWorker Snapshot Management による Isilon スナップショットの管理 ( 図 6 の右側を参照 ) は コンピューティングとストレージが分離され HDFS レイヤーが共有ストレージ上で実行されているデータレイク導入環境に適用されます 共有ストレージが使用されているため お客様はストレージレイヤーに組み込まれたデータ管理機能をすべて使用することができます つまり お客様は NetWorker によって管理される Isilon スナップショット機能を活用することができ Data Domain 保護ストレージへのロールオーバーを行うこともできます ロールオーバーとは スナップショットからセカンダリストレージデバイスへのバックアップを NDMP 経由で実行することです これは通常 データの長期保存が必要な場合に行います NETWORKER SNAPSHOT MANAGEMENT による ISILON から DATA DOMAIN へのスナップショットの管理 このセクションでは コンピューティングとストレージが分離され HDFS レイヤーが Isilon ストレージで実行されているデータレイク導入環境における EMC NetWorker スナップショット管理の活用についての詳細を説明します 共有 Isilon ストレージが使用されているため お客様はストレージレイヤーに組み込まれた Isilon データ管理機能をすべて使用することができます このデータレイク保護シナリオでは NetWorker が Isilon スナップショットを管理し スナップショットはオンプレミスの Data Domain ストレージシステムにロールオーバーされます このソリューションのターゲットストレージとして Data Domain システムを使用することは 主に次の 3 つの要因を考慮してお客様が選択します 1. 自社のデータに対して Data Domain の可変長重複排除と圧縮ストレージのメリットがあるか 2. Data Domain ストレージの拡張性がニーズに合っているか ( テラバイト ) 3. NFS はアクセス性の要件を満たしているか 14

NetWorker 管理者は 1 つのポリシーを定義してデータ保護プロセスを自動化することができます このポリシーには データレイクの Isilon システム上でスナップショットを開始し Ethernet 経由で NDMP テープサーバを使用して Isilon のスナップショットをオンプレミス Data Domain システム上へロールオーバーする処理が含まれます Data Domain システムはスナップショットデータを取得し 可変長重複排除と圧縮を実行します NetWorker は すべてのバックアップ スナップショット クローンのカタログを保持しており このデータレイク保護ソリューションのリストアをシンプルで分かりやすくしています NetWorker では スナップショットの保存期間を管理することもできます リストアを実行する場合 NetWorker 管理者は 最初のスナップショットからすばやく簡単にリストアできます あるいは Data Domain システムにロールオーバーされた NDMP バックアップセーブセットのいずれかを選択し Ethernet 経由の NDMP を使用して プライマリ Isilon システムにリストアします スナップショットからリストアする場合は RTO が大幅に短縮されるというメリットがあります また Data Domain 上のバックアップからリカバリする場合は 長期間の RPO にすばやくアクセスできます NetWorker は一部または全体のリストアを実行でき リストア先には元の場所または同じデバイス上の別の場所を指定することができます お客様は ディザスタリカバリの保護を強化するために 2 番目のサイトにインストールされた別個の Data Domain システムで NetWorker が管理するレプリケーションを活用することを選択できます NetWorker は ディザスタリカバリのために 2 番目のサイトの Data Domain システムからリストアを実行することができます NETWORKER による ISILON から DATA DOMAIN へのスナップショットの管理を使用するメリット お客様は NetWorker で Isilon のスナップショットを管理して Data Domain システムでデータレイクを保護することで 重要なメリットを達成できます まずもっとも重要なことは このビジネスデータレイク保護ソリューションが Hadoop をデータロスや破損から守るエンタープライズクラスのデータ保護を提供し 優れた RTO を実現するということです NetWorker スナップショット管理は アレイのスナップショットと Data Domain へのロールオーバーを自動化することで データ保護プロセスを簡素化します このデータ保護ソリューションは 最初のスナップショットからのリカバリや Data Domain 保護ストレージ上のセーブセットからのロールオーバーによるリカバリなど 複数のリカバリオプションを提供します Data Domain のデータ非脆弱性アーキテクチャは 必要なときにデータレイクからデータをリカバリできることと データが信頼できることを保証するクラス最高のデータ保護を提供します Data Domain システムは 可変長重複排除と圧縮によってストレージ効率を高めており 通常はストレージ要件が 10 分の 1~30 分の 1 まで削減されます また Data Domain システムは非常に高速で 最大 68 TB/ 時の速度でデータを取得でき データレイクの保護バックアップを完了するまでに要する時間が最小限に抑えられます お客様がすでにデータ保護に関する他のニーズのために NetWorker を使用している場合は データレイクを保護するために同じプロセスと専門技術を活用できます 最後に NetWorker を活用して帯域幅効率に優れた Data Domain レプリケーションを管理し ディザスタリカバリオプションのために用意した 2 番目のサイトの Data Domain システムへレプリケートすることができます NETWORKER による ISILON から ISILON へのスナップショットの管理 このセクションでは コンピューティングとストレージが分離され HDFS レイヤーが Isilon ストレージで実行されているデータレイク導入環境における Dell EMC NetWorker スナップショット管理の活用についての詳細を説明します 共有 Isilon ストレージが使用されているため お客様はストレージレイヤーに組み込まれた Isilon データ管理機能をすべて使用することができます このデータレイク保護シナリオでは NetWorker が Isilon スナップショットを管理し スナップショットは 2 番目のオンプレミス Isilon ストレージシステムにレプリケートされます このソリューションで Isilon のスナップショットとレプリケーションによる保護を使用することは 主に次の 4 つの要因を考慮してお客様が選択します 1. Data Domain システムが提供する可変長重複排除と圧縮では データのストレージコストを大幅に削減することはできないのをすでに承知しているかどうか 2. 保護が必要なデータ量を割り当てられたバックアップウィンドウ内で保護可能かどうか 3. Isilon ストレージの拡張性がニーズに合っているか ( ペタバイト ) 4. お客様の組織には NFS/SMB(CIFS)/HDFS のアクセス性の要件があるか NetWorker 管理者は 1 つのポリシーを定義してデータ保護プロセスを自動化することができます このポリシーには データレイクの Isilon システム上でスナップショットを開始し Isilon SyncIQ を使用して Isilon のスナップショットを 2 番目のオンプレミス Isilon システム上へ自動制御によってレプリケートする処理が含まれます 2 番目の Isilon システムには NetWorker と Isilon SyncIQ によってレプリケートされているスナップショットデータのコピーが保存されます NetWorker は すべてのバックアップ スナップショット クローンのカタログを保持しており このデータレイク保護ソリューションのリストアをシンプルで分かりやすくしています NetWorker では スナップショットの保存期間を管理することもできます リストアを実行する場合 NetWorker 管理者は 最初のスナップショットからすばやく簡単にリストアできます あるいは ターゲット Isilon システムにレプリケートされているスナップショッ 15

トのいずれかを選択して プライマリ Isilon システムにリストアします NetWorker は一部または全体のリストアを実行でき リストア先には元の場所または同じデバイス上の別の場所を指定することができます リモートレプリケーションのシナリオでは リモートサイトの Data Domain システムまたは他のバックアップターゲットへの NDMP のロールオーバーを NetWorker がさらに調整および管理でき 本番環境の Isilon システムからバックアップを完全にオフロードすることができます これにより 毎日の運用に影響を与えることなく 大規模なデータセットを毎週または四半期ごとにバックアップできます NETWORKER による ISILON 間のスナップショットの管理を使用するメリット お客様は NetWorker で Isilon のスナップショットを管理して Isilon ストレージでデータレイクを保護することで 重要なメリットを達成できます まずもっとも重要なことは このビジネスデータレイク保護ソリューションが Hadoop をデータロスや破損から守るエンタープライズクラスのデータ保護を提供し 優れた RTO を実現するということです NetWorker スナップショット管理は 最初のスナップショットとセカンダリ Isilon へのレプリケーションプロセスを自動化することで データ保護プロセスを簡素化します このデータ保護ソリューションは ソース Isilon システム上の最初のスナップショットからのリカバリや 2 番目の Isilon システム上のレプリケートされたスナップショットからのリカバリなど 複数のリカバリオプションを提供します さらに Data Domain システムへロールオーバーする機能により長期保存が可能となり データの破損や災害からの保護を強化することができます スナップショット レプリケーション ロールオーバーのプロセスはすべて 1 つのポリシーによって制御できます Isilon は Hadoop および他の Big Data アプリケーション用の理想的なプラットフォームです 消失訂正符号を使用してデータを保護するため 従来の HDFS の 33% のストレージ効率とは対照的に 80% 超のストレージ効率が実現します Isilon には ノードタイプのクラスが複数あります これにより 特定のワークロード向けにさまざまな Isilon 階層を最適化できます お客様がすでに他のニーズのために Isilon または NetWorker を使用している場合は データレイク保護ソリューション向けに同じプロセスと専門技術を活用できます NetWorker スナップショット管理は スナップショットとバックアップの両方で共通のワークフローとユーザーインターフェイスを使用する NetWorker の統合機能です 最後に NetWorker を活用して Isilon レプリケーションを管理し ディザスタリカバリオプションのために用意した 2 番目のサイトのもう 1 つの Isilon システムへレプリケートすることができます NETWORKER SNAPSHOT MANAGEMENT による ISILON から ECS へのスナップショットの管理 このセクションでは コンピューティングとストレージが分離され HDFS レイヤーが Isilon ストレージで実行されているデータレイク導入環境における Dell EMC NetWorker スナップショット管理の活用についての詳細を説明します 共有 Isilon ストレージが使用されているため お客様はストレージレイヤーに組み込まれた Isilon データ管理機能をすべて使用することができます このデータレイク保護シナリオでは NetWorker が Isilon スナップショットを管理し スナップショットはオンプレミスの ECS(Elastic Cloud Storage) アプライアンスにロールオーバーされます このソリューションのターゲットストレージとして ECS を使用することは 主に次の 3 つの要因を考慮してお客様が選択します 1. Data Domain システムが提供する可変長重複排除と圧縮では データのストレージコストを大幅に削減することはできないのをすでに承知しているかどうか 2. ECS が提供するハイパースケールが必要かどうか ( エクサバイト ) 3. オブジェクト /HDFS へのアクセスが必要かどうか NetWorker 管理者は 1 つのポリシーを定義してデータ保護プロセスを自動化することができます このポリシーには データレイクの Isilon システム上でスナップショットを開始し Ethernet 経由で ECS API を使用して Isilon のスナップショットを 2 番目のオンプレミス ECS アプライアンス上へロールオーバーする処理が含まれます NetWorker は すべてのバックアップ スナップショット クローンのカタログを保持しており このデータレイク保護ソリューションのリストアをシンプルで分かりやすくしています NetWorker では スナップショットの保存期間を管理することもできます リストアを実行する場合 NetWorker 管理者は 最初のスナップショットから簡単にリストアできます あるいは ECS システムにロールオーバーされたセーブセットのいずれかを選択し Ethernet 経由の ECS API を使用して プライマリ Isilon システムにリストアします NetWorker は一部または全体のリストアを実行でき リストア先には元の場所または同じデバイス上の別の場所を指定することができます お客様は ディザスタリカバリの保護を強化するために 2 番目のサイトにインストールされた別個の ECS アプライアンスで NetWorker が管理するレプリケーションを活用することを選択できます ディザスタリカバリのため 2 番目のサイトの ECS アプライアンスから NetWorker のリストアを実行できます 16

NETWORKER による ISILON から ECS へのスナップショットの管理を使用するメリット お客様は NetWorker で Isilon のスナップショットを管理して Elastic Cloud Storage ソリューションでデータレイクを保護することで 重要なメリットを達成できます まずもっとも重要なことは このビジネスデータレイク保護ソリューションが Hadoop をデータロスや破損から守るエンタープライズクラスのデータ保護を提供し 優れた RTO を実現するということです NetWorker スナップショット管理は 最初のスナップショットと ECS へのロールオーバーを自動化することで データ保護プロセスを簡素化します このデータ保護ソリューションは 最初のスナップショットからのリカバリや ECS ストレージ上のセーブセットからのロールオーバーによるリカバリなど 複数のリカバリオプションを提供します ECS アプライアンスを使用すると ViPR の機能と低コストで高密度のスケールアウトコモディティハードウェアプラットフォームを組み合わせることで あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます ECS アプライアンスは段階的に導入および拡張できるので 差し迫ったニーズや成長予測に応じた適切なサイズを選択できます ECS では アプリケーション ストレージの要件 アクセスに関するニーズに基づいてデータレイク保護ソリューションを最適化できるので 必要な柔軟性と制御を確保することができます お客様がすでに他のニーズのために NetWorker または Elastic Cloud Storage を使用している場合は データレイクを保護するために同じプロセスと専門技術を活用できます お客様のメリット 前述のように このホワイトペーパーで示されているすべてのビジネスデータレイク保護ソリューションは Hadoop をデータロスや破損から守る ニーズの高いエンタープライズクラスのデータ保護を提供します Dell EMC は お客様のデータレイクの大きさ データタイプ アクセス性の要件 ストレージとデータ保護に関する現在の専門技術に応じて お客様が最良のデータレイク保護ソリューションを選ぶための選択肢を提供します このホワイトペーパーで説明している 保護ストレージターゲットとして Data Domain システムを活用するビジネスデータレイク保護ソリューションのオプションは Data Domain 固有の追加のメリットをもたらします Data Domain のデータ非脆弱性アーキテクチャは 必要なときにデータレイクからデータをリカバリできることと データが信頼できることを保証する究極のデータ保護を提供します Data Domain システムは 可変長重複排除と圧縮によってストレージ効率を高めており 通常はストレージ要件が 10 分の 1~30 分の 1 まで削減されます また Data Domain システムは非常に高速で 最大 68 TB/ 時の速度でデータを取得でき データレイクの保護バックアップを完了するまでに要する時間が最小限に抑えられます お客様がすでにデータ保護に関する他のニーズのために Data Domain を使用している場合は データレイクを保護するために同じプロセスと専門技術を活用できます Dell EMC Data Protection Suite ファミリーの一部である DD Boost for Enterprise Applications は Hadoop のデータ保護を提供します DD Boost には NFS よりも優れたバックアップパフォーマンス 帯域幅要件の削減 ロードバランシングと信頼性の向上という特徴があり Data Domain は DD Boost のこれらの機能を活用して Hadoop のお客様にさらなるメリットを提供します その際に DD Boost for Enterprise Apps は Hadoop クラスタの管理と Hadoop ファイルシステムへの統合と Hadoop ネイティブの構成要素の活用により 優れたユーザーエクスペリエンスを提供します このホワイトペーパーで説明している ストレージターゲットとして Isilon システムを活用するビジネスデータレイク保護ソリューションのオプションは お客様に固有のメリットを独自に提供します Isilon は消失訂正符号を使用してデータを保護するため 従来の HDFS の 33% のストレージ効率とは対照的に 80% 超のストレージ効率が実現します Isilon には ノードタイプのクラスが複数あるため 特定のワークロード向けにさまざまな Isilon 階層を最適化できます お客様の組織ですでに他のニーズのために Isilon を使用している場合は データレイク保護ソリューションのこれらのオプション向けに同じプロセスと専門技術を活用できます このホワイトペーパーで説明している ストレージターゲットとして ECS(Elastic Cloud Storage) を活用するビジネスデータレイク保護ソリューションのオプションは 拡張性とアクセス性のメリットをもたらします ECS アプライアンスを使用すると ViPR の機能と低コストで高密度のスケールアウトコモディティハードウェアプラットフォームを組み合わせることで あらゆる規模の組織向けにハイパースケールなストレージとクラウドの経済性を実現できます ECS では アプリケーション ストレージの要件 アクセスに関するニーズに基づいてデータレイク保護ソリューションを最適化できるので 必要な柔軟性と制御を確保することができます 最後に お客様の組織ですでに他のニーズのために Elastic Cloud Storage を使用している場合は データレイクを保護するために同じプロセスと専門技術を活用できます このホワイトペーパーで説明している NetWorker を活用するビジネスデータレイク保護ソリューションは 使用するストレージオプションに関係なくいくつかの追加のメリットをもたらします NetWorker 管理者は データ保護のポリシーを定義してすべてのスナップショットおよびロールオーバー処理を自動化し 日々の運用を簡単かつ効果的にすることができます NetWorker では バックアップ スナップショット ロールオーバーの保存に対する制御も提供されるので 手動の保存作業が最小限に抑えられます さらに NetWorker ソリューションのオプションには ロールオーバーセーブセットのほかにも Isilon スナップショットからリカバリする機能が含まれているので 優れた RTO と最大限の柔軟性が実現します 17

まとめ このホワイトペーパーでは Big Data のユースケースが十分に発達してきたことを明確に示し データレイクの定義を提供するとともに お客様が本格的なエンタープライズクラスのデータレイク保護ソリューションを求めている理由を説明してきました Dell EMC は Big Data ソリューションのソートリーダーして Hadoop とその他のデータレイクを保護するためのデータ保護戦略と さまざまなデータ保護ソリューションオプションについて このホワイトペーパーで説明しました Dell EMC はお客様に選択肢を提供して どのソリューションアプローチとどのターゲットストレージオプションが拡張性とアクセス性に関するお客様のニーズを満たし すでに存在する可能性のある既存の社内ストレージやデータ保護に関する専門技術を活用できるかどうかの選択をお客様に委ねています Dell EMC Big Data Hadoop ビジネスデータレイクソリューションの詳細については Dell.com の Big Data ソリューションのページと 以下の関連資料をご確認ください Dell EMC Data Domain Operating System データシート Dell EMC Isilon スケールアウトストレージ製品ファミリーデータシート Dell EMC ECS Appliance, powered by ViPR データシート Dell EMC Data Domain データ非脆弱性アーキテクチャホワイトペーパー Dell EMC NetWorker データシート Data Domain Boost のビジネスバリュー 18