Microsoft Word - EMC Isilon HDFSサポートホワイトペーパー2012Feb.doc

ホワイトペーパー EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築要約このホワイトペーパーでは EMC Isilon スケールアウト NAS によってエンタープライズが Hadoop データ分析ワークフローを導入する方法について詳細に説明しますここではコアアーキテクチャの関連コンポーネントを紹介するとともに進化するビッグデータの分析ワークフローのストレージ要件を満たすうえでシンプルさを保ちつつ信頼できるビジネスの洞察を迅速かつ効率的に得る Isilon と Hadoop の併用の利点を明らかにしていきます 2012 年 2 月

Copyright 2012 EMC Corporation. All Rights Reserved. EMC Corporation はこの資料に記載される情報が発行日時点で正確であるとみなしていますまた情報は予告なく変更されることがありますこの資料に記載される情報は現状有姿の条件で提供されています EMC Corporation はこの資料に記載される情報に関するどのような内容についても表明保証条項を設けず特に商品性や特定の目的に対する適応性に対する黙示の保証はいたしませんこのドキュメントで説明されているいかなる EMC ソフトウェアの使用コピー配布に関しても適切なソフトウェアライセンスが必要です最新の EMC 製品名については EMC.com で EMC Corporation の商標を参照してください VMware は米国およびその他の国における VMware, Inc. の登録商標または商標です他のすべての名称ならびに製品についての商標はそれぞれの所有者の商標または登録商標です Part Number h10528 EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 2

目次はじめに... 4 Hadoop ソフトウェアの概要... 4 Hadoop MapReduce... 5 Hadoop 分散ファイルシステム... 5 Hadoop のディストリビューション... 6 Hadoop エコシステム... 6 Hadoop のアーキテクチャ... 7 EMC Isilon OneFS の概要... 8 Isilon のアーキテクチャ... 8 OneFS オプションモジュール... 9 Isilon の Hadoop 接続... 10 シンプル... 11 効率性... 12 柔軟性... 13 信頼性... 14 ファイルシステムジャーナル... 15 ノード / デバイス障害に対するプロアクティブな対応... 15 Isilon のデータ整合性... 16 プロトコルのチェックサム... 16 ダイナミックセクタ修復... 16 Mediascan... 16 IntegrityScan... 16 データの高可用性... 17 ビジネスの継続性... 17 まとめ... 21 Isilon について... 21 EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 3

はじめに企業は急増する大量データビッグデータの保存や管理に始終対応を迫られていますデータの計算能力の拡大に合わせてディスクドライブの容量も拡大を続けていますがビッグデータを分析して貴重な洞察を得るためのツールはこのようなデータの急増に追いついていません既存の分析アーキテクチャは高価で処理速度が遅すぎることが知られており維持や管理がきわめて難しいことも明らかになっています Hadoop は企業が保有するデータセットから貴重な洞察を短時間で得られるように設計されているオープンソースの革新的な大規模データ分析エンジンです MapReduce および HDFS(Hadoop Distributed File System) という 2 つの主要コンポーネントで構成されています MapReduce は複数のノード上でジョブを並列処理し大規模データセットから結果を高速で取得する分散タスク処理フレームワークですまた HDFS は Hadoop 計算ファームが分析に必要な入力データすべてと MapReduce ジョブによって生成される出力データのすべてを格納する分散ファイルシステムです Hadoop はスケールアウトという原則に基づいて構築されています汎用ハードウェアのクラスタ上で動作するインテリジェントなソフトウェアを使用して貴重な洞察を迅速にかつ低コストで提供します Hadoop がビッグデータの分析に最適なのはこの分散並列型のタスク処理エンジンのおかげですさまざまなビッグデータのストレージニーズに対し企業は今まで同様 EMC Isilon スケールアウト NAS(Network Attached Storage) に期待を寄せています OneFS は Isilon スケールアウト NAS のオペレーティングシステムでありクラスタを形成する複数ノード上で実行される分散ファイルシステムでもあります OneFS はハードウェアをスケールアウトするという観点に加えて管理もスケールアウトできるように設計されており大規模なシステムであっても従来のストレージシステムの管理に必要な人員と同程度の人員で管理できます OneFS には自己修復および自己管理のための機能が組み込まれておりストレージ管理の複雑さを解消し管理負荷を劇的に軽減できるようになっていますまた OneFS は並列処理するように設計されているため複数のハードウェアユニットに分散されて主要なシステムサービスが実行されますその結果 OneFS はインフラストラクチャの拡張にとともにすべての次元で仮想的に拡張できるようになっており今日のようにデータが急増したりワークフローが変化する状況下においても同じように機能し続けます柔軟性に富みインフラストラクチャやデータ容量の需要の変化だけでなく進化するワークフローにも適応可能でシンプルでかつ使いやすい EMC Isilon スケールアウト NAS はビッグデータ分析ワークフローソリューションにおける Hadoop 向けストレージとしてきわめて魅力的な選択肢となります Hadoop ソフトウェアの概要 Hadoop は企業が保有するデータセットから企業活動に結び付く貴重な洞察を短時間で得られるように設計された革新的なオープンソースのビッグデータ分析エンジンです Hadoop の主要コンポーネントは以下のとおりです EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 4

Hadoop MapReduce: 計算ノードで構成されるクラスタ上の大規模データセットに対してジョブを並列処理し結果を高速で取得する分散タスク処理フレームワークです Hadoop HDFS(Hadoop Distributed File System): Hadoop による分析に必要なすべてのデータを格納する分散ファイルシステムで Hadoop 計算ファームによって使用されます MapReduce はもともとコンピューティングパラダイムとして Google によって開発されたものですが Hadoop は Yahoo により MapReduce の実装として構築されオープンソースとして公開されています Hadoop MapReduce Hadoop MapReduce はコード作成が容易なアプリケーション用のソフトウェアフレームワークで汎用の計算ノードで構成される大規模クラスタ上で大量データを並列処理します MapReduce フレームワークの構成要素は以下のとおりです JobTracker( ジョブトラッカ ): ジョブやコンポーネントタスクのスケジュール設定モニタ管理をするマスターでクラスタノードごとに 1 つ存在します TaskTracker( タスクトラッカ ): JobTracker に指示されたジョブに必要なタスクコンポーネントを実行します各スレーブクラスタノードごとに 1 つ存在します MapReduce ジョブ ( クエリ ) は複数のマップタスクで構成されておりクラスタ全体で完全に並列分散処理されます MapReduce はマップの出力をソートしますこの出力はタスクを減らすために入力として使用されますジョブの入力と出力は両方とも HDFS を使用して計算ノードのクラスタ全体にわたって格納されます MapReduce はタスクのスケジューリングやモニタリングを行い失敗したタスクの再実行を管理します Hadoop クラスタでは一般に MapReduce 計算ノードと HDFS(HDFS ストレージ層 ) は同じノード上に存在します MapReduce はこの構成によりデータがすでに存在するノード上のタスクを効率的にスケジューリングすることでクラスタ内にあるデータの移動にかかるネットワークのボトルネックを回避しますこのような仕組みで計算層は HDFS 層上のデータの存在場所を整理して重要な洞察を効率的に引き出します Hadoop は Java で記述する必要がありますが MapReduce アプリケーションは Java 以外の言語でも記述可能です MapReduce アプリケーションは特定のジョブに関して Hadoop Streaming インターフェイスを使用して実行可能ファイルを mapper や reducer に指定します Hadoop 分散ファイルシステム HDFS はクラスタ内の複数のノードにまたがるブロックベースのファイルシステムでありファイルとしてユーザデータを格納しますユーザやアプリケーションがファイルやディレクトリを操作 ( 作成名前変更移動削除 ) できるように従来の階層の形でファイルを表示しますまた MapReduce フレームワークでアプリケーションを実行する際に使用できるように Streaming インターフェイスも表します HDFS はハードリンクやソフトリンクの設定をサポートしておらず特定のブロックを検索 EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 5

したりファイルを上書きすることはできませんまたプログラムによるアクセスが必要なためファイルシステムとしてマウントすることもできません HDFS の通信はすべて TCP/IP プロトコル上に階層化されます HDFS の主要コンポーネントは以下のとおりです NameNode( ネームノード ): 単一のマスターメタデータサーバで各ファイルファイルの場所ファイル内の全ブロックおよびそれらが存在する DataNodes のインメモリマップを所有します DataNode( データノード ): 読み取り / 書き込み要求を提供し NameNode の指示によりブロックの作成削除複製を行います各スレーブクラスタノードに 1 つ存在します HDFS は MapReduce ジョブの実行前にすべてのデータが存在するストレージ層です HDFS はブロックミラーリングを使用して Hadoop クラスタにデータを分散し複数の計算ノードのローカルデータとして保護しますデフォルトのブロックサイズは 64 MB でデフォルトでは 3 面 (3x) で複製されます Hadoop のディストリビューション Apache Hadoop はオープンソースで Apache Foundation(apache.org) によって管理されていますその他のすべてのディストリビューションは Apache Hadoop を基に構築拡張されたものです現在利用できる一般的な Hadoop ディストリビューションには以下のものがあります Apache Hadoop Cloudera CDH3 Greenplum HD Hortonworks Data Platform ここに挙げたものが今日利用できる Hadoop のすべてではありませんこれらはディストリビューションの一部です Hadoop ディストリビューションの完全なリストは以下を参照してください http://wiki.apache.org/hadoop/distributions%20and%20commercial%20support Hadoop エコシステム Hadoop エコシステムコンポーネントは Hadoop スタック上に実装され追加の機能を提供して分析ワークフローを有効にするアドオンコンポーネントです Hadoop エコシステムにおける主なオプションには以下のものがあります Hive: HDFS に格納されたデータに対する SQL に似たアドホックのクエリインターフェイスです HBase: HDFS 上に配置されるランダム読み取り / 書き込み可能な列指向の高パフォーマンス構造化ストレージシステムです Pig: 並列コンピューティング用のハイレベルデータフロー言語および実行フレームワークです EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 6

Mahout: Hadoop を使用する拡張可能なマシン学習アルゴリズムです R(RHIPE): 大規模な複合データセットに対する統計分析用の分割および再結合機能を提供しますここに挙げたものは Hadoop エコシステムを構成するコンポーネントの一部ですエコシステム R (RHIPE) Pig Mahout Hive HBase コアコンポーネント Map Reduce- 計算層 ( ジョブスケジューリング / 実行 ) HDFS- ストレージ層 (Hadoop 分散ファイルシステム ) Hadoop の全コンポーネント Hadoop のアーキテクチャ以下の図は Hadoop 計算クラスタで実行される Hadoop のコアコンポーネントのアーキテクチャを示したものです JobTracker DataNode TaskTracker DataNode TaskTracker DataNode TaskTracker Ethernet Hadoop NameNode DataNode TaskTracker DataNode TaskTracker DataNode TaskTracker この計算環境では一般に以下の処理が行われます 1. HDFS レイヤにデータを取り込みます 2. MapReduce を使用してデータを計算または分析します 3. Hadoop の全体的なワークフローに合わせて HDFS やその他のインフラストラクチャに結果を格納またはエクスポートします上の図では NameNode が環境内に 1 つしかなくもし NameNode に障害が発生した場合 Hadoop 環境全体が利用できなくなるおそれがあります EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 7

EMC Isilon OneFS の概要 OneFS は従来のストレージアーキテクチャの 3 つの層 ( ファイルシステムボリュームマネージャ RAID) を 1 つの統合ソフトウェア層に組み合わせたもので Isilon ストレージクラスタ上で実行される単一のインテリジェントな分散ファイルシステムを形成しますファイルシステムボリュームマネージャ RAID OneFS はファイルシステムボリュームマネージャ保護機能をインテリジェントな単一の分散システムに統合これは革新的な OneFS の中核でありエンタープライズ環境でスケールアウト NAS の活用を可能にしています OneFS はスケールアウトの基本原則 ( インテリジェントソフトウェア汎用ハードウェア分散アーキテクチャ ) に基づいています OneFS は単なるオペレーティングシステムではなくデータを Isilon ストレージクラスタに格納する際に基盤となるファイルシステムでもあります Isilon のアーキテクチャ OneFS は複数の Isilon ノードに対し専用の機能を提供します複数のノードで単一のクラスタを構成しますノードはラックマウント型のアプライアンスでメモリ CPU 1 ギガビットまたは 10 ギガビットのネットワークインターフェイス NVRAM 低遅延の Infiniband インターコネクトディスクコントローラストレージメディアを搭載していますつまりクラスタを構成する各ノードはストレージ機能に加えてデータ処理機能も備えています現在のところ Isilon のクラスタは最小構成の 3 ノードから最大 144 ノードまで拡張できますノードにはいくつかのモデルがありますがいずれも単一のクラスタに組み込むことができますノードはモデルによって容量に対するスループットや IOPS が異なります OneFS では単一のシステムに含むことができるノード数に理論上制限はありませんノードをクラスタに追加するとディスクキャッシュ CPU およびネットワーク容量が総量として増加します OneFS は構成するハードウェアを全体として活用するため各ハードウェアの単純な合計よりも大きな容量を利用できます RAM は単一のコヒーレントキャッシュにグループ化されクラスタ上の I/O はどの部分であってもキャッシュされたデータを ( キャッシュされた場所を問わず ) 利用できます NVRAM もグループ化され電源故障時にも高スループットで安全に書き込みできますスピンドルと CPU が集約化されると 1 つのファイルへのアクセスであっても複数ファイルへ EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 8

のアクセスであってもクラスタが拡大するにつれてスループット容量 IOPS が増加しますクラスタのストレージ容量は単一のファイルシステム内で最小 18 テラバイト (TB) から最大 15.5 ペタバイト (PB) まで拡張できます EMC Isilon のノードは機能に応じていくつかのモデルに分類されます S シリーズ : IOPS を重視したアプリケーション X シリーズ : 大量の同時処理と高スループットのワークフローを実現 NL シリーズ : プライマリストレージ水準のアクセス性能とテープ並みのコストを実現パフォーマンスアクセラレータ : 容量と独立して性能を拡張バックアップアクセラレータ : 高速かつ拡張性に優れたバックアップ / リストアを提供クライアント / アプリケーション層 Isilon ストレージ層 Windows Linux UNIX および Apple クライアント NFS CIFS FTP HTTP 標準的なギガビット Ethernet 層クラスタ間通信 Infiniband または GigE 層企業環境に設置される OneFS のコンポーネントこの図はソフトウェアハードウェアネットワーク接続が企業環境内で連携している完全なアーキテクチャを表しています複数のサーバで完全に分散された単一のファイルシステムを提供しており負荷容量およびスループットに基づくニーズの変化に応じて柔軟に拡張できるようになっています OneFS のオプションモジュール OneFS にはお客様のニーズに合わせて利用できるアドオンのソフトウェアモジュールが提供されています各モジュールの名称と概要は以下のとおりです SnapshotIQ TM - シンプルで拡張性と柔軟性に優れたスナップショットによるローカルデータの保護 SmartConnect TM - ポリシーベースのデータアクセスフェイルオーバと負荷分散による高可用性の実現 SmartQuotas TM - クラスタストレージのクォータ管理とシンプロビジョニング EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 9

SynclQ TM - 高速かつ柔軟なファイルベースの非同期データレプリケーション SmartPools TM - 複数のディスク階層を使用したデータ管理とファイルの属性に基づく情報ライフサイクル管理 (ILM) ポリシーの適用 SmartLock TM - 思いがけない削除に対するポリシーベースの保存および保護 InsightIQ TM - トレンドやホットスポットを特定できる強力でシンプルな分析プラットフォームで主要クラスタの統計情報を提供各ソフトウェアモジュールの詳細についてはそれぞれのデータシートをご覧ください Isilon の Hadoop 接続 HDFS の通信はすべて TCP/IP プロトコル上に階層化されるため Isilon では HDFS 層は OneFS の Over-the-wire プロトコルとして統合されていますこの統合により Hadoop のコアコンポーネントにおいてもあるいはエコシステムコンポーネントにおいても Hadoop アーキテクチャを構成するネイティブなパーツとしてスケールアウト NAS プラットフォームを活用できますその結果 Hadoop ワークフロー全体でシンプルかつ柔軟性信頼性効率性に優れた OneFS を活用できるようになります R (RHIPE) Pig Mahout Hive HBase NameNode JobTracker TaskTracker DataNode Ethernet HDFS Hadoop( コンピュータ層 ) に接続した Isilon スケールアウト NAS( ストレージ層 ) 上の図は Isilon スケールアウト NAS を Over-the-wire プロトコル (HDFS) 経由で Hadoop 計算クラスタに統合したアーキテクチャを示していますこのアーキテクチャでは Isilon スケールアウト NAS が企業の Hadoop ワークフローにおいて主要な Hadoop 要素となっていますまた Hadoop ワークフローの 2 つのコアコンポーネントを分離できるようになっています ( 計算層である MapReduce とストレージ層である HDFS) 今日利用可能なネットワーク帯域幅は劇的に増加しており OneFS は根本的に分散並列処理向けに構築されているため共有型のスケールアウトストレージモデルを活用して Hadoop によるデータ分析ワークフローを実現できます以下の図は Isilon スケールアウト NAS を活用した Hadoop のすべてのコアコンポーネントとエコシステムコンポーネントの詳細を示したものです EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 10

R (RHIPE) Pig Mahout OneFS Hive HBase MapReduce- 演算層 ( ジョブスケジューリング / 実行 ) JobTracker TaskTracker ネットワーク複数の 10 G インターフェイス HDFS- ストレージ層 NameNode DataNode Hadoop 環境で動作する Isilon スケールアウト NAS と Hadoop の全コンポーネント EMC Isilon OneFS は単一ファイルシステムと単一のグローバルネームスペースを 15 PB にスケールアウトできますまたこの容量で同時スループットを 85 GB/s まで拡張できます Hadoop ワークフローの要件に合わせて OneFS では直線的に容量とパフォーマンスを拡張できます詳細については specsfs2008 のベンチマーキングの結果をご覧ください (www.spec.org) 以降のセクションでは Hadoop ワークフローで EMC Isilon スケールアウト NAS を活用する利点について詳しく紹介しますシンプル EMC Isilon の OneFS ではディスクプールのラック管理ファイルシステムのプロビジョニング最適なデータ保護メカニズムの適用に必要な複雑な作業が完全に不要となりますデータはいつでもアクセス可能でありさまざまな障害に対して保護されています Hadoop を簡単に利用できるため自社のデータを余すところなく活用しビジネスを推進する洞察を得ることに集中できます Hadoop をフル活用し Hadoop エコシステムのストレージインフラの管理に時間を浪費することなく主要な傾向を明らかにすることでビジネスに役立つ新たな機会を見極めることができます Isilon ストレージの拡張は通常 60 秒未満で完了します既存のクラスタへのノードの追加はラックへの設置後電源投入時にボタンを押すだけなので簡単ですこのクラスタへの結合プロセスにより追加された容量はすぐに利用可能になり新たなノードにも適切なバージョンの OneFS と設定が適用されますすぐに利用可能となる追加容量に加えバックグラウンドジョブの実行により作業負荷が Isilon クラスタ全体に均等に再配分されるためデータのホットスポット発生を回避できますこのような容量拡張はすべてスケールアウトストレージがオンラインのままで行われネットワークに影響を及ぼさずに MapReduce ジョブが実行されます HDFS プロトコルに加え OneFS では以下のプロトコルもサポートされています NFS CIFS/SMB EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 11

FTP HTTP iscsi REST Isilon HDFS の実装は OneFS と HDFS クライアント間の軽量化プロトコル層です標準の POSIX で格納されたファイルは Isilon クラスタのファイルシステムと互換性を保っているため上記のプロトコルを使用して Hadoop ワークフローで使うデータを簡単に取得したり Hadoop から得られた重要な洞察をデータ分析ワークフローの他のコンポーネントにエクスポートできます EMC Isilon スケールアウト NAS に格納済みのデータであれば OneFS で Hadoop 計算ファームを指定するだけです Hadoop ワークフローに対して時間やリソースを浪費する負荷配分作業を行う必要はありません OneFS により Hadoop 環境の HDFS 層を検証済みのファイルシステムとして使用できます単一のネームスペース単一のボリューム仮想化効率性 Isilon スケールアウト NAS により Hadoop ワークフローがシンプルになります OneFS は Isilon クラスタの容量利用率が 80% 以上になるように設計されており Hadoop データ分析ワークフローにおける効率性を高めますファイルシステムに存在する各ブロックに 3 面のミラーリングを使用する従来の Hadoop アーキテクチャに比べて容量利用率に優れ ROI や TCO を最適化しますたとえば 12 PB の Hadoop データを格納したい場合データの格納にデフォルトの 3 面ミラーリングを使用する従来の Hadoop クラスタでは 36 PB 以上の物理容量が必要になりますしかし同じ Hadoop データ 12 PB をデータ保護をしたうえで OneFS に格納した場合約 16PB の物理容量で済みます結果として設備投資コストが大幅に削減され管理対象のインフラストラクチャもシンプルになります EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 12

Isilon による設備投資コストの削減には運用が容易で管理が簡単になるだけではなく環境面での利点もあります Isilon のノードは容量が高密度になるため従来型ではストレージの直接接続でたとえば 36 PB となる Hadoop クラスタの稼働に必要な電力は Isilon クラスタでは 16 PB の電力需要で賄えます必要なラックスペースも同様に少なくなります Isilon クラスタではこのような追加のコスト削減効果もあります Isilon スケールアウト NAS を Hadoop 環境の共有ストレージ層として使用すると Hadoop 計算ファームを集約して最小化できるという利点もありますストレージに関連する HDFS のすべてのオーバヘッドを Isilon にオフロードすることによって Hadoop 計算ファームはローカルストレージを管理保護しながらデータ分析を実行する代わりに分析ジョブをより効率的に実行できます Hadoop 計算ファームにおけるこれらの HDFS 関連の全タスクの実行を軽減することによって OneFS では既存の Hadoop コンピュータインフラストラクチャを活用してデータ分析ワークフローのその他のタスクを実行し Hadoop 計算ファームの設置面積を削減できます Hadoop で得られた主要な洞察をデータ分析ワークフローの他の部分に提供し共有ストレージを他の標準プロトコルからアクセス可能にすることでデータ分析ワークフロー全体が強化されますこのようなストレージの集約化によってデータ分析ワークフロー全体が合理化され設備投資や運用コストが大幅に削減されます柔軟性直接接続されたストレージを使用する従来の Hadoop クラスタでは計算層とストレージ層が緊密に結合しており一方だけを拡張することはできませんそのため計算能力が十分であってもストレージ容量が不足した場合 Hadoop クラスタ全体を拡張する必要があります拡張に伴い計算インフラストラクチャとともにネットワークインフラストラクチャも追加することになります全体の利用率という点で効率性や柔軟性で不利な方法です Hadoop の計算層とストレージ層を切り離すことによって必要に応じて柔軟にストレージや計算能力を個別に拡張できます成長に合わせて投資するというこのような柔軟なアーキテクチャによって必要なときに必要なもののみを購入できるため Hadoop の複合的な環境をより効率的に活用できますその結果 OneFS で小規模の導入から開始し Hadoop ストレージ層の同時スループットを必要に応じて最大 85 GB/s までスケールアウトできます Hadoop のストレージのニーズに対して OneFS を使用することの主な利点は Apache Hadoop に準拠しているということです Hadoop データ分析ワークフローで使用する Hadoop ディストリビューションを柔軟に選択できます EMC Isilon スケールアウト NAS は以下の Hadoop ディストリビューションでテスト済みです Apache Hadoop 0.20.203 Apache Hadoop 0.20.205 EMC Greenplum HD 1.1 EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 13

信頼性 Hadoop 分析に対する投資効果を最大限に高めるため企業は復元力の高いビッグデータストレージインフラストラクチャを必要としています Isilon スケールアウト NAS および OneFS オペレーティングシステムはデータ資産を保護し可用性の高いデータ環境を実現するために信頼性の高いインフラストラクチャと強力なデータ保護を提供します従来の Hadoop クラスタではハードウェア層でデータを保護するために HDFS 層でのミラーリング技術とともにカスタムのサブブロック CRC チェックサムを使用しており冗長データが発生していましたその結果規模が拡大するにつれてコストがかさんでいきます Isilon のデータ保護は OneFS のファイルシステムレベルで実装されハードウェアの RAID コントローラには依存していませんこの方法であれば市場の状況やハードウェアの性能進化に合わせて新しいデータ保護スキームを追加できるという利点があります保護がファイルレベルで適用されるため新しい保護機能やパフォーマンススキームを利用するにあたって OneFS ソフトウェアだけをアップグレードすれば対応できます OneFS はパリティの保護計算に広く実証済みであるリードソロモン符号アルゴリズムを使用していますファイルレベルで適用される保護によりデータの復元は迅速で効率的に実行されます I ノードディレクトリおよびその他のメタデータは参照するデータブロックと同じまたは上位のレベルで保護されますすべてのデータメタデータおよび前方誤り訂正 (FEC) ブロックが複数のノードにストライプされるため専用のパリティドライブは必要ありませんこの 2 つの方法により単一障害点およびボトルネックを回避しファイルの再構築を高度に並列化されたプロセスで実行可能にします現在のところ OneFS では最大 4 つのコンポーネントの同時障害に対する保護を提供しており N+1 から N+4 のパリティ保護レベルを使用できます単一のノード障害による影響は個別のディスクに起こる障害と同レベルにまたノード全体でスペクトルのもう一端における障害のように最小限に抑制されます OneFS は複数のハイブリッド保護スキームもサポートしていますこれには N+2:1 と N+3:1 も含まれそれぞれ 2 ドライブの障害または 1 ノードの障害 3 ドライブの障害または 1 ノードの障害からデータを保護しますこれらの保護スキームは各ノードに数テラバイトレベルの SATA ドライブが最大 36 台搭載されるような高密度のノード構成では特に有用ですこの場合複数ドライブに障害が発生する可能性はノード全体に障害が発生する可能性をはるかに上回りますファイルが保護レベルを超えるなど複数のデバイスで同時に障害が発生するという起こりそうにない状況でも OneFS は可能な限りすべてを再保護し Isilon のクラスタのログに個々のファイルに関するエラーを報告します EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 14

ノード 1 ノード 2 ノード 3 ノード 4 ノード 5 パリティパリティデータストライプパリティパリティデータストライプパリティデータストライプパリティパリティデータストライプパリティパリティ OneFS のハイブリッドパリティ保護スキーム (N+M:x) ファイルシステムジャーナルすべての Isilon ノードにはデュアルバッテリバックアップ型の 512 MB NVRAM カードが搭載されノードのファイルシステムジャーナルを保護します各ジャーナルは OneFS によって安定したストレージとして使用され突然の停電やその他の突発的な出来事から書き込みトランザクションを保護しますジャーナルはファイルシステムの一貫性を保護し充電は最大 3 日間持続します Isilon クラスタの各メンバーノードは NVRAM コントローラを備えているため OneFS ファイルシステム全体が完全にジャーナル化されますノード / デバイス障害に対するプロアクティブな対応 OneFS または SmartFail によって検出された ECC エラーが特定のしきい値に達したドライブは事前予防的に取り除かれそのドライブのデータは自動的に再構築されてクラスタの別の場所に配置されます SmartFail とその後の修復プロセスはいずれも完全に自動化されており管理者が介入する必要はありません OneFS はデータをファイルレベルで保護するため不整合やデータ損失は使用できないデバイス障害のあるデバイスに分離され残りのファイルシステムが損なわれることなく利用可能です OneFS は高度に分散化されたアーキテクチャ上に構築されており複数のノードの CPU メモリスピンドルを活用して高度に並列化された効率的な方法で障害の発生したドライブからデータを再構築できます Isilon のストレージシステムは特定のドライブの速度に影響されず OneFS はドライブの障害から非常にすばやくリカバリが可能でこの効率性はクラスタサイズに比例して向上しますそのため Isilon クラスタ内の故障したドライブは数時間から数日を要するハードウェア RAID ベースのストレージデバイスの再構築に比べてきわめて迅速に数分から数時間程度で再構築されますさらに OneFS には専用のホットスペアドライブは必要ありません EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 15

Isilon のデータ整合性 ISI Data Integrity(IDI) は 32 ビットの CRC チェックサムを介してファイルシステム構造を破損から保護する OneFS プロセスですファイルおよびメタデータの両方についてすべての Isilon ブロックでチェックサム検証が使用されていますメタデータチェックサムはメタデータブロック自体に含まれておりファイルデータチェックサムはメタデータとして保存され参照整合性が維持されますすべてのチェックサムはイニシエータによって再計算されノードはすべての要求時に特定の読み取りを実行します再計算されたチェックサムが保存されたチェックサムと一致しない場合 OneFS はシステムアラートを生成しイベントをログに記録対応するパリティブロックを取得してクライアントに返し疑わしいデータブロックを自動的に修復しようとしますプロトコルのチェックサムブロックとメタデータに加えて OneFS は Remote Block Management(RBM) プロトコルデータに対してもチェックサム検証を提供します RBM はバックエンドクラスタの相互接続用に Isilon が開発した RPC ベースのユニキャストプロトコルです RBM プロトコルのチェックサムは Infiniband ハードウェアチェックサムに加えてネットワーク層で提供され故障したハードウェアコンポーネントや他の障害の発生状態を示すハードウェアコンポーネントの検出および分離に使用されますダイナミックセクタ修復 OneFS は不良ディスクセクタを回避しファイルシステムによって良好データが再書き込み先にリダイレクトされる DSR( ダイナミックセクタ修復 ) 機能を備えています OneFS が正常動作中にブロックの読み取りに失敗すると DSR が起動します DSR は消失データを再構築しそのドライブ上の別の場所またはノード内の別のドライブにデータを書き込みますこの操作によりブロックの後続の読み取りが失敗するのを避けることができます DSR は完全に自動化されておりエンドユーザに対して完全に透過ですディスクセクタのエラーおよび CRC の不一致ではドライブの再構築プロセスとほぼ同じプロセスが使用されます Mediascan OneFS における MediaScan の役割はディスクのセクタをチェックすることとセクタ ECC エラーの発生時にディスクドライブがエラーを修復するように DSR メカニズムを起動することです MediaScan は OneFS の一部として実装され事前に設定したスケジュールに基づいて自動的に実行されます影響が少ないバックグラウンドプロセスとして設計されているため MediaScan は完全に分散され Isilon 独自の並列アーキテクチャの利点をフル活用できます IntegrityScan ファイルシステム全体の不整合を調べる IntegrityScan も OneFS のコンポーネントです各ブロックを系統的に読み取り関連付けられているチェックサムを検証します従来の fsck 形式のファイルシステム整合性チェックツールとは異なり IntegrityScan はクラスタを完全に実行したままで動作するように設計されておりダウンタイムは発生しません IntegrityScan によってチェックサムの不一致が検出された場合システムアラートが生成され syslog に書き込まれます OneFS はエラーの疑いのあるブ EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 16

ロックの修復を自動的に試行しますデータの高可用性直接接続されたストレージを使用する従来の Hadoop クラスタであらゆるファイルシステムの名前空間を操作するのは単一の NameNode だけです Isilon ストレージではすべての Isilon ノードが NameNode 要求または DataNode 要求に応答できます Hadoop 計算クライアントがファイルの要求を Isilon に送信するたびにその要求は別の Isilon ノードのアドレスに送信されます Hadoop 環境ではクラスタ内のすべての Isilon ノードが NameNode および DataNode になりますこれにより複数の Hadoop 計算ノードで実行される複数の mapper タスクや reducer タスクから複数の Isilon ノードに I/O の負荷分散が実行されます OneFS はこのように従来の Hadoop クラスタに存在する単一障害点を解消し負荷分散を可能にします Isilon SmartConnect モジュールは Hadoop 計算クライアントに対してダイナミックなフェイルオーバとフェイルバックをサポートすることによりデータの高可用性を実現しますノードに障害が発生した場合 MapReduce ジョブに関連する進行中の読み取りや書き込みはすべて Isilon クラスタの別ノードに渡され MapReduce ジョブまたはタスクは中断することなく処理を完了しますこの処理は SmartConnect Zone 名を Hadoop core-site.xml 設定ファイルの設定パラメータおよび Isilon クラスタのダイナミック IP アドレスとして使用することによって可能になります SmartConnect Zone 設定の詳細については Isilon のユーザガイドを参照してくださいこの機能は HDFS ストレージ層を提供する Isilon OneFS で Hadoop MapReduce ジョブを実行している際に障害が発生しても継続的なデータの可用性と負荷分散を提供しますビジネスの継続性 OneFS には企業環境におけるビジネスの継続性を確保するために欠かせない信頼性の高いデータバックアップソリューションを提供する堅牢なメカニズムが備わっています Isilon の SnapshotIQ は OneFS 内のすべてのディレクトリやサブディレクトリの読み取り専用のポイントインタイムコピーを取得しますこのコピーは高速なローカルバックアップとして機能します OneFS スナップショットは拡張性が高く作成にかかる時間は通常 1 秒未満ですファイルシステムの活動レベルサイズコピーされるディレクトリのサイズにかかわらずパフォーマンスのオーバヘッドはほとんどありませんまたファイルの変更されたブロックはスナップショットのアップデート時に保存されるためスナップショットストレージが高い効率性で利用できますユーザは各ファイルシステムのディレクトリ下にある非表示のディレクトリ /.snapshot を経由して使用可能なスナップショットにアクセスできます Isilon SnapshotIQ はクラスタ上に無制限のスナップショットを作成することもできますスナップショットの間隔を細分化して RPO 時間枠を向上できるため他の大多数のスナップショット実装に比べて非常に大きな利点があります EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 17

エンドユーザファイルの削除ファイルのリストア SnapshotIQ を使用したユーザ主導のファイルリカバリ SnapshotIQ には失われたファイルや破損したファイルをユーザ自身がリカバリできる利点に加えてファイルシステムへの影響を最小限に抑えつつバックアップする方法も備わっていますスナップショットからのバックアップを起動するにはいくつかの利点があります最も大きな利点は読み取り専用スナップショットから直接バックアップを実行するためファイルシステムを停止する必要がないということですその結果開いているファイルのロックの競合という問題が回避されユーザはバックアップジョブの実行中にもデータにフルアクセスできます SnapshotIQ はクラスタ上のスナップショットの最新バージョンをポイントするエイリアスも自動で作成しますバックアップが常にそのエイリアスを参照するようにすればバックアッププロセスが容易になります定義上スナップショットはポイントインタイムコピーであるためスナップショットからのバックアップによりファイルシステムまたはサブディレクトリの一貫性が維持されますこのプロセスは NDMP バックアップジョブの一部としてスナップショットを作成する NDMP スナップショット機能を使用しバックアップの完了後にそのスナップショットを削除することでさらに合理化できます OneFS では広く普及した NDMP ( ネットワークデータ管理プロトコル ) のサポートによりバックアップおよびリストア機能を利用できます NDMP は主要なデータバックアップ製品との互換性を提供するオープンな標準プロトコルです Isilon は NDMP のバージョン 3 および 4 の両方をサポートしています OneFS NDMP モジュールには以下の機能があります NDMP を使用した完全 / 増分バックアップおよびリストアダイレクトアクセスリストア (DAR/DDAR) 単一ファイルリストア 3 方向バックアップ任意のシステムへのリストア ACL( アクセス制御リスト ) へのシームレスな統合代替データストリームおよび EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 18

リソースフォーク選択的なファイルリカバリレプリケーション後のバックアップスナップショットと NDMP はローカルな障害に対する理想的なソリューションですが致命的な障害や自然災害などへの備えは第二の選択肢として地理的に離れている場所にデータセットをコピーするほうがより適切です Isilon SyncIQ モジュールは広範な RPO( 目標復旧地点 ) および RTO( 目標復旧時間 ) を解決する高パフォーマンスの非同期レプリケーションを提供しますこれによりインフラストラクチャのコストと災害発生時のデータ損失の可能性との最適なトレードオフを決定できます SyncIQ は複製されたファイルシステムにハードリミットを設けないためデータの増加に伴って線形的にマルチペタバイトの範囲で拡張できます SynclQ によるパラレルレプリケーションプライマリクラスタ DR クラスタ SyncIQ を使用したローカルまたは地理的に離れた Isilon OneFS クラスタへの Hadoop データのレプリケーション SyncIQ は短距離または長距離のレプリケーション用に LAN または WAN のどちらの接続でも容易に最適化されるためサイト固有のまたは地域的な災害の両方からデータを保護できますさらに SyncIQ はクラスタストレージのパフォーマンスと効率性を活用するように設計された高度に並列化されたポリシーベースのレプリケーションアーキテクチャを採用していますそのため総スループットは容量に比例して増加され拡張データセット全体で RPO が一貫して保持されます従来の Hadoop ストレージ実装における課題は HDFS ストレージ層の一部として EMC Isilon を導入することで解決できます以下に要点を示します従来の Hadoop ストレージ実装専用のストレージインフラストラクチャ - Hadoop での利用に限定される EMC Isilon ストレージ実装スケールアウトストレージ - 複数のアプリケーションとワークフローに接続 EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 19

単一障害点 - NameNode が単一障害点になるエンタープライズレベルのデータ保護なし - スナップショットレプリケーションバックアップがない非効率なストレージ利用 - 3 面ミラーでデータ保護拡張性がない - ストレージと計算リソースを切り離せない手動でのインポート / エクスポート - プロトコルのサポートなし単一障害点なし - 分散した NameNode エンドツーエンドのデータ保護 - SnapshotIQ SyncIQ NDMP バックアップ業界随一のストレージの利用効率 - 使用率 80% 以上柔軟な拡張性 - 計算リソースとストレージを別々に拡張マルチプロトコル - 業界標準プロトコル - NFS CIFS FTP HTTP HDFS EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 20

まとめ Hadoop は企業のビッグデータから貴重な洞察を得るために必要な時間やリソースを劇的に削減する革新的な分析エンジンですこのホワイトペーパーで詳述したように EMC Isilon スケールアウト NAS および Isilon OneFS オペレーティングシステムは Over-the-wire プロトコルとして HDFS 層を利用することで大きな利点をもたらしますこの統合により Hadoop のコアコンポーネントにおいてもエコシステムコンポーネントにおいてもスケールアウト NAS プラットフォームを Hadoop アーキテクチャのネイティブな構成要素として活用できるようになりますまた Hadoop ワークフロー全体でシンプルさ柔軟性信頼性効率性に優れた OneFS を活用できます HDFS を統合することで業界標準の Apache Hadoop ディストリビューションと Isilon を組み合わせたビッグデータ分析ソリューションを容易に展開し強力で効率性と柔軟性に優れたビッグデータストレージと分析環境を構築できますこのアプローチにより直接接続されたストレージを使用しリソースを大量に消費する複雑な従来の Hadoop 導入上の課題が解消されます Isilon スケールアウト NAS は進化するビッグデータ分析ワークフローの要件を満たすためのシンプルさを保ちつつ Hadoop 環境のデータ保護を強化し信頼性を高める復元力の高いストレージインフラストラクチャを提供します Isilon について Isilon は EMC の一部門でスケールアウト NAS のグローバルリーダーですストレージではなくデータの管理を望む企業にパワフルでシンプルなソリューションを提供しています Isilon の製品は規模にかかわらず導入管理拡張が容易です従来のエンタープライズストレージとは異なり Isilon は将来的にストレージが増えたりよりパフォーマンスが必要になったりビジネスニーズが変化してもシンプルなまま運用できます Isilon は企業のストレージに対する考え方を変革しようとしています考え方を変えることによってお客様はより優れたより簡単な方法を見つけることができるようになります詳細については www.isilon.co.jp をご覧ください EMC Isilon スケールアウト NAS による Hadoop ストレージ環境の構築 21

Microsoft Word - EMC Isilon HDFSサポート ホワイトペーパー2012Feb.doc

Microsoft Word - EMC Isilon HDFSサポートホワイトペーパー2012Feb.doc