Technical Documentation

Size: px

Start display at page:

Download "Technical Documentation"

ひさともいなくら
6 years ago
Views:

1 SteelEye Protection Suite for Linux v8.0 Technical Documentation May 2012

2 This document and the information herein is the property of SIOS Technology Corp. (previously known as SteelEye Technology, Inc.) and all unauthorized use and reproduction is prohibited. SIOS Technology Corp. makes no warranties with respect to the contents of this document and reserves the right to revise this publication and make changes to the products described herein without prior notification. It is the policy of SIOS Technology Corp. to improve products as new technology, components and software become available. SIOS Technology Corp., therefore, reserves the right to change specifications without prior notice. LifeKeeper, SteelEye and SteelEye DataKeeper are registered trademarks of SIOS Technology Corp. Other brand and product names used herein are for identification purposes only and may be trademarks of their respective companies. To maintain the quality of our publications, we welcome your comments on the accuracy, clarity, organization, and value of this document. Address correspondence to: Copyright 2012 By SIOS Technology Corp. San Mateo, CA U.S.A. All rights reserved

3 目次 Chapter 1: はじめに 1 SteelEye Protection Suite for Linux について 1 SPS for Linux の統合コンポーネント 1 SteelEye Protection Suite ソフトウェアのパッケージ 1 SPS for Linux のインストールイメージファイル 1 SPS Core Package Cluster 2 オプションのリカバリソフトウェア 2 ドキュメンテーション 2 ドキュメンテーション 2 Chapter 2: SPS のインストール 5 システム要件 5 テクニカルノート 5 SteelEye Protection Suite ソフトウェアのパッケージ 5 SPS for Linux のインストールイメージファイル 5 SPS Core Package Cluster 6 オプションのリカバリソフトウェア 6 SPS LifeKeeper 環境の計画 7 サーバ構成のマッピング 7 LifeKeeper ペアに対する構成マップの例 8 ストレージとアダプタの要件 8 ストレージとアダプタのオプション 9 サポートされているストレージモデル 9 サポートされているアダプタモデル 37 SPS LifeKeeper 環境のセットアップ 39 Linux OS および関連する通信パッケージのインストール 39 目次 i

4 サーバと共有ストレージの接続 39 共有ストレージの設定 39 ネットワーク設定の確認 40 VLAN インターフェースサポートマトリックス 41 切り替え可能な IP アドレスの作成 41 データベースアプリケーションのインストールとセットアップ 42 SteelEye Protection Suite ソフトウェアのインストール 43 SPS ソフトウェアのインストール 43 ライセンスの取得とインストール 45 プライマリネットワークのインターフェースを変更する場合ライセンス Rehost が必要 46 インターネット /IP ライセンス 47 サブスクリプションライセンス 47 サブスクリプションライセンスのトラブルシューティング 47 インターネット Host ID の取得 48 SPS LifeKeeper インストールの確認 48 LifeKeeper SPS のアップグレード 48 Chapter 3: SteelEye DataKeeper for Linux 51 はじめに 51 保護対象のリソース 51 LifeKeeper Core 52 LifeKeeper Core ソフトウェア 52 File System Generic Application IP および RAW I/O の Recovery Kit ソフトウェア 53 LifeKeeper GUI ソフトウェア 54 LifeKeeper のマニュアルページ 54 設定の概念 54 共通のハードウェアコンポーネント 54 すべての LifeKeeper 設定に共通するコンポーネント 55 システムのグループ化の配置 55 アクティブ - アクティブのグループ化 56 アクティブ - スタンバイのグループ化 57 ii 目次

5 インテリジェントスイッチバックと自動スイッチバックの違い 58 syslog によるログの記録 59 リソース階層 59 リソースタイプ 59 リソースの状態 60 階層の関係 61 イクイバレンシ情報 61 リソース階層の情報 62 リソース階層の例 63 ステータスの詳細表示 63 リソース階層の情報 65 通信ステータスの情報 66 LifeKeeper のフラグ 67 シャットダウンストラテジー 68 ステータスの簡略表示 68 リソース階層の情報 68 通信ステータスの情報 69 障害検出とリカバリのシナリオ 69 IP ローカルリカバリ 69 ローカルリカバリのシナリオ 69 コマンドラインの操作 70 リソースのエラーリカバリのシナリオ 71 サーバの障害リカバリのシナリオ 73 インストールと設定 75 LifeKeeper for Linux のインストール 75 LifeKeeper for Linux の設定 75 LifeKeeper の設定手順 75 TTY 接続のセットアップ 76 SNMP による LifeKeeper イベント転送 77 SNMP による LifeKeeper イベント転送の概要 77 目次 iii

6 LifeKeeper イベントテーブル 77 LifeKeeper イベント転送の設定 79 前提条件 79 設定作業 80 設定の確認 80 SNMP イベント転送の無効化 81 SNMP のトラブルシューティング 81 LifeKeeper イベントメール通知 81 LifeKeeper イベントメール通知の概要 81 メールが生成される LifeKeeper のイベント 82 LifeKeeper イベントメール通知の設定 83 前提条件 83 設定作業 83 設定の確認 84 イベントメール通知の無効化 84 メール通知のトラブルシューティング 84 任意の設定作業 85 デスクトップのツールバーに LifeKeeper GUI のアイコンを追加する 85 Gnome を使用している場合 : 85 KDE を使用している場合 : 85 アイコンの位置を変更する 86 手動フェイルオーバ確認オプションの設定 86 サーバのシャットダウンストラテジーの設定 86 LifeKeeper ハートビートの調整 87 ハートビート設定項目の概要 87 例 87 ハートビートの設定 88 設定上の考慮事項 88 SPS でカスタム証明書を使用する 88 証明書の使用方法 89 iv 目次

7 独自の証明書の使用 89 Linux の設定 89 データレプリケーションの設定 93 ネットワーク設定 94 アプリケーションの設定 94 ストレージとアダプタの設定 95 HP のマルチパス I/O 設定 112 EMC PowerPath のマルチパス I/O 設定 115 IBM SDD によるマルチパス I/O 設定 117 Hitachi HDLM のマルチパス I/O 設定 117 Device Mapper Multipath I/O の設定 129 LifeKeeper I-O フェンシングの概要 133 リザベーションの無効化 133 非共有ストレージ 134 リザベーションを使用しない I/O フェンシングの設定 134 I/O フェンシング表 134 Quorum/Witness 136 Quorum/Witness Server Support Package for LifeKeeper 136 機能の概要 136 パッケージの要件 136 パッケージのインストールと設定 137 設定可能なコンポーネント 137 使用可能な quorum モード 138 使用可能な witness モード 139 Quorum を喪失したときに利用可能なアクション 139 共有 witness トポロジーのための追加設定ノードクラスタに witness ノードを追加する 141 期待される動作 ( デフォルトモードを仮定 ) 142 シナリオシナリオ目次 v

8 シナリオシナリオ SCSI リザベーション 143 SCSI リザベーションを利用したストレージフェンシング 143 I/O フェンシングのための代替方式 145 STONITH 145 STONITH で IPMI を使用する 145 パッケージの要件 145 VMware vsphere 環境での STONITH 145 パッケージの要件 145 インストールと設定 146 <vm_id> 147 期待される動作 148 Watchdog 148 コンポーネント 148 設定 149 アンインストール 150 リソースポリシー管理 150 概要 150 Steeleye Protection Suite/vAppKeeper のリカバリ動作 150 ポリシーによるカスタム動作およびメンテナンスモード動作 151 標準ポリシー 151 メタポリシー 152 リソースレベルのポリシーに関する重要な考慮事項 152 lkpolicy ツール 153 lkpolicy の使用方法の例 153 ローカルおよびリモートサーバとの認証 153 ポリシーのリスト表示 154 現在のポリシーの表示 154 ポリシーの設定 154 vi 目次

9 ポリシーの削除 154 認証情報の設定 155 認証情報の追加または変更 155 ストア内の認証情報のリスト表示 155 サーバの認証情報の削除 155 追加情報 155 LifeKeeper API 156 ネットワーク設定 156 認証 156 LifeKeeper 管理 157 概要 157 エラーの検出および通知 157 N-Way リカバリ 157 管理作業 158 サーバプロパティの編集 158 コミュニケーションパスの作成 158 コミュニケーションパスの削除 160 サーバのプロパティ - フェイルオーバ 160 リソース階層の作成 162 LifeKeeper アプリケーションリソース階層 162 Recovery Kit のオプション 163 ファイルシステムリソース階層の作成 163 Generic Application リソース階層の作成 164 Raw デバイスリソース階層の作成 165 リソースのプロパティの編集 166 リソースの優先順位の編集 167 [Up] および [Down] ボタンの使用 168 優先順位の値の編集 168 変更の適用 168 リソース階層の拡張 168 目次 vii

10 ファイルシステムリソース階層の拡張 169 Generic Application リソース階層の拡張 170 Raw デバイスリソース階層の拡張 170 階層の拡張解除 170 リソース依存関係の作成 171 リソース依存関係の削除 172 すべてのサーバからの階層の削除 173 LifeKeeper User Guide 175 LifeKeeper for Linux の使用 176 GUI 176 GUI の概要 - 全般 176 GUI サーバ 176 GUI クライアント 176 GUI クライアントの終了 177 LifeKeeper GUI ソフトウェアパッケージ 177 メニュー 178 SteelEye LifeKeeper for Linux のメニュー 178 リソースのコンテキストメニュー 178 サーバのコンテキストメニュー 179 [File] メニュー 180 [Edit] メニュー - [Resource] 180 [Edit] メニュー - [Server] 181 [View] メニュー 181 [Help] メニュー 182 ツールバー 182 SteelEye LifeKeeper for Linux のツールバー 182 GUI のツールバー 182 リソースのコンテキストツールバー 184 サーバのコンテキストツールバー 185 GUI の実行の準備 186 viii 目次

11 LifeKeeper の GUI - 概要 186 GUI サーバ 186 GUI クライアント 186 GUI クライアントの開始 187 LifeKeeper GUI アプレットの開始 187 アプリケーションクライアントの開始 187 GUI クライアントの終了 187 LifeKeeper の GUI の設定 187 GUI 管理用の LifeKeeper サーバの設定 187 GUI の実行 188 GUI の設定 188 GUI の制限 189 GUI サーバの開始 / 停止 189 LifeKeeper GUI サーバを開始するには 189 トラブルシューティング 189 LifeKeeper GUI サーバを停止するには 190 LifeKeeper GUI サーバのプロセス 190 GUI ユーザの設定 190 Java のセキュリティポリシー 192 ポリシーファイルの場所 192 ポリシーファイルの作成と管理 192 ポリシーファイルでの権限の付与 193 ポリシーファイルの例 193 Java プラグイン 194 Java プラグインのダウンロード 194 Java プラグインのトラブルシューティング 194 リモートシステムでの GUI の実行 195 リモートシステムでの GUI の設定 195 リモートシステムでの GUI の実行 196 アプレットのトラブルシューティング 196 目次 ix

12 LifeKeeper サーバでの GUI の実行 197 GUI アプレットを使用するためのブラウザのセキュリティパラメータ 198 Netscape Navigator と Netscape Communicator 198 Firefox 198 Internet Explorer 198 ステータスの表 199 プロパティパネル 199 出力パネル 200 メッセージバー 200 GUI の終了 200 共通の作業 200 LifeKeeper の起動 200 LifeKeeper サーバプロセスの起動 200 LifeKeeper の停止 201 LifeKeeper プロセスの表示 201 LifeKeeper GUI サーバプロセスの表示 201 サーバのクラスタへの接続 202 クラスタからの切断 203 接続サーバの表示 203 サーバのステータスの表示 203 サーバのプロパティの表示 204 サーバのログファイルの表示 204 リソースのタグと ID の表示 205 リソースのステータスの表示 205 サーバリソースのステータス 205 グローバルリソースのステータス 206 リソースのプロパティの表示 207 [Status] ウィンドウの表示オプションの設定 207 Resource Labels 208 Resource Tree 208 x 目次

13 Comm Path Status 209 Row Height 209 Column Width 209 メッセージ履歴の表示 210 メッセージ履歴の解釈 210 リソース階層ツリーの展開と折り畳み 211 [Cluster Connect] ダイアログ 212 [Cluster Disconnect] ダイアログ 212 [Resource Properties] ダイアログ 213 [General] タブ 213 [Relations] タブ 214 [Equivalencies] タブ 214 [Server Properties] ダイアログ 214 [General] タブ 215 [CommPaths] タブ 217 [Resources] タブ 218 オペレータの作業 219 リソースを In Service にする 219 リソースを Out of Service にする 220 高度な作業 220 LCD 220 LifeKeeper 設定データベース 220 関連トピック 221 LCDI のコマンド 221 シナリオの状況 221 階層の定義 222 LCD の設定データ 224 依存関係の情報 224 リソースのステータス情報 224 サーバ間のイクイバレンシ情報 224 目次 xi

14 LCD のディレクトリ構造 225 LCD のリソースタイプ 225 LifeKeeper のフラグ 225 リソースのサブディレクトリ 226 リソースの動作 227 /opt/lifekeeper の LCD のディレクトリ構造 227 LCM 228 通信ステータスの情報 229 LifeKeeper の警報とリカバリ 229 警報クラス 229 警報の処理 230 警報ディレクトリのレイアウト 230 メンテナンス作業 230 LifeKeeper の設定値の変更 230 ファイルシステムの健全性の監視 232 条件の定義 233 フル ( またはほぼフル ) のファイルシステム 233 アンマウントされたまたは不適切にマウントされたファイルシステム 233 LifeKeeper が保護するシステムのメンテナンス 234 リソース階層のメンテナンス 234 フェイルオーバ後の復旧 235 LifeKeeper の削除 235 GnoRPM からの削除 236 コマンドラインからの削除 236 ディストリビューションの有効化パッケージの削除 236 ファイアウォールを使用した状態での LifeKeeper の実行 236 LifeKeeper のコミュニケーションパス 237 LifeKeeper GUI の接続 237 LifeKeeper の IP アドレスリソース 237 LifeKeeper Data Replication 237 xii 目次

15 ファイアウォールの無効化 238 ファイアウォール経由での LifeKeeper GUI の実行 238 LifeKeeper の起動 239 LifeKeeper サーバプロセスの起動 240 LifeKeeper の停止 240 リソース階層の転送 240 テクニカルノート 240 LifeKeeper の機能 240 チューニング 241 LifeKeeper の動作 243 サーバの設定 244 LifeKeeper 7.5 以降のパッケージ依存リスト 244 [Confirm Failover] と [Block Resource Failover] の設定 245 Confirm Failover On: 245 Block Resource Failover On: 245 条件 / 考慮事項 : 246 NFS クライアントのオプション 246 NFS クライアントをマウントするときの考慮事項 246 UDP または TCP の選択 246 /etc/exports の Sync オプション 246 Red Hat EL6 ( および Fedora 14) クライアントと Red Hat EL6 NFS サーバの使用 246 Red Hat EL5 NFS クライアントと Red Hat EL6 NFS サーバの使用 247 クラスタの例 247 拡張したマルチクラスタの例 247 トラブルシューティング 249 既知の問題と制限 249 インストール 249 LifeKeeper Core 252 インターネット /IP ライセンス 256 GUI 258 目次 xiii

16 データレプリケーション 260 IPv6 262 Apache 265 Oracle Recovery Kit 265 NFS Server Recovery Kit 266 SAP Recovery Kit 267 LVM Recovery Kit 268 DMMP Recovery Kit 269 PostgreSQL Recovery Kit 269 MD Recovery Kit 270 GUI トラブルシューティング 271 ネットワーク関連トラブルシューティング (GUI) 272 Windows プラットフォームでの論理接続の遅延 272 Sun FAQ から : 272 モデムからの実行 : 272 プライマリネットワークインターフェースのダウン : 273 ホストへのルートが存在しない例外 : 273 不明なホストの例外 : 273 Windows から : 274 Linux から : 275 X Window Server に接続できない : 275 システムの日付と時刻の調整 276 コミュニケーションパスの稼働と停止 276 推奨される対策 277 不完全なリソースの作成 277 不完全なリソースの優先順位の変更 277 一貫した状態への階層のリストア 278 階層の設定中に共有ストレージが見つからない 278 LifeKeeper サーバ障害からの復旧 279 推奨される対策 : 280 xiv 目次

17 停止できないプロセスからの復旧 280 手動リカバリ時のパニックからの復旧 280 Out-of-Service 階層の復旧 280 リソースタグ名の制限 281 Tag Name Lengthタグ名の長さ 281 有効な " 特殊 " 文字 281 無効な文字 281 シリアル (TTY) コンソールの警告 281 システムが init 状態 S に遷移しているという警告 281 共有ストレージでスレッドがハングしているというメッセージ 282 説明 282 推奨される対策 : 282 Chapter 4: SteelEye DataKeeper for Linux 283 はじめに 283 SteelEye DataKeeper for Linux によるミラーリング 283 DataKeeper の特長 283 同期ミラーリングと非同期ミラーリングの違い 284 同期ミラーリング 284 非同期ミラーリング 284 Steeleye DataKeeper の仕組み 284 同期 ( および再同期 ) 285 標準ミラーの構成 285 N+1 の構成 286 複数ターゲットの構成 287 SteelEye DataKeeper リソース階層 287 フェイルオーバのシナリオ 288 シナリオシナリオシナリオシナリオ目次 xv

18 インストールと設定 291 SteelEye DataKeeper for Linux のインストールと設定 291 DataKeeper リソースを設定する前に 291 ハードウェアとソフトウェアの要件 291 ハードウェアの要件 291 ソフトウェアの要件 292 全般的な設定 292 ネットワークと LifeKeeper の設定 292 データ複製パスの変更 293 ネットワーク帯域幅の要件の特定 293 Linux システム ( 物理または仮想 ) での変化率の測定 293 ネットワーク帯域幅の要件の特定 294 基本変化率の測定 294 詳細変化率の測定 295 収集した詳細変化率データの解析 295 詳細変化率データのグラフ作成 300 [Confirm Failover] と [Block Resource Failover] の設定 304 [Confirm Failover On] 304 [Block Resource Failover On] 305 各サーバのフラグの設定 305 SteelEye DataKeeper for Linux のリソースタイプ 306 Replicate New File System 306 Replicate Existing File System 306 DataKeeper Resource 307 リソースの設定作業 307 概要 307 DataKeeper リソース階層の作成 308 リソース階層の拡張 309 DataKeeper リソース階層の拡張 310 リソース階層の拡張解除 312 xvi 目次

19 リソース階層の削除 312 DataKeeper リソースを Out of Service にする 313 DataKeeper リソースを In Service にする 313 リソース階層のテスト 314 LifeKeeper の GUI からの手動スイッチオーバの実行 314 管理 315 SteelEye DataKeeper for Linux の管理 315 ミラーのステータスの表示 315 GUI からのミラーの管理 316 リワインドブックマークの作成と表示 317 ミラーを強制的にオンラインにする 318 一時停止と再開 318 ミラーの一時停止 318 ミラーの再開 318 データのリワインドと復旧 318 圧縮レベルの設定 322 リワインドログの場所の設定 322 リワインドログの最大サイズの設定 322 コマンドラインからのミラー管理 322 ミラーの操作 323 例 : 323 ミラーの設定 323 例 : 323 ビットマップの管理 324 コマンドラインからのミラーステータスの監視 324 例 : 324 サーバの障害 325 再同期 325 全同期の回避 326 方法目次 xvii

20 手順 327 方法手順 328 Multi-Site Cluster 329 SteelEye Protection Suite for Linux Multi-Site Cluster 329 SteelEye Protection Suite for Linux Multi-Site Cluster 329 Multi-Site Cluster を設定する際の考慮事項 330 Multi-Site Cluster の制限 331 SteelEye Protection Suite for Linux Multi-Site Cluster リソース階層の作成 331 Replicate New File System 332 Replicate Existing File System 334 DataKeeper Resource 335 リソース階層の拡張 337 DataKeeper リソース階層の拡張 339 ディザスタリカバリシステムへの階層の拡張 339 IP リソースのリストアおよびリカバリの設定 342 Multi-Site Cluster 環境へのマイグレーション 342 要件 343 始める前に 343 マイグレーションの実行 344 マイグレーションの正常な完了 352 トラブルシューティング 355 Index 359 xviii 目次

21 SteelEye Protection Suite for Linux について Chapter 1: はじめに SteelEye Protection Suite (SPS) for Linux は高可用性のクラスタリングと革新的なデータ複製機能をエンタープライズクラスのソリューションに統合したものです SPS for Linux の統合コンポーネント SteelEye LifeKeeper は障害回復性の高いソフトウェアソリューションでありお使いのサーバのファイルシステムアプリケーションおよびプロセスの高い可用性を維持します LifeKeeper にはカスタマイズした耐障害性のハードウェアは不要です LifeKeeper を使用するにはネットワーク内にある 2 台以上のシステムをグループ化するだけですサイト固有の構成データが作成され自動の障害検出とリカバリが実行されます障害が発生した場合障害が発生したサーバから LifeKeeper が保護しているリソースを指定のバックアップサーバに移行します実際のスイッチオーバ時に短時間の中断が発生しますただしオペレータの介入なしに LifeKeeper がバックアップサーバに動作をリストアします SteelEye DataKeeper は LifeKeeper 環境に統合データミラーリング機能を提供しますこの機能により LifeKeeper リソースが共有 / 非共有ストレージ環境で動作可能になります SteelEye Protection Suite ソフトウェアのパッケージ SteelEye Protection Suite (SPS) for Linux ソフトウェアは 1 つのイメージファイル (sps.img) に入っていますオプションの LifeKeeper Recovery Kit は Core パッケージの後にインストールされます SPS for Linux のインストールイメージファイル SPS for Linux のイメージファイル (sps.img) にはインストールスクリプトのセットがありシステムに SPS をインストールするときに必要なユーザ対話型のシステム設定作業を実行するように設計されていますインストールイメージファイルは実行している Linux のディストリビューションを特定し一連のユーザの応答を使用して SPS のインストールが正常に完了するために必要なさまざまなパッケージをインストールしますサーバ間の通信を可能にする LifeKeeper API (steeleye-lkapi) もインストールされます重要な注記 : 現在この API は内部使用のみとして予約されていますが将来のリリースではお客様とサードパーティが使用できるように公開される可能性がありますユーザに対する質問のタイプと順序は使用している Linux のディストリビューションによって異なりますそれぞれの質問をよく読んで正しく回答してください通常の状況ではインストールイメージファイルに必要な各手順を完了するためにそれぞれの質問に [Yes] で回答してください SteelEye Protection Suite for Linux 1

22 SPS Core Package Cluster SPS for Linux のイメージファイルには Core パッケージがあり以下のソフトウェアパッケージが含まれます SPS Core Package Cluster LifeKeeper (steeleye-lk) LifeKeeper Core パッケージにはメモリ CPU OS SCSI ディスクサブシステムファイルシステムなどの中核システムコンポーネント用のリカバリソフトウェアがあります LifeKeeper GUI (steeleye-lkgui) LifeKeeper GUI パッケージは LifeKeeper の管理および監視用のグラフィカルユーザインターフェースです DataKeeper (steeleye-lkdr) DataKeeper パッケージはインテントログ記録を使用するデータ複製 ( 同期ミラーまたは非同期ミラー ) を実行します IP Recovery Kit (steeleye-lkip) LifeKeeper IP Recovery Kit は IP アドレスの自動リカバリ用のスイッチオーバソフトウェアです Raw I/O Recovery Kit (steeleye-lkraw) LifeKeeper Raw I/O Recovery Kit はロー I/O を使用してカーネルのバッファリングを迂回するアプリケーションをサポートします CCISS Recovery Kit (steeleye-lkcciss) Hewlett-Packard (Compaq) の CCISS デバイスを DataKeeper でサポートするオプションのパッケージ ( このパッケージは SPS のインストールイメージファイル内にあり DataKeeper と共に HP のストレージデバイス (CCISS) を使用する場合にのみインストールされる ) マニュアルページ (steeleye-lkman) LifeKeeper マニュアルページパッケージは LifeKeeper 製品のリファレンスマニュアルですオプションのリカバリソフトウェアリカバリキットは SPS Core ソフトウェアとは別にリリースされます使用可能なリカバリキットとパッケージ名の最新の総合リストについては SPS テクニカルドキュメンテーションの Application Recovery Kits セクションを参照してくださいドキュメンテーションドキュメンテーションインストール設定管理およびトラブルシューティングの手順を説明する総合的な参考資料 SteelEye Protection Suite for Linux 以下のセクションで SPS for Linux の各項目について説明していますセクションはじめに説明ソフトウェアパッケージ構成の概念など SteelEye Protection Suite for Linux 製品の入門情報を示します 2 はじめに

23 ドキュメンテーションセクション SPS for Linux Installation Guide 設定管理 User's Guide 説明お使いの SPS 環境の計画と設定 SPS のインストールとライセンスおよび LifeKeeper のグラフィカルユーザインターフェース (GUI) の設定に役立つ情報がありますクラスタ内の各サーバで LifeKeeper ソフトウェアを設定するための詳細情報と手順がありますサーバのプロパティの編集やリソースの作成などのサーバレベルの作業およびリソースの編集拡張削除などのリソースレベルの作業について説明します実行できる多数の作業を含めて LifeKeeper の GUI に関する詳細情報がありますテクニカルノートセクションおよび多数の高度なトピックもあります DataKeeper SteelEye DataKeeper for Linux の計画とインストールの手順および管理設定およびユーザの情報がありますトラブルシューティング Recovery Kits エラーコードの検索既知の問題と制限について説明し SteelEye LifeKeeper for Linux のインストール設定および使用を行うときに発生する可能性がある問題に対する解決策を説明します LifeKeeper で特定のアプリケーションの管理と制御を可能にするオプションの Recovery Kits の計画とインストールの手順および管理設定およびユーザの情報があります SteelEye Protection Suite for Linux の使用時に表示される可能性のあるすべてのメッセージのリストがあり該当する場合はエラーの原因およびエラー状態を解消するために必要な処置についても説明していますこの総合リストから表示されたエラーコードを検索できます SteelEye Protection Suite for Linux 3

25 Chapter 2: SPS のインストール SteelEye Protection Suite (SPS) インストールガイドには SPS 環境をプランニングおよびインストールする方法が記載されていますサーバストレージデバイスネットワークコンポーネントをセットアップするために必要な手順の他 LifeKeeper のグラフィカルユーザインターフェース ( GUI) の詳しい設定についても示されますこのガイドの手順をすべて終えれば LifeKeeper および DataKeeper リソースを設定できる状態になります SPS for Linux テクニカルドキュメンテーションでは SPS 設定に必要な情報が記載されていますシステム要件ハードウェアおよびソフトウェアの要件やバージョンの詳しいリストについては SPS for Linux リリースノートを参照してくださいまた SPS をインストールする前に本書に記載されているプランニング作業およびハードウェア構成作業を完了していることを確認してくださいテクニカルノート詳しいトラブルシューティング制限などこのソフトウェアに関連する情報については SPS for Linux テクニカルドキュメンテーションのテクニカルノートおよびトラブルシューティングを参照してください SteelEye Protection Suite ソフトウェアのパッケージ SteelEye Protection Suite (SPS) for Linux ソフトウェアは 1 つのイメージファイル (sps.img) に入っていますオプションの LifeKeeper Recovery Kit は Core パッケージの後にインストールされます SPS for Linux のインストールイメージファイル SPS for Linux のイメージファイル (sps.img) にはインストールスクリプトのセットがありシステムに SPS をインストールするときに必要なユーザ対話型のシステム設定作業を実行するように設計されていますインストールイメージファイルは実行している Linux のディストリビューションを特定し一連のユーザの応答を使用して SPS のインストールが正常に完了するために必要なさまざまなパッケージをインストールしますサーバ間の通信を可能にする LifeKeeper API (steeleye-lkapi) もインストールされます重要な注記 : 現在この API は内部使用のみとして予約されていますが将来のリリースではお客様とサードパーティが使用できるように公開される可能性があります SteelEye Protection Suite for Linux 5

26 SPS Core Package Cluster ユーザに対する質問のタイプと順序は使用している Linux のディストリビューションによって異なりますそれぞれの質問をよく読んで正しく回答してください通常の状況ではインストールイメージファイルに必要な各手順を完了するためにそれぞれの質問に [Yes] で回答してください SPS for Linux のイメージファイルには Core パッケージがあり以下のソフトウェアパッケージが含まれます SPS Core Package Cluster LifeKeeper (steeleye-lk) LifeKeeper Core パッケージにはメモリ CPU OS SCSI ディスクサブシステムファイルシステムなどの中核システムコンポーネント用のリカバリソフトウェアがあります LifeKeeper GUI (steeleye-lkgui) LifeKeeper GUI パッケージは LifeKeeper の管理および監視用のグラフィカルユーザインターフェースです DataKeeper (steeleye-lkdr) DataKeeper パッケージはインテントログ記録を使用するデータ複製 ( 同期ミラーまたは非同期ミラー ) を実行します IP Recovery Kit (steeleye-lkip) LifeKeeper IP Recovery Kit は IP アドレスの自動リカバリ用のスイッチオーバソフトウェアです Raw I/O Recovery Kit (steeleye-lkraw) LifeKeeper Raw I/O Recovery Kit はロー I/O を使用してカーネルのバッファリングを迂回するアプリケーションをサポートします CCISS Recovery Kit (steeleye-lkcciss) Hewlett-Packard (Compaq) の CCISS デバイスを DataKeeper でサポートするオプションのパッケージ ( このパッケージは SPS のインストールイメージファイル内にあり DataKeeper と共に HP のストレージデバイス (CCISS) を使用する場合にのみインストールされる ) マニュアルページ (steeleye-lkman) LifeKeeper マニュアルページパッケージは LifeKeeper 製品のリファレンスマニュアルですオプションのリカバリソフトウェアリカバリキットは SPS Core ソフトウェアとは別にリリースされます使用可能なリカバリキットとパッケージ名の最新の総合リストについては SPS テクニカルドキュメンテーションの Application Recovery Kits セクションを参照してください 6 SPS のインストール

27 SPS LifeKeeper 環境の計画以下のトピックは SPS LifeKeeper for Linux クラスタ環境の定義に役立ちますサーバ構成のマッピング以下のガイドラインを使用してサーバ構成を文書化してください 1. 使用する構成に対してサーバ名プロセッサの種類メモリおよびその他の I/O デバイスを決定してくださいバックアップサーバを指定した場合にはプライマリサーバに障害が発生したときに選択したサーバに処理を実行する能力があることを確認する必要があります 2. 通信接続要件を決定してください重要 : クラスタ化された構成には可能性として 2 種類の通信要件 ( クラスタ要件とユーザ要件 ) がありますクラスタ - LifeKeeper クラスタではサーバ間に少なくとも 2 つのコミュニケーションパス ( ハートビートとも呼ばれます ) が必要になりますこの冗長性により通信障害が原因で発生するスプリットブレインシナリオを回避することができます独立した 2 つのサブネットを使用する 2 つの分離した LAN ベースの (TCP) コミュニケーションパスが推奨されこれらの 1 つ以上をプライベートネットワークとして構成する必要があります TCP と TTY のの組み合わせもサポートされています TTY コミュニケーションパスはサーバのシリアルポート間で RS-232 ヌルモデム通信を使用しますコミュニケーションパスを 1 つしか使用しない場合互いに通信する LifeKeeper クラスタ内のシステムの機能に支障をきたす可能性があります単一のコミュニケーションパスを使用しているときにそのコミュニケーションパスで障害が発生した場合複数のシステム上で同時に LifeKeeper の階層が使用可能になることがありますこれは偽のフェイルオーバまたはスプリットブレインシナリオと呼ばれますスプリットブレインシナリオでは各サーバがアプリケーションを制御できると認識しているためデータにアクセスしようとしたり共有ストレージデバイスにデータを書き込もうとする場合がありますスプリットブレインシナリオを解決するために LifeKeeper ではサーバの電源をオフにしたり再起動したり階層を使用できなくすることですべての共有データに対するデータの整合性を保証することができますまた TCP コミュニケーションパス上のネットワークトラフィックが大きくなると偽のフェイルオーバや LifeKeeper が適切に初期化できなくなるなど予期せぬ動作が生じる可能性がありますユーザ - ユーザトラフィックに対する代替の LAN 接続つまりクラスタハートビートに使用するものとは別の LAN 接続を用意することをお勧めしますただし ( 推奨通りに ) 2 つの TCP コミュニケーションパスを構成した場合これらのコミュニケーションパスのいずれかがサーバに出入りするその他のトラフィックとネットワークアドレスを共有することができます注記 : 必要な場合にのみリソースを使用できるようにする場合は Quorum/Witness Server Support Package for LifeKeeper を利用することができます SteelEye Protection Suite for Linux 7

28 LifeKeeper ペアに対する構成マップの例 3. 共有リソースアクセス要件を確認して理解してください共有ストレージを使用するクラスタは共有 SCSI バスまたはファイバチャネルループを利用できます LifeKeeper ではリソースが 1 つのサーバにロックされるためロックされたすべてのリソースへのアクセスが必要になるサーバは常時 1 つだけであることを確認する必要があります LifeKeeper デバイスのロックは論理ユニット (LUN) レベルで行われますアクティブ / アクティブ構成では各階層が独自の一意の LUN にアクセスする必要があります共通の LUN にアクセスするすべての階層は同じサーバ上でアクティブ ( 稼働中 ) である必要があります 4. 共有メモリ要件を決定してください共有メモリおよびセマフォパラメータを設定する場合は LifeKeeper だけでなくサードパーティ製アプリケーションの共有メモリ要件も考慮に入れてください LifeKeeper の共有メモリ要件についてはテクニカルノートの調整を参照してください LifeKeeper ペアに対する構成マップの例この構成マップの例はディスクアレイサブシステムを共有する LifeKeeper サーバのペアを図示しています通常は Server 1 がアプリケーションを実行し Server 2 がバックアップサーバまたはセカンダリサーバになりますこのケースでは同時に 1 つのサーバがディスクアレイのディスクストレージスペース全体を保有しているのでディスクリソースの競合はありませんディスクアレイコントローラは DAC SCSI ホストアダプタ ( パラレル SCSI ファイバチャネルなど ) は SCSI HA と表記されていますサーバのペアが最も単純な LifeKeeper 構成となります 3 つ以上のサーバで構成されるクラスタを計画する場合複数のサーバ間が適切に接続されるようにマッピングすることが非常に重要になりますたとえば多方向フェイルオーバ構成では物理的な接続が存在しない場合でも LifeKeeper 内のコミュニケーションパスを定義することが可能ですカスケーディングフェイルオーバ機能を実現するために各サーバがクラスタ内の他のすべてのサーバへの物理的な接続パスを持つ必要がありますストレージとアダプタの要件以下のガイドラインを使用してストレージとホストアダプタの要件を決定してくださいストレージデバイス - アプリケーションのデータストレージ要件に基づいて構成に必要なデータストレージデバイスの種類と数を決定する必要があります共有ファイルはディスクアレイサブシステム (RAID : 8 SPS 環境の計画

29 ストレージとアダプタのオプション Redundant Array of Inexpensive Disks) 上に置く必要があります LifeKeeper は構成に使用できるハードウェア RAID 周辺装置を多数サポートしていますサポートされている周辺装置のリストについてはストレージとアダプタのオプションを参照してくださいストレージデバイスの構成を計画する際には以下の点を考慮してください LifeKeeper では物理ディスクまたは論理ユニット (LUN) レベルでリソースを管理しその構成内では同時に 1 つのサーバのみが各物理ディスクまたは LUN 上のリソースを利用できますそのため LifeKeeper の構成を始める前にディスク割り当ての計画を立てることをお勧めしますたとえばアクティブ / アクティブ構成の各階層は独自の一意の LUN にアクセスする必要があるので 2 ノードアクティブ / アクティブ構成の場合は最低 2 つの LUN が必要になります一部のモデル固有の問題およびハードウェア構成の詳細についてはストレージとアダプタの構成を参照してくださいアダプタ - 構成の種類および周辺装置の数に基づいて必要な SCSI またはファイバチャネルホストアダプタの種類と数を決定してください選択するアダプタはドライバが使用できるように LifeKeeper だけでなく使用している Linux ディストリビューションでもサポートされていることが重要ですサポートされているホストアダプタのリストについてはサポートされているアダプタモデルを参照してください参照用に構成マップにホストアダプタを追加する必要がありますストレージとアダプタのオプション以下の表には共有ストレージ構成で LifeKeeper が現在サポートしているディスクアレイのストレージモデルおよびアダプタが一覧表示されていますストレージまたはアダプタモデルごとに認定の種類が示されていますストレージベンダがストレージアダプタモデルにリストされているものに関連するその他のアダプタモデルをサポートしている場合 LifeKeeper for Linux はこれらのアダプタモデルもサポートしますこれらのアレイおよびアダプタに対するドライババージョンおよびその他の構成要件についてはストレージおよびアダプタの構成を参照してください IP フェイルオーバのみを使用する非共有ストレージを含む LifeKeeper 構成あるいは SteelEye Data Replication または Network Attached Storage の使用時にはサポートされているディスクアレイおよびアダプタは必要ありませんサポートされているストレージモデルベンダストレージモデル認定 ADTX ArrayMasStor P パートナーのテスト ArrayMasStor L ArrayMasStor FC-II パートナーのテストパートナーのテスト Altix TP9100 SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 9

30 サポートされているストレージモデルベンダストレージモデル認定 Baydel Storage Arrays DAR3/5SE68C DAR3/C/5SE68C SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト Consan CRD5440 SIOS Technology Corp. のテスト CRD7220 (f/w 3.00) SIOS Technology Corp. のテスト DataCore SANsymphony SIOS Technology Corp. のテスト Dell 650F (CLARiiON) SIOS Technology Corp. のテスト Dell EMC CX3 10c/CX3 40c/CX3 20c CX3 80/CX3 40(F)/CX3 20(F) Dell EMC CX300/CX600/CX400/CX700/CX500 PowerVault ( Dell PERC LSI Logic MegaRAID 有り ) Dell MD3000 Dell PowerVault MD3200/3220 パートナーのテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテストパートナーのテストパートナーのテスト 10 SPS 環境の計画

31 サポートされているストレージモデルベンダストレージモデル認定 Dell EqualLogic PS5000 および PS6000 Dell EqualLogic PS4000 PS6500 PS6010E/S/X/XV/XVS および PS6510E/X Dell EqualLogic PS4100, PS4110, PS6100, PS6110 パートナーのテストベンダのサポートステートメントベンダのサポートステートメント EMC Symmetrix 3000 Series SIOS Technology Corp. のテスト Symmetrix 8000 Series Symmetrix DMX/DMX2 Symmetrix DMX3/DMX4 Symmetrix VMAX Series CLARiiON CX200 CX400 CX500 CX600 および CX700 ベンダのサポートステートメントパートナーのテストパートナーのテストパートナーのテスト SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 11

32 サポートされているストレージモデルベンダストレージモデル認定 CLARiiON CX300 CLARiX CX3-20 CLaRiiON CX3FC および combo CLaRiiON CX310c CLaRiiON AX4 CLaRiiON AX45 CLaRiiON CX4-120 CX4-240 CX4-480 CX4-960 VNX Series 5100/5300/5500/5700/750 パートナーのテストパートナーのテストパートナーのテストパートナーのテスト SIOS Technology Corp. のテストパートナーのテストパートナーのテストベンダのサポートステートメント FalconStor FalconStor Network Storage Server (NSS) Version 6.15 パートナーのテスト 12 SPS 環境の計画

33 サポートされているストレージモデルベンダストレージモデル認定 Fujitsu ETERNUS3000 (PG-FC105 PG-FC106 または PG-FC107 有り ) シングルパスのみ ETERNUS6000 (PG-FC106 有り ) シングルパスのみ ETERNUS4000 Model 80 および Model 100 (PG-FC106 PG- FC107 または PG-FC202 有り ) シングルパスのみ FibreCAT S80 ( 注記を参照 ) ETERNUS SX300 (PG-FC106 または PG-FC107 有り ) マルチパスのみ ETERNUS2000 Series:Model 50 Model 100 および Model 200 (PG-FC202 有り ) シングルパスおよびマルチパス構成 ETERNUS4000 Series:Model 300 および Model 500 (PG-FC202 有り ) シングルパスおよびマルチパス構成 ETERNUS DX60/DX80/DX90 Fibre Channel パートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストベンダのサポートステートメントベンダのサポートステートメント SteelEye Protection Suite for Linux 13

34 サポートされているストレージモデルベンダストレージモデル認定 ETERNUS DX60 S2/DX80 S2/DX90 S2 Fibre Channel ETERNUS DX410/DX440 Fibre Channel ETERNUS DX410 S2/DX440 S2 Fibre Channel ETERNUS DX8100/DX8400/DX8700 Fibre Channel ETERNUS VS850 ベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメント 14 SPS 環境の計画

35 サポートされているストレージモデルベンダストレージモデル認定 Hitachi Data Systems HDS RAID 700 (VSP) HDS 7700 HDS 5800 HDS 9570V HDS 9970V HDS 9980V AMS 500 SANRISE USP/NSC (TagmaStore USP/NSC) パートナーのテストベンダのサポートステートメントベンダのサポートステートメントパートナーのテストパートナーのテストパートナーのテスト SIOS Technology Corp. のテストパートナーのテスト SteelEye Protection Suite for Linux 15

36 サポートされているストレージモデルベンダストレージモデル認定 BR1200 BR1600 BR1600E BR1600S AMS2010 AMS2100 AMS2300 AMS2500 Hitachi Unified Storage 110 (HUS 110) Hitachi Unified Storage 130 (HUS 130) Hitachi Unified Storage 150 (HUS 150) パートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメント 16 SPS 環境の計画

37 サポートされているストレージモデルベンダストレージモデル認定 HP/Compaq RA 4100 SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 17

38 サポートされているストレージモデルベンダストレージモデル認定 MA/RA 8000 SIOS Technology Corp. のテスト 18 SPS 環境の計画

39 サポートされているストレージモデルベンダストレージモデル認定 MSA1000 / MSA1500 ( アクティブ / アクティブおよびアクティブ / パッシブファームウェア構成 ) SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 19

40 サポートされているストレージモデルベンダストレージモデル認定 HP MSA1000 Small Business SAN Kit SIOS Technology Corp. のテスト 20 SPS 環境の計画

41 サポートされているストレージモデルベンダストレージモデル認定 HP P2000 G3 MSA FC(RHEL5.4 上の DMMP 有り ) HP P2000 G3 MSA SAS HP P4000/P4300 G2 SIOS Technology Corp. のテストパートナーのテスト SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 21

42 サポートされているストレージモデルベンダストレージモデル認定 HP P4000 VSA HP P4500 G2 HP P6300 EVA FC HP P9500 HP XP20000/XP24000 ベンダのサポートステートメントベンダのサポートステートメントパートナーのテストベンダのサポートステートメント SIOS Technology Corp. のテスト 22 SPS 環境の計画

43 サポートされているストレージモデルベンダストレージモデル認定 3PAR T400 Fibre Channel 3PAR F200/F400/T800 Fibre Channel 3PAR V400 EVA3000/5000 EVA4X00/6X00/8X00 (XCS 6.x シリーズファームウェア ) EVA4400 EVA6400/8400 EVA8100 (XCS 6.x シリーズファームウェア ) MSA2000 Fibre Channel MSA2000 iscsi MSA2000 SA MSA 2300 Fibre Channel パートナーのテストベンダのサポートステートメントパートナーのテスト SIOS Technology Corp. およびパートナーのテスト SIOS Technology Corp. およびパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテスト SteelEye Protection Suite for Linux 23

44 サポートされているストレージモデルベンダストレージモデル認定 MSA2300 i MSA2300 SA パートナーのテストパートナーのテスト 24 SPS 環境の計画

45 サポートされているストレージモデルベンダストレージモデル認定 IBM FAStT200 SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 25

46 サポートされているストレージモデルベンダストレージモデル認定 FAStT500 SIOS Technology Corp. のテスト 26 SPS 環境の計画

47 サポートされているストレージモデルベンダストレージモデル認定 DS4100 * パートナーのテスト SteelEye Protection Suite for Linux 27

48 サポートされているストレージモデルベンダストレージモデル認定 DS4200 パートナーのテスト 28 SPS 環境の計画

49 サポートされているストレージモデルベンダストレージモデル認定 DS4300 (FAStT600) * SIOS Technology Corp. のテスト SteelEye Protection Suite for Linux 29

50 サポートされているストレージモデルベンダストレージモデル認定 DS4400 (FAStT700) * DS4500 (FAStT900) * SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト 30 SPS 環境の計画

51 サポートされているストレージモデルベンダストレージモデル認定 DS4700 DS4800 DS4300 (FAStT600) DS4400 (FAStT700) DS5000 パートナーのテストパートナーのテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテストパートナーのテスト SteelEye Protection Suite for Linux 31

52 サポートされているストレージモデルベンダストレージモデル認定 ESS Model 800 * DS6800 * DS8100 * DS400 ( シングルパスのみ ) DS3200 DS3300 DS3400 DS3500 SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト 32 SPS 環境の計画

53 サポートされているストレージモデルベンダストレージモデル認定 IBM eserver xseries Storage Solution Server Type445-R for SANmelody IBM eserver xseries Storage Solution Server Type445-FR for SANmelody パートナーのテストパートナーのテスト IBM SAN Volume Controller * * IBM TotalStorage Proven IBM Storwize V7000 (Firmware Version ) SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト JetStor JetStor II SIOS Technology Corp. のテスト MicroNet Genesis One ベンダのサポートステートメント MTI Gladiator 2550 ベンダのサポートステートメント Gladiator 3550 Gladiator 3600 ベンダのサポートステートメントベンダのサポートステートメント SteelEye Protection Suite for Linux 33

54 サポートされているストレージモデルベンダストレージモデル認定 NEC NEC istorage M100 FC (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) NEC istorage M10e / M300 / M500 FC (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) NEC istorage S500 / S1500 / S2500 ( シングルパスのみ ) NEC istorage S Series (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) NEC istorage D1-10 / D1-30 (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) NEC istorage D3-10 / D1-10 (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) NEC istorage D3-10 / D3-30 (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) NEC istorage D8-10 / D8-20 / D8-30 (SPS Recovery Kit 使用時のシングルパスおよびマルチパス構成 ) パートナーのテストベンダのサポートステートメント SIOS Technology Corp. のテストベンダのサポートステートメントベンダのサポートステートメントパートナーのテストパートナーのテストパートナーのテスト 34 SPS 環境の計画

55 サポートされているストレージモデルベンダストレージモデル認定 Network Appliance (NetApp) NAS FAS2xx Series FAS9xx Series FAS2xxx Series FAS3xxx Series FAS6xxx Series SAN FAS3xxx Series (QLogic QLE246x および DMMP 有り ) ベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメント Newtech SweeperStor SATA パートナーのテスト SweeperStor SAS パートナーのテスト nstor NexStor 4320F パートナーのテスト ProCom Reliant 1000 ベンダのサポートステートメント SteelEye Protection Suite for Linux 35

56 サポートされているストレージモデルベンダストレージモデル認定 Radion Systems Rack U2W Microdisk U2W ベンダのサポートステートメントベンダのサポートステートメント SGI InfiniteStorage 4600 パートナーのテスト Linux MPP ドライバパートナーのテスト SILVERstor Giant GT-3000 シリーズパートナーのテスト Sun StorEdge 3310 パートナーのテスト StorEdge 3510 FC (Sun StorEdge 2Gb PCI Single FC Network Adapter 有り ) StorEdge 6130 FC (Sun StorEdge 2Gb PCI Single FC Network Adapter 有り ) StorageTek 2540 (Sun StorageTek 4Gb PCI-E Dual FC Host Bus Adapter または Sun StorageTek 4Gb PCI Dual FC Network Adapter 有りパートナーのテストパートナーのテストパートナーのテスト TID MassCareRAID パートナーのテスト Winchester Systems MassCareRAIDⅡ FlashDisk OpenRAID (SCSI) FlashDisk OpenRAID (FC) パートナーのテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト Xiotech Magnitude 3D SIOS Technology Corp. のテスト 36 SPS 環境の計画

57 サポートされているアダプタモデルサポートされているアダプタモデルアダプタの種類 Differential SCSI Adapter アダプタモデル Adaptec 2944 W Adaptec 2944 UW または Adaptec 2940 U2W Compaq 64bit PCI Dual Channel Wide Ultra2 SCSI Adapter Compaq SA 5i 6i 532 および 642 PCI Dual Channel Wide Ultra3 SCSI Adapters Dell PERC 2/DC PERC 4/DC LSI Logic MegaRAID Elite 1600 (Dell PERC 3/DC はこのアダプタの OEM バージョンです ) Adaptec Adaptec ASR-2010S (Fujitsu PG-140C / CL) 注記を参照 Adaptec ASR-3200S (Fujitsu PG-142B /C /D) 注記を参照 LSI Logic MegaRAID SCSI (Fujitsu PC- 142E) 注記を参照注記 : IP フェイルオーバのみを使用する非共有ストレージを含む LifeKeeper 構成あるいは SteelEye Data Replication の使用時にはこれらのアダプタは Fujitsu のテストを受けます認証 SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテストパートナーのテストベンダのサポートステートメントベンダのサポートステートメントベンダのサポートステートメント SteelEye Protection Suite for Linux 37

58 サポートされているアダプタモデルアダプタの種類 Fibre Channel Serial Attached SCSI (SAS) アダプタモデル QLogic QLA 2100 QLogic QLA 2200 QLogic QLA 2340 QLogic QLA 200 (HP Q200) HP StorageWorks 2GB 64-bit/133MHz PCI-X to Fibre Channel Host Bus Adapter (FCA2214) Compaq 64 bit/66mhz Fibre Channel Host Bus Adapter B21 Sun StorEdge 2Gb PCI Single FC Network Adapter (OEMed QLogic QLA 2310) Sun StorageTek 4Gb PCI-E Dual FC Host Bus Adapter Sun StorageTek 4Gb PCI Dual FC Network Adapter Emulex LP9002 (PG-FC105) Emulex LP1050 Emulex LP10000 ( これらのアダプタに必要なドライバとバージョンについては Emulex のドライバを参照してください ) HP QLogic QMH2462 4Gb FC HBA Qlogic QLE2460 (4Gb HBA) Qlogic QLE2462 (4Gb HBA) FC1142SR 4Gb シングルチャネル PCI-Express Fibre Channel アダプタ FC1242SR 4Gb デュアルチャネル PCI-Express Fibre Channel アダプタ DELL SAS 5/e アダプタ認証 SIOS Technology Corp. のテスト SIOS Technology Corp. のテスト SIOS Technology Corp. のテストパートナーのテストパートナーのテストパートナーのテスト SIOS Technology Corp. のテストパートナーのテストパートナーのテストパートナーのテストパートナーのテストパートナーのテスト SIOS Technology Corp. では Fibre Channel のハブとスイッチを特に認証していませんこれはこれらのデバイスに対する LifeKeeper 固有の既知の制限事項や要件がないためですストレージとアダプタの構成に示されたアレイについての注記が特にない限り LifeKeeper ではディスクアレイベンダがサポートするハブおよびスイッチを推奨します 38 SPS 環境の計画

59 SPS LifeKeeper 環境のセットアップ要件が決定され LifeKeeper 設定がマップされたのでこの SPS LifeKeeper 環境のコンポーネントをセットアップすることができます注記 : 一部のセットアップ作業は異なる順序で実行することが可能ですがこのリストは推奨された順序で示されています Linux OS および関連する通信パッケージのインストール SPS LifeKeeper for Linux ソフトウェアのインストールを実行する前に最初に Linux オペレーティングシステムが正常にインストールされ稼動することを確認する必要があります完全なインストールの詳細については Linux のディストリビューションに付属の Linux インストール手順書を参照してください注記 : 共有ストレージを接続して設定した後に Linux をインストールすることも可能ですが新しい周辺装置を導入する前に Linux をインストールして実行する方が簡単な場合があります SPS LifeKeeper for Linux インストールイメージファイルは SPS LifeKeeper をシステムにインストールする前に必要なユーザ対話型システムセットアップタスクを実行するように設計された一連のインストールスクリプトを提供しますサーバと共有ストレージの接続非共有ストレージ環境で LifeKeeper を使用することを計画している場合はこの情報をスキップできますデータレプリケーション ( ミラーリング ) 環境で LifeKeeper を使用している場合はこの文書の DataKeeper セクションを参照してくださいネットワーク接続ストレージ環境で LifeKeeper を使用している場合は LifeKeeper Network Attached Storage Recovery Kit 管理ガイドを参照してください Linux がインストールされたらホストアダプタおよび共有周辺装置のアドレスを設定する必要があります具体的な詳細についてはアダプタおよびストレージデバイスに付属のドキュメンテーションを参照してください共有ストレージの設定 LifeKeeper では共有 SCSI (Small Computer System Interface) ホストアダプタおよび共有ディスクハードウェアの機能を使用して障害が発生したサーバから指定のバックアップサーバにリソースを切り替えるように設定できますファイバチャネルのストレージエリアネットワーク (SAN) も障害の発生したサーバから指定のバックアップサーバにリソースを切り替えるのに使用できます以下の作業を実行してディスクベースのアプリケーションリソース階層を作成し LifeKeeper でフェイルオーバ保護を提供できるようにしてください SteelEye Protection Suite for Linux 39

60 ネットワーク設定の確認 1. ディスクおよび LUN のパーティションを分割してください LifeKeeper の保護下にあるすべてのディスクのパーティションを分割する必要があるので共有ディスクアレイは論理ユニット (LUN) に設定する必要がありますディスクアレイ管理ソフトウェアを使用してこの設定を実行してください詳細な手順についてはディスクアレイソフトウェアのマニュアルを参照してください注記 : LifeKeeper では LUN レベルでディスクをロックすることに注意してくださいしたがってアクティブ / スタンバイ設定では 1 つの LUN が適切と考えられますただしアクティブ / アクティブ設定を使用する場合は少なくとも 2 つの別個の LUN を設定して各階層が独自の一意の LUN にアクセスできるようにする必要があります 2. 両方のサーバが共有ディスクを認識することを確認してください (fdisk コマンドなどを使用 ) 作成した LUN を Linux が認識しない場合は LifeKeeper も認識しません 3. LifeKeeper 階層でプライマリサーバとして使用するシステムから共有ディスク上のファイルシステムを作成してくださいファイルシステムの管理に関する完全な手順については Linux のマニュアルを参照してくださいネットワーク設定の確認 LifeKeeper をインストールする前にネットワークが適切に設定され動作することを確認することが重要ですネットワークの動作を確認するためにこの時点で実行する必要のある作業を以下に示します 1. サーバのインストールでファイアウォールが有効になっている場合は LifeKeeper のポートを提供するかまたはファイアウォールを無効にする必要がありますトピックファイアウォールがある場合の LifeKeeper の実行を参照してください 2. 各サーバからローカルサーバを ping しクラスタ内の他のサーバを ping してください ping が失敗した場合には必要なトラブルシューティングを行い修正処置を実行してください 3. サーバに複数のネットワークアダプタがある場合はアダプタが異なるサブネット上にあるように設定する必要がありますアダプタが同じサブネット上にある場合 TCP/IP は 2 つ目のアダプタを有効に利用できません 4. localhost がクラスタ内の各サーバで解決可能であることを確認してください DNS が実装されていない場合は /etc/hosts ファイルを編集して localhost 名のエントリを追加してくださいこのエントリはローカルサーバの IP アドレスをリストしたりデフォルトのエントリ ( ) をリストすることができます localhost が解決できない場合 LifeKeeper GUI が正常に機能しない可能性があります 5. DNS が実装されている場合は LifeKeeper クラスタ内のサーバが DNS を使用して解決できるように設定されていることを確認してください 6. 各サーバのホスト名が正しく LifeKeeper をインストールした後に変更されないことを確認してください後で LifeKeeper システムのホスト名を変更するように決定した場合はクラスタ内のすべてのサーバについて以下の手順に従う必要があります a. 次のコマンドを使用してクラスタ内のすべてのサーバ上の LifeKeeper を停止してください /opt/lifekeeper/bin/lkstop 40 SPS 環境のセットアップ

61 VLAN インターフェースサポートマトリックス b. Linux hostname コマンドを使用してサーバのホスト名を変更してください c. 続行する前に新しいホスト名がクラスタ内の各サーバで解決可能であることを確認する必要があります ( 前の項目を参照 ) d. クラスタ内の各サーバで次のコマンドを実行して LifeKeeper のホスト名を更新してください ( 詳細については lk_chg_value(1m) を参照してください ) /opt/lifekeeper/bin/lk_chg_value -o oldhostname -n newhostname e. 次のコマンドを使用して LifeKeeper を起動してください /opt/lifekeeper/bin/lkstart LifeKeeper for Linux v7.x ではコミュニケーションパスおよび IP リソース用の VLAN インターフェースがサポートされています VLAN インターフェースの種類は以下に示すように選択することができます VLAN インターフェースサポートマトリックス - サポートなし \ x サポートあり LK Linux v7.1 以前のバージョン VLAN_NAME_TYPE コミュニケーションパス IP リソース DEV_PLUS_VID (eth0.0100) - x DEV_PLUS_VID_NO_PAD (eth0.100) - x VLAN_PLUS_VID (vlan0100) x x VLAN_PLUS_VID_NO_PAD (vlan100) x x LK Linux v7.2 以降のバージョン VLAN_NAME_TYPE コミュニケーションパス IP リソース DEV_PLUS_VID (eth0.0100) x x DEV_PLUS_VID_NO_PAD (eth0.100) x x VLAN_PLUS_VID (vlan0100) x x VLAN_PLUS_VID_NO_PAD (vlan100) x x 切り替え可能な IP アドレスの作成切り替え可能な IP アドレスとはサーバ間で切り替えることができる仮想的な IP アドレスです各サーバのネットワークインターフェースカードに関連付けられた IP アドレスとは別個のものです LifeKeeper の保護下にあるアプリケーションは切り替え可能な IP アドレスに関連付けられていま SteelEye Protection Suite for Linux 41

62 データベースアプリケーションのインストールとセットアップすこれによりプライマリサーバで障害が発生した場合その IP アドレスがバックアップサーバに切り替わります切り替え可能な IP アドレスに対してリソース階層を設定することを計画している場合はクラスタの各サーバで以下の作業を実行する必要がありますコンピュータ名が正しく変更されないことを確認する ping コマンドを使用して切り替え可能な IP アドレスが一意であることを確認する /etc/hosts ファイルを編集して切り替え可能な IP アドレスごとにエントリを追加する詳細については LifeKeeper for Linux IP Recovery Kit テクニカルドキュメンテーションを参照してくださいデータベースアプリケーションのインストールとセットアップ使用する環境に Oracle Informix DB2 MySQL などの保護されたデータベースアプリケーションが含まれている場合はデータベースに付属のドキュメンテーションを使用してアプリケーションをインストールする必要がありますデータベースが共有ファイルシステム上にあり設定ファイルが共有ファイルシステム上にあることを確認してください実行可能ファイルはローカルまたは共有のファイルシステム上に置くことができます LifeKeeper をインストールした後にアプリケーションをインストールすることも可能ですが LifeKeeper の保護下に置く前に適切に設定され稼動することを確認するためにアプリケーションをテストする必要がありますインストールおよびセットアップ時のその他の考慮事項については特定の LifeKeeper データベースリカバリキットドキュメンテーションを参照してください 42 SPS 環境のセットアップ

63 SteelEye Protection Suite ソフトウェアのインストール SPS 設定の各サーバに SPS ソフトウェアをインストールします各 SPS サーバにはオプションの LifeKeeper リカバリキットパッケージを含む設定要件をサポートするために必要なパッケージが用意されている必要がありますコアパッケージとそれに続くオプションのリカバリソフトウェアを含む SPS インストールイメージファイル (sps.img) がインストールされますコアパッケージとそれに続くオプションのリカバリソフトウェアを含む SPS インストールイメージファイル (sps.img) がインストールされますこのイメージファイルはシステムへの SPS のインストール時に必要なユーザ対話型システムセットアップタスクを実行するように設計された一連のインストールスクリプトを提供しますインストールイメージファイルによってどのような Linux ディストリビューションを実行するかが識別され一連の質問と回答を通して正常な SPS インストールを確保するために必要なさまざまなパッケージがインストールされますまたサーバの Host ID を取得および表示するためのユーティリティを提供するライセンスユーティリティパッケージもインストールされます Host ID は SPS を実行するための有効なライセンスを取得するために使用されます詳細については SPS for Linux リリースノートを参照してください注記 : これらのインストール手順は読者がサーバにインストールされた Linux オペレーティングシステムに精通していることを前提としています重要 : 共有ストレージへの SPS のインストールはサポートされていません各サーバのローカルディスクに独自のコピーをインストールする必要があります SPS パッケージはすべてディレクトリ /opt/lifekeeper にインストールされます LifeKeeper の既存バージョンを再インストールする場合最初に古い LifeKeeper パッケージを削除する必要があります標準の LifeKeeper のインストールには既存のリソース階層の再定義が必要になります現在のリソース階層の定義を保持する場合は SPS for Linux リリースノートおよび SPS のアップグレードを参照してアップグレードの手順を確認してください SPS のインストール時に LifeKeeper Distribution Enabling パッケージを参照するエラーメッセージが表示された場合 SPS インストールイメージファイルで setup スクリプトを実行 / 再実行する必要があります SPS ソフトウェアのインストール SPS はお使いの Linux ディストリビューションに関わらずコマンドラインでインストールされます 1. 以下のコマンドを使用して sps.imgファイルをマウントしてください mount PATH/IMAGE_NAME MOUNT_POINT -t iso9660 -o loop SteelEye Protection Suite for Linux 43

64 SPS ソフトウェアのインストールここで PATH は spslk.img ファイルへのパスです IMAGE_NAME は spslk.img ファイルの名前です MOUNT_POINT はマウント位置へのパスです 2. sps.img マウントディレクトリに移動して次のコマンドを入力してください./setup 3. インストール手順の間に何が行われるかを説明するテキストが表示されますここで行われる一連の質問に対して Yes の場合は y No の場合は n と答えます質問の種類と順序はお使いの Linux ディストリビューションによって異なります各質問をよく読んで適切に回答してください正常な SPS インストールに必要なすべての手順を完了するために各質問に対して Yes と答えることをお勧めします注記 : インストールイメージファイルは共有ストレージデバイスまたはオプションのをサポートするためのカーネルモジュールをインストールすることができますカーネルのアップグレードに関する重要な情報 : SPS は一般的にいくつかの機能をサポートするためカーネルモジュールをインストールします ; そのため RedHat システムでカーネルパッチの適用 / カーネルのアップグレードを実施する際にインストールメディアから./setup スクリプトを再度実行し SPS の一部としてインストールしたカーネルを新しいカーネルとして有効にしてくださいこの操作を実施しない場合は SPS リソースを in service および / もしくは保護できない状態のままになります 4. ここでセットアップスクリプトがライセンスユーティリティのインストールを実行します詳細についてはライセンスの取得とインストールを参照してください 5. 次に SPS コアパッケージがインストールされます 6. セットアップスクリプトで提示されたすべての質問に答えるとインストールが成功したことが示されます注記 : セットアップスクリプトの実行に関する追跡情報が /var/log/lk_install.log に保存されます注記 : アップグレードの際にはセットアップの実行前に LifeKeeper を停止するようにしてください 7. クラスタの他のサーバにも SPS ソフトウェアを適宜同じ手順を使用してインストールしてください 8. 次に LifeKeeper のリカバリキットとオプションのソフトウェアパッケージを個々のイメージファイルから同じ手順を使用してインストールしてくださいアップグレード手順については LifeKeeper のアップグレードを参照してください 44 SteelEye Protection Suite ソフトウェアのインストール

ライセンスの取得とインストール SPS LifeKeeper for Linux ではサーバごとに固有のライセンスが必要になりますこのライセンスはランタイムライセンスですつまりライセンスがなくても LifeKeeper SPS をインストールできますが製品を正常に起動して実行するにはライセンスをインストールする必要があります注記 : RHEL 6.

65 ライセンスの取得とインストール SPS LifeKeeper for Linux ではサーバごとに固有のライセンスが必要になりますこのライセンスはランタイムライセンスですつまりライセンスがなくても LifeKeeper SPS をインストールできますが製品を正常に起動して実行するにはライセンスをインストールする必要があります注記 : RHEL 6.1 と共に新しいハードウェアを使用する場合は LifeKeeper SPS for Linux トラブルシューティングセクションにある RHEL 6.1 の既知の問題を参照してくださいインストールスクリプトはサーバの Host ID を取得して表示するラインセンスユーティリティパッケージをインストールします ( インストールスクリプトを介して表示される Host ID は常に MAC アドレスの Host ID になります IP アドレスの Host ID を使用する場合はインターネット Host ID の取得トピックを参照してください ) Host ID を SteelEye Protection Suite LifeKeeper ソフトウェアで提供された Entitlement ID ( 認証コード ) と共に使用して SteelEye Protection Suite LifeKeeper を実行するために必要なパーマネントライセンスを取得しますこのプロセスを以下の図に示します注記 : ソフトウェアパッケージごとにサーバごとのライセンスが必要になります以下の手順を実行して LifeKeeper SPS クラスタ内の各サーバに対するライセンスを取得してインストールしてください 1. Host ID を取得してくださいインストールセットアップスクリプトのライセンスユーティリティで表示される Host ID をメモしてください Host ID はライセンスを取得するシステムで /opt/lifekeeper/bin/lmhostid を実行して取得することもできます 2. Host ID をノートに書き留めるかファイルに保存してくださいファイルに保存した場合はそのファイルをインターネットアクセスが可能なシステムにコピーしてくださいノートに書き留めた場 SteelEye Protection Suite for Linux 45

66 プライマリネットワークのインターフェースを変更する場合ライセンス Rehost が必要合はそのノートをインターネットアクセスが可能なシステムのあるところに持って行ってください 3. LifeKeeper Entitlement ID ( 認証コード ) があることを確認してくださいライセンスの取得に必要な Entitlement ID を含むソフトウェアをメールで受け取っているはずです 4. SIOS Technology Corp. ラインセンス管理ポータルでライセンスを取得してください a. インターネットアクセスが可能なシステムを使用して SIOS Technology Corp. ラインセンス管理ポータルにログインしてください b. [Manage Entitlements] を選択してください注記 : パスワードを変更する場合は画面の右上隅にある [Profile] ボタンを使用してください c. [Entitlement ID] を探して行項目の左にあるボックスをオンにすることでその Entitlement ID に関連付けられた各 [Activation ID] を選択してください d. [Activate] タブを選択してください e. 必要なフィールドを定義して [Next] を選択してください f. [Select Existing Host] をクリックして定義済みのホストを選択するか [Add New Host] を選択することで新しいホストを作成してください g. [Host ID] を入力して [Okay] をクリックしてください h. [Host ID] の左にあるボックスをオンにして [Generate] を選択してください [Fulfillment ID] が [License Summary] 画面に表示されます i. [Fulfillment ID] の左にあるボックスをオンにして [ License] タブを選択してください j. ラインセンスの送信先となる有効なメールアドレスを入力して [Send] を選択してください k. [Complete] を選択してください l. メールを取得してください m. ファイルを適切なシステムにコピーにしてください 5. ラインセンスをインストールしてください各システムでライセンスファイルを /var/lifekeeper/license にコピーするかまたは各システムで /opt/lifekeeper/bin/lkkeyins を実行してファイルに対するファイル名 ( フルパスを含む ) を指定してくださいプライマリネットワークのインターフェースを変更する場合ライセンス Rehost が必要ライセンスユーティリティで使用する Host ID は LifeKeeper サーバのプライマリネットワークインターフェースカード (NIC) から取得されます LifeKeeper では起動するたびにライセンスが有効かどうかを確認します LifeKeeper サーバで将来 NIC の交換が必要になり Host ID が変更されることになる場合は次回 LifeKeeper を停止するときに LifeKeeper を再起動する前にライセンス Rehost を実行する 46 ライセンスの取得とインストール

67 インターネット /IP ライセンス必要があります SIOS Technology Corp. ライセンス管理ポータルにログインして [Manage Licenses] 画面から [Support Actions/Rehost] を選択してこの Rehost を実行してください ( 注記 : Rehost はサポートに連絡することなく 6 カ月に一度実行することができます ) インターネット /IP ライセンスインターネット /IP ライセンスに関する情報については LifeKeeper SPS for Linux トラブルシューティングセクションの既知の問題およびインターネット Host ID の取得を参照してくださいサブスクリプションライセンスサブスクリプションライセンスとは更新機能を持つ期限付きライセンスです評価版ライセンスと同様に更新せずに一定期間を過ぎるとライセンスが切れますこの更新プロセスを自動的に行うようにするには以下の手順に従います ( 注記 : サブスクリプション更新サービスでは TCP/IP ポート 443 で SIOS Technology Corp. ライセンス管理サーバにアクセスするためにインターネット接続が必要になります ) 1. 次のコマンドを実行してください /opt/lifekeeper/bin/runsubscriptionservice start 2. プロンプトが表示されたら (SIOS Technology Corp. カスタマー登録で取得した ) ユーザ ID とパスワードを入力してください前の手順が正常に実行された場合はサブスクリプション更新サービスが実行されるようになりバックグラウンドで更新ステータスのチェックが定期的に行われます特定の日数 ( ) 後に期限が切れるライセンスが見つかると syslog (/var/log/messages) に警告通知が送信されライセンスの更新が実行されます新しいライセンスのアクティベーションが可能な ( このシステムの Entitlement に対して新しいアクティベーションが購入されている ) 場合自動的にアクティベーションが実行され古いライセンスを交換するシステム上に新しいライセンスがインストールされますこのシステムに対するライセンスが更新される ( アクティベーションが購入される ) 限りこのサービスによりユーザが操作することなくシステム上でライセンスのアップグレードが確実に実行されますサブスクリプションライセンスのトラブルシューティングエラーが発生した場合はサポートに連絡する前に以下の作業を実行してください LifeKeeper Log と syslog (/var/log/messages) のエラーメッセージを確認してください必要に応じて次のコマンドを実行してメッセージを取得してください /opt/lifekeeper/bin/lmsubscribe --immediate SIOS Technology Corp. ライセンス管理ポータルにログインして資格情報を確認してください次のコマンドを使用して資格情報を入力してください /opt/lifekeeper/bin/lmsubscribe -login これが正常に実行された場合は次のコマンドを実行してサービスを開始してください /opt/lifekeeper/bin/runsubscriptionservice start SteelEye Protection Suite for Linux 47

68 インターネット Host ID の取得ライセンス管理ポータルでパスワードを変更した場合は次のコマンドを実行して自動ライセンス更新サービスをアップデートしてください /opt/lifekeeper/bin/lmsubscribe --login ライセンス証明書の所有権が変更された場合は SIOS Technology Corp. のサポート担当者に連絡して証明書を新しい所有者に移転してください所有権が移転されたらこの新しい資格情報を使用して自動ライセンス更新サービスをアップデートする必要がありますこの操作を実行するには新しいユーザ ID とパスワードを使用して次のコマンドを実行してください /opt/lifekeeper/bin/lmsubscribe --login インターネット Host ID の取得マシンのインターネット Host ID を取得するには lmhostid を使用しますインターネット Host ID は通常システムのプライマリネットワークインターフェースのプライマリ IP アドレスですインターネット Host ID は Ethernet ( または MAC) Host ID の代替として使用することができ VM クローンのために MAC アドレスが変更される可能性がある仮想環境において望ましいと考えられます例 : 1. 次のコマンドを入力してください # /opt/lifekeeper/bin/lmhostid -internet -n 2. プログラムから返される ID を記録してください # /opt/lifekeeper/bin/lmhostid -internet -n "INTERNET= " 注記 : この情報は SIOS Technology Corp. から取得したパーマネントライセンスキーに記載されている情報と一致する必要があります SPS LifeKeeper インストールの確認 SPS LifeKeeper パッケージが正しくインストールされていることを確認するにはコマンドラインで次のコマンドを入力してください rpm -V <package name> 注記 : パッケージが正しくインストールされている場合このコマンドは何も出力しませんコマンドラインからクエリを実行するには次のコマンドを入力してください rpm -qi <package name> 注記 : このコマンドの予想される出力はパッケージ情報です LifeKeeper SPS のアップグレード SPS for Linux は既存のリソース階層を維持しながら将来のリリースにアップグレードすることできますこの情報をよく検討してアプリケーションのダウンタイムを最小限に抑えるようにしてください 48 ライセンスの取得とインストール

69 LifeKeeper SPS のアップグレード注記 : LifeKeeper は LifeKeeper Version 7.4 または Version 7.5 から Version 8.0 にアップグレードすることができます 7.4 または 7.5 以外のバージョンからアップグレードする場合は古いバージョンをアンインストールしてから SteelEye Protection Suite for Linux を再インストールする必要があります古いバージョンをアンインストールする代わりに古いバージョンを 7.4 または 7.5 にアップグレードしてから 8.0 へのアップグレードを実行する方法もあります注記 : アップグレード時に lkbackup を使用する場合は lkbackup 既知の問題を参照して詳細を確認してください 1. 2 つのノードのみを持つ SPS クラスタをアップグレードする場合は直接手順 2 に進んでください 3 つ以上のノードを持つ SPS クラスタをアップグレードする場合はすべてのアプリケーションをこれからアップグレードするサーバから切り替えてくださいこの操作を実行するには手動で行うかまたは LifeKeeper シャットダウン方法を Switchover に設定しますこれにより LifeKeeper が停止したりサーバがシャットダウンしたときにアプリケーションが切り替えられます 2. 必要に応じて LifeKeeper SPS をアップグレードする前に Linux オペレーティングシステムをアップグレードしてくださいオペレーティングシステムのアップグレードを実行する前にアップグレードするサーバのすべてのリソースを拡張解除することをお勧めします 3. LifeKeeper SPS インストールイメージファイルを使用して LifeKeeper をアップグレードしてください次のコマンドを使用して SPS インストールイメージファイルをマウントしてください mount PATH/IMAGE_NAME MOUNT_POINT -t iso9660 -o loop ここで PATH はイメージへのパスです IMAGE_NAME はイメージの名前です MOUNT_POINT はマウント位置へのパスです 4. spslk.img マウントディレクトリに移動して次のコマンドを入力してください./setup パッケージがアップグレードされていることを確認する情報メッセージが表示されます 5. アップグレードが終了したら LifeKeeper GUI を停止してから再起動し更新された GUI クライアントをロードしてください 6. 3 つ以上のノードを持つ SPS クラスタをアップグレードする場合はすべてのアプリケーションをこれからアップグレードするサーバから切り替えてください 7. アップグレードする SPS クラスタのサーバごとにこの手順を繰り返してください注記 : 同じバージョンおよびリリースの SPS は 1 つのクラスタ内のすべてのシステムにインストールする必要があります一般的に異なるバージョンまたはリリースの SPS の間には互換性がありませんローリングアップグレード以外の状況で異なるバージョンまたはリリースが存在しクラスタ内の別のシステムで実行されている場合には LifeKeeper を起動しないでください SteelEye Protection Suite for Linux 49

71 Chapter 3: SteelEye DataKeeper for Linux はじめに SteelEye LifeKeeper for Linux はさまざまなストレージ構成をサポートし最大 32 ノードの高可用性クラスタリングを提供します共有ストレージ ( ファイバチャネル SAN iscsi) ネットワーク接続ストレージ ( NAS) ホストベースの複製 HP Continuous Access などのアレイベースの SAN 複製との統合などをサポートします保護対象のリソース LifeKeeper ファミリの製品には多様なシステムリソースにフェイルオーバ保護を提供できるソフトウェアがあります以下の図に LifeKeeper の柔軟性および自動リカバリを指定できるリソースタイプを示しますファイルシステム LifeKeeper では ext2 ext3 ext4 reiserfs NFS vxfs xfs などのファイルシステムの指定とフェイルオーバができます通信リソース LifeKeeper には TCP/IP のような通信リソースの通信 Recovery Kit が用意されていますインフラストラクチャリソース LifeKeeper には NFS Samba LVM WebSphere MQ ソフトウェア RAID (md) など Linux インフラストラクチャサービス用のオプションの Recovery Kit が用意されています Web サーバリソース LifeKeeper には Apache Web サーバリソース用のオプションの Recovery Kit が用意されていますメールサーバリソース LifeKeeper には Postfix 電子メールサービス用のオプションの Recovery Kit が用意されていますデータベースとその他のアプリケーション LifeKeeper には Oracle Informix MySQL DB2 PostgreSQL Sybase SAP DB/MaxDB などの主要な RDBMS 製品および SAP や ClearCase などのエンタープライズアプリケーション用のオプションの Recovery Kit が用意されています LifeKeeper は多様なリソースタイプについて複数の回復方法をサポートします SteelEye Protection Suite for Linux 51

LifeKeeper Core LifeKeeper Core LifeKeeper Core は以下の 4 つの主要コンポーネントで構成されています LifeKeeper Core ソフトウェア File System Generic Application Raw I/O および IP の Recovery Kit ソフトウェア LifeKeeper GUI ソフトウェア

72 LifeKeeper Core LifeKeeper Core LifeKeeper Core は以下の 4 つの主要コンポーネントで構成されています LifeKeeper Core ソフトウェア File System Generic Application Raw I/O および IP の Recovery Kit ソフトウェア LifeKeeper GUI ソフトウェア LifeKeeper のマニュアルページ LifeKeeper Core ソフトウェア LifeKeeper Core ソフトウェアは以下のコンポーネントで構成されます LifeKeeper 構成データベース (LCD) - LCD は LifeKeeper が保護するリソースの情報を保存しますリソースインスタンス依存関係イクイバレンシ情報リカバリの方向 LifeKeeper の動作フラグに関する情報が含まれますシステムの起動後にデータが記憶されているようにデータは共有メモリにキャッシュされファイルに保存されます LCD インターフェース (LCDI) - LCDI は LCD に保存されているデータやデータの変更を要求するクエリを設定データベース (LCD) にクエリを送信しますまたリソースの状態や説明の情報を取得するために Application Recovery Kit が LCDI を使用することもできます LifeKeeper Communications Manager (LCM) - LCM はクラスタ内にあるサーバのステータスの特定および LifeKeeper のプロセス間通信 ( ローカルとリモート ) に使用されますクラスタ内のあるサーバ上にあるすべてのコミュニケーションパスで LCM 通信がないことはサーバに障害が発 52 SteelEye DataKeeper for Linux

73 File System Generic Application IP および RAW I/O の Recovery Kit ソフトウェア生したことを示します LifeKeeper アラームインターフェース - LifeKeeper アラームインターフェースはイベントを起動するためのインフラストラクチャです LifeKeeper が保護するリソースに障害が検出された場合アプリケーションデーモンにより sendevent プログラムが呼び出されます sendevent プログラムが LCD と通信しリカバリプロセスが使用可能かどうかを判断します LifeKeeper のローカルリカバリ動作と制御のインターフェース ( LRACI) - LRACI はリソースに適切なリカバリスクリプトを判断しリソースに適切な restore / remove スクリプトを呼び出します File System Generic Application IP および RAW I/O の Recovery Kit ソフトウェア LifeKeeper Core はサーバ上の指定リソースを保護しますリソースを以下に示します File Systems - LifeKeeper では共有ストレージデバイス上にあるファイルシステムの指定とフェイルオーバができますファイルシステムは共有 SCSI バス経由で 2 台のサーバからアクセス可能なディスク上に作成できます LifeKeeper のファイルシステムリソースは 1 台目のサーバに作成されてから 2 台目のサーバに拡張されますファイルシステムの健全性監視がディスクフルと不適切なマウント ( またはアンマウント ) のファイルシステム条件を検出します検出した条件に従って Recovery Kit が警告メッセージのログ記録ローカルリカバリの試行またはファイルシステムリソースのバックアップサーバへのフェイルオーバを実行できます File System Recovery Kit に関連するヘルプトピックとしてファイルシステムのリソース階層の作成拡張ファイルシステムの健全性の監視などがあります Generic Applications - Generic Application Recovery Kit はリソースタイプに対して事前定義リカバリキットが指定されていない汎用アプリケーションやユーザ定義アプリケーションを保護できますこのキットを使用すると特定アプリケーションについてカスタマイズした監視スクリプトやリカバリスクリプトを指定できます Generic Application Recovery Kit に関連するヘルプトピックとして汎用アプリケーションのリソース階層の作成拡張などがあります IP Addresses - IP Recovery Kit には LifeKeeper 環境で障害が発生したプライマリサーバから切り替え可能な IP アドレスをバックアップサーバにリカバリするメカニズムがあります切り替え可能な IP アドレスとはサーバ間で切り替えることができる仮想 IP アドレスであり各サーバのネットワークインターフェースカードに関連付けられている IP アドレスとは別のものです LifeKeeper で保護されているアプリケーションは切り替え可能な IP アドレスに関連付けられているのでプライマリサーバに障害が発生した場合切り替え可能な IP アドレスはバックアップサーバに関連付けられます LifeKeeper で保護されているリソースは切り替え可能な IP アドレスです特定の製品構成および管理に関する情報についてはリカバリキットに含まれる IP Recovery Kit Technical Documentation を参照してください RAW I/O - RAW I/O Recovery Kit はカーネルのバッファリングを迂回するアプリケーションのロー I/O デバイスをサポートします RAW I/O Recovery Kit では共有ストレージデバイスにボンディングされた RAW デバイスの指定とフェイルオーバができます RAW デバイスはリソースの作成前にプライマリノードに設定する必要がありますローリソースを作成した後追加サーバに拡張できます SteelEye Protection Suite for Linux 53

74 LifeKeeper GUI ソフトウェア LifeKeeper GUI ソフトウェア LifeKeeper GUI は Java テクノロジを使用して開発されたクライアント / サーバアプリケーションであり LifeKeeper およびその設定データ用のグラフィカルな管理インターフェースです LifeKeeper GUI クライアントはスタンドアロンの Java アプリケーションおよび Web ブラウザから呼び出される Java アプレットの両方として実装されます LifeKeeper のマニュアルページ LifeKeeper 製品用の LifeKeeper Core のリファレンスマニュアルページです設定の概念 LifeKeeper は 2 台以上のサーバを持つグループに対してユーザが定義したリソース階層に基づいて機能します以下のトピックで LifeKeeper のフェイルオーバ設定の概念を説明しています共通のハードウェアコンポーネント LifeKeeper のすべての設定には以下の共通コンポーネントが含まれます 1. サーバグループ LifeKeeper が提供する障害回復機能は 2 台以上のサーバをクラスタにグループ化することを基礎にしていますサーバはサポートする Linux のディストリビューションを実行するサポートするプラットフォームであればいずれでもかまいません LifeKeeper には複数の重なり合うグループにサーバを設定する柔軟性がありますただしリカバリ可能なリソースについての重要な要件はリソースの役割と優先順位が定義されたサーバのグループをリンクすることですリソースに対するサーバの優先順位は現在実行中のサーバに障害が発生した場合にどのサーバがそのリソースを復旧するかを決定するために使用されます最高の優先順位を示す値は 1 です特定のリソースについて最高の優先順位の値 ( 通常は 1) を持つサーバが通常そのリソースのプライマリサーバと呼ばれますその他のサーバはそのリソースのバックアップサーバとして定義されます 2. コミュニケーションパス LifeKeeper のハートビートは LifeKeeper クラスタ内にあるサーバ間の定期的なメッセージで主要な障害検出機能ですクラスタ内のすべてのサーバには単純な通信障害でシステムに障害が発生しないように冗長なハートビートコミュニケーションパス (comm パス ) が必要です 2 つの独立したサブネットを使用する LAN ベース (TCP) の個別な 2 つのコミュニケーションパスが推奨されます ( 少なくとも 1 つのコミュニケーションパスをプライベートネットワークとして設定してください ) ただし TCP と TTY のコミュニケーションパスの組み合わせの使用もサポートしています TCP コミュニケーションパスは他のシステムの通信にも使用できます注記 : TTY コミュニケーションパスはクラスタ内の他のサーバがアクティブかどうかを検出するためにのみ LifeKeeper で使用されます LifeKeeper の GUI は TCP/IP を使用して保護するリソースに関するステータス情報を通信します TCP コミュニケーションパスが 2 つ設定されている場合 LifeKeeper はパブリックネットワークのコミュニケーションパスをリソースステータスの通信に使用しますこのため LifeKeeper の GUI が使用しているネットワークがダウンすると TTY ( または他の TCP) コミュニケーションパスが動作可能な場合でも GUI には他のサーバのステータスが UNKNOWN として表示されます 54 SteelEye DataKeeper for Linux

すべての LifeKeeper 設定に共通するコンポーネント 3. 共有データリソース共有ストレージの構成では LifeKeeper クラスタ内のサーバは同一セットのディスクに対するアクセスを共有しますプライマリサーバに障害が発生した場合 LifeKeeper は障害が発生したサーバ上にあるディスクのロック解除および次に使用可能なバックアップサーバのディスクのロックを自動管理します 4.

75 すべての LifeKeeper 設定に共通するコンポーネント 3. 共有データリソース共有ストレージの構成では LifeKeeper クラスタ内のサーバは同一セットのディスクに対するアクセスを共有しますプライマリサーバに障害が発生した場合 LifeKeeper は障害が発生したサーバ上にあるディスクのロック解除および次に使用可能なバックアップサーバのディスクのロックを自動管理します 4. 共有通信 LifeKeeper は TCP/IP アドレスのような通信リソースの切り替えを自動管理できるのでアプリケーションが現在どのサーバでアクティブになっているかには無関係にユーザはアプリケーションに接続できますすべての LifeKeeper 設定に共通するコンポーネントシステムのグループ化の配置リソース階層は LifeKeeper サーバのクラスタに対して定義されますある階層について各サーバに優先順位が割り当てられます 1 が最高の優先順位ですプライマリつまり優先順位が最高のサーバがそれらのリソースの通常動作に使用するコンピュータです 2 番目に高い優先順位を持つサーバがバックアップサーバでありプライマリサーバに障害が発生した場合に LifeKeeper がリソースを切り替え SteelEye Protection Suite for Linux 55

76 アクティブ - アクティブのグループ化る先のサーバですアクティブ / アクティブのグループではすべてのサーバがプロセスをアクティブに実行しますただし他のサーバのリソース階層ではバックアップサーバとしても機能しますアクティブ / スタンバイのグループではプライマリサーバは処理を実行しバックアップサーバはプライマリサーバに障害が発生した場合に備えてスタンバイするように設定できますスタンバイシステムは小型でパフォーマンスの低いシステムでもかまいませんがプライマリサーバに障害が発生した場合にリソースの可用性を確保できるだけの処理能力が必要です共有リソースに対する物理的な接続とアクセスによりグループ化のオプションが決まりますグループ化するサーバには通信とハートビートパスがインストールされ動作可能である必要がありすべてのサーバが共有 SCSI またはファイバチャネルインターフェース経由でディスクリソースにアクセスできる必要があります例えば以下の図ではサーバ 1 のリソース AppA にはグループ化オプションが 1 つのみありますこの構成で AppA データベースへの共有アクセスを持つ他のサーバはサーバ 2 のみですただしサーバ 3 のリソース AppB はその他 3 台のいずれを含むグループにも属するように設定できますこれはこの例の共有 SCSI バスが構成内の 4 台すべてのサーバに AppB データベースへのアクセスを提供しているからですアクティブ - アクティブのグループ化アクティブ / アクティブペアの設定ではすべてのサーバがプロセスをアクティブに実行しますまた他のサーバのリソース階層ではバックアップサーバとして機能します以下の設定例に 2 つのアクティブ / アクティブペアのサーバを示しますサーバ 1 は AppA を処理していますがサーバ 2 で実行中の AppX のバックアップサーバとして機能しますこの逆も当てはまりますサーバ 2 は AppX を処理していますがサーバ 1 で実行中の AppA のバックアップサーバとして機能しますサーバ 3 とサーバ 4 の間には同じタイプのアクティブ / アクティブの関係がありますサーバ 1 とサーバ 2 の設定とサーバ 3 とサーバ 4 の設定は似ていますが大きな違いがあります AppA と AppX のアプリケーションについてサーバ 1 とサーバ 2 のみをグループ化できますこれらのサーバのみが共有リソースにアクセスできます 56 SteelEye DataKeeper for Linux

アクティブ - スタンバイのグループ化ただし AppB と AppC は複数のグループ化オプションを持ちますこれは 4 台のサーバすべてが AppB と AppC の共有リソースにアクセスできるからです AppB と AppC は第 3 第 4 のバックアップシステムとしてサーバ 1

がアクティブに AppB を処理しているときにはサーバ 1 サーバ 2 およびサーバ 4 は物理的に接続していても AppB のディスクリソースを使用できませんアクティブ - スタンバイのグループ化アクティブ / スタンバイのペア設定ではプライマリサーバは処理を実行し

77 アクティブ - スタンバイのグループ化ただし AppB と AppC は複数のグループ化オプションを持ちますこれは 4 台のサーバすべてが AppB と AppC の共有リソースにアクセスできるからです AppB と AppC は第 3 第 4 のバックアップシステムとしてサーバ 1 やサーバ 2 にフェイルオーバするように設定することもできます注記 : LifeKeeper はディスクレベルでロックを適用するので AppB と AppC のディスクリソースに接続する 4 つのシステムのうち任意の時点でそれらにアクセスできるのは 1 つのみですこのためサーバ 3 がアクティブに AppB を処理しているときにはサーバ 1 サーバ 2 およびサーバ 4 は物理的に接続していても AppB のディスクリソースを使用できませんアクティブ - スタンバイのグループ化アクティブ / スタンバイのペア設定ではプライマリサーバは処理を実行しバックアップサーバはプライマリサーバに障害が発生した場合に備えてスタンバイしますスタンバイシステムは小型でパフォーマンスの低いシステムでもかまいませんがプライマリサーバに障害が発生した場合にリソースの可用性を確保できるだけの処理能力が必要です SteelEye Protection Suite for Linux 57

78 インテリジェントスイッチバックと自動スイッチバックの違いスタンバイサーバは複数のアクティブサーバにバックアップを提供します例えば上の図では 3 つのアクティブ / スタンバイのリソースペアでサーバ 2 がスタンバイサーバです LifeKeeper のリソース定義が以下のアクティブ / スタンバイのペアの関係を指定しますサーバ 1 の AppA がサーバ 2 にフェイルオーバするサーバ 3 の AppB がサーバ 2 にフェイルオーバするサーバ 4 の AppC がサーバ 2 にフェイルオーバする複数のアクティブ / スタンバイグループを持つ設定を検討するときには以下の 3 つの重要な設定概念を念頭に置いてくださいディスクの所有権複数の異なるアクティブなアプリケーションは異なる複数のサーバから同じ共有ディスクまた LUN にあるディスクパーティションを使用できません LifeKeeper はディスクまたは LUN のレベルでロックを適用します SCSI ロックが適用された場合共有 SCSI バス上にあるシステム 1 台のみがディスクまたは LUN のパーティションにアクセスできますこのため同一ディスク上の異なるパーティションにアクセスする複数のアプリケーションは同一サーバ上でアクティブにする必要がありますこの例ではサーバ 3 が AppB のディスクリソースを所有しサーバ 4 が AppC のリソースを所有します処理能力サーバ 1 サーバ 3 およびサーバ 4 に同時に障害が発生する可能性は非常に低いですが複数のリソース関係をサポートするスタンバイサーバを指定するときには複数の障害が発生した場合にスタンバイサーバが重要な処理のすべてを処理できるように注意する必要があります LifeKeeper の管理この例ではサーバ 2 がその他 3 台のサーバをバックアップします一般的に LifeKeeper のデータベースを複数の論理グループで同時に管理することは望ましくありませんはじめに予備システムと 1 台のアクティブなシステムとの間でリソースを作成し次に予備システムと別のアクティブなシステムとの間という手順を繰り返してリソースを作成する必要がありますインテリジェントスイッチバックと自動スイッチバックの違いデフォルトではリソースのスイッチバック設定はインテリジェントですこれはそのリソースについてサーバ A からサーバ B にフェイルオーバが発生すると別の障害が発生するか管理者がリソースを別のサーバにインテリジェントに切り替えるまでリソースはサーバ B に残りますこのためサーバ A が In Service に戻った後もリソースはサーバ B で動作を続行しますこの時点ではサーバ A はリソースのバックアップとして機能します状況によっては障害が発生したサーバが復旧したときにリソースをそのサーバに自動でスイッチバックすることが望ましい場合があります LifeKeeper には前述したデフォルトのインテリジェントスイッチバック動作に代わる選択肢として自動スイッチバックオプションがありますこのオプションは各サーバの個々のリソース階層に設定できます特定のサーバ上にあるリソース階層に自動スイッチバックを選択しそのサーバに障害が発生した場合そのリソース階層はバックアップシステムにフェイルオーバします障害が発生したサーバが復旧したときにリソース階層は元のサーバに自動的にスイッチバックします注記 : 自動スイッチバックのチェックは LifeKeeper を起動したときまたはクラスタに新しいサーバを追加したときにのみ実行されます通常のクラスタ動作中には実行されません 58 SteelEye DataKeeper for Linux

79 syslog によるログの記録 LifeKeeper は優先順位が上位のサーバから下位のサーバへの自動スイッチバックを実行しません syslog によるログの記録 LifeKeeper 8.0 から標準の syslog 機能を使用してログの記録が行われます LifeKeeper では 3 つの syslog の実装 ( 標準の syslog rsyslog および syslog-ng) をサポートしてますパッケージのインストール時にはすべての LifeKeeper ログメッセージに対して local6 機能を使用するように syslog が設定されますすべての LifeKeeper ログメッセージを /var/log/lifekeeper.log に送信する LifeKeeper 固有のルーティングを含むように syslog 設定ファイル (/etc/syslog-ng/syslog-ng.conf など ) が変更されます ( 元の設定ファイルは ~ で終わる同じ名前を使用してバックアップされます ) この機能はインストール後に /opt/lifekeeper/bin にある lklogconfig ツールを使用して変更することができますこのツールの詳細については LifeKeeper がインストールされているシステム上の lklogconfig(8) マニュアルページを参照してください注意 : LifeKeeper がサーバから削除されると LifeKeeper 固有の syslog 設定が削除されますリソース階層 LifeKeeper の GUI を使用するとあるサーバにリソース階層を作成し次にその階層を 1 台以上のバックアップサーバに拡張できますその後 LifeKeeper により指定したすべてのサーバに指定階層が自動作成されます LifeKeeper は各サーバのデータベースで階層情報を管理しますコマンドラインインターフェースを使用する場合は各サーバの階層を明示的に指定する必要がありますリソース階層の作成後 LifeKeeper が階層内のリソースの停止と開始を管理します以下の関連トピックで階層の指定作業の基本情報を説明していますリソースタイプリソースはハードウェアとソフトウェアのいずれかでありリソースタイプ別に分類できます LifeKeeper はファイルシステムと SCSI のリソースタイプに処理を提供しリカバリキットは通信 RDBMS その他のアプリケーションのリソースタイプに処理を提供します例えば保護するファイルシステムの階層には以下のタイプのリソースインスタンスが含まれます filesys - Linux のファイルシステムリソースオブジェクトでマウントポイントにより識別されます device - SCSI ディスクパーティションと仮想ディスクでデバイスファイル名で識別されます ( 例 : sdc1) disk - SCSI ディスクまたは RAID システム論理ユニットで SCSI デバイス名で識別されます ( 例 : sd) SteelEye Protection Suite for Linux 59

リソースの状態リソースの状態状態 In Service 保護 (ISP) 意味リソースが動作可能です LifeKeeper のローカルリカバリが正常に動作しています LifeKeeper のサーバ間リカバリと障害検出が動作可能です In Service 未保護 (ISU) Out of Service 障害 (OSF) Out of Service 障害なし (OSU)

80 リソースの状態リソースの状態状態 In Service 保護 (ISP) 意味リソースが動作可能です LifeKeeper のローカルリカバリが正常に動作しています LifeKeeper のサーバ間リカバリと障害検出が動作可能です In Service 未保護 (ISU) Out of Service 障害 (OSF) Out of Service 障害なし (OSU) リソースが動作可能ですこのリソースについて LifeKeeper のローカルリカバリ方式が動作不能です LifeKeeper のサーバ間リカバリと障害検出が動作可能ですリソースが障害により Out of Service になっていますリカバリは完了していないか失敗しましたこのリソースについて LifeKeeper の警告機能は動作不能ですリソースは Out of Service ですが別のサーバからリソースを引き継ぐことができます不正 ( 未定義 ) 状態 (ILLSTATE) この状態はリソースインスタンスについて状態が設定されていない場合に表示されます通常の状況ではこの不正状態が長く続くことはありませんある状態から別の状態への移行が予測されます LifeKeeper の情報テーブルがすべて更新される前 (LifeKeeper が初めて起動するときなど ) にスイッチオーバが発生した場合にこの状態になります 60 SteelEye DataKeeper for Linux

81 階層の関係階層の関係 LifeKeeper ではリソースインスタンス間の関係を作成できます主な関係は依存関係で例えばあるリソースインスタンスが動作するために別のリソースインスタンスに依存しますリソースインスタンスと依存関係の組み合わせがリソース階層です例えば /usr1 の動作はディスクサブシステムに依存するので /usr1 とディスクサブシステムを表すインスタンスとの間に順序付きの階層の関係を作成できますリソース階層により指定された依存関係はリソースインスタンスを In Service と Out of Service にする適切な順序を LifeKeeper に示しますこのリソース階層の例では disk と device のインスタンスを正常に In Service にするまで LifeKeeper は /usr1 リソースを In Service にすることができませんイクイバレンシ情報 LifeKeeper リソース階層を作成して拡張するとそのリソース階層はプライマリサーバとセカンダリサーバの両方に存在しますほとんどのリソースインスタンスは 1 台のサーバでのみ同時にアクティブにできますこのようなリソースについて LifeKeeper はイクイバレンシ情報という第 2 の種類の関係を定義しますこれによりリソースがあるサーバで In Service になるとイクイバレンシ情報が定義されている他のサーバでは Out of Service になります以下の例に各サーバのディスクパーティションのリソースインスタンス間のイクイバレンシ情報を示しますこの例では各リソースインスタンスが類似のイクイバレンシを持ちます SteelEye Protection Suite for Linux 61

リソース階層の情報リソース階層の情報各リソースのステータスはステータスの詳細表示とステータスの簡略表示で表示されます root リソースを表す LifeKeeper のタグ名は [TAG] 列の左端から開始され階層内のリソースのタグ名は適切にインデントされてリソース間の依存関係を表します以下の例はステータスの簡略表示のリソース階層セクションから取ったものです ( デバイスとディスクの

82 リソース階層の情報リソース階層の情報各リソースのステータスはステータスの詳細表示とステータスの簡略表示で表示されます root リソースを表す LifeKeeper のタグ名は [TAG] 列の左端から開始され階層内のリソースのタグ名は適切にインデントされてリソース間の依存関係を表します以下の例はステータスの簡略表示のリソース階層セクションから取ったものです ( デバイスとディスクの ID は表示領域に収まるように切り詰められている ) LOCAL TAG ID STATE PRIO PRIMARY svr1 app3910-on-svr1 app4238 ISP 1 svr2 svr1 filesys4083 /jrl1 ISP 1 svr2 svr1 device ISP 1 svr2 svr1 disk ISP 1 svr2 階層の図についてはリソース階層の例のトピックを参照してください詳細についてはステータスの詳細表示とステータスの簡略表示のトピックのリソース階層の情報セクションを参照してください 62 SteelEye DataKeeper for Linux

リソース階層の例リソース階層の例ステータスの詳細表示このトピックでは lcdstatus コマンドの出力例を使用してステータスの詳細表示で提供される情報のカテゴリについて説明しますこの情報を表示する方法の詳細については LCD (1M) のマニュアルページを参照してくださいコマンドラインに man lcdstatus または man LCD を入力できます LifeKeeper の

83 リソース階層の例リソース階層の例ステータスの詳細表示このトピックでは lcdstatus コマンドの出力例を使用してステータスの詳細表示で提供される情報のカテゴリについて説明しますこの情報を表示する方法の詳細については LCD (1M) のマニュアルページを参照してくださいコマンドラインに man lcdstatus または man LCD を入力できます LifeKeeper の GUI で使用できるステータス情報についてはサーバーのステータスの表示またはリソースのステータスの表示を参照してくださいステータスの詳細表示の例 : シャットダウンストラテジー Resource hierarchies for machine "wileecoyote": ROOT of RESOURCE HIERARCHY apache-home.fred: id=apache-home.fred app=webserver type=apache state=isp initialize=(autores_isp) automatic restore to IN-SERVICE by LifeKeeper info=/home/fred /usr/sbin/httpd reason=restore action has succeeded depends on resources: ipeth ,ipeth ,ipeth Local priority = 1 SteelEye Protection Suite for Linux 63

84 ステータスの詳細表示 SHARED equivalency with "apache-home.fred" on "roadrunner", priority = 10 FAILOVER ALLOWED ipeth : id=ip app=comm type=ip state=isp initialize=(autores_isp) automatic restore to IN-SERVICE by LifeKeeper info=wileecoyote eth fffffc00 reason=restore action has succeeded these resources are dependent: apache-home.fred Local priority = 1 SHARED equivalency with "ipeth " on "roadrunner", priority = 10 FAILOVER ALLOWED ipeth : id=ip app=comm type=ip state=isp initialize=(autores_isp) automatic restore to IN-SERVICE by LifeKeeper info=wileecoyote eth fffffc00 reason=restore action has succeeded these resources are dependent: apache-home.fred Local priority = 1 SHARED equivalency with "ipeth " on "roadrunner", priority = 10 FAILOVER ALLOWED ipeth : id=ip app=comm type=ip state=isp initialize=(autores_isp) automatic restore to IN-SERVICE by LifeKeeper info=wileecoyote eth fffffc00 reason=restore action has succeeded These resources are dependent: apache-home.fred Local priority = 1 SHARED equivalency with "ipeth " on "roadrunner", priority = 10 FAILOVER ALLOWED 通信ステータスの情報 The following LifeKeeper servers are known: machine=wileecoyote state=alive machine=roadrunner state=dead (eventslcm detected failure at Wed Jun 7 15:45:14 EDT 2000) The following LifeKeeper network connections exist: 64 SteelEye DataKeeper for Linux

85 リソース階層の情報 to machine=roadrunner type=tcp addresses= / state="dead" priority=2 #comm_downs=0 LifeKeeper のフラグ The following LifeKeeper flags are on: shutdown_switchover シャットダウンストラテジー The shutdown strategy is set to: switchover. リソース階層の情報 LifeKeeper はリソースのステータスを root リソースから表示します表示にはリソースのすべての依存関係についての情報が含まれます複数のリソースに共通する要素は最初の root リソースの下に 1 回のみ表示されます各リソース記述の第 1 行にはリソースタグとその後に続くコロン (:) が表示されます ( 例 : device13557:) 階層内でリソースの記述に使用できる情報要素を以下に示します id - LifeKeeper が使用する一意のリソース識別文字列 app - アプリケーションのタイプを示します例えばサンプルリソースは Web サーバアプリケーションです type - リソースのクラスタイプを示します例えばサンプルリソースは Apache アプリケーションです state - リソースの現在の状態 ISP ローカルで In Service であり保護されています ISU In Service であり保護されていません OSF Out of Service であり障害が発生しています OSU Out of Service であり障害はありません initialize - リソースの初期化方法を指定します例えば LifeKeeper はアプリケーションのリソースをリストアしますがホストアダプタは LifeKeeper なしで初期化します info - オブジェクトの remove と restore のスクリプトが使用するオブジェクトに固有の情報があります reason - 存在する場合リソースが現在の状態にある原因を示します例えばあるアプリケーションが OSU の状態になった原因は別のサーバでそのアプリケーションが In Service (ISP または ISU) になったからです共有リソースはグループ内の 1 台のサーバでのみ同時にアクティブにできます depends on resources - 存在する場合このリソースが依存するリソースのタグ名がリストされ SteelEye Protection Suite for Linux 65

86 通信ステータスの情報ます these resources are dependent - 存在する場合このオブジェクトが直接依存するすべての親リソースのタグ名が示されます Local priority - このリソースについてターゲットサーバのフェイルオーバの優先順位の値を示します SHARED equivalency - このリソースが同等として定義されたリモートリソースのリソースタグとサーバ名およびこのリソースについてのフェイルオーバの優先順位の値を示します FAILOVER ALLOWED - 存在する場合上の行で同等と指定されたリモートサーバで LifeKeeper が動作可能であることおよびアプリケーションが障害に対して保護されていることを示します FAILOVER INHIBITED は LifeKeeper がシャットダウンされているかリモートサーバが停止していることによりアプリケーションが保護されていないことを示します通信ステータスの情報ステータス表示のこのセクションには LifeKeeper が認識しているサーバとその現在の状態および各コミュニケーションパスの情報がリストされますこれらの通信情報の要素はステータス表示にあります state - コミュニケーションパスのステータス通信ステータスの値は以下の値をとります ALIVE - 通常の動作中 DEAD - 通常の動作をしていません priority - コミュニケーションパスに割り当てられた優先順位の値この項目は TCP パスについてのみ表示されます #comm_downs - ポートに障害が発生してフェイルオーバが発生した回数パスの障害によりフェイルオーバが発生するのは障害発生時に ALIVE のコミュニケーションパスが他にない場合のみですさらにステータス表示では TTY コミュニケーションパスについてのみ維持されている以下の統計値を提供できます wrpid - 個々の TTY コミュニケーションパスが一意の読み取りプロセスと書き込みプロセスを持ちます wrpid フィールドには書き込みプロセスのプロセス ID があります書き込みプロセスは以下の 2 つの条件のうちいずれかが発生するまでスリープ状態ですハートビートタイマの期限が切れ書き込みプロセスにメッセージを送信させるローカルプロセスが LifeKeeper のメンテナンスメッセージを他のサーバに送信するように書き込みプロセスに要求する書き込みプロセスは関連付けられた TTY ポートを使用してメッセージを他のシステムの TTY ポート上にある読み取りプロセスに送信します rdpid - 個々の TTY コミュニケーションパスが一意の読み取りプロセスと書き込みプロセスを持ちます rdpid フィールドには読み取りプロセスのプロセス ID があります読み取りプロセスは以下の 2 つの条件のうちいずれかが発生するまでスリープ状態です 66 SteelEye DataKeeper for Linux

87 LifeKeeper のフラグハートビートタイマの期限が切れ定義済みのハートビート間隔が期限切れになったかどうかを読み取りプロセスが判断する必要がある場合期限切れの場合読み取りプロセスはコミュニケーションパスに DEAD 状態のマークを付けますこれにより ALIVE とマークされた他のコミュニケーションパスがない場合はフェイルオーバイベントが開始されますリモートシステムの書き込みプロセスが LifeKeeper のメンテナンスメッセージを送信し読み取りプロセスがメッセージの受信に必要なプロトコルを実行します #NAKs - 書き込みプロセスが negative acknowledgment ( NAK) を受信した回数 NAK メッセージは他のシステム上にある読み取りプロセスが書き込みプロセスが送信したメッセージを受け取らず書き込みプロセスがメッセージパケットを再送信する必要があったことを意味します #NAKs の統計値は回線ノイズに起因して長期間にわたって集計できますただし急激に数値が増加した場合通信サブシステムで診断手順を実行する必要があります #chksumerr - サーバ間のチェックサムメッセージが一致しなかった回数この統計値は回線ノイズに起因して長期間にわたって集計できますただし急激に数値が増加した場合通信サブシステムで診断手順を実行する必要があります #incmpltmes - 受信メッセージパケットが予測サイズに一致しなかった回数不一致の回数が多い場合コミュニケーションパスに関連付けられたハードウェアポートで診断手順の実行が必要な可能性があります #noreply - 書き込みプロセスが肯定応答の待機中にタイムアウトしメッセージを再送信しなければならなかった回数肯定応答がない場合サーバの過負荷またはサーバの障害を意味することがあります #pacresent - 読み取りプロセスが同一パケットを受診した回数これは送信サーバの書き込みプロセスがタイムアウトし同一メッセージを再送信する場合に発生することがあります #pacoutseq - 読み取りプロセスが順序が不正のパケットを受診した回数このフィールドの値が大きい場合メッセージパケットの脱落を示すことがあり通信サブシステムで診断手順の実行が必要な可能性があります #maxretrys - 特定のメッセージについて再送信の最大回数を超えたときに増加する指標 (NAK と noreply のメッセージ ) #maxretrys フィールドの値が大きい場合通信サブシステムで診断手順を実行する必要があります LifeKeeper のフラグステータスの詳細表示の後部近くにシステムのフラグセットがあります共通タイプはプロセスのロックが動作を完了するまで他のプロセスを確実に待機させるために使用する LCD のロックフラグです LCD のロックの標準フォーマットは以下のとおりです!action!processID!time!machine:id. 一般的な LCD のロックフラグの例を示します!action!02833! !server1:filesys ファイルシステム階層を作成するとこのフォーマットでステータス表示にフラグが生成されます filesys の指定は他のアプリケーションリソース階層では別のリソースタイプである場合も一般的なアプリケーションやユーザ定義アプリケーションでは app である場合もあります他の代表的なフラグとして!nofailover!machine!notarmode!machine shutdown_switchover SteelEye Protection Suite for Linux 67

88 シャットダウンストラテジーなどがあります!nofailover!machine と!notarmode!machine のフラグは LifeKeeper が作成と削除を行う内部の一時フラグでサーバのフェイルオーバを制御します shutdown_switchover フラグはこのサーバのシャットダウンストラテジーが switchover に設定されたことを示しサーバのシャットダウンによりスイッチオーバが発生します使用可能なフラグの詳細については依存関係の作成方法については LCDI-flag (1M) を参照してくださいシャットダウンストラテジーステータスの詳細表示の最後の項目はこのシステム用に選択された LifeKeeper のシャットダウンストラテジーを示します詳細についてはサーバのシャットダウンストラテジーの設定を参照してくださいステータスの簡略表示このトピックでは lcdstatus -e コマンドの出力例を使用してステータスの簡略表示で提供される情報のカテゴリについて説明しますこの情報を表示する方法の詳細については LCD (1M) のマニュアルページを参照してくださいコマンドラインに man lcdstatus または man LCD を入力できます LifeKeeper の GUI で使用できるステータス情報についてはサーバーのステータスの表示またはリソースのステータスの表示を参照してくださいステータスの簡略表示の例 : リソース階層の情報 BACKUP TAG ID STATE PRIO PRIMARY svr1 appfs3910-on-svr1 appfs4238 ISP 1 svr2 svr1 filesys4083 /jrl1 ISP 1 svr2 svr1 device ISP 1 svr2 svr1 disk ISP 1 svr2 通信ステータスの情報 MACHINE NETWORK ADDRESSES/DEVICE STATE PRIO svr1 TCP / ALIVE 1 svr1 TTY /dev/ttys0 ALIVE -- リソース階層の情報 LifeKeeper は各リソースのステータスを表示します root リソースを表す LifeKeeper のタグ名は [TAG] 列の左端から開始され階層内のリソースのタグ名は適切にインデントされてリソース間の依存関係を表します 68 SteelEye DataKeeper for Linux

89 通信ステータスの情報 BACKUP 列はフェイルオーバの優先順序内でこのステータス表示の対象システムの次にあるシステムを示します指定したリソースについてターゲットシステムが優先順位の最も低いシステムである場合そのリソースの BACKUP 列にはダッシュ (------) が表示されます TAG 列 - リソースの root タグがあります ID 列 - 各リソースの識別文字列があります STATE 列 - 各リソースの現在の状態があります ( リソースの状態を参照 ) PRIO 列 - 各リソースについてローカルサーバのフェイルオーバの優先順位の値があります PRIMARY 列 - 各リソースについて優先順位が最高のサーバ名があります通信ステータスの情報表示のこのセクションにはターゲットシステムで定義された各コミュニケーションパスのリストがあります各パスについて以下の情報が表示されます MACHINE - コミュニケーションパスのリモートサーバ名 NETWORK - コミュニケーションパスのタイプ (TCP または TTY) ADDRESSES/DEVICE - コミュニケーションパスの IP アドレスまたはデバイス名のペア STATE - コミュニケーションパスの状態 (ALIVE または DEAD) PRIO - TCP パスの場合パスに割り当てられた優先順位 TTY パスの場合優先順位が割り当てられていないのでこの列にはダッシュ (----) が表示されます障害検出とリカバリのシナリオ障害検出とリカバリを実行するために LifeKeeper のさまざまなコンポーネントがどのように連携しているかを調べるには 3 つのタイプのリカバリシナリオを説明する以下のトピックを参照してください IP ローカルリカバリ SIOS ではバックアップインターフェースが必要な場合すべての LifeKeeper リリースに含まれる標準 Linux の NIC ボンディングメカニズムを使用してボンディングしたインターフェースを使用することを推奨しています LifeKeeper のリリースからボンディングしたインターフェースがサポートする唯一の方法になりました以前のリリースでは後述の IP キットのバックアップインターフェース機能を使用できます IP ローカルリカバリ機能を使用すると IP Recovery Kit が障害を検出したときに LifeKeeper は保護している IP アドレスを設定されているインターフェースから同一サーバ上の別のインターフェースに移動できますローカルリカバリはオプションのバックアップ方式を提供するのでサーバで特定のインターフェースに障害が発生した場合保護している IP アドレスをバックアップインターフェースで動作可能にできますこのためアプリケーション / リソース階層全体がバックアップサーバにフェイルオーバすることを防ぐことができますローカルリカバリのシナリオ SteelEye Protection Suite for Linux 69

90 コマンドラインの操作 IP ローカルリカバリを使用するとサーバ上で LifeKeeper が保護する各 IP アドレスについてバックアップネットワークインターフェースを 1 つ指定できますバックアップインターフェースが正しく動作するためにはプライマリインターフェースと同じ物理ネットワークに接続する必要がありますシステム管理者は有効なインターフェースが選択されていることを確認する必要がありますバックアップインターフェースをあるサーバに指定しクラスタ内の他のサーバには指定しないことには正当性があります選択されたあるサーバ上のバックアップインターフェースは他のサーバ上のバックアップの選択に影響を与えません IP Recovery Kit によって IP アドレスの障害が検出されると結果として生じる障害によって IP ローカルリカバリスクリプトが起動されます LifeKeeper は最初にその IP アドレスを現在のネットワークインターフェース上で In Service に戻そうとしますこの動作に失敗した場合 LifeKeeper はリソースインスタンスをチェックして使用可能なバックアップインターフェースの有無を調べます使用可能なバックアップインターフェースがある場合 IP アドレスをバックアップインターフェースに移動しようとしますローカルリカバリの試行がすべて失敗した場合 LifeKeeper は IP アドレスとすべての依存リソースをバックアップサーバにフェイルオーバしますバックアップインターフェース名は IP リソースインスタンスの情報フィールドに指定できます情報フィールドの値はスペースで区切りプライマリサーバ名ネットワークインターフェース名 IP アドレスネットマスクバックアップインターフェース名の順に指定します例を示します ServerA eth fffffc00 eth1 バックアップインターフェースを設定しない場合 5 番目のフィールド値を none に設定してください保護している IP アドレスがバックアップインターフェースに移動すると 2 番目と 5 番目のフィールド値が入れ替えられ元のバックアップインターフェースがプライマリになり元のプライマリインターフェースがバックアップになりますこの結果 LifeKeeper の起動時スイッチオーバ時およびフェイルオーバ時には LifeKeeper は常に最後に設定されたインターフェースで IP アドレスを In Service にしようとしますコマンドラインの操作 LifeKeeper for Linux v3.01 以降では既存の IP リソースインスタンスにバックアップインターフェースを追加したり削除したりする機能はコマンドラインユーティリティとして提供されていますこの機能は lkipbu ユーティリティが提供しますコマンドと構文は以下のとおりです lkipbu [-d machine] -{a r} -t tag -f interface このインスタンスについてバックアップインターフェースがすでに定義済みの場合または不正なインターフェース名が指定された場合 add 動作 (-a オプションで指定 ) は失敗します指定したインターフェースがこの DataKeeper の現在のバックアップインターフェースでない場合削除動作 (-r オプションで指定 ) は失敗しますコマンドライン操作で IP アドレスをバックアップインターフェースに手動で移動することもできますこの操作は以下の構文で -m オプションにより指定します lkipbu [-d machine] -m -t tag このインスタンスについてバックアップインターフェースが設定されていない場合この操作は失敗します指定したリソースインスタンスが現在 In Service である場合現在のインスタンスから IP アドレスを設定解除する ipaction remove 動作および IP アドレスをバックアップインターフェースに設定する ipaction restore 動作を使用して移動が実行されます移動後 execute_broadcast_ ping の機能を使用して新しいインターフェース上にあるアドレスの動作が確認され正常に動作して 70 SteelEye DataKeeper for Linux

リソースのエラーリカバリのシナリオいる場合は IP リソースインスタンスの INFO フィールドにあるインターフェースの値が入れ替えられますこのコマンドの実行時に指定した IP リソースインスタンスが Out of Service である場合 INFO フィールドのプライマリとバックアップのインターフェースの値が単純に入れ替えられます lkipbu ユーティリティには指定した IP

91 リソースのエラーリカバリのシナリオいる場合は IP リソースインスタンスの INFO フィールドにあるインターフェースの値が入れ替えられますこのコマンドの実行時に指定した IP リソースインスタンスが Out of Service である場合 INFO フィールドのプライマリとバックアップのインターフェースの値が単純に入れ替えられます lkipbu ユーティリティには指定した IP リソースインスタンスについて現在指定されているプライマリとバックアップのインターフェースおよびプライマリインターフェース上のリソースの状態 ( 動作中または停止 ) を取得するオプションもありますこの操作は以下の構文で -s オプションにより指定します lkipbu [-d machine] -s -t tag 出力は以下のようになります IP address: Netmask: Primary interface: eth0 (up) Backup interface: eth1 詳細については lkipbu(8) のマニュアルページを参照してくださいリソースのエラーリカバリのシナリオ LifeKeeper は LifeKeeper が保護するリソースのステータスと健全性をチェックするリアルタイムデーモンモニタ lkcheck を装備しています In Service の各リソースについて lkcheck が定期的にそのリソースタイプの quickcheck スクリプトを呼び出します quickcheck スクリプトがリソースのクイック健全性チェックを実行しリソースが障害のある状態にあると判断すると quickcheck スクリプトはイベント通知メカニズム sendevent を呼び出します以下の図に lkcheck がプロセスを開始したときのリカバリプロセスの作業を示します 1. lkcheck が実行されますデフォルトでは lkcheck プロセスは 2 分ごとに実行されます lkcheck が動作するとシステムで In Service の各リソースについて適切は quickcheck ス SteelEye Protection Suite for Linux 71

92 リソースのエラーリカバリのシナリオクリプトを呼び出します 2. quickcheck スクリプトがリソースをチェックします quickcheck スクリプトが実行するチェックの内容は各リソースタイプによって異なります通常スクリプトはリソースのクライアントの動作をシミュレートして予測した応答を受信するかどうかを確認することにより目的の作業を実行するためにリソースが使用可能かどうかを単純に確認します 3. quickcheck スクリプトが sendevent を呼び出します quickcheck スクリプトがリソースが障害のある状態にあると判断した場合 sendevent を呼び出して適切なクラスとタイプを持つイベントを開始します 4. リカバリ手順の検索システムイベント通知メカニズム sendevent ははじめにイベントタイプまたはコンポーネントについて LCD がリソースまたはリカバリを持つかどうかを判断しようとしますこの判断を行うために is_recoverable プロセスは LCD のリソース階層をスキャンしてイベントに対応するリソースインスタンス ( この例では filesys の名前 ) を検索します次の手順の動作はスキャンでリソースレベルのリカバリ手順が検出されたかどうかによって異なります検出されない場合リカバリ手順が見つからない場合 is_recoverable は sendevent に戻り sendevent は基本イベント通知を続行します検出された場合スキャンでリソースが検出された場合 is_recoverable はリカバリプロセスをバックグラウンドに運びます is_recoverable プロセスが戻り sendevent が基本イベント通知を続行します推奨フラグ -A を基本警告イベント応答スクリプトに渡し LifeKeeper がリカバリを実行することを示します 5. リカバリプロセスが開始されますリカバリが続行していると仮定して is_recoverable はリカバリプロセスを開始しはじめにローカルリカバリを試行します 6. ローカルリカバリが試行されますインスタンスが検出された場合リカバリプロセスは LCD 内のリソース階層にアクセスし階層ツリーからイベントに応答する方法を知っているリソースを検索してローカルリカバリを試行します各リソースタイプについてイベントクラスにちなむ名前を持つサブディレクトリ ( そのイベントタイプのリカバリスクリプトを持つ ) を含むリカバリサブディレクトリを検索しますリカバリプロセスがリソース階層で障害が発生しているリソースから上方向に最も離れたリソースに関連付けられているリカバリスクリプトを実行しますリカバリスクリプトが正常に完了した場合リカバリは停止しますスクリプトが失敗した場合次のリソースに関連付けられたスクリプトが実行されリカバリスクリプトが正常に完了するか障害が発生したインスタンスに関連付けられたリカバリスクリプトが試行されるまで続行されますローカルリカバリが正常に完了した場合リカバリは停止します 7. サーバ間のリカバリが開始されますローカルリカバリに失敗した場合イベントはサーバ間のリカバリにエスカレートします 8. リカバリが続行されますローカルリカバリに失敗しているのでリカバリプロセスは失敗したインスタンスを Out-of-Service-FAILED (OSF) 状態にマークしこの失敗したリソースに依存するすべてのリソースを Out-of-Service-UNIMPAIRED (OSU) 状態にマークしますリカバリプロセスは次に障害が発生したリソースまたは障害が発生したリソースに依存するリソースが他のシステム上にあるリソースとイクイバレンシー情報を持っているかどうかを判断し優先順位が最高の 72 SteelEye DataKeeper for Linux

93 サーバの障害リカバリのシナリオ動作可能なサーバを選択します同時にアクティブにできるイクイバレンシー情報を持つリソースは 1 つのみですイクイバレンシー情報が存在しない場合リカバリプロセスは停止しますイクイバレンシー情報が検出されて選択された場合 LifeKeeper はサーバ間のリカバリを開始しますリカバリプロセスが LCM 経由でイクイバレンシー情報を持つリソースを持つ選択されたバックアップシステムの LCD プロセスにメッセージを送信しますこれは LifeKeeper がサーバ間のリカバリを試行することを意味します 9. lcdrecover プロセスが転送を調整しますバックアップサーバの LCD プロセスが lcdrecover プロセスを運び同等リソースの転送を調整します 10. バックアップサーバのアクティブ化 lcdrecover プロセスが同等のリソースを検出しそのリソースが Out of Service のリソースに依存しているかどうかを判断します lcdrecover が必要な各リソースについて restore スクリプト ( リソースリカバリ動作スクリプトの一部 ) を実行しリソースを In Service にしますバックアップサーバでリソースをリストアすることによりプライマリシステムからより多くの共有リソースを転送することが必要になる場合がありますプライマリシステムとの間でプライマリサーバ上でのサービスから削除する必要があるリソースを示すメッセージが送受信され次に選択したバックアップサーバで In Service になり重要なアプリケーションのすべての機能が提供されますこの動作は転送する追加の共有リソースがなくなりバックアップで必要なすべてのリソースインスタンスがリストアされるまで続行されますサーバの障害リカバリのシナリオ LifeKeeper Communications Manager (LCM) には 2 つの機能がありますメッセージング LCM は LifeKeeper がリカバリ設定または監査の実行を行うときに送信するメッセージの経路として機能します障害検出また LCM にはサーバに障害が発生しているかどうかを検出する役割もあります LifeKeeper には構成内の各サーバにペアのサーバが動作していることを定期的に通知する組み込みのハートビート信号がありますあるサーバがいずれかのコミュニケーションパス経由でハートビートメッセージを受信しなかった場合 LifeKeeper はそのパスを DEAD としてマークしますサーバの障害リカバリのシナリオ以下の図に LCM ハートビートメカニズムがサーバの障害を検出したときのリカバリ作業を示します SteelEye Protection Suite for Linux 73

94 サーバの障害リカバリのシナリオ以下の手順では上の図で LifeKeeper があるサーバのすべての通信接続を DEAD としてマークした場合のリカバリシナリオを説明します 1. LCM が eventslcm を起動します LifeKeeper がすべてのコミュニケーションパスを DEAD としてマークすると LCM は eventslcm プロセスを開始します eventslcm プロセスを停止する活動は 1 つのみですコミュニケーションパスがアクティブであるいずれかのコミュニケーションパスがハートビート信号の送信を再開した場合 LCM は eventslcm プロセスを停止します通信障害に起因するフェイルオーバやシステムの障害を防止するために各ペアのサーバ間に物理的に独立した冗長なコミュニケーションパスを 2 つ以上設定することが重要です 2. sendevent へのメッセージ送信 eventslcm がイベントタイプ machfail を持つ sendevent を呼び出してシステム障害警告を送信します 3. sendevent がフェイルオーバリカバリを開始します sendevent プログラムが LifeKeeper がシステム障害イベントを処理できることを判断し LifeKeeper フェイルオーバリカバリプロセス lcdmachfail を実行します 4. lcdmachfail のチェック lcdmachfail プロセスがはじめに応答していないサーバがシャットダウンしていないことを確認しますシステム障害の発生前に他のシステムが正常にシャットダウンしている場合フェイルオーバは禁止されます次に lcdmachfail は障害が発生したシステムとイクイバレンシ情報を持つリソースをすべて特定しますこれがリカバリの関与ポイントです 5. lcdmachfail がリソースをリストアします lcdmachfail が障害が発生したシステムとイクイバレンシ情報を持つバックアップサーバ上のリソースをすべて特定しますまたバックアップサーバが該当するリソースが構成されている優先順位が最高のアクティブなサーバであるかどうかを判断しますすべてのバックアップサーバがこのチェックを実行するので 1 台のサーバのみが階層のリカバリを試行しますこのチェックに合格した個々の同等リソースについて lcdmachfail が関連付けられたリストアプログラムを呼び出します次に lcdmachfail はリストアしたリソースに依存する各リソースもリストアしますこれはバックアップサーバ上の階層全体が In Service になるまで続行されます 74 SteelEye DataKeeper for Linux

95 インストールと設定 LifeKeeper for Linux のインストール LifeKeeper for Linux ソフトウェアの完全なインストール手順については SPS for Linux インストールガイドを参照してください詳細については SPS for Linux リリースノートを参照してください LifeKeeper for Linux の設定 LifeKeeper 環境がインストールされるとクラスタ内の各サーバ上で LifeKeeper ソフトウェアを設定することができます LifeKeeper 設定手順トピックの手順に従ってくださいここには詳細と共に各トピックへのリンクが記載されています LifeKeeper の設定手順 SPS Installation Guide で説明されている LifeKeeper 環境のインストールが完了している場合クラスタの各サーバの SPS ソフトウェアを起動設定する準備は整っています詳細を説明するトピックへのリンクを含む以下の手順を実行してください以下の手順はクラスタ内の各サーバで実行します 1. 次のコマンドを root として実行して LifeKeeper を起動します /opt/lifekeeper/bin/lkstart このコマンドによって管理対象のサーバ上のまだ起動していないすべての LifeKeeper デーモンプロセスを起動します LifeKeeper の起動および停止に関する詳細情報については LifeKeeper の起動および LifeKeeper の停止を参照してください 2. TTY 通信接続をセットアップします LifeKeeper のハートビート用に TTY コミュニケーションパスを利用する場合はハートビート用の物理的な接続をセットアップする必要があります 3. GUI を設定します GUI の設定には多くのタスクが含まれます GUI を実行するための準備の中の LifeKeeper GUI - 概要トピックから始めてください詳細な手順については GUI を実行するための準備を網羅するリンクの順番に従ってください注記 : LifeKeeper GUI を初めて実行すると QuickStart ボタンが表示されこれを押すと LifeKeeper のリソースの設定を案内する手順とリンクを含むウィンドウが開きます QuickStart Configuration Assistant は [Help] メニューからいつでもアクセスできます 4. コミュニケーションパスを作成します LifeKeeper の保護を有効にする前にコミュニケーションパス ( ハートビート ) の定義を作成する必要があります 5. 以下の設定作業を任意で実行します SteelEye Protection Suite for Linux 75

96 TTY 接続のセットアップサーバのシャットダウンストラテジーの設定手動フェイルオーバ確認オプションの設定 LifeKeeper ハートビートの調整デスクトップのツールバーに LifeKeeper GUI のアイコンを追加する SNMP イベント転送の設定イベントメール通知の設定クラスタで STONITH デバイスを使用する場合は STONITH デバイスを制御するスクリプトを作成し LifeKeeper の適切なイベントディレクトリに配置します 6. LifeKeeper でアプリケーションを保護する準備ができました以降の手順はオプションの LifeKeeper Recovery Kit の 1 つを使用するかどうかによって異なります LifeKeeper Recovery Kit を使用する場合リソース階層を作成拡張する手順についてはキットに関連するドキュメントを参照してください関連する Recovery Kit がないアプリケーションを使用する場合 2 通りの選択肢がありますシンプルなアプリケーションの場合アプリケーションと LifeKeeper との間のインターフェースの作成方法を慎重に検討してください LifeKeeper Core に含まれる Generic Application Recovery Kit を使用して保護することもできますより複雑なアプリケーションの場合オプションの LifeKeeper Extender を使用すると独自の Recovery Kit を作成できますその手順とサンプルコードについては LifeKeeper Extender のドキュメントを参照してください TTY 接続のセットアップ LifeKeeper のハートビート用に TTY コミュニケーションパスを利用する場合はハートビート用の物理的な接続をセットアップする必要があります単一の通信障害による誤ったフェイルオーバを抑止するためには複数のコミュニケーションパスが必要です 2 つ以上の LAN ベース (TCP) のコミュニケーションパスも使用する必要があります使用する各サーバのシリアルポートにシリアルハートビート用の TTY ケーブルを接続します 1. 次のコマンドを実行してシリアルパスをテストします /opt/lifekeeper/bin/portio -r -p port -b baud ここで baud はシリアルパス用に選択したボーレート ( 通常は 9600) port はサーバ 1 でテスト中のシリアルポート例えば /dev/ttys0 これでサーバ 1 はサーバ 2 からの入力を待っている状態です 2. サーバ 2 で portio コマンドを実行しますペアの 2 番目のシステムで次のコマンドを実行します 76 設定

97 SNMP による LifeKeeper イベント転送 echo Helloworld /opt/lifekeeper/bin/portio -p port -b baud ここで baud はサーバ 1 に合わせて選択した同じボーレート port はサーバ 2 でテスト中のシリアルポート例えば /dev/ttys0 3. コンソールを確認しますコミュニケーションパスが正常に動作する場合サーバ 1 のコンソールには Helloworld が表示されます表示されない場合は診断修正作業を終えてから LifeKeeper の設定を続けてください SNMP による LifeKeeper イベント転送 SNMP による LifeKeeper イベント転送の概要 SNMP (Simple Network Management Protocol) はネットワークを管理するためのデバイスに依存しないフレームワークですネットワーク上のデバイスはデバイスのベンダーが提供する MIB (Management Information Base) 変数によって記述されますネットワーク内の各ノード上では SNMP エージェントが実行されネットワークマネージャノードと通信を行いますネットワークマネージャはエージェントに対するクエリで MIB 変数の値を取得設定することによりエージェントノードを監視制御しますエージェントはトラップと呼ばれるメッセージを非同期に生成して例外イベントの発生をマネージャにしらせることもできます SNMP (Simple Network Management Protocol) を使用してネットワークを監視および管理するアプリケーションは多数提供されています LifeKeeper のイベント通知機能では特定のイベントが起きたときに通知を受信するアプリケーションを登録することができます (sendevent(5) マニュアルページを参照 ) LifeKeeper は LifeKeeper の動作を監視するサードパーティのネットワーク管理コンソールに向けて LifeKeeper の重要なイベントに関する SNMP トラップ通知を送信するように簡単に設定できます SNMP トラップを受信するリモート管理コンソールは最初にそのシステムの管理用ソフトウェアを使用して設定する必要があります LifeKeeper は外部の SNMP の設定機能を提供していませんリモート管理サーバは通常 LifeKeeper クラスタの外側に配置されます ( つまり LifeKeeper のノードではありません ) LifeKeeper イベントテーブル以下の表では LifeKeeper のイベントのリストと関連付けられているトラップ番号を示していますオブジェクト ID (OID) はプリフィックスとそれに続く個別のトラップ番号から次のフォーマットで構成されます prefix.0.specific trap number プリフィックスはでありこれは MIB ツリーで iso.org.dod.internet.private.enterprises.7359 に展開されます (7359 は SteelEye (SIOS Technology) の企業番号です LifeKeeper を表す 1 をこれに続けます ) 例えば LifeKeeper Startup Complete イベントは次の OID を生成します : LifeKeeper イベント / 説明トラップ番号オブジェクト ID SteelEye Protection Suite for Linux 77

98 LifeKeeper イベントテーブル LifeKeeper Startup Complete LifeKeeper が起動したノードから送信されます LifeKeeper Shutdown Initiated LifeKeeper のシャットダウンを開始したノードから送信されます LifeKeeper Shutdown Complete LifeKeeper のシャットダウンを完了したノードから送信されます LifeKeeper Manual Switchover Initiated on Server 手動スイッチオーバを要求したノードから送信されます LifeKeeper Manual Switchover Complete - recovered list 手動スイッチオーバを完了したノードから送信されます LifeKeeper Manual Switchover Complete - failed list 手動スイッチオーバに失敗したクラスタ内の各ノードから送信されます LifeKeeper Node Failure Detected for Server クラスタ内のノードに障害が発生したときにクラスタ内の各ノードから送信されます LifeKeeper Node Recovery Complete for Server - recovered list 障害ノードからのリソースをリカバリしたクラスタ内の各ノードから送信されます LifeKeeper Node Recovery Complete for Server - failed list 障害ノードからのリソースのリカバリに失敗したクラスタ内の各ノードから送信されます LifeKeeper Resource Recovery Initiated リソースをリカバリしているノードから送信されますリカバリが完了したか失敗したかを示す 131 または 132 トラップが必ずこれに続きます LifeKeeper Resource Recovery Failed リカバリを試みたリソースを稼働できなかったときにトラップ 130 を送信したノードから送信されます LifeKeeper Resource Recovery Complete リソースのリカバリが完了したときにトラップ 130 を送信したノードから送信されます * 設定

99 LifeKeeper イベント転送の設定 LifeKeeper Communications Path Up ノードへのコミュニケーションパスが確立されました LifeKeeper Communications Path Down ノードへのコミュニケーションパスがダウンしましたトラップ PDU に追加情報を含めるために以下の変数が使用されます Trap message すべてのトラップ Resource Tag Resource Tag Resource Tag List of recovered resources List of recovered resources List of failed resources List of failed resources * 複数のバックアップサーバでリカバリに失敗するとこのトラップは複数回表示されることがあります LifeKeeper イベント転送の設定前提条件 SNMP によるイベント転送機能は LifeKeeper のコア機能の一部として含まれており LifeKeeper の追加パッケージをインストールする必要はありませんただし LifeKeeper イベントのトラップ通知を生成する LifeKeeper の各ノードに SNMP ソフトウェアがインストールされている必要があります LifeKeeper はこの SNMP トラップユーティリティを使ってトラップを生成しますこのユーティリティはほとんどの Linux ディストリビューションで snmp-utils パッケージによって提供されています (SuSE では snmp と呼ばれます ) 以前のバージョン (4.1 以前 ) の snmp の実装では defcommunity ディレクティブがサポートされていないためトラップは public コミュニティストリングを使用して送信されます LifeKeeper のノードで SNMP エージェント snmpd を起動しておく必要はありませんネットワーク管理コンソール上のトラップハンドラおよびトラップメッセージに対するハンドラの応答に関する設定は LifeKeeper の本機能が提供する範囲ではありません必要な手順についてはお使いのシステム管理ツールが提供するドキュメンテーションを参照してください SteelEye Protection Suite for Linux 79

100 設定作業設定作業 LifeKeeper SNMP イベント転送を設定するには以下の作業を実施します SNMP トラップを生成する LifeKeeper クラスタの各ノードにおいて最後の手順以外のすべてを繰り返す必要があります 1. 上述の snmptrap ユーティリティが利用できることを確認します 2. SNMP トラップを受信するネットワーク管理ノードを指定します指定するにはコマンドラインを使用するか /etc/default/lifekeeper ファイルを編集します DNS の問題に影響されないようにドメイン名ではなく IP アドレスを指定してくださいコマンドラインからは lk_configsnmp を使用します ( 詳細については lk_configsnmp (1M) のマニュアルページを参照してください ) このユーティリティでは IP アドレスのみ使用できますまたはデフォルトファイル /etc/default/lifekeeper を編集して IP アドレスを追加します LK_TRAP_MGR= エントリを見つけて = の右側に IP アドレスを入力します ( = の前後にはスペースを入れません ) 3. defcommunity をサポートとしない SNMP 実装の以前のバージョンをお使いの場合はこのステップを飛ばしてくださいトラップは public コミュニティストリングを使用して送信されます新しいバージョンの場合は次の手順を実行します /usr/share/snmp/snmp.conf でデフォルトのコミュニティを指定しますこのファイルが存在しない場合は十分な制限付きの権限で作成しますディレクティブ defcommunity を値と共に追加しますこれによりトラップの送信時に SNMP バージョン 2c のコミュニティストリングが指定されます例えば以下のような行を追加します defcommunity mycommunitystring この設定ファイルの詳細については snmp.conf マニュアルページを参照してください 4. リモート管理コンソール上で LifeKeeper のイベントから送られて来るトラップ OID を検出し応答するために必要な設定手順をすべて実行します管理ノードが Linux サーバの場合この機能の検証を開始するために最低限必要なことは snmptrapd を -f -Lo オプション付き ( メッセージを stdout に出力 ) で開始することです設定の確認設定が正常に動作することを確認するには LifeKeeper の処理を実行します ( 例えば LifeKeeper を開始または停止するまたは LifeKeeper GUI を使用してあるリソースを手動で In Service の状態にするなど ) 管理コンソールでトラップメッセージを受信していることを確認しますトラップを受信していない場合は管理システムの適切なログファイルを調査し管理ソフトウェアが提供する標準のトラブルシューティング手順を実行してください LifeKeeper のログを調べるとトラップメッセージの送信に問題があるかどうかを判断することができます詳細については SNMP のトラブルシューティングを参照してください 80 設定

101 SNMP イベント転送の無効化 SNMP イベント転送の無効化 LifeKeeper による SNMP トラップの生成を無効にするにはファイル /etc/default/lifekeeper の LK_TRAP_MGR 環境変数から IP アドレスの割り当てを削除するだけですコマンドラインで lk_ configsnmp ユーティリティを disable オプションを付けて実行します (k_confignotifyalias (1M) マニュアルページの例を参照してください ) または /etc/default/lifekeeper を編集して LKTRAP_MGR のエントリを LK_TRAP_MGR= に変更します ( または行全体を削除します ) この手順はトラップメッセージの送信を無効にしたい各ノードで実行する必要があります SNMP のトラブルシューティング SNMP によるイベント転送に関連して予想される問題とその解決策を以下に説明します具体的なエラーメッセージについては LifeKeeper メッセージカタログを参照してください問題 : LifeKeeper から SNMP のトラップメッセージが送信されない解決策 : snmptrap ユーティリティがインストールされていることを確認します ( 通常は /bin/bin にあります ) インストールされていない場合は適切な SNMP パッケージをインストールします ( 前提条件を参照 ) 別の場所にインストールされている場合はファイル /etc/default/lifekeeper の PATH 変数に適切なパスを追加します問題 : SNMP のエラーメッセージがログに記録されない LifeKeeper サーバから SNMP のトラップメッセージが送信されていないように見える解決策 : トラップを受信するネットワーク管理サーバの IP アドレスが LK_TRAP_MGR に設定されていることを確認しますコマンドラインで lk_configsnmp を --query オプション付きで使用して設定を確認します (lk_configsnmp(1m) マニュアルページの例を参照してください ) またはファイル /etc/default/lifekeeper の LK_TRAP_MGR のエントリを確認しますこの変数は SNMP トラップメッセージを生成する LifeKeeper の各ノードで設定する必要があります LifeKeeper イベントメール通知 LifeKeeper イベントメール通知の概要 LifeKeeper イベントメール通知は特定のイベントが LifeKeeper クラスタで発生したときに 1 人以上のユーザがメールによる通知を受信する仕組みです LifeKeeper のイベント通知機能では特定のイベントが起きたときに通知を受信するアプリケーションを登録することができます (sendevent(5) マニュアルページを参照 ) LifeKeeper は LifeKeeper の動作を監視したいユーザのグループに向けて LifeKeeper の重要なイベントに関するメール通知を送信するように簡単に設定できますさらに lk_ log(8) ユーティリティまたは LifeKeeper GUI のサーバログファイルの表示機能を使用すると送信された各メール通知のログを参照することができますメッセージは通常 NOTIFY ログに入りますログの内容をコマンドラインで表示する方法の詳細については lk_log(8) マニュアルページを参照してくださいデフォルトでは LifeKeeper イベントメール通知は無効になっていますこの機能を有効にするには /etc/default/lifekeeper で指定する LK_NOTIFY_ALIAS 環境変数を設定する必要が SteelEye Protection Suite for Linux 81

102 メールが生成される LifeKeeper のイベントあります LK_NOTIFY_ALIAS 環境変数にはメールアドレスまたはエイリアスを 1 つまたは複数個 ( カンマ区切り ) 設定できます LK_NOTIFY_ALIAS を設定するにはコマンドラインから lk_ confignotify alias (lk_confignotifyalias(1m) マニュアルページで例を参照してください ) を実行してイベントが発生したときにメールを受信するアドレスまたはアドレスリストを指定するかデフォルトファイル /etc/default/lifekeeper を編集してメールアドレスまたはアドレスリストを追加します LK_NOTIFY_ALIAS= エントリを見つけてアドレスまたはカンマ区切りのアドレスリストを入力します選択した LifeKeeper イベントについてメールを送信する必要があるクラスタのすべてのノードで以上の手順を繰り返しますメール通知を無効にするには引数 -disable を付けて lk_confignotifyalias (lk_ confignotifyalias(1m) マニュアルページで例を参照してください ) を実行するかデフォルトファイル /etc/default/lifekeeper を編集して LK_NOTIFY_ALIAS の設定を削除します ( この行を LK_NOTIFY_ALIAS= に変更 ) メールが生成される LifeKeeper のイベント以下の LifeKeeper イベントが発生するとメール通知が生成されます (LK_NOTIFY_ALIAS が設定されている場合 ) LifeKeeper のイベント LifeKeeper Startup Complete LifeKeeper Shutdown Initiated LifeKeeper Shutdown Complete LifeKeeper Manual Switchover Initiated on Server イベントの説明 LifeKeeper が起動したノードから送信されます LifeKeeper のシャットダウンを開始したノードから送信されます LifeKeeper のシャットダウンを完了したノードから送信されます手動スイッチオーバを要求されたノードから送信されます LifeKeeper Manual Switchover Complete - recovered list LifeKeeper Manual Switchover Complete - failed list LifeKeeper Node Failure Detected LifeKeeper Node Recovery Complete for Server - recovered list 手動スイッチオーバが完了したノードからリカバリに成功したリソースのリストと共に送信されます手動スイッチオーバが完了したノードから切り替えに失敗したリソースのリストと共に送信されますクラスタ内のノードに障害が発生したときにクラスタ内の各ノードから送信されます障害ノードからのリソースをリカバリしたクラスタ内の各ノードからリカバリに成功したリソースのリストと共に送信されます 82 設定

103 LifeKeeper イベントメール通知の設定 LifeKeeper Node Recovery Complete for Server - failed list LifeKeeper Resource Recovery Initiated LifeKeeper Resource Recovery Complete LifeKeeper Resource Recovery Failed LifeKeeper Communications Path Up LifeKeeper Communications Path Down 障害ノードからのリソースのリカバリに失敗したクラスタ内の各ノードからリカバリに失敗したリソースのリストと共に送信されますリソースをリカバリしているノードから送信されますこのメールに続いてリカバリが完了したか失敗したかを示すメッセージ ( Resource Recovery Complete または Resource Recovery Failed ) が必ず送信されますリソースのリカバリが成功した時点で LifeKeeper Resource Recovery Initiated メッセージを送信したノードからリカバリに成功したリソースのリストと共に送信されますリソースが In Service の状態になることができない場合に LifeKeeper Resource Recovery Initiated メッセージを送信したノードからリカバリに成功したリソースのリストと共に送信されますノードへのコミュニケーションパスが確立されましたノードへのコミュニケーションパスがダウンしました LifeKeeper イベントメール通知の設定前提条件イベントメール通知機能は LifeKeeper のコア機能の一部として含まれており LifeKeeper の追加パッケージをインストールする必要はありませんただし LifeKeeper イベントのメール通知を生成する LifeKeeper の各ノードに電子メールソフトウェアがインストールされている必要があります LifeKeeper は mailx パッケージによってインストールされるメールユーティリティを使用して通知を送信しますメールの設定は LifeKeeper の本機能が提供する範囲ではありませんデフォルトでは LifeKeeper イベントメール通知は無効になっています設定作業 LifeKeeper イベントメール通知を設定するには以下の作業を実施します 1. 上述のメールユーティリティが利用できることを確認します 2. LifeKeeper のイベントのメール通知を受信するユーザ (1 人以上 ) を特定し LifeKeeper のデフォルトファイル /etc/default/lifekeeper の LK_NOTIFY_ALIAS を設定しますこれを行うにはコマンドラインを使用するかファイル /etc/default/lifekeeper を編集して通知を受信するメールアドレスまたはエイリアスを指定しますコマンドラインからは lk_confignotifyalias を使用します ( 詳細については lk_ confignotifyalias (1M) のマニュアルページを参照してください ) このユーティリティではカンマ区切りのメールアドレスまたはエイリアスのみ使用できます SteelEye Protection Suite for Linux 83

104 設定の確認またはデフォルトファイル /etc/default/lifekeeper を編集してメールアドレスまたはエイリアスを追加します LK_NOTIFY_ALIAS= エントリを見つけて = の右側にメールアドレスまたはエイリアス (1 つまたはカンマ区切りのリスト ) を入力します ( = の前後にはスペースを入れません ) 設定の確認設定が正常に動作することを確認するには LifeKeeper の処理を実行します ( 例えば LifeKeeper を開始または停止するまたは LifeKeeper GUI を使用してあるリソースを手動で In Service の状態にするなど ) ファイル /etc/default/lifekeeper の LK_NOTIFY_ALIAS で指定したユーザがメールを受信していること LifeKeeper のログファイルにメッセージが記録されていることを確認しますメールを受信していない場合はメール障害に対する通常のトラブルシューティング手順を実行してください LifeKeeper のログを調べるとメール送信に問題があるかどうかを判断することができます詳細についてはメール通知のトラブルシューティングを参照してくださいイベントメール通知の無効化 LifeKeeper によるメール通知の生成を無効にするにはファイル /etc/default/lifekeeper の LK_NOTIFY_ALIAS 環境変数からメールアドレスとエイリアスの割り当てを削除するだけですコマンドラインで lk_confignotifyalias ユーティリティを --disable オプションを付けて実行します (k_ confignotifyalias (1M) マニュアルページの例を参照してください ) または /etc/default/lifekeeper を編集して LK_NOTIFY_ALIAS のエントリを LK_NOTIFY_ ALIAS = に変更しますこの手順はメール送信を無効にしたい各ノードで実行する必要がありますメール通知のトラブルシューティング LifeKeeper イベントのメール通知に関連して予想される問題とその解決策を以下に説明します具体的なエラーメッセージについては LifeKeeper メッセージカタログを参照してください問題 : LifeKeeper からのメールを受信しない解決策 : メールユーティリティがインストールされていることを確認します ( 通常は /bin/mail にあります ) インストールされていない場合は mailx パッケージをインストールします別の場所にインストールされている場合はファイル /etc/default/lifekeeperpath 変数にメールユーティリティのパスを追加します問題 : LifeKeeper からのメールを受信しない解決策 : メール設定を確認し配信用のキューにメールメッセージが滞留していないことを確認しますメール設定の問題が原因でメッセージが滞留することがあります LK_NOTIFY_ALIAS で指定しているメールアドレスが有効なアドレスでありカンマで区切られていることを確認します問題 : ログファイルに mail returned というエラーメッセージがある 84 設定

105 任意の設定作業解決策 : メールコマンドがエラー X を返す場合 LifeKeeper イベントがメールを生成送信する際に問題 ( node failure など ) が発生していますメール設定を確認し LK_NOTIFY_ALIAS に含まれるメールアドレスが有効でありアドレスのリストがカンマで区切られていることを確認しますまた LK_ NOTIFY_ALIAS で指定しているメールアドレスのフォーマットを使用してコマンドラインからそれらのアドレスにメールを送信できることを確認します問題 : メッセージや成功または失敗がログに何も記録されずノードのフェイルなどの LifeKeeper イベントが発生したときもメールを受信するはずのユーザがメールを受信しない解決策 : LK_NOTIFY_ALIAS にメールアドレスが設定されており複数の場合はカンマで区切られていることを確認しますコマンドラインで lk_confignotifyalias を --query オプション付きで使用して設定を確認します (lk_confignotifyalias(1m) マニュアルページの例を参照してください ) またはファイル /etc/default/lifekeeper の LK_NOTIFY_ALIAS で確認しますこの変数はメール通知メッセージを生成する LifeKeeper の各ノードで設定する必要がありますまた LifeKeeper イベントメール通知の概要でその LifeKeeper イベントがメールメッセージを生成するのかどうかを確認します ( すべてのイベントがメールメッセージを生成するわけではありません ) 任意の設定作業デスクトップのツールバーに LifeKeeper GUI のアイコンを追加する LifeKeeper GUI パッケージをインストールすると LifeKeeper GUI のアイコンが自動的に [System] サブメニューの下のデスクトップメニューに追加されます ( アイコンが表示されない場合は一度ログアウトしてからもう一度ログインしてください ) デスクトップのツールバーにアイコンを追加したい場合は次の手順を実行してください注記 : [System] メニューの場所は Linux ディストリビューションごとに異なります Gnome を使用している場合 : 1. Footprint デスクトップメニューで [System] を選択します 2. [LifeKeeper GUI] を右クリックします 3. [Add this launcher to panel] を選択しますデスクトップのツールバーにアイコンが表示されます KDE を使用している場合 : 1. K デスクトップメニューで, [Panel] [Add Application] の順に選択します 2. [System] [LifeKeeper GUI] の順に選択しますデスクトップのツールバーにアイコンが表示されます SteelEye Protection Suite for Linux 85

106 アイコンの位置を変更するアイコンの位置を変更するツールバー上の LifeKeeper GUI のアイコンの位置を変更したい場合は次の手順を実行してください (Gnome KDE 共通 ) 1. ツールバーの LifeKeeper GUI アイコンで右クリックし [Move] ( または [Move Applet] ) を選択します 2. アイコンはツールバーの任意の場所に移動させることができます 3. 好きな場所で左クリックしてアイコンを新しい位置に固定します手動フェイルオーバ確認オプションの設定構成によっては障害を検出されたシステムのフェイルオーバリカバリを LifeKeeper が実行する前にシステム管理者の手動による確認を必須とすることが望ましいこともありますこの機能を使用すると実際には起きていないリモートシステムのクラッシュを LifeKeeper が検出した場合に LifeKeeper がフェイルオーバを実行するのを防ぐことができますこのような状況はハートビートのコミュニケーションパスが冗長化されていない構成で発生する可能性がありますこのオプションを設定するにはフェイルオーバリカバリを実行するシステムで confirmso!uname フラグを設定しますここで uname はフェイルしたリモートシステムの名前です LCDI-flag(1M) マニュアルページを参照してくださいこのフラグが設定された状態で LifeKeeper が該当システムがフェイルしたと判断した場合スイッチオーバを確認またはブロックするには lk_confirmso(1m) コマンドを使用する必要がありますこのコマンドの使用方法およびこの機能に関連するデフォルトのタイムアウトや動作を指定する値 (/etc/default/lifekeeper 内の設定項目 CONFIRMSOTO および CONFIRMSODEF で指定 ) の変更方法については lk_confirmso(1m) マニュアルページを参照してくださいサーバのシャットダウンストラテジーの設定シャットダウンストラテジーはサーバがシャットダウンするときにバックアップサーバにリソースをスイッチオーバするかどうかを制御する LifeKeeper の設定オプションです以下のオプションがあります Do Not Switch Over Resources ( デフォルト ) Switch Over Resources LifeKeeper は正常なシャットダウンではバックアップサーバのリソースを起動しません LifeKeeper は正常なシャットダウンでバックアップサーバのリソースを起動しますシャットダウンストラテジーはデフォルトでは Do Not Switch Over Resources に設定されていますクラスタ内の各サーバでどちらのストラテジーを使用するかを決定し必要に応じてシャットダウンストラテジーを Switch Over Resources に変更してくださいクラスタ内の各サーバで次のようにします 1. [Edit] メニューで [Server] を選択し次に [Properties] をクリックします 2. 修正するサーバを選択します 86 設定

107 LifeKeeper ハートビートの調整 3. [Server Properties] ダイアログの [General] タブで [Shutdown Strategy] を選択します注記 : シャットダウンストラテジーが有効に機能するには正常なシャットダウン時に LifeKeeper のプロセスが起動している必要があります LifeKeeper が起動していないかリソースが In Service でない場合リソースはスイッチオーバされません LifeKeeper ハートビートの調整ハートビート設定項目の概要 LifeKeeper のハートビートは各サーバが生存していることを確認するためにコミュニケーションパスを通じて LifeKeeper のサーバ間で送受信される信号ですハートビートに関しては LifeKeeper が障害を検知する速さを決定する要素が 2 つあります間隔 : ハートビートの間の秒数ハートビート回数 : コミュニケーションパスが切断していると LifeKeeper が判定するまでに許容されるハートビートの失敗回数これらのハートビートの値は LifeKeeper デフォルトファイル /etc/default/lifekeeper 内の以下の 2 つの設定項目で指定しますデフォルト値を使用した場合よりも早期にサーバの障害を検知したい場合は設定項目を変更することができます LCMHBEATTIME ( 間隔 ) LCMNUMHBEATS ( ハートビート回数 ) 次の表は TCP および TTY 経由のハートビートの設定項目についてのデフォルト値と最小値の一覧です TTY コミュニケーションパスは媒体として通信速度が遅いため間隔を 2 秒未満にすることはできません設定項目デフォルト値最小値 LCMHBEATTIME 5 1 (TCP) 2 (TTY) LCMNUMHBEATS 3 2 (TCP TTY) 重要な注記 : どちらの設定項目もクラスタ内のすべてのサーバで必ず同じ値にする必要があります例 LifeKeeper のクラスタで両方の間隔がデフォルト値に設定されていると仮定します LifeKeeper はサーバ間で 5 秒ごとにハートビートを送信します通信障害によって 2 回のハートビートが途絶し 3 回目のハートビートで再開した場合 LifeKeeper はアクションを実行しませんコミュニケーションパスの切断継続時間がハートビート 3 回分になった場合は LifeKeeper はそのコミュニケーションパスを切断と判定しますただし他方の冗長的なコミュニケーションパスも切断と判定されるまではフェイルオーバを開始しません SteelEye Protection Suite for Linux 87

108 ハートビートの設定ハートビートの設定設定項目とその値を追加するには /etc/default/lifekeeper ファイルを手動で編集する必要があります通常デフォルトファイルにはこれらの設定項目のエントリが含まれていません設定したい値を含めて次のような行を追加してください LCMHBEATTIME=x LCMNUMHBEATS=y 最小値を下回る値を設定した場合 LifeKeeper はその値を無視して代わりに最小値を採用します設定上の考慮事項間隔を 5 秒未満に設定するとネットワークの中断による誤ったフェイルオーバを発生させるリスクが高くなるため 5 秒未満に設定する場合はコミュニケーションパスをプライベートネットワーク上で構成してください検証によるとハートビート回数を 2 未満にした場合に誤ったフェイルオーバの発生リスクが高まりますこのためこの値は 2 以上に制限されています誤ったフェイルオーバを回避するため間隔およびハートビート回数の値はどちらもクラスタ内のすべてのサーバで必ず同じ値にする必要がありますこのためこれらの値を編集する前に両方のサーバで LifeKeeper を停止しておく必要があります LifeKeeper の稼働開始後アプリケーション保護している状態でハートビートの設定項目を編集する場合はコマンド lkstop -f が使用できますこのコマンドは LifeKeeper を停止しますが保護下のアプリケーションは停止しません LCMHBEATTIME および LCMNUMHBEATS の値に上限値はありませんただし非常に大きい数字に値を設定すると LifeKeeper の障害検知能力は著しく損なわれます例えば両方の値を 25 に設定した場合サーバ障害を検知するまでに LifeKeeper は 625 秒間 (10 分間以上 ) 待つことになりますこれはサーバをリブートしてクラスタに再参加させるのに十分な時間です注記 : TTY および TCP コミュニケーションパスの両方を使用する場合各設定項目の値は両方のコミュニケーションパスに適用されます唯一の例外は TTY コミュニケーションパスの最小値である 2 未満の値が間隔に設定された場合です例えば障害をできるだけ早く検知するために LifeKeeper で許容される最小値を指定したとします LCMHBEATTIME=1 LCMNUMHBEATS=2 このとき LifeKeeper は TCP コミュニケーションパスの間隔に 1 秒を採用し TTY の間隔には 2 秒を採用しますサーバ障害が発生すると LifeKeeper は間隔の短い TCP の障害 (1 秒間隔の 2 回のハートビート後 ) を先に検知しますただし TTY の障害 (2 秒間隔の 2 回のハートビート後 ) を検知するまでは何もしません SPS でカスタム証明書を使用する Steeleye Protection Suite (SPS) の 7.5 以降では異なるシステムとの通信に SSL/TLS が使用されま 88 設定

109 証明書の使用方法すデフォルトではノード間で一定の身元確認が可能なデフォルト証明書が SPS と共にインストールされますこのドキュメントではデフォルト証明書を組織独自の認証局 (CA) が作成した証明書に置き換える方法を説明します証明書の使用方法 LifeKeeper サーバ間の通信では転送するデータを保護するために SSL/TLS が使用されます双方のシステムは自身を特定する証明書を提示し証明書を提示されたシステムは CA 証明書を使用して提示された証明書を SSL 接続経由で確認します以下の 3 種類の証明書が使用されます /opt/lifekeeper/etc/certs/lk4linuxvalidnode.pem ( サーバ証明書 ) /opt/lifekeeper/etc/certs/lk4linuxvalidclient.pem ( クライアント証明書 ) /opt/lifekeeper/etc/certs/lkca.pem( 認証局 ) 最初の 2 つの証明書はサーバが実行する検証に合格するために CA 証明書による署名が必要です証明書の共通名は検証されません証明書は CA によって署名されるのみということに注意してください独自の証明書の使用運用環境によってはデフォルト証明書を組織内部の CA または商用 CA が作成した証明書に置き換える必要がある場合がありますそのような場合は上記の 3 種類の証明書を同じ証明書ファイル名を持つ新しい証明書に置き換えますこれらの証明書は PEM 形式です LK4LinuxValidNode.pem および LK4LinuxValidClient.pem はそれぞれキーと証明書の両方を含んでいます LK4LinuxValidNode.pem 証明書はサーバタイプの証明書です LK4LinuxValidClient.pem はクライアントタイプの証明書ですデフォルトの証明書を置換した場合変更を反映するには LifeKeeper を再起動する必要があります証明書の設定を間違えると steeleye-lighttpd デーモンが起動に失敗し LifeKeeper のログファイルにエラーが記録されます問題が発生した場合このログファイルを参照すると実行すべき完全なコマンドを見ることができます Linux の設定オペレーティングシステム必要なすべてのパッケージをインストールするためにはオペレーティングシステムはデフォルトでインストールしてください最小構成のオペレーティングシステムでは必要なすべてのパッケージが含まれないため LifeKeeper で使用することはできません SteelEye Protection Suite for Linux 89

110 Linux の設定 LifeKeeper クラスタの可用性を最大限に引き出すにはシステムで使用するカーネルのバージョンが非常に重要です次の表はサポート対象のディストリビューションおよびバージョンと LifeKeeper 認定テストに合格したカーネルを示していますカーネルのアップデートディストリビューション / バージョン Red Hat Enterprise Linux 5 および Red Hat Enterprise Linux 5 Advanced Platform (x86 および AMD64/EM64T) Red Hat Enterprise Linux 6 (x86 および AMD64/EM64T) SUSE SLES 10 (x86 および x86_64) SUSE SLES 11 (x86 および x86_64) Oracle Enterprise Linux 5 (x86 および x86_64) The Community ENTerprise Operating System (CentOS) 5.0 (x86 および x86_64) The Community ENTerprise Operating System (CentOS) 6.0 (x86 および x86_64) サポート対象カーネル el el5 ( デフォルトカーネル ) el5 (Update 1) el5 (Update 2) el5 (Update 3) el5 (Update 4) el5 (Update 5) el5 (Update 6) el5 (Update 7) el5 (Update 8) el el6 (Update 1) el6 (Update 2) ( デフォルトカーネル ) (SP1) (SP2) (SP3) (SP4) (SP1) el el5 (Update 1) el5 (Update 2) el5 (Update 3) el5 (Update 4) el5 (Update 5) el5 (Update 6) el5 (Update 7) el5 (Update 8) el el5 (Update 1) el5 (Update 2) el5 (Update 3) el5 (Update 4) el5 (Update 5) el5 (Update 6) el5 (Update 7) el5 (Update 8) el el6 (Update 1) el6 (Update 2) 90 設注定記 : このリストのサポート対象のディストリビューションおよびカーネルは LifeKeeper のみを考慮したものですお使いのサーバおよびストレージハードウェアについては各メーカーがサポートするディストリビューションおよびカーネルに従ってください

111 Linux の設定デバイスの動的な追加 LifeKeeper が起動する前に Linux 側ですべてのデバイスの設定を完了しておく必要があります LifeKeeper の起動後に LifeKeeper の保護対象のデバイスを設定する場合そのデバイスを共有する各サーバで LifeKeeper を停止して再起動する必要がありますこれによりデバイスを検知および検証する機能によって設定が確認され LifeKeeper がデバイスにアクセスできるようになります Linux の SCSI ドライバには論理ユニット (LUN) の検索対象とするデバイスを制御するいくつかのパラメータがあります LUN をサポートしないデバイスのリスト - このリストのデバイスは LUN をサポートしないことがわかっているため SCSI ドライバはこれらのデバイスに対して LUN を検索することを許可しません LUN をサポートするデバイスのリスト - このリストのデバイスは LUN をサポートすることがわかっているため必ず LUN を検索します Probe all LUNs on each SCSI device - デバイスがどちらのリストにも存在しない場合検索するかどうかを指定しますこのパラメータは make config を使用して SCSI モジュールセクションで設定します LUN のサポート (SUSE を含む ) ほとんどのディストリビューションでは Probe all LUNs 設定はデフォルトで有効になっていますが Red Hat ではデフォルトで無効に設定されています LifeKeeper の構成でデータ保護を目的として通常使用される外部 RAID コントローラには多くの場合複数の LUN ( 論理ユニット ) が設定されます LUN のサポートを有効にするにはこのフィールドを選択してカーネルを再構築する必要がありますカーネルやモジュールを再構築せずに Probe all LUNs を有効にするには変数 max_scsi_ luns を 255 に設定します ( これによって最大 255 個の LUN をスキャンするようになります ) SCSI ドライバがモジュールになっているカーネル (Red Hat など ) で max_scsi_luns を設定するには /etc/modules.conf に以下のエントリを追加してから初期 RAM ディスクを再構築し再起動してその RAM ディスクを読み込みます options scsi_mod max_scsi_luns=255 SCSI ドライバをカーネルにコンパイルするカーネル (SUSE など ) で max_scsi_luns を設定するには /etc/lilo.conf に以下のエントリを追加します append="max_scsi_luns=255" 注記 : 255 個の LUN をスキャンするとデバイスによってはブートのパフォーマンスに悪影響を与える可能性があります ( 特に BLIST_SPARSELUN が指定されたデバイス ) Dell PV650F というアレイではそのような状況が発生しましたこのパフォーマンスの問題を回避するにはアレイ上で設定した LUN の最大数 (16 または 32 など ) を max_scsi_luns に設定します例えば以下のようになります append="max_scsi_luns=16" SteelEye Protection Suite for Linux 91

112 Linux の設定 libstdc- ++ ライブラリの要件 libxp および libxt ライブラリの要件 LifeKeeper をインストールした後に yum update を実行する SPS インストールセットアップスクリプトを実行中に libstdc++ ライブラリの依存関係要件の失敗に関するメッセージが表示される場合がありますこのライブラリはいくつかの compatlibstdc++ rpm パッケージの中で提供されておりハードウェアプラットフォームおよび実行する Linux ディストリビューションに依存します 64 ビットシステムにおいても LifeKeeper では 64 ビットバージョン (x86_64) ではなく 32 ビットアーキテクチャのパッケージを使用する必要があります 64 ビットバージョンがインストールされている場合必要なライブラリが欠落しているため起動に失敗しますこの問題を回避 ( 解決 ) するには OS のインストールメディアに含まれている 32 ビットバージョンの compat-libstdc++ パッケージをインストールした後 I/S セットアップスクリプトを実行 ( 再実行 ) します一部のディストリビューションではこのパッケージの複数の 32 ビットバージョンを用意していることに注意してください ( 例えば compat-libstdc compat-libstdc など ) このような場合は単純に両方のバージョンをインストールして必要なライブラリがインストールされるようにします上記と同様に libxp および libxt ライブラリの依存関係要件の失敗に関するメッセージが表示される場合もあります LifeKeeper では 64 ビットプラットフォームでもこれらのライブラリの 32 ビットバージョンが必要です yum update を実行すると以下のエラーが発生する場合があります ksh conflicts with pdksh LifeKeeper を正しく動作させるには ksh パッケージをインストールしたり更新したりしないでくださいパッケージをインストールしたり更新したりした場合は SPS インストールセットアップスクリプトを必ず再実行してくださいこれにより競合する ksh パッケージが削除され必要な pdksh パッケージが再インストールされます 92 設定

113 データレプリケーションの設定データレプリケーションの設定項目説明 SteelEye DataKeeper は Linux カーネルバージョン 2.6 以降をサポートします一部の DataKeeper 機能には追加でカーネルの最低要件があります次の表は DataKeeper の各機能をサポートする Linux ディストリビューションを X で示しています SteelEye DataKeeper の機能 / ディストリビューションマトリクス DataKeeper の機能複数ターゲットサポート ( カーネル ) ビットマップインテントログ ( カーネル ) 非同期 (WAN) レプリケーション ( カーネル ) ビットマップマージ ( ) Red Hat RHEL 4 RHEL 5+ RHEL 6 SUSE SLES 10 SLES 11 X X X X X X X X X X X X X X X X * RHEL 5.4 以降が該当しますビットマップマージのコードは Red Hat EL5 Update 4 カーネルにバックポートされました SteelEye DataKeeper ドキュメンテーション SteelEye DataKeeper のドキュメンテーションは SIOS Technology Corp. の Web サイトにある SteelEye Protection Suite テクニカルドキュメンテーションの中に収録されています SteelEye Protection Suite for Linux 93

114 ネットワーク設定ネットワーク設定項目ルーティングテーブルに対する IP Recovery Kit の影響 IP サブネットマスク EEpro100 ドライバの初期化説明 LifeKeeper が保護する IP アドレスは論理インターフェースとして Linux 上で実装されます Linux 上で論理インターフェースを設定するとその論理インターフェースに関連付けられたサブネットへのルートが自動的にルーティングテーブルに追加されます例えば物理インターフェースによってそのサブネットへのルートがすでに存在する場合も同様ですこの追加により同じサブネットに対して複数のルーティングテーブルエントリが作成される可能性があります接続元のアドレスを検査して確認するアプリケーションの場合複数のルーティングテーブルエントリがあると LifeKeeper システムが (LifeKeeper がインストールされていない ) 他のシステム上のそのようなアプリケーションに接続しようとしたときに問題が発生することがあります複数のルーティングテーブルエントリによって物理インターフェースからではなく論理インターフェースから接続が張られているように見えます LifeKeeper 保護下の IP 設定では物理インターフェースの IP アドレスと LifeKeeper が保護するエイリアス IP アドレスのサブネットを同じにする場合 2 つのアドレスのサブネットマスクを同じにする必要がありますサブネットマスクの設定を間違えると LifeKeeper GUI のクライアントとサーバ間の接続に遅延や障害が発生します Intel Ethernet インターフェースを搭載するシステムでは eepro100 ドライバの初期化の問題を解決するために Intel e100 ドライバをインストールする必要があります eepro100 ドライバを使用するとブート時にインターフェースが起動したときに以下のエラーが発生しインターフェースをシャットダウンするまでエラーを出し続けることがあります eth0: card reports no Rx buffers eth0: card reports no resources アプリケーションの設定項目 glibc 2.2 を使用する場合のデータベースサポートデータベース初期化ファイル説明 Informix Dynamic Server 9.2 は glibc 2.1 も使用します glibc 2.2 を使用するディストリビューションでは Informix Dynamic Server 以降が必要ですデータベースの初期化ファイルは共有デバイス上に置いてローカルファイルシステムの指定場所にシンボリックリンクを作成するかまたは個別のシステム上に保持して変更を適用する必要がある場合に手動で両方のシステムを更新するかのいずれかに必要があります 94 設定

115 ストレージとアダプタの設定項目 Oracle のローカルマウントポイント Apache のアップデート説明 Oracle のローカル環境は internal として接続するか sysdba として接続するかによって異なります LifeKeeper の保護下に置く場合 connect / as sysdba を使用してローカルマウントポイント上にデータベースを作成する必要があります Linux オペレーティングシステムのアップグレードの一環として LifeKeeper が保護する Apache アプリケーションをアップグレードするには起動時のデフォルトサーバインスタンスを無効にする必要があります設定ファイル (httpd.conf) がデフォルトのディレクトリ (/ etc / httpd / conf) にある場合設定ファイルは Red Hat のアップグレードによって上書きされますしたがってアップグレードする前にファイルのコピーを作成しアップグレードした後にファイルをリストアする必要がありますまたの Specific Configuration Considerations for Apache Web Server セクションを参照してください Apache Web Server Recovery Kit Administration Guide. ストレージとアダプタの設定項目マルチパス I/O および冗長コントローラ説明マルチパス I/O のソリューションには数種類ありすでに利用可能なものや Linux 環境向けに開発中のものなどがあります SIOS Technology Corp. は多くのサーバベンダアダプタベンダおよびドライバ開発者と積極的に協力することで LifeKeeper とマルチパス I/O ソリューションとの協調動作を実現していますデータの整合性を保護するために LifeKeeper が使用する SCSI リザベーションは特殊な要件を必要とするためマルチパス I/O ソリューションの最初の実装では多くの場合要件が満たされませんディスクアレイサポートに関する以下の技術情報を参照し個別のアレイがマルチパスおよび特定のマルチパスソリューションでサポートされているかを判断してくださいマルチパスおよび特定のマルチパスソリューションと共に動作する LifeKeeper のサポート対象として一覧に指定されていないアレイはサポート対象ではないと考えてください SteelEye Protection Suite for Linux 95

116 ストレージとアダプタの設定項目説明マルチパス構成ではパスの操作中に大量の I/O を実行するとシステムが応答しなくなったように見えることがありますマルチパスのソフトウェアが LUN のアクセスをあるパスから別のパスに移動する場合処理中の I/O も新しいパスに移動させる必要がありますこの I/O の経路変更はその I/O の応答時間の遅延を発生させますこの間にさらに I/O が発行されるとそれらはシステム内のキューとなりシステムはプロセス用のメモリを使い果たしてしまう可能性があります非常に高負荷の I/O の下ではこれらの遅延と低メモリ状態によってシステムが無応答になり LifeKeeper がこれをサーバのダウンとして検知しフェイルオーバを開始することがありますこの問題が発生する頻度には多くの要因が影響を及ぼしますプロセッサの速度は I/O がキューに保持される速さに影響します高速なプロセッサでは障害が検知される頻度が高くなりますマルチパス構成での大量の I/O システムメモリの搭載量はシステムが無応答になるまでにキューに保持できる I/O の数に影響しますメモリが多いシステムでは障害が検知される頻度が低くなります使用する LUN の数はキューに保持できる I/O の量に影響します I/O の特性はキューに保持される I/O の量に影響します問題が発生したテストケースではディスクにデータを無制限に書き込んでいましたほとんどのアプリケーションはデータの読み取りと書き込みの両方を行うはずですフェイルオーバを待って読み取りがブロックされることで書き込みも抑制され結果的に I/O 速度が減少して障害検知の頻度が低くなります例えば RDAC を使用した IBM DS4000 のマルチパス構成のテストでは DS4000 への I/O スループットを毎秒 190 MB 以上にしてパス障害をシミュレーションした場合に LifeKeeper は約 12 回に 1 回サーバの障害を ( 誤 ) 検出しましたこのテストではサーバとして IBM x345 ( デュアル Xeon 2.8GHz プロセッサとメモリ 2 GB を搭載 ) を使用し DS4400 に接続して使用サーバ当たり 8 ボリューム (LUN) にしましたフェイルオーバを抑止するために LifeKeeper の LCMNUMHBEATS パラメータ (/etc/default/lifekeeper 内 ) は 16 に増やしましたこのパラメータの変更により無応答のシステムが生存していないと判定するまでに LifeKeeper はデフォルトの約 15 秒ではなく約 80 秒間待機するようになります 96 設定

117 ストレージとアダプタの設定項目大規模ストレージ構成の場合のスイッチオーバに関する特別な考慮事項 HP MA8000 HP MSA1000 および MSA1500 HP 3PAR F200/F400/T400/T800 説明いくつかの大規模ストレージ構成 ( 例えば複数の論理ボリュームグループがあり各ボリュームグループ内に 10 以上の LUN を持つ構成 ) では LifeKeeper は障害を検出したときにデフォルトの 300 秒のタイムアウト時間内に sendevent を完了することができない場合がありますその結果バックアップシステムへのスイッチオーバが失敗しますサービス状態にならないリソースが生じ LifeKeeper のログにエラーメッセージが記録されます大規模ストレージ構成では /etc/default/lifekeeper ファイルの SCSIERROR を event から halt に変更することを推奨しますこれにより LifeKeeper は SCSI エラーの発生時に halt を実行します LifeKeeper はバックアップシステムへのフェイルオーバに成功するようになります QLogic 2200 アダプタとの組み合わせで SIOS Technology Corp. により認定 qla2200 ドライバのバージョン以降を使用してくださいシングルパスおよびマルチパスの両構成において HP FCA2214 (QLA 2340) アダプタとの組み合わせで SIOS Technology Corp. により認定マルチパス構成で MSA1000 をサポートするための構成要件と注意事項は HP のマルチパス I/O の設定セクションで別途説明しています HP 3PAR は SIOS Technology Corp. によってテスト済みですテスト構成は次の通りです HP 3PAR T400 ( ファームウェア (InForm OS) バージョン MU4) + HP 82Q 8Gb Dual Port PCI-e FC HBA AJ764A ( ファームウェアバージョンドライババージョン k) + DMMP (device-mapper el5 device-mapper-multipath el5) テストは LifeKeeper for Linux v7.3 と RHEL 5.6 ( カーネル el5) を使用して行われました HP 3PAR V400 HP 3PAR V400 は SIOS Technology Corp. によってテスト済みですテスト構成は次の通りです HP 3PAR V400 ( ファームウェア (InForm OS) バージョン 3.1.1) + HP 82E 8Gb Dual Port PCI-e FC HBA AJ763A/AH403A ( ファームウェアバージョン 1.11A5 (U3D1.11A5) sli-3 ドライババージョン p (RHEL にバンドル ) + DMMP (device-mapper device-mapper-multipath el6) テストは LifeKeeper for Linux v7.5 と RHEL 6.1 を使用して行われました SteelEye Protection Suite for Linux 97

118 ストレージとアダプタの設定項目 HP EVA 3000/5000 および EVA 4X00/6X00/8X00 (XCS 6.x シリーズファームウェア ) HP EVA4400 HP EVA6400/8400 HP EVA 8100 (XCS 6.x シリーズファームウェア ) HP MSA2000fc HP MSA2000i 説明シングルパスおよびマルチパスの両構成において HP FCA2214 (QLA 2340) アダプタとの組み合わせで SIOS Technology Corp. により認定マルチパス構成で EVA をサポートするための構成要件と注意事項は HP のマルチパス I/O の設定セクションで別途説明しています Hewlett-Packard 社により認定シングルパスとマルチパス構成の両方で DMMP Recovery Kit および HP DMMP ソフトウェアが必要です EVA4400 は Red Hat EL 5 Update 3 および Novell SLES 11 と LifeKeeper の組み合わせで動作することが検証済みです Novell のテストは HP Storage Group によって行われました Hewlett-Packard 社により認定シングルパスとマルチパス構成の両方で DMMP Recovery Kit および HP DMMP ソフトウェアが必要です EVA6400/8400 は Red Hat EL 5 Update 3 および Novell SLES 11 と LifeKeeper の組み合わせで動作することが検証済みです Novell のテストは HP Storage Group によって行われました DMMP マルチパス構成において HP FC 1142SR アダプタとの組み合わせで SIOS Technology Corp. パートナーにより認定マルチパス構成で EVA をサポートするための構成要件と注意事項は Device Mapper Multipath I/O の設定セクションで別途説明しています EVA 8100 は XCS v6.200 ファームウェア + device-mappermultipath el5 + DMMP Recovery Kit v7.3 + RHEL 5.3 でテスト済みですシングルパスおよびマルチパスの両構成においてファイバチャネルとの組み合わせで Hewlett-Packard 社により認定テストされたモデルは QLogic QMH2462 HBA ( ドライババージョン ) を使用した MSA2012fc および MSA2212fc のシングルパス構成ですマルチパス構成のテストでは同一モデルと HP DMMP および LifeKeeper DMMP Recovery Kit が使用されましたマルチパス構成において iscsi との組み合わせで Hewlett- Packard 社により認定テストに使用されたモデルは MSA2012i (HP DMMP 使用 ) です HP ではシングルパス構成のテストは行われていませんが SIOS Technology Corp. は HP DMMP および LifeKeeper DMMP Recovery Kit を組み合わせたシングルパス構成をサポートします 98 設定

119 ストレージとアダプタの設定項目 HP MSA2000sa HP MSA 2300fc HP MSA 2300i HP MSA 2300sa HP P2000 G3 MSA SAS HP P4000/P4300 G2 HP P4500 G2 HP P6300 EVA FC 説明シングルパスおよびマルチパスの両構成において SA との組み合わせで Hewlett-Packard 社により認定テストに使用されたモデルは MSA2012sa ですシングルパスとマルチパス構成の両方で DMMP Recovery Kit および HP DMMP ソフトウェアが必要です現在 HP によるサポートは直接接続構成のみですシングルパスおよびマルチパスの両構成においてファイバチャネルとの組み合わせで Hewlett-Packard 社により認定テストに使用されたモデルは HP AE312A (FC2142SR) HBA ( ドライババージョン d0-rhel4.7-04) を使用した MSA2324fc のシングルパス構成ですマルチパス構成のテストでは同一モデルと HP DMMP および LifeKeeper DMMP Recovery Kit が使用されました Hewlett-Packard 社により認定シングルパスとマルチパス構成の両方で DMMP Recovery Kit および HP DMMP ソフトウェアが必要です Hewlett-Packard 社により認定シングルパスとマルチパス構成の両方で DMMP Recovery Kit および HP DMMP ソフトウェアが必要です DMMP を使用する MSA2300sa ラックおよびタワー型構成のみサポートされます LifeKeeper を使用するブレード構成はサポートされていません Device Mapper Multipath Recovery Kit を使用するマルチパス構成において SIOS Technology Corp. により認定 LifeKeeper for Linux は P2000 G3 SAS アレイを使用する単一クラスタで最大 11 LUN をサポートします RHEL LifeKeeper Core に内蔵の SCSI サポート + iscsi Software Initiators 環境のシングルパスおよびマルチパスの両構成において SIOS Technology Corp. により認定テストに使用されたモデルは HP P4300 G2 7.2TB SAS Starter SAN BK716A ですデフォルトキットはシングルパスおよび一部のマルチパスストレージをサポートします一般的にマルチパスストレージはアクティブ / パッシブ構成に限定されます Hewlett-Packard 社により認定 HP では P4500 について P4000 ( 上記参照 ) との互換性を保証しています Device Mapper Multipath Recovery Kit を使用する RHEL 6.1 のマルチパス構成において SIOS Technology Corp. パートナーによりテスト済み SteelEye Protection Suite for Linux 99

120 ストレージとアダプタの設定項目説明 SteelEye LifeKeeper for Linux v7.2 以降を使用する場合について Hewlett-Packard 社により認定テストに使用されたモデルは HP P9500/XP です以下の環境の LifeKeeper で動作することが認定されています Red Hat Enterprise (32 bit x64 (64 bit; Opteron および Intel EMT64)) HP P9500/XP RHEL 5.3 RHEL 5.4 RHEL 5.5 SuSE Enterprise Server (32 bit x64 (64 bit; Opteron および Intel EMT64)) SLES 10 SP3 SLES 11 SLES 11 SP1 ネイティブまたは内蔵のクラスタリングソリューション : RHCS および SLE HA HP XP20000/XP24000 IBM DS4000 Storage ( 旧 IBM FAStT) RHEL 5 SLES10 SLES 11 上で LifeKeeper for Linux + DMMP ARK を使用するマルチパス構成 (DMMP 使用 ) において SIOS Technology Corp. により認定テストに使用されたストレージのモデル番号は XP20000 および XP24000 です接続インターフェースは FC ですテストに使用された HBA のモデル番号は QLogic QMH2562 ( ファームウェアドライババージョン k) です SIOS Technology Corp. では XP ストレージの path_checker の設定を readsector0 に変更することを推奨しますシングルパスおよびマルチパスの両構成において QLogic 2200 および 2340 アダプタとの組み合わせで SIOS Technology Corp. により認定 qla2200 または qla2300 ドライバのバージョン以降を使用してください (IBM より指定 ) IBM DS4000 ストレージアレイシステムで Emulex FC アダプタを使用する場合は下記の Emulex Drivers 項目で指定の lpfc ドライバを使用してくださいシングルパス (= シングルループ ) サポート : シングルパス構成では LifeKeeper が正常に動作するにはファイバチャネルスイッチまたはハブが必要ですマルチパス (= デュアルループ ) サポート : マルチパスは RDAC サポート付きでリリースされたモデル ( 現在のところ DS4300 DS4400 DS4500 モデル ) でサポートされています RDAC を使用したマルチパス構成ではファイバチャネルスイッチおよびハブは必須ではありません RDAC はアプリケーションがパスの障害に影響されないようにパスのフェイルオーバを処理するソフトウェアパッケージです RDAC をインストールおよび設定する手順は使用するバージョンによって若干異なりますインストールビルド設定の手順については RDAC に関する IBM のドキュメンテーションを参照してください 100 設定

121 ストレージとアダプタの設定 IBM DS5000 IBM DS3500 (FC モデル ) 項目説明 IBM RDAC を使用するマルチパス構成においてパートナーテストにより認定お使いのディストリビューションでサポートされている RDAC ドライバについては IBM の Web サイトを参照してください Red Hat Enterprise Linux Server Release 5.5 (Tikanga) 環境のシングルパスおよびマルチパスの両構成において SIOS Technology Corp. により認定 (HBA: QLE2560 QLE2460 RDAC: RDAC C ) シングルパスおよびマルチパスの両構成で RDAC が必要です注記 : SAS および iscsi 接続はサポートされていません IBM DS3400 Storage IBM System Storage DS3300 IBM System Storage DS3200 IBM DS400 IBM San Volume Controller (SVC) シングルパスおよびマルチパスの両構成において QLogic 2300 アダプタとの組み合わせで SIOS Technology Corp. により認定 qla2200 または qla2300 ドライバのバージョン以降を使用してください (IBM より指定 ) シングルパスおよびマルチパスのサポートに関する詳細については表内の IBM DS4000 Storage エントリを参照してください iscsi Software Initiators との組み合わせで SIOS Technology Corp. により認定このストレージデバイスはシングルパスおよびマルチパスの両構成において 2 ノードの LifeKeeper クラスタで動作しますシングルパスまたはマルチパスのいずれの場合も両方のサーバに IBM RDAC ドライバをインストールする必要がありますマルチパス構成を使用する場合は /etc/default/lifekeeper ファイルで SCSIHANGMAX を 50 に設定する必要がありますお使いのディストリビューションでサポートされている RDAC ドライバについては IBM の Web サイトを参照してください IBM SAS HBA (25R8060) との組み合わせで SIOS Technology Corp. により認定このストレージデバイスはシングルパスおよびマルチパスの両構成において 2 ノードの LifeKeeper クラスタで動作しますシングルパスまたはマルチパスのいずれの場合も両方のサーバに IBM RDAC ドライバをインストールする必要がありますお使いのディストリビューションでサポートされている SAS および RDAC ドライバについては IBM の Web サイトを参照してくださいシングルパス構成の場合のみ SIOS Technology Corp. により認定ファームウェアバージョン 7.01 ビルド 0838 以降を使用してください (IBM より指定 ) シングルパス構成においてパートナーテストにより認定 SDD Recovery Kit および Device Mapper Multipath Recovery Kit を使用するマルチパス構成において SIOS Technology Corp. により認定 SteelEye Protection Suite for Linux 101

122 ストレージとアダプタの設定項目 IBM eserver xseries ストレージソリューションサーバ Type445-R / Type445-FR for SANmelody IBM Storwize V7000 ( ファームウェアバージョン ) 説明マルチパス構成において IBM TotalStorage FC2-133 ホストバスアダプタとの組み合わせでパートナーテストにより認定 qla2200 ドライバのバージョン ( フェイルオーバなし ) 以降を使用してください (IBM より指定 ) マルチパスサポート : マルチパスは Multipath Linux Driver for IBM SANmelody Solution Server ( バージョン 1.0.0) を使用する IBM eserver xseries ストレージソリューションサーバ Type445-R / Type445- FR for SANmelody でサポートされています SIOS Technology Corp. は iscsi (iscsi-initiator-utils el6.x86_64) と DMMP (device-mapper el6 device-mapper-multipath el6) を使用する IBM Storwize V7000 (Firmware Version ) を認定していますテストは LifeKeeper for Linux v7.5 と RHEL 6.2 を使用して行われました制限事項 : IBM Storwize V7000 は Quorum/Witness Server Kit および STONITH と組み合わせて使用する必要があります /etc/default/lifekeeper 内で以下の設定により SCSI リザベーションを無効にしてください RESERVATIONS=none 102 設定

123 ストレージとアダプタの設定項目説明 SIOS Technology Corp. は以下の構成要件を満たす場合の Dell PERC 2/DC Dell PERC 4/DC および LSI Logic MegaRAID Elite 1600 ストレージコントローラを使用する 2 ノードクラスタでの Dell PowerVault ストレージアレイを認定しています (Dell PERC 3/DC は MegaRAID Elite 1600 の OEM バージョンです ) 以下の要件が必要となるのはこれらのホストベースの RAID コントローラが LifeKeeper の通常の要件である SCSI リザベーションと一意のデバイス ID をサポートしていないためです 1. Dell PowerVault ストレージは同一クラスタ内の LifeKeeper の管理下では他のタイプの共有ストレージと共存できません Dell PERC および LSI Logic MegaRAID コントローラを搭載する Dell PowerVault 2. Dell PowerVault ストレージおよびコントローラをクラスタで使用するための設定方法についてはハードウェアに付属のマニュアルに従ってください具体的には両方のシステムで同時にコントローラファームウェアの設定画面を開きアダプタプロパティページを選択 Cluster Mode] を Enabled に設定 Initiator ID を一方のシステムでは 6 に他方のシステムでは 7 に設定することなどが含まれますその後両方のコントローラから同じ LUN が見えること Linuxmegaraid ドライバが正常にロードされていることを確認します 3. 以上のストレージ設定は SCSI リザベーションをサポートしないため LifeKeeper 内で SCSI リザベーションの使用を無効にする必要があります無効にするにはクラスタの両ノードで LifeKeeper のデフォルトファイル /etc/default/lifekeeper に RESERVATIONS=none を追加します LifeKeeper によって管理される各 LUN の一意の ID は /opt/lifekeeper/bin/lkid ユーティリティを使用して手動で設定する必要があります割り当てる ID はクラスタ内で一意にしてくださいまた将来競合が発生しないように割り当て方法を工夫してください lkid ユーティリティは一意の ID を自動的に生成することもできます lkid ユーティリティの使用方法生成する ID ID が置かれる場所制限事項などの詳細については lkid(8) ヘルプページを参照してください LVM で lkid を使用する際の注意についてはの既知の問題セクションを参照してください 4. I/O フェンシングを提供する STONITH デバイスを用意して設定しますこれは上記の構成で SCSI リザベーションのサポートがないために必要ですこの設定では STONITH デバイスが再起動コマンドではなく電源切断コマンドをシステムに対して実行するようにしますさらに LifeKeeper の通信が何らかの理由で中断したとき手動操作によって同時に両ノード上のデバイス階層をサービス中の状態にしないように注意してください SteelEye Protection Suite for Linux 103

124 ストレージとアダプタの設定項目 Dell EMC (CLARiiON) CX200 DELL MD3000 Dell PowerVault MD3200/3220 Dell EqualLogic PS5000 説明 EMC はこのアレイと QLA2340 アダプタの環境用に次の 2 つのバージョンのドライバを認定しています : qla2x00-clariionv および qla2x00-clariion-v 両バージョンとも QLogic の Web サイト ( で入手できますシングルパスおよびマルチパスの両構成において DELL SAS 5/e との組み合わせでパートナーテストにより認定テストは RHEL4 で行われましたが LifeKeeper がサポートする他の Linux ディストリビューションまたはバージョンを使用する場合の既知の問題はありませんシングルパスおよびマルチパスの両構成で RDAC が必要ですシングルパス構成では HBA ホストタイプに Windows MSCS Cluster single path を使用してくださいマルチパス構成では HBA ホストタイプに Linux を使用してください Dell PowerVault MD3200/3220 は SIOS Technology Corp. パートナーによってテスト済みですテスト構成は次の通りです RHEL 5.5 で DMMP と DMMP Recovery Kit Quorum/Witness Server Kit および STONITH と組み合わせて使用する必要があります /etc/default/lifekeeper 内に RESERVATIONS=none を設定して SCSI リザベーションを無効にしますサーバには IPMI 2.0 に準拠のインターフェースが必須です Dell EqualLogic は SIOS Technology Corp. パートナーによってテスト済みですテスト構成は次の通りです Dell EqualLogic PS iscsi-initiator (Software イニシエータ ) による SCSI -2 リザベーション + Red Hat Enterprise Linux ES release 4 (Nahant Update 5 カーネル EL) テストには iscsi-initiator-utils マルチパス構成 active-backup (mode=1) による bonding が使用されました Dell EqualLogic PS DMMP + DMMP Recovery Kit + RHEL 5 + iscsi-initiator-utils el5 LUN 数が大きい場合 (20 以上 ) は /etc/default/lifekeeper の REMOTETIMEOUT 設定を REMOTETIMEOUT=600 に変更してください 104 設定

125 ストレージとアダプタの設定項目 Dell EqualLogic PS4000/4100/4110/6000/6010/6100 /6110/6500/6510 FalconStor Network Storage Server (NSS) 説明 Dell EqualLogic は SIOS Technology Corp. パートナーによってテスト済みですテスト構成は次の通りです Dell EqualLogic PS4000/4100/4110/6000/6010/6100/6110/6500/ DMMP + DMMP Recovery Kit + RHEL iscsi-initiatorutils el5 LUN 数が大きい場合 (20 以上 ) は /etc/default/lifekeeper の REMOTETIMEOUT 設定を REMOTETIMEOUT=600 に変更してください SIOS Technology Corp. により認定 /etc/multipath.conf に以下のパラメータを設定する必要があります polling_interval 5 no_path_retry 36 日立 HDS RAID 700 (VSP) RAID 700 (VSP) は SIOS Technology Corp. パートナーによってシングルパス構成にてテスト済みですテスト構成は次の通りです : OS: Red Hat Enterprise Linux Server Release 5.5 (Tikanga) HBA: Qlogic QLE2562 ( ドライバ :OS 同梱の k) / Emulex LPe12002 ( ドライバ :OS 同梱の p). 注記 : マルチパス構成はまだ認定されていません SteelEye Protection Suite for Linux 105

126 ストレージとアダプタの設定項目日立 HDS 9570V 9970V 9980V 説明 QLogic 23xx アダプタを使用するシングルパス構成において SIOS Technology Corp. により認定 qla2200 ドライバのバージョン 6.04 以降を使用してください注記 : これらのアレイではファイバチャネルスイッチまたはハブを使用してシングルコントローラ ( シングルループ ) のみの構成にすることを SIOS Technology Corp. は推奨しますただし各サーバのストレージへのパスが単一である限りスイッチやハブを使用することなく各サーバが日立アレイの個別のコントローラまたはポートに直接接続する LifeKeeper クラスタを構成することもできますこの構成を使用する場合 LifeKeeper はスプリットブレインの状況で通常の動作とは非常に異なる動作をすることに注意してください通常 LifeKeeper はスプリットブレインの状況でアクティブな階層のフェイルオーバを実行し元のプライマリノードは SCSI リザベーションを奪われた結果としてリブートを行いますサーバを直接複数のコントローラまたはポートに接続する構成の日立アレイの場合アレイ内の特定のタイミングに特殊性があるため LifeKeeper はバックアップノード上で SCSI リザベーションを獲得することができずにフェイルオーバに失敗しますこれにより階層の少なくとも一部が元のプライマリノードで稼働し続けますこのためこのような構成にあるすべての LifeKeeper リソースがディスクリソースの 1 つに対して直接の従属関係を持ちディスクリソースの移行ができない場合にリソースをサービス中の状態にできないようにすることが重要ですこのことは階層内の IP リソースについて特に重要です日立アレイにはこのアレイのような直接接続の構成で LifeKeeper を正常に動作させるために必要なある特定のホストモードがあります 9570V アレイの場合は以下の設定が必要です日立 HDS 9980V ホスト接続モード 1 --> Standard mode ホスト接続モード 2 --> Target Reset mode (Bus Device Reset) Third Party Process Logout Spread mode LIP ポート全リセットモード --> LIP port all reset mode 9970V および 9980V アレイについてはホストモード " を SUN に設定する必要があります HDS 9980V は SLES9 SP3 LSI Logic Fusion HBA DMMP を使用するマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みです詳細については Device Mapper Multipath I/O の設定セクションを参照してください 106 設定

127 ストレージとアダプタの設定項目 nstor NexStor 4320F ADTX ArrayMasStor L and FC-II 富士通 ETERNUS3000 富士通 ETERNUS 6000 富士通 FibreCAT S80 富士通 ETERNUS SX300 富士通 ETERNUS2000 Model 50 説明このストレージは 2 ノードクラスタの各サーバがアレイ内の別々のコントローラに直接接続するデュアルコントローラ構成において SIOS Technology Corp. パートナー企業によりテスト済みですこの構成ではスプリットブレインの状況で LifeKeeper は日立 HDS ストレージアレイについて説明した動作と同じように動作するため階層構成上の同じ注意事項が当てはまりますこのストレージユニットはスイッチを使用するシングルパス構成および 2 ノードクラスタの各サーバがアレイ内の別々のコントローラに直接接続するデュアルコントローラ構成において SIOS Technology Corp. パートナーによりテスト済みです両方の構成においてスプリットブレインの状況で LifeKeeper は日立 HDS ストレージアレイについて説明した動作と同じように動作するため階層構成上の同じ注意事項が当てはまります ArrayMasStor L は QLogic 2340 および 2310 ホストアダプタ QLogic フェイルオーバドライバ ( バージョン ) を使用するマルチパス構成においても SIOS Technology Corp. パートナーによってテストおよび認定済みですこのストレージユニットは PG-FC105 (Emulex LP9001) PG- FC106 (Emulex LP9802) PG-PC107 ホストバスアダプタ lpfc ドライバ v を使用するシングルパス構成において SIOS Technology Corp. パートナー企業によりテスト済みですこのストレージユニットは PG-FC106 (Emulex LP9802) ホストバスアダプタ lpfc ドライバ v を使用するシングルパス構成において SIOS Technology Corp. パートナーによりテスト済みですこのアレイでは /etc/default/lifekeeper に次のエントリを追加する必要があります ADD_LUN_TO_DEVICE_ID=TRUE このストレージユニットは PG-FC106 (Emulex LP9802) および PG-FC107 ホストバスアダプタ lpfc ドライバ v を使用するマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みです SX300 に同梱の RDAC ドライバが必要ですこのストレージユニットは PG-FC202 (LPe1150-F) ホストバスアダプタ EMPD マルチパスドライバを使用するデュアル RAID コントローラによるマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みですテストではファームウェアバージョン WS2.50A6 およびドライババージョン EMPD V2.0L12 が使用されましたテストは LifeKeeper for Linux v6.2 と RHEL4 ( カーネル ELsmp) および RHEL5 ( カーネル el5) を使用して行われました SteelEye Protection Suite for Linux 107

128 ストレージとアダプタの設定項目富士通 ETERNUS4000 Model 300 富士通 ETERNUS2000 Model 200 説明このストレージユニットは PG-FC202 (LPe1150-F) ホストバスアダプタ EMPD マルチパスドライバを使用するデュアル RAID コントローラによるマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みですこのストレージユニットは PG-FC203L (Emulex LPe1250-F8) ホストバスアダプタ ( ファームウェアバージョン 1.11A5 ドライババージョン p) EMPD マルチパスドライバ ( ドライババージョン V2.0L20 パッチバージョン T000973LP-1) を使用するマルチパス構成において Fujitsu Limited によりテスト済みですテストは LifeKeeper for Linux v7.1 と RHEL 5 ( カーネル el5) を使用して行われました富士通 ETERNUS VS850 Device Mapper Multipath Recovery Kit を使用するシングルパス構成およびマルチパス構成においてベンダサポートステートメントにより認定 108 設定

129 ストレージとアダプタの設定項目説明マルチパスデバイスを使用するアプリケーションとファイルシステムの保護 : SPS デバイスを使用するアプリケーションやファイルシステムを LifeKeeper によって設定し保護するには SPS Recovery Kit をインストールする必要があります SPS Kit のインストール後は 1 つ以上のマルチパスデバイスノードを使用するアプリケーション階層を作成するだけで SPS Kit が提供する新しいリソースタイプが自動的に組み込まれますマルチパスデバイスノード : SPS Kit を使用するにはすべてのファイルシステムおよび RAW デバイスをネイティブの /dev/sd* デバイスノードではなくマルチパスデバイスノード (/dev/dd*) 上にマウントまたは設定する必要があります SCSI-3 Persistent Reservations の使用 : SPS Kit はリザベーションタイプを書き込み専用とする SCSI-3 Persistent Reservations を使用しますこの場合クラスタの 1 ノードが予約したデバイスはクラスタの他のノードから読み取り可能のままですがデバイスへの書き込みはできなくなりますこのことはそれらの他のノード上で進行中の読み取り専用アクセスのためにファイルシステムをマウントできるという意味ではないことに注意してください NEC istorage Storage Path Savior Multipath I/O LifeKeeper では sg_persist ユーティリティを使用してパーシステントリザベーションを発行監視します必要であれば LifeKeeper は sg_persist(8) ユーティリティをインストールしますハードウェア要件 : SPS Kit は Emulex LP952 LP9802 LP1050 LP1150 HBA および Emulex lpfc ドライバを使用する NEC istorage ディスクアレイにおいてテストおよび認定済みです SPS Kit は SPS がサポートする他の NEC istorage D および S でも同様に問題なく動作すると考えられますマルチパスソフトウェアの要件 : SPS Kit は SPS for Linux を使用してテスト済みですインストールされている SPS パッケージに対する既知の依存関係はありませんインストール要件 : SPS Recovery Kit をインストールする前に SPS ソフトウェアをインストールする必要があります SPS パスの追加または修復 : LifeKeeper は SPS リソースを起動する場合パーシステントリザベーションを確立してその時点でアクティブなパスに登録します最初のリザベーションの後に新しいパスが追加されるか障害が起きたパスが修復されて SPS がそのパスを自動的に再度アクティブにした場合そのパスは LifeKeeper が SPS リソースに対する次の quickcheck を実行するまでリザベーションの一部として登録されませんその時点までに SPS がそのパスに対する書き込みを許可した場合リザベーション競合が発生しシステムのメッセージファイルに競合が記録されます SPS ドライバは登録されたパスでそれらの I/O を再試行するためアプリケーションにとっては検出 SteelEye 可能な障 Protection 害になりません Suite forquickcheck Linux 109 によるパスの登録が完了するとその後の書き込みは成功し

130 ストレージとアダプタの設定項目説明このストレージユニットは QLogic PCI to Fibre Channel Host Adapter for QLE2462 ( ファームウェアバージョン [IP] ドライババージョン ) ストレージファームウェア J200 を使用するデュアル RAID コントローラによるマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みですテストは LifeKeeper for Linux v6.2 DMMP Recovery Kit v6.2 および以下のディストリビューションとカーネルを使用して行われました RHEL4 DMMP Newtech SweeperStor SATA および SAS Emulex LP 以降 Emulex LPe 以降 Qlogic QLA 以降 Qlogic QLE 以降 RHEL5 DMMP Emulex LP 以降 Emulex LPe 以降 Qlogic QLA 以降 Qlogic QLE 以降 SLES10 DMMP Emulex LP 以降 Emulex LPe 以降 Qlogic QLA 以降 Qlogic QLE 以降注記 : マルチパス構成では DMMP が必要ですこのストレージは SIOS Technology Corp. パートナーによってテスト済みですテストのシングルパス構成は次の通りですホスト 1 Qlogic QLE2562 (HBA BIOS 2.10 ドライババージョン qla2xxx k *) TID MassCareRAID ホスト 2 HP AE312A (HBA BIOS 1.26 ドライババージョン qla2xxx k *) テストは LifeKeeper for Linux v7.3 と Red Hat Enterprise Linux 5.5 ( カーネル el5) を使用して行われました LifeKeeper for Linux は TID MassCareRAID アレイを使用する単一クラスタで最大 11 LUN をサポートします 110 設定

131 ストレージとアダプタの設定項目 TIDMassCareRAIDⅡ Sun StorageTek 2540 QLogic ドライバ Emulex ドライバ Adaptec 29xx ドライバ DataCore SANsymphony 説明このストレージユニットは Qlogic ドライバと SCSI-2 リザベーションを使用しファイバチャネルスイッチを使用しないマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みです Red Hat Enterprise Linux ES release 4 Update6 ( カーネル ELsmp) が使用されました /etc/default/lifekeeper の FAILFASTTIMER 設定を 5 から 30 に変更する必要がありますこのストレージユニットは StorageTek 4Gb PCI-E Dual FC ホストバスアダプタおよび Sun StorageTek 4Gb PCI Dual FC ネットワークアダプタを使用する RDAC + デュアル RAID コントローラによるマルチパス構成において SIOS Technology Corp. パートナー企業によりテスト済みです QLogic アダプタを使用するサポート対象の他のファイバチャネルアレイについては qla2200 または qla2300 ドライバのバージョン以降を使用してくださいサポート対象の Emulex HBA については lpfc ドライバ v 以降を使用してください Adaptec 29xx を使用するサポート対象の SCSI アレイについては OS ディストリビューションに付属の aic7xxx ドライババージョン以降を使用してくださいこのストレージデバイスは SUSE SLES 9 Service Pack 3 Device Mapper Multipath および Qlogic 2340 アダプタを使用してテスト済みです他のバージョンディストリビューションアダプタを組み合わせても動作すると考えられますがテストは実施されていませんこの構成および他の構成についての具体的なサポートについては DataCore にお問い合わせください高負荷でのフェイルオーバのテストで 1 つの問題が見つかっています複数のサーバがリブートした場合にサーバがシングルパスのみを構成する状態になりますテストは 3 ノードクラスタで構成され 2 台のサーバが同時に切断されました 2 台のサーバがリブートした後約半分の時間 1 台のサーバがシングルパスのみを持つ状態になりましたこの問題はそのサーバをリブートすれば解決しますサーバを 1 台だけリブートしたときはこの問題は見られませんでしたこの問題は DataCore に報告済みです最低 1 つのパスが継続的に利用できるためこの問題は深刻な問題とはみなされていません SteelEye Protection Suite for Linux 111

132 HP のマルチパス I/O 設定項目説明このストレージデバイスは ed Hat EL 4 Update 3 および Qlogic 2340 アダプタを使用してテスト済みです他のバージョンディストリビューションアダプタを組み合わせても LifeKeeper は動作すると考えられますがテストは実施されていませんこの構成および他の構成についての具体的なサポートについては Xiotech にお問い合わせください Magnitude 3D はシングルパス構成でテストが行われました Xiotech Magnitude 3D セットアップ中に OS で 8 LUN しか構成できないという構成上の問題が 1 つ検出されましたこれは Magnitude 3D が SCSI 問い合わせデータの中で自身を SCSI-2 デバイスに指定しているためです 2.6 カーネルの SCSI ドライバはデバイスが例外リストに含まれていない限り 8 を超える LUN を SCSI-2 デバイス上で自動で認識しません Magnitude 3D はそのリストに入っていません /proc/scsi/scsi にコマンドを発行して各 LUN を構成するという対応策が Xiotech からテスト用に提供されました HP のマルチパス I/O 設定項目 Secure Path を使用する場合の MSA1000 および MSA1500 のマルチパス要件 HP P2000 Secure Path を使用する場合の EVA3000 および EVA5000 のマルチパス要件説明 LifeKeeper は MSA1000 および MSA1500 を使用するマルチパス I/O 構成で Secure Path をサポートしますこのサポートの要件として Secure Path v3.0c 以降を使用する必要があります LifeKeeper は HP P2000 MSA FC の使用をサポートしますこのストレージユニットは RHEL 5.4 上のマルチパス構成において SIOS Technology Corp. によってテスト済みです Secure Path を使用するマルチパス I/O 構成で EVA3000 および EVA5000 を LifeKeeper がサポートするには次の要件があります 1. EVA VCS v2.003 または v3.00 以降各サーバで Command View v3.00 を使用して [Host OS type] を [Custom] に [Custom Mode Number] を [hex e] に設定してください詳細な手順については HP Secure Path リリースノートを参照してください 2. HP Secure Path v3.0c 以降 112 設定

133 HP のマルチパス I/O 設定 Secure Path を使用するマルチパスクラスタのインストール Secure Path を使用するマルチパスクラスタを新規にインストール場合は次の手順を実行します 1. 選択した OS を各サーバにインストールします 2. 次のクラスタハードウェアをインストールします FCA2214 アダプタストレージスイッチおよびケーブル 3. HP Platform Kit をインストールします 4. HP Secure Path ソフトウェアをインストールしますここでシステムをリブートする必要があります Secure Path からストレージへのパスを適切に設定したことを確認します詳細については Secure Path のドキュメンテーションを参照してください 5. LifeKeeper をインストールします QLogic Failover Driver を使用する MSA1000 および MSA1500 のマルチパスサポート QLogic Failover Driver を使用する EVA のマルチパスサポート LifeKeeper for Linux は MSA1000 および MSA1500 を使用するマルチパス I/O 構成で QLogic Failover Driver をサポートしますこのサポートの要件として QLogic ドライバ v 以降を使用する必要があります LifeKeeper は EVA 3000/5000 および EVA 4X00/6X00/8X00 で QLogic Failover Driver をサポートします 3000/5000 ではファームウェアバージョン 4000 以上が必要です 4000/6000/8000 ではファームウェアバージョン 5030 以上が必要です HP が提供する QLogic ドライバの最新版 (v 以降 ) を使用する必要がありますホスト接続は Linux にしてくださいパス / モード設定に LifeKeeper からの制限はありません特殊なホスト接続パス / モードの推奨設定および使用可能な EVA のポートなどの以前の制限はこのバージョンのファームウェアとドライバには存在しないことに注意してください SteelEye Protection Suite for Linux 113

134 HP のマルチパス I/O 設定 MSA1000/MSA1500 または EVA のシングルパス構成から Secure Path を使用するマルチパス構成へのアップグレードシングルパスからマルチパスにクラスタをアップグレードするには次の手順を実行します ( アップグレードはクラスタ全体で行う必要があります ) 1. 通常のアップグレード手順に従って LifeKeeper を最新バージョンにアップグレードしますこの手順をローリングアップグレードで行うとクラスタ全体の停止を回避できます 2. すべてのノードで LifeKeeper を停止しますハードウェアのアップグレードが完了しすべてのノードでステップ 5 が完了するまでクラスタはダウンした状態です 3. 各ノードで HP Platform Kit をインストール / アップグレードします 4. 各ノードに HP Secure Path ソフトウェアをインストールしますここでシステムをリブートする必要があります Secure Path からストレージへのパスを適切に設定したことを確認します詳細については Secure Path のドキュメンテーションを参照してください 5. LifeKeeper を起動しますすべての階層がアップグレード前と同様に動作するはずです注記 : これは LifeKeeper の以前のバージョンがサポートしていたアップグレード方法から変更された点です Secure Path による永続的デバイスノード Secure Path は /dev/spdev/spxx (XX はデバイス名 ) の形式の永続的なデバイスノードをサポートしますこれらのノードは特定の SCSI デバイスノード /dev/sdxx へのシンボリックリンクです LifeKeeper はこれらのノードを通常の SCSI デバイスノード /dev/sdxx であるかのように認識します LifeKeeper はデバイスが /dev/sda1 か /dev/sdq1 かを直接検出しその後正しいデバイスノードを直接使用することによりリブートおよびクラスタノードをまたがってデバイス名の永続性を独自に維持しています注記 : SCSI デバイスノードへのシンボリックリンクのサポートは LifeKeeper v4.3.0 で追加されましたアクティブ / パッシブコントローラおよびコントローラスイッチオーバ起動時にシングルパスでも通知が発生しない MSA1000 では一方のコントローラをアクティブに他方のコントローラをスタンバイモードにすることによってマルチパスを実装していますアクティブなコントローラまたはアクティブなコントローラへのパスのいずれかに問題が起きた場合スタンバイコントローラがアクティブ化されて処理を引き継ぎますコントローラをアクティブにする場合コントローラの準備ができるまでにある程度の時間がかかりますアレイ上で設定されている LUN の数に応じて 30 ~ 90 秒の時間を必要としますこの間ストレージへの I/O は新しくアクティブになるコントローラに経路変更できるようになるまでブロックされますシステムがロードされたときにサーバがシングルパスでしかストレージにアクセスできない場合でもこの問題に関する通知が発生しませんこの問題はシステムがリブートしたときに上記のような物理的なパスの障害が起きると発生しますが一時的なパス障害でも発生していますシステムをロードするときは管理者はストレージへのすべてのパスが正しく構成されたことを必ず確認し構成されていない場合はハードウェアの問題を修復するかシステムをリロードして一時的な問題を解決するかいずれかのアクションを取ることを推奨します 114 設定

135 EMC PowerPath のマルチパス I/O 設定 EMC PowerPath のマルチパス I/O 設定マルチパスデバイスを使用するアプリケーションとファイルシステムの保護 EMC PowerPath デバイスを使用するアプリケーションやファイルシステムを LifeKeeper によって設定し保護するには PowerPath Recovery Kit をインストールする必要があります PowerPath Kit のインストール後は 1 つ以上のマルチパスデバイスノードを使用するアプリケーション階層を作成するだけで PowerPath Kit が提供する新しいリソースタイプが自動的に組み込まれますマルチパスデバイスノード SCSI-3 Persistent Reservations の使用 PowerPath Kit を使用するにはすべてのファイルシステムおよび RAW デバイスをネイティブの /dev/sd* デバイスノードではなくマルチパスデバイスノード (/dev/emcpower*) 上にマウントまたは設定する必要があります PowerPath Kit はリザベーションタイプを書き込み専用とする SCSI-3 Persistent Reservations を使用しますこの場合クラスタの 1 ノードが予約したデバイスはクラスタの他のノードから読み取り可能のままですがデバイスへの書き込みはできなくなりますこのことはそれらの他のノード上で進行中の読み取り専用アクセスのためにファイルシステムをマウントできるという意味ではないことに注意してください LifeKeeper では sg_persist ユーティリティを使用してパーシステントリザベーションを発行監視します必要であれば LifeKeeper は sg_persist(8) ユーティリティをインストールします EMC Symmetrix (VMAX を含む ) アレイをマルチパスソフトウェアおよび LifeKeeper と組み合わせて使用する場合は SCSI-3 Persistent Reservations を LUN 単位で有効にする必要がありますこのことは DMMP と PowerPath の両方に当てはまりますハードウェア要件 PowerPath Kit は QLogic QLA2340 HBA (EMC が推奨する qla2xxx ドライバを使用 ) および Emulex LP10000 HBA (EMC が推奨する lpfc ドライバを使用 ) を使用する EMC CLARiiON CX300 ディスクアレイにおいてテストおよび認定済みです PowerPath Kit は QLogic QLA2340 HBA を使用する EMC CLARiX CX3-20 においてもテストおよび認定済みです注記 : RHEL 6 上の LifeKeeper は EMC Clariion に接続されているリザベーションをサポートできませんこのキットは EMC の他の CLARiiON モデルまたは EMC から Dell や他のベンダへの OEM の CLARiiON モデルでも同様に問題なく動作すると考えられますマルチパスソフトウェアの要件 PowerPath Kit v には PowerPath for Linux v5.3 が必要です PowerPath Kit v より前のバージョンでは PowerPath for Linux v4.4.x v4.5.x v5.0.x v5.0.x が必要です SteelEye Protection Suite for Linux 115

136 EMC PowerPath のマルチパス I/O 設定 PowerPath v5.3 ドライバへの移行方法オプション A 1. 以下の手順を実行して PowerPath 5.3 ドライバにアップグレードします a. 古い PowerPath ドライバを削除 b. PowerPath 5.3 ドライバをインストール 2. PowerPath Kit にアップグレードします 3. サーバをリブートします注記 : サーバをリブートするとき PowerPath Kit が LifeKeeper PowerPath リソースとして使用されます PowerPath ドライバ 5.3 に問題があり古い PowerPath ドライバを使用しなければならない場合このオプションでは v キットをインストールする前に使用していたバージョンの PowerPath Kit を再インストールする必要がありますオプション B 1. 以下の手順を実行して PowerPath 5.3 ドライバにアップグレードします a. 古い PowerPath ドライバを削除 b. PowerPath 5.3 ドライバをインストール c. サーバをリブートします 2. PowerPath Kit にアップグレードし以下のいずれかを実行してアップグレードされた Recovery Kit を使用して PowerPath リソースを開始しますオプション 1: PowerPath リソースをサービス休止にして再度サービス状態に戻します注記 : これを行うには PowerPath デバイスを使用するすべてのアプリケーションをいったん停止してから再起動する必要がありますこのオプションの場合操作を順次実行することができるため別々の時間に実行して大きな変更を回避することが可能ですオプション 2: LifeKeeper を停止 (lkstop) してから起動 (lkstart) しますこれによりすべてのリソースがいったんサービス休止になった後再度サービス状態に戻ります注記 : この方法ではオプション 1 と同様にすべてのアプリケーションを停止しますが 2 つのコマンドだけですべての PowerPath リソースが新しいキットを使うようにできるためユーザの介入が少なくて済みますオプション 3: LifeKeeper をすぐに停止 (lkstop) してから起動 (lkstart) します注記 : この方法ではアプリケーションを実行したまま LifeKeeper にストレージへのアクセス方法をリロードさせますアプリケーションの停止時間はありません 116 設定

137 IBM SDD によるマルチパス I/O 設定 IBM SDD によるマルチパス I/O 設定マルチパスデバイスを使用するアプリケーションとファイルシステムの保護 IBM SDD デバイスを使用するアプリケーションやファイルシステムを LifeKeeper によって設定し保護するには SDD Recovery Kit をインストールする必要があります SDD Kit のインストール後は 1 つ以上のマルチパスデバイスノードを使用するアプリケーション階層を作成するだけで SDD Kit が提供する新しいリソースタイプが自動的に組み込まれますマルチパスデバイスノード SCSI-3 Persistent Reservations の使用 SDD Kit を使用するにはすべてのファイルシステムおよび RAW デバイスをネイティブの /dev/sd* デバイスノードではなくマルチパスデバイスノード (/dev/vpath*) 上にマウントまたは設定する必要があります SDD Kit はリザベーションタイプを書き込み専用とする SCSI-3 Persistent Reservations を使用しますこの場合クラスタの 1 ノードが予約したデバイスはクラスタの他のノードから読み取り可能のままですがデバイスへの書き込みはできなくなりますこのことはそれらの他のノード上で進行中の読み取り専用アクセスのためにファイルシステムをマウントできるという意味ではないことに注意してください LifeKeeper では sg_persist ユーティリティを使用してパーシステントリザベーションを発行監視します必要であれば LifeKeeper は sg_persist(8) ユーティリティをインストールしますハードウェア要件マルチパスソフトウェアの要件 SDD パスの追加または修復 SDD Kit は QLogic QLA2340 HBA (IBM が推奨する qla2xxx ドライバを使用 ) を使用する IBM ESS ディスクアレイおよび IBM SAN Volume Controller (SVC) においてテストおよび認定済みです SDD Kit は SDD ドライバがサポートする他の IBM ディスクアレイと HBA アダプタ (Emulex) でも同様に問題なく動作すると考えられます IBM が推奨する HBA ドライバを必ず使用する必要があります SDD Kit には IBM SDD ドライバ v 以降を使用する必要があります LifeKeeper は SDD リソースを起動する場合パーシステントリザベーションを確立してその時点でアクティブなパスに登録します最初のリザベーションの後に新しいパスが追加されるか障害が起きたパスが修復されて SDD がそのパスを自動的に再度アクティブにした場合そのパスは LifeKeeper が SDD リソースに対する次の quickcheck を実行するまでリザベーションの一部として登録されませんその時点までに SDD がそのパスに対する書き込みを許可した場合リザベーション競合が発生し SDD のログファイルとシステムのメッセージファイルに競合が記録されます SDD ドライバは登録されたパスでそれらの I/O を再試行するためアプリケーションにとっては検出可能な障害になりません quickcheck によるパスの登録が完了するとその後の書き込みは成功します Hitachi HDLM のマルチパス I/O 設定 SteelEye Protection Suite for Linux 117

138 Hitachi HDLM のマルチパス I/O 設定マルチパスデバイスを使用するアプリケーションとファイルシステムの保護 HDLM デバイスを使用するアプリケーションやファイルシステムを LifeKeeper によって設定し保護するには HDLM Recovery Kit をインストールする必要があります HDLM Kit のインストール後は 1 つ以上のマルチパスデバイスノードを使用するアプリケーション階層を作成するだけで HDLM Kit が提供する新しいリソースタイプが自動的に組み込まれますマルチパスデバイスノード SCSI-3 Persistent Reservations の使用 HDLM Kit を使用するにはすべてのファイルシステムおよび RAW デバイスをネイティブの /dev/sd* デバイスノードではなくマルチパスデバイスノード (/dev/sddlm*) 上にマウントまたは設定する必要があります HDLM Kit はリザベーションタイプを書き込み専用とする SCSI-3 Persistent Reservations を使用しますこの場合クラスタの 1 ノードが予約したデバイスはクラスタの他のノードから読み取り可能のままですがデバイスへの書き込みはできなくなりますこのことはそれらの他のノード上で進行中の読み取り専用アクセスのためにファイルシステムをマウントできるという意味ではないことに注意してください LifeKeeper では sg_persist ユーティリティを使用してパーシステントリザベーションを発行監視します必要であれば LifeKeeper は sg_persist(8) ユーティリティをインストールしますハードウェア要件マルチパスソフトウェアの要件 HDLM Kit は QLogic QLA2432 HBA および k5-rhel ドライバと Silkworm3800 FC スイッチを使用した Hitachi AMS1000 ディスクアレイにおいてテストおよび認定されました HDLM Kit は他の日立ディスクアレイでも同様に問題なく動作すると考えられます HDLM Kit は SANRISE AMS シリーズ SANRISE USP Hitachi VSP においても認定済みです HBA および HBA ドライバは HDLM がサポートするものを使用してください BR1200 は Hitachi Data Systems により認定シングルパスとマルチパス構成の両方で RDAC ドライバーが必要です RDAC ドライバーを使用する BR1200 構成のみサポートされ HDLM(HDLM ARK) を使用する構成はサポートされていません HDLM Kit は以下の各 HDLM for Linux をサポートします 05-80, 05-81, 05-90, 05-91, 05-92, 05-93, 05-94, 6.0.0, 6.0.1, 6.1.0, 6.1.1, 6.1.2, 6.2.0, 6.2.1, 6.3.0, 6.4.0, 6.4.1, 6.5.0, 6.5.1, 6.5.2, 6.6.0, 6.6.2, 7.2.0, 7.2.1, インストールされている HDLM パッケージに対する既知の依存関係はありません注記 : HDLM 以降から製品名が Hitachi Dynamic Link Manager Software (HDLM) に変更されました (05-9X) より古いバージョンでは Hitachi HiCommand Dynamic Link Manager (HDLM) という製品名です注記 : HDLM version 以降は HDLM Recovery Kit v でサポートされていませんこのバージョンの HDLM を使用する場合は HDLM Recovery Kit v 以降と LifeKeeper Core v7.3 かより新しいバージョンの Core を使用してください注記 : LVM を使用する場合は HDLM にてサポートされているバージョンの LVM を使用してくださいまた LVM が /dev/sddlm* に紐付いた /dev/sd* デバイスを検出しないよう /etc/lvm/lvm.conf にフィルターを設定する必要があります詳細は HDLM のマニュアルから LVM の設定を参照してください 118 設定

139 Hitachi HDLM のマルチパス I/O 設定 Linux ディストリビューションの要件 Linux ディストリビューションの要件 HDLM Kit は以下のディストリビューションでサポートされています RHEL 4 (AS/ES) (x86 or x86_64) Update 1, 2, 3, 4, Update 4 Security Fix (*2), 4.5,4.5 Security Fix(*4),4.6,4.6 Security Fix(*8),4.7,4.7 Security Fix(*9), 4.8,4.8 Security Fix(*12) (x86/x86_64)(*1) RHEL 5, 5.1, 5.1 Security Fix(*5), 5.2, 5.2 Security Fix(*6), 5.3, 5.3 Security Fix(*10),5.4, 5.4 Security Fix (*11), 5.5, (x86/x86_64)(*1) RHEL 6, 6.1, 6.2 (x86/x86_64)(*1)(*15) (*1) AMD Opteron ( シングルコアデュアルコア ) または Intel EM64T アーキテクチャ CPU (x86_64 カーネル ) (*2) 次のカーネルがサポートされています x86: el, elsmp, elhugemem x86_64: el, elsmp, ellargesmp (*3) 日立では RHEL4 U2 の環境をサポートしていません (*4) 次のカーネルがサポートされています x86: el, elsmp, elhugemem x86_64: el, elsmp, ellargesmp (*5) 次のカーネルがサポートされています x86: el5, el5pae, el5, el5pae x86_64: el5, el5 (*6) 次のカーネルがサポートされています x86: el5, el5pae, el5, el5pae, el5, el5pae x86_64: el5, el5, el5 (*7) 次のカーネルがサポートされています x86: el, elsmp, elhugemem x86_64: el, elsmp, ellargesmp (*8) 次のカーネルがサポートされています x86: el, elsmp, elhugemem, el, elsmp, elhugemem x86_64: el, elsmp, ellargesmp, el, elsmp, ellargesmp (*9) 次のカーネルがサポートされています x86: el, elsmp, elhugemem, SteelEye Protection Suite for Linux EL, ELsmp, ELhugemem, EL,2.6.9-

140 Hitachi HDLM のマルチパス I/O 設定インストール要件 HDLM パスの追加または修復 HDLM Recovery Kit をインストールする前に HDLM ソフトウェアをインストールする必要がありますまた SCSI デバイスから HDLM デバイスに環境を移行したい場合は HDLM 環境を設定した後インストールセットアップスクリプトを実行する必要がありますそのようにしないと sg3_utils がインストールされません LifeKeeper は HDLM リソースを起動する場合 Persistent Reservations を確立してその時点でアクティブなパスに登録します最初の Reservation の後に新しいパスが追加されるか障害が起きたパスが修復されて HDLM がそのパスを自動的に再度アクティブにした場合そのパスは LifeKeeper が HDLM リソースに対する次の quickcheck を実行するまでリザベーションの一部として登録されませんその時点までに HDLM がそのパスに対する書き込みを許可した場合 Reservation Conflict が発生しシステムのメッセージファイルに競合が記録されます HDLM ドライバは登録されたパスでそれらの I/O を再試行するためアプリケーションにとっては検出可能な障害になりません quickcheck によるパスの登録が完了するとその後の書き込みは成功します quickcheck が Reservation Conflict を検出するとステータスが Offline(E) に変更されますステータスが Offline(E) の場合ユーザはオンラインの HDLM コマンドを使用して手動でステータスを Online に変更する必要があります OS のバージョン / アーキテクチャ RHEL4 120 設定

141 Hitachi HDLM のマルチパス I/O 設定 U1-U4 U- 3 セキュリティフィックス (*7- ) U4 セキュリティフィックス (*2) セキュリテ 4.- ィ 6 フィックス (*4- ) セキュリテ 4.7 ィフィックス (*8- ) 4.7 セキュリティフィックス (*9) セキュリティフィックス (*12) X86/X86_64 SteelEye Protection Suite for Linux 121

142 Hitachi HDLM のマルチパス I/O 設定 05-80, X 05-91,05-92 X X X (*3) X X X (*3) X X X X X HDLM X (*3) X X X X X X X X X X (*3) X X X X X X X X X X (*3) X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X 122 設定

143 Hitachi HDLM のマルチパス I/O 設定 X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X X (*3) X X X X X X X X X X SteelEye Protection Suite for Linux 123

144 Hitachi HDLM のマルチパス I/O 設定 v6.0 (v 以降 ) v6.1(v 以降 ) v6.2(v 以降 ) v6.2(v 以降 ) v6.3(v 以降 ) X X X X X X X X X X X X X X X X X X X X X X X X X X X LifeKeeper HDLM ARK v6.4(v 以降 ) v7.0(v 以降 ) V7.1(v 以降 ) V7.2 (v 以降 ) V7.3(v 以降 ) v7.4(v 以降 ) v7.5( 以降 ) X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X RHEL4 のサポートは LifeKeeper v7.4 までです v7.5 以降はサポートされません X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X = サポートあり空白 = サポートなし 124 設定

145 Hitachi HDLM のマルチパス I/O 設定 RHEL5 OS バージョン / アーキテクチャ未更新セキュリティフィックス (*- 5) セキュリティフィックス (*- 6) セキュリティフィックス (*1-0) セキュリティフィックス (*11) セキュリティ 5.- フィッ 6 クス (*1-3) セキュリティフィックス X86/X86_64 SteelEye Protection Suite for Linux 125

146 Hitachi HDLM のマルチパス I/O 設定 05-80, 05-81, , X X X HDLM X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 126 設定

147 Hitachi HDLM のマルチパス I/O 設定 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X SteelEye Protection Suite for Linux 127

148 Hitachi HDLM のマルチパス I/O 設定 v6.0 (v 以降 ) v6.1 (v 以降 ) v6.2 (v 以降 ) X X X X v6.2 (v 以降 ) v6.3 (v 以降 ) v6.4 (v 以降 ) X X X X X X X X X X X X X X X LifeKeeper HDLM ARK v7.0 (v 以降 ) v7.1 (v 以降 ) v7.2 (v 以降 ) V7.3( 以降 ) v7.4(v 以降 ) v7.5( 以降 ) v8.0( 以降 ) X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X = サポートあり空白 = サポートなし 128 設定

149 Device Mapper Multipath I/O の設定 RHEL6 OSバージョン / アーキテクチャ X86/X86_ X X HDLM X X X X X X X X X X X X X V7.0(v 以降 ) V7.1(v 以降 ) V7.2(v 以降 ) LifeKeeper V7.3( 以降 ) X v7.4(v 以降 ) X v7.5( 以降 ) X X X v8.0( 以降 ) X X X HDLM ARK X X X X = サポートあり空白 = サポートなし Device Mapper Multipath I/O の設定 Device Mapper Multipath デバイスを使用するアプリケーションとファイルシステムの保護 Device Mapper Multipath デバイスを使用するアプリケーションやファイルシステムを LifeKeeper によって設定し保護するには Device Mapper Multipath (DMMP) Recovery Kit をインストールする必要があります DMMP Kit のインストール後は 1 つ以上のマルチパスデバイスノードを使用するアプリケーション階層を作成するだけで DMMP Kit が提供する新しいリソースタイプが自動的に組み込まれます SteelEye Protection Suite for Linux 129

150 Device Mapper Multipath I/O の設定マルチパスデバイスノード DMMP Kit を使用するにはすべてのファイルシステムおよび RAW デバイスをネイティブの /dev/sd* デバイスノードではなくマルチパスデバイスノード上にマウントまたは設定する必要がありますディスク全体を利用できるサポート対象のマルチパスデバイスノードは /dev/dm-# /dev/mapper/<uuid> /dev/mapper/<user_friendly_name> および /dev/mpath/<uuid> ですディスクのパーティションに対応するには /dev/mapper ディレクトリに作成される各パーティション用のデバイスノードを使用します SCSI-3 Persistent Reservations の使用 Device Mapper Multipath Recovery Kit はリザベーションタイプを書き込み専用とする SCSI-3 Persistent Reservations を使用しますこの場合クラスタの 1 ノードが予約したデバイスはクラスタの他のノードから読み取り可能のままですがデバイスへの書き込みはできなくなりますこのことはそれらの他のノード上で進行中の読み取り専用アクセスのためにファイルシステムをマウントできるという意味ではないことに注意してください LifeKeeper では sg_persist ユーティリティを使用してパーシステントリザベーションを発行監視します必要であれば LifeKeeper は sg_persist(8) ユーティリティをインストールします EMC Symmetrix (VMAX を含む ) アレイをマルチパスソフトウェアおよび LifeKeeper と組み合わせて使用する場合は SCSI-3 Persistent Reservations を LUN 単位で有効にする必要がありますこのことは DMMP と PowerPath の両方に当てはまります 130 設定

151 Device Mapper Multipath I/O の設定 Device Mapper Multipath Kit は EMC CLARiiON CX300 HP EVA 8000 HP MSA1500 HP P2000 IBM SAN Volume Controller (SVC) IBM DS8100 IBM DS6800 IBM ESS DataCore SANsymphony HDS 9980V を使用して SIOS Technology Corp. によりテスト済みです Device Mapper Multipath のサポートについてはストレージベンダにお問い合わせください CX300 でリザベーションのサポートを有効にするにはリザベーションに従うようにハードウェアハンドラに通知する必要がありますこのアレイ用に /etc/multipath.conf 内の次のパラメータを設定してください hardware_handler 3 emc 0 1" HP MSA1500 の場合デフォルトのパスチェッカ (tur) とのリザベーション競合を返しますこれによりスタンバイノードはすべてのパスを障害であると判定しますこの状態を回避するにはこのアレイ用に /etc/multipath.conf 内の次のパラメータを設定してくださいハードウェア要件 path_checker readsector0 HDS 9980V の場合以下の設定が必要です Host mode: 00 System option: 254 ( 有効にする必要がありますすべてのサーバに影響を与えるグローバルな HDS 設定です ) Device emulation: OPEN-V HDS の DMMP 設定の詳細については HDS ドキュメンテーション Suse Linux Device Mapper Multipath for HDS Storage または Red Hat Linux Device Mapper Multipath for HDS Storage v1.15 以降を参照してくださいこのドキュメンテーションでは互換性のある multipath.conf ファイルも提供していますファームウェアバージョン 6 以降を使用する EVA ストレージでは DMMP Recovery Kit v 以降が必要ですこれ以前のバージョンの DMMP Recovery Kit はバージョン 6 より前のファームウェアを使用する EVA ストレージでサポートされていますマルチパスソフトウェアの要件 Linux ディストリビューションの要件 SUSE の場合 multipath-tools 以降が必要です Red Hat の場合 device-mapper-multipath rhel4 以降が必要ですベンダが提供する最新のマルチパスツールの組み合わせを使用することを推奨しますこのマルチパス製品の機能と安定性は急速に向上しています IBM などの一部のストレージベンダは現時点では SLES 11 を使用する DMMP を認定していません SIOS Technology Corp. は DMMP SLES 11 EMC CLARiiON および Symmetrix アレイの組み合わせで報告された問題を現在調査中です SteelEye Protection Suite for Linux 131

152 Device Mapper Multipath I/O の設定 Device Mapper Multipath デバイスで I/O テストを実行中にサーバのリブートなどの SAN 上の操作によって一時的なパスの障害が報告されることは珍しくありませんほとんどの場合結果として単に 1 つのパスだけが障害となり他のパスは I/O を送信するためパフォーマンスへのわずかな影響以外に検出される障害はありませんただし一部のケースでは複数のパスが障害として報告され機能するパスがまったくない状態になることがありますこの状態ではファイルシステムやデータベースなどのアプリケーションからは I/O エラーが発生しているように見えますこのような障害を排除する上で Device Mapper Multipath およびベンダのサポートはこれまでに大きく改善されましたただしまだ問題が発生することはありますこのような状況を回避するため以下の措置を検討してください 1. ディスクアレイベンダの手順に従ってマルチパス構成が正しく設定されていることを確認します 2. failback 機能の設定を確認しますこの機能はパスの障害および修復後にパスを再度アクティブにするまでの時間を指定します immediate に設定した場合パスがオンラインに戻るとすぐに使用を再開することを意味します整数に設定した場合パスがオンラインに戻ってから使用を再開するまでの秒数を意味します 10 ~ 15 に設定すると一般的に SAN 上のスラッシングを回避するのに十分なセトリング時間が得られます一時的なパス障害 3. no_path_retry 機能の設定を確認しますこの機能はすべてのパスに障害が発生したときに Device Mapper Multipath がやるべきことを指定します 10 ~ 15 に設定することを推奨しますこの機能によってすべてのパスに障害が起きた一時的なイベントを乗り切る方法が提供され復旧に必要な妥当な時間を稼ぐことができます LifeKeeper の DMMP Kit はストレージへの I/O を監視しており 4 分以内に応答がなかった場合 LifeKeeper はスタンバイサーバにリソースをスイッチオーバします注記 : 簡単には削除できない I/O が発生するため LifeKeeper では no_path_retry 設定を queue に設定することは推奨されませんそれらを削除するためのメカニズムは新しいバージョンの DM に含まれておりデバイスの設定を次のように変更できます /sbin/dmsetup message -u 'DMid' 0 fail_if_no_path これによって no_path_retry の設定が一時的に fail に変更され未処理の I/O がすべて失敗しますただし multipathd は no_path_retry をいつでもデフォルトにリセットできます失敗した I/O を消去するために設定が fail_if_no_ path に変更されたときはデバイスにアクセスする前に ( 手動または LifeKeeper によって ) 設定をデフォルトにリセットする必要があります no_path_retry が queue に設定されていて障害が発生した場合 LifeKeeper はリソースをスタンバイサーバにスイッチオーバしますただし LifeKeeper は失敗した I/O を削除しませんこの I/O を消去するための推奨の方法はリブートですが上記の dmsetup コマンドを使用して管理者が消去することもできます I/O を消去しておかないと他方のサーバでリソースがサービス休止状態になってロックを解放した場合にこの古い I/O が発行される事態になってデータの破損が発生します 132 設定

153 LifeKeeper I-O フェンシングの概要 LifeKeeper I-O フェンシングの概要 I/O フェンシングは障害ノードをデータから切り離すことにより共有ストレージへの非協調的なアクセスを防止する機能です複数のサーバが同じデータにアクセスできる環境ではデータの破損を防ぐためにすべての書き込みを制御された方法で行うことが不可欠です障害検知メカニズムが破綻した場合この破綻によってノード障害に似た状況になるため問題が発生します例えば 2 ノードクラスタで 2 つのノード間の接続に障害が発生した場合各ノードは相手側に障害が発生したと思い込むため両方のノードがデータに対する制御を獲得しようと試みてデータの破損につながります I/O フェンシングは特定のノードからのデータアクセスをブロックすることによりこのデータ破損のリスクを排除しますリザベーションの無効化リザベーションを使用すると共有ストレージに対する最高レベルのデータ保護が可能になりますが場合によってはリザベーションを使用できず LifeKeeper 内で無効にしなければならないことがありますリザベーションを無効にすると複数のシステムが意図的または意図せずにストレージにアクセスしようとする場合にストレージが調停役として動作することがなくなりますそのためシステムハングシステムビジーまたはサーバが停止したように見えるあらゆる状況に対応できるようにクラスタメンバーシップによってストレージをフェンシングする別の方法を採用することを検討する必要がありますリザベーションがなくても信頼性の高い構成を実現する鍵はフェイルオーバが発生したとき他のサーバの電源がオフになったことまたは電源が再投入されたことを知ることですこの要件を満たすために利用可能なフェンシングオプションは 4 つありこれらは SCSI リザベーションなしでも LifeKeeper で非常に信頼性の高い構成を実現できますオプションは以下の通りです STONITH (Shoot the Other Node in the Head) ( 高信頼性のインターコネクトすなわちサーバと STONITH デバイスとの間のシリアル接続を使用 ) - STONITH はサーバがクラスタの一部とみなされなくなったときにそのサーバを物理的に停止させたり電源を切断したりする技術です LifeKeeper フェイルオーバのイベント時にサーバの電源を切断する機能をサポートしていますこれにより共有データへの安全なアクセスを保証しますこのオプションはリザベーションと同様の信頼性を提供できますが利用できるのは物理的に同じ場所に配置された 2 つのノードに限定されます Quorum/Witness - Quorum/Witness サーバは特にクラスタサーバが異なる場所に配置されている場合にクラスタ内でのメンバーシップを確認するために使用されますこのオプションはスプリットブレインに対応できるもののシステムハングに対応できないため単独での使用は推奨されません Watchdog - Watchdog はサーバーの状態を監視します問題が検出されると問題のあるサーバは再起動または電源を切断されますこのオプションではサーバーのハングからのリカバリはできますがスプリットブレインには対応できませんしたがってこのオプションもまた単独での使用は推奨されません CONFIRM_SO - このオプションでは自動フェイルオーバを無効にする必要がありますそのため信頼性が非常に高い ( 管理者のスキルによって異なります ) 一方で可用性はあまり高くありません SteelEye Protection Suite for Linux 133

154 非共有ストレージこれらの代替フェンシング方式はどれも単独では十分とは言えませんが組み合わせて使用することで非常に信頼性の高い構成を実現できます非共有ストレージ非共有ストレージ環境で LifeKeeper を使用する計画の場合共有ストレージに存在するデータ破損のリスクは問題にならないためリザベーションは不要ですただしデータの部分的または完全な再同期およびマージが必要な場合があります信頼性と可用性を最適化するには非共有ストレージでも上記のオプションを検討する必要があります注記 : 各オプションの信頼性と可用性の比較の詳細については I/O フェンシング比較表を参照してください完全なデータ保護を実現するオプションはないことを理解することは重要ですただし以下のように組み合わせるとリザベーションとほぼ同等レベルの保護を実現できますリザベーションを使用しない I/O フェンシングの設定ノードフェンシングをサポートするクラスタを構成するには以下の手順を実行します 1. LifeKeeper を停止します 2. LifeKeeper 内での SCSI リザベーションの使用を無効にします無効にするにはクラスタのすべてのノードで LifeKeeper のデフォルトファイル /etc/default/lifekeeper を編集します Reservations 変数を追加または修正して none にします (RESERVATIONS= none ) このオプションはリザベーションを利用できない場合のみ使用することに注意してください 3. I/O フェンシングを提供する STONITH デバイスを用意して設定しますこの設定では STONITH デバイスが reboot コマンドではなく poweroff コマンドをシステムに対して実行するようにします LifeKeeper の通信が何らかの理由で中断したとき手動操作によって同時に両ノード上のデバイス階層を In Service の状態にしないように注意してください 4. 必要に応じて quorum/witness サーバを用意して設定します quorum/witness サーバを設定使用する詳細な手順と情報については Quorum/Witness Server Support Package トピックを参照してください注記 : サイトの障害時に最良の保護機能を提供するため quorum/witness サーバはクラスタ内の別サーバから離れた場所にある必要があります 5. 必要に応じて Watchdog を設定します詳細については Watchdog トピックを参照してください I/O フェンシング表リザベーション有効リザベーション単独スプリットブレインハングしたサーバ 134 設定

155 I/O フェンシング表 Quroum/Witness Watchdog Watchdog & Quorum/Witness STONITH ( シリアル ) リザベーション無効フェンシングなし STONITH ( シリアル ) CONFIRM_SO * Quorum/Witness Watchdog 非共有ストレージデフォルトの機能 Quorum/Witness CONFIRM_SO * Watchdog STONITH ( シリアル ) Watchdog & STONITH SteelEye Protection Suite for Linux 135

Quorum/Witness 信頼性最大信頼性最小 * CONFIRM_SO は信頼性が非常に高い ( 管理者のスキルによって異なります ) 一方で自動フェイルオーバが無効になるため可用性はあまり高くありません Quorum/Witness Quorum/Witness Server Support Package for LifeKeeper 機能の概要 LifeKeeper Core

ローカルサイトのフェイルオーバと WAN 越しのノードへのフェイルオーバを実行することができますこのパッケージでは多数決ベースの quorum check を使用して 3 ノード以上のクラスタを制御できます追加の quorum ロジックは witness サポートパッケージをインストールした場合のみ有効になります 1 台以上の witness サーバを使用すると

156 Quorum/Witness 信頼性最大信頼性最小 * CONFIRM_SO は信頼性が非常に高い ( 管理者のスキルによって異なります ) 一方で自動フェイルオーバが無効になるため可用性はあまり高くありません Quorum/Witness Quorum/Witness Server Support Package for LifeKeeper 機能の概要 LifeKeeper Core の既存のフェイルオーバプロセスに Quorum/Witness Server Support Package for LifeKeeper (steeleye-lkqwk) を組み合わせることによりネットワーク全体にわたる障害の恐れがある環境においてより高い信頼度でシステムフェイルオーバを実行できますつまりスプリットブレインの発生リスクを大幅に軽減しながらローカルサイトのフェイルオーバと WAN 越しのノードへのフェイルオーバを実行することができますこのパッケージでは多数決ベースの quorum check を使用して 3 ノード以上のクラスタを制御できます追加の quorum ロジックは witness サポートパッケージをインストールした場合のみ有効になります 1 台以上の witness サーバを使用すると通信障害後にリソースを起動する前に障害ノードのステータスについて他のノードからセカンドオピニオンを取得できます witness サーバはクラスタを構成するサーバを判断する調停役として機能する追加的なサーバですフェイルオーバ先となることができるノードは witness サーバが障害となったノードのステータスに関して同じ意見である場合のみリソース起動が許可されますこれによりノード間で発生する単純な通信障害から発生するフェイルオーバを回避し全体のアクセスやパフォーマンス In Service のノードに影響を与えないようにします実際の運用では最初に実行されたとき witness ノードを含めクラスタ内の他のすべてのノードに問い合わせをしますパッケージの要件すでに説明した要件に加えてこのパッケージの要件としてライセンス認証された標準の LifeKeeper Core が witness server として機能するサーバにインストールされている必要があります注記 : コミュニケーションパスが正しく設定されている限り複数のクラスタが単一の quorum/witness server を共有できます ( 詳細については下の共有 witness トポロジーのための追加設定を参照してください ) quorum/witness モードのクラスタに参加するすべてのノード (witness 専用のノードを含む ) には Quorum/Witness Server Support Package for LifeKeeper をインストールする必要があります tcp_ remote quorum モードを使用する場合は /etc/default/lifekeeper 内の QUORUM_HOSTS に設定したホストには Quorum/Witness Server Support Package for LifeKeeper をインストールする必要はありません 136 設定

157 パッケージのインストールと設定パッケージのインストールと設定 Quorum/Witness Server Support Package for LifeKeeper は quorum/witness モードのクラスタ内の各サーバ (witness 専用のサーバを含む ) にインストールする必要があります witness ノードに必要な唯一の設定は適切なコミュニケーションパスを作成することです witness サーバを追加する一般的なプロセスには以下の手順が含まれます witness ノード用のサーバをセットアップし他のノードとのネットワーク通信ができることを確認します witness ノード上に LifeKeeper Core をインストールし適切にライセンス認証 / アクティベーションを行いますクラスタ内のすべてのノードに quorum/witness サポートパッケージをインストールします witness ノードを含めすべてのノード間でコミュニケーションパスを作成します上記の手順が完了するとクラスタは quorum/witness モードで動作するようになりフェイルオーバが許可される前に witness ノードを含む他のノードにフェイルオーバの確認が行われますパッケージインストール後のデフォルト設定では多数決ベースの quorum check および witness check が有効になっています注記 : Quorum ( クラスタ構成に必要な最小メンバー数 ) が多数決ベースのためクラスタを構成するノードの台数を奇数にすることを推奨します詳細な設定オプションについては下の設定可能なコンポーネントセクションを参照してください注記 : witness パッケージをインストールしたノードであれば witness 機能に参加できます witness 専用ノードとは互換性のある LifeKeeper の Core と witness パッケージがインストールされていて保護対象のリソースを持たないノードのことを単に指しています設定可能なコンポーネント quorum/witness パッケージでは quorum と witness という 2 つのモードを設定できますデフォルトでは quorum/witness パッケージをインストールすると quorum と witness の両方のモードが有効になりますこれは witness 機能を必要とする大部分の環境に適した動作ですこれらのモードは /etc/default/lifekeeper 設定ファイルでカスタマイズすることが可能で witness モードは個別に調整することもできますパッケージがインストールされると設定ファイルにはデフォルト設定が書き込まれ majority がデフォルトの quorum モードに remote_verify がデフォルトの witness モードになります以下はその例です QUORUM_MODE=majority WITNESS_MODE=remote_verify 注記 : クラスタの各ノードでまったく異なる quorum/witness 設定をすることはできますが予想外の状況や診断の困難な状況になることを避けるためすべてのノードで同じ設定にすることを推奨します SteelEye Protection Suite for Linux 137

158 使用可能な quorum モード使用可能な quorum モード quorum check モードには次の 3 種類のモードが用意されていますこれらは /etc/default/lifekeeper の QUORUM_MODE 設定を使用して設定できます majority ( デフォルト ) tcp_remote none/off 以下に各モードを説明します majority デフォルトの majority 設定ではチェック時に可視 / 生存している LifeKeeper ノードの数に基づいて Quorum が決定されますこのチェックは単純な多数決方式です全ノード数の過半数を見ることができるノードは Quorum に属します tcp_remote tcp_remote quorum モードは以下の点を除いて majority モードと共通です問い合わせを受けるサーバはクラスタとそのコミュニケーションパスから独立して設定する ( これらのサーバに LifeKeeper をインストールする必要はありません ) サーバへの確認は単に指定ポート上の TCP/IP サービスに接続できるかどうかによって行われるこのモードでは TCP のタイムアウト設定 (QUORUM_TIMEOUT_SECS) と問い合わせ先のホスト (QUORUM_HOSTS) を /etc/default/lifekeeper に追加する必要があるため追加設定が必要です tcp_remote の設定例は以下の通りです QUORUM_MODE=tcp_remote # What style of quorum verification do we do in comm_up/down # and lcm_avail (maybe other) event handlers. # The possible values are: # - none/off: Do nothing, skip the check, assume all is well. # - majority: Verify that this node and the nodes it can reach # have more than half the cluster nodes. # - tcp_remote: Verify that this node can reach more than half # of the QUORUM_HOSTS via tcp/ip. QUORUM_HOSTS=myhost:80,router1:443,router2:22 # If QUORUM_MODE eq tcp_remote, this should be a comma delimited # list of host:port values like myhost:80,router1:443,router2:22. # This doesn't matter if the QUORUM_MODE is something else. QUORUM_TIMEOUT_SECS=20 # The time allowed for tcp/ip witness connections to complete. # Connections that don't complete within this time are treated # as failed/unavailable. # This only applies when the QUORUM_MODE is tcp_remote. WITNESS_MODE=remote_verify # This can be either off/none or remote_verify. In remote_verify # mode, core event handlers (comm_down) will doublecheck the 138 設定

159 使用可能な witness モード # death of a system by seeing if other visible nodes # also think it is dead. QUORUM_LOSS_ACTION=fastboot # This can be one of osu, fastkill or fastboot. # fastboot will IMMEDIATELY reboot the system if a loss of quorum # is detected. # fastkill will IMMEDIATELY halt/power off the system upon # loss of quorum. # osu will just take any in-service resources out of service. # Note: this action does not sync disks or unmount filesystems. QUORUM_DEBUG= # Set to true/on/1 to enable debug messages from the Quorum # modules. HIDE_GUI_SYS_LIST=1 注記 : このモードは本質的に柔軟性と複雑さを備えるため使用するには LifeKeeper および関連する特定のネットワーク / クラスタ設定の両方に対する十分な理解と注意が必要です none/off このモードではすべての quorum check が無効になっていますこの設定ではクラスタの実際の状態にかかわらずあたかもそのノードが常に Quorum を持っているように quorum check が動作します使用可能な witness モード witness モードには次の 2 種類のモードが用意されていますこれらは /etc/default/lifekeeper の WITNESS_MODE 設定を使用して設定できます remote_ verify および none/off 以下に各モードを説明します remote_verify このデフォルトモードでは witness check によってノードのステータスを確認します通常この確認はノード障害が疑われるときに行われますこのモードでは各ノードはクラスタ内の他のすべての可視ノードに対して障害ノードのステータスに関する意見を求めることにより疎通を二重にチェックします none/off このモードでは witness check が無効になっています通信障害の場合はあたかも witness 機能がインストールされていないかのような論理で動作します注記 : リソースを持たずに quorum/witness 専用ノードとして動作するサーバは witness check を実行する必要がないためそのようなサーバでは witness モードを none/off に設定する必要があります Quorum を喪失したときに利用可能なアクション witness パッケージでは Quorum を喪失したときにシステムがどのように応答すべきかについて 3 種類のオプションを提供していますこれらのオプションは /etc/default/lifekeeper 内の QUORUM_ SteelEye Protection Suite for Linux 139

160 共有 witness トポロジーのための追加設定 LOSS_ACTION 設定によって選択できます 3 つのオプションはすべてそのシステムのリソースを Out of Service 状態にしますがそれぞれ異なる動作をします quorum パッケージがインストールされている場合のデフォルトオプションは fastboot です以下に各オプションを説明します fastboot fastboot オプションを選択している場合 ( 通信ができないことにより ) Quorum の喪失が検出されるとシステムは直ちにリブートしますこれは過激な方法ですが確実にシステムを外部のリソースから素早く切り離すことができますストレージレベルのレプリケーションなど多くの場合にリソースをこのように即座にリリースすることが望まれますこのオプションには以下の 2 つの重要な注意点があります fastkill 1. システムはシャットダウン手順を最初に実行することなく直ちにハードリブートを実行します ( ディスクの同期などの ) タスクは一切実行されません 2. システムはストレージとのネゴシエーションやリソースへのアクセスなどを含む通常の起動ルーチンを実行しながら復帰します fastkill オプションは fastboot オプションに非常に似ていますがシステムは Quorum を喪失したときにハードリブートするのではなく即座に停止します fastboot オプションと同様に ( ディスクの同期などの ) タスクは一切実行されませんシステムは手動でリブートする必要がありますその後システムはストレージとのネゴシエーションやリソースへのアクセスなどを含む通常の起動ルーチンを実行しながら復帰します osu osu オプションは最も穏健なオプションです Quorum を喪失したシステムはそのまま稼働しますがシステム上のリソースは Out of Service 状態にされます一部のクラスタ構成ではこの方法で十分ですが他のクラスタ構成では保護能力不足だったり応答が遅すぎる場合があります共有 witness トポロジーのための追加設定 quorum/witness サーバを複数のクラスタで共有する場合個々のクラスタの管理を簡素化するように設定することができます標準的な操作では LifeKeeper GUI を使用して最初のノードに接続しようとすると LifeKeeper GUI はすべてのクラスタノードとの接続を試みますつまりクラスタ内の各システムから見えるすべてのシステムに接続します共有 witness サーバはすべてのクラスタに接続されているため GUI は witness ノードから見えるすべてのクラスタ内のすべてのシステムに接続することになりますこの状況を回避するにはすべての witness サーバで HIDE_GUI_SYS_LIST 設定パラメータを true に設定する必要がありますこの設定によって witness サーバから見えるサーバは実質的に不可視になり GUI は最初に接続したサーバに関連付けられたクラスタ内のサーバにのみ接続するようになります注記 : この設定は witness サーバにのみ設定してください GUI は最初に接続したサーバに関連付けられたクラスタ内のサーバにのみ接続するためそのサーバが witness サーバでかつ HIDE_GUI_SYS_LIST が true に設定されている場合 GUI はコミュニケーションパスが確立している他のサーバに自動的に接続することができませんこの現象は LifeKeeper GUI の典型的な動作ではないためネットワークまたは他の設定に問題があるとインストーラが間違って判断する可能性がありますこの設定をした witness サーバ上で LifeKeeper GUI を使用 140 設定

2 ノードクラスタに witness ノードを追加するする場合はクラスタ内の他のいずれかのノードに手動で接続するとクラスタの残りのノードが正しく GUI に表示されます注記 : すべてのクラスタ内のすべてのシステムで witness check が実行されるのを防ぐには共有する quorum/witness 専用ノードで witness_mode を常に none/off

161 2 ノードクラスタに witness ノードを追加するする場合はクラスタ内の他のいずれかのノードに手動で接続するとクラスタの残りのノードが正しく GUI に表示されます注記 : すべてのクラスタ内のすべてのシステムで witness check が実行されるのを防ぐには共有する quorum/witness 専用ノードで witness_mode を常に none/off に設定してください 2 ノードクラスタに witness ノードを追加する以下は Quorum/Witness Server Support Package for LifeKeeper を利用する 2 ノードクラスタに 3 番目のノードとなる witness ノードを追加する場合の例です witness ノードを持つ単純な 2 ノードクラスタ SteelEye Protection Suite for Linux 141

162 期待される動作 ( デフォルトモードを仮定 ) サーバ A とサーバ B は LifeKeeper Core を使用したセットアップがすでに完了しサーバ A で作成されたリソース階層がサーバ B に拡張されています ( サーバ W は拡張されたリソース階層を持っていません ) 以下の手順を使用して 3 番目のノードを witness ノードとして追加します 1. witness 用のノードをセットアップし他の 2 ノードとのネットワーク通信ができることを確認します 2. witness ノード上に LifeKeeper Core をインストールし適切にライセンス認証 / アクティベーションを行います 3. 3 ノードすべてに Quorum/Witness Server Support Package をインストールします 4. 3 ノードの間すべてにコミュニケーションパスを作成します 5. 必要な quorum check モードを /etc/default/lifekeeper に設定します (majority tcp_remote non/off) ( この例では majority を選択しています ) これらのモードの説明については使用可能な quorum モードを参照してください 6. 必要な witness モードを /etc/default/lifekeeper に設定します (remote_ verify non/off) これらのモードの説明については使用可能な witness モードを参照してください期待される動作 ( デフォルトモードを仮定 ) シナリオ 1 サーバ A とサーバ B との間の通信に障害が発生サーバ A とサーバ B の間の通信に障害が発生した場合以下のように動作しますサーバ A と B は通信障害イベントの処理を開始しますただし全く同時とは限りません両方のサーバは簡単な quorum check を実行し両方共自身が多数派に属すると判断します (A と B の両方から W が見えているため既知の 3 ノードのうちの 2 ノード側にいると判断します ) 各サーバはまだ通信可能な他方のノードに対し自ノードと通信できなくなったサーバの状態について問い合わせますこのシナリオではサーバ A が B のステータスについて W に問い合わせサーバ B が A のステータスについて W に問い合わせることになりますサーバ A と B は共に witness サーバへの問い合わせによって他方のサーバがまだ生存していると判断しフェイルオーバ処理は何も発生しませんリソースは In Service のままになりますシナリオ 2 サーバ A と W との間の通信に障害が発生 witness パッケージがインストールされているとすべてのノードが witness ノードとして動作することが可能であり実際にそのように動作するためこのシナリオは前のシナリオと同じになりますこの場合サーバ A と witness サーバ W は共にサーバ B への問い合わせによって他方のサーバがまだ生存していると判断しますシナリオ 3 サーバ A と他の全ノードとの間の通信に障害が発生 (A に障害が発生 ) 142 設定

163 シナリオ 4 この場合サーバ B は以下の動作をしますサーバ A との通信障害イベントの処理を開始します witness サーバ W とまだ通信が可能でありしたがって Quorum を持っていると判断しますサーバ A が見えないことをサーバ W に確認した後通常のフェイルオーバ動作を開始しますこれにより保護対象のリソースはサーバ B 上で In Service になります B がソースとして動作している状態でサーバ A の通信が回復前のシナリオの状態からサーバ A が通信を再開したとしますサーバ B は comm_up イベントを処理し Quorum を持っている (3 ノードすべてが見える ) ことと In Service のリソースを持っていることを判断しますサーバ A は comm_up イベントを処理し自身も Quorum を持っていることとリソースが別の場所で In Service であることを判断しますこの時点ではサーバ A はリソースを in service にしません B がソースとして動作している状態でサーバ A に電源が入れられて他のノードと通信可能この場合サーバ B は前のシナリオと同じように応答しますがサーバ A は lcm_avail イベントを処理しますサーバ A は Quorum を持っていると判断しこの場合は現在サーバ B で in service であるリソースを in service にしないことにより正常に応答します B がソースとして動作している状態でサーバ A に電源が入れられて他のノードと通信不能この場合サーバ A は lcm_avail イベントを処理しサーバ B と W はサーバ A と通信できないので何もしませんサーバ A は 3 ノードのうちの 1 ノードとしか通信できないため Quorum を持っていないと判断します Quorum を持たない場合サーバ A はリソースを in service にしませんシナリオ 4 サーバ A と他の全ノードとの間の通信に障害が発生 (A のネットワークに障害が発生しているが A は稼動中 ) この場合サーバ B は以下の動作をしますサーバ A との通信障害イベントの処理を開始します witness サーバ W とまだ通信が可能でありしたがって Quorum を持っていると判断しますサーバ A が見えないことをサーバ W に確認した後通常のフェイルオーバ動作を開始しますこれにより保護対象のリソースはサーバ B 上で In Service になりますまたこの場合サーバ A は以下の動作をしますサーバ B との通信障害イベントの処理を開始しますサーバ B とも witness サーバ W とも通信できないため Quorum を持っていないと判断します直ちにリブートします ( fastboot がデフォルトの動作のためハードリブートされます ) SCSI リザベーション SCSI リザベーションを利用したストレージフェンシング SteelEye Protection Suite for Linux 143

SCSI リザベーションを利用したストレージフェンシング LifeKeeper for Linux はリソースフェンシングとノードフェンシングの両方をサポートしますが主要なフェンシングメカニズムは SCSI リザベーションによるストレージフェンシングです共有ストレージに対する最高レベルのデータ保護を提供するこのフェンシングを使用すると非常に粒度の高い LUN

164 SCSI リザベーションを利用したストレージフェンシング LifeKeeper for Linux はリソースフェンシングとノードフェンシングの両方をサポートしますが主要なフェンシングメカニズムは SCSI リザベーションによるストレージフェンシングです共有ストレージに対する最高レベルのデータ保護を提供するこのフェンシングを使用すると非常に粒度の高い LUN レベルのロックによって最大限の柔軟性と最大限のセキュリティが可能になりますこのアーキテクチャでベースとなる共有リソース (LUN) はプライマリ quorum デバイスです quorum は共有ストレージに対する排他的なアクセスと定義できますつまりこの共有ストレージは 1 度に 1 台のサーバからしかアクセスできません quorum ( 排他的アクセス ) を持つサーバはプライマリの役割を持ちます quorum の確立 ( 排他的アクセスをどのサーバに与えるか ) は quorum デバイスによって行われます上述の通りリザベーションが有効の場合 quorum デバイスはその共有リソースです共有リソースは共有リソースに対するリザベーションを持つサーバを判断して quorum を確立しますこれによりある 1 つのサーバがその LUN にアクセスできる限りクラスタは実質的には単一のサーバで運用されることになります SCSI リザベーションは共有のユーザデータを保護し LifeKeeper が指定するシステムのみデータを変更できるようにしますクラスタ内外の他のシステムがそのデータを変更することは許可されませんさらに SCSI リザベーションによってクラスタ内の複数のサーバで障害が起きた場合に LifeKeeper 保護下のアプリケーションは共有のユーザデータに安全にアクセスできますサーバの多数派 quorum は必要ありません唯一の要件は共有データの所有権の帰属が確立していることです quorum/witness 機能を追加すると quorum のメンバーシップを確立することができますこのメンバーシップがない場合スプリットブレインの状況で複数のサーバ ( 場合によっては全サーバ ) がお互いを終了させることも考えられますリザベーションが有効になっている構成に Watchdog を追加すると部分的にサーバがハングしている状態からリカバリするメカニズムが提供されますハングしたサーバが LifeKeeper に検出されないような場合に Watchdog はリカバリを開始しますまたサーバがハングしてさらにリザベーションが奪われた場合に Watchdog はそのサーバをリブートしてリカバリを開始することができます 144 設定

165 I/O フェンシングのための代替方式 I/O フェンシングのための代替方式 SCSI リザベーションを利用したリソースフェンシングに加えて LifeKeeper for Linux はリザベーションの無効化もサポートしますリザベーションが有効か無効にかかわらず以下の 2 つの点に注意すべきですストレージへのアクセスは LifeKeeper が制御する必要がありますストレージへの意図しないアクセス ( ファイルシステムのマウント手動の fsck など ) が発生しないように細心の注意を払う必要があります以上の 2 つのルールを順守してリザベーションを有効にすると LifeKeeper はたいていのエラーを防止できますリザベーションが ( 単独で ) 無効になった状態は保護がない状態ですしたがってこの保護を実現するには他の選択肢を検討する必要があります以降のセクションでは SCSI リザベーションなしでも LifeKeeper で非常に信頼性の高い構成を実現できる各種のフェンシングオプションと代替方式を説明します STONITH STONITH (Shoot the Other Node in the Head) はクラスタ内のノードの電源をリモートから切断するフェンシング方式です LifeKeeper の STONITH 機能は外部電源スイッチコントロール IPMI 対応マザーボードおよびハイパーバイザーが提供する電源機能を利用してクラスタ内の他のノードの電源を切断します STONITH で IPMI を使用する IPMI (Intelligent Platform Management Interface) はコンピュータシステムにアクセスする共通インターフェースのセットを提供します IPMI を使用するとシステムの状態を監視してシステムを管理できます IPMI を STONITH で使用すると故障と思われるクラスタノードの電源スイッチをクラスタソフトウェアが制御することによりシリアル接続またはネットワーク接続を介してノードの電源切断やリブートができるため故障ノードが共有データにアクセスしたりデータを破損するのを確実に防ぎますパッケージの要件 IPMI ツールのパッケージ (ipmitool el6.x86_64.rpm など ) VMware vsphere 環境での STONITH vcli (vsphere Command-Line Interface) は ESXi ホストと仮想マシンを含む仮想インフラストラクチャを管理するための VMware でサポートされているコマンドラインインターフェースです vcli コマンドがお使いの環境のニーズに合致する場合は VMware の仮想マシン間での LifeKeeper STONITH の実装に適用することができますパッケージの要件 VMware vsphere SDK Package ( 例 : VMware-vSphere-SDK-4.X.X-XXXXX.i386.tar.gz) VMware vsphere CLI (vsphere CLI は vsphere SDK と同じインストールパッケージに含まれています ) SteelEye Protection Suite for Linux 145

166 インストールと設定 ( 注記 : vmware-cmd を使用する場合のみ必要 ) VMware Tools ( 例 : VMwareTools tar.gz) インストールと設定 LifeKeeper をインストールしクラスタ内の各ノードでコミュニケーションパスを設定した後 STONITH をインストールおよび設定します 1. 次のコマンドを実行して LifeKeeper STONITH スクリプトをインストールします /opt/lifekeeper/samples/stonith/stonith-install 2. (*IPMI を利用する場合のみ ) BIOS または ipmitool コマンドを使用して以下の BMC (Baseboard Management Controller) 変数を設定します静的 IP アドレスの使用 IP アドレスサブネットマスクユーザ名パスワードユーザに管理者権限を追加ユーザのネットワークアクセスを有効化 ipmitool コマンドの使用例を示します ( 詳細については ipmitool のマニュアルページを参照してください ) # ipmitool lan set 1 ipsrc static # ipmitool lan set 1 ipaddr # ipmitool lan set 1 netmask # ipmitool user set name 1 root # ipmitool user set password 1 secret # ipmitool user priv 1 4 # ipmitool user enable 1 3. 設定ファイルを編集します設定ファイルを編集し STONITH を有効にして電源を切断するコマンドラインを追加します注記 : フェンシングループ (2 台のマシン間で通信は喪失しているもののお互いをまだ STONITH できる場合にお互いに電源オフとリブートをし続ける状態 ) を回避するためリブートではなく電源オフを推奨します /opt/lifekeeper/config/stonith.conf 146 設定

167 <vm_id> # LifeKeeper STONITH configuration # # Each system in the cluster is listed below. To enable STONITH for a # given system, # remove the '#' on that line and insert the STONITH command line to power off # that system. # Example1: ipmi command # node-1 ipmitool -I lanplus -H U root -P secret power off # Example2: vcli-esxcli command # node-2 esxcli --server= username=root --password=secret vms vm kill --type='hard' --world-id= # Example3: vcli-vmware_cmd command # node-3 vmware-cmd -H U root -P secret <vm_id> stop hard minute-maid ipmitool -I lanplus -H U root -P secret power off kool-aid ipmitool -I lanplus -H U root -P secret power off vm1 esxcli --server= username=root --password=secret vms vm kill --type='hard' --world-id= vm2 vmware-cmd -H U root -P secret <vm_id> stop hard <vm_id> vsphere CLI コマンドは vsphere SDK for Perl の上で実行されます <vm_id> は VM の識別子として使用されていますこの変数によって設定対象の VM 用の設定ファイルを指定します設定ファイルのパスを調べるには以下の手順を実行します 1. 次のコマンドを実行します vmware-cmd -H <vmware host> -l 2. 上記のコマンドによって VMware ホストのリストが表示されます vmware-cmd -l の出力例を以下に示します (3 台の VM を表示 ) /vmfs/volumes/4e08c1b9-d741c09c-1d3e-0019b9cb28be/lampserver/lampserver.vmx /vmfs/volumes/4e1e1386-0b862fae-a b9cb28bc/oracle10/oracle.vmx /vmfs/volumes/4e08c1b9-d741c09c-1d3e- 0019b9cb28be/lampserver02/lampserver02.vmx 出力されたリストで設定中の VM を見つけます 3. パス名を <vm_id> 変数にペーストします上記の例では以下の通りになります SteelEye Protection Suite for Linux 147

期待される動作 vmware-cmd -H 10.0.0.1 -U root -P secret /vmfs/volumes/4e08c1b9-d741c09c-1d3e- 0019b9cb28be/lampserver/lampserver.

168 期待される動作 vmware-cmd -H U root -P secret /vmfs/volumes/4e08c1b9-d741c09c-1d3e- 0019b9cb28be/lampserver/lampserver.vmx stop hard 注記 : VMware コマンドの詳細については引数なしで vmware-cmd を実行するとすべてのオプションに関するヘルプページが表示されます期待される動作 LifeKeeper がノードとの通信障害を検出するとそのノードの電源が切断されフェイルオーバが発生します問題を修復した後に手動でそのノードの電源を入れる必要があります Watchdog Watchdog はサーバが正常に動作しない場合に問題の発生を予防する修正処置 ( リブート ) を確実に実行できるようにサーバを監視する方法です Watchdog は特別な Watchdog ハードウェアを使用して実装する場合とソフトウェアのみのオプションを使用して実装する場合があります ( 注記 : この構成は Red Hat Enterprise Linux Versions 5 および 6 でのみ検証されています他のオペレーティングシステムでは検証されていないため現時点ではサポートされません ) コンポーネント Watchdog タイマのソフトウェアドライバまたは外部ハードウェアコンポーネント Watchdog デーモン - 該当する Linux ディストリビューションを通じて rpm が入手可能 LifeKeeper Core デーモン - LifeKeeper のインストールに付随ヘルスチェックスクリプト - LifeKeeper の監視スクリプト LifeKeeper と Watchdog の相互運用性 148 設定

169 設定次のセクションを注意深く読んでくださいデーモンはエラーからリカバリするように設計されており注意深く設定しないとデーモンはシステムをリセットしますインストールおよび設定を行う前に慎重に計画してくださいこのセクションの目的は Watchdog についての説明や設定をすることではありませんここでは Watchdog 構成での LifeKeeper との相互運用についての説明や設定のみ行います設定以下の手順は root ユーザ権限を持つ管理者が行う必要があります管理者は Watchdog のリスクおよび問題についてすでに熟知しているものとしますヘルスチェックスクリプト (LifeKeeper 監視スクリプト ) は LifeKeeper の設定と Watchdog の設定 (/opt/lifekeeper/samples/watchdog/lifekeeper-watchdog) を関連付けるコンポーネントですこのスクリプトは LifeKeeper の完全な監視を提供するものであり一切の修正は不要です 1. 以前に Watchdog を設定していた場合は次のコマンドを入力して Watchdog を停止しますそうでない場合は手順 2 に進みます /etc/rc.d/init.d/watchdog stop Watchdog の停止を示す以下の確認メッセージが表示されるはずです Stopping watchdog:[ok] 2. Watchdog ソフトウェアのインストールで供給される Watchdog 設定ファイル (/etc/watchdog.conf) を編集します test-binary を次のように修正します test-binary = /opt/lifekeeper/samples/watchdog/lifekeeperwatchdog test-timeout を次のように修正します test-timeout = 5 interval を次のように修正します interval = 7 interval は LifeKeeper のコミュニケーションパスのタイムアウト (15 秒 ) よりも小さい値にしてください約半分の値が妥当です 3. LifeKeeper が起動していることを確認しますまだの場合は LifeKeeper の起動トピックを参照してください 4. 次のコマンドを入力して Watchdog を起動します /etc/rc.d/init.d/watchdog start Watchdog の起動を示す以下の確認メッセージが表示されるはずです Starting watchdog: [OK] 5. 今後の再起動の際に Watchdog を自動的に起動させるには次のコマンドを入力します chkconfig --levels 35 watchdog on SteelEye Protection Suite for Linux 149

170 アンインストール注記 : Watchdog を設定すると予想外のリブートがときどき発生する可能性がありますこれは Watchdog の仕組みから来る一般的な性質です正常に応答しないプロセスがあると Watchdog 機能は LifeKeeper ( またはオペレーティングシステム ) がハングしていると判断し ( 警告なしに ) システムをリブートしますアンインストール LifeKeeper をアンインストールする場合は慎重に行ってください以下に列記の通り上記の手順を逆の順で実行します警告 : LifeKeeper を構成する RPM パッケージを削除する方法で LifeKeeper をアンインストールする場合は先に Watchdog を停止してください上記の手順 2 では LifeKeeper の Watchdog スクリプトを呼び出すように Watchdog 設定ファイルを修正していますしたがって先に Watchdog を停止しておかないと存在しないスクリプトを呼び出すことになりますリブートを実行するこのスクリプトが見つからない場合はエラーが発生しますこの状態は Watchdog を停止するまで継続します 1. 次のコマンドを入力して Watchdog を停止します /etc/rc.d/init.d/watchdog stop Watchdog の停止を示す以下の確認メッセージが表示されるはずです Stopping watchdog: [OK] 2. Watchdog ソフトウェアのインストールで供給される Watchdog 設定ファイル (/etc/watchdog.conf) を編集します test-binary および interval の両エントリをコメントアウトします ( 各行の先頭に # を追加します ) #test-binary = #interval = ( 注記 : interval が他の機能によって以前から使用されていた場合はそのままにしておくこともできます ) 3. LifeKeeper をアンインストールします LifeKeeper の削除トピックを参照してください 4. これで Watchdog を起動し直すことができます LifeKeeper のみが Watchdog を使用していた場合は次のコマンドを入力すると Watchdog を永続的に無効にできます chkconfig --levels 35 watchdog off リソースポリシー管理概要 Steeleye Protection Suite for Linux および Steeleye vappkeeper のリソースポリシー管理ではリソースのローカルリカバリとフェイルオーバ ( または VMware HA との統合 ) の動作管理機能が提供されますリソースポリシーは lkpolicy コマンドラインツール (CLI) を使用して管理できます Steeleye Protection Suite/vAppKeeper のリカバリ動作 Steeleye Protection Suite および SteelEye vappkeeper には個々のアプリケーションおよび関連し合うアプリケーションのグループを監視する機能があり定期的にローカルリカバリを実行したり保護下の 150 設定

171 ポリシーによるカスタム動作およびメンテナンスモード動作アプリケーションに障害が発生したときに通知することができます関連し合うアプリケーションの例としては主アプリケーションが下位のストレージまたはネットワークリソースに依存する階層などがありますアプリケーションまたはリソースに障害が発生した場合のデフォルトの動作は以下の通りです 1. ローカルリカバリ : 最初にリソースまたはアプリケーションのローカルでリカバリを試みますこのときは外部の介入なしにローカルサーバ上でリソースまたはアプリケーションをリストアしようとしますローカルリカバリが成功した場合 Steeleye Protection Suite/vAppKeeper は追加のアクションを実行しません 2. フェイルオーバ ( または VMware HA との連携 ): 次にローカルリカバリでリソースまたはアプリケーションのリストアに失敗した ( またはリソースを監視するリカバリキットがローカルリカバリをサポートしていない ) 場合フェイルオーバは開始されませんフェイルオーバは以下の 2 つの異なる形態を取ることができます Steeleye Protection Suite for Linux: この構成 ( 高可用性クラスタで使用 ) のフェイルオーバ処理ではクラスタ内の別のサーバ上で該当アプリケーション ( および依存するすべてのリソース ) を起動しようと試みます SteelEye vappkeeper: この構成 (VMware 環境のアプリケーション監視で使用 ) のフェイルオーバ処理では仮想マシン (VM) ゲストでアプリケーション障害が発生したことを VMware HA に通知します VMware HA の通常の反応は警告なしに問題を是正するためにただちに VM ゲストを再起動することです場合によって VMware HA は VM ゲストを別の VM ホストに移動したり別のアクションを実行したりすることもできます VMware HA が状況を処理する方法は SteelEye vappkeepe の構成に依存しませんリカバリ動作の詳細については SteelEye Protection Suite の障害検出およびリカバリシナリオまたは vappkeeper の障害検出およびリカバリシナリオを参照してくださいポリシーによるカスタム動作およびメンテナンスモード動作 Steeleye Protection Suite/vAppKeeper Version 7.5 以降ではデフォルトのリカバリ動作を変更する追加ポリシーを設定する機能をサポートしますリソース単位またはサーバ単位で 4 つのポリシーが設定可能です ( リソース単位のポリシーに関する注意については下のセクションを参照してください ) サーバレベルでポリシーを変更する方法を推奨します利用可能なポリシーは以下の通りです標準ポリシー Failover(vAppKeeper の場合は VM の再起動を開始する VMware HA との連携を利用します ) このポリシー設定を使用するとリソースフェイルオーバを有効 / 無効にできます ( 注記 : リザベーションが適切に処理されるにはフェイルオーバは個々の SCSI リソースで無効にすることはできません ) LocalRecovery - Steeleye Protection Suite/vAppKeeper はデフォルトではフェイルオーバを実行する前に個々のリソースまたは保護対象アプリケーション全体を再起動することにより保護対象リソースのリカバリを試みますこのポリシー設定を使用するとローカルリカバリを有効 / 無効にできます TemporalRecovery - 通常 Steeleye Protection Suite は障害リソースのローカルリカバリを実 SteelEye Protection Suite for Linux 151

172 メタポリシーメタポリシー行しますローカルリカバリに失敗すると Steeleye Protection Suite はリソース階層を別ノードにフェイルオーバしますローカルリカバリに成功した場合はフェイルオーバは実行されませんローカルリカバリに成功した場合でもサーバの何らかの異常によって短時間の間にローカルリカバリが再試行される場合があり結果として何度も連続してローカルリカバリが試行されることになりますこれが発生すると問題のアプリケーションは可用性が悪化しますこの反復的なローカルリカバリ / 障害サイクルを回避するために時間的リカバリポリシーを設定できます時間的リカバリポリシーを使用すると管理者は指定した時間内に試行するローカルリカバリの回数を ( 成功かどうかにかかわらず ) 制限することができます例 : リソースが試行するローカルリカバリの回数を 30 分間で 3 回に限定するポリシー定義をユーザが設定した場合 30 分以内に 3 回目のローカルリカバリが試行されると Steeleye Protection Suite はフェイルオーバを実行します定義した時間的リカバリポリシーは有効または無効にできます時間的リカバリポリシーが無効の場合時間的リカバリ処理は継続して実行されポリシーが適用されるはずの時間に通知がログに表示されますが実際のアクションは実行されません注記 : 時間的リカバリポリシーを設定した状態でフェイルオーバとローカルリカバリの一方または両方を無効にすることは可能ですフェイルオーバまたはローカルリカバリを無効にした場合に時間的リカバリポリシーは実行されることがないためこの状態は非論理的ですメタポリシーは他の複数のポリシーに影響を与える可能性があるポリシーです通常これらのポリシーは標準ポリシーであれば複数個の設定が必要になるような特定のシステム動作を実現するためのショートカットとして使用します NotificationOnly - このモードでは管理者は Steeleye Protection Suite または vappkeeper を監視専用状態にすることができます 1 つのリソース ( またはサーバ単位のポリシーの場合はすべてのリソース ) のローカルリカバリおよびフェイルオーバの両方が影響を受けます障害が検知されるとユーザインターフェースには Failure 状態が表示されますただしリカバリもフェイルオーバも実行されません注記 : 管理者は障害の原因となった問題を手動で修正し障害が起きたリソースを復帰させて通常の Steeleye Protection Suite の運用を継続する必要がありますリソースレベルのポリシーに関する重要な考慮事項リソースレベルのポリシーとはリソース階層全体またはサーバレベルのポリシーとは異なり特定のリソースにのみ適用されるポリシーです例 : アプリケーション - IP - file system 上記のリソース階層ではアプリケーションは IP とファイルシステムの両方に依存していますポリシーは特定のリソースのローカルリカバリまたはフェイルオーバを無効にするように設定できますこれは例えば IP リソースのローカルリカバリが失敗し IP リソースのフェイルオーバが無効に設定されていた場合 IP リソースはフェイルオーバを実行せず他のリソースのフェイルオーバも 152 設定

173 lkpolicy ツール発生させないことを意味しますただしファイルシステムリソースのローカルリカバリが失敗しファイルシステムリソースのポリシーのフェイルオーバが無効化されていない場合階層全体がフェイルオーバを実行します注記 : 重要事項としてリソースレベルのポリシーは設定対象の特定のリソースにのみ適用されることに注意してください上記は単純な例です複雑な階層を構成することもできるためリソースレベルのポリシーを設定するときは注意してください lkpolicy ツール lkpolicy ツールは Steeleye Protection Suite for Linux または SteelEye vappkeeper が稼働するサーバのポリシーを管理 ( 参照設定削除 ) するためのコマンドラインツールです lkpolicy はポリシーの設定および修正ポリシーの削除利用可能なポリシーと現在の設定値の表示をサポートしますさらに設定したポリシーは有効または無効に設定できるためリカバリ動作に影響を与えながらリソース / サーバ設定を保持できます全体的な使用方法は次の通りです lkpolicy [--list-policies --get-policies --set-policy --remove-policy] <name value pair data...> <name value pair data...> は運用方法および対象のポリシーによって異なります ( 特にポリシーを設定する場合 ) 例 : 有効 / 無効タイプのポリシーのほとんどでは必要なのは [--on] または [-- off] のスイッチのみですが時間的ポリシーの場合はしきい値を設定するための値も必要です lkpolicy の使用方法の例ローカルおよびリモートサーバとの認証 lkpolicy ツールはサーバが公開する API を通じて Steeleye Protection Suite および vappkeeper サーバと通信しますこの API は lkpolicy ツールなどのクライアントに対して認証を要求します lkpolicy ツールで Steeleye Protection Suite または vappkeeper サーバに最初にアクセスしようとしたときにそのサーバに対する認証情報がまだ保存されていない場合ユーザは認証情報を求められます認証情報はユーザ名とパスワードの形式でありさらに以下の条件があります 1. クライアントには Steeleye Protection Suite/vAppKeeper の管理者権限が必要ですしたがってそのユーザ名は (PAM による ) オペレーティングシステムの認証設定によって lkadmin グループに属する必要があります必ずしも root で実行する必要はありませんが root ユーザはデフォルトで適切なグループに属しているため root を使用することもできます 2. 認証情報は認証情報ストアに保存されるためツールを使用してこのサーバにアクセスするたびに手動で認証情報を入力する必要はありません Steeleye Protection Suite の認証情報の設定またはを参照してください vappkeeper の認証情報の設定認証情報ストアおよび credstore ユーティリティを使用した管理についての詳細な情報が掲載されています lkpolicy によるセッションの例は以下のようになります [root@thor49 ~]# lkpolicy -l -d v6test4 SteelEye Protection Suite for Linux 153

174 ポリシーのリスト表示 Please enter your credentials for the system 'v6test4'. Username: root Password: Confirm password: Failover LocalRecovery TemporalRecovery NotificationOnly ~]# lkpolicy -l -d v6test4 Failover LocalRecovery TemporalRecovery NotificationOnly ~]# ポリシーのリスト表示 lkpolicy --list-policy-types 現在のポリシーの表示 lkpolicy --get-policies lkpolicy --get-policies tag=\* lkpolicy --get-policies --verbose tag=mysql\* # mysql で始まるすべてのポリシー lkpolicy --get-policies tag=mytagonly ポリシーの設定 lkpolicy --set-policy Failover --off lkpolicy --set-policy Failover --on tag=myresource lkpolicy --set-policy Failover --on tag=\* lkpolicy --set-policy LocalRecovery --off tag=myresource lkpolicy --set-policy NotificationOnly --on lkpolicy --set-policy TemporalRecovery --on recoverylimit=5 period=15 lkpolicy --set-policy TemporalRecovery --on --force recoverylimit=5 period=10 ポリシーの削除 lkpolicy --remove-policy Failover tag=steve 注記 :NotificationOnly はポリシーのエイリアスです NotificationOnly を有効にすることは対応する LocalRecovery および Failover ポリシーを無効にすることと等価です 154 設定

175 認証情報の設定認証情報の設定他のシステムと通信するための認証情報は認証情報ストアを使用して管理されていますこのストアは必要に応じて /opt/lifekeeper/bin/credstore ユーティリティで管理できますこのユーティリティを使用するとサーバアクセスに必要な認証情報をサーバごとに設定変更削除することができます認証情報の追加または変更認証情報の追加と変更は同じ方法で実行できます代表的な例としてサーバー server.mydomain.com に対する資格情報を追加または変更する場合は次のようになります /opt/lifekeeper/bin/credstore -k server.mydomain.com myuser この例では server.mydomain.com へのアクセスに使用するユーザ名として myuser を指定してしていますパスワードを入力 / 確認するプロンプト (passwd の様に ) が表示されます注記 : LifeKeeper サーバの認証情報を格納するために使用されるキー名は lkpolicy などのコマンドで使用するホスト名と完全に一致する必要がありますコマンドで使用するホスト名が FQDN であれば認証情報のキーも FQDN でなければなりませんコマンドで使用するホスト名がショートネームであれば認証情報のキーもショートネームでなければなりません認証情報ストアにデフォルトキーを作成することもできますサーバキーが存在しない場合にデフォルトの認証情報が認証に使用されますデフォルトキーを追加変更するには以下のコマンドを実行してください /opt/lifekeeper/bin/credstore -k default myuser ストア内の認証情報のリスト表示現在格納されている認証情報をリスト表示するには以下のコマンドを実行します /opt/lifekeeper/bin/credstore -l これにより認証情報ストア内に格納されているキーが表示されますこの場合のキーは認証情報を使用する対象のサーバを示しています ( 認証情報自体は秘密情報のためこのコマンドが表示するのは実際の認証情報の内容ではなくキー名のみです ) サーバの認証情報の削除特定のサーバに対する認証情報を削除するには以下のコマンドを実行します /opt/lifekeeper/bin/credstore -d -k myserver.mydomain.com この例ではサーバ myserver.mydomain.com に対する認証情報がストアから削除されます追加情報 credstore ユーティリティの詳細については以下のコマンドを実行してください SteelEye Protection Suite for Linux 155

176 LifeKeeper API /opt/lifekeeper/bin/credstore --man コマンドのマニュアルページがすべて表示されます LifeKeeper API LifeKeeper API を使用すると LifeKeeper サーバ間の通信を行えるようになります重要な注記 : 現在この API は内部使用のみに予約されていますが将来のリリースではユーザやサードパーティが使用できるように開放される可能性がありますネットワーク設定 LifeKeeper の各サーバはポート 778 の SSL 接続を使用してこの API を提供しますこのポートは /etc/default/lifekeeper 内の設定変数 API_SSL_PORT を使用して変更できます認証 LifeKeeper API は認証に PAM を使用します API へのアクセス権限はグループ lkadmin lkoper lkguest のメンバーであるユーザにのみ付与されますユーザに権限を与えるにはシステムの PAM 設定に応じてローカルシステムファイル (/etc/passwd および /etc/group) を使用するかユーザを LDAP または Active Directory のグループに追加します注記 : LifeKeeper API は lkpasswd で管理されるユーザデータベースは使用しません 156 設定

177 LifeKeeper 管理概要 LifeKeeper は操作時に管理を必要としません LifeKeeper は保護されたリソースを監視し障害が発生した場合に指定されたリカバリアクションを実行するように自動的に機能します以下のケースでは LifeKeeper GUI を使用しますリソースおよび階層の定義 LifeKeeper は次のインターフェースオプションを提供します LifeKeeper GUI LifeKeeper コマンドラインインターフェースリソース監視 LifeKeeper GUI はリソースステータス情報および LifeKeeper ログへのアクセスを提供します手動での処理メンテナンスやその他の管理アクションのためにサーバまたは特定のリソースを停止することが必要になる場合があります LifeKeeper GUI には特定のリソースを稼動させたり停止させることができるメニュー機能が用意されていますアプリケーションが LifeKeeper の保護下に置かれるとこれらの LifeKeeper のインターフェースを介してのみアプリケーションを起動および停止させることができます LifeKeeper の起動および停止はコマンドラインを介してのみ行われます LifeKeeper の管理設定およびメンテナンス操作を実行する詳細な手順については GUI の作業およびメンテナンス作業を参照してくださいエラーの検出および通知アプリケーション内の問題を検出して通知する機能は最適な総合的耐障害性ソリューションを構築する上で非常に重要ですすべての個々のアプリケーションは障害発生のメカニズムと形式によって異なるため一般的なメカニズムを示すことはできませんただし一般的に多くのアプリケーションの設定は LifeKeeper に用意されている Core システムのエラー検出機能を利用することができますリソースエラー回復シナリオおよびサーバ障害回復シナリオの各トピックでは共通する 2 つの障害状況を使用して LifeKeeper のコア機能を示しています LifeKeeper にはエラーアラームおよびリカバリ手順を起動するイベントを定義するための完全な環境も用意されていますこのインターフェースは通常システムエラーログ用のパターンマッチ定義 (/var/log/messages) またはカスタムビルドのアプリケーション固有の監視プロセスが必要になります N-Way リカバリ N-Way リカバリを使用すると異なる複数のリソースをクラスタ内の異なるバックアップサーバにフェイル SteelEye Protection Suite for Linux 157

178 管理作業オーバすることができます保護されたリソースに戻る管理作業サーバプロパティの編集 1. サーバプロパティを編集するにはサーバプロパティを表示する場合と同様に [Server Properties] ダイアログを表示してください 2. 該当のサーバに適切な権限でログインした場合は次の項目が編集可能になりますシャットダウン方法フェイルオーバ確認 3. 変更が加えられると [Apply] ボタンが有効になりますこのボタンをクリックすると変更が適用されますウィンドウは閉じられません 4. 完了したら [OK] をクリックし変更内容を保存してウィンドウを閉じるかまたは [Cancel] をクリックして変更内容を適用せずにウィンドウを閉じますコミュニケーションパスの作成サーバ間の LifeKeeper コミュニケーションパスを設定する前にハードウェアおよびソフトウェアのセットアップを検証します詳細については SPS for Linux リリースノートを参照してくださいサーバのペア間にコミュニケーションパスを作成するには両方のサーバに個別にパスを定義する必要があります LifeKeeper ではサーバのペア間に TCP (TCP/IP) と TTY の両方のコミュニケーションパスを作成することができます TTY パスは所定のペア間に 1 つだけ作成できますこれに対し TCP コミュニケーションパスはパスの終点となるローカルおよびリモートのアドレスを指定することでサーバのペア間に複数作成することができます所定のリモートサーバへの TCP パスを使用する順序を LifeKeeper に設定するには優先値を使用します重要 : 単一のコミュニケーションパスを使用した場合互いに通信するクラスタ内のサーバの機能に支障をきたす可能性があります単一のコミュニケーションパスを使用しているときにそのコミュニケーションパスで障害が発生した場合複数のサーバ上で同時に LifeKeeper の階層が使用可能になることがありますこれは偽のフェイルオーバと呼ばれますまた TCP コミュニケーションパス上のネットワークトラフィックが大きくなると偽のフェイルオーバや LifeKeeper の初期化の問題など予期せぬ動作が生じる可能性があります 1. 開始するには次の 4 つの方法がありますサーバアイコンを右クリックしてサーバコンテキストメニューが表示されたら [Create Comm Path] をクリックしてくださいグローバルツールバーで [Create Comm Path] ボタンをクリックしてくださいサーバコンテキストツールバーで ( 表示された場合 ) [Create Comm Path] ボタンをクリッ 158 LifeKeeper 管理の概要

179 コミュニケーションパスの作成クしてください [Edit] メニューで [Server] [Create Comm Path] の順に選択してください 2. [Create Comm Path] というタイトルのダイアログが表示されます表示されるオプションのそれぞれについて [Help] をクリックすると選択した項目の説明が表示されます 3. リストボックスから [Local Server] を選択し [Next] をクリックしてください 4. リストボックスで 1 つ以上の [Remote Servers] を選択してくださいリストボックスにリモートサーバが表示されていない ( つまりクラスタにまだ接続されていない ) 場合は [Add] を使用して入力してくださいローカルとリモートの両方のサーバに対するネットワークアドレスが解決可能であることを確認する必要があります ( たとえば DNS で解決するか /etc/hosts ファイルに追加します ) [Next] をクリックしてください 5. [Device Type] に対して [TCP] または [TTY] を選択して [Next] をクリックしてください 6. [Device Type] が [TCP] に設定されている場合は 1 つ以上の [Local IP Addresses] を選択してください [Device Type] が [TTY] に設定されている場合は [Local TTY Device] を選択してください [Next] をクリックしてください 7. [Device Type] が [TCP] に設定されている場合は [Remote IP Address] を選択してください [Device Type] が [TTY] に設定されている場合は [Remote TTY Device] を選択してください [Next] をクリックしてください 8. [Device Type] が [TCP] に設定されている場合はこのコミュニケーションパスに対して [Priority] を入力または選択してください [Device Type] が [TTY] に設定されいる場合はこのコミュニケーションパスに対して [Baud Rate] を入力または選択してください [Next] をクリックしてください 9. [Create] をクリックしてくださいネットワーク接続が正常に作成されたことを示すメッセージが表示されます [Next] をクリックしてください 10. 複数のローカル IP アドレスまたは複数のリモートサーバを選択したときに [Device Type] が [TCP] に設定されている場合は手順 6 に戻り次のコミュニケーションパスの設定を続けます複数のリモートサーバを選択したときに [Device Type] が [TTY] に設定されている場合は手順 5 に戻り次のコミュニケーションパスの設定を続けます 11. 終了メッセージが表示されたら [Done] をクリックしてください [Server Properties] ダイアログを表示するかまたはコマンド lcdstatus -q を入力することでコミュニケーションパスを確認することができます lcdstatus の使用方法については LCD(1M) マニュアルページを参照してください [ALIVE] ステータスが表示されますさらに GUI の右ペインのサーバアイコンをチェックしてくださいこれが作成済みの 1 つ目のコミュニケーションパスである場合は 1 つのコミュニケーションパスが [ALIVE] であるが冗長コミュニケーションパスがないことを示す黄色のハートビートがサーバアイコンに表示されます [ALIVE] のコミュニケーションパスが 2 つ以上ある場合は緑色のハートビートがサーバアイコンに表示されます SteelEye Protection Suite for Linux 159

180 コミュニケーションパスの削除重要 : IPv6 アドレスを使用してコミュニケーションパスを作成する場合は自動設定 / ステートレスアドレスではなく静的に割り当てられたアドレスを使用してください自動設定 / ステートレスアドレスは時間がたつと変更されコミュニケーションパスが使用できなくなる可能性があります数分たってもコミュニケーションパスが使用可能にならない場合はペアのサーバのコンピュータ名が正しいことを確認してください TTY コミュニケーションパスを使用している場合は 2 つのサーバ間のケーブル接続が正しく緩んでいないことを確認してください必要に応じて portio(1m) コマンドを使用して TTY 接続の動作を確認してくださいコミュニケーションパスの削除 1. 開始するには次の 4 つの方法がありますサーバアイコンを右クリックしてサーバコンテキストメニューが表示されたら [Delete Comm Path] をクリックしてくださいグローバルツールバーで [Delete Comm Path] ボタンをクリックしてくださいサーバコンテキストツールバーで ( 表示された場合 ) [Delete Comm Path] ボタンをクリックしてください [Edit] メニューで [Server] [Delete Comm Path] の順に選択してください 2. [Delete Comm Path] というタイトルのダイアログが表示されます表示されるオプションのそれぞれについて [Help] をクリックすると選択した項目の説明が表示されます 3. リストから [Local Server] を選択し [Next] をクリックしてくださいこのダイアログが表示されるのはグローバルツールバー上の [Delete Comm Path] ボタンまたは [Server] ボタンを選択する [Edit] メニューを使用して削除を選択した場合のみです 4. 削除するコミュニケーションパスを選択して [Next] をクリックしてください 5. [Delete Comm Path(s)] をクリックしてください出力パネルが有効な場合ダイアログが閉じてコミュニケーションパスを削除するコマンドの結果が出力パネルに表示されます有効でない場合はダイアログが表示されたままこれらの結果が表示されますすべての結果が表示されたら [Done] をクリックして終了しますネットワーク接続が正常に削除されたことを示すメッセージが表示されます 6. [Done] をクリックしてダイアログを閉じ GUI ステータス表示に戻ってくださいサーバのプロパティ - フェイルオーバプライマリサーバがローカルリカバリを試行して失敗した場合または完全に機能停止した場合ほとんどのサーバ管理者は LifeKeeper で保護されたリソースをバックアップサーバにリストアすることが必要になりますこれがデフォルトの LifeKeeper の動作になりますただし管理者によっては保護されたリソースをリカバリサイトで自動的に稼動するようにしたくない場合もありますたとえばディザスタリカバリ状況においてサーバ間のネットワーク接続の信頼性が低くなるような WAN 環境に LifeKeeper がインストールされている場合ですデフォルトでは保護されたすべてのリソースに対して自動フェイルオーバが有効になっています保護されたリソースに対する自動フェイルオーバを無効にしたりバックアップサーバへの自動フェイルオーバを行 160 LifeKeeper 管理の概要

181 サーバのプロパティ - フェイルオーバわないようにするには [Server Properties] の [General] タブにある [Failover] セクションを使用して以下の通り設定してくださいクラスタ内の各サーバで次のようにします 1. サーバのプロパティを表示する場合と同様に [Server Properties] ダイアログを表示してください 2. [General] タブを選択してください [Server Properties] ダイアログの [Failover] セクションでシステムおよびリソースのフェイルオーバ機能を無効にするサーバをチェックしてくださいデフォルトでは LifeKeeper のすべてのフェイルオーバ機能が有効になっています [Disable System Failover] 列でローカルサーバの完全な機能停止に対応するバックアップサーバとしての資格を喪失させるサーバを選択してください [Disable Resource Failover] 列でこのローカルサーバ上でリソース階層に障害が発生した場合に対応するバックアップサーバとしての資格を喪失させるサーバを選択してください最初にシステムのフェイルオーバ機能を無効にしなければリソースのフェイルオーバを無効にすることはできません選択内容を適用するには [Apply] ボタンを押してください SteelEye Protection Suite for Linux 161

182 リソース階層の作成リソース階層の作成 1. リソース階層の作成を開始するには次の 4 つの方法がありますサーバアイコンを右クリックしてサーバコンテキストメニューが表示されたら [Create Resource Hierarchy] をクリックしてくださいグローバルツールバーで [Create Resource Hierarchy] ボタンをクリックしてくださいサーバコンテキストツールバーで ( 表示された場合 ) [Create Resource Hierarchy] ボタンをクリックしてください [Edit] メニューで [Server] を選択して [Create Resource Hierarchy] をクリックしてください 2. [Create Resource Wizard] というタイトルのダイアログが表示されクラスタ内にインストールされているすべての認識されたリカバリキットのリストが示されますアプリケーションを保護するためにリソース階層を構築する Recovery Kit を選択して [Next] をクリックしてください 3. [Switchback Type] を選択して [Next] をクリックしてください 4. [Server] を選択して [Next] をクリックしてください注記 : サーバコンテキストメニューから開始した場合クリックしたサーバアイコンから自動的にサーバが決定されるのでこの手順はスキップされます 5. 続いて表示されるダイアログを使用して作成しているリソース階層の種類に必要なデータを入力してください LifeKeeper アプリケーションリソース階層 LifeKeeper をリカバリキット無しでインストールした場合デフォルトでは [Select Recovery Kit] リストにファイルシステムまたは Generic Application 用のオプションが含まれています Generic Application のオプションは関連付けられたリカバリキットがないアプリケーションに使用できます Raw I/O Recovery Kit または IP Recovery Kit ( これらは両方とも別個にパッケージ化され LifeKeeper Core メディアに含まれている Core Recovery Kit です ) をインストールした場合 [Select Recovery Kit] リストはこれらの Recovery Kit に対する追加のオプションを提供しますこれらの利用可能なオプションについては以下のトピックを参照してくださいファイルシステムリソース階層の作成 Generic Application リソース階層の作成 Raw デバイスリソース階層の作成 IP Recovery Kit については IP Recovery Kit テクニカルドキュメンテーションを参照してください 162 LifeKeeper 管理の概要

183 Recovery Kit のオプション Recovery Kit のオプションインストールしたオプションの各リカバリキットは [Select Recovery Kit] リストにエントリを追加しますたとえば Oracle Apache および NFS の Recovery Kit がリストに表示されます必要なリソース階層を作成する手順については各リカバリキットに付属の管理ガイドを参照してください注記 : ファイルシステムまたは論理ボリューム上に構築されるその他のアプリケーションリソース階層を作成する場合最初に Logical Volume Manager (LVM) Recovery Kit をインストールする必要がありますファイルシステムリソース階層の作成このオプションはファイルシステムのみを保護する場合 ( たとえば保護を必要とする共有ファイルがある場合 ) に使用します 1. ファイルシステムリソース階層の作成を開始するには次の 4 つの方法がありますサーバアイコンを右クリックしてサーバコンテキストメニューが表示されたら [Create Resource Hierarchy] をクリックしてくださいグローバルツールバーで [Create Resource Hierarchy] ボタンをクリックしてくださいサーバコンテキストツールバーで ( 表示された場合 ) [Create Resource Hierarchy] ボタンをクリックしてください [Edit] メニューで [Server] を選択して [Create Resource Hierarchy] をクリックしてください 2. [Create Resource Wizard] というタイトルのダイアログが表示され [Recovery Kit] リストが示されます [File System Resource] を選択して [Next] をクリックしてください 3. [Switchback Type] を選択して [Next] をクリックしてください 4. [Server] を選択して [Next] をクリックしてください注意 : サーバコンテキストメニューから開始した場合クリックしたサーバアイコンから自動的にサーバが決定されるのでこの手順はスキップされます 5. [Create gen/filesys Resource] ダイアログが表示されますファイルシステムリソース階層に対して [Mount Point] を選択し [Next] をクリックしてください選択したマウントポイントがクラスタ内の別のサーバと共有されていることを確認するには各ストレージキットをチェックしてマウントされたデバイスを共有として認識しているかどうかを確認しますストレージキットがマウントされたデバイスを認識していない場合は次のエラーダイアログが表示されます <file system> is not a shared file system [OK] を選択すると [Create gen/filsys Resource] ダイアログに戻ります注記 : マウントポイントを選択リストに表示するにはそのマウントポイントがマウントされている必要がありますマウントポイントに対するエントリが /etc/fstab ファイルに存在する場合階層の作成および拡張時にこのエントリが削除されま SteelEye Protection Suite for Linux 163

184 Generic Application リソース階層の作成す NAS Recovery Kit を使用する前に ( 特にマウント設定が複雑な場合 ) /etc/fstab のバックアップを作成することをお勧めします /etc/default/lifekeeper で調整可能な REPLACEFSTAB=true TRUE を設定することにより /etc/fstab のエントリが削除されても元に戻すように指定することができますこれらのリソースの多く (SteelEye DataKeeper LVM Device Mapper Multipath など ) はファイルシステムリソースを作成するためにクラスタ内の各サーバで LifeKeeper リカバリキットを必要としますこれらのキットが適切にインストールされていない場合クラスタ内で共有されるファイルシステムが表示されません 6. ファイルシステムリソース階層に対するデフォルトの [Root Tag] が作成されます ( これはステータス表示でこのリソースに使用されるラベルです ) このルートタグを選択するか独自のルートタグを作成して [Next] をクリックしてください 7. [Create Instance] をクリックしてくださいインスタンス作成のステータスを示すメッセージがウィンドウに表示されます 8. [Next] をクリックしてくださいファイルシステム階層が正常に作成されたというメッセージがウィンドウに表示されます 9. この時点でファイルシステムリソース階層の拡張に移動するには [Continue] をクリックし GUI に戻るには [Cancel] をクリックします [Cancel] をクリックすると階層が 1 つのサーバにしか存在しないという警告メッセージが表示されこの時点で保護されなくなります Generic Application リソース階層の作成このオプションは関連付けられたリカバリキットがないユーザ定義のアプリケーションを保護する場合に使用します下記のユーザ指定スクリプトに対するテンプレートは $LKROOT/lkadm/subsys/gen/app/templates に用意されていますこれらのテンプレートは保護するアプリケーション用にカスタマイズしてテストする前に別のディレクトリにコピーしてください注記 : ファイルシステムディスクパーティション IP アドレスなどの他のリソースに依存するアプリケーションについてはこれらの各リソースを個別に作成し Create Dependency を使用して適切な依存関係を作成してください 1. Generic Application リソース階層の作成を開始するには次の 4 つの方法がありますサーバアイコンを右クリックしてサーバコンテキストメニューが表示されたら [Create Resource Hierarchy] をクリックしてくださいグローバルツールバーで [Create Resource Hierarchy] ボタンをクリックしてくださいサーバコンテキストツールバーで ( 表示された場合 ) [Create Resource Hierarchy] ボタンをクリックしてください [Edit] メニューで [Server] を選択して [Create Resource Hierarchy] をクリックしてください 2. [Create Resource Wizard] というタイトルのダイアログが表示され [Recovery Kit] リストが示されます Generic Application を選択して [Next] をクリックしてください 3. [Switchback Type] を選択して [Next] をクリックしてください 164 LifeKeeper 管理の概要

185 Raw デバイスリソース階層の作成 4. [Server] を選択して [Next] をクリックしてください注記 : サーバコンテキストメニューから開始した場合クリックしたサーバアイコンから自動的にサーバが決定されるのでこの手順はスキップされます 5. 次のダイアログでアプリケーションに対する [Restore Script] へのパスを入力し [Next] をクリックしてくださいこれはアプリケーションを起動するコマンドですテンプレートディレクトリにテンプレート起動スクリプト restore.template が用意されていますこの restore スクリプトが既に起動されているアプリケーションに影響を与えてはなりません 6. アプリケーションに対する [Remove Script] へのパスを入力し [Next] をクリックしてくださいこれはアプリケーションを停止するコマンドですテンプレートディレクトリにテンプレート停止スクリプト remove.template が用意されています 7. アプリケーションに対する [quickcheck Script] へのパスを入力し [Next] をクリックしてくださいこれはアプリケーションを監視するコマンドですテンプレートディレクトリにテンプレート監視スクリプト remove.template が用意されています 8. アプリケーションに対する [Local Recovery Script] へのパスを入力し [Next] をクリックしてくださいこれはローカルサーバ上の障害が発生したアプリケーションの復元を試みるコマンドですテンプレートディレクトリにテンプレート回復スクリプト recover.template が用意されています 9. [Application Information] を入力し [Next] をクリックしてくださいこれは起動停止回復監視の各スクリプトで必要になる可能性のあるアプリケーションに関するオプションの情報です 10. [Bring Resource In Service] に対して [Yes] または [No] を選択し [Next] をクリックしてください [No] を選択するとリソース状態が作成後に OSU に設定されます [Yes] を選択するとあらかじめ用意された restore スクリプトが実行されますファイルシステムディスクパーティション IP アドレスなどの他のリソースに依存するアプリケーションについては適切な依存リソースをまだ作成していない場合には [No] を選択してください 11. [Root Tag] を入力してくださいこれはリソースインスタンスに対する一意の名前です ( これはステータス表示でこのリソースに対して表示されるラベルです ) 12. [Create Instance] をクリックして作成プロセスを起動してくださいインスタンス作成のステータスを示すメッセージがウィンドウに表示されます 13. [Next] をクリックしてください階層が正常に作成されたというメッセージがウィンドウに表示されます 14. この時点で Generic Application リソース階層の拡張に移動するには [Continue] をクリックし GUI に戻るには [Cancel] をクリックします [Cancel] をクリックすると階層が 1 つのサーバにしか存在しないという警告が表示されこの時点で保護されなくなります Raw デバイスリソース階層の作成このオプションは Raw デバイスリソースを保護する場合に使用しますたとえば既存のデータベース階層に追加する必要がある Raw デバイスに対して追加のテーブルスペースを作成する場合このオプションを使用して Raw デバイスリソースを作成します注記 : LifeKeeper ではディスク論理ユニット ( または LUN) レベルのディスクパーティションリソースを一度に 1 つのクラスタの 1 つのシステムにロックします SteelEye Protection Suite for Linux 165

186 リソースのプロパティの編集 1. Raw デバイスリソース階層の作成を開始するには次の 4 つの方法がありますサーバアイコンを右クリックしてサーバコンテキストメニューが表示されたら [Create Resource Hierarchy] をクリックしてくださいグローバルツールバーで [Create Resource Hierarchy] ボタンをクリックしてくださいサーバコンテキストツールバーで ( 表示された場合 ) [Create Resource Hierarchy] ボタンをクリックしてください [Edit] メニューで [Server] を選択して [Create Resource Hierarchy] をクリックしてください 2. [Create Resource Wizard] というタイトルのダイアログが表示され [Recovery Kit] リストが示されます Raw デバイスを選択して [Next] をクリックしてください 3. [Switchback Type] を選択して [Next] をクリックしてください 4. [Server] を選択して [Next] をクリックしてください注記 : サーバコンテキストメニューから開始した場合クリックしたサーバアイコンから自動的にサーバが決定されるのでこの手順はスキップされます 5. このリソースが配置される共有ストレージデバイスで [Raw Partition] を選択して [Next] をクリックしてください 6. [Root Tag] を入力してくださいこれはリソースインスタンスに対する一意の名前です ( これはステータス表示でこのリソースに対して表示されるラベルです ) 7. [Create Instance] をクリックして作成プロセスを起動してください作成中に何が発生したかを示すテキストが [Creating scsi/raw resource] というタイトルのウィンドウに表示されます 8. [Next] をクリックしてください階層が正常に作成されたというメッセージがウィンドウに表示されます 9. この時点で Raw リソース階層の拡張に移動するには [Continue] をクリックし GUI に戻るには [Cancel] をクリックします [Cancel] をクリックすると階層が 1 つのサーバにしか存在しないということを警告するメッセージが表示されこの時点で保護されなくなりますリソースのプロパティの編集 1. リソースのプロパティを編集するにはリソースのプロパティを表示する場合と同様に [Resource Properties] ダイアログを表示してください 2. 該当のサーバに適切な権限でログインした場合は次の項目が編集可能になりますスイッチバックリソース設定 ( 特殊な設定を持つリソースの場合のみ ) リソースの優先順位 3. 変更が加えられると [Apply] ボタンが有効になりますこのボタンをクリックすると変更が適用されますウィンドウは閉じられません 4. 完了したら [OK] をクリックし変更内容を保存してウィンドウを閉じるかまたは [Cancel] をク 166 LifeKeeper 管理の概要

リソースの優先順位の編集リックして変更内容を適用せずにウィンドウを閉じますリソースの優先順位の編集リソース階層が定義されているサーバの優先順位は編集または変更することができます最初にリソースのプロパティを表示する場合と同様に Resource Properties ダイアログを表示してください下に示すように Resource Properties

187 リソースの優先順位の編集リックして変更内容を適用せずにウィンドウを閉じますリソースの優先順位の編集リソース階層が定義されているサーバの優先順位は編集または変更することができます最初にリソースのプロパティを表示する場合と同様に Resource Properties ダイアログを表示してください下に示すように Resource Properties ダイアログの [Equivalencies] タブにサーバ上の特定のリソースに対する優先順位が表示されます優先順位を変更するには次の 2 つの方法があります [Up]/[Down] ボタンを使用してイクイバレンシを移動することにより優先順位を変更してくださいまたは優先順位の値を直接編集してください SteelEye Protection Suite for Linux 167

188 [Up] および [Down] ボタンの使用 [Up] および [Down] ボタンの使用 1. Equivalencies 表で行をクリックしてイクイバレンシを選択してください選択したイクイバレンシに応じて [Up] または [Down] ボタンが有効になります最も優先順位が高いサーバを選択した場合以外は [Up] ボタンが有効になります最も優先順位が低いサーバを選択した場合以外は [Down] ボタンが有効になります 2. [Up] または [Down] をクリックして優先順位リストのイクイバレンシを移動してください数値の優先順位の列は変更されませんがイクイバレンシがリスト内で上下に移動します優先順位の値の編集 1. Equivalencies 表の Priority 列で優先順位の値をクリックすることにより優先順位を選択してください優先順位の値の周りにボックスが表示され値が強調表示されます 2. 必要な優先順位を入力して Enter を押してください注記 : 有効なサーバの優先順位は 1 ~ 999 です優先順位を編集した後 Equivalencies 表が再ソートされます変更の適用 Equivalencies 表で必要な優先順位を設定したら [Apply] ( または [OK]) をクリックして変更を適用します [Apply] ボタンをクリックすると加えられた変更内容が適用されます [OK] ボタンをクリックすると加えられた変更内容が適用されウィンドウが閉じられます [Cancel] ボタンをクリックすると [Apply] が直前にクリックされているので加えられた変更内容を保存せずにウィンドウが閉じられますリソース階層の拡張 LifeKeeper の [Extend Resource Hierarchy] オプションはあるサーバから既存の階層をコピーして別の LifeKeeper サーバ上に同様の階層を作成します階層が他のサーバに拡張されるとそのリソースに対してカスケーディングフェイルオーバが使用可能になります既存の階層が現在存在するサーバはテンプレートサーバと呼ばれます新たに拡張された階層が配置されるサーバはターゲットサーバと呼ばれますターゲットサーバは拡張された階層をサポートすることができ他のリモートサーバ上の同等の階層と ( アクティブな LifeKeeper コミュニケーションパスを介して ) 通信できなければなりませんつまり既存の階層内のリソースに関連付けられているすべてのリカバリキットがターゲットサーバだけでなく階層が現在存在する他のすべてのサーバに既にインストールされている必要があります 1. GUI を介してリソース階層を拡張するには次の 5 つの方法があります新しいリソース階層を作成してください階層が作成されたことがダイアログに表示されたら [Continue] ボタンをクリックして Pre-Extend Wizard を介して新しい階層の拡張を開始してくださいグローバルまたはサーバ固有のリソースアイコンを右クリックしてリソースコンテキストメニューを表示し次に [Extend Resource Hierarchy] をクリックして Pre-Extend Wizard を 168 LifeKeeper 管理の概要

189 ファイルシステムリソース階層の拡張介して選択したリソースを拡張してくださいグローバルツールバーで [Extend Resource Hierarchy] ボタンをクリックしてください [Pre-Extend Wizard] ダイアログが表示されたら [Template Server] および [Tag to Extend] を選択しそれぞれ選択した後に [Next] をクリックしてくださいリソースコンテキストツールバーで ( 表示された場合 ) [Extend Resource Hierarchy] ボタンをクリックして Pre-Extend Wizard を表示してください [Edit] メニューで [Resource] を選択して [Extend Resource Hierarchy] をクリックしてください [Pre-Extend Wizard] ダイアログが表示されたら [Template Server] および [Tag to Extend] を選択しそれぞれ選択した後に [Next] をクリックしてください 2. デフォルトの [Target Server] を選択するかまたは選択リストの中から 1 つ入力して [Next] をクリックしてください 3. [Switchback Type] を選択して [Next] をクリックしてください 4. デフォルト値を選択するかまたは独自の [Template Priority] を入力して [Next] をクリックしてください 5. 独自の [Target Priority] を選択するか入力して [Next] をクリックしてください 6. ダイアログに次に実行される拡張前のチェックが表示されますこれらのテストが成功した場合 LifeKeeper は拡張している特定の種類のリソースに必要な手順の実行を開始します [Extend Resource Hierarchy] オプションの [Accept Defaults] ボタンは LifeKeeper の [Extend Resource Hierarchy] のデフォルト値を熟知して値の入力や確認をしないで素早く LifeKeeper リソース階層を拡張したいユーザ向けです GUI ダイアログを使用して対話的に段階を追って LifeKeeper リソース階層を拡張する場合は [Next] ボタンを選択します注記 : マルチルート階層のすべてのルートはまとめて拡張する必要がありますつまり単一ルート階層として拡張することはできません注記 : コマンドラインによる手順については SAP ドキュメントのコマンドラインからの SAP リソースの拡張を参照してくださいファイルシステムリソース階層の拡張この操作はリソース階層の拡張に関するセクションで説明されているようにファイルシステムリソース階層の作成を完了した後に自動的に開始したり既存のファイルシステムリソースから開始することができますそれが済んだら次に以下の手順を完了しますこれらの手順はファイルシステムリソースに固有のものです 1. [Extend gen/filesys Resource Hierarchy] ダイアログボックスが表示されますファイルシステム階層に対して [Mount Point] を選択し [Next] をクリックしてください 2. LifeKeeper が提供する [Root Tag] を選択するかまたはターゲットサーバ上のリソース階層に対する独自のタグを入力して [Next] をクリックしてください 3. ダイアログに拡張操作のステータスが表示され階層が正常に拡張されたことを示すメッセージが表示されて終了します同じリソース階層を別のサーバに拡張する場合は [Next Server] をクリックしてくださいその場合は拡張の操作が繰り返されますまたは [Finish] をクリックしてこの操作を完了してください SteelEye Protection Suite for Linux 169

190 Generic Application リソース階層の拡張 4. 拡張された階層が検証されると確認情報がダイアログに表示されますこれが終了すると [Done] ボタンが有効になります [Done] をクリックして終了してください Generic Application リソース階層の拡張この操作はリソース階層の拡張に関するセクションで説明されているように Generic Application リソース階層の作成を終了した後に自動的に開始したり既存の Generic Application リソースから開始することができますそれが済んだら次に以下の手順を完了しますこれらの手順は Generic Application リソースに固有のものです 1. LifeKeeper が提供する [Root Tag] を選択するかまたはターゲットサーバ上のリソース階層に対する独自のタグを入力して [Next] をクリックしてください 2. 次に [Application Information] ( オプション ) を入力し [Next] をクリックしてください 3. ダイアログに拡張操作のステータスが表示され階層が正常に拡張されたことを示すメッセージが表示されて終了します同じリソース階層を別のサーバに拡張する場合は [Next Server] をクリックしてくださいその場合は拡張の操作が繰り返されますまたは [Finish] をクリックしてこの操作を完了してください 4. 拡張された階層が確認されると確認情報がダイアログに表示されますこれが終了すると [Done] ボタンが有効になります [Done] をクリックして終了してください Raw デバイスリソース階層の拡張この操作はリソース階層の拡張に関するセクションで説明されているように Raw デバイスリソース階層の作成を終了した後に自動的に開始したり既存の Raw デバイスリソースから開始することができますそれが済んだら次に以下の手順を完了しますこれらの手順は Raw デバイスリソースに固有のものです 1. LifeKeeper が提供する [Root Tag] を選択するかまたはターゲットサーバ上のリソース階層に対する独自のタグを入力して [Next] をクリックしてください 2. ダイアログに拡張操作のステータスが表示され階層が正常に拡張されたことを示すメッセージが表示されて終了します同じリソース階層を別のサーバに拡張する場合は [Next Server] をクリックしてくださいその場合は拡張の操作が繰り返されますまたは [Finish] をクリックしてこの操作を完了してください 3. 拡張された階層が検証されると確認情報がダイアログに表示されますこれが終了すると [Done] ボタンが有効になります [Done] をクリックして終了してください階層の拡張解除 LifeKeeper の [Unextend Resource Hierarchy] オプションは単一サーバから階層全体 ( すべてのリソースを含む ) を削除しますこれはすべてのサーバから 1 つの階層を削除する [Delete Resource Hierarchy] 選択項目とは異なります [Unextend Resource Hierarchy] を使用する場合既存の階層を削除するサーバはターゲットサーバと呼ばれます 170 LifeKeeper 管理の概要

191 リソース依存関係の作成 [Unextend Resource Hierarchy] 選択項目はターゲットへのアクティブな LifeKeeper コミュニケーションパスを持つ LifeKeeper サーバから使用することができます 1. 開始するには次の 5 つの可能な方法があります拡張解除したいリソース階層 / サーバの組み合わせに対するアイコンを右クリックしてくださいリソースコンテキストメニューが表示されたら [Unextend Resource Hierarchy] をクリックしてください拡張解除したいグローバルリソース階層のアイコンを右クリックしてくださいリソースコンテキストメニューが表示されたら [Unextend Resource Hierarchy] をクリックしてくださいダイアログが表示されたらリソース階層の拡張を解除するサーバを [Target Server] リストで選択し [Next] をクリックしてくださいグローバルツールバーで [Unextend Resource Hierarchy] ボタンをクリックしてくださいダイアログが表示されたらリソース階層の拡張を解除するサーバを [Target Server] リストで選択し [Next] をクリックしてください次のダイアログで [Hierarchy to Unextend] リストから拡張解除したいリソース階層を選択し再度 [Next] をクリックしてくださいリソースコンテキストツールバーで ( 表示された場合 ) [Unextend Resource Hierarchy] ボタンをクリックしてください [Edit] メニューで [Resource] をポイントして [Unextend Resource Hierarchy] をクリックしてくださいダイアログが表示されたらリソース階層の拡張を解除するサーバを [Target Server] リストで選択し [Next] をクリックしてください次のダイアログで [Hierarchy to Unextend] リストから拡張解除したいリソース階層を選択し再度 [Next] をクリックしてください 2. 拡張解除するように指定したサーバおよびリソース階層を確認するメッセージがダイアログに表示されます [Unextend] をクリックしてアクションを実行してください 3. 出力パネルが有効な場合ダイアログが閉じてリソース階層の拡張を解除するコマンドの結果が出力パネルに表示されます有効でない場合はダイアログが表示されたままこれらの結果が表示されますすべての結果が表示されたら [Done] をクリックして終了しますリソース依存関係の作成ほとんどの Recovery Kits では元のリソース階層作成タスク中にそれらの依存関係が作成されますが特定の条件下では新規または追加のリソース依存関係を作成したり既存のリソース依存関係を削除することが必要になる場合があります一例として既存の IP 依存関係を別の IP アドレスに変更する場合が挙げられますリソース階層全体を削除して新しいリソース階層を作成する代わりに既存の IP 依存関係を削除して異なる IP アドレスを持つ新しい依存関係を作成することができます 1. 開始するには次の 4 つの可能な方法があります親子依存関係を追加したいサーバの下の親サーバ固有のリソースまたは親グローバルリソースに対するアイコンを右クリックしてくださいリソースコンテキストメニューが表示されたら [Create Dependency] をクリックしてください SteelEye Protection Suite for Linux 171

192 リソース依存関係の削除注記 : 右ペインでサーバ固有のリソースを右クリックした場合 [Server] の値はそのサーバになります左ペインでグローバルリソースを右クリックした場合 [Server] の値はリソースが最も高い優先度を持つサーバになりますグローバルツールバーで [Create Dependency] ボタンをクリックしてくださいダイアログが表示されたらリソース依存関係の作成を開始するサーバを [Server] リストで選択し [Next] をクリックしてください次のダイアログで [Parent Resource Tag] リストから親リソースを選択し再度 [Next] をクリックしてくださいリソースコンテキストツールバーで ( 表示された場合 ) [Create Dependency] ボタンをクリックしてください [Edit] メニューで [Resource] をポイントして [Create Dependency] をクリックしてくださいダイアログが表示されたらリソース依存関係の作成を開始するサーバを [Server] リストで選択し [Next] をクリックしてください次のダイアログで [Parent Resource Tag] リストから親リソースを選択し再度 [Next] をクリックしてください 2. サーバ上の既存の有効なリソースのドロップダウンボックスから [Child Resource Tag] を選択してください以下の例外を持つサーバ上で利用可能なすべてのリソースがダイアログに表示されます親リソースその先祖およびその子親リソースと同じサーバに拡張されていないリソース親リソースと同じ相対優先度を持たないリソース親リソースが稼働中の場合に親と同じサーバ上で稼働していないリソース [Next] をクリックして次のダイアログに進んでください 3. このダイアログで依存関係の作成に対して適切な親および子のリソースタグが選択されていることを確認できます [Create Dependency] をクリックして親を拡張したクラスタ内のすべてのサーバで依存関係を作成してください 4. 出力パネルが有効な場合ダイアログが閉じて依存関係を作成するコマンドの結果が出力パネルに表示されます有効でない場合はダイアログが表示されたままこれらの結果が表示されますすべての結果が表示されたら [Done] をクリックして終了しますリソース依存関係の削除 1. 開始するには次の 4 つの可能な方法があります親子依存関係を削除したいサーバの下の親サーバ固有のリソースまたは親グローバルリソースに対するアイコンを右クリックしてくださいリソースコンテキストメニューが表示されたら [Delete Dependency] をクリックしてくださいグローバルツールバーで [Delete Dependency] ボタンをクリックしてくださいダイアログが表示されたらリソース依存関係の削除を開始するサーバを [Server] リストで選択し [Next] をクリックしてください次のダイアログで [Parent Resource Tag] リストから親リソースを選択し再度 [Next] をクリックしてくださいリソースコンテキストツールバーで ( 表示された場合 ) [Delete Dependency] ボタンをクリ 172 LifeKeeper 管理の概要

193 すべてのサーバからの階層の削除ックしてください [Edit] メニューで [Resource] をポイントして [Delete Dependency] をクリックしてくださいダイアログが表示されたらリソース依存関係の削除を開始するサーバを [Server] リストで選択し [Next] をクリックしてください次のダイアログで [Parent Resource Tag] リストから親リソースを選択し再度 [Next] をクリックしてください 2. ドロップダウンボックスから [Child Resource Tag] を選択してくださいこれは削除したい依存関係における子のタグ名である必要があります [Next] をクリックして次のダイアログボックスに進んでください 3. このダイアログで依存関係の削除に対して適切な親および子のリソースタグが選択されていることを確認できます [Delete Dependency] をクリックしてクラスタ内のすべてのサーバ上の依存関係を削除してください 4. 出力パネルが有効な場合ダイアログが閉じて依存関係を削除するコマンドの結果が出力パネルに表示されます有効でない場合はダイアログが表示されたままこれらの結果が表示されますすべての結果が表示されたら [Done] をクリックして終了しますすべてのサーバからの階層の削除 1. 開始するには次の 5 つの可能な方法があります削除を開始するサーバの下の削除したい階層にあるリソースのアイコンを右クリックしてくださいリソースコンテキストメニューが表示されたら [Delete Resource Hierarchy] をクリックしてください削除したい階層にあるグローバルリソースのアイコンを右クリックしてくださいリソースコンテキストメニューが表示されたら [Delete Resource Hierarchy] をクリックしてくださいダイアログが表示されたらリソース階層の削除を開始するサーバを [Server] リストで選択し [Next] をクリックしてくださいグローバルツールバーで [Delete Resource Hierarchy] ボタンをクリックしてくださいダイアログが表示されたらリソース階層の削除を開始するサーバを [Target Server] リストで選択し [Next] をクリックしてください次のダイアログで [Hierarchy to Delete] リストから削除したい階層内のリソースを選択し再度 [Next] をクリックしてくださいプロパティパネルのリソースコンテキストツールバーで ( 表示された場合 ) [Delete Resource Hierarchy] ボタンをクリックしてください [Edit] メニューで [Resource] をポイントして [Delete Resource Hierarchy] をクリックしてくださいダイアログが表示されたらリソース階層の削除を開始するサーバを [Target Server] リストで選択し [Next] をクリックしてください次のダイアログで [Hierarchy to Delete] リストから削除したい階層内のリソースを選択し再度 [Next] をクリックしてください 2. 削除するために指定した階層を確認するメッセージがダイアログに表示されます [Delete] をクリックしてアクションを実行してください 3. 出力パネルが有効な場合ダイアログが閉じて階層を削除するコマンドの結果が出力パネルに表示されます有効でない場合はダイアログが表示されたままこれらの結果が表示されますすべての結果が表示されたら [Done] をクリックして終了します SteelEye Protection Suite for Linux 173

194

195 LifeKeeper User Guide User Guide は検索可能な総合リソースで LifeKeeper の GUI で実行できる多くの作業の詳細情報がありますこのドキュメントにアクセスするには User Guide をクリックしてください GUI から実行できる作業は 3 つの分野に分類できます共通の作業 - これらはどのユーザでも実行できる基本的な作業でクラスタへの接続サーバやリソースのプロパティの表示ログファイルの表示 GUI の設定の変更などがありますオペレータの作業 - これらはオペレータの権限を必要とする高度な作業でリソースをサービス中やサービス停止にする操作などがあります管理者の作業 - これらは管理者の権限を必要とする作業ですサーバのプロパティの編集リソースの作成通信パスの作成や削除などのサーバレベルの作業およびリソースの編集拡張削除などのリソースレベルの作業があります以下の表にそれぞれのユーザ権限で使用できるデフォルトの作業を示します特定のリソースタイプについてその他の作業が使用できることがありますこれらの作業については関連するリソースキットのドキュメントで説明しています作業権限ゲストオペレータ管理者サーバとリソースの表示サーバへの接続と切断サーバのプロパティとログの表示サーバのプロパティの変更リソース階層の作成通信パスの作成と削除リソースのプロパティの表示リソースのプロパティの変更リソースのサービス中とサービス休止の切り替えリソース階層の拡張と拡張解除リソースの依存関係の作成と削除リソース階層の削除 SteelEye Protection Suite for Linux 175

196 LifeKeeper for Linux の使用 LifeKeeper for Linux の使用以下のトピックでは LifeKeeper のグラフィカルユーザインターフェース (GUI) および LifeKeeper の GUI から実行できる多数の作業について詳しく説明しています GUI GUI のコンポーネントは LifeKeeper Core のインストールの一部としてすでにインストールされています LifeKeeper の GUI は Java テクノロジを使用して LifeKeeper およびその設定データ用にグラフィカルユーザインターフェースを提供します LifeKeeper の GUI はクライアント / サーバアプリケーションなのでユーザはクライアントシステムでグラフィカルユーザインターフェースを実行して LifeKeeper が動作中のサーバシステムの監視や管理を行いますクライアントとサーバのコンポーネントは同一システム上にある場合もない場合もあります GUI の概要 - 全般クラスタマシンの必要なグループメンバシップをユーザが持っている限り GUI を使用することで任意のマシンから任意のクラスタ内のサーバとリソースの管理操作または監視ができます ( 詳細については GUI のユーザの設定を参照 ) GUI のサーバとクライアントのコンポーネントについて説明します GUI サーバデフォルトではシステムの起動時に各 LifeKeeper サーバ上にある GUI サーバは初期化されません GUI サーバはハイパーテキスト転送プロトコル (HTTP) とリモートメソッド呼び出し (RMI) を使用して GUI クライアントと通信しますデフォルトでは GUI サーバは LifeKeeper の起動時に初期化されませんがコアの LifeKeeper のプロセスで起動するように設定できます GUI サーバの開始 / 停止を参照してください GUI クライアント GUI クライアントは任意の LifeKeeper サーバ上のアプリケーションとしてまたは Java が有効な任意のシステム上の Web クライアントとして実行できますクライアントには以下のコンポーネントがあります左上のステータスの表には接続しているサーバとそのリソースの上位のステータスが表示されます右上のプロパティパネルにはステータスの表で直前に選択したオブジェクトの詳細情報が表示されます下部の出力パネルにはコマンドの出力が表示されますウィンドウの最下部にあるメッセージバーには処理のステータスメッセージが表示されますコンテキストツールバー ( プロパティパネル内 ) とグローバルツールバーを使用すると頻繁に使用す 176 User Guide

197 GUI クライアントの終了る作業に即座にアクセスできますコンテキストメニュー ( ポップアップ ) とグローバルメニューからすべての作業にアクセスできます GUI クライアントの終了 [File] メニューから [Exit] を選択するとすべてのサーバから切断されクライアントが終了します LifeKeeper GUI ソフトウェアパッケージ LifeKeeper GUI は LifeKeeper Core パッケージクラスタにバンドルされている steeleye-lkgui ソフトウェアパッケージに含まれています steeleye-lkgui パッケージは以下の動作を実行します Java アーカイブフォーマットの LifeKeeper GUI クライアントをインストールする LifeKeeper GUI サーバをインストールする LifeKeeper 管理 Web サーバをインストールする注記 : LifeKeeper 管理 Web サーバはパブリック Web サーバとは異なるポート 81 を使用するように設定されますディレクトリ /opt/lifekeeper/htdoc/ に Java ポリシーファイルをインストールしますこのファイルには LifeKeeper GUI の実行に必要な最小限の権限があります LifeKeeper GUI アプリケーションはこの場所にある java.policy ファイルを使用してアクセスを制御します GUI 管理用に LifeKeeper を準備する続行する前に LifeKeeper サーバに LifeKeeper GUI パッケージがインストール済みであることを確認する必要がありますコマンド rpm -qi steeleye-lkgui を入力してこのパッケージがインストール済みであるかどうかを確認できます GUI パッケージがインストール済みである場合出力にパッケージ名 steeleye-lkgui が表示されます SteelEye Protection Suite for Linux 177

メニューメニュー SteelEye LifeKeeper for Linux のメニューリソースのコンテキストメニューリソースのコンテキストメニューはステータスの表内にあるグローバル ( クラスタ全体の ) リソース ( 上図 ) またはサーバ固有のリソースインスタンス ( 下図 ) を右クリックしたときに表示されますデフォルトのリソースコンテキストメニューについてここで説明しますが

198 メニューメニュー SteelEye LifeKeeper for Linux のメニューリソースのコンテキストメニューリソースのコンテキストメニューはステータスの表内にあるグローバル ( クラスタ全体の ) リソース ( 上図 ) またはサーバ固有のリソースインスタンス ( 下図 ) を右クリックしたときに表示されますデフォルトのリソースコンテキストメニューについてここで説明しますがこのメニューは特定のリソースタイプについてカスタマイズされていることがありますこの場合メニューは該当するリソースキットのドキュメンテーションで説明されています選択したリソースについて動作が呼び出されます特定のサーバ上にあるリソースインスタンスを選択した場合そのサーバについて動作が呼び出されます一方グローバル ( クラスタ全体の ) リソースを選択した場合はサーバを選択する必要があります In Service - リソース階層を in service にします Out of Service - リソース階層を out of service にします 178 User Guide

199 サーバのコンテキストメニュー Extend Resource Hierarchy - フェイルオーバをサポートするためにリソース階層を別のサーバに拡張します Unextend Resource Hierarchy -1 台のサーバから拡張リソース階層を削除します Create Dependency -2 つのリソース間に親 / 子の関係を作成します Delete Dependency -2 つのリソース間にある親 / 子の関係を削除します Delete Resource Hierarchy - リソース階層を LifeKeeper クラスタ内のすべてのサーバから削除します Properties -[Resource Properties] ダイアログを表示しますサーバのコンテキストメニューサーバのコンテキストメニューはステータスの表内にあるサーバアイコンを右クリックしたときに表示されますこのメニューは [Edit] メニューの [Server] サブメニューと同じですが動作は常に最初に選択したサーバ上で呼び出される点が異なります Disconnect -クラスタから切断します Refresh -GUI を最新情報に更新します View Logs - 接続しているサーバについて LifeKeeper のログメッセージを表示します Create Resource Hierarchy -リソース階層を作成します Create Comm Path -サーバ間にコミュニケーションパスを作成します Delete Comm Path -サーバからコミュニケーションパスを削除します Properties -[Server Properties] ダイアログを表示します SteelEye Protection Suite for Linux 179

200 [File] メニュー [File] メニュー Connect - LifeKeeper クラスタに接続します LifeKeeper クラスタ内の各サーバに接続するにはそのサーバでログイン認証が必要です Exit - すべてのサーバから切断し GUI のウィンドウを閉じます [Edit] メニュー - [Resource] In Service - リソース階層を in service にします Out of Service - リソース階層を out of service にします Extend Resource Hierarchy - フェイルオーバをサポートするためにリソース階層を別のサーバに拡張します Unextend Resource Hierarchy - 1 台のサーバから拡張リソース階層を削除します Create Dependency - 2 つのリソース間に親 / 子の関係を作成します Delete Dependency - 2 つのリソース間にある親 / 子の関係を削除します Delete Resource Hierarchy - リソース階層を LifeKeeper クラスタ内のすべてのサーバから削除します Properties - [Resource Properties] ダイアログを表示します 180 User Guide

[Edit] メニュー - [Server] [Edit] メニュー - [Server] Disconnect - クラスタから切断します Refresh - GUI を最新情報に更新します View Logs - 接続しているサーバについて LifeKeeper のログメッセージを表示します Create Resource Hierarchy - リソース階層を作成します Create

201 [Edit] メニュー - [Server] [Edit] メニュー - [Server] Disconnect - クラスタから切断します Refresh - GUI を最新情報に更新します View Logs - 接続しているサーバについて LifeKeeper のログメッセージを表示します Create Resource Hierarchy - リソース階層を作成します Create Comm Path - サーバ間にコミュニケーションパスを作成します Delete Comm Path - サーバからコミュニケーションパスを削除します Properties -[Server Properties] ダイアログを表示します [View] メニュー Global Toolbar - チェックボックスがオンの場合このコンポーネントを表示します Message Bar - チェックボックスがオンの場合このコンポーネントを表示します SteelEye Protection Suite for Linux 181

202 [Help] メニュー Properties Panel - チェックボックスがオンの場合このコンポーネントを表示します Output Panel - チェックボックスがオンの場合このコンポーネントを表示します Options - GUI の表示プロパティを編集します History - メッセージバーに表示された最新メッセージを LifeKeeper の GUI の [Message History] ダイアログボックスに表示します ( 最大 1000 行 ) Expand Tree - リソース階層ツリー全体を展開します Collapse Tree - リソース階層ツリー全体を折り畳みます [Help] メニュー Technical Documentation - SIOS Technology Corp. のテクニカルドキュメンテーションの開始ページを表示します About... - LifeKeeper GUI のバージョン情報を表示しますツールバー SteelEye LifeKeeper for Linux のツールバー GUI のツールバーこのツールバーはプロパティパネルに表示されるデフォルトのサーバとリソースのコンテキストツールバーを組み合わせたものですがこのツールバーから動作を実行するときにはサーバとリソースを選択する必要があります Connect -LifeKeeper クラスタに接続します 182 User Guide

203 GUI のツールバー Disconnect -LifeKeeper クラスタから切断します Refresh -GUI を最新情報に更新します View Logs - 接続しているサーバについて LifeKeeper のログメッセージを表示します Create Resource Hierarchy - リソース階層を作成します Delete Resource Hierarchy - リソース階層を LifeKeeper クラスタ内のすべてのサーバから削除します Create Comm Path - サーバ間にコミュニケーションパスを作成します Delete Comm Path - サーバからコミュニケーションパスを削除します In Service - リソース階層を in service にします Out of Service - リソース階層を out of service にします Extend Resource Hierarchy - フェイルオーバをサポートするためにリソース階層を別のサーバに拡張します Unextend Resource Hierarchy -1 台のサーバから拡張リソース階層を削除します SteelEye Protection Suite for Linux 183

204 リソースのコンテキストツールバー Create Dependency -2 つのリソース間に親 / 子の関係を作成します Delete Dependency -2 つのリソース間にある親 / 子の関係を削除します Migrate Hierarchy to Multi-Site Cluster - 既存の階層を Multi-Site Cluster 環境に移行しますリソースのコンテキストツールバーステータスの表からサーバ固有のリソースインスタンスを選択するとプロパティパネルにリソースのコンテキストツールバーが表示されます選択したサーバとリソースについて動作が呼び出されます灰色表示のリソースについて動作を選択することはできません In Service - リソース階層を in service にします Out of Service - リソース階層を out of service にします Extend Resource Hierarchy - フェイルオーバをサポートするためにリソース階層を別のサーバに拡張します Unextend Resource Hierarchy -1 台のサーバから拡張リソース階層を削除します Add Dependency - 2 つのリソース間に親 / 子の関係を作成します 184 User Guide

205 サーバのコンテキストツールバー Remove Dependency - 2 つのリソース間にある親 / 子の関係を削除します Delete Resource Hierarchy - リソース階層をすべてのサーバから削除しますサーバのコンテキストツールバーステータスの表からサーバを選択するとプロパティパネルにサーバのコンテキストツールバーが表示されます選択したサーバについて動作が呼び出されます Disconnect -LifeKeeper クラスタから切断します Refresh -GUI を最新情報に更新します View Logs - 接続しているサーバについて LifeKeeper のログメッセージを表示します Create Resource Hierarchy - リソース階層を作成します Delete Resource Hierarchy - リソース階層を LifeKeeper クラスタ内のすべてのサーバから削除します Create Comm Path - サーバ間にコミュニケーションパスを作成します Delete Comm Path - サーバからコミュニケーションパスを削除します SteelEye Protection Suite for Linux 185

206 GUI の実行の準備 GUI の実行の準備 LifeKeeper の GUI - 概要 LifeKeeper の GUI は Java テクノロジを使用して LifeKeeper およびその設定データとのグラフィカルなステータスのインターフェースを提供します LifeKeeper の GUI はクライアント / サーバアプリケーションなのでユーザはクライアントシステムでグラフィカルユーザインターフェースを実行して LifeKeeper が動作中のサーバシステムの監視や管理を行いますクライアントとサーバは同一システム上にある場合もない場合もありますクラスタマシンの必要なグループメンバシップをユーザが持っている限り LifeKeeper の GUI を使用することで任意のマシンから任意のクラスタ内のサーバとリソースの管理操作または監視ができます ( 詳細については GUI のユーザの設定を参照 ) LifeKeeper GUI のサーバとクライアントのコンポーネントについて説明します GUI サーバシステムの起動時に LifeKeeper クラスタ内の各サーバで LifeKeeper GUI サーバが初期化されます LifeKeeper GUI サーバは Java ネイティブインターフェース (JNI) 経由で LifeKeeper Core ソフトウェアとリモートメソッド呼び出し (RMI) を使用して LifeKeeper GUI と通信します GUI クライアント LifeKeeper GUI クライアントは Linux システム上のアプリケーションとしてまたは Windows や Unix システム上の Web ブラウザから呼び出し可能なアプレットとして動作するように設計されています LifeKeeper GUI クライアントには以下のグラフィカルコンポーネントがあります左上のステータスの表には接続しているサーバとそのリソースの上位のステータスが表示されます右上のプロパティパネルにはステータスの表で直前に選択したオブジェクトの詳細情報が表示されます下部の出力パネルにはコマンドの出力が表示されますウィンドウの最下部にあるメッセージバーには処理のステータスメッセージが表示されますサーバのコンテキストツールバーとリソースのコンテキストツールバー ( プロパティパネル内 ) およびグローバルツールバーからは頻繁に使用する作業に即座にアクセスできますサーバのコンテキストメニューとリソースのコンテキストメニュー ( ポップアップ ) およびグローバルメニュー ([File] [Edit Server] [Edit Resource] {View] および [Help}) からはすべての作業にアクセスできますグラフィックのリソースサーバまたは表のセルを右クリックするとコンテキストメニューが表示されますまた多くの作業はこれらのコンテキストメニューから開始できますこの場合リソースとサーバは自動的に指定されます 186 User Guide

207 GUI クライアントの開始 GUI クライアントの開始 LifeKeeper GUI アプレットの開始 Web から LifeKeeper GUI アプレットを実行するには好みの Web ブラウザを開き URL name>:81 (<server name> は LifeKeeper サーバの名前 ) に移動しますこれによりそのマシン上にある LifeKeeper GUI サーバから LifeKeeper GUI アプレットがロードされますロードの完了後 [Cluster Connect] ダイアログが表示されますこのダイアログで任意の GUI サーバに接続できます注記 : アプレットの実行時に必須の Java プラグインがシステムにない場合プラグインをダウンロードする Web サイトが自動的に表示されますまた Java を有効にするようにブラウザのセキュリティパラメータを設定する必要がありますパラメータが設定済みでもクライアントがロードされない場合は GUI のトラブルシューティングを参照してくださいアプリケーションクライアントの開始ある LifeKeeper サーバで管理者権限を持つユーザはそのサーバからアプリケーションクライアントを実行できます LifeKeeper GUI アプリケーションを開始するにはグラフィカルウィンドウから /opt/lifekeeper/bin/lkguiapp を実行してくださいこの操作を実行してもクライアントがロードされない場合は GUI のトラブルシューティングを参照してください GUI クライアントの終了 [File] メニューから [Exit] を選択するとすべてのサーバから切断されクライアントが終了します LifeKeeper の GUI の設定 GUI 管理用の LifeKeeper サーバの設定各 LifeKeeper サーバについて以下の手順を実行してください各手順には詳細手順の参照先またはリンクがあります 1. 各サーバに Java 実行時環境 (JRE) または Java ソフトウェア開発キット (JDK) をインストールする必要があります必要な Java のバージョンと必要なダウンロードにアクセスするための URL については SPS for Linux リリースノートを参照してください注記 : JRE は SPS のインストールイメージファイルから設定スクリプトを実行し JRE のインストールのみを選択することでインストールできます ( 詳細については SPS for Linux インストールガイドを参照 ) 2. 各サーバで LifeKeeper GUI サーバを開始してください (GUI サーバの開始 / 停止を参照 ) 注記 : GUI サーバが後続の初期インストールを開始した後 LifeKeeper の開始と停止は GUI サーバを含む LifeKeeper のすべてのデーモンプロセスの開始と停止を行います 3. root 以外のユーザに GUI の使用を許可するように計画している場合は GUI ユーザの設定が必要です SteelEye Protection Suite for Linux 187

208 GUI の実行 GUI の実行 LifeKeeper の GUI は以下の場所で実行できますクラスタ内の LifeKeeper サーバクラスタ外のリモートシステム LifeKeeper クラスタ内のサーバで GUI の設定と実行を行う方法については LifeKeeper サーバでの GUI の実行を参照してください LifeKeeper クラスタ外のリモートシステムで GUI の設定と実行を行う方法についてはリモートシステムでの GUI の実行を参照してください GUI の設定項目 GUI のクライアントとサーバの通信 GUI サーバの Java プラットフォーム Java リモートオブジェクトレジストリのサーバポート説明 LifeKeeper GUI のクライアントとサーバは通信に Java のリモートメソッド呼び出し (RMI) を使用します RMI が正しく動作するためにはクライアントとサーバは解決可能なホスト名または IP アドレスを使用する必要があります DNS が実装されていない場合 ( または他の名前のルックアップメカニズムを使用して名前が解決できない場合 ) はクライアントとサーバのそれぞれについて /etc/hosts ファイルを編集し他のすべての LifeKeeper サーバの名前とアドレスを含めてください LifeKeeper GUI サーバには Java 実行時環境 (JRE) - Java 仮想マシン Java プラットフォームのコアクラスおよびサポートするファイル - をインストールする必要があります JRE 5.0 for Linux は SPS for Linux のインストールイメージファイルにあります (SPS for Linux インストールガイドを参照 ) またはから直接ダウンロードすることもできます注記 : デフォルトでは LifeKeeper GUI サーバは JRE が各サーバのディレクトリ /usr/java/j2re1.5.0_07 にインストールされていると予測します JRE が見つからない場合 GUI サーバはディレクトリ /usr/java/j2sdk1.5.0_07 から Java ソフトウェア開発キット (JDK) を探します JRE または JDK を別のディレクトリの場所で使用する場合は LifeKeeper のデフォルトファイル /etc/default/lifekeeper の PATH を編集し Java インタープリタ java.exe を持つディレクトリを含めてくださいこのファイルの編集時に LifeKeeper が実行中である場合は変更内容を認識させるために LifeKeeper GUI サーバを停止し再起動する必要があります再起動しない場合 LifeKeeper GUI は Java コマンドを見つけることができません LifeKeeper GUI サーバは各 LifeKeeper サーバ上の Java リモートオブジェクトレジストリ用にポート 82 を使用しますこれによりサーバは典型的なファイアウォールの後にあるクライアントからの RMI 呼び出しをサポートできます 188 User Guide

209 GUI の制限 LifeKeeper の管理 Web サーバ GUI クライアントのネットワークアクセス LifeKeeper GUI サーバにはクライアントのブラウザの通信用に管理 Web サーバが必要です現在 LifeKeeper GUI サーバは管理 Web サーバとして lighttpd Web サーバのプライベートコピーを使用していますこの Web サーバは steeleye-lighttpd パッケージによりインストールと設定が実行され他の Web サーバとの競合を避けるためにポート 81 を使用します LifeKeeper GUI クライアントには LifeKeeper クラスタ内のすべてのホストへのネットワークアクセスが必要です LifeKeeper GUI クライアントをブラウザ内で実行する場合アプレットへのネットワークアクセスを可能にするためにセキュリティレベルを低下させる必要がありますセキュリティを低い値に設定した状態で他のサイトを閲覧しないように注意してください ( つまりイントラネットまたは信頼できるサイトについてのみセキュリティ設定を変更する ) GUI の制限項目 GUI の相互運用性の制限説明 LifeKeeper for Linux クライアントは Linux サーバ上の LifeKeeper の管理にのみ使用できます LifeKeeper for Linux の GUI と LifeKeeper for Windows は同時には使用できません GUI サーバの開始 / 停止 LifeKeeper GUI サーバを開始するには LifeKeeper GUI サーバが動作していない場合は root として以下のコマンドを入力してください /opt/lifekeeper/bin/lkguiserver start このコマンドは管理しているサーバで LifeKeeper GUI サーバのデーモンプロセスが現在動作していない場合それらのデーモンプロセスをすべて開始します以下のようなメッセージが表示されます # Installing GUI Log # LK GUI Server Startup at: # Mon May 8 14:14:46 EDT 2006 # LifeKeeper GUI Server Startup completed at: # Mon May 8 14:14:46 EDT 2006 LifeKeeper GUI サーバが開始した後以降の LifeKeeper の開始操作はすべて LifeKeeper GUI サーバのプロセスを自動的に開始しますトラブルシューティング LifeKeeper GUI は各サーバのポート 81 を管理 Web サーバ用にポート 82 を Java リモートオブジェクトレジストリに使用します他のアプリケーションがそれらのポートを使用している場合 LifeKeeper GUI SteelEye Protection Suite for Linux 189

210 LifeKeeper GUI サーバを停止するにはは正しく機能しませんこれらの値はファイル /etc/default/lifekeeper の以下のエントリを編集することにより変更できます GUI_WEB_PORT=81 GUI_RMI_PORT=82 注記 : これらのポートの値は起動時に GUI サーバで初期化されますポートの値を変更した場合 GUI サーバを停止し再起動する必要がありますこれらの値は接続するすべてのクラスタ全体で同一である必要があります LifeKeeper GUI サーバを停止するには LifeKeeper GUI サーバが動作している場合は root として以下のコマンドを入力してください /opt/lifekeeper/bin/lkguiserver stop このコマンドは管理しているサーバで LifeKeeper GUI サーバのデーモンプロセスが現在動作している場合それらのデーモンプロセスをすべて停止します以下のメッセージが表示されます # LifeKeeper GUI Server Shutdown at: # Fri May 19 15:37:27 EDT 2006 # LifeKeeper GUI Server Shutdown Completed at: # Fri May 19 15:37:28 EDT 2006 LifeKeeper GUI サーバのプロセス LifeKeeper GUI サーバが動作していることを確認するには以下のコマンドを入力してください ps -ef grep runguiser 以下のような出力が表示されます root :24? 00:00:00 sh/opt/lifekeeper/bin/runguiser 現在動作している他の GUI サーバのデーモンプロセスのリストを表示するには以下のコマンドを入力してください ps -ef grep S_LK 以下のような出力が表示されます root Oct16? 00:00:00/usr/jre1.2.2/bin/i386/green_threads/rmiregistry -J-DS_ LK=true 82 root Oct16? 00:00:00/usr/jre1.2.2/bin/i386/green_threads/java -DS_LK=true - 0ss3m -ss3m-dcom.steeleye.li GUI ユーザの設定 GUI ユーザには 3 つのクラスがありそれぞれ権限が異なります 190 User Guide

211 GUI ユーザの設定 1. クラスタ全体にわたって Administrator ( 管理者 ) の権限を持つユーザは GUI から可能な動作のすべてを実行できます 2. 1 台のサーバ上で Operator ( オペレータ ) の権限を持つユーザは LifeKeeper の設定やステータスの情報を表示できそのサーバ上のリソースを in service または out of service にすることができます 3. 1 台のサーバ上で Guest ( ゲスト ) の権限を持つユーザはそのサーバの LifeKeeper の設定やステータスの情報を表示できます GUI サーバは root として起動する必要があります GUI パッケージのインストール時に root のログインとパスワードのエントリが Administrator の権限付きで GUI パスワードファイルに自動設定されるので root はそのサーバから GUI アプリケーションまたは Web クライアント経由で LifeKeeper のすべての作業を実行できます root 以外のユーザに LifeKeeper GUI クライアントの使用を許可するように計画している場合は LifeKeeper GUI のユーザを設定する必要があります最良の方法は常にクラスタ全体を単位として許可を付与することですサーバ単位で許可を付与することもできますがユーザを混乱させてしまい管理作業が実行できなくなりますユーザ管理は以下に示すようにコマンドラインインターフェースから lkpasswd を使用して実行します特記ない限りすべてのコマンドでユーザのパスワードを 2 回入力する必要があります変更内容はユーザの次回のログイン時または GUI サーバの再起動時 ( いずれかの早い時点 ) で有効になります各ユーザは 1 台のサーバにつき権限を 1 つ持ちますサーバで新しい権限が指定された場合以前の権限エントリは削除されますユーザに LifeKeeper GUI の Administrator 権限を付与するには以下のコマンドを入力してください /opt/lifekeeper/bin/lkpasswd -administrator <user> ユーザに LifeKeeper GUI の Operator 権限を付与するには以下のコマンドを入力してください /opt/lifekeeper/bin/lkpasswd -operator <user> ユーザに LifeKeeper GUI の Guest 権限を付与するには以下のコマンドを入力してください /opt/lifekeeper/bin/lkpasswd -guest <user> ユーザの権限レベルを変更せずに既存のユーザのパスワードを変更するには以下のコマンドを入力してください /opt/lifekeeper/bin/lkpasswd <user> 既存のユーザに LifeKeeper GUI の使用を禁止するには以下のコマンドを入力してください /opt/lifekeeper/bin/lkpasswd -delete <user> このコマンドではパスワードを入力する必要はありません注記 : これらのコマンドは管理しているサーバでのみ GUI パスワードファイルを更新します LifeKeeper クラスタ内のすべてのサーバでコマンドを繰り返し入力する必要があります SteelEye Protection Suite for Linux 191

212 Java のセキュリティポリシー Java のセキュリティポリシー LifeKeeper の GUI はポリシーベースのアクセス制御を使用します GUI クライアントのロード時に現在有効なセキュリティポリシーに基づいて権限が GUI クライアントに割り当てられますポリシーはさまざまな署名者 / 場所からのコードに提供される権限を指定し外部から設定可能なポリシーファイルから初期化されますデフォルトではシステム全体のポリシーファイルとオプションのユーザポリシーファイルが 1 つずつありますシステム全体でコードに権限を付与するシステムポリシーファイルが先にロードされ次にユーザポリシーファイルが追加されます LifeKeeper GUI がアプリケーションとして起動される場合はこれらのポリシーファイルに加えて LifeKeeper GUI のポリシーファイルもロードされることがありますポリシーファイルの場所デフォルトではシステムポリシーファイルは以下の場所にあります <JAVA.HOME>/lib/security/java.policy (Linux) <JAVA.HOME>\lib\security\java.policy (Windows) 注記 : JAVA.HOME はシステムのプロパティ JAVA.HOME の値を指し JRE または JDK がインストールされたディレクトリの場所を指定しますユーザポリシーファイルは. の文字で始まりデフォルトでは以下の場所にあります <USER.HOME>\.java.policy 注記 : USER.HOME はシステムのプロパティ user.home の値を指しユーザのホームディレクトリを指定します例えば Windows NT ワークステーション上にあるユーザ Paul のホームディレクトリは paul.000 です Windows システムの場合 user.home のプロパティ値のデフォルト値は以下のとおりです C:\WINNT\Profiles\<USER> ( マルチユーザ Windows NT システム ) C:\WINDOWS\Profiles\<USER> ( マルチユーザ Windows 95/98 システム ) C:\WINDOWS ( シングル - ユーザ Windows 95/98 システム ) デフォルトでは LifeKeeper GUI のポリシーファイルは以下の場所にあります /opt/lifekeeper/htdoc/java.policy (Linux) ポリシーファイルの作成と管理デフォルトでは LifeKeeper GUI がアプリケーションとして起動される場合に LifeKeeper GUI のポリシーファイルが使用されます LifeKeeper GUI をアプレットとして実行する場合ホームディレクトリにユーザポリシーファイルを作成する必要があります ( 存在しない場合 ) ユーザポリシーファイルは LifeKeeper GUI を実行するために必要な最低限の権限を指定する必要がありますこのトピックのポリシーファイルの例セクションで後述します 192 User Guide

213 ポリシーファイルでの権限の付与ポリシーファイルの作成と管理は単純なテキストエディタまたは Java 実行時環境 (JRE) や Java 開発キット (JDK) に含まれるグラフィカルな Policy Tool ユーティリティから行うことができます Policy Tool を使用すると入力が簡略化されポリシーファイルに必要な構文の知識が不要になります Policy Tool の使用方法の詳細についてはにある Policy Tool のドキュメンテーションを参照してください LifeKeeper GUI を実行するために必要な最低限の権限を持つユーザポリシーファイルを作成する最も簡単な方法は /opt/lifekeeper/htdoc/java.policy にある LifeKeeper GUI のポリシーファイルをホームディレクトリにコピーしファイル名を.java.policy に変更することです ( ファイル名の前にあるドットは必須 ) Windows システムではファイル name>:81/java.policy (<server name> は LifeKeeper サーバのホスト名 ) を開いてホームディレクトリに.java.policy の名前を付けて保存することで LifeKeeper GUI のポリシーファイルをコピーできますユーザポリシーファイルの正しい場所を特定する必要がある場合は Java のコントロールパネルを使用して Java コンソールを有効にし LifeKeeper GUI をアプレットとして起動しますユーザポリシーファイルのホームディレクトリのパスが Java コンソールに表示されますポリシーファイルでの権限の付与権限はシステムリソースへのアクセスを表しますアプレットにリソースへのアクセスを許可するには対応する権限をアクセスを試行するコードに明示的に付与する必要があります権限は通常名前を持ち ( ターゲット名として参照される ) 場合によっては 1 つ以上の動作を含むカンマ区切りリストを持ちます例えば以下のコードは /tmp ディレクトリのファイル abc に対する読み取りアクセスを表す FilePermission オブジェクトを作成します perm = new java.io.filepermission("/tmp/abc","read"); この例ではターゲット名は /tmp/abc 動作文字列は read ですポリシーファイルは指定したコードソースからのコードに許可する権限を指定しますこの例で /home/sysadmin ディレクトリのコードにファイル /tmp/abc への読み取りアクセスを付与するポリシーファイルのエントリは以下のとおりです grant codebase "file:/home/sysadmin/" { permissionjava.io.filepermission "/tmp/abc", "read"; }; ポリシーファイルの例このポリシーファイルの例には LifeKeeper GUI の実行に必要な最小限の権限がありますこのポリシーファイルは LifeKeeper GUI パッケージにより /opt/lifekeeper/htdoc/java.policy にインストールされます /* * Permissions needed by the LifeKeeper GUI. You may want to * restrict this by codebase. However, if you do this, remember * that the recovery kits can have an arbitrary jar component * with an arbitrary codebase, so you'll need to alter the grant * to cover these as well. */ grant { SteelEye Protection Suite for Linux 193

214 Java プラグイン /* * Need to be able to do this to all machines in the * LifeKeeper cluster. You may restrict the network * specification accordingly. */ permission java.net.socketpermission"*", "accept,connect,resolve"; /* * We use URLClassLoaders to get remote properties files and * jar pieces. */ permission java.lang.runtimepermission"createclassloader"; /* * The following are needed only for the GUI to run as an * application (the default RMI security manager is more * restrictive than the one a browser installs for its * applets. */ permission java.util.propertypermission "*","read"; permission java.awt.awtpermission "*"; permission java.io.filepermission "<<ALL FILES>>","read,execute"; }; Java プラグイン使用しているブラウザに関係なく ( サポートするブラウザを参照 ) ブラウザが初めて LifeKeeper GUI のロードを試行するときには Java プラグインソフトウェアを自動ダウンロードするか Java プラグインソフトウェアのダウンロードとインストールを行う Web ページを表示しますその後は Java プラグインソフトウェアのテクノロジをサポートする Web ページに遭遇するたびにブラウザは Java プラグインソフトウェアを自動的に起動します Java プラグインのダウンロード Java プラグインソフトウェアは Solaris Linux および Windows の Java 実行時環境 (JRE) の一部として含まれています JRE のダウンロードにはお使いのネットワークとシステム設定のサイズにより合計で 3 ~ 10 分かかりますダウンロードの Web ページには JRE と Java プラグインソフトウェアについての詳細なドキュメンテーションとインストール手順があります注記 1: プラグインのインストール後およびプラグインのプロパティを変更するたびにブラウザを閉じて再起動する必要があります注記 2: LifeKeeper は Java プラグインのバージョン 1.3.x 以降のみをサポートしています Java プラグインのトラブルシューティング Netscape 6/7 Mozilla 1.x または Firefox 1.x を使用している場合 Netscape Mozilla または Firefox のプラグインのディレクトリに $JAVAHOME ディレクトリの libjavaplugin_oji.so ファイルのパスへのシンボリックリンクの作成が必要になることがあります 194 User Guide

215 リモートシステムでの GUI の実行例 (Firefox 1.5 と jre 1.5): cd /usr/lib/mozilla//plugins ln -s/usr/java/jre1.5.0_07/plugin/i386/ns7/libjavaplugin_oji.so Netscape 4 で Java プラグインを含む Java 実行時環境をインストールしたにもかかわらずブラウザが Java プラグインを検出しない場合は NPX_PLUGIN_PATH 環境変数を Java プラグインの場所 (javaplugin.so ファイルがある場所 ) に設定してくださいつまり NPX_PLUGIN_ PATH=$JAVAHOME/jre/plugin/i386/ns4 をエクスポートしてください ($JAVAHOME は Java 実行時環境をインストールした最上位のディレクトリ ) Java プラグインは Java 2 SDK 標準エディション v1.3 のセキュリティモデルをサポートしていますアプレットはすべて標準アプレットセキュリティマネージャの下で実行されます詳細については Java のセキュリティの FAQ または GUI アプレットを使用するためのブラウザのセキュリティパラメータの設定を参照してください一部のプラットフォーム / ブラウザの組み合わせでは Java プラグインソフトウェアが LifeKeeper の GUI にある Java コンポーネント ( スクロールバーツールバーメニューなど ) の表示と動作に影響しますこれらの多くの状況では回避策としてウィンドウのサイズを変更したり最小化 / 最小化解除 ( 強制再表示 ) したりすると問題が解決しますリモートシステムでの GUI の実行 LifeKeeper GUI を Java アプレットとして実行することにより LifeKeeper クラスタ外の Linux Unix または Windows のシステムから LifeKeeper の管理ができますこの環境での GUI の設定と実行について説明しますリモートシステムでの GUI の設定リモートの Linux Unix または Windows のシステムで LifeKeeper GUI を実行するには使用するブラウザが JDK 1.6 アプレットをフルにサポートする必要があります LifeKeeper GUI をサポートするプラットフォームとブラウザの詳細については SPS for Linux リリースノートを参照してください 1. LifeKeeper GUI をアプレットとして実行する場合ホームディレクトリにユーザポリシーファイルを作成する必要があります ( 存在しない場合 ) ユーザポリシーファイルには LifeKeeper GUI の実行に必要な最小限の権限を指定する必要があります LifeKeeper GUI を実行するために必要な最小限の権限を持つユーザポリシーファイルを作成する最も簡単な方法は /opt/lifekeeper/htdoc/java.policy にある LifeKeeper GUI のポリシーファイルをホームディレクトリにコピーしファイル名を.java.policy に変更します ( ファイル名の前にあるドットは必須 ) Windows システムではファイル name>:81/java.policy (<servername> は LifeKeeper サーバのホスト名 ) を開いてホームディレクトリに.java.policy の名前を付けて保存することで LifeKeeper GUI のポリシーファイルをコピーできますユーザポリシーファイルの正しい場所を特定する必要がある場合は Java のコントロールパネルを使用して Java コンソールを有効にし LifeKeeper GUI をアプレットとして起動しますユーザポリシーファイルのホームディレクトリのパスが Java コンソールに表示されますユーザポリシーファイルがすでにある場合は LifeKeeper サーバの SteelEye Protection Suite for Linux 195

216 リモートシステムでの GUI の実行 /opt/lifekeeper/ htdoc/java.policy に指定されている必須エントリを単純なテキストエディタを使用して既存のファイルに追加できます詳細については Java のセキュリティポリシーを参照してください 2. ブラウザのセキュリティパラメータを低に設定する必要がありますこの設定では通常 Java と Java アプレットが有効になりますさまざまなブラウザとバージョンが存在するのでブラウザのセキュリティパラメータの設定手順は GUI アプレットを使用するためのブラウザのセキュリティパラメータの設定で説明しています注記 : セキュリティを低く設定した状態で外部サイトを閲覧するときには注意が必要です 3. GUI を初めて実行するときに Netscape または Internet Explorer を使用しかつ必要な Java プラグインがシステムにない場合プラグインをダウンロードする Web サイトが自動的に表示されることがあります必要な Java プラグインのバージョンとダウンロードにアクセスするための URL については SPS for Linux リリースノートを参照してくださいリモートシステムでの GUI の実行上記の作業を完了するとリモートシステムで LifeKeeper GUI を Java アプレットとして実行できます 1. LifeKeeper GUI の Web ページの URL name>:81 (<server name> は LifeKeeper の名前 ) を開いてくださいこの Web ページには LifeKeeper のスプラッシュ画面とアプレットがあります Web ページが開くと以下の動作が実行されますスプラッシュ画面が表示されるアプレットがロードされる Java 仮想マシンが開始される一部のサーバファイルがダウンロードされるアプレットが初期化されるネットワークとシステムの設定によってはこれらの動作に最大 20 秒かかることがあります通常アプレットのロード時と初期化時にブラウザには最小のステータスがいくつか表示されますすべてのものが正しくロードされた場合アプレット領域に [Start] ボタンが表示されますスプラッシュ画面に [Start] ボタンが表示されない場合またはアプレットのロードと初期化が失敗した疑いがある場合はアプレットのトラブルシューティングまたはネットワークに関するトラブルシューティングを参照してください 2. 要求されたら [Start] をクリックしてください LifeKeeper の GUI が表示され [Cluster Connect] ダイアログが自動的に表示されますサーバが開始されクラスタへの接続が確立した後 GUI のウィンドウに接続しているサーバにより保護されているリソースとステータスがグラフィックで表示されます GUI のメニューとツールバーのボタンから LifeKeeper の管理機能を使用できます注記 : 一部のブラウザではアプレットで作成されたウィンドウとダイアログに Warning: Applet Window が表示されますこれは通常の動作であり無視できますアプレットのトラブルシューティングアプレットのロードと初期化に失敗した疑いがある場合は以下の操作を試してください 196 User Guide

217 LifeKeeper サーバでの GUI の実行 1. アプレットが失敗したことを確認してください通常アプレットの状態を示すブラウザウィンドウ内にメッセージが出力されます Netscape と Internet Explorer ではテキストのステータスに加えてアプレットの代わりにアイコンが表示されることがありますアイコンをクリックすると失敗の内容が表示される場合があります 2. Java プラグインをインストールしていることを確認してください問題が Java プラグインに関連する場合は Java プラグインのトピックを参照してください 3. ブラウザの設定要件特にセキュリティ設定を満たしていることを確認してください詳細については GUI アプレットを使用するためのブラウザのセキュリティパラメータの設定を参照してください設定について明らかな間違いが見つからない場合は次の手順に進んでください 4. Java コンソールを開いてください Firefox Netscape および旧バージョンの Internet Explorer の場合はマシンのコントロールパネルから Java プラグインアプレットを実行しコンソールを表示するオプションを選択してからブラウザを再起動してください最新バージョンの Internet Explorer の場合は [Tools] > [Sun Java Console] を選択してください [Sun Java Console] のメニュー項目が表示されない場合は [Tools] > [Manage Add-Ons] を選択しコンソールを有効にしてくださいその後コンソールを表示するにはブラウザの再起動が必要になることがあります Mozilla の場合は [Tools] > [Web Development] > [Sun Java Console] を選択してください 5. URL name>:81 を再度開いて GUI アプレットを開始してください Java プラグインのコンソールパネルを変更した場合はブラウザを再起動してください 6. コンソールに表示されたメッセージを確認してくださいメッセージは問題の解決に役立ちます問題がネットワークに関連する場合はネットワークに関するトラブルシューティングを参照してください LifeKeeper サーバでの GUI の実行 LifeKeeper GUI を実行する最も簡単な方法は LifeKeeper サーバでアプリケーションとして実行することですこれは実際には同一システム上で GUI のクライアントとサーバを実行することです 1. GUI 管理用の LifeKeeper サーバを設定した後 root として以下のコマンドを入力することによりサーバ上で GUI をアプリケーションとして実行できます /opt/lifekeeper/bin/lkguiapp 2. lkguiapp スクリプトが適切な環境変数を設定してアプリケーションを開始しますアプリケーションのロード時に LifeKeeper のアプリケーション指定ダイアログまたはスプラッシュ画面が表示されます 3. アプリケーションのロード後 LifeKeeper の GUI が表示され [Cluster Connect] ダイアログが自動的に表示されます接続先のサーバ名およびログインとパスワードを入力してください 4. クラスタへの接続が確立した後 GUI のウィンドウに接続しているサーバにより保護されているリソースとステータスがグラフィックで表示されます GUI のメニューとツールバーのボタンから管理機能を使用できます SteelEye Protection Suite for Linux 197

218 GUI アプレットを使用するためのブラウザのセキュリティパラメータ GUI アプレットを使用するためのブラウザのセキュリティパラメータ警告 : セキュリティを低い値に設定した状態での他のサイトの閲覧には注意してください Netscape Navigator と Netscape Communicator 1. [Edit] メニューの [Preferences] を選択してください 2. [Preferences] ダイアログボックスの [Advanced Category] をダブルクリックしてください 3. [Enable Java] と [Enable Java Script] のオプションを選択してください 4. [OK] をクリックしてください Firefox 1. [Edit] メニューの [Preferences] を選択してください 2. [Preferences] ダイアログボックスの [Content] を選択してください 3. [Enable Java] と [Enable Java Script] のオプションを選択してください 4. [Close] をクリックしてください Internet Explorer セキュリティが最高の状態で Internet Explorer を使用するには以下の手順で LifeKeeper サーバを信頼済みサイトのゾーンに追加してください 1. [Tools] メニューの [Internet Options] をクリックしてください 2. [Security] タブをクリックしてください 3. [Trusted Sites] ゾーンを選択し [Custom Level] をクリックしてください 4. [Reset custom settings] の [Medium/Low] を選択し [Reset] をクリックしてください 5. [Sites] をクリックしてください 6. 接続する LifeKeeper サーバのサーバ名とポート番号を入力してください ( 例 : 以下の手順で行う別の方法 ( セキュリティが低くなる可能性がある ) もあります 1. [Tools] メニューの [Internet Options] をクリックしてください 2. [Internet] または [Local Intranet] を選択してください ( リモートシステムと LifeKeeper クラスタが同じイントラネット上に存在するかどうかによって異なる ) 3. [Security Level] バーを [Medium] ([Internet] を選択した場合 ) または [Medium-low] ([Local Intranet] を選択した場合 ) に調整してくださいこれらは各ゾーンのデフォルト設定です 4. [OK] をクリックしてください 198 User Guide

219 ステータスの表ステータスの表ステータスの表には接続しているサーバとそのリソースのステータスがグラフィック表示されます以下の項目が表示されます最も上の行に各サーバの状態左端の列に各リソースのグローバル ( サーバ全体での ) 状態と親 / 子の関係残りのセルに各サーバの各リソースの状態サーバとリソースの状態はグラフィックステキストおよび色を使用して表示されますサーバのテーブルの空白セルは特定のリソースがそのサーバで定義されていないことを示しますステータスの表でサーバまたはリソースを選択した場合その項目の詳細な状態の情報とコンテキスト依存ツールバーがプロパティパネルに表示されますまた任意の項目のセルを右クリックすることで該当するサーバのコンテキストメニューまたはリソースのコンテキストメニューをポップアップ表示できますステータスの表は 2 つのセクションに分かれています左右のセクションの境界を移動してそれらのセクションの相対サイズを変更できますまたステータスの表を折り畳んで階層ツリーの上位項目のみを表示できますツリーのリソース項目の折り畳み / 展開を実行すると表内にリストされる階層に対しても折り畳み / 展開が適用されますプロパティパネルプロパティパネルにはステータスの表から選択されたサーバまたはリソースのプロパティが表示されますプロパティパネルは [Server Properties] ダイアログまたは [Resource Properties] ダイアログと同じ機能を持ちさらに一般的に使用するコマンドに即座にアクセスできるコンテキスト依存ツールバーがありますこのパネルの上部にはサーバを選択した場合は server_name リソースを選択した場合は server_name: resource_name がキャプションとして表示されますプロパティパネルに表示されるコンテキスト依存ツールバーはサーバのコンテキストツールバーとリソースのコンテキストツールバーですサーバまたはリソースのツールバーもカスタマイズできますツールバーのカスタマイズの詳細については該当する Application Recovery Kit のドキュメンテーションを参照してくださいプロパティパネル下部にあるボタンは以下の機能を持ちます [Apply] ボタンはパネルの編集可能なプロパティに対する変更内容を適用しますこのボタンが有効になるのは編集可能なプロパティを変更した場合のみです [Reset] ボタンはサーバにすべてのプロパティの現在の値を照会しこれまで変更した内容を消去しますこのボタンは常に有効です [Help] ボタンはプロパティパネルのコンテキスト依存ヘルプを表示しますこのボタンは常に有効ですプロパティパネルのサイズを増減するにはパネルの左端にある境界を左右にスライドしてくださいこのパネルを開閉するには [View] メニューの [Properties Panel] チェックボックスを使用してください SteelEye Protection Suite for Linux 199

220 出力パネル出力パネル出力パネルは LifeKeeper GUI クライアントが送出したコマンドの出力を収集しますコマンドの実行開始時にタイムスタンプ付きのラベルが出力パネルに追加されそのラベルの下にそのコマンドの出力がすべて追加されます複数のコマンドを同時に実行する場合 ( 通常は異なるサーバ上 ) 各コマンドの出力が対応するセクションに送られ各コマンドの結果が見やすくなります出力パネルのサイズを増減するにはパネル上部にある境界を上下にスライドしてくださいこのパネルを開閉するには [View] メニューの [Output Panel] チェックボックスを使用してください出力パネルを閉じているときには各コマンドを開始するダイアログが表示されたままになりこのダイアログを閉じるまで出力がこのダイアログに表示されますそしてこのダイアログを閉じた後はコマンドの出力を確認できなくなります出力パネルを再び開いた後は LifeKeeper の GUI はデフォルトの動作に戻りますメッセージバーメッセージバーは [Status] ウィンドウの下に表示されますメッセージが 1 行のテキストで表示されます Connecting to Server X や Failure to connect to Server X などのメッセージが表示されますメッセージバーを非表示にするには [View] メニューの [Message Bar] チェックボックスをオフにしますメッセージバーを表示するには [View] メニューの [Message Bar] チェックボックスをオンにしますメッセージバーに表示されたメッセージの履歴を表示する方法についてはメッセージ履歴の表示を参照してください GUI の終了 [File] メニューから [Exit] を選択するとすべてのサーバから切断され GUI のウィンドウが閉じます共通の作業以下にすべてのユーザが実行できる基本作業を示します LifeKeeper の起動デフォルトではすべての SPS ソフトウェアはディレクトリ /opt/lifekeeper にインストールされますすべての確認作業が完了すると両方のサーバで LifeKeeper を起動する準備が整いますこのセクションでは LifeKeeper サーバデーモンプロセスの起動について説明します LifeKeeper GUI アプリケーションは別個のコマンドを使用して起動され LifeKeeper GUI の設定に説明されています LifeKeeper には LifeKeeper デーモンプロセスの起動と停止を行うコマンドラインインターフェースが用意されていますこれらのデーモンプロセスは LifeKeeper GUI を起動する前に実行する必要があります LifeKeeper サーバプロセスの起動 LifeKeeper がシステムで現在実行されていない場合はすべてのサーバに対するユーザルートとして次のコマンドを入力してください 200 User Guide

221 LifeKeeper の停止 /opt/lifekeeper/bin/lkstart 数秒の遅延の後情報メッセージが表示されます注記 : LifeKeeper を起動するときに LifeKeeper Distribution Enabling Package を参照するエラーメッセージが表示された場合は LifeKeeper インストールイメージファイルをインストール / 再インストールする必要があります lkstart コマンドの詳細についてはコマンドラインで man LCD を入力して LCD(1M) マニュアルページを参照してください LifeKeeper の停止 LifeKeeper を停止する必要がある場合はルートとして次のコマンドを入力して停止してください /opt/lifekeeper/bin/lkstop このコマンドは管理されているサーバ上で現在実行されているすべての LifeKeeper デーモンプロセスを停止します LifeKeeper プロセスの表示現在実行されているすべての LifeKeeper デーモンプロセスのリストを表示するには次のコマンドを入力してください ps -ef grep LifeKeeper 出力の例を以下に示します root :25?00:00:00 /opt/lifekeeper/bin/lcm root :25?00:00:00/opt/LifeKeeper/bin/ttymonlcm root :25?00:00:00/opt/LifeKeeper/bin/lcd root :25?00:00:00/opt/LifeKeeper/bin/lkcheck root :25?00:00:00/opt/LifeKeeper/bin/lkscsid root :26?00:00:00/opt/LifeKeeper/bin/lk_logmgr -1 注記 : 上記のコア LifeKeeper デーモンプロセスの他にも実行される追加の GUI サーバデーモンプロセスがあります GUI サーバに関連するプロセスのリストについては LifeKeeper GUI サーバプロセスの表示を参照してください LifeKeeper GUI サーバプロセスの表示 LifeKeeper GUI サーバが実行されていることを確認するには次のコマンドを入力してください ps -ef grep runguiser 次のような出力が表示されます root :24? 00:00:00 sh /opt/lifekeeper/bin/runguiser SteelEye Protection Suite for Linux 201

サーバのクラスタへの接続現在実行されているその他の GUI サーバデーモンプロセスのリストを表示するには次のコマンドを入力してください ps -efw grep S_LK 次のような出力が表示されます root 819 764 0 Oct16?00:00:00 java -Xint -Xss3M -DS_LK=true - Djava.rmi.server.

222 サーバのクラスタへの接続現在実行されているその他の GUI サーバデーモンプロセスのリストを表示するには次のコマンドを入力してください ps -efw grep S_LK 次のような出力が表示されます root Oct16?00:00:00 java -Xint -Xss3M -DS_LK=true - Djava.rmi.server.hostname=wake -Dcom.steeleye.LifeKeeper.rmiPort=82 -Dcom.steeleye.LifeKeeper.LKROOT=/opt/LifeKeeper -DGUI_RMI_ REGISTRY=internal -DGUI_WEB_PORT=81 com.steeleye.lifekeeper.beans.s_lk サーバのクラスタへの接続 1. 開始するには以下の 2 つの方法がありますグローバルツールバーの [Connect] ボタンをクリックする [File] メニューの [Connect] をクリックする 2. [Cluster Connect] ダイアログの [Server Name] フィールドに接続するクラスタ内のサーバ名を入力してください注記 : IPv6 アドレスを使用する場合はこのアドレスを大かっこ [ ] で囲む必要がありますこれによりマシンの IPv6 アドレス経由で接続を確立できます別の方法として名前をアドレスに割り当てることができその名前を使用して接続できます 3. [Login] と [Password] のフィールドに指定のサーバ上で LifeKeeper が認証に使用するユーザのログイン名とパスワードを入力してください 4. [OK] をクリックしてください GUI が正常に指定サーバに接続した場合 GUI は新しいサーバが検出されなくなるまでクラスタ内にあるすべての既知のサーバへの接続 ( およびステータス表示への追加 ) を継続します注記 : 最初のログイン名とパスワードがクラスタ内のサーバ上にあるクライアントで認証に失敗した場合そのサーバでの別のログイン名とパスワードを入力するように要求されます [Password] ダイアログ 202 User Guide

223 クラスタからの切断で [Cancel] を選択した場合サーバへの接続は中止され GUI はクラスタ内の残りのコンポーネントへの接続を継続しますクラスタからの切断この作業は選択したサーバ経由で GUI クライアントをクラスタ内のすべてのサーバから切断します 1. 開始するには以下の 3 つの方法がありますグローバルツールバーの [Disconnect] ボタンをクリックする [Edit] メニューの [Server] を選択し [Disconnect] をクリックするサーバのコンテキストツールバーが表示される場合はそこにある [Disconnect] ボタンをクリックする 2. [Cluster Disconnect] ダイアログの [Select Server in Cluster] リストから切断するクラスタ内のサーバ名を選択してください 3. [OK] をクリックしてくださいクラスタ内の全サーバのリストを持つ [Confirmation] ダイアログが表示されます 4. [Confirmation] ダイアログの [OK] をクリックしてクラスタ内の全サーバからの切断を確定してくださいクラスタからの切断後そのクラスタ内にあるすべてのサーバが GUI のステータス表示から消去されます接続サーバの表示サーバの状態は下図に示すように表内のサーバのグラフィック表示で表されますサーバアイコンが視覚的に示すサーバの状態の詳細についてはサーバの状態の表示を参照してくださいサーバのステータスの表示サーバの状態は下図に示すように表内のサーバのグラフィック表示で表されます SteelEye Protection Suite for Linux 203

224 サーバのプロパティの表示サーバの状態 ALIVE ALIVE 状態のシンボル意味クライアントはサーバに有効な接続を行うことができますこのサーバから ALIVE のリモートサーバへのコミュニケーションパスが ALIVE です DEAD とマークされたコミュニケーションパスおよび DEAD のサーバをターゲットとするコミュニケーションパスは無視されますこれは DEAD のサーバには DEAD のグラフィックで表されるからですクライアントはサーバに有効な接続を行うことができますこのサーバから指定リモートサーバへの 1 つ以上のコミュニケーションパスが DEAD ですこのサーバから指定リモートサーバへの間には冗長コミュニケーションパスが存在しません DEAD クラスタ内の他のサーバから DEAD として報告されました UNKNOWN ネットワーク接続が失われました最後に分かっている LifeKeeper の状態が ALIVE ですサーバのプロパティの表示 1. 開始するには以下の 2 つの方法がありますプロパティを表示するサーバのアイコンを右クリックしますサーバのコンテキストメニューが表示されたら [Properties] をクリックしますサーバのプロパティはサーバをクリックするとプロパティパネル ( 有効になっている場合 ) にも表示されます [Edit] メニューの [Server] をポイントし [Properties] をクリックしますダイアログが表示されたら表示するサーバを [Server] リストから選択します 2. 別のサーバのプロパティを表示する場合はサーバを [Server] リストから選択してください 3. 確認が完了したら [OK] をクリックしてウィンドウを閉じてくださいサーバのログファイルの表示 1. 開始するには以下の 4 つの方法がありますサーバのアイコンを右クリックしてサーバのコンテキストメニューを表示し次に [View Log] をクリックして [LifeKeeper Log Viewer] ダイアログを表示するグローバルツールバーの [View Log] ボタンをクリックし [LifeKeeper Log Viewer] ダイアログの [Server] リストから表示するサーバを選択するサーバのコンテキストツールバーが表示される場合はその [View Log] ボタンをクリックす 204 User Guide

225 リソースのタグと ID の表示る [Edit] メニューの [Server] をポイントし [View Log] をクリックする次に [LifeKeeper Log Viewer] ダイアログの [Server] リストから表示するサーバを選択する 2. グローバルツールバーまたは [Edit] メニューから捜査を開始して別のサーバのログを表示する場合は [LifeKeeper Log Viewer] ダイアログの [Server] リストからそのサーバを選択しますサーバのコンテキストメニューまたはサーバのコンテキストツールバーから [View Log] を選択した場合はこの機能は使用できません 3. 確認が完了したら [OK] をクリックして [Log Viewer] ダイアログを閉じてくださいリソースのタグと ID の表示リソースのタグと ID を即座に表示するには [Status] ウィンドウのリソースアイコンにカーソルを合わせてマウスの左ボタンを 1 回押します ( シングルクリック ) 優先順位が最も低いサーバのリソースのタグと ID がメッセージバーに表示されます特定サーバ上にあるリソースのタグと ID を表示する場合は表内のリソースインスタンスセルを左クリックしてくださいメッセージバーに表示されるメッセージは以下のようになります Resource Tag = ipdnet , Resource ID = IP 特定の状況では GUI がリソース ID を特定できないことがありますこの場合はリソースタグのみがメッセージバーに表示されますリソースのステータスの表示リソースのステータスつまり状態はグローバルリソースのステータス ( すべてのサーバについて ) とサーバリソースのステータス (1 台のサーバ上 ) の 2 つの形式で表示されますグローバルリソースのステータスは [Status] ウィンドウの左ペインにあるリソース階層ツリーに表示されますサーバリソースのステータスはリソースの列とサーバ行の交点にある表のセルにありますサーバリソースのステータス下図にアクティブスタンバイおよび不明のリソースステータスを持つサーバを示します wallace 上のリソースはすべてアクティブです gromit pat mike および batman 上のリソースはすべてスタンバイです bullwinkle 上のリソースはすべて不明です SteelEye Protection Suite for Linux 205

226 グローバルリソースのステータスサーバリソースの状態状態のシンボル意味アクティブこのサーバ上でリソースは動作可能であり保護されています (ISP) 可用性の低下このサーバ上でリソースは動作可能ですがバックアップリソースによる保護はされていません (ISU) スタンバイサーバはリソースの動作を引き継ぐことができます (OSU) 障害このサーバ上のリソースに問題が検出されました例えばリソースを In Service にする試行が失敗しました (OSF) 不明空のパネルリソースが初期化されていないか (ILLSTATE) このサーバで LifeKeeper が動作中でありませんサーバのリソースが定義されていませんグローバルリソースのステータス 206 User Guide

227 リソースのプロパティの表示状態のシンボル説明意味 / 原因正常リソースがアクティブ (ISP) でバックアップがアクティブです警告リソースがアクティブ (ISP) です 1 つ以上のバックアップが不明または障害 (OSF) としてマークされています障害リソースがいずれのサーバでもアクティブでありません (OSF) リソースが通常の原因により Out of Service になりましたリソースが通常ではない方法により動作が停止しましたリカバリは完了していないか失敗しました複数のサーバがアクティブであることを告げています不明利用可能な情報からは状態を特定できませんでしたサーバへの接続が遮断されましたサーバのリソースインスタンスがすべて不明の状態ですリソースのプロパティの表示 1. 開始するには以下の 3 つの方法がありますプロパティを表示するリソース / サーバの組み合わせのアイコンを右クリックしますリソースのコンテキストメニューが表示されたら [Properties] をクリックしますリソースのプロパティはプロパティパネル ( 有効になっている場合 ) にも表示されますプロパティを表示するグローバルリソースのアイコンを右クリックしますリソースのコンテキストメニューが表示されたら [Properties] をクリックしますダイアログが表示されたら表示するリソースが存在するサーバを [Server] リストから選択します [Edit] メニューの [Resource] をポイントし [Properties] をクリックしますダイアログが表示されたらプロパティを表示するリソースを [Resource] リストから選択し表示するリソースが存在するサーバを [Server] リストから選択します 2. 別のリソースのプロパティを表示する場合はリソースを [Resource] リストから選択してください 3. 別のサーバ上にあるリソースのプロパティを表示する場合はサーバを [Server] リストから選択してください 4. 確認を終了したら [OK] をクリックしてウィンドウを閉じてください [Status] ウィンドウの表示オプションの設定 [Options] ダイアログは [View] メニューから表示できます [Options] ダイアログで LifeKeeper のさまざ SteelEye Protection Suite for Linux 207

228 Resource Labels まな表示形式を指定できますこれらの設定およびチェックボックスのメニュー項目の全ての設定とさまざまなウィンドウサイズはクライアントマシンのホームフォルダにあるファイル.lkGUIpreferences で複数のセッションにわたって保存されますこのファイルは Web クライアントとアプリケーションクライアントの両方が使用します各クライアントマシンの優先設定は他のマシンの優先設定から独立しています 2 台のマシンで優先設定を同期する場合は優先ファイルを恒常的に共有するか一時的にマシン間でコピーを移動します 1. [View] メニューの [Options] をクリックしてください [View Options] ダイアログが表示されます 2. [Status] ウィンドウでのリソースの表示位置を変更するには [Display Options] タブをクリックし変更するオプショングループを選択してください以下に示すオプショングループの詳細説明を参照してください 3. [OK] をクリックして設定を保存し [Status] ウィンドウに戻ってください Resource Labels このオプショングループを使用するとリソース階層ツリー内のリソースをタグ名別と ID 別のいずれで表示するかを指定できます注記 : リソース階層ツリーに表示されるリソースタグ /ID は優先順位が最も低い番号を持つサーバに属します特定サーバ上にあるリソースのタグ /ID を表示する場合は表内のリソースインスタンスセルを左クリックしてくださいメッセージバーにそのタグ /ID が表示されます By tag name: By ID: Resource Tree このオプショングループを使用するとリソース階層ツリー内に表示するリソースのソート順序を指定できます 208 User Guide

229 Comm Path Status Sort By Resource - リソースラベルのみを基準にしてリソースをソートします Sort By Cluster - 同じサーバクラスタに属するリソースがグループ化されるようにサーバクラスタとリソースラベルを基準にしてソートします No Sort - ソートを無効にしますリソースは GUI が検出した順序で表示されますリソース階層ツリーの上位リソースはツリー内のリソースを左クリックして新しい位置にドラッグすることで手動ソートできます順序は移動したリソースおよびツリー内の移動先の位置によって異なります注記 : 0 と 9 のキーはリソース階層ツリーの展開 / 折り畳みを即座に実行するホットキー / アクセラレータキーとして指定されていますマウスもツリー全体の展開や折り畳みに使用できますリソース階層ツリーのタイトル領域をクリックしダブルクリックするとツリーが展開しますクリックするとツリーが折り畳まれます Comm Path Status このオプショングループを使用するとサーバの状態のグラフィックに表示するコミュニケーションパスの状態の形式を指定できます Warn if No Redundancy - 1 組のサーバ間のコミュニケーションパスが冗長コミュニケーションパスとして設定されていない場合サーバの警告グラフィックを表示します No Redundancy Required - 1 組のサーバ間に冗長コミュニケーションパスがないことを無視しますがコミュニケーションパスに障害が発生した場合にはサーバの警告グラフィックを表示します Row Height このオプショングループを使用すると表内の行の高さを指定できます選択肢は [Default] [Small] および [Smallest] です注記 : + と - のキーはリソース階層ツリー内と表内にあるリソースのサイズを即座に変更するホットキー / アクセラレータキーとして指定されています Column Width このオプショングループを使用すると表内のサーバとリソースの列幅を指定できます選択肢は以下のとおりです Default: 標準の幅 Custom: ドロップダウンリストから幅 ( ピクセル単位 ) を選択できます Automatic: 使用可能な領域全体に収まるようにすべての列のサイズを自動変更します注記 : 7 と 8 のキーはリソース階層の表内にあるリソース列のサイズを即座に変更するホットキー / アクセラレータキーとして指定されています SteelEye Protection Suite for Linux 209

230 メッセージ履歴の表示メッセージ履歴の表示 1. [View] メニューの [History] をクリックしてください LifeKeeper GUI の [Message History] ダイアログが表示されます 2. 履歴のメッセージをすべて消去する場合は [Clear] をクリックしてください 3. ダイアログを閉じるには [OK] をクリックしてください [Message History] ダイアログにはメッセージバーからの最新のメッセージが表示されます履歴リストには最大 1000 行を表示できます最大行数を超えた場合新しいメッセージにより最も古いメッセージが押し出されますこれらのメッセージはクライアントとサーバとの間の動作のみを表し時系列で表示されます最新のメッセージがリストの上部に表示されますメッセージ履歴の解釈 <-- はメッセージがサーバから受信したことを示し通常は以下の形式をとります <--"server name":"action" <--"server name":"app res":"action" <--"server name":"res instance":"action" --> はメッセージがクライアントから送信されたことを示し通常は以下の形式をとります -->"server name":"action" -->"server name":"app res":"action" -->"server name":"res instance":"action" [Clear] ボタンをクリックすると履歴が消去されますがダイアログは閉じません [OK] ボタンをクリックすると履歴を消去せずにダイアログが閉じます 210 User Guide

231 リソース階層ツリーの展開と折り畳みリソース階層ツリーの展開と折り畳みこのツリーのセグメントではリソース file_system_2 が展開されておりリソース nfs-/opt/qe_ auto/nfs/export1 が折り畳まれています展開されているリソースアイコンの左には示されますが表折り畳まれているリソースアイコンの左には表示されますがリソース階層ツリーを展開するにはをクリックするかの右側にあるリソースアイコンをダブルクリックしてくださいリソース階層ツリーをすべて展開するには [View] メニューの [Expand Tree] をクリックするか [Status] ウィンドウの左ペインにある列ヘッダの [Resource Hierarchy Tree] ボタンをダブルクリックしてください注記 : リソース階層ツリーに表示されるリソースタグ /ID は優先順位が最も低い番号を持つサーバに属します特定サーバ上にあるリソースのタグ /ID を表示する場合は表内のリソースインスタンスセルを左クリックしてくださいメッセージバーにそのタグ /ID が表示されますリソース階層ツリーを折り畳むにはをクリックするかの右側にあるリソースアイコンをダブルクリックしてくださいリソース階層ツリーをすべて折り畳むには [View] メニューの [Collapse Tree] をクリックするか [Status] ウィンドウの左ペインにある列ヘッダの [Resource Hierarchy Tree] ボタンをダブルクリックしてください SteelEye Protection Suite for Linux 211

[Cluster Connect] ダイアログ注記 : 9 と 0 のキーはすべてのリソース階層ツリーに対して即座に展開 / 折り畳みを実行するホットキー / アクセラレータキーとして指定されています [Cluster Connect] ダイアログ Server Name - 接続先のサーバ名 Login - 接続先のサーバに LifeKeeper 認証情報を持つユーザのログイン名

232 [Cluster Connect] ダイアログ注記 : 9 と 0 のキーはすべてのリソース階層ツリーに対して即座に展開 / 折り畳みを実行するホットキー / アクセラレータキーとして指定されています [Cluster Connect] ダイアログ Server Name - 接続先のサーバ名 Login - 接続先のサーバに LifeKeeper 認証情報を持つユーザのログイン名 Password - 接続先のサーバで指定ログインを認証するパスワード [Cluster Disconnect] ダイアログ Select Server in Cluster - 接続しているサーバの名前がドロップダウンリストボックスに表示されますリストから切断するクラスタのサーバを選択してください切断されるクラスタ内のすべてのサーバが確認ダイアログに表示されます 212 User Guide

233 [Resource Properties] ダイアログ [Resource Properties] ダイアログ [Resource Properties] ダイアログは [Edit] メニューやリソースのコンテキストメニューから使用できますこのダイアログにはサーバ上にある特定のリソースのプロパティが表示されます [Edit] メニューからアクセスした場合はリソースとサーバを選択できますリソースコンテキストメニューからアクセスした場合はサーバを選択できます [General] タブ Tag - リソースインスタンスの名前システムに対して一意で管理者にリソースを示します ID - リソースインスタンスに関連する文字列でありリソースタイプのすべてのインスタンス間で一意です関連するアプリケーションソフトウェアに対してリソースインスタンスの内部特性のいくつかを示します Switchback ( 管理者権限を持つユーザは編集可能 ) - In Service のリソースが存在するサーバに障害が発生した場合にサーバのリカバリ動作を管理する設定この設定が [Intelligent] の場合指定リソースの可能なバックアップとしてサーバが動作しますこの設定が [Automatic] の場合サーバはアクティブにリソースの再取得を試行します ( 以下の条件が満たされる場合 ) サーバがクラスタから離れるときにはリソース階層のサービスが既に in service である必要がありますリソース階層がすべて in service である場合は低プライオリティのサーバで in service である必要があります注記 : 自動スイッチバックのチェックは LifeKeeper を起動したときまたはクラスタに新しいサーバを追加したときにのみ実行されます通常のクラスタ動作中には実行されません State - リソースインスタンスの現在の状態 Active ローカルで In Service であり保護されています Warning - ローカルで In Service ですがローカルリカバリは試行されません Failed - Out of Service 障害 Standby - Out of Service 障害なし LLSTATE - LifeKeeper の起動シーケンスの一部として実行されるリソース初期化プロセスにより適切に初期化されていませんこの状態のリソースは LifeKeeper で保護されていません UNKNOWN - リソースの状態を特定できませんでした GUI サーバが使用できない可能性があります Reason - 存在する場合リソースが現在の状態にある原因 ( つまり最後の状態変化の原因 ) を示します例えば galahad 上にあるアプリケーションの状態が OSU である原因は tristan 上にある共有プライマリリソース ordbfsaa-on-tristan の状態が ISP か ISU であることです共有リソースはグループ内の 1 つのシステムでのみ同時にアクティブにできます SteelEye Protection Suite for Linux 213

234 [Relations] タブ Initialization - 起動時のリソースの初期化動作を決定する設定であり AUTORES_ ISP INIT_ISP INIT_OSU などがあります [Relations] タブ Parent - このリソースに直接依存するリソースのタグ名を示します Child - このリソースが依存するすべてのリソースのタグ名を示します Root - このリソース階層で親を持たないリソースのタグ名 [Equivalencies] タブ Server - リソースが定義済みの同等性を持つサーバ名 Priority ( 管理者権限を持つユーザは編集可能 ) - このリソースについてターゲットサーバのフェイルオーバの優先順位の値 Tag - 同等のサーバ上にあるこのリソースのタグ名 Type - 同等のタイプ (SHARED COMMON COMPOSITE) Reorder Priorities ( 管理者権限を持つユーザは編集可能 ) - [Up]/[Down] ボタンを使用して選択した同等リソースの優先順位を並べ替えることができます [OK] ボタンをクリックすると変更内容が適用されてウィンドウが閉じます [Apply] ボタンをクリックすると変更内容が適用されます [Cancel] ボタンをクリックすると最後に [Apply] をクリックして以降の変更内容を保存せずにウィンドウが閉じます [Server Properties] ダイアログ [Server Properties] ダイアログはサーバのコンテキストメニューや [Edit] メニューから使用できますこのダイアログには特定のサーバのプロパティが表示されますサーバのプロパティはプロパティパネル ( 有効になっている場合 ) にも表示されますこのダイアログの 3 つのタブについて説明します [OK] ボタンをクリックすると変更内容が適用されてウィンドウが閉じます [Apply] ボタンをクリックすると変更内容が適用されます [Cancel] ボタンをクリックすると最後に [Apply] をクリックして以降の変更内容を保存せずにウィンドウが閉じます 214 User Guide

235 [General] タブ [General] タブ Name - 選択したサーバの名前 State - サーバの現在の状態サーバの状態は以下の値をとります ALIVE - サーバが使用可能 DEAD - サーバが使用不可 UNKNOWN - リソースの状態を特定できませんでした GUI サーバが使用できない可能性があります Permission - そのサーバに現在ログインしているユーザの権限レベル権限は以下の値をとります Administrator - ユーザは LifeKeeper のすべての作業を実行できます Operator - ユーザは LifeKeeper のリソースとサーバのステータスを監視できリソースを in service または out of service にすることができます Guest - ユーザは LifeKeeper のリソースとサーバのステータスを監視できます SteelEye Protection Suite for Linux 215

236 [General] タブ Shutdown Strategy ( 管理者権限を持つユーザは編集可能 ) - サーバがシャットダウンしたときにリソースがクラスタ内のバックアップサーバにスイッチオーバするかどうかを制御する設定設定 Switchover Resources はリソースがクラスタ内のバックアップサーバで in service になることを示します設定 Do not Switchover Resources はリソースがクラスタ内にある別のサーバで in service にならないことを示します Failover Strategy - この設定を使用して LifeKeeper のクラスタ内にある特定システムからのフェイルオーバをユーザに確定するよう要求できますこの設定は LifeKeeper の管理者のみが使用できますオペレータとゲストにはこの設定は表示されませんデフォルトではフェイルオーバはすべてユーザの操作を必要とせず自動実行されますただしフェイルオーバ確認フラグが設定されると指定システムからフェイルオーバするには以下のコマンドを実行して確定することが必要です lk_confirmso -y system. 以下のコマンドを実行してフェイルオーバをブロックできます lk_confirmso -n system. 指定期間内にこれらのコマンドのいずれかが実行されない限りシステムは事前プログラミングされたデフォルト動作を実行します /etc/default/lifekeeper ファイル内にある 2 つのフラグがこの自動動作を制御します CONFIRMSODEF CONFIRMSOTO これはデフォルト動作を指定します 0 に設定されている場合デフォルト動作はフェイルオーバを実行します 1 に設定されている場合デフォルト動作はフェイルオーバをブロックしますこれは秒単位で設定されデフォルト動作を実行する前に LifeKeeper が待機する時間を示します 216 User Guide

[CommPaths] タブ [CommPaths] タブ Server -LifeKeeper のクラスタ内でコミュニケーションパスが接続している他のサーバのサーバ名 Priority - 2 台のサーバ間でコミュニケーションパスを使用する順序を定義する優先順位 1 が最高の優先順位で 99 が最低の優先順位です State -LifeKeeper の設定データベース (LCD)

237 [CommPaths] タブ [CommPaths] タブ Server -LifeKeeper のクラスタ内でコミュニケーションパスが接続している他のサーバのサーバ名 Priority - 2 台のサーバ間でコミュニケーションパスを使用する順序を定義する優先順位 1 が最高の優先順位で 99 が最低の優先順位です State -LifeKeeper の設定データベース (LCD) のコミュニケーションパスの状態コミュニケーションパスの状態は以下の値をとります ALIVE - 通常の動作をしています DEAD - 通常の動作をしていません UNKNOWN - 状態を特定できませんでした GUI サーバが使用できない可能性があります Type - リスト内のサーバと [Server] フィールドに指定されたサーバとの間のコミュニケーションパスの種類 TCP (TCP/IP) または TTY Address/Device - コミュニケーションパスが使用する IP アドレスまたはデバイス名 Comm Path Status - LifeKeeper の設定データベース (LCD) 内のコミュニケーションパスの状態に基づいて GUI が判定したコミュニケーションパスのステータスの概要以下にコミュニケーショ SteelEye Protection Suite for Linux 217

[Resources] タブンパスのステータスの値を示しますこれらの値は下のパネルの詳細テキストの下に表示されます NORMAL - すべてのコミュニケーションパスが通常の動作をしています FAILED - 指定サーバに対するすべてのコミュニケーションパスが動作していません UNKNOWN - コミュニケーションパスのステータスを特定できませんでした

238 [Resources] タブンパスのステータスの値を示しますこれらの値は下のパネルの詳細テキストの下に表示されます NORMAL - すべてのコミュニケーションパスが通常の動作をしています FAILED - 指定サーバに対するすべてのコミュニケーションパスが動作していません UNKNOWN - コミュニケーションパスのステータスを特定できませんでした GUI サーバが使用できない可能性があります WARNING - 指定サーバに対する 1 つ以上のコミュニケーションパスが動作していません DEGRADED - 指定サーバに対する 1 つ以上の冗長コミュニケーションパスが動作していません NONE DEFINED - コミュニケーションパスが定義されていません [Resources] タブ 218 User Guide

239 オペレータの作業 Name - 選択したサーバ上にあるリソースインスタンスのタグ名 Application - リソースタイプのアプリケーション名 (gen scsi など ) Resource Type - サービスを提供するリソースタイプハードウェアのクラスソフトウェアのクラスまたはシステムのエンティティのクラス (app filesys nfs device disk など ) State - リソースインスタンスの現在の状態 ISP ローカルで In Service であり保護されています ISU - ローカルで In Service ですがローカルリカバリは試行されません OSF - Out of Service 障害 OSU - Out of Service 障害なし LLSTATE - LifeKeeper の起動シーケンスの一部として実行されるリソース初期化プロセスによりリソースの状態が適切に初期化されていませんこの状態のリソースは LifeKeeper で保護されていません UNKNOWN - リソースの状態を特定できませんでした GUI サーバが使用できない可能性がありますオペレータの作業以下のトピックはオペレータの権限を必要とする高度な作業ですリソースを In Service にする 1. 開始するには以下の 5 つの方法があります in service にするリソース / サーバの組み合わせのアイコンを右クリックしますリソースのコンテキストメニューが表示されたら [In Service] をクリックします in service にするグローバルリソースのアイコンを右クリックしますリソースのコンテキストメニューが表示されたら [In Service] をクリックしますダイアログが表示されたら in service にするリソースが存在するサーバを [Server] リストから選択し [Next] をクリックしますグローバルツールバーの [In Service] ボタンをクリックしますダイアログが表示されたら in service にするリソースが存在するサーバを [Server] リストから選択し [Next] をクリックします次のダイアログで in service にするリソースを 1 つ以上 [Resouce(s)] リストから選択し [Next] をもう一度クリックしますリソースのコンテキストツールバーが表示される場合はその [In Service] ボタンをクリックします [Edit] メニューの [Resource] をポイントし [In Service] をクリックしますダイアログが表示されたら in service にするリソースがあるサーバを [Server] リストから選択し [Next] をクリックします次のダイアログで in service にするリソースを 1 つ以上 [Resouce(s)] リストから選択し [Next] をもう一度クリックします 2. 選択したサーバとリソースを In Service にすることを示すダイアログボックスが表示されます親リ SteelEye Protection Suite for Linux 219

240 リソースを Out of Service にするソースの in service にせずに依存する子リソースを in service にしようとする場合このダイアログには警告も表示されます [In Service] をクリックして依存する子リソースと共にリソースを in service にしてください 3. 出力パネルが有効の場合はダイアログが閉じリソースを In Service にするコマンドの結果が出力パネルに表示されます出力パネルが無効の場合はこれらの結果を表示するダイアログが表示されたままになり結果がすべて表示されたら [Done] をクリックします in service になった追加の依存 ( 子 ) リソースがダイアログまたは出力パネルに表示されます 4. リソースを in service にする動作で発生したエラーは in service にするリソースがあるサーバの LifeKeeper ログに記録されますリソースを Out of Service にする 1. 開始するには以下の 4 つの方法があります Out of Service にするグローバルリソースまたはリソース / サーバの組み合わせのアイコンを右クリックしますリソースのコンテキストメニューが表示されたら [Out of Service] をクリックしますグローバルツールバーの [Out of Service] ボタンをクリックします [Out of Service] ダイアログが表示されたら Out of Service にするリソースを 1 つ以上 [Resouce(s)] リストから選択し [Next] をクリックしますリソースのコンテキストツールバーが表示される場合は [Out of Service] ボタンをクリックします [Edit] メニューの [Resource] をポイントし [Out of Service] をクリックします [Out of Service] ダイアログが表示されたら Out of Service にするリソースを 1 つ以上 [Resouce(s)] リストから選択し [Next] をクリックします 2. 選択したリソースが Out of Service になることを示す [Out of Service] ダイアログボックスが表示されます親リソースを Out of Service にせずに依存する子リソースを Out of Service にしようとする場合このダイアログには警告も表示されます [Out of Service] をクリックして次のダイアログボックスに進みます 3. 出力パネルが有効の場合はダイアログが閉じリソースを Out of Service にするコマンドの結果が出力パネルに表示されます出力パネルが無効の場合はこれらの結果を表示するダイアログが表示されたままになり結果がすべて表示されたら [Done] をクリックします 4. リソースを Out of Service にする動作で発生したエラーは Out of Service にするリソースが存在するサーバの LifeKeeper ログに記録されます高度な作業 LCD LifeKeeper 設定データベース 220 User Guide

241 関連トピック LifeKeeper 設定データベース (LCD) は LifeKeeper が既知のすべてのリソースタイプについてオブジェクト指向のリソース階層情報を管理しリカバリ方向の情報を保存しますデータは共有メモリにキャッシュされファイルに保存されるのでシステムの再起動後もデータが保持されます LCD にはリカバリが必要なリソースインスタンスについての状態の情報および特定の詳細情報もあります LCD のディレクトリ構造保存されるデータタイプ使用できるリソースタイプおよびアプリケーションスクリプトの使用の詳細については以下の関連トピックを参照してください関連トピック LCDI のコマンド LifeKeeper にはアプリケーションのリソース階層を定義するためのメカニズムが 2 つ用意されています LifeKeeper の GUI LifeKeeper 設定データベースのインターフェース (LCDI) コマンド LCDI は LifeKeeper が提供するインターフェースコマンドのセットで使用するアプリケーションのニーズに合わせてリソース階層の設定の作成とカスタマイズができますアプリケーションが複数のリソース ( 例 : 2 つ以上のファイルシステム ) に依存する場合コマンドインターフェースを使用しますコマンドの詳細については LCDI のマニュアルページを参照してくださいこのトピックでは開発シナリオを示し GUI とコマンドの両方の機能を使用してリソース階層を作成できる方法を説明しますシナリオの状況アプリケーションの例である ProjectPlan はサーバ 1 とサーバ 2 が共有する SCSI ファイルシステムにデータを保存していますサーバ 1 がアプリケーションのプライマリ階層にありますアプリケーションには /project-data と /schedule の 2 つのファイルシステムがあります階層定義の最初の手順では依存関係を指定しますこのアプリケーションの例には以下の依存関係があります共有ファイルシステムアプリケーションは /project-data と /schedule のファイルシステムに依存します SCSI ディスクサブシステム. 次にファイルシステムは SCSI ディスクサブシステム ( デバイスディスクおよびホストアダプタのリソースを含む ) に依存します結果として階層を作成する作業は以下の図のようになります SteelEye Protection Suite for Linux 221

242 階層の定義階層の定義この例のアプリケーション階層を作成するために必要な作業を示します 1. ファイルシステムリソースの作成 LifeKeeper の GUI にはファイルシステムリソースを作成するメニューがありますファイルシステムリソース階層の作成を参照してくださいこの定義作業の最後で LCD では 2 つのファイルシステムリソースが以下のように定義されます ID タグサーバ /project-data /project-data /schedule /schedule project-data-on-server1 project-data-from-server1 schedule-on-server1 schedule-from-server1 Server1 Server2 Server1 Server2 注記 : LifeKeeper で使用されるタグ名には意味はありません単なるラベルです表内のタグ名は LifeKeeper のデフォルト値です 2. リソースの定義この例では以下の項目を定義する必要がありますアプリケーション : リソースタイプ : インスタンス ID: タグ : projectapp plan 1yrplan the-project-plan 222 User Guide

243 階層の定義注記 : LifeKeeper の GUI を使用して定義の大部分を作成できますがこの例の以降ではコマンドインターフェースの操作を説明します 3. ディレクトリの作成各システムで以下のコマンドを使用してディレクトリ /opt/lifekeeper/subsys の下に必要なアプリケーションリカバリディレクトリを作成します mkdir -p /opt/lifekeeper/subsys/projectapp/resources/plan/actions 4. アプリケーションの定義以下のコマンドでアプリケーション projectapp を作成します app_create -d Server1 -a projectapp app_create -d Server2 -a projectapp 5. リソースタイプの定義以下のコマンドでリソースタイプ plan を作成します typ_create -d Server1 -a projectapp -r plan typ_create -d Server2 -a projectapp -r plan 6. リカバリスクリプトのインストール restore と remove のスクリプトを各サーバの以下のディレクトリにコピーします /opt/lifekeeper/subsys/projectapp/resources/plan/actions 7. インスタンスの定義以下のコマンドでリソースのインスタンスタイプが plan ID が 1yrplan のリソースを定義します ins_create -d Server1 -a projectapp -r plan -I\ AUTORES_ISP -t the-project-plan -i 1yrplan ins_create -d Server2 -a projectapp -r plan -I\ SEC_ISP -t the-project-plan -i 1yrplan Server1 に作成したインスタンスの -I AUTORES_ISP 命令は LifeKeeper の再起動時にそのリソースを自動的に in service にするように LifeKeeper に指示しますこの例ではリソースの restore スクリプトが実行され正常に実行された場合はリソースが ISP 状態になりますこの動作はペアのリソースがすでにサービス起動している場合は実行されません Server2 に作成したインスタンスの -I SEC_ISP 命令は LifeKeeper の再起動時にそのリソースを in service にしないように LifeKeeper に指示しますその代わり Server2 は Server1 上にあるリソースのバックアップとして機能しプライマリのリソースまたはサーバに障害が発生したときにローカルリソースを in service にします 8. 依存関係の定義以下のコマンドはアプリケーションとファイルシステムの依存関係を定義します dep_create -d Server1 -p the-project-plan -c project-data-on- System1 dep_create -d Server2 -p the-project-plan -c project-datafrom-server1 SteelEye Protection Suite for Linux 223

244 LCD の設定データ dep_create -d Server1 -p the-project-plan -c schedule-on- Server1 dep_create -d Server2 -p the-project-plan -cschedule-from- Server1 9. lcdsync の実行以下の lcdsync コマンドを実行して設定のコピーを更新するように LifeKeeper に通知します lcdsync -d Server1 lcdsync -d Server2 10. リソースを In Service にするプライマリサーバで LifeKeeper の GUI にアクセスし [Edit] > [Resource]> [In-Service] をクリックしてリソースを In Service にします LCD の設定データ LCD には以下の関連するデータタイプが保存されます依存関係の情報リソースのステータス情報サーバ間のイクイバレンシ情報依存関係の情報定義した各リソースについて LifeKeeper は依存関係のリストおよび依存物 ( あるリソースに依存するリソース ) のリストを保持します詳細については LCDI_relationship (1M) と LCDI_ instances (1M) のマニュアルページを参照してくださいリソースのステータス情報 LifeKeeper は各リソースインスタンスのステータス情報をメモリに保持します LCD が認識するリソースの状態は ISP ISU OSF OSU および ILLSTATE ですシステムイベントが発生した場合または管理者が特定の操作を行った場合にリソースがある状態から別の状態に変化することがありますリソースの状態が変化した場合ステータスの変化がローカルサーバの LCD およびそのリソースのダイアログサーバ上にあるデータベースに反映されますサーバ間のイクイバレンシ情報さまざまなサーバ上にある複数のリソース間に関係が存在することがありますイクイバレンシ情報とは別のサーバ上にある 2 つのリソースが同一の物理エンティティであることを示す関係です 2 台のサーバがイクイバレンシ情報の関係にある 1 つのリソースを持つ場合 LifeKeeper はその動作により 2 台のサーバ上にあるリソースの 1 つのみが同時に In Service 保護 (ISP) になるようにします両方のサーバでそのリソースインスタンスを Out of Service (OSU または OSF) にすることができますがデータの整合性の理由から同時に In Service にできるリソースは 1 つのみです 224 User Guide

245 LCD のディレクトリ構造 SCSI バス上にある複数のディスクが同等なリソースの一例です SCSI のロック ( または予約 ) メカニズムにより任意の時点でディスクデバイスのロックを所有できるのは 1 台のサーバのみですこのロック所有機能により同時に複数のサーバによる同一ディスクリソースへのアクセスが防止されますさらに階層内の依存関係によりファイルシステムのようにディスクに依存するリソースはすべて同時に 1 台のサーバでのみ In Service になります LCD のディレクトリ構造 /opt/lifekeeper の下にある主なサブディレクトリを示します config - LifeKeeper の設定ファイルイクイバレンシ情報を含みます bin - LifeKeeper の実行可能プログラム is_recoverable などがあります詳細については障害検出とリカバリのシナリオを参照してください subsys - リソースとタイプ LifeKeeper は共有 SCSI ディスクサブシステムのリソースとタイプの定義を scsi で汎用アプリケーションのメニュー機能を gen で提供しますアプリケーションのインターフェースを定義する場合は subsys の下にディレクトリを作成してください events - 警報イベント詳細については LifeKeeper の警報とリカバリを参照してください /opt/lifekeeper 内の LCD ディレクトリの構造については /opt/lifekeeper 内の LCD ディレクトリの構造のトピックを参照してください LCD のリソースタイプ LCD は共有メモリおよび /opt/lifekeeper ディレクトリの両方に保持されますディレクトリ構造の図に示すように subsys にはアプリケーションインターフェースの指定に使用できるアプリケーションリソースセットが 2 つあります gen - 汎用アプリケーションとファイルシステムの情報 scsi - SCSI に固有のリカバリ情報これらのサブディレクトリについてはリソースのサブディレクトリを参照してください LifeKeeper のフラグステータスの詳細表示の後部近くにシステムのフラグセットがあります共通タイプはプロセスのロックが動作を完了するまで他のプロセスを確実に待機させるために使用する LCD のロックフラグです LCD のロックの標準フォーマットは以下のとおりです!action!processID!time!machine:id. 一般的な LCD のロックフラグの例を示します!action!02833! !<servername>:filesys. ファイルシステム階層を作成するとこのフォーマットでステータス表示にフラグが生成されます filesys の指定は他のアプリケーションリソース階層では別のリソースタイプである場合も一般的なアプリケーションやユーザ SteelEye Protection Suite for Linux 225

246 リソースのサブディレクトリ定義アプリケーションでは app である場合もあります他の代表的なフラグとして!nofailover!machine and shutdown_switchover があります!nofailover!machine フラグは LifeKeeper が作成と削除を行う内部の一時フラグでサーバのフェイルオーバを制御します shutdown_switchover フラグはこのサーバのシャットダウン方針がスイッチオーバに設定されたことを示しサーバのシャットダウンによりスイッチオーバが発生します使用可能なフラグの詳細については LCDI-flag (1M) を参照してくださいリソースのサブディレクトリ scsi と gen のディレクトリはそれぞれリソースのサブディレクトリを持ちますこれらのディレクトリの内容は LifeKeeper が提供するリソースタイプのリストです scsi のリソースタイプこれらのリソースタイプは /opt/lifekeeper/subsys/scsi/resources ディレクトリにあります実際の設定によってはその他のディレクトリが存在する場合があります device - ディスクパーティションまたは仮想ディスクデバイス disk - 物理ディスクまたは LUN hostadp - ホストアダプタ gen のリソースタイプこれらのリソースタイプは /opt/lifekeeper/subsys/gen/resources ディレクトリにあります filesys - ファイルシステム app - 汎用またはユーザ定義のアプリケーションであり他のリソースに依存することがある各リソースタイプのディレクトリには以下のものが 1 つ以上ありますインスタンスこのファイルは LCD に保存されているリソースインスタンスに関する恒久的な情報を反映しますこのリソースタイプに関連付けられたリソースインスタンスの記述的な情報があります警告 : インスタンスファイル ( または LCD ファイル ) を直接変更しないでくださいリソースインスタンスの作成や操作を行うには LifeKeeper の GUI の機能または ins_create ins_remove ins_gettag ins_ setas ins_setinfo ins_setinit ins_setstate および ins_list の LifeKeeper の LCDI_instances コマンドのみを使用してくださいこれらのコマンドの詳細については LCDI_instances (1M) のマニュアルページを参照してください recovery このオプションのディレクトリには障害が検出されたリソースのローカルリカバリの試行に使用されるプログラムがあります recovery ディレクトリには sendevent に渡されるイベントクラスに対応するディレクトリがありますディレクトリの名前は sendevent プログラムに渡されるクラスパラメータ (-C) と一致する必要があります (LifeKeeper の警告とリカバリを参照 ) 各サブディレクトリにアプリケーションは対応するイベントタイプを処理するリカバリプログラムを入れることができますこれらのプログラムの名前は sendevent の -E パラメータで渡される文字列と一致する必要がありますこのオプションのディレクトリは複数のアプリケーションに使用されるように存在することはできません 226 User Guide

247 リソースの動作 actions このディレクトリには特定のリソースタイプのリソースインスタンスについてのみ動作するリカバリ実行プログラムのセットがあります使用するアプリケーションについてアプリケーション内のすべてのリソースに適用する動作がある場合はその動作を resource type ディレクトリではなくアプリケーションディレクトリの actions サブディレクトリに入れてくださいリカバリ指示ソフトウェアがリソースインスタンスの変更や復旧に使用されます各リソースタイプの actions ディレクトリに remove と restore の 2 つの動作が必要ですリソースの動作リソースタイプの actions ディレクトリには特定のアプリケーションの動作を記述するプログラム ( 多くの場合は shell スクリプト ) があります各リソースタイプについて restore と remove の 2 つの動作が必要です remove と restore のプログラムは正反対の機能を実行する必要がありますつまり相互の動作を元に戻す必要がありますこれらのスクリプトは絶対に手動で実行しないでくださいこれらのスクリプトは LifeKeeper のリカバリ動作と制御のインターフェース (LRACI) の perform_action shell プログラムのみが実行する必要があります (LRACI-perform_action (1M) マニュアルページを参照 ) /opt/lifekeeper の LCD のディレクトリ構造以下の図に /opt/lifekeeper のディレクトリ構造を示します SteelEye Protection Suite for Linux 227

248 LCM LCM The LifeKeeper Communications Manager (LCM) は 1 台以上の LifeKeeper サーバ上にあるプロセス間に信頼性の高い通信を提供しますこのプロセスはシステム間の冗長コミュニケーションパスを使用できるので 1 つのコミュニケーションパスに障害が発生しても LifeKeeper やそれが保護するリソースには障害が発生しません LCM は RS-232 (TTY) と TCP/IP の接続を含む多様な通信方法をサポートしています LCM は以下の機能を提供します LifeKeeper のハートビート接続している他の LifeKeeper システムと定期的に通信して他のシステムが動作を継続しているかどうかを判断します LifeKeeper はハートビート信号がないことを認識することにより他の方法では検出されないシステム全体の障害を検出できます管理サービス LifeKeeper の管理機能は LCM の機能を使用してリモート管理を実行しますこの機能はシングルポイントの管理設定の検証および管理動作の正常性チェックに使用されます設定とステータスの通信 LifeKeeper 設定データベース (LCD) はリソースのステータス可用性および設定を LCM 機能経由で記録します LCM の機能により LCD はプライマリとセカンダリのシステム間で整合性のあるリソース情報を保持できます 228 User Guide

249 通信ステータスの情報フェイルオーバリカバリあるシステム上のリソースに障害が発生すると LCM は LifeKeeper にバックアップシステム上にリソースを復旧するように通知します LCM が提供する LifeKeeper のサービスに加えて shell コマンドセットによりアプリケーションによる信頼性の高いシステム間通信が可能ですこれらのコマンドとして snd_msg, rcv_msg can_talk などがありますこれらのコマンドの詳細については LCMI_mailboxes (1M) のマニュアルページを参照してください LCM はシステム上でリアルタイムプロセスとして動作しシステムのハートビートが送信されるなどの重要な通信が確実に実行されるようにします通信ステータスの情報ステータス表示の通信ステータスの情報のセクションには LifeKeeper が認識しているサーバとその現在の状態および各コミュニケーションパスの情報がリストされます以下の例はステータスの簡略表示の通信ステータスのセクションのものです MACHINE NETWORK ADDRESSES/DEVICE STATE PRIO tristan TCP / ALIVE 1 tristan TTY /dev/ttys0 ALIVE -- 詳細についてはステータスの詳細表示とステータスの簡略表示のトピックの通信ステータスの情報セクションを参照してください LifeKeeper の警報とリカバリ LifeKeeper のエラー検出と通知はイベント警報メカニズム sendevent をベースにしています sendevent メカニズムの重要な概念は独立したアプリケーションが重要なコンポーネントについて警報を受信できるように登録できることです警報を開始する側のコンポーネントと受信する側のアプリケーションのいずれも他のアプリケーションの存在を知るように変更する必要はありませんアプリケーションに固有のエラーが sendevent 機能経由で LifeKeeper のリカバリメカニズムをトリガできますこのセクションでは警報クラス警報の処理および警報ディレクトリのレイアウトを含む警報に関連するトピックを説明し次に警報の概念を示す処理シナリオを示します警報クラス /opt/lifekeeper/events ディレクトリにはアラームクラスのセットがリストされますこれらのクラスはイベントを生成するシステムの特定サブコンポーネントに対応します ( 例 : filesys) 各警報クラスのサブディレクトリには可能性のある警報のセットがあります ( 例 : badmount diskfull) shell スクリプトまたはプログラムを適切なディレクトリに入れることでこれらの警報を受信するようにアプリケーションを登録できます LifeKeeper は基本的な警報通知機能を使用していますこの警報機能によりイベントについて登録されたすべてのアプリケーションで該当する警報の発生時に sendevent により処理プログラムが非同期で実行されます LifeKeeper が存在する場合 sendevent プロセスははじめに LifeKeeper のリソースオブジェクトがクラスとイベントを処理できるかどうかを判断します LifeKeeper がクラス / イベントの一致を検出した場合適切な復旧シナリオが実行されます SteelEye Protection Suite for Linux 229

250 警報の処理 sendevent 警報機能の追加スクリプトを定義することは任意です LifeKeeper リソースを定義すると LifeKeeper が基本的な警報機能を提供しますその詳細はこの章の処理シナリオで後述します注記 : リソースインスタンスのローカルリカバリは LifeKeeper の制御下にあるアプリケーションが中断されたリソースサービスをイベントが発生したシステムのエンドユーザに返そうとする試行ですサーバ間リカバリではアプリケーションはバックアップシステムに移行できますこの種のリカバリはローカルリカバリが失敗したかローカルリカバリが不可能である場合に試行されます警報の処理 LifeKeeper の注意が必要な可能性のあるイベントを検出するアプリケーションまたはプロセスは sendevent プログラムを実行し各エラークラスエラー名および障害のあるインスタンスの引数を渡すことによりイベントを報告できます必須の詳細オプションのパラメータおよび構文については sendevent (5) のマニュアルページを参照してください警報ディレクトリのレイアウト /opt/lifekeeper/events ディレクトリには 2 種類の内容があります LifeKeeper の指定クラス LifeKeeper は events ディレクトリの下に lifekeeper と filesys の 2 つの警報クラスを用意しています警報イベントの例として noaccess と diskfull があります警報クラスは sendevent コマンドの -C オプションで渡される文字列に対応し警報イベントは -E オプションで渡される文字列に対応します Lifekeeper の警報クラスは LifeKeeper のサブシステム内のイベント報告用に内部的に使用されますアプリケーションに固有のクラス特定のアプリケーションで警報クラスの定義が必要な場合 events ディレクトリに他のサブディレクトリが追加されますアプリケーションは shell スクリプトまたはバイナリプログラムをそのサブディレクトリに入れることでこれらの警報を受信するように登録しますこれらのプログラムの名前は属するアプリケーションパッケージの名前に由来しますメンテナンス作業以下に LifeKeeper のメンテナンス作業を示します LifeKeeper の設定値の変更 LifeKeeper には設定と設定を行った後に変更を要する場合がある値が多数あります変更を要する場合がある値の例として LifeKeeper サーバの uname コミュニケーションパスの IP アドレス IP リソースのアドレスタグ名などがありますこれらの値を変更するには注意して以下の手順に従ってください 1. 以下のコマンドを使用してすべてのサーバで LifeKeeper を停止してください LKROOT/bin/lkstop コミュニケーションパスを削除したりサーバからリソース階層を拡張解除したりする必要はありません 230 User Guide

251 LifeKeeper の設定値の変更 2. LifeKeeper サーバの uname を変更する場合は hostname(1) コマンドを使用してサーバのホスト名を変更してください 3. 先に進む前に新しいホスト名がクラスタ内のすべてのサーバで解決可能であることを確認してくださいコミュニケーションパスのアドレスを変更する場合は新しいアドレスが設定され動作していることを確認してください (ping と telnet のユーティリティをこの確認に使用可能 ) 4. LifeKeeper の複数の値を変更する必要がある場合はクラスタ内の各サーバ上のファイルで古い値と新しい値を以下のフォーマットで指定する必要があります old_value1=new_value1... old_value9=new_value9 5. クラスタ内のすべてのサーバで lk_chg_value コマンドを実行し出力を確認して予測しなかった変更内容による副作用が発生していないことを確認してください変更する値が複数ある場合は以下のコマンドを実行してください $LKROOT/bin/lk_chg_value -Mvf file_name file_name は手順 4 で作成したファイルの名前です変更する値が 1 つのみの場合は以下のコマンドを実行してください $LKROOT/bin/lk_chg_value -Mvo old_value -n new_value -M オプションは LifeKeeper のすべてのファイルに対して変更を行わないことを指定します 6. クラスタ内のすべてのサーバで -M オプションを指定せずに lk_chg_value コマンドを実行して LifeKeeper のファイルを変更してください変更する値が複数ある場合は以下のコマンドを実行してください $LKROOT/bin/lk_chg_value -vf file_name file_name は手順 4 で作成したファイルの名前です変更する値が 1 つのみの場合は以下のコマンドを実行してください $LKROOT/bin/lk_chg_value -vo old_value -n new_value 7. 以下のコマンドを使用して LifeKeeper を再起動してください $LKROOT/bin/lkstart LifeKeeper の GUI を使用してクラスタを表示する場合は GUI を閉じてから再起動しなければならないことがあります例 : Server1 と Server2 は 2 ノードクラスタ内にある LifeKeeper サーバの uname です Server1 はアドレスのコミュニケーションパスを持ちます Server2 はアドレスの IP リソースを持ちこの IP リソースは Server1 に拡張されています Server1 について以下の値を変更します SteelEye Protection Suite for Linux 231

252 ファイルシステムの健全性の監視値旧新 uname Server1 Newserver1 コミュニケーションパスのアドレス IP リソースのアドレスこれらの変更を行うには以下の手順を実行する必要があります注記 : 1. 以下のコマンドを使用して Server1 と Server2 の両方で LifeKeeper を停止してください $LKROOT/bin/lkstop 2. 以下のコマンドを使用して Server1 の uname を Newserver1 に変更してください hostname Newserver1 3. Newserver1 と Server2 の両方に以下の内容を持つファイル /tmp/subs を作成してください Server1=Newserver = = 両方のサーバで以下のコマンドを実行し出力を確認して予測しなかった変更内容による副作用が発生していないことを確認してください $LKROOT/bin/lk_chg_value -Mvf /tmp/subs 5. 両方のサーバで -M オプションを指定せずに lk_chg_value コマンドを実行して LifeKeeper のファイルを変更してください $LKROOT/bin/lk_chg_value -vf /tmp/subs 6. 以下のコマンドを使用して両方のサーバで LifeKeeper を再起動してください $LKROOT/bin/lkstart LifeKeeper のファイルを変更せずに lk_chg_value による変更内容を表示するには -M オプションを使用してください lk_chg_value が調べるファイルを表示するには -v を使用してくださいタグ名を変更しない場合は -T オプションを使用してくださいリソース ID を変更しない場合は -I オプションを使用してくださいファイルシステムの健全性の監視ファイルシステムの健全性の監視機能は LifeKeeper が保護するファイルシステム依存のアプリケーションで障害が発生する原因となる条件を検出します監視はアクティブ / In Service のリソース ( つまりファイルシステム ) でのみ実行されます監視する条件は以下の 2 つですファイルシステムがフル ( またはほぼフル ) の状態になるファイルシステムが不適切にマウント ( またはアンマウント ) された 232 User Guide

253 条件の定義これら 2 つの条件のいずれかが検出されるといくつかの動作のいずれかが実行されることがあります警告メッセージがログ記録されシステム管理者に電子メールを送信できるリソースインスタンスのローカルリカバリを試行できるリソースをバックアップサーバにフェイルオーバできる条件の定義フル ( またはほぼフル ) のファイルシステムディスクがフルの条件は検出できますがローカルリカバリまたはフェイルオーバの実行で解決することはできません管理者の操作が必要ですデフォルトではメッセージがログ記録されます追加の通知機能を使用できます例えば電子メールをシステム管理者に送信できますまた他の方法により別のアプリケーションを起動して警告メッセージを送信できますこの通知機能を有効にする方法については LifeKeeper のイベント電子メール通知の設定のトピックを参照してくださいディスクフルの条件に加えてディスクがほぼフルの条件を検出し警告メッセージを LifeKeeper のログに記録できますディスクフルのしきい値は以下のとおりです FILESYSFULLERROR=95 ディスクがほぼフルのしきい値は以下のとおりです FILESYSFULLWARN=90 デフォルト値は上記のとおりそれぞれ 90% と 95% ですが /etc/default/lifekeeper ファイルの調整可能なパラメータを使用して設定できますこれら 2 つのしきい値の意味は以下のとおりです FILESYSFULLWARNING - ファイルシステムがこの割合までフルになるとメッセージが LifeKeeper のログに表示されます FILESYSFULLERROR - ファイルシステムがこの割合までフルになるとメッセージが LifeKeeper のログおよびシステムログに表示されますファイルシステムの通知スクリプトも呼び出されますアンマウントされたまたは不適切にマウントされたファイルシステム LifeKeeper は /etc/mtab ファイルをチェックして LifeKeeper が保護する In Service のファイルシステムが実際にマウントされているかどうかを調べますさらに filesys のリソース情報フィールドに保存されているマウントオプションに対してマウントオプションをチェックし階層の作成時に使用されていた元のマウントポジションと一致するかどうかを確認しますファイルシステムがアンマウントされているか不適切にマウントされていることを検出した場合ローカルリカバリが起動され正しいマウントオプションを使用してファイルシステムの再マウントが試行されます再マウントに失敗した場合条件を解消するためにフェイルオーバが試行されます以下のリストにフェイルオーバに進行する場合がある再マウントの障害の一般的な原因を示しますファイルシステムが破損している (fsck の障害 ) マウントポイントディレクトリの作成失敗 SteelEye Protection Suite for Linux 233

254 LifeKeeper が保護するシステムのメンテナンスマウントポイントがビジーマウントの失敗 LifeKeeper の内部エラー LifeKeeper が保護するシステムのメンテナンス LifeKeeper が保護するサーバをシャットダウンしてメンテナンスを行うときにはメンテナンスの前にバックアップサーバでシステムのリソース階層を In Service にする必要がありますこのプロセスによりメンテナンスが必要なシステム上にある共有ディスクの動作がすべて停止します記載の順序で以下の操作を実行してください Server A はメンテナンスが必要なプライマリシステム Server B はバックアップサーバです 1. Server B で階層を in service にしてくださいバックアップの Server B で LifeKeeper の GUI を使用して現在 Server A で in service であるリソース階層を in service にしますこれにより LifeKeeper の保護下にある共有ディスクに存在している Server A のファイルシステムがアンマウントされます詳細についてはリソースを In Service にするを参照してください 2. Server A で LifeKeeper を停止してください LifeKeeper のコマンド /opt/lifekeeper/bin/lkstop を使用して LifeKeeper を停止しますリソースが保護されていない状態になります 3. Linux をシャットダウンし Server A の電源をオフにしてください Server A の Linux オペレーティングシステムをシャットダウンしサーバの電源をオフにします 4. メンテナンスを実行してください Server A で必要なメンテナンスを実行します 5. Server A の電源をオンにし Linux を再起動してください Server A の電源をオンにし次に Linux オペレーティングシステムを再起動します 6. Server A で LifeKeeper を開始してください LifeKeeper のコマンド /opt/lifekeeper/bin/lkstart を使用して LifeKeeper を開始しますリソースが保護されている状態になります 7. 必要に応じて Server A で階層を in service にしてください Server A で LifeKeeper の GUI を使用して Server B にスイッチオーバしていたすべてのリソース階層を in service にしてくださいリソース階層のメンテナンスシステム上のその他すべての階層を LifeKeeper で保護した状態であるリソース階層のメンテナンスを実行できますこのためにはメンテナンスが必要な階層を Out of Service にしメンテナンス作業の完了後にその階層を In Service にしますリソース階層のメンテナンスを実行するには以下の手順に従ってください 1. 階層を Out of Service にしてください LifeKeeper の GUI を使用してメンテナンスを実行する必要があるリソース階層をすべて Out of Service にします詳細についてはリソースを Out of Service にするを参照してください 2. メンテナンスを実行してくださいリソース階層で必要なメンテナンスを実行します 234 User Guide

255 フェイルオーバ後の復旧 3. 階層をリストアしてください LifeKeeper の GUI を使用してリソース階層を In Service にします詳細についてはリソースを In Service にするを参照してくださいフェイルオーバ後の復旧 LifeKeeper がプライマリサーバ (Server A) からバックアップサーバ (Server B) にフェイルオーバリカバリを実行した後以下の手順を実行してください 1. ログを確認してください Server B の LifeKeeper が Server A からフェイルオーバリカバリを実行するとフェイルオーバ中にステータスメッセージが表示されます実際の出力は設定によって異なりますマウントやアンマウントの失敗に関するいくつかのメッセージが表示されることが予測されますがこれらのメッセージはリカバリの失敗を示唆しませんこれらのメッセージおよび Server B でリソースを In Service にするときに発生したエラーは LifeKeeper のログに記録されます 2. メンテナンスを実行してください Server A の障害の原因を特定し解決しますメンテナンスを実行するために Server A の電源をオフにすることが必要な場合があります 3. 必要に応じて Server A を再起動してくださいメンテナンスが完了したら必要に応じて Server A を再起動します 4. 必要に応じて LifeKeeper を開始してください Server A で LifeKeeper が動作していない場合はコマンド /opt/lifekeeper/bin/lkstart を使用して LifeKeeper を開始します 5. アプリケーションを Server A に戻してください都合のよい時点で LifeKeeper の GUI を使用して Server A でアプリケーションを in service にします詳細についてはリソースを In Service にするを参照してください Server A でアプリケーションが [Automatic Switchback] に設定されている場合はこの手順は不要なことがあります LifeKeeper の削除 Linux 環境での LifeKeeper パッケージのアンインストールは rpm をサポートするグラフィカルインターフェースまたはコマンドラインから実行できますこのセクションではコマンドラインから rpm コマンドを使用して LifeKeeper をアンインストールする手順を詳しく説明します rpm コマンドを使用する手順の詳細については rpm(8) のマニュアルページを参照してください rpm ソフトウェアの詳細については以下の Web サイトを参照してください以下に LifeKeeper ソフトウェアを削除するための要件を示しますアプリケーションの移動 LifeKeeper ソフトウェアを削除する前にサーバ上に LifeKeeper の保護を必要とするアプリケーションがないことを確認する必要がありますアプリケーションリソース階層が In Service のサーバからは絶対に LifeKeeper を削除しないでください LifeKeeper を削除すると同等性リソース階層定義ログファイルなどの設定データがすべて削除されます追加情報についてはリソース階層の転送を参照してください LifeKeeper の開始 LifeKeeper のリカバリキットソフトウェアを削除するときには LifeKeeper が実行中でなければならない場合があります LifeKeeper が実行中でない場合削除プロセスはクラスタ内の他の LifeKeeper サーバからリソースインスタンスを削除できず複数のサーバが不整合の状態になることがありますすべてのパッケージの削除 LifeKeeper Core を削除する場合初めに LifeKeeper に依存する SteelEye Protection Suite for Linux 235

256 GnoRPM からの削除他のパッケージ ( 例 : LifeKeeper のリカバリキット ) を削除する必要があります LifeKeeper のリカバリキットを削除する前にまず関連するアプリケーションリソース階層を削除することが推奨されます注記 : LifeKeeper のリカバリキットソフトウェアを削除する前にまず関連する階層をそのサーバから削除することが推奨されますこの削除はリソースの拡張解除の設定作業で実行できます既存の階層の拡張解除を実行せずに LifeKeeper のリカバリキットパッケージを削除した場合現在定義されこのリカバリキットにより保護されている該当のリソース階層はシステムから自動的に削除されます一般的なルールは以下のとおりですリソース階層が In Service のサーバからは絶対にリカバリキットを削除しないでくださいこれにより現在の階層が破壊されリカバリキットの再インストール時に階層の再作成が必要になります GnoRPM からの削除 GnoRPM のウィンドウで削除する各パッケージのアイコンを右クリックしポップアップメニューの [Uninstall] をクリックしてください ( またはパッケージアイコンを選択して [Uninstall] ボタンをクリックできます ) コマンドラインからの削除サーバから LifeKeeper を削除するには rpm -e <packagename> コマンドを使用して LifeKeeper のパッケージをすべて削除してください rpm コマンドを使用する手順の詳細については rpm(8) のマニュアルページを参照してください例えば LifeKeeper Core パッケージを削除するには以下のコマンドを入力します rpm -e steeleye-lk 参考として LifeKeeper Core パッケージクラスタに含まれるパッケージを示します steeleye-lk steeleye-lkgui steeleye-lkhlp steeleye-lkip steeleye-lkman steeleye-lkraw steeleye-lkcciss ディストリビューションの有効化パッケージの削除 LifeKeeper パッケージを削除した後 SPS のインストールイメージファイルに含まれる設定スクリプトがインストールしたディストリビューションに固有の有効化パッケージを削除する必要がありますお使いの Linux ディストリビューションによりパッケージの名前は steeleye-lk<linux Distribution> のようになっています steeleye-lkredhat steeleye-lksuse ファイアウォールを使用した状態での LifeKeeper の実行以下のネットワークアクセス要件を満たす場合 LifeKeeper for Linux は同一サーバ上にファイアウォー 236 User Guide

257 LifeKeeper のコミュニケーションパスルを設定した状態で実行できます注記 : ファイアウォールを単に無効にする場合は後述のファイアウォールの無効化を参照してください LifeKeeper のコミュニケーションパスコミュニケーションパスは特定の IP アドレスを使用して LifeKeeper クラスタ内にあるサーバペアの間に設定されます TCP ポート 7365 は作成時にデフォルトで各通信のリモート側により使用されますが通信の開始側の TCP ポートは任意です推奨方法はそのシステムが既知のコミュニケーションパスでローカルとリモートの IP アドレスの各指定ペアについて受信と送信の両方のトラフィックを許可するように各 LifeKeeper サーバにファイアウォールを設定することです LifeKeeper GUI の接続 LifeKeeper GUI はデフォルトの初期接続ポートであるポート 81 と 82 を含めて特定の TCP ポートを多数使用しますまた LifeKeeper GUI はポート 1024 以降をオブジェクトの送受信に使用するリモートメソッド呼び出し (RMI) も使用しますこれらすべてのポートが各 LifeKeeper サーバのファイアウォールで少なくとも GUI クライアントが動作する外部システムに対して開いている必要があります LifeKeeper の IP アドレスリソース IP アドレスに関連するアプリケーションにアクセスする必要があるクライアントシステムから LifeKeeper の階層にある IP アドレスリソースにアクセスできるようにファイアウォールを設定する必要があります IP アドレスリソースは LifeKeeper クラスタ内のあるサーバから別のサーバに移動できるのですべての LifeKeeper サーバ上のファイアウォールを適切に設定する必要がありますまた LifeKeeper はブロードキャスト ping のテストを使用して IP アドレスリソースの健全性を定期的にチェックしますこのテストでは仮想 IP アドレスからブロードキャスト ping パケットを送信しローカルサブネット上の他のいずれかのシステムが最初に応答するまで待ちますこのテストが失敗しないようにするには各 LifeKeeper サーバ上のファイアウォールが以下のタイプのネットワーク動作を許可するように設定する必要があります仮想 IP アドレスからのインターネット制御メッセージプロトコル (ICMP) パケットの送信 ( アクティブな LifeKeeper サーバがブロードキャスト ping を送信できる ) 仮想 IP アドレスからの ICMP パケットの受信 ( 他の LifeKeeper サーバがブロードキャスト ping を受信できる ) 任意のローカルアドレスからの ICMP 応答パケットの送信 ( 他の LifeKeeper サーバがブロードキャスト ping に応答できる ) 仮想 IP アドレスでの ICMP 応答パケットの受信 ( アクティブな LifeKeeper サーバがブロードキャスト ping への応答を受信できる ) LifeKeeper Data Replication LifeKeeper Data Replication を使用する場合は複製に ndb を使用する任意のポートへのアクセスを許可するようにファイアウォールを設定する必要があります nbd が使用するポートは以下の式で計算できます SteelEye Protection Suite for Linux 237

258 ファイアウォールの無効化 <mirror number> + <256 * i> i は 0 から始まり使用されていないポート番号が計算されるまで加算されます /etc/services に定義されているポート netstat -an --inet の出力に含まれるポートまたは LifeKeeper Data Replication の他のリソースが使用中としてすでに定義されているポートは使用中です例 : LifeKeeper Data Replication リソースのミラー番号が 0 である場合式は当初使用するポートをとして計算しますがこの番号は一部の Linux ディストリビューションでは SCP 設定ポートとして /etc/services に定義されていますこの場合 i が 1 だけ増分されてポート番号が得られますこの番号はこれらの Linux ディストリビューションの /etc/services には定義されていませんファイアウォールの無効化ファイアウォールを無効にする場合は以下の手順に従ってください 1. 以下のコマンド ( お使いのファイアウォールパッケージによって異なる ) を使用してファイアウォールを停止してください /etc/init.d/ipchains stop または /etc/init.d/iptables stop IPv6 環境を使用している場合はかならず ip6tables を考慮してください /etc/init.d/ip6tables stop SuSE Linux Enterprise Server を実行している場合 /etc/init.d/susefirewall2_init stop /etc/init.d/susefirewall2_setup stop 2. パッケージを削除するか (rpm -e を使用 ) 以下のいずれかのコマンド ( お使いのファイアウォールパッケージによって異なる ) を使用して起動を無効にしてください /sbin/chkconfig --del ipchains または /sbin/chkconfig --del iptables /sbin/chkconfig --del ip6tables SuSE Linux Enterprise Server を実行している場合は SuSEfirewall2 の設定を管理する必要がありますファイアウォール経由での LifeKeeper GUI の実行場合によっては LifeKeeper クラスタが会社のファイアウォール内に配置され管理者はファイアウォールの外側にあるリモートシステムから LifeKeeper GUI を実行します LifeKeeper は GUI のサーバとクライアントとの通信にリモートメソッド呼び出し (RMI) を使用します RMI クライアントはそれぞれの方向に通信を確立できる必要があります RMI クライアントは動的ポートを使用するのでクライアントには推奨ポートを使用できません解決法としては以下のように ssh を使用してファイアウォールを通過する方法があります 238 User Guide

259 LifeKeeper の起動 1. 社内の IT 部門がファイアウォール内にアクセスするために十分にセキュリティの高い shell ポートを社内ファイアウォールに開けていることを確認します多くの場合 IT 部門がアクセスを許可するマシンは実際にはクラスタ内のマシンではなくそこからクラスタ内にアクセスできる中間マシンですこのマシンは Unix または Linux が動作するマシンである必要があります 2. 中間マシンと LifeKeeper サーバの両方が sshd (Secure Shell デーモン ) を実行していることおよび X11 ポート転送が有効になっていること ( これは通常 etc/ssh/sshd_config の `X11Forwarding yes' 行にある ) を確認してください不明の場合は IT 部門に依頼してください 3. X の Unix クライアントから以下のコマンドを使用して中間マシンにトンネルを作成します ssh -X -C <intermediate machine> -C はトラフィックの圧縮を意味し低速のインターネットリンクから受信する場合に役立つことが多々あります 4. 中間マシンから以下のコマンドを使用して LifeKeeper サーバにトンネルを作成します ssh -X <LifeKeeper server> 中間マシンは LifeKeeper サーバとの間にかなり高い帯域幅の接続をもつはずなのでこのコマンドには圧縮は不要です 5. すべての操作が良好に完了した場合以下のコマンドを実行してください echo $DISPLAY localhost:10.0 のような値に設定されます値が設定されない場合 X11 の転送がいずれかの sshd 設定ファイルで無効になっています 6. 以下のコマンドを実行して LifeKeeper サーバから単純な xterm をポップアップ表示できることを確認してください /usr/x11r6/bin/xterm 7. xterm が表示された場合以下のコマンドを使用して LifeKeeper で lkguiapp を実行できます /opt/lifekeeper/bin/lkguiapp 8. GUI コンソールが表示されるまで待ってください Java は多くのグラフィックス動作を使用し低速リンクで伝播するには時間がかかります ( 圧縮している場合でも ) しかし最終的には GUI コンソールが表示されます LifeKeeper の起動デフォルトではすべての SPS ソフトウェアはディレクトリ /opt/lifekeeper にインストールされますすべての確認作業が完了すると両方のサーバで LifeKeeper を起動する準備が整いますこのセクションでは LifeKeeper サーバデーモンプロセスの起動について説明します LifeKeeper GUI アプリケーションは別個のコマンドを使用して起動され LifeKeeper GUI の設定に説明されています LifeKeeper には LifeKeeper デーモンプロセスの起動と停止を行うコマンドラインインターフェースが用意されていますこれらのデーモンプロセスは LifeKeeper GUI を起動する前に実行する必要があります SteelEye Protection Suite for Linux 239

260 LifeKeeper サーバプロセスの起動 LifeKeeper サーバプロセスの起動 LifeKeeper がシステムで現在実行されていない場合はすべてのサーバに対するユーザルートとして次のコマンドを入力してください /opt/lifekeeper/bin/lkstart 数秒の遅延の後情報メッセージが表示されます注記 : LifeKeeper を起動するときに LifeKeeper Distribution Enabling Package を参照するエラーメッセージが表示された場合は LifeKeeper インストールイメージファイルをインストール / 再インストールする必要があります lkstart コマンドの詳細についてはコマンドラインで man LCD を入力して LCD(1M) マニュアルページを参照してください LifeKeeper の停止 LifeKeeper を停止する必要がある場合はルートとして次のコマンドを入力して停止してください /opt/lifekeeper/bin/lkstop このコマンドは管理されているサーバ上で現在実行されているすべての LifeKeeper デーモンプロセスを停止しますリソース階層の転送 LifeKeeper サーバで定期的なメンテナンスやその他の作業を実行する必要がある場合 LifeKeeper の GUI を使用して In Service のリソースを別のサーバに移動できますサーバ A からサーバ B に In Service のリソース階層を転送するには GUI を使用してサーバ B でリソース階層を in service にしますサーバ A のリソースがすべて対応するバックアップサービスで In Service になるまで操作を繰り返します手順についてはリソースを In Service にするを参照してくださいサーバ A のリソースがすべてバックアップサーバでアクティブになった後アプリケーションの処理に影響を与えることなくサーバ A をシャットダウンできますただしメンテナンスの期間中クラスタ内にあるサーバ数によってはリソースが LifeKeeper で保護されないことがありますテクニカルノートお使いの LifeKeeper 環境に関する設定と動作上の問題に関する以下のテクニカルノートをお読みになることを強く推奨します LifeKeeper の機能項目説明 240 User Guide

261 チューニングライセンス LifeKeeper を使用するには各サーバに一意の実行時ライセンスキーが必要ですこれは物理サーバと仮想サーバの両方に適用されますライセンスキーは LifeKeeper Core ソフトウェアおよび LifeKeeper リカバリキットの各パッケージに必要ですインストールスクリプトがサーバの Host ID を取得して表示する Licensing Utilities パッケージをインストールします Host ID およびソフトウェアに付属のアクティベーション ID が SIOS Technology Corp の Web サイトからライセンスキーを取得するために使用されます. 大型クラスタのサポート国際化とローカライズ LifeKeeper は最大 32 台のサーバを持つ大型クラスタの設定をサポートしますただし LifeKeeper 以外の多くの要因がクラスタ内でサポートされるサーバの台数に影響することがありますこの要因としてストレージの相互接続オペレーティングシステムストレージソフトウェアの制限などがありますサポートされる最大クラスタサイズを調べるにはベンダ固有のハードウェアとソフトウェアの設定情報を参照してください LifeKeeper for Linux v5.2 以降はリソース名とタグ名でのワイド / マルチバイト文字の使用をサポートしていますがネイティブの言語メッセージサポートは含まれていません Java のプロパティファイルのロケール固有バージョンを作成することにより LifeKeeper の GUI をローカライズできますが現在フルにローカライズされているのは英語バージョンのみですただし LifeKeeper の GUI に表示される多くのメッセージは LifeKeeper Core から来ているので GUI のローカライズはユーザにとって Core ソフトウェアがフルにローカライズされるまでの単なる部分的な解決法です追加情報については制限または既知の問題の言語環境の影響も参照してください LifeKeeper の MIB ファイル Watchdog STONITH XFS ファイルシステム IPv6 LifeKeeper は LifeKeeper クラスタ内で発生するイベントを記述する SNMP トラップを送出するように設定できますこの機能の設定に関する詳細については lk_ configsnmp(8) のマニュアルページを参照してください LifeKeeper のトラップを記述する MIB ファイルは /opt/lifekeeper/include/lifekeeper-mib.txt に記載されています LifeKeeper は Watchdog 機能をサポートしていますこの機能は SIOS Technology Corp. により Red Hat EL 5.5 の 64- ビット Red Hat EL 5.6 の 32- ビットおよび Red Hat EL 6 + softdog でテスト済みです LifeKeeper は STONITH 機能をサポートしていますこの機能は SIOS Technology Corp. により IBM x3550 x86_64 アーキテクチャ上の SLES 11 および RHEL5.5 の 64- ビットでテスト済みです XFS ファイルシステムはファイルシステムのチェックと修正に fsck ユーティリティを使用しませんその代わりにログの再生をマウントに依存します整合性の問題についての懸念がある場合はシステム管理者がファイルシステムを out of service にしてアンマウントし xfs_check(8) と xfs_repair(8) を実行して問題を解決する必要があります SIOS は ip コマンドの使用に移行し ifconfig コマンドを使用しなくなりました ( 詳細については IPv6 の既知の問題を参照 ) チューニング項目説明 SteelEye Protection Suite for Linux 241

262 チューニング IPC セマフォと IPC 共有メモリシステムファイルテーブル LifeKeeper にはプロセス間通信 (IPC) セマフォと IPC 共有メモリが必要です以下の Linux カーネルオプションの Red Hat のデフォルト値は /usr/src/linux/include/linux/sem.h にあり LifeKeeper の多数の設定をサポートするのに十分な値ですオプション必須 Red Hat 6.2 のデフォルト値 SEMOPM SEMUME SEMMNU SEMMAP SEMMNI LifeKeeper がバックアップシステムに正常にフェイルオーバするためにはシステムリソースが使用可能である必要があります例えばシステムファイルテーブルがフルの場合 LifeKeeper が新しいプロセスを開始してリカバリを実行することができない可能性がありますエンタプライズパッチを持つカーネル (LifeKeeper がサポートするものを含む ) では file-max つまりシステムで開いているファイルの最大数はデフォルトでシステムメモリサイズの 1/10 に設定されますこれは LifeKeeper の多数の設定をサポートするのに十分な値です file-max 値をデフォルト値よりも低く設定すると予期しない LifeKeeper の障害が発生することがあります file-max 値は以下のコマンドで取得できます cat /proc/sys/fs/file-nr このコマンドは 3 つの値を返します 1 番目の値はファイルテーブルのエントリのこれまでの最大値 ( システムがこれまでに検出した最大値 ) 2 番目の値は現在のファイルテーブルのエントリ数 3 番目の値は file-max の値です file-max を調整するには /etc/sysctl.conf の fs,file-max 値を追加 ( または変更 ) し ( フォーマットについては sysctl.conf(5) を参照 ) sysctl p 次にこのファイルを実行してシステムを更新します /etc/sysctl.conf の値は再起動後も保持されます 242 User Guide

263 LifeKeeper の動作 LifeKeeper の動作 Linux ファイアウォールと SELinux の共存 nolock Option ファイアウォールと SELinux がインストール時に有効になりますインストールの完了後 SELinux を無効にしファイアウォールを変更する必要があります SELinux のモードが有効または許可の場合 LifeKeeper はインストールされず機能しません RedHat の SELinux を無効にするにはホストシステムのコンソールから systemconfig-securitylevel-tui ツールを実行してください SELinux for SLES 11 SP1 が提供されていますがこれも無効にする必要があります ( AppArmor ( このセキュリティモデルを使用するディストリビューションの場合 ) は有効にすることができますホストのファイアウォールが有効の場合 LifeKeeper は機能しますただし絶対に必要な場合以外はファイアウォールは無効にし LifeKeeper が保護するリソースは別の保護ファイアウォール内に配置してください LifeKeeper をファイアウォールを有効にしたホストと共存させる必要がある場合 LifeKeeper はコミュニケーションパス GUI IP およびデータ複製に特定のポートを使用します Linux のファイアウォール機能を使用する場合 LifeKeeper が使用する特定のポートを開く必要があります RedHat のファイアウォールを無効にしたり変更したりするにはホストシステムのコンソールから system-config-securitylevel-tui ツールを実行してください SUSE のファイアウォールを無効にしたり変更したりするには yast2 を実行し [Security and User] [Firewall] を順に選択してください詳細についてはファイアウォールを使用した状態での LifeKeeper の実行を参照してくださいロック処理を伴うストレージアプリケーションを使用する際以下の NFS マウントオプションの推奨として SPS では nolock オプションを追加で設定する必要があります例 : rw,nolock,bg,hard,nointr,tcp,nfsvers=3,timeo=600,rsize=32768,wsize=32768,actimeo=0. Out of LifeKeeper サーバの障害発生後のリカバリの一部として障害が発生したサーバに設定さ Service の階はその時点で優先順位が最高の alive のサーバで復旧されますこれは障害が発生れているリソース階層のうち障害発生時にいずれかのサーバで In Service ではないもの層のしたサーバ復旧するサーバクラスタ内のその他のサーバなど Out of Service の階層が復旧最後に In Service であったサーバを問いません Suid マウントオプションカーネルデバッガ (kdb) init s suid マウントオプションは root としてマウントするときのデフォルトでありマウントコマンドにより /etc/mtab に書き込まれることはありません LifeKeeper 環境では suid マウントオプションは不要です LifeKeeper が保護するサーバでカーネルデバッガ (kdb) を使用したり init s に移動する前にそのサーバで LifeKeeper をシャットダウンするか LifeKeeper が保護するリソースをバックアップサーバに切り替える必要があります LifeKeeper の SCSI 予約デーモン (lkscsid と lkccissd) を有効にした状態で ( デフォルトで有効になっている ) kdb を使用すると予期しないパニックが発生することがあります SteelEye Protection Suite for Linux 243

264 サーバの設定ロックしている共有デバイスでのシステムパニック項目 LifeKeeper はロックを使用して共有 SCSI バス上にある他のサーバがアクセスしないように共有データを保護します他のサーバがデバイスをロックしたことにより LifeKeeper がデバイスにアクセスできない場合致命的なエラーが発生し即座に対処する必要があります対処しない場合データが破損するおそれがありますこの条件が検出された場合 LifeKeeper はシステムにパニックを発生させる機能を有効にします共有デバイスが予約された状態で LifeKeeper が lkstop 以外の方法により停止した場合 ( これは kdb または init s の実行で発生することがある ) 他のサーバがリソースを復旧するときに LifeKeeper のロックメカニズムによりカーネルパニックのトリガになることがありますこの方法で LifeKeeper を停止する前にリソースをすべて Out of Service にする必要があります説明サーバの設定項目 BIOS のアップデート説明使用可能な最新の BIOS を常にすべての LifeKeeper サーバにインストールする必要があります LifeKeeper 7.5 以降のパッケージ依存リスト以下にお使いの OS ディストリビューションにより LifeKeeper 7.5 以降の必須パッケージに必要となる場合がある依存関係のリストを示します重要 : これらのパッケージの 32- ビットバージョンが必要ですこのリストの依存関係を満たすために追加のパッケージのインストールが必要になる場合があります bzip2 OR libbz2 OR bzip2-lib glibc iproute OR iproute2 iptables iputils libstdc++ OR libstdc++43 mktemp nfs-utils OR nfs-kernel-server (NFS 共有を保護する場合 ) pam zlib 注記 : OR は Linux OS ディストリビューションのバリエーションですこのリストには依存関係がすべて含まれているわけではありませんベースパッケージと Linux OS ディストリビューションによっては追加のパッケージの依存関係が必要になることがありますまた特定のオプションのソフトウェアコンポーネントがインストールされていることを設定スクリプトが検出した場合追加のパッケージの依存関係が必要になることがあります yum や zypper などリポジトリベースのパッケージマネージャの使用を検討することを推奨しますこれらのパッケージマネージャは定義済みのソフトウェアリポジトリを検索して依存関係を自動的に解決するように設計されているのでこれらの必須パッケージのインストールが容易になります 244 User Guide

265 [Confirm Failover] と [Block Resource Failover] の設定 [Confirm Failover] と [Block Resource Failover] の設定以下の説明例および考慮事項をよく読んで理解してからお使いの LifeKeeper 環境で [Confirm Failover] または [Block Resource Failover] を設定してくださいこれらの設定はコマンドラインまたは LifeKeeper の GUI の [Properties] パネルから使用できます Confirm Failover On: 定義システム A からシステム B へのフェイルオーバの手動確認を有効にします ( システム A はプロパティが [Properties] パネルに表示されるサーバでシステム B はチェックボックスの左にあるシステム ) あるシステムでこのオプションをオンに設定した場合障害発生が検出されたシステムについて LifeKeeper がフェイルオーバリカバリを実行するにはシステム管理者による手動確認が必要になりますフェイルオーバを確認するには lk_confirmso コマンドを使用しますデフォルトではこのコマンドを実行するまで管理者には 10 分の猶予時間がありますこの時間は /etc/default/lifekeeper の CONFIRMSOTO 設定で変更できます管理者が 10 分以内に lk_confirmso コマンドを実行しない場合フェイルオーバは続行されるかブロックされますデフォルトではフェイルオーバが続行されますこの動作は /etc/default/lifekeeper の COMFIRMSODEF 設定で変更できます例 : 自動フェイルオーバをすべてブロックする場合は [Properties] パネルの [Confirm Failover On] オプションを設定しさらに CONFIRMSODEF を 1 ( フェイルオーバをブロック ) CONFIRMSOTO を 0 ( フェイルオーバ動作が決定されるまで待機しない ) に設定してくださいこの設定を選択するタイミング : この設定は設定に冗長ハートビートコミュニケーションパスを含まない多くのディザスタリカバリその他の WAN 設定で使用されます通常のサイト ( 非マルチサイトクラスタ ) ではあるサーバで [Properties] ページを開き [Confirm Failover] フラグをオンに設定するサーバを選択してくださいマルチサイト WAN の設定の場合 : フェイルオーバの手動確認を有効にしてくださいマルチサイト LAN の設定の場合 : フェイルオーバの手動確認を有効にしないでくださいマルチサイトクラスタ環境では非ディザスタシステムから DR システムを選択し [Set Confirm Failover On] チェックボックスをオンにしますクラスタ内の非ディザスタサーバのそれぞれについて [Properties] パネルを開いてこの設定を選択する必要があります Block Resource Failover On: 定義 - デフォルトではリソースのすべての障害について復旧イベントが発生しローカルシステムの障害リソースの復旧が試行されますローカルリカバリが失敗した場合または有効になっていない場合はリソースが定義されている優先順位が次に最も高いシステムに LifeKeeper がローカル履歴を転送しますただし宛先として指定したシステムでこの設定を選択している場合リソース障害に起因するリソースの転送はすべてブロックされますこの設定が有効の場合以下のメッセージがログに記録されます Local recovery failure, failover blocked, MANUAL INTERVENTION REQUIRED SteelEye Protection Suite for Linux 245

266 条件 / 考慮事項 : 条件 / 考慮事項 : マルチサイト設定では設定のすべてのサーバについてフェイルオーバのブロックを選択しないでください注記 : この設定はシステム全体の障害が発生した場合のフェイルオーバ動作には影響しませんリソースの障害に起因するフェイルオーバのみをブロックします NFS クライアントのオプション LifeKeeper で保護する NFS サーバを設定するときには NFS クライアントがこのサーバに接続する方法がフェイルオーバ時に再接続する速さに大きな影響を与えます NFS クライアントをマウントするときの考慮事項 NFS サーバはクライアントコンピュータにネットワークベースのストレージシステムを提供しますこのリソースを使用するにはクライアントシステムは NFS サーバによりエクスポートされた既に NFS であるファイルシステムをマウントする必要があります NFS クライアントを LifeKeeper が保護する NFS リソースに接続する方法についていくつかのオプションをシステム管理者は考慮する必要があります UDP または TCP の選択 NFS プロトコルはユーザデータグラムプロトコル (UDP) と伝送制御プロトコル (TCP) のいずれかを活用できます.NFS は従来クライアント / サーバの通信に UDP プロトコルを使用してきましたこの理由の 1 つは NFS が UDP プロトコルを使用してステートレス方式で動作するほうが容易だからですこのステートレスであることが高可用性のクラスタ化では重要ですこれは保護されている NFS サーバリソースがクラスタホスト間で切り替えられた場合にクライアントを容易に認識できるからです一般的に LifeKeeper が保護する NFS リソースを操作するときには UDP プロトコルが TCP よりも良好に動作する傾向があります /etc/exports の Sync オプション LifeKeeper が保護する NFS リソースの場合エクスポートオプションとして sync を指定することが推奨されます sync オプションはディスクに書き込みを実行してから肯定応答を NFS クライアントに送信するように NFS に指示しますもう 1 つのオプションである async も使用できますがこのオプションを使用するとデータが破損するおそれがありますこれはディスクに書き込みを実行する前に NFS 書き込みの肯定応答をクライアントに送信するからです NFS クライアントも NFS ファイルシステムのマウント時にオプションとして sync を指定できます Red Hat EL6 ( および Fedora 14) クライアントと Red Hat EL6 NFS サーバの使用 Red Hat EL6 用 NFS サーバのバグと思われるものにより Red Hat EL6 ( および Fedora 14) を実行する NFS クライアントは NFS のバージョン (nfsvers) および UDP の両方をマウントコマンドに指定できませんこれと同じ動作が Ubuntu10.10 クライアントでも確認されていますこの動作は Red Hat EL6 NFS を使用する Red Hat EL5 クライアントでは確認されておらず Red Hat EL5 NFS サーバを使用するすべてのクライアントで確認されていません Red Hat EL6 (Fedora 14) クライアントと Red Hat EL 6 NFS サーバを使用するための NFS マウントディレクトリの最善の組み合わせは以下のとおりです mount <protected-ip>:<export> <mount point> -o nfsvers=2,sync,hard,intr,timeo=1 246 User Guide

Red Hat EL5 NFS クライアントと Red Hat EL6 NFS サーバの使用この組み合わせでは LifeKeeper が保護する NFS サーバがスイッチオーバまたはフェイルオーバを実行する場合にクライアントの再接続時間が最短になります Red Hat EL5 NFS クライアントと Red Hat EL6 NFS サーバの使用 Red Hat EL5 を実行する NFS

267 Red Hat EL5 NFS クライアントと Red Hat EL6 NFS サーバの使用この組み合わせでは LifeKeeper が保護する NFS サーバがスイッチオーバまたはフェイルオーバを実行する場合にクライアントの再接続時間が最短になります Red Hat EL5 NFS クライアントと Red Hat EL6 NFS サーバの使用 Red Hat EL5 を実行する NFS クライアントと Red Hat EL6 NFS サーバを使用するときに再接続時間が短い最善のオプションの組み合わせは以下のとおりです mount <protected-ip>:<export> <mount point> -o nfsvers=3,sync,hard,intr,timeo=1,udp クラスタの例拡張したマルチクラスタの例 SteelEye Protection Suite for Linux 247

268

269 トラブルシューティングメッセージカタログでは操作管理 GUI など SteelEye Protection Suite for Linux を使用しているときに出会う可能性があるすべてのエラーコードを列挙しますまたエラーコードの原因に関する追加の説明や問題解決のために必要な処置についても必要に応じて記載しますこの完全なリストを検索すると受信したエラーコードを見つけることができますまた以下の個別のメッセージカタログに直接アクセスすることもできますコアメッセージカタログファイルシステムキットメッセージカタログ Gen/App キットメッセージカタログ GUI メッセージカタログ IP キットメッセージカタログ Oracle Listener キットメッセージカタログ Oracle キットメッセージカタログ SCSI キットメッセージカタログ SDR キットメッセージカタログ上記のメッセージカタログに加え以下のトピックでも直面する可能性がある問題や制限事項のトラブルシューティングについて詳細を説明します既知の問題と制限下記に LifeKeeper for Linux で明らかになっている制限または既知の問題を機能領域ごとに示しますインストール説明リリース 7.4 以降では SteelEye 製品 RPM パッケージの再割り当てはサポートされません SUSE にインストールしている場合コアでパッケージチェックエラー (rpm -V steeleye-lk) が発生します以下のエラーが発生します SUSE がシャットダウンスクリプトを実行する方法により ( 他の Linux ディストリビューションとは異なり ) 以下のスクリプトがインストール後に別の場所に移動するので実行レベルを変更するか再起動しているときに LifeKeeper はシャットダウンされます以下は steeleye-lk パッケージを確認しているときに発生する唯一のエラーです Missing /etc/rc.d/rc0.d/k01lifekeeper Missing /etc/rc.d/rc1.d/k01lifekeeper Missing /etc/rc.d/rc6.d/k01lifekeeper SteelEye Protection Suite for Linux 249

270 インストール GUI はデフォルトの RHEL6 64-bit では動作しません Red Hat Enterprise Linux 6 64-bit には互換性の問題があります解決方法 : LifeKeeper をインストールする前に OS のインストールメディアに含まれている以下のパッケージをインストールしてください LifeKeeper をインストールする前にインストールされていない場合インストール作業が正常に終了しません libxau el6.i686.rpm libxcb el6.i686.rpm libx el6.i686.rpm libxext el6.i686.rpm libxi el6.i686.rpm libxtst el6.i686.rpm 新しいデバイスがスキャンされているときに nbd ドライバがロードされると multipathd デーモンはエラーログにエラーを記録します解決方法 : ログでこれらのエラーを避けるには /etc/multipath.conf の blacklist に devnode "^nbd" を追加します NFS Setup Logging が不完全です ISO イメージ sps.img からインストール設定スクリプトを実行する場合 NFS のスクリプトパッチプロセスの結果は LifeKeeper インストールログ (/var/log/lk_install.log) でキャプチャされません対応策はありません Html.pm パッケージとの競合のため 7.x からのコアパッケージのアップグレードに失敗します LifeKeeper Core パッケージ (steeleye-lk) をリリース以前からリリース以降にアップグレードしたところファイル /opt/lifekeeper/lib/perl/html.pm に競合エラーが発生しましたこのエラーを解決しコアパッケージを正常にインストールするには --force オプションを rpm に使用する必要がありますループバックインターフェースを INTERFACELIST 設定で使用する際ライセンスが正常に機能しませんループバック (lo) インターフェースを INTERFACELIST 設定で使用できません IP アドレスに基づくライセンスファイルが使用されている場合 lklicmgr ツールは HOSTID mismatch (HOSTID が不一致です ) というメッセージを誤表示します IP アドレスに基づくライセンスファイルが使用されている場合 lklicmgr は HOSTID 不一致エラーを誤表示しますこれは lklicmgr の表示の問題に過ぎませんライセンスは予期したとおりに機能します 250 トラブルシューティング

271 インストール nfslock init スクリプトのパッチをあてる際 HA 向けの NFS 設定に失敗します NFS の HA には nfs-utils パッケージが必須ですそのパッケージがシステムにインストールされていない場合は nfslock init スクリプトの HA 機能を有効にするパッチスクリプトが失敗します解決方法 : nfs-utils パッケージをインストールしその後 SPS インストールセットアップスクリプトを再度実行してください SteelEye Protection Suite for Linux 251

272 LifeKeeper Core LifeKeeper Core 252 トラブルシューティング

273 LifeKeeper Core 説明言語環境の影響一部の LifeKeeper スクリプトは Linux システムユーティリティの出力を解析し一定のパターンに従って情報を抽出します英語圏以外のロケールで一部のコマンドが実行されている場合予測されたパターンは変更され LifeKeeper スクリプトは必要な情報の取得に失敗しますこのため言語環境変数 LC_MESSAGES は /etc/default/lifekeeper で POSIX C locale (LC_MESSAGES=C) に設定されています言語を英語に設定して Linux をインストールする必要はありません ( インストールメディアで使用可能な言語を選択できます ) /etc/default/lifekeeper の LC_MESSAGES の設定は LifeKeeper にのみ影響します /etc/default/lifekeeper の LC_MESSAGES の値を変更すると LifeKeeper の動作に悪影響を与える可能性があります悪影響はメッセージカタログがさまざまな言語とユーティリティに対応してインストールされているかどうかおよび LifeKeeper が予期していないテキスト出力をそれらが生成するかどうかに左右されますファイルシステムラベルは大規模な設定で使用しないことを推奨しますファイルシステムラベルを使用すると大きなクラスタの場合起動時にパフォーマンスが低下する可能性がありますラベルを使用するにはシステムに接続されるすべてのデバイスをスキャンする必要があり通常はその結果として問題が生じます SAN に接続されているシステム特にデバイスへのアクセスがブロックされている LifeKeeper が導入されているシステムの場合このスキャニングは非常に遅くなる可能性があります Red Hat システムでこのパフォーマンスの問題を防ぐには /etc/fstab を編集しラベルをパス名に置き換えます SUSE SLES 10 を実行している QLogic ドライバ (qla2xxx) のリザベーションを解除できません QLogic ドライバ (qla2xxxx) を使用している SUSE SLES 10 システムではフェイルオーバが機能しませんストック QLogic ドライバで SLES 10 を実行している x86 ボックスではリザベーションを解除できないのでフェイルオーバは機能しません SLES 10 で配布された qla2xxx ドライバはハングした IO があった場合リセットを発行するだけです注記 : SLES 10 SP1 で配布された qla2xxx ドライバーで問題は修正されました gen/app リソースで構文エラーが発生する可能性がありますコアのアップグレードをせずに steeleye-lkgui パッケージのみアップグレードした場合 gen/app リソースで構文エラーが発生します steeleye-lkgui パッケージには同じバージョンまたはそれ以降のバージョンのコアを必要とする gen/app GUI コンポーネントへの更新が含まれています注記 : LifeKeeper をアップグレードする際に GUI とコアパッケージを最新バージョンにアップグレードする必要があります GUI パッケージと一緒にコアをアップグレードした場合エラーは発生しないはずです SLES10 システムでシャットダウンがハングします SLES10 を備えた AMD64 システムでシャットダウンを実行するとシステムはロックアップしシャットダウンは完了しませんこれは bug # で Novell にレポートされていますこのロックアップは SLES10 の powersave package が原因で発生します対応策 : SLES10 の powersave package を削除しシャットダウンが正常に完了できるようになります SteelEye Protection Suite for Linux 253

274 LifeKeeper Core lkscsid は sendevent を発行するとシステムを停止します lkscsid はディスク障害を検出するとデフォルトで sendevent を LifeKeeper に発行し障害から復旧しようとします sendevent はまずローカルで障害から復旧しようとしますそれに失敗するとディスクの階層を別のサーバに切り替えて障害から復旧しようとします一部のバージョンの Linux (RHEL5 および SLES11) では lkscsid は sendevent を発行できないため代わりにすぐにシステムを停止しますこれは /dev/sda などの SCSI デバイスノードを使用している階層にのみ影響します RHEL6 64-bit ではセットアップが失敗します Red Hat Enterprise Linux 6 64-bit には互換性の問題があります解決方法 : LifeKeeper をインストールする前に OS のインストールメディアに含まれている以下のパッケージをインストールしてください LifeKeeper セットアップを実行する前にインストールされていない場合セットアップは正常に終了しません rpm -i compat-libstdc el6.i686 libgcc el6.i686 rpm -i nss-softokn-freebl el6.i686 glibc el6.i686 注記 : 詳細については LifeKeeper 7.5 以降のパッケージ依存関係のリストを参照してください DataKeeper の Create Resource が失敗します Citrix XenServer ( または IDE ディスクエミュレーションを提供できるその他のハイパーバイザ ) で実行されている完全に仮想化された VM で DataKeeper を使用している場合 create でエラーが発生します ERROR ( エラー ):Cannot get the hardware ID of the device "dev/hda3" ( デバイス dev/hda3 のハードウェア ID を取得できません ) これは完全に仮想化された VM がローカルディスクを IDE ドライバとして表示させ getid がこれらの VM にある IDE ディスクを適切にクエリーできないためです対応策 : /dev/hda* を DEVNAME device_pattern ファイルに追加します次に例を示します # cat /opt/lifekeeper/subsys/scsi/resources/devname/device_ pattern /dev/hda* API アクセスに対するホスト名の指定 LifeKeeper サーバ認証情報の格納に使用するキー名は他の LifeKeeper サーバのホスト名と完全に一致する必要があります ( そのサーバに対する hostname コマンドで表示されます ) ホスト名が FQDN の場合認証キーは FQDN である必要がありますホスト名が短縮名の場合キーも短縮名にする必要があります対応策 : credstore によって格納されたホスト名がホスト名と完全に一致していることを確認します 254 トラブルシューティング

275 LifeKeeper Core 以前のバージョンの LifeKeeper の lkbackups を使用する場合はでリストアする場合に /etc/default/lifekeeper を手動で更新する必要があります LifeKeeper/SPS ではロギングなどの主要なコアコンポーネントに対して大幅な機能強化が加えられていますこれらの機能強化は /etc/default/lifekeeper ファイルの設定に影響します lkbackup がをリストアするとこれらの設定は正しい値を持っていません解決方法 : LifeKeeper for Linux v8 未満で取得した lkbackup を restore する前に /etc/default/lifekeeper を保存します lkbackup から restore したら以下の新しい設定値にマージします LKSYSLOGTAG=LifeKeeper LKSYSLOGSELECTOR=local6 詳細については syslog でのロギングを参照してくださいリソースの作成後に lkbackup を restore すると破損したイクイバレンシが残されます作成したリソースの設定ファイルは lkbackup 中に保存されます lkbackup でバックアップした後で初めてリソースを作成した場合そのリソースは前のバックアップからリストアする際に適切に把握されない可能性があります解決方法 : 新しいリソースを初めて追加する前に lkbackup からリストアします新しいリソースが lkbackup の後で追加された場合リストアの前に削除するかリソースの階層のインスタンスを削除しリストアの後で階層を再拡張してください注記 : 特定のリソースを初めて作成する際に lkbackup を実行することを推奨しますフェイルオーバ時に誤った順序でリソースが remove されます階層が共通リソースインスタンスを別のルート階層と共有している場合カスケーディングフェイルオーバまたはリソースフェイルオーバの間リソースは誤った順序で remove されることがあります解決方法 : 共通ルートを作成すると階層のリソースの remove がトップダウンで実行されます 1. restore と remove を常に進める gen/app を作成します 2. 現在のルートをすべてこの新しい gen/app の子にします注記 : restore および remove スクリプトに /bin/true を使用するとこれが可能になります SteelEye Protection Suite for Linux 255

276 インターネット /IP ライセンスインターネット /IP ライセンス 256 トラブルシューティング

277 インターネット /IP ライセンス INTERFACELIST 構文 /etc/hosts 設定の依存関係 /etc/hosts 設定 : インターネットベースのライセンス (IPv4 アドレス ) を使用している場合 /etc/hosts の設定はライセンスの検証に悪影響を与える可能性があります LifeKeeper の起動に失敗した場合は以下のようなメッセージが出力されます Error in obtaining LifeKeeper license key (LifeKeeper ライセンスキーの取得エラー ): Invalid host. ( 無効なホストです ) The hostid of this system does not match the hostid specified in the license file. ( このシステムの hostid はライセンスファイルで指定した hostid と一致しません ) リストされているインターネット hostid が正しい場合 /etc/hosts の設定が原因の可能性があります /etc/hosts エントリを正しく一致させるには IPv6 エントリの前に IPv4 エントリを記載する必要があります /etc/hosts 設定が原因かどうかを確認するには次のコマンドを実行します /opt/lifekeeper/bin/lmutil lmhostid -internet -n 記載されている IPv4 アドレスがインストールされたライセンスファイルの IPv4 アドレスと一致しない場合正しいアドレスを返すために /etc/hosts を変更し IPv4 エントリを IPv6 エントリの前に配置する必要があります INTERFACELIST 構文 : デフォルトでは LifeKeeper のライセンスはプライマリネットワークインターフェース eth0 に基づいていますインターフェース eth0 の名前が変更されると LifeKeeper インストールおよびセットアップエラーが発生します LifeKeeper が一意のシステム HOST ID の取得に失敗する原因になるので名前の変更には対応していません RedHat Enterprise Linux 6.1 で導入された整合性のあるネットワークデバイス命名規約に対応するために RedHat Enterprise Linux 6.x でプライマリインターフェースの名前を指定するための INTERFACELIST 設定が追加されました整合性のあるインターフェースのネットワークデバイスの命名ではオンボードインターフェースに em< ポート番号 > pci アドインインターフェースに pci< スロット番号 >p< ポート番号 >_< 仮想機能インターフェース > を使用します RedHat Enterprise Linux 6.x システムの場合デフォルトでは LifeKeeper はネットワークデバイス em0 を探しますそのデバイスが存在しない場合 INTERFACELIST 設定を設定しプライマリインターフェース名を指定する必要があります設定にはプライマリインターフェース名のみを含めるだけで構いませんがコロン区切りのリストによる追加の名前 ( たとえば INTERFACELIST=em0:em1 など ) には対応していません注記 : INTERFACELIST 設定値は /etc/default/lifekeeper で設定する必要があります LifeKeeper Core パッケージがまだインストールされていない場合 /etc/default/lifekeeper は存在しませんこの場合設定スクリプト (export INTERFACELIST=em1 など ) を再実行する前に INTERFACELIST が環境で設定されていることを確認してください SteelEye Protection Suite for Linux 257

278 GUI GUI 説明 GUI を終了した後で Web ブラウザを介して再接続すると GUI ログインプロンプトが再表示されない場合があります GUI アプレットを終了するか切断してから同じ Web ブラウザセッションから再接続しようとするとログインプロンプトが表示されない場合があります回避策 : Web ブラウザを再度開きサーバに接続します Firefox ブラウザを使用している際はすべての Firefox のブラウザを閉じ再び開きます RHEL5 の lkguiapp が対応していないテーマに関するエラーをレポートします GUI アプリケーションクライアントを起動すると以下のコンソールメッセージが表示される場合がありますこのメッセージは RHEL 5 および FC6 Java プラットフォームのルックアンドフィールに由来するもので GUI クライアントの動作に悪影響を及ぼすことはありません /usr/share/themes/clearlooks/gtk-2.0/gtkrc:60:engine "clearlooks" is unsupported, ignoring ( エンジン clearlooks は未対応です無視しています ) ネットワークが切断され再接続された後で GUI は IP リソースの状態をすぐに更新しませんクラスタ内のサーバ間のプライマリネットワークが切断され再接続されると RMI/TCP レイヤーの問題のためリモート GUI クライアントの IP リソースの状態が更新されるまで 1 分 25 秒かかる場合があります 258 トラブルシューティング

をクリックすると LifeKeeper GUI の動作が可能になります推奨される処置 : セキュリティ警告の数を減らすには 2 つのオプションがあります SteelEye

279 GUI 説明 Java 署名 / 未署名混合コードの警告 - LifeKeeper Java GUI クライアントアプレットをリモートシステムからロードすると以下のセキュリティ警告が表示されることがあります [Run] をクリックすると以下のダイアログが表示されますブロックするかどうかを確認するメッセージが表示されます [No] をクリックすると LifeKeeper GUI の動作が可能になります推奨される処置 : セキュリティ警告の数を減らすには 2 つのオプションがあります SteelEye Protection Suite for Linux [Always trust content from this publisher] ボックスをチェックし [Run] をクリックしま

280 データレプリケーション説明ポート 778 が使用中の場合 steeleye-lighttpd プロセスの開始に失敗します steeleye-lighttpd の起動時にプロセスがポート 778 を使用している場合 steeleye-lighttpd の起動に失敗し GUI への接続障害が発生する解決方法 : クラスタ内のすべてのノードで以下の設定を行い LifeKeeper をすべてのノードで再起動します以下の行を /etc/default/lifekeeper に追加します API_SSL_PORT=port_number port_number は使用する新しいポートですデータレプリケーション説明両方のサーバに重要な I/O トラフィックを持つシンメトリックなアクティブ SDR 設定で netraid デバイス ( ミラー ) にマウントされたファイルシステムが応答を停止し結果的にシステム全体がハングします Linux バッファキャッシュの単一スレッドの特性によりバッファキャッシュフラッシングデーモンはリモートでコミットする必要があるバッファをフラッシュアウトしようとしてハングする可能性がありますフラッシングデーモンがハングするとクリアされていないバッファの数がシステムで許容されている上限 (/proc/sys/kernel/vm/bdflush で設定 ) を超えるとクリアされていないバッファを持つ Linux システムのすべてのアクティビティは停止しますこれはリモートシステムがリモートバッファを消去できなくなるような事態でないかぎり通常は深刻な問題ではありません LifeKeeper はネットワークの障害を検出しそのときにレプリケーションを停止するのでハング状態は消去されますただしリモートシステムがローカルシステムにもレプリケートされた場合 ( つまり相互がシンメトリカルにレプリケートされた場合 ) このフラッシングデーモンのハング状態に入った場合永久にデッドロックする可能性がありますデッドロックを解除するには両方のシステムの nbd-client デーモンを手動で停止します ( これによりミラーが切断されます ) ただしこのデッドロックを完全に防止する場合はシンメトリックアクティブレプリケーションを推奨しません GUI は SLES 10 SP2 システム上で適切な状態が表示されませんこの問題は SLES 10 SP2 カーネルのバグによるもので更新カーネルバージョンで修正されています SLES 10 SP2 では netstat は /proc/<pid>/fd という新しいフォーマットで切断されます解決方法 : SLES 10 SP2 を使用する場合はカーネルバージョンをにアップグレードしてください 260 トラブルシューティング

281 データレプリケーション圧縮レベル設定用に 32-bit zlib パッケージを RHEL 6 (64-bit) にインストールする必要があります RHEL 6 (64-bit) で SDR を使用する場合以下のエラーが表示されることがあります Could not start balance on Target when Compression Level is set on RHEL 6 (64-bit) ( 圧縮レベルが RHEL 6 (64-bit) で設定された場合ターゲットのバランスを開始できませんでした ) 解決方法 : この問題を解決するには RHEL 6 (64-bit) を使用する場合は 32-bit zlib パッケージをインストールしてくださいミラーが切断され /var/log/messages にたくさんのエラーが記述されますこの問題は (Red Hat EL 6.x や CentOS 6 で ) 意図的に障害を発生させるストレステストを実行しているとき ( 特にミラーターゲットシステムで実行されている nbd_server プロセスを停止しているときに ) にときおり見られますディストリビューションの最新カーネル (Red Hat EL 6.0 または 6.1 の場合は kernel el6 など ) にアップグレードするとこの問題が発生するリスクの軽減に役立つ場合がありますソースシステムを再起動するとこの問題はなくなります CentOS 6 ( el6) に付属のデフォルトカーネルでは ( ミラーの過負荷に過ぎない場合でも ) この問題はさらに頻繁に発生する可能性があります残念なことに CentOS はこの状態を改善するカーネル ( ) をまだリリースしていません SIOS は CentOS 6 で入手可能になり次第カーネルへのアップグレードを推奨していますカーネルのアップグレードに関する重要な情報 : SPS は一般的にいくつかの機能をサポートするためカーネルモジュールをインストールします ; そのため RedHat システムでカーネルパッチの適用 / カーネルのアップグレードを実施する際にインストールメディアから./setup スクリプトを再度実行し SPS の一部としてインストールしたカーネルを新しいカーネルとして有効にしてくださいこの操作を実施しない場合は SPS リソースを in service および / もしくは保護できない状態のままになります大きなミラーサイズを備えた md_raid1 プロセスではトップで高い CPU 使用率がレポートされます mdx_raid1 プロセス (X はミラー番号 ) では非常に大きなミラー (500GB 以上 ) を操作している際に一部の OS ディストリビューションで高い CPU 使用率がトップでレポートされることがあります解決方法 : CPU の使用率を減らすには LifeKeeper 設定 LKDR_CHUNK_SIZE でチャンクサイズを 1024 に変更しこの新しい設定を使用するためにミラーを削除して再作成します DataKeeper リソースで lkbackup を使用する場合は全同期が必要です lkbackup では instance と mirror_info ファイルを保存しますがソースおよびターゲットの状態として lkbackup からリストアした後で DataKeeper ミラーの全同期を実行することが最善の方策です SteelEye Protection Suite for Linux 261

282 IPv6 IPv6 262 トラブルシューティング

283 IPv6 説明 SIOS は ifconfig コマンドから ip コマンドの使用に移行しましたこの変更のため外部スクリプトを使用するお客様も同様の変更を行うことを推奨します ifconfig コマンドを発行し結果を解析して特定のインターフェースを探す代わりにスクリプトは ip -o addr show を使用し結果を解析して inet および secondary という語を含む行を検索します # ip -o addr show 1: lo:<loopback,up,lower_up> mtu qdisc noqueue state UNKNOWN \ link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 1: lo inet /8 scope host lo 1: lo inet6 ::1/128 scope host \ valid_lft forever preferred_lft forever 2: eth0:<broadcast,multicast,up,lower_up> mtu 1500 qdisc pfifo_ fast state UP qlen 1000 \ link/ether d2:05:de:4f:a2:e6 brd ff:ff:ff:ff:ff:ff 2: eth0 inet /22 brd scope global eth0 2: eth0 inet /22 scope global secondary eth0 2: eth0 inet /22 scope global secondary eth0 2: eth0 inet6 2001:5c0:110e:3364::1:2/64 scope global \ valid_lft forever preferred_lft forever 2: eth0 inet6 2001:5c0:110e:3300:d005:deff:fe4f:a2e6/64 scope global dynamic \ valid_lft 86393sec preferred_lft 14393sec 2: eth0 inet6 fe80::d005:deff:fe4f:a2e6/64 scope link \ valid_lft forever preferred_lft forever ip コマンドの上記の結果では以下の行に eth0 インターフェースの仮想 IP アドレスが含まれます 2: eth0 inet /22 scope global secondary eth0 2: eth0 inet /22 scope global secondary eth0 SteelEye Protection Suite for Linux 263

284 IPv6 /etc/sysconfig/network-scripts/ifcfg-<nicname> の IPV6_AUTOCONF = No が再起動または起動の際に考慮されません起動時に自動設定されたステートレスな IPv6 アドレスがネットワークインターフェースに割り当てられます IPV6_AUTOCONF=No が設定されているインターフェースのステートレス IPv6 アドレスでコミュニケーションパスが作成された場合任意のシステムリソースが ifdown <nicname>;ifup <nicname> などのインターフェースを管理する際にアドレスが削除されます IPV6_AUTOCONF が No に設定されているのでプライマリサーバを再起動した後で自動設定された IPv6 アドレスを使用しているコミュニケーションパスは復旧せず無効のままです解決方法 : スタティックな IPv6 アドレスのみを使用してください自動設定された IPv6 アドレスを使用すると再起動後に通信が失われたり NIC が変更されたりする可能性があります自動設定された IPv6 アドレスをコミュニケーションパス作成に使用できますがシステム管理者は以下の条件を認識する責任があります自動設定されたステートレスな IPv6 アドレスがネットワークインターフェース (NIC) MAC アドレスに準拠していることコミュニケーションパスが作成され関連 NIC が後で置き換えられた場合自動設定された IPv6 アドレスは異なるものになり LifeKeeper はコミュニケーションパスが無効になっていることを適切に表示しますコミュニケーションパスを再作成する必要があります RHEL5.6 ではホスト操作のあらゆる側面で一貫した IPv6 自動設定を確保するための動作を実行するには sysctl.conf net.ipv6.* 命令 ('if/ip' ユーティリティで参照される ifcfg- <nic> の明示的な IPV6_AUTOCONF 設定およびシステムが起動して init レベルを切り替える際に NIC 制御に影響する /etc/sysctl.conf) に加え個々のインターフェース設定ファイルを正確に設定するために詳細かつ具体的なドメインの知識が必要になります IP: IPv6 のソースアドレス変更設定ではソースアドレスが設定されません IPv6 IP リソースのソースアドレスを設定しようとすると何も変更されていない場合でも成功となります対応策 : 現在のところ対応策はありません今後のリリースで対応する予定です IP: 無効な IPv6 アドレス設定が IP リソース作成で許可されますオクテットに 4 文字を超える文字が含まれている場合 2001:5c0:110e:3368:000000: :61:14 という形式の IPv6 アドレスが許容されます対応策 : 正しい形式の IPv6 アドレスを入力してください IPv6 アドレス設定からホストに接続できません lkguiapp は解決可能なホスト名または IP アドレスの場合でも IPv6 の 16 進数アドレス設定からホストに接続できません lkguiapp では IPv4 設定ノードで接続する必要があります IPv6 のコミュニケーションパスは完全にサポートされています 264 トラブルシューティング

285 Apache bonding NIC に割り当てられているものの暫定的な状態のアドレスでは IPv6 リソースが ISP としてレポートされます LifeKeeper で IPv6 に保護されているリソースは IPv6 リソースが bonding インターフェース上にある SLES システムでは In Service Protected (ISP: In Service の保護 ) と不正に識別されますこれは 'active-backup' (1) および Linux カーネル以降とは別のモードです IPv6 の bonding リンクは解決できないアドレスを持つ暫定的な状態のままになります対応策 : bonding インターフェースモードを 'active-backup' (1) に設定しますまたは 'active-backup' (1) 以外のモードの場合リンク状態を tentative ( 暫定的 ) から valid ( 有効 ) に設定する更新したカーネルで操作しますカーネルのアップグレードに関する重要な情報 : SPS は一般的にいくつかの機能をサポートするためカーネルモジュールをインストールします ; そのため RedHat システムでカーネルパッチの適用 / カーネルのアップグレードを実施する際にインストールメディアから./setup スクリプトを再度実行し SPS の一部としてインストールしたカーネルを新しいカーネルとして有効にしてくださいこの操作を実施しない場合は SPS リソースを in service および / もしくは保護できない状態のままになります Apache 説明 Apache キットは IPv6 に対応していません httpd.conf で IPv6 を識別しません httpd.conf ファイルで Listen 命令エントリに割り当てられた IPv6 アドレスが原因で問題が発生します解決方法 : Apache Recovery Kit で IPv6 がサポートされるまでリソース作成後に IPv6 アドレスを httpd.conf ファイルに指定できません Oracle Recovery Kit 説明 Oracle Recovery Kit には Connection Manager および Oracle Names 機能のサポートが含まれていません LifeKeeper Oracle Recovery Kit には Oracle Connection Manager と Oracle Names という Oracle Net 機能のサポートが含まれていません Oracle Connection Manager は同じサービスにアクセスする必要がある多数の接続を管理するルーティングプロセスです Oracle Names はサービスアドレスの一括格納を管理する Oracle 固有の命名サービスです LifeKeeper Oracle Recovery Kit は送信されてきたクライアント接続要求をリスニングしサーバへのトラフィックを管理する Oracle Net Listener プロセスを保護します Oracle Listener に関する LifeKeeper 設定固有の情報については LifeKeeper for Linux Oracle Recovery Kit 管理ガイドを参照してください SteelEye Protection Suite for Linux 265

286 NFS Server Recovery Kit Oracle Recovery Kit は Oracle 10g の ASM またはグリッドコンポーネント機能をサポートしていません以下の情報は Oracle 10g データベースインスタンスのみを対象とします Oracle 10g で提供されている Oracle Automatic Storage Manager (ASM) 機能は現在 LifeKeeper ではサポートされていませんまた 10g のグリッドコンポーネントは LifeKeeper Oracle Recovery Kit によって保護されていません RAW デバイスファイルシステム論理ボリュームに対するサポートは現在の LifeKeeper for Linux Oracle Recovery Kit に含まれていますグリッドコンポーネントに対するサポートは gen/app リカバリキットを使用して LifeKeeper 保護機能に追加できます Oracle パッケージのインストールは LifeKeeper 実行中に app および type エントリを追加できません Oracle パッケージ ( バージョン 7.2) のインストール時に LifeKeeper が実行されていると Oracle リソース階層が作成されないので LifeKeeper を終了して再起動するまで app および typ エントリが作成されません解決方法 : LifeKeeper を停止してから Oracle rpm をインストールしてください 1. lkstop -f で LifeKeeper を停止します 2. Oracle をインストールします 3. LifeKeeper を再起動します lkstart Oracle Recovery Kit は NFS バージョン 4 をサポートしていません Oracle Recovery Kit は共有データベースストレージ用に NFS バージョン 3 をサポートしています NFSv4 ファイルロッキングメカニズムのため NFS バージョン 4 は現時点ではサポートされていません NFS Server Recovery Kit 説明最上位の NFS リソース階層は hanfs リソースのスイッチバックタイプを使用します障害から In Service 状態に復旧する際に NFS リソース階層がプライマリサーバにスイッチバックするかどうかを制御するスイッチバックタイプは hanfs リソースで定義されます一部のクライアントが nfs ファイルロックを再取得できません NFS クライアントとして動作しているとき一部の Linux カーネルは NFS ロックが解除されているので再取得する必要があるという NFS サーバからの通知に正常に応答しませんそのためこれらのシステムが LifeKeeper に保護されている NFS ファイル共有のクライアントである場合これらのクライアントで保持されている NFS ロックはフェイルオーバまたはスイッチオーバの際に失われますロック処理を伴うストレージアプリケーションを使用する際以下の NFS マウントオプションの推奨として SPS では nolock オプションを追加で設定する必要があります例 : rw,nolock,bg,hard,nointr,tcp,nfsvers=3,timeo=600,rsize=32768,wsize=327-68,actimeo= トラブルシューティング

287 SAP Recovery Kit NFS v4 の変更は SLES 11 nfs サブシステムの操作と互換性がありません SLES 11 の非 NFS v4 リモートエクスポートのマウンティングによって rpc.statd が開始されます NFS v4 ルートエクスポートを保護するクラスタ内の Out of Service ノードでは rpc.statd の開始に失敗します解決方法 : NFS v4 ルートエクスポートを保護しているクラスタで NFS v2/v3 と混在させないでください IPv6 では NFS v4 を設定できません IPv6 仮想 IP は NFSv4 階層にまとめられます解決方法 : NFSv4 リソースの作成時に IPv6 仮想 IP リソースを使用しないでください NFS v4: 拡張解除後に階層を再拡張できませんエクスポートポイントがすでにターゲットサーバでエクスポート済みなので拡張に失敗します階層がサーバ A で作成されサーバ B に拡張されサーバ B で In Service になりサーバ A から拡張解除された場合 NFS v4 階層のサーバ A への再拡張は失敗します解決方法 : サーバ A で exportfs -ra というコマンドを実行し残された追加エクスポート情報をクリーンアップします NFSv3: RedHat 6.x および CentOS 6.x ではファイルロックスイッチオーバに失敗しますサーバのフェイルオーバまたはスイッチオーバでファイルロックをフェイルオーバしても RedHat 6.x または CentOS 6.x システムでは機能しません NFSv3 のロックフェイルオーバは現在これらの OS バージョンではサポートされていません解決方法 : NFSv4 で有効なロックフェイルオーバ機能を使用します Oracle Recovery Kit は NFSv4 をサポートしていません Oracle Recovery Kit は共有データベースストレージ用に NFSv3 をサポートしています NFSv4 ファイルロッキングメカニズムのため NFSv4 は現時点ではサポートされていません SAP Recovery Kit 説明 SAP 階層の削除または拡張解除に失敗します同じ IP リソースを階層内の複数の場所に格納している SAP 階層を削除または拡張解除するとリソースが削除されずコアダンプが発生することもありますこの問題を修正するには拡張解除または削除操作に失敗した後で残ったリソースを LifeKeeper GUI から手動で削除しますサーバからコアファイルを削除するという方法もあります SteelEye Protection Suite for Linux 267

288 LVM Recovery Kit [Handle Warnings] により -e 行 1 で構文エラーが発生します [Handle Warnings] のデフォルトの動作 [No] を [Yes] に変更するとエラーを受信します解決方法 : このオプションをデフォルト設定の [No] のままにしてください注記 : [Yellow] は頻繁には障害を示さない一時的な状態のためこの設定をデフォルト選択の [No] のままにしておくことを強く推奨します同じ設定を選択すると Update Wizard のボタンが非表示になります現在の設定を変更せずに [Handle Warning] を更新しようとすると戻る必要があることを示す次の画面で [Done] ボタンが表示されません res_state に変更を加えると監視が無効になります [Protection Level] を [BASIC] に設定し SAP を手動でダウンさせた場合 ( 保守などの目的で ) FAILED とマークされ監視が停止します解決方法 : 監視を再開する場合 LifeKeeper はリソースを手動ではなく開始する必要があります ERS が Core/CI の親ではない場合 In Service の ERS がリモートホストで失敗します追加 SAP リソースの依存関係なしで ERS リソースを作成するとスイッチオーバ時に初期の In Service 状態が失敗します解決方法 : CI/Core インスタンス (SCS または ASCS) の親として ERS を作成してから In Service の状態を再試行します LVM Recovery Kit 説明 lkid の使用はディスク全体で LVM pvcreate と互換性がありません lkid を使用して LVM 物理ボリュームとして設定されているディスクで一意のディスク ID を生成すると lkid および LVM 情報が格納されているディスク上の場所で競合が発生しますこれにより lkid および pvcreate が使用された順番に従って lkid または LVM 情報のどちらかが上書きされます対応策 : lkid を LVM と組み合わせて使用する必要がある場合はディスクをパーティション化しディスク全体ではなくディスクパーティションを LVM 物理ボリュームとして使用します LVM のアクションが RHEL 6 では遅くなります RHEL 6 で一部の LVM コマンドを実行している際前のリリースよりもパフォーマンスが遅くなる場合がありますこれは LVM リソースを含む階層のやや長い restore および remove 時間で見られます 268 トラブルシューティング

289 DMMP Recovery Kit Raw および LVM Recovery Kit が混在した構成は RHEL 6 環境ではサポートされません Raw リソースの作成時 Raw Recovery Kit は Raw デバイスの major # および minor # に基づいてデバイスファイルを検索しますその結果 /dev/dm-* がデバイスとなりますが /dev/dm-* の形式は LVM Recovery Kit が処理することができないため "raw device not found" というエラーが GUI に表示されます DMMP Recovery Kit 説明 DMMP: スタンバイサーバで発行された write がハングすることがあります別のサーバでリザーブされている DMMP デバイスに write が発行されると IO が永久に ( またはデバイスがもう一方のサーバでリザーブされなくなるまで ) ハングすることがありますもう一方のサーバでデバイスが解放され write が発行されるとデータが破損することがありますこの問題の原因は DMMP での IO 再試行に従ってパス確認が実行される方法にあります no_path_retry が 0 ( 失敗 ) に設定されるとこのハングは発生しません別のサーバでパスがリザーブされているときにデバイスの path_checker が失敗しても (MSA1000) この問題は発生しません対応策 : no_path_retry を 0 ( 失敗 ) に設定しますしかしこれにより一時的なパスの障害が原因で IO の障害が発生する可能性もあります DMMP: 複数のイニシエータが ATP_C をサポートする SAS アレイで正しく登録されていません LifeKeeper は複数の SAS イニシエータが SAS アレイに接続される設定をサポートしていませんこうした設定では各イニシエータが正常に登録されないので 1 つのイニシエータのみが IO を発行できるようになりますマルチパスドライバ (DMMP など ) が未登録のイニシエータに IO を発行するとエラーが発生します RHEL 6 の場合 LifeKeeper は EMC Clariion に接続されているリザベーションをサポートできません PostgreSQL Recovery Kit 説明 SteelEye Protection Suite for Linux 269

290 MD Recovery Kit SLES 10 SP2 ではデータベースが稼働していないまたは dbfail が発生すると PostgresSQL リソースがエラーとなりますこの問題は SLES 10 SP2 カーネルのバグによるもので更新カーネルバージョンでは修正されています SLES 10 SP2 では netstat は /proc/<pid>/fd という新しいフォーマットで切断されます netstat ユーティリティはデータベースが実行されていることを確認するために PostgreSQL Recovery Kit で使用されます解決方法 : SLES 10 SP2 で実行している場合はカーネルバージョンをにアップグレードしてくださいカーネルのアップグレードに関する重要な情報 : SPS は一般的にいくつかの機能をサポートするためカーネルモジュールをインストールします ; そのため RedHat システムでカーネルパッチの適用 / カーネルのアップグレードを実施する際にインストールメディアから./setup スクリプトを再度実行し SPS の一部としてインストールしたカーネルを新しいカーネルとして有効にしてくださいこの操作を実施しない場合は SPS リソースを in service および / もしくは保護できない状態のままになります MD Recovery Kit 説明 MD Recovery Kit は homehost で作成されたミラーをサポートしません LifeKeeper MD Recovery Kit は homehost 機能で作成されたミラーでは正常に機能しません homehost が設定された場合 LifeKeeper は不正なフォーマットの一意の ID を使用するので In Service の操作が失敗します SLES 11 システムでは homehost はミラーの作成時にデフォルトで設定されます homehost に対応している mdadm のバージョンは別のディストリビューションやバージョンでも使用可能と思われますこの機能を無効にするにはミラー作成時にコマンドラインで --homehost="" を指定します homehost 設定で作成されたミラーがすでに存在している場合はミラーを再作成して設定を無効にする必要があります homehost で作成されたミラーで LifeKeeper 階層がすでに構築されている場合階層を削除し homehost を無効にしてミラーを構築した後で再作成する必要があります MD Recovery Kit は LVM デバイスで作成された MD デバイスをサポートしていません LifeKeeper MD Recovery Kit は LVM デバイスで作成された MD デバイスを正常に処理しません MD デバイスが作成されると LifeKeeper が認識できない名前が付けられます /etc/mdadm.conf の MD Recovery Kit 設定ファイルエントリがコメントアウトされていません /etc/mdadm.conf の LifeKeeper 設定ファイルエントリ破砕起動後にコメントアウトする必要がありますこれらのファイルエントリはコメントアウトされていません 270 トラブルシューティング

291 GUI トラブルシューティング一部のパス障害ではコンポーネントが out of service にならないいずれのパス障害でも場合によっては mdadm が失敗を検出し MD quickcheck が lkscsid による障害ディスク検出の前に復旧を開始しますこれにより複数の復旧が同時に発生しコンポーネントが out of service にならなくなります大規模な設定ではローカルリカバリが実行されません大規模な設定 (6 以上の階層 ) ではローカルリカバリがトリガされた場合 (sendevent) すべての階層がチェックされずローカルリカバリが失敗することがあります起動時にミラーが自動的に開始されます一部のシステム (RHEL 6 を実行しているシステムなど ) では起動時に自動的にミラーを開始する設定ファイル (/etc/mdadm.conf) に AUTO エントリがあります ( 例 : AUTO +imsm +1.x all) 解決方法 : LifeKeeper ではミラーを自動的に開始しないようにする必要があるのでこのエントリを編集し起動時に自動的に開始しように指定する必要があります前の例 (AUTO +imsm +1.x all) は imsm メタデータおよび 1.x メタデータから他のすべてを除いたものを使用して作成したミラーを自動的に開始するようにシステムに指示していますこのエントリを AUTO -all に変更しあらゆるものマイナスすべてを自動的に開始するように ( つまり何も自動的に開始されないように ) システムに通知する必要があります重要 : クリティカルなシステムリソース (root など ) が MD を使用している場合それらのミラーが他の方法で開始され LifeKeeper で保護されているミラーは開始されないことを確認してください MD リソースインスタンスは restore 時に udev 処理の悪影響を受けることがあります udev 処理中にデバイスノードが remove され再作成されます restore の際ノードが再作成される前に LifeKeeper がノードにアクセスしようとして restore が失敗する場合があります解決方法 : LifeKeeper restore アクションを再実行してください GUI トラブルシューティング LifeKeeper GUI をリモートシステムから設定する際に問題が発生した場合は以下のいずれかのトピックを参照してください Java プラグイントラブルシューティングアプレットトラブルシューティングネットワーク関連トラブルシューティング ( GUI) SteelEye Protection Suite for Linux 271

292 ネットワーク関連トラブルシューティング (GUI) ネットワーク関連トラブルシューティング (GUI) LifeKeeper は GUI クライアントとサーバの通信に Java RMI (Remote Method Invocation) を使用します問題となりうる要素の一部は RMI に関連しそれ以外は一般的なネットワークの設定に関する問題です Windows プラットフォームでの論理接続の遅延 Sun FAQ から : 最も蓋然性が高いのはホストのネットワーク設定が誤りというものです RMI は Java API ネットワーククラス特に ava.net.inetaddress を使用しますこれはアドレスマッピングおよびホスト名へのアドレスに対して両方のホストに TCP/IP ホスト名のルックアップを実行させます Windows ではルックアップ機能はネイティブ Windows ソケットライブラリで実行されるので遅延は RMI ではなく Windows ライブラリで発生するものですホストが DNS を使用するように設定されている場合これは通信に関連するホストについて認識しないという DNS サーバの問題となる可能性がありますその場合 DNS ルックアップのタイムアウトが発生しますこのケースに当てはまる場合はファイル \windows\system32\drivers\etc\hosts で関連ホスト名 / アドレスをすべて指定してください通常のホストファイルのフォーマットを次に示します例 : IP アドレスサーバ名称 homer.somecompany.com homer これで最初のルックアップにかかる時間を短縮できるはずですまたサブネットマスクとゲートウェイアドレスの設定が誤っていると接続の遅延や障害を引き起こす可能性がありますこれらの設定が正しいことをネットワーク管理者に確認してくださいモデムからの実行 : サーバが存在するネットワークにモデムで (PPP または SLIP を使用して ) 接続する場合コンピュータは一時的な IP 番号を操作用に取得しますこの一時的な番号はホスト名がマップしたものではない可能性があります ( ホスト名が何かにマップしている場合 ) そのためこの場合は IP のみで通信するようにサーバに指示する必要がありますこれにはモデム接続ウィンドウを開いて一時的な IP 番号を取得しますこの番号を使用して GUI クライアントのホスト名プロパティを設定しますプラグインでブラウザのホスト名を設定するには [Java Plug-In Control Panel] を開き [Java Run Time Parameters] に以下の値を追加してクライアントのホスト名を設定します -Djava.rmi.server.hostname=<MY_HOST> HotJava ブラウザのホスト名を設定するには hotjava コマンドラインに以下の値を追加します -Djava.rmi.server.hostname=<MY_HOST> たとえば以下のようになります -Djava.rmi.server.hostname= トラブルシューティング

293 プライマリネットワークインターフェースのダウン : プライマリネットワークインターフェースのダウン : LifeKeeper GUI は GUI クライアントと GUI サーバの通信を維持するために Remote Method Invocation (RMI) を使用しますほぼどのような場合でもプライマリネットワークインターフェースを介してサーバへの接続が確立されますつまりサーバのプライマリイーサネットインターフェースがダウンした場合接続は失われ GUI クライアントに [Unknown] というサーバの状態が表示されますこの問題の唯一の解決策はサーバのプライマリイーサネットインターフェースを再び有効にすることですまた RMI の制限のためマルチホームサーバ ( 複数のネットワークインターフェースを備えたサーバ ) でこの問題を解決することはできませんホストへのルートが存在しない例外 : ホストに接続できなかったためソケットをリモートホストに接続できませんでしたこれは通常ネットワークのローカルサーバとリモートホストの間のリンクの一部がダウンしたかホストがファイアウォールの後ろにあることを意味します不明なホストの例外 : LifeKeeper GUI クライアントとサーバは通信に Java RMI (Remote Method Invocation) 技術を使用します RMI が正常に動作するためにクライアントとサーバは解決可能なホスト名または IP アドレスを使用する必要があります解決不可能な名前 WINS 名修飾されていない DHCP 名を使用した場合 Java は UnknownHostException を送出しますこのエラーメッセージは以下の条件でも発生する可能性がありますサーバ名が存在しない場合サーバ名の誤記がないか確認してください設定された DHCP サーバが RMI サーバが実際に存在するドメインではなくリゾルバドメインのドメイン名になるように RMI サーバの完全修飾ドメイン名を設定している場合この場合サーバの DHCP ドメインの外側の RMI クライアントは不正なドメイン名のためにサーバにアクセスできませんサーバが Windows Internet Naming Service (WINS) を使用するように設定されたネットワーク上にある場合 DNS にのみ依存しているホストは WINS の下に登録されたホストにアクセスできない場合があります RMI クライアントとサーバがファイアウォールをはさんだ反対側にある場合ファイアウォールの外側に RMI クライアント内側にサーバがある場合クライアントはサーバに対してリモート呼び出しを実行できません LifeKeeper GUI を使用している場合クライアントによって提供されたホスト名はサーバから解決できるものでありサーバからのホスト名はクライアントによって解決できるものである必要があります LifeKeeper GUI はこの例外を捕捉しユーザに警告しますクライアントがサーバのホスト名を解決できない場合この例外が捕捉されメッセージ 115 が表示されますサーバがクライアントのホスト名を解決できない場合この例外が捕捉されメッセージ 116 が表示されますどちらのメッセージにも実行が試された未修飾ホスト名を指定する Java 例外の一部が含まれています SteelEye Protection Suite for Linux 273

294 Windows から : 下記にホスト名の解決が正常に機能していることをテストまたは検証するために使用できる手順をいくつか示します Windows から : 1. Linux サーバとの通信の確認 DOS プロンプトからホスト名を使用してターゲットを ping します ping <TARGET_NAME> たとえば以下のようになります ping homer ターゲットの修飾されたホスト名と IP アドレスをリストする応答が表示されるはずです 2. 正しい設定の確認 DNS の設定を確認するかネットワークに DNS サーバをインストールします ControlPanel->Network->Protocols->TCP/IP の設定を確認しますこれらの設定が正しいことをネットワーク管理者に確認してください [DNS] タブのホスト名はローカルネームサーバで使用されているものと一致している必要がありますこれは GUI エラーメッセージで指定したホスト名とも一致している必要がありますローカルホストおよびその接続先となる LifeKeeper サーバのエントリを含める形で hosts ファイルを編集してください Windows 95/98 システムでは hosts ファイルは以下のようになります %windir%\hosts (for example, C:\WINDOWS\HOSTS). 注記 : Windows 95/98 では hosts ファイルの最後のエントリがキャリッジリターン (CR) またはラインフィード (LF) で終わっていない場合 hosts ファイルはまったく読み取られません Windows NT システムでは hosts ファイルは以下のようになります %windir%\system32\drivers\etc\hosts (for example, C:\WINNT\System32\DRIVERS\ETC\HOSTS). たとえばシステムが HOSTCLIENT.MYDOMAIN.COM と呼ばれ IP アドレスとしてを使用している場合 hosts ファイルに次のエントリを追加します HOSTCLIENT.MYDOMAIN.COM HOSTCLIENT 3. GUI クライアントで使用するホスト名プロパティを設定してくださいプラグインでブラウザからホスト名を設定するには [Java Plug-In Control Panel] を開き [Java Run Time Parameters] に以下の値を追加してクライアントのホスト名を設定します Djava.rmi.server.hostname=<MY_HOST> 4. Microsoft のネットワーク関連のパッチをで確認してください 274 トラブルシューティング

295 Linux から : Linux から : 1. ホスト名または IP アドレスを使用して Linux からターゲットサーバを ping し他のサーバとの通信を確認します ping <TARGET_NAME> たとえば以下のようになります ping homer ターゲットの修飾されたホスト名をリストする応答が表示されるはずです 2. ホスト名または IP アドレスで ping を実行しクラスタ内の各サーバでローカルホストが解決可能であることを確認します DNS が実装されていない場合 /etc/hosts ファイルを編集しローカルホスト名のエントリを追加しますこのエントリでローカルサーバの IP アドレスまたはデフォルトエントリ ( ) をリストできます 3. DNS が NIS の前に指定されていることを確認します /etc/nsswitch.conf の hosts 行で DNS を NIS の前に置く必要がありますまた /etc/resolv.conf は正しく設定された DNS サーバを指す必要があります 4. DNS を実装しない場合または他の方法がうまくいかない場合は /etc/hosts ファイルを編集しホスト名のエントリを追加します 5. GUI クライアントで使用するホスト名プロパティを設定してくださいこれは管理者ごとに変更する必要がありますプラグインでブラウザからホスト名を設定するには [Java Plug-In Control Panel] を開き [Java Run Time Parameters] に以下の値を追加してクライアントのホスト名を設定します -Djava.rmi.server.hostname=<MY_HOST> HotJava ブラウザからホスト名を設定するには hotjava コマンドラインに以下の値を追加します -Djava.rmi.server.hostname=<MY_HOST> たとえば以下のようになります -Djava.rmi.server.hostname= Djava.rmi.server.hostname= homer.somecompany.com X Window Server に接続できない : LifeKeeper GUI アプリケーションを telnet セッションから実行している場合 GUI クライアントが LifeKeeper サーバで X Window Server にアクセスできることを確認する必要があります LifeKeeper サーバは GUI クライアントのホスト名またはネットワークアドレスを解決できる必要があります LifeKeeper サーバに対して telnet を実行して LifeKeeper GUI アプリケーションを実行した場合 DISPLAY 環境変数にはクライアントのホスト名と表示番号を含める必要がありますたとえば Server1 というサーバに Client1 というクライアントから telnet を実行した場合 DISPLAY 環境変数は Client1:0 に設定される必要があります LifeKeeper GUI アプリケーションを実行した場合 Client1 SteelEye Protection Suite for Linux 275

296 システムの日付と時刻の調整の DISPLAY 名に出力が送信されます Client1 が X Window Server にアクセスできない場合例外が発生して LifeKeeper GUI アプリケーションは失敗します LifeKeeper GUI をアプリケーションとして起動したときに X Window Server に接続できないまたはクライアント DISPLAY 名を開くことができないというエラーが発生した場合は以下の手順を実行してください 1. ホスト名または IP アドレスを使用して表示変数を設定しますたとえば以下のようになります DISPLAY=Client1.somecompany.com:0 DISPLAY= :0 2. xhost または xauth コマンドを使用しクライアントが LifeKeeper サーバで X Window Server に接続できることを確認します 3. クライアント用の DNS エントリを追加するかクライアント用のエントリを LifeKeeper サーバのローカルホストファイルに追加します LifeKeeper サーバからクライアントに対してホスト名または IP アドレスを使用して ping を実行しクライアントとの通信を確認しますシステムの日付と時刻の調整マルチユーザモードのときにシステムの日付 / 時刻を過去に変更すると LifeKeeper に問題が発生する可能性がありますリソース管理の際には SCSI ha_xref_tbl が使用されます日付または時刻が過去の時間値に変更された場合新しい時刻よりも後のタイムスタンプが付いているリソースの管理は新しい時間が ha_xref_tbl の作成時点に達するまでフリーズする可能性もありますこの問題の結果フリーズしている間にリソースを作成または変更する際に問題になる可能性がありますシステムの日付 / 時刻カウンタを過去に調整するには : 1. シングルユーザモードにします ( LifeKeeper を停止させてから ) 2. 日付または時刻を過去のものに変更します 3. マルチユーザモードに戻します 4. LifeKeeper を再起動しますこの操作によって新しい現在時刻を設定した新しい ha_xref_ tbl が作成され操作を続行できるようになります注記 : タイムゾーン ( TZ シェル変数 ) を変更した場合または夏時間から標準時間に変更した場合 LifeKeeper には影響しません Linux はすべての時間値を 1970 年 1 月 1 日からの絶対秒数として保持しますタイムゾーンまたは夏時間 / 標準時間の変更はその絶対秒数を ASCII で解釈した値に過ぎないのでカウンタ自体は変更されませんコミュニケーションパスの稼働と停止コミュニケーションパスの停止と稼働が繰り返される場合 ( LifeKeeper GUI で Alive Dead Alive というように表示される場合 ) ハートビートの設定がクラスタ内のすべてのサーバで同じ値に設定されていない可能性があります 276 トラブルシューティング

297 推奨される対策この状態はいずれか一方のサーバにある LifeKeeper デフォルトファイル /etc/default/lifekeeper で設定名に誤記がある場合にも発生する可能性があります推奨される対策 1. クラスタ内のすべてのサーバで LifeKeeper を停止します 2. クラスタ内の各サーバで /etc/default/lifekeeper にある LCMHBEATTIME 設定と LCMNUMHBEATS 設定の値とスペルを確認します設定値スペルミスの無いことを各ノードで確認します 3. クラスタ内のすべてのサーバで LifeKeeper を再起動します不完全なリソースの作成インスタンスの一部のみが作成された状態でリソース設定プロセスが中断された場合階層を再設定する前に手動でクリーンアップする必要があります LifeKeeper GUI を使用し一部が作成されたリソースを削除してください手順についてはすべてのサーバからの階層の削除を参照してください階層リストにこれらのリソースが含まれていない場合 ins_remove( LCDI-instances(1M) を参照 ) および dep_remove( LCDI-relationship(1M)) を使用し部分的な階層をクリーンアップしなければならない可能性もあります不完全なリソースの優先順位の変更 LifeKeeper の階層は親子の関係によって関連付けられたすべてのリソースとして定義されています複数の親を持つリソースの場合 GUI と階層のすべてのリソースを区別することは一概に簡単とも言えなくなります階層の整合性を保持するにはサーバごとに階層内のすべてのリソースに対して優先順位を変更する必要があります [OK] または [Apply] ボタンを押した後で選択される階層のすべてのルートリソースを表示することで GUI はこの要件を強制しますこの時点ですべてのルートを受け付けるか操作をキャンセルするかを選択できますルートのリストを受け付けた場合新しい優先順位の値が階層内のすべてのリソースに割り当てられますその階層の [Resource Properties] ダイアログが表示されている間他の変更を階層に加えていることを確認する必要があります [Resource Properties] ダイアログの優先順位を編集する前に LifeKeeper に加えられた変更が動的にダイアログで更新されますただし変更を加えると基本的な変更が LifeKeeper で加えられた場合でもダイアログの値は凍結されます [Apply] または [OK] ボタンをクリックした後でのみ変更が加えられたことが通知されるので優先順位の変更操作は要求どおりに進みません複数の優先順位の変更を伴う優先順位の変更操作時に復旧できないエラーの可能性を最低限に抑えるにはプログラムは一度に 1 つのサーバに対して個別に行われる一連の変更として複数の優先順位の変更操作を実行しますまた操作時に優先順位の競合を防ぐために必要に応じて一時的な値がプロパティに割り当てられますこの一時的な値は最大許容値 999 を超えるもので優先順位の変更中に一時的に GUI に表示されることもあります操作が完了すると一時的な値はすべて要求された値に置き換えられますエラーが発生し優先順位の値をロールバックできない場合一時的な優先順位の値の一部がそのまま残る可能性もありますこの場合は下記の推奨手順に従って階層を修復してください SteelEye Protection Suite for Linux 277

298 一貫した状態への階層のリストア一貫した状態への階層のリストア優先順位の変更操作の間にエラーが発生し操作を完了できない場合優先順位は不整合の状態のまま残る可能性がありますエラーはシステムやコミュニケーションパスの障害を含めさまざまな理由で発生します操作が開始された後や完了する前にエラーが発生しプログラムが前の優先順位にロールバックできなかった場合操作中にエラーがあったことおよび前の優先順位を restore できなかったことを示すメッセージが表示されますこの場合以下の処置を実行し階層を一貫性のある状態に restore する必要があります 1. 可能であれば問題の原因を特定しますシステムまたはコミュニケーションパスの障害を確認します優先順位管理プログラムの実行中にその他の操作が行われていないことを確認します 2. 可能であれば問題の原因を修正してから先に進みますたとえば階層を修復する前に障害が発生したシステムまたはコミュニケーションパスを restore する必要があります 3. [Resource Properties] ダイアログから操作を再試行します 4. [Resource Properties] ダイアログから変更できない場合はコマンドライン hry_setpri を使用して階層を修復するとより簡単かもしれませんこのスクリプトを使用すると一度に 1 つのサーバに対して優先順位を変更できますこのスクリプトは GUI からは実行できません 5. 修復を実行したら階層が存在するすべてのサーバに対して eqv_list コマンドを実行し階層のすべてのリソースに対して返された優先順位の値を調べ LifeKeeper データベースがすべてのサーバで一貫していることを確認します 6. 最終的に階層を修復できない場合は階層を削除して再作成する必要がある可能性もあります階層の設定中に共有ストレージが見つからないリソースの階層を設定中に LifeKeeper が No shared storage ( 共有ストレージがありません ) というメッセージをレポートする状況がいくつかあります考えられる原因 : ストレージを共有するサーバー間でコミュニケーションパスが定義されていません共有ストレージデバイスで階層が設定されている場合 LifeKeeper はクラスタ内の別のサーバを少なくとも 1 つ検証しその共有ストレージにアクセスできることを確認します推奨される対策 : LifeKeeper GUI または lcdstatus (1M) を使用しコミュニケーションパスが設定されておりアクティブになっていることを確認します考えられる原因 : ストレージを共有するサーバー間でコミュニケーションパスが機能していません推奨される対策 : LifeKeeper GUI または lcdstatus (1M) を使用しコミュニケーションパスが設定されておりアクティブになっていることを確認します 278 トラブルシューティング

299 LifeKeeper サーバ障害からの復旧考えられる原因 : Linux が共有ストレージにアクセスできないこの原因としてはドライバがロードされていないことやドライバがロードされたときにストレージの電源が入っていないことあるいはストレージデバイスが正しく設定されていないことなどが考えられます推奨される対策 : /proc/scsi/scsi でデバイスが正しく定義されていることを確認します考えられる原因 : LifeKeeper を起動する前にストレージが Linux で設定されていない LifeKeeper の起動時にすべての SCSI デバイスがスキャンされデバイスのマッピングが判別されます LifeKeeper の起動後にデバイスが設定された ( 電源がオンにされた接続されたまたはドライバがロードされた ) 場合デバイスを設定して使用できるようにするには LifeKeeper を停止してから再起動する必要があります推奨される対策 : $LKROOT/subsys/scsi/Resources/hostadp/device_info にデバイスがリストされていることを確認してください $LKROOT はデフォルトでは /opt/lifekeeper. ですデバイスがこのファイルにリストされていない場合 LifeKeeper はそのデバイスを使用しません考えられる原因 : ストレージがサポートされていないストレージとアダプタのトピックでは LifeKeeper で動作がテストされサポートされている具体的な SCSI デバイスが列挙されていますただしこのリストに含まれているのはすでに知られているデバイスなので注意してください LifeKeeper の要件を満たしているものの SIOS Technology Corp. がテストしていないデバイスが存在する可能性もあります推奨される対策 : $LKROOT/subsys/scsi/Resources/hostadp/device_info にデバイスがリストされていることを確認してください $LKROOT はデフォルトでは /opt/lifekeeper ですデバイスがこのファイルにリストされているもののデバイス名の後に来る ID が NU- で始まる場合 LifeKeeper はデバイスから一意の ID を取得できなかったことを示します一意の ID がない場合 LifeKeeper はデバイスが共有されているかどうかを判別できません考えられる原因 : ストレージではデバイスを LifeKeeper で使用できるようにする前に特定の LifeKeeper ソフトウェアをインストールする必要がありますたとえば Raw I/O サポートを有効にするための steeleye-lkraw キットデータレプリケーションを有効にするための steeleye-lkdr ソフトウェアなどです推奨される対策 : 必要な LifeKeeper パッケージが各サーバにインストールされていることを確認しますソフトウェアの要件については SPS for Linux リリースノートを参照してください補足のヒント : test_lk(1m) ツールを使用するとストレージおよび通信の問題のデバッグに役立ちます LifeKeeper サーバ障害からの復旧 LifeKeeper クラスタ内のサーバにオペレーティングシステムの再インストールを ( したがって LifeKeeper の再インストールも ) 必要とする障害が発生した場合クラスタの各サーバからリソース階層を再拡張する必要がありますただし再インストールしたサーバとの共有イクイバレンシ関係がクラスタのサーバにある場合 LifeKeeper は再インストールしたサーバへ既存のリソース階層を拡張することを許可しませ SteelEye Protection Suite for Linux 279

300 推奨される対策 : んまた再インストールされたサーバには階層が実際には存在していないため再インストールしたサーバから階層を拡張解除することもできません推奨される対策 : 1. リソース階層が設定されている各サーバで eqv_list コマンドを使用してすべての共有イクイバレンシのリストを取得します ( 詳細については LCDI-relationship を参照してください ). 下記の例では server1 および server2 に対する IP リソースの iptag のコマンドおよび結果の出力を示しますここでは server2 が再インストールされたサーバ server1 が設定された階層です eqv_list -f: server1:iptag:server2:iptag:shared:1:10 2. リソース階層が設定された各サーバで eqv_remove を使用して階層の各リソースのイクイバレンシ関係を手動で削除します ( 詳細については LCDI-relationship を参照してください ) たとえば上記の手順 1 の例を基に server1 に対して以下のコマンドを実行します eqv_remove -t iptag -S server2 -e SHARED 3. 2 つ以上のサーバがあるクラスタではこれらのリソース階層のイクイバレンシ関係が定義されているクラスタ内の各サーバに対して手順 1 と 2 を繰り返します 4. 最後に GUI を使用しリソース階層が in-service になっているサーバから再インストールされたサーバに各リソース階層を拡張します停止できないプロセスからの復旧プロセスが停止不可の場合 LifeKeeper は共有ディスクパーティションをアンマウントできない可能性がありますそのためリソースを別のシステムで In Service にすることができません停止できないプロセスから復旧する唯一の方法はシステムを再起動することです手動リカバリ時のパニックからの復旧手動スイッチオーバ時に PANIC になるとリカバリが不完全に終わる可能性があります PANIC またはその他の大きなシステム障害が手動スイッチオーバ時に発生した場合バックアップシステムへの完全自動リカバリは保証できなくなります In Service になる必要があるすべてのリソースが In Service であることをバックアップシステムで確認してください In Service ではないリソースがあった場合は LifeKeeper GUI を使用してそのリソースを手動で In Service にします手順についてはリソースを In-Service するを参照してください Out-of-Service 階層の復旧 LifeKeeper サーバの障害からの復旧の一環として障害が発生したサーバで設定されているもののサーバの障害時にどのサーバでも In Service ではなかったリソース階層が障害時に最優先で Alive になったサーバで復旧されますこれは障害が発生したサーバ復旧中のサーバ階層内の他の 280 トラブルシューティング

301 リソースタグ名の制限サーバを含め Out of Service の階層が最後にどこで In Service だったかには無関係ですリソースタグ名の制限 Tag Name Length タグ名の長さ All tags within LifeKeeper may not exceed the 256 character limit. 有効な " 特殊 " 文字 - _. / しかしながらタグの先頭には以下を含むことができません "." or "/". 無効な文字 + ; # $ * = "space" シリアル (TTY) コンソールの警告シリアルコンソールデータパスの一部が信頼できない場合または Out of Service になった場合シリアル (RS-232 TTY) コンソールを使用するユーザは LifeKeeper サービスで深刻な問題に直面する可能性があります操作中に LifeKeeper はコンソールメッセージを生成します設定に ( 標準的な VGA コンソールではなく ) シリアルコンソールがある場合これらのコンソールメッセージが確実に配信されるようにするために LifeKeeper からエンドユーザターミナルへのデータパス全体が機能している必要がありますターミナルの電源オフモデムの未接続ケーブルのゆるみなどデータパスがつながっていない場合 Linux STREAMS ファシリティはコンソールメッセージをキューに入れます STREAMS キューがいっぱいになった場合 Unix カーネルは STREAMS バッファキューにメッセージを入れる余地ができるまで LifeKeeper を保留にしますこれにより LifeKeeper がハングすることもあります注記 : LifeKeeper 環境のシリアルコンソールは可能なかぎり避け VGA コンソールを使用することを推奨しますシリアルコンソールを使用する必要がある場合シリアルコンソールがオンになっていることケーブルとオプションのモデムが正しく接続されていることメッセージが表示されていることを必ず確認してくださいシステムが init 状態 S に遷移しているという警告 LifeKeeper が動作している場合システムを直接 init 状態 S に切り替えないでください Linux の init システムの操作が原因でこうした遷移が全 LifeKeeper プロセスの即時停止につながり突発的な障害を発生させる可能性がありますこの場合は代わりに LifeKeeper を (lkstop で ) 手動停止するかシステムを最初に init 状態 1 にしてから init 状態 S にしてください SteelEye Protection Suite for Linux 281

302 共有ストレージでスレッドがハングしているというメッセージ共有ストレージでスレッドがハングしているというメッセージデバイス確認スレッドがそれほど迅速に処理を完了していない場合スレッドがハングしているというメッセージが LifeKeeper ログに記録されることがありますこれによりリソースがあるサーバから別のサーバに移動しさらに悪いケースではサーバが停止する可能性があります説明 (/etc/default/lifekeeper の ) FAILFASTTIMER は各デバイスが正常に動作していることおよび特定のシステムによって所有されているすべてのリソースがそのシステムからアクセス可能でそのシステムに所有されていることを確認するための秒数を定義します FAILFASTTIMER はこの所有権を確定しデータの信頼性を最大限に確保するために可能なかぎり小さくする必要がありますただしデバイスがビジー状態で負荷がピークの場合指定した時間内で応答できない可能性もありますデバイスの操作が FAILFASTTIMER よりも長くかかっている場合 LifeKeeper はデバイスがハングしている可能性を検討します FAILFASTTIMER の時間を 3 回繰り返してもデバイスが応答しない場合 LifeKeeper はデバイスに障害が発生したものとみなしてリカバリを実行しますリカバリプロセスは SCSIERROR の設定で定義します SCSIERROR の設定によってはローカルリカバリを実行し失敗した場合はスイッチオーバを実行するために sendevent が発行されることもありますこの操作がない場合システムが停止するおそれもあります推奨される対策 : ハングメッセージがまれにエラーログに出力されもうハングしていないというメッセージがそれに続く場合さらに括弧の数が常に 1 つの場合それほど警戒する理由はありませんただしこのメッセージが頻繁にログに記録され数が 2 または 3 の場合以下の 2 つの処置が必要になる可能性がありますストレージの負荷を減らすことを試みるストレージの処理に FAILFASTTIMER ( デフォルトでは 5 秒または 15 秒を 3 回 ) の 3 倍の時間がかかっている場合ストレージに対する負荷を考慮し I/O の長い遅延を避けるために負荷を分散する必要がありますこれにより LifeKeeper はデバイスを頻繁に確認できるようになりさらにそのデバイスを使用しているアプリケーションのパフォーマンスも向上します負荷を減らすことができない場合 FAILFASTTIMER をデフォルトの 5 秒から増やすことができますこの値はできる限り低く抑える必要がありますそのためメッセージがまったく表示されなくなるかまれにしか表示されなくなるまで少しずつ値を増やしてください注記 : FAILFASTTIMER の値が変更された場合新しい値を有効にするために LifeKeeper を終了し再起動する必要があります 282 トラブルシューティング

303 Chapter 4: SteelEye DataKeeper for Linux はじめに SteelEye DataKeeper for Linux は LifeKeeper 環境に統合データミラーリング機能を提供しますこの機能により LifeKeeper リソースが共有 / 非共有ストレージ環境で動作可能になります SteelEye DataKeeper for Linux によるミラーリング Steeleye DataKeeper の仕組み SteelEye DataKeeper for Linux によるミラーリング SteelEye DataKeeper for Linux は共有ストレージを使用せずに可用性の高いクラスタ ( SteelEye LifeKeeper を使用 ) を構築したいお客様やビジネスに不可欠なデータをサーバ間でリアルタイムに複製したいお客様に別の方法を提供します SteelEye DataKeeper は同期または非同期のボリュームレベルのミラーリングを使用してプライマリサーバ ( ミラーソース ) から 1 台以上のバックアップサーバ ( ミラーターゲット ) にデータを複製します DataKeeper の特長 SteelEye DataKeeper には以下の特長があります TCP/IP ベースのローカルエリアネットワーク ( LAN) またはワイドエリアネットワーク ( WAN) 経由でリモートの場所に高い信頼性効率整合性でデータをミラーリングできます同期と非同期のミラーリングをサポートします複製はファイルシステムの下のブロックレベルで実行されるので関与するアプリケーションに対して透過的です LifeKeeper と共に使用した場合複数ターゲットへのカスケーディングフェイルオーバも含めて複数ターゲットへの同時ミラーリングをサポートします特定時点のデータへのリワインドをサポートしているので喪失したデータや破損データの復旧ができます内蔵のネットワーク圧縮にによりワイドエリアネットワークでの最大スループットが向上します主要なファイルシステムをすべてサポートします ( ファイルシステムのジャーナリングサポートの詳細については SPS for Linux リリースノートの製品説明を参照してください ) ミラーリングしたデータにフェイルオーバの保護を提供します SteelEye Protection Suite for Linux 283

304 同期ミラーリングと非同期ミラーリングの違い LifeKeeper のグラフィカルユーザインターフェースに統合されています他の LifeKeeper Application Recovery Kit をフルにサポートしますシステムリカバリ時にプライマリサーバとバックアップサーバとの間でデータを自動的に再同期します障害発生時には仮想のシステムコンポーネントの健全性を監視しローカルリカバリを実行します I/O フェンス用の Stonith デバイスをサポートします詳細については STONITH のトピックを参照してください同期ミラーリングと非同期ミラーリングの違い同期ミラーリングと非同期ミラーリングの違いを理解するとアプリケーション環境に適切なミラーリング方法を選択することができます同期ミラーリング SteelEye DataKeeper はプライマリサーバとバックアップサーバに同時にデータを書き込む同期ミラーリング方法を使用してリアルタイムミラーを実現します書き込み動作のたびに DataKeeper は書き込みをターゲットデバイスに転送しリモート確認を受信してから I/O 完了を通知します同期ミラーリングの長所はデータの保護レベルが高いことですこれは常にデータのすべてのコピーを確実に同一にしているからですただしリモート確認を待つためにパフォーマンスが低下することがありこれは特に WAN 環境で発生します非同期ミラーリング非同期ミラーリングではそれぞれの書き込みがソースデバイスに対して行われ次にコピーがターゲットデバイスに送信されるキューに入れられますこれはつまり任意の時点でソースからターゲットデバイスへの送信を待っている多数の書き込みトランザクションが存在する可能性があります非同期ミラーリングの長所は書き込みがプライマリディスクに到達した時点で確認されるためパフォーマンスが高いことですただしプライマリディスクに障害が発生した場合非同期書き込みキュー内にある書き込みはターゲットに送信されないため信頼性が低くなりますこの問題を緩和するために SteelEye DataKeeper はプライマリディスクに対する個々の書き込みについてインテントログファイルにエントリを作成しますインテントログとはプライマリとターゲットのミラー間で同期していないデータブロックを示すビットマップですサーバの障害発生時にインテントログを使用するとデータ全体の再同期を回避できます注記 : インテントログは同期と非同期の両方のミラーモードで使用できますただし非同期ミラーリングのインテントログは以降の Linux カーネルでのみサポートされます Steeleye DataKeeper の仕組み SteelEye DataKeeper は NetRAID デバイスを作成して保護します NetRAID デバイスは RAID1 のデバイスであり下図に示すようにローカルのディスクまたはパーティションおよびネットワークブロックデバイス ( NBD) で構成されます 284 はじめに

305 同期 ( および再同期 ) LifeKeeper がサポートするファイルシステムはその他すべてのストレージデバイスと同様に NetRAID デバイスにマウントできますこの場合ファイルシステムは複製されたファイルシステムと呼ばれます LifeKeeper は NetRAID デバイスと複製されたファイルシステムの両方を保護しますファイルシステムは DataKeeper [ リソース階層を作成することにより作成されます NetRAID デバイスを別のサーバに拡張すると NBD デバイスが作成され 2 台のサーバ間にネットワーク接続が確立されます NBD 接続が確立されるとただちに SteelEye DataKeeper がデータの複製を開始します nbd-client プロセスがプライマリサーバで実行されバックアップサーバで動作している nbd-server プロセスと接続します同期 ( および再同期 ) DataKeeper リソース階層は作成されてから拡張されるまでの間デグレードモードですつまりデータはローカルのディスクまたはパーティションにのみ書き込まれます階層をバックアップ ( ターゲット ) システムに拡張すると SteelEye DataKeeper が 2 つのシステム間でデータを同期し以降の書き込みはすべてターゲットに複製されますどの時点でもデータが非同期になった場合 ( システムまたはネットワークの障害が発生した場合 ) SteelEye DataKeeper はソースとターゲットのシステムでデータを自動的に再同期しますインテントログ ( ビットマップファイル ) を使用するようにミラーが設定されている場合 SteelEye DataKeeper はインテントログを使用して非同期のデータを特定するので全体の再同期は不要ですインテントログ ( ビットマップファイル ) を使用するようにミラーが設定されていない場合はデータ複製の中断後に全体の再同期が実行されます標準ミラーの構成最も一般的なミラーの構成では下図に示すように 2 台のサーバがあり各サーバのローカルのディスクまたはパーティションとの間にミラーが確立されますサーバ 1 はミラーソースを持つプライマリサーバで SteelEye Protection Suite for Linux 285

306 N+1 の構成すサーバ 2 はミラーターゲットを持つバックアップサーバです N+1 の構成前述した標準ミラーの構成の変形として一般的に使用される構成ではクラスタ内にある 2 台以上のサーバが共通のバックアップサーバにデータを複製しますこの場合は下図に示すように各ミラーソースがバックアップサーバの個別のディスクまたはパーティションに複製する必要があります 286 はじめに

複数ターゲットの構成複数ターゲットの構成適切な Linux のディストリビューションとバージョン 2.6.

特定のソースのディスクまたはパーティションを最大 7 つのミラーターゲットに複製でき各ミラーターゲットは別のシステムに存在する必要がありますつまりソースのディスクまたはパーティションを

307 複数ターゲットの構成複数ターゲットの構成適切な Linux のディストリビューションとバージョン以降のカーネルと共に使用した場合下図に示すように SteelEye DataKeeper はプライマリサーバの 1 つのディスクまたはパーティションから複数のバックアップシステムにデータを複製することもできます特定のソースのディスクまたはパーティションを最大 7 つのミラーターゲットに複製でき各ミラーターゲットは別のシステムに存在する必要がありますつまりソースのディスクまたはパーティションを同一ターゲットシステム上にある複数のディスクまたはパーティションにミラーリングすることはできませんこのタイプの構成では LifeKeeper のカスケーディングフェイルオーバ機能を使用でき保護するアプリケーションとそのデータに対して複数のバックアップシステムを提供できます SteelEye DataKeeper リソース階層以下の例に LifeKeeper の GUI に表示される典型的な DataKeeper リソース階層を示します SteelEye Protection Suite for Linux 287

フェイルオーバのシナリオリソース datarep-ext3-sdr は NetRAID リソースであり親リソース ext3-sdr はファイルシステムリソースです本書の以降の部分では DataKeeper リソースは両方のリソースを合わせたものを指すことに注意してくださいファイルシステムリソースは NetRAID リソースに依存するので NetRAID

308 フェイルオーバのシナリオリソース datarep-ext3-sdr は NetRAID リソースであり親リソース ext3-sdr はファイルシステムリソースです本書の以降の部分では DataKeeper リソースは両方のリソースを合わせたものを指すことに注意してくださいファイルシステムリソースは NetRAID リソースに依存するので NetRAID リソースに対する動作はその上にあるファイルシステムにも影響しますフェイルオーバのシナリオ以下の 4 つの例で SteelEye DataKeeper を使用するフェイルオーバで何が起きるかを説明しますこれらの例では LifeKeeper for Linux クラスタはサーバ 1( プライマリサーバ ) とサーバ 2( バックアップサーバ ) の 2 台のサーバで構成されますシナリオ 1 サーバ 1 が動作不能になった後サーバ 1 からサーバ 2 へのミラーが正常に完了している結果 : フェイルオーバが発生しますサーバ 2 がプライマリサーバの役割を担当しサーバ 1 が再び動作可能になるまでデグレードモード ( バックアップなし ) で動作しますサーバ 1 が再び動作可能になると SteelEye DataKeeper がサーバ 2 からサーバ 1 への再同期を開始します以前のカーネルでは全体の再同期が実行されます以降のカーネルまたは RedHat Enterprise Linux 5.4 の以降のカーネル ( または RedHat 5.4 以降のサポートする派生カーネル ) では部分的な再同期が実行されますつまりソースとターゲットにあるビットマップファイルに記録された変更部分についてのみ同期が必要です 288 はじめに

309 シナリオ 2 注記 : SteelEye DataKeeper は現在ミラーソースとして動作しているサーバに以下のフラグをセットします $LKROOT/subsys/scsi/resources/netraid/$TAG_last_owner サーバ 1 がサーバ 2 にフェイルオーバするとこのフラグがサーバ 2 にセットされますこのためサーバ 1 が動作を再開すると SteelEye DataKeeper はこの最終オーナフラグをサーバ 1 から削除しますその後サーバ 2 からサーバ 1 にデータの再同期を開始しますシナリオ 2 シナリオ 1 でサーバ 2( プライマリサーバである状態 ) がサーバ 1( この時点ではバックアップサーバ ) との再同期中に動作不能になる結果 : 再同期プロセスが正常に完了しなかったのでデータが破損している可能性がありますこの結果 LifeKeeper は DataKeeper リソースをサーバ 1 にフェイルオーバしませんサーバ 2 が動作可能になった場合にのみ LifeKeeper はサーバ 2 で DataKeeper リソースを In Service ( ISP) にしますシナリオ 3 サーバ 1( プライマリ ) とサーバ 2( ターゲット ) の両方が動作不能になるサーバ 1( プライマリ ) が最初に動作可能になる結果 : サーバ 1 は DataKeeper リソースを In Service にしませんこの理由は停止してからオンラインに戻ったソースサーバはターゲットと通信できないからですソースサーバは以下のタグをセットします $LKROOT/subsys/scsi/resources/netraid/$TAG_data_corrupt これは正しくない方向へのデータ同期を防止する安全策ですこの場合サーバ 1 でミラーを強制的にオンラインにする必要がありますつまりサーバ 1 の data_corrupt フラグを削除しリソースを In Service にしますミラーを強制的にオンラインにするを参照してください注記 : $TAG_data_corrupt フラグを削除する前にサーバ 1 が最終のプライマリサーバであることを確認する必要がありますサーバ 1 が最終のプライマリサーバでない場合データが破損する可能性がありますこれは last_owner フラグの有無で確認できますシナリオ 4 サーバ 1( プライマリ ) とサーバ 2( ターゲット ) の両方が動作不能になるサーバ 2( プライマリ ) が最初に動作可能になる SteelEye Protection Suite for Linux 289

310 シナリオ 4 結果 : LifeKeeper はサーバ 2 の DataKeeper リソースを ISP にしませんサーバ 1 が動作可能になると LifeKeeper はサーバ 1 の DataKeeper リソースを ISP にします 290 はじめに

311 インストールと設定 SteelEye DataKeeper for Linux のインストールと設定ハードウェア / ソフトウェア要件 DataKeeper リソースを設定する前に以下のトピックには DataKeeper リソースの作成と管理を行う前に考慮が必要な情報がありますまた 3 種類の DataKeeper リソースについても説明しています LifeKeeper Core のリソース階層を設定する手順については LifeKeeper の設定セクションを参照してくださいハードウェアとソフトウェアの要件 SteelEye DataKeeper をインストールするには LifeKeeper の構成が次の要件を満たしている必要がありますハードウェアの要件サーバ - LifeKeeper for Linux をサポートする 2 台以上のサーバ IP ネットワークインターフェースカード - 各サーバにネットワークインターフェースカードが 1 つ以上必要ですただし LifeKeeper クラスタには 2 つのコミュニケーションパスが必要です独立した 2 つのサブネットを使用する 2 つの分離した LAN ベースのコミュニケーションパスが推奨されこれらの 1 つ以上をプライベートネットワークとして構成する必要がありますただし TCP と TTY を組み合わせて使用することもできます注記 : ソフトウェアミラーリングの特性によりサーバ間のネットワークトラフィックが多くなる可能性がありますこのため SteelEye DataKeeper のデバイス用に個別のプライベートネットワークを実装することが推奨されますこの実装には各サーバに追加のネットワークインターフェースカードが必要になることがありますディスクまたはパーティション - ソースとターゲットのディスクまたはパーティションとして動作するプライマリサーバとバックアップサーバのディスクまたはパーティションターゲットのディスクまたはパーティションはソースのディスクまたはパーティション以上のサイズである必要があります注記 : SteelEye Data Replication のリリースからパーティションが作成されていないディスク全体 ( /dev/sdd) の複製が可能になりました旧バージョンの SteelEye Data Replication ではディスクを複製するにはパーティションを作成する必要がありました ( /dev/sdd1 のような 1 つの大きいパーティションの場合でも ) SteelEye Data Replication からこの制限が取り除かれました SteelEye Protection Suite for Linux 291

312 ソフトウェアの要件ソフトウェアの要件オペレーティングシステム SteelEye DataKeeper は 2.6 Linux カーネルをベースにする主要な Linux のディストリビューションと共に使用できますサポートしているディストリビューションのリストについては SPS for Linux リリースノートを参照してください非同期ミラーリングとインテントログは以降の Linux カーネルを使用するディストリビューションでのみサポートされます複数のターゲットのサポート ( 複数のミラーターゲットのサポート ) には以降の Linux カーネルが必要です LifeKeeper のインストールスクリプト - 多くの場合パッケージをインストールする必要があります ( SteelEye DataKeeper の特定の要件については SPS for Linux リリースノートの製品の要件セクションを参照してください ) HADR-generic-2.6 SteelEye DataKeeper をインストールする前に LifeKeeper クラスタの各サーバにこのパッケージをインストールする必要があります HADR パッケージは SPS のインストールイメージファイルにありインストールの setup スクリプトにより該当するパッケージが自動的にインストールされます LifeKeeper ソフトウェア - 各サーバに同じバージョンの LifeKeeper Core をインストールする必要がありますまた使用を計画している同じバージョンの Recovery Kit も各サーバにインストールする必要があります SPS LifeKeeper の特定の要件については SPS for Linux リリースノートを参照してください SteelEye DataKeeper ソフトウェア - SPS クラスタの各サーバには SteelEye DataKeeper ソフトウェアが必要です SteelEye DataKeeper のインストールと削除の特定の手順については SPS for Linux インストールガイドを参照してください全般的な設定ターゲットのディスクまたはパーティションのサイズ ( バックアップサーバ上 ) はソースのディスクまたはパーティションのサイズ ( プライマリサーバ上 ) 以上である必要があります DataKeeper リソースを作成して拡張すると同期プロセスによりターゲットのディスクまたはパーティションに存在するデータが削除されソースのパーティションにあるデータに置き換えられますネットワークと LifeKeeper の設定各ペアのサーバ間でデータのレプリケーション用に選択するパスはあらかじめそれらのサーバ間の LifeKeeper コミュニケーションパスとしても設定されている必要がありますネットワークパスを変更する方法についてはデータレプリケーションパスの変更を参照してください DataKeeper リソースを設定するときにはローカルリカバリを有効にしている LifeKeeper IP リソースがすでに使用しているインターフェース / アドレスの使用は避けてください例えば LifeKeeper IP リソースがインターフェース eth1 に構成されておりインターフェース eth2 でのローカルリカバリが有効にされている場合 eth1 と eth2 のいずれについても DataKeeper リソースによる使用を避ける必要がありますローカルリカバリを有効にするとバックアップインターフェースへのスイッチオーバ中にインターフェースが無効になるので SteelEye DataKeeper に障害が発生することがありま 292 インストールと設定

313 データ複製パスの変更すこのリリースの SteelEye DataKeeper は DataKeeper リソースの自動スイッチバックをサポートしていませんさらに自動スイッチバックの制限は DataKeeper リソースの上に存在する他の LifeKeeper リソースにも適用されますデータ複製パスの変更 LK 7.1 から lk_chg_value を使用して LK 7.1 からマイナーエンドポイントを変更できるようになりました例えばマイナーエンドポイントを IP アドレスのからに変更するには以下の操作を行います 1. lkstop ( lk_chg_value は LifeKeeper の動作中は実行できません ) 2. lk_chg_value -o n lkstart この IP アドレスを使用するミラーに含まれるすべてのサーバでこれらのコマンドを実行してください注記 : このコマンドは該当アドレスを使用するコミュニケーションパスも変更しますネットワーク帯域幅の要件の特定 SteelEye DataKeeper をインストールする前に現在の構成の複製に仮想マシンを使用するか物理的な Linux サーバを使用するかによりネットワーク帯域幅の要件を特定する必要があります仮想マシン ( VM) を使用する場合は Linux システム ( 物理または仮想 ) の変化率の測定方法を使用して複製を計画している仮想マシンの変化率を測定してくださいこの値は仮想マシンの複製に必要となるネットワーク帯域幅を表しますネットワーク帯域幅の要件を特定した後ネットワークが最大のパフォーマンスを発揮するように構成してくださいネットワーク帯域幅の要件が現在使用できるネットワーク能力を超えている場合は以下のオプションを 1 つ以上検討しなければならない可能性があります SteelEye DataKeeper( または可能な場合はネットワークハードウェア ) の圧縮を有効にするネットワーク能力を増強する複製するデータ量を低減する一時データおよびスワップファイル用に複製しないローカルのストレージリポジトリを作成する毎日ピーク時以外に複製を手動でスケジュールする Linux システム ( 物理または仮想 ) での変化率の測定 DataKeeper for Linux は使用できるネットワーク内でデータを複製できますマルチサイトすなわち広域ネットワーク ( WAN) 構成ではソースパーティションが 1 日中更新されるときにパーティションを正常に複製してミラーをミラーリング状態に維持するために十分な帯域幅があるかという質問に対して特別な検討が必要です SteelEye Protection Suite for Linux 293

314 ネットワーク帯域幅の要件の特定ミラーがミラーリング状態でない場合にはパーティションのスイッチオーバは許可されないのでミラーをミラーリング状態に維持することが重要ですネットワーク帯域幅の要件の特定 SteelEye DataKeeper をインストールする前にデータを複製するネットワーク帯域幅の要件を特定する必要があります以下の方法を使用して複製を計画しているデータの変化率を測定してくださいこの値はデータの複製に必要なネットワーク帯域幅の量を表しますネットワーク帯域幅の要件を特定した後ネットワークが最大のパフォーマンスを発揮するように構成してくださいネットワーク帯域幅の要件が現在使用できるネットワーク能力を超えている場合は以下のオプションを 1 つ以上検討する必要があります DataKeeper( または可能な場合はネットワークハードウェア ) の圧縮を有効にする複製が不要な一時データおよびスワップファイル用に複製しないローカルのストレージリポジトリを作成する複製するデータ量を低減するネットワーク能力を増強する SteelEye DataKeeper はデータを非同期キューに追加することにより短期間に急増した書き込み動作を処理しますただし長期間にわたって複製されるすべてのボリュームのディスク書き込み動作の合計が平均して DataKeeper とネットワークが送信できる変化量を下回ることを確認してくださいネットワーク能力が不十分なためにディスクの変化率に対処できず非同期キューがいっぱいになった場合ミラーは同期動作に戻りますこれによりソースサーバのパフォーマンスに悪影響を及ぼすことがあります基本変化率の測定以下のコマンドを使用してミラーリングするファイルまたはパーティションを特定してください例えば /dev/sda3 を使用して 1 日に書き込まれるデータ量を測定します 1 日後 MB_START=`awk '/sda3 / { print $10 / 2 / 1024 }' /proc/diskstats` MB_END=`awk '/sda3 / { print $10 / 2 / 1024 }' /proc/diskstats` 1 日の変化率 ( 単位 : MB) は MB_END MB_START で得られます SteelEye DataKeeper が 1 日にミラーリングできるおよその量は以下のとおりです T1( 1.5 Mbps) - 14,000 MB/ 日 ( 14 GB) T3( 1.5 Mbps) - 410,000 MB/ 日 ( 410 GB) ギガビット ( 1 Gbps) - 5,000,000 MB/ 日 ( 5 TB) 294 インストールと設定

315 詳細変化率の測定詳細変化率の測定変化率を収集する最良の方法は一定期間 ( 例 : 1 日 ) ディスクの書き込み動作をログに記録してディスクの書き込みのピーク期間を特定することですディスクの書き込み動作を追跡するにはシステムのタイムスタンプをログに記録して /proc/diskstats のダンプを行う cron ジョブを作成してください例えば 2 分間隔でディスクの統計値を収集するには /etc/crontab に以下のリンクを追加します : */2 * * * * root ( date ; cat /proc/diskstats ) >> /path_ to/filename.txt 1 日 1 週間などの期間が経過した後 cron ジョブを無効にし得られたデータファイルを安全な場所に保存します収集した詳細変化率データの解析 roc-calc-diskstats ユーティリティは前述の手順で収集したデータを解析しますこのユーティリティは長期間ログに記録された出力を持つ /proc/diskstats 出力ファイルからデータセットに含まれるディスクの変化率を計算します roc-calc-diskstats #!/usr/bin/perl # Copyright (c) 2011, SIOS Technology, Corp. # 作成者 :Paul Clements use strict; sub msg { printf } sub dbg { return if (!$ENV{'ROC_DEBUG'}); } $0 =~ s@^.*/@@; # ベースネーム sub usage { msg "Usage:$0 <interval> <start-time> <iostat-data-file> [dev-list]\n"; msg "\n"; msg "This utility takes a /proc/diskstats output file that contains\n"; msg "output, logged over time, and calculates the rate of change of\n"; msg "the disks in the dataset\n"; msg "OUTPUT_CSV=1 set in env. dumps the full stats to a CSV file on STDERR\n"; msg "\n"; SteelEye Protection Suite for Linux 295

316 収集した詳細変化率データの解析 msg "Example:$0 1hour \"jun 23 12pm\" steeleye-iostat.txt sdg,sdh\n"; msg "\n"; msg "interval - interval between samples\n"; msg "start time - the time when the sampling starts\n"; msg "iostat-data-file - collect this with a cron job like:\n"; msg "\t0 * * * * (date ; cat /proc/diskstats) >> /root/diskstats.txt\n"; msg "dev-list - list of disks you want ROC for (leave blank for all)\n"; exit 1; } usage if (@ARGV < 3); my $interval = TimeHuman($ARGV[0]); my $starttime = epoch($argv[1]); my $file = $ARGV[2]; my $blksize = 512; # /proc/diskstats はセクタ数 my %devs = map { $_ => 1 } split /,/, $ARGV[3]; my %stat; my $firsttime; my $lasttime; # 日付スタンプで出力を除算 my %days = ( 'Sun' => 1, 'Mon' => 1, 'Tue' => 1, 'Wed' => 1, 'Thu' => 1, 'Fri' => 1, 'Sat' => 1); my %fields = ( 'major' => 0, 'minor' => 1, 'dev' => 2, 'reads' => 3, 'reads_merged' => 4, 'sectors_read' => 5, 'ms_time_reading' => 6, 'writes' => 7, 'writes_merged' => 8, 'sectors_written' => 9, 'ms_time_writing' => 10, 'ios_pending' => 11, 'ms_time_total' => 12, 'weighted_ms_time_total' => 13 ); my $devfield = $fields{'dev'}; my $calcfield = $ENV{'ROC_CALC_FIELD'} $fields{'sectors_written'}; dbg "using field $calcfield\n"; open(fd, "$file") or die "Cannot open $file:$!\n"; 296 インストールと設定

317 収集した詳細変化率データの解析 foreach (<FD>) { = split; if (exists($days{$_[0]})) { # 日付スタンプの除算をスキップ if ($firsttime eq '') { $firsttime = join ' } $lasttime = join ' next; } next if ($_[0]!~ /[0-9]/); # 無視 if (!%devs exists $devs{$_[$devfield]}) { $_[$calcfield]; } = totals(\%stat); printf "Sample start time:%s\n", scalar(localtime($starttime)); printf "Sample end time:%s\n", scalar(localtime($starttime + ((@{$stat{'total'}} - 1) * $interval))); printf "Sample interval:%ss # サンプル :%s Sample length:%ss\n", $interval, (@{$stat{'total'}} - 1), (@{$stat{'total'}} - 1) * $interval; print "(Raw times from file:$firsttime, $lasttime)\n"; print "Rate of change for devices ".(join ', ', sort keys %stat)."\n"; foreach (sort keys %stat) { my ($max, $maxindex, $roc) = roc($_, $blksize, printf "$_ peak:%sb/s (%sb/s) (@ %s) average:%sb/s (%sb/s)\n", HumanSize($max), HumanSize($max * 8), scalar localtime($starttime + ($maxindex * $interval)), HumanSize($roc), HumanSize($roc * 8); } # 関数 sub roc { my $dev = shift; my $blksize = shift; my $interval = shift; my ($max, $maxindex, $i, $first, $last, $total); my $prev = -1; my $first = $_[0]; if ($ENV{'OUTPUT_CSV'}) { print STDERR "$dev," } foreach (@_) { SteelEye Protection Suite for Linux 297

318 収集した詳細変化率データの解析 if ($prev!= -1) { if ($_ < $prev) { dbg "wrap detected at $i ($_ < $prev)\n"; $prev = 0; } my $this = ($_ - $prev) * $blksize / $interval; if ($this > $max) { $max = $this; $maxindex = $i; } if ($ENV{'OUTPUT_CSV'}) { print STDERR "$this," } } $prev = $_; # 次回用に現在の値を保存 $last = $_; $i++; } if ($ENV{'OUTPUT_CSV'}) { print STDERR "\n" } return ($max, $maxindex, ($last - $first) * $blksize / ($interval * ($i - 1))); } sub totals { # パラメータ : stat_hash my $stat = shift; foreach (keys %$stat) { next if (!defined($stat{$_})); my $i; foreach (@vals) { $totalvals[$i++] += $_; } } } # KB MB などの単位に変換し読みやすいフォームサイズで出力 sub HumanSize { # パラメータ : bytes/bits my $bytes = shift; = ( '', 'K', 'M', 'G', 'T', 'P' ); my $i = 0; while ($bytes / >= 1) { 298 インストールと設定

319 収集した詳細変化率データの解析 $bytes /= ; $i++; } return sprintf("%.1f %s", $bytes, $suffixes[$i]); } # 人間が理解しやすい時間間隔を秒数に変換 sub TimeHuman { # パラメータ : human_time my $time = shift; my %suffixes = ('s' => 1, 'm' => 60, 'h' => 60 * 60, 'd' => 60 * 60 * 24); $time =~ /^([0-9]*)(.*?)$/; $time = $1; my $suffix = (split //, $2)[0]; # 添え字を最初の文字にする if (exists $suffixes{$suffix}) { $time *= $suffixes{$suffix}; } return $time; } sub epoch { # パラメータ : date my $date = shift; my $seconds = `date +'%s' --date "$date" 2>&1`; if ($?!= 0) { die "Failed to recognize time stamp:$date\n"; } return $seconds; } 使用法 : #./roc-calc-diskstats <interval> <start_time> <diskstats-datafile> [dev-list] 使用例 ( 概要のみ ) : #./roc-calc-diskstats 2m Jul 22 16:04:01 /root/diskstats.txt sdb1,sdb2,sdc1 > results.txt この例は概要 ( およびディスク別のピーク I/O 情報 ) を results.txt にダンプします使用例 ( 概要とグラフデータ ) : # export OUTPUT_CSV=1 #./roc-calc-diskstats 2m Jul 22 16:04:01 /root/diskstats.txt sdb1,sdb2,sdc1 2> results.csv > results.tx SteelEye Protection Suite for Linux 299

320 詳細変化率データのグラフ作成この例はグラフデータを results.csv に概要 ( およびディスク別のピーク I/O 情報 ) を results.txt にダンプします結果の例 ( results.txt) Sample start time: Tue Jul 12 23:44: Sample end time: Wed Jul 13 23:58: Sample interval: 120s #Samples: 727 Sample length: 87240s (Raw times from file: Tue Jul 12 23:44:01 EST 2011, Wed Jul 13 23:58:01 EST 2011) Rate of change for devices dm-31, dm-32, dm-33, dm-4, dm-5, total dm-31 peak:0.0 B/s (0.0 b/s) (@ Tue Jul 12 23:44: ) average:0.0 B/s (0.0 b/s) dm-32 peak:398.7 KB/s (3.1 Mb/s) (@ Wed Jul 13 19:28: ) average:19.5 KB/s (156.2 Kb/s) dm-33 peak:814.9 KB/s (6.4 Mb/s) (@ Wed Jul 13 23:58: ) average:11.6 KB/s (92.9 Kb/s) dm-4 peak:185.6 KB/s (1.4 Mb/s) (@ Wed Jul 13 15:18: ) average:25.7 KB/s (205.3 Kb/s) dm-5 peak:2.7 MB/s (21.8 Mb/s) (@ Wed Jul 13 10:18: ) average:293.0 KB/s (2.3 Mb/s) total peak:2.8 MB/s (22.5 Mb/s) (@ Wed Jul 13 10:18: ) average:349.8 KB/s (2.7 Mb/s) 詳細変化率データのグラフ作成お客様に固有の経時的な帯域幅のニーズを分かりやすくするためにテンプレートスプレッドシート diskstats-template.xlsx が用意されていますこのスプレッドシートにはサンプルデータがあり roccalc-diskstats で収集したデータで上書きできます diskstats-template 300 インストールと設定

詳細変化率データのグラフ作成 1. results.csv を開き total 列を含めてすべての行を選択してください 2. diskstats-template.xlsx を開き diskstats.csv ワークシートを選択してください 3. セル 1-A を右クリックし [Insert Copied Cells] を選択してください 4.

321 詳細変化率データのグラフ作成 1. results.csv を開き total 列を含めてすべての行を選択してください 2. diskstats-template.xlsx を開き diskstats.csv ワークシートを選択してください 3. セル 1-A を右クリックし [Insert Copied Cells] を選択してください 4. 複製用に割り当てた帯域幅の量を反映するようにワークシートの左下にあるセルの bandwidth 値を調整してください単位 : メガビット / 秒 ( Mb/sec) 注記 : その右側にあるセルの値は収集した生データに合わせて自動的にバイト / 秒単位に変換されます SteelEye Protection Suite for Linux 301

bandwidth vs ROC ワークシートを選択してください 7. グラフを右クリックし [Select Data...] を選択してください a.

322 詳細変化率データのグラフ作成 5. 以下の行 / 列番号を記録してください a. Total( 下のスクリーンショットでは行 6) b. Bandwidth( 下のスクリーンショットでは行 9) c. 最終データポイント ( 下のスクリーンショットでは列 R) 6. bandwidth vs ROC ワークシートを選択してください 7. グラフを右クリックし [Select Data...] を選択してください a. Bandwidth 系列を調整してください i. 左の [Series] リストから bandwidth を選択してください ii. [Edit] をクリックしてください iii. 以下の構文を使用して [Series Values] フィールドを調整してください 302 インストールと設定

[Edit] をクリックしてください iii. 以下の構文を使用して [Series Values] フィールドを調整してください =diskstats.csv!

323 詳細変化率データのグラフ作成 =diskstats.csv!$b$<row>:$<final_column>$<row>" 例 : =diskstats.csv!$b$9:$r:$9" iv. [OK] をクリックしてください b. ROC 系列を調整してください i. 左の [Series] リストから ROC を選択してください ii. [Edit] をクリックしてください iii. 以下の構文を使用して [Series Values] フィールドを調整してください =diskstats.csv!$b$<row>:$<final_ column>$<row>" 例 : =diskstats.csv!$b$6:$r:$6" SteelEye Protection Suite for Linux 303

324 [Confirm Failover] と [Block Resource Failover] の設定 iv. [OK] をクリックしてください c. [OK] をクリックしてウィザードを終了してください 8. Bandwidth vs ROC のグラフが更新されます結果を解析してデータの複製をサポートするために十分な帯域幅があるかどうかを判断してください [Confirm Failover] と [Block Resource Failover] の設定以下の説明例および考慮事項をよく読んで理解してからお使いの LifeKeeper 環境で [Confirm Failover] または [Block Resource Failover] を設定してくださいこれらの設定はコマンドラインまたは LifeKeeper の GUI の [Properties] パネルから使用できます [Confirm Failover On] 定義 - システム A からシステム B へのフェイルオーバの手動確認を有効にします ( ここでシステム A はプロパティが [Properties] パネルに表示されるサーバでシステム B はチェックボックスの左にあるシステム ) あるシステムでこのオプションをオンに設定した場合障害発生が検出されたシステムについて LifeKeeper がフェイルオーバリカバリを実行するにはシステム管理者による手動確認が必要になりますフェイルオーバを確認するには lk_confirmso コマンドを使用しますデフォルトではこのコマンドを実行するまで管理者には 10 分の猶予時間がありますこの時間は /etc/default/lifekeeper の CONFIRMSOTO 設定で変更できます管理者が 10 分以内に lk_confirmso コマンドを実行しない場合フェイルオーバは続行されるかブロックされますデフォルトではフェイルオーバが続行されますこの動作は /etc/default/lifekeeper の COMFIRMSODEF 設定で変更できます例 : 自動フェイルオーバをすべてブロックする場合は [Properties] パネルの [Confirm Failover On] オプションを設定しさらに CONFIRMSODEF を 1( フェイルオーバをブロック ) CONFIRMSOTO を 0( フェイルオーバ動作が決定されるまで待機しない ) に設定してくださいこの設定を選択する時期 : この設定は構成に冗長ハートビートコミュニケーションパスを含まない多くのディザスタリカバリ XenServer その他の WAN 構成で使用されます 304 インストールと設定

325 [Block Resource Failover On] 通常のサイト ( 非マルチサイトクラスタおよび非 XenServer) ではあるサーバで [Properties] ページを開き [Confirm Failover flag] フラグをオンに設定するサーバを選択してくださいマルチサイト WAN の構成の場合 : フェイルオーバの手動確認を有効にしてくださいマルチサイト LAN の構成の場合 : フェイルオーバの手動確認を有効にしないでくださいマルチサイトクラスタ環境では非ディザスタシステムから DR システムを選択し [Set Confirm Failover On] チェックボックスをオンにしますクラスタ内の非ディザスタサーバのそれぞれについて [Properties] パネルを開いてこの設定を選択する必要があります XenServer 環境ではリスト内のすべてのサーバ ( DR サイトのみでなく ) のチェックボックスをオンにする必要があります [Block Resource Failover On] 定義 - デフォルトではリソースのすべての障害についてリカバリイベントが発生しローカルシステムの障害リソースのリカバリが試行されますローカルリカバリが失敗した場合または有効になっていない場合はリソースが定義されている優先順位が次に最も高いシステムに LifeKeeper がリソース階層を転送しますただし宛先として指定したシステムでこの設定を選択している場合リソース障害に起因するリソースの転送はすべてブロックされますこの設定が有効の場合以下のメッセージがログに記録されます Local recovery failure, failover blocked, MANUAL INTERVENTION REQUIRED 条件 / 考慮事項 : マルチサイト構成では構成内のすべてのサーバについてフェイルオーバのブロックを選択しないでください XenServer 環境ではクラスタ内の各システムについてフェイルオーバのブロックを選択してください注記 : この設定はシステム全体の障害が発生した場合のフェイルオーバ動作には影響しませんローカルリソースの障害に起因するフェイルオーバのみをブロックします各サーバのフラグの設定 1. LifeKeeper の GUI にログインしクラスタ内のサーバを選択してください [View] メニューで [Properties] パネルのオプションを選択した場合は [Properties] パネルが表示されます ( GUI の右端 ) パネルの下部にある [General] タブにシステム構成が表示されます SteelEye Protection Suite for Linux 305

326 SteelEye DataKeeper for Linux のリソースタイプ 2. [Set Confirm Failover On] 列でクラスタ内のその他の各サーバのチェックボックスをオンにしてください 3. [Set Block Resource Failover On] 列で必要に応じてクラスタ内の各サーバのチェックボックスをオンにしてくださいマルチサイトクラスタ構成での重要な考慮事項 : マルチサイトクラスタ構成のサーバについては [Set Block Resource Failover On] 列のチェックボックスをオンにしないでください 4. [OK] をクリックしてください SteelEye DataKeeper for Linux のリソースタイプ DataKeeper リソース階層を作成するときにリソースタイプを選択するように LifeKeeper から要求されます DataKeeper リソースにはいくつかのタイプがありますお使いの環境に最適なタイプを選択するときに以下の情報が役立ちます Replicate New File System Replicate New File System を選択すると NetRAID デバイスが作成 / 拡張され NetRAID デバイスに指定のマウントポイントがマウントされますまた LifeKeeper がサポートするファイルシステムと NetRAID デバイスの両方が LifeKeeper で保護されますローカルのディスクまたはパーティションがフォーマットされます注意 : データがすべて削除されます Replicate Existing File System Replicate Existing File System を選択すると現在マウントされているディスクまたはパーティションが使用されディスクまたはパーティションのデータが削除されることなく NetRAID デバイスが作成されます SteelEye DataKeeper はローカルのディスクまたはパーティションをアンマウントしローカルのディスクまたはパーティションを使用して NetRAID デバイスを作成しますそして NetRAID デバイスにマウントポイントをマウントします次に NetRAID デバイスと LifeKeeper がサポートするファイルシステムの両方を LifeKeeper で保護します 306 インストールと設定

327 DataKeeper Resource 重要 : SteelEye Protection Suite for Linux のマルチサイトクラスタ階層を作成する場合作成プロセス中にアプリケーションが停止します階層の作成と拡張が完了した後アプリケーションを再起動する必要があります DataKeeper Resource DataKeeper リソースを選択すると NetRAID デバイスが作成 / 拡張されファイルシステムは含めずに LifeKeeper で保護されます RAW I/O デバイスを使用できるデータベースを使用している場合はこの複製タイプを選択できますユーザがデータアクセスを続行できるように SteelEye DataKeeper は現在マウントされている NetRAID デバイスのアンマウントと削除は実行しませんユーザは手動スイッチオーバの前に NetRAID デバイスを手動でアンマウントし手動スイッチオーバの後に他のサーバにマウントする必要があります注記 : DataKeeper リソースの作成後に手動マウントしたファイルシステムを LifeKeeper で保護する場合は以下の操作を行います 1. LifeKeeper がサポートするファイルシステムで NetRAID デバイスをフォーマットしてください 2. NetRAID デバイスをマウントしてください 3. NetRAID デバイスを使用して共有ストレージのディスクまたはパーティションにあるかのようにファイルシステムの階層を作成し拡張してくださいこれで LifeKeeper のファイルシステムリカバリキットがフェイルオーバ時のファイルシステムのマウント / アンマウントを実行しますリソースの設定作業 SteelEye DataKeeper の設定作業はすべて LifeKeeper のグラフィカルユーザインターフェース ( GUI) から実行できます LifeKeeper の GUI では SteelEye DataKeeper のリソースの設定管理監視の作業をガイド付きで行うことができます概要 SteelEye DataKeeper の設定に関して以下の作業を行うことができます Create a Resource Hierarchy - DataKeeper リソース階層を作成します Delete a Resource Hierarchy - DataKeeper リソース階層を削除します Extend a Resource Hierarchy - DataKeeper リソース階層をプライマリサーバからバックアップサーバに拡張します Unextend a Resource Hierarchy - LifeKeeper クラスタ内にある 1 台のサーバの DataKeeper リソース階層を拡張解除 ( 削除 ) します Create Dependency - 既存のリソース階層と別のリソースインスタンスとの間に子の依存関係を作成しクラスタ内のすべての対象サーバに依存関係の変更を伝播します Delete Dependency - リソースの依存関係を削除してクラスタ内にあるすべての対象サーバに SteelEye Protection Suite for Linux 307

328 DataKeeper リソース階層の作成依存関係の変更を伝播します In Service - リソース階層をアクティブにします Out of Service - リソース階層を非アクティブにします View/Edit Properties - リソース階層のプロパティの表示または編集を行います DataKeeper リソース階層の作成マルチサイトクラスタに DataKeeper リソース階層を作成する場合は [Hierarchy Type] を選択した後このセクションの最後にある手順を参照してくださいプライマリサーバで以下の操作を行ってください 1. [Edit] > [Server] > [Create Resource Hierarchy] を選択してください [Create Resource Wizard] ダイアログボックスが表示されます 2. ドロップダウンリストから [Data Replication] オプションを選択し [Next] をクリックして続行してください 3. 以下の情報を入力するように要求されますダイアログボックスで [Back] ボタンが有効な場合は前のダイアログボックスに戻ることができますこれはエラーが発生して前に入力した情報を修正する必要がある場合に便利な機能ですいつでも [Cancel] をクリックして作成処理全体を取り消すことができますフィールド Switchback Type Server Hierarchy Type ヒント [intelligent switchback] を指定する必要がありますこれはバックアップサーバにフェイルオーバした後管理者が手動で DataKeeper リソースをプライマリサーバにスイッチバックする必要があることを意味します注意 : このリリースの SteelEye DataKeeper は DataKeeper リソースの自動スイッチバックをサポートしていませんさらに自動スイッチバックの制限は DataKeeper リソースの上に存在する他の LifeKeeper リソースにも適用されます作成する NetRAID デバイスが存在するサーバ ( 通常はプライマリサーバ ) の名前を選択してくださいドロップダウンリストボックスにはクラスタ内のすべてのサーバが表示されます以下のいずれかを選択して作成するデータレプリケーションのタイプを選択してください Replicate New File System Replicate Existing File System DataKeeper Resource 308 インストールと設定

329 リソース階層の拡張フィールド Bitmap File Enable Asynchronous Replication? ヒントインテントログの記録に使用するビットマップファイルの名前を選択するか入力してください [None] を選択するとインテントログは使用されずすべての再同期が部分的ではなく全体の再同期になりますこのレプリケーションリソースによるターゲットシステムへの非同期レプリケーションのサポートを許可するには [Yes] を選択してくださいすべてのターゲットについて同期レプリケーションを使用する場合は [No] を選択してください後でレプリケーションリソースが各ターゲットサーバに拡張されるときに実際のレプリケーションタイプ ( 同期または非同期 ) を選択するように要求されます ( 両方のレプリケーションタイプの詳細については SteelEye DataKeeper でのミラーリングを参照してください ) これらすべてのターゲットへのレプリケーションを非同期で実行する場合は他のターゲットへのレプリケーションを同期実行する場合でもここでは [Yes] を選択する必要があります以降の一連のダイアログボックスは [Hierarchy Type] で選択した項目によって異なります一部のダイアログボックスはすべての階層タイプで同じですが表示される順序と必要な情報が少し異なることがあります以下の 3 つのトピックで階層作成の残りのプロセスについて説明しています DataKeeper Resource Replicate New File System Replicate Existing File System リソース階層の拡張この操作は [Edit] メニューから開始できますまたは [Create Resource Hierarchy] オプションの動作が完了すると自動的に開始されますその場合は手順 2 を参照してください 1. [Edit] メニューの [Resource] から [Extend Resource Hierarchy] を選択します Pre-Extend Wizard が表示されます拡張操作に慣れていない場合は [Next] をクリックしてください LifeKeeper の [Extend Resource Hierarchy] のデフォルト値が分かっていて入力と確認を省略する場合は [Accept Defaults] をクリックしてください 2. Pre-Extend Wizard に以下の情報を入力します注記 : 最初の 2 つのフィールドは [Edit] メニューから拡張を開始した場合にのみ表示されますフィールド Template Server ヒント現在 In Service の DataKeeper リソース階層が存在するテンプレートサーバを選択してくださいここで選択するテンプレートサーバと次のダイアログボックスで選択する拡張するタグによって In Service ( アクティブ ) のリソース階層が表されることを理解しておくことが重要です選択したテンプレートサーバで In Service でないリソースタグを選択した場合エラーメッセージが表示されますこのダイアログのドロップダウンボックスにはクラスタ内にある全サーバの名前が表示されます SteelEye Protection Suite for Linux 309

330 DataKeeper リソース階層の拡張フィールド Tag to Extend Target Server Switchback Type Template Priority ヒントこれはテンプレートサーバからターゲットサーバに拡張する DataKeeper インスタンスの名前ですドロップダウンボックスにはテンプレートサーバ上に作成したすべてのリソースが表示されます拡張先のサーバを入力するか選択してください [intelligent switchback] を指定する必要がありますこれはバックアップサーバにフェイルオーバした後管理者が手動で DataKeeper リソースをプライマリサーバにスイッチバックする必要があることを意味します注意 : このリリースの SteelEye DataKeeper は DataKeeper リソースの自動スイッチバックをサポートしていませんさらに自動スイッチバックの制限は SteelEye DataKeeper リソースの上に存在する他の LifeKeeper リソースにも適用されますテンプレートの優先順位を選択するか入力してくださいこれはサーバで現在 In Service の DataKeeper 階層の優先順位です 1 ~ 999 の範囲でまだ優先順位として使用されていない値が有効で小さい数字ほど優先順位が高くなります ( 数値 1 が最高の優先順位 ) 拡張処理時に別のシステムですでに使用中の優先順位をこの階層に対して指定することはできませんデフォルト値をが推奨されます注記 : このフィールドは階層をはじめて拡張するときにだけ表示されます Target Priority ターゲットの優先順位を選択するか入力してくださいこれは他のサーバにある同等の階層に対する新しく拡張する DataKeeper 階層の優先順位です 1 ~ 999 の範囲でまだ優先順位として使用されていない値が有効でリソースのカスケーディングフェイルオーバシーケンスにおけるサーバの優先順位を示します数値が小さいほど優先順位は高くなります ( 数値 1 が最高の優先順位 ) LifeKeeper のデフォルトでは階層が作成されたサーバに 1 が割り当てられることに注意してください優先順位は連続している必要はありませんが特定のリソースについて 2 つのサーバに同じ優先順位を割り当てることはできません拡張前のチェックが正常に終了したというメッセージが表示されたら [Next] をクリックしてください拡張する階層に応じて拡張されるリソースタグ ( 一部編集不可 ) を示す一連の情報ボックスが表示されます 3. [Next] をクリックして [Extend Resource Hierarchy] の構成タスクを開始してください 4. 次のセクションには別のサーバに DataKeeper リソースを拡張するために必要な手順を示します DataKeeper リソース階層の拡張 1. pre-extend スクリプトが正常に実行されたというメッセージが表示されたら以下の情報を指定するように要求されます 310 インストールと設定

331 DataKeeper リソース階層の拡張フィールド Mount Point Root Tag ヒントターゲットサーバ上にあるファイルシステムマウントポイントを入力してください ( DataKeeper リソースに関連する LifeKeeper が保護するファイルシステムがない場合はこのダイアログは表示されません ) ルートタグを選択するか入力してくださいこれはターゲットサーバ上にあるファイルシステムリソースインスタンスの一意の名前です ( DataKeeper リソースに関連する LifeKeeper が保護するファイルシステムがない場合はこのダイアログは表示されません ) 複製するファイルシステムの配置先となるターゲットサーバ上のディスクまたはパーティションを選択してくださいドロップダウンボックスのディスクまたはパーティションのリストには以下のものを除いて使用できるすべてのディスクが表示されます Target Disk or Partition すでにマウント済みのものスワップディスクまたはスワップパーティション LifeKeeper が保護するディスクまたはパーティションドロップダウンリストには root (/) boot (/boot) /proc, floppy cdrom などの特殊なディスクまたはパーティションも表示されません注記 : ターゲットのディスクまたはパーティションはソースのディスクまたはパーティション以上のサイズである必要があります DataKeeper Resource Tag Bitmap File Replication Path Replication Type DataKeeper リソースタグの名前を選択するか入力してくださいインテントログの記録に使用するビットマップファイルの名前を選択するか入力してください [None] を選択するとインテントログは使用されずすべての再同期が部分的ではなく全体の再同期になりますターゲットサーバとクラスタ内の他の指定サーバとの間で複製に使用するローカルとリモートの IP アドレスのペアを選択してください有効なパスおよび対応する IP アドレスはこのサーバのペアに対して指定した LifeKeeper コミュニケーションパスのセットから得られます DataKeeper の特性によりプライベート ( 専用 ) ネットワークを使用することが強く推奨されます DataKeeper リソースをすでに 1 台以上のターゲットサーバに拡張している場合追加のサーバに対する拡張を実行すると新しいターゲットサーバと既存のサーバとの組み合わせのそれぞれについて繰り返し複製パスを指定するように要求されます指定したサーバのペアについて使用する複製タイプとして [synchronous] または [asynchronous] を選択してください前述の [Replication Path] フィールドと同様に DataKeeper リソースをすでに 1 台以上のターゲットサーバに拡張している場合追加のサーバに対する拡張を実行すると新しいターゲットサーバと既存のサーバとの組み合わせのそれぞれについて繰り返し複製タイプを指定するように要求されます SteelEye Protection Suite for Linux 311

332 リソース階層の拡張解除 2. [Extend] をクリックして次に進んでください拡張が実行中であることを確認する情報ボックスが表示されます 3. [Finish] をクリックして DataKeeper リソースインスタンスが正常に拡張されたことを確認してください 4. [Done] をクリックして [Extend Resources Hierarchy] メニューを終了してください注記 : 必ずすべてのサーバでスイッチオーバを手動実行して新しいインスタンスの機能をテストしてください詳細についてはリソース階層のテストを参照してくださいこの時点で SteelEye DataKeeper がソースからターゲットのディスクまたはパーティションにデータの再同期を開始しています LifeKeeper の GUI ではターゲットサーバにある DataKeeper リソースのステータスは Resyncing になります再同期が完了するとステータスは Target になりますこれは通常のスタンバイ状態です再同期中 DataKeeper リソースおよびそれに依存するリソースはフェイルオーバできませんこれはデータの破損を防止するためですリソース階層の拡張解除 LifeKeeper クラスタ内にある 1 台のサーバからリソース階層を削除するには次の手順を実行します 1. [Edit] メニューの [Resource] から [Unextend Resource Hierarchy] を選択してください 2. DataKeeper リソースを拡張解除するターゲットサーバを選択してください DataKeeper リソースが現在 In Service ( アクティブ ) のサーバは選択できません注記 : 右側のペインから個々のリソースインスタンスを右クリックして [Unextend] 作業を選択した場合このダイアログボックスは表示されません [Next] をクリックしてください 3. 拡張解除する DataKeeper 階層を選択し [Next] をクリックしてください ( このダイアログはいずれかのペインでリソースインスタンスを右クリックして [Unextend] を選択した場合には表示されません ) 4. 選択したターゲットサーバと DataKeeper リソース階層の拡張解除を確認する情報ボックスが表示されます [Unextend] をクリックしてください 5. DataKeeper リソースが正常に拡張解除されたことを確認する別の情報ボックスが表示されます [Done] をクリックして [Unextend Resource Hierarchy] メニューを終了してください注記 : これでデータがバックアップサーバにレプリケーションされなくなりますリソース階層の削除 LifeKeeper 構成内のすべてのサーバから DataKeeper リソースを削除するには次の手順を実行してください注記 : DataKeeper リソースは削除する前に Out of Service にすることが推奨されます Out of Service にしない場合 md と NetRAID のデバイスが削除されずファイルシステムを手動でアンマウントする必要があります DataKeeper リソースを Out of Service にするを参照してください 312 インストールと設定

333 DataKeeper リソースを Out of Service にする 1. [Edit] メニューの [Resource] から [Delete Resource Hierarchy] を選択してください 2. 削除する DataKeeper リソース階層が存在するターゲットサーバの名前を選択してください注記 : 左側ペインのグローバルリソースまたは右側ペインの個々のリソースインスタンスを右クリックして [Delete Resource] 作業を選択した場合このダイアログボックスは表示されません 3. [Hierarchy to Delete] を選択してください ( 左右のペインのリソースインスタンスを右クリックして [Delete Resource] 作業を選択した場合このダイアログは表示されません ) [Next] をクリックしてください 4. 選択したターゲットサーバと削除の対象として選択した階層を確認する情報ボックスが表示されます [Delete] をクリックしてください 5. DataKeeper リソースが正常に削除されたことを確認する別の情報ボックスが表示されます [Done] をクリックして終了してください注記 : リソースを削除する前にマウントされた状態の NetRAID デバイスはマウントされたまま残りますそれ以外の NetRAID デバイスは削除されます DataKeeper リソースを Out of Service にする DataKeeper リソースを Out of Service にすると LifeKeeper によるリソースの保護が解除されますミラーが解除されファイルシステムがアンマウントされます ( 該当する場合 ) md デバイスが停止し nbd サーバとクライアントが強制終了されます警告 : データのミラーリングを停止して LifeKeeper の保護を解除する場合以外は DataKeeper リソースを Out of Service にしないでください一時停止の操作を使用してミラーリングを一時停止してください 1. LifeKeeper の GUI の右側ペインにある In Service の DataKeeper リソースを右クリックしてください 2. リソースのポップアップメニューの [Out of Service] をクリックしてください 3. 選択したリソースが Out of Service になることを示すダイアログボックスが表示されますこの操作に関連するリソースの依存関係がダイアログに表示されます [Next] をクリックしてください 4. 情報ボックスに Out of Service にするリソースの結果が表示されます [Done] をクリックしてください DataKeeper リソースを In Service にする DataKeeper リソースを In Service にする操作はリソースの作成と似ています LifeKeeper は nbd サーバとクライアントを起動しソースとターゲットのデバイス間でデータを同期する md デバイスを起動してファイルシステムをマウントします ( 該当する場合 ) 1. 右側のペインにある DataKeeper リソースインスタンスを右クリックしてください 2. ポップアップメニューの [In Service] をクリックしてください選択したサーバとリソースを In Service にすることを確認するダイアログボックスが表示されます [In Service] をクリックしてリソースを In Service にしてください SteelEye Protection Suite for Linux 313

334 リソース階層のテスト 3. 情報ボックスに In Service にするりソースの結果が表示されますこの操作に関連するリソースの依存関係が確認ダイアログに表示されます [Done] をクリックしてくださいリソース階層のテスト手動スイッチオーバを開始することによって DataKeeper リソース階層をテストできますこのテストはプライマリサーバからバックアップサーバへのリソースインスタンスのフェイルオーバをシミュレートします LifeKeeper の GUI からの手動スイッチオーバの実行手動スイッチオーバを開始するには LifeKeeper の GUI で [Edit] > [Resource] > [In Service] を選択します例えばバックアップサーバで In Service リクエストが実行されると DataKeeper リソース階層がバックアップサーバ側で In Service になりプライマリサーバ側では Out of Service になりますこの時点で元のバックアップサーバがプライマリサーバに元のプライマリサーバがバックアップサーバになりますスイッチオーバ後 LifeKeeper の GUI ではターゲットサーバにある DataKeeper リソースのステータスが Resyncing ( 再同期中 ) になります再同期が完了するとステータスは Target になりますこれは通常のスタンバイ状態です注記 : 再同期中は DataKeeper リソースの手動フェイルオーバはできません [Out of Service] 要求を実行した場合リソース階層は他のサーバで In Service にならずに Out of Service になりますリソースを同じサーバ上で In Service に戻すことができるのは再同期中にリソースが Out of Service になった場合のみです 314 インストールと設定

335 管理 SteelEye DataKeeper for Linux の管理以下のトピックにはリソースを作成した後の SteelEye DataKeeper for Linux の動作と問題を理解し管理するのに役立つ情報がありますミラーのステータスの表示 [Replication Status] ダイアログにはミラーに関する以下の情報が表示されます Mirror status:fully Operational( フルに動作可能 ) Paused( 一時停止 ) Resyncing( 再同期中 ) または Out Of Sync( 非同期 ) Synchronization status: 同期が完了した割合 Replication type: synchronous( 同期 ) または asynchronous( 非同期 ) Replication direction: ソースサーバからターゲットサーバに Bitmap: ビットマップ / インテントログの状態 Rewind Log: リワインドログの場所とサイズ ( 有効の場合 ) Network Compression Level: 圧縮レベル ( 有効の場合 ) [Replication Status] ダイアログを表示するには次の手順に従います 1. [View] メニューをクリックし [Properties Panel] を選択します 2. [LifeKeeper status] 表示にある DataKeeper リソースをクリックしますまたは 1. [LifeKeeper status] 表示にある DataKeeper リソースを右クリックします 2. ポップアップメニューから [Properties] を選択します SteelEye Protection Suite for Linux 315

336 GUI からのミラーの管理 GUI からのミラーの管理 SteelEye DataKeeper のミラーは LifeKeeper の GUI から以下の 2 とおりの方法で実行できます 1. [Properties Panel] を有効にしツールバーのアイコン ( スクリーンショットを参照 ) をクリックします 316 管理

337 リワインドブックマークの作成と表示 /Linux/7.5/LK4L/SAPSolution/docmap.html 以下の 1 ファイルで使用 : /alllinux.php 説明を表示するにはそれぞれのアイコンをクリックしてくださいまたは 2. DataReplication リソースを右クリックしポップアップメニューから動作を選択しますリワインドブックマークの作成と表示 SteelEye Protection Suite for Linux 317

338 ミラーを強制的にオンラインにするブックマークとはリワインドログファイル内に配置されるエントリですリワインドの実行が必要な場合にブックマークは重要なシステムイベント ( アップグレードなど ) の追跡に役立ちますリワインドの実行時にブックマークの付いたログエントリがすべてリワインド位置の選択肢として表示されますミラーを強制的にオンラインにする [Force Mirror Online] は両方のサーバが動作不能になりかつプライマリサーバの再起動後にリソースを In Service にできない場合にのみ使用してください [Force Mirror Online] を選択すると data_corrupt フラグが削除され DataKeeper リソースが In Service になります詳細についてはトラブルシューティングセクションのプライマリサーバがリソースを ISP にできないを参照してください注記 : Mirror_settings はターゲットシステム ( ミラーのソースになるシステムには無関係に設定を有効にする場合はすべてのシステム ) で実行する必要があります設定の変更内容を有効にするにはミラーを一時停止してから再起動する必要があります一時停止と再開ミラーの一時停止ミラーの再開ミラーを一時停止してすべての書き込みをターゲットディスクに複製する動作を一時的に停止できます例えばミラーを一時停止してターゲットディスクのスナップショットを収集することもトラフィックのピーク時にソースシステムの I/O パフォーマンスを向上させることもできますミラーを一時停止するとミラーはターゲットシステムの通常のファイルシステムのマウントポイントに読み取りアクセスするように ( カーネル以降は読み取り / 書き込みアクセス ) マウントされますミラーの一時停止中にターゲットに書き込まれたデータはすべてミラーの再開時に上書きされますデータのリワインドと復旧 318 管理

339 データのリワインドと復旧リワインド機能を使用するとターゲットディスクのデータを以前の任意のディスク書き込みに戻すことができます手順は以下のとおりです 1. ミラーを一時停止します 2. 以前のディスク書き込みに対応するタイムスタンプを選択しディスクがその時点までリワインドされます 3. リワインドしたデータを確認しその状態 ( 良好または不良 ) を指定するように要求されます 4. その後ユーザは現在のデータを使用することも ( 手順 5 に移動 ) 別のタイムスタンプを選択してリワインドを続行することも ( 手順 2 に移動 ) できます 5. ユーザはデータを手動で復旧してからミラーを再開 ( リワインドしたデータを消去 ) することもミラーと任意の保護されたアプリケーションをターゲットシステムに切り替えてリワインドしたデータを新規の実稼働データとして使用することもできます上記の手順が一連のウィザードのダイアログとして表示されますダイアログを以下に示します 1. データのリワインドを確定してください [Continue] をクリックしてください 2. ミラーがリワインドの準備をするために一時停止します [Next] をクリックしてください 3. リワインドする時点のタイムスタンプを選択するか入力してくださいブックマーク付きのログエントリおよび他のログエントリのランダムサンプリングがドロップダウンリストに表示されますダイアログ下部の進行状況バーに良好のデータ ( 緑 ) 不良のデータ ( 赤 ) 不明のデータ ( 黄 ) が表示されますしたがってリワインドプロセスの開始時には進行状況バーはすべて黄で表示されますデータがリワインドされユーザがデータの良好不良を指定するとそれに合わせて進行状況バーが緑と赤のセクションで更新されます SteelEye Protection Suite for Linux 319

340 データのリワインドと復旧ダイアログ 3 4. データのリワインド中ですデータのリワインド後データを検証できるようにターゲットディスクが読み取り専用アクセス用にマウントされます [Next] をクリックしてください 320 管理

データのリワインドと復旧ダイアログ 4 5. データのコメントを入力するように要求されますコメントを入力し ( 任意 ) [Next] をクリックしてください 6. 次にデータが有効かどうかを指定するように要求されます [Yes] または [No] をクリックし [Next] をクリックしてください 7.

341 データのリワインドと復旧ダイアログ 4 5. データのコメントを入力するように要求されますコメントを入力し ( 任意 ) [Next] をクリックしてください 6. 次にデータが有効かどうかを指定するように要求されます [Yes] または [No] をクリックし [Next] をクリックしてください 7. 次にリワインドを続行するか ( ダイアログ 3 に戻る ) 現在のリワインドされたデータを使用してリカバリを開始するか ( ダイアログ 8 に進む ) を尋ねられます 8. リカバリ方法を選択するように要求されます選択肢は以下のとおりです a. アプリケーションを < ターゲットシステム > に移動する ( ダイアログ 9 に進む ) b. ソースシステムにデータを手動コピーする ( ダイアログ 10 に進む ) c. 項目を選択し [Next] をクリックしてください 9. ターゲットサーバに階層がスイッチオーバされますリワインドされたデータが古いソースディスクと再同期されます [Finish] をクリックしてくださいリワインドが完了しました 10. ソースシステムにファイルを手動でコピーするように要求されます保持するリワインドデータを安全な場所にコピーし [Next] をクリックしてください SteelEye Protection Suite for Linux 321

342 圧縮レベルの設定 11. ミラーが再開されますソースからターゲットへの全体の再同期が実行されます [Finish] をクリックしてくださいリワインドが完了しました圧縮レベルの設定ネットワークの圧縮レベルは 0 ~ 9 の値に設定できます値 0 は圧縮を無効にしますレベル 1 は最も高速で圧縮率が最も低いレベルです一方レベル 9 は最も低速ですが圧縮率が最高ですネットワーク圧縮は通常 WAN 環境で利用することによって効果を発揮しますリワインドログの場所の設定リワインドログファイルの保存場所を選択します ( システムがミラーのターゲットである場合のみ ) 必要とするログ履歴 1 の量を保存するためにこの場所には十分な容量が必要ですログはミラーまたは共有ディスクに置くことができません最大のパフォーマンスを発揮するにはミラーとは別の物理ディスクに置いてください空の設定はリワインドログを無効にします注記 : 設定の変更内容を有効にするにはミラーを一時停止してから再起動する必要があります 1 ログファイルはミラーディスクに書き込まれる各ディスクブロックのコピーを持つため同一のディスクブロックを複数回書き込んだ場合やファイルを変更したりファイルの最後に内容を付け加えたりした場合ログファイルがミラーディスク自体よりも大きなサイズになる可能性がありますリワインドログの最大サイズの設定ログファイルの最大サイズを MB 単位で入力してください空の値または値 0 はファイルサイズの制限を無効にします最大サイズまで増大するログファイルを保存するためにログファイルディスクには十分な容量が必要ですただしディスク容量が不足したことが検出された場合ログが折り返され最も古いエントリが上書きされますコマンドラインからのミラー管理ミラーの管理は LifeKeeper の GUI からの操作だけでなくコマンドラインからも実行できま 322 管理

343 ミラーの操作す DataKeeper のリソースの管理に使用できるコマンドがいくつかあります ( $LKROOT/bin ディレクトリを参照 ) ミラーの操作 mirror_action <tag> <action> <source> [target(s)] <tag> DataKeeper リソースを表す LifeKeeper のソースタグ <action> pause resume force fullresync のいずれか <source> 現在のソースシステム <target> 操作対象のターゲットシステム ( またはシステムのリスト ) 例 : ソースシステム adam からターゲットシステム eve へのミラー ( 名前 : datarep-ext3) を一時停止する mirror_action datarep-ext3 pause adam eve adam から eve と sophocles の両方のシステムへの複製を再開する mirror_action datarep-ext3 resume adam eve sophocles システム eve へのオンラインミラーリングを強制実行する mirror_action datarep-ext3 force eve adam から sophocles への複製を再開しこれらのシステム間で全体の再同期を強制実行する mirror_action datarep-ext3 fullresync adam sophocles ミラーの設定 mirror_settings <tag> <setting> <value> <tag> DataKeeper リソースを表す LifeKeeper のソースタグ <setting> logdir logmax compress のいずれか <value> 設定する値注記 : mirror_settings はターゲットシステム ( ミラーのソースになるシステムには無関係に設定を有効にする場合はすべてのシステム ) で実行する必要があります設定の変更内容を有効にするにはミラーを一時停止してから再起動する必要があります例 : ネットワーク圧縮のレベルを 5 に設定する mirror_settings datarep-ext3 compress 5 SteelEye Protection Suite for Linux 323

344 ビットマップの管理ネットワーク圧縮を無効にする mirror_settings datarep-ext3 compress 0 リワインドログのディレクトリを設定する ( そしてリワインドログを有効にする ) mirror_settings datarep-ext3 logdir /tmp/logs リワインドログを無効にする mirror_settings datarep-ext3 logdir リワインドログの最大サイズを 1GB に設定する mirror_settings datarep-ext3 logmax リワインドログの最大サイズの制限を無効にする mirror_settings datarep-ext3 logmax 0 ビットマップの管理 bitmap -a <num> -c -d -X <bitmap_file> -a <num> ビットマップファイルに非同期書き込みのパラメータを追加します同期ミラーのアップグレードにより非同期ターゲットを含むようになった場合これは必須です <num> のデフォルト値は 256 です -c ビットマップファイルをクリーニングします ( すべてのビットを 0 に設定 ) ソースディスクの余分な複製がターゲットに存在する場合これを使用することで全体の再同期を回避できますこのオプションは特に注意して使用してください -d ビットマップファイルをダーティに設定します ( すべてのビットを 1 に設定 ) 例えば制御分離の状況が発生した後などにこのオプションを使用して全体の再同期を強制実行できます -X<bitmap file> ビットマップファイルを調べてビットマップとミラーに関する有用な情報を表示しますさらに mdadm コマンドを使用して DataKeeper のリソースを管理できますこれは DataKeeper のリソースが実際には md デバイスに存在するためです詳細については mdadm(8) のマニュアルページを参照してください注記 : mdadm を使用するときにはオペレーティングシステムに含まれているバージョンよりも新しい $LKROOT/bin 内のバージョンを必ず使用してくださいコマンドラインからのミラーステータスの監視通常ミラーステータスは LifeKeeper の GUI から [Resource Properties] ダイアログの [Replication Status] を使用して確認できますただし以下の操作でもミラーのステータスを監視できます $LKROOT/bin/mirror_status <tag> 例 : # mirror_status datarep-ext3-sdr 324 管理

345 サーバの障害 [-] eve -> adam Status: Paused Type: Asynchronous [-] eve -> sophocles Status: Resynchronizing [=> ] 11% Resync Speed: 1573K/sec Type: Synchronous Bitmap: 4895 bits (chunks), 4895 dirty (100.0%) 以下のコマンドも役に立つことがあります cat /proc/mdstat サンプルの mdstat ファイルを示します eve:~ # cat /proc/mdstat Personalities : [raid1] md1 : active raid1 nbd10[1] nbd8[3](f) sdb1[0] blocks super non-persistent [3/2] [UU_] bitmap: 3/3 pages [12KB], 64KB chunk, file: /opt/lifekeeper/bitmap_ext3-sdr unused devices: <none/></tag> サーバの障害プライマリサーバとバックアップサーバの両方が動作不能になった場合 DataKeeper リソースは両方のサーバが再び動作可能になった場合にのみ In Service / アクティブになりますこれは間違った方向への再同期に起因するデータの破損を防ぐためです動作可能なサーバがリソースが In Service Protected (ISP) である最後のサーバであることが確実に分かっている場合は DataKeeper リソースを右クリックし [Force Mirror Online] を選択してそのリソースを強制的にオンラインにすることができます再同期 DataKeeper リソースの再同期中ターゲットサーバにあるこのリソースインスタンスのステータス SteelEye Protection Suite for Linux 325

346 全同期の回避は Resyncing ( 再同期中 ) になりますただしリソースインスタンスはプライマリサーバのソース ( ISP) です LifeKeeper の GUI はターゲットサーバにある DataKeeper のリソースのステータスを以下のアイコンで表示しますプライマリサーバにある DataKeeper のリソースは以下のアイコンで表示されます再同期が完了するとすぐにターゲットのリソースの状態がターゲットになりアイコンが以下のように変化します再同期プロセスについて以下の点に注意してください SteelEye DataKeeper のリソースとその親リソースはプライマリでの障害発生時に再同期プロセス中のターゲットにはフェイルオーバできませんターゲットサーバの同期中に DataKeeper リソースが out of service / 非アクティブになった場合そのリソースは同じシステムまたはすでに同期済みの別のターゲット ( 複数のターゲットが存在する場合 ) でのみ In Service / アクティブにすることができ再同期が続行されます再同期プロセス中にプライマリサーバが動作不能になった場合同期プロセス中のターゲットサーバはすべて DataKeeper リソースを In Service にすることができませんプライマリサーバが再び動作可能になった後にミラーの再同期が続行されます全同期の回避大量のデータを WAN リンク経由で複製する場合膨大なネットワーク帯域幅と時間を消費する可能性がある全同期は避けることが望ましいです新しいカーネルと共に使用する場合 SteelEye DataKeeper はビットマップテクノロジを使用して全同期をほぼ防ぐことができますただし既存のデータを複製する場合ミラーの初期設定時に発生する最初の全同期を回避することはできません ( 新規データの場合には SteelEye は全同期を実行しないので以降の手順は不要です ) 既存のデータを複製するときに全同期を回避する方法がいくつかありますここでは推奨する 2 とおりの方法を説明します 326 管理

347 方法 1 方法 1 1 番目の方法では RAW ディスクイメージを取得してターゲットサイトに輸送しますデータがターゲットシステムに到着するまでソースシステムのミラーをアクティブにしておくことができるのでこの方法ではダウンタイムが最小になります手順 1. ミラーを作成してください ( [Replicate Existing Filesystem] を選択 ) ただしターゲットシステムにミラーを拡張しないでください 2. ミラーを out of service にしてください 3. ソースディスクまたはパーティションのイメージを取得してくださいこの例では選択したディスクまたはパーティションは /dev/sda1 です root@source# dd if=/dev/sda1 of=/tmp/sdr_disk.img bs=65536 ( ブロックサイズの引数は単に効率的にするためです ) ディスクまたはパーティションの RAW ディスクイメージを持つファイルが作成されますファイルの代わりにハードドライブやその他の記憶デバイスも使用できます 4. オプション手順 - ソースディスクまたはパーティションのチェックサムを取得してください root@source# md5sum /dev/sda1 5. オプション手順 - ディスクイメージファイルを圧縮してください root@source# gzip /tmp/sdr_disk.img 6. ビットマップファイルをクリアしてください root@source# /opt/lifekeeper/bin/bitmap -c /opt/lifekeeper/bitmap_sdr 7. ミラーと依存ファイルシステムおよびアプリケーション ( 存在する場合 ) のサービスを開始してくださいビットマップファイルによりデータがターゲットシステムに転送される間に発生した変更内容が追跡されます 8. 好みの転送方法を使用してターゲットシステムにディスクイメージを転送してください 9. オプション手順 - ターゲットシステムでディスクイメージファイルを圧縮解除してください root@target# gunzip /tmp/sdr_disk.img.gz 10. オプション手順イメージファイルのチェックサムが手順 4 で取得した元のチェックサムと一致することを確認してください root@target# md5sum /tmp/sdr_disk.img 11. イメージをターゲットシステム ( 例 : /dev/sda2) に転送してください root@target# dd if=/tmp/sdr_disk.img of=/dev/sda2 bs=65536 SteelEye Protection Suite for Linux 327

348 方法両方のシステムで etc/default/lifekeeper に LKDR_NOFULL_SYNC=1 を設定してください root@source# echo 'LKDR_NO_FULL_SYNC=1' >> /etc/default/lifekeeper root@target# echo 'LKDR_NO_FULL_SYNC=1' >> /etc/default/lifekeeper 13. ミラーをターゲットに拡張してください部分的な再同期が実行されます方法 2 ターゲットシステムを簡単に輸送できる場合またはシステムの設定時にターゲットシステムがソースと同じ場所にある場合にこの方法を使用できますこの方法では最初の全同期を高速なローカルネットワークで実行できるように最終的な WAN ミラーを作成するネットワークルートを LAN ミラーに一時的に変更します以下の例ではソースサイトはサブネット /24 にありターゲットサイトがサブネット /24 にあると仮定していますソースとターゲットのシステムの間に一時的に静的ルートを設定することによりローカルのイーサネット接続またはループバックケーブルを使用して WAN トラフィックをあるサーバから別のサーバに直接送信できます手順 1. ソースサイトでシステムをインストールし設定してください 2. 静的ルートを追加してください root@source# route add -net /24 dev eth0 root@target# route add -net /24 dev eth0 この時点で両方のシステムが LAN 上で相互に通信できる必要があります 3. LifeKeeper でコミュニケーションパスを設定してください 4. ミラーを作成しターゲットに拡張してください全同期が実行されます 5. ミラーを Pause にしてくださいミラーが再開されるまで変更内容はビットマップファイルで追跡されます 6. 静的ルートを削除してください root@source# route del -net /24 root@target# route del -net /24 7. ターゲットシステムをシャットダウンし恒久的に配置する場所に輸送してください 8. ターゲットシステムを起動しソースとのネットワーク接続を確立してください 9. Resume the mirror を実行してください部分的な再同期が実行されます 328 管理

349 SteelEye Protection Suite for Linux Multi-Site Cluster Multi-Site Cluster SteelEye Protection Suite for Linux Multi-Site Cluster は別のライセンス製品であり 2 台以上のサーバ間で LifeKeeper の共有ストレージ構成を使用しさらに SteelEye DataKeeper for Linux を使用して共有ディスクを 1 台以上のターゲットサーバに複製する機能を持ちます SteelEye Protection Suite for Linux Multi-Site Cluster SteelEye Protection Suite for Linux Multi-Site Cluster は LifeKeeper を使用して 2 台以上のサーバ間で共有ストレージを構成しその共有ディスクを SteelEye DataKeeper を使用して 1 台以上のサーバへミラーリングを構成する付加機能のための個別ライセンス製品です SteelEye Protection Suite for Linux Multi-Site Cluster は異なるサブネットに存在する複数のネットワークセグメントにわたって IP アドレスのフェイルオーバを提供するように構成されたワイドエリアネットワークに組み込むことができますこの構成には仮想ネットワーク ( 仮想 LAN( VLAN) ) と仮想プライベートネットワーク ( VPN) が含まれます以下の画像は SteelEye Protection Suite for Linux Multi-Site Cluster 製品を構成した後の SteelEye LifeKeeper の GUI です階層の釣り合いが取れていないように見えますが階層は適切に構成されており正しく機能しますすでに SteelEye DataKeeper を使用していて SteelEye SteelEye Protection Suite for Linux 329

350 Multi-Site Cluster を設定する際の考慮事項 LifeKeeper のグラフィカルユーザインターフェースに慣れている場合 LifeKeeper の GUI での SteelEye Protection Suite Multi-Site Cluster リソース階層の表示は旧リリースの SteelEye DataKeeper とは異なります Multi-Site Cluster を設定する際の考慮事項システムの構成を始める前に Linux のマルチサイトクラスタ階層の環境では避けるべき階層構成を理解しておくことが重要です以下に Linux Multi-Site Cluster 環境で避ける必要のある階層構成の例を 3 つ示しますこれらすべての例で Linux Multi-Site Cluster 階層は下にあるデバイスを別の階層と共有していますいずれかの階層で障害またはスイッチオーバが起こると関連する階層が影響を受けますこれによりアプリケーションの障害やミラーの破損など予期しない結果が起こる可能性がありますこの場合後で全同期プロセスを実行する必要がありますさらにミラーソースから DR サイトに切り替えて DR サイトからプライマリサイトへのミラーバックを許可すると事態が複雑になることがありますこれはミラーターゲットシステムが回レベルのディスクリソースを In Service にしているからですすべての共有リソースもミラーターゲットと同じノードで動作可能 ( ISP) にする必要があります 330 Multi-Site Cluster

351 Multi-Site Cluster の制限例 : 説明 Multi-Site Cluster 階層のミラーディスクリソースを複数回同じ階層または別の階層で使用するミラービットマップ用に同じ Multi-Site Cluster のファイルシステムまたはディスクリソースを複数の Multi-Site Cluster 階層で使用する ( 各ミラーのビットマップファイルは一意の LUN に存在する必要があり共有できない ) ビットマップファイルシステムデバイスまたはディスクリソースを別の階層 ( マルチサイトまたは非マルチサイト ) で使用する Multi-Site Cluster の制限 Linux Multi-Site Cluster を使用する場合 SteelEye Logical Volume Manager Recovery Kit をディザスタリカバリノードにインストールしないでください SteelEye Protection Suite for Linux Multi-Site Cluster リソース階層の作成プライマリサーバで以下の操作を行ってください 1. [Edit] > [Server] > [Create Resource Hierarchy] を選択してください [Create Resource Wizard] ダイアログボックスが表示されます 2. ドロップダウンリストから [Data Replication] オプションを選択し [Next] をクリックして続行してください 3. 以下の情報を入力するように要求されますダイアログボックスで [Back] ボタンが有効な場合は前のダイアログボックスに戻ることができますこれはエラーが発生して前に入力した情報を修正する必要がある場合に便利な機能ですいつでも [Cancel] をクリックして作成処理全体を取り消すことができますフィールド Switchback Type Server ヒント [intelligent switchback] を指定する必要がありますこれはバックアップサーバにフェイルオーバした後管理者が手動で Multi-Site Cluster リソースをプライマリサーバにスイッチバックする必要があることを意味します注意 : このリリースの SteelEye DataKeeper は DataKeeper リソースの自動スイッチバックをサポートしていませんさらに自動スイッチバックの制限は Multi-Site Cluster 階層を構成する LifeKeeper リソースにも適用されますこの制限の対象として階層の上に存在するものまたは階層内の子が含まれます NetRAID デバイスを作成するサーバ ( 通常はプライマリサーバ ) の名前を選択してくださいドロップダウンリストボックスにはクラスタ内のすべてのサーバが表示されます SteelEye Protection Suite for Linux 331

352 Replicate New File System フィールド Hierarchy Type ヒント以下のいずれかを選択して作成するデータ複製のタイプを選択してください Replicate New File System Replicate Existing File System DataKeeper Resource 以降の一連のダイアログボックスは [Hierarchy Type] で選択した項目によって異なります一部のダイアログボックスはすべての階層タイプで同じですが表示される順序と必要な情報が少し異なることがあります以下の 3 つのトピックで階層作成の残りのプロセスについて説明しています Replicate New File System Replicate Existing File System DataKeeper Resource Replicate New File System このオプションは NetRAID デバイスを作成し LifeKeeper がサポートするファイルシステムタイプでフォーマットしますファイルシステムを NetRAID デバイスにマウントしマウントしたファイルシステムと NetRAID デバイスの両方を LifeKeeper で保護します NetRAID デバイスとローカルのディスクまたはパーティションがフォーマットされ既存のデータが削除されます新しいファイルシステムにミラーを作成し LifeKeeper で保護する場合にこのオプションを選択してくださいこのリソースタイプには 1 つの空いているディスクまたはパーティションが必要です注意 : このオプションを選択するとローカルのディスクまたはパーティションがフォーマットされ既存のデータがすべて削除されます 1. 要求されたら以下の情報を入力してくださいフィールド Source Disk or Partition ヒント [Source Disk or Partition] ドロップダウンリストには以下のものを除いて使用できるすべてのディスクが表示されます現在マウントされているものスワップディスクまたはスワップパーティション LifeKeeper が保護するディスクまたはパーティションドロップダウンリストには root (/) boot (/boot) /proc floppy cdrom などの特殊なディスクまたはパーティションも表示されません 2. 非共有のソースのディスクまたはパーティションを選択した場合以下の画面が表示されます 332 Multi-Site Cluster

353 Replicate New File System 3. 共有のソースのディスクまたはパーティションを選択するには [Back] を選択してください残りの情報を指定して SteelEye Protection Suite for Linux Multi-Site Cluster リソースの構成を完了してくださいフィールド New Mount Point New File System Type DataKeeper Resource Tag File System Resource Tag Bitmap File ヒント新しいファイルシステムの新しいマウントポイントを入力してくださいこれは複製したディスクまたはパーティションが配置されるマウントポイントですファイルシステムタイプを選択します LifeKeeper がサポートするファイルシステムタイプのみを選択できます DataKeeper リソースインスタンスの一意の DataKeeper リソースタグ名を選択するか入力してくださいファイルシステムリソースインスタンスのファイルシステムリソースタグを選択するか入力してくださいプルダウンリストからビットマップファイルの項目を選択してください表示されたリストにはビットマップファイルの保持に使用できる共有ファイルシステムがあります $LKROOT/bin ディレクトリを参照 ) ビットマップファイルは階層内のローカルノード間で切り替え可能な共有デバイスに配置する必要があります SteelEye Protection Suite for Linux 333

354 Replicate Existing File System 4. [Next] をクリックして確認画面に進んでください 5. 確認画面に新しいファイルシステムの作成場所およびローカルのディスクまたはパーティションについて保留中の再フォーマットに関する警告が表示されます [Create] をクリックしてリソースの作成を開始します 6. リソースを新しいファイルシステムに作成するために有効なデータを指定したかどうかが LifeKeeper により検証されます LifeKeeper が問題を検知した場合は情報ボックスにエラーが表示されます検証が正常に完了するとリソースが作成されますディスクまたはパーティションのサイズによりファイルシステムの作成には数分かかることがあります [Next] をクリックして次に進んでください 7. 新しい複製ファイルシステムのリソース階層が正常に作成されたことを示す情報ボックスが表示されます複製を開始してリソース階層を LifeKeeper で保護するにはクラスタ内の別のサーバにリソース階層を拡張する必要がありますリソースを拡張する場合は [Next] 後でリソースを拡張する場合は [Cancel] をクリックしてください [Continue] をクリックすると Pre-extend Wizard が起動しますリソース階層を別のサーバに拡張する方法の詳細についてはリソース階層の拡張の手順 2 を参照してください Replicate Existing File System このオプションはローカルのディスクまたはパーティションに現在マウントされているファイルシステムをアンマウントし NetRAID デバイスを作成してファイルシステムを NetRAID デバイスに再マウントします NetRAID デバイスとマウントされたファイルシステムの両方が LifeKeeper で保護されます既存のファイルシステムにミラーを作成し LifeKeeper で保護する場合にこのオプションを選択してください 1. 要求されたら以下の情報を入力してくださいフィールド Existing Mount Point ヒントこれはプライマリサーバの NetRAID デバイスにマウントするマウントポイントですローカルのディスクまたはパーティションがすでにこのマウントポイントにマウントされている必要があります 2. 非共有のソースのマウントポイントを選択した場合以下の画面が表示されます 334 Multi-Site Cluster

355 DataKeeper Resource 3. 共有のマウントポイントを選択するには [Back] を選択してください残りの情報を指定して SteelEye Protection Suite for Linux Multi-Site Cluster リソースの構成を完了してくださいフィールド DataKeeper Resource Tag File System Resource Tag Bitmap File ヒント DataKeeper リソースインスタンスの一意の DataKeeper リソースタグ名を選択するか入力してくださいファイルシステムリソースタグの名前を選択するか入力してくださいプルダウンリストからビットマップファイルの項目を選択してください表示されたリストにはビットマップファイルの保持に使用できる共有ファイルシステムがあります $LKROOT/bin ディレクトリを参照 ) ビットマップファイルは階層内のローカルノード間で切り替え可能な共有デバイスに配置する必要があります 4. [Next] をクリックして DataKeeper リソースをプライマリサーバに作成してください 5. DataKeeper リソースのを作成するために有効なデータを指定したかどうかが LifeKeeper により検証されます LifeKeeper が問題を検知した場合は情報ボックスにエラーが表示されます検証が正常に完了するとリソースが作成されます [Next] をクリックしてください 6. 既存のレプリケーションファイルシステムのリソース階層が正常に作成されたことを示す情報ボックスが表示されますレプリケーションを開始してリソース階層を LifeKeeper で保護するにはクラスタ内の別のサーバにリソース階層を拡張する必要がありますリソースを拡張する場合は [Next] 後でリソースを拡張する場合は [Cancel] をクリックしてください [Continue] をクリックすると Pre-extend Wizard が起動しますリソース階層を別のサーバに拡張する方法の詳細についてはリソース階層の拡張の手順 2 を参照してください DataKeeper Resource このオプションは NetRAID デバイスのみを作成し ( ファイルシステムは作成しない ) NetRAID デバイス SteelEye Protection Suite for Linux 335

356 DataKeeper Resource を LifeKeeper で保護しますディスクまたはパーティション上に DataKeeper デバイスのみを作成し LifeKeeper で保護する場合にこのオプションを選択してください読み取り可能なミラーを作成するにはこのデバイス上にファイルシステムを作成しマウントする操作を手動で行う必要がありますこのリソースタイプには 1 つの空いているディスクまたはパーティションが必要です 1. 要求されたら以下の情報を入力してくださいフィールドヒントドロップダウンボックスのソースディスクまたはパーティションのリストには以下のものを除いて使用できるすべてのディスクが表示されます現在マウントされているもの Source Disk or Partition スワップタイプのディスクまたはパーティション LifeKeeper が保護するディスクまたはパーティションドロップダウンリストには root (/) boot (/boot) /proc, floppy cdrom などの特殊なディスクまたはパーティションも表示されません注記 : VMware を使用する場合は VMware の既知の問題を参照してください 2. 非共有のソースのディスクまたはパーティションを選択した場合以下の画面が表示されます 336 Multi-Site Cluster

357 リソース階層の拡張 3. 共有のソースのディスクまたはパーティションを選択するには [Back] を選択してください残りの情報を指定して SteelEye Protection Suite for Linux Multi-Site Cluster リソースの構成を完了してくださいフィールド DataKeeper Resource Tag Bitmap File ヒント DataKeeper リソースインスタンスの一意の DataKeeper リソースタグ名を選択するか入力してくださいプルダウンリストからビットマップファイルの項目を選択してください表示されたリストにはビットマップファイルの保持に使用できる共有ファイルシステムがあります $LKROOT/bin ディレクトリを参照 ) ビットマップファイルは階層内のローカルノード間で切り替え可能な共有デバイスに配置する必要があります 4. [Next] をクリックしてください 5. 使用する前にファイルシステムを手動で作成し NetRAID デバイス ( /dev/mdx) にマウントする必要があることを示す情報ウィンドウが表示されます [Create] をクリックして DataKeeper デバイスをローカルのディスクまたはパーティションに作成してください 6. 情報ボックスが表示され DataKeeper リソースのを作成するために有効なデータを指定したかどうかが LifeKeeper により検証されます LifeKeeper が問題を検知した場合は情報ボックスにエラーが表示されます検証が正常に完了するとリソースが作成されます [Next] をクリックして次に進んでください 7. DataKeeper リソースデバイスが正常に作成されたことを示す情報ボックスが表示されますデータの複製を開始しバックアップ / ターゲットサーバを LifeKeeper で保護するにはクラスタ内の別のサーバに階層を拡張する必要がありますリソースを拡張する場合は [Continue] 後でリソースを拡張する場合は [Cancel] をクリックしてください [Continue] をクリックすると Pre-extend Wizard が起動しますリソース階層を別のサーバに拡張する方法の詳細についてはリソース階層の拡張の手順 2 を参照してくださいリソース階層の拡張この操作は [Edit] メニューからプライマリサーバからセカンダリサーバに開始する必要がありますまたは [Create Resource Hierarchy] オプションの動作が完了すると自動的に開始されますその場合は手順 2 を参照してください 1. [Edit] メニューの [Resource] から [Extend Resource Hierarchy] を選択します Pre-Extend Wizard が表示されます拡張操作に慣れていない場合は [Next] をクリックしてください LifeKeeper の [Extend Resource Hierarchy] のデフォルト値が分かっていて入力と確認を省略する場合は [Accept Defaults] をクリックしてください 2. Pre-Extend Wizard に以下の情報を入力します SteelEye Protection Suite for Linux 337

358 リソース階層の拡張注記 : 最初の 2 つのフィールドは [Edit] メニューから拡張を開始した場合にだけ表示されますフィールド Template Server Tag to Extend Target Server Switchback Type テンプレートの優先順位ヒント DataKeeper リソースが現在 In Service のテンプレートサーバを選択してくださいここで選択するテンプレートサーバと次のダイアログボックスで選択する拡張するタグによって In Service ( アクティブ ) のリソース階層が表示されることを理解しておくことが重要です選択したテンプレートサーバで In Service でないリソースタグを選択した場合エラーメッセージが表示されますこのダイアログのドロップダウンボックスにはクラスタ内の全サーバの名前が表示されますこれはテンプレートサーバからターゲットサーバに拡張する DataKeeper インスタンスの名前ですドロップダウンボックスにはテンプレートサーバ上に作成したすべてのリソースが表示されます拡張先のサーバを入力するか選択してください [intelligent switchback] を指定する必要がありますこれはバックアップサーバにフェイルオーバした後管理者が手動で Multi-Site Cluster 階層のリソースをプライマリサーバにスイッチバックする必要があることを意味します注意 : このリリースの DataKeeper for Linux は DataKeeper リソースの自動スイッチバックをサポートしていませんさらに自動スイッチバックの制限は Multi-Site Cluster 階層を構成する LifeKeeper リソースにも適用されますこの制限の対象として階層の上位あるいは下位にあるリソースも含まれます Template Priority を選択または入力しますこれはサーバで現在 In Service の DataKeeper 階層の優先順位です優先順位は 1 ~ 999 の範囲で未使用の値が有効で小さい数字ほど優先順位が高くなります ( 数字 1 が最高の優先順位に相当します ) 拡張処理時に別のシステムですでに使用中の優先順位をこの階層に対して指定することはできませんデフォルト値を推奨します注記 : このフィールドは階層をはじめて拡張するときにだけ表示されますターゲットの優先順位 Target Priority を選択または入力しますこれは他のサーバにある同等の階層に対する新しく拡張する DataKeeper 階層の優先順位です 1 ~ 999 の範囲でまだ優先順位として使用されていない値が有効でリソースのカスケーディングフェイルオーバシーケンスにおけるサーバの優先順位を示します数値が小さいほど優先順位は高くなります ( 1 は最高の優先順位を表します ) LifeKeeper のデフォルトでは階層が作成されたサーバに 1 が割り当てられることに注意してください優先順位は連続している必要はありませんが特定のリソースについて 2 つのサーバに同じ優先順位を割り当てることはできません 3. Pre-Extend のチェックが正常に終了したというメッセージが表示されたら [Next] をクリックしてください 4. 拡張する階層に応じて拡張されるリソースタグ ( 一部編集不可 ) を示す一連の情報ボックスが表示されますリソース階層の拡張を実行する場合は [Next] をクリックしてください 338 Multi-Site Cluster

359 DataKeeper リソース階層の拡張次のセクションには別のサーバに DataKeeper リソースを拡張するために必要な手順を示します DataKeeper リソース階層の拡張 1. pre-extend スクリプトが正常に実行されたというメッセージが表示されたら以下の情報を指定するように要求されますフィールド Mount Point Root Tag DataKeeper Resource Tag Bitmap File ヒントターゲットサーバ上にあるファイルシステムのマウントポイント名を入力してください ( DataKeeper リソースに関連する LifeKeeper が保護するファイルシステムがない場合はこのダイアログは表示されません ) ルートタグを選択するか入力してくださいこれはターゲットサーバ上にあるファイルシステムリソースインスタンスの一意の名前です ( DataKeeper リソースに関連する LifeKeeper が保護するファイルシステムがない場合はこのダイアログは表示されません ) DataKeeper リソースタグの名前を選択するか入力してくださいインテントログの記録に使用するビットマップファイルの名前を選択してください [None] を選択するとインテントログは使用されずすべての再同期が部分的ではなく全体の再同期になります 2. [Next] をクリックして次に進んでください拡張が実行中であることを示す情報ボックスが表示されます 3. [Finish] をクリックして DataKeeper リソースインスタンスが正常に拡張されたことを確認してください 4. [Done] をクリックして [Extend Resources Hierarchy] メニューを終了してください注記 : 必ずすべてのサーバで手動スイッチオーバを実行して新しいインスタンスの機能をテストしてください詳細についてはリソース階層のテストを参照してくださいこの時点で DataKeeper がソースからターゲットのディスクまたはパーティションにデータの再同期を開始しています LifeKeeper の GUI ではターゲットサーバにある DataKeeper リソースのステータスは Resyncing になります再同期が完了するとステータスは Target になりますこれは通常のスタンバイ状態です再同期中 DataKeeper リソースおよびそれに依存するリソースはフェイルオーバできませんこれはデータの破損を防止するためですディザスタリカバリシステムへの階層の拡張この操作は ISP ノードからまたは複数ノードの作成プロセスの一環として [Edit] メニューからのみ実行できますまたは [Create Resource Hierarchy] オプションの動作が完了すると自動的に開始されますその場合は手順 2 を参照してください SteelEye Protection Suite for Linux 339

360 ディザスタリカバリシステムへの階層の拡張 1. [Edit] メニューの [Resource] から [Extend Resource Hierarchy] を選択します Pre-Extend Wizard が表示されます拡張操作に慣れていない場合は [Next] をクリックしてください LifeKeeper の [Extend Resource Hierarchy] のデフォルト値が分かっていて入力と確認を省略する場合は [Accept Defaults] をクリックしてください 2. Pre-Extend Wizard に以下の情報を入力します注記 : 最初の 2 つのフィールドは [Edit] メニューから拡張を開始した場合にのみ表示されますフィールド Target Server Switchback Type Target Priority Template Priority ヒント拡張先のサーバを入力するか選択してください [intelligent switchback] を指定する必要がありますこれはバックアップサーバにフェイルオーバした後管理者が手動で Multi-Site Cluster 階層のリソースをプライマリサーバにスイッチバックする必要があることを意味します注意 : このリリースの SteelEye DataKeeper for Linux は DataKeeper リソースの自動スイッチバックをサポートしていませんさらに自動スイッチバックの制限は Multi-Site Cluster 階層を構成する LifeKeeper リソースにも適用されますこの制限の対象として階層の上位あるいは下位にあるリソースも含まれますターゲットの優先順位を選択するか入力してくださいこれは他のサーバにある同等の階層に対する新しく拡張する DataKeeper 階層の優先順位です 1 ~ 999 の範囲でまだ優先順位として使用されていない値が有効でリソースのカスケーディングフェイルオーバシーケンスにおけるサーバの優先順位を示します数値が小さいほど優先順位は高くなります ( 数値 1 が最高の優先順位 ) LifeKeeper のデフォルトでは階層が作成されたサーバに 1 が割り当てられることに注意してください優先順位は連続している必要はありませんが特定のリソースについて 2 つのサーバに同じ優先順位を割り当てることはできませんテンプレートの優先順位を選択するか入力してくださいこれはサーバで現在 In Service の DataKeeper 階層の優先順位です 1 ~ 999 の範囲でまだ優先順位として使用されていない値が有効で小さい数字ほど優先順位が高くなります ( 数値 1 が最高の優先順位 ) 拡張処理時に別のシステムですでに使用中の優先順位をこの階層に対して指定することはできませんデフォルト値を推奨します注記 : このフィールドは階層を最初に拡張するときにだけ表示されます 3. Pre-Extend のチェックが正常に終了したというメッセージが表示されたら [Next] をクリックしてください注記 : 拡張する階層に応じて拡張されるリソースタグ ( 一部編集不可 ) を示す一連の情報ボックスが表示されます 4. [Next] をクリックして [Extend Resource Hierarchy] の構成タスクを開始してください次のセクションには別のサーバに DataKeeper リソースを拡張するために必要な手順を示します 340 Multi-Site Cluster

361 ディザスタリカバリシステムへの階層の拡張 1. pre-extend スクリプトが正常に実行されたというメッセージが表示されたら以下の情報を指定するように要求されますフィールド Mount Point Root Tag ヒントターゲットサーバ上にあるファイルシステムのマウントポイント名を入力してください ( DataKeeper リソースに関連する LifeKeeper が保護するファイルシステムがない場合はこのダイアログは表示されません ) ルートタグを選択するか入力してくださいこれはターゲットサーバ上にあるファイルシステムリソースインスタンスの一意の名前です ( DataKeeper リソースに関連する LifeKeeper が保護するファイルシステムがない場合はこのダイアログは表示されません ) 複製するファイルシステムの配置先となるターゲットサーバ上のディスクまたはパーティションを選択してくださいドロップダウンボックスのディスクまたはパーティションのリストには以下のものを除いて使用できるすべてのディスクが表示されます Target Disk or Partition すでにマウント済みのものスワップディスクまたはスワップパーティション LifeKeeper が保護するディスクまたはパーティションドロップダウンリストには root (/) boot (/boot) /proc, floppy cdrom などの特殊なディスクまたはパーティションも表示されません注記 : ターゲットのディスクまたはパーティションはソースのディスクまたはパーティション以上のサイズである必要があります DataKeeper Resource Tag Bitmap File Replication Path DataKeeper リソースタグの名前を選択するか入力してくださいインテントログの記録に使用するビットマップファイルの名前を選択するか入力してください [None] を選択するとインテントログは使用されずすべての再同期が部分的ではなく全体の再同期になりますターゲットサーバとクラスタ内の他の指定サーバとの間で複製に使用するローカルとリモートの IP アドレスのペアを選択してください有効なパスおよび対応する IP アドレスはこのサーバのペアに対して指定した LifeKeeper コミュニケーションパスのセットから得られます DataKeeper の特性によりプライベート ( 専用 ) ネットワークを使用することが強く推奨されます DataKeeper リソースをすでに 1 台以上のターゲットサーバに拡張している場合追加のサーバに対する拡張を実行すると新しいターゲットサーバと既存のサーバとの組み合わせのそれぞれについて繰り返し複製パスを指定するように要求されます SteelEye Protection Suite for Linux 341

362 IP リソースのリストアおよびリカバリの設定フィールド Replication Type ヒント指定したサーバのペアについて使用する複製タイプとして [synchronous] または [asynchronous] を選択してください前述の [Replication Path] フィールドと同様に DataKeeper リソースをすでに 1 台以上のターゲットサーバに拡張している場合追加のサーバに対する拡張を実行すると新しいターゲットサーバと既存のサーバとの組み合わせのそれぞれについて繰り返し複製タイプを指定するように要求されます 2. [Next] をクリックして次に進んでください拡張が実行中であることを確認する情報ボックスが表示されます 3. [Finish] をクリックして DataKeeper リソースインスタンスが正常に拡張されたことを確認してください 4. [Done] をクリックして [Extend Resources Hierarchy] メニューを終了してください IP リソースのリストアおよびリカバリの設定この設定を完了するには IP リソースの [Restore] と [Recovery] の設定を [Disable] にする必要がありますこのオプションは [Properties] ペインに表示されますある IP リソースの [Properties] ペインを開いたときまたはある IP リソースのプロパティを表示するときにはこの設定は 3 つのボタンオプションのいずれかですこのオプションの詳細については IP Recovery Kit を参照してください注記 : 必ずすべてのサーバで手動スイッチオーバを実行して新しいインスタンスの機能をテストしてください詳細についてはリソース階層のテストを参照してくださいディザスタリカバリノードへの拡張が完了している場合この時点で SteelEye DataKeeper がソースからターゲットのディスクまたはパーティションにデータの再同期を開始しています LifeKeeper の GUI ではターゲットサーバにある DataKeeper リソースのステータスは Resyncing ( 再同期中 ) になります再同期が完了するとステータスは Target になりますこれは通常のスタンバイ状態です再同期中 DataKeeper リソースおよびそれに依存するリソースはフェイルオーバできませんこれはデータの破損を防止するためですまだ実行していない場合は必ず confirm failover フラグをセットしてくださいこの手順の詳細については [Confirm Failover] と [Block Resource Failover] の設定のセクションを参照してください Multi-Site Cluster 環境へのマイグレーション SteelEye Multi-Site Migrate 機能が SteelEye Protection Suite for Linux Multi-Site Cluster 製品に装備されていますこの追加機能を使用すると管理者は既存の SteelEye Linux LifeKeeper 環境を Multi-Site Cluster 環境に移行できます移行手順により階層のダウンタイムを最小に抑えて選択した共有ファイルシステムのリソースを安全に移行して複製できます既存のファイルシステムから Multi-Site リソースを作成するときの重要な考慮事項をいくつか示します Multi-Site の移行手順では作成プロセスでファイルシステムをアンマウントし NetRAID デバイスに再マウントしますリソースの作成手順中はこのファイルシステムに依存するアプリケーションをすべて停止する 342 Multi-Site Cluster

要件必要がありますこの操作は移行手順が処理するので管理者からの操作は不要です NAS( scsi/netstorage) DRBD( scsi/drbd) SDR( scsi/netraid) および Multi-Site Cluster リソース ( scsi/disrec) のリソースタイプを含む階層は Multi-Site の移行機能を使用して移行することはできません要件

363 要件必要がありますこの操作は移行手順が処理するので管理者からの操作は不要です NAS( scsi/netstorage) DRBD( scsi/drbd) SDR( scsi/netraid) および Multi-Site Cluster リソース ( scsi/disrec) のリソースタイプを含む階層は Multi-Site の移行機能を使用して移行することはできません要件マイグレーションを実行する前にお使いのシステムが本書のインストールと設定セクションに記載されている要件を満たすことを確認してください SDR のインストールセクションにまとめられている一般的な SDR の要件に加えてクラスタ内の各システムに Novell の SLES 11 SLES 10 または Red Hat Enterprise Linux 5 がインストールされている必要がありますこの機能はストレージデバイスを共有する 2 つのサーバがある構成のために定義されています 1 台のサーバはプライマリでプライマリサイトにあります 3 台目のサーバはリモートでディザスタリカバリサイトにあります SteelEye Protection Suite for Linux Multi-Site Cluster をプライマリとその他の共有ストレージノードにインストールした後はマイグレーション機能を活用するために必要な追加のインストールや設定は不要です始める前に以下の画像に移行を開始する前のファイルシステムのリソース階層を示します SteelEye Protection Suite for Linux 343

ファイルシステムリソースを右クリックして [Migrate Hierarchy to Multi-Site Cluster]

364 マイグレーションの実行マイグレーションの実行 Multi-Site Migrate を構成して実行するには 3 とおりの方法があります以下の操作ができます LifeKeeper の GUI のツールバーから [Migrate] アイコンを選択し移行するリソースを選択しますファイルシステムリソースを右クリックして [Migrate Hierarchy to Multi-Site Cluster] メニューオプションを選択しますファイルシステムリソースを選択し [Properties Panel] ツールバーの [Migration] アイコンを選択します 344 Multi-Site Cluster

365 マイグレーションの実行グローバルツールバーのアイコンから移行を開始した場合以下のダイアログボックスが表示されます 1. 移行する階層が存在する In Service のサーバを選択してください [Next] をクリックしてください SteelEye Protection Suite for Linux 345

366 マイグレーションの実行 2. 移行する root 階層タグを選択し [Next] をクリックしてください root タグはファイルシステムにすることも他のアプリケーションリソースにすることもできます選択したタグ ( ファイルシステム以外のリソースの場合 ) にはファイルシステムに依存するリソースが含まれている必要があります LifeKeeper の GUI のウィンドウでファイルシステムを選択しポップアップウィンドウから [Migrate Hierarchy to Multi-Site Cluster] を選択するか [Properties Panel Migrate] アイコンの [Migrate] アイコンを選択した場合以下の初期化画面が表示されます 346 Multi-Site Cluster

367 マイグレーションの実行 3. [Continue] ボタンが有効になったらクリックしてください以下のビットマップダイアログが表示されます SteelEye Protection Suite for Linux 347

368 マイグレーションの実行 4. 移行するファイルシステムのビットマップファイルを選択してください [Next] をクリックしてください重要 : [Next] をクリックした後はこのファイルシステムのビットマップファイルの選択を変更できなくなります 348 Multi-Site Cluster

369 マイグレーションの実行 5. 階層内で移行する 2 番目のファイルシステムのビットマップファイルを選択してください前のダイアログボックスで 1 番目のビットマップファイルを選択した後追加のファイルシステムタグが表示されるのでそれらの各タグについて一意のビットマップファイルを入力できます注記 : 移行するファイルシステムが 1 つのみの場合はこの画面は表示されませんまた移行するファイルシステムが 2 つ以上の場合この画面に似た複数の画面が表示されます 6. [Next] をクリックしてください以下のような概要画面が表示されます SteelEye Protection Suite for Linux 349

370 マイグレーションの実行 7. この概要画面には移行手順で送信したすべての構成情報が表示されます [Migrate] をクリックすると以下の画面が表示されます 350 Multi-Site Cluster

371 マイグレーションの実行 8. 移行ステータスがこのウィンドウに表示されます [Finish] ボタンが有効になったらクリックしてください SteelEye Protection Suite for Linux 351

372 マイグレーションの正常な完了マイグレーションの正常な完了以下の画像に Multi-Site のマイグレーションが完了した後のファイルシステムリソース階層の例を示しますこれで階層を非共有ノード ( megavolt) に拡張できます 352 Multi-Site Cluster

373 マイグレーションの正常な完了 SteelEye Protection Suite for Linux 353

374

375 トラブルシューティング以下の表に予測される問題と推奨される処置を示します症状 DataKeeper リソースを削除した後に NetRAID デバイスが削除されないインストール /HADR rpm の失敗フェイルオーバ中のエラープライマリサーバに障害が発生するとセカンダリサーバの DataKeeper リソースが ISP になりますただしプライマリサーバが再起動すると両方のサーバで DataKeeper リソースが OSF になります両方のサーバが動作不能になってからプライマリサーバが再起動したときにリソースを ISP にすることができない推奨される処置 NetRAID デバイスがマウントされている場合 DataKeeper リソースを削除しても NetRAID デバイスは削除されません以下のコマンドを使用して手動でデバイスをアンマウントして削除することができます mdadm S <md_device> (<md_device> を調べるには cat /proc/mdstat) これらのファイルを手動でインストールするための詳細手順についてはインストールセクションを参照してくださいデバイスのステータスを確認してください再同期が進行中の場合フェイルオーバは実行できません DataKeeper リソース階層の作成時に選択したスイッチバックタイプを確認してくださいこのリリースでは DataKeeper リソースの自動スイッチバックはサポートされていませんリソースプロパティのウィンドウでスイッチバックタイプを [Intelligent] に変更できますセカンダリサーバよりも前にプライマリサーバが動作可能になった場合 DataKeeper リソースを強制的にオンラインにすることができますこのためにはリソースプロパティのダイアログを開き [Replication Status] タブ [Actions] ボタンを順にクリックし次に [Force Mirror Online] を選択してください [Continue] をクリックして確認してから [Finish] をクリックしてください SteelEye Protection Suite for Linux 355

376 トラブルシューティング症状現在マウントしている NFS ファイルシステムに DataKeeper 階層を作成するときのエラー DataKeeper の GUI のウイザードに新しく作成したパーティションがリストされない推奨される処置現在 NFS がエクスポートしたファイルシステムに DataKeeper 階層を作成しようとしていますエクスポートする前にこのファイルシステムを複製する必要があります Linux OS はシステムを次回再起動するまで新しく作成したパーティションを認識しないことがあります新しく作成したパーティションのエントリを調べるには /proc/partitions ファイルを表示してください新しく作成したパーティションがこのファイルに表示されない場合システムを再起動する必要がありますこれは制御分離のシナリオで一時的な通信障害により発生することがあります通信の再開後両方のシステムがそれぞれそれ自体をプライマリと見なしますいずれのシステムが最終のプライマリシステムであったかが不明なので DataKeeper はデータを再同期しません手動操作が必要ですビットマップを使用しない場合 : プライマリとバックアップの両方のサーバでリソースが緑 ( ISP) で表示される最終のバックアップであったサーバを特定しそのサーバのリソースを Out of Service にする必要がありますその後 DataKeeper が全体の再同期を実行しますビットマップを使用している場合 ( 以前のカーネル ) : 元のバックアップノードから始めて両方のリソースを Out of Service にする必要があります次に以下のコマンドを実行してプライマリノードのビットマップをダーティに設定する必要があります $LKROOT/lkadm/subsys/scsi/netraid/bin/bitmap d /opt/lifekeeper/bitmap_filesys ( /opt/lifekeeper/bitmap_filesys ハビットマップファイルの名前 ) これによりリソースが In Service になると全体の再同期が強制実行されます次にプライマリノードでリソースを In Service にします全体の再同期が開始されますビットマップを使用する場合 ( 以降のカーネルまたは RedHat Enterprise Linux 5.4 の以降のカーネル ( または RedHat 5.4 以降のサポートする派生カーネル ) : 最終のバックアップであったサーバを特定しそのサーバのリソースを Out of Service にする必要がありますその後 DataKeeper が部分的な再同期を実行します 356 トラブルシューティング

377 トラブルシューティング症状 Install - コアを SUSE にインストールするとパッケージのチェックエラー ( rpm -V steeleye-lk) がコアで発生する Core - 言語環境の影響 Core - SLES10 システムでシャットダウンがハングする GUI - GUI の終了後に Web ブラウザから再接続したときに GUI のログインプロンプトが再表示されないことがある以下のエラーが発生します推奨される処置 SUSE がシャットダウンスクリプトを実行する方法により ( 他の Linux ディストリビューションと比較して ) インストール後に以下のスクリプトが別の場所に移動されますこのため実行レベルを変更したり再起動したりすると LifeKeeper がシャットダウンしますこれらのエラーは steeleye-lk パッケージの検証時にのみ発生します不足 /etc/rc.d/rc0.d/k01lifekeeper 不足 /etc/rc.d/rc1.d/k01lifekeeper 不足 /etc/rc.d/rc6.d/k01lifekeeper LifeKeeper の一部のスクリプトは Linux のシステムユーティリティの出力を解析し情報を抽出するために特定のパターンに依存しますこれらのコマンドのいくつかを英語以外のロケールで実行すると予測パターンが変更され LifeKeeper のスクリプトは必要な情報を取得できませんこのため /etc/default/lifekeeper では言語環境変数 LC_MESSAGES が POSIX C のロケールに設定されています ( LC_ MESSAGES=C) 言語を英語にして Linux をインストールする必要はありません ( インストールメディアで使用できる任意の言語を選択可能 ) /etc/default/lifekeeper の LC_MESSAGES の設定は LifeKeeper にのみ影響します /etc/default/lifekeeper の LC_MESSAGES の値を変更する場合は LifeKeeper の動作に悪影響を及ぼす可能性があることに注意してください副作用は多様な言語とユーティリティ用にメッセージカタログがインストールされているかおよび LifeKeeper が予測しないテキスト出力が生成されるかどうかによって異なります SLES10 をインストールした AMD64 システムでシャットダウンを実行するとシステムがロックアップしてシャットダウンが完了しませんこれはバグ # により Novell に報告済みですこのロックアップは SLES10 節電パッケージが原因と考えられています回避策 : SLES10 節電パッケージを削除するとシャットダウンが正常に完了するようになります GUI アプレットを終了するか切断してから同じ Web ブラウザのセッションから再接続しようとするとログインプロンプトが表示されないことがあります回避策 : Web ブラウザを閉じ Web ブラウザを開き直してからサーバに接続します Firefox ブラウザを使用している場合は Firefox のウィンドウをすべて閉じてから開き直します SteelEye Protection Suite for Linux 357

378 トラブルシューティング症状 GUI - RHEL5 の lkguiapp が未サポートのテーマエラーをレポートする Data Replication - GUI に SLES 10 SP2 システムの正しいステータスが表示されない Data Replication - 32 ビットマシンのサイズ制限 VMware のゲストのデバイス ID が /dev/disk/byid にない推奨される処置 GUI アプリケーションクライアントの開始時に以下のコンソールメッセージが表示されることがあります /usr/share/themes/clearlooks/gtk-2.0/gtkrc:60:engine "clearlooks" is unsupported, ignoring このメッセージは RHEL 5 および FC6 Java プラットフォームの表示方式からのもので GUI クライアントの動作に悪影響は及ぼしません SLES 10 SP2 では /proc/<pid>/fd の新しいフォーマットにより nestat が壊れていますこの問題は SLES 10 SP2 カーネルのバグに起因しておりカーネルの更新バージョンで修正済みです解決策 : SLES 10 SP2 を実行している場合はカーネルをバージョンにアップグレードしてください 32 ビットマシンで 2 TB を超えるドライブを複製しようとすると以下のエラーが発生することがあります Negotiation:..Error:Exported device is too big for me.get 64-bit machine 解決策 : 32 ビットマシンで SteelEye DataKeeper を使用する場合 2 TB を超えるドライブの複製はできません DataKeeper の作成プロセスで複製に使用できるすべてのディスクまたはパーティションを表示するはずのドロップダウンボックスに仮想ハードディスクのディスク ID が表示されません VMware のデバイス ID は /dev/disk/by-id にないので DataKeeper はそれらの正しい ID を特定できません回避策 : 以下のファイルにドライブを手動で追加してください /opt/lifekeeper/subsys/scsi/resources/devname/device_ pattern 358 トラブルシューティング

379 Index Index A API 156 B Block Resource Failover 305 C Confirm Failover 304 CONFIRM_SO リザベーションの無効化 133 Core 52 F File Systems 53 G Generic Applications 53 GUI GUI サーバプロセスの表示 201 LifeKeeper サーバでの実行 197 ソフトウェアパッケージ 177 デスクトップのツールバーにアイコンを追加する 85 ユーザの設定 190 リモートシステムでの実行 195 停止 189 概要 186 終了 200 設定 187 開始 189 SteelEye Protection Suite for Linux 359

380 Index GUI からのミラーの管理 316 I In Service 219 IP Addresses 53 J Java セキュリティポリシー 192 プラグイン 194 L LifeKeeper Communications Manager (LCM) 228 ステータスの情報 229 警報とリカバリ LifeKeeper の警報インターフェース 229 LifeKeeper イベントメール通知設定 83 LifeKeeper のローカルリカバリ動作と制御のインターフェース (LRACI) 53 LifeKeeper の停止 201, 240 LifeKeeper の削除 235 LifeKeeper の起動 200, 239 LifeKeeper 設定データベース (LCD) 221 /opt/lifekeeper の LCD のディレクトリ構造 227 コマンド LCD インターフェース (LCDI) 221 ディレクトリ構造 225 フラグ 225 リソースタイプ 225 リソースのサブディレクトリ 226 設定データトラブルシューティング

381 Index lkbackup SDR による 261 破損したイクイバレンシ 255 lkpolicy ツール 153 M Multi-Site Cluster 329 ファイルシステム新規の複製 332 既存の複製 334 リストアおよびリカバリの設定 342 リソース階層ディザスタリカバリシステムへの拡張 339 作成 331 拡張 337 制限 331 概要 329 移行実行 344 正常な完了 352 要件 343 設定する際の考慮事項 330 N N-Way リカバリ 157 O Out of Service 220 Q Quorum/Witness 136 quorum モード 138 SteelEye Protection Suite for Linux 361

382 Index Quorum を喪失した ( 多数派ではなくなった ) ときのアクション 139 witness モード 139 インストールと設定 137 リザベーションの無効化 133 共有 Witness 140 設定可能なコンポーネント 137 R RAW I/O 53 S SNMP によるイベント転送 77 SNMP のトラブルシューティング 81 概要 77 設定 79 STONITH リザベーションの無効化 133 T Tag Name Restrictions 281 Valid Characters 281 TTY 接続 76 V VMWare 既知の問題 358 アアクティブ / スタンバイ 57 アクティブ / アクティブ 56 アダプタのオプショントラブルシューティング

383 Index アップグレード 48 イイクイバレンシ情報 61 イベントメール通知 81 トラブルシューティング 84 概要 77 インストール 43, 291 コマンドライン 43 ライセンス 45 確認 48 インターネット Host ID 48 インテリジェントスイッチバック 58 ウウオッチドッグリザベーションの無効化 133 エエラーの検出 157 カカスタム証明書 88 ココマンドラインミラーステータスの監視 324 ミラー管理 322 コミュニケーションパスハートビート 54 ファイアウォール 236 作成 158 SteelEye Protection Suite for Linux 363

384 Index 削除 160 ササーバグループ 54 サーバのプロパティフェイルオーバ 160 表示 204 サーバの障害 325 サーバプロパティ編集 158 サーバ構成のマッピング 7 シシステムの日付と時刻 276 スステータスの表 199 ステータス表示簡略 68 詳細 63 ストレージのオプション 9 ダダイアログ Cluster Connect 212 Cluster Disconnect 212 Resource Properties 213 Server Properties 214 ツツールバー 182 GUI トラブルシューティング

385 Index サーバのコンテキスト 185 リソースのコンテキスト 184 デデータベースアプリケーション 42 データ複製パス 293 テテクニカルノート 240 トトラブルシューティング 249, 355 GUI トラブルシューティング 271 コミュニケーションパス 276 不完全なリソースの作成 277 不完全なリソースの優先順位の変更 277 制限 249 既知の問題 249 ネネットワーク帯域幅変化率の測定 293 要件の特定 293 ハハードウェア 54 ははじめにミラーリング 283 仕組み 284 SteelEye Protection Suite for Linux 365

386 Index パパッケージ 1, 5 フファイアウォールファイアウォールを使用した状態での LifeKeeper の実行 236 ファイアウォール経由での LifeKeeper GUI の実行 238 フェイルオーバのシナリオ 288 フェンシング I/O フェンシング表 134 代替方式 145 概要 133 ブブラウザのセキュリティパラメータ 198 フラグ 305 ププロパティパネル 199 ママルチサイトクラスタ始める前に 343 ミミラーステータスコマンドラインからの監視 324 ミラーのステータス表示 315 ミラーを強制的にオンラインにする 318 ミラー管理コマンドライントラブルシューティング

387 Index メメッセージバー 200 メニュー 178 [Edit] メニュー - [Resource] 180 [Edit] メニュー - [Server] 181 File 180 Help 182 View 181 サーバのコンテキスト 179 リソースのコンテキスト 178 ラライセンス 45 リリカバリ Out-of-Service 階層 280 サーバ障害 279 フェイルオーバ後 235 停止できないプロセス 280 手動リカバリ時のパニック 280 リザベーション SCSI 143 無効化 133 リソースタイプ 59 リソースのプロパティ 166 リソースの優先順位 167 リソースの状態 60 リソースポリシー管理 150 SteelEye Protection Suite for Linux 367

388 Index リソース依存関係作成 171 削除 172 リソース階層 59 In Service 313 Out of Service 313 ツリーの展開 211 ツリーの折り畳み 211 テスト 314 メンテナンス 234 作成 162, 308 Generic Application 164 Raw デバイス 165 ファイルシステム 163 例 63 削除 173, 312 情報 62 拡張 168, 309 Generic Application 170 Raw デバイス 170 ファイルシステム 169 拡張解除 170, 312 転送 240 階層の関係 61 リワインドデータのリワインドと復旧 318 リワインドブックマークの作成と表示 317 リワインドログの場所の設定 322 リワインドログの最大サイズの設定トラブルシューティング

389 Index 一一時停止と再開 318 保保護対象のリソース 51 健健全性の監視 232 共共有データリソース 55 共有通信 55 再再同期 325 全体の回避 326 出出力パネル 200 切切り替え可能な IP アドレス 41 切断 203 同同期ミラーリング 284 圧圧縮レベル 322 変変化率 293 手手動フェイルオーバー確認 86 SteelEye Protection Suite for Linux 369

390 Index 接接続サーバと共有ストレージ 39 サーバをクラスタに 202 環環境セットアップ 39 管管理 157 自自動スイッチバック 58 表表示サーバのステータス 203 サーバのプロパティ 204 サーバのログファイル 204 メッセージ履歴 210 リソースのステータス 205 リソースのタグと ID 205 リソースのプロパティ 207 接続サーバ 203 表示オプション 207 要要件 DataKeeper 93 Quorum/Witness パッケージ 136 STONITH トラブルシューティング

391 Index ストレージとアダプタ 8 ソフトウェア 291 ハードウェア 291 ファイアウォール 236 設設定 75, 291 アプリケーション 94 データレプリケーション 93 ネットワーク 94 ネットワーク設定の確認 40 ネットワークと LifeKeeper 292 任意の作業 85 値 230 全般 292 共有ストレージ 39 手順 75 概念 54 認認証情報 155 障障害検出とリカバリ 69 IP ローカルリカバリ 69 サーバの障害リカバリのシナリオ 73 リソースのエラーリカバリのシナリオ 71 非非同期ミラーリング 284 SteelEye Protection Suite for Linux 371

392

すべて見る

LifeKeeper Single Server Protection

LifeKeeper Single Server Protection v9.2 インストレーションガイド 2017 年 10 月本書およびその内容は SIOS Technology Corp. ( 旧称 SteelEye Technology, Inc.) の所有物であり許可なき使用および複製は禁止されています SIOS Technology Corp. は本書の内容に関していかなる保証も行いません