CLUSTERPRO MC RootDiskMonitor 2.4 for Linux HW-RAID 監視機能 ユーザーズガイド

Similar documents
CLUSTERPRO MC RootDiskMonitor 2.1 for Linux HW-RAID 監視機能 ユーザーズガイド 2016(Mar) NEC Corporation 製品の概要 HW-RAID 監視機能 本製品の導入について 操作 運用手順 注意 制限事項について 付録

CLUSTERPRO MC RootDiskMonitor 1.0 for Linux はじめての RootDiskMonitor 2013(Apr) NEC Corporation はじめに 製品概要 監視の設定と実践 おわりに

CLUSTERPRO MC RootDiskMonitor 2.3 for Linux HW-RAID 監視機能 リリースメモ 2018(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル

CLUSTERPRO MC StorageSaver 2.2 for Linux リリースメモ 2017(Apr) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

CLUSTERPRO MC RootDiskMonitor 2.3 for Linux リリースメモ 2018(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル

CLUSTERPRO MC RootDiskMonitor 1.1 for Linux リリースメモ 2013(Sep) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル

CLUSTERPRO MC StorageSaver 1.1 for Linux リリースメモ 2015(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows FAQ 集 2013(Mar) NEC Corporation 導入に関する質問 運用に関する質問 動作環境に関する質問

CLUSTERPRO MC RootDiskMonitor CLUSTERPRO MC StorageSaver for BootDisk 仮想環境 ( ゲスト OS) での設定手順 (Linux 版 Windows 版 ) 2017(Apr) NEC Corporation 仮想環境 ( ゲスト

CLUSTERPRO MC StorageSaver istorage M シリーズ使用時の設定手順 (HP-UX 版 Linux 版 Windows 版 ) 2013(Apr) NEC Corporation istorage M シリーズを使用する場合の StorageSaver 設定手順 (H

CLUSTERPRO MC StorageSaver istorage M シリーズ使用時の設定手順 (HP-UX 版 Linux 版 Windows 版 ) 2013(Sep) NEC Corporation istorage M シリーズを使用する場合の StorageSaver 設定手順 (H

CLUSTERPRO MC ProcessSaver 2.1 for Linux リリースメモ 2016(Mar) NEC Corporation ライセンス パッケージのインスト ル セットアップ マニュアル 障害発生時の手順 補足事項 注意事項

CLUSTERPRO MC ProcessSaver ApsEdition 1.0 for Linux リリースメモ 2012(Sep) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

CLUSTERPRO MC StorageSaver 2.1 for Linux FAQ 集 2016(Mar) NEC Corporation 導入に関する質問 起動 終了に関する質問 監視に関する質問 障害復旧に関する質問 クラスタに関する質問 動作環境に関する質問

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) に よるプロセス監視の基本的な動作について記載したものです (1) 商標および商標登録 Linux は Linus Torvalds 氏の米国およ

CLUSTERPRO MC StorageSaver 1.2 for Linux はじめての StorageSaver (vsphere 対応版 ) 2014(Mar) NEC Corporation はじめに 製品概要 監視の設定と実践 付録 おわりに

改版履歴 版数改版履歴改版年月日 1 新規作成 2013/3/29 2 TESTIO_MODE を追加 OVER_ACTION VG_STALL_ACTION の設定値を変更 2013/9/30 3 CLUSTERPRO MC StorageSaver for BootDisk (for Linux

改版履歴 版数改版内容 新規作成 i

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows インストールガイド 2013(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

CLUSTERPRO MC RootDiskMonitor 2.3 for Windows リリースメモ 2018(Jun) NEC Corporation はじめに ライセンス 動作要件 セットアップ マニュアル

改版履歴 版数 改版 内容 新規作成 Microsoft.NET Framework のダウンロード先 URL を追記 バージョンアップに伴い改版 i

CLUSTERPRO MC StorageSaver for BootDisk 1.2 (for Windows) インストールガイド 2014(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

CLUSTERPRO MC StorageSaver for BootDisk 2.1 (for Windows) インストールガイド 2016(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) と CLUSTERPRO X 3.1 for Linux ( 以後 CLUSTERPRO と記載します ) を組み合わせて フェイルオーバクラスタ

CLUSTERPRO MC ProcessSaver 2.3 for Windows インストールガイド 2018(Jun) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品のアンインストール 本製品のアップデートインストール

CLUSTERPRO MC ProcessSaver 2.3 for Windows ユーザーズガイド ( コマンド編 ) 2018(Jun) NEC Corporation はじめに コマンドリファレンス メッセージ一覧

CLUSTERPRO MC RootDiskMonitor 2.3 for Windows インストールガイド 2018(Jun) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール 本製品のアップデートインストール

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

CLUSTERPRO MC ProcessSaver 2.2 for Linux 構築ガイド 2017(Oct) NEC Corporation 責任範囲 適用範囲 概要 事前準備 クラスター設定 動作確認

CLUSTERPRO MC RootDiskMonitor 1.1 for Windows パトロールシーク機能 インストールガイド 2013(Sep) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

CLUSTERPRO MC StorageSaver 1.0 for Windows インストールガイド 2013(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール 注意 制限事項

CLUSTERPRO MC ProcessSaver 1.0 for Windows 構築ガイド 2012(Sep) NEC Corporation はじめに責任範囲適用範囲概要事前準備クラスタ設定

CLUSTERPRO MC StorageSaver 2.0 for Windows インストールガイド 2015 (Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール 本製品のアップデートインストール 注意 制限

CLUSTERPRO MC ProcessSaver 1.0 for Windows ユーザーズガイド ( コマンド編 ) 2012(Sep) NEC Corporation はじめに コマンドリファレンス メッセージ一覧

CLUSTERPRO MC StorageSaver 2.4 for Windows インストールガイド

CLUSTERPRO MC ProcessSaver 2.1 for Windows 構築ガイド 2016(Mar) NEC Corporation はじめに 責任範囲 適用範囲 概要 事前準備 クラスタ設定

はしがき (1) マニュアルについて CLUSTERPRO MC ProcessSaver for Linux Web サーバー監視機能テンプレートガイド は ProcessSaver による Web サーバー監視時のプロセス監視ソリューションを支援するための導入事例をご紹介します 本資料でご紹介す

CLUSTERPRO MC RootDiskMonitor 2.1 for Windows パトロールシーク機能 インストールガイド 2016(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

はしがき 本書は CLUSTERPRO MC StorageSaver 1.0 for Linux ( 以後 StorageSaver と記載します ) の出力する syslog のメッセージの意味と対処方法について説明したものです (1) 本書は以下のオペレーティングシステムに対応します IA32

Universal RAID Utility Ver2.1 ユーザーズガイド

CLUSTERPRO MC StorageSaver ハードウェア障害復旧後の運用手順 (HP-UX 版 Linux 版 Windows 版 ) 2012(Sep) NEC Corporation はじめに ハードウェア障害復旧後の運用手順 注意 制限事項

CLUSTERPRO MC ApplicationMonitor 1.1 for Linux を 5 ノード以上の RAC 構成で 使用する場合の補足事項 2013(Oct) NEC Corporation 多ノード RAC 構成用の設定

CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2015/03/31 Page 2 NEC Corporation 2015

Universal RAID Utility Ver4.1 ユーザーズガイド

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2013/03/ OverAction と DiskStallAction の値変更 (ActionNone ServiceCmdDisable ProcessOfRdmstatKillEnable ServiceCmdEnable)

CLUSTERPRO MC RootDiskMonitor 1.0 for Linux ユーザーズガイド 2013(May) NEC Corporation 製品の概要 OS ディスクの監視方式について SG の設定 操作 運用手順 syslog メッセージ 注意 制限事項について リファレンス 付

CLUSTERPRO MC RootDiskMonitor 1.1 for Linux syslog メッセージ一覧 2013(Sep) NEC Corporation フォーマットについて RootDiskMonitor の運用メッセージ その他のメッセージ RootDiskMonitor のデバ

CLUSTERPRO MC StorageSaver 2.0 for Windows 導入ガイド 第 1 版 2015 年 3 月 日本電気株式会社

CLUSTERPRO MC RootDiskMonitor 2.1 for Linux CLUSTERPRO MC StorageSaver for BootDisk 2.1 (for Linux) ユーザーズガイド 2016(Mar) NEC Corporation 製品の概要 OS ディスクの監

Linkexpress トラブル初期調査資料 採取コマンド使用手引書

ESMPRO/JMSS Ver6.0

ESMPRO/JMSS Ver6.0

はじめに 本書は Express5800/ft サーバに Red Hat Enterprise Linux 6 Server 及び ft Server Control Software がインストールされており OS がインストールされている内蔵ディス クに空き容量がある場合に 追加でボリュームを作

ダンプ取得機能強化サポートオプション Enterprise Edition

NEC Express5800 シリーズ N /158 Fibre Channel コントローラ ドライバインストール手順書 A

はしがき 本書は CLUSTERPRO MC RootDiskMonitor 1.2 for Linux ( 以後 RootDiskMonitor と記載します ) および CLUSTERPRO MC StorageSaver for BootDisk 1.2 (for Linux) の OS ディ

CLUSTERPRO MC StorageSaver 1.2 for Linux パラメータシート 第 4 版 2014 年 3 月 31 日 日本電気株式会社

Microsoft Windows Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Linux は Linus Torvalds 氏の日本およびその他の国における登録商標または商標です Red Hat

N Setup card

Microsoft Word - esm_update_jp.doc

Universal RAID Utility (Linux版)

CLUSTERPRO MC StorageSaver 2.1 for Windows イベントログメッセージ一覧 2016 (Mar) NEC Corporation はじめに StorageSaver の運用メッセージその他のメッセージ障害解析情報の採取

CLUSTERPRO MC ProcessSaver 2.3 for Windows はじめての ProcessSaver 第 5 版 2018 年 6 月 日本電気株式会社 日頃より弊社製品をご愛顧いただきありがとうございます このたび お客様にご利用いただく ProcessSaver でのプロセ

Microsoft Word - TestReport_PRIMEPOWER250_ doc

Microsoft Word - README_2011_FW.txt

Microsoft Windows Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Linux は Linus Torvalds 氏の日本およびその他の国における登録商標または商標です Red Hat

CLUSTERPRO MC StorageSaver 2.2 for Linux パラメーターシート 第 4 版 2017 年 4 月 日本電気株式会社

改版履歴 版数改版内容 新規作成 Page 1

ESMPRO/ServerManager サーバ死活監視機能

ESMPRO/JMSS Ver6.0

CLUSTERPRO MC StorageSaver 1.2 for Windows はじめての StorageSaver (vsphere 対応版 ) 2014(Mar) NEC Corporation はじめに 製品概要 監視の設定と実践 おわりに

手動操作によるパーティション作成方法 4. リストア方法 (3) システム情報の復元 の 3-2) の手順で sfdisk コマンドによるシステムのパーティション情報の復元に失敗する場合は fdisk コマンドにて手動でパーティションを作成してください 作成するパーティションのサイズは バックアップ

目次 1 はじめに 2 pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ 3 再起動スクリプトの記述方法 4 pcheck の起動 停止 (1) コマンドラインからの起動 (2) rc からの起動 5 運用管理 (1) 監視の一時停止 再開コマンド (2) 監視状態

Microsoft Word - nvsi_050090jp_oracle10g_vlm.doc

CLUSTERPRO MC ProcessSaver for Linux クイックリファレンス 第 1 版 2016 年 3 月 日本電気株式会社

Microsoft Word - nvsi_090203_r1_sanboot_vaultdr.doc

ProcessSaver WebEdition テンプレートガイド

MegaMonitor for Linux インストール・操作マニュアル

PowerPoint プレゼンテーション

BMC 故障時のハードウェア障害通報機能セットアップガイド NX7700x/A5012M-4,A5012L-2, A5012L-2D,A5012L-1D ( リリース 1.0) 2018 年 12 月 日本電気株式会社 2018 NEC Corporation

セットアップカード

PRIMEQUEST 1000 シリーズ IO 製品 版数の確認方法

Release Note for Recording Server Monitoring Tool V1.1.1 (Japanese)

OpenAM 9.5 インストールガイド オープンソース ソリューション テクノロジ ( 株 ) 更新日 : 2013 年 7 月 19 日 リビジョン : 1.8

HPE ProLiant Thin Micro TM200 サーバー Microsoft Windows Server インストール手順

CLUSTERPRO MC StorageSaver ハードウェア障害復旧後の運用手順 (HP-UX 版 Linux 版 Windows 版 ) 2016(Mar) NEC Corporation はじめに ハードウェア障害復旧後の運用手順 注意 制限事項

Red Hat Enterprise Linuxのcron(8)デーモンにデフォルト定義されたtmpwatch命令の動作による、WebOTXのトラブル対処方法

Linux修正適用手順書

Microsoft Word - nvsi_090196_r1_vaultdr_offline_rhel_dualpath.doc

PRIMERGY TX100 S3 未サポートOS動作検証確認情報

Status Utility for Linuxオンラインマニュアル

Microsoft Word - VPN...[.U.K.C.hLinux doc

UCS M シリーズ サーバでの Redhat/CentOS オペレーティング システムのインストール

改版履歴 本書の改版履歴は以下のとおりです 日付 改版理由 変更箇所 版数 2014/09/04 初版発行 版 2015/03/30 第 1.1 版に改訂 対象 OS 追加 1.1 版 2015/07/10 第 1.2 版に改訂 対象 OS 追加 1.2 版 2015/09/04 第 1

はじめに SCSI ( ) RAID Utility (HDD Check Scheduler) V1.01 / 2005 年 4 月富士通株式会社 Microsoft Windows Windows NT Microsoft Corporation All Rights Reserved, Cop

Universal RAID Utility Ver2.5 ユーザーズガイド

KSforWindowsServerのご紹介

WebSAM AlertManager Ver4.2 UL1032-B03 UL1032-HB03 UL1032-JB03 セットアップカード 1 章パッケージの中身の確認 2 章セットアップの準備 3 章セットアップの方法 4 章注意事項 UL1032-XB03 SL1032B0301-1

Transcription:

CLUSTERPRO MC RootDiskMonitor 2.4 for Linux HW-RAID 監視機能 ユーザーズガイド 2019(Apr) NEC Corporation 製品の概要 HW-RAID 監視機能 本製品の導入について 操作 運用手順 注意 制限事項について 付録

はしがき 本書は CLUSTERPRO MC RootDiskMonitor 2.4 for Linux HW-RAID 監視機能 ( 以後 HWRAIDMON と記載します ) について記載したものです 基本機能として以下の運用が可能です - 物理ディスク死活監視機能 - 障害レポート機能 HW-RAID 監視機能は Express5800 シリーズの Universal RAID Utility から制御可能な HW-RAID コントローラーを搭載した環境でのみ機能します (1) 本書は以下のオペレーティングシステムに対応します x86 および x86_64 搭載サーバー Red Hat Enterprise Linux 6.0~6.10 Red Hat Enterprise Linux 7.0~7.6 (2) 商標および登録商標 Red Hat Red Hat Enterprise Linux は 米国およびその他の国における Red Hat, Inc. およびその子会社の商標または登録商標です Linux は 米国およびその他の国における Linus Torvalds の登録商標です その他記載の製品名および会社名は すべて各社の商標または登録商標です なお 本書ではR TM マークを明記しておりません i

目次 1. 製品の概要... 1 1.1. 製品概要について... 1 1.2. 製品構成について... 2 2. HW-RAID 監視機能... 4 2.1. 物理ディスクの死活監視... 4 3. 本製品の導入について... 8 3.1. 本製品の導入... 8 3.2. 監視定義ファイルについて... 8 3.3. 本製品のログについて... 9 4. 操作 運用手順... 10 5. 注意 制限事項について... 12 5.1. 注意 制限事項... 12 6. 付録... 15 6.1. 本製品のテスト手順について... 15 ii

1. 製品の概要 1.1. 製品概要について (1) 製品の提供する主な機能 本製品は RAID コントローラーを使った HW-RAID を構成しているディスクの死活監視を 行います HW-RAID 監視機能 RAID ユーティリティを用いてディスクの状態を定期監視します ディスクの故障を検出すると syslog に異常レポートを通知します 1

1.2. 製品構成について (1) プロダクト構成 本製品は Linux の HW-RAID 監視を行います (2) ソフトウェア構成 プロセス構成は以下のとおりです rdm_hwraidmon HW-RAID 監視デーモン rdmhwraid_admin 運用管理コマンド ファイル ディレクトリ構成は以下のとおりです 実行形式ディレクトリ /opt/ha/hwraidmon/bin 監視定義ファイル /var/opt/ha/hwraidmon/conf/rdm_hwraidmon.config /var/opt/ha/hwraidmon/conf/rdm_hwraidmon_service.config rc ファイル /etc/init.d/rdmhwraidmon 1 Unit 定義ファイル /usr/lib/systemd/system/rdmhwraidmon.service 2 1 以下の環境でのみ作成されます Red Hat Enterprise Linux 6.x 2 以下の環境でのみ作成されます Red Hat Enterprise Linux 7.x 2

(3) サポート範囲 x86 および x86_64 対応 CPU 搭載サーバーに搭載されている RAID コントローラー配下に 構成されているディスクが対象となります 本機能は HW-RAID を構成する物理ディスク群から 1 つの論理ディスクを作成した構成を サポートします 複数の論理ディスクを作成した構成はサポート対象外となります サポート対象の構成例 論理ディスク 1 論理ディスク 2 物理ディスク 1 物理ディスク 2 物理ディスク 3 物理ディスク 4 物理ディスク群 サポート対象外の構成例 論理ディスク 1 論理ディスク 2 物理ディスク 1 物理ディスク 2 物理ディスク 3 物理ディスク 4 物理ディスク群 UniversalRAIDUtility は Ver.2.4 以降のバージョンが対象となります 3

2. HW-RAID 監視機能 2.1. 物理ディスクの死活監視 rdm_hwraidmon コマンド実行 状態参照 判定 Universal RAID Utility 状態表示 論理ディスク RAID コントローラー RAID 物理ディスク 図 1 HW-RAIDSCSI 統計情報監視デーモンによる物理 OS ディスク監視構造 4

(1) 監視方式について 監視デーモン (rdm_hwraidmon) は一定間隔 ( デフォルト 3600 秒 ) で HW-RAID の各物理ディスクの状態を取得します 取得した HW-RAID 状態をチェックします 物理ディスクの状態が異常の場合に ディスク障害と判断します ディスク障害と判断した場合は syslog に障害通知します 5

(2) 監視定義ファイルについて 本機能の監視定義ファイルについて説明します いずれの監視定義ファイルも特別な要件がないかぎりそのままご使用ください システム定義 rdm_hwraidmon.config 製品全体の動作を設定する定義ファイル /var/opt/ha/hwraidmon/conf/rdm_hwraidmon.config # Service configuration file PATH. SERVICE_FILE /var/opt/ha/hwraidmon/conf/rdm_hwraidmon_service.config # Memory Log size (MB). # minimum=1, default=5 MEMORYLOG_SIZE 5 # Memory Log dump file num. # minimum=5, default=10 DUMPFILE_MAX_NUM 10 # Log directory PATH. TRACELOG_DIRECTORY /var/opt/ha/hwraidmon/log # Log output mode. # Not set, Memory log only (default) # Set "LOGMODE TRACE" => Memory Log + File Log. #LOGMODE TRACE # Trace Log file size (MB) # minimum=1, default=5 #TRACELOG_SIZE 5 サービス定義 rdm_hwraidmon_service.config 実行するサービスを設定する定義ファイル /var/opt/ha/hwraidmon/conf/rdm_hwraidmon_service.config _bi_hwraidmon _bi_mediumerror { SERVICE_INIT DLL: /opt/ha/hwraidmon/services/lib_bi_hwraidmon.so:init:direct:300:-:-:0 SERVICE_EXEC DLL:/opt/HA/HWRAIDMON/services/lib_bi_hwraidmon.so:hwraidmon:DIRECT:300:3600:-:0 } 6

(3) 監視定義ファイルのパラメーターについて内部パラメーターのためユーザーは変更する必要はありません システム定義 rdm_hwraidmon.config 監視ルール項目 SERVICE_FILE MEMORYLOG_SIZE DUMPFILE_MAX_NUM TRACELOG_DIRECTORY LOGMODE TRACELOG_SIZE 説明サービス定義ファイルのパスを記述します 動作ログのサイズを指定します 指定値は 1~ デフォルト 5 動作ログの出力数を指定します 指定値は 5~ デフォルト 10 動作ログの出力先を指定します 動作ログの出力モードを指定します デフォルトは未指定 ( メモリのみ ) です MEMORY: メモリのみ TRACE: メモリ + ファイル DEBUG: メモリ + ファイル + 標準出力トレースファイルのサイズを指定します デフォルトは未指定 (5) です 指定値は 1~5 システム定義 rdm_hwraidmon_service.config 実行間隔を変えたい場合は以下の値を変更してください 例 : 実行間隔をデフォルト 3600 秒から 600 秒に変更する場合 _bi_hwraidmon _bi_mediumerror { SERVICE_INIT DLL: /opt/ha/hwraidmon/services/lib_bi_hwraidmon.so:init:direct:300:-:-:0 SERVICE_EXEC DLL:/opt/HA/HWRAIDMON/services/lib_bi_hwraidmon.so:hwraidmon:DIRECT:300: 3600 :-:0 } _bi_hwraidmon _bi_mediumerror { SERVICE_INIT DLL: /opt/ha/hwraidmon/services/lib_bi_hwraidmon.so:init:direct:300:-:-:0 SERVICE_EXEC DLL:/opt/HA/HWRAIDMON/services/lib_bi_hwraidmon.so:hwraidmon:DIRECT:300: 600 :-:0 } 7

3. 本製品の導入について 3.1. 本製品の導入 導入手順の詳細については CLUSTERPRO MC RootDiskMonitor 2.4 for Linux HW-RAID 監視 機能リリースメモ をご覧ください 3.2. 監視定義ファイルについて HW-RAID を構成している物理ディスクの状態を監視するには 監視定義ファイルが必要です 特別な要件がないかぎり 監視定義ファイルはそのままご使用ください 各監視定義ファイルは以下のとおりです 監視動作用定義ファイル /var/opt/ha/hwraidmon/conf/ rdm_hwraidmon.config 実行するサービスを設定する定義ファイル /var/opt/ha/hwraidmon/conf/ rdm_hwraidmon_service.config 8

3.3. 本製品のログについて 本製品では HW-RAID 監視で致命的な異常を検出すると syslog にメッセージを出力します また その他動作ログについては 各ログファイルに出力されます syslog ファイル : /var/log/messeages syslog の facility と level は以下のとおりです facility : LOG_DAEMON level : LOG_LEVEL_INFO LOG_LEVEL_WARN LOG_LEVEL_ERR LOG_LEVEL_WARN LOG_LEVEL_ERR は致命的な障害のときに使用されます (1) 警報対象として監視を推奨するメッセージ一覧特に重要度の高い syslog メッセージを記述します ( 下線部はメッセージの固定部分を示します ) これらのメッセージが出力された場合は 記載している処置を行ってください PD' 物理ディスク番号 ' [' デバイス名 '] status is Failed. 説明 : 物理ディスクの故障を検出 処置 : 故障しているディスクがないかどうか HW 部門に確認を行ってください LD' 論理ディスク番号 ' [' デバイス名 '] status is Degraded. LD' 論理ディスク番号 ' [' デバイス名 '] status is Offline. 説明 : 論理ディスクの冗長性低下または冗長性消失を検出処置 : 故障しているディスクがないかどうか HW 部門に確認を行ってください (2) 本製品のログファイル本製品のログファイル (HWRAIDMON 動作ログ ) は以下のとおりです 監視デーモンの起動 停止および監視中の動作ログ /var/opt/ha/hwraidmon/log/rdm_hwraidmon_dump_yyyymmddhhmmss.log 本ログファイルは障害検出時 または監視デーモン終了時のみ作成されます "YYYYMMDDHHMMSS" にはファイル作成時の日時が入り デフォルトで 5MB のログが 10 世代まで作成されます 本ログは開発調査用のログです 通常運用にてユーザーが意識する必要はありません 9

4. 操作 運用手順 (1) HW-RAID 監視デーモンプロセスの起動 終了 - rc ファイルからの起動 終了 OS 起動 ( boot ) を契機に自動起動 OS 終了を契機に自動終了されます デフォルトで自動起動が設定されるのはランレベル 3 および 5 です - 手動起動 終了以下のコマンドを root 権限で投入することで起動できます Red Hat Enterprise Linux 7.x # systemctl start rdmhwraidmon Red Hat Enterprise Linux 6.x # /etc/init.d/rdmhwraidmon start 以下のコマンドを root 権限で投入することで終了できます Red Hat Enterprise Linux 7.x # systemctl stop rdmhwraidmon Red Hat Enterprise Linux 6.x # /etc/init.d/rdmhwraidmon stop 上記コマンドで終了しない場合は ps -ef grep rdm_hwraidmon でデーモンプロセスの pid を検索して kill -9 <pid> で終了させてください また 以下のコマンドを root 権限で投入することで デーモンプロセスを再起動できます Red Hat Enterprise Linux 7.x # systemctl restart rdmhwraidmon Red Hat Enterprise Linux 6.x # /etc/init.d/rdmhwraidmon restart 10

(2) 運用管理コマンドの操作手順 - 監視の一時停止 再開 以下のコマンドを root 権限で投入することで一時停止できます # /opt/ha/hwraidmon/bin/rdmhwraid_admin -c stop 以下のコマンドを root 権限で投入することで一時停止した監視を再開できます # /opt/ha/hwraidmon/bin/rdmhwraid_admin -c start - デーモンプロセスの終了 以下のコマンドを root 権限で投入することで終了できます # /opt/ha/hwraidmon/bin/rdmhwraid_admin -c shutdown - 動作ログ抽出 以下のコマンドを root 権限で投入することで動作ログを抽出できます # /opt/ha/hwraidmon/bin/rdmhwraid_admin -c dump 11

5. 注意 制限事項について 5.1. 注意 制限事項 (1) 下記の注意事項があります - 本製品を利用する場合 Linux SCSI パススルードライバー (sg ドライバー ) が インストールされ 事前にカーネルモジュールとしてロードされている必要があります モジュールがロードされているかどうかは lsmod コマンドの結果から確認できます 以下の sg ドライバーのエントリ行が出力されることを確認してください # lsmod grep sg sg 38369 2 sg ドライバーのエントリ行 - 本製品は内部で以下のパッケージを利用します sg3_utils Utils for Linux's SCSI generic driver devices + raw devices 本パッケージがインストールされていない場合 事前にインストールしてください 以下のコマンドでインストールの有無を確認できます # rpm -qa sg3_utils sg3_utils-w.x-y.z インストールされていない場合 何も出力されません 注意 :w, x, y, z には sg3_utils パッケージのバージョン番号が入ります 本パッケージは標準で OS インストール媒体中に含まれます 12

- Red Hat Enterprise Linux 7.x と 6.x (64bit) のシステムに本製品を インストールする場合 事前に互換ライブラリ (glibc-x-y.z.i686.rpm) が インストールされている必要があります 互換性ライブラリがインストールされていない場合 事前にインストールしてください 以下のコマンドでインストールの有無を確認できます # rpm -qa glibc : glibc-x-y.z.i686 インストールされていない場合 " glibc-x-y.z.i686" の行が出力されません 注意 :x, y, z には互換性ライブラリのバージョン番号が入ります 本パッケージは標準で OS インストール媒体中に含まれます - 本製品を運用中には共有メモリを約 1MB 程度使用します - 本製品は内部で以下のパッケージを利用します UniversalRaidUtility 本パッケージがインストールされていない場合 事前にインストールしてください 以下のコマンドでインストールの有無を確認できます # rpm -qa UniversalRaidUtility UniversalRaidUtility-x.y-z インストールされていない場合 何も出力されません 注意 :x, y, z には Universal Raid Utility のバージョン番号が入ります - 監視定義ファイルのパラメーターは基本的にデフォルト値を使用してください - HW-RAID の構成を変更する場合は HW-RAID 監視デーモンを終了させた後に 行ってください 構成変更後に再び HW-RAID 監視デーモンを起動してください 13

- UniversalRAIDUtility は Ver.2.4 2.5 3.1 4.02 が対象となります 指定のバージョン以外では正しく動作しない可能性があります - ホットスペアのディスクは監視対象外です - RAID コントローラーが複数ある環境はサポート対象外です - 本製品で障害を検出した場合は HW 部門に確認を取ってください - 監視定義ファイルを変更した場合はデーモンプロセスを再起動してください - 復旧を通知するメッセージはありません 復旧の確認は /opt/ha/rdm/bin/rdmadmin -c pdstatus で行ってください - 間欠障害の場合は障害検出できない場合があります - LD に付加されるデバイス名 (/dev/sdx) は補助的な情報のため故障箇所の特定は HW 構成を確認してください - UniversalRAIDUtility の強制状態変更コマンドを使用する場合はシステムディスク でないことを確認してから行ってください - 本製品は Linux のセキュリティ拡張機能である SELinux には対応しておりません SELinux の機能が有効になっている OS では本製品を使用することができませんので 必ず SELinux の機能を無効にしてください 14

6. 付録 6.1. 本製品のテスト手順について はじめに 本製品を導入するシステムにおいて 障害ディスク検出の検証を擬似的に行う手順を説明します コマンドオペレーションでディスク障害を擬似することにより 物理ディスクの抜き差し等の操作を 行う必要がなくなります HW-RAID 構成で物理ディスクの障害 復旧を擬似する手順について説明します 以下の操作は UniversalRAIDUtility 2.4 の場合を例としています システムドライブを構成する物理ディスクのステータスは強制変更しないでください ステータスを強制的に変更するとシステムが起動できなくなる可能性があります HW-RAID 構成は以下のものを想定しています レベル :RAID1 論理ディスク :LD1,LD2 物理ディスク :PD1,PD2,PD3,PD4 システムディスク データディスク LD1 LD2 PD1 PD2 PD3 PD4 15

擬似障害 復旧手順 (1) HW-RAID 監視デーモンが起動していることを確認します # ps -ef grep rdm_hwraidmon root 59651 1 0 12:00? 00:00:00 /opt/ha/hwraidmon/bin/rdm_hwraidmon 起動していない場合は以下のコマンドで起動してください Red Hat Enterprise Linux 7.x # systemctl start rdmhwraidmon Red Hat Enterprise Linux 6.x # /etc/init.d/rdmhwraidmon start (2) Universal RAID Utility の RAID システム管理モードを確認します # raidcmd runmode Standard Mode (3) RAID システム管理モードが Standard Mode の場合は 以下のコマンドにて管理モードを 変更します 既に Advanced Mode の場合は この手順は不要です # raidcmd runmode -md=a Changed RAID System Management Mode to "Advanced Mode". (4) RAID コントローラーの情報を参照します 障害状態にする物理ディスクの情報を確認します 16

# raidcmd property -tg=all : RAID Controller #1 Physical Device #3 ID : 3 Enclosure : 1 Slot : 4 Device Type : HDD Interface : SAS Vendor/Model : SEAGATE ST973402SS Firmware Versio : 0002 Serial Number : 3NP1JVQZ Capacity : 67GB Status : Online S.M.A.R.T. : Normal RAID Controller で示される番号が RAID コントローラー番号 Physical Device で示される番号が物理ディスク番号となります 上記の例では RAID コントローラー番号が 1 物理ディスク番号が 3 となります (5) PD3 を障害状態に強制変更します # raidcmd stspd -c=1 -p=3 -st=offline Make the Physical Device #3 offline. [Warning] The redundancy of Logical Drive will be lost. Do you continue? [yes(y) or no(n)] : -c は RAID コントローラー番号 -p は物理ディスク番号を指定します 上記ではコントローラー番号 1 物理ディスク番号 3 を指定しています (6) PD3 が障害状態になっていることを確認します # raidcmd property -tg=pd -c=1 -p=3 RAID Controller #1 Physical Device #3 ID : 3 Enclosure : 1 Slot : 4 Device Type : HDD Interface : SAS Vendor/Model : SEAGATE ST973402SS Firmware Versio : 0002 Serial Number : 3NP1JVQZ Capacity : 67GB Status : Failed S.M.A.R.T. : Normal -tg は出力範囲を指定します 上記では物理ディスクの状態を出力するため pd を指定しています 17

# /opt/ha/rdm/bin/rdmadmin -c pdstatus (monitor status = TRUE) =================================================================== : : Logical : I/O type : H/W Path : status : status ==========:=====================:===========:======================= VG : VG_NONE : up 論理ディスクの状態を MIRROR : : PV : /dev/sda : up : up 表示します LD : 1 : Online PD : 1 : Online PD : 2 : Online MIRROR : : PV : /dev/sdb : up : up LD : 2 : Degraded PD : 3 : Failed 物理ディスクの状態を表示します PD : 4 : Online (7) 監視のタイミングで障害検出メッセージが syslog に出力されていることを確認します デフォルトでは最大 3600 秒かかります # view /var/log/messages Sep 14 13:00:14 host1 rdm_hwraidmon[21520]: LD2 [/dev/sdb] status is Degraded. Sep 14 13:00:14 host1 rdm_hwraidmon[21520]: PD3 [/dev/sdb] status is Failed. (8) PD3 を正常状態に強制変更します # raidcmd stspd -c=1 -p=3 -st=online Make the Physical Device #3 online [Warning] The redundancy of Logical Drive will be lost. Do you continue? [yes(y) or no(n)] : (9) PD3 が正常状態になっていることを確認します # raidcmd property -tg=pd -c=1 -p=3 RAID Controller #1 Physical Device #3 ID : 3 Enclosure : 1 Slot : 4 Device Type : HDD Interface : SAS Vendor/Model : SEAGATE ST973402SS Firmware Version : 0002 Serial Number : 3NP1JVQZ Capacity : 67GB Status : Online S.M.A.R.T. : Normal 18

(monitor status = TRUE) =================================================================== : : Logical : I/O type : H/W Path : status : status ==========:=====================:===========:======================= VG : VG_NONE : up MIRROR : : PV : /dev/sda : up : up LD : 1 : Online PD : 1 : Online PD : 2 : Online MIRROR : : PV : /dev/sdb : up : up LD : 2 : Online PD : 3 : Online PD : 4 : Online (10) (2) で管理モードを変更した場合は元に戻します 管理モードを変更していない場合はこの手順は不要です # raidcmd runmode -md=s Changed RAID System Management Mode to "Standard Mode". 19

CLUSTERPRO MC RootDiskMonitor 2.4 for Linux HW-RAID 監視機能ユーザーズガイド 2019 年 4 月第 6 版日本電気株式会社東京都港区芝五丁目 7 番地 1 号 TEL (03) 3454-1111( 代表 ) NEC Corporation 2019 日本電気株式会社の許可なく複製 改変などを行うことはできません 本書の内容に関しては将来予告なしに変更することがあります

保護用紙