CLUSTERPRO MC ProcessSaver for Linux クイックリファレンス 第 1 版 2016 年 3 月 日本電気株式会社

Similar documents
目次 1 はじめに 2 pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ 3 再起動スクリプトの記述方法 4 pcheck の起動 停止 (1) コマンドラインからの起動 (2) rc からの起動 5 運用管理 (1) 監視の一時停止 再開コマンド (2) 監視状態

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) に よるプロセス監視の基本的な動作について記載したものです (1) 商標および商標登録 Linux は Linus Torvalds 氏の米国およ

目次 1 はじめに 2 Pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ 3 再起動スクリプトの記述方法 4 Pcheck の起動 終了 (1) ProcessSaver コンソール (GUI) からの起動 (2) PcheckRunList からの起動 (3) コ

CLUSTERPRO MC ProcessSaver 2.3 for Windows ユーザーズガイド ( コマンド編 ) 2018(Jun) NEC Corporation はじめに コマンドリファレンス メッセージ一覧

CLUSTERPRO MC ProcessSaver 1.0 for Windows ユーザーズガイド ( コマンド編 ) 2012(Sep) NEC Corporation はじめに コマンドリファレンス メッセージ一覧

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) と CLUSTERPRO X 3.1 for Linux ( 以後 CLUSTERPRO と記載します ) を組み合わせて フェイルオーバクラスタ

CLUSTERPRO MC ProcessSaver 2.2 for Linux 構築ガイド 2017(Oct) NEC Corporation 責任範囲 適用範囲 概要 事前準備 クラスター設定 動作確認

はしがき (1) マニュアルについて CLUSTERPRO MC ProcessSaver for Linux Web サーバー監視機能テンプレートガイド は ProcessSaver による Web サーバー監視時のプロセス監視ソリューションを支援するための導入事例をご紹介します 本資料でご紹介す

改版履歴 版数改版内容 新規作成 Page 1

CLUSTERPRO MC ProcessSaver 2.3 for Windows はじめての ProcessSaver 第 5 版 2018 年 6 月 日本電気株式会社 日頃より弊社製品をご愛顧いただきありがとうございます このたび お客様にご利用いただく ProcessSaver でのプロセ

改版履歴 版数 改版 内容 新規作成 MC 2.1 に対応 MC 2.2 に対応 MC 2.3 に対応 商標の記載の修正 i

MC ProcessSaver ユーザーズガイド (リモート制御機能)

ProcessSaver WebEdition テンプレートガイド

CLUSTERPRO MC ProcessSaver 2.1 ユーザーズガイド ( リモート制御機能 ) 2016(Mar) NEC Corporation 本機能の概要について 動作要件 インストールおよびアンインストールについて 操作 設定について 注意 制限事項 リファレンス

CLUSTERPRO MC ProcessSaver 2.4 for Linux FAQ 集

改版履歴 版数改版履歴改版年月日 1 新規作成 2013/3/29 2 TESTIO_MODE を追加 OVER_ACTION VG_STALL_ACTION の設定値を変更 2013/9/30 3 CLUSTERPRO MC StorageSaver for BootDisk (for Linux

CLUSTERPRO MC ProcessSaver 1.0 for Windows 構築ガイド 2012(Sep) NEC Corporation はじめに責任範囲適用範囲概要事前準備クラスタ設定

MC ProcessSaver for Linux ユーザーズガイド

CLUSTERPRO MC ProcessSaver 2.1 for Windows 構築ガイド 2016(Mar) NEC Corporation はじめに 責任範囲 適用範囲 概要 事前準備 クラスタ設定

CLUSTERPRO MC ProcessSaver 2.1 for Linux syslog メッセージ一覧 2016(Mar) NEC Corporation フォーマットについて 監視対象となる syslog メッセージ ProcessSaver 運用メッセージ padmin コマンドのメッセ

CLUSTERPRO MC ProcessSaver 2.1 for Linux リリースメモ 2016(Mar) NEC Corporation ライセンス パッケージのインスト ル セットアップ マニュアル 障害発生時の手順 補足事項 注意事項

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.1 for Linux ( 以後 ProcessSaver と記載します ) の 出力する syslog のメッセージの意味と対処方法について説明したものです (1) 商標および登録商標 Linux は Linus Torv

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2015/03/31 Page 2 NEC Corporation 2015

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2013/03/ OverAction と DiskStallAction の値変更 (ActionNone ServiceCmdDisable ProcessOfRdmstatKillEnable ServiceCmdEnable)

CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) の 出力する syslog のメッセージの意味と対処方法について説明したものです (1) 本書は以下のオペレーティングシステムに対応します IA3

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows FAQ 集 2013(Mar) NEC Corporation 導入に関する質問 運用に関する質問 動作環境に関する質問

CLUSTERPRO MC ProcessSaver 2.2 for Linux syslog メッセージ一覧 2017(Apr) NEC Corporation フォーマットについて 監視対象となる syslog メッセージ ProcessSaver 運用メッセージ padmin コマンドのメッセ

CLUSTERPRO MC StorageSaver 1.2 for Linux パラメータシート 第 4 版 2014 年 3 月 31 日 日本電気株式会社

CLUSTERPRO MC StorageSaver 2.1 for Linux FAQ 集 2016(Mar) NEC Corporation 導入に関する質問 起動 終了に関する質問 監視に関する質問 障害復旧に関する質問 クラスタに関する質問 動作環境に関する質問

CLUSTERPRO MC RootDiskMonitor 1.1 for Linux リリースメモ 2013(Sep) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル

CLUSTERPRO MC ProcessSaver ApsEdition 1.0 for Linux リリースメモ 2012(Sep) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

CLUSTERPRO MC StorageSaver 1.1 for Linux リリースメモ 2015(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

CLUSTERPRO MC StorageSaver 2.0 for Windows 導入ガイド 第 1 版 2015 年 3 月 日本電気株式会社


CLUSTERPRO MC RootDiskMonitor CLUSTERPRO MC StorageSaver for BootDisk 仮想環境 ( ゲスト OS) での設定手順 (Linux 版 Windows 版 ) 2017(Apr) NEC Corporation 仮想環境 ( ゲスト

CLUSTERPRO MC ProcessSaver 2.3 for Windows インストールガイド 2018(Jun) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品のアンインストール 本製品のアップデートインストール

改版履歴 版数改版内容 新規作成 i

CLUSTERPRO MC StorageSaver istorage M シリーズ使用時の設定手順 (HP-UX 版 Linux 版 Windows 版 ) 2013(Apr) NEC Corporation istorage M シリーズを使用する場合の StorageSaver 設定手順 (H

CLUSTERPRO MC StorageSaver 2.2 for Linux リリースメモ 2017(Apr) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

ProcessSaver テンプレートガイド

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows インストールガイド 2013(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

WebSAM System Navigator JNS isadmin SNMP Trap 連携設定手順書 NEC 2012 年 12 月

CLUSTERPRO MC StorageSaver for BootDisk 1.2 (for Windows) インストールガイド 2014(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

CLUSTERPRO MC StorageSaver istorage M シリーズ使用時の設定手順 (HP-UX 版 Linux 版 Windows 版 ) 2013(Sep) NEC Corporation istorage M シリーズを使用する場合の StorageSaver 設定手順 (H

プレポスト【解説】

Microsoft Word - TestReport_PRIMEPOWER250_ doc

監視アラート対応手順書(FOR LINUX)

CLUSTERPRO MC StorageSaver for BootDisk 2.1 (for Windows) インストールガイド 2016(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

CLUSTERPRO MC ApplicationMonitor 1.1 for Linux を 5 ノード以上の RAC 構成で 使用する場合の補足事項 2013(Oct) NEC Corporation 多ノード RAC 構成用の設定

CLUSTERPRO MC RootDiskMonitor 2.3 for Linux HW-RAID 監視機能 リリースメモ 2018(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル

CLUSTERPRO for Linux PostgreSQL HowTo

CLUSTERPRO for Linux MySQL HowTo

HDC-EDI Manager Ver レベルアップ詳細情報 < 製品一覧 > 製品名バージョン HDC-EDI Manager < 対応 JavaVM> Java 2 Software Development Kit, Standard Edition 1.4 Java 2

要求受付機能 管理番号内容対象バージョン 314 トレースログに重複してメッセージが出力される場合がある 6.3.2~ 大量のファイルトリガ情報が登録されている状態でファイルトリガプロセスを起動するとファイルトリガプロセスが停止する場合がある 7.2.0~7.3.1 ユーティリティ

DHCPサーバのクラスタ化

CLUSTERPRO MC RootDiskMonitor 2.3 for Windows インストールガイド 2018(Jun) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール 本製品のアップデートインストール

CLUSTERPRO MC StorageSaver 2.1 for Windows イベントログメッセージ一覧 2016 (Mar) NEC Corporation はじめに StorageSaver の運用メッセージその他のメッセージ障害解析情報の採取

Oracle Database 監視製品の使い分け 2017 年 10 月日本電気株式会社クラウドプラットフォーム事業部 CLUSTERPROグループ

< 障害一覧 > HULFT 配信機能 管理番号 内容 対象バージョン 39 コード変換の必要がない集信処理および配信処理を実行したにも関わ 7.0.0~7.3.1 らず コード変換処理でエラーとなる場合がある 44 システム動作環境設定再設定コマンド (hulclusterxxx -set) を使

HULFT8 for Windows/UNIX/Linux/zLinux の機能で発生する不具合について

CLUSTERPRO MC StorageSaver 2.2 for Linux パラメーターシート 第 4 版 2017 年 4 月 日本電気株式会社

Microsoft Word - ModelAnalys操作マニュアル_

Microsoft Word - OpsMgrConnectorGuide.doc

Linkexpress トラブル初期調査資料 採取コマンド使用手引書

PowerPoint プレゼンテーション

改版履歴 版数 改版日付 改版内容 /03/14 新規作成 2013/03まで製品サイトで公開していた WebSAM DeploymentManager Ver6.1 SQL Server 2012 製品版のデータベース構築手順書 ( 第 1 版 ) を本 書に統合しました 2

CLUSTERPRO MC StorageSaver 1.2 for Linux はじめての StorageSaver (vsphere 対応版 ) 2014(Mar) NEC Corporation はじめに 製品概要 監視の設定と実践 付録 おわりに

ServerView Resource Orchestrator V3.0 ネットワーク構成情報ファイルツール(Excel形式)の利用方法

CLUSTERPRO MC LogMonitor 2.4 for Linux ユーザーズガイド (SNMP トラップ送信機能)

クラスタ構築手順書

NFS On CLUSTERPRO for Linux

はしがき (1) マニュアルについて CLUSTERPRO MC ProcessSaver for Linux テンプレートガイド は ProcessSaver によるプロセス監視ソリューションを支援するための導入事例をご紹介します 本資料でご紹介する事例は 監視対象となる製品の設定ファイルの設定

Samba Install and Update Guide

PRIMERGY TX150 S6 使用上の注意

ServerView RAID Manager VMware vSphere ESXi 6 インストールガイド

ユーティリティ 管理番号 内容 対象バージョン 157 管理情報バッチ登録コマンド (utliupdt) のメッセージ出力に対し リダイレクトまたはパイプを使用すると メッセージが途中までしか出 力されないことがある 267 転送集計コマンド (utllogcnt) でファイル ID とホスト名の組

CLUSTERPRO MC RootDiskMonitor 1.1 for Windows パトロールシーク機能 インストールガイド 2013(Sep) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

譲渡人複数証明データコンバータ操作説明書 平成 26 年 6 月

無線LAN JRL-710/720シリーズ ファームウェアバージョンアップマニュアル 第2.1版

目次 レジストリの設定...2 トレーディングソフトの自動起動設定...7 VPS 自動再起動の設定

インストール手順書 Systemwalker for Symfoware Server Message Monitoring Tool 11.1

国土数値情報 XML シェープ変換ツール 操作説明書 平成 23 年 7 月 国土交通省国土政策局

<< 目次 >> 1 PDF コンバータのインストール ライセンスコードの入力 PDF にフォントを埋め込みたい場合の設定 PDF オートコンバータ EX で使用しない場合 PDF コンバータ単体で使用する場合の説明 PDF コンバータのアン

ServerView RAID Manager VMware vSphere ESXi 5 インストールガイド

ServerView RAID Manager VMware vSphere ESXi 5 インストールガイド

IBM API Connect 開発者ポータル構成ガイド 1章

WebSAM LogCollector (リリース3.3) HP-UX用マネージャ クラスタ構築ガイド

ESMPRO/ServerManager でサポートする機能について HPE WBEM プロバイダで管理する RAID システムは ESMPRO/ServerManager との連携にて アラートビューア表示 のみサポートします また エクスプレス通報サービス (MG) を合わせてお使いいただくこと

ファイルサーバー(Samba)構築ガイド

InterSafe_Sales_Guide

アップデート手順概要

Microsoft Word - VPN...[.U.K.C.hLinux doc

GHS混合物分類判定システムインストールマニュアル

1.SqlCtl クラスリファレンス SqlCtl クラスのリファレンスを以下に示します メソッドの実行中にエラーが発生した場合は標準エラー出力にメッセージを出力します (1)Connect() メソッド データベースへ connect 要求を行います boolean Connect(String

rndc BIND

PostgreSQL Plus 管理者ガイド

改 版 履 歴 版 数 改 版 内 容 新 規 作 成 MC 2.1 に 対 応 i

Transcription:

CLUSTERPRO MC ProcessSaver for Linux クイックリファレンス 第 1 版 2016 年 3 月 日本電気株式会社

目次 1 はじめに 2 pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ 3 再起動スクリプトの記述方法 4 pcheck の起動 終了 (1) コマンドラインからの起動 (2) rc からの起動 5 運用管理 (1) 監視の一時停止 再開コマンド (2) 監視状態の表示コマンド - 監視コマンドの一覧表示 - 監視ルール表示 - 監視状態表示 (3) 運用中に出力されるメッセージ (4) リトライオーバ時の対処 (5) オンライン保守手順 [ 付録 ] パラメータ設定シート P.3 P.4 P.5 P.7 P.9 P.10 P.11 P.12 P.13 P.14 P.15 P.15 P.16 P.17 P.18 P.19 P.20 P.22 2 NEC Corporation 2016

1 はじめに 本マニュアルは ProcessSaver の基本的な運用に最低限必要な設定を簡易的に記載したものです 本マニュアルでは基本的なプロセス監視機能 プロセス監視 消滅検出 自動再開 を運用する際に必要となるファイルおよびパラメータの意味や設定方法をご説明いたします なお 詳細な設定につきましては 同梱の ユーザーズガイド をご覧ください 3 NEC Corporation 2016

2 pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ pfile とは pcheck(1m) プロセス単位に定義される設定ファイルです 4 NEC Corporation 2016

(1) 基本パラメータ PARAM pcheck 全体の動作を規定する共通部情報 ##### PARAM ##### IPCKEY 0x1f000501 1 MSG_CHECK_INTERVAL 5 2 MONITOR_INTERVAL 10 3 SHM_DUMP_FILE /var/opt/ha/ps/log/pcheck_dump 4 1 2 IPCKEY... 共有メモリの key を指定します システム上で一意となる 0x00000001~0x7fffffff の数値を設定してください MSG_CHECK_INTERVAL... 内部イベントをスケジュールするタイマ値を指定します 指定値は MONITOR_INTERVAL より小さい値を設定してください 3 MONITOR_INTERVAL... プロセス監視を一定間隔で行う場合のタイマ値を指定します MSG_CHECK_INTERVAL の整数倍の値を設定してください 4 SHM_DUMP_FILE... 共有メモリのイメージを出力するファイル名を絶対パスで指定します ファイル名は 128 文字未満で設定してください 5 NEC Corporation 2016

( 続き ) PENT プロセス単位の管理情報を規定する個別部情報 ##### PENT ##### ## pname:restart shell:grace:retry_count_max:retry_over_action sampleproc:/home2/bin/restart.sh:86400:3:continue 1 2 3 4 5 各パラメータは :( コロン ) で区切ります 1 2 3 4 5 監視対象プロセス名...ps コマンド (ps -ef) で表示されたプロセス名をそのまま設定してください 再起動スクリプト名... 監視対象プロセスを起動するシェルスクリプトを絶対パスで設定します 省略時は 0 または - ( ハイフン ) を指定してください また監視プロセス起動用の rc スクリプトを直接指定することも可能です (rc スクリプトを指定した例 ): /etc/init.d/sample start GRACE 値... リトライ回数に達するまでの監視時間を指定します リトライ回数...GRACE 値内に実行するプロセスの最大再開回数を指定します リトライオーバアクション... リトライ回数に達した場合の動作を設定します 以下の動作を指定できます continue : 対象プロセス以外のプロセスを継続して監視 exit : クラスタ環境の設定により サーバ切り替えにつながる終了処理 shutdown : pcheck コマンドを終了 6 NEC Corporation 2016

(2) オプションパラメータ オプションパラメータを指定することで 対象プロセスを特定するためのキーを指定することができます オプション情報を,( カンマ ) で区切ることで複数のオプションを指定することができます オプションパラメータは省略可能です 同一名プロセスを特定する場合に有効なオプション sampleproc:/home2/bin/restart.sh:86400:3:continue:uid=503 uid=xxx...xxx には対象プロセスの uid を指定します 対象プロセスが複数存在し uid が異なる場合に指定します sampleproc:/home2/bin/restart.sh:86400:3:continue:uname=user1 uname=xxx...xxx には対象プロセスのユーザー名を指定します 対象プロセスが複数存在し ユーザー名が異なる場合に指定します sampleproc:/home2/bin/restart.sh:86400:3:continue:include_strings=keyword include_strings=xxx または include_strings=xxx&yyy&zzz...xxx yyy zzz にはプロセス名の検索条件となる文字列を指定します sampleproc:/home2/bin/restart.sh:86400:3:continue:min_proc_count=3 min_proc_count=xxx...xxx には起動プロセスの下限数を指定します 指定された数未満となった場合にプロセス消滅を検出します sampleproc:/home2/bin/restart.sh:86400:3:continue:max_proc_count=3 max_proc_count=xxx...xxx には起動プロセスの上限数を指定します 指定された数を超過した場合にプロセス消滅を検出します 7 NEC Corporation 2016

( 続き ) プロセスをグルーピングする場合に有効なオプション sampleproc1:/home2/bin/restart.sh:86400:3:continue:grouptag=group1 sampleproc2:/home2/bin/restart.sh:86400:3:continue:grouptag=group1 grouptag=xxx...xxx にはグループ監視を行う場合のグループ名を指定します 注 ) グループ監視の詳細については ユーザーズガイドを参照してください その他のオプション sampleproc:/home2/bin/restart.sh:86400:3:continue:clear_cmd=/home2/bin/clear.sh clear_cmd=xxx...xxx にはリトライオーバ時に実行するシェルスクリプトファイル名を絶対パスで指定します sampleproc:/home2/bin/restart.sh:86400:3:continue:restart_timeout=30 restart_timeout=xxx...xxx には再起動スクリプトの実行に時間がかかる場合に 監視対象プロセス毎に再起動スクリプトの実行を待ち合わせる時間を設定します 注 ) MONITOR_INTERVAL の整数倍の値を設定してください sampleproc:/home2/bin/restart.sh:86400:3:continue:restart_waittime=60 restart_waittime=xxx...xxx には監視対象プロセス毎に プロセスの再起動がエラー終了した場合の待ち合わせ時間を設定します 8 NEC Corporation 2016

3 再起動スクリプトの記述方法 再起動スクリプトは pcheck(1m) がプロセスの消滅を検出した場合に プロセスを再開するための手続きを記述したファイルです 監視対象プロセスが終了した場合に必要な処理と再起動のために必要な処理を記述してください フォーマットは通常のシェルスクリプトです 基本的な記述方式は以下となります 1 再起動スクリプトには プロセス消滅に伴う後処理を記述します ここでは stop を指定します 念のため 後処理が完了するまで sleep によって待ち合わせます 再起動スクリプト #!/bin/sh /etc/init.d/crond stop /bin/sleep 5 ( 例 ) crond の場合 1 2 プロセス起動の前処理と実際の起動処理を記述します ここでは start を指定します 念のため 開始処理が完了するまでsleepによって待ち合わせます /etc/init.d/crond start 2 /bin/sleep 5 exit 0 3 3 exit 0を記述します (ProcessSaverは再起動スクリプトの戻り値によって正常に再起動できたかどうかを判断しているため 必ずexit0で終了します ) 9 NEC Corporation 2016

4 pcheck の起動 終了 (1) コマンドラインからの起動 (2)rc からの起動 10 NEC Corporation 2016

(1) コマンドラインからの起動 コマンドラインからの ProcessSaver 起動 終了手順は以下の通りです 注 ) 下記コマンドの pfile 名には絶対パスを指定してください 起動 コマンドのフォーマット : /opt/ha/ps/bin/pcheck -f <pfile> & 例 : # /opt/ha/ps/bin/pcheck -f /var/opt/ha/ps/conf/bin/pfile & pcheck(1m) は監視を開始すると終了するまで フォアグラウンドにプロンプトが返ってこないため & を付けてバックグラウンドでコマンドを実行します 終了 コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c shutdown 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c shutdown 11 NEC Corporation 2016

(2)rc からの起動 rc ファイルから pcheck(1m) を呼び出すことで ノードの立ち上げ 立ち下げと連動して起動 終了を自動化できます rc ファイルは サンプルを参考にして作成します rc ファイルを作成したら /etc/init.d/ 配下に保存し 指定する rc のディレクトリ (/etc/rc2.d/ および /etc/rc3.d/ /etc/rc5.d) 配下にリンクします rc ファイルを使用したコマンド実行による起動と終了の手順は以下のとおりです 起動 # /etc/init.d/rcfile start サンプル :/var/opt/ha/ps/conf/src/rc_sample/rcfile #!/bin/sh # trap 1 2 3 13 15 # Environment PCHECK=/opt/HA/PS/bin/pcheck PADMIN=/opt/HA/PS/bin/padmin PFILE=/var/opt/HA/PS/conf/bin/pfile 1 : : : 'start') 該当のpfileを指定 ## You must execute on background. 2 # /usr/bin/nohup ${PCHECK} -f ${PFILE} & ;; # を外す 'stop') ${PADMIN} -f ${PFILE} -c shutdown : : : 終了 # /etc/init.d/rcfile stop 注 ) マシン起動 終了と同時に rc ファイルが実行されることを確認する場合はご使用のマシンをリブートする必要があります 12 NEC Corporation 2016

5 運用管理 (1) 監視の一時停止 再開コマンド (2) 監視状態の表示コマンド - - - 監視コマンドの一覧表示 監視ルール表示 監視状態表示 (3) 運用中に出力されるメッセージ (4) リトライオーバ時の対処 (5) オンライン保守手順 13 NEC Corporation 2016

(1) 監視の一時停止 再開コマンド プロセス監視の停止コマンド コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c stop 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c stop pfile の再読み込みコマンド コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c reload 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c reload 停止中のプロセス監視の再開コマンド コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c start 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c start 14 NEC Corporation 2016

(2) 監視状態の表示コマンド - 監視コマンドの一覧表示 /opt/ha/ps/bin/padmin -l ipckey... 共有メモリの key (system 上で一意の値 ) pfile... 監視対象の pfile 名 mypid...pcheck のプロセス ID # /opt/ha/ps/bin/padmin -l ipckey = 0x1f000303 mypid = 27913 myname = pcheck pfile = /var/opt/ha/ps/conf/bin/pfile message = start myname... 実行中のコマンド名 message の種類 message... 処理中のメッセージ ( イベント ) start プロセス監視の実行 resume startと同じ stop プロセス監視の停止 suspend stopと同じ reload pfile 再読み込み中 15 NEC Corporation 2016

( 続き ) - 監視ルール表示 padmin -f <pfile> -c show param MSG_CHECK_INTERVAL... 処理中のメッセージを確認する間隔 MONITOR_INTERVAL... 監視間隔 PFILE... 監視対象 pfile 名 MESSAGE_BOX... 処理中のイベントを表すメッセージ MONITOR_STOP_COUNT... 監視停止中のプロセス数 # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin//pfile -c show param MSG_CHECK_INTERVAL = 5 MONITOR_INTERVAL = 10 MONITOR_TRY_COUNT = 2 SHM_DUMP_FILE = /tmp/st/dump/proc_dump PFILE = /var/opt/ha/ps/conf/bin /pfile MESSAGE_BOX = start MONITOR_STOP_COUNT = 0 FAIL_PROC_COUNT = 0 ALL_PROC_COUNT = 1 FAIL_PROC_COUNT... リトライオーバとなっているプロセス数 ALL_PROC_COUNT... すべての監視プロセス数 16 NEC Corporation 2016

( 続き ) - 監視状態表示 padmin -f <pfile> -c show pent pname... 監視対象のプロセス名 pid... 監視対象プロセスID retry_count... プロセスを再起動した回数 restart_count... プロセスを再起動した累計 proc_sts... プロセスの監視状態 #/opt/ha/ps/bin/padmin -f var/opt/ha/ps/conf/bin/pfile -c show pent pname = sampleproc pid = 28073 retry_count = 0 restart_count = 0 proc_sts = AVAIL retry_over_act = continue rerun_time = -------- pent_id = 1 monitor_sts = on retry_over_act... リトライオーバとなった場合の処理 rerun_time... 再起動日時 (GRACE 値時間内での初回再起動の日時 ) pent_id...pfile の pent 部分に指定したプロセスの通番 monitor_sts...pent 単位の監視状態 17 NEC Corporation 2016

(3) 運用中に出力されるメッセージ プロセスの消滅を検出すると syslog に以下のようなメッセージが出力されますので 障害の原因を解析願います プロセスの消滅を検出したメッセージ プロセスの再起動を開始したメッセージ プロセスの監視を開始したメッセージ Process[ < プロセス名 >, pid=<xxx> ] Down Jan 18 13:34:43 xxx pcheck[7750]: Process [sampleproc,pid=16133] Down Jan 18 13:34:43 xxx pcheck[7750]: Try to restart (sampleproc) プロセスの消滅を検出すると pfile に指定された再起動スクリプト等を実行しプロセスの再起動を開始します Jan 18 13:35:04 xxx pcheck[7750]: (sampleproc,pid=8107) Up Try to restart (< プロセス名 >) (< プロセス名 >, pid=<xxx>) Up プロセスが起動していることを確認した後 pcheck(1m) によってプロセス監視を開始します pfile に再起動スクリプト等を指定していない場合 プロセスの再起動は行われません プロセスが動作していないことを検出したメッセージ Set pid fail (< プロセス名 >) Jan 18 13:35:04 xxx pcheck[7750]: Set pid fail (sampleproc) リトライオーバを検出したメッセージ (< プロセス名 >) RETRY_OVER:< リトライオーバアクション > Jan 18 13:39:25 xxx pcheck[7750]: (sampleproc) RETRY_OVER:CONTINUE 18 NEC Corporation 2016

(4) リトライオーバ時の対処 pcheck が 対象プロセスの再起動に pfile で指定されたリトライ回数失敗するとリトライオーバとなり監視を停止します プロセス監視の再開は以下の手順で行います pfile に指定したリトライオーバアクションが continue の場合は pcheck は起動状態で監視を停止していますので 以下のコマンドによりプロセス監視を再開することができます /opt/ha/ps/bin/padmin -f <pfile> -c reload # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c reload リトライオーバアクションが shutdown 又は exit の場合は pcheck が消滅していますので pcheck コマンドによりプロセス監視を再開してください /opt/ha/ps/bin/pcheck -f <pfile> & # /opt/ha/ps/bin/pcheck -f /var/opt/ha/ps/conf/bin/pfile & 19 NEC Corporation 2016

(5) オンライン保守手順 監視対象プロセスの終了 再起動は以下の手順で行います 1 プロセス監視の一時停止 コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c stop 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c stop 2 対象プロセスを終了 再起動 実行形式の変更によるプロセスの再起動等のメンテナンス作業を行うことが可能です 3 pfile の再読み込み ( 初期化 ) コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c reload 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c reload ProcessSaver は対象プロセスの PID によって監視を行っているため 保守によって再起動を行う場合は pfile の再読み込みを行わなければなりません 20 NEC Corporation 2016

( 続き ) 4 プロセス監視の再開 コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c start 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c start 手順 3 4 の代わりに以下のコマンドによっても プロセス監視の再開が行えます コマンドのフォーマット : /opt/ha/ps/bin/padmin -f <pfile> -c restart 例 : # /opt/ha/ps/bin/padmin -f /var/opt/ha/ps/conf/bin/pfile -c restart pfile を変更した場合には reload を使用して pfile の再読み込みが必要となります 21 NEC Corporation 2016

[ 付録 ] パラメータ設定シート ( 例 ) 以下のパラメータシートによって pfile のパラメータを容易に設定することができます 現在記入している値は例です 未記入のシートをプリントアウトしてご利用ください プロセス監視 pfile 設定項目 pfile 名 運用形態 PARAM 部 /var/opt/ha/ps/conf/bin/pfile pcheck 起動 共有メモリキー 項目パラメータ名設定値備考 IPCKEY メッセージチェックインター バル MSG_CHECK_INTERVAL 5 0x1f000501 共有メモリのキー (0x00000001~ 0x7fffffff) 内部イベントチェック間隔 ( 秒 ) モニタインターバル MONITOR_INTERVAL 10 プロセス監視間隔 ( 秒 ) 共有メモリダンプファイル SHM_DUMP_FILE /var/opt/ha/ps/log/pcheck_dump 共有メモリイメージ出力ファイル PENT 部 監視対象プロセス名再起動スクリプト名 GRACE 値 リトライ回数 リトライオーバアクション 備考 sampleproc /home2/bin/restart.sh 86400 3 continue 22 NEC Corporation 2016

パラメータ設定シート プロセス監視 pfile 設定項目 pfile 名運用形態 PARAM 部項目 パラメータ名 設定値 備考 共有メモリキー IPCKEY 共有メモリのキー (0x00000001~0x7fffffff) メッセージチェックインターバル MSG_CHECK_INTERVAL 内部イベントチェック間隔 ( 秒 ) モニタインターバル MONITOR_INTERVAL プロセス監視間隔 ( 秒 ) 共有メモリダンプファイル SHM_DUMP_FILE 共有メモリイメージ出力ファイル PENT 部 監視対象プロセス名再起動スクリプト名 GRACE 値 リトライ回数 リトライオーバアクション 備考 23 NEC Corporation 2016