監視アラート対応手順書(FOR LINUX)

Similar documents
監視アラート対応手順書(FOR LINUX)

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) に よるプロセス監視の基本的な動作について記載したものです (1) 商標および商標登録 Linux は Linus Torvalds 氏の米国およ

はしがき 本書は CLUSTERPRO MC ProcessSaver 1.0 for Linux ( 以後 ProcessSaver と記載します ) と CLUSTERPRO X 3.1 for Linux ( 以後 CLUSTERPRO と記載します ) を組み合わせて フェイルオーバクラスタ

CLUSTERPRO MC ProcessSaver 2.2 for Linux 構築ガイド 2017(Oct) NEC Corporation 責任範囲 適用範囲 概要 事前準備 クラスター設定 動作確認

はしがき (1) マニュアルについて CLUSTERPRO MC ProcessSaver for Linux Web サーバー監視機能テンプレートガイド は ProcessSaver による Web サーバー監視時のプロセス監視ソリューションを支援するための導入事例をご紹介します 本資料でご紹介す

ネットワークユーティリティ説明書

スライド 1

Confidential

CLUSTERPRO MC ProcessSaver for Linux クイックリファレンス 第 1 版 2016 年 3 月 日本電気株式会社

OWI(Oracle Wait Interface)の概要

PostgreSQL 9.0 のレプリケーションを使ってみよう SRA OSS, Inc. 日本支社佐藤友章 2010/12/11 Copyright 2010 SRA OSS, Inc. Japan All rights reserved. 1

CLUSTERPRO for Linux MySQL HowTo

ProcessSaver WebEdition テンプレートガイド

Lets移行プラットホーム

Cuoreテンプレート

Nagios XI - SNMPでのLinux監視

目次 第 1 章 環境構築 システム概要 ロードバランサ ジーンコードサーバー コンテンツサーバー (PC サイトサーバー ) コンテンツサーバー (PC サイトサーバー ) DNS... 6

Microsoft Word - Œ{Ł¶.doc

目次 1. はじめに ご利用条件 証明書配付システムの停止時間 実施手順 電子証明書の取得手順 Windows 証明書ストアへの電子証明書インポート手順 電子証明書インポート完了確認.

リバースプロキシー (シングル構成) 構築手順

CLUSTERPRO による MariaDB の HA クラスタ動作検証 第 1 版 日本電気株式会社クラウドプラットフォーム事業部 CLUSTERPRO グループ

目次 1 はじめに 2 pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ 3 再起動スクリプトの記述方法 4 pcheck の起動 停止 (1) コマンドラインからの起動 (2) rc からの起動 5 運用管理 (1) 監視の一時停止 再開コマンド (2) 監視状態

9. システム設定 9-1 ネットワーク設定 itmはインターネットを経由して遠隔地から操作を行ったり 異常が発生したときに電子メールで連絡を受け取ることが可能です これらの機能を利用するにはiTM 本体のネットワーク設定が必要になります 設定の手順を説明します 1. メニューリスト画面のシステム設

PostgreSQL Plus 管理者ガイド

CLUSTERPRO MC ProcessSaver 2.3 for Windows ユーザーズガイド ( コマンド編 ) 2018(Jun) NEC Corporation はじめに コマンドリファレンス メッセージ一覧

untitled

ServerView ESXi CIM Provider VMware vSphere ESXi 6.5 インストールガイド

内容環境... 3 対応 OS の変更... 3 関連アプリケーションの追加... 4 機能追加... 5 グラフ機能... 5 稼働率... 8 サービス一括削除 自動復旧エスカレーションコマンド AWS カスタムメトリックス監視 NRPE 任意監視... 11

Microsoft Word - PG-140D投込_最終版_.doc

PowerPoint プレゼンテーション

107号_表紙_表示用

サイボウズ Office 10「インストール」

ポップアップブロックの設定

目次 1 はじめに 2 Pfile の設定パラメータ (1) 基本パラメータ (2) オプションパラメータ 3 再起動スクリプトの記述方法 4 Pcheck の起動 終了 (1) ProcessSaver コンソール (GUI) からの起動 (2) PcheckRunList からの起動 (3) コ

HeartCoreインストールマニュアル

ServerView ESXi CIM Provider VMware vSphere ESXi 6.5 インストールガイド

PRIMERGY RX300S6 におけるクラスタ製品「DB/Control」と「DBC/APKeeper」の動作検証報告

Microsoft Word - ランチョンプレゼンテーション詳細.doc

別紙 : 検証環境の構築手順 ( 章 ) 1. サーバ設定 1.1 IP アドレス設定 サーバは以下の 6 台を用いる pgpool-ii サーバ 2 台 DB サーバ 3 台 上位サーバ 1 台 OS は全サーバで CentOS 6.4 x86_64 とする pgpool-ii のサー

PowerPoint プレゼンテーション

HA8000シリーズ xJモデルBMCネットワークにおける注意事項

利用約款別紙 SkyCDP for AWS 基本サービス仕様書 この仕様書は SkyCDP for AWS の基本サービスに関する内容 方法について記述したものです 尚 SkyCDP for AWS オプションサービスをご利用のお客様は各 SkyCDP for AWS オプションサービスのご契約内容

PSCHG000.PS

(H8) 1,412 (H9) 40,007 (H15) 30,


F1 P P19 160

2012年1月号 061158/表2対向


管理サイト操作マニュアル Version.1.1. デジアナコミュニケーションズ株式会社

変更履歴 Version 日付 変更内容 /8/23 初版作成 /1/17 他ドキュメントのバージョンアップに伴い版数のみ更新 /6/13 他ドキュメントのバージョンアップに伴い版数のみ更新 /1/15 動作環境でインストールするソ

OpenAM 9.5 インストールガイド オープンソース ソリューション テクノロジ ( 株 ) 更新日 : 2013 年 7 月 19 日 リビジョン : 1.8

リバースプロキシー(冗長構成)構築手順

ProScan for Mailserverバージョン6

コミュニティ運営とレンタルサーバ 法林浩之

MIRACLE MH for SNMP サポート SLA( サービスレベルアグリーメント ) ML-CS-0747 本書は サイバートラスト株式会社 ( 以下 サイバートラスト ) が MIRACLE MH for SNMP サポート ( 以下当サポートサービス ) の内容について説明するものである

障害管理テンプレート仕様書

intra-mart ワークフローデザイナ

STARTプログラム.indd

ServerView ESXi CIM Provider / ServerView RAID Core Provider VMware vSphere ESXi 6.5 / 6.7 インストールガイド


人間石川馨と品質管理


CLUSTERPRO MC ProcessSaver 2.1 for Windows 構築ガイド 2016(Mar) NEC Corporation はじめに 責任範囲 適用範囲 概要 事前準備 クラスタ設定

2013 5

1000

CLUSTERPRO MC ProcessSaver 1.0 for Windows 構築ガイド 2012(Sep) NEC Corporation はじめに責任範囲適用範囲概要事前準備クラスタ設定

mr0605.indd

MK14may_all.pdf

no May

広報2007年05月号-20p.indd

mr0805.indd

Si-R30取扱説明書

クイックマニュアル(利用者編)

FUJITSU Cloud Service for OSS 「システム監視サービス」ご紹介資料

PDF


ポップアップブロックの設定

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows FAQ 集 2013(Mar) NEC Corporation 導入に関する質問 運用に関する質問 動作環境に関する質問


目    次

目次 1. アプリケーション登録 利用設定 CardDAV 設定 デフォルトアカウント設定 アプリケーションのログイン ログアウト KDDI SMARTアドレス帳 にログインする KDDI SMARTアドレス帳 にログイン

DRサイトを作って耐障害性を高めたい:IDCFクラウド活用マニュアル

ServerView ESXi CIM Provider VMware vSphere ESXi 6.0 インストールガイド

ServerView ESXi CIM Provider / ServerView RAID Core Provider VMware vSphere ESXi 6.0 インストールガイド

Microsoft PowerPoint - ambp-syoukai.ppt [互換モード]

PostgreSQL

Microsoft Word - HAクラスタ構築手順書.doc

構成管理記録テンプレート仕様書

インストーラー 管理番号 内容 対象バージョン 230 HULFT がすでにインストールされているパスに対してサイレントインストールを実行すると インストールされていた HULFT の動作環境が不正な状態になる 7.3.0~7.3.1 ユーティリティ 管理番号 内容 対象バージョン 231 管理情報


ServerView RAID Manager VMware vSphere ESXi 5 インストールガイド

目次 はじめに フリープラグインリスト マイグレーションツール Cobalt Migration Utility Web サーバーの帯域制御プラグイン データベースプラグイン

SonicWALL サーバ証明書 2048bit 対応ファームウェア アップデート手順書 PROシリーズ(G4製品)版

クラスタ構築手順書

スライド 1

本マニュアルに記載された内容は 将来予告なしに一部または全体を修正及び変更することがあります なお 本マニュアルにこのような不備がありましても 運用上の影響につきましては責任を負いかねますのでご了承ください 本マニュアルの一部 あるいは全部について 許諾を得ずに無断で転載することを禁じます ( 電子

CLUSTERPRO MC ProcessSaver 1.0 for Windows ユーザーズガイド ( コマンド編 ) 2012(Sep) NEC Corporation はじめに コマンドリファレンス メッセージ一覧

GenieATM 6300-T / 6200-T シリーズ 1. 基本的な機器オペレーションのために 1-1. 機器への接続 機器への接続方法は 以下の 2 通りがあります シリアルポートを使用してログインする LAN 経由で Telnet または SSH を使用して仮想 Interface からロ

目次 1. はじめに 本文書の目的 前提条件 略語 事前準備 ホスト名の名前解決 Linux 版パッケージ システム要件 ソフトウェア要件 パッケージ構成

Transcription:

監視アラート対応手順書 (FOR LINUX) プロセス監視アラート対応手順 Version.1.0 株式会社クララオンライン 2014/07/16

2 監視アラート対応手順書 (FOR LINUX) 更新履歴 改定日版改定者改定内容 2014/7/16 1.0 クララオンライン新規作成

3 監視アラート対応手順書 (FOR LINUX) 目次 1. 監視項目... 4 1.1. 監視一覧 ( 基本内容 )... 4 2. アラートメール起点の対応フロー... 4 3. お客様へのご連絡... 5 4. 障害時連絡レベル... 5 4.1. 障害と連絡方法... 5 4.2. 電話連絡方法... 5 4.3. 連絡内容... 5 4.4. メール連絡時の本文内容 ( テンプレート )... 6 5. プロセス監視アラート対応手順... 7 5.1. httpd の場合... 7 5.2. mysqld の場合... 8 5.3. postgre の場合... 8 5.4. crond の場合... 9

4 監視アラート対応手順書 (FOR LINUX) はじめに Linux 向けシステムのアラートが発生した際の操作手順を記載致します 1. 監視項目 1.1. 監視一覧 ( 基本内容 ) 監視概要監視項目監視閾値監視間隔 / リトライ / 試行回数対応手順 httpd 手順へ プロセス監視 mysqld postgres プロセス稼働状態 手順へ手順へ crond 手順へ 2. アラートメール起点の対応フロー

5 監視アラート対応手順書 (FOR LINUX) 3. お客様へのご連絡 障害検知時即時連絡 復旧時報告 記録 メール連絡致します メール報告致します メール報告致します 手順書通りの対応にて復旧出来ない場合は 電話連絡を行います 4. 障害時連絡レベル 4.1. 障害と連絡方法 連絡レベル レベル内容 連絡方法 1 手順書通りの対応にて復旧 メール連絡致します 2 手順書通りの対応に復旧不可 電話連絡 ( 連絡先一覧記載連絡先 ) メール連絡致します 4.2. 電話連絡方法 連絡先 連絡回数 予め指定された電話番号へ連絡を行います 予め指定された電話番号に連絡が取れない場合 連絡順序通りに 2 周連絡を行います 予め指定された電話番号へ 2 周しても連絡が取れない場合 メールにて状況報告を行うのみと致します 留守電 予め指定された電話番号に連絡して 留守電に切り替わった場合 留守電に 3.3 連絡内容 を報告致しま す 4.3. 連絡内容 1 2 3 4 5 6 障害発生 ( 検知 ) 時間対象ホスト名対象 IP アドレス検知内容現象と対応内容サービス影響

6 監視アラート対応手順書 (FOR LINUX) 4.4. メール連絡時の本文内容 ( テンプレート ) クララオンライン障害受付センターでございます 下記のとおり弊社の監視システムによる発報がございましたので 報告致します 対象ホスト名 : 対象 IP アドレス : 発報時間 : yyyy 年 mm 月 dd 日 HH 時 MM 分 復旧時間 : yyyy 年 mm 月 dd 日 HH 時 MM 分 発報内容 : < 例 :port_http_dhit> 対応内容 : 対応前連絡では空欄 対応後は内容を記載 < 例 httpd 再起動 >>

7 監視アラート対応手順書 (FOR LINUX) 5. プロセス監視アラート対応手順 5.1. httpd の場合 1. 状態確認 # ps aux grep httpd 以下のように httpd のプロセスが立ちあがっているかを確認致します root 1383 0.0 1.0 365652 10908? Ss May20 1:05 /usr/sbin/httpd root 13169 0.0 0.0 107460 948 pts/0 S+ 14:33 0:00 grep httpd apache 15293 0.0 3.4 466960 34720? S Jun11 0:50 /usr/sbin/httpd apache 16578 0.0 3.7 470968 38500? S Jun11 0:48 /usr/sbin/httpd apache 22387 0.0 3.7 468608 38360? S Jun10 1:25 /usr/sbin/httpd apache 24777 0.0 3.5 466836 36704? S Jun10 1:22 /usr/sbin/httpd apache 25829 0.0 3.3 466824 34304? S Jun12 0:27 /usr/sbin/httpd apache 26598 0.0 3.2 467104 32960? S Jun12 0:29 /usr/sbin/httpd apache 26680 0.0 3.1 466560 32420? S Jun12 0:27 /usr/sbin/httpd apache 27185 0.0 3.5 467088 36576? S Jun10 1:17 /usr/sbin/httpd apache 28770 0.0 3.6 467076 37348? S Jun10 1:17 /usr/sbin/httpd apache 31017 0.0 3.3 467080 34368? S Jun12 0:21 /usr/sbin/httpd apache 31473 0.0 3.4 466564 35708? S Jun10 1:10 /usr/sbin/httpd 2. ブラウザよりページの確認 http://ip アドレス / 上記 1 及び 2 で問題がなく なお且つリカバリーメールを確認した場合 以下手順には進まず 連絡 ( メール及び電話 ) のみと致します 3.apache 再起動 # /etc/init.d/httpd restart 4. apache 再起動後 上記 1 及び 2 の手順にて プロセス状態を確認致します 4-1. プロセス状態が正常及びブラウザからのページ確認が正常の場合 メールにて復旧連絡を行います 4-2. プロセス状態若しくはブラウザの確認にて異常の場合 電話及びメールにて状況報告を行います 備考 状況についてメール及び電話にてお客様へ連絡致します

8 監視アラート対応手順書 (FOR LINUX) 5.2. mysqld の場合 1. 状態確認 # ps aux grep mysqld mysqld のプロセスが立ちあがっているかを確認致します root 1104 0.0 0.1 106064 1496? S May20 0:00 /bin/sh /usr/bin/mysqld_safe --datadir=/var/lib/mysql --socket=/var/lib/mysql/mysql.sock --pid-file=/var/run/mysqld/mysqld.pid --basedir=/usr --user=mysql mysql 1260 0.1 5.5 719508 56500? Sl May20 64:59 /usr/libexec/mysqld --basedir=/usr --datadir=/var/lib/mysql --user=mysql --log-error=/var/lib/mysql/test.clara.ne.jp.err --pid-file=/var/run/mysqld/mysqld.pid --socket=/var/lib/mysql/mysql.sock --port=3306 root 13189 0.0 0.0 107464 952 pts/0 S+ 14:35 0:00 grep mysqld 上記 1 で問題がなく なお且つリカバリーメールを確認した場合 以下手順には進まず 連絡 ( メール及び電話 ) のみと致します 2.mysqld 再起動 # /etc/init.d/mysqld restart 3. mysqld 再起動後 上記 1 及び 2 の手順にて プロセス状態を確認致します 4-1. プロセス状態が正常の場合 メールにて復旧連絡を行います 4-2. プロセス状態が異常の場合 電話及びメールにて状況報告を行います 備考 5.3. postgre の場合 1. 状態確認 # ps aux grep postgre postgre のプロセスが立ちあがっているかを確認致します postgres 3391 1 4 23:11 pts/0 00:00:00 /usr/pgsql-9.0/bin/postgres postgres 3392 3391 0 23:11? 00:00:00 postgres: logger process postgres 3394 3391 0 23:11? 00:00:00 postgres: writer process postgres 3395 3391 0 23:11? 00:00:00 postgres: wal writer process postgres 3396 3391 0 23:11? 00:00:00 postgres: autovacuum launcher process postgres 3397 3391 0 23:11? 00:00:00 postgres: archiver process postgres 3398 3391 0 23:11? 00:00:00 postgres: stats collector process 上記 1 で問題がなく なお且つリカバリーメールを確認した場合 以下手順には進まず 連絡 ( メール及び電話 ) のみと致します 2.postgresql 再起動 # /etc/init.d/postgresql start 3. postgresql 再起動後 上記 1 及び 2 の手順にて プロセス状態を確認致します 3-1. プロセス状態が正常の場合 メールにて復旧連絡を行います 3-2. プロセス状態が異常の場合 電話及びメールにて状況報告を行います 備考

9 監視アラート対応手順書 (FOR LINUX) 5.4. crond の場合 1. 状態確認 # ps aux grep crond 以下のように cron のプロセスが立ちあがっているかを確認致します root 13253 0.0 0.1 117300 1268? Ss 14:38 0:00 crond 上記 1 で問題がなく なお且つリカバリーメールを確認した場合 以下手順には進まず 連絡 ( メール及び電話 ) のみと致します 2.crond 再起動 # /etc/init.d/crond start 3. crond 再起動後 上記 1 及び 2 の手順にて プロセス状態を確認致します 3-1. プロセス状態が正常の場合 メールにて復旧連絡を行います 3-2. プロセス状態が異常の場合 電話及びメールにて状況報告を行います 備考