Microsoft PowerPoint - OSS運用管理勉強会資料_ a.pptx

Similar documents
スライド 1

Symantec AntiVirus の設定

X-MON 3.1.0

1. はじめに 本書は OSS の統合監視ソフトウェア Zabbix を使用して IBM Flex System の障害検知を行う検証を実施 した際の報告書です IBM Flex System ではシャーシ全体を管理するための CMM Chassis Manager Module が標準で搭載さ れ

スライド 1

MIRACLE MH for SNMP サポート SLA( サービスレベルアグリーメント ) ML-CS-0747 本書は サイバートラスト株式会社 ( 以下 サイバートラスト ) が MIRACLE MH for SNMP サポート ( 以下当サポートサービス ) の内容について説明するものである

スライド 1

日本 PostgreSQL ユーザ会第 28 回しくみ + アプリケーション勉強会 Zabbix を使って PostgreSQL を監視してみよう 2014 年 2 月 1 日 TIS 株式会社中西剛紀 (Yoshinori Nakanishi)

PowerPoint プレゼンテーション

9 WEB監視

BOM for Windows Ver.6.0 リリースノート

X-MON3

インストーラー 管理番号 内容 対象バージョン 230 HULFT がすでにインストールされているパスに対してサイレントインストールを実行すると インストールされていた HULFT の動作環境が不正な状態になる 7.3.0~7.3.1 ユーティリティ 管理番号 内容 対象バージョン 231 管理情報

目次 1. 概要 動作環境

WebSAM System Navigator JNS isadmin SNMP Trap 連携設定手順書 NEC 2012 年 12 月

シナリオ1:ハードウェア異常監視①(メール通知等の設定)

マニュアル訂正連絡票

PowerPoint プレゼンテーション

商用監視ソフトウェアユーザの Zabbix 移行へ朗報 Zabbix Event Viewer のご紹介 【本邦初公開】

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

BOM for Windows Ver

システムインテグレータのIPv6対応

McAfee Application Control ご紹介

intra-mart EX申請システム version.7.2 事前チェック

運用統合ソフトウェア 2014/6/4 ミラクル リナックス株式会社 大和 一洋 Copyright MIRACLE LINUX CORPORATION All rights reserved

BOM for Windows Ver.6.0 SR2 Rollup Package リリースノート

アジェンダ クラスタリングとは 今回の構成 DRBD Zabbix 等の構成ソフトウェア Zabbix2.0 新機能 構築方法 バックアップについて 参考資料 2

ESMPRO/ServerManager Ver. 6 変更履歴

KiwiSyslogServer/KiwiLogViewer製品ガイド

ライフサイクル管理 Systemwalker Centric Manager カタログ

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right

ソフトウェアの説明

OSS 運用監視ツールトラブル事例あるある集 ログ監視を行う際に 知っておくべき トラブル事例 2017/06/07 ミラクル リナックス株式会社テクニカルアライアンス部竹村隆吉 公開 Copyright MIRACLE LINUX CORPORATION. All rights reserved.

KSforWindowsServerのご紹介

Zabbix入門-勉強会資料_

Microsoft PowerPoint - kiwi_productguide v9_rev2.7.ppt

ServerView Agents 補足情報

TFTP serverの実装

アジェンダ 商用監視ツールとの併用方法 商用監視ツールとの併用検証結果 その他のツールとの連携 - ジョブコントローラー - 監視コンソール 2

ESET Mobile Security V4.1 リリースノート (Build )

Webセキュリティサービス

本資料の内容は マイクロソフトの公式見解を基にはしていますが あくまでも私の経験に基づく個人見解です マイクロソフトの公式見解ではない部分もありますので よろしくお願いします 1

Mobile Access簡易設定ガイド

zabbix エージェント インストールマニュアル [Windows Server] 第 1.2 版 2018 年 05 月 18 日 青い森クラウドベース株式会社

PowerPoint Presentation

更新履歴 No 更新箇所版数日付 1 第一版作成 /12/28 2 一部画像差し替え 誤字修正 /02/09 2

<48554C46545F F A5490E08E9197BF2E786C73>

使用する前に

Microsoft Word - ssVPN MacOS クライアントマニュアル_120版.doc

クエリの作成が楽になるUDF

SAMBA Stunnel(Windows) 編 1. インストール 1 セキュア SAMBA の URL にアクセスし ログインを行います xxx 部分は会社様によって異なります xxxxx 2 Windows 版ダウンロード ボ

HDC-EDI Manager Ver レベルアップ詳細情報 < 製品一覧 > 製品名バージョン HDC-EDI Manager < 対応 JavaVM> Java 2 Software Development Kit, Standard Edition 1.4 Java 2

新バージョン! Zabbix 2.2 と検証結果のご紹介 SRA OSS, Inc. 日本支社山本博之 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 1

スライド 1

2017/8/2 HP SiteScope software 監視機能対応表 この監視機能対応表は HP SiteScope software v11.33) に対応しています モニタ モニタ説明 モニタ説明 SiteScope for Windows SiteScope for Linux ネット

IBM Proventia Management/ISS SiteProtector 2.0

自己紹介 指崎則夫 ( さしざきのりお ) SCUGJ 運営スタッフ Microsoft MVP

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

現象 3 仮想マシン起動時に イベントログ ( システムログ ) に以下の警告イベントが登録される 種類 : 警告ソース :VMSMP イベント ID:27 " 任意の仮想マシン名 " のネットワーキングドライバーが読み込まれましたが サーバーからの別のバージョンが含まれています サーバーバージョン

PC にソフトをインストールすることによって OpenVPN でセキュア SAMBA へ接続することができます 注意 OpenVPN 接続は仮想 IP を使用します ローカル環境にて IP 設定が被らない事をご確認下さい 万が一仮想 IP とローカル環境 IP が被るとローカル環境内接続が行えなくな

iRMC S4 ご使用上の留意・注意事項

SigmaSystemCenter 仮想マシンサーバ(ESX)のIPアドレス変更手順(SSC3.0~3.5u1)

ServerView Operation Manager補足情報

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

Windows Server 用 HDJ-HSU シリーズアンロックユーティリティ SHGate Service 取扱説明書 SHGate Service は サーバー機に接続されたセキュリティハードディスク HDJ-HSU シリーズ にパスワードを登録することで サーバー起動時や HDJ-HSU

管理対象クライアント端末のログを管理画面で日時 端末名等により複合検索を行える機能を有すること 外部記億媒体の使用ログを CSV 形式で出力する機能を有すること 外部記億媒体の未使用期間 最終使用クライアント端末 最終使用ユーザー名を把握できること 1.3 階層管理機能 - 外部記憶媒体使用設定権限

/ COMBINATION 入出力の状態 バッテリ状態などをリアルタイムで確認できます 停電などのイベント発生時および一定時間ごとの の状態を履歴として記録し表示できます Webブラウザ またはTelnet 端末を使用して, 遠隔からの状態確認や設定変更ができます Java Web Start また

1. 概要 この章では HDE Controller X LG Edition をお使いの方に向けて LGWAN 接続に特化した設定の説明をします HDE Controller X LG Edition 以外の製品をご利用のお客様はこの章で解説する機能をお使いになれませんのでご注意ください 452

PowerPoint Presentation

レベルアップ詳細情報 < 製品一覧 > 製品名 バージョン < 追加機能一覧 > 管理番号 内容 説明書参照章 カナ文字拡張対応 < 改善一覧 > 管理番号 内容 対象バージョン 説明書参照章 文字列のコピー ペースト改善 ~ 子画面の表示方式 ~ 履歴の詳細情報 ~ タブの ボタン ~ 接続時の管

スライド 1

<4D F736F F D20837D836A B5F93C192E88C AC888D593FC97CD5F2E646F63>

国立国会図書館サーチとのOAI-PMH連携時に障害となるポイント

SAMBA Stunnel(Mac) 編 1. インストール 1 セキュア SAMBA の URL にアクセスし ログインを行います xxxxx 部分は会社様によって異なります xxxxx 2 Mac OS 版ダウンロー

Linux Support Service

更新履歴 TonerSaver3 Version 年 02 月 24 日新機能及び変更点 HP PCL6 でイメージ印刷時に R と B が稀に入れ替わる動作を改善 (#1158) OKI C810/C8600 でイメージの R と B が稀に入れ替わる動作改善 (#115

CLUSTERPROXSingleServerSafe SingleServerSafe ご紹介 2007 年 10 月

スライド 1

Time Server Pro. TS-2910 リリースノート お客様各位 2019/09/13 セイコーソリューションズ株式会社 Time Server Pro.(TS-2910/TS-2912) システムソフトウェアリリースノート Ver2.1.1 V2.2 変更点 Version 2.2 (

スライド 1

平成 30 年度需要家側エネルギーリソースを活用したバーチャルパワープラント構築実証事業 (A 事業 ) 東京電力パワーグリッド株式会社関西電力株式会社 2019 年 3 月

表紙

BOM for Windows Ver

Red Hat Enterprise Linuxのcron(8)デーモンにデフォルト定義されたtmpwatch命令の動作による、WebOTXのトラブル対処方法

アプリケーション インスペクションの特別なアクション(インスペクション ポリシー マップ)

バックアップについての注意点 自動バックアップ設定後も 正常にデータが保管されているか定期的に必ず確認してください 定期的に必ず確認してください 設定後であっても様々な理由で突然バックアップが失敗していることもあるためです 複数の場所や媒体に定期的に保管することを強くおすすめします! 特に同じ建屋内

1. 検証概要 目的及びテスト方法 1.1 検証概要 Micro Focus Server Express 5.1 J の Enterprise Server が提供する J2EE Connector 機能は JCA 仕様準拠のコンテナとして多くの J2EE 準拠アプリケーションサーバーについて動作

外部向け資料作成にあたって

winras.pdf

FUJITSU Cloud Service for OSS 認証サービス サービス仕様書

Windows 10 のインストール Windows 10 の Technical Preview(Build 9926) の日本語版が 2015 年 1 月末に公開され 以後着々とアップグレードが行われ 遂に製品版は 2015 年 7 月 29 日から発売された 発売後 1 年間は Windows

スライド 1

X-MON 3.2.0

Microsoft Word - ManagerIPChange.doc

変更点

9. システム設定 9-1 ネットワーク設定 itmはインターネットを経由して遠隔地から操作を行ったり 異常が発生したときに電子メールで連絡を受け取ることが可能です これらの機能を利用するにはiTM 本体のネットワーク設定が必要になります 設定の手順を説明します 1. メニューリスト画面のシステム設

インストール ダウンロード Infragistics Windows Forms 修正項目 ID 修正日 コンポーネント カテゴリ 説明 言語 /5/17 WinCalendarInfo バグ修正 カレンダーの情報を変更すると予定がなくなる問題 EN /0

Python によるジオプロセシング スクリプト入門

21 システムプロパティ情報設定画面での入力エラー時の画面表示の改善 - 22 EDI Base JOB リレーション情報登録画面での表示項目の変更 - 23 集信後ジョブもしくは配信前ジョブが変更された場合の業務情報詳細画面でのダイアログメッセー - ジの追加 24 インストール時に実行する in

Microsoft PowerPoint - Module_pub_ _v1.02.ppt

Transcription:

OSS 運 管理勉強会商用統合監視ソフトウェアからの移 事例と HP サーバーの HW 監視 2013 年 11 月 19 日

Agenda HP サーバの HW 監視 (10 分 ) 商用統合監視 SW からの移 事例 (15 分 ) QA(5 分 ) 2

HP サーバの HW 監視

Zabbix と HW 監視 Zabbix はアプリケーションからハードウェアまで一括して監視できる ただし Zabbix で HW を監視するのは大変 App Middleware Zabbix Server OS MIB の解析 量のアイテム トリガーの作成障害試験. Hardware 4

MIRACLE ZBX HP サーバ用監視テンプレートによる受信 どのホストで何が起きたかがすぐにわかる SNMP Trap 送信元ホスト名を表示 障害内容の概要を表示 Phisical Drive Status Change (3046) on zab460l Logical Drive Status Change (3034) on zab460l 5

MIRACLE ZBX HP サーバ用監視テンプレートによる受信 詳細な障害箇所も Zabbix から確認 SNMP Trap 全体を Zabbix 上に表示 Port 1I Box 1 Bay 2 failed 6

MIRACLE ZBX HP サーバ用監視テンプレートによる受信 500 以上の SNMP Trap に対応したアイテムとトリガーを登録済み 未登録の SNMP Trap を受信しても重度の障害として通知 7

SNMP Trap 受信方式 Zabbix 1.8でもZabbix 2.0でも利 できます snmptrapdから呼び出されたスクリプトがzabbix_senderコマンドを実 します Zabbix サーバ 監視対象 HW/SW SNMP Trap snmptrapd スクリプト ( テンプレート付属 ) snmptrapd が SNMP Trap 受信時にスクリプトを呼び出す スクリプト中で Zabbix_Sender コマンドを実 し Zabbix サーバに通知する Zabbix サーバ 8

テンプレートの構成 スクリプト Zabbix サーバ テンプレート zabbix_sender s < 送信元 IP の逆引き結果 > k <MIB オブジェクト名 > o <SNMP Trap のデータ全て > 紐づけ 値として保存 コマンド引数 zabbix_sender s < ホスト > k < キー > o < 値 > SNMP Trap 送信元ホストの障害として通知 アイテムとトリガーは 1 対 1 に対応 アイテム トリガー キー値 CPQIDA-MIB_cpqDa2PhyDrvStatusChange CPQIDA-MIB_cpqDa2LogDrvStatusChange CPQNIC-MIB_cpqNic2RedundancyIncreased CPQNIC-MIB_cpqNic3RedundancyReduced 名前 深刻度 Physical Drive Status Change (3003) 致命的 Logical Drive Status Change (3001) 致命的 NIC Redundancy Increased Trap (18007) 情報 NIC Redundancy Reduced Trap (18014) 重度 9

商用統合監視 SWとZabbixの機能差分 Zabbixへ移 をしようとすると 困った! 旧システムで使用していた監視 SW の機能がない! 1. 過去アラームのローカル出 機能がない 2. 取得したリソース値のローカル出 機能がない 3. ログ SNMP Trap 内のメッセージを抽出し イベントやアクションに 反映ができない 作りこみで対応 4. アラーム抑止の時間リセット機能がない 5. アクションがテンプレート管理ではない 6. 監視条件に優先順位がないため すべて排他の条件にしなければならない 工夫次第で何とかなる! 11

4. アラーム抑止の時間リセット機能がない除外期間と除外解除期間 指定期間内にログ出 された重複アラームを抑止し 一定期間超過後にリセットする機能 除外期間 期間を指定 ( 例 :2 分間で条件にマッチするエラーが複数 でても 最初の のみアラームとする ) 除外解除周期 初回アラームから指定時間超過後に 抑止をリセット ( 例 : 初回アラームから 15 分後に抑止を解除 ) nodata 関数を使えば簡単に実現できそうに思えるが 後者の 除外解除周期 が難しい 12

4. アラーム抑止の時間リセット機能がない nodata 関数だけで実現しようとすると [ アイテム ].regexp(.*)#0 & [ アイテム ].nodata(120)#1 ( ノーマル ) このとき DB に値が入ったタイミング ( アイテム収集タイミング ) と タイマー系関数である nodata 関数の毎分 0 秒と 30 秒に過去 120 秒の値を確認する 13

4. アラーム抑止の時間リセット機能がない nodata 関数だけで実現しようとすると [ アイテム ].regexp(.*)#0 & [ アイテム ].nodata(120)#1 ( ノーマル ) 初回アラームを基準とするのではなく DB の値を過去に遡って確認する仕様であるため エラーが出 され続けた時にトリガーステータスが正常に戻らない 14

4. アラーム抑止の時間リセット機能がない [ 準備 1] アクションを作成 エスカレーションを 有効 期間を初回アラームから抑止リセットさせたい時間 ( 秒 ) アクションのオペレーションをステップ2 zabbix_senderで該当トリガーキーに対して 抑止リセット という文字を送信 /usr/bin/zabbix_sender -z < ホスト名 > -s {HOSTNAME} -k '{TRIGGER.KEY}' -o '< 抑止リセット >' [ 準備 2] トリガーに条件追加 [ アイテム ].regexp(.*)#0 & [ アイテム ].nodata(120)#1 [ アイテム ].regexp(.*)#0 & [ アイテム ].nodata(120)#1 & [ アイテム ].regexp(" 抑止リセット ")}=0 15

4. アラーム抑止の時間リセット機能がない [ 参考 ] アクションの例 16

4. アラーム抑止の時間リセット機能がない 結果 17

5. アクションがテンプレート管理ではない アクションのインポート / エクスポートが出来ない ある商用統合監視 SW の場合は自動アクション機能が Zabbix でいうトリガーの一部として設定できたため その自動アクションもテンプレートとしてインポート / エクスポートができたが Zabbix ではそれが出来ない 18

5. アクションがテンプレート管理ではない アクションのインポート / エクスポートが出来ない DB を直接書き換える方法も考えられるが Zabbix が使用する DB に直接 INSERT することで 予期せぬ動作をする懸念があった 開発環境で試験をしたアクション設定値が 商用環境でも同一の設定となっていることの担保がとれればよい ことから アクションの設定一覧のエクスポート機能を実装した これは単純にアクションに使用している actions operations conditions を DB から SELECT し テキストに出 する機能 商用環境でアクションを作成後 あらかじめ開発環境で上記機能を使用して生成されたテキストデータとの差分比較をすることにより 最低限のエンドユーザー要望を満たすことが出来た 19

6. 監視条件に優先順位がないため すべて排他の条件にしなければならない 商用統合監視 SW の場合 条件を上から順番にマッチングしていき マッチしたタイミングでそれより下の条件は ない [ 例 ] YYYY/MM/DD hh:mm::ss error エラーコード =[xxxx] あるログに error という 字列が書き込まれたときにアラームとしたい 但し ログ内に書かれたエラーコードが 1000/2000/3000/4000/5000 のときはアラームとはしたくない ある商用統合監視 SW であれば 右図のようにアラーム発報したい条件より上に 除外条件 を追加するだけでよかった +/- 条件 1 除外 エラーコード =[1000] 2 除外 エラーコード =[2000] 3 除外 エラーコード =[3000] 4 除外 エラーコード =[4000] 5 除外 エラーコード =[5000] 6 発報 error 20

6. 監視条件に優先順位がないため すべて排他の条件にしなければならない Zabbixで普通に条件を作ると Zabbixではすべての条件がフラットに評価される 前ページの例でトリガーを作ると [ アイテム ].regexp(.*error.* )#0 errorという 字列が含まれる & [ アイテム ].regexp(.* エラーコード = [1000 ].* )=0 エラーコード1000は除外 & [ アイテム ].regexp(.* エラーコード = [2000 ].* )=0 エラーコード2000は除外 & [ アイテム ].regexp(.* エラーコード = [3000 ].* )=0 エラーコード3000は除外 & [ アイテム ].regexp(.* エラーコード = [4000 ].* )=0 エラーコード4000は除外 & [ アイテム ].regexp(.* エラーコード = [5000 ].* )=0 エラーコード5000は除外 という いトリガーを作らないとならない 正規表現を使ってみる 21

6. 監視条件に優先順位がないため すべて排他の条件にしなければならない独自正規表現を作成する [ 管理 ] > [ 一般設定 ] から正規表現を作成する 22

6. 監視条件に優先順位がないため すべて排他の条件にしなければならない 独自正規表現を作成する 名前 :errorcode 条件式 : 右表 とすると トリガー条件式は [ アイテム ].regexp(@errorcode)#0 という短い条件で済む また 除外したいエラーコードの追加 / 削除があったとしても 正規表現側を修正するだけで容易に修正が可能になる 期待値 条件 1 結果が真.*eroor.* 2 結果が偽.* エラーコード = [1000 ].* 3 結果が偽.* エラーコード = [2000 ].* 4 結果が偽.* エラーコード = [3000 ].* 5 結果が偽.* エラーコード = [4000 ].* 6 結果が偽.* エラーコード = [5000 ].* 23

Thank you