Zabbixを もっと使おう

Similar documents
スライド 1

PowerPoint プレゼンテーション

3 パッケージからのインストール

日本 PostgreSQL ユーザ会第 28 回しくみ + アプリケーション勉強会 Zabbix を使って PostgreSQL を監視してみよう 2014 年 2 月 1 日 TIS 株式会社中西剛紀 (Yoshinori Nakanishi)

3 ディストリビューション・パッケージからのインストール

Zabbix 3.4の新機能

新バージョン! Zabbix 2.2 と検証結果のご紹介 SRA OSS, Inc. 日本支社山本博之 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 1

Zabbix入門-勉強会資料_

Zabbix でミドルウェア毎に効率的に データを収集するために作った仕組みの話 株式会社サイバーエージェント Conference Japan

Zabbix で PostgreSQL を監視! pg_monz のご紹介 Zabbix Conference Japan 年 11 月 20 日 SRA OSS, Inc. 日本支社マーケティング部

Microsoft PowerPoint - OSS運用管理勉強会資料_ a.pptx

MIRACLE MH for SNMP サポート SLA( サービスレベルアグリーメント ) ML-CS-0747 本書は サイバートラスト株式会社 ( 以下 サイバートラスト ) が MIRACLE MH for SNMP サポート ( 以下当サポートサービス ) の内容について説明するものである

HeartCoreインストールマニュアル(PHP版)

HeartCore(PHP 版 ) インストール手順について説明いたします なお 本資料は 例として下記内容を前提として説明しております 環境情報 対象 OS: Linux ( ディストリビューション : Red Hat Enterprise Linux Server) APサーバ : Apache

自己紹介 とは Zabbix の概要 Zabbix のインストール 監視設定 Web サーバーの監視 その他 (DBMS の監視 ) 2

Nagios XI - SNMPでのLinux監視

9 WEB監視

HeartCoreインストールマニュアル

商用監視ソフトウェアユーザの Zabbix 移行へ朗報 Zabbix Event Viewer のご紹介 【本邦初公開】

スライド 1

PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部

スライド 1

Zabbix パートナー会とは (1) 日本国内の Zabbix パートナーが集う会 北は東日本計算センターさんから 南は九電ビジネスソリューションズさんまで 日本国内の Zabbix パートナー企業 33 社 ( 参照 :

運用統合ソフトウェア 2014/6/4 ミラクル リナックス株式会社 大和 一洋 Copyright MIRACLE LINUX CORPORATION All rights reserved

自己紹介 指崎則夫 ( さしざきのりお ) SCUGJ 運営スタッフ Microsoft MVP

BOM for Windows Ver.6.0 リリースノート

2013年『STSSスキルコミュニティ』 テーマ別Kickoff資料

システムパッケージリリース情報-Version5.0.0pre

KiwiSyslogServer/KiwiLogViewer製品ガイド

内容環境... 3 対応 OS の変更... 3 関連アプリケーションの追加... 4 機能追加... 5 グラフ機能... 5 稼働率... 8 サービス一括削除 自動復旧エスカレーションコマンド AWS カスタムメトリックス監視 NRPE 任意監視... 11

スライド 1

運用

使用する前に

改版履歴 版数 改版日付 改版内容 /03/14 新規作成 2013/03まで製品サイトで公開していた WebSAM DeploymentManager Ver6.1 SQL Server 2012 製品版のデータベース構築手順書 ( 第 1 版 ) を本 書に統合しました 2

CLUSTERPROXSingleServerSafe SingleServerSafe ご紹介 2007 年 10 月

PowerPoint プレゼンテーション

FUJITSU Cloud Service for OSS 「システム監視サービス」ご紹介資料

2017/8/2 HP SiteScope software 監視機能対応表 この監視機能対応表は HP SiteScope software v11.33) に対応しています モニタ モニタ説明 モニタ説明 SiteScope for Windows SiteScope for Linux ネット

BOM for Windows Ver

HP Device Managerご紹介資料

ライフサイクル管理 Systemwalker Centric Manager カタログ

システムパッケージリリース情報-Version5.1.0

Microsoft Word - XOOPS インストールマニュアルv12.doc

iRMC S4 ご使用上の留意・注意事項

別紙 : 検証環境の構築手順 ( 章 ) 1. サーバ設定 1.1 IP アドレス設定 サーバは以下の 6 台を用いる pgpool-ii サーバ 2 台 DB サーバ 3 台 上位サーバ 1 台 OS は全サーバで CentOS 6.4 x86_64 とする pgpool-ii のサー

SLAMD導入手順

CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

提案書

AWS Deck Template

平成22年度「技報」原稿の執筆について

リバースプロキシー (シングル構成) 構築手順

インストーラー 管理番号 内容 対象バージョン 230 HULFT がすでにインストールされているパスに対してサイレントインストールを実行すると インストールされていた HULFT の動作環境が不正な状態になる 7.3.0~7.3.1 ユーティリティ 管理番号 内容 対象バージョン 231 管理情報

Agenda 1. 今回のバージョンアップについて a. バージョンアップ概要 b. バージョンアップ目的 c. 新バージョンのシステム要件に関する注意事項 d. 現行バージョンのサポート期間 2. 対応プラットフォームの追加 3. 新機能の追加および機能強化 2

テクニカルドキュメントのテンプレート

アジェンダ 自己紹介 とは Zabbix を利用する上での TIPS システムインテグレーションの現場では まとめ 本文中に登場する会社名 商号名 製品名 サービス名称などの名称は 各社の商号 商標または登録商標です 2

<< 目次 >> 1 PDF コンバータのインストール ライセンスコードの入力 PDF にフォントを埋め込みたい場合の設定 PDF オートコンバータ EX で使用しない場合 PDF コンバータ単体で使用する場合の説明 PDF コンバータのアン

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

Oracle SQL Developer Data Modeler

Helix Swarm2018.1インストール手順

A : kerl kerl Erlang/OTP Erlang/OTP 2 2 Elixir/Phoenix URL 2 PDF A.2 Bash macos.bash_profile exp

Sophos Enterprise Console

Oracle Enterprise Managerシステム監視プラグイン・インストレーション・ガイドfor Juniper Networks NetScreen Firewall, 10gリリース2(10.2)

OSSTechプレゼンテーション

システム管理者ガイド GIGAPOD 3 システム管理者ガイド - 負荷分散構成 第 1.01 版 2013 年 3 月 改訂履歴 No バージョン 日付 作成者 改訂者 補足 /09 トライポッドワークス 初稿 /03 トライポッドワークス cr

仮想マシン構成のホスト ゲスト連携物理サーバー上の CLUSTERPRO X と仮想マシン上の X SSS で連携が可能です 例えば物理サーバー上の CLUSTERPRO X の異常検出をトリガとし仮想マシン上の X SSS をフェールオーバーさせることなども可能です 仮想化環境に最適なライセンス体

新環境への移行手順書

HinemosのHatohol連携のご紹介 -OSSの運用統合ソフトウェア Hatohol はとほる NECソリューションイノベータ 中村桂一

PostgreSQL Plus 管理者ガイド

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

LDAP Manager SupportList

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

McAfee Firewall for Linux リリース ノート

ジョブ管理ソフトウェア LoadStar Scheduler ご紹介資料 ~ システム運用品質の向上とコスト削減を実現 ~

PowerPoint Presentation

ADempiere (3.5)

IPM Release 2.6 へのアップグ レード

Microsoft PowerPoint - kiwi_productguide v9_rev2.7.ppt

intra-mart Accel Platform — IM-共通マスタ スマートフォン拡張プログラミングガイド   初版  

レベルアップ詳細情報 < 製品一覧 > 製品名 バージョン < 追加機能一覧 > 管理番号 内容 説明書参照章 カナ文字拡張対応 < 改善一覧 > 管理番号 内容 対象バージョン 説明書参照章 文字列のコピー ペースト改善 ~ 子画面の表示方式 ~ 履歴の詳細情報 ~ タブの ボタン ~ 接続時の管

intra-mart EX申請システム version.5.3 PDFオプション リリースノート

Transcription:

Zabbixをもっと使おう 2016/11/06 @OSC 2016 TOKYO/FALL ZABBIX-JP 田中敦

自己紹介 2 氏名 田中敦 ( たなかあつし ) 所属 ZABBIX-JP(Zabbix の日本のコミュニティ ) 役職 副代表 主な活動 コミュニティサイト (http://www.zabbix.jp/) にて 情報発信と問い合わせ対応 Zabbix の UI などの日本語翻訳

アジェンダ 3 はじめに Zabbixの振り返り 監視方法の詳細 標準の機能 機能の拡張 応用例 Zabbix 3.2について まとめ

はじめに 4

Zabbix とは 5 ラトビアにある Zabbix LLC という会社が開発しているオープンソースの統合監視ツール ライセンスは GPLv2 Web ブラウザを使用して監視の設定ができる 専用のエージェント SNMP IPMI JMX SSH Telnet 独自のスクリプトなど様々な方法を利用して監視が可能 取得した値をグラフ化したり マップと呼ばれる機能で障害発生個所を把握しやすい テンプレートと呼ばれる監視設定のセットを事前に用意しておくことで 新規に追加されたサーバーの監視を速やかに開始できる

Zabbix 用語の振り返り 6 用語アイテムトリガーアクションテンプレート 概要 監視する項目のこと CPU メモリ ネットワーク ハードディスク ログファイルなど 数値や文字列で値を取得する アイテムで取得してきた値に対して 条件を付与して障害かどうかを判定する条件式を設定するもの トリガーなどでイベントが発生したときにメールでの通知やスクリプトの実行などを行う設定のこと アイテム トリガー グラフなどをひとまとまりにして 監視対象を追加したときに これを紐づけるだけで監視が開始できるようにする

監視方法の詳細 7

監視項目の取得シーケンス (1) 8 アイテムのタイプが Zabbix エージェントの場合 1 キーを指定して値を要求 Zabbix サーバー 3 値を返却 Zabbix エージェント 2 値取得処理

監視項目の取得シーケンス (2) 9 アイテムのタイプが Zabbix エージェント ( アクティブ ) の場合 1 ホスト名を指定して取得するキーのリストを要求 Zabbix サーバー 2 キーのリストを返答 Zabbix エージェント Zabbix サーバー (B) 取得した値を送信 Zabbix エージェント (A) 受信したキーと間隔で値取得処理

簡単な拡張 (UserParameter) 10 標準で用意されているアイテムのキー以外にも 設定ファイルに UserParameter という設定を追加することで 標準以外の項目も監視することができる Zabbix サーバーとのやり取りは 通常の Zabbix エージェントと同様 例 : /etc/zabbix/zabbix_agentd.d/userparameter_mysql.conf

UserParameter の例 11 パッケージでのインストール時にデフォルトで用意されている設定例 UserParameter=mysql.status[*],echo "show global status where Variable_name='$1';" HOME=/var/lib/zabbix mysql -N awk '{print $$2}' キー ( 引数あり ) mysql.status[*] コマンド文字列 echo "show global status where Variable_name='$1';" HOME=/var/lib/zabbix mysql -N awk '{print $$2}'

簡単な拡張 ( トラッパー ) 12 別の拡張方法として トラッパーと呼ばれるものを使用できる アイテムのタイプとして Zabbix トラッパー を選択して作成しておくことで zabbix_sender というコマンドを使用して アイテムの値を任意のタイミングで Zabbix サーバーに通知することができる Zabbix エージェントをインストールできないサーバーから定期的に値の通知だけを行わせることにも使用できる システムリソースのメトリクスだけではなく 各種センサーの値や業務システムのメトリクスを Zabbix サーバーに集約することも可

Zabbix トラッパーのシーケンス 13 Zabbix サーバー 1 ホストとキーと値を指定して値を送信 任意のサーバー

Zabbix トラッパーの応用例 14 ジョブの終了ステータスの通知 ジョブの終了時に 正常終了か異常終了かを Zabbix サーバーに通知 通知された値によって Zabbix のトリガーで判定して運用管理者にメールなどで通知 業務システムなどの指標値の視覚化 アンケートシステムでのアンケート収集状況を視覚化 登録ユーザーの属性に合わせて分類して視覚化 IoTの各種デバイスやセンサーの値を収集して監視

高度な拡張 15 ローレベルディスカバリ (LLD) ネットワークインターフェースの自動認識 マウントされたハードディスクの自動認識 SNMP 対応機器のインターフェースの自動認識

標準で用意されている LLD の例 16 1 監視対象リストを要求 Zabbix サーバー 2JSON 形式でリストを返却 5 アイテムデータの取得 Zabbix エージェント Zabbix 用データベース 3 リストを元にアイテムなどを自動生成 4 生成されたアイテム情報などを取得 { ] } "data":[ {"{#FSNAME}":"/","{#FSTYPE}":"rootfs"}, {"{#FSNAME}":"/proc","{#FSTYPE}":"proc"}, {"{#FSNAME}":"/sys","{#FSTYPE}":"sysfs"}, {"{#FSNAME}":"/","{#FSTYPE}":"ext4"}, {"{#FSNAME}":"/proc/bus/usb","{#FSTYPE}":"usbfs"}, {"{#FSNAME}":"/boot","{#FSTYPE}":"ext4"},

さらなる拡張 17 独自 LLD の利用 標準機能で用意された LLD の機能以外にも 独自のディスカバリ用のスクリプトなどを用意することで 独自の動的に数が変化する監視対象を自動認識 独自 LLD の応用例 PostgreSQL monitoring template for Zabbix (pg_monz) API の利用

拡張時の注意点 18 1 つの値取得処理にかかる時間に注意すること デフォルトの設定では Zabbix サーバー側も Zabbix エージェント側も 3 秒間でタイムアウトが発生してしまうので Zabbix サーバーや Zabbix エージェントが値を取得する処理に時間がかかるようであれば 設定ファイルの Timeout の値を長めに設定する ( 最大値は 30 秒 ) リモートからクラウド環境を監視するような場合でも 値取得に時間がかかるなら同様 30 秒以上かかるような処理は 別途 結果をファイルに書き出して Zabbix がそのファイルから読み出すようにするか トラッパーを利用して zabbix_sender コマンドで Zabbix サーバーに通知するようにする

応用例 19

動的に監視対象の数が変化する環境の 20 監視 クラウド環境 AWS 環境の監視 CloudWatch のメトリクスを Zabbix 上で障害判定と長期保管 データベース PostgreSQL の監視 DBMS 上に登録されている複数のデータベースの情報を自動的に取得して監視項目の自動設定 (ex. pg_monz LLD やトラッパーを利用 )

他のシステムやプロダクトとの連携 21 ログの分析 Fluentd の出力に Zabbix を指定することで Fluentd のソースから取得した情報を集計など加工して監視できるようにする (ex. fluent-plugin-zabbix トラッパー利用 ) 視覚化の拡張 デフォルトのグラフ機能よりも様々な表現力のあるグラフを生成する (ex. Zabbix plugin for Grafana API 利用 ) インシデント管理 Redmine や OTRS との連携 ( リモートコマンドやメディアスクリプト利用 )

Zabbix plugin for Grafana 22 https://github.com/alexanderzobnin/grafana-zabbix

Zabbix 3.2 情報 23

Zabbix 3.2 リリース 24 Zabbix 3.2 が 2016 年 9 月 14 日にリリースされた 現時点の最新版は Zabbix 3.2.1 Zabbix 3.2 は ポイントリリースと呼ばれるバージョン サポート期間が短いことに注意 次のバージョンがリリースされたら 約 1 ヶ月でサポートが終了する予定 長期間のサポートが必要なのであれば 長期間のサポートが用意されている LTS と呼ばれるバージョン ( 例 :Zabbix 3.0) を選択すること

Zabbix 3.2 の新機能と変更点 25 トリガーの手動クローズイベントタグの設定イベント相関関係の設定ヒステリシストリガーの改善 LLDで生成したアイテムの詳細確認 Webシナリオのエクスポートとインポートイベント画面から障害画面へホストグループの階層化

トリガーの手動クローズ 26 これまで ログ監視や SNMP トラッパーの監視で トリガーの状態が 障害 のままとなって 無理矢理 関数 nodata() を使用して一定時間後にトリガーの状態をクリアしていた これでは 対処しなくてもトリガーの状態が 正常 に戻ってしまうので 本当にその検知した障害に対応できたのかがわからない Zabbix 3.2 では トリガーの設定として 手動でクローズすることができるかどうかを設定できるようになった

トリガーの設定画面 27

ヒステリシストリガーの改善 28 いままでのトリガーの条件設定は 条件式に合致するかしないかしか指定ができなかった 障害が発生している状態で 回復したとみなす閾値を別途設定するために ヒステリシストリガーと呼ばれる設定があった 例 ({TRIGGER.VALUE}=0 and {server:system.cpu.load[,avg1].last()}>10) or ({TRIGGER.VALUE}=1 and {server:system.cpu.load[,avg1].last()}>5) Zabbix 3.2 では 回復したと判定する方法として 別の条件式を設定することも可能となった

トリガーの条件式と復旧条件式 29

Zabbix 3.2 アップグレード時留意点 1 30 RHEL 7 や CentOS 7 で systemd で zabbix-server を起動している場合 3.2.x にソフトウェアをアップグレードし 最初に zabbixserver を起動する時は systemctl コマンドで起動しないこと zabbix_server プロセス起動時のデータベースアップグレード処理に時間がかかってしまう場合がある 次ページのようにコマンドで手動起動し ログファイルを確認してデータベースのアップグレードが正常に終了したことを確認しておくこと 詳細 :ZBX-11203 database upgrade from Zabbix 3.0 to Zabbix 3.2 fails https://support.zabbix.com/browse/zbx-11203

Zabbix 3.2 アップグレード後の初期起 31 動 コマンド実行例 # sudo -u zabbix /usr/sbin/zabbix_server -f -c /etc/zabbix/zabbix_server.conf ログサンプル 30488:20160916:103655.733 current database version (mandatory/optional): 02040000/02040000 30488:20160916:103655.733 required mandatory version: 03020000 30488:20160916:103655.733 starting automatic database upgrade 30488:20160916:103655.836 completed 1% of database upgrade 30488:20160916:103655.852 completed 2% of database upgrade 30488:20160916:103657.732 completed 97% of database upgrade 30488:20160916:103657.736 completed 98% of database upgrade 30488:20160916:103657.737 completed 100% of database upgrade 30488:20160916:103657.737 database upgrade fully completed

Zabbix 3.2 アップグレード時留意点 2 32 ODBC を使用したデータベースアクセス ( データベースモニタ ) のアイテムが正常に取得できない 以下のようなログが記録される 20850:20160915:160911.863 error reason for ホスト名 :db.odbc.select[ クエリ名 ]" changed: Received value [??p] is not suitable for value type [Numeric (unsigned)] and data type [Decimal] 次バージョン (3.2.2) で修正予定 詳細 :ZBX-11213 DB Monitoring stopped working after upgrade to 3.2 https://support.zabbix.com/browse/zbx-11213

RHEL 6/CentOS 6 への導入 Zabbix 3.0 以降では RHEL 6/CentOS 6 は Zabbix サーバーを構築する環境としては非推奨となった Web インターフェースの稼働条件として PHP 5.4 以降のみサポートであるため RHEL 6/CentOS 6 の標準の PHP のバージョンが古いので対応不可 他にも一部ライブラリのバージョンが古いため Zabbix サーバーの新機能が利用できないものがある ( 例 :SMTP 認証 ) 33 対策として RHEL 7/CentOS 7 に移行するか 一部機能の制限があるものの SCL サードベンダーのパッケージ ソースからの導入などで 新しいバージョンの PHP やライブラリを使用して Zabbix サーバーや Zabbix の Web インターフェースを稼働させることはできる

RHEL 6 へのインストールヒント 34 # yum install centos-release-scl # yum install rh-php56-php rh-php56-php-bcmath rh-php56-php-gd rh-php56-php-ldap rh-php56-php-mbstring rh-php56-php-xml rh-php56-php-mysqlnd # yum install http://repo.zabbix.com/zabbix/3.2/rhel/6/x86_64/zabbix-release-3.2-1.el6.noarch.rpm # yum install zabbix-agent # yum --enablerepo=zabbix-deprecated install zabbix-server-mysql # yum --enablerepo=zabbix-deprecated install zabbix-web-mysql zabbix-web-japanese # yum install mysql-server # vi /etc/my.cnf # service mysqld start # chkconfig mysqld on # mysql -uroot mysql> create database zabbix character set utf8 collate utf8_bin; mysql> grant all privileges on zabbix.* to zabbix@localhost identified by 'password' ; mysql> exit # zcat /usr/share/doc/zabbix-server-mysql-3.2.1/create.sql.gz mysql -uroot zabbix # vi /etc/zabbix/zabbix_server.conf # cp /usr/share/doc/zabbix-web-3.2.1/httpd24-example.conf /opt/rh/httpd24/root/etc/httpd/conf.d/zabbix.conf # vi /opt/rh/httpd24/root/etc/httpd/conf.d/zabbix.conf # setsebool -P httpd_can_network_connect on # setsebool -P zabbix_can_network on # service httpd24-httpd start # service zabbix-agent start # service zabbix-server start # yum install policycoreutils-python # grep zabbix_server /var/log/audit/audit.log audit2allow -M zabbix-limit # semodule -i zabbix-limit.pp # service zabbix-server start

まとめ 35

Zabbix の機能を活用することで 36 拡張や他システムとの連携によって より広範囲の情報を把握して視覚化できる 運用管理の担当者の監視設定の負荷を軽減する 運用の効率化と継続的改善へ

Zabbix 3.2 以降の新機能で 37 トリッキーな設定ではなく 標準の機能として確認済みのトリガーを手動で確認済みの状態に戻すことができる より柔軟なトリガーの依存関係を設定して 自動的に状態をリセットし 本来関知して対応しなければならない障害に注力しやすくなる

ご参考 38 PostgreSQL monitoring template for Zabbix (pg_monz) http://pg-monz.github.io/pg_monz/ fluent-plugin-zabbix http://sfujiwara.hatenablog.com/entry/20120417/1334640635 https://github.com/fujiwara/fluent-plugin-zabbix Zabbix plugin for Grafana https://github.com/alexanderzobnin/grafana-zabbix Zabbix 3.2 新機能 http://www.zabbix.com/jp/whats_new

おわり 39 ご清聴いただきありがとうございました 本資料内で利用させて頂いた各プロダクト名やサービス名などは 各社もしくは各団体の商標または登録商標です