OSS システム統合監視入門 ~, Hinemos の機能と選択のポイント ~ SRA OSS, Inc. 日本支社山本博之 yamamoto@sraoss.co.jp Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 1
統合監視ツールとは 1 つのソフトウェアに複数の役割を持たせて一元管理 グラフによる視覚化 異常負荷の警告 性能情報の蓄積 ログデータの管理, Hinemos, etc スクリプト ジョブ実行 バックアップ 死活チェック システム情報の登録 サービス復旧 サービス監視 ハードウェア監視 警告灯の点灯 マップ化 資産管理 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 2
OSS 統合監視ツール Hinemos Hinemos 開発 : NTT データ 監視画面 : 専用 GUI クライアント (Java ベース ) サーバ : JBoss 設定 : 専用 GUI データ保存形式 : RDB (PostgreSQL) ジョブ管理機能 一括管理機能をもつ 一括管理 : ファイル配布 RPM インストール マシンの起動 停止など国産なので日本語のドキュメントは整備されている有償オプションが充実し パートナー制度により サポートや Hinemos をベースにした製品が充実 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 3
Hinemos 構成例 Hinemos ping 監視 管理者 Hinemos マネージャ WEB 監視 DB 監視 (JDBC) Hinemos クライアント ( 専用ツール ) HA オプション VM 管理オプション VMware Xen,KVM SNMP 監視リソース プロセス監視 (SNMP,WBEM) Hinemos エージェント ジョブ実行ログ監視コマンドによる監視 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 4
監視画面 ( 専用 GUI) Hinemos 障害が発生すると赤に 危険 警告 情報 不明の発生した数 現在の状態 データベースに蓄積された情報 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 5
監視項目の一覧 データの視覚化 Hinemos タブでグラフを切り替え可能 グラフ ( 例 ) ネットワーク通信量 グラフの対象期間を切り替えれる Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 6
スコープ 設定の流れ Hinemos リポジトリ情報リポジトリ情報監視項目設定 CPU 使用率プロセス数 WEB 応答 (1) リポジトリにホストを登録ホストをグルーピング = スコープ設定 : リポジトリ ノードの作成 変更 (2) 情報の通知先を設定設定 : 監視設定 通知 (3) 監視項目をスコープと通知に結びつけて 取得情報と条件を設定設定 : 監視設定 一覧 監視画面 イベント通知 ステータス通知 通知 メール ジョブ Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 7
設定画面 Hinemos 設定は GUI 上で行う 設定の一括インポートは Utility オプションを利用 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 8
実行したいジョブを登録する ジョブ管理 Hinemos 正常実行など状態がわかる 手動で開始も可能定時実行や日付で実行したい時は スケジュール カレンダーを使う Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 9
ジョブの構成 Hinemos のジョブは階層構造と依存関係をもつ ジョブユニット : ジョブ階層の最上位要素ジョブネット : ジョブのグループジョブ : ジョブの最小単位 ノード上で実行されるコマンドに対応 ジョブユニット ジョブネット A ジョブネットB ジョブ4 ジョブ 1 ジョブ 2 ジョブ 3 ジョブ 5 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 10
Hinemos の導入にあたって Hinemos インストール 設定は容易 インストーラスクリプトで対話的にインストール オプション製品の導入も容易 全てイメージしやすい日本語表示のGUI 設定項目が単純であれば楽に設定ができる スコープへの一括反映 マネージャと監視対象機器のネットワーク疎通は必須 複雑なネットワーク構成に対応できないマネージャが監視項目を直接取りに行くので監視対象が多いとマネージャがボトルネックになる可視化機能はやや弱い Web 上での情報が少ない Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 11
の特徴 ライセンスがGPL Webブラウザで操作できる管理画面データ保存はRDBMS (MySQL, PostgreSQL, Oracle, SQLite) Cで実装されているため軽量 sshやtelnetでエージェントレス監視 スクリプトによるカスタム監視で自由自在対応プラットフォームが多い (OSにパッケージが用意されている場合も) プロキシも設置できて拠点間 - 処理分散に対応 を操作するAPIを標準搭載テンプレートの一括インポート エクスポート サーバ / エージェントが対応 FreeBSD OpenBSD HP-UX Linux Solaris AIX Mac OS X Tru64/OSF SCO Open Server エージェントのみ対応 Windows Novell Netware Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 12
管理者 構成例 メール通知 ブラウジング セグメント外 Proxy シンプルチェック WEB 監視 監視対象 エージェント監視 メール通知 server ブラウジング SNMP 監視 処理分散 管理者 Proxy 監視対象 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 13
HA 化 (1) Pacemaker/Heartbeat による Active-Standby 構成 Pacemeker Heartbeat Pacemeker Heartbeat 保護対象 サーバ Active Standby DB Server Server 必要に応じて Web DB のデータレプリケーションは -DRBD DB DB - ログベースレプリケーション Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 14
HA 化 (2) 2 つの サーバを並行して動作させる Active-Active 構成 Active (primary) Active (secondary) 保護対象 サーバ DB Server Server 必要に応じて Web 2 つの サーバは同一の監視項目をもつ DB DB アラートは片方 (primary) からのみ上がるように設定する Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 15
エージェント パッシブチェック アクティブチェック エージェント メモリ利用率は? パッシブ サーバ 45% です アクティブ メモリ利用率 45% CPU 利用率 20% ディスク利用率.. 15% ( サーバの仕事を各エージェントで負担 ) Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 16
用語があるので注意 アイテム監視を行う項目 ( ロードアベレージ ポート監視など ) 設定することで各データを集める トリガー障害の検知 ( ポートから反応がなければ真など ) ステータスを変える条件を設定する イベント状態変化の管理 ( 正常 障害 障害 正常 ) アクション 通知 ( メール送信など ) 対応 ( コマンド実行など ) 復旧動作 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 17
監視対象機器 ディスクメモリ CPU 設定の流れ (1) ホストを監視サーバに登録項目 : ホストの作成 ( 例 )agent1.example.com サーバ (2) 監視項目を設定 DB に指定のデータが蓄積項目 : アイテムの作成 ( キーによる指定 : 細かいパラメータによる取得条件の調整 ) ( 例 )icmppingloss[,3,2000,24,1000] DB 条件式 :( 例 ){agent1.example.com:icmppingloss[,3,2000,24,1000].last(0)}>0 真 ( 障害 ) (3) 条件式を設定項目 : トリガーの作成 偽 ( 正常 ) イベント メール送信 スクリプト実行 (4) 実行内容を定義項目 : アクションの作成 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 18
テンプレートの活用 一括インポート エクスポート 編集ができる <item type="0" key="vfs.fs.inode[/,pfree]" value_type="3"> 略 <trigger> <description>low free disk space on {HOSTNAME} volume /</description> <type>0</type> <expression>{template_linux:vfs.fs.size[/,pfree].last(0)}<10</expression> <url></url> <status>0</status> <priority>4</priority> <comments></comments> </trigger> 略 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 19
テンプレートの活用イメージ Apache テンプレート Apache サーバ Linux Linux 基本テンプレート DB テンプレート DB サーバ Linux Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 20
グラフ スクリーン マップのショートカット 監視画面 致命的な障害 重度の障害 軽度の障害 警告 情報 未分類とレベル別に表示 致命的な障害が発生 異常あり なしを表示 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 21
データの視覚化 期間の調整 CPU 使用率 ロードアベレージ タイル状にデータを張り付けることが可能 ( スクリーン ) 複数のグラフの重ね合わせが可能数値の加工 ( 計算 ) 後のグラフ描写も可能 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 22
の導入にあたって Webインタフェースのため専用クライアントは不要インタフェースは直感的 ホスト アイテム トリガー イベント アクションの流れが分かれば簡単テンプレートにより設定の一括反映ができるプロキシによる分散管理 負荷分散が可能複雑な構成や要求に対応しやすい柔軟性のある設定 Web 上で多くの情報を得られる httpd php データベースなど個別にセットアップの必要あり慣れていないとインストールは少々手間キーやトリガーの書き方を覚える必要がある Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 23
どれを使えばいいの? 基本的な監視であれば Hinemos どちらでも可 ジョブ管理 一括管理機能が必要 Hinemos 高度な監視機能 大規模なシステムの監視 Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 24
参考情報一覧 ITLeader OSS 俯瞰図 239 http://it.impressbm.co.jp/e/2012/05/15/4331 Hinemos: http://www.hinemos.info/ : http://www.zabbix.com/ ZABBIX-JP サイト http://www.zabbix.jp/ HA 化 https://www.zabbix.org/wiki/docs/howto/high_availability 弊社 Web サイト技術情報のページで Hinemos の入門記事の連載を行っています http://www.sraoss.co.jp/technology/hinemos/ http://www.sraoss.co.jp/technology/zabbix/ Copyright 2013 SRA OSS, Inc. Japan All rights reserved. 25