Oracle Enterprise Manager Grid Control の配置ガイドライン
アジェンダ Oracle Enterprise Manager の配置ライフ サイクル 配置前の計画 配置フェーズ 配置後のアクティビティ 実装時の考慮事項
Oracle Enterprise Manager の配置ライフ サイクル 配置前のアクティビティ 要件分析 キャパシティ計画およびサイズ指定 ソリューション アーキテクチャ設計 配置計画 POC/ ステージング インスタンス 配置リポジトリ OMS の配置 エージェントの配置 配置 HA/ セキュリティ 本番インスタンス 配置後のアクティビティ 監視ハウスキーピングチューニング 変更管理
機能要件 要件分析 範囲および目的 何を監視するか 何を管理するか システムのユーザーは誰か 異なるコンポーネントをデータセンターに配置する方法 現行システムの管理プロセス / プラクティスの内容 Grid Control の主な目的は何か
要件 機能マッピング 要件分析 要件を Oracle Enterprise Manager Grid Control へマッピング 標準機能 管理パック 管理プラグイン 構成設定 カスタマイズ / 拡張機能
インフラストラクチャ要件 要件分析 Oracle Enterprise Manager Grid Control Architecture に影響する高可用性要件 Oracle Management Repository 高可用性 - Real Application Clusters 障害時リカバリ - Data Guard Oracle Management Service(OMS) 複数の OMS サーバー ロードバランサ (SLB) を前に配置 アップロード済みファイル用の共有受信ディレクトリ Software Library 用の共有 NFS ディレクトリ
インフラストラクチャ要件 - 続き 要件分析 Grid Control 実装のセキュリティ要件の理解 フレームワーク通信セキュリティ 認証および認可 監査 機能以外の他の要件 パフォーマンス スケーラビリティ バックアップとリカバリ
Grid Control のサイズ指定 キャパシティ計画およびサイズ指定 必要な入力 監視するホスト数 ( エージェント ) ターゲットのタイプ数 (DB AS アプリケーションなど ) データ収集の頻度 違反 / 通知の予測サイズ スケジュールされたジョブ数 Grid Control の使用による自動化計画 ( 修正アクション ジョブなど )
# ターゲット # ターゲット サイズ指定 - ラフ ガイドライン キャパシティ計画およびサイズ指定 OMS ホスト 3Ghz CPU/ Host メモリ (GB) 起動ディスク (GB) 小規模 (100) 1 1 2 2 中規模 (1,000) 1 2 2 5 大規模 (10,000) 2 2 2 10 リポジトリ データベース ホスト 3Ghz CPU/ Host メモリ (GB) 起動ディスク (GB) 小規模 (100) 1 1 2 10 中規模 (1,000) 1 2 4 30 大規模 (10,000) 2 4 6 150
サイズ指定 - ネットワーク要件 キャパシティ計画およびサイズ指定 リポジトリ OMS リポジトリ ストレージ 1Gbps 30ms * 1Gbps <1ms * 300Kbps DSL 300ms * 300Kbps DSL 300ms * * 最小帯域幅 / 最大待機時間
Oracle Enterprise Manager Grid Control アーキテクチャ ダイアグラム ソリューション アーキテクチャ設計 アーキテクチャ ダイアグラムの開発 目的情報 ( 監視内容 ) リポジトリおよび OMS ホスト情報 (OS バージョン CPU メモリ ) リポジトリ ストレージ情報 ターゲット - OMS - リポジトリ 高可用性サーバー / ストレージ / ネットワーク サーバー ロード バランサ コンポーネント間のファイアウォール
ソリューション アーキテクチャの検証 ソリューション アーキテクチャ設計 ダイアグラムを要件および容量へマッピング 要件として指定されている場合 高可用性があることを確認 物理インフラストラクチャが帯域幅要件を満たしていることを確認 HTTP タイミング / ヒット情報の収集に Chronos を使用? Oracle Webcache を使用してください 複数の OMS が必要か? 共有受信ディレクトリおよびサーバー ロードバランサを含める必要あり
配置計画の準備 詳細計画の開発 パート 1 - Grid Control Central の配置インフラストラクチャ Oracle Management Repository の配置データベース OMS の配置 パート 2 - エージェントの配置 エージェントの配置 監視の標準化 通常タスクの自動化
配置 - リポジトリ DB 配置リポジトリ 認定された最新のデータベース バージョン (10.2.0.4 または 11.1.0.7) を Oracle RAC オプションによって有効化 基礎となるストレージ テクノロジーに Oracle ASM を選択 Oracle Management Repository のスループット向上のために DBMS_SHARED_POOL パッケージをインストール Database MAA のベスト プラクティス ARCHIVELOG モードの有効化 ブロック チェックサムの有効化 REDO ログ ファイルおよびグループのサイズを適切に構成 フラッシュ リカバリ領域の使用 フラッシュバック データベースの有効化 ファスト スタート障害時リカバリの使用によるインスタンス リカバリ時間の制御 データベース ブロック チェックの有効化 DISK_ASYNCH_IO の設定
配置 - OMS サーバー OMS の配置 OMS の配置 Oracle EM 10g GC Release 2(Linux 向け 10.2.0.1 または Microsoft Windows 向け 10.2.0.2) ソフトウェアのみインストール 10.2.0.5.0 GC パッチ セットを OMS に適用 10.2.0.5.0 GC パッチ セットを OMS ホストのエージェントに適用 OMS の Oracle ホーム ディレクトリから ConfigureGC.pl スクリプトを実行して Grid Control を構成 以下のノートで説明するように最新の PSU および重要なパッチを適用 https://support.us.oracle.com/oip/faces/secure/km/document Display.jspx?id=853691.1
エージェントの配置方法 エージェントの配置 エージェントの大量配置 エージェント プッシュ エージェント ダウンロード Oracle Universal Installerを使用したエージェント インストール エージェント クローニング NFSエージェント インストール アクティブ / パッシブ構成 クラスタ エージェント
エージェント配置時の考慮事項 エージェントの配置 エージェント プッシュ (1) エージェント ダウンロード (2) Oracle Universal Installer の使用によるエージェント インストール (3) エージェント クローニング (a) NFS/ 共有エージェント (b) アクティブ パッシブ モード (c) Oracle RAC エージェント (d) 一元管理ローカル管理ローカル管理一元 / ローカル管理一元 / ローカル管理一元 / ローカル管理一元 / ローカル管理 SSH 設定を必要とし エージェント バイナリをターゲット マシンにプッシュ エージェント ホスト マシンで wget を必要とし プルを使用 エージェント インストール ソフトウェアを各ホスト マシンに手動でダウンロード または NFS に一元化してステージング エージェント バイナリはすべてのホストの中央で共有および保存される そのため 最小領域のみ必要 Oracle EM コンソールへのアクセスが必要 エージェント ダウンロード スクリプトは すべてにアクセスできる URL からダウンロードが可能 管理者がすべてのエージェント インストールを実行している場合に適切 個々のホスト / ターゲット オーナーにエージェントをインストールする負担がかかる場合に適切 インストールするエージェントが非常に少数の場合にのみ有効である面倒な方法 ソース エージェントが標準レベルにパッチされ ゴールド イメージとして処理できる場合に適切 すべてのホストの環境が標準または同様の構成の場合に適切 プライマリ / スタンバイ ターゲットに使用 クラスタ ターゲットに使用 エージェント インストール ソフトウェアを OMS ホームにステージングする必要がある Oracle EM GUI を使用することで実行可能 エージェント インストール ソフトウェアを OMS ホームにステージングする必要がある Oracle EM GUI を使用することで実行可能
エージェント配置 エージェントの配置 エージェントの大量配置により エージェント インストールにかかる時間と労力を節約できる これには 以下を使用する OMS のエージェント配置アプリケーション ダウンロード可能なエージェント スクリプト エージェントの大量配置では 異なるプラットフォーム向けのエージェント キットを OMS でステージングする必要がある OMS でのキットのステージングは Grid コントロール GUI の Deployment ページの "Download Agent Software" を使用することによって実行可能 エージェントの大量配置には 同様のマシンが必要である
エージェント配置 アクティブ / パッシブ構成 エージェントの配置 DB Grid Control コンソール Oracle Management Agent (OMA) DB Oracle Management Service(OMS) ホストごとに 1 つのエージェントをインストール EMCLI をインストール 共有ストレージおよびクラスタ ウェアを使用して アクティブ / パッシブ ターゲットをインストール 通常どおりターゲットを発見 EMCLI コマンドの relocate target を使用し エージェント間の監視を移動 emcli relocate target Oracle Management Repository (OMR)
HA 構成 HA/ セキュリティ 複数の OMS の使用による高可用性 すべての OMS によってアクセス可能な共有ディレクトリの構成 各 OMS に共有ファイル システム ローダーを構成 OMS をサーバー ロードバランサと共に置き 1 台の OMS が故障した場合に Grid Control が使用可能であることを確認 スケーリングにも有益 リポジトリおよび OMS では常に POC/ ステージング Oracle EM インスタンスがあることが望ましい
MAA - クラスタ トポロジ (1) アクティブ / パッシブ ( フェイルオーバー中はブラックアウト ) HA/ セキュリティ Oracle Management Agent DB Grid Control コンソール アクティブ OMS 共有ストレージ スタンバイ OMS アクティブ OMR 共有ストレージ スタンバイ OMR
MAA - クラスタ トポロジ (2) アクティブ / アクティブ モード ( フェイルオーバー中は一時停止 ) HA/ セキュリティ Oracle Management Agent DB Oracle RAC を備えた最新の認証された DB バージョン ストレージ テクノロジーとしての Oracle ASM Database MAA のベスト プラクティス 高速接続フェイルオーバーの設定 ロードバランサ 適切な OMS インストール ロケーション ( ネットワーク待機時間 ) Grid Control コンソール ストレージ Oracle Management Service アプリケーション サーバー MAA のベスト プラクティス 共有ファイル システム ロード ディレクトリの構成 接続文字列の構成 Oracle RAC エージェント HA の機能 :watchdog プロセス SLB 間の通信用にエージェントを構成 SLB をレトロフィットできるようにエージェントを構成
MAA - クラスタ トポロジ (3) 障害時リカバリ HA/ セキュリティ プライマリ セカンダリ フィジカル スタンバイ データベース DB ファスト スタート フェイルオーバーおよび Oracle オブザーバ Oracle Management Service ストレージ スタンバイ OMS Data Guard Broker による管理 冗長 OMS Oracle RAC リポジトリ Oracle Data Guard Oracle RAC スタンバイ リポジトリ FCF/ONS の拡張による接続スイッチオーバーの自動化 Advance Configuration Guide for High Availability Best Practices を参照
MAA @ Customer XYZ Oracle EM インフラストラクチャの各コンポーネントに高可用性を構築 障害シナリオ DB ノード障害 使用する機能 Oracle RAC システムの配置 Oracle RAC 障害 - NIC/ カード 投票 OCR など ストレージ ディスク障害 Oracle RAC のすべてのベスト プラクティスを配置 ASN Disk のミラー化 OMS ノード障害 2 つの OMS ノードを Cisco ロードバランサおよび GSS に接続 XML 共有アップロード ファイル障害 ロードバランサ障害 デュアル クラスタの使用による Netapps HA 機能 アクティブ / パッシブ モード構成 サイトの完全障害 障害サイト
障害シナリオ - XYZ プライマリ スタンバイ OMS ノード Oracle RAC ノード エージェント REDO 送信
バックアップとリカバリ Oracle Management Repository HA/ セキュリティ Oracle Management Agent(OMA) DB Grid Control Console Oracle Management Service(OMS) データベースのバックアップおよびリカバリに標準データベース ツールを使用 ケース 1: 同じホストで完全リカバリ -- Oracle EM への特別な配慮なし 新規ホストでは リポジトリ ターゲットを修正 ケース 2: 部分 / ポイント イン タイム リカバリ - エージェントが再同期化の正しいソースおよびステート情報となる Oracle Management Repository(OMR) emctl resync repos
バックアップとリカバリ Oracle Management Service HA/ セキュリティ Oracle Management Agent(OMA) DB Grid Control Console Oracle Management Repository(OMR) Oracle Management Service(OMS) Oracle Management Service は ( ほとんどの場合 ) ステートレス いくつかの形式のディスク ミラー化によって受信ディレクトリを保護 次によって OMS 構成をバックアップ : Emctl exportconfig 方法 1: ソフトウェア ディレクトリ構造をバックアップ / リストア 同じディレクトリ パスへリストア 方法 2: 元のメディアから再インストールしてベースラインを取得 保存した OMS 構成をリストア Emctl importconfig
バックアップとリカバリ Oracle Management Agent HA/ セキュリティ Oracle Management Agent(OMA) DB 方法 1: ディスクのバックアップおよびリストア 方法 2: 元のメディアから再インストール Grid Control Console Oracle Management Repository(OMR) Oracle Management Service(OMS) リポジトリを正しいソースとして考慮 リポジトリからステート情報を再構築 Emcli resyncagent
最大可用性アーキテクチャの参照先 Metalink Note 330072.1 - High Availability for EM Oracle EM Grid Control Certification チェッカーをチェックアウト (Metalink Note 412431.1) ドキュメント セット インストールおよび構成ガイド 第 17 章 "Grid Control Common Configurations" 第 18 章 "Configuring Enterprise Manager for Active Passive Environments" 管理者ガイド 第 10 章 "Backup, Recovery and Disaster Recovery" http://www.oracle.com/technology/deploy/availability/htdocs /maa.htm ドキュメント セットの改訂および更新中に公開された データベースおよび Grid Control のベスト プラクティス ガイダンスが含まれます
Oracle EM インフラストラクチャ セキュリティ インストール後のステップとしてのセキュアなOracle Enterprise Manager Oracle Management Service(OMS) Oracle Management Repository(OMR) セキュアでないサービスを削除することにより Oracle Management Service および Repository マシンを強化 Enterprise Manager コンポーネントの保護 HA/ セキュリティ Oracle Management Agent(OMA) SSL v3 ASO SSL v3 データベース セキュリティのベスト プラクティスを Repository に Oracle Application Server Security のベスト プラクティスを OMS に適用 OMS および Repository をファイアウォールの内側に配置 OMS Repository への IP アドレス経由のネットワーク アクセスを制限 Oracle ホームの所有者への Impersonation ベースのアクセスを使用 セキュアな通信の構成 データベース アプリケーション サーバー アプリケーション OMS と Repository 間の通信の Advanced Security Option を有効化 既知の認証局からの認証を使用
エージェントのセキュリティ Enterprise Manager をセキュアに維持 HA/ セキュリティ Oracle Management Repository(OMR) Grid Control Oracle Management コンソール Service(OMS) SSH エージェントの作成段階 Oracle Management Agent(OMA) データベースアプリケーション アプリケーションサーバー エージェントの新規 ( 大量 ) 配置 OMS とホスト サーバー間で SSH を使用する 'Agent Deploy' を使用 エージェントの保護 emctl secure agent OMS との通信の保護 アップロード中のデータから不正なエージェントを防止 最新の CPU/PSU が Enterprise Manager のすべてのコンポーネントに適用されることを確認
Enterprise Manager のユーザー セキュリティ Grid Control 認証 HA/ セキュリティ OSSO LDAP サーバー リポジトリベースの認証 ( デフォルト ) パスワード プロファイルを有効化してパスワード コントロールを強化 デフォルト Oracle Management EUS Oracle シングル サインオン (SSO) または Enterprise User Security(EUS) のユーザー認証をサポート エンタープライズ全体の ID 管理の簡素化 SSO および EUS により ユーザーは LDAP サーバーに保存された資格証明を使用することで Grid Control への認証が可能
Enterprise Manager のユーザー セキュリティ 認可と監視 HA/ セキュリティ 監視 リソース : ターゲット ジョブ レポート オペレーション : ブラックアウト 構成 Oracle Enterprise Manager Roles and Privilege Propagating Group 最小限の権限のみを付与 最小権限の原則に追随 10.2.0.5 のファイングレインな新しい権限 アクセス制御管理の簡素化 個々の権限ではなくロールをユーザーに付与 Privilege Propagation グループと共にロールを使用 Enterprise Manager のユーザー アクションを監視 Enterprise Manager Auditing の有効化 外部化サービスを構成し 監査データを Repository から外部システムへパージ
Enterprise Manager のユーザー セキュリティ 認可と監視 HA/ セキュリティ 監視 リソース : ターゲット ジョブ レポート オペレーション : ブラックアウト 構成 Oracle Enterprise Manager Roles and Privilege Propagating Group 最小限の権限のみを付与 最小権限の原則に追随 10.2.0.5 のファイングレインな新しい権限 アクセス制御管理の簡素化 個々の権限ではなくロールをユーザーに付与 Privilege Propagation グループと共にロールを使用 Enterprise Manager のユーザー アクションを監視 Enterprise Manager Auditing の有効化 外部化サービスを構成し 監査データを Repository から外部システムへパージ
Enterprise Manager のセキュリティ ファイアウォールの考慮事項 HA/ セキュリティ HTML コンソール : AS Control へ接続 ホスト エージェント ターゲット ホスト エージェント EM GC (HTTP および HTTPS で同じ ) OMS ターゲット Webcache HTML コンソール : Webcache へ接続 DB ターゲット リポジトリ HTML コンソール : Apache へ接続
Management Agents の監視 監視 エージェント ログ ファイル Emagent.log/trc/nohup 管理サーバーおよびリポンジトリ ページ エージェント サブタブ Emdiagレポートを使用してアラートを生成 リスナーの問題によりターゲットが減少
管理サーバーの監視 監視 Enterprise Managerでの監視 OPMN J2EEおよびOMSログ ファイル $OH/opmn/logs/* $OH/j2ee/OC4J_EM/log/*/* $OH/sysman/log/* 管理サーバーおよびリポンジトリ ページ バックログ インジケータ ロード中のデータ ファイルのバックログ 送信待ちの通知 ジョブ ステップのバックログ
ターゲット構成の監視 監視 正しく構成されないターゲット 不正なORACLE_HOME 不正なデータベース パスワード 不正なロール (Oracle ASM/Oracle Data Guard) エージェント構成 クロックの偏り - EMDiagでレポート 通信の問題
管理リポジトリの監視 監視 Enterprise Managerでの監視 アラート ログ データベース診断 ADDM AWR ASH 領域の監視 Oracleホームの空き領域 毎日のヘルス チェック リソース / パフォーマンス リポジトリ オペレーション データ処理 内部のハウスキーピング
Enterprise Manager Diagnostics (EMDiag) 監視 AGTVFY エージェントの診断 - 検証 / 検出 $ agtvfy verify all -level 9 - エージェント統計 $ agtvfy show targets リポジトリ診断 REPVFY - 検証 / 検出 $ agtvfy verify all -level 9 - ダンプ $ repvfy dump health ヘルプ スクリーンの取得 : $ agtvfy -h ヘルプ スクリーンの取得 : $ repvfy -h 詳細は My Oracle Support を参照してください 421053.1: EMDiagkit Download and Master Index
Enterprise Manager Diagnostics (EMDiag) 監視 Enterprise Manager の正しいコンポーネントから正しいデータを取得し Oracle Support との通信を効率化 通常のケースまたは複数のコンポーネントを含むケース向けの RDA リポジトリからの情報 : - エラー ログ $ repvfy dump errors - システム情報 $ repvfy dump system OMS から必要な情報 : - ログ ファイル (OPMN J2EE および SYSMAN ログ ) - システム情報 $ repvfy dump system エージェントから必要な情報 : - ログ ファイル $ agtvfy zip log - Config ファイル $ agtvfy zip config
ネットワーク通信問題の診断 監視 すべての Enterprise Manager 層はネットワーク経由で通信 - OMS -> リポジトリ :Oracle Net - エージェント <-> OMS:HTTP(S) - 管理者 <-> OMS:HTTP(S) 使用可能なネットワーク ツール層間の通信をテスト - 統計およびスループット :netstat - 接続のテスト :traceroute - ネットワーク待機時間 :ping, tnsping 使用可能な Web ツール Enterprise Manager アプリケーションの応答をテスト - URL ページ グラバー :wget lynx - スクリプティング :perl
Enterprise Manager のハウスキーピング ハウスキーピング ルーチン メンテナンスの理由 Oracle EM Grid Control のパフォーマンスに重要 以下によって停止を防止 すべての層の監視 動向の観察 使用法 / リソース 可用性 アラートの頻繁な " 振動 " や " 洪水 " を削減 永続的に " ダウン " しているターゲットの削除 初期の警告サインの検出 ログ ファイルのメッセージ 繰り返されるエラー / メッセージ
Enterprise Manager のハウスキーピング ハウスキーピング 週ごとの " オンライン " タスク システム エラーの解決 メトリック収集エラーの解決 すべてのオープン アラートの解決 常にダウン 重複または構成されないターゲットの解決 リポジトリ データベースのデータベース アラート ログ エラーの解決 月ごとの " オフライン " タスク AWR Segment Advisor のすべての推奨事項の実装の検討
Enterprise Manager のパフォーマンス チューニング チューニング 管理リポジトリ リポジトリ システムの CPU メモリ およびディスク使用率の監視 リポジトリ データベースの監視 一般的なパフォーマンス ボトルネックの原因 : ハウスキーピング タスクの未実施 ハードウェア / ソフトウェアの不正な構成 不十分なハードウェア リソース 根本原因を特定する動向のバイタルサイン
Enterprise Manager のチューニングのバイタルサイン ローダーのバイタルサイン 時間実行のパーセント 1 秒ごとのローダー スループット ( 行 / 秒 / スレッド ) ロールアップのバイタルサイン ロールアップ ジョブの時間実行のパーセント 1 秒ごとのロールアップ スループット ( 行 / 秒 ) ジョブ 通知 アラートのバイタルサイン I/O のバイタルサイン Management Repository インスタンスからデータ ファイルへのディスク I/O 管理サーバーと管理リポジトリ間のネットワーク I/O Oracle RAC インターコネクト ( ネットワーク )I/O 注 : Oracle EM のバイタルサインについて詳しくは OEM Advance Configuration 10g Release 5 ガイド を参照してください チューニング
Enterprise Manager の使用による Enterprise Manager のチューニング チューニング 遅い UI ページ OC4Jサーブレット レベルでのエンド ツー エンドのページ監視 各 URLのOC4Jパフォーマンス サーブレット時間 JSP 時間 EJBメソッド時間 JDBC 時間 SQL 問合せに分割したJDBD 時間 SQL 問合せのピンポイント ボトルネック
Enterprise Manager の管理変更のバイタルサインを推定 変更管理 良好なパフォーマンス中にベースラインを取得することが鍵 ターゲット データへの完全な影響を見るには 31 日間待機 ベースラインから動向を調査 変更率により 将来のリソース要件の正確な予測が可能
変更管理 変更管理 ターゲット数 ターゲット タイプへのすべての変更 ネットワーク ストレージおよびサーバー インフラストラクチャへのすべての変更 監視ポリシー しきい値へのすべての変更 すべての新機能 / 機能 リリース アップグレードの計画
実装時の考慮事項 リポジトリ データベースの配置 10.2.0.4 または 11.1.0.7 SLB 構成 - ベスト プラクティスの使用 エージェントの配置 配置方法の選択 ターゲットの監視 ポリシーの定義 組織の要件が基本 高可用性および定期的なテストに向けて Enterprise Manager を構成 初期設定 テストおよび継続的なテスト Enterprise Manager の保護 通信および暗号化キー 優先接続情報
実装時の考慮事項 目標と計画の位置合わせ - 実績のある手法を使用 ビジネス ケース データセンター管理全体へ統合 カスタマイズ 拡張機能およびプロセス調整 さまざまなレベルでのトレーニング
質問
追加情報 search.oracle.com Oracle Enterprise Manager または oracle.com