まずは、Pacemakerを使ってみよう!

Similar documents
実演!Pacemakerで楽々クラスタリング

実演!Pacemakerで楽々クラスタリング OSC2011Tokyo/Spring

Pacemakerでかんたんクラスタリング体験してみよう

Pacemaker + KVMで仮想化クラスタリング ~仮想化連携機能のご紹介~ OSC2011Tokyo/Fall

挑戦!Pacemakerで自由自在にHAクラスタリング

HAクラスタをフェイルオーバ失敗から救おう!

HAクラスタでPostgreSQLを高可用化(前編)

スライド 1

Heartbeat + Xenで仮想化クラスタリングしてみよう!

自己紹介 名前 所属 飯田雄介 ( いいだゆうすけ ) 主な活動 Linux-HA Japan プロジェクト Pacemaker 本体の機能改善や 外部ツールの開発を行っています Linux-HA Japan から pm_logconv や pm_crmgen といったツールを提供しています 2

別紙 : 検証環境の構築手順 ( 章 ) 1. サーバ設定 1.1 IP アドレス設定 サーバは以下の 6 台を用いる pgpool-ii サーバ 2 台 DB サーバ 3 台 上位サーバ 1 台 OS は全サーバで CentOS 6.4 x86_64 とする pgpool-ii のサー

2

目次 Pacemaker ってなに? Pacemaker の設定とは? Pacemaker のリソース設定 リソース定義 パラメータ設定 リソース種類選択 リソース制約 クラスタ設定 さいごに Linux-HA Japan の紹介 Linux-HA Japan Project 2

SRA OSS, Inc. ホワイトペーパー IBM Power Systems (Linux) における PaceMaker/DRBD/PostgreSQL/pgpool-II 動作検証 2011 年 10 月 1 日 SRA OSS,Inc. 日本支社 Copyright 2011SRA OSS

改版履歴 版数改版履歴改版年月日 1 新規作成 2013/3/29 2 TESTIO_MODE を追加 OVER_ACTION VG_STALL_ACTION の設定値を変更 2013/9/30 3 CLUSTERPRO MC StorageSaver for BootDisk (for Linux

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2015/03/31 Page 2 NEC Corporation 2015

スライド 1

スライド 1

<48554C46545F F A5490E08E9197BF2E786C73>

SAMBA Stunnel(Mac) 編 1. インストール 1 セキュア SAMBA の URL にアクセスし ログインを行います xxxxx 部分は会社様によって異なります xxxxx 2 Mac OS 版ダウンロー

PC にソフトをインストールすることによって OpenVPN でセキュア SAMBA へ接続することができます 注意 OpenVPN 接続は仮想 IP を使用します ローカル環境にて IP 設定が被らない事をご確認下さい 万が一仮想 IP とローカル環境 IP が被るとローカル環境内接続が行えなくな

<MW-400k > InterSec/MW400k アップデート適用手順書 2017 年 8 月 1 版

Microsoft Word - クライアントのインストールと接続設定

CLUSTERPRO MC StorageSaver 1.2 for Linux パラメータシート 第 4 版 2014 年 3 月 31 日 日本電気株式会社

HAクラスタで PostgreSQLを高可用化 (後編) ~ レプリケーション編 ~

改版履歴 版数改版履歴改版年月日 1.0 新規作成 2013/03/ OverAction と DiskStallAction の値変更 (ActionNone ServiceCmdDisable ProcessOfRdmstatKillEnable ServiceCmdEnable)

Microsoft Word - ssVPN MacOS クライアントマニュアル_120版.doc

テーマ Pacemaker-1.1 を味わうための 便利 な使い方 ~ 保守運用に活用しよう ~ Pacemaker で対応する 故障 ケースの起こし方と復旧手順 ~ 事前に動作検証しよう ~ 実際の構築運用シーンで起きる問題の 解決 方法 ~ よくある問題を理解しよう ~ 2

Microsoft Word - HAクラスタ構築手順書.doc

3 検証結果 3.1 ソフトウェアのインストール Red Hat Enterprise Linux 5.7 は最小構成でインストールし 最新バージョンにアップデートした Thirdware Linux-HA を構成するパッケージ (DRBD Heartbeat Pacemaker) は LINBIT

SAMBA Stunnel(Windows) 編 1. インストール 1 セキュア SAMBA の URL にアクセスし ログインを行います xxx 部分は会社様によって異なります xxxxx 2 Windows 版ダウンロード ボ

目次 1 環境 バージョン インストール環境 インストール手順 前提条件 CentOS SSHD の設定 VSFTPD の設定 コンテンツ管理 CGI のイ

XEN 仮想マシンの移植 Islandcenter.jp 2009/04/14 既に作成済みの XEN 仮想マシンを移植する方法を説明します 仮想マシンイメージは 通常 /var/lib/xen/image/myvmachine に作成されていますが このファイルを tar 圧縮してリムーバブルメデ

HAクラスタで PostgreSQLを高可用化 (後編) ~ レプリケーション編 ~

Symantec AntiVirus の設定

ServerView RAID Manager VMware vSphere ESXi 6 インストールガイド

CLUSTERPRO/システム構築ガイド

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows FAQ 集 2013(Mar) NEC Corporation 導入に関する質問 運用に関する質問 動作環境に関する質問

<4D F736F F F696E74202D E656D6F73837D836C815B C B CC90DA91B182CC8E DD82F0979D89F082B582E682A F38DFC E >

人と地球にやさしい情報社会を イノベーションで実現する グローバルリーディングカンパニー NEC グループビジョン 2017 Page 2

Cuoreテンプレート

Maser - User Operation Manual

音声認識サーバのインストールと設定

SAMBA Remote(Mac) 編 PC にソフトをインストールすることによって OpenVPN でセキュア SAMBA へ接続することができます 注意 OpenVPN 接続は仮想 IP を使用します ローカル環境にて IP 設定が被らない事をご確認下さい 万が一仮想 IP とローカル環境 IP

Confidential

ESMPRO/ServerManager Ver. 6 変更履歴

AGT10(Android (TM) 2.3) ファームウェア更新方法

スキルブレイン株式会社 LPI-Japan 主催 LPIC 304 技術解説セミナー LPI-Japan アカデミック認定校スキルブレイン株式会社河原木忠司 LPI-Japan All rights reserved.

防災マップ作成システムの開発業務基本設計書

目次 1. 動作環境チェック 動作必要環境 Java のインストール Java のインストール Firebird のインストール Firebird のインストール Adobe Reader のインストール

ServerView RAID Manager VMware vSphere ESXi 5 インストールガイド

2-3- 基 Linux のシステム管理に関する知識 1 独立行政法人情報処理推進機構

スライド 1

Windows Server 2003 Service Pack 適用手順書

ServerView Resource Orchestrator V3.0 ネットワーク構成情報ファイルツール(Excel形式)の利用方法

Windows Server 2003 Service Pack 適用手順書

iExpressソフトフォン TE20-ST-EX

SIOS Protection Suite for Linux v9.3.2 AWS Direct Connect 接続クイックスタートガイド 2019 年 4 月

CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

CLUSTERPRO MC StorageSaver 2.0 for Windows 導入ガイド 第 1 版 2015 年 3 月 日本電気株式会社

Administration of Veritas Cluster Server 6.0 for UNIX の管理練習問題 例題 1. installvcs -installonly が正常に実行されたことが記録されるテキストファイルは次のどれですか (2 つ選択 ) a. インストールログ b.

目次 メールの基本設定内容 2 メールの設定方法 Windows Vista / Windows 7 (Windows Live Mail) Windows 8 / Windows 10 (Mozilla Thunderbird) 3 5 Windows (Outlook 2016) メ

オフラインメンテナンス説明書-ver5.0.0

ServerView RAID Manager VMware vSphere ESXi 5 インストールガイド

PostgreSQL Plus 管理者ガイド

VPN 接続の設定

iRMC S4 ご使用上の留意・注意事項

LINE WORKS 管理者トレーニング 4. セキュリティ管理 Ver 年 6 月版

McAfee Application Control ご紹介

共有フォルダ接続手順 1 共有フォルダ接続ツールのダウンロード 展開 CSVEX のトップページから共有フォルダ接続ツールの zip ファイルをダウンロードします ダウンロードした zip ファイルを右クリックして すべて展開 を選択します (Windows 環境では zip ファイルを解凍しなくて

PowerPoint プレゼンテーション

AutoSlideGenerator

Microsoft Word - SE第15回.doc

CLUSTERPRO MC StorageSaver 1.1 for Linux リリースメモ 2015(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

Pacemake-1.0とは違うのだよ、1.0とは! ~Pacemaker-1.1新機能のご紹介~

Airwave_upgrade.pdf

How to Install and Configure Panorama Panorama のインストールと設定 Panorama は Palo Alto Networks のサポートサイトからダウンロード可能な VMware イメージです 本書は Panorama のインストールと Panora

Microsoft Word - qtsi_120246jp_rhev.doc

Mobile Access簡易設定ガイド

平成22年度「技報」原稿の執筆について


Microsoft Word - nvsi_090203_r1_sanboot_vaultdr.doc

2013年『STSSスキルコミュニティ』 テーマ別Kickoff資料

ユーザーライセンス管理ツール操作マニュアル

CLUSTERPRO X IIJ GIO インフラストラクチャー P2 動作検証報告 2017 年 11 月日本電気株式会社クラウドプラットフォーム事業部 CLUSTERPROグループ 1 NEC Corporation 2017

Cisco Unified Communications Manager サーバ アドレスとユーザ名の自動的な入力

BR5010ESLTE-GW 取扱説明書 ログ編 第 1.0 版 2018 年 2 月

目次 1. 概要 製品構成 用語集 SECUDRIVE Device Control Basic インストールUSBメモリの構成 プログラムのインストール 体験版から正規版への変更

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

HDC-EDI Manager Ver レベルアップ詳細情報 < 製品一覧 > 製品名バージョン HDC-EDI Manager < 対応 JavaVM> Java 2 Software Development Kit, Standard Edition 1.4 Java 2

PowerPoint プレゼンテーション

日本 PostgreSQL ユーザ会第 28 回しくみ + アプリケーション勉強会 Zabbix を使って PostgreSQL を監視してみよう 2014 年 2 月 1 日 TIS 株式会社中西剛紀 (Yoshinori Nakanishi)

Microsoft Word - Setup_Guide

Microsoft Word - nvsi_090200jp_r1_nvbsvr_mscs.doc

レプリケーションについて レプリケーション元に設定したメイン機の共有フォルダーと レプリケーション先に指定した予備機の共有フォルダーを同期し 同じ状態に保ちます (LAN 環境により遅延が発生します ) 遠隔地へのレプリケーションにより メイン機側での災害 事故によるデータ損失のリスク低減ができます

eo 光ベーシックルータ (BAR1G01) 取扱説明書 (Ver1.0) 1 目次 1. 設定画面を開く ステータス画面で接続状態を確認する 基本設定 インターネット接続設定 DHCPサーバー機能設定 IPアドレ

CLUSTERPRO MC ProcessSaver 2.1 for Windows 構築ガイド 2016(Mar) NEC Corporation はじめに 責任範囲 適用範囲 概要 事前準備 クラスタ設定

Microsoft Word - FTTH各種設定手順書(鏡野地域対応_XP項目削除) docx

Office365 AL-Mail

はじめに 1. 概要本書では SuitePRO V3 にて提供している迷惑メールフィルタのバージョンアップ手順について案内しています なお この手順につきましては 迷惑メールフィルタ機能について オンラインマニュアルの内容通りに設定されていることを前提条件とします

Transcription:

第 3 回 Linux-HA Japan 勉強会 まずは Pacemaker を 使ってみよう! 2011 年 7 月 1 日 @ パソナグループ本部ビル Linux-HA Japan プロジェクト田中崇幸 Linux-HA Japan Project 1

自己紹介 名前 : 田中崇幸 (Takayuki Tanaka) Twitter: @tanakacchi21 所属 : Linux-HA Japan プロジェクト コミュニティ旗揚時のメンバー Pacemaker 普及促進のため 講演で全国行脚中 趣味 : マラソン 野球観戦 サッカー観戦 念願のサブスリーを達成したばかりの市民マラソンランナー 道産子なので 北海道日本ハムファイターズ と コンサドーレ札幌 の大ファン Linux-HA Japan Project 2

本日のお話 1 本日の Pacemaker デモ環境 2 インストール 設定をデモします! 3 フェイルオーバ 系切り替えをデモします! Linux-HA Japan Project 3

1 本日の Pacemaker デモ環境 Linux-HA Japan Project 4

本日の Pacemaker デモ環境 ハードウェア ノート PC (Core2Duo 2.26MHz メモリ 2G) OS CentOS 5.6 x86_64 HA クラスタ Pacemaker-1.0.11 ( インストールのデモを行います ) クラスタ化するアプリケーション PostgreSQL 9.0.4 ( インストール済み ) 仮想環境 Xen (CentOS 5.6 同梱版 ) Domain-U は 2 ドメインで構成 各ドメインには CPU 1 メモリ 480M を割り当て Linux-HA Japan Project 5

Pacemaker デモ構成 demo (Domain-0) サービス LAN 仮想 IP 192.168.0.100 pm1 192.168.0.22 192.168.10.22 インターコネクト LAN1 192.168.0.23 192.168.10.23 pm2 PostgreSQL 192.168.20.22 インターコネクト LAN2 192.168.20.23 HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 DB 領域 /dev/xvdb2 管理用 LAN Linux-HA Japan Project 6

Pacemaker デモ機構成 (Xen 仮想 NW) demo (Domain-0) pm1 (Domain-U) eth3 xenbr0 ( サービス LAN 用ブリッジ ) pdummy0 xenbr1 ( インターコネクト LAN1 用ブリッジ ) pdummy1 eth3 pm2 (Domain-U) xenbr2 ( インターコネクト LAN2 用ブリッジ ) pdummy2 xenbr3 ( 管理 LAN 用ブリッジ ) p dummy0 dummy1 dummy2 Linux-HA Japan Project 7

Pacemaker デモ機構成 (Xen 仮想ディスク ) pm1 (Domain-U) demo (Domain-0) pm2 (Domain-U) /dev/xvda1 (OS 領域 ) /dev/xvda2 (swap) /dev/xvda pm1 OS 領域 /dev/lvm/pm1 pm2 OS 領域 /dev/lvm/pm2 /dev/xvda /dev/xvda1 (OS 領域 ) /dev/xvda2 (swap) /dev/xvdb1 ( 排他制御 ) /dev/xvdb2 (DB 領域 ) /dev/xvdb 共有データ領域 /dev/lvm/shared-disk1 /dev/xvdb /dev/xvdb1 ( 排他制御 ) /dev/xvdb2 (DB 領域 ) Linux-HA Japan Project 8

Pacemaker デモ リソース構成 これら 4 つのリソースはグループ設定します ディスク排他制御 (sfex) 共有ディスクの排他制御を行います DB データ領域マウント (Filesystem) 共有ディスクにある DB データ領域のマウント制御を行います 仮想 IP 割り当て (IPaddr2) サービス提供用の仮想 IP を割り当てます PostgreSQL 制御 (pgsql) PostgreSQL 9.0.4 の制御を行います Linux-HA Japan Project 9

本日は STONITH のデモも行います STONITH (stonith-helper, xen0, meatclient) STONITH は Shoot The Other Node In The Head の略で監視対象サーバの異常を検出したときに 強制的にそのサーバをダウンさせるノードフェンシングを行います ネットワーク監視 (pingd) 指定した IP アドレスに ping 送信し ネットワーク疎通があるかどうかの監視を行います ディスク監視 (diskd) 指定したディスクデバイスにアクセスし ディスクの正常性確認を行います Linux-HA Japan Project 10

STONITH 実行例 ( スプリットブレイン ) STONITH pm1 切断 pm2 HW 制御ボード インターコネクトとは別の通信経路で HW 制御ボードに対しリセットを実行 HW 制御ボード OS と連動しない HW 制御ボードから強制電源断 Linux-HA Japan Project 11

STONITH 実行例 ( リソース停止失敗 ) STONITH pm1 リソース リソース故障 pm2 停止処理失敗 リソース HW 制御ボード STONITH 成功後 リソースがフェイルオーバ HW 制御ボード リソース故障時 フェイルオーバしようとして リソース停止失敗または停止タイムアウト Linux-HA Japan Project 12

Pacemaker デモ機フェンシング (STONITH) 構成 demo (Domain-0) pm1 (Domain-U) STONITH eth3 xenbr0 ( サービス LAN 用ブリッジ ) pdummy0 xenbr1 ( インターコネクト LAN1 用ブリッジ ) eth3 pm2 (Domain-U) pdummy1 xen0 STONITH プラグインを使用し xenbr3 経由で STONITH を実行する xenbr2 ( インターコネクト LAN2 用ブリッジ ) pdummy2 xenbr3 ( 管理 LAN 用ブリッジ ) p dummy0 xm destroy dummy1pm2 dummy2 SSH Linux-HA Japan Project 13

2 インストール 設定を デモします! Linux-HA Japan Project 14

インストール方法の種類 1. yum を使ってネットワークインストール Pacemaker 本家 (clusterlabs) の yumのリポジトリを使用サーバにインターネット接続必須 2. ローカルリポジトリ + yum を使ってインストール Linux-HA Japan 提供のリポジトリパッケージを使用 Linux-HA Japan オリジナルパッケージも含まれる 3. rpm を手動でインストール 沢山の rpm を個別にダウンロードする必要あり 4. ソースからインストール 最新の機能をいち早く試せる コンポーネントが多いので コンパイルは面倒 本日は 2 の構築デモを行います Linux-HA Japan Project 15

~ ローカルリポジトリ + yum を使ってインストール ~ ( サーバにインターネット接続環境がなくても OK!) 1. Pacemaker リポジトリパッケージをダウンロード Linux-HA Japan 提供の Pacemaker リポジトリパッケージを sourceforge.jp からダウンロードしておきます pacemaker-1.0.11-1.2.1.el5.x86_64.repo.tar.gz をダウンロード Pacemaker-1.0.11-1.2.1 版は版は 7 月上旬リリース予定 Linux-HA Japan Project 16

2. yum でインストール! /tmp で展開し yum コマンドでインストールします # cd cd /tmp # tar tar zxvf pacemaker-1.0.11-1.2.1.el5.x86_64.repo.tar.gz # cd cd /tmp/pacemaker-1.0.11-1.2.1.el5.x86_64.repo/ # yum c c pacemaker.repo install pacemaker pm_crmgen pm_diskd pm_logconv-hb pm_extras pm_crmgen-1.1-1.el5.noarch.rpm crm 用設定ファイル編集ツール pm_diskd-1.0-1.el5.x86_64.rpm ディスク監視アプリとRA pm_logconv-hb-1.1-1.el5.noarch.rpm ログ変換ツール pm_extras-1.1-1.el5.x86_64.rpm その他オリジナル RA 等 ぜひぜひ使ってみてください! Linux-HA Japan Project 17

ここでやっと Pacemaker インストールを デモします! Linux-HA Japan Project 18

クラスタ制御部基本設定 /etc/ha.d/ha.cf クラスタ制御部の基本設定ファイル クラスタ内の全サーバに同じ内容のファイルを設置 pacemaker on on debug debug 0 udpport 694 694 keepalive 2 warntime 7 deadtime 10 10 initdead 48 48 logfacility local1 local1 bcast bcast bcast bcast node node pm1 pm1 node node pm2 pm2 watchdog /dev/watchdog respawn root root /usr/lib64/heartbeat/ifcheckd pm_extras をインストールし この ifcheckd の設定を追加すればインターコネクト LAN の接続状況も確認可能です Linux-HA Japan Project 19

クラスタ制御部基本設定 /etc/ha.d/authkeys サーバ間の 認証キー を設定するファイル クラスタ内の全サーバに 同じ内容のファイルを配置 所有ユーザ / グループ パーミッションは root/root rw---- に設定 auth auth 1 1 sha1 hogehoge これも基本的に Heartbeat2 と設定は同じです 認証キー : 任意の文字列 認証キーの計算方法 :sha1, md5, crc を指定可 Linux-HA Japan Project 20

クラスタ制御部基本設定 /etc/syslog.conf 必須の設定ではないが 多くのログが /var/log/messages に出力されるため出力先を個別のファイルに変更するのがお勧め local1.info を使用し /var/log/ha-log へ出力する場合の例 *.info;mail.none;authpriv.none;cron.none;local1.none /var/log/messages : ( 省略省略 ) : local1.info /var/log/ha-log ha.cf で設定した logfacility 名 Linux-HA Japan Project 21

ここまでいけば Pacemaker が起動できます! # /etc/init.d/heartbeat start 2 サーバで実行 Starting High-Availability services: [[ OK ]] Linux-HA Japan Project 22

ということで Pacemaker を起動してみます! Linux-HA Japan Project 23

起動確認 Pacemaker の状態表示コマンドである crm_mon コマンドを利用します # crm_mon ============ Last Last updated: Fri Fri Jun Jun 24 2411:51:30 2011 2011 Stack: Stack: Heartbeat Current Current DC: DC: pm2 pm2 (2d9dccc6-e3db-486c-b028-15fea6bc9567) -- partition with with quorum Version: 1.0.11-1554a83db0d3c3e546cfd3aaff6af1184f79ee87 2 Nodes Nodes configured, unknown expected votes votes 0 Resources configured. ============ Online: Online: [[ pm1 pm1 pm2 pm2 ]] クラスタに組み込まれているサーバ名が表示されます Linux-HA Japan Project 24 Linux-HA Japan Project

-fa オプションを付与すると インターコネクト LAN の接続状況も確認可能です # crm_mon -fa -fa ============ ~ 省略省略 ~ ============ Online: Online: [[ pm1 pm1 pm2 pm2 ]] Node Node Attributes: ** Node Node pm1: pm1: + pm2- :: up up + pm2- :: up up ** Node Node pm2: pm2: + pm1- :: up up + pm1- :: up up インターコネクトが UP されているのが確認可能 Linux-HA Japan Project 25

ここで Pacemaker 状態表示と インターコネクト LAN 故障を デモします! デモ例は次ページ Linux-HA Japan Project 26

インターコネクト LAN1 を故障させてみる デモ 1 サービス LAN pm1 192.168.0.22 192.168.10.22 疑似故障 # ifdown 故障 192.168.0.23 192.168.10.23 pm2 DC 192.168.20.22 192.168.20.23 HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 DB 領域 /dev/xvdb2 管理用 LAN Linux-HA Japan Project 27

これだけでは リソース設定が無いのでなーんにもアプリケーションは起動していません Linux-HA Japan Project 28

リソース計画 リソース制御するには事前に計画が必要 リソースの選択 Apache PostgreSQL NW 監視など 何を使用するか? リソースエージェント (RA) がなければ 予め自作してみるか? リソースの動作の定義 リソースの監視 (monitor) 間隔は何秒にするか? タイムアウトは? 故障時はどのように動作させるか? リソースエージェント (RA) に与えるパラメータは? リソース配置 連携の定義 リソースをどのサーバで起動させるか? リソースの起動順番は? Linux-HA Japan Project 29

リソース設定方法 主に 2 通り cib.xml ファイルに XML 形式で設定を記述 従来のHeartbeat 2での方法 XMLを手で書く必要があり面倒 crm コマンドで設定 Pacemakerからの新機能 crmファイル編集ツールは Linux-HA Japanより提供本日は crm ファイル編集ツールを使用して構築デモを行います Linux-HA Japan Project 30

crm ファイル編集ツール pm_crmgen 6/6 6/6 に pm_crmgen 1.1 1.1 版を版をリリース Linux-HA Japan で crm ファイル編集ツールを提供中! Excel のテンプレートファイルから簡単に crm 用設定ファイルを生成してくれるツールです リポジトリパッケージに含まれていますし 個別にダウンロードも可能です http://sourceforge.jp/projects/linux-ha/ Linux-HA Japan Project 31

どのサーバが優先的にActive? NW 監視は? NWが壊れた時の挙動は? STONITHの設定は? など細かい挙動の設定も可能です! Linux-HA Japan Project 32

crm ファイル編集ツール 設定イメージ 1) Excel のテンプレートファイルにリソース定義を記載 /usr/share/pacemaker/pm_crmgen/pm_crmgen_env.xls Excel が使用できる PC にコピーします テンプレートは青枠の中に値を記入していきます ファイルを 本日の仮想デモ環境は この Excel の設定例シートでほとんど構築が可能です! 監視間隔やタイムアウト値 故障時の動作などを入力 Linux-HA Japan Project 33

crm ファイル編集ツール どのサーバを Active にするかといったリソース配置制約の設定も サーバ名を記述するだけで可能です リソース ID ID Active と Standby サーバを指定 Linux-HA Japan Project 34

crm ファイル編集ツール crm 用設定ファイルに変換 2) CSV 形式でファイルを保存 crm_sample.csv などとして CSV 形式で保存 3) CSV ファイルをサーバへ転送 CSVファイル保存後 SCPやFTP 等でpm_crmgenがインストールされたサーバへ転送 Linux-HA Japan Project 35

crm ファイル編集ツール crm 用設定ファイルに変換 4) pm_crmgen コマンドで crm ファイルを生成 # pm_crmgen o o crm_sample.crm crm_sample.csv 生成する設定ファイル名 3) で転送した CSV ファイル 5) crm コマンドを実行してリソース設定を反映 # crm configure load update crm_sample.crm Linux-HA Japan Project 36

共有ディスク排他制御機能 sfex (Shared Disk File EXclusiveness Control Program) sfex は共有ディスクの所有権を制御するリソースです 共有ディスク上のデータパーティションを使うリソースと一緒にリソースグループを作ります 所有権を持ったサーバのリソースのみがデータパーティションにアクセスできます pm1 リソースグループ sfex Filesystem IPaddr2 pgsql 所有権読み書き 接続 OK pm1 sfex 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 所有権読み書き 接続 NG pm2 リソースグループ sfex Filesystem IPaddr2 pgsql Linux-HA Japan Project 37

共有ディスク排他制御機能 (sfex) 排他制御領域の初期化 共有ディスク排他制御機能 (sfex) を使用するためには 排他制御領域を初期化する必要性があります # sfex_init n n 1 /dev/xvdb1 排他制御領域のデバイス名を指定する ext3 などのファイルシステムを作成する必要性はありません Linux-HA Japan Project 38

リソース設定をして サービスの起動と 本当にサービス が起動しているかデモします! デモ例は次ページ Linux-HA Japan Project 39

PostgreSQL に接続してみる demo# pgsql -U postgres -h 192.168.0.100 -l サービスLAN 仮想 IP 192.168.0.100 pm1 PostgreSQL 192.168.0.22 192.168.10.22 192.168.20.22 インターコネクト LAN1 インターコネクト LAN2 192.168.0.23 192.168.10.23 192.168.20.23 pm2 デモ 2 demo(domain-0) DC HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 管理用 LAN Linux-HA Japan Project 40

3 フェイルオーバ 系切り替えを デモします! Linux-HA Japan Project 41

pm1 を強制停止してみる デモ 3 demo# xm destroy pm1 サービス LAN 仮想 IP 192.168.0.100 pm1 192.168.0.22 192.168.10.22 インターコネクト LAN1 192.168.0.23 192.168.10.23 pm2 DC PostgreSQL 192.168.20.22 インターコネクト LAN2 192.168.20.23 HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 DB 領域 /dev/xvdb2 管理用 LAN Linux-HA Japan Project 42

pm2 をスタンバイ化してみる # crm node standby pm2 サービス LAN デモ 4 pm1 192.168.0.22 192.168.10.22 192.168.20.22 インターコネクト LAN1 インターコネクト LAN2 仮想 IP 192.168.0.100 192.168.0.23 192.168.10.23 standby 192.168.20.23 pm2 DC PostgreSQL HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 管理用 LAN Linux-HA Japan Project 43

pm2 をスタンバイ解除してみる # crm node online pm2 サービス LAN デモ 5 pm1 PostgreSQL 192.168.0.22 仮想 IP 192.168.0.100 192.168.10.22 192.168.20.22 インターコネクト LAN1 インターコネクト LAN2 192.168.0.23 192.168.10.23 192.168.20.23 pm2 DC standby Online へ HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 管理用 LAN Linux-HA Japan Project 44

リソース故障させてみる デモ 6 擬似故障 # kill -9 postgresql 親プロセス サービス LAN pm1 192.168.0.22 仮想 IP 192.168.0.100 192.168.10.22 インターコネクト LAN1 192.168.0.23 192.168.10.23 pm2 DC PostgreSQL 故障 192.168.20.22 インターコネクト LAN2 192.168.20.23 HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 eth3 172.20.24.23 HW 制御ボード 172.20.24.21 DB 領域 /dev/xvdb2 管理用 LAN Linux-HA Japan Project 45

この状態で pm2 をスタンバイしてみる # crm node standby pm2 サービス LAN デモ 7 pm1 フェイルカウント 192.168.0.22 192.168.10.22 192.168.20.22 インターコネクト LAN1 インターコネクト LAN2 仮想 IP 192.168.0.100 192.168.0.23 192.168.10.23 192.168.20.23 pm2 DC PostgreSQL HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 standby eth3 172.20.24.23 HW 制御ボード 172.20.24.21 管理用 LAN Linux-HA Japan Project 46

切り替わらないのは ミスではありません! Linux-HA Japan Project 47

フェイルカウントがカウントアップされているため クリアしなければ切り替わりません # crm_mon -fa -fa ============ ~ 省略省略 ~ ============ Migration summary: ** Node pm1: prmpg: migration-threshold=1 fail-count=1 ** Node pm2: Failed actions: prmpg_monitor_10000 (node=pm1, call=34, rc=7, status=complete): not not running Linux-HA Japan Project 48

フェイルカウントをクリアしてみる # crm resource cleanup prmpg pm1 サービスLAN デモ 8 pm1 フェイルカウント クリア HW 制御ボード 172.20.24.21 192.168.0.22 仮想 IP 192.168.0.100 192.168.10.22 192.168.20.22 eth3 172.20.24.22 インターコネクト LAN1 インターコネクト LAN2 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 192.168.0.23 192.168.10.23 192.168.20.23 eth3 172.20.24.23 pm2 DC standby HW 制御ボード 172.20.24.21 管理用 LAN Linux-HA Japan Project 49

pm2 Online 後に スプリットブレイン サービス LAN デモ 9 DC? pm1 PostgreSQL 192.168.0.22 仮想 IP 192.168.0.100 192.168.10.22 192.168.20.22 擬似故障 # ifdown # ifdown インターコネクト LAN1 故障 インターコネクト LAN2 192.168.0.23 192.168.10.23 192.168.20.23 pm2 DC? HW 制御ボード 172.20.24.21 eth3 172.20.24.22 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 eth3 HW 制御ボード 172.20.24.23 172.20.24.21 ダブルマウントでデータ破壊!? 管理用 LAN Linux-HA Japan Project 50

リソース故障時 停止タイムアウト 擬似故障 # kill -9 postgresql 親プロセス サービス LAN デモ 10 DC pm1 故障 PostgreSQL 192.168.0.22 停止タイムアウト HW 制御ボード 172.20.24.21 フェイルオーバ失敗!? 仮想 IP 192.168.0.100 192.168.10.22 192.168.20.22 eth3 172.20.24.22 インターコネクト LAN1 インターコネクト LAN2 排他制御領域 /dev/xvdb1 DB 領域 /dev/xvdb2 管理用 LAN 192.168.0.23 192.168.10.23 192.168.20.23 eth3 172.20.24.23 pm2 HW 制御ボード 172.20.24.21 Linux-HA Japan Project 51