Pacemaker-1.1で 始 める 高 可 用 クラスタ 入 門 ~ 私 が 落 ちても 代 わりはいるもの~ 2015 年 5 月 23 日 OSC2015 Nagoya Linux-HA Japan 竹 下 雄 大
本 日 の 内 容 Pacemakerってなに? 最 新 Pacemaker-1.1.12の 特 徴 をご 紹 介 Pacemakerクラスタを 構 築 してみよう! 故 障 時 の 動 きを 体 験 してみよう! リソース 故 障 今 後 のスケジュール 2
Pacemakerってなに? Pacemakerはオープンソースの HAクラスタソフトです 3
Pacemakerってなに? High Availability = 高 可 用 性 つまり 一 台 のコンピュータでは 得 られない 高 い 信 頼 性 を 得 るために 複 数 のコンピュータを 結 合 (クラスタ 化 )し ひとまとまりとする ためのソフトウェアです サービス 継 続 性 4
Pacemakerってなに? HAクラスタを 導 入 すると 故 障 で 現 用 系 でサービスが 運 用 できなくなったときに 自 動 で 待 機 系 でサービスを 起 動 させます このことを フェイルオーバ と 言 います サービス フェイルオーバ サービス 故 障 現 用 系 待 機 系 5
Pacemakerってなに? は このHAクラスタソフトとして 実 績 のある Heartbeat と 呼 ばれていたソフトの 後 継 です 6
Pacemakerってなに? Pacemakerで 監 視 できること 仮 想 IP アプリケーション 監 視 制 御 起 動 停 止 稼 働 監 視 自 己 監 視 プロセス 監 視 watchdog ネットワーク 監 視 制 御 ping 疎 通 確 認 仮 想 IP 制 御 ノード 監 視 ハートビート 通 信 STONITH( 強 制 電 源 断 ) ディスク 監 視 制 御 ファイルシステム 監 視 共 有 ディスク 排 他 制 御 サーバ#1 サーバ#2 7
Pacemakerってなに? Pacemakerが 起 動 / 停 止 / 監 視 を 制 御 する 対 象 をリソースと 呼 ぶ 例 :Apache PostgreSQL 共 有 ディスク 仮 想 IPアドレス リソースの 制 御 はリソースエージェント(RA)を 介 して 行 う RAが 各 リソースの 操 作 方 法 の 違 いをラップし Pacemakerで 制 御 できるようにして いる 多 くはシェルスクリプト PostgreSQL RA Apache RA リソース エージェント リソース 共 有 ディスク RA 8
スプリットブレインとSTONITH (1) Pacemakerで 管 理 されるノードはインターコネクトLANを 通 して ハート ビート 通 信 によってお 互 いの 状 態 を 把 握 しています 生 きてる? サーバ#1 生 きてるよ! サーバ#2 ハートビート 通 信 が 途 切 れると? ACT 系 :SBY 系 がダウンしたかも?でもサービスは 稼 働 しているから このままでいいか SBY 系 :ACT 系 がダウンしたかも!?サービス 停 止 するかもしれな いから サービスを 起 動 しないと! 両 ACT 状 態 になる(スプリットブレイン) サービスの 両 系 起 動 仮 想 IPアドレスの 競 合 共 有 ディスクの2 重 マウント( 最 悪 の 場 合 データ 破 壊 が 発 生 ) 9
スプリットブレインとSTONITH (2) スプリットブレインを 阻 止 するには? 確 実 (かつ 最 終 的 )な 手 段 はこれ 10
スプリットブレインとSTONITH (3) STONITH (Shoot The Other Node In The Head) 両 ACT 状 態 になる 前 に 対 向 ノードの 強 制 電 源 断 を 実 行 する 機 能 サーバ 付 属 のリモートHW 制 御 ボード(iLOなど)を 利 用 OSと 別 系 統 のネットワークなので 信 頼 性 が 高 い 主 なSTONITHプラグイン ipmi libvirt stonith-helper 用 途 物 理 環 境 で 利 用 OSと 別 系 統 のネットワークを 利 用 するため 信 頼 性 が 高 い ただし iloなどのhw 制 御 ボードが 必 要 libvirtで 制 御 される 仮 想 環 境 で 利 用 ホストマシンからゲストマシンを 強 制 停 止 する スプリットブレイン 発 生 時 に 下 記 の 事 象 を 防 止 する 補 助 プラグイン ( 電 源 断 は 実 行 しない) 正 常 稼 働 中 のACTがSTONITHされること ( 不 必 要 なフェイルオーバの 発 生 ) お 互 いが 同 時 にSTONITHを 実 行 し 両 系 ダウン( 相 撃 ち) Linux-HA Japan 製 のプラグイン Linux-HA Japan 公 式 サイト(http://osdn.jp/projects/linux-ha/)から 取 得 可 能 11
参 考 STONITHプラグインが 使 えない 場 合 のスプリットブレイン 対 策 sfex 共 有 ディスクのsfex 専 用 パーティションに ディスクのロック 情 報 を 定 期 的 に 書 き 込 む ACT 系 によりロック 情 報 が 更 新 されていれば ACT 系 が 生 存 してい ると 判 断 し SBY 系 でのリソース 起 動 を 抑 止 VIPcheck SBY 系 からACT 系 のVIPに 対 してpingを 送 信 ping 応 答 があれば ACT 系 が 生 存 していると 判 断 し SBY 系 でのリ ソース 起 動 を 抑 止 12
最 新 Pacemaker-1.1.12 の 特 徴 をご 紹 介 13
2つのPacemaker Pacemakerには1.0 系 と1.1 系 の2 種 類 が 存 在 します 基 本 機 能 や 管 理 できるリソースに 違 いはありません 何 が 違 うの? コンポーネント 新 機 能 動 作 速 度 の 向 上 Pacemaker-1.0は 開 発 メンテナンスが 終 了 しました どっちを 使 えばいいの?? 新 規 導 入 の 場 合 Pacemaker-1.1の 利 用 をお 勧 めします! 14
Pacemaker-1.0と1.1の 比 較 Pacemaker-1.0 系 Pacemaker-1.1 系 対 応 OS( 1) RHEL 5/6, CentOS 5/6 RHEL 6/7, CentOS 6/7 クラスタ 上 限 ( 2) 6ノード 16ノード クラスタ 起 動 速 度 比 較 的 遅 い 早 い (1.0 系 から7 8 割 程 度 短 縮 ) フェイルオーバ 速 度 比 較 的 遅 い 早 い (1.0 系 から7 割 程 度 短 縮 ) 機 能 Pacemaker-1.0の 機 能 は 踏 襲 Pacemaker-1.1 系 でのみ 利 用 可 能 な 新 機 能 あり( 3) 実 績 たくさん これから 1 Linux-HA Japan 提 供 のリポジトリパッケージを 利 用 する 場 合 2 上 限 値 や 速 度 はLinux-HA Japanでの 検 証 によるもの( 環 境 により 異 なります) 3 Pacemaker-1.1の 性 能 新 機 能 の 詳 細 については 下 記 参 照 http://linux-ha.osdn.jp/wp/archives/4075 15
コンポーネントの 比 較 Pacemakerは 様 々なコンポーネントが 組 み 合 わさって 動 作 します Pacemaker-1.1でコンポーネントが 刷 新 されました Pacemaker- 1.0.13 Pacemaker- 1.1.12 約 4 年 の 期 間 を 経 てメジャー バージョンアップとなります Linux-HA Japan 開 発 ツール pm_logconvなど pm_logconvなど Linux-HA Japanで 開 発 した ツール 類 もPacemaker- 1.1.12に 対 応 済 みです 運 用 管 理 機 能 crmsh-2.1 pcs 0.9.90 運 用 管 理 機 能 としてcrmshと pcsの2 種 類 が 選 択 できるよう になりました STONITHプラグイン リソース 制 御 機 能 共 有 ライブラリ ノード 管 理 機 能 resource-agents- 3.9.5 pacemaker-1.0.13 cluster-glue- 1.0.11 heartbeat- 3.0.5 crmsh corosync- 1.4.6 cluster-glue- 1.0.12 resource-agents- 3.9.5 + 開 発 版 pacemaker-1.1.12 libqb-0.17.1 corosync- 2.3.4 fence-agents- 4.0.10 ノード 管 理 機 能 はcorosyncを 使 用 するため 設 定 やクラス タの 起 動 停 止 方 法 が 変 わりま す STONITHプラグインは cluster-glueとfence-agents の2 種 類 が 選 択 できるように なりました リソースエージェントは Pacemaker-1.0.13と 同 じも のを 使 用 することができます 凡 例 新 規 更 新 運 用 管 理 機 能 にはcrmshを 利 用 する 前 提 でお 話 しします crmshとpcsで 管 理 コマンドなどが 異 なるため 16
ノード 管 理 機 能 にCorosyncを 採 用 しました Pacemaker-1.1.12からLinux-HA Japanではノード 管 理 機 能 にCorosyncを 採 用 しました! Corosyncを 使 用 することによるメリット Corosyncを 使 うとノード 故 障 の 検 知 速 度 が 向 上 し フェイ ルオーバ 完 了 に 要 する 時 間 を 短 縮 することができます Heartbeatでは6ノード 80リソース 構 成 程 度 が 限 界 だっ たが Corosyncでは16ノード 200リソース 程 度 までの 動 作 実 績 があります Pacemaker-1.1 系 の 動 作 速 度 向 上 の 主 要 因 17
Pacemakerクラスタを 構 築 してみよう! 18
デモ 環 境 について (1) Pacemaker Apache PostgreSQL Tracを 使 用 したWEB サービスのActive/Standby 構 成 を 作 ります 一 般 的 なWEBサービスに 必 要 なリソースはすべて 組 み 込 んでいます( 仮 想 IPや 共 有 ディスクも 含 め) この 環 境 では 次 に 挙 げる 故 障 に 対 応 できます リソース 故 障 ノード 故 障 ディスク 故 障 ( 内 蔵 共 有 ディスク) ネットワーク 故 障 (サービスLAN 故 障 ) インターコネクトLAN 故 障 (スプリットブレイン) ただし STONITHではなく sfexによる 対 応 19
デモ 環 境 について (2) デモ 環 境 は 仮 想 マシン2 台 (VMware Player)を 利 用 します ハードウェア CPU: 1コア メモリ: 1GB ディスク: 10GB ソフトウェア OS: CentOS-6.6-x86_64 PostgreSQL-9.4.1( 公 式 サイトから 取 得 ) Trac-1.0.1(easy_installコマンドを 使 ってインストール) httpd-2.2.15-39(os 同 梱 版 を 使 用 ) 20
こんな 環 境 を 作 ります サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 仮 想 IP 192.168.1.100 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 仮 想 IP 192.168.2.20 192.168.3.20 ロック 情 報 ロック 情 報 mount mount sfex Activeノード 192.168.4.10 PostgreSQL DB 192.168.4.20 Standbyノード 管 理 LAN 21
Pacemakerのリソースに 表 すと このようになります サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 リソースグループ sfex Filesystem IPaddr2 仮 想 IP 192.168.1.100 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 仮 想 IP 192.168.2.20 192.168.3.20 リソースグループ sfex Filesystem IPaddr2 pgsql pgsql apache apache ping mount mount ping diskd 2 sfex diskd 2 Activeノード 192.168.4.10 PostgreSQL DB 192.168.4.20 Standbyノード 管 理 LAN 22
前 提 条 件 説 明 を 簡 略 化 するため 以 下 のセットアップを 予 め 行 って います Apache PostgreSQL Tracはインストール 済 みで 動 作 する 状 態 Tracは 下 記 のアドレスでアクセスできるように 構 築 済 み http://192.168.1.100/osc2015nagoya selinuxとiptablesは 無 効 化 しています 作 業 はrootユーザで 行 います 23
Pacemakerのインストール 1. Pacemakerリポジトリパッケージの 取 得 2. Pacemakerのインストール 24
Pacemakerリポジトリパッケージの 取 得 Linux-HA JapanのHPからPacemakerリポジトリパッケ ージを 取 得 します http://osdn.jp/projects/linux-ha/downloads/62369/pacemaker-repo- 1.1.12-1.1.el6.x86_64.rpm/ 25
Pacemakerのインストール 先 ほど 取 得 したRPMをインストールします Pacemakerのパッケージ 群 (RPM)とyumリポジトリの 定 義 ファイル(repoファ イル)がローカルディスクに 配 置 されます # rpm -ivh pacemaker-repo-1.1.12-1.1.el6.x86_64.rpm # ls /opt/linux-ha/pacemaker/rpm/ pacemaker-1.1.12-1.el6.x86_64.rpm corosync-2.3.4-1.el6.x86_64.rpm resource-agents-3.9.5-1.589.b6443.el6.x86_64.rpm crmsh-2.1-1.el6.x86_64.rpm (snip) # ls /etc/yum.repos.d/pacemaker.repo /etc/yum.repos.d/pacemaker.repo 26
Pacemakerのインストール yumコマンドでpacemakerをインストールします 依 存 関 係 のあるパッケージは 自 動 的 にインストールされます インターネットに 接 続 できない( 外 部 のyumリポジトリを 利 用 できない) 場 合 は インストールメディアを 利 用 してローカルリポジトリを 作 成 し てください 1 # yum y install pacemaker-all (snip) Complete! ( 1) CentOS 等 では PacemakerがOSに 同 梱 されているため yumによりos 同 梱 の Pacemakerがインストールされる 場 合 があります その 場 合 対 象 のrepoファイルに 下 記 を 追 記 してください exclude=pacemaker pacemaker-libs corosync cluster-glue heartbeat resource-agents 27
Pacemakerクラスタを 動 かすための 設 定 1. corosync.confの 作 成 2. 認 証 鍵 ファイルの 作 成 (corosync 通 信 用 ) 3. /etc/sysconfig/pacemakerの 設 定 4. クラスタ 起 動 スクリプトの 修 正 28
corosync.confの 作 成 /etc/corosync/corosync.confを 以 下 のように 作 成 します クラスタを 組 む 全 てのマシンに 同 じファイルを 配 置 してください 赤 字 の 設 定 については 自 身 の 環 境 に 合 わせて 適 宜 変 更 してく ださい totem { version: 2 rrp_mode: active token: 1000 interface { ringnumber: 0 bindnetaddr: 192.168.2.0 mcastaddr: 239.255.1.1 mcastport: 5405 } interface { ringnumber: 1 bindnetaddr: 192.168.3.0 mcastaddr: 239.255.1.1 mcastport: 5405 } } クラスタ 間 通 信 に 使 用 するネットワーク 全 て について 定 義 してくだ さい クラスタ 間 通 信 に 使 用 するネット ワークアドレスを 設 定 してください マルチキャスト 通 信 用 のアドレスを 設 定 してください 239.0.0.0~ 239.255.255.255 の 範 囲 が 推 奨 です クラスタ 間 通 信 で 利 用 する 受 信 ポー トです # ( 続 き) logging { syslog_facility: daemon debug: off } quorum { provider: corosync_votequorum expected_votes: 2 } syslogのファシリティを 設 定 します デフォルトの 設 定 では daemon が 設 定 され ます クラスタに 参 加 するノー ド 数 を 設 定 してください 29
認 証 鍵 ファイルの 作 成 以 下 のコマンドを 実 行 してクラスタ 間 通 信 に 使 用 する 認 証 鍵 ファイルを 作 成 します 生 成 された 認 証 鍵 ファイルをクラスタを 組 む 全 てのマ シンにコピーしてください # corosync-keygen -l # ls -la /etc/corosync/authkey -rw-r--r-- 1 root root 128 8 月 20 16:56 14 /etc/corosync/authkey # scp -p /etc/corosync/authkey server02:/etc/corosync/authkey 30
/etc/sysconfig/pacemakerの 設 定 本 設 定 でPacemakerのプロセスが 故 障 した 時 の 振 る 舞 い を 指 定 できます 本 設 定 を 追 加 すると Pacemakerのプロセスが 故 障 したノードはhalt 状 態 となり 他 のノードからはノードに 故 障 が 発 生 したと 判 断 されるようになります # vi /etc/sysconfig/pacemaker (snip) 67 # Enable this for rebooting this machine at the time of process (subsystem) failure 68 export PCMK_fail_fast=yes コメントアウトを 外 し 設 定 値 を yes に 69 (snip) 31
クラスタ 起 動 スクリプトの 修 正 (1) corosyncプロセスが 故 障 した 場 合 にcorosyncのwatchdog を 動 作 させるため 起 動 スクリプトの52 行 目 を 有 効 にします # vi /etc/init/pacemaker.combined.conf (snip) 50 51 # if you use watchdog of corosync, uncomment the line below. 52 pidof corosync false コメントアウトを 外 す 53 54 pidof crmd stop corosync (snip) 32
クラスタ 起 動 スクリプトの 修 正 (2) クラスタ 起 動 中 にOSをshutdownした 場 合 にクラスタを 正 常 に 停 止 させるため 起 動 スクリプトの5 行 目 に 設 定 を 追 加 します # vi /etc/init/pacemaker.combined.conf (snip) 3 # Starts Corosync cluster engine and Pacemaker cluster manager. 4 5 stop on runlevel [0123456] この1 行 を 追 加 6 kill timeout 3600 7 respawn (snip) 33
クラスタを 起 動 する 1. クラスタを 起 動 する 2. クラスタの 状 態 を 確 認 する 34
クラスタを 起 動 する 以 下 のコマンドを 実 行 してクラスタを 起 動 します Pacemaker-1.1.12からはUpstart 経 由 (CentOS6)で 起 動 します # initctl start pacemaker.combined pacemaker.combined start/running, process 25490 クラスタ 停 止 コマンドはこちら # initctl stop pacemaker.combined pacemaker.combined stop/waiting 35
クラスタの 状 態 を 確 認 する crm_mon を 実 行 してノードの 状 態 が Online になってい ることを 確 認 します # crm_mon -fad1 Online: [ server01 server02 ] (snip) 2 台 のマシンの 状 態 が Onlineになっているこ とを 確 認 します crm_monはクラスタの 状 態 を 確 認 するためのコマンドです 36
クラスタにリソースを 管 理 させる 1. リソース 定 義 ファイルを 作 成 する 2. リソース 定 義 ファイルをクラスタに 読 み 込 ませる 3. クラスタの 状 態 を 確 認 する 4. サービスが 起 動 したことを 確 認 してみよう 37
リソース 定 義 ファイルを 作 成 する 今 回 のデモ 構 成 では 以 下 のものをリソース 化 します サービスリソース apache pgsql IPaddr2( 仮 想 IPの 管 理 ) Filesystem(mountの 管 理 ) sfex( 共 有 ディスクロック 情 報 の 管 理 ) 監 視 リソース ping(ネットワークを 監 視 するリソース) diskd(ディスクを 監 視 するリソース) 38
リソース 定 義 ファイルをクラスタに 読 み 込 ませる crmコマンド 1 を 実 行 してクラスタにリソース 定 義 ファイル 2 を 読 み 込 ませます # crm configure load update osc2015nagoya.crm リソース 定 義 ファイル 1 crmコマンドはpacemakerクラスタを 操 作 する 運 用 管 理 コマンドです 運 用 管 理 機 能 にcrmshを 用 いた 場 合 に 利 用 できます 2 リソース 定 義 ファイルの 詳 細 については 下 記 参 照 http://linux-ha.osdn.jp/wp/archives/3786 39
クラスタの 状 態 を 確 認 する crm_monを 実 行 して リソースがActiveノード 上 で Started 状 態 になったことを 確 認 します # crm_mon -fad1 Online: [ server01 server02 ] Full list of resources: (snip) Resource Group: grptrac prmsfex (ocf::heartbeat:sfex):started server01 prmfs (ocf::heartbeat:filesystem): Started server01 prmvip (ocf::heartbeat:ipaddr2): Started server01 prmdb (ocf::heartbeat:pgsql): Started server01 prmweb (ocf::heartbeat:apache): Started server01 Clone Set: clndiskd1 [prmdiskd1] Started: [ server01 server02 ] Clone Set: clndiskd2 [prmdiskd2] Started: [ server01 server02 ] Clone Set: clnping [prmping] Started: [ server01 server02 ] (snip) リソースがActiveノード 上 で Started 状 態 になっ ていることを 確 認 します どちらのノードがActiveノードとなるかは リソース 定 義 ファイルの 制 約 で 記 述 します 制 約 に ついては 下 記 参 照 http://linux-ha.osdn.jp/wp/archives/3882 40
サービスが 起 動 したことを 確 認 してみよう WEBブラウザを 起 動 して 下 記 アドレスにアクセスし ます Tracに 接 続 できたら 無 事 構 築 完 了 です http://192.168.1.100/osc2015nagoya このIPはリソース 定 義 の IPaddr2で 設 定 した 仮 想 IPで す 41
故 障 時 の 動 きを 体 験 してみよう! 42
Pacemakerはどんな 時 にフェイルオーバしてくれるの? 例 えば 次 に 挙 げるような 状 況 になった 時 リソースをフ ェイルオーバしてくれます リソース 故 障 例 )httpdプロセスが 故 障 により 停 止 してしまった 時 ノード 故 障 例 ) 電 源 故 障 によりノードが 停 止 してしまった 時 ディスクやネットワークの 故 障 43
リソース 故 障 によるフェイルオーバのデモ 今 回 のデモではActiveノードでApache(httpd)プロセスをkill コマンドで 強 制 停 止 させることで フェイルオーバを 発 生 させ ます # kill -9 <httpdの 親 プロセス> 44
リソース 故 障 によるフェイルオーバ( 故 障 発 生 時 ) サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 リソースグループ sfex Filesystem IPaddr2 仮 想 IP 192.168.1.100 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 192.168.2.20 192.168.3.20 pgsql apache ping diskd 2 mount apacheの エラーを 検 知! sfex ping diskd 2 192.168.4.10 PostgreSQL DB 192.168.4.20 Activeノード Standbyノード 管 理 LAN 45
リソース 故 障 によるフェイルオーバ( 故 障 発 生 後 ) サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 リソースグループ sfex Filesystem IPaddr2 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 仮 想 IP 192.168.1.100 192.168.2.20 192.168.3.20 リソースグループ sfex Filesystem IPaddr2 pgsql apache ping diskd 2 mount リソースグループがフェイルオーバ sfex pgsql apache ping diskd 2 192.168.4.10 PostgreSQL DB 192.168.4.20 Activeノード Standbyノード 管 理 LAN リソース 故 障 時 は 故 障 したリソースだけでなく そのリソースが 属 す るリソースグループ 全 体 がフェイルオーバします 46
リソース 故 障 発 生 後 のクラスタ 状 態 # crm_mon -fad1 (snip) Resource Group: grptrac prmsfex (ocf::heartbeat:sfex):started server02 prmfs (ocf::heartbeat:filesystem): Started server02 prmvip (ocf::heartbeat:ipaddr2): Started server02 prmdb (ocf::heartbeat:pgsql): Started server02 prmweb (ocf::heartbeat:apache): Started server02 Clone Set: clndiskd1 [prmdiskd1] Started: [ server01 server02 ] Clone Set: clndiskd2 [prmdiskd2] Started: [ server01 server02 ] Clone Set: clnping [prmping] Started: [ server01 server02 ] (snip) Migration summary: * Node server01: リソースはフェイルオーバさ れ Standbyノード 上 で 起 動 されます Migration summary に 故 障 リソースの 情 報 が 表 示 され ます Failed actions に 故 障 発 生 時 のオペレーション 情 報 が 表 示 されます prmweb: migration-threshold=1 fail-count=1 last-failure='mon May 18 14:04:52 2015' * Node server02: Failed actions: prmweb_monitor_10000 on server01 'not running' (7): call=66, status=complete, lastrc-change='mon May 18 14:04:52 2015', queued=0ms, exec=0ms ( 注 ) 本 来 の 運 用 では 故 障 原 因 を 取 り 除 き fail-countをクリアするなどして 故 障 発 生 前 の 状 態 に 戻 しますが 今 回 のデ モでは 時 間 の 都 合 上 復 旧 の 説 明 手 順 は 省 き 一 旦 クラスタを 再 起 動 させる 手 順 を 取 ります 47
今 後 のスケジュール 2015/5 月 現 在 のコミュニティ 動 向 ClusterLabs( 本 家 コミュニティ) 現 在 Pacemaker-1.1.13のリリースへ 向 け 作 業 中 Linux-HA Japan Pacemaker-1.1.12のRHEL7 対 応 Pacemaker-1.1.13の 確 認 フィードバック 今 後 のリリーススケジュール( 予 定 ) 2015/5/15 2015/5 月 末 2015/6 月 2015/10 月 本 家 コミュニティ Pacemaker-1.1.13-RC3 リリース Pacemaker-1.1.13 リリース( 想 定 ) Linux-HA Japan Pacemaker-1.1.12-1.1 RHEL7 対 応 リポジトリパッ ケージリリース Pacemaker-1.1.13 リポジトリパッケージリ リース(RHEL6/RHEL7) 48
さいごに Linux-HA Japan URL http://linux-ha.osdn.jp/ http://osdn.jp/projects/linux-ha/ Pacemaker 関 連 の 最 新 情 報 を 日 本 語 で 発 信 Pacemakerのダウンロードもこ ちらからどうぞ (インストールが 楽 なリポジトリパッケージ を 公 開 しています) 49
さいごに 日 本 におけるHAクラスタについての 活 発 な 意 見 交 換 の 場 として Linux-HA Japan 日 本 語 メーリングリスト も 開 設 しています Linux-HA-Japan MLでは Pacemaker Heartbeat3 Corosync DRBDなど HAクラスタに 関 連 する 話 題 は 歓 迎! ML 登 録 用 URL http://linux-ha.osdn.jp/ の メーリングリスト をクリック MLアドレス linux-ha-japan@lists.osdn.me スパム 防 止 のために 登 録 者 以 外 の 投 稿 は 許 可 制 です 50
ご 清 聴 ありがとうございました Linux-HA Japan 検 索 51
参 考 osc2015nagoya.crm ### Cluster Option ### property no-quorum-policy="ignore" stonith-enabled="false" startup-fencing="false" ### Resource Defaults ### rsc_defaults resource-stickiness="infinity" migration-threshold="1" ### Group Configuration ### group grptrac prmsfex prmfs prmvip prmdb prmweb ### Clone Configuration ### clone clnping prmping clone clndiskd1 prmdiskd1 clone clndiskd2 prmdiskd2 ### Master/Slave Configuration ### ### Fencing Topology ### ### Primitive Configuration ### primitive prmsfex ocf:heartbeat:sfex params device="/dev/sdb1" index="1" lock_timeout="70" monitor_interval="10" op start interval="0s" timeout="90s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="block" primitive prmfs ocf:heartbeat:filesystem params fstype="ext4" run_fsck="force" device="/dev/sdb2" options="barrier=0" directory="/pgsqldb" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="block" primitive prmvip ocf:heartbeat:ipaddr2 params ip="192.168.1.100" nic="eth0" cidr_netmask="24" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="block" primitive prmdb ocf:heartbeat:pgsql params pgctl="/usr/pgsql-9.4/bin/pg_ctl" psql="/usr/pgsql-9.4/bin/psql" pgdata="/pgsqldb/pgdata/data" start_opt="-p 5432" pgdba="postgres" pgport="5432" pgdb="template1" op start interval="0s" timeout="300s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="300s" on-fail="block" primitive prmweb ocf:heartbeat:apache op start interval="0s" timeout="300s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="300s" on-fail="block" 52
参 考 osc2015nagoya.crm primitive prmping ocf:pacemaker:ping params name="default_ping_set" host_list="192.168.1.5" multiplier="100" attempts="2" timeout="2" debug="true" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" ### Resource Colocation ### colocation rsc_colocation-grptrac-clnping-1 INFINITY: grptrac clnping colocation rsc_colocation-grptrac-clndiskd1-2 INFINITY: grptrac clndiskd1 colocation rsc_colocation-grptrac-clndiskd2-3 INFINITY: grptrac clndiskd2 ### Resource Order ### order rsc_order-clnping-grptrac-1 0: clnping grptrac symmetrical=false order rsc_order-clndiskd1-grptrac-2 0: clndiskd1 grptrac symmetrical=false order rsc_order-clndiskd2-grptrac-3 0: clndiskd2 grptrac symmetrical=false primitive prmdiskd1 ocf:pacemaker:diskd params name="diskcheck_status" device="/dev/sdb" options="-e -t 70" interval="10" dampen="2" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" primitive prmdiskd2 ocf:pacemaker:diskd params name="diskcheck_status_internal" device="/dev/sda" options="-e" interval="10" dampen="2" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" ### Resource Location ### location rsc_location-grptrac-1 grptrac rule 200: #uname eq server01 rule 100: #uname eq server02 rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100 rule -INFINITY: not_defined diskcheck_status or diskcheck_status eq ERROR rule -INFINITY: not_defined diskcheck_status_internal or diskcheck_status_internal eq ERROR 53