AutoSlideGenerator



Similar documents
Pacemakerでかんたんクラスタリング体験してみよう

まずは、Pacemakerを使ってみよう!

実演!Pacemakerで楽々クラスタリング

実演!Pacemakerで楽々クラスタリング OSC2011Tokyo/Spring

Pacemake-1.0とは違うのだよ、1.0とは! ~Pacemaker-1.1新機能のご紹介~

HAクラスタでPostgreSQLを高可用化(前編)

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

ファイルサーバー(NFS) 構築ガイド

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安

その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

Pacemaker + KVMで仮想化クラスタリング ~仮想化連携機能のご紹介~ OSC2011Tokyo/Fall

iStorage ソフトウェア VMware vSphere Web Client Plug-in インストールガイド

<4D F736F F F696E74202D B E E88E68C9A90DD8BC65F E DC58F4994C52E >

事前チェック提出用現況報告書作成ツール入力マニュアル(法人用)

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

平 成 27 年 11 月 ~ 平 成 28 年 4 月 に 公 開 の 対 象 となった 専 門 協 議 等 における 各 専 門 委 員 等 の 寄 附 金 契 約 金 等 の 受 取 状 況 審 査 ( 別 紙 ) 専 門 協 議 等 の 件 数 専 門 委 員 数 500 万 円 超 の 受

挑戦!Pacemakerで自由自在にHAクラスタリング

4 参 加 資 格 要 件 本 提 案 への 参 加 予 定 者 は 以 下 の 条 件 を 全 て 満 たすこと 1 地 方 自 治 法 施 行 令 ( 昭 和 22 年 政 令 第 16 号 ) 第 167 条 の4 第 1 項 各 号 の 規 定 に 該 当 しない 者 であること 2 会 社

自己紹介 名前 所属 飯田雄介 ( いいだゆうすけ ) 主な活動 Linux-HA Japan プロジェクト Pacemaker 本体の機能改善や 外部ツールの開発を行っています Linux-HA Japan から pm_logconv や pm_crmgen といったツールを提供しています 2

<4D F736F F D E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A C98AD682B782E993C195CA915B C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

(3) 小 単 元 の 指 導 と 評 価 の 計 画 小 単 元 第 11 章 税 のあらまし の 指 導 と 評 価 の 計 画 ( 四 次 確 定 申 告 制 度 抜 粋 ) 関 心 意 欲 態 度 思 考 判 断 技 能 表 現 知 識 理 解 小 単 元 の 評 価 規 準 税 に 関 す

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

参加表明書・企画提案書様式

通 知 カード と 個 人 番 号 カード の 違 い 2 通 知 カード ( 紙 )/H27.10 個 人 番 号 カード (ICカード)/H28.1 様 式 (おもて) (うら) 作 成 交 付 主 な 記 載 事 項 全 国 ( 外 国 人 含 む)に 郵 送 で 配 布 希 望 者 に 交

<819A955D89BF92B28F BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

MetaMoJi ClassRoom/ゼミナール 授業実施ガイド

CSV_Backup_Guide

・モニター広告運営事業仕様書

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

PowerPoint プレゼンテーション

<4D F736F F D20819C B78AFA95DB91538C7689E68DEC90AC289

奨学事業戦略部個人情報ファイル簿

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や

HAクラスタをフェイルオーバ失敗から救おう!

PoINT Storage ManagerのWindows Failover Clusterでの動作設定

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

目次 Pacemaker ってなに? Pacemaker の設定とは? Pacemaker のリソース設定 リソース定義 パラメータ設定 リソース種類選択 リソース制約 クラスタ設定 さいごに Linux-HA Japan の紹介 Linux-HA Japan Project 2

「給与・年金の方」からの確定申告書作成編

セルフメディケーション推進のための一般用医薬品等に関する所得控除制度の創設(個別要望事項:HP掲載用)

<4D F736F F F696E74202D2082C882E982D982C DD8ED88EE688F882CC82B582AD82DD C668DDA9770>

為 が 行 われるおそれがある 場 合 に 都 道 府 県 公 安 委 員 会 がその 指 定 暴 力 団 等 を 特 定 抗 争 指 定 暴 力 団 等 として 指 定 し その 所 属 する 指 定 暴 力 団 員 が 警 戒 区 域 内 において 暴 力 団 の 事 務 所 を 新 たに 設


企 画 課 企 画 部 満 了 2 55 総 務 部 企 画 室 設 置 認 可 学 部 佐 賀 大 学 附 属 図 書 館 医 学 分 館 設 置 申 請 書 企 画 室 企 画 調 査 係 2004/4/1 30 年 2005/4/1 2035/3/31 ファイル 事 務 室 企 画 部 企 画

<8FEE95F AD D2E786C73>

治 験 実 施 管 理 システム NMGCP 向 け Excel 形 式 プロトコール 作 成 手 順 書 V4.0.3 対 応 版 第 1 版 株 式 会 社 富 士 通 アドバンストエンジニアリング All Rights Reserved,Copyright 株 式 会 社 富 士 通 アドバン

弁護士報酬規定(抜粋)

別冊資料-11

<4D F736F F D2095CA8E A90DA91B18C9F93A289F1939A8F D8288B3816A5F E646F63>

Taro-○離島特産品等マーケティング支援事業に係る企画提案募集要領

大田市固定資産台帳整備業務(プロポーザル審査要項)

調 査 結 果 トピック1: 性 年 代 別 利 用 率 の 利 用 率 は 男 女 ともに 各 年 代 で 大 きく 伸 長 している 2011 年 9 月 の 調 査 では の 年 代 別 利 用 率 は 男 女 とも が 最 も 高 く が 23.9% が 20.5%だったが 今 年 の 調

(6) 事 務 局 職 場 積 立 NISAの 運 営 に 係 る 以 下 の 事 務 等 を 担 当 する 事 業 主 等 の 組 織 ( 当 該 事 務 を 代 行 する 組 織 を 含 む )をいう イ 利 用 者 からの 諸 届 出 受 付 事 務 ロ 利 用 者 への 諸 連 絡 事 務

工 事 名 渟 城 西 小 学 校 体 育 館 非 構 造 部 材 耐 震 改 修 工 事 ( 建 築 主 体 工 事 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 1 設 計 図 書 等 の 閲 覧 貸 出 平 成 28 年 2 月 23 日 ( 火

学校教育法等の一部を改正する法律の施行に伴う文部科学省関係省令の整備に関する省令等について(通知)

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている

入 札 参 加 者 は 入 札 の 執 行 完 了 に 至 るまではいつでも 入 札 を 辞 退 することができ これを 理 由 として 以 降 の 指 名 等 において 不 利 益 な 取 扱 いを 受 けることはない 12 入 札 保 証 金 免 除 13 契 約 保 証 金 免 除 14 入

<4D F736F F D2090AD957B94468FD88AEE94D B292428C7689E68F912E646F63>

S16-386・ソフトウェアの調達に関する入札実施の件

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

1.システム 構 成 1.1 ハードウェア 及 ぶ 基 本 ソフトウェア (1) システム 構 成 の 基 本 方 針 システム 構 成 のコンセンプトについて 2 頁 以 内 で 記 述 してください 1ハードウェア 構 成 のコンセプト

Microsoft Word - 佐野市生活排水処理構想(案).doc

平成17年度高知県県産材利用推進事業費補助金交付要綱

(Microsoft PowerPoint \213\306\213\226\211\302\215X\220V\220\340\226\276\211\357\201i3\201j)

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63>

PowerPoint プレゼンテーション

スライド 1

工 事 名 能 代 南 中 学 校 体 育 館 非 構 造 部 材 耐 震 改 修 工 事 ( 建 築 主 体 工 事 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 1 設 計 図 書 等 の 閲 覧 貸 出 平 成 28 年 5 月 24 日 ( 火

国立研究開発法人土木研究所の役職員の報酬・給与等について

Taro-H19退職金(修正版).jtd

養 老 保 険 の 減 額 払 済 保 険 への 変 更 1. 設 例 会 社 が 役 員 を 被 保 険 者 とし 死 亡 保 険 金 及 び 満 期 保 険 金 のいずれも 会 社 を 受 取 人 とする 養 老 保 険 に 加 入 してい る 場 合 を 解 説 します 資 金 繰 りの 都

別 添 1 女 性 国 家 公 務 員 の 登 用 状 況 資 料 1 指 定 職 に 占 める 女 性 の 割 合 は3.0%( 平 成 27 年 11 月 1 日 現 在 ) ( 前 年 9 月 1 日 現 在 から0.2ポイント 増 ) 本 省 課 室 長 相 当 職 以 上 に 占 める 女

01_07_01 データのインポート_エクスポート_1

4 応 募 者 向 けメニュー 画 面 が 表 示 されます 応 募 者 向 けメニュー 画 面 で [ 交 付 内 定 時 の 手 続 を 行 う] [ 交 付 決 定 後 の 手 続 を 行 う]をクリックします 10

入札公告 機動装備センター

質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定

(Microsoft Word - \203A \225\345\217W\227v\227\314 .doc)

Microsoft Word - ML_ListManager_10j.doc

17 外 国 人 看 護 師 候 補 者 就 労 研 修 支 援 18 看 護 職 員 の 就 労 環 境 改 善 運 動 推 進 特 別 20 歯 科 医 療 安 全 管 理 体 制 推 進 特 別 21 在 宅 歯 科 医 療 連 携 室 整 備 22 地 域 災 害 拠 点 病

所沢市告示第   号

J A K カ イ ロ プ ラ ク テ ィ ッ ク 協 同 組 合 規 約 ( 目 的 ) 第 1 条 組 合 員 の 権 利 義 務 等 は 定 款 に よ っ て 定 め ら れ て い る が 定 款 の 第 6 条 の 規 定 に よ り 定 款 に 記 載 さ れ な い 必 要 事 項

-2-

工 事 名 沢 口 浄 配 水 場 建 設 工 事 ( 浄 水 管 理 棟 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 平 成 24 年 5 月 8 日 ( 火 ) 正 午 から 1 設 計 図 書 等 の 閲 覧 貸 出 基 本 事 項 2のとおり

端 末 型 払 い 出 しの 場 合 接 続 構 成 図 フレッツ グループから 払 出 されたIPアドレス /32 NTT 西 日 本 地 域 IP 網 フレッツ グループ フレッツ グループから 払 出 されたIPアドレス /

「シンセツくん」簡易マニュアル 低圧新増設 街灯一括申込み編


<947A957A8E9197BF C E786C73>

平成19年9月改定

職 員 の 平 均 給 与 月 額 初 任 給 等 の 状 況 (1) 職 員 の 平 均 年 齢 平 均 給 料 月 額 及 び 平 均 給 与 月 額 の 状 況 (5 年 4 月 1 日 現 在 ) 1 一 般 行 政 職 区 類 団 府 分 似 体 平 均 年 齢

事務連絡

Ⅰ 校 外 における 研 修 の 留 意 点 1 校 外 における 研 修 のコマ 数 の 考 え ア) 午 前 午 後 の 講 座 は 0.5 日 (0.5 コマ) イ) 全 日 の 講 座 は 1.0 日 (1.0 コマ) 2 校 外 における 研 修 として 選 択 できない 講 座 研 修

<4D F736F F D208DE3905F8D8291AC8B5A8CA48A948EAE89EF8ED0208BC696B18BA492CA8E64976C8F BD90AC E378C8E89FC92F994C5816A>

3. 選 任 固 定 資 産 評 価 員 は 固 定 資 産 の 評 価 に 関 する 知 識 及 び 経 験 を 有 する 者 のうちから 市 町 村 長 が 当 該 市 町 村 の 議 会 の 同 意 を 得 て 選 任 する 二 以 上 の 市 町 村 の 長 は 当 該 市 町 村 の 議

2015年度ワイヤレスソリューションセミナー「AlaxalA x 4ipnetで実現する連携ソリューションのご紹介」

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

社 会 福 祉 協 議 会 様 の 運 営 する 以 下 の 相 談 業 務 をサポートします 1. 日 常 生 活 自 立 支 援 事 業 2. 成 年 後 見 制 度 事 業 3. 高 齢 者 ふれあい 相 談 センター 事 業 ( 高 齢 者 の 何 でも 相 談 支 援 ) 4. 資 金 貸

2016 年 度 情 報 リテラシー 変 更 された 状 態 同 様 に 価 格 のセルを 書 式 設 定 する 場 合 は 金 額 のセルをすべて 選 択 し [ 書 式 ]のプルダウンメニューか ら[ 会 計 ]を 選 択 する すると が 追 加 され 金 額 としての 書 式 が 設 定 さ


2. ど の 様 な 経 緯 で 発 覚 し た の か ま た 遡 っ た の を 昨 年 4 月 ま で と し た の は 何 故 か 明 ら か に す る こ と 回 答 3 月 17 日 に 実 施 し た ダ イ ヤ 改 正 で 静 岡 車 両 区 の 構 内 運 転 が 静 岡 運

一般競争入札について

Transcription:

OSS HAクラスタPacemakerを 活 用 したHAシステム 構 築 の 勘 所 Pacemaker で 楽 々クラスタリング 2011 年 4 月 28 日 Linux-HA Japan 三 井 一 能 Linux-HA Japan Project 1

こんにちは

本 日 の 内 容

本 日 の 内 容 Pacemakerの 歴 史 コミュニティの 動 向 Pacemakerの 概 要 インストール 設 定

講 演 を 機 会 に

PacemakerでHAクラスタを 組 めそう だ

PacemakerでHAクラスタを 組 めそう だ 帰 ってPacemakerでHAクラスタを 組 みたくなる

と 思 っていただきたいと 思 います

まず

まず 自 己 紹 介

名 前

みいかずよし

漢 字 だと

三 井 一 能

三 井 一 能 読 み 方 が 難 しいですが みいかずよし と 読 みます

みついさん でも 返 事 します

id:kzmtw よければfollowしてください

家 族 構 成

妻 と 娘 の3 人 家 族 です

趣 味

ありきたりですが 子 育 てですかね イクメンの 話 題 は 大 好 きです

さて Linux-HA Japanについて

Linux-HA Japanの 経 緯 HAクラスタ Heartbeat の 日 本 における 更 なる 普 及 展 開 を 目 的 とし 2007 年 10 月 5 日 Linux-HA (Heartbeat) 日 本 語 サイト を 設 立

Linux-HA Japanの 経 緯 Heartbeat2のrpmバイナリと オリジナ ルのHeartbeat 機 能 追 加 用 パッケージを 提 供

Webサイト http://linux-ha.sourceforge.jp/ ( 一 般 向 け) http://sourceforge.jp/projects/linux-ha/ ( 開 発 者 向 け Pacemaker 情 報 の 公 開 用 として 新 しい 一 般 向 けウェブサイトが 2010/6/25にオープンしました 本 日 の 資 料 もこのサイトから 公 開 予 定 です! Linux-HA Japan Project

メーリングリスト 日 本 におけるHAクラスタについての 活 発 な 意 見 交 換 の 場 とし て Linux-HA Japan 日 本 語 メーリングリスト も 開 設 しています Linux-HA-Japan MLでは Pacemaker Heartbeat3 Corosync DRBDなど HAクラスタに 関 連 する 話 題 は 歓 迎! ML 登 録 用 URL http://linux-ha.sourceforge.jp/ の メーリングリスト をクリック MLアドレス linux-ha-japan@lists.sourceforge.jp スパム 防 止 のために 登 録 者 以 外 の 投 稿 は 許 可 制 です 26 Linux-HA Japan Project

にて 連 載 中! Pacemakerでかんたんクラスタリ ング 体 験 してみよう! http://gihyo.jp/admin/serial/01/pacemaker 合 計 5 回 の 連 載 で Pacemakerの 概 要 説 明 から 構 築 方 法 保 守 運 用 にいたるまで 紹 介 しています

勤 務 先

NTT 研 究 企 画 部 門 OSSセンタ

疑 問

NTTはなぜOSSに 取 り 組 んでいるの か

OSSの 狙 い

コスト 削 減

コスト 削 減 ベンダロックインの 回 避

コスト 削 減 ベンダロックインの 回 避 ホワイトボックスであるOSSを 使 った 技 術 力 向 上

こういった 効 果 を 狙 い 社 内 システム のOSS 適 用 支 援 を 行 っています

OSSセンタ

具 体 的 な 取 り 組 みは?

1つめ

OSSVERT

OSSVERT (オズバート) OSs Suites VErified Technically

OSSVERT 安 心 して 利 用 できるOSS 製 品 の 選 定 と 技 術 検 証 の 実 施 クライアント Webサーバ Apache UltraMonkey APサーバ TOMCAT JBoss DBサーバ PostgreSQL MySQL アクティブ スタンバイ Pacemaker Amanda

2つめ

OSSVERTを 構 成 するOSS 製 品 の 研 究 開 発 コミュニティ 活 動

主 に 活 動 しているOSS 製 品 データベース: PostgreSQL HAクラスタ: Pacemaker APサーバ: JBoss

3つめ

グループ 会 社 のOSS 利 用 をトータル サポート

情 報 の 一 元 提 供 OSSの 問 題 解 決 個 別 パッチの 提 供

ここから 本 題

Pacemakerの 話 をします

Pacemakerってなに?

PacemakerはOSSのHAクラスタソフ トウェアです

アンケートをとります

Pacemakerを 知 っていますか?

同 じくOSSのHAクラスタである Heartbeatを 知 っていますか?

Pacemakerは Heartbeatの 後 継 ソ フトウェアです

Pacemakerを 導 入 すると 現 用 系 で 故 障 が 発 生 しサービスができなくなったと きに 待 機 系 でサービスを 自 動 起 動 し サービス 中 断 を 最 小 限 にすることができます フェイルオーバ 故 障 現 用 系 待 機 系

Pacemakerの 歴 史

Heartbeatの 最 初 のバージョンから 12 年 の 歴 史 があります

1998 年 Linux-HAプロジェクト 発 足 Heartbeatのアルファ 版

2010 年 Pacemaker-1.0.10リリース 2009 年 CorosyncをサポートするPacemaker-1.0.6 2008 年 Pacemaker-1.0.0リリース 2007 年 リソース 管 理 機 能 がPacemakerとして 独 立 2005 年 Heartbeatバージョン2リリース 多 ノード 構 成 リソース 監 視 が 可 能 1999 年 Heartbeatバージョン1リリース 1+1 構 成 ノード 監 視 可 能 1998 年 Linux-HAプロジェクト 発 足 Heartbeatのアル ファ 版

あれ Pacemaker-1.1 使 っているけ ど

Pacemakerでのバージョンの 考 え 方

Pacemakerでのバージョンの 考 え 方 偶 数 バージョン: 1.0.x, 1.2.x

Pacemakerでのバージョンの 考 え 方 偶 数 バージョン: 1.0.x, 1.2.x 長 期 安 定 リリース バグフィックスのみ 3 4ヶ 月 周 期 でリリース 1.2 系 の 安 定 版 リリースは 2012-8ご ろ

Pacemakerでのバージョンの 考 え 方 奇 数 バージョン: 1.1.x

Pacemakerでのバージョンの 考 え 方 奇 数 バージョン: 1.1.x フィーチャーリリース 新 規 機 能 追 加 / 削 除 機 能 設 定 の 互 換 性 は 低 め 3 4ヶ 月 周 期 でリリース RHEL6にテクノロジープレビューとし て 同 梱

現 在 の 開 発 コミュニティの 状 況

現 在 の 開 発 コミュニティの 状 況 OSS HAクラスタ 関 連 のプロジェクト が 協 力 し 合 う 関 係 が 進 んできている

現 在 の 開 発 コミュニティの 状 況 集 中 と 選 択 による パッケージの 再 編 Pacemaker + Heartbeat3 リソース 制 御 部 クラスタ 制 御 部 Heartbeat2 Pacemaker Heartbeat3 Pacemaker + Corosync リソース 制 御 部 クラスタ 制 御 部 OpenAIS OpenAIS Corosync OpenAIS + Corosync リソース 制 御 部 クラスタ 制 御 部 Linux-HA Japan Project 70

現 在 の 開 発 コミュニティの 状 況 2008 2010

2011-4 Linux Foundationに High Availability Working Groupを 設 立 同 じ 傘 の 下 でコミュニティ 間 の 連 携 活 動 を 強 化 する 動 き - コミュニティ 間 でパッケージ 統 合 Resource agentsのマージ 作 業 - 2011-10 mini-summit 開 催 (プラハ)

mini-summitは 主 要 開 発 者 がfaceto-faceで 議 論 する 場 で 毎 年 開 催

前 回 2010-11 Linux Plumbers Conference(ケンブリッジ)で 開 催 Pacemaker 1.0パッチメンテナ Linux-HA Japan OpenAIS Corosync Linux-cluster DRBD Heartbeat3 Linux-HA Pacemaker OCFS2

Pacemakerってなに?

PacemakerはHAクラスタソフトウェ アです

多 彩 なクラスタ 構 成 が 可 能 です

基 本 構 成

1+1 構 成

1+1 構 成 ACT-SBY 構 成

ACT-SBY 構 成 稼 動 系 でサービスが 動 作 故 障 が 発 生 すると 待 機 系 でサービス が 起 動 フェイルオーバといいます ユーザ ユーザ LAN Active Standby 故 障 Active 故 障 発 生 フェイル オーバ

応 用 構 成

ACT-ACT 構 成 両 方 のサーバでサービスが 動 作 故 障 が 発 生 すると 他 方 のサーバで サービスを 起 動 ユーザ ユーザ LAN Active1 Active2 故 障 Active2 Active1 故 障 発 生 フェイル オーバ

N+1 構 成 N+M 構 成

N+1 構 成 N+M 構 成 複 数 台 のサーバでサービスが 動 作 故 障 が 発 生 するとSBY( 待 機 系 )で サービス 起 動 2+1 構 成 例 Active2 を フェイルオーバ Active1 Active2 Standby Active1 故 障 Active2 Active2に 故 障 発 生

M/S 構 成 Multi State (Master/Slave) 稼 動 系 と 連 携 したサービスが 待 機 系 でも 動 作 する 構 成 通 常 のリソースの 状 態 遷 移 start 停 止 起 動 stop

M/S 構 成 Multi State (Master/Slave) 稼 動 系 と 連 携 したサービスが 待 機 系 でも 動 作 する 構 成 M/Sのリソースの 状 態 遷 移 start promote 停 止 Slave Master stop demote

M/S 構 成 M/S 機 能 を 持 っているサービス DRBD ディスク 同 期 mysql データベースレプリケーション ユーザ ユーザ LAN Master 連 携 Slave 故 障 Master 故 障 発 生 フェイル オーバ

Pacemakerの 基 本 動 作

Pacemakerの 基 本 動 作 1. ノード 監 視 2. リソース 監 視 3. スプリットブレイン 対 策

基 本 動 作 1:ノード 監 視

基 本 動 作 1:ノード 監 視 相 手 サーバの 生 死 を 確 認 するため 一 定 間 隔 で 通 信 (ハートビート 通 信 ) Activeノード 元 気 かい! Pacemaker Standbyノード OK! Pacemaker ハートビートLAN とか Linux-HA Japan Project インターコネクトLAN と 呼 ぶ

基 本 動 作 1:ノード 監 視 ハートビート 通 信 に 失 敗 すると 相 手 はダウンしたと 判 断 フェイルオーバなどのクラスタ 制 御 を 行 う Activeノード Standbyノード 故 障 Pacemaker Pacemaker あれ? 応 答 なし! ノード 断

基 本 動 作 2:リソース 制 御

基 本 動 作 2:リソース 制 御 リソースって?

基 本 動 作 2:リソース 制 御 リソース = クラスタが 管 理 するものす べて

基 本 動 作 2:リソース 制 御 リソース = クラスタが 管 理 するものす べて 大 きくは2つ

1つめ サービス 継 続 するのに 必 要 なもの

1つめ サービス 継 続 するのに 必 要 なもの サーバプログラム コンピュータ 資 源 * 仮 想 IPアドレス * ファイルシステム

2つめ 故 障 を 検 知 するために 監 視 が 必 要 な もの

2つめ 故 障 を 検 知 するために 監 視 が 必 要 な もの ネットワーク 経 路 監 視 ディスク 監 視

リソース 制 御

リソース 制 御 サービスを 提 供 するために Pacemakerがリソースを 起 動 (start) 停 止 (stop) 監 視 (monitor)すること

リソースエージェント(RA)

リソースエージェント(RA) Pacemakerがリソース 制 御 するため に 利 用 するスクリプト

あらかじめ 含 まれる 標 準 RA 74 個 # crm ra list ocf AoEtarget AudibleAlarm CTDB ClusterMon Delay Dummy EvmsSCC Evmsd Filesystem HealthCPU HealthSMART ICP IPaddr IPaddr2 IPsrcaddr IPv6addr LVM LinuxSCSI MailTo ManageRAID ManageVE NVclient Pure-FTPd Raid1 Route SAPDatabase SAPInstance SendArp ServeRAID SphinxSearchDaemon Squid Stateful SysInfo SystemHealth VIPArip VIPcheck VirtualDomain WAS WAS6 WinPopup Xen Xinetd anything apache controld db2 diskd drbd edir88 exportfs fio iscsilogicalunit iscsitarget ids iscsi ldirectord mysql mysql-proxy nfsserver o2cb oracle oralsnr pgsql ping pingd portblock postfix proftpd rsyncd scsi2reservation sfex syslog-ng tomcat vmware

あらかじめ 含 まれる 標 準 RA 目 的 リソース リソースエージェント 名 (/usr/lib/ocf/resource.d/ に 存 在 ) サーバプログラ ム データベース インターネットサーバ pgsql, oracle, oralsnr, mysql apache, tomcat, jboss, postfix コンピュータ 資 源 ファイルシステム Filesystem ( 複 数 のファイルシステムに 対 応 ) 異 常 監 視 仮 想 IPアドレス ネットワーク 経 路 監 視 ディスク 監 視 共 有 ディスク 排 他 仮 想 IPアドレス 排 他 IPaddr2, IPv6addr pingd diskd (Linux-HA Japan 提 供 ) sfex VIPcheck (Linux-HA Japan 提 供 )

リソースエージェント(RA) クラスとプロバイダで 分 類

リソースエージェント(RA) クラス = RAの 準 拠 している 仕 様 lsb と ocf の2つ

リソースエージェント(RA) クラス = RAの 準 拠 している 仕 様 lsb: LSB 仕 様 のinitscript 形 式 /etc/init.d/* にあるスクリプトを 利 用 ただし リターンコードを 正 しく 返 却 さ れていることが 条 件

リソースエージェント(RA) クラス = RAの 準 拠 している 仕 様 ocf: Open Clustering Framework lsbを 拡 張 し RAへの 引 数 やコマ ンドを 追 加 Pacemakerの 機 能 をフルに 使 う のはこっち

リソースエージェント(RA) プロバイダ = RAの 提 供 元 heartbeat: Linux-HAプロジェクトが 提 供 pacemaker: Pacemakerが 提 供 独 自 のRAを 作 るときは 専 用 のプロ バイダを 作 るとよい

リソースエージェント 実 装 例 PostgreSQL(pgsql RA) 監 視 (monitor) 処 理 の 抜 粋 pgsql_monitor() { PostgreSQLの 監 視 のメイン 関 数 if! pgsql_status PostgreSQLプロセスの 存 在 を 確 認 then PostgreSQLプロセスがいなければ ocf_log info "PostgreSQL is down" return $OCF_NOT_RUNNING PostgreSQLは 停 止 していると 判 断 fi runasowner -q $loglevel $OCF_RESKEY_psql $psql_options -c $OCF_RESKEY_monitor_sql 実 際 にSQL(select now())を 実 行 してPostgreSQLの 正 常 性 を 確 認 return $OCF_SUCCESS PostgreSQLは 動 作 していると 判 断 } $OCF_SUCCESS, $OCF_NOT_RUNNINGはPacemakerで 定 義 済 みの 変 数

リソースエージェントは 自 作 可 能 #!/bin/sh. ${OCF_ROOT}/resource.d/heartbeat/.ocf-shellfuncs start 処 理 () { } stop 処 理 () { } monitor 処 理 { } meta-data 処 理 (){ } validate-all 処 理 (){ } case $1 in start) start 処 理 ();; stop) stop 処 理 ();; monitor) monitor 処 理 ();; esac 通 常 のシェルスクリプトで 実 装 でき ます いくつか 必 須 のパラメータ 呼 び 出 し に 対 する 処 理 と 定 義 済 みの 戻 り 値 を 返 すように 実 装 する 必 要 がありま す リソース 開 始 監 視 停 止 の 処 理 シェルに 渡 されるパラメータ を 元 にRA 処 理 を 振 り 分 け

さらに HAクラスタとして 重 要 な 機 能

基 本 機 能 3:スプリットブレイン 対 策 全 てのハートビートLANが 切 れてしまった 場 合 Active 生 きてる? 元 気 だよ Standby ハートビートLAN

基 本 機 能 3:スプリットブレイン 対 策 全 てのハートビートLANが 切 れてしまった 場 合 お 互 いが 相 手 が 故 障 したと 判 断 し サービスを 引 き 継 ご うとします これをスプリットブレインと 呼 びます Active 生 きてる? しーん Standby 切 断 切 断 サービス 起 動 しまーす

両 サーバが 勝 手 に 動 き 始 めると ( 例 えば) データを 共 有 していると データ 破 壊 発 生 IPを 共 有 していると IP 競 合 発 生 ネットワークスイッチ IP : 192.168.0.10 IP : 192.168.0.10 出 来 る 限 り 回 避 するため ハートビートLANは2 切 断 本 以 上 用 意 仮 にスプリットブレインが 発 生 しても 切 断 Pacemakerは 複 数 の 対 策 が 用 意 さ mount れています mount STONITH 共 機 有 能 ディスク ( 強 制 電 源 断 ) sfex( 共 有 ディスク 排 他 制 御 ) Quorum 機 能 ( 多 数 決 に 基 づく 制 御 ) 両 系 マウント

対 策 1:STONITH

STONITH Shoot-The-Other-Node-In-The- Head 絵 で 表 現 すると

STONITH http://ourobengr.com/ha

STONITH サービス 継 続 を 邪 魔 するサーバをク ラスタから 強 制 的 に 離 脱 させる 機 能 用 語 的 には ノードフェンシング

STONITH いつ 発 動 される?

STONITH 発 動 タイミング スプリットブレイン 発 生 時 リソースの 停 止 処 理 に 失 敗 したとき

STONITHデバイス 実 現 方 法 によりさまざまなSTONITH プラグインが 用 意 されている サーバ 搭 載 のHW 制 御 ボード リモートパワースイッチ UPS poweroffコマンド 保 守 者 による 手 動 リセット

対 策 2:sfex

sfex 共 有 ディスク 排 他 制 御 機 能 絵 で 表 現 すると

sfex 共 有 ディスク 排 他 制 御 機 能 http://sourceforge.jp/projects/linux-ha/wiki/hb-sfex

sfex 共 有 ディスク 排 他 制 御 機 能 意 図 しない 両 系 マウントによるファイ ルシステム 破 壊 を 防 ぐ http://sourceforge.jp/projects/linux-ha/wiki/hb-sfex

sfex 共 有 ディスクの 所 有 権 を 制 御 するリ ソース

sfex 共 有 ディスク 上 に 専 用 パーティション を 用 意 し 所 有 者 を 管 理

sfex ハードウェア 依 存 性 が 小 さいことが 特 徴

その 他 の 対 策 Quorum: ノード 数 に 基 づくリソース 制 御 (3ノード 以 上 ) VIPcheck: サービス 用 仮 想 IPアドレ スに 基 づくリソース 制 御 などがあります

Pacemakerを 構 成 するコンポーネン トを 見 ていきます

Pacemakerを 構 成 するコンポーネン ト

Pacemakerを 構 成 するコンポーネン ト 役 割 分 担 Pacemaker: リソース 制 御 Heartbeat or Corosync: クラスタ 制 御

Pacemakerプロセス crmd: Pacemakerのメインプロセス cib: クラスタに 関 する 情 報 を 一 元 管 理 pengine: クラスタ 状 態 に 基 づきリソース 配 置 を 決 定 し 状 態 遷 移 を 計 算 stonithd: STONITHプラグインの 管 理

Heartbeatプロセス ccm: メンバーシップ 管 理 heartbeat: プロセス 間 通 信 サブプロセス 管 理

Corosyncプロセス corosync: メンバーシップ 管 理 ノード 間 通 信 サブプロセス 管 理

いよいよ HAクラスタをどう 構 築 する かを 見 ていきます

PostgreSQLのHAクラスタ 構 成

PostgreSQLのHAクラスタ 構 成 ハードウェア VMware VM (1CPU, 1GB memory, 8GB HDD) 2 個 OS CentOS 5.5 x86_64 HAクラスタ Pacemaker-1.0.10 クラスタ 化 するアプリケーション PostgreSQL 9.0.3 ACT-SBY 構 成 共 有 ディスク iscsi データベース 領 域 として 利 用 NIC 4つ 使 用 (サービスLAN ハートビートLAN 2 管 理 LAN)

システム 構 成 ルータ 192.168.68.2 サービスLAN 仮 想 IP 192.168.68.100 pm01 PostgreSQL eth0 192.168.68.101 eth1 192.168.32.101 eth2 192.168.64.101 ハートビートLAN1 ハートビートLAN2 eth0 192.168.68.102 eth1 192.168.32.102 eth2 192.168.64.102 pm02 システム 領 域 eth3 192.168.128.101 sfex 領 域 /dev/sdb1 DB 領 域 /dev/sdb2 eth3 192.168.128.102 システム 領 域 管 理 用 LAN 143

リソースの 洗 い 出 し 種 別 リソース RA / STONITH Plugin フェイルオーバ 対 象 ( 稼 動 系 で 起 動 ) 故 障 検 知 (すべてのノードで 起 動 ) STONITH (STONITH 対 象 以 外 の ノードで 起 動 ) 共 有 ディスク 排 他 制 御 共 有 ディスクのマウント 仮 想 IPアドレス PostgreSQL ネットワーク 経 路 監 視 内 蔵 ディスク 監 視 共 有 ディスク 監 視 相 打 ち 防 止 sshプラグイン( ) 保 守 者 介 在 sfex Filesystem IPaddr2 pgsql pingd diskd diskd stonith-helper external/ssh meatware テスト 用 のプラグイン cluster-glue-libs-develパッケージに 含 まれる ので 別 途 インストールしてください ただし 実 運 用 では 使 用 しないこと 日 本 コミュ ニティ 提 供 ツールで 出 現 します

リソース 配 置 クローン サービスLAN pingd グループ グループ pingd diskd sfex sfex diskd diskd グループ stonith-helper Filesystem IPaddr2 pgsql Filesystem IPaddr2 pgsql diskd グループ stonith-helper external/ssh pm01 pm02 external/ssh meatware pm02を 強 制 再 起 動 す る pm02 以 外 に 配 置 pm01を 強 制 再 起 動 す る pm01 以 外 に 配 置 meatware

リソース 設 定 の 種 類

リソース 設 定 の 種 類 primitive clone group

リソース 設 定 の 種 類 primitive

リソース 設 定 の 種 類 primitive すべてのリソース 設 定 の 基 本 RAはまずprimitive 設 定 することから はじまる

リソース 設 定 の 種 類 clone

リソース 設 定 の 種 類 clone 同 じ 設 定 のリソースを 複 数 のノードで 動 かしたい 場 合 に 使 用 ネットワーク 経 路 監 視 やディスク 監 視 で 使 用

リソース 設 定 の 種 類 group

リソース 設 定 の 種 類 group 複 数 のリソースをまとめてフェイル オーバさせるために 使 用 グループ sfex 起 動 順 序 Filesystem IPaddr2 pgsql 停 止 順 序

フェイルオーバ 条 件

フェイルオーバ 条 件 ノード 監 視

フェイルオーバ 条 件 ノード 監 視 ハートビート 通 信 が 不 通

故 障 箇 所 サービスLAN pingd diskd diskd グループ stonith-helper external/ssh meatware グループ sfex Filesystem IPaddr2 pgsql pingd diskd diskd グループ stonith-helper external/ssh meatware

フェイルオーバ 条 件 ノード 監 視 ハートビート 通 信 が 不 通 ノード 故 障 ノードフェンシング

フェイルオーバ 条 件 ネットワーク 経 路 監 視

フェイルオーバ 条 件 ネットワーク 経 路 監 視 指 定 されたIPアドレスまでネットワー ク 通 信 ができない

故 障 箇 所 サービスLAN pingd diskd diskd グループ stonith-helper external/ssh meatware グループ sfex Filesystem IPaddr2 pgsql pingd diskd diskd グループ stonith-helper external/ssh meatware

フェイルオーバ 条 件 ネットワーク 経 路 監 視 指 定 されたIPアドレスまでネットワー ク 通 信 ができない 故 障 が 稼 動 系 ならばリソースを フェイルオーバ

フェイルオーバ 条 件 ディスク 監 視 (sfex)

フェイルオーバ 条 件 ディスク 監 視 (sfex) 共 有 ディスクにアクセスできない

故 障 箇 所 サービスLAN pingd diskd diskd グループ stonith-helper external/ssh meatware グループ sfex Filesystem IPaddr2 pgsql pingd diskd diskd グループ stonith-helper external/ssh meatware

フェイルオーバ 条 件 ディスク 監 視 (sfex) 共 有 ディスクにアクセスできない リソースをフェイルオーバ

フェイルオーバ 条 件 ディスク 監 視 (diskd)

フェイルオーバ 条 件 ディスク 監 視 (diskd) 内 蔵 ディスクまたは 共 有 ディスクにア クセスできない

故 障 箇 所 サービスLAN pingd diskd diskd グループ stonith-helper external/ssh meatware グループ sfex Filesystem IPaddr2 pgsql pingd diskd diskd グループ stonith-helper external/ssh meatware

フェイルオーバ 条 件 ディスク 監 視 (diskd) 内 蔵 ディスクまたは 共 有 ディスクにア クセスできない 故 障 が 稼 動 系 ならばリソースを フェイルオーバ

フェイルオーバ 条 件 リソース 故 障

フェイルオーバ 条 件 リソース 故 障 PostgreSQLのmonitor 処 理 に 失 敗

故 障 箇 所 サービスLAN pingd diskd diskd グループ stonith-helper external/ssh meatware グループ sfex Filesystem IPaddr2 pgsql pingd diskd diskd グループ stonith-helper external/ssh meatware

フェイルオーバ 条 件 リソース 故 障 PostgreSQLのmonitor 処 理 に 失 敗 リソースをフェイルオーバ

まずインストール

インストールの 方 法 方 法 1. 本 家 (clusterlabs)のyumリポ ジトリを 使 用 * 別 のyumリポジトリ(EPEL)も 必 要

インストールの 方 法 方 法 2. 日 本 コミュニティのリポジトリ パッケージ yumリポジトリのアーカイブ ローカルリポジトリとして 使 用 検 証 をパスした 組 み 合 わせ Linux-HA Japanオリジナルパッケージも 含 む こちらを 推 奨

リポジトリパッケージでインストール http://sourceforge.jp/projects/linux-ha/ からダウンロード pacemaker-1.0.10-1.4.1.el5.x86_64.repo.tar.gz をダウンロード (32bit 環 境 の 場 合 は pacemaker-1.0.10-1.4.1.el5.i386.repo.tar.gz を 選 んでください )

リポジトリパッケージでインストール /tmp にアーカイブファイルを 展 開 し yumでインストールします # tar zxvf pacemaker-1.0.10-1.4.1.el5.x86_64.repo.tar.gz -C /tmp # cd /tmp/pacemaker-1.0.10-1.4.1.el5.x86_64.repo # yum -c pacemaker.repo install pacemaker heartbeat 日 本 コミュニティ 提 供 ツールをインストール # yum c pacemaker.repo pm_extra pm_crmgen pm_diskd pm_logconv-hb テスト 用 STONITHプラグインをインストール # yum c pacemaker.repo cluster-glue-libs-devel

Pacemakerの 自 動 起 動 をオフにする # chkconfig --level 2345 heartbeat off オンの 場 合 サーバ 起 動 後 に 自 動 的 にクラスタに 組 み 込 まれる オフの 場 合 手 動 でPacemakerを 起 動 運 用 で 選 択

設 定 ファイルのたぐい

設 定 ファイルのたぐい /etc/ha.d/ha.cf Heartbeatの 設 定 /etc/ha.d/authkeys ハートビート 通 信 の 認 証 用 キー /etc/syslog.conf ログファイルの 分 離 /etc/pm_logconv.conf ログメッセージ 変 換

/etc/ha.d/ha.cf pacemaker on debug 0 udpport 694 keepalive 2 warntime 7 deadtime 10 initdead 10 logfacility local1 bcast eth1 bcast eth2 node pm01 node pm02 watchdog /dev/watchdog respawn root /usr/lib64/heartbeat/ifcheckd Pacemakerを 使 う デバッグログ 出 力 フラグ HB 通 信 のUDPポート HB 通 信 送 信 間 隔 HB 通 信 断 線 時 の 警 告 までの 時 間 HB 通 信 断 線 判 断 までの 時 間 初 期 起 動 時 の 待 ち 合 わせ 時 間 syslog 出 力 時 のファシリティ 指 定 HB 通 信 方 法 の 指 定 クラスタに 参 加 するノード 名 kernel 提 供 のsoftdogデバイス 名 サブプロセスの 起 動

/etc/ha.d/authkeys ハートビート 通 信 の 認 証 用 キー auth 1 1 sha1 secret secretを 任 意 のパスフレーズで 書 き 換 える

/etc/ha.d/authkeys rootのみにread 権 限 を 与 えてくださ い # chmod 0600 /etc/ha.d/authkeys

/etc/syslog.conf Pacemakerのログ 量 が 多 いため ロ グファイルを 分 けることが 望 ましい 慣 習 として 出 力 先 : /var/log/ha-log

/etc/syslog.conf 変 更 点 *.info;mail.none;authpriv.none;cron.none;local1.none local1.info /var/log/ha-log /var/log/messages 設 定 反 映 # /etc/init.d/syslog restart

pm_logconv 日 本 コミュニティ 提 供 ツール Pacemakerのログを 見 やすくする

pm_logconv /etc/pm_logconv.conf を 編 集 [Settings] #ha_log_path = /var/log/ha-log #output_path = /var/log/pm_logconv.out #hostcache_path = /var/lib/heartbeat/hostcache #syslogformat = True #reset_interval = 60 attribute_pingd = default_ping_set, lt, 100 attribute_diskd = diskcheck_status, eq, ERROR attribute_diskd_inner = diskcheck_status_internal, eq, ERROR #logconv_logfacility = daemon act_rsc = prmex prmpg

pm_logconv /etc/inittabに 起 動 設 定 logc:2345:respawn:/usr/share/pacemaker/pm_logconv/pm_l ogconv.py initを 再 起 動 # telinit q

pm_logconv ログローテーションの 設 定 /etc/logrotate.d/heartbeat に 下 記 を 追 加 /var/log/pm_logconv.out { missingok }

以 上 で1 台 めのセットアップが 完 了

もう1 台 のサーバも 同 じようにセット アップしてください

Pacemakerの 起 動 準 備 ができました

Pacemakerの 起 動 2 台 のサーバでコマンドを 実 行 # /etc/init.d/heartbeat start

Pacemakerの 起 動 確 認 いづれかのサーバで 状 態 表 示 コマン ド 実 行 # crm_mon -A

Pacemakerの 起 動 確 認 状 態 表 示 コマンド 実 行 結 果 ============ Last updated: Fri Mar 18 22:31:07 2011 Stack: Heartbeat Current DC: pm01 (755595f2-7905-4ba3-909e-68c4e74067bf) - partition with quorum Version: 1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3 2 Nodes configured, unknown expected votes 0 Resources configured. ============ Online: [ pm02 pm01 ] 2 台 のサーバがクラスタに 組 み 込 まれている Node Attributes: * Node pm02: + pm01-eth1 : up + pm01-eth2 : up * Node pm01: + pm02-eth1 : up + pm02-eth2 : up ハートビート 通 信 の 状 態 を 表 示 ifcheckdによる 機 能

起 動 時 のログの 比 較 /var/log/ha-log v.s. /var/log/pm_logconv.out

起 動 時 のログの 比 較 /var/log/ha-log (353 行 ) Apr 22 08:42:45 pm01 heartbeat: [4978]: WARN: Logging daemon is disabled --enabling logging daemon is recommended Apr 22 08:42:45 pm01 heartbeat: [4978]: info: ************************** Apr 22 08:42:45 pm01 heartbeat: [4978]: info: Configuration validated. Starting heartbeat 3.0.4 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: heartbeat: version 3.0.4 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: Heartbeat generation: 1300455432 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: glib: UDP Broadcast heartbeat started on port 694 (694) interface eth1 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: glib: UDP Broadcast heartbeat closed on port 694 interface eth1 - Status: 1 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: glib: UDP Broadcast heartbeat started on port 694 (694) interface eth2 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: glib: UDP Broadcast heartbeat closed on port 694 interface eth2 - Status: 1 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: G_main_add_TriggerHandler: Added signal manual handler Apr 22 08:42:45 pm01 heartbeat: [4979]: info: G_main_add_TriggerHandler: Added signal manual handler Apr 22 08:42:45 pm01 heartbeat: [4979]: notice: Using watchdog device: /dev/watchdog Apr 22 08:42:45 pm01 heartbeat: [4979]: info: G_main_add_SignalHandler: Added signal handler for signal 17 Apr 22 08:42:45 pm01 heartbeat: [4979]: info: Local status now set to: 'up' Apr 22 08:42:46 pm01 heartbeat: [4979]: info: Link pm01:eth1 up. Apr 22 08:42:46 pm01 heartbeat: [4979]: info: Link pm01:eth2 up. Apr 22 08:42:49 pm01 heartbeat: [4979]: info: Link pm02:eth1 up. Apr 22 08:42:49 pm01 heartbeat: [4979]: info: Status update for node pm02: status up Apr 22 08:42:49 pm01 heartbeat: [4979]: info: Link pm02:eth2 up. Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Comm_now_up(): updating status to active Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Local status now set to: 'active' Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/ccm" (101,105) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/cib" (101,105) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/lrmd -r" (0,0) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/stonithd" (0,0) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/attrd" (101,105) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/crmd" (101,105) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Starting child client "/usr/lib64/heartbeat/ifcheckd" (0,0) Apr 22 08:42:50 pm01 heartbeat: [4989]: info: Starting "/usr/lib64/heartbeat/ccm" as uid 101 gid 105 (pid 4989) Apr 22 08:42:50 pm01 heartbeat: [4990]: info: Starting "/usr/lib64/heartbeat/cib" as uid 101 gid 105 (pid 4990) Apr 22 08:42:50 pm01 heartbeat: [4991]: info: Starting "/usr/lib64/heartbeat/lrmd -r" as uid 0 gid 0 (pid 4991) Apr 22 08:42:50 pm01 heartbeat: [4992]: info: Starting "/usr/lib64/heartbeat/stonithd" as uid 0 gid 0 (pid 4992) Apr 22 08:42:50 pm01 heartbeat: [4993]: info: Starting "/usr/lib64/heartbeat/attrd" as uid 101 gid 105 (pid 4993) Apr 22 08:42:50 pm01 heartbeat: [4994]: info: Starting "/usr/lib64/heartbeat/crmd" as uid 101 gid 105 (pid 4994) Apr 22 08:42:50 pm01 attrd: [4993]: info: Invoked: /usr/lib64/heartbeat/attrd Apr 22 08:42:50 pm01 lrmd: [4991]: info: G_main_add_SignalHandler: Added signal handler for signal 15 Apr 22 08:42:50 pm01 attrd: [4993]: info: main: Starting up Apr 22 08:42:50 pm01 heartbeat: [4995]: info: Starting "/usr/lib64/heartbeat/ifcheckd" as uid 0 gid 0 (pid 4995) Apr 22 08:42:50 pm01 heartbeat: [4979]: info: Status update for node pm02: status active Apr 22 08:42:50 pm01 cib: [4990]: info: Invoked: /usr/lib64/heartbeat/cib Apr 22 08:42:50 pm01 stonithd: [4992]: info: G_main_add_SignalHandler: Added signal handler for signal 10 Apr 22 08:42:50 pm01 ifcheckd: [4995]: info: Invoked: /usr/lib64/heartbeat/ifcheckd Apr 22 08:42:50 pm01 ccm: [4989]: info: Hostname: pm01 Apr 22 08:42:50 pm01 cib: [4990]: info: G_main_add_TriggerHandler: Added signal manual handler Apr 22 08:42:50 pm01 stonithd: [4992]: info: G_main_add_SignalHandler: Added signal handler for signal 12 Apr 22 08:42:50 pm01 cib: [4990]: info: G_main_add_SignalHandler: Added signal handler for signal 17 Apr 22 08:42:50 pm01 lrmd: [4991]: info: G_main_add_SignalHandler: Added signal handler for signal 17 Apr 22 08:42:50 pm01 lrmd: [4991]: info: enabling coredumps Apr 22 08:42:50 pm01 lrmd: [4991]: info: G_main_add_SignalHandler: Added signal handler for signal 10 Apr 22 08:42:50 pm01 lrmd: [4991]: info: G_main_add_SignalHandler: Added signal handler for signal 12 Apr 22 08:42:50 pm01 lrmd: [4991]: info: Started. Apr 22 08:42:50 pm01 cib: [4990]: info: retrievecib: Reading cluster configuration from: /var/lib/heartbeat/crm/cib.xml (digest: /var/lib/heartbeat/crm/cib.xml.sig) Apr 22 08:42:50 pm01 crmd: [4994]: info: Invoked: /usr/lib64/heartbeat/crmd Apr 22 08:42:50 pm01 crmd: [4994]: info: main: CRM Hg Version: da7075976b5ff0bee71074385f8fd02f296ec8a3 Apr 22 08:42:50 pm01 crmd: [4994]: info: crmd_init: Starting crmd Apr 22 08:42:50 pm01 crmd: [4994]: info: G_main_add_SignalHandler: Added signal handler for signal 17 Apr 22 08:42:50 pm01 attrd: [4993]: info: register_heartbeat_conn: Hostname: pm01 Apr 22 08:42:50 pm01 attrd: [4993]: info: register_heartbeat_conn: UUID: 8559a0d8-a5c9-4a84-aa7e-1961cad9658c Apr 22 08:42:50 pm01 attrd: [4993]: info: crm_cluster_connect: Connecting to Heartbeat Apr 22 08:42:50 pm01 attrd: [4993]: info: main: Cluster connection active Apr 22 08:42:50 pm01 attrd: [4993]: info: main: Accepting attribute updates Apr 22 08:42:50 pm01 attrd: [4993]: info: main: Starting mainloop... Apr 22 08:42:50 pm01 heartbeat: [4979]: info: the send queue length from heartbeat to client ccm is set to 1024 Apr 22 08:42:50 pm01 heartbeat: [4979]: info: the send queue length from heartbeat to client attrd is set to 1024 Apr 22 08:42:50 pm01 cib: [4990]: info: startcib: CIB Initialization completed successfully Apr 22 08:42:50 pm01 stonithd: [4992]: info: register_heartbeat_conn: Hostname: pm01 Apr 22 08:42:50 pm01 stonithd: [4992]: info: register_heartbeat_conn: UUID: 8559a0d8-a5c9-4a84-aa7e-1961cad9658c Apr 22 08:42:50 pm01 stonithd: [4992]: info: crm_cluster_connect: Connecting to Heartbeat Apr 22 08:42:50 pm01 heartbeat: [4979]: info: the send queue length from heartbeat to client stonithd is set to 1024 Apr 22 08:42:50 pm01 stonithd: [4992]: notice: /usr/lib64/heartbeat/stonithd start up successfully. Apr 22 08:42:50 pm01 stonithd: [4992]: info: G_main_add_SignalHandler: Added signal handler for signal 17 Apr 22 08:42:51 pm01 cib: [4990]: info: register_heartbeat_conn: Hostname: pm01 Apr 22 08:42:51 pm01 cib: [4990]: info: register_heartbeat_conn: UUID: 8559a0d8-a5c9-4a84-aa7e-1961cad9658c Apr 22 08:42:51 pm01 cib: [4990]: info: crm_cluster_connect: Connecting to Heartbeat Apr 22 08:42:51 pm01 cib: [4990]: info: ccm_connect: Registering with CCM... Apr 22 08:42:51 pm01 cib: [4990]: WARN: ccm_connect: CCM Activation failed Apr 22 08:42:51 pm01 cib: [4990]: WARN: ccm_connect: CCM Connection failed 1 times (30 max) Apr 22 08:42:51 pm01 heartbeat: [4979]: info: the send queue length from heartbeat to client cib is set to 1024 Apr 22 08:42:51 pm01 crmd: [4994]: info: do_cib_control: Could not connect to the CIB service: connection failed Apr 22 08:42:51 pm01 crmd: [4994]: WARN: do_cib_control: Couldn't complete CIB registration 1 times... pause and retry Apr 22 08:42:51 pm01 crmd: [4994]: info: crmd_init: Starting crmd's mainloop Apr 22 08:42:53 pm01 ccm: [4989]: info: G_main_add_SignalHandler: Added signal handler for signal 15 Apr 22 08:42:53 pm01 crmd: [4994]: info: crm_timer_popped: Wait Timer (I_NULL) just popped! Apr 22 08:42:54 pm01 cib: [4990]: info: ccm_connect: Registering with CCM... Apr 22 08:42:54 pm01 cib: [4990]: info: cib_init: Requesting the list of configured nodes Apr 22 08:42:54 pm01 cib: [4990]: info: cib_init: Starting cib mainloop Apr 22 08:42:54 pm01 cib: [4990]: info: cib_client_status_callback: Status update: Client pm01/cib now has status [join] Apr 22 08:42:54 pm01 cib: [4990]: info: crm_new_peer: Node 0 is now known as pm01 Apr 22 08:42:54 pm01 cib: [4990]: info: crm_update_peer_proc: pm01.cib is now online Apr 22 08:42:54 pm01 cib: [4990]: info: cib_client_status_callback: Status update: Client pm02/cib now has status [join] Apr 22 08:42:54 pm01 cib: [4990]: info: crm_new_peer: Node 0 is now known as pm02 Apr 22 08:42:54 pm01 cib: [4990]: info: crm_update_peer_proc: pm02.cib is now online Apr 22 08:42:54 pm01 cib: [4990]: info: cib_client_status_callback: Status update: Client pm01/cib now has status [online] Apr 22 08:42:54 pm01 crmd: [4994]: info: do_cib_control: CIB connection established Apr 22 08:42:54 pm01 cib: [5002]: info: write_cib_contents: Archived previous version as /var/lib/heartbeat/crm/cib-90.raw Apr 22 08:42:54 pm01 cib: [5002]: info: write_cib_contents: Wrote version 0.244.0 of the CIB to disk (digest: d0cf804b2a297ae9841f7b172f2a18fe) Apr 22 08:42:54 pm01 cib: [5002]: info: retrievecib: Reading cluster configuration from: /var/lib/heartbeat/crm/cib.cid1zn (digest: /var/lib/heartbeat/crm/cib.6fjral) Apr 22 08:42:55 pm01 heartbeat: [4979]: WARN: 1 lost packet(s) for [pm02] [16:18] Apr 22 08:42:55 pm01 heartbeat: [4979]: info: No pkts missing from pm02! Apr 22 08:42:55 pm01 cib: [4990]: info: cib_client_status_callback: Status update: Client pm02/cib now has status [online] Apr 22 08:42:55 pm01 crmd: [4994]: info: register_heartbeat_conn: Hostname: pm01 Apr 22 08:42:55 pm01 crmd: [4994]: info: register_heartbeat_conn: UUID: 8559a0d8-a5c9-4a84-aa7e-1961cad9658c Apr 22 08:42:55 pm01 crmd: [4994]: info: crm_cluster_connect: Connecting to Heartbeat Apr 22 08:42:55 pm01 heartbeat: [4979]: info: the send queue length from heartbeat to client crmd is set to 1024 Apr 22 08:42:55 pm01 crmd: [4994]: info: do_ha_control: Connected to the cluster Apr 22 08:42:55 pm01 crmd: [4994]: info: do_ccm_control: CCM connection established... waiting for first callback Apr 22 08:42:55 pm01 crmd: [4994]: info: do_started: Delaying start, CCM (0000000000100000) not connected Apr 22 08:42:55 pm01 crmd: [4994]: notice: crmd_client_status_callback: Status update: Client pm01/crmd now has status [online] (DC=false) Apr 22 08:42:55 pm01 attrd: [4993]: info: cib_connect: Connected to the CIB after 1 signon attempts Apr 22 08:42:55 pm01 attrd: [4993]: info: cib_connect: Sending full refresh Apr 22 08:42:55 pm01 crmd: [4994]: info: crm_new_peer: Node 0 is now known as pm01 Apr 22 08:42:55 pm01 crmd: [4994]: info: crm_update_peer_proc: pm01.crmd is now online Apr 22 08:42:55 pm01 crmd: [4994]: info: crmd_client_status_callback: Not the DC Apr 22 08:42:55 pm01 crmd: [4994]: notice: crmd_client_status_callback: Status update: Client pm01/crmd now has status [online] (DC=false) Apr 22 08:42:56 pm01 crmd: [4994]: info: crmd_client_status_callback: Not the DC Apr 22 08:42:56 pm01 crmd: [4994]: notice: crmd_client_status_callback: Status update: Client pm02/crmd now has status [offline] (DC=false) Apr 22 08:42:56 pm01 crmd: [4994]: info: crm_new_peer: Node 0 is now known as pm02 Apr 22 08:42:56 pm01 crmd: [4994]: info: crmd_client_status_callback: Not the DC Apr 22 08:42:56 pm01 crmd: [4994]: info: do_started: Delaying start, CCM (0000000000100000) not connected Apr 22 08:42:56 pm01 crmd: [4994]: info: config_query_callback: Checking for expired actions every 900000ms Apr 22 08:42:56 pm01 crmd: [4994]: info: do_started: Delaying start, CCM (0000000000100000) not connected Apr 22 08:42:57 pm01 crmd: [4994]: notice: crmd_client_status_callback: Status update: Client pm02/crmd now has status [online] (DC=false) Apr 22 08:42:57 pm01 cib: [4990]: info: mem_handle_event: Got an event OC_EV_MS_NEW_MEMBERSHIP from ccm Apr 22 08:42:57 pm01 cib: [4990]: info: mem_handle_event: instance=2, nodes=2, new=2, lost=0, n_idx=0, new_idx=0, old_idx=4 Apr 22 08:42:57 pm01 cib: [4990]: info: cib_ccm_msg_callback: Processing CCM event=new MEMBERSHIP (id=2) Apr 22 08:42:57 pm01 cib: [4990]: info: crm_get_peer: Node pm02 now has id: 1 Apr 22 08:42:57 pm01 cib: [4990]: info: crm_update_peer: Node pm02: id=1 state=member (new) addr=(null) votes=-1 born=1 seen=2 proc=00000000000000000000000000000100 Apr 22 08:42:57 pm01 cib: [4990]: info: crm_update_peer_proc: pm02.ais is now online Apr 22 08:42:57 pm01 cib: [4990]: info: crm_update_peer_proc: pm02.crmd is now online Apr 22 08:42:57 pm01 cib: [4990]: info: crm_update_peer: Node pm01: id=0 state=member (new) addr=(null) votes=-1 born=2 seen=2 proc=00000000000000000000000000000100 Apr 22 08:42:57 pm01 cib: [4990]: info: crm_update_peer_proc: pm01.ais is now online Apr 22 08:42:57 pm01 cib: [4990]: info: crm_update_peer_proc: pm01.crmd is now online Apr 22 08:42:57 pm01 crmd: [4994]: info: crm_update_peer_proc: pm02.crmd is now online Apr 22 08:42:57 pm01 crmd: [4994]: info: crmd_client_status_callback: Not the DC Apr 22 08:42:57 pm01 crmd: [4994]: info: mem_handle_event: Got an event OC_EV_MS_NEW_MEMBERSHIP from ccm Apr 22 08:42:57 pm01 crmd: [4994]: info: mem_handle_event: instance=2, nodes=2, new=2, lost=0, n_idx=0, new_idx=0, old_idx=4 Apr 22 08:42:57 pm01 crmd: [4994]: info: crmd_ccm_msg_callback: Quorum (re)attained after event=new MEMBERSHIP (id=2) Apr 22 08:42:57 pm01 crmd: [4994]: info: ccm_event_detail: NEW MEMBERSHIP: trans=2, nodes=2, new=2, lost=0 n_idx=0, new_idx=0, old_idx=4 Apr 22 08:42:57 pm01 crmd: [4994]: info: ccm_event_detail: CURRENT: pm02 [nodeid=1, born=1] Apr 22 08:42:57 pm01 crmd: [4994]: info: ccm_event_detail: CURRENT: pm01 [nodeid=0, born=2] Apr 22 08:42:57 pm01 crmd: [4994]: info: ccm_event_detail: NEW: pm02 [nodeid=1, born=1] Apr 22 08:42:57 pm01 crmd: [4994]: info: ccm_event_detail: NEW: pm01 [nodeid=0, born=2] Apr 22 08:42:57 pm01 crmd: [4994]: info: crm_get_peer: Node pm02 now has id: 1 Apr 22 08:42:57 pm01 crmd: [4994]: info: crm_update_peer: Node pm02: id=1 state=member (new) addr=(null) votes=-1 born=1 seen=2 proc=00000000000000000000000000000200 Apr 22 08:42:57 pm01 crmd: [4994]: info: crm_update_peer_proc: pm02.ais is now online Apr 22 08:42:57 pm01 crmd: [4994]: info: crm_update_peer: Node pm01: id=0 state=member (new) addr=(null) votes=-1 born=2 seen=2 proc=00000000000000000000000000000200 Apr 22 08:42:57 pm01 crmd: [4994]: info: crm_update_peer_proc: pm01.ais is now online Apr 22 08:42:57 pm01 crmd: [4994]: info: do_started: The local CRM is operational Apr 22 08:42:57 pm01 crmd: [4994]: info: do_state_transition: State transition S_STARTING -> S_PENDING [ input=i_pending cause=c_fsa_internal origin=do_started ] Apr 22 08:42:58 pm01 heartbeat: [4979]: WARN: 1 lost packet(s) for [pm02] [23:25] Apr 22 08:42:58 pm01 heartbeat: [4979]: info: No pkts missing from pm02! Apr 22 08:43:58 pm01 crmd: [4994]: info: crm_timer_popped: Election Trigger (I_DC_TIMEOUT) just popped! Apr 22 08:43:58 pm01 crmd: [4994]: WARN: do_log: FSA: Input I_DC_TIMEOUT from crm_timer_popped() received in state S_PENDING Apr 22 08:43:58 pm01 crmd: [4994]: info: do_state_transition: State transition S_PENDING -> S_ELECTION [ input=i_dc_timeout cause=c_timer_popped origin=crm_timer_popped ] Apr 22 08:43:59 pm01 crmd: [4994]: info: do_state_transition: State transition S_ELECTION -> S_PENDING [ input=i_pending cause=c_fsa_internal origin=do_election_count_vote ] ま だ ま だ 続 く

起 動 時 のログの 比 較 /var/log/pm_logconv.out (41 行 ) Apr 22 08:42:45 pm01 info: Starting Heartbeat 3.0.4. Apr 22 08:42:46 pm01 info: Link pm01:eth1 is up. Apr 22 08:42:46 pm01 info: Link pm01:eth2 is up. Apr 22 08:42:49 pm01 info: Link pm02:eth1 is up. Apr 22 08:42:49 pm01 info: Link pm02:eth2 is up. Apr 22 08:42:50 pm01 info: Start "ccm" process. (pid=4989) Apr 22 08:42:50 pm01 info: Start "cib" process. (pid=4990) Apr 22 08:42:50 pm01 info: Start "lrmd" process. (pid=4991) Apr 22 08:42:50 pm01 info: Start "stonithd" process. (pid=4992) Apr 22 08:42:50 pm01 info: Start "attrd" process. (pid=4993) Apr 22 08:42:50 pm01 info: Start "crmd" process. (pid=4994) Apr 22 08:42:50 pm01 info: Start "ifcheckd" process. (pid=4995) Apr 22 08:44:04 pm01 info: Set DC node to pm02. Apr 22 08:44:10 pm01 info: Resource prmstonith2-1 tries to start. Apr 22 08:44:10 pm01 info: Resource prmstonith2-1 started. (rc=0) Apr 22 08:44:11 pm01 info: Attribute "pm02-eth1" is updated to "up". Apr 22 08:44:11 pm01 info: Attribute "pm02-eth2" is updated to "up". Apr 22 08:44:11 pm01 info: Resource prmstonith2-2 tries to start. Apr 22 08:44:11 pm01 info: Resource prmdiskd1:1 tries to start. Apr 22 08:44:11 pm01 info: Resource prmdiskd2:1 tries to start. Apr 22 08:44:11 pm01 info: Resource prmpingd:1 tries to start. Apr 22 08:44:12 pm01 info: Attribute "diskcheck_status" is updated to "normal". Apr 22 08:44:12 pm01 info: Resource prmdiskd2:1 started. (rc=0) Apr 22 08:44:12 pm01 info: Attribute "diskcheck_status_internal" is updated to "normal". Apr 22 08:44:12 pm01 info: Resource prmstonith2-2 started. (rc=0) Apr 22 08:44:12 pm01 info: Resource prmdiskd1:1 started. (rc=0) Apr 22 08:44:12 pm01 info: Attribute "default_ping_set" is updated to "100". Apr 22 08:44:12 pm01 info: Resource prmpingd:1 started. (rc=0) Apr 22 08:44:12 pm01 info: Attribute "diskcheck_status" is updated to "normal". Apr 22 08:44:12 pm01 info: Attribute "diskcheck_status_internal" is updated to "normal". Apr 22 08:44:12 pm01 info: Attribute "default_ping_set" is updated to "100". Apr 22 08:44:12 pm01 info: Resource prmex tries to start. Apr 22 08:44:12 pm01 info: Resource prmstonith2-3 tries to start. Apr 22 08:44:13 pm01 info: Resource prmstonith2-3 started. (rc=0) Apr 22 08:44:14 pm01 info: Resource prmex started. (rc=0) Apr 22 08:44:14 pm01 info: Resource prmfs tries to start. Apr 22 08:44:15 pm01 info: Resource prmfs started. (rc=0) Apr 22 08:44:16 pm01 info: Resource prmip tries to start. Apr 22 08:44:16 pm01 info: Resource prmip started. (rc=0) Apr 22 08:44:18 pm01 info: Resource prmpg tries to start. Apr 22 08:44:21 pm01 info: Resource prmpg started. (rc=0) Pacemakerのログ から 特 に 運 用 に 関 係 のあるものを 抽 出 メッセージ 変 換 する ツール

リソース 設 定

Crmコマンド ( 統 合 シェル)を 使 用

Crmコマンド ( 統 合 シェル)を 使 用 Pacemakerで 導 入 され リソース 設 定 からノード リソース 管 理 なども 行 える

Crmコマンド ( 統 合 シェル)を 使 用 リソース 設 定 をファイル( 例 :pg.crm) で 作 成 して コマンドを 実 行 # crm configure load update pg.crm

リソース 設 定

リソース 設 定 クラスタオプション リソースデフォルトオプション 個 別 のリソース 設 定 リソース 制 約 条 件

リソース 設 定 クラスタオプション property no-quorum-policy="ignore" stonith-enabled="true" startup-fencing="false" stonith-timeout="740s"

リソース 設 定 リソースデフォルトオプション rsc_defaults resource-stickiness="infinity" migration-threshold="1"

リソース 設 定 PostgreSQLのフェイルオーバグ ループのprimitive 宣 言 primitive prmex ocf:heartbeat:sfex params device="/dev/sdb1" index="1" collision_timeout="1" lock_timeout="10" monitor_interval="10" op start interval="0s" timeout="300s" on-fail="restart" op monitor interval="10s" timeout="90s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="fence" primitive prmfs ocf:heartbeat:filesystem params fstype="ext3" device="/dev/sdb2" directory="/var/lib/pgsql/9.0/data" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="fence" primitive prmip ocf:heartbeat:ipaddr2 params ip="192.168.68.100" nic="eth0" cidr_netmask="24" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="fence" primitive prmpg ocf:heartbeat:pgsql params pgctl="/usr/pgsql-9.0/bin/pg_ctl" start_opt="-p 5432 -h 192.168.68.100" psql="/usr/pgsql-9.0/bin/psql" pgdata="/var/lib/pgsql/9.0/data" pgdba="postgres" pgport="5432" pgdb="template1" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="fence"

リソース 設 定 PostgreSQLのフェイルオーバグ ループのグループ 宣 言 group grppg prmex prmfs prmip prmpg

リソース 設 定 ネットワーク 経 路 監 視 のprimitive 宣 言 primitive prmpingd ocf:pacemaker:pingd params name="default_ping_set" host_list="192.168.68.2" multiplier="100" dampen="0" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore"

リソース 設 定 ディスク 監 視 のprimitive 宣 言 primitive prmpingd ocf:pacemaker:pingd params name="default_ping_set" host_list="192.168.68.2" multiplier="100" dampen="0" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" primitive prmdiskd1 ocf:pacemaker:diskd params name="diskcheck_status" device="/dev/sdb" interval="10" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore"

リソース 設 定 ネットワーク 経 路 監 視 ディスク 監 視 のclone 化 clone clnpingd prmpingd clone clndiskd1 prmdiskd1 clone clndiskd2 prmdiskd2

リソース 設 定 PostgreSQLリソースグループの 配 置 制 約 location rsc_location-grppg-1 grppg rule 200: #uname eq pm01 rule 100: #uname eq pm02 rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100 rule -INFINITY: not_defined diskcheck_status or diskcheck_status eq ERROR rule -INFINITY: not_defined diskcheck_status_internal or diskcheck_status_internal eq ERROR

primitive prmstonith1-3 stonith:meatware params priority="3" stonith-timeout="600" hostlist="pm01" op start interval="0s" timeout="60s" op monitor interval="3600s" timeout="60s" op stop interval="0s" timeout="60s" STONITH 設 定 STONITH Pluginのprimitive 宣 言 primitive prmstonith1-1 stonith:external/stonith-helper params priority="1" stonith-timeout="70" hostlist="pm01" dead_check_target="192.168.68.101 192.168.32.101 192.168.64.101 192.168.128.101" standby_wait_time="15" standby_check_command="/usr/sbin/crm_resource -r prmex -W grep -q `hostname`" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="3600s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" primitive prmstonith1-2 stonith:external/ssh params priority="2" stonith-timeout="300" hostlist="pm01" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="3600s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore"

STONITH 設 定 STONITH Pluginのgroup 宣 言 group grpstonith1 prmstonith1-1 prmstonith1-2 prmstonith1-3

STONITH 設 定 pm02 用 の 設 定 も 同 じように 実 施

STONITH 設 定 STONITH Pluginの 配 置 制 約 location rsc_location-grpstonith1-2 grpstonith1 rule -INFINITY: #uname eq pm01 location rsc_location-grpstonith2-3 grpstonith2 rule -INFINITY: #uname eq pm02

リソース 設 定 の 反 映 リソース 設 定 をエディタ( 例 :pg.crm) で 作 成 して 次 のコマンドを 実 行 # crm configure load update pg.crm

Pacemakerのクラスタ 状 態 表 示 # crm_mon -A

Pacemakerのクラスタ 状 態 表 示 ============ ( 省 略 ) ============ Online: [ pm02 pm01 ] Resource Group: grppg prmex (ocf::heartbeat:sfex): Started pm01 prmfs (ocf::heartbeat:filesystem): Started pm01 prmip (ocf::heartbeat:ipaddr2): Started pm01 prmpg (ocf::heartbeat:pgsql): Started pm01 Resource Group: grpstonith1 prmstonith1-1 (stonith:external/stonith-helper): Started pm02 prmstonith1-2 (stonith:external/ssh): Started pm02 prmstonith1-3 (stonith:meatware): Started pm02 Resource Group: grpstonith2 prmstonith2-1 (stonith:external/stonith-helper): Started pm01 prmstonith2-2 (stonith:external/ssh): Started pm01 prmstonith2-3 (stonith:meatware): Started pm01 Clone Set: clndiskd1 Started: [ pm02 pm01 ] Clone Set: clndiskd2 Started: [ pm02 pm01 ] Clone Set: clnpingd Started: [ pm02 pm01 ] Node Attributes: * Node pm02: + default_ping_set : 100 + diskcheck_status : normal + diskcheck_status_internal : normal + pm01-eth1 : up + pm01-eth2 : up PostgreSQL 関 連 の 設 定 STONITHの 設 定 ネットワーク 経 路 監 視 ディスク 監 視 の 設 定 pm02における 各 種 監 視 情 報 の 値 (ネットワーク 経 路 監 視 ディスク 監 視 ハートビートLAN 監 視 )

デモビデオ

デモビデオ1 リソースがなにも 設 定 されていない 状 態 から PostgreSQLのHAクラス タ 設 定 をロードします # crm configure load update pg.crm

デモビデオ2 リソース 故 障 (PostgreSQL)を 発 生 さ せます Pacemakerが 故 障 を 検 知 し リソー スをフェイルオーバさせます 故 障 復 旧 後 次 のコマンドで 故 障 状 態 をクリアします # crm resource cleanup prmpg

デモビデオ3 ネットワーク 経 路 監 視 でエラーを 発 生 させます Pacemakerが 故 障 を 検 知 し リソー スをフェイルオーバさせます

デモビデオ4 ハートビートLANをすべて 断 線 し ス プリットブレインを 発 生 させます STONITHが 発 動 されます stonithhelperにより 待 機 ノードがリブートさ れます

pm_crmgen ExcelまたはOpenOfficeで 編 集 した テンプレートファイルからcrmコマンド の 入 力 ファイルを 生 成 するツールで す

pm_crmgen 1) Excelのテンプレートファイルにリソース 定 義 を 記 載 /usr/share/pacemaker/pm_crmgen/pm_crmgen_env.xls Excel が 使 用 できるPCにコピーします テンプレートは 青 枠 の 中 に 値 を 記 入 していきます ファイルを デモビデオ 環 境 は このExcelの 設 定 例 シートのみで 作 成 Linux-HA Japan Project 228 監 視 間 隔 やタイムアウト 値 故 障 時 の 動 作 などを 入 力

pm_crmgen どのサーバを 稼 動 系 にするかといった リソース 配 置 制 約 の 設 定 も サーバ 名 を 記 述 するだけで 可 能 です リソース ID 稼 動 系 と 待 機 系 サー バを 指 定

pm_crmgen crm 用 設 定 ファイルに 変 換 2) CSV 形 式 でファイルを 保 存 crm_sample.csv な どとしてCSV 形 式 で 保 存 3) CSVファイルをサーバへ 転 送 CSVファイル 保 存 後 SCPやFTP 等 でpm_crmgenがインストール されたサーバへ 転 送

pm_crmgen crm 用 設 定 ファイルに 変 換 4) pm_crmgenコマンドでcrmファイルを 生 成 # pm_crmgen o crm_sample.crm crm_sample.csv 生 成 する 設 定 ファイル 名 3)で 転 送 した CSVファイル 5) crmコマンドを 実 行 してリソース 設 定 を 反 映 # crm configure load update crm_sample.crm 231

最 後 に 皆 さんへのメッセージ

Pacemakerは 商 用 製 品 にも 負 けな い 機 能 と 信 頼 性 を 持 ったHAクラスタ ソフトウェアです

まずは Pacemakerを 使 ってみてく ださい

皆 さんが 使 うことが OSSの 力 になり ます

できることからOSSへの 貢 献 を 始 め てみませんか?

できることからOSSへの 貢 献 を 始 め てみませんか? 質 問 バグ 報 告 新 規 RAの 提 案 エンハンスメントの 提 案

自 己 のスキルレベルアップを 確 認 し たくなったら

自 己 のスキルレベルアップを 確 認 し たくなったら LPIC304を 受 けてみましょう!

ご 静 聴 ありがとうございました!

新 ロゴ 誕 生 の 裏 話

昨 年 Pacemakerをプロモーションし ていこうとなったとき どうしても 気 に なったこと

Pacemakerのロゴ 医 療 用 のPacemakerっぽいのをどう にかしたい!

Linux-HA Japanで 投 票 で 新 しいロゴ を 作 りました

Linux-HA Japanで 投 票 で 新 しいロゴ を 作 りました これって うさぎ?

Linux-HA Japanで 投 票 で 新 しいロゴ を 作 りました はいそうです 続 きは Web( )で http://gihyo.jp/admin/serial/01/pace maker/0001 コラム:Pacemakerロゴあれこれ

調 子 にのって 本 家 の 開 発 者 にも 新 ロゴを 提 案 Linux Plumbers Conference 2010

意 外 にも 好 印 象!

公 開 投 票 でどっちがいいか 決 めよう ということに

公 開 投 票 の 結 果 は?

公 開 投 票 の 結 果 は?

というわけで 本 家 のロゴにも 採 用 でも カラーにこだわりが