Pacemake-1.0とは違うのだよ、1.0とは! ~Pacemaker-1.1新機能のご紹介~



Similar documents
自己紹介 名前 所属 飯田雄介 ( いいだゆうすけ ) 主な活動 Linux-HA Japan プロジェクト Pacemaker 本体の機能改善や 外部ツールの開発を行っています Linux-HA Japan から pm_logconv や pm_crmgen といったツールを提供しています 2

目次 Pacemaker ってなに? Pacemaker の設定とは? Pacemaker のリソース設定 リソース定義 パラメータ設定 リソース種類選択 リソース制約 クラスタ設定 さいごに Linux-HA Japan の紹介 Linux-HA Japan Project 2

ファイルサーバー(NFS) 構築ガイド

CSV_Backup_Guide

iStorage ソフトウェア VMware vSphere Web Client Plug-in インストールガイド

PoINT Storage ManagerのWindows Failover Clusterでの動作設定

テーマ Pacemaker-1.1 を味わうための 便利 な使い方 ~ 保守運用に活用しよう ~ Pacemaker で対応する 故障 ケースの起こし方と復旧手順 ~ 事前に動作検証しよう ~ 実際の構築運用シーンで起きる問題の 解決 方法 ~ よくある問題を理解しよう ~ 2

雇用保険被保険者資格取得届(様式)編


Pacemakerでかんたんクラスタリング体験してみよう

2 課 題 管 理 ( 科 学 研 究 費 補 助 金 ) 画 面 が 表 示 されます 補 助 事 業 期 間 終 了 後 欄 の[ 入 力 ] をクリックします [ 入 力 ]ボタンが 表 示 されていない 場 合 には 所 属 する 研 究 機 関 の 事 務 局 等 へお 問 い 合 わせく

VPS では 通 常 はインスタンスが 1 個 です 停 止 と 再 起 動 を 選 択 できます CloudStack では インスタンスの 追 加 と 破 棄 の 機 能 を 利 用 することにより お 客 様 が 契 約 されているインスタンス 数 分 の 仮 想 サーバを 自 由 に 追 加

実演!Pacemakerで楽々クラスタリング

Microsoft Word - 佐野市生活排水処理構想(案).doc

(表紙)

Microsoft Word - 生物学技研報告ONLINE ガイドブック.doc

HAクラスタをフェイルオーバ失敗から救おう!

目 次 ログインする 前 に... 4 メンバー 管 理 編 ( 管 理 者 )... 5 ログインする... 6 トップページについて... 7 メンバー 管 理 をする... 8 メンバー 管 理 画 面 について 医 療 機 関 指 定 新 規 追 加 指 定...

まずは、Pacemakerを使ってみよう!

PowerPoint プレゼンテーション

<IE の 設 定 について> 従 来 版 をすでにご 利 用 の 方 の 場 合 互 換 表 示 設 定 がある 状 態 になっていると 思 わ れますので 必 ず 解 除 の 設 定 を 行 ってください 従 来 版 では IE の 10 以 上 では 互 換 表 示 設 定 が 必 要 でした

通 知 カード と 個 人 番 号 カード の 違 い 2 通 知 カード ( 紙 )/H27.10 個 人 番 号 カード (ICカード)/H28.1 様 式 (おもて) (うら) 作 成 交 付 主 な 記 載 事 項 全 国 ( 外 国 人 含 む)に 郵 送 で 配 布 希 望 者 に 交

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

技術報告会原稿フォーマット

目 次 1.はじめに 1-1. はじめに 2. 操 作 2-1. 概 要 2-2. 操 作 方 法 ( 調 査 依 頼 の 確 認 ) 2-3. 操 作 方 法 ( 回 答 登 録 ) 2-4. 操 作 方 法 (ワークシート 出 力 ) 2-5. 操 作 方 法 (ワークシート 取 込 ) 3.

Microsoft Word - ML_ListManager_10j.doc

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

Sea-NACCS 利用者研修 【通関編】

2 科 学 研 究 費 助 成 事 業 のトップページ 画 面 が 表 示 されます [ 研 究 者 ログイン]をクリック します 掲 載 している 画 面 は 例 示 です 随 時 変 更 されます 3 科 研 費 電 子 申 請 システムの 応 募 者 ログイン 画 面 が 表 示 されます e

スライド 1

よりメンバーに 配 布 した 第 2 期 は 第 1 期 に 開 発 した 大 気 時 間 値 集 計 解 析 ツールをベースに 機 能 改 良 を 行 った 国 立 環 境 研 究 所 では メンバーから 寄 せられる 要 望 使 い 勝 手 に 関 する 意 見 感 想 不 具 合 発 生 など

< 入 力 にあたっての 注 意 事 項 > 応 募 基 本 情 報 の 申 請 は 代 表 申 請 方 式 の 場 合 は 代 表 申 請 を 行 う 応 募 者 が 連 名 申 請 方 式 の 場 合 は 連 名 申 請 する 応 募 者 のうちのいずれかの1 者 が 研 究 体 を 代 表 し

< 目 次 > 8. 雇 用 保 険 高 年 齢 雇 用 継 続 給 付 27 ( 育 児 休 業 給 付 介 護 休 業 給 付 ) 8.1 高 年 齢 雇 用 継 続 給 付 画 面 のマイナンバー 設 定 高 年 齢 雇 用 継 続 給 付 の 電 子 申 請 高

<4D F736F F D203193FA8AD45F95CA8E86325F89898F4B315F94F093EF8AA98D AD97DF914F82CC8FEE95F182CC8EFB8F C28E8B89BB2E646F63>

スライド 1

第2回 制度設計専門会合 事務局提出資料

小 売 電 気 の 登 録 数 の 推 移 昨 年 8 月 の 前 登 録 申 請 の 受 付 開 始 以 降 小 売 電 気 の 登 録 申 請 は 着 実 に 増 加 しており これまでに310 件 を 登 録 (6 月 30 日 時 点 ) 本 年 4 月 の 全 面 自 由 化 以 降 申

WEBメールシステム 操作手順書

<4D F736F F F696E74202D2082C882E982D982C DD8ED88EE688F882CC82B582AD82DD C668DDA9770>

スライド 1

Office365 ProPlus 利用方法について

治 験 実 施 管 理 システム NMGCP 向 け Excel 形 式 プロトコール 作 成 手 順 書 V4.0.3 対 応 版 第 1 版 株 式 会 社 富 士 通 アドバンストエンジニアリング All Rights Reserved,Copyright 株 式 会 社 富 士 通 アドバン

文科省様式3-2集計オプションマニュアル

パソコンバンクWeb21 操作マニュアル[導入・事前設定編]

スライド 1

あいち電子調達共同システム

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安

S16-386・ソフトウェアの調達に関する入札実施の件

参加表明書・企画提案書様式

変 更 履 歴 日 付 Document ver. 変 更 箇 所 変 更 内 容 2015/3/ 新 規 追 加 2015/9/24 誤 字 修 正 2016/2/ 動 作 環 境 最 新 のものへ 変 更 全 体 オペレーター の 表 記 を 削 除 2016/5/

別冊資料-11

スライド 0

<4D F736F F F696E74202D B E E88E68C9A90DD8BC65F E DC58F4994C52E >

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

<4D F736F F F696E74202D2093FA8C6F939D8D EA68E9197BF>

Microsoft PowerPoint _リビジョンアップ案内_最終.pptx

POWER EGG V2.01 ユーザーズマニュアル ファイル管理編

 

ProWebRabbitインストールガイド

< F2D8AC493C CC81698EF3928D8ED2816A2E6A7464>

Microsoft Word - eラーニングFAQ_final.docx

<4D F736F F D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A B E A2E646F63>

前 書 き 広 域 機 関 システム System for Organization for Cross-regional Coordination of Transmission Operators(OCCTO) 商 標 類 Windows Office Excel Word

工 事 名 渟 城 西 小 学 校 体 育 館 非 構 造 部 材 耐 震 改 修 工 事 ( 建 築 主 体 工 事 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 1 設 計 図 書 等 の 閲 覧 貸 出 平 成 28 年 2 月 23 日 ( 火

2011論稿_吉川宏之.indd

データコピーとは データコピーは 古 い NAS のデータを 新 しい HDL-Z シリーズに 簡 単 にコピーできます 環 境 例 本 製 品 は 以 下 の 用 途 の 際 に 最 適 です 古 い HDL-Z シリーズから 新 しい HDL-Z シリーズへのコピー 古 い HDL-Z シリーズ

入札方式別操作

AGT10 ( Android(TM) 4.1) ファームウェア更新方法

工 事 名 能 代 南 中 学 校 体 育 館 非 構 造 部 材 耐 震 改 修 工 事 ( 建 築 主 体 工 事 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 1 設 計 図 書 等 の 閲 覧 貸 出 平 成 28 年 5 月 24 日 ( 火

目 次 1.はじめに 書 式 の 説 明 表 紙 スケジュール 組 入 れ 基 準 併 用 禁 止 薬 併 用 注 意 薬 同 種 同 効 薬 医 師 モニタリング..

贈与税 faq

前 書 き 広 域 機 関 システム System for Organization for Cross-regional Coordination of Transmission Operators(OCCTO) rev: 商 標 類 Windows Office Excel

- 1 - 総 控 負 傷 疾 病 療 養 産 産 女 性 責 帰 べ 由 試 ~ 8 契 約 契 約 完 了 ほ 契 約 超 締 結 専 門 的 知 識 技 術 験 専 門 的 知 識 高 大 臣 専 門 的 知 識 高 専 門 的 知 識 締 結 契 約 満 歳 締 結 契 約 契 約 係 始

その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

Pacemake-1.0とは違うのだよ、1.0とは! ~Pacemaker-1.1新機能のご紹介~

PowerPoint プレゼンテーション

目 次 1. 積 算 内 訳 書 に 関 する 留 意 事 項 1 ページ 2. 積 算 内 訳 書 のダウンロード 3 ページ 3. 積 算 内 訳 書 の 作 成 (Excel 2003の 場 合 ) 6 ページ 4. 積 算 内 訳 書 の 作 成 (Excel 2007の 場 合 ) 13

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

(Microsoft Word - \220\340\226\276\217\221.doc)

PowerPoint プレゼンテーション

振込データの作成

PC 移 行 は 以 下 の 流 れで 行 います 次 ページ 以 降 に 各 手 順 を 記 載 しますのでご 確 認 ください ( をクリックすると 該 当 の 説 明 にジャンプします ) 移 行 元 のPCでの 作 業 Step1 移 行 するデータをバックアップする (3ページ) [データ

Office 10 パッケージ版「リンク集」

住宅改修の手引き(初版)

PowerPoint プレゼンテーション

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

4 応 募 者 向 けメニュー 画 面 が 表 示 されます 応 募 者 向 けメニュー 画 面 で [ 交 付 内 定 時 の 手 続 を 行 う] [ 交 付 決 定 後 の 手 続 を 行 う]をクリックします 10

( 運 用 制 限 ) 第 5 条 労 働 基 準 局 は 本 システムの 維 持 補 修 の 必 要 があるとき 天 災 地 変 その 他 の 事 由 によりシステムに 障 害 又 は 遅 延 の 生 じたとき その 他 理 由 の 如 何 を 問 わず その 裁 量 により システム 利 用 者

2

目 次 1. はじめに 3 2. システム 要 件 4 3. HDD Password Tool のインストール 5 Windows の 場 合 5 Mac の 場 合 8 4. HDD Password Tool の 使 い 方 HDD Password Tool を 起 動 する

V-CUBE One

AirStationPro初期設定

6 システムを 入 れているパソコンを 入 れ 替 えたいが どうしたらいいのか 元 のパソコンから 新 しいパソコンに 昨 年 度 入 力 データを 移 行 します 手 順 は 次 のとおりです 1 元 のパソコンでシステムを 起 動 して メニュー 画 面 から バックアップ リカバリ を 選

PowerPoint プレゼンテーション

第三十六号の三様式(第六条関係)(A4)

1.2. ご 利 用 環 境 推 奨 ブラウザ Internet Explorer Google Chrome(バージョン 32 時 点 で 動 作 確 認 済 み) Mozilla Firefox(バージョン 26 時 点 で 動 作 確 認 済 み) Safari 7

・モニター広告運営事業仕様書

トートリンク インストールガイド

Transcription:

Pacemaker-1.1で 始 める 高 可 用 クラスタ 入 門 ~ 私 が 落 ちても 代 わりはいるもの~ 2015 年 5 月 23 日 OSC2015 Nagoya Linux-HA Japan 竹 下 雄 大

本 日 の 内 容 Pacemakerってなに? 最 新 Pacemaker-1.1.12の 特 徴 をご 紹 介 Pacemakerクラスタを 構 築 してみよう! 故 障 時 の 動 きを 体 験 してみよう! リソース 故 障 今 後 のスケジュール 2

Pacemakerってなに? Pacemakerはオープンソースの HAクラスタソフトです 3

Pacemakerってなに? High Availability = 高 可 用 性 つまり 一 台 のコンピュータでは 得 られない 高 い 信 頼 性 を 得 るために 複 数 のコンピュータを 結 合 (クラスタ 化 )し ひとまとまりとする ためのソフトウェアです サービス 継 続 性 4

Pacemakerってなに? HAクラスタを 導 入 すると 故 障 で 現 用 系 でサービスが 運 用 できなくなったときに 自 動 で 待 機 系 でサービスを 起 動 させます このことを フェイルオーバ と 言 います サービス フェイルオーバ サービス 故 障 現 用 系 待 機 系 5

Pacemakerってなに? は このHAクラスタソフトとして 実 績 のある Heartbeat と 呼 ばれていたソフトの 後 継 です 6

Pacemakerってなに? Pacemakerで 監 視 できること 仮 想 IP アプリケーション 監 視 制 御 起 動 停 止 稼 働 監 視 自 己 監 視 プロセス 監 視 watchdog ネットワーク 監 視 制 御 ping 疎 通 確 認 仮 想 IP 制 御 ノード 監 視 ハートビート 通 信 STONITH( 強 制 電 源 断 ) ディスク 監 視 制 御 ファイルシステム 監 視 共 有 ディスク 排 他 制 御 サーバ#1 サーバ#2 7

Pacemakerってなに? Pacemakerが 起 動 / 停 止 / 監 視 を 制 御 する 対 象 をリソースと 呼 ぶ 例 :Apache PostgreSQL 共 有 ディスク 仮 想 IPアドレス リソースの 制 御 はリソースエージェント(RA)を 介 して 行 う RAが 各 リソースの 操 作 方 法 の 違 いをラップし Pacemakerで 制 御 できるようにして いる 多 くはシェルスクリプト PostgreSQL RA Apache RA リソース エージェント リソース 共 有 ディスク RA 8

スプリットブレインとSTONITH (1) Pacemakerで 管 理 されるノードはインターコネクトLANを 通 して ハート ビート 通 信 によってお 互 いの 状 態 を 把 握 しています 生 きてる? サーバ#1 生 きてるよ! サーバ#2 ハートビート 通 信 が 途 切 れると? ACT 系 :SBY 系 がダウンしたかも?でもサービスは 稼 働 しているから このままでいいか SBY 系 :ACT 系 がダウンしたかも!?サービス 停 止 するかもしれな いから サービスを 起 動 しないと! 両 ACT 状 態 になる(スプリットブレイン) サービスの 両 系 起 動 仮 想 IPアドレスの 競 合 共 有 ディスクの2 重 マウント( 最 悪 の 場 合 データ 破 壊 が 発 生 ) 9

スプリットブレインとSTONITH (2) スプリットブレインを 阻 止 するには? 確 実 (かつ 最 終 的 )な 手 段 はこれ 10

スプリットブレインとSTONITH (3) STONITH (Shoot The Other Node In The Head) 両 ACT 状 態 になる 前 に 対 向 ノードの 強 制 電 源 断 を 実 行 する 機 能 サーバ 付 属 のリモートHW 制 御 ボード(iLOなど)を 利 用 OSと 別 系 統 のネットワークなので 信 頼 性 が 高 い 主 なSTONITHプラグイン ipmi libvirt stonith-helper 用 途 物 理 環 境 で 利 用 OSと 別 系 統 のネットワークを 利 用 するため 信 頼 性 が 高 い ただし iloなどのhw 制 御 ボードが 必 要 libvirtで 制 御 される 仮 想 環 境 で 利 用 ホストマシンからゲストマシンを 強 制 停 止 する スプリットブレイン 発 生 時 に 下 記 の 事 象 を 防 止 する 補 助 プラグイン ( 電 源 断 は 実 行 しない) 正 常 稼 働 中 のACTがSTONITHされること ( 不 必 要 なフェイルオーバの 発 生 ) お 互 いが 同 時 にSTONITHを 実 行 し 両 系 ダウン( 相 撃 ち) Linux-HA Japan 製 のプラグイン Linux-HA Japan 公 式 サイト(http://osdn.jp/projects/linux-ha/)から 取 得 可 能 11

参 考 STONITHプラグインが 使 えない 場 合 のスプリットブレイン 対 策 sfex 共 有 ディスクのsfex 専 用 パーティションに ディスクのロック 情 報 を 定 期 的 に 書 き 込 む ACT 系 によりロック 情 報 が 更 新 されていれば ACT 系 が 生 存 してい ると 判 断 し SBY 系 でのリソース 起 動 を 抑 止 VIPcheck SBY 系 からACT 系 のVIPに 対 してpingを 送 信 ping 応 答 があれば ACT 系 が 生 存 していると 判 断 し SBY 系 でのリ ソース 起 動 を 抑 止 12

最 新 Pacemaker-1.1.12 の 特 徴 をご 紹 介 13

2つのPacemaker Pacemakerには1.0 系 と1.1 系 の2 種 類 が 存 在 します 基 本 機 能 や 管 理 できるリソースに 違 いはありません 何 が 違 うの? コンポーネント 新 機 能 動 作 速 度 の 向 上 Pacemaker-1.0は 開 発 メンテナンスが 終 了 しました どっちを 使 えばいいの?? 新 規 導 入 の 場 合 Pacemaker-1.1の 利 用 をお 勧 めします! 14

Pacemaker-1.0と1.1の 比 較 Pacemaker-1.0 系 Pacemaker-1.1 系 対 応 OS( 1) RHEL 5/6, CentOS 5/6 RHEL 6/7, CentOS 6/7 クラスタ 上 限 ( 2) 6ノード 16ノード クラスタ 起 動 速 度 比 較 的 遅 い 早 い (1.0 系 から7 8 割 程 度 短 縮 ) フェイルオーバ 速 度 比 較 的 遅 い 早 い (1.0 系 から7 割 程 度 短 縮 ) 機 能 Pacemaker-1.0の 機 能 は 踏 襲 Pacemaker-1.1 系 でのみ 利 用 可 能 な 新 機 能 あり( 3) 実 績 たくさん これから 1 Linux-HA Japan 提 供 のリポジトリパッケージを 利 用 する 場 合 2 上 限 値 や 速 度 はLinux-HA Japanでの 検 証 によるもの( 環 境 により 異 なります) 3 Pacemaker-1.1の 性 能 新 機 能 の 詳 細 については 下 記 参 照 http://linux-ha.osdn.jp/wp/archives/4075 15

コンポーネントの 比 較 Pacemakerは 様 々なコンポーネントが 組 み 合 わさって 動 作 します Pacemaker-1.1でコンポーネントが 刷 新 されました Pacemaker- 1.0.13 Pacemaker- 1.1.12 約 4 年 の 期 間 を 経 てメジャー バージョンアップとなります Linux-HA Japan 開 発 ツール pm_logconvなど pm_logconvなど Linux-HA Japanで 開 発 した ツール 類 もPacemaker- 1.1.12に 対 応 済 みです 運 用 管 理 機 能 crmsh-2.1 pcs 0.9.90 運 用 管 理 機 能 としてcrmshと pcsの2 種 類 が 選 択 できるよう になりました STONITHプラグイン リソース 制 御 機 能 共 有 ライブラリ ノード 管 理 機 能 resource-agents- 3.9.5 pacemaker-1.0.13 cluster-glue- 1.0.11 heartbeat- 3.0.5 crmsh corosync- 1.4.6 cluster-glue- 1.0.12 resource-agents- 3.9.5 + 開 発 版 pacemaker-1.1.12 libqb-0.17.1 corosync- 2.3.4 fence-agents- 4.0.10 ノード 管 理 機 能 はcorosyncを 使 用 するため 設 定 やクラス タの 起 動 停 止 方 法 が 変 わりま す STONITHプラグインは cluster-glueとfence-agents の2 種 類 が 選 択 できるように なりました リソースエージェントは Pacemaker-1.0.13と 同 じも のを 使 用 することができます 凡 例 新 規 更 新 運 用 管 理 機 能 にはcrmshを 利 用 する 前 提 でお 話 しします crmshとpcsで 管 理 コマンドなどが 異 なるため 16

ノード 管 理 機 能 にCorosyncを 採 用 しました Pacemaker-1.1.12からLinux-HA Japanではノード 管 理 機 能 にCorosyncを 採 用 しました! Corosyncを 使 用 することによるメリット Corosyncを 使 うとノード 故 障 の 検 知 速 度 が 向 上 し フェイ ルオーバ 完 了 に 要 する 時 間 を 短 縮 することができます Heartbeatでは6ノード 80リソース 構 成 程 度 が 限 界 だっ たが Corosyncでは16ノード 200リソース 程 度 までの 動 作 実 績 があります Pacemaker-1.1 系 の 動 作 速 度 向 上 の 主 要 因 17

Pacemakerクラスタを 構 築 してみよう! 18

デモ 環 境 について (1) Pacemaker Apache PostgreSQL Tracを 使 用 したWEB サービスのActive/Standby 構 成 を 作 ります 一 般 的 なWEBサービスに 必 要 なリソースはすべて 組 み 込 んでいます( 仮 想 IPや 共 有 ディスクも 含 め) この 環 境 では 次 に 挙 げる 故 障 に 対 応 できます リソース 故 障 ノード 故 障 ディスク 故 障 ( 内 蔵 共 有 ディスク) ネットワーク 故 障 (サービスLAN 故 障 ) インターコネクトLAN 故 障 (スプリットブレイン) ただし STONITHではなく sfexによる 対 応 19

デモ 環 境 について (2) デモ 環 境 は 仮 想 マシン2 台 (VMware Player)を 利 用 します ハードウェア CPU: 1コア メモリ: 1GB ディスク: 10GB ソフトウェア OS: CentOS-6.6-x86_64 PostgreSQL-9.4.1( 公 式 サイトから 取 得 ) Trac-1.0.1(easy_installコマンドを 使 ってインストール) httpd-2.2.15-39(os 同 梱 版 を 使 用 ) 20

こんな 環 境 を 作 ります サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 仮 想 IP 192.168.1.100 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 仮 想 IP 192.168.2.20 192.168.3.20 ロック 情 報 ロック 情 報 mount mount sfex Activeノード 192.168.4.10 PostgreSQL DB 192.168.4.20 Standbyノード 管 理 LAN 21

Pacemakerのリソースに 表 すと このようになります サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 リソースグループ sfex Filesystem IPaddr2 仮 想 IP 192.168.1.100 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 仮 想 IP 192.168.2.20 192.168.3.20 リソースグループ sfex Filesystem IPaddr2 pgsql pgsql apache apache ping mount mount ping diskd 2 sfex diskd 2 Activeノード 192.168.4.10 PostgreSQL DB 192.168.4.20 Standbyノード 管 理 LAN 22

前 提 条 件 説 明 を 簡 略 化 するため 以 下 のセットアップを 予 め 行 って います Apache PostgreSQL Tracはインストール 済 みで 動 作 する 状 態 Tracは 下 記 のアドレスでアクセスできるように 構 築 済 み http://192.168.1.100/osc2015nagoya selinuxとiptablesは 無 効 化 しています 作 業 はrootユーザで 行 います 23

Pacemakerのインストール 1. Pacemakerリポジトリパッケージの 取 得 2. Pacemakerのインストール 24

Pacemakerリポジトリパッケージの 取 得 Linux-HA JapanのHPからPacemakerリポジトリパッケ ージを 取 得 します http://osdn.jp/projects/linux-ha/downloads/62369/pacemaker-repo- 1.1.12-1.1.el6.x86_64.rpm/ 25

Pacemakerのインストール 先 ほど 取 得 したRPMをインストールします Pacemakerのパッケージ 群 (RPM)とyumリポジトリの 定 義 ファイル(repoファ イル)がローカルディスクに 配 置 されます # rpm -ivh pacemaker-repo-1.1.12-1.1.el6.x86_64.rpm # ls /opt/linux-ha/pacemaker/rpm/ pacemaker-1.1.12-1.el6.x86_64.rpm corosync-2.3.4-1.el6.x86_64.rpm resource-agents-3.9.5-1.589.b6443.el6.x86_64.rpm crmsh-2.1-1.el6.x86_64.rpm (snip) # ls /etc/yum.repos.d/pacemaker.repo /etc/yum.repos.d/pacemaker.repo 26

Pacemakerのインストール yumコマンドでpacemakerをインストールします 依 存 関 係 のあるパッケージは 自 動 的 にインストールされます インターネットに 接 続 できない( 外 部 のyumリポジトリを 利 用 できない) 場 合 は インストールメディアを 利 用 してローカルリポジトリを 作 成 し てください 1 # yum y install pacemaker-all (snip) Complete! ( 1) CentOS 等 では PacemakerがOSに 同 梱 されているため yumによりos 同 梱 の Pacemakerがインストールされる 場 合 があります その 場 合 対 象 のrepoファイルに 下 記 を 追 記 してください exclude=pacemaker pacemaker-libs corosync cluster-glue heartbeat resource-agents 27

Pacemakerクラスタを 動 かすための 設 定 1. corosync.confの 作 成 2. 認 証 鍵 ファイルの 作 成 (corosync 通 信 用 ) 3. /etc/sysconfig/pacemakerの 設 定 4. クラスタ 起 動 スクリプトの 修 正 28

corosync.confの 作 成 /etc/corosync/corosync.confを 以 下 のように 作 成 します クラスタを 組 む 全 てのマシンに 同 じファイルを 配 置 してください 赤 字 の 設 定 については 自 身 の 環 境 に 合 わせて 適 宜 変 更 してく ださい totem { version: 2 rrp_mode: active token: 1000 interface { ringnumber: 0 bindnetaddr: 192.168.2.0 mcastaddr: 239.255.1.1 mcastport: 5405 } interface { ringnumber: 1 bindnetaddr: 192.168.3.0 mcastaddr: 239.255.1.1 mcastport: 5405 } } クラスタ 間 通 信 に 使 用 するネットワーク 全 て について 定 義 してくだ さい クラスタ 間 通 信 に 使 用 するネット ワークアドレスを 設 定 してください マルチキャスト 通 信 用 のアドレスを 設 定 してください 239.0.0.0~ 239.255.255.255 の 範 囲 が 推 奨 です クラスタ 間 通 信 で 利 用 する 受 信 ポー トです # ( 続 き) logging { syslog_facility: daemon debug: off } quorum { provider: corosync_votequorum expected_votes: 2 } syslogのファシリティを 設 定 します デフォルトの 設 定 では daemon が 設 定 され ます クラスタに 参 加 するノー ド 数 を 設 定 してください 29

認 証 鍵 ファイルの 作 成 以 下 のコマンドを 実 行 してクラスタ 間 通 信 に 使 用 する 認 証 鍵 ファイルを 作 成 します 生 成 された 認 証 鍵 ファイルをクラスタを 組 む 全 てのマ シンにコピーしてください # corosync-keygen -l # ls -la /etc/corosync/authkey -rw-r--r-- 1 root root 128 8 月 20 16:56 14 /etc/corosync/authkey # scp -p /etc/corosync/authkey server02:/etc/corosync/authkey 30

/etc/sysconfig/pacemakerの 設 定 本 設 定 でPacemakerのプロセスが 故 障 した 時 の 振 る 舞 い を 指 定 できます 本 設 定 を 追 加 すると Pacemakerのプロセスが 故 障 したノードはhalt 状 態 となり 他 のノードからはノードに 故 障 が 発 生 したと 判 断 されるようになります # vi /etc/sysconfig/pacemaker (snip) 67 # Enable this for rebooting this machine at the time of process (subsystem) failure 68 export PCMK_fail_fast=yes コメントアウトを 外 し 設 定 値 を yes に 69 (snip) 31

クラスタ 起 動 スクリプトの 修 正 (1) corosyncプロセスが 故 障 した 場 合 にcorosyncのwatchdog を 動 作 させるため 起 動 スクリプトの52 行 目 を 有 効 にします # vi /etc/init/pacemaker.combined.conf (snip) 50 51 # if you use watchdog of corosync, uncomment the line below. 52 pidof corosync false コメントアウトを 外 す 53 54 pidof crmd stop corosync (snip) 32

クラスタ 起 動 スクリプトの 修 正 (2) クラスタ 起 動 中 にOSをshutdownした 場 合 にクラスタを 正 常 に 停 止 させるため 起 動 スクリプトの5 行 目 に 設 定 を 追 加 します # vi /etc/init/pacemaker.combined.conf (snip) 3 # Starts Corosync cluster engine and Pacemaker cluster manager. 4 5 stop on runlevel [0123456] この1 行 を 追 加 6 kill timeout 3600 7 respawn (snip) 33

クラスタを 起 動 する 1. クラスタを 起 動 する 2. クラスタの 状 態 を 確 認 する 34

クラスタを 起 動 する 以 下 のコマンドを 実 行 してクラスタを 起 動 します Pacemaker-1.1.12からはUpstart 経 由 (CentOS6)で 起 動 します # initctl start pacemaker.combined pacemaker.combined start/running, process 25490 クラスタ 停 止 コマンドはこちら # initctl stop pacemaker.combined pacemaker.combined stop/waiting 35

クラスタの 状 態 を 確 認 する crm_mon を 実 行 してノードの 状 態 が Online になってい ることを 確 認 します # crm_mon -fad1 Online: [ server01 server02 ] (snip) 2 台 のマシンの 状 態 が Onlineになっているこ とを 確 認 します crm_monはクラスタの 状 態 を 確 認 するためのコマンドです 36

クラスタにリソースを 管 理 させる 1. リソース 定 義 ファイルを 作 成 する 2. リソース 定 義 ファイルをクラスタに 読 み 込 ませる 3. クラスタの 状 態 を 確 認 する 4. サービスが 起 動 したことを 確 認 してみよう 37

リソース 定 義 ファイルを 作 成 する 今 回 のデモ 構 成 では 以 下 のものをリソース 化 します サービスリソース apache pgsql IPaddr2( 仮 想 IPの 管 理 ) Filesystem(mountの 管 理 ) sfex( 共 有 ディスクロック 情 報 の 管 理 ) 監 視 リソース ping(ネットワークを 監 視 するリソース) diskd(ディスクを 監 視 するリソース) 38

リソース 定 義 ファイルをクラスタに 読 み 込 ませる crmコマンド 1 を 実 行 してクラスタにリソース 定 義 ファイル 2 を 読 み 込 ませます # crm configure load update osc2015nagoya.crm リソース 定 義 ファイル 1 crmコマンドはpacemakerクラスタを 操 作 する 運 用 管 理 コマンドです 運 用 管 理 機 能 にcrmshを 用 いた 場 合 に 利 用 できます 2 リソース 定 義 ファイルの 詳 細 については 下 記 参 照 http://linux-ha.osdn.jp/wp/archives/3786 39

クラスタの 状 態 を 確 認 する crm_monを 実 行 して リソースがActiveノード 上 で Started 状 態 になったことを 確 認 します # crm_mon -fad1 Online: [ server01 server02 ] Full list of resources: (snip) Resource Group: grptrac prmsfex (ocf::heartbeat:sfex):started server01 prmfs (ocf::heartbeat:filesystem): Started server01 prmvip (ocf::heartbeat:ipaddr2): Started server01 prmdb (ocf::heartbeat:pgsql): Started server01 prmweb (ocf::heartbeat:apache): Started server01 Clone Set: clndiskd1 [prmdiskd1] Started: [ server01 server02 ] Clone Set: clndiskd2 [prmdiskd2] Started: [ server01 server02 ] Clone Set: clnping [prmping] Started: [ server01 server02 ] (snip) リソースがActiveノード 上 で Started 状 態 になっ ていることを 確 認 します どちらのノードがActiveノードとなるかは リソース 定 義 ファイルの 制 約 で 記 述 します 制 約 に ついては 下 記 参 照 http://linux-ha.osdn.jp/wp/archives/3882 40

サービスが 起 動 したことを 確 認 してみよう WEBブラウザを 起 動 して 下 記 アドレスにアクセスし ます Tracに 接 続 できたら 無 事 構 築 完 了 です http://192.168.1.100/osc2015nagoya このIPはリソース 定 義 の IPaddr2で 設 定 した 仮 想 IPで す 41

故 障 時 の 動 きを 体 験 してみよう! 42

Pacemakerはどんな 時 にフェイルオーバしてくれるの? 例 えば 次 に 挙 げるような 状 況 になった 時 リソースをフ ェイルオーバしてくれます リソース 故 障 例 )httpdプロセスが 故 障 により 停 止 してしまった 時 ノード 故 障 例 ) 電 源 故 障 によりノードが 停 止 してしまった 時 ディスクやネットワークの 故 障 43

リソース 故 障 によるフェイルオーバのデモ 今 回 のデモではActiveノードでApache(httpd)プロセスをkill コマンドで 強 制 停 止 させることで フェイルオーバを 発 生 させ ます # kill -9 <httpdの 親 プロセス> 44

リソース 故 障 によるフェイルオーバ( 故 障 発 生 時 ) サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 リソースグループ sfex Filesystem IPaddr2 仮 想 IP 192.168.1.100 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 192.168.2.20 192.168.3.20 pgsql apache ping diskd 2 mount apacheの エラーを 検 知! sfex ping diskd 2 192.168.4.10 PostgreSQL DB 192.168.4.20 Activeノード Standbyノード 管 理 LAN 45

リソース 故 障 によるフェイルオーバ( 故 障 発 生 後 ) サービスLAN WEBアクセス インターネット 192.168.1.10 192.168.1.20 リソースグループ sfex Filesystem IPaddr2 192.168.2.10 192.168.3.10 インターコネクトLAN1 インターコネクトLAN2 仮 想 IP 192.168.1.100 192.168.2.20 192.168.3.20 リソースグループ sfex Filesystem IPaddr2 pgsql apache ping diskd 2 mount リソースグループがフェイルオーバ sfex pgsql apache ping diskd 2 192.168.4.10 PostgreSQL DB 192.168.4.20 Activeノード Standbyノード 管 理 LAN リソース 故 障 時 は 故 障 したリソースだけでなく そのリソースが 属 す るリソースグループ 全 体 がフェイルオーバします 46

リソース 故 障 発 生 後 のクラスタ 状 態 # crm_mon -fad1 (snip) Resource Group: grptrac prmsfex (ocf::heartbeat:sfex):started server02 prmfs (ocf::heartbeat:filesystem): Started server02 prmvip (ocf::heartbeat:ipaddr2): Started server02 prmdb (ocf::heartbeat:pgsql): Started server02 prmweb (ocf::heartbeat:apache): Started server02 Clone Set: clndiskd1 [prmdiskd1] Started: [ server01 server02 ] Clone Set: clndiskd2 [prmdiskd2] Started: [ server01 server02 ] Clone Set: clnping [prmping] Started: [ server01 server02 ] (snip) Migration summary: * Node server01: リソースはフェイルオーバさ れ Standbyノード 上 で 起 動 されます Migration summary に 故 障 リソースの 情 報 が 表 示 され ます Failed actions に 故 障 発 生 時 のオペレーション 情 報 が 表 示 されます prmweb: migration-threshold=1 fail-count=1 last-failure='mon May 18 14:04:52 2015' * Node server02: Failed actions: prmweb_monitor_10000 on server01 'not running' (7): call=66, status=complete, lastrc-change='mon May 18 14:04:52 2015', queued=0ms, exec=0ms ( 注 ) 本 来 の 運 用 では 故 障 原 因 を 取 り 除 き fail-countをクリアするなどして 故 障 発 生 前 の 状 態 に 戻 しますが 今 回 のデ モでは 時 間 の 都 合 上 復 旧 の 説 明 手 順 は 省 き 一 旦 クラスタを 再 起 動 させる 手 順 を 取 ります 47

今 後 のスケジュール 2015/5 月 現 在 のコミュニティ 動 向 ClusterLabs( 本 家 コミュニティ) 現 在 Pacemaker-1.1.13のリリースへ 向 け 作 業 中 Linux-HA Japan Pacemaker-1.1.12のRHEL7 対 応 Pacemaker-1.1.13の 確 認 フィードバック 今 後 のリリーススケジュール( 予 定 ) 2015/5/15 2015/5 月 末 2015/6 月 2015/10 月 本 家 コミュニティ Pacemaker-1.1.13-RC3 リリース Pacemaker-1.1.13 リリース( 想 定 ) Linux-HA Japan Pacemaker-1.1.12-1.1 RHEL7 対 応 リポジトリパッ ケージリリース Pacemaker-1.1.13 リポジトリパッケージリ リース(RHEL6/RHEL7) 48

さいごに Linux-HA Japan URL http://linux-ha.osdn.jp/ http://osdn.jp/projects/linux-ha/ Pacemaker 関 連 の 最 新 情 報 を 日 本 語 で 発 信 Pacemakerのダウンロードもこ ちらからどうぞ (インストールが 楽 なリポジトリパッケージ を 公 開 しています) 49

さいごに 日 本 におけるHAクラスタについての 活 発 な 意 見 交 換 の 場 として Linux-HA Japan 日 本 語 メーリングリスト も 開 設 しています Linux-HA-Japan MLでは Pacemaker Heartbeat3 Corosync DRBDなど HAクラスタに 関 連 する 話 題 は 歓 迎! ML 登 録 用 URL http://linux-ha.osdn.jp/ の メーリングリスト をクリック MLアドレス linux-ha-japan@lists.osdn.me スパム 防 止 のために 登 録 者 以 外 の 投 稿 は 許 可 制 です 50

ご 清 聴 ありがとうございました Linux-HA Japan 検 索 51

参 考 osc2015nagoya.crm ### Cluster Option ### property no-quorum-policy="ignore" stonith-enabled="false" startup-fencing="false" ### Resource Defaults ### rsc_defaults resource-stickiness="infinity" migration-threshold="1" ### Group Configuration ### group grptrac prmsfex prmfs prmvip prmdb prmweb ### Clone Configuration ### clone clnping prmping clone clndiskd1 prmdiskd1 clone clndiskd2 prmdiskd2 ### Master/Slave Configuration ### ### Fencing Topology ### ### Primitive Configuration ### primitive prmsfex ocf:heartbeat:sfex params device="/dev/sdb1" index="1" lock_timeout="70" monitor_interval="10" op start interval="0s" timeout="90s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="block" primitive prmfs ocf:heartbeat:filesystem params fstype="ext4" run_fsck="force" device="/dev/sdb2" options="barrier=0" directory="/pgsqldb" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="block" primitive prmvip ocf:heartbeat:ipaddr2 params ip="192.168.1.100" nic="eth0" cidr_netmask="24" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="block" primitive prmdb ocf:heartbeat:pgsql params pgctl="/usr/pgsql-9.4/bin/pg_ctl" psql="/usr/pgsql-9.4/bin/psql" pgdata="/pgsqldb/pgdata/data" start_opt="-p 5432" pgdba="postgres" pgport="5432" pgdb="template1" op start interval="0s" timeout="300s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="300s" on-fail="block" primitive prmweb ocf:heartbeat:apache op start interval="0s" timeout="300s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="300s" on-fail="block" 52

参 考 osc2015nagoya.crm primitive prmping ocf:pacemaker:ping params name="default_ping_set" host_list="192.168.1.5" multiplier="100" attempts="2" timeout="2" debug="true" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" ### Resource Colocation ### colocation rsc_colocation-grptrac-clnping-1 INFINITY: grptrac clnping colocation rsc_colocation-grptrac-clndiskd1-2 INFINITY: grptrac clndiskd1 colocation rsc_colocation-grptrac-clndiskd2-3 INFINITY: grptrac clndiskd2 ### Resource Order ### order rsc_order-clnping-grptrac-1 0: clnping grptrac symmetrical=false order rsc_order-clndiskd1-grptrac-2 0: clndiskd1 grptrac symmetrical=false order rsc_order-clndiskd2-grptrac-3 0: clndiskd2 grptrac symmetrical=false primitive prmdiskd1 ocf:pacemaker:diskd params name="diskcheck_status" device="/dev/sdb" options="-e -t 70" interval="10" dampen="2" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" primitive prmdiskd2 ocf:pacemaker:diskd params name="diskcheck_status_internal" device="/dev/sda" options="-e" interval="10" dampen="2" op start interval="0s" timeout="60s" on-fail="restart" op monitor interval="10s" timeout="60s" on-fail="restart" op stop interval="0s" timeout="60s" on-fail="ignore" ### Resource Location ### location rsc_location-grptrac-1 grptrac rule 200: #uname eq server01 rule 100: #uname eq server02 rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100 rule -INFINITY: not_defined diskcheck_status or diskcheck_status eq ERROR rule -INFINITY: not_defined diskcheck_status_internal or diskcheck_status_internal eq ERROR 53