SoftwareDesign DRBDで始める今どきクラスタリング Profile 名前 岩崎のぼる 橘べるちぇ 所属 株式会社サードウェア Twitter 活動 会社 サーバ構築とか簡単なスクリプトとか 会社 個人 書籍 雑誌の執筆 日経Lin

Similar documents
Microsoft PowerPoint (セミナー用)DRBD紹介資料.ppt [互換モード]

アジェンダ クラスタリングとは 今回の構成 DRBD Zabbix 等の構成ソフトウェア Zabbix2.0 新機能 構築方法 バックアップについて 参考資料 2

アジェンダ はクラウド上でも十分使えます 1. の概要 とは の導入事例 で利用される構成 2. をクラウドで使う クラウドサービスの分類 Amazon Web Services による構成例 2

ActiveImage Protector 3.5

スライド 1

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

Arcserve Replication/High Availability 製品の仕組み

Microsoft Word - CygwinでPython.docx

概要 ここでは先程デモを行った OpenStack の中で仮想マシンのデータがどのように管理されているかをご紹介致します OpenStack の中でデータがどのように配置され 管理されているかを知ることは 可用性を検討する上で非常に重要になります 2

Ontrack EasyRecovery 11 基本的な使い方

PowerPoint プレゼンテーション

<4D F736F F F696E74202D204E505F8E9F90A291E E815B CFC82AF B838B B838B C5E B8D5C91A E E4E41532E7

PowerPoint プレゼンテーション

Zabbix で PostgreSQL を監視! pg_monz のご紹介 Zabbix Conference Japan 年 11 月 20 日 SRA OSS, Inc. 日本支社マーケティング部

vdi_service_details

Avago( 旧 LSI) 3108 チップ搭載 RAID カードでの RAID1/RAID10 この RAID カードの RAID1 と RAID10 の設定方法によるメリット / デメリットについて お問い合わせをいただきました お問い合わせ : SuperMicroのサーバに当該チップ使用のR

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

1.3 ソフトウェア体系および対応表 (1) istorage ソフトウェアは istorage シリーズのディスクアレイを管理 および ディスクアレイが有する機能を制御するソフトウェア群です このソフトウェア群が提供するストレージ管理 制御機能を利用すると 様々なストレージソリューションを実現でき

変更履歴 項番版数内容更新日 版新規作成 2013 年 11 月 18 日 1

Windows10の標準機能だけでデータを完全バックアップする方法 | 【ぱそちき】パソコン初心者に教えたい仕事に役立つPC知識

CLUSTERPRO X IIJ GIO インフラストラクチャー P2 動作検証報告 2017 年 11 月日本電気株式会社クラウドプラットフォーム事業部 CLUSTERPROグループ 1 NEC Corporation 2017

◎phpapi.indd

MAGNIA Storage Server Configuration Guide


pgpool-ii で PostgreSQL のクラスタを楽々運用しよう OSC Tokyo 2014/12/12 SRA OSS, Inc. 日本支社マーケティング部 OSS 技術グループ 長田 悠吾

DataKeeper for Windows リリースノート

フォーマット/メンテナンスガイド

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

フォーマット/メンテナンスガイド

Diginnos PC 初期化方法 初期化操作を行うと ストレージ ( ハードディスク / SSD)( 以降ストレージと記載します ) 内のデータが全て初期化されます 必要なデータは他のメディア等にバックアップのうえ作業してください 初期化とは Windows 10 のプッシュボタンリセットの機能の

Microsoft Word - nvsi_090200jp_r1_nvbsvr_mscs.doc

改版履歴 Ver. 日付履歴 1.0 版 2014/5/30 目次 0 はじめに 本文中の記号について Windows Server Failover Cluster をインストールするための準備 Windows Server Failover

arcserve Backup r16 ライセンスと WSFC 対応製品 Arcserve Japan rev. 1.5

CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

改版履歴 Ver. 日付履歴初版 2014/7/10 - 目次 1. はじめに クラスター構築の流れ Windows Server Failover Cluster をインストールするための準備 OS のセットアップ時の注意... -

ブランドを統一 GUI とマニュアル上の製品表記をすべて Arcserve に統一 Arcserve Backup Arcserve Unified Data Protection Arcserve Replication/HA 2

付録

フォーマット(初期化)について

サンのオープンソースへの 取り組み

BIGLOBEクラウドホスティングAPIリファレンス

Microsoft Word - nvsi_060132jp_datadomain_restoreDRAFT4.doc

HP Serviceguard Solution for Linux(11.20) の MIRACLE System Savior バックアップ検証報告書 MIRACLE System Savior を使用した HP Serviceguard Solution for Linux(11.20) 環境

ActiveImage Protector 2016 R2 for Express5800 / ftサーバ

Software-Defined Storage ware Virtual SAN ware Virtual SAN

1996 Only One Technology NetJapan System Data Protection Solutions 2009 ActiveImage Protector ActiveImage Protector OS NetJapan System Protection Solu

Windows Storage Server リファレンスマニュアル

PowerPoint プレゼンテーション

PostgreSQL による クラスタ構成の可能性 SRA OSS, Inc. 日本支社 取締役支社長 石井達夫

EMC Isilon X シリーズ EMC Isilon X200 EMC Isilon X400 OneFS オペレーティングシステムで動作する EMC Isilon X シリーズは 優れた汎用性を持ちながらもシンプルなスケールアウトストレージアーキテクチャを採用して 大量のデータへの高速アクセス

Arcserve Replication/HA r16.5 のご紹介 Arcserve Japan 第 1.6 版 1

内容 1 はじめに バックアップの必要性 Windows Storage Server のバックアップについて ShadowProtect 5 for I-O DATA を利用したバックアップのメリット ShadowProtect 5 for

iStorage NSシリーズ管理者ガイド(詳細編)

XAMPP で CMS のお手軽 テスト環境を手に入れよう 2011/5/21 上村崇 1

CLUSTERPRO MC StorageSaver 1.2 for Linux パラメータシート 第 4 版 2014 年 3 月 31 日 日本電気株式会社

記憶域スペースダイレクト (S2D) を活用したハイパーコンバージドインフラ技術解説ガイド 概要本ドキュメントは Windows Server 2016 で構築したハイパーコンバージドインフラ (Hyper-Converged Infrastructure:HCI) を技術的な観点から解説したガイド

ライフサイクル管理 Systemwalker Centric Manager カタログ

3 検証結果 3.1 ソフトウェアのインストール Red Hat Enterprise Linux 5.7 は最小構成でインストールし 最新バージョンにアップデートした Thirdware Linux-HA を構成するパッケージ (DRBD Heartbeat Pacemaker) は LINBIT

新製品 Arcserve Backup r17.5 のご紹介 (SP1 対応版 ) Arcserve Japan Rev. 1.4

■POP3の廃止について

Microsoft Word - ssVPN MacOS クライアントマニュアル_120版.doc

ドメインコントローラを冗長化していてもバックアップは必要です! Active Directory データベースの複製の仕組み DC1 2 変更された情報を定期的に他の DC に複製 DC2 同期 1 ドメインコントローラ (DC) で変更が行われる Active Directory データベース上で

BMR for NVBU NIC bnx2.ko SVR/CLNT 上での SCSI megaraid_sas.ko 自動認識デバイス Partition 構成 (RHEL6.0 uefi/lvm 構成の場合 ) Partition1 /boot/efi EFI 200MB Partition2 /

スライド 1

クローン機能について 保存先が HDLH シリーズの場合マスタースレーブファイル 設定のコピー HDLH シリーズ 台をそれぞれマスター / スレーブとして構成し マスターの設定やファイルをスレーブに保存します ファイルの保存はレプリケーション機能を利用しておこなわれます 社内 LAN マスター故障

大学ファイルサーバー ( 共有フォルダ ) について 大学ファイルサーバー ( 共有フォルダ ) への利用について... 2 共有フォルダの説明... 3 共有フォルダ構成... 3 教職員共有フォルダ... 3 学生共有フォルダ... 4 教職員 / 学生個人フォルダ... 4 大学ファイルサーバ

EMC Data Domain Boost for Symantec NetBackup and NetBackup Storage Unit Group Failover

情報システム運用・管理規程

JustSystems

【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus

Transcription:

DRBDとPacemakerによるLinux-HA環境 株式会社サードウェア 岩崎のぼる

SoftwareDesign DRBDで始める今どきクラスタリング Profile 名前 岩崎のぼる 橘べるちぇ 所属 株式会社サードウェア Twitter http://twitter.com/bellche 活動 会社 サーバ構築とか簡単なスクリプトとか 会社 個人 書籍 雑誌の執筆 日経Linux SoftwareDesign Perl中毒 その他 Linux HA Japan Project 半分仕事 日本Unboundユーザ会 主にLinux関連の業界を右往左往 その他 猫好き 最近Pythonを勉強中 iphone/ipadを持っててもmacが無くて寂しい Androidの開発環境があっても端末なくて寂 自宅に自分の部屋が無くて寂しい @IT DRBD iscsi夢の共演 前/後編

アウトライン DRBDの概要 Linux-HAとDRBDを組み合わせ DRBDで起こりがちなトラブル 事例紹介 Pacemaker概要 HeartbeatからPacemakerへ Linux-HA Japan Project コミュニティ 紹介

DRBDとは Duplicated Replicated Block Device Duplicated = 複製された Replicated = 重ねられた Block Device = ブロックデバイス なんて言えばいいのかw ブロックデバイスが複製されているという感じです

ただの複製ではありません TCP/IPネットワーク

いろいろ細かい説明は飛ばします ハードウェア構成とか 設定方法とか 初期同期とか 基本的な管理コマンドとか

ブロックデバイスが複製できるということは 通常のHDD /dev/sda1 とか はもちろん SSD デバイスが複製できる 早い RAMディスクなんかも複製できる 超早い ブロックデバイスで認識されてば 結構いろんなものがレプリケーションされます ネットワークを使っているのに なんとリアルタイムでレプリケーションされる

TCP/IPネットワークを使うということは 専用のレプリケーションI/Fがいらない TCP/IPなので速度はともかくVPNで遠隔地可能 夢が広がる 2台分のサーバの面倒をみないといけなくなるため メンテナンスする 仕事の範囲も広がる

重要なところ DRBDはFilesystemの下で動いている Filesystemを選ばない ここに注目 ext3/ext4 XFS FAT32 NTFS まさになんでも来い

弱点もある 単純にサーバが2台以上必要 やっぱり同期するためディスクI/Oは遅くなる ネットワークの遅延にモロ影響される 壊れたデータもレプリケーションしてしまう NFSとかSambaのディレクトリは複製できない DRBDでミラーされた領域を共有してください

ここでちょっとしたテクニックをご紹介 DRBDとLVMの組み合わせ LVをミラーリング PVをミラーリング

LVをDRBDでミラーリングすると 設定は簡単 普通にLVをミラーすればいい マウント マウント Filesystem DRBD DRBD LV LV VG VG HDD PV HDD PV Primary スナップショット Secondary セカンダリ側でもスナップショットを取ればマウントできちゃう 運用側に負荷をかけずに世代バックアップを取ることができる セカンダリのI/O負荷があがるなら 一旦DRBD同士の接続を切っちゃえばいい 多分これDRBDでしか実現できない技な気がする 他知らない

PVをDRBDでミラーリングすると 設定は少しおまじないが必要 lvm.conf FS FS FS FS LV LV LV LV LVの追加 削除 LVのリサイズ VGのステータス変更 etc. VG DRBD PV DRBD PV HDD HDD Primary Secondary LVMの利便性をそのままにDRBDで全部ミラーリング可能 LV作る度にDRBDのリソース追加とかしなくていい 16TBを越えた大容量に対応できるようになる VG使用 DRBDは一応16TBまでサポート

PVをDRBDでミラーリングすると /etc/lvm/lvm.conf のおまじないって # By default we accept every block device: #filter = [ "a/.*/" ] # DRBD on LVM Configuration filter = [ "r /dev/sd.* " ] ①デフォルトだと/dev/drbd*デバイスをPVとして認識してくれない ②物理デバイス sda3とかsdb1とか を認識しないように指定する これをやってからlvm2-monitorを再起動すると/dev/drbd*がPVとして認識される 注) これをやらなくても pvcreate /dev/drbd0 が通りますが pvdisplayで確認すると物理デバイスをpvとして認識し ている状態となるので DRBDでミラーリングされません

LVをミラーするパターンのメリット デメリット メリット セカンダリ側でスナップショットをとってマウントできる 構築が簡単 デメリット LVのリサイズができなくなる LVを追加する場合 DRBDリソースも追加設定する必 要がある LVMの機能は結構制限される

PVをミラーするパターンのメリット デメリット メリット LVのサイズ変更 追加等LVMの機能全開にできる DRBDデバイス PV を増やしてVGに登録できる デメリット セカンダリ側でスナップショットがマウントできない LVMで障害が発生するとシングルポイントになる 設定と運用に少し手間がかかる (vgchangeとか)

直前追加 3ノードについて DRBDは最大4台まで同期できます スタックノードというのを使ってDRBDの上にDRBD をかぶせるイメージで理解してください 3ノード目をWAN越えする要求がけっこうあります WANになると回線が遅いのがネックになります 回線が遅いのをごまかすために DRBD Proxy 有料ソリューション があります 図はあとで追加してアップ するかも

キーワード Disaster Recovery ディザスタリカバリ 遠隔地にバックアップを置くことで 災害時にデータセンタ事態に被害が発生してもデータを 消失しないための体制やしくみを言います FTPはVPNを使って定期的なバックアップを遠隔地に保存する手法が現在一般的なのでは ないでしょうか DRBDを使うとリアルタイムな DR環境が実現します

気になるパフォーマンス

ベンチマークを取ってみました シーケンシャル読み込み HP ProLiant 360 G6 1Gbps NIC DRBD over LVM 同期状態 DRBD over LVM 非同期状態 LVM over DRBD 同期状態 +SS LVM over DRBD 同期状態 Per Chr Block LVM over DRBD 非同期状態 DRBD のみ 同期状態 DRBD のみ 非同期状態 LV のみ ( 基準値 0 50000 100000 150000 200000 250000 読み込みはローカルからしか読まないので 同 期非同期に関わらず一定値を出す

ベンチマークを取ってみました HP ProLiant 360 G6 1Gbps NIC シーケンシャル書き込み DRBD over LVM 同期状態 DRBD over LVM 非同期状態 LVM over DRBD 同期状態 +SS LVM over DRBD 同期状態 Per Chr Block Rewrite LVM over DRBD 非同期状態 DRBD のみ 同期状態 DRBD のみ 非同期状態 LV のみ ( 基準値 0 50000 100000 150000 200000 250000 ChrとRewriteはもともと遅いのであまり差は出な いがBlockでは結構差が出る

ベンチマークを取ってみました HP ProLiant 360 G6 1Gbps NIC すみません このデータは 普通には 出せないことになっていますw ファイルの作成や削除を繰り返すテストでは同期のオー バーヘッドが多くなりかなりの差が出る

結 論 DRBDは向き不向きがあるのでDRBD を使用するアプリケーションの特性を 考えて使いましょう 当然と言えば当然なんですが

Pacemakerとは HAクラスタ環境を 実現

>> キーワード これと これ HighAvailability ハイ アベイラビリティ 略して HA

HighAvailabilityとは High = 高い Availability = 有用性 要するに 結構使える ということ よくわかりませんw

HighAvailabilityとは2 HighAvailability 高可用性

どのようにサービスの可用性 使える度 を高めるか 予備を用意する 同じサービスを提供できるサーバをもう一大用意して寝かせておき いざとなったら交換してしまえば 同じサービスが提供できる Active/Standby型のフェイルオーバーHAクラスター環境 という長い名前で呼んで説得力を無駄に稼いだりします

HA環境の基本形 提供するサービスが停止したときに 予備のサーバを 自動で起動してサービスを継続する 2台構成 つまり

前置き終わり 姉妹 構成

姉妹だから 使える 可用性が高い

姉妹 双子の姉妹

良い 可用性が高い

愛着が沸く 最重要事項 妹 姉 ごめん ちょっとなんか今日調子悪くて 障害発生 妹 妹 わかった 今日は私ががんばるよ フェイルオーバー 俺 しょうがないな 調子が悪いところを俺が診てやるよ メンテナンス 妹 姉 調子良くなったよ 心配かけてごめんね メンテナンス終了 妹 妹 よかった でもお姉ちゃんはまだゆっくりしててっ HA環境復旧

設定 名前 高良 かな CV 田中理恵 身長165cm 体重49kg 胸はAカップ スポーティ 性格 明るく元気 結構気が強い姉御肌 髪の毛 黒で若干グレーが入るくらい セミロング 普段はアップにしていることが多い 髪留めに ペースメーカーのロゴ 姉妹おそろい スポーツウーマン 結構頭もいい 年齢 20歳 職業 某工学部情報工学科の2年生 周囲は男性が8割以上だけど 平気 そこそこもてるけど あまり恋愛に興味はない お父さんはIT系の会社で仕事をしている 将来は 自分もIT系の会社に入るんだろうなぁと考えている 2年生だけどそろそろ就活も視野に入ってきている スポーツウーマン 高校時代 陸上部 種目は走り高跳び インターハイに出たことがある でも優勝とか言うレベルではない 大学に入ってからは もっぱらバイトの日々 家族構成 長女 高校2年生の妹がいる 4人家族 両親は健在 お母さんは専業主婦 生い立ちなどの設定 江戸っ子 普通のサラリーマン家庭で育つ パソコンも使うけど 妹ほどではない どちらかと言うと身体を動かしていた方が好き 格好 スーツ ボーイッシュな さっぱりした格好が中心 色は寒色系 口癖はある ちょっと姉御肌な声 てやんでぃ 特技 運動 字は汚い 趣味 ネットサーフィン 身体を動かす 妹が胸が大きいことが ちょっとだけコンプレックス これイラスト制作用のラフ画 なので 公式キャラクターは もうちょっと変わる予定です 色も適当です

設定 名前 高良 かよ CV 丹下桜 身長160cm 体重49kg 胸はEカップ 性格 明るいオタク 髪の毛 黒で若干茶色が入るくらい ロング 普段はポニーテールで 大きなリボンを付けている 髪留めに ペースメーカーのロゴ 姉妹おそろい 年齢 17歳 職業 ミッション系女子高の2年生 成績は中の上 オタク ネットとアニメが大好き ファンタジー系のラノベも好き コスプレも少しだけするけど 人前でやるのはちょっと恥ずかしい 家族構成 次女 お姉さんはかなちゃん 4人家族 両親は健在 お母さんは専業主婦 お父さんはIT系の会社で仕事をしている 生い立ちなどの設定 江戸っ子 普通のサラリーマン家庭で育つ 小4からパソコンを触っている パソコンとかネットには詳しいがITはそれほどでもない 格好 かわいい系の格好 メイド服 コスプレ 学校の制服はセーラー服 東京女学館参照 口癖はある 萌え 舌っ足らずで 少し噛む 特技 パソコン ブラインドタッチが出来る 携帯を打つ早さは誰にも負けない 趣味 ブログ アフリエイトで小遣い稼ぎ コスプレを少々 身体を動かすことは苦手 ピンク系の色が好き 服もそんな感じが多い 部屋は姉妹別 となりどうし お姉ちゃんがなんでもできることがちょっとだけコンプレックス これイラスト制作用のラフ画 なので 公式キャラクターは もうちょっと変わる予定です 色も適当です

設定終了

Pacemakerの動き リソースはCRM クラスターリソースマネージャ で 管理されます CRMコマンドという管理コマンドで設定します CIB.xmlというファイルで設定値と現在の状態を一 元管理しています Heartbeat V2にもCRMが実装されていますが 分 離してPacemakerとなりました

HA環境の例

HA環境の例

キーワード SHARED Nothing Cluster (シェアドナッシングクラスター)

DRBDを使わないクラスター環境 サービスを提供するサーバは 2台構成のHAクラスタを組んでおり データは共有ス トレージを使用している Webサーバ 相互監視 Webサーバ マウント 共有ストレージ 共有ストレージダウンしてしまうとサービス継続は不可能となる 共有ストレージのデータが壊れてしまうとどうしようもない RAIDを組んだりして対応している

シェアドナッシングクラスター

DRBDとPacemakerを組み合わせると 簡単低コストで シェアドナッシングの HAクラスター環境の 構築が可能となります

よく遭遇する障害

キーワード SPLIT BRAIN スプリットブレイン 頭が2つに割れてしまうという意味

正常な時は 私に任せなさい お姉ちゃんに任せる 意思の疎通ができてる Active側でサービスが起し Standby側ではサービスが上がらな い状態で待機される Active Standby

スプリットブレイン状態だと あれ 妹いない ま いっかwww あ お姉ちゃんいない 私ががんばらなくちゃ 意思の疎通ができない 健気な妹たちは 意思の疎通ができ ず お互いがActiveになろうとしてが んばってしまいます Active Active

スプリットブレインを起こしてしまうと IP重複が起きる可能性がある 同時に2つのノードから共有ストレージをマウントし てしまい ファイルシステムが壊れる その他いろいろ 重大な障害へ発展する可能性高い

Pacemaker DRBD環境でのスプリットブレイン IP重複は起きてしまう場合がある それぞれがストレージを持っているため 同時マウ ントの障害は発生しない ただデータの同期が停止する 安全装置 重大なデータ障害へ発展する 可能性が比較的低い 落ちれば全部重大 同期されなかった差分は自動または人間の目でデータを確認しながら抽出し 再度同期を開始さ せることで元の状態に戻る データが破損されるリスクも共有ストレージに加えて低くなります

まとめ

DRBDはファイルシステムを問わない LVMと組み合わせて楽しくも辛くもなれる リアルタイムなディザスタリカバリ環境の実現 Pacemakerと組み合わせると世界がぐっと広がる 単一障害点のHA化にもってこい シェアドナッシングクラスター環境 パフォーマンス低下に注意 姉妹構成で愛情溢れる保守が可能となる

事例紹介 シチズン時計 DRBD over LVM 3ノード) 岐阜女子大学 LVM over DRBD 3ノード 米国911センター 業務ごと冗長化4ノード

コミュニティ紹介

Linux-HA Japan 活動内容 MLの運営 技術情報の公開 OSC等のイベントに参加 飲んだり 食べたり つぶやいたり いろいろ作ってみたり Linux-HA Japan 検索

ご静聴ありがとう ございました