CLUSTERPRO X 3.1 ネットワークパーティション解決方法補足資料 (Linux 版 ) 3 版 2011/10/11
人と地球にやさしい情報社会を イノベーションで実現する グローバルリーディングカンパニー NEC グループビジョン 2017 Page 2
本資料について この資料はネットワークパーティション状態時の動作と それを解決する方法について説明した資料です CLUSTERPRO X for Linux を対象とします Page 3
ネットワークパーティション状態とは サーバが正常であるがハートビート用の LAN の障害などで 双方のサーバ が 相手サーバがダウンしている と認識する状態のこと ネットワークに障害が発生 1 はダウンした 1 はダウンした 2 の業務をフェイルオーバする 同一ファイルシステムをマウントしてファイルシステム破壊発生 Page 4
LAN ハートビート, KLAN ハートビートを補完するリソース - LAN 以外のハートビート - LAN 系のハートビートを補完する *1 ハートビートリソースとして以下のハートビートリソースが追加で設定可能です COM ハートビートリソース ディスクハートビートリソース COM ハートビートリソース COM(RS-232C) ポートを使用して死活監視を行います COM HB COM RS-232C クロスケーブル COM COM HB ディスクハートビートリソース 上のディスクハートビート用パーティションを使用して死活監視を行います Disk HB ディスクハートビート用パーティション Disk HB *1 LAN 系の HB は必須です COM ハートビートとディスクハートビートのみでは動作しません Page 5
ディスクハートビートを追加した場合 LAN が断線した場合でもネットワークパーティション状態と判断されなくなる Disk HB Disk HB ネットワークに障害が発生 1LANHB, LANKHB はダウンした 2DiskHB はダウンしていアプリケーないション Disk HB Disk HB 1LANHB, LANKHB はダウンした 2DiskHB はダウンしていない 3 の業務をフェイルオーバしない Page 6
COM ハートビートを追加した場合 LAN が断線した場合でもネットワークパーティション状態と判断されなくなる ネットワークに障害が発生 1LANHB, LANKHB はダウンした COM HB COM HB 2COMHB は COM COM COM HB COM COM COM HB ダウンしていない 1LANHB, LANKHB はダウンした 2COMHB はダウンしていない 3 の業務をフェイルオーバしない Page 7
ネットワークパーティション状態の発生を抑止するリソース - Ping ネットワークパーティション解決 () リソース - ハートビートが 相手サーバダウン の状態になった場合に予め設定した監視先 (ping の発行先 ) からの応答が無い場合にサーバをシャットダウンします 他のサーバ ICMP ルータ 1 ルータなど IP アドレスを持つネットワーク機器 1. 設定した監視先へ ping パケットを送出, 応答を監視する 2. ハートビートが途絶しかつ ping の応答が無いとサーバをダウンさせる HUB からも同様 ルータ 2 HUB PC や他サーバへ Page 8
ネットワークパーティション状態の発生を抑止するリソース - Ping ネットワークパーティション解決リソース - 監視先の計画停止などに対応するため監視先は複数設定 (OR と AND) が可能 ( 例 ) 以下 A または B になった場合に ping 不達 と判断する A) サーバとルータ 1 にpingが不達 B) サーバとルータ 2 にpingが不達 常時起動でクラスタシステムと関連性のある *1 他サーバ サーバ ICMP ICMP ルータ 1 ルータなど IP アドレスを持つネットワーク機器 HUB ルータ 2 ICMP HUB PC や他サーバへ 1. 設定した監視先へ ping パケットを送出, 応答を監視する からも同様 2. ハートビートが途絶しかつ ping の応答が無いと自サーバをダウンさせる *1 クラスタシステム上で動作する業務が依存しているサーバなど Page 9
が設定されている場合の挙動 監視先 2PingNP 監視先に ping 実行 監視先 2PingNP 監視先に ping 実行 LAN / LAN / にネットワークに障害が発生 LAN / LAN / 1 はダウンした 1 はダウンした 監視先 3PING の応答が無いので自サーバをダウンさせる 監視先 3PING の応答が有るので自サーバをダウンさせない がダウンしてフェイルオーバをする LAN / LAN / LAN / LAN / 4 はシャットダウン 安全にフェイルオーバして業務継続 Page 10
IP モニタリソースとの違い IP モニタリソースも ping の応答有無でサーバシャットダウンなどのアクションが可能ですが以下の点で PING ネットワークパーティション解決リソースと異なります IP モニタリソースハートビートリソースの状態に依存せず ping の応答が無いときに設定されたアクション *1 を実行します PING ネットワークパーティション解決リソースハートビートリソースが 相手サーバダウン 状態でかつ ping の応答が無いときにサーバのシャットダウンを実行します *1 モニタリソースの異常検出タブで設定したアクション Page 11