Microsoft Word - Arista_Networks_VXLAN_White_Paper_KH.docx

Similar documents
PowerPoint プレゼンテーション

CSS のスパニングツリー ブリッジの設定

VLAN の設定

2.5 トランスポート層 147

スライド 1

VLAN Trunk Protocol(VTP)について

アマチュア無線のデジタル通信

PowerPoint プレゼンテーション

TeamViewer マニュアル – Wake-on-LAN

TeamViewer 9マニュアル – Wake-on-LAN

Presentation Template Koji Komatsu

JPexam 最新の IT 認定試験資料のプロバイダ IT 認証であなたのキャリアを進めます

4-4. ファイアウォール (IPv4)

情報通信の基礎

PowerPoint Presentation

Solstice Pod ネットワーク導入ガイド

アライドテレシス・コアスイッチ AT-x900 シリーズ で実現するエンタープライズ・VRRPネットワーク

PIM-SSMマルチキャストネットワーク

コンバージドファブリック仕様一覧

マルチポイント GRE を介したレイヤ 2(L2omGRE)

Microsoft PowerPoint ppt [互換モード]

Maximize the Power of Flexible NetFlow

IPsec徹底入門

FUJITSU Cloud Service for OSS プライベート接続 サービス仕様書

2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹

Cisco HyperFlex セットアップ概要

Express5800 シリーズ Windows Server 2019 NIC チーミング (LBFO) 設定手順書 Microsoft Windows Windows Server は 米国 Microsoft Corporation の米国およびその他の国における登録商標です その他 記載され

ACI ファブリックの基本

INDEX Demo の目的 ゴール Scenario 1: 自動化 Scenario 2: 効率化 2

変更履歴 項番版数内容更新日 版新規作成 2013 年 11 月 18 日 1

セキュリティ機能の概要

ヤマハDante機器と他社AES67機器の接続ガイド

TCP/IP設定のいろは

Windows Server 2008 R2 Hyper-V ネットワーク設定ガイド

Cisco CSS HTTP キープアライブと ColdFusion サーバの連携

フルボリュームのレプリケーションは 通常 営業時間外か週末に実施されます 一方 インクリメンタルなレプリケーションは 一日を通じて実施され 開始点としてフルボリュームのレプリケートを必要とします 主な機能 TCP 最適化標準的な TCP ウィンドウサイズと輻輳動作を変更することでスループットを改善

プロダクト仕様書 SLB

セキュリティ機能の概要

エンドユーザーコンピューティングⅠ

No. ネットワーク一 17 番 機能 ポートベースVLAN, タグVLAN, プロトコルVLAN,MAC VLAN, Tag 変換に対応していること DHCPサーバをサポートしていること IGMP snooping,mld snooping 機能をサポートしていること IPv4 及びIPv6におけ

TFTP serverの実装

Microsoft Word - PCOMM V6.0_FAQ.doc

ポート拡張オプション(10GBASE-T×2)

Windows GPO のスクリプトと Cisco NAC 相互運用性

第5回 ネットワークプランニング18 (CS・荒井)

ネットワーク入門 データ届くためには2 練習問題

Windows Server 2016 Hyper-V ストレージQoS機能の強化

Exam : 日本語版 Title : Introducing Cisco Data Center Networking Vendor : Cisco Version : DEMO 1 / 4 Get Latest & Valid J Exam's Question a

77-j.pdf

網設計のためのBGP入門

刷新されたIIJ GIOクラウド基盤におけるSDNの実践

IPIP(Si-RG)

PowerPoint Presentation

Nexus 1000V による UCS の MAC アドレスのトレース

使用する前に

PAN-OS: パケット処理 PAN-OS のパケットフローシーケンス パロアルトネットワークス合同会社

Microsoft® Windows® Server 2008/2008 R2 の Hyper-V 上でのHP ProLiant用ネットワークチーミングソフトウェア使用手順

VRF のデバイスへの設定 Telnet/SSH アクセス

まえがき 2011 年 11 月 1 日 ver1.0 [ 初版 ] 本手順書では vcenter サーバが管理する仮想コンピュータを Acronis Backup & Recovery 11 エージェント for ESX(i)( バーチャルアプライアンス ) を用いてバックアップする手順をご紹介し

常駐接続(ISL AlwaysOn)Wake On LAN 設定ガイド

JapanCert 専門 IT 認証試験問題集提供者 1 年で無料進級することに提供する

Rev:1.0 Arcserve Backup 18.0: 下位互換サポート 1 下位互換サポートについて 下位互換サポートの対象製品と対象バージョン 注意点 全体的な注意点 下位互換バージョンのライセンス登録

JP-AN-186_Feb_2015 -JP

タイム センシティブ ネットワーキングについて

IPSEC(Si-RG)

アライドテレシス・コアスイッチ AT-x900 シリーズとディストリビューションスイッチ AT-x600 シリーズで実現するACLトラフィックコントロール

Transcription:

VXLAN: データセンター拡張の基盤技術ホワイトペーパー VXLAN(Virtual Extensible LAN) の概要 この文書では VXLANのしくみについて概要を説明します また 仮想インフラの導入時に いつどの部分でVXLANを使えばよいかという判断材料も提示します VXLANは アリスタ Broadcom Intel VMwareをはじめとする各社で仕様を策定した規格です 仮想データセンターの拡張性を向上させます VMwareのvSphereをはじめとする仮想化の大きなメリットの1つは データセンター内のサーバー間で仮想マシン (VM) を移動できることです VMを実行したままでも移動が可能です ステートフルvMotionやライブvMotionと呼ばれるこの機能によって サーバーの管理とプロビジョニングがシンプルになります VMの機能や可用性にも影響は及びません vmotionをサポートするためには VMは常にしかるべきIPサブネット内に存在しなくてはなりません これによって ネットワーク上の他のユーザーとVMとの間のネットワーク接続が保証されます 残念ながら IPサブネットの壁により VMの移動範囲は vswitchが同じサブネットに属するvsphereサーバーのクラスタに限定されます たとえば 使用率が低いサーバーにVMを移動しようとシステム管理者が考えたときには そのVMのネットワーク接続が vmotionによって中断することがないかどうか確認しなくてはなりません これは 小規模なサブネットのクラスタでは通常は問題とはなりませんが サブネット VM サーバーの数が増えてくると vmotionを制限するipサブネットの壁にぶつかります VXLAN の用途 : VXLANのレイヤ2トンネリング機能は IPサブネットの壁を克服するものです データセンターのサブネット分割の方法に関係なく データセンターのどのサーバーにもVMを移動できるようになります これによって www.arista.com/jp 1

管理者は 信頼性の高い L3 アーキテクチャをデータセンターに採用しつつ データセンターのすべてのサーバー間で VM の移動をサポートできます 使用例 : 利用者向けのクラウドをプロビジョニングするホスティング プロバイダ IPアドレス空間が一杯になった後もデータセンターのネットワーク アーキテクチャを維持したいと考えるVMファーム 802.1qのVLANの制約を超えてマルチテナント サービスを拡張する必要があるクラウド サービス プロバイダ VXLANとは根本的に レイヤ2の複数の ( サブ ) ネットワークを集約してレイヤ3のインフラにトンネリングするためのしくみです VX LANの基本的な用途は 複数のレイヤ3ネットワークのドメインを接続して共通のレイヤ2ドメインに見せかけることです このしくみによって 別々のネットワーク上にある仮想マシン同士が 同じレイヤ2サブネット内にあるかのように通信できます VTEP(Virtual Tunnel End Point) を使用して複数の仮想ネットワークを伝送 VXLAN の実装 : VXLAN を使用するには 以下をサポートしたネットワーク インフラが必要です マルチキャストのサポート :IGMP と PIM レイヤ 3 ルーティング プロトコル :OSPF BGP IS-IS ほとんどの部分では ネットワーク デバイスはVXLANトラフィックを透過的に処理します つまり IPにカプセル化されたトラフィックのスイッチングやルーティングは 通常のIPトラフィックと特に変わりません VXLANゲートウェイは Virtual Tunnel End Point (VTEP) とも呼ばれ カプセル化と非カプセル化のサービスをVXLANに対して一元的に提供しています VTEPには ハイパーバイザ内の仮想ブリッジ VXLANに対応したVMアプリケーション VXLANに対応したスイッチング ハードウェアのいずれかを使用できます 既存のデータセンター インフラでネットワークを仮想化するうえで VTEPは鍵となります www.arista.com/jp 2

そんなに多くは使えません... VXLANの各ネットワーク セグメントは VXLAN Network Identifier(VNI) という24ビットの一意のIDと関連付けられています 24ビットのアドレス空間であることから 仮想ネットワークの数は 802.1Qの上限である4096を超えて 最大 1670 万まで拡張できます ただし マルチキャストとネットワーク ハードウェアの制限により 多くの環境では 実際に使用可能な仮想ネットワークの数は少なくなります L2の論理ドメインが同じであるVMは 同じサブネットを使用し 共通のVNIが割り当てられます L2とVNIのこのマッピングによって VM 間の通信が可能となります なお VXLANを使用した場合でも レイヤ3のアドレッシングの方法は変わりません L2の物理ネットワークに適用されるIPアドレッシングの規則が 仮想ネットワークにも適用されます VXLANは VMのMACアドレスとVNIの組み合わせによってVMを一意に識別します このしくみが興味深いのは 重複するMACアドレスがデータセンターのドメイン内に共存できることです 重複するMACアドレスが同じVNIで共存してさえいなければ問題ありません VNIサブネット上の仮想マシンには VXLANを利用するための特別な設定は必要ありません カプセル化 / 非カプセル化やVNIのマッピングは ハイパーバイザに組み込まれたVTEPが対処するからです また VXLAN 対応のスイッチング プラットフォームも同様で 802.1q 対応のネットワーク デバイスのカプセル化 / 非カプセル化のオーバーヘッドに対処します VTEPに対しては レイヤ2またはIPサブネットからVNIネットワークへのマッピングと VNIからIPマルチキャスト グループへのマッピングの設定が必要です 前者のマッピングでは VNI/MACのトラフィック フローのためのフォワーディング テーブルがVTEPに作成されます 後者のマッピングでは オーバーレイ ネットワーク全体に対するブロードキャスト / マルチキャスト機能をVTEPがエミュレートできるようになります VTEPの構成を同期する処理は RANCIDのような一般的な構成管理ツールで自動化するか またはVMware vcenter OrchestratorやOpen vswitchなどのシステムを使って管理できます VXLAN のフレームのカプセル化と転送 : ここまでに挙げた要素を使って VTEP は次のような形で転送規則を適用します 1) 送信元と宛先のMACアドレスが同じホスト上にある場合は トラフィックはvSwitchを通じてローカルでスイッチングされ VXLANのカプセル化 / 非カプセル化は実行されない 2) 宛先のMACアドレスが同じESXホスト上にない場合は 送信元のVTEPが適切なVXLANヘッダーを付けてフレームをカプセル化し ローカルのテーブルに基づいて宛先のVTEPに転送する 宛先のVTEPは VXLANヘッダーを外して内部フレームを取り出したうえで 宛先のVMに届ける 3) 不明なユニキャストやブロードキャスト / マルチキャストのトラフィックの場合は ローカルのVTEPはVXLANヘッダーを付けてフレームをカプセル化し 作成時点でVNIに割り当てられたVNIのマルチキャスト アドレスにそのフレームをマルチキャストする これには すべてのARPやBoot-p/DHCP 要求などが含まれる www.arista.com/jp 3

他のホストのVTEPは マルチキャスト フレームを受信して ユニキャスト トラフィックと同じように処理する ( 上記の2を参照 ) このトンネリング方法の実装は MPLSやOTVといった他の手法に比べて比較的シンプルです 管理者は VNIまたはIPマッピングとマルチキャスト アドレスさえ設定すれば済むからです 残りはVTEPが管理します フレームの構造の詳細は次のとおりです VXLAN ヘッダーの構造 イーサネット ヘッダー : 宛先アドレス - 宛先の VTEP が同じサブネット上の場合は その MAC アドレスを設定します 宛先の VTEP が別のサブネット上にある場合は ネクスト ホップ デバイス ( 通常はルーター ) のアドレスを設定します VLAN - VXLAN の実装ではオプションです デフォルトでは 802.1Q の Tagged Prototocol Identifier(TPID) の Ethertype である 0X8100 で 該当する VLAN ID タグを持ちます Ethertype - IPv4 のペイロード パケットを示す 0X0800 に設定します 現時点では IPv6 はサポートしていませんが 今後の導入に向けた検討が進んでいます IP ヘッダー : プロトコル - 0x11 に設定して UDP パケットであることを示します 送信元 IP - 送信元の VTEP の IP アドレスに設定します 宛先 IP - 宛先の VTEP の IP アドレスに設定します 未知 / 未学習の場合や ブロードキャスト / マルチキャスト アドレスの場合は VXLAN はマルチキャスト グループを使ってネットワークのブロードキャストをシミュレートします 処理の概略は次のとおりです a) 宛先 IPを 送信元の仮想マシンのVNIに対応するIPマルチキャスト グループに置き換える b) フレームがマルチキャストされ 同じVNIマルチキャスト グループのすべてのVTEPが受信する 各 VTEPはこのフレームを取り出し 送信元のID とVNIのマッピングを今後の使用のために学習したうえで フレームの種類とローカルのフォワーディング テーブルの情報に基づいて パケットを転送または破棄する c) 対象の仮想マシンが属するVTEPが 仮想マシンの応答をカプセル化して 送信元のVTEPに転送する d) 送信元のVTEPが応答を受信し IDとVNIのマッピングをやはり今後の使用のためにキャッシュする UDP ヘッダー : 送信元ポート - 転送を行うVTEPが設定します この値には インナーのイーサネット ヘッダーから算出したハッシュ値も使用できます これにより ポート チャネルやECMPのハッシュ アルゴリズムがこの値をトラフィックの負荷分散に活用できます www.arista.com/jp 4

VXLAN ポート - VXLAN の IANA ポート ベンダー固有 UDP チェックサム - 送信元の VTEP が 0x0000 に設定するものとします 受信側の VTEP が 0x0000 とは異なるチェックサムを受信した場合 フレームをチェックし チェックサムが正しくない場合には破棄する必要があります VXLAN ヘッダー : VXLANフラグ - ビット3(VNIビット ) を除き 予約済みのビットはすべてゼロに設定します VNIビットは 有効なVNIについては1 に設定します VNI - 24ビットのフィールドで VXLANのネットワークIDを示します Reserved - 24ビットと8ビットの予約済みフィールドで ゼロに設定します VXLAN のパケットの流れ : VXLAN:VM から VM への通信 それぞれIPサブネットが異なる別々のホスト上にあるVM1とVM2の間でセッションが開始された場合 パケットの流れは次のようになります ここでは 開始時点の状態と想定します つまり 対応付けが未学習であるものとします VM1 は 192.168.0.101 に対応する MAC アドレスを要求する ARP パケットを送信する VTEP1 は この ARP をマルチキャスト パケットにカプセル化し VNI 864 に該当するグループにマルチキャストする VNI 864 に該当するすべての VTEP がこのパケットを受信し VTEP1 と VM1 の MAC の対応付けを自らのテーブルに追加する VTEP2は マルチキャスト パケットを受信し フレームを取り出して VNI 864 内のポート グループにフラッディングする VM2は ARPを受信し 自らのMACアドレスを伝える応答をVM1に送信する www.arista.com/jp 5

VTEP2は この応答をユニキャストのIPパケットとしてカプセル化し VTEP1に転送する この応答をユニキャストで送信できるのは カプセル化されて届いた最初のARPによって VTEP2がVTEP1とVM1のMACアドレスの対応付けを学習しているため VTEP1は 応答のパケットを受信し 中身を取り出して VM1に転送する この時点で VM1とVM2の間の通信が確立され 該当するすべての状態マシンに関連付けがプログラムされました これ以降 送信元が192.168.0.100 宛先が192.160.0.101のユニキャスト トラフィックについては VTEP1はそのパケットに次のようなヘッダーを付加します a. VNI VXLAN ヘッダーは 864 b. 標準の UDP ヘッダー UDP チェックサムは 0x0000 に設定し VXLAN の宛先ポートはベンダーに応じた適切な IANA ポートに設定 c. 送信先 IP は VTEP2 の IP アドレスに設定 プロトコル ID は UDP(0x011) に設定 d. 標準の MAC ヘッダーに ネクスト ホップの MAC アドレスを指定 ( 上の例の場合 ネクスト ホップは MA C アドレスが 00:13:73:0C:76:24 のルーターのインターフェイス ) VTEP2は 間にあるルーター経由でこのパケットを受信します フレームを取り出す処理はUDPヘッダーの値により開始されます VTEP2はフレームをvSwitchに送り VNI 864に対応付けられたポート グループに届けます こうしてVM2にフレームが送られ 処理が行われます 応答のトラフィックも 上の例を逆にたどる形ですべて同様に処理されます 導入上の考慮事項 : ネットワークのデータグラムのペイロードと帯域幅の使用率 : VXLANのカプセル化のヘッダーによって イーサネット フレームの全体のサイズは50バイト大きくなります したがって ジャンボ フレームをサポートするインフラが不可欠です また VXLANのトラフィックに対応するうえで 帯域幅の使用が増すことも考慮する必要があります パケット サイズが大きくなった複数のネットワークが混在すると 帯域幅の消費が増えることから VXLA Nは 10Gb 以上のネットワーク テクノロジで導入するのが賢明です 標準のIPデータグラムを使用すると VXLANで長距離間のvMotionやHigh Availability(HA) の導入の選択肢を提供しやすくなります VXLANのフレームは 中のパケットの情報も加味してパケット ヘッダーに可変性を加え 負荷分散アルゴリズムの助けとします ただし ネットワーク デザイン上の関心が 障害復旧の用途や データセンターのリモート ミラーリングの用途におけるVX LANの活用にある場合には VMware vmotion/haのハートビートのラウンド トリップの遅延が10ミリ秒を超えないことが重要です トラフィックの優先順位サービスを備えた高帯域幅で低レイテンシーのスイッチングを活用したネットワーク デザインによって これらの要件を満たすことができ 仮想データセンターを拡張できます マルチキャストの要件 : 前述のとおり VXLANネットワーク内では ブロードキャスト 未知のユニキャスト マルチキャストをシミュレートするために IPマルチキャスト サービスを使用しています これはVXLANの要件です また 要件ではないものの 現在の構成では マルチキャスト グループとVNIを1 対 1で対応づけることが推奨されています このようにすると MACテーブルの更新の情報は 必要なVTE Pのみに送られます 1つのみのマルチキャスト アドレスをすべてのVNIで使用する方法も可能ですが この場合 必要としないV TEPにもアドレスが実質的にフラッディングされ ネットワーク内で不要なトラフィック フローが発生することになります PIMのsparseモード denseモード BIDIRは いずれもVXLANをサポートするマルチキャスト機能を提供します 管理者によっては PIMに懸念を抱く向きもあるかもしれません 特に CPUに負荷をかけるPIMの処理に起因するネットワーク障害を経験したことのある方です しかし ここで留意する必要があるのは 現在のスイッチング プラットフォームはPIMをハードウェアでサポートしており ネットワークのパフォーマンスや信頼性に悪影響を及ぼすことなく PIMの大規模な展開に対応できるということです www.arista.com/jp 6

ARP キャッシュと MAC テーブルの検討事項 : VXLANネットワーク上のVMは VTEPを通じて非仮想ネットワークとの通信を行います VTEPには 仮想ファイアウォールやVMw are vshieldのようなソフトウェア アプライアンスか VXLAN 対応スイッチを使用できます いずれにせよ VTEPがルーティング サービスを提供する場合 不要なARPを防ぐためには サービス対象となる仮想ネットワーク上のVMの数に対応できる規模のA RPキャッシュが必要です VXLANのフレームにカプセル化されたVMのトラフィックは サーバーのVTEPのMAC IDを使用します これによって データセンターの物理スイッチのMACアドレスのエントリは減ります 理想としては VXLANの物理ネットワークは VTEPのMACアドレスと データセンター内のホストの管理インターフェイスのMACアドレスのみを学習すればよいという状況が理想的です しかし 小規模なVMの展開であればその方法を適用できる可能性もあるものの VMとサーバー クラスタをサブネットに分割して サーバー 1 台あたり最大で数十というVMでも維持可能なトラフィック ボリュームに対応しておく方が賢明です VLAN と VXLAN の比較表 : 機能 / 拡張性 802.1Q VLAN VXLAN 仮想ネットワークの数 4K: スパニング ツリーの規模による制限 1600 万以上 : ネットワークで使用するマルチキャスト ルーターがサポートするマルチキャスト グループ数による制限 ネットワークの規模 802.1Q VLANが許容する範囲 PIMマルチキャスト グループが許容する 範囲 ネットワークのパケット サイズ 1.5K または 9K VXLAN ヘッダー分として 50 バイトを追加 マルチキャストの要件 なし PIM SM DM またはBIDIR グループ数 に応じて仮想ネットワーク数が決定 ルーティングのサポート 802.1Q 対応のルーターまたはスイッチ VMware vshield vedge 対応のルーターまたはスイッチ および VTEP 対応のルーター ARPキャッシュ VLANあたりのVM 数を制限 VMwareまたはVTEPのキャッシュがVNI あたりのVM 数を制限 MAC テーブル スイッチの MAC テーブルに対する VM の MAC アドレス数が制限 スイッチの MAC テーブルに対する VTEP の MAC アドレス数が制限 まとめ : VXLANは レイヤ3ネットワークの境界を越えてレイヤ2サブネットを拡張するための強力な手段です トラフィックをカプセル化してL3ゲートウェイの先に延伸することによって VMの可搬性やvMotionの制限の問題を打開でき 異なるIPサブネット上に置かれているサーバーでVMをホストできます またVXLANでは データセンター インフラ全体にわたって複数のサブネットをオーバーレイできます 仮想ネットワーク数を制限するのは 基盤のネットワークの物理的な帯域幅と VXLANネットワークのブロードキャスト / マルチキャスト トラフィックをシミュレートするためのマルチキャスト サブネット数のみです 適切なハードウェアを使用すれば ネットワークの安定性を犠牲にすることなく 802.1QのVLANの4Kという上限数をVXLANによって打破できます カプセル化したトラフィックのルーティングには 既に確立されているIPトランスポートを使用します したがって リンク アグリゲーション ループの検出と破棄 経路探索は OSPF BGP IS-ISといった実証済みのプロトコルで解決できます VXLANは 既存のインフラにそのまま適用でき インフラの変更は必要ありません VMware Intel Broadcom アリスタ Open vswitchなど各社がサポートしていることから 相互運用性が保証され ベンダー ロックインを回避できます VXLANを使用したシステムによって ネットワーク管理者はクラウド仮想化を新しいレベルにまで拡大し これまでより多くのユーザーに経済的に対応できます 詳細については www.arista.com/jp を参照してください www.arista.com/jp 7