(1) IGPのシステム 設 計 論 3 内 容 ルーティングとは ~ 基 本 の 復 習 ~ RIP OSPF OSPFの の 基 礎 OSPFの の 設 定 OSPFの の 網 設 計 OSPFの の 仕 組 み ~ 大 規 模 ネットワークにおいてOSPF OSPFの の 何 が 響 くのか~



Similar documents
All Rights Reserved. Copyright(c)1997 Internet Initiative Japan Inc. 1

関連事項の整理 62 IGP と EGP の違い ルータルータ ルータルータ EGP は Routing Domain 間の中の経路のみ扱う EGP の Next Hop は境界ルータへの IP アドレス Routing Domain - A ルータ ルータ IGP は Routing Domain

橡C14.PDF

BGPベストパス選択の実際

一般競争入札について

は 固 定 流 動 及 び 繰 延 に 区 分 することとし 減 価 償 却 を 行 うべき 固 定 の 取 得 又 は 改 良 に 充 てるための 補 助 金 等 の 交 付 を 受 けた 場 合 にお いては その 交 付 を 受 けた 金 額 に 相 当 する 額 を 長 期 前 受 金 とし

スライド 1

積 載 せず かつ 燃 料 冷 却 水 及 び 潤 滑 油 の 全 量 を 搭 載 し 自 動 車 製 作 者 が 定 める 工 具 及 び 付 属 品 (スペアタイヤを 含 む )を 全 て 装 備 した 状 態 をいう この 場 合 に おいて 燃 料 の 全 量 を 搭 載 するとは 燃 料

私立大学等研究設備整備費等補助金(私立大学等

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数

<4D F736F F D2095CA8E A90DA91B18C9F93A289F1939A8F D8288B3816A5F E646F63>


<4D F736F F D E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A C98AD682B782E993C195CA915B C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

<8BB388F58F5A91EE82A082E895FB8AEE967B95FB906A>

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

佐渡市都市計画区域の見直し

4 参 加 資 格 要 件 本 提 案 への 参 加 予 定 者 は 以 下 の 条 件 を 全 て 満 たすこと 1 地 方 自 治 法 施 行 令 ( 昭 和 22 年 政 令 第 16 号 ) 第 167 条 の4 第 1 項 各 号 の 規 定 に 該 当 しない 者 であること 2 会 社

Microsoft PowerPoint - 報告書(概要).ppt

質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定

<4D F736F F D208DE3905F8D8291AC8B5A8CA48A948EAE89EF8ED0208BC696B18BA492CA8E64976C8F BD90AC E378C8E89FC92F994C5816A>

入 札 参 加 者 は 入 札 の 執 行 完 了 に 至 るまではいつでも 入 札 を 辞 退 することができ これを 理 由 として 以 降 の 指 名 等 において 不 利 益 な 取 扱 いを 受 けることはない 12 入 札 保 証 金 免 除 13 契 約 保 証 金 免 除 14 入

文化政策情報システムの運用等

岡山県警察用航空機の運用等に関する訓令

端 末 型 払 い 出 しの 場 合 接 続 構 成 図 フレッツ グループから 払 出 されたIPアドレス /32 NTT 西 日 本 地 域 IP 網 フレッツ グループ フレッツ グループから 払 出 されたIPアドレス /

<4D F736F F D2095BD90AC E D738FEE816A939A905C91E D862E646F63>

平成27年度大学改革推進等補助金(大学改革推進事業)交付申請書等作成・提出要領

< DB8CAF97BF97A6955C2E786C73>



1 変更の許可等(都市計画法第35条の2)

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

Microsoft Word - 全国エリアマネジメントネットワーク規約.docx

ていることから それに 先 行 する 形 で 下 請 業 者 についても 対 策 を 講 じることとしまし た 本 県 としましては それまでの 間 に 未 加 入 の 建 設 業 者 に 加 入 していただきますよう 28 年 4 月 から 実 施 することとしました 問 6 公 共 工 事 の

Taro-08国立大学法人宮崎大学授業

の と す る (1) 防 犯 カ メ ラ を 購 入 し 設 置 ( 新 設 又 は 増 設 に 限 る ) す る こ と (2) 設 置 す る 防 犯 カ メ ラ は 新 設 又 は 既 設 の 録 画 機 と 接 続 す る こ と た だ し 録 画 機 能 付 防 犯 カ メ ラ は

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

Transcription:

大 規 模 ネットワークに おける 経 路 制 御 設 計 2001 年 12 月 7 日 NTTコミュニケーションズ 友 近 剛 史 イクアント 前 村 昌 紀 1 発 表 内 容 タイトル 分 担 当 (1) IGPのシステム 設 計 論 80 友 近 (2) BGPのシステム 設 計 論 80 前 村 (3) 大 規 模 な 経 路 制 御 設 計 の 実 際 20 (3-1) 概 要 5 前 村 (3-2) Confederationの の 実 例 5 前 村 (3-3) 3) static-to to-bgp bgpの の 実 例 10 友 近 2

(1) IGPのシステム 設 計 論 3 内 容 ルーティングとは ~ 基 本 の 復 習 ~ RIP OSPF OSPFの の 基 礎 OSPFの の 設 定 OSPFの の 網 設 計 OSPFの の 仕 組 み ~ 大 規 模 ネットワークにおいてOSPF OSPFの の 何 が 響 くのか~ IS-IS IS( 時 間 の 都 合 上 参 考 資 料 のみ) 4

ルーティングとは ~ 基 本 の 復 習 ~ 5 ルータでは IP IPパケットのヘ ッダに 書 かれている 宛 先 ア ドレスと ルータの と ルータのルーティ ルーティ ングテーブルを 参 照 し 次 の 行 き 先 (ネクストホップ) を 決 める ルーティングテーブルが 正 しく 作 成 されないと IP IPパケットは 目 的 地 に 到 達 できなくなる IPデータ TOS,TTL など 色 々 IPパケット IPヘッダ 送 信 元 アドレス IPヘッダ 宛 先 アドレス 宛 先 アドレス(Destination Address) とルーティングテーブルを 比 較 ルータとは コンピュータA コンピュータB ネットワークB ルータX C ルータY ルータZ ネット ワークC コンピュータC ルータV ルータXのルーティングテーブル IPアドレス ネクストホップ ネットワークB ルータY ネットワークC ルータZ ネットワークD ルータZ : : : : コンピュータD ルータW ネット ワーク D ルータZのルーティングテーブル IPアドレス ネクストホップ ネットワークC ルータV ネットワークD ルータW : : ネットワーク とは ネットワ ークセグメント のこと 6

ルータB 10.0.5.2 10.0.5.1 ルータA IPパケットが 192.168.10.0/24 に 行 きたいとき ダイナミックルーティング 実 際 のデータの 流 れ ルータC 10.0.2.1 ルータD 10.0.2.2 経 路 情 10.0.3.1 報 10.0.0.2 10.0.1.1 10.0.3.2 10.0.1.2 10.0.0.1 経 路 情 報 ルータE 10.0.4.2 10.0.4.1 経 路 情 報 192.168.10.0/24 ルータF 192.168.10.0/24に 関 してはルータFの み 設 定 すればよい 4:192.168.10.0/24 192.168.10.0/24は こっちの 方 にあるという 情 報 がルータDからルータC やルータEに 伝 わる 5:ルータCやルータEは 経 路 情 報 を 受 けてルーティ ングテーブルを 作 成 する 6:その 経 路 情 報 がルータA に 伝 わり ルータAでルーティ ングテーブルが 作 成 される 3:ルータDは 経 路 情 報 を 受 けてルーティングテー ブルを 作 成 する ルータD のルーティングテーブル IPアドレス アドレス ネクストホップ *.*.*.*/* 10.0.2.1 *.*.*.*/* 10.0.3.2 192.168.10.0/24 10.0.4.2 1:ルータFは192.168.10.0/24 は 自 分 のところにあるぞ! とみんなに 知 らせる 2:1の 情 報 ( 経 路 情 報 ) がルータFからルータDに 伝 わる 自 動 的 に192.168.10.0/24 宛 ての 設 定 が 各 ルータに 設 定 される そして ルーティングテーブルを 構 築 した 後 で パケットは 転 送 されていく 7 (1) 経 路 情 報 が 伝 わり (2)ルーティングテーブルができ (3)それに 基 づいてトラフィックが 流 れる 経 路 情 報 と 実 際 のデータの 向 きは 逆 になる ルータX NW-B ルータY NW-C ルータZ : : : : ダイナミックルーティング 3 実 際 のIP の IPデータの 転 送 ルータY 1ルーティング プロトコルの 情 報 2ルーティングテーブルの 作 成 (ルータX) トラブルシュートの 例 下 りのデータトラフィックが 意 図 するところ を 通 らないとき 上 りのBGP BGP 経 路 の 伝 わり 方 に 問 題 あり AS AS AS BGP filter BGP データ トラフィック 8

IGPとEGP IGPs (Interior Gateway Protocols) 同 一 AS(Autonomous System: 自 律 システム) 内 で 使 用 されるルーティングプロトコル RIP (Routing Infomation Protocol ) OSPF (Open Shortest Path First ) IS-IS (Intermediate System-to to-intermediate System) EGPs (Exterior Gateway Protocols) AS 間 で 使 用 されるルーティングプロトコル BGP (Boarder Gateway Protocol ) 9 ルーティングプロトコル ディスタンスベクターアルゴリズム 隣 接 ルータ 同 士 で 経 路 情 報 を 交 換 することでネットワーク 情 報 を 知 る 他 のルータから 受 信 したルーティングテーブルに 自 分 が 直 接 接 続 して いるネットワークを 加 え 受 信 したインタフェース 以 外 のインタフェース に 流 す リンクステートアルゴリズム それぞれのルータが 自 分 の 接 続 しているネットワークについての 情 報 等 をネットワーク 全 体 に 通 知 する 各 ルータで 共 通 のトポロジーデータベースを 持 つ パスベクターアルゴリズム 経 路 情 報 が 伝 わっていく 際 に 経 路 情 報 にパス 属 性 と 呼 ばれる 付 加 情 報 がついて 伝 わる 10

ディスタンスベクターアルゴリズム RIP それぞれのルータが 隣 接 しているルータとルーテ ィング 情 報 を 交 換 することによって ルーティング テーブルを 構 築 する 仕 組 み ルータは 自 分 のもっているルーティングテーブルを 接 続 しているネットワークに30 秒 ごとにブロードキ ャストする 隣 接 したルータから 受 け 取 った 情 報 (ネットワークアドレ ス)に 自 分 の 知 っている 情 報 を 付 加 し 送 信 する これが 全 ルータの 間 で 繰 り 返 し 行 われることでル ータは 接 続 されたすべてのネットワークとそこへの 道 筋 を 知 ることができる 収 束 に 時 間 がかかる 11 OSPF リンクステートアルゴリズム 1リンクステートの 交 換 リンクステート リンクステート リンクステート SPF(Dijkstra Dijkstra) アルゴリズム 2リンクステートデータベース (トポロジカルデータベース) ( 同 一 エリア 内 のすべてのルータで 共 通 )の ) 作 成 3 自 身 をrootとした を 最 短 パスツリーの 作 成 4ルーティングテーブルの 作 成 12

AS20001が172.16.0.0/16を を 広 告 172.16.0.0/16 パスベクターアルゴリズム 経 路 情 報 に 付 加 されたPath 属 性 (Path ( Attribute)を を 基 づいて 経 路 選 択 AS20001 AS_PATH: 20001 ルーティング 情 報 は AS ASを を 通 り 抜 けるたび に 自 分 のAS の 番 号 を 付 加 していく AS_PATHの の 短 い 方 が 優 先 172.16.0.0/16 : 20001 AS20002 AS_PATH: 20002 20001 AS_PATH: 20001 172.16.0.0/16 : 20001 AS_PATH: 20004 20001 AS20004 172.16.0.0/16 : 20004 20001 Prefix AS Path 172.16.0.0/16 20003 20002 20001 > 172.16.0.0/16 20004 20001 best 172.16.0.0/16 へのトラヒック AS20005 AS20003 172.16.0.0/16 : 20003 20002 20001 172.16.0.0/16 : 20002 20001 AS_PATH: 20003 20002 20001 13 RIP 14

RIP Routing Information Protocol ディスタンスベクターアルゴリズム UDP 520 番 を 使 用 サブネットの 情 報 を 運 ばない ルータは 自 分 のもっているルーティングテーブルを 接 続 している ネットワークに30 秒 ごとにブロードキャストする 隣 接 したルータから 受 け 取 った 情 報 (ネットワークアドレス)に 自 分 の 知 っている 情 報 を 付 加 し 送 信 する これが 全 ルータの 間 で 繰 り 返 し 行 われることでルータは 接 続 されたすべてのネット ワークとそこへの 道 筋 を 知 ることができる 収 束 に 時 間 がかかる 古 くからBSD UNIXシステム 上 でrouted routedという 形 で 実 装 されている 実 装 は 簡 単 で 多 くの 機 器 で 実 装 されている 15 メリット RIPのメリットとデメリット 多 くのネットワーク 機 器 で 対 応 されている 処 理 の 負 荷 が 小 さい デメリット サブネットマスクの 情 報 を 運 ばない» VLSM 非 対 応 ディスタンスベクター 方 式 のため 網 変 更 等 の 際 収 束 に 時 間 がかかる デフォルトの 設 定 で 30 秒 に1 回 各 ルータは 自 分 のもっているすべて のルーティング 情 報 を 隣 接 ルータへブロードキャストで 送 出 する» 経 路 情 報 のトラヒックが 多 い» RIPに 参 加 していないノードも 無 関 係 な 情 報 の 処 理 で 無 駄 を 生 じる 最 大 のホップ 数 は15 は 15までしか 対 応 できない ホップ 数 で 比 較 なので 回 線 の 帯 域 に 応 じて 適 切 な 経 路 を 選 ぶことが 難 しい 16

VLSM Variable Length Subnet Mask VLSMとは1つのネットワークをサブネットに 分 割 する 場 合 に 複 数 の 長 さのサブネットマスクを 使 用 する 方 法 例 えば あるクラスCを 分 割 するときに/26 /26と/27 /27を を 同 時 に 利 用 し たりすること 例 えば 同 じクラスCでは 同 じprefix 長 しか 使 えない というのは VLSMに 対 応 していない という 逆 に 言 うと RIP RIPでも あるルータであるクラスCをすべて でも あるルータであるクラスCをすべて/26 /26で で 使 用 し ま た 他 のあるクラスCをすべて/27 /27で で 使 用 する ということはできる なお クラスCで/24 /24しか 使 えないというのはサブネットに 対 応 し ていない という 状 況 ip classless ip subnet-zero は 忘 れないように! 17 RIP2 RIP1と 完 全 後 方 互 換 性 RIP1を を 少 し 直 した 感 じ サブネットマスクの 情 報 を 運 ぶ VLSM 対 応 経 路 情 報 をブロードキャストだけでなくマルチキャストでも 行 える 認 証 機 構 を 提 供 しかし RIP1 RIP1と と 同 じくディスタンスベクター 方 式 である デフォルトで30 秒 に1 回 各 ルータは 自 分 のもってい るすべてのルーティング 情 報 を 隣 接 ルータへ 送 出 する 網 変 更 等 の 際 収 束 に 時 間 がかかる RIP1,RIP2ともに 大 規 模 ネットワークには 適 さない ただし 大 きくないネットワークではお 手 軽 に 使 える 便 利 なルーティングプロトコル 18

OSPF 19 OSPFの の 基 礎 20

OSPFについて について RFC 1247(July 1991) RFC 1583 (March 1994)(9 箇 所 変 更 backward-compatible compatible) RFC 2178 (July 1997) (10 箇 所 変 更 backward-compatible compatible) RFC 2328 (April 1998) (4 箇 所 変 更 backward-compatible compatible) Open Shortest Path Fast version 2 リンクステートアルゴリズム IPを 直 接 使 用 し プロトコル 番 号 89 VLSM 対 応 マルチキャストでlink link-state stateを 配 布 21 リンクステート トポロジーの 変 更 があったときだけ link link-state stateのupdate が 送 信 される リンクステートとはリンクのステートの 情 報 のこと» あるルータのリンク(インタフェース)のステート つまりIP IPアドレス マスク 接 続 されるネットワークタイプ そのネットワークに 接 続 され るルータ 等 のこと» それらのリンクステートが 集 まって トポロジーDBを 形 成 する ルーティングテーブルを 交 換 しない トポロジー 変 化 のないときでも 定 期 的 に30 分 に 一 回 LSAを refreshする 22

コスト 同 じネットワークが 複 数 見 える 場 合 コストが 一 番 低 い 経 路 を 選 択 する データパケット 192.168.2.0/24 ルータA データパケット cost 10 192.168.0.2 ルータB cost 16 ルータD リンク cost 10 ステート データパケット リンク ステート リンク ステート ルータC 192.168.0.3 cost 33 ルータE cost 10 192.168.2.10 192.168.2.11 ルータA IPアドレス ネクストホップ コスト 192.168.2.0/24 192.168.0.2 36 192.168.2.0/24 192.168.0.3 53 コストが 一 番 低 い 経 路 を 選 択 正 確 にはルーティングテーブル(フォワーディングテーブル)にのるのがそれだけになる 23 障 害 時 にはバックアップ 経 路 に 切 り 替 わる 障 害 時 には コストの 高 いバックアップ 経 路 に 切 り 替 わる ルータA cost 10 192.168.0.2 ルータB 障 害 cost 16 リンク ステート ルータD 192.168.2.0/24 cost 10 リンク データパケット データパケット ステート 192.168.2.10 データパケット ルータC 192.168.0.3 cost 33 ルータE リンク cost 10 ステート 192.168.2.11 ルータA IPアドレス ネクストホップ コスト 192.168.2.0/24 192.168.0.2 36 192.168.2.0/24 192.168.0.3 53 コストの 高 いバックアップ 経 路 に 切 り 替 わる 正 確 にはコストの 低 い 経 路 がルーティングテーブルから 消 え コストの 高 い 経 路 が 現 れる 24

ロードバランス 同 じネットワークが 同 じコストで 見 えるネットワークに 対 して は トラフィックが 半 分 ずつ 分 散 する(ロードバランス) ルータA データパケット データパケット cost 10 192.168.0.2 ルータB ルータD リンク ステート データパケット リンク cost 16 cost 10 ステート 192.168.2.0/24 データパケット データパケット 192.168.2.10 データパケット ルータC 192.168.0.3 ルータA IPアドレス ネクストホップ コスト 192.168.2.0/24 192.168.0.2 36 192.168.2.0/24 192.168.0.3 36 cost 16 リンク ステート ルータE cost 10 192.168.2.11 等 コストでロードバランスする OSPF 的 にはイコールコストマルチパスをサポートし そして 一 般 的 なルータでは イコールコストマルチパスについてはトラフィックを 半 分 ずつに 分 散 する 25 障 害 時 は 全 てのトラヒックが 残 りの 経 路 を 通 る ~ロードバランス 時 ~ 障 害 時 には 障 害 した 経 路 が 消 えて 全 てのトラヒックが 残 りの 経 路 を 通 る 障 害 ルータB ルータD リンク cost 16 cost 10 ルータA cost 10 192.168.0.2 ステート リンク ステート データパケット 192.168.2.0/24 データパケット 192.168.2.10 データパケット ルータC 192.168.0.3 cost 16 ルータE リンク cost 10 ステート 192.168.2.11 ルータA IPアドレス ネクストホップ コスト 192.168.2.0/24 192.168.0.2 36 192.168.2.0/24 192.168.0.3 36 2 経 路 のときは 経 路 が 一 つ 消 えて 残 り 一 つだけになる 26

最 長 一 致 (longest ( match)ルーティング 規 則 IPパケットの 宛 先 アドレスを 調 べて 一 致 するネットワークアドレスが 複 数 ある 場 合 には ビット 列 が 長 い 方 のネットワークアドレスを 選 択 する 192.168.1.0/24 192.168.0.0/24 送 信 元 192.168.1.20 宛 先 192.168.2.10 ルータB ルータD ルータA 192.168.1.1 192.168.0.1 192.168.0.2 192.168.2.0/28 192.168.1.20 192.168.0.3 ルータC ルータE 192.168.2.10 ホストA ルータA IPアドレス ネクストホップ C 192.168.0.0/24 192.168.0.1 C 192.168.1.0/24 192.168.1.1 192.168.2.0/28 192.168.0.2 192.168.2.0/24 192.168.0.3 192.168.2.0/24 Longest matchで192.168.0.2 192.168.0.2を を 選 択 する 27 ルーティングテーブ ルに 載 るまで (prefix prefixが が 二 つの 場 合 ) Noの 例 : 前 ページ 192.168.2.0/28 28と 192.168.2.0/24 24 は 違 うprefix prefix No フローチャート Yes 異 なるコスト 値 Yesの 例 :3ページ 前 上 を 通 ってきた192.168.2.0/24 の 経 路 情 報 と 下 を 通 ってきた192.168.2.0/24 の 経 路 情 報 は 同 じprefix 同 じコスト 値 マッチする 経 路 が 複 数 あるとき ( 例 :192.168.2.10) マッチする 経 路 が 一 つのとき ( 例 :192.168.2.100) ルーティング テーブルに 載 っ ているネットワー クにマッチする IPパケットが 来 たとき ロンゲストマッチ の 規 則 に 従 って prefix 長 が 長 いほ うを 選 択 し そち らに 転 送 される マッチした 経 路 に 従 っ てIP IPパケッ トが 転 送 さ れる マッチした 経 路 (コストの 低 いほうしかルーティングテー ブルには 載 っていないので それにマッチする)に 従 って IPパケットが 転 送 される ロードバランスされる ( 全 く 同 じprefix じ prefixが が 複 数 ル ーティングテーブルに 載 っているため) 28

OSPFの 設 定 29 OSPF 設 定 (C 社 の 例 ) router ospf <process ID> 自 分 のAS の ASと と 同 じ 番 号 にすることが 多 い» 一 つのAS 内 で 一 つしかOSPF processを を 走 らせない 場 合» process IDは1~65535 65535の の 何 番 にしてもいい network 192.168.0.0 0.0.0.15 area 0 0.0.0.15はワイルドカードマスク» アドレスのうち 無 視 する 部 分 をマスクする 192.168.0.0~192.168.0.15 192.168.0.15の の 範 囲 にあるアドレスのインタフェースで» OSPFを area 0 で 話 す» そのインタフェースのネットワークをOSPF OSPFに に 広 告 する 上 記 2つが 基 本 で 最 低 限 のOSPF の OSPFのconfig 30

ルータA OSPFの の 基 本 設 定 (C 社 の 例 ) 192.168.1.0/24 Ether0 192.168.1.1 Ether0 192.168.1.2 ルータB 192.168.2.0/24 Ether1 192.168.2.10 ルータBの 設 定 interface Ethernet0 ip address 192.168.1.2 255.255.255.0! interface Ethernet1 ip address 192.168.2.10 255.255.255.0! router ospf 1 network 192.168.1.0 0.0.0.255 area 0 network 192.168.2.0 0.0.0.255 area 0 ルータAの 設 定 Ether0 192.168.1.3 ルータC interface Ethernet0 ip address 192.168.1.1 255.255.255.0! router ospf 1 network 192.168.1.0 0.0.0.255 area 0 Ether1 192.168.2.11 ルータCの 設 定 interface Ethernet0 ip address 192.168.1.3 255.255.255.0! interface Ethernet1 ip address 192.168.2.11 255.255.255.0! router ospf 1 network 192.168.1.0 0.0.0.255 area 0 network 192.168.2.0 0.0.0.255 area 0 31 ルータCの 設 定 interface Ethernet0 ip address 192.168.1.3 255.255.255.0! interface Ethernet1 ip address 192.168.2.11 255.255.255.0! router ospf 1 network 192.168.1.0 0.0.0.255 area 0 network 192.168.2.0 0.0.0.255 area 0 Ethernet0 ワイルドカードマスクについて Ethernet0のアドレス 192.168.1.3 OSPF networkコマンドの ワイルドビットマスク 0.0.0.255 2 進 数 に 直 すと 論 理 和 OSPFのnetworkコマンドの アドレス 192.168.1.0 ワイルドビットマスク 0.0.0.255 2 進 数 に 直 すと 11000000.01010100.00000001.00000000 00000000.00000000.00000000.11111111 11000000.01010100.00000001.11111111 Ethernet1 (A)とする Ethernet1のアドレス 192.168.2.11 OSPF networkコマンドの ワイルドビットマスク 0.0.0.255 2 進 数 に 直 すと 11000000.01010100.00000001.00000011 00000000.00000000.00000000.11111111 11000000.01010100.00000010.00001011 00000000.00000000.00000000.11111111 論 理 和 11000000.01010100.00000001.11111111 論 理 和 11000000.01010100.00000010.11111111 (A)とマッチするので マッチするのでEthernet0 Ethernet0でOSPF OSPFを を 話 す (A)とマッチしないので マッチしないのでEthernet1 Ethernet1でOSPF OSPFを を 話 さない この 例 では2 行 目 のnetwork の networkコマンドにマッチするので 結 局 OSPFは は 話 す 32

redistribute static redistribute static 経 路 をOSPF を OSPFに に 再 配 する 192.168.1.0/24 192.168.2.0/24 192.168.0.0/24 192.168.1.1 ルータB ルータA 192.168.2.10 static ルータB B configuration(c 社 製 ルータ )! static ip route 192.168.0.0 255.255.255.0 192.168.1.1! ospf router ospf 1 network 192.168.2.0 0.0.0.255 area 0 redistribute static subnets redistribute リンク ステート ルータD OSPF ルータC ルータD リンク ステート 192.168.3.0/24 リンク ステート 192.168.3.3 ルータE ルータF ルータF IPアドレス ネクストホップ 192.168.0.0/24 192.168.3.3 IPアドレス ネクストホップ 192.168.0.0/24 192.168.2.10 33 passive-interface interface passive-interface interface Ethernet1/0 そのインタフェースでOSPF OSPFを を 話 さない OSPFにとって にとってstub stubなnetwork networkな な 場 合 そのネットワークをOSPF OSPFに に 広 告 した いが そのネットワークでOSPF OSPFを を 話 さない 方 がいい ということが 多 い そ のときに networkコマンド + passive-interface interface でやる redistribute connected subnetsでも 同 様 のことができる 192.168.1.0/24 192.168.0.0/24 OSPF 192.168.2.0/24 ルータF 192.168.1.1 ルータB ルータA Ether1/0 192.168.2.10 ここではOSPF OSPFは 話 していない でもこのネットワーク 情 報 を OSPFに に 載 せたいとき ルータB B configuration(c 社 製 ルータ ) router ospf 1 network 192.168.2.0 0.0.0.255 area 0 network 192.168.1.0 0.0.0.255 area 0 passive-interface interface Ehternet1/0 リンク ステート ルータD IPアドレス ネクストホップ 192.168.1.0/24 192.168.3.3 192.168.3.0/24 リンク ステート 192.168.3.3 ルータD ルータF IPアドレス ネクストホップ 192.168.1.0/24 192.168.2.10 34

Interfaceの の 設 定 (C 社 の 例 ) コストによるネットワークごとの 重 み 付 けができる デフォルト 100M/ 回 線 速 度 (bps) ip ospf cost <cost> そのインタフェースからデータパケットが 出 るときのためのコスト» 非 対 称 でもよい 通 常 は 流 れるのは10 秒 に 一 回 のHello の Helloだけ ブロードキャストネットワーク(Ether) Ether)やPoint Point-to to-point Pointで10 秒» ノンブロードキャストネッワーク(X.25 公 衆 網 など)では30 秒 ip ospf hello-interval <seconds> デッドタイマー HELLOトを 受 け 取 らなければ 障 害 だと 判 断 デフォルト HELLOインターバルの4 倍 ip ospf dead-interval <seconds> 35 OSPF 設 定 (C 社 の 例 ) その 他 同 一 コストの 複 数 パスを 同 時 に 使 用 できる ロードバランス 6つまで maximum-paths 6 (rotuer ( ospf **で) 認 証 ip ospf authentication-key ***** (interfaceで) area ** authentication (router ospf **で) 36

デフォルトルートの 生 成 デフォルトルートの 生 成 デフォルトルートを 広 告 する そのルータにデフォルトが 向 く 外 部 に 近 いルータで 設 定 する» BGPスピーカーでないルータ(エッジに 近 いルータ)から BGP BGPスピーカー (GWに 近 いルータ)までデータパケットを 転 送 するため 192.168.1.0/24 192.168.0.0/24 10.1.2.0/30 192.168.1.1 192.168.0.1 ルータA 192.168.0.2 192.168.0.3 ISP 側 RT ルータC 10.1.2.2 10.1.2.1 リンク ステート ルータB router ospf 1 default-information originate ルータC configuration ルータA ルータB IPアドレス ネクストホップ IPアドレス ネクストホップ 0.0.0.0/0 192.168.0.3 0.0.0.0/0 192.168.0.3 イ ン タ ー ネ ッ ト 37 デフォルトルート(C 社 の 例 ) デフォルトルートの 生 成 default-information originate» そのルータにデフォルトルートの 情 報 が 既 にある 場 合 だけ 広 告 default-information originate always» そのルータにデフォルトルートの 情 報 がない 場 合 はalways は alwaysが 必 要 デフォルトルートを 広 告 するルータに 知 らないアドレス 向 け( 例 :プラ イベートアドレス)にパケットが 来 た 場 合 そのパケットを 廃 棄 しなくては ならない この 処 理 はかなり 重 いため できればインタフェースで 廃 棄 できるようなルータ( 例 :GSR : GSR)でデフォルトルートを 広 告 すべき» C7513+RSP4でも 廃 棄 パケットが20 20~30 30Mbps Mbpsでかなり 苦 しい» CPU 負 荷 検 証 などでも 廃 棄 専 用 のルータを 用 意 すべき default-route 広 告 ルータは 他 のdefault default-route 広 告 ルータが 生 成 した default-route routeを 受 け 取 らない 38

External routesとメトリックのタイプ External routes staticや 他 のルーティングプロトコルからredistribute redistributeされた 経 路 そのルータはAS * 境 界 ルータになる *ここでいう ここでいうAS メトリックのタイプ type1:external externalのコストに コストにinternal internalコストを 加 えていく type2:external externalのコストのまま ルータconfiguration ASとは 共 通 の 経 路 制 御 プロトコルを 用 いて 経 路 情 報 を 交 換 しているルータのグループのこと いわゆるBGP 等 でいうAS ASとは 違 う redistribute **** metric <metric> metric-type type <1 2> subnets N1(E1) default-information originate metric <metric> metric-type type <1 2> 5» これもexternal externalになる N2(E2) デフォルトはtype2 5 同 じネットワークに 関 しては 常 に(メトリックに 関 わらず) 8 intra-area area > inter-area > external E1 > external E2 N1:13 ( O O IA O E1 O E2 ) N2:5 7 の 順 番 で 優 先 される sh ip routeの 出 力 N1:20 N2:5 39 OSPFの 網 設 計 40

網 設 計 においての 基 本 まずは 要 望 条 件 を 整 理 し ポリシーを 策 定 する 例 基 本 機 能 の 実 現» 静 的 状 態 での 接 続 性» 迂 回 機 能 の 実 現 信 頼 性 の 向 上» リンク 障 害» ノード 障 害» 機 種 レベルでの 冗 長 化» メディアレベルの 冗 長 化 ( 例 :Giga : Giga-Ether EtherとFDDI FDDI)» ビル 障 害 41 要 望 条 件 ポリシー( 続 き) コストの 低 減» 回 線 数 回 線 帯 域 の 削 減» アクトスタンバイにするか ロードバランスにするか» 1 + 1 にするか n + 1 にするか 保 守 運 用 性 の 向 上» 物 理 的 にシンプルであること» 論 理 的 にシンプルであること» 地 域 的 サービス 的 に 分 離 可 能 であること» 移 行 が 容 易 であること 将 来 性» ビル 数 ノード 数 ユーザ 数 の 増 大 対 応» サービス 種 類 の 増 大 対 応 42

DR(Designated Router) ルータB リンク ステート ルータA リンク ステート ルータC リンク ステート リンク リンク リンク ステート ステート ステート リンク ステート リンク ステート ルータD ルータE リンク ステート リンク ステート DRがないとあるネットワークセグメントでのリンク ステートのやりとりがフルメッシュ 的 になってしまう 43 DR(Designated Router) DR(Designated Router) = 指 名 ルータ ルータB リンク ステート ルータA リンク ステート ルータC リンク ステート リンク ステート ルータD ルータE ネットワークセグメント 上 で 一 つのルータをDRに することによりリンクステートのやりとりを 減 らす 44

DRとBDR Designated Router: 指 名 ルータ Backup Designated Router:バックアップ 指 名 ルータ マルチアクセスネットワーク 上 で 必 ず1つ 存 在 BDRはDR DRがダウンしたときのバックアップ DRとBDR 以 外 のルータをDROTHER DROTHERという DRは 結 構 負 荷 がかかるので 処 理 能 力 のあるルータ や 他 の 処 理 が 重 くかかっていないものになるなど 選 定 に 考 慮 する 必 要 がある 一 つのルータが 複 数 のネットワークのDR DRになるべくな らないように 考 慮 する 必 要 がある ルータAが ネットワークXの DRとネットワークYの とネットワークYのDR DRに 同 時 にならないようにする ルータ ルータ ルータA ルータ ルータ ネットワ ークX ネットワ ークY 45 DRとBDR Helloプロトコルで 決 定 される AdjacencyはLink Link-state stateをやりとりする 関 係 単 純 にHello Helloパケットをやりとりするのは パケットをやりとりするのはNeighbor 関 係 よって DROTHER 同 士 はNeighbor Neighborであるが であるがAdjacency ではない ルータB リンクステートの 交 換 Adjacency ルータA リンクステートの 交 換 Adjacency ルータC neighbor neighbor リンク ステート の 交 換 Adjacency neighbor リンクステート の 交 換 Adjacency neighbor ルータD neighbor 注 :BDR : BDRとDROTHER DROTHERはAdjacent jacentになって いるが BDR BDRからの からのflooding floodingは 省 略 される ルータE Adjacency neighbor 46

priority DRになりやすさの 値 ip ospf priority * (interface) ospf priorityの の 値 が 高 いほど 優 先 される しかし 対 象 とするネットワークですでにDR/BDR DR/BDRが が 存 在 するときにはDROTHER DROTHERとなる 結 局 最 初 に 立 ち 上 げた2つのルータがDR/BDR DR/BDRとなる よって ネットワークを 新 規 に 立 ち 上 げる 時 などは priorityが が 高 いものから 起 動 させるのが 望 ましい ospf priority 0はDR/BDR 0 DR/BDRに に 選 ばれない 負 荷 が 大 きくなると 困 るルータなどは0にする 47 1 PriorityとDR/BDR DR/BDRの の 遷 移 Priority 2 2 DR Priority 4 Priority 2 DR Priority 3 ルータA ルータD ルータA ルータE 3 ルータB Priority 1 Priority 4 ルータD BDR Priority 3 ルータE 4 BDR ルータB ルータC Priority 1 Priority 5 Priority 4 BDR 後 からpriority priorityの 高 いルータが 加 わ ってもDR,BDR DR,BDRは 変 わらない Priority 3 ルータD ルータE ルータB ルータC DR Priority 1 Priority 5 DRがdownするとDR には 元 BDRが BDRにはpriorityが 一 番 高 いルータがなる BDR さらにDR(ルータB)がdown するとDRには 元 BDRが BDRには(DR BDRを 除 い たルータの 中 で)priorityが 一 番 高 いルータがなる ルータC Priority 5 DR 48

エリアについて バックボーンエリア(Area 0) エリア 境 界 ルータ (ABR ABR) エリア (Area X) エリア (Area Y) エリア (Area Z) エリア 同 一 エリア 内 のすべてのルータでトポロジーデータベースは 共 通 バックボーンエリアに 他 のエリアがぶら 下 がる 形 エリア 境 界 ルータ エリアを 結 ぶルータをエリア 境 界 ルータと 呼 ぶ 必 ずバックボーンエリア(エリア0)には 属 する 49 エリアについての 設 計 まず エリア0を 構 築 して(または 考 えて) それ 後 その 他 のエ リアを 拡 張 していく(または 考 えていく) エリア0は 全 てのエリアの 中 心 信 頼 性 を 必 要 とするNW NWであれば リダンダンシーのため 一 つ のエリアでは 複 数 のエリア 境 界 ルータを 置 くべき 一 つのエリア 境 界 ルータが 所 属 するエリアはなるべく2つまで にすべき つまりエリア0ともう 一 つのエリア というようになる 経 路 の 集 約 エリア 境 界 ルータにて 経 路 の 集 約 をする エリアごとに 経 路 を 集 約 できるように アドレス 設 計 をする» area ** range <address> <mask> (エリア ( 境 界 ルータ) OSPFにredistribute redistributeされる 経 路 も 集 約 できるように アドレス 設 計 する» summary-address address <address> <mask> (AS 境 界 ルータ) 50

エリアについての 設 計 リダンダンシーのため 一 つのエリアでは 複 数 のエリア 境 界 ルータ 一 つのエリア 境 界 ルータが 所 属 するエリアはなるべく2つまで 経 路 の 集 約 バックボーンエリア (Area0 Area0) R R R R R-A R-B R-C R-D R R R R R R Area X Area Y 51 バーチャルリンク エリア 境 界 ルータ (ABR ABR) バックボーンエリア(Area 0) R-A エリア エリア エリア (Area Z) (Area X) (Area Y) R-B バーチャ ルリンク エリア (Area V) バーチャルリンク バックボーンに 対 して 物 理 的 コネクションを 持 たないエリア を 取 り 込 む 52

エリアについての 設 計 (バーチャルリンク) バーチャルリンクをあてにしてネット ワークを 設 計 すべきでない 設 計 が 複 雑 になる 冗 長 性 確 保 が 難 しい バックボーンエリア AreaVを0 以 外 にするとRouter Router-Bが3つ (Area 0) のエリアに 所 属 してしまう これはあま R-A り 好 ましくない よってAreaV AreaVをArea0 Area0とするが すると Area Z Area0が が 大 きくなって 規 模 対 応 性 に 関 R-B してはあまり 効 果 が 得 られない Area0につなげるというより つなげるというより Area0 Area0を 拡 大 するイメージ Virtual linkはarea0 Area0の 一 部 であり 2つのルータ 間 がunnumbered が なp-to to-pネットワークで 接 続 されているように 振 る 舞 う R-A area Z virtual-link link <Router-BのR-ID( ID(loopback loopbackアドレス アドレス)> R-B area Z virtual-link link <Router-AのR-ID( ID(loopback loopbackアドレス アドレス)> Area V バーチャ ルリンク 53 エリアについての 設 計 (バーチャルリンク) バーチャルリンクはArea0 Area0に に 対 して 物 理 的 コネクションを 持 たないエリアを 取 り 込 むとき 万 が 一 のときのエリア エリア0が が 切 断 されてしまう 場 合 にバックボーンをつなぐため (patching) patching)に に 使 用 するときや 網 変 更 の 際 の 緊 急 措 置 対 応 のための 使 用 にと どめておくべき patchingの の 例 R バックボーンエリア (Area0 Area0) SW-Aが が 故 障 した ときにR-Bがarea0 から 切 断 されない ように R-AとR-B でAreaZ AreaZを を 介 した バーチャルリンク を 張 っておく バーチャ ルリンク R-A SW-A R-B SW-Z Area Z R R R 54

ルータID loopbackアドレスがあるときは アドレスがあるときはloopback loopbackアドレス そうでないときは 最 大 のIP の IPアドレス アドレス(C 社 で)(RFC で RFC 的 には 最 小 のアドレスとする 実 装 戦 略 が 考 えられる(One One possible implementation strategy would be to use the smallest IP interface e address belonging to the router) となっている) ルータID IDが 変 わると link link-state stateしゃべり 直 し loopbackアドレスを 設 定 するべき 絶 対 ダウンしない 安 定 している ibgpピアリングのためにも ルータID IDとしてなにかと 使 う» telnet» syslog, tftpのソースアドレスとして /32で で 十 分 55 OSPFの 仕 組 み ~ 大 規 模 ネットワークにおいてOSPF OSPFの の 何 が 響 くのか~ 56

ルーティングテーブルの 作 成 まで Monami 大 規 模 ネットワークにおいてOSPF OSPFの 何 が 響 くのか 理 解 するため OSPF OSPFプロトコルについて 知 りたいなぁ 1リンクステートのやりとり SPF(Dijkstra Dijkstra) アルゴリズム 2リンクステートデータベース (トポロジカルデータベース) ( 同 一 エリア 内 のすべてのルータで 共 通 )の ) 作 成 3 自 身 をrootとした を 最 短 パスツリーの 作 成 4ルーティングテーブルの 作 成 57 リンクステートデータベース* * RFC1583 : The Topological Database RFC 2178, 2328 : The Link-state Database 有 向 グラフ ルータとネットワークで 構 成 される ルータがネットワークにインタフェースを 持 っていると きは ルータとネットワークをつなぐ 2つのルータが 物 理 的 にpoint point-to to-point pointで で 結 ばれてい るときは ルータ 同 士 をつなぐ 58

リンクステートデータベース (トランジットネットワーク) トランジットネットワーク マルチアクセスネットワークにおいて 複 数 のルータがあるとき ルータとネットワークを 双 方 向 でつなぐ 59 リンクステートデータベース (スタブネットワーク) スタブネットワーク マルチアクセスネットワークにおいてルータが 一 つだけのとき ルータからネットワークへの 片 方 向 でつなぐ 60

リンクステートデータベース (point-to-point) point-to to-point 2つのルータが 物 理 的 にpoint point-to to-point pointで で 結 ばれているとき は ルータ 同 士 をつなぐ 双 方 向 Numberedのときは そのインタフェースは 各 ルータにstub networkでくっついているようにみなす» ルータからインタフェースの 片 方 向 Unnumberedのときはルータだけ I はルータイ ンタフェースの 接 頭 詞 を 示 す 61 リンクステートデータベース データベースの 中 はコストを 値 とする コストはルータインタフェースにリンクステートが 入 っ てくるところで 効 く つまり データトラフィックが 出 るところで 効 く ネットワークからルータに 向 かうところは 常 にコスト0 同 一 エリア 内 のすべてのルータで 共 通 次 ページの 例 はエリアが 一 つだけの 例 62

リンクステートデータベースの 例 63 リンクステートデータベースの 内 容 p-to to-pはrt 同 士 の 辺 となる FROM FROMでNW NWがあるところは 複 数 のルータがあるマルチ アクセスネットワークとなる NW NWから からRT RTに に 向 かうのは 常 に0 RT RTから からNやHに 向 かうのはその ルータがそのネットワークに インタフェースを 持 つことを 意 味 する 値 はそのインタフェースでのコス トを 示 す RT RTから からIに 向 かうのは P2P P2Pに おいて 対 抗 のルータのインタフ ェースにアドレスが 割 り 当 てら れていることを 示 す 64

リンクステートデータベースとLSA 65 OSPFのパケットの 種 類 前 ページでnetwork LSAとか とかrouter LSAってでてきたけ ど そもそもLink Link-state stateってどんな 内 容 なんだろう? Type パケット 名 1 HELLO 2 Database Description 3 Link-state Request 4 Link-state Update 5 Link-state Acknowledgment 66

OSPFのパケットの 種 類 Type1~3 HELLO(Type1) neighborの の 検 出 維 持 DR/BDRの の 決 定 すべてのルータより 周 期 的 (10 ( 10sec sec)に に 送 信» デッドタイマー: ルータのダウン 削 除 時 などの 構 成 変 更 の 発 見 Database Description(2) & Link-state Request(3) ネットワークにルータが 新 たに 参 加 したときに DR DRとのデータ ベースの 違 いのチェックを 行 う LS age(link Link-state stateの 作 成 されてからの 時 間 )をチェックして どちらが 最 新 のものを 保 持 しているか 判 断 自 分 のもっているものが 古 い もしくは 持 っていない 場 合 に はLink Link-state Requestを 送 信 し 詳 細 な 情 報 を 得 る 以 上 の 動 作 でAdjacency Adjacencyが が 確 立 される 67 OSPFのType5,4 Type5,4とLSA Link-state Acknowledgment(Type5) Link-state Updateを 受 信 したときの 受 信 確 認 Link-state Update(Type4) 最 も 重 要 (OSPF OSPFを を 理 解 するためには) OSPFでは 情 報 Link-state stateを 交 換 するが それがこれ ひとつのLink Link-state UpdateはOSPF OSPFヘッダ ヘッダとそれに 続 く 複 数 の Link-state Advertisementでできている できている Link-state Advertisementの 種 類 LS Type LSAの 名 前 1 ルータLSA 2 ネットワークLSA 3, 4 サマリLSA 5 AS-external LSA LSAヘッダについては Type4 Link-state Updateの ほかに Type2のDatabase Description Type5のLinkstate Acknowledgmentの 中 でも 使 われるが Type2,5に ついてはLASヘッダだけが 使 用 され LSAの 中 身 は 使 用 されない 68

ルータLSA(Type1) LSAの の 種 類 Type1,2 全 てのルータで 生 成 する ルータの 接 続 情 報» そのルータにどういうリンクが ついているか それぞれのリン クの 種 類 * とリンクの 情 報 (Link ID,Link DATA)とコストを 情 報 と してもつ エリア 内 しか 伝 わらない これにより エリア 内 の 各 ルー タが 各 ネットワークにどのように 接 続 されているかが 分 かる ネットワークLSA(Type2) DRが 作 成 する そのネットワークに 接 続 してい るルータのリスト エリア 内 しか 伝 わらない OSPF OSPFのType4 Type4のLS LS-update updateの 話 題 の 中 でLSA で LSAの 話 しになって LSA LSAのType1 Type1のルータ ルータLSA LSAの の 話 題 の 中 で ルータについているリンクのType Typeの の 話 しに なって そのLink Typeの 表 である * 参 考 : ルータLSA LSAの 中 で 表 すリンクのType Link Type Description 1 他 のルータとp-to to-p 接 続 ** 2 透 過 ネットワーク *** への 接 続 3 stubネットワークへの 接 続 4 virtual link ** RFC2178から から p-to to-pはtype3 Type3 でも 表 してよいことになっている *** 2 台 以 上 のルータが 接 続 されて いるマルチアクセスネットワーク 69 LSAの の 種 類 Type3~5 サマリLSA(Type3,4) エリア 境 界 ルータによって 生 成 される エリア 外 の 情 報 Type 3 はエリア 外 のネットワークの 情 報 Type 4 はAS 境 界 ルータの 情 報 (AS 外 部 のネットワークについてはType5 Type5) AS external LSA(Type5) AS 境 界 ルータによって 生 成 される 他 のAS の ASの の 経 路 を 記 述 redistribute された 経 路 default-information originate 70

NSSA RFC1587 The OSPF NSSA Option 準 スタブエリア(Not So Stubby Area) Type 7 LSAを を 使 う スタブエリアは AS externalな な 経 路 (Type 5)は は 流 れない よって スタブエ リアにはAS 境 界 ルータは 置 くことはできない 例 えばstatic staticをredistribute redistributeするところなどでは 使 えない NSSA は 上 記 の 制 限 をなくす 仕 組 み NSSAでは ではType7 LSAを 流 すことができる NSSAのAS AS 境 界 ルータでType7 LSAとして としてredistribute redistributeすることによって AS 境 界 ルータを 置 くことができるという 仕 組 み Type 7 LSAsはNSSA NSSAのASBR ASBRでしか 生 成 できない Type 7 LSAsはNSSA NSSAの の 中 でしか 流 れない NSSAから 他 のarea の areaに に 行 くときは ABR ABRでType 7 LSAsをType 5 LSAsに 変 更 す る そのときサマライズやフィルターすることもできる エッジの 方 でメモリの 少 ないルータとかある 場 合 に 使 える C 社 ではIOS 11.2あたりから 対 応 71 ルーティングテーブルの 作 成 まで ここまでで Link Link-state stateについてと それをもとにどのようにしてリン クステートデータベースができるかがわかった ではそれからどうや ってルーティングテーブルができるのかなぁ? 1リンクステートのやりとり SPF(Dijkstra Dijkstra) アルゴリズム 2リンクステートデータベース (トポロジカルデータベース) ( 同 一 エリア 内 のすべてのルータで 共 通 )の ) 作 成 3 自 身 をrootとした を 最 短 パスツリーの 作 成 4ルーティングテーブルの 作 成 72

最 短 パスツリー SPF(Dijkstra Dijkstra) アルゴリズム 73 SPF(Dijkstra Dijkstra)アルゴリズム(1) すべての 中 で 最 小 のものを 確 定 していき 次 はそこから 次 のノード までを 加 えていく データベースを 見 て RT6 RT6から 次 のノード までのツリーを 作 る 1 回 目 最 小 :6 : : 確 定 現 在 リーフにあるノードの 中 でRT6 で RT6からのコ ストが 最 小 である6のノードを 確 定 する 74

SPF(Dijkstra Dijkstra)アルゴリズム(2) 確 定 したところからDB DBを を 見 て 次 のノードまで 伸 ばす ( RT6などの 既 に 確 定 しているノードは 除 く) 2 回 目 2 最 小 :7 : : 旧 確 定 : 新 確 定 : 消 去 現 在 リーフにあるノードの 中 でRT6 で RT6からの コストが 最 小 である7のノードを 確 定 する RT4はRT6 RT6 RT3 RT3 N3 N3 RT4 RT4で 確 定 したので RT5 RT4 RT4のところは 消 去 する 75 SPF(Dijkstra Dijkstra)アルゴリズム(3) こういう 感 じで 繰 り 返 していく 確 定 したところからDB DBを を 見 て 次 のノードまで 伸 ばす 3 回 目 3 最 小 :8: 最 小 : : 旧 確 定 : 新 確 定 : 消 去 現 在 リーフにあるノードの 中 でRT6 で RT6からの コストが 最 小 である8のノードを 確 定 する RT7はRT6 RT6 RT10 RT10 N6 N6 RT7 RT7で で 確 定 したので RT5 RT7 RT7のところは 消 去 する 76

ルーティングテーブルの 作 成 最 短 パスツリーからルーティ ングテーブルが 作 成 される 77 エリアで 分 けられている 場 合 バーチャ ルリンク Area 1 Area 3 Area 2 Area 0 Area 1 78

リンクステートデータベースの 内 容 LS Type2: ネットワークLSA エリア 境 界 ルータから AS 境 界 ルータまで LS Type4: サマリ LSA LS Type1: ルータLSA エリア 境 界 ルータからエリア 外 の ネットワーク(inter inter-area area)まで LS Type3: サマリ LSA これは 以 下 の 情 報 からわかる エリア 境 界 ルータ(RT3 RT3 RT4 RT4)から 全 部 のエリア 境 界 ルータ(RT7 RT7 RT10 RT10など)までのコストがバックボーン エリアのSPF treeから 計 算 される 各 エリアのエリア 境 界 ルータからバックボーンにサマ リ 情 報 を 流 している これがつまりエリア 境 界 ルータがバックボーンに 属 し ていなければならない 理 由 でもある AS 境 界 ルータから AS externalなネットワー クまで Type5: AS external LSA 79 SPF(Dijkstra Dijkstra)アルゴリズムの 負 荷 リーフにあるノードは 候 補 リストに 入 っていて コストの 低 い 順 に 並 べてある 最 もコストの 低 いノードを 確 定 して そこから 新 たなリーフを 継 ぎ 足 していく その 新 たなリーフを 候 補 リストのしかるべき 位 置 に 入 れるのは 現 在 の 候 補 リストにのってい るノード 数 を m とすると O(log(m))となる すべてのリンクは 必 ず1 度 づつ 調 べられ ている よって そのエリアの 全 リンクの 数 を l とする と O( l * log(m) ) となる よって エリア 内 のノードの 数 だけ ではなく リンクの 数 つまりネットワーク 構 成 によって 大 きく 左 右 される 同 じノード 数 でもリンクの 数 が 多 いような 構 成 だときつい 候 補 リストの 先 頭 から 抜 き 出 す(これには す 計 算 量 はかからない) RT-e(3) e(3)を を 候 補 リストに 入 れる のにO(log(m)) かかる RT-f(8) (8)を を 候 補 リストに 入 れる のにO(log(m)) かかる 候 補 リストの 先 頭 から 抜 き 出 す RT-h(6) (6)を を 候 補 リストに 入 れる のにO(log(m)) かかる RT-g(10) (10)を を 候 補 リストに 入 れ るのにO(log(m)) かかる 80

OSPFの 負 荷 について OSPFでネックになるのは でネックになるのはSPF SPFアルゴリズムだけではない むしろLink Link-state stateの の 交 換 がかなりの 負 荷 がかかっているよ うに 見 えるときもある 安 定 しないネットワークではなかなかadjacency adjacencyも も 確 立 しない sh ip ospf neighbor で 見 ても DR DRやBDR BDRともなかなか ともなかなかFULL FULLになら ない» Exchange Init メモリが 足 りないから 不 安 定 になっているわけではない ということがよくある インプリマターだし はっきりしたことは 誰 にもわからない 81 大 規 模 ネットワークにおけるOSPF 設 計 どのくらいの 大 きさまでOSPF OSPFが が 耐 えられるかは ルータの 機 種 メモ リ ネットワークの 構 成 安 定 度 などによるので 一 概 に 言 えない また 検 証 も 困 難 それだけの 台 数 を 集 めるのは 難 しい したがって 基 本 的 に 経 験 則 となる また 以 下 のような 著 名 な 人 のドキュメントも 参 考 になる OSPF Anatom of an Internet Routing Protocol» J. Moy RFC 著 者» January 1998 OSPF DESIGN GUIDE» Bassam Halabi -Cisco Systems Network Consulting Engineer ( インターネットルーティングアーキテクチャ インターネットルーティングアーキテクチャ の 著 者 )» April 1996» http://www.cisco cisco.com/warp/public/104/1.html 82

大 規 模 ネットワークにおけるOSPF 設 計 Tips 一 つのArea Areaに 持 てる 台 数 よくある 質 問 で その 度 に 一 概 に 言 えない というのが 決 まり 文 句 だが C7513 RSP4 256Mとかで とかで100 台 くらいは 十 分 安 定 していけそう? ただ 今 までの 説 明 の 通 り かなりネットワーク 構 成 によって 左 右 される 実 際 は 増 やしていって 例 えばどこかのリンクをシャットダウンしたときとか に 増 やす 前 に 比 べてコンバージェンス 時 間 (CPU ( CPUが が 落 ち 着 くまでの 時 間 ) が 明 らかに 大 きくなるとそろそろ 限 界 だと 思 うべき» これはわかります トラヒックが 非 常 にかかっていて ただでさえ 負 荷 の 重 いルータに 注 意 する» こういうルータは 大 事 なルータでもある 最 も 注 意 すべき 性 能 の 低 いルータが 入 っているだろうから それも 注 意 する 必 要 がある Halabi:50 台 まで 60 台 とか70 台 は 避 けた 方 がいい Moy:1991 年 に 多 くて200 台 と 言 ったが ベンダによって350 350というところもあ れば 50 50とかそれ 以 下 とかいうところもある ただ あまり 少 なくしすぎないべ きだ 83 大 規 模 ネットワークにおけるOSPF 設 計 まとめ リンク 数 あまりリンクを 持 つような 構 成 はよくない 例 :p2p : p2pでフルメッシュにするよりも マルチアクセスの でフルメッシュにするよりも マルチアクセスのSW SWにする メモリ メモリが 足 りているといって 安 心 してはいけない しかし メモリが 多 いに 越 したことはない OSPFのルートマップが 占 有 するメモリ 容 量 は,1エントリ 当 たり200 200~300 300B オーバーヘッドは,1LSA 当 たり100 100B» 5 万 経 路 で15M+ M+α Byteとなってメモリは 足 りているのだが DR/BDR DRは は 結 構 (かなり) 負 荷 がかかるので 処 理 能 力 のあるルータや 他 の 処 理 が 重 くかかっていないものになるなど 考 慮 する 必 要 がある 一 つのルータが 複 数 のネットワークのDR DRにならないように 考 慮 する 必 要 があ る» ip ospf priority loopbackアドレス 安 定 したルータID IDのため のためにloopback loopbackアドレスを 持 つようにする 84

大 規 模 ネットワークにおけるOSPF 設 計 まとめ エリア area 0 を 中 心 としてそこから 拡 大 していくようにする リダンダンシーのため 一 つのエリアでは 複 数 のエリア 境 界 ルータを 置 く べき エリア 境 界 ルータがもつエリアの 数 はなるべく2つまでにする virtual linkをあてにして 設 計 しないようにする 経 路 数 なるべく 経 路 が 集 約 できるようにIP IPアドレスの 設 計 をする デフォルトルート デフォルトルートをうまく 使 う» default-information originate 多 くの 経 路 をOSPF を OSPFにredistribute redistributeはしない» あまり 負 荷 に 関 係 なさそうなAS externalの の 経 路 でさえも 多 くなるとメモリが 足 りているにもかかわらず 不 安 定 になる まずは ちゃんとポリシーを 策 定 するのが 基 本 85 危 なくなったときどうするか? 機 器 の 性 能 をアップグレードする 劇 的 に 変 わることが 多 い( 例 :C7513 : RSP2 RSP4 RSP4) ノード 数 とリンク 数 を 少 なくするため 大 容 量 ルータにする バックボーンエリア 内 の 台 数 の 削 減 それでもどんどん 大 きくなっていく それができない またはそれでも 間 に 合 わないなら 工 夫 すればよい 状 況 に 応 じて 手 を 打 つ confederation static-to to-bgp 他 の 候 補» エリア 境 界 ルータにもっと 多 くのエリア» OSPFプロセス 分 け» IS-IS 化» virtual link» ネットワーク 分 けて 他 のプロトコルで 結 ぶ» etc... 86

IS-IS すみませんが IS IS-IS ISのプレゼンは 時 間 の 都 合 上 省 略 させていただきます しかし 一 部 要 望 があるため 参 考 資 料 ということで 添 付 しておきます 宜 しくお 願 い 致 します 87 IS-IS 米 国 のビッグISP ISPでOSPF OSPFではなく ではなく IS IS-IS ISを 使 ってい るところが 結 構 ある OSPFよりスケールするという 噂 もある 本 質 的 にはOSPF OSPFと 大 差 ないはずなので 実 装 がしっか りしているのだろう 米 国 ISP 向 けにチューニングされているらしい 日 本 のISP ISPや や 企 業 で 使 っているところはないだろう とりあえず どんなものか 見 てみよう 88

IS-IS ISの 特 徴 注 意 :この 資 料 でIS で IS-IS ISと 言 っているのは 正 確 には Integrated IS-IS IS のことである Link state routing protocol Level1 and Level2 OSIスタックの スタックのLinks State Routing Protocol -OSPF OSPFに に 非 常 によく 似 ている -DR DRの 仕 組 みも 存 在 する 2つの 階 層 をもつ Cost-based routing protocol NSAP address その 他 1link linkでmetric 0~63 0 default 値 は10 は 10(すべての すべてのIF IF) 積 算 されたmetric metricの 最 大 値 :1023 : 使 用 するアドレスNSAP Address VLSM 対 応 OSI CLNS と TCP/IPネットワークをサポート ロードバランスはCisco Ciscoでは では6path pathまで 89 L1 area L1 L1 area L1/L2 L1/L2 L1 ネットワーク 構 成 例 L1 area L1/L2 L1/L2 L1 area L1 L1 area areaの 概 念 がある area areaのボーダーは ボーダーはOSPF OSPFと 異 なり リンクになる area 内 のrouting の routingをlevel1 routingと いう area 間 のrouting の routingをlevel2 routingと いう level1 routingを を 話 すルータを level1(l1)ルータという ルータという Level1 ISと もいう leve2 routingを 話 すルータを level2(l2)ルータという ルータという Level2 ISと もいう level1 routing level2 routingどちら も 話 すルータをlevel1/level2(L1/L2) ルータという 多 くのL2 L2ルータは 自 areaのため level1 routingを 話 すため L1/L2 L1/L2ルー タとなる 90

用 語 の 簡 単 な 説 明 CLNS(Connectionless Network Service) OSIのものだが いわば のものだが いわば IP IPの の 世 界 でのアドレスや 伝 送 の 仕 組 み というのと 同 じような 感 じで OSI OSIの の 世 界 でのアドレスや 伝 送 の 仕 組 み ということ NSAP(Network Service Access Point)address CLNSで で 使 うアドレス プロトコルスタック TCP/IP アドレスや 伝 送 の 仕 組 み IP アドレス IPアドレス OSI CLNS NSAPアドレス 91 IS-IS Routing Protocolの 仕 組 み IS-IS ISのLSP(Link State PDU)はOSI OSIのノード 間 のやり 取 りとして 認 識 される IS-IS ISのやり 取 りは OSI OSIのネットワークレイヤ 即 ちCLNS ち CLNSで で 行 われる よって 各 ルータでは OSI OSIでのアドレスすなわち でのアドレスすなわちNSAP NSAPアドレスで 表 現 されるNET を 持 つ 必 要 がある NET NETはOSPF OSPFでいうルータ でいうルータID IDにあたる IPはIS IS-IS ISのLSP LSPに 乗 る 情 報 としてやり 取 りされる つまり 1 CLNSにおいて においてIS IS-IS ISのやり 取 りをし データベースができる 2 NETに に 基 づいたツリーを 作 る 3 IP( 及 びCLNS CLNS)のルーティングテーブルを 作 る OSPFとIS IS-IS ISの 比 較 ルーティングプロトコル 使 用 するネットワークレイヤ ノードのID できるルーティングテーブル OSPF IP ルータID (IP IPアドレスに 基 づく) IP IS-IS CLNS NET (NSAP NSAPアドレスに 基 づく) IP 及 びCLNS 92

Level1 and Level2 Routing Dijkstra sアルゴリズム Level1とLevel2 Level2 両 方 それぞれに 関 して 独 立 に 走 る Level1 IS ルータにおいて エリア 内 への 通 信 に 関 しては Level1 IS-IS ISで で 認 識 し 普 通 にrouting に tableに のっけることによって 通 信 が 可 能 となる 他 エリアへの 通 信 に 関 しては metric 的 に 最 も 近 いL1/L2ルータに 向 けて default routeを 向 けることによって 通 信 が 可 能 となる» routing tableにそこに 向 けて 0.0.0.0/0 が 生 成 されるわけ» L1/L2ルータから ルータからL1 L1への へのLSP LSPのATT(Attached) bitを1にすることによって 知 らさ れる Level1/Level2 IS ルータにおいて 他 エリアへの 通 信 に 関 しては Level2 IS-IS ISで で 認 識 自 エリアへの 通 信 に 関 しては Level1 IS-IS ISで で 認 識 93 NSAP address NSAP address Example: 47.0004.004D.0003.0000.0C00.62E6.00 NET IS-IS area address System address (=System ID + セレクタ) ( 可 変 長 :1~13 : 13byte byte) ( 固 定 長 :7byte) : System IDは は 自 由 に 振 ることができるが 一 般 的 に 次 のような 形 で 割 り 当 てられることが 多 い MACアドレスを 割 り 当 てる» system IDはセレクタ 抜 かして6bytes bytesのため ぴったり loopbackのip addressを を 割 り 当 てる» 6bytes bytesを16 進 数 表 記 すると 数 字 が12 個 になる その12 個 の 数 字 を 3 桁 の10 進 数 表 記 4つに 当 てる 例 :loopback : loopbackのip addressが192 192.168.10..168.10.1の の 場 合 system IDを 1921.6801.0001 にする 192.168.10. 1 94

Config 例 95 基 本 config 基 本 的 なコンフィグ 1) ISISプロセスをあげる router isis net xx.xxxx xxxx.xxxx xxxx.xxxx xxxx.xxxx xxxx.00 2) インタフェースにISIS ISISをしゃべらす そのインタフェースのNW NWも も 広 告 する int xxx ip router isis 以 上 が 最 小 限 のコマンド この 場 合 このルータはLevel Level-1/2 1/2ルータとして 動 く ルータ 自 体 やリンクをLevel Level-1やLevel Level-2-only onlyにするコマンド メトリックを 設 定 するコマンドなどなどがある 96

IS-IS ISとOSPF OSPFとの 本 質 的 な 違 い SPFをダイクストラアルゴリズムで 作 るときに OSPF OSPFでは ルータID IDを を 元 に 計 算 するが その 代 わりにNSAP NSAPで で 表 現 さ れるNET NETでやる(これは 本 質 的 な 違 いではない) ISISエリア 境 界 がルータとルータの 間 にあるが Level Level- 1/2ルータを ルータをOSPF OSPFの の 場 合 のエリア 境 界 ルータと 思 うと 本 質 的 な 差 はない area これをバックボーンエリアと 考 えればOSPF OSPFと と 同 じこと L1 L1/L2 L1 L1 L1 L1/L2 L1/L2 L1 area area 97 OSPF と IS-IS ISの 比 較 米 国 ISPで で 昔 IS-IS ISに に 使 っていて 慣 れているので 今 も 使 っている という 理 由 でIS IS-IS ISを を 使 っているところもある 日 本 でIS で IS-IS ISに に 慣 れている 人 なんていない 教 えてくれる 人 も サポートしてくれる 人 もいない 本 もドキュメントもあまりない CLNSも も 使 いたい 人 にはうれしいがそんな 人 はいない いまさらIS IS-IS ISには 変 更 できない オペレーション 的 にも ノウハウ 的 にも ネットワーク 的 にも 普 通 これらのデメリットに 逆 らってまでOSPF OSPFでなく でなくIS IS-IS ISにすること はほとんどない しかし OSPF OSPFでどうしようもなくなった 場 合 は ルータ 製 品 的 にIS IS-IS のほうがOSPF OSPFよりスケールしやすい 実 装 になっているということを 信 じてIS IS-IS ISを を 試 してみるのも 一 案 ではある ただし 通 常 上 記 のデメリットがでかく また 工 夫 すればOSPF OSPFで なんとかなるケースが 多 い 98

(2) BGPのシステム 設 計 論 99 概 要 関 連 事 項 の 整 理 BGP プロトコル 概 説 ISPネットワーク 拡 大 に 沿 った 規 模 対 応 ポリシルーティング ポリシルーティングの 実 際 100

関 連 事 項 の 整 理 101 AS(Autonomous Autonomous System) とIGP, EGP AS== 単 一 のルーティングポリシで 運 用 される 範 囲 一 般 的 にはひとつのISP ISP Routing Domain とも 呼 ばれる 16ビット( ビット(1~65535) 65535)の の 番 号 空 間 を 持 つ AS2914== NTT Verio,, AS5511==FT/Opentransit Internet» AS2914==» 64512~65535 65535はプライベートAS» 現 在 最 大 値 は22000は 程 度,11,000, 個 程 度 が 観 測 される The Internet とは AS ASが 相 互 接 続 された 全 体 AS 境 界 を 基 準 に 経 路 制 御 プロトコルが 異 なる IGP: Interior Gateway Protocol OSPF, IS-IS, IS, RIP» AS 内 (Intra-AS) AS)の の 経 路 制 御 に 用 いる EGP: Exterior Gateway Protocol BGP, IDRP» AS 間 (Inter-AS) AS)の の 経 路 制 御 に 用 いる 102

CIDRの 復 習 (1) CIDR Classless Inter-Domain Routing クラスレスなAS 間 の 経 路 制 御 クラスレスとは» classa, classb, classcなどのクラスの 考 え 方 を 除 い たもの» 対 義 語 ==クラスフル クラスフル(classful) 103 CIDRの 復 習 (2) クラスフル(classful classful) という 考 え 方 IPアドレスの 先 頭 オクテットの 値 でネットワークアドレ スの 範 囲 を 判 断 する» class A = 1~1261 126 第 一 オクテットだけがネットワーク» class B = 128~191 191 第 二 オクテットまでネットワーク» class C = 192~223 223 第 三 オクテットまでネットワーク ネットワークアドレス 単 位 でしか 扱 わない( 扱 えない, 伝 えない, 伝 えるすべがない) その 中 を 更 に 分 割 したものをサブネットと 言 う» 分 割 する 大 きさも 自 分 にしか 定 義 できず 伝 えるすべがない» クラスフルネットワークの 中 は 統 一 したサブネットのサイズに しないと 扱 えない 104

CIDRの の 復 習 (3) クラスレス(classless) classless)という という 考 え 方 どこまでがネットワークを 示 すのかを 明 示 して 扱 う ネットワークを 示 すものをプリフィクス(Prefix) Prefix)と と 呼 ぶ プリフィクスの 長 さは 一 般 的 にビット 数 で 表 される» Class CのC 202.216.40.0 202.216.40/24 (202.216.40.0/24)( つまりクラスレスだと 連 続 するclass Cアドレスを C 任 意 の 大 きさでひとかたま りで 扱 える Class Aのサブネットも A 全 く 同 様 に 扱 える Class Cより C 小 さいアドレスブロックも 全 く 同 様 に 任 意 の 大 きさで 扱 える» これがいわゆるVLSM(Variable Length Subnet Mask) 105 CIDRの の 復 習 (4) CIDR クラスレスな ラスレスなAS 間 経 路 制 御 プリフィクス+プリフィクス 長 で 経 路 情 報 を 扱 う 複 数 のClassCの ClassC(=/24) (=/24)アドレスも(あらゆるアドレ スが) 任 意 の 大 きさでひとかたまりに 扱 える AS 内 の 小 さなネットワークセグメント,ユーザ ネットワークをひとかたまりにして 他 のASの ASに に 広 告 できる» 経 路 集 成 aggregation 106

The Internetにおける 階 層 的 経 路 制 御 (1) 全 インターネットを3つに つに 階 層 化 して それ ぞれ 独 立 して 経 路 制 御 を 扱 う InterAS» AS 間,Default, Default-Freeゾーン,EGPで で 制 御 IntraAS» AS 内,AS, 内 の 全 経 路,IGP, IGPで で 制 御 End-User» ユーザサイト 内 Static StaticやIGPで で 制 御 107 The Internetにおける 階 層 的 経 路 制 御 (2) 経 路 集 成 Aggregation 複 数 の 経 路 情 報 をひとかたまりにして より 大 きなサ イズの(より 短 いプリフィクスの) 単 一 の 経 路 情 報 にす ること 現 在 IPアドレスの 割 り 振 りはISP 毎 に 行 われているの で そこからユーザに 割 り 当 てるIP IPアドレスは 割 り 振 り ブロックで 集 成 することができる 202.216.32.0/24 202.216.33.0/25 202.216.33.128/26 202.216.33.192/26 202.216.34.0/23 202.216.36.0/22 集 成 202.216.32.0/21 108

The Internetにおける 階 層 的 経 路 制 御 (3) それぞれの 境 界 で 経 路 集 成 = 情 報 量 の 縮 退 上 流 の 経 路 は 全 て default route で 制 御 す る 下 流 の 詳 細 構 成 は 気 に せず ひとかたまりの 経 路 で 制 御 する 110,000 経 路 Inter AS Default-free freeゾーン EGPによる 経 路 制 御 10 10 Default route route 経 路 集 成 1000 1000 IGPによる IGPによる 経 Intra-Domain 経 路 路 制 制 御 経 路 制 御 AS IGPによる 経 路 制 御 経 路 制 御 IGPによる 御 経 路 制 御 BGP OSPF 1 Default route route 経 路 集 成 10 10 End-User 109 The Internetにおける 階 層 的 経 路 制 御 (4) その 内 在 的 矛 盾? CIDRは は 非 階 層 的 アドレス 形 態 であったIP IPアドレスに 階 層 構 造 を 持 ち 込 んだ 階 層 構 造 を 厳 格 に 推 し 進 めようとすると» 電 話 番 号 のように 局 番 固 定 割 り 当 てのような 構 造 が 望 ましい 末 端 に 近 くなるほどマルチホームがしにくい» 小 さいアドレスブロックでマルチホームをするのは 難 しい 実 際 問 題 としては 小 さいアドレスブロックでマルチホ ームすることも 容 認 されつつある» 階 層 的 経 路 制 御 の 崩 壊 の 兆 し 110

BGP プロトコル 概 説 111 基 本 事 項 の 確 認 現 在 のバージョンは4 BGP4, RFC1771 AS 間 経 路 制 御 に 用 いる ピアリング(peering) 明 示 的 に 定 義 した 隣 接 ル ータとの 間 にTCPに 上 でセッションを 確 立 し 経 路 情 報 を 交 換 する パスベクター 型 プロトコルと 呼 ばれ プリフィクス 単 位 の 経 路 情 報 レコードにはパス 属 性 と 呼 ばれ る 属 性 情 報 が 添 えられている パス 属 性 により 経 路 の 優 先 制 御 を 行 う パス 属 性 を 調 整 することで 経 路 制 御 ポリシを 実 装 することができる 112

BGPとOSPF OSPFの の 比 較 (1) OSPF IGP : Interior Gateway Protocol IP 上 に 直 接 乗 るプロトコル Protocol number: 89 BGP EGP : Exterior Gateway Protocol TCP 上 に 乗 るプロトコル Port number: 179 リンクステート 型 プロトコル リンクステート 情 報 を 伝 播 状 態 変 更 毎 にLSAに LSA, 連 鎖 伝 播 パスベクター 型 プロトコル パス 情 報 を 伝 播 状 態 変 更 毎 にUPDATEに UPDATE, 連 鎖 伝 播 113 BGPとOSPF OSPFの の 比 較 (2) OSPF 基 本 的 に OSPF OSPFを を 起 動 した 隣 接 ルータ 全 てと 経 路 交 換 マルチキャストでセグメント 上 の 全 OSPFルータとやりとり BGP 明 示 的 に 定 義 した 隣 接 ルータ のみと 経 路 交 換 隣 接 ルータ 毎 にBGPに BGPセッションを 確 立 (ピアリング) あるネットワーク(ルータ)の 状 態 変 更 は 全 ルータのパスツリー 再 作 成 を 引 き 起 こす 30 分 でリフレッシュ-- --flooding あるネットワークの 状 態 変 化 は 基 本 的 にはそのプリフィクスだけ の 問 題 リフレッシュなし 114

BGPとOSPF OSPFの の 比 較 (3) OSPF トポロジの 管 理 に 主 眼 を 置 く エリア 内 共 通 のLSDBの LSDBを を 全 ルータ が 作 成 し LSDB LSDBから 各 ルータ それぞれがパスツリーを 作 成 BGP プリフィクス(ネットワーク)の パス 属 性 に 着 目 受 領 したUPDATE UPDATEは 各 AS,ルータのポリシに 基 づいて 処 理, 以 遠 伝 播 する 経 路 個 別 のポリシ 付 加 は 不 可 経 路 個 別 にポリシ 付 加 が 可 能 パス 属 性 値 として プリフィクスに 付 加 精 密 で 敏 速 な 経 路 制 御 ポリシに 基 づいた 経 路 制 御 115 メッセージヘッダ マーカー(Marker) セキュリティ 目 的 に 利 用 長 さ(length) さ タイプ(Type) メッセージタイプ» オープン(OPEN)» 更 新 (UPDATE)» 通 知 (NOTIFICATION)» キープアライブ(KEEPALIVE) Length[2] Marker [16] Type[1] 116

OPENメッセージ BGPセッション 開 設 に 利 用 以 下 のパラメータ 提 示 してネゴ シエーションを 実 施 バージョン» 現 在 はバージョン4 自 AS 番 号 ホールドタイム» キープアライブの 間 隔 を 指 定 BGP ID» 自 分 が 持 つIPつ IPアドレスからひと つをID IDとして 利 用 する オプションは 現 在 のところ 認 証 情 報 のみが 定 義 されている 受 諾 にはKEEPALIVE, 拒 否 に はNOTIFICATIONを を 返 す Marker [16] Length[2] OPEN My Autonomous Number[2] Option Length [1] Version[1] Hold Time[2] BGP ID[32] Option Data[ 255] 117 KEEPALIVEメッセージ セッションの 正 常 性 確 認 に 利 用 UPDATEが 一 定 期 間 以 上 発 生 しない 場 合 に 送 信 Hold Time より 頻 繁 に Length[2] Marker [16] KEEPALIVE 118

NOTIFICATIONメッセージ エラー 通 知 し セッション を 終 了 する フォーマット 不 良 無 効 値 状 態 遷 移 エラー Hold Time 満 了 セッション 中 止 Error Subcode [1] Length[2] Marker [16] Data NOTIFICATION Error Code[1] 119 UPDATEメッセージ 経 路 情 報 の 交 換 に 利 用 取 り 消 される(withdrawn) プリフィクスを 複 数 及 び パス 属 性 と 到 達 可 能 プリ フィクス(NLRI) NLRI)の の 組 一 対 を 伝 達 可 能 経 路 情 報 を 消 すのは 一 気 にできる パス 属 性 の 変 更 や 新 しい 経 路 情 報 は1プリフィクスずは つUPDATEを を 送 信 Marker [16] Length[2] UPDATE Unfeasible routes length [2] Prefix Length [1] Prefix Length Path attributes Length [1] NLRI Length [1] Withdrawn routes Prefix #1 Prefix #2 Path attributes Network Layer Reachability Information 120

Path Attributes(パス 属 性 ) プリフィクスに 括 りつけられた 経 路 選 択 制 御 用 の 属 性 値 群 必 須, 任 意, 透 過 性, 非 透 過 性 の4つに の 分 類 必 須 Well-known mandatory» 全 てのBGP BGPルータで 解 釈 可 能 で 全 ての 経 路 レコードに 必 要 任 意 Well-known discretionary» 全 てのBGP BGPルータで 解 釈 可 能 で 必 ずしもつけなくても 良 い 透 過 性 Optional transitive» 一 部 のBGPの BGPルータで 解 釈 されない 可 能 性 があり 次 のASの ASへも 伝 播 される 非 透 過 性 Optional non-transitive» 一 部 のBGPの BGPルータで 解 釈 されない 可 能 性 があり 次 のASの ASへ へ 伝 播 さ れない 121 Path Attributes(パス 属 性 ) Well-known mandatory ORIGIN 生 成 元 のASの ASでどういう 形 でBGPで 上 に 生 成 されたか» IGP, EGP, INCOMPLETE の3 値 AS_PATH 生 成 元 ASまでの 経 過 ASのリスト NEXT_HOP そのプリフィクスへの 次 のホップとなるIP IPアドレス 122

Path Attributes(パス 属 性 ) ポリシ 制 御 のプレイヤーたち LOCAL_PREF 任 意 Local Preference AS 内 で 他 ASから 受 け 取 った 経 路 に 関 する 優 先 度 をつけるのに 用 いる MULTI_EXIT_DISC 非 透 過 性 Multi Exit Discriminator 複 数 相 互 接 続 点 を 持 つ 隣 接 ASに に 対 してそれぞれ の 優 先 度 を 伝 える COMMUNITY 透 過 性 任 意 の32の 32ビットの 情 報 を 伝 達 する 123 ebgpとibgp ebgp External BGP 他 のASの ASとの 間 でセッションを 張 り 経 路 情 報 の 交 換 を 行 う ibgp Internal BGP 同 じASじ ASの 複 数 のBGPの BGPルータの 間 で それぞれが ebgpを を 介 して 入 手 した(あるいは 自 AS 内 から 生 成 した) 外 部 経 路 を 交 換 し AS 内 の 経 路 情 報 の 同 期 を 取 る 基 本 的 には ibgp ibgpで で 入 手 した 経 路 情 報 はiBGPは ibgpで 以 遠 伝 播 しない» 全 てのBGP BGPルータとiBGPセッションを 確 立 する 必 要 が ある( 回 避 方 法 は 後 ほど) 124

ISPネットワーク 拡 大 に 沿 った 規 模 対 応 設 計 BGPの の 導 入 125 AS 番 号 はどうやって 割 り 当 てを 受 けるのか JPNICが が 割 り 当 てを 行 う ftp://ftp.nic.ad.jp/jpnic/ipaddress/as- application.txt» 現 在 正 式 サービス 化 に 向 けて 作 業 中 AS 割 り 当 ての 条 件 RFC1930» 日 本 語 訳 も 一 応 ある» ftp://ftp.nic.ad.jp/jpnic/ipaddress/rfc1930-jp.txt jp.txt» マルチホーム 接 続 (IX( 接 続 を 含 む)となっているこ とが 条 件 126

最 も 単 純 なBGP BGPの の 導 入 IGPでデフォルトル ートが 指 されるルー タが 単 一 のボーダ ルータ BGP AS AS 独 自 の 経 路 制 御 ポリシだ から 2つ つ 以 上 のASの に 接 続 Inter AS aggregate aggregate Default route Intra AS IGPによる 経 路 制 御 問 題 点 : single point of of failure 複 数 箇 所 で 他 のAS の ASと と 接 続 したい 127 BGP 導 入 の 実 際 2つ つ 以 上 の 国 内 大 手 ISPを を 上 流 としてマル チホーム 接 続 NSPIXP,JPIX, JPNAP, PihanaIXなどのイ ンターネットエクスチェンジに 加 入 して 国 内 到 達 性 を 確 保 別 途 国 際 ゲートウェイ ISP(あるいは 国 内 大 手 ISP)に に 加 入 して 海 外 到 達 性 を 確 保 アドレスブロックは JPNIC JPNICなどから 割 り 当 てを うける 128

BGPの 基 本 的 コンフィグレーション(1) BGP 起 動 router bgp 20000 BGP 起 動 no synchronization BGPグローバルコマンド no auto-summary BGP グローバルコマンド network 172.16.0.0 IGPで IGPで で 経 路 があればBGP があればBGP BGPで BGPで で 広 告 network 192.0.1.0 含 まれるプリフィクスがIGP まれるプリフィクスが IGP IGP aggregate-address address 223.224.0.0 255.255.0.0 summary-only neighbor 202.249.2.60 remote-as 4689 neighbor 202.249.2.60 route-map AS4689-in in neighbor 202.249.2.60 route-map ixp-out out Peer Peer IGPにあれば IGPにあれば 集 成 経 路 を 広 告 集 成 経 路 以 外 を 抑 制 Peer Peer 確 立 Route-map mapで mapで ポリシを ポリシを 記 述 129 BGPの 基 本 的 コンフィグレーション(2) Inbound 方 向 のルートマップの 例 route-map AS4689-in permit 10 match as-path 10 set local-preference 110! route-map AS4689-in permit 20 match as-path 20 set local-preference 100! シーケンス シーケンス 番 号 順 に 適 用 それぞれのシーケ ンスで ンスで 適 合 条 件 と アクションを アクションを 定 義 130

BGPの 基 本 的 コンフィグレーション(3) Outbound 方 向 のルートマップの 例 route-map ixp-out permit 10 match as-path 30 set metric 1000! 131 ISPネットワーク 拡 大 に 沿 った 規 模 対 応 設 計 ibgpシステムの 構 築 132

2つのボーダルータを 置 く デフォルトが2つ IGP 的 に 近 いほうを 選 択 する ボーダルータ 間 の 経 路 情 報 の 同 期? ibgpの の 確 立 aggregate Default 次 の 課 題 : BGP 加 入 者 にトランジットを 提 供 ibgp ebgp Inter AS Intra AS IGPによる 経 路 制 御 Full route aggregate Default 133 ibgpの の 注 意 点 ebgpは は 直 接 隣 接 を 必 要 とするが ibgp ibgpはas 内 での 同 期 が 目 的 なので 離 れていても 確 立 可 能 ibgpは は 全 てのボーダルータとセッション を 張 る 必 要 がある ただし 134

ibgp 仕 様 上 の 問 題 点 Synchronization 問 題 トランジットしようとする 経 路 はIGPは IGPで で 観 測 さ れていなければならない Next-hop hopが 別 のボーダルータだった 場 合 途 中 のIGPの IGPノードではdefaultしか 知 らない net N net N default Default net N????? net N 135 ibgpシステムの 解 No synchronization IGP synchronizationの の 縛 りを 解 くコマンド(c 社 ) IGPで で 経 路 観 測 されない 経 路 も 利 用 可 能» つまり BGP BGPルータ 間 に 非 BGPルータがあると 矛 盾 が 発 生 トランジット 層 の 総 BGPノード 化 トランジット 層 とアクセス 層 の 二 層 構 造 へ BGPユーザが 多 い 場 合 総 トランジット 層 に 近 づく Transit layer Access layer 136

ibgp 問 題 のまとめ ibgpは は 隣 接 していなくても 確 立 可 能 仕 様 では 中 間 ノードが 経 路 制 御 できないと 問 題 があるので IGP IGPでBGP 経 路 を 知 っている 必 要 が あった がしかし それでは 経 路 制 御 階 層 化 の 意 味 がな いので IGP IGPとの 同 期 を 外 すほうがよい IGP 同 期 を 外 す 結 果 全 てのBGP BGPルータは 隣 接 する 必 要 がある BGPルータ(トランジット) 層 と 非 BGPルータ(アク セス) 層 の 二 層 に 階 層 化 総 トランジット 層 へ 137 ibgpシステムの 基 本 (1) NEXT_HOPをIGP IGPで 観 測 する ibgpで で 伝 播 される 外 部 経 路 では 基 本 的 に NEXT_HOPの の 値 は 変 わらない ebgpの の 隣 接 ルータのIP IPアドレス BGP 経 路 は NEXT_HOP NEXT_HOPがIGPでreachableでなでな ければ 有 効 とならない そこで IXやプライベートピアリングのセグメントを やプライベートピアリングのセグメントをIGPで で 認 識 させる» 例 えばpassive passive-interfaceでospfプロセスに 定 義 する ebgpルータで ルータで ibgpピアに 対 してnexthop nexthop-selfを を 設 定 して 自 分 のIPの IPアドレスをNEXT_HOPとして 使 う 138

ibgpシステムの 基 本 (2) loopbackをピア 設 定 に 利 用 する ibgpピアの ピアの 設 定 では loopback loopbackアドレスを 利 用 するのが 基 本 1oopbackインターフェースはダウンしない» 隣 接 ルータと 対 面 するインターフェースが 落 ちても 迂 回 して 到 達 することが 可 能» Loopbackインターフェースにも インターフェースにもIGPを を 起 動 することを 忘 れずに 全 BGPルータで 同 じIPじ IPアドレスで 対 象 ルータを 認 識 す ることが 可 能 139 ibgpの 基 本 的 コンフィグレーション Interface Loopback 0 ip address 202.216.41.1 255.255.255.255! Interface FastEthernet 2/0 description NSPIXP2 Segment ip address 202.249.2.41 255.255.255.0! Router ospf 4689 network 202.216.41.1 0.0.0.0 area 0 network 202.249.2.0 0.0.0.255 area 0 passive-interface interface loopback 0 passive-interface interface FastEtheret 2/0! Router bgp 4689 neighbor IBGP peer-group neighbor IBGP remote-as 4689 neighbor IBGP update-source Loopback 0 neighbor 202.216.41.2 peer-group IBGP neighbor 202.216.41.3 peer-group IBGP neighbor 202.216.41.4 peer-group IBGP! Loopback Loopback 00 の 設 定 /32で /32で で 構 わない わない FastE2/0 FastE2/0 がIX がIXセグメントだったとする LoopbackとIX LoopbackとIXセグメントをOSPF 上 で 定 義 かつ かつ 非 活 性 とする これによって とする これによって 他 の BGPルータでもそれぞれがIGP 上 で 認 識 される される peer-group peer-groupを を 利 用 してみる してみる 等 質 なコンフィグには なコンフィグには 非 常 に 有 効 Update-source Update-source で ピアリングに で ピアリングに 利 用 す るIP るIPアドレスを 定 義 する する ibgpにloopback ibgpにloopbackアドレスを 利 用 すると すると BGPルータを BGPルータをIPアドレスで 認 識 できるの できるの で 運 用 上 非 常 に 便 利 140

ISPネットワーク 拡 大 に 沿 った 規 模 対 応 設 計 ibgpシステムのスケーラビリティ 141 ibgpシステムのスケーラビリティ ibgpで で 得 た 経 路 は 他 のiBGPpeerの ibgppeerに に 再 伝 播 しないため 全 ノードをmesh 状 にpeerに peerする ボーダルータ5ノードで 既 に10に 10peer 10ノードでは ノードでは? 10C2 = 45» 11ノード 目 の 増 設 にあたって10 10peerの の 追 加 ibgpフル Transit フルmesh layer 問 題 142

ibgpフル フルmesh 問 題 解 決 策 ibgpルートリフレクタ ルートリフレクタ(1) リフレクタとリフレクタクライアントの2 階 層 化 リフレクタからクライアントにはiBGP ibgpで で 得 た 経 路 を 再 分 配 する RR Transit layer RR 143 ibgpフル フルmesh 問 題 解 決 策 ibgpルートリフレクタ ルートリフレクタ(2) コンフィグレーション リフレクタ 側 で 以 下 のように 設 定 クライアント 側 では 設 定 不 要» 階 層 化 可 能 router bgp 4689 bgp cluster-id FOUR-BYTE BYTE-CLUSTER-ID neighbor CLI.ENT.IPA.DDR remote-as 4689 neighbor CLI.ENT.IPA.DDR route-reflector reflector-clientclient 144

ibgpフル フルmesh 問 題 解 決 策 BGPコンフェデレーション コンフェデレーション(1) BGPコンフェデレーション コンフェデレーション(confederation) ASの の 中 を 更 に 小 さい 単 位 でsubASで subasに に 分 け そ の 間 をeBGPを ebgpで で 結 ぶ フルmesh meshにはる 必 要 はなくなる AS65001 AS65003 AS65002 Transit layer AS65004 AS65005 145 ibgpフル フルmesh 問 題 解 決 策 BGPコンフェデレーション コンフェデレーション(2) コンフィグレーション プライベートASを 利 用 するのが 普 通 Confed 内 部 となるAS 番 号 をconfed を peersで で 定 義 router bgp 65000 bgp confederation identifier 4689 bgp confederation peers 65001 65002 65003 65004 network. 146

AS 内 BGPスケーラビリティ 問 題 の 実 際 複 数 の 対 外 接 続 地 域 /POP 毎 にBGPに 接 続 加 入 者 がいる それぞれBGP BGPノード が 必 要 冗 長 性 確 保 が 必 要 POPにコアルータを 2 台 BGP 加 入 者 増 加 BGP 加 入 者 収 容 ル ータの 増 加 The Internet 13C2=78 78peers 13 147 AS 内 BGPスケーラビリティ 問 題 の 実 際 RR RRによる 解 法 RRの の 導 入 The Internet POPコアルータと 対 外 接 続 ルータをフルメッシュ 9C2+8= +8=44 44peers 加 入 者 ルータがクライアント 148

AS 内 BGPスケーラビリティ 問 題 の 実 際 コンフェデレーションによる 解 法 地 域 POP POPごとに subasを を 設 定 BGP 加 入 者 収 容 ル ータとの 間 にiBGPに ibgpを 設 定 confedbgp 領 域 subas The Internet 25peers IGPは は 分 割, 単 一 ど ちらでもOK 149 ISPネットワーク 拡 大 に 沿 った 規 模 対 応 設 計 スケーラビリティとトラブル 回 避 150

ebgpのスケーラビリティ 経 路 数 110,000 -- CIDR Report by Tony Bates** 所 要 メモリサイズに 影 響» 256MB 必 要 Peerの の 数 IXで で 多 数 のpeerを を 張 るとメモリ 所 要 に 影 響 50peer 程 度 +upsteamで10mb 程 度 余 分 に 消 費 ** http://www.employees.org/~tbates ~tbates/ 151 ebgpの 問 題 回 避 技 術 (1) 誤 広 告 対 策» 隣 接 ASが が 広 告 する 経 路 は 完 全 にいつも 正 しいとは 限 らない 誤 った 経 路 受 領 は 障 害 の 原 因 となる AS-path pathによるフィルタリング» 隣 接 ASが が 広 告 するAS AS-pathを 予 め 知 らせてもらい 知 らせてもらったAS AS-pathの の 経 路 しか 受 け 取 らない プリフィクスフィルタリング» ( 主 に 顧 客 の 場 合 ) 顧 客 が 広 告 するプリフィクスを 予 め 知 らせてもらい フィルタする Maximum-prefix を 絞 る» Neighbor NE.IG.HB.OR maximum-prefix 1000 900 C 社 コマンド 1000 経 路 までしか 受 けず 900 900でアラーム 152

ebgpの 問 題 回 避 技 術 (2) Route flapping リンク 不 安 定 などによる 経 路 広 告 のばたつき 経 路 更 新, 消 去 の 連 続 でCPUで CPUリソースを 浪 費 対 処 策 :Flap: Dampening»..(config config-router)# bgp dampening c 社 コマンド» ばたつく 経 路 に 一 定 時 間 のペナルティを 課 して 経 路 テーブルから 消 す 153 ebgpの 問 題 回 避 技 術 (3) ポリシ 変 更 の 負 担 軽 減 ポリシ 変 更 を 反 映 には peer peerのクリアが 必 要» Upstreamの の 場 合 full route を 受 けるため 負 担 対 処 策 : soft-reconfiguration c 社 機 能» クリアなしに 経 路 に 対 するポリシ 反 映» Outbound はコンフィグそのままで 実 行 可 能 Clear ip bgp PEER soft out 一 旦 広 告 していた 経 路 を 取 り 消 して 再 広 告» Inbound はneighbor 定 義 が 必 要 Neighbor ADDRESS soft-reconfiguration inbound ネイバから 受 けたそのものを 蓄 えておき それに 対 して 新 たなポリシを 適 用 メモリが 余 分 に 必 要 なので 注 意 Full routeで10 10MB 程 度 154

ポリシルーティング 155 ポリシルーティング BGPにおける 経 路 情 報 の 扱 い プリフィクス(NLRI) NLRI)+パス 属 性 パス 属 性 値 の 調 整,パス 属 性 値 に 基 づく 経 路 選 択 を 行 うことができる ルーティングポリシ 複 数 peerを を 持 つASつ ASとの 間 でどのようにトラヒック を 交 換 するか セキュリティのために 経 路 をフィルタする 複 数 のupstreamの upstreamに に 対 するトラヒックバランス 156

ポリシルーティングを 可 能 にする パス 属 性 値 AS_PATH 経 過 AS 列, 短 いほうが 優 先 AS-path prependでas 列 長 の 調 整 が 可 能 LOCAL_PREF Local Preference 設 計 者 意 図 の 優 先 順 位 付 け MULTI_EXIT_DISC Multi Exit Discriminator 隣 接 する 同 一 ASの の 複 数 peerの の 優 先 度 COMMUNITY Community Attribute 32ビットの 値 を 付 加 できる プロトコル 上 値 に 意 味 はない が 有 効 な 利 用 法 がカレントプラクティスに 存 在 157 AS_PATH 172.16.0.0/16 AS20001 AS_PATH: 20001 AS_PATH: 20001 AS20004 AS20002 AS_PATH: 20002 20001 AS20003 AS_PATH: 20004 20001 Prefix AS Path 172.16.0.0/16 20003 20002 20001 > 172.16.0.0/16 20004 20001 172.16.0.0/16 へのトラヒック AS20005 AS_PATH: 20003 20002 20001 通 常 AS_PATH AS_PATHが が 短 い(AS 数 が 少 ない)ものを 選 択 する 158

AS Path Prepend ASを 余 計 につけて AS_PATH_length AS_PATH_lengthを 長 く 見 せるテクニック as-path prepend 20004 AS_PATH: 20004 20004 172.16.0.0/16 AS20004 AS_PATH: 20004 AS_PATH: 20003 20004 20004 AS20003 Prefix AS Path 172.16.0.0/16 20003 20004 20004 > 172.16.0.0/16 20002 20004 172.16.0.0/16への トラヒック AS20001 AS20002 AS_PATH: 20002 20004 159 LOCAL_PREF 172.16.0.0/16 AS20001 他 ASから 受 領 する 経 路 に 付 加 し 大 きいほうが 優 先 される AS20002 172.16.0.0/16の トラヒックの 流 れ AS20004 AS20003 通 常 AS_Pathの 小 さいAS2 経 由 が 優 先 だが Local_Prefに より AS4の 経 路 を 優 先 する Local_Pref=90 AS_PATH: 20002 20001 AS20005 Local_Pref=100 AS_PATH: 20004 20003 20001 Prefix AS Path LocPref > 172.16.0.0/16 20004 20003 20001 100 172.16.0.0/16 20002 20001 90 160

MULTI_EXIT_DISC AS20001 172.16.0.0/16 MED500 プライベート ピアリング 172.16.0.0/16への トラヒックは プラ イベートピアを 経 由 MED1000 IXピアリング Prefix AS Path MED 172.16..0.0/24 20001 200 > 172.16..0.0/24 20001 100 AS20002 広 告 する 経 路 に 付 加 し 隣 接 AS に 伝 えられ 隣 接 ASにおける 経 路 選 択 で 使 われる 数 値 が 小 さい 方 が 優 先 161 COMMUNITY(1) 32ビットの 整 数 値, 透 過 性 Well-known known Community No-export:» 自 AS 以 外 に 広 告 しない No-advertise:» 受 領 したルータ 以 降 に 広 告 しない Well-known ではないCommunity 経 路 情 報 を 受 領 したAS AS,ルータで 解 釈 させ 何 らかのポリシ 付 加 を 発 生 させる 162

COMMUNITY(2) 一 般 的 な 利 用 法 New-format 32ビットを ットを16ビットずつに 二 分» 5511:1000 上 位 ターゲットAS 下 位 ターゲットASでの 動 作 例 1:RFC1998 MCI( 現 CWnet)における 実 装 例 3561:70 そのプリフィクスにLocPref LocPref=70 付 与 3561:80 そのプリフィクスにLocPref LocPref=80 付 与... そのAS ASからの 戻 りトラヒックの 制 御 に 便 利! 163 COMMUNITY(3) AS5511 Opentransit Internet の 例 5511:1000 5511:1001 5511:1002 5511:1101 5511:1102 5511:1201 5511:1202 5511:1301 5511:1302 5511:1401 米 国 ピアに 非 広 告 米 国 ピアにプリペンド1 米 国 ピアにプリペンド2 Sprintlinkに 非 公 告 ICMに 非 公 告 Sprintlinkにプリペンド1 ICMにプリペンド1 Sprintlinkにプリペンド2 ICMにプリペンド2 SprintlinkにRelayPOPで 非 公 告 5511:2000 5511:2001 5511:2002 5511:2101 5511:2102 5511:2201 5511:2202 5511:2301 5511:2302 5511:3000 5511:3001 5511:3002 5511:4000 欧 州 ピアに 非 公 告 欧 州 ピアにプリペンド1 欧 州 ピアにプリペンド2 Equantに 非 公 告 Eboneに 非 公 告 Equantにプリペンド1 Eboneにプリペンド1 Equantにプリペンド2 Eboneにプリペンド2 アジア 太 平 洋 に 非 公 告 アジア 太 平 洋 にプリペンド1 アジア 太 平 洋 にプリペンド2 欧 米 亜 太 以 外 に 広 告 しない 164

COMMUNITYの の 利 用 方 法 経 路 情 報 に 付 加 して 広 告 することで 対 地 における 経 路 選 択 を 制 御 することができる 172.16.0.0/16 AS20004 172.16.0.0/16 CA 3561:70 172.16.0.0/16 CA 3561:70に 対 して LOCAL_PREF=70を 付 加 AS20003 172.16.0.0/16への トラヒック AS3561 Prefix AS Path LocPref 172.16.0.0/16 20003 20004 70 > 172.16.0.0/16 20002 20004 100 AS20002 165 BGPの 最 適 経 路 の 決 定 プロセス 同 一 プリフィクスの 経 路 情 報 が 複 数 があると き パス 属 性 値 に 拠 って 最 適 方 路 を 決 定» 以 下 cisco ciscoの の 例 1. Local Preferenceが が 大 きい 2. AS_PATHが が 短 い 3. MEDが が 小 さい 4. IGP 上 でNextで Next-hopが 近 い(cosい cost/metric) 5. BGPのルータ ルータIDが 小 さい 166

ポリシルーティングの 実 際 167 相 互 接 続 の 例 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 ピア2 ピア1 IX 自 AS 顧 客 168

ポリシルーティングの 基 本 検 討 相 互 接 続 別 対 地 別 の 基 本 ポリシ 付 け» Outbound/Inbound を 対 にして どういう 経 路 を 交 換 するか 相 互 接 続 別» 顧 客» ピア 相 手» 海 外 上 流 フルルート 供 給, 顧 客 経 路 のみ 受 領 自 網 顧 客 経 路 のみを 相 互 に 交 換 自 網 顧 客 経 路 のみ 供 給,フルルート 受 領 対 地 別 ( 優 先 する 順 番 にパスを 並 べる)» 顧 客 直 接,IX, 経 由,Upstream, 経 由» 国 内 対 地 プライベートピア 経 由,IX, IXピア 経 由,Upstream, 経 由» 海 外 対 地 安 い 順 番, 品 質 の 良 い 順 番,とりあえず 無 制 御 169 受 領 経 路 優 先 順 序 検 討 ( 国 内 ) 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 ピア2 ピア1 IX 自 AS 顧 客 に 対 しては 契 約 線 を 優 先 するが 障 害 時 にはIX 経 由 でも 到 達 性 を 確 保 したい 顧 客 170

受 領 経 路 優 先 順 序 検 討 ( 国 内 ) 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 ピア2 ピア1 IX 自 AS ピアはプライベートピアがある 場 合 そ こを 優 先 にしたい 国 内 が 全 滅 したときには 海 外 も 使 い たい 顧 客 171 受 領 経 路 優 先 順 序 検 討 ( 国 内 ) 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 ピア2 ピア1 IX 自 AS 顧 客 172

受 領 経 路 優 先 順 序 検 討 ( 海 外 ) 海 外 上 流 1が が 一 番 安 いので ト ラフィックを 集 めたい しかし 到 達 性 が 良 い 対 地 は 他 の 上 流 を 使 うようにしたい 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 ピア2 ピア1 IX 自 AS 顧 客 173 受 領 経 路 に 関 する ルーティングポリシ 実 装 案 各 ebgpピアで ピアで 受 領 経 路 に 対 して 以 下 の 通 り LOCAL_PREFを を 付 与 する 顧 客 110 プライベートピアリング 100 IXピアリング 95 海 外 上 流 90 海 外 上 流 に 関 して 上 流 2,, 上 流 3から から 受 領 する 経 路 にASに AS-path prepend を1hop 掛 ける 174

広 告 経 路 ポリシ 検 討 ( 国 内 ) 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 ピア2 ピア1 IX 自 AS 顧 客 広 告 する 経 路 に 付 与 して 有 効 なattributeは は MED, as-path prepend,, community のみ 175 広 告 経 路 ポリシ 検 討 ( 海 外 ) ( ( 受 領 経 路 と 同 様 に ) 海 外 上 流 1が が 一 番 安 いので ト ラフィックを 集 めたい しかし 到 達 性 が 良 い 対 地 は 他 の 上 流 を 使 うようにしたい ピア2 ピア1 海 外 上 流 1 海 外 上 流 2 海 外 上 流 3 IX 自 AS 顧 客 176

広 告 経 路 に 関 する ルーティングポリシ 実 装 案 各 ebgpピアで ピアで 広 告 経 路 に 対 して 以 下 の 通 り MULTI_EXIT_DISCを を 付 与 する 顧 客 500 プライベートピアリング 900 IXピアリング 1000 海 外 上 流 に 関 して 上 流 2,, 上 流 3に に 広 告 する 経 路 にASに AS-path prepend を1hop 掛 ける 177 海 外 上 流 のトラフィック 制 御 の 難 しさ 海 外 上 流 からのinbound inboundトラフィッ クのバランスは 日 々 変 化 する 接 続 構 成 は 常 に 更 新 される 調 整 方 法 としては as-path prepend, Community プリフィクスの 一 部 のみ 適 用 精 密 な 調 整 が 不 要 な 工 夫 が 必 要 全 部 従 量 課 金 サービスにしてコスト へのインパクトを 少 なくする 十 分 なキャパシティを 準 備 して 突 出 し ても 性 能 低 下 にならないようにする US Tier1 US Tier1 US Tier1 US Tier1 IXピアリング,プライベートピアリング ピアリング 構 成 変 更, 容 量 増 強, 提 携 関 係, 顧 客 関 係 海 外 上 流 1 海 外 上 流 2 自 AS 海 外 上 流 3 178

(3) 大 規 模 な 経 路 制 御 設 計 の 実 際 179 (3-1) 概 要 設 計 指 針 180

参 考 文 献 RFC2791 - Scalable Routing Design Principles 著 者 : Jessica Yu, CoSine Informational RFC IIJ 近 藤 邦 昭 氏, 友 近, 前 村 で 元 となるインターネ ットドラフトを 和 訳 http://www.janog.gr.jp/doc/draft-yu yu-routing-scaling-01- j.txt 大 規 模 ネットワークの 経 路 制 御 システムにおけ る 問 題 点 を 概 説 し 設 計 上 の 指 針 を 示 すもの 181 問 題 点 ルータのリソース 消 費 メモリ 消 費 要 因» 経 路 数 過 多,IX, IX, 顧 客 集 線 ルータにおける 方 路 過 多,iBGP, セッション 過 多» BGPのプリフィクスフィルタリング, のプリフィクスフィルタリング,IGPの の 肥 大 化 したLSDB CPU 資 源 消 費 要 因» 不 安 定 なネットワークのflapping» フラッディング- 全 ネットワークへのLSA 伝 搬» 過 負 荷 の 悪 循 環 182

スケーラビリティ 確 保 のための 指 針 階 層 構 造 化 区 画 化 適 切 なトレードオフの 設 定 経 路 制 御 処 理 の 負 担 を 軽 減 スケーラブルな 経 路 制 御 ポリシ, 実 装 183 階 層 構 造 化 単 一 階 層,フルメッシュ 構 成 はスケールし ない Transit t Core Network と Access Network の 二 層 に 分 けると 分 かりやすい OSPFのバックボーンエリアとその 他 のエリア IS-IS ISのlevel1, level1, level2 ibgpルートリフレクタの 階 層 化 構 造 を 過 度 に 複 雑 にしないこと 184

区 画 化 階 層 構 造 化 においては 二 層 目 が 区 画 化 されている OSPFのエリア 分 割 BGP Confederation によるIGP IGPドメインの 分 割 問 題 障 害 の 局 所 化 効 果 経 路 の 集 成 185 適 切 なトレードオフの 設 定 冗 長 性 対 スケーラビリティ 過 度 の 冗 長 性 を 持 たせない 収 束 性 対 安 定 性 Flap dampeningなど など 収 束 性 を 犠 牲 にしながら それを 最 小 にする 努 力 186

経 路 制 御 処 理 の 負 担 を 軽 減 経 路 情 報 の 削 減 適 切 な aggregate, summarize できる 限 りdefaulり default t route を 利 用 する» Single-home homeの の 加 入 者 過 度 な 冗 長 構 成 を 取 らない» 代 用 方 路 は2つ は つ 以 上 いらないのでは? 187 スケーラブルな 経 路 制 御 ポリシ, 実 装 要 件 を 満 たす 範 囲 で 可 能 な 限 りポリシを 簡 素 に する 間 違 いの 起 こりやすい 手 作 業 を 避 け 可 能 な 限 り 自 動 化 する 経 路 制 御 の 完 全 性 のためにプリフィックスによる 経 路 フィルタリングを 実 施 することは 例 外 として プリフィックス 毎 のポリシは 可 能 な 限 り 避 ける 例 外 を 作 ることを 避 ける 188

(3-2) Confederationの の 実 例 BGP Confederationとは とは? 複 数 のASナンバのBGPスピーカを 外 か ら 見 たときに 単 一 のASの ASナンバとして 見 せる ことができる AS4689 AS65002 AS65001 AS5511 AS4689 AS65003 AS4689 AS4713 190

IGPスケーラビリティ 解 決 に 利 用 subas 毎 に 別 のIGPの IGPプロセスを 起 動 一 つのAS ASをsubASに 分 割 する AS 内 のIGPの IGPが 巨 大 化 しても 分 ければ 大 丈 夫 AS5511 AS4689» OSPFが 耐 えられなくなったら 分 ければ 良 い AS4689 OSPF65002 OSPF65001 AS65002 AS65003 IS-IS AS65001 AS4689 AS4713 191 Confederationの 起 動 router bgp 65001 bgp confederation identifier 4689 bgp confederation peers 65002 65003 65004 network. 192

Confederationの 利 点 OSPFプロセス プロセス 肥 大 化 への 対 策 OSPFプロセスを 小 さくする!! 大 きくなったら 分 割 すれば 良 い 地 域 ごとにポリシ 制 御 可 能 障 害 の 局 所 化 全 網 規 模 になるのだけは 避 けたい ネットワークの 統 合 や 内 部 での 管 理 分 割 など 193 Confederationにおける 経 路 の 扱 い confedの 中 のsubASの 間 はeBGPは ebgp, subasの 中 でもiBGP ibgpは 張 れる LocPref,, MED, NextHopは は subasをまたまた いでも 保 存 する(iBGP 的 扱 い) い confed 内 のsubASの subasは ASpathとして として 観 測 で きるがhop 数 評 価 には 利 用 されない 194

Confederationにおける 経 路 制 御 設 計 tips subas 毎 のnetworkの 定 義 は 事 実 上 不 可 能 OSPFをredistribute redistributeして して aggregateする AS 全 体 の 集 成 経 路 の 生 成 中 央 にaggregate に generator 対 外 接 続 ルータでspecific specificをfilter filter out Next-hop nexthop-self でsubASをより 普 通 のASの ASのように 扱 う Inter-subAS 領 域 でIGPで IGPを 立 ち 上 げればnexthop nexthop-selfは 要 らない 対 外 接 続 ルータを 単 独 1ASにするする OSPFを を 起 動 が 不 要,BGP, BGPハンドリングに 専 念 195 (3-3) 3) static-to to-bgpの の 実 例

概 要 OSPF 経 路 数 の 増 大 とその 影 響 OSPF 経 路 削 減 の 諸 方 法 static 経 路 のBGP BGPへの へのredistribute その 他 付 随 するテクニック 結 果 考 察 197 OSPF 経 路 数 の 増 大 AS4713(OCN)では では OSPF OSPFの の 経 路 数 が 非 常 に 増 えていた 90% 強 がexternal 経 路 これはcustomer customerへの staticの の 経 路 をOSPF OSPFにredistribute redistributeしていた 経 路 あまり 効 率 よくaggregate aggregateできない JPNICおかわり 制 限 198

OSPF 経 路 数 の 増 大 の 影 響 OSPFには にはexternal externalとはいえある 程 度 以 上 の 数 の 経 路 を 流 すべきでない 疑 似 環 境 において 検 証 してみたところ ある 程 度 以 上 のexternal 経 路 が 流 れるとOSPF OSPFが 不 安 定 になることが 確 認 できた Exchange init 199 適 用 ネットワークの 特 徴 と 条 件 1 トラヒックのロードバランスをしながら リダンダンシーをとるため 様 々なところでトラヒック のロードバランスをはかっている R R SW SW POP R R ロード バランス R R 2 サービスの 停 止 がなく 3 運 用 の 手 順 の 変 更 を 極 力 少 なく SW SW POP R R 200

OSPF 経 路 削 減 の 諸 方 法 OSPFを 分 割 する(リンク 部 分 で) Confederation 等» ロードバランス 困 難 一 つ 手 前 のルータでバランスさせないといけない» サービス 停 止 運 用 変 更 OSPFに に 変 えてIS IS-IS ISにする 設 計 運 用 ノウハウが 足 りない 実 際 効 くのかどうかわからない その 他 static 経 路 をOSPF OSPFでなく 直 接 ibgpに redistributeさせる 201 Static 経 路 のBGPの BGPへのredistribute static 経 路 をOSPF OSPFでなく 直 接 ibgpにredistribute IGPとしての としてのBGP BGP(external 経 路 はBGP BGP トポロジは OSPF) 前 々ページ 1.2.3. 1.2.3.などの 前 提 条 件 を 満 たし かつ OSPFの の 経 路 数 を 削 減 する 方 法 BGPは は 経 路 数 についてスケーラビリティが 高 い 前 提 ibgpセッションは 当 然 ( 元 々)loopback 同 士 ルータのloopback loopbackアドレスなどは 当 然 ( 元 々)OSPF OSPFに 流 れている staticを 設 定 しているルータもBGP BGPをしゃべらす 202

仕 組 み その 経 路 へデータが 行 くためにはBGP next-hop であるredistribute redistributeしたルータの したルータのloopback loopbackアドレス へ 向 かおうとする BGP next-hop hopへ 向 けてOSPF OSPFで 作 られたルーテ ィングテーブルをrecursive lookupする ロードバランスする データ トラヒック R R R R R Loopback address static ibgpへredistribute 203 その 他 付 随 するテクニック(1) BGPで で no no-export exportのcommunity communityをつけるこ とによりspecific specificな な 経 路 をAS 外 部 に 流 れな いようにする R R R static AS no-export R R 204

その 他 付 随 するテクニック(2) Route Reflectorの の 階 層 化 を 用 いること によってReflector Reflectorの の 処 理 を 軽 くする フルルート 必 要 でないところはfiltering filteringする コア R R R R R R Reflectorの 階 層 化 filtering Cluster Clusterの 増 加 経 路 数 の 増 加 によるReflector 負 荷 増 加 に 対 する 対 策 エッジ R R R : route-reflector reflector-client client 205 結 果 実 際 にこれらの 方 法 を 用 いることによって それ 以 来 AS4713の の 内 部 ルーティングの 安 定 性 が 増 した 運 用 手 順 もほとんど 変 化 なし Static 経 路 はiBGP ibgpに 流 し OSPFはトポロジーの 情 報 をもつだけでよ い!!!!!! 206

参 考 文 献 207 参 考 文 献 RFC2791 - Scalable Routing Design Principles Jessica Yu インターネットルーティングアーキテクチャ 第 2 版 Sam Halabi / Danny McPherson 著, 鈴 木 訳 インターネットルーティング 入 門 友 近 池 尻 小 早 川 著, 翔 泳 社 インターネットルーティング C. Huitema 著, 前 村 監 修 エクストランス 訳, 翔 泳 社 208

ご 静 聴 ありがとうございました -- 大 規 模 ネットワークにおける 経 路 制 御 設 計 -- NTTコミュニケーションズ ビジネスユーザ 事 業 部 友 近 剛 史 tomo@byd.ocn.ad.jp イクアント 前 村 昌 紀 maem@gip.ad.jp 209