将来ネットワーク科学リサーチシンポジウム 将来ネットワークのトラヒック制御技術 大阪大学大学院情報科学研究科 NTT ネットワーク基盤技術研究所 将来ネットワーク共同研究講座 上山憲昭 2014. 9. 5
ホスト中心からデータ中心へのパラダイム変換 NW( ホスト中心 ) とサービス ( データ中心 ) のギャップを解消する新しい NW アーキテクチャとして CCN が提唱 IP 層が Narrow waist ( 全体共通 ) email, WWW, SMTP, HTTP, RTP, TCP, UUDP, IP ethernet, PPP, CSMA, SONET, Copper, fiber, radio, アプリ依存 全ノード共通 リンク依存 CCN: Content-Centric Networking browser, chat, File Stream Security Content chunks Strategy IP, UDP, P2P, Copper, fiber, radio, コンテンツ層が Narrow waist ( 全体共通 ) 現在のインターネット ホスト中心 CCN データ中心 出展 : V. Jacobson, et al., Networking Named Content, ACM CoNEXT 2009 1
HTTP: Ongoing Step toward CCN アーキテクチャの変革を伴う CCN への移行に先立ち, 現在のインターネットも既にデータ中心ネットワークを志向 * *L. Popa, et al., HTTP as the NarrowWaist of the Future Internet, ACM HotNets 2010 インターネットでは,Web 閲覧や動画ストリーミング配信が中心であり,HTTP トラヒックが支配的 HTTP はコンテンツ名称で通信先を指定するデータ中心なプロトコル HTTP 層が Narrow waist ( 全体共通 ) WWW, HTTP streaming, MPEG DASH, HTTP IP, MPLS, OTN, CSMA, SONET, Copper, fiber, radio, アプリ依存全ノード共通ネットワーク依存リンク依存 2
累積分布 Web レスポンス時間の増大 50% のサイトは 4 秒以上,10% のサイトは 9 秒以上の待ち時間 Web レスポンス時間の改善が重要 1.0 0.8 0.6 0.4 0.2 0 10-2 10-1 1 10 10 2 レスポンス時間 ( 秒 ) 人気の上位 1,200 の各 Web サイトに東京からアクセスしたときの, レスポンス時間の累積分布をプロット 3
Web トラヒック発生パタンの複雑化 Web 閲覧時には多数の HTTP 通信が発生 動的生成データ A の配信サーバ ( 東京 ) 画像データ B の配信サーバ (NY) HTML <DOCTYPE HTML PUBLIC> <head> <title> </head> <body> <a href= A.. ></a> <a href= B.. ></a> 広告サーバ ( ロンドン ) HTML 配信サーバ ( シドニー ) ユーザ端末 ( ブラジル ) Web ブラウザは取得 HTML を解析し, 各種埋込オブジェクト (Obj) を個別に HTTP request で要求 ユーザ端末 HTML Obj A Obj B Web サーバ Obj A サーバ HTTP request HTTP response Obj B サーバ 半数のサイト : 7 拠点以上,15 ホスト以上から,70 オブジェクト以上を取得 10% のサイト : 15 拠点以上,40 ホスト以上から,150 オブジェクト以上を取得 4
CDN: Web オブジェクトの配信プラットフォーム 1,000 の Top サイトの 74% が CDN を利用 * CDN は,Web レスポンス時間削減のための最も一般的な技術 1 ユーザ端末はローカル DNS サーバから Akamai DNS サーバのアドレスを取得 3 ユーザ端末は回答キャッシュに HTTP request ユーザ端末 ローカル DNS サーバ 1 2Akamai DNS サーバは近いキャッシュのアドレスを回答 2 3 キャッシュサーバ 4 Akamai DNS サーバ オリジナルサーバ *J. Ott, et al., Content Delivery and the Natural Evolution of DNS, ACM IMC 2012 4 キャッシュミス時はオリジナルサーバから取得 Akamai や Limelight 等の CDN 事業者が, エッジに多数のキャッシュサーバを設置し,Web オブジェクトをキャッシュ HTTP request に対し, ユーザに近いキャッシュサーバから Web オブジェクトを配信することで, 配信遅延時間を短縮 5
エッジコンピューティング 動的オブジェクトの配信には, データセンタの代わりにエッジノードでオブジェクトを生成するエッジコンピューティング * が有効 コード実行により生成される動的オブジェクトには CDN の適用が困難 エッジコンピューティング エッジサーバに動的オブジェクト生成のためのコードをキャッシュ ユーザの配信要求時, データセンタ (NW のコア ) に代わってエッジサーバがコードを実行し, 動的オブジェクトを生成 & 配信 動的オブジェクト生成 データセンタ ユーザ端末 エッジサーバ *A. Davis, et al., EdgeComputing: Extending Enterprise Applications to the Edge of the Internet, WWW 2004 NTT 未来ねっと研究所, エッジコンピューティング, http://labolib3.aecl.ntt.co.jp/cec_jp/ 6
効果的なキャッシュ制御 CDN やエッジコンピューティングの効果を最大化するには, キャッシュが効果的なオブジェクトを優先的にキャッシュすることが有効 キャッシュやエッジサーバの CPU メモリ資源は有限 全世界の全 Web サイトのオブジェクトや生成コードをキャッシュすることは困難 Webサイトのジャンルによってオブジェクトの配置傾向が異なるのでは? キャッシュの効果はジャンルに依存 ジャンル別優先制御の可能性着眼点アジアは遅延大北米は遅延小アジアも遅延小 あるジャンル (Science など ) のコンテンツは北米に集中 そのようなジャンルのコンテンツを優先的にキャッシュ 7
Web アクティブ測定プラットフォーム NW ワイドで継続的な Web アクティブ測定により,Web オブジェクトの配置傾向を把握し, キャッシュの優先制御ポリシィを設定 Data center Router Network operator Edge servers (1) オブジェクト配置の測定 各ルータが定期的に様々な Web サイトにアクセスし, オブジェクト配置情報を取得 Router Network operator (3) キャッシュ制御ポリシィ設定 測定情報のクラスタ分析により, キャッシュが効果的なジャンルを抽出し, 優先制御ポリシィを設定 (2) 測定データの集約 8
Web 通信パタンのアクティブ測定 サイトジャンルによるオブジェクト配置傾向の差異を確認するため, 世界 12 地点から約 1,000 の主要サイトにアクセス 16 ジャンル (Alexa* の分類 ) 測定対象 Web サーバ ジャンルサイトの例測定サイト数 News Science Sports news.yahoo.com cnn.com ieee.org nature.com sports.yahoo.com msn.foxsports.com 39 95 38 * http://www.alexa.com/ 測定地点 Massachusetts Australia Wisconsin New Zealand California Japan Ireland Ecuador Germany Argentina Russia Reunion Internet HTTP (3) 測定データ分析 可視化 (2)HTTP 送信 測定 測定ホスト (1) 測定設定 測定ツール 9
平均コンテンツ距離 測定地点 A からの平均コンテンツ距離 オブジェクト配置傾向のクラスタ分析 オブジェクトの地理的な配置傾向の似たサイトをグループ化 クラスタ 1 クラスタ 3 クラスタ4 クラスタ2 測定地点 Bからの平均コンテンツ距離 ( 実際には12 次元空間でグループ化 ) 12 測定地点から閲覧時の平均コンテンツ距離の傾向に基づき, サイトをクラスタリング 北米 欧州 アジア 測定地点 欧州集中クラスタ 北米集中クラスタ 世界分散クラスタ 10
クラスタ分析の結果の例 平均サーバ距離に基づきサイトをクラスタ分析 5 クラスタが出現 北米集中クラスタ C1 世界分散クラスタ C2 北米にサーバが集中 様々な地域にサーバが存在 欧州集中クラスタ C3 南米集中クラスタ C4 アジア集中クラスタ C5 欧州にサーバが集中 南米にサーバが集中 アジアにサーバが集中 11
ジャンルによるオブジェクト配置傾向の差異 ジャンルごとに各クラスタへの分類比率を比較 News Sport 世界分散クラスタ C2 への分類比率が大 Localized group C4 C5 C1 C3 C2 C4 C3 C1 C2 情報の地域性が高い Web サイト 世界の様々な地域にサーバが存在し, 近隣から取得 Science 北米集中クラスタ C1 への分類比率が大 Universal group C4 C3 C2 C1 情報の地域性が低い Web サイト 北米にサーバが集中 ジャンル間の配置傾向の差異を確認 キャッシュ優先制御の効果が出現 12
まとめ 将来ネットワーク : トラヒックの多様性 複雑性が増大 共同研究講座の取組み データマイニングによる将来ネットワークの構造分析 制御技術 取組みの一例 Web オブジェクト配置傾向の計測プラットフォーム CDN やエッジコンピューティングにおける Web サイトのジャンル別優先制御への応用が期待 13