アウトライントラフィック抑制型アドホックネットワークの必要性研究目的超低消費電力化効果の総合評価の枠組み提案方式トラフィック抑制型アドホックネットワーキング方式自己同期型パイプラインによるデータ駆動チップマルチプロセッサ (CMP) プラットフォーム総合評価の消費電力の評価トラフィ

トラフィックを抑制するアドホックネットワーキングプラットフォームの超低消費電力化 ~ 超低消費電力化データ駆動ネットワーキングシステム ~ 01 年 11 月 0 日筑波大学西川博昭

アウトライントラフィック抑制型アドホックネットワークの必要性研究目的超低消費電力化効果の総合評価の枠組み提案方式トラフィック抑制型アドホックネットワーキング方式自己同期型パイプラインによるデータ駆動チップマルチプロセッサ (CMP) プラットフォーム総合評価の消費電力の評価トラフィック抑制型アドホックネットワーキング方式の評価プラットフォームシミュレータによる統合評価プラットフォームの評価比較対象として従来型ネットワークシステムの消費電力の評価研究成果のデモ

アドホックネットワークとは? 中継機能を実現したノードで構成される通信インフラを要しないネットワークをアドホックネットワークと呼ぶ災害時などの緊急時に有用とされている緊急時の暫定ネットワークとしてアドホックネットワークを活用する LAN LAN インターネット LAN マルチホップ型アドホックネットワーク

トラフィック抑制型アドホックネットワーキングプラットフォームの要件情報の到達率を向上させる情報転送方式を実現するアドホックネットワークではマルチホップによる放送型情報転送を行うためパケットの衝突が起きやすいパケットの衝突を抑制し情報の到達率を向上させる方式の実現が必要である通信環境を長時間維持するための超低消費電力化を実現する緊急時の電力不足時にも通信環境を維持する必要がある通信時はもとより圧倒的な割合を占める待機時の超低消費電力化の実現が必須であるパケットの衝突が起こる情報源待機時間の割合が圧倒的に多い << 通信時待機時 4

研究目的ネットワーキングシステムを超低消費電力で実現して緊急時にも通信時間を可能な限り長く維持する超低消費電力化データ駆動ネットワーキングシステム : Ultra-Low-Power Data-Driven Networking System 本質的な電力によって受動的に動作するデータ駆動原理を最大限に活用したトラフィック抑制型アドホックネットワーキング方式ならびに自己同期型パイプラインによるデータ駆動 CMP プラットフォームを統合して実現する 5

超低消費電力化効果の総合評価の枠組み従来型ネットワークシステム従来型アドホックネットワークノードの送受信パケットログプラットフォームの入出力パケットクロック同期による従来型プラットフォーム上の UDP/IP 処理 ( ネットワークプロセッサ XScale の後継と捉えられる Atom) 低消費電力化効果の評価単位時間あたりの入出力パケット数 [packet/sec.] パケットあたりの ( 通信処理時間 [sec./packet] と待機時間 [sec./packet]) 通信処理時消費電力 [W] と待機時消費電力 [W] トラフィック抑制型アドホックネットワーキング方式ノードの送受信パケットログプラットフォームの入出力パケット自己同期型パイプラインによるデータ駆動 CMP プラットフォーム (ULP-DDCMP+) 上の UDP/IP 処理 ( 二重化環状パイプライン + CMP + VS + PG) CMP: Chip Multiprocessor VS: Voltage Scaling PG: Power Gating =総消費電力 [W] (の消費電力)/( 従来型ネットワークシステムの消費電力 )= 数百分の一をめざす 6

トラフィック抑制型アドホックネットワーキング方式トラフィックを抑制しパケットの衝突を回避して情報の到達率を向上させる既存方式 :SF 再送信を行ったノード : 1 ( 全ノードが再送信した ) 提案方式 :LDCF 再送信を行ったノード : 11 4 6 5 6 5 4 6 4 1 5 5 1 7 6 情報生成ノード受信したノード 4 受信したノード ( 再送信を行った ) 受信したノード ( 冗長な再送信を中止した ) 1 SF: Simple Flooding LDCF:Load-aware Dynamic Counter-based Flooding 1 7

LDCF: Load-aware Dynamic Counter-based Flooding 提案手法想定 : 災害現場のライブ中継などのストリーム系の高負荷アプリケーションを想定しある情報源から連続的に動画フレームパケットがフラッディング送信される負荷感応型フラッディング方式 LDCF: 自ノード内負荷を見て効率的 ( 無駄な中継再送信をやめ可能な限り多くのノードに情報を届けるような ) 情報転送を行うトラフィックの抑制法パケットを受信した全てのノードは単純フラッディングのように全パケットを再送信せずに自ノードの負荷を見て再送信の抑制 / 非抑制を決定するノード負荷はレイヤ送信キュー長で判断する自ノード負荷が高い再送信を抑制する自ノード負荷が低い再送信を抑制しない一定時間内に同一の情報源が発信した同一内容のパケットの受信回数をカウントするカウント値が再送信許可閾値を下回る場合にのみ再送する事前にネットワークシミュレーションにより閾値を選出する 8

放送型情報転送のシミュレーションによる評価設定同一条件下で SF/LDCF をシミュレーション結果 1000 m 160,000 600 m パケット数 10,000 80,000 40,000 0 1/10 SF 提案 LDCF SF 提案 LDCF SF 提案 LDCF SF 提案 LDCF ( パラメータ ) 災害発生時を再現ノード総数 :100ノード初期配置 : ランダム発信ノード :ノードノードの移動速度 :0~4m/s( ランダム方向 ) 下位レイヤ :IEEE80.11g(54Mbps) Mbps 11Mbps 4Mbps 54Mbps MAC データレートシミュレーション結果 (10 回試行の平均値 ) 9

の統合評価方法トラフィック抑制型アドホックネットワーキング方式と自己同期型パイプラインによるデータ駆動 CMP プラットフォームの相乗効果からなる超低消費電力化効果を評価するトラフィック抑制型アドホックネットワーキング方式ノードの送受信パケットログプラットフォームの入出力パケット ULP-DDCMP+ 上の UDP/IP 処理 ( 二重化環状パイプライン + CMP + VS + PG) ネットワークシミュレーション結果よりプラットフォームの入出力パケットを抽出する ULP-DDCMP の回路シミュレーション結果と実測結果より ULP- DDCMP+ のパイプライン段毎のタクトと消費電力を抽出したプラットフォームシミュレータ UDP/IP 処理時電力約 0.06 mw 待機時電力約 0.019 mw ULP-DDCMP+ の自己同期型パイプラインの段単位でトークンの生成消費のシミュレーションを実施しパイプライン段単位で消費電力を積算し総消費電力を求められる総消費電力約 0.045 mw ULP-DDCMP: 二重化環状パイプラインとCMPを実現したデータ駆動 CMPの試作 VLSI 10

フロードプラットフォーム映像 codec 放送型情報転送 USBドライバ MAC 処理 UDP/IP 処理組込み用途プロセッサ Atom (Linux OS) USB コントローラ USB 接続の入出力機器オUSB WiFi NIC ULP- DDCMP バッテリ ULP DDNS プラットフォーム ULP DDCMP: 自己同期型二重化環状パイプラインによるデータ駆動 CMP 11

超低消費電力化データ駆動 CMP:ULP-DDCMP 効率的情報転送に用いられる UDP/IP 処理のデータ駆動実現総実行命令数の約 80% を占める単項演算を低消費電力で実行可能とする二重化環状パイプライン :ULP-CUE 単項演算実行時に発火制御を回避する合流分流発火制御合流分流命令フェッチ単項演算用経路メモリアクセスデコード演算 ULP-CUE: Ultra-Low-Power CUE 自己同期型パイプラインによるデータ駆動 CMP データ駆動 CMPチップ : データ駆動方式では負荷機能分散が自在にできる ULP-DDCMP (fabricated in June 011) 自己同期型パイプラインでは CMP 化が自在にできる低消費電力化のため 4 個のコアへ入力パケットを振り分け負荷分散処理を実現した ULP- CUE0 Token Router ULP- CUE ULP- CUE1 ULP- CUE 65nm CMOS 7ML 4 x bit ULP-CUE 4.mm x 4.mm Die ULP-CUE(1.V) による UDP/IP 処理時の消費電力 4.64mW > ULP-DDCMP(0.8V) による UDP/IP 処理時の消費電力 1.46mW 1

自己同期型 VLSI 実現 (ULP-STP) とその評価方法自律的かつ局所的な制御による低消費電力化 (a) トークン流量に応じた電力供給実行時電圧制御 (VS) (b) 待機時のリーク電流の遮断細粒度パワーゲーティング (PG) 特長 1: トークンの処理中であっても VS が可能特長 : トークンを処理していないパイプライン段を PG 可能 PG の粒度 ( パイプライン段数 ) をリーク量 ( 製造プロセス ) に応じて設定可能 ULP-STP (009) 評価方法 ULP-DDCMP (011) 65nm 試作チップの実測消費電流モニタによる VDD 制御回路 PS ISO の最適化を施した回路の SPICE シミュレーションパイプライン段数最適化後の低消費電力効果の半定量化 ( 含電力性能オーバヘッドリーク電力量 ) 1

プラットフォームによる実測 Atom ボード Atom E660 LCD ( 取り外し ) オフロード I/F とロギング機構 ( 背面側 ) MAC/PHY ( 背面側 ) ULP-DDCMP オフロード I/F ボード ( 背面側 ) & ULP-DDCMP ボード PID 制御による VS LCD: Liquid Crystal Display ULP-DDCMP と Atom の消費電力の実測方法 ULP-DDCMP Atom ボードおよびオフロード IF ボードを対象に電源電圧電流ならびに入出力データの変化を同時に記録するロギング機構を FPGA を用いて実現した電源電圧 [V] および電流 [A] をデジタル化 ( ) した値および入出力データの総量 [token] を周期的 ( ) にサンプリングしタイムスタンプとともに記録する設計時点で入手可能であった 1bit-1.5MHz のアナログデジタル変換器を用いた UDP/IP 処理時とスタンバイ時の消費電力の実時間観測を可能とした 14

プラットフォームシミュレータに設定するパイプライン段毎のタクトと消費電力パイプライン段毎のタクト論理ゲートレベル回路シミュレーションより求めた各タクトを設定する ( ULP-DDCMP における周回時間の実測値と論理ゲートレベル回路シミュレーションより求めた周回時間がほぼ一致した ) パイプライン段毎の消費電力 ULP-DDCMP の消費電力を SPICE より求めたパイプライン段毎の消費電力の比率を用いて比例配分してパイプライン段毎の消費電力を設定する BB MB B ULP-CUE0 ULP-CUE1 ULP-CUE ULP-CUE プラットフォーム (ULP-DDCMP+) MA MM M FP PS FP ID FP コア (ULP-CUE) パイプライン段 (ULP-STP) 15

プラットフォームシミュレータに設定するパイプライン段毎のタクトと消費電力 PG 回路を最適化した ULP-DDCMP+ の性能特性消費電力特性をプラットフォ - ムシミュレータのパラメタ群として設定したパイプライン段毎のタクト [sec.]: 標準電圧 1.V の場合を基準として VDD を 0.8V~1.V に変えた場合の ULP-DDCMP の周回時間の変化率を実測しこれを 1.V 時の send 時間 ack 時間に乗算したパイプライン段毎の消費電力 [W]: VDD を 0.8V~1.V に変えた場合の ULP-DDCMP のスイッチング電力とリーク電力 (PS on 時 ) の実測値を SPICE より求めたパイプライン段毎の電力比により比例配分した PG 回路のオーバヘッドパイプライン段毎のタクトパイプライン段毎の消費電力 send 時間ack 時間 PS スイッチ時の電力量 PS-on 時の突入電流による電力量 PS-off 時のリーク電力 PS のオン抵抗による VVSS 上昇率は平均 1% であったため電力当りの性能の観点から速度オーバヘッドは無視できると仮定した最適化した PS セルのゲート幅および個数に基づいて PS のスイッチング時における PS と PS 駆動用バッファの消費電力量を加算したスリープ時間に応じて突入電流が発生する突入電流の最大値を SPICE により求めて電力量を加算した ULP-DDCMP 内で PG を実現したパイプライン段を対象にリーク電力削減率 =(PS off 時のリーク電力 )/(PS on 時のリーク電力 ) を実測しパイプライン段毎のリーク電力 (PS on 時 ) に乗じた 16

プラットフォームシミュレータによる消費電力の評価ネットワークシミュレーションより抽出したプラットフォームの入出力パケット BB MB 各パイプライン段の消費電力 [W] 各パイプライン段のタクト [sec.] 実測回路シミュレーションより抽出するパラメタ B 入力 MA MM M FP コア (ULP-CUE) パイプライン段 (ULP-STP) PS FP ID FP ULP-CUE0 ULP-CUE1 ULP-CUE ULP-CUE プラットフォーム (ULP-DDCMP+) ULP CUE ULP CUE ULP CUE1 ULP CUE0 消費電力 [μw] 80000 60000 40000 0000 0 (a) パイプライン段コアへの積み上げイメージ 0 0 40 60 80 100 10 140 時刻 [nsec.] (b) コアプラットフォームへの積み上げイメージ 5000 BB: Branch 0000 MA:Memory Access 5000 0000 FP: Function Processor 15000 B:Branch 10000 PS:Program Storage 5000 MM: Matching Memory 0 MB: Merge 0 0 40 60 80 100 10 140 時刻 [nsec.] 消費電力 [μw] 各パイプライン段の消費電力とトークンの滞在時間を積み上げてプラットフォームの消費電力を算出する 17

従来型ネットワークシステムの消費電力の評価従来型アドホックネットワークノードの送受信パケットログプラットフォームの入出力パケットクロック同期による従来型プラットフォーム上の UDP/IP 処理 ( ネットワークプロセッサ XScale の後継と捉えられる Atom) 従来型アドホックネットワークのネットワークシミュレーション結果より 1 秒間あたりの入出力パケット数を抽出する送信 : 約 56. 個受信 : 約 555.6 個 AtomにおけるUDP/IP 処理時間に ULP-DDCMPにおける送信処理時間と受信処理時間の比を乗算してパケットあたりの送受信処理時間を求める送信 : 約.μsec. 受信 : 約.8μsec. Atomの実測結果より UDP/IP 処理に要する電力 ( 約 1084 mw) とスタンバイ時電力 ( 約 1.91 mw) を求める UDP/IP 処理時間 = 入出力パケット数パケットあたりの送受信処理時間 =56..+ 555.6.8=7.6msec. 待機時間 = 1sec. UDP/IP 処理時間 =99.64msec. 比例配分 UDP/IP 処理時電力約 7.99mW 待機時電力約 1.89mW 総消費電力約 9.88 mw 18

従来型プラットフォームの処理時間と消費電力 Atom ボードのロギング結果 UDP/IP 処理時間 = パケットあたり約 0.4μsec. (104Byte) パケットあたり約 5.06μsec. (56Byte) 処理時間パケット長と想定 UDP/IP 処理時電力 (UDP/IP 処理自体に要する電力として推定する ) 1OS 起動後 UDP/IP 処理を実行した場合の Atom ボードの消費電力 : 約 11490 mw OS 起動後の Atom ボードの消費電力 : 約 10406 mw 1 からを減算して Atom 以外のインタフェイス回路などの周辺回路のリーク電力および UDP/IP 処理の実行に不可欠な OS による消費電力を取り除き Atom の通信処理時電力を推定した 1-= 約 1084 mw スタンバイ時電力通信処理時電力約 1084 mw 0.016( 1) 0.11( )= 約 1.91 mw 1:G. Gerosa, et al., 008 ISSCC より (90 時のピーク電力に対する待機時電力の比率 ) :90 時に対する 5 時のリーク電力の比率 19

超低消費電力化の総合評価結果削減目標に向けた現時点までの評価 UDP/IP 処理時の電力で 1/00 程度に削減される (vs. 従来型プラットフォームにおける UDP/IP 処理時 ) 待機時には 1/100 程度に削減できる (vs. 従来型プラットフォームにおける待機時 ) 総消費電力として 1/00 程度の削減効果が見込める評価結果を得た研究開始当初に想定したネットワークプロセッサ XScale を基準とすれば当初目標とした数百分の一程度の超低消費電力化が達成されたと考えている待機時電力 [mw] UDP/IP 処理時電力 [mw] 総消費電力 [mw] SF + Atom LDCF + ULP-DCMP+ 1.89 0.0188 (1/101) 7.99 0.06 (1/05) 9.88 0.0450 (1/0) 0