目的 システムLSIの電力性能比 ( 性能 / 電力 ) 向上 背景 : 通勤電車のひとコマ 一昔前 今は 社会全体が要求する情報処理能力の飛躍的増大 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 2

Similar documents
スライド 1

Microsoft PowerPoint - invited-namiki.ppt [互換モード]

インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美

富士通セミコンダクタープレスリリース 2009/05/19

Microsoft PowerPoint - 11Web.pptx

Microsoft PowerPoint - 集積回路工学(5)_ pptm

6. パイプライン制御

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx

スライド 1

アウトライン トラフィック抑制型アドホックネットワークの必要性 研究目的 超低消費電力化効果の総合評価の枠組み 提案方式 トラフィック抑制型アドホックネットワーキング方式 自己同期型パイプラインによるデータ駆動チップマルチプロセッサ (CMP) プラットフォーム 総合評価 の消費電力の評価 トラフィ

-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR

Microsoft PowerPoint pptx

NJU72501 チャージポンプ内蔵 圧電用スイッチングドライバ 概要 NJU72501はチャージポンプ回路を内蔵し 最大で3V 入力から 18Vppで圧電サウンダを駆動することができます このチャージポンプ回路には1 倍 2 倍 3 倍昇圧切り替え機能を備えており 圧電サウンダの音量を変更すること

本文ALL.indd

モータ HILS の概要 1 はじめに モータ HILS の需要 自動車の電子化及び 電気自動車やハイブリッド車の実用化に伴い モータの使用数が増大しています 従来行われていた駆動用モータ単体のシミュレーション レシプロエンジンとモータの駆動力分配制御シミュレーションの利用に加え パワーウインドやサ

CacheBusのご紹介

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の

DRAM SRAM SDRAM (Synchronous DRAM) DDR SDRAM (Double Data Rate SDRAM) DRAM 4 C Wikipedia 1.8 SRAM DRAM DRAM SRAM DRAM SRAM (256M 1G bit) (32 64M bit)

TULを用いたVisual ScalerとTDCの開発

Microsoft PowerPoint - acr_rod_ b.ppt [互換モード]

PowerPoint プレゼンテーション

電力線重畳型機器認証技術

Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 0 Copyright 2017 FUJITSU AD

卒業研究報告

Arduino をドリトルから 制御する教材の試行 鈴木裕貴 1

Microsoft PowerPoint - ICD2011TakadaSlides.pptx

特集新世代マイクロプロセッサアーキテクチャ ( 後編 ) 3. 実例 3 ユビキタス コンピューティング時代の組み込みマイクロコンピュータ, SuperH と M32R 清水徹 * 1 長谷川淳 * 2 服部俊洋 * 3 近藤弘郁 * 4 ( 株 ) ルネサステクノロジシステムソリューション統括本部

1 薄膜 BOX-SOI (SOTB) を用いた 2M ビット SRAM の超低電圧 0.37V 動作を実証 大規模集積化に成功 超低電圧 超低電力 LSI 実現に目処 独立行政法人新エネルギー 産業技術総合開発機構 ( 理事長古川一夫 / 以下 NEDOと略記 ) 超低電圧デバイス技術研究組合(

Microsoft PowerPoint - 6.memory.ppt

elm73xxxxxxa_jp.indd

A Responsive Processor for Parallel/Distributed Real-time Processing

ターゲット項目の設定について

Microsoft PowerPoint - 4.CMOSLogic.ppt

PowerPoint プレゼンテーション

SCIMA アーキテクチャと性能評価 - SCIMA アーキテクチャの概要 - 中村宏東京大学先端科学技術研究センター

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

富士通セミコンダクター株式会社発表資料

等価回路図 絶対最大定格 (T a = 25ºC) 項目記号定格単位 入力電圧 1 V IN 15 V 入力電圧 2 V STB GND-0.3~V IN+0.3 V 出力電圧 V GND-0.3~V IN+0.3 V 出力電流 I 120 ma 許容損失 P D 200 mw 動作温度範囲 T o

スライド 1

CMOS リニアイメージセンサ用駆動回路 C10808 シリーズ 蓄積時間の可変機能付き 高精度駆動回路 C10808 シリーズは 電流出力タイプ CMOS リニアイメージセンサ S10111~S10114 シリーズ S10121~S10124 シリーズ (-01) 用に設計された駆動回路です セン

160311_icm2015-muramatsu-v2.pptx

MCU MOS-FET [2] [3] CPU [4] MCU CPU 2.2 [5] OS 3. 1 CPU CPU CPU CPU CPU 1 Fig. 1 system structure 2 Fig. 2 Entire sequence 2

スライド 1

NJM78L00S 3 端子正定電圧電源 概要 NJM78L00S は Io=100mA の 3 端子正定電圧電源です 既存の NJM78L00 と比較し 出力電圧精度の向上 動作温度範囲の拡大 セラミックコンデンサ対応および 3.3V の出力電圧もラインアップしました 外形図 特長 出力電流 10

計算機アーキテクチャ

平成19年度・地球工学研究所の知的財産に関する報告会 - 資料集

SimscapeプラントモデルのFPGAアクセラレーション

完成版_セミナー発表資料110928

Slide 1

首都大学東京 新技術説明会 日時 : 平成 27 年 9 月 25 日 ( 金 ) 場所 :JST 東京別館ホール ノイズ耐性フリップフロップの開発と 信頼性要求電子機器への応用可能性 首都大学東京システムデザイン研究科情報通信システム学域 教授 三浦幸也

代センサーネットワーク モバイル情報機器 サーバー等から研究開発実施者が想定するアプリケーションにおいて 劇的な低消費電力化を志向する新しいメモリアーキテクチャ 基本ソフトウェア アルゴリズムのデザインを提示するとともに 必要に応じて間歇動作等に求められる次世代不揮発性素子の性能を提示し システムと

Microsoft PowerPoint - ICD2011UenoSlides.pptx

フロントエンド IC 付光センサ S CR S CR 各種光量の検出に適した小型 APD Si APD とプリアンプを一体化した小型光デバイスです 外乱光の影響を低減するための DC フィードバック回路を内蔵していま す また 優れたノイズ特性 周波数特性を実現しています

Microsoft PowerPoint - 3.3タイミング制御.pptx

スライド 1

SICE東北支部研究集会資料(2009年)

AN15880A

Microsoft PowerPoint - 9.Analog.ppt

出力電圧ランク 品名 出力電圧 品名 出力電圧 品名 出力電圧 NJU774*F15 1.5V NJU774*F28 2.8V NJU774*F4 4.V NJU774*F18 1.8V NJU774*F29 2.9V NJU774*F45 4.5V NJU774*F19 1.9V NJU774*F

NJM78L00 3 端子正定電圧電源 概要高利得誤差増幅器, 温度補償回路, 定電圧ダイオードなどにより構成され, さらに内部に電流制限回路, 熱暴走に対する保護回路を有する, 高性能安定化電源用素子で, ツェナーダイオード / 抵抗の組合せ回路に比べ出力インピーダンスが改良され, 無効電流が小さ

「電子政府推奨暗号の実装」評価報告書

IPSJ SIG Technical Report Vol.2015-ARC-215 No.7 Vol.2015-OS-133 No /5/26 Just-In-Time PG 1,a) 1, Just-In-Time VM Geyser Dalvik VM Caffei

PIC の書き込み解説 PICライターを使うときに間違った使い方を見受ける 書き込み失敗の原因は知識不足にある やってはいけないことをしている 単に失敗だけならまだしも部品を壊してしまう 正しい知識を身に着けよう 書き込みに必要なピンと意味 ICSPを意識した回路設計の必要性 ICSP:In Cir

arduino プログラミング課題集 ( Ver /06/01 ) arduino と各種ボードを組み合わせ 制御するためのプログラミングを学 ぼう! 1 入出力ポートの設定と利用方法 (1) 制御( コントロール ) する とは 外部装置( ペリフェラル ) が必要とする信号をマイ

Microsoft Word - AK8133_MS0930_J_05.doc

新技術説明会 様式例

スライド 1

2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹

Microsoft PowerPoint - ARCICD07FukumotoSlides.pptx

Microsoft Word - TestReport_PRIMEPOWER250_ doc

Jan/25/2019 errata_c17m11_10 S1C17 マニュアル正誤表 項目 リセット保持時間 対象マニュアル発行 No. 項目ページ S1C17M10 テクニカルマニュアル システムリセットコントローラ (SRC) 特性 19-3 S1C17M20/M

観測波形 赤いエリアに波形が入り込まなければ規格を満足しています.5mではより厳しいTP2の規格でも満足しています.5mケーブル使用時 TP2規格 TP3規格 -.1-5mケーブル使用時 2

工学院大学建築系学科近藤研究室2000年度卒業論文梗概

hpc141_shirahata.pdf

2ALU 以下はデータ幅 4ビットの ALU の例 加算, 減算,AND,OR の4つの演算を実行する 実際のプロセッサの ALU は, もっと多種類の演算が可能 リスト 7-2 ALU の VHDL 記述 M use IEEE.STD_LOGIC_1164.ALL; 00 : 加算 use IEE

Microsoft PowerPoint - sales2.ppt

26 FPGA FPGA (Field Programmable Gate Array) ASIC (Application Specific Integrated Circuit) FPGA FPGA FPGA FPGA Linux FreeDOS skewed way L1

Fujitsu Standard Tool

NJW V 単相 DC ブラシレスモータドライバ 概要 NJW4320 は 24Vファンモータ用の単相 DCブラシレスモータドライバICです PWMソフトスイッチング方式を採用し 高効率でモータ駆動時の静音化が実現できます ロック保護回路 過電流検出回路 サーマルシャットダウン (TSD

名称 型名 SiC ゲートドライバー SDM1810 仕様書 適用 本仕様書は SiC-MOSFET 一体取付形 2 回路ゲートドライバー SDM1810 について適用いたします 2. 概要本ドライバーは ROHM 社製 2ch 入り 180A/1200V クラス SiC-MOSFET

スライド 1

( 作成方法 ) 1 メーカーの取扱説明書に記載されている 2 PC 購入店で作成してもらう (PC デポで6000 円 ) 3 リカバリー作成ソフトがインストールされている ⑵ PC 丸ごと ( システムイメージ ) のバックアップ バックアップ方法 注 4 USB 接続の外付け HDD を使用

< B8CDD8AB B83685D>

Microsoft PowerPoint - ARCEMB08HayashiSlides.ppt [互換モード]

2STB240PP(AM-2S-G-005)_02

Monthly Research / セキュアハードウェアの登場とその分析

Microsoft Word - TC4013BP_BF_J_P9_060601_.doc

Microsoft PowerPoint - NxLec ppt

スライド 1

M SRAM 1 25 ns ,000 DRAM ns ms 5,000,

Microsoft PowerPoint - 隅谷様(パナソニック).ppt [互換モード]

ソフトウェア基礎技術研修

PowerPoint プレゼンテーション

目次 1 I2Cとは 13 結線写真 2 センサの多くがI2Cに対応 14 WHO_AM_I 3 マイコンでのI2C通信例 15 I2C読込みプログラム 4 とは 16 I2C読込みスクリプト概要① 5 タイミングパラメータ 17 I2C読込みスクリプト概要② 6 書込み 18 センサ読込みプログラ

e - カーボンブラック Pt 触媒 プロトン導電膜 H 2 厚さ = 数 10μm H + O 2 H 2 O 拡散層 触媒層 高分子 電解質 触媒層 拡散層 マイクロポーラス層 マイクロポーラス層 ガス拡散電極バイポーラープレート ガス拡散電極バイポーラープレート 1 1~ 50nm 0.1~1

ルート プロセッサ

降圧コンバータIC のスナバ回路 : パワーマネジメント

研修コーナー

フォト IC ダイオード S SB S CT 視感度に近い分光感度特性 視感度特性に近い分光感度特性をもったフォトICダイオードです チップ上には2つの受光部があり 1つは信号検出用受光部 もう1つは近赤外域にのみ感度をもつ補正用受光部になっています 電流アンプ回路中で2

パーキンソン病治療ガイドライン2002

Transcription:

回路 ~ アーキテクチャ ~ システムソフトウェア協調で実現する低消費電力化技術 プロジェクト名 : 革新的電源制御による次世代超低電力高性能システム LSI の研究 中村宏 ( 東京大学 ) 宇佐美公良 ( 芝浦工業大学 ) 天野英晴 ( 慶應義塾大学 ) 近藤正章 ( 電気通信大学 ) 並木美太郎 ( 東京農工大学 ) 黒田忠広 ( 慶應義塾大学 )

目的 システムLSIの電力性能比 ( 性能 / 電力 ) 向上 背景 : 通勤電車のひとコマ 一昔前 今は 社会全体が要求する情報処理能力の飛躍的増大 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 2

LSI の性能と消費電力の関係 トランジスタのスイッチング速度と消費電力 遅延 : t delay CVDD ( V Vth ) DD α ~ 1.5 (mobility degradation parameter) ダイナミック電力 P dyn = C V DD 2 f β 動作に伴う電力 : 高速動作 消費電力大 リーク電力 : 常に消費する電力 システム全体の性能と消費電力の関係 α リーク電力 消費電力 性能 : ボトルネックの性能 電力 : 全体の総和目標不要 不急の動作部を的確に電源制御 ( 停止 低速 ) 性能不変 電力低減電力性能比の向上 性能 1 つのトランジスタあたり CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 3

研究方針 研究方針 : 回路実装 アーキテクチャ システムソフトウェアの階層を越えた協調による革新的電源制御 従来の低電力化技術 : 設計階層の観点から 回路技術 : 電力と性能を調整する 調整弁 の実現 Clock Gating, DVFS, Dual Vth, Power Gating,.. アーキテクチャ OS: 忙しくない動作がいつ (When) どこに (Where) あるかを見つけ 調整弁 の制御 従来 OS アーキテクチャ 回路技術 デバイス技術 When? Where? How? 電力 性能調整弁 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 4

望ましい調整弁とは 電力 性能調整弁 電力削減効果が大 時間的 空間的に細粒度制御が可能 Processor int fp cache Reconfig System Cache busy 細粒度 電源制御の適用範囲拡大 Processor int fp cache Memory Network 面積 性能 電力面でのオーバヘッド小 System LSI 調整弁の制御自体が時間と電力を要す idle CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 5

望ましい調整弁とは 車のアイドリングストップでは 電力削減効果が大 時間的 空間的に細粒度制御が可能 細粒度 電源制御の適用範囲拡大 面積 性能 電力面でのオーバヘッド小 調整弁の制御自体が時間と電力を要す エンジン切で燃料消費ゼロ エンジン切ってもすぐにスタートできる 車の大きさ 速さ 値段変わらない CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 6

しかし リーク電力の削減 回路技術 Power Gating ( 電源遮断 ) スリープトランジスタを対象回路と GNDの間に挿入 動的基板バイアス技術 sleep signal 基板電位を変更し 動作時は Low Vth, 待機時は High Vth 時間オーバヘッド大 : 時間的粗粒度 空間領域も細分化難 : 空間的粗粒度 Circuit Block GND アーキテクチャからは扱いづらい技術 電力 性能調整弁 sleep Tr. VGND 集積度向上 周波数向上 忙しくない動作の分布 : 時間的 空間的にも細粒度に Vdd leakage current 粒度の乖離 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 7

設計階層と低電力化技術 回路技術 ~ アーキテクチャ ~OS レベルの協調へ 調整弁の協調設計と制御 : 粒度の最適化 提案 OS アーキテクチャ回路技術デバイス技術 When? Where? How? 電力 性能調整弁 制御粒度の最適化が重要 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 8

研究成果 回路実装 アーキテクチャ システムソフトウェアの 階層を越えた協調による革新的電源制御 Power Gating 技術によるリーク電力削減技術の確立 MIPS 互換プロセッサ Geyser-1/2, Geyser-CUBE の試作 実機評価 コンパイラ OS 協調型 Power Gating 制御 Linux の安定動作 電力効率アクセラレータ (Cool Mega Array) CMA-1/2, CMA-CUBE の試作 実機評価 Geyser+CMA CUBE 統合システムへ 3 次元ワイヤレス結合 ( 黒田グループの成果適用 ) CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 9

回路技術 : パワーゲーティング 回路と Ground の間に power switch を挿入 回路が非動作時に power switch off リーク電力削減 考慮すべき点 :power on/off に要する電力オーバヘッド BET(break even time) : 電力オーバヘッドを相殺する sleep 時間 回路技術が実現する時間粒度 Power sleep 時間の BET power switch ACTIVE スリープ開始 SLEEP WAK EUP ウェイクアップ ACTIVE Time CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 10

Geyser: power gating の適用 MIPS R3000 ベースプロセッサ Fine Grain Run Time Power Gating を適用 実装 ID ステージで スリープ制御信号を生成する EX ステージで演算に使うユニットを判断 必要なユニットだけにイネーブル信号を送る IF ID EX MEM WB 命令 命令から使うユニットを特定 シフトユニットを起動 イネーブル信号を送る 一般演算ユニット シフトユニット 乗算ユニット 演算を実行 除算ユニット CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 11

設計 試作した CPU コア Geyser-1 世界初 : サイクル毎の細粒度 Power Gating e-shuttle 65nm Vdd=1.2V, Freq=60MHz キャッシュ TLB 非搭載 30% 電力削減 @80 2.1 mm ASSCC 09 4.2 mm Shifter MULT DIV ALU リークモニタ CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 12

Geyser-2 Geyser-2: 2nd プロトタイプ TLB キャッシュ搭載 OS の稼働と周波数向上を狙う 210MHz で動作 wakeup latency < 5ns を実現 Geyser-2 TLB MMU 105MHz FPGA IO,etc 210MHz R3000 Core Inst. Cache (8KB, 2Way) Data Cache (8KB, 2Way) SDRAM Board CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 13

Geyser-CUBE Linux が動作 統合システム ( 市川グループ ) へ 電力削減効果 : 1/10 へ パワーゲーティング回路の改良 : 展示 デモ中 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 14

BET( 損益分岐点 ) の値 Power sleep 時間の BET Cycles @200MHz 74 26 114 38 90 nm technology simulation 25 65 100 125 74 44 22 12 16 10 14 8 10 8 6 2 ACTIVE スリープ開始 92 SLEEP 28 WA ACTIVE KEU P Time ウェイクアップ 12 8 ALU Shift Mult Div CP0 BET: 回路技術が実現する 調整弁 の時間粒度 温度上昇に伴い BET は短くなる リーク電流 : 温度上昇で増大 電力 性能調整弁 環境に大きく依存する BET に合わせた PG 戦略が重要 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 15

PG 戦略 : 車に喩えると アイドリングストップ : 気楽にするのは すぐにエンジンかかる ( 数秒 ): たかだか車 1 台分 パワーゲーティング :10~100 サイクル 再開時のペナルティ :10~100 命令実行できる 気楽にはパワーゲーティングできない 成否は周囲の状況による 交差点で赤になった直後 渋滞時 : いつ動くかわからない 渋滞時 :10 (100) 台前の動きが見える 周囲の状況を把握できるのは運転手 エンジンではない 周囲の状況を把握できるのは OS/ アーキ 回路技術ではない CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 16

回路技術 ~ コンパイラ ~OS 協調による Power Gating BET( 損益分岐点 ) < sleep 時間を実現する戦略 PG 戦略 演算器の使用頻度が低い場合 利用後は常に power off 演算器の使用頻度の高い場合 コンパイラは BET が小さいと想定してコード生成 電力 性能調整弁 BET が小さい ( 温度高 = リーク大 ) 時 コンパイラによる power on/off 指示を OS が有効にする BET が大きい ( 温度低 = リーク小 ) 時 コンパイラ指示を OS が無効化 cache miss 時のみ power off リークモニタ出力より OS が BET 判断 &PG 戦略選択 回路技術 コンパイラ OS の協調 Power Gating CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 17

デモ中 : 演算ユニットの実行時スリープ状況 BEP を下回るスリープ消費電力増大 BAD! ソフトウェアレベル (OS, コンパイラ ) から抑制 スリープ量 ( スリープサイクル 回数 ) BEP を上回るスリープ消費電力減少 GOOD! 短 古 スリープサイクル BET: Break Even Time エネルギー的な損益分岐点.BEP を上回る場合のみスリープするのが理想. 長 新 時間

研究成果 ( 再掲 ) 回路実装 アーキテクチャ システムソフトウェアの 階層を越えた協調による革新的電源制御 Power Gating 技術によるリーク電力削減技術の確立 MIPS 互換プロセッサ Geyser-1/2, Geyser-CUBE の試作 実機評価 コンパイラ OS 協調型 Power Gating 制御 Linux の安定動作 電力効率アクセラレータ (Cool Mega Array) CMA-1/2, CMA-CUBE の試作 実機評価 Geyser+CMA CUBE 統合システムへ 3 次元ワイヤレス結合 ( 黒田グループの成果適用 ) CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 19

CMA の設計方針 大規模なデータパス : 性能アクセラレータ ではなく 電力効率アクセラレータ として検討 データレジデント : 処理を時空間で閉じ込め : 粒度最適化 動作すべき真に必要なトランジスタを 必要時に必要部だけ動作 大規模データパスで メモリ ( レジスタ ) アクセス数 / 演算処理数を減らす メモリアクセスに要するエネルギー削減 組合せ回路 : レジスタ部と分離し低電圧動作 データ供給能力に見合った低電圧 & 低消費電力動作を可能に メモリアクセスと演算処理のスループットを合わせ 演算処理は必要時に必要な速度で 演算処理部のエネルギー効率 DVS 組合せ回路 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 20 DME DMEM M PE SE 8 8 PE DME DME DME DMEM DMEM DMEM M M M レジスタ部 CMA-1

CMA-1 のチップ写真 レベルシフタ μ コントローラ PE アレイ クロックツリー領域パワーゲーティングテスト回路 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 21

CMA-1, -2 の電力効率 ~ 実測 ~ 100MOPS/mW クラスの電力効率 従来に比して 2 桁の改善最大 :230MOPS / mw (24bit sepia filter) MOPS/mW データ供給部 (μコントローラ) の改良により PEアレイの V (PEアレイ部電圧) 最適な電圧点が存在 データ供給と演算処理がバランスしやすい CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 22

研究成果 ( 再掲 ) 回路実装 アーキテクチャ システムソフトウェアの 階層を越えた協調による革新的電源制御 Power Gating 技術によるリーク電力削減技術の確立 MIPS 互換プロセッサ Geyser-1/2, Geyser-CUBE の試作 実機評価 コンパイラ OS 協調型 Power Gating 制御 Linux の安定動作 電力効率アクセラレータ (Cool Mega Array) CMA-1/2, CMA-CUBE の試作 実機評価 Geyser+CMA CUBE 統合システムへ 3 次元ワイヤレス結合 ( 黒田グループの成果適用 ) CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 23

領域内統合システムへ 3 次元ワイヤレス接続 ( 黒田グループの成果 ) で Geyser と CMA を結合 ワイヤレスルータ +Geyser ワイヤレスルータ +CMA TX TX point-to-point 接続 + バブルフロー制御 (virtual channel なしにデッドロックフリーを実現 ) TX TX TX TX TX TX CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 24

Geyser-CUBE チップ Geyser & ワイヤレス結合部 ワイヤレス結合部 Geyser プロセッサ CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 25

Geyser/CMA-CUBE チップ CMA Geyser & ワイヤレス結合部 & CMA & ワイヤレス結合部 CMACUBE CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 26

Geyser/CMA-CUBE 実装 実装断面図 Packet Error Rate (PER) 10-4 10-5 10-6 10-7 10-8 36bit Burst Packet @ 50MHz System Clock パケット転送エラー率 Continuous >1 Hour Error Free Operation @ Nominal Supply Voltage 実装拡大写真 ( 展示中 ) 10-9 0.8 0.9 1 1.1 1.2 1.3 1.4 Supply Voltage [V] 供給電圧 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 27

まとめ Geyser: MIPS 互換プロセッサ 消費電力 1/10 に低減 回路技術 ~ コンパイラ ~OS の協調 Power Gating の有効性 制御粒度 の観点から協調 適用範囲拡大 : 汎用 OS Linux 上での実証成功 CMA: 電力効率アクセラレータ 電力性能比を 1/100 程度に向上 Geyser+CMA CUBE 統合システム 3 次元ワイヤレス接続による統合システム ブースでデモ中 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 28