FeRAM
|
|
|
- れいな えいさか
- 7 years ago
- Views:
Transcription
1 2012 年 1 月 20 日 株式会社東芝セミコンダクター & ストレージ社半導体研究開発センターデジタルメディア SoC 技術開発部林宏雄 1
2 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 2
3 デジタル分野の発表 高性能デジタル (High Performance Digital) 高電力効率デジタル (Energy Efficient Digital) スマートフォン 携帯 サーバー PC デジタル家電 認識応用 汎用 応用特化 プロセッサとその要素技術 数 W~100W 超 mw FE からなかなか論文が出てこない Video CODEC 画像処理 認識 3
4 Transistor Count (Millions) Transistor Counts vs. Year CHIP COMPLEXITY Itanium 2 コア record 3.1 billion Poulson 8 コア L3 32MB Nehalem-EX 8コア L3 24MB Itanium2 4 コア Xeon 2 コア Xeon 6 コア L3 16MB, L2 9MB SPARC Rock Cell SH 8コア L2 512KB SPU RAM 256KBx8 Intel 48 IA コア IBM z196 Godson-3B AMD Bobcat 2コア L2 512KBx2 Cell Nehalem 4コア GPU, DDRC L3 8MB nm 350nm 250nm 180nm 130nm 90nm 65nm 45nm 32nm 22nm Year 18 ヶ月で 2 倍のペース Moore の法則が続いている ISSCC 2011 Intel Poulson 最大の3.1 billion Tr. Intel Sandy Bridge, AMD Bobcat: DDRCに加え GPUを統合 ISSCC 2012: Intelが22 nm FinFETを用いたIvy Bridgeを発表予定 のデータを元に作成 4
5 年 [Intel Pollack, Micro32] 5
6 Power Consumption (W) 消費電力の推移 ( 250 TOTAL POWER CONSUMPTION SPARC Rock 2.3GHz Alpha21364 Power4 Itanium Power5 Xeon 3GHz Power6 5GHz Itanium2 2.4GHz Nehalem-EX Pentium4 4GHz Itanium PowerPC 3GHz Opteron 2.6GHz Xeon Power7 SCC WireSpeed Poulson 3.1GHz Rainbow Fall 50 0 P.A. Semi. 2GHz SH 4 コア SH 8 コア Westmere Godson-3B Renesas Hetero Multi Sandy Bridge Year 平均は 100W くらいでほぼ横ばい 近年は下がる傾向 のデータを元に作成 6
7 動作周波数の推移 ( Pentium4 4GHz PowerPC Cell 4.4GHz Power6 5GHz Xeon 3.6GHz Opteron 2.6GHz Cell 4GHz Xeon 2.66GHz IBM z GHz Rainbow Fall SPARC Power5 UltraSPARC III SH 4 コア 600MHz Intel SCC Renesas Hetero Multi. SH 8コア 600Mhz 500nm 350nm 250nm 180nm 130nm 90nm 65nm 45nm 32nm 周波数も 2004 年以降頭打ち むしろ下がる傾向 ISSCC 2012 Press Release のデータを元に作成 7
8 ISSCC で発表されたチップのプロセッサコア数 2004 年からマルチコアの発表が増えた 2007 年以降は全てマルチコア のデータを元に作成 8
9 ここまでのまとめ 電力密度 消費電力によりクロック周波数の向上はストップ 一方 Mooreの法則は継続 トランジスタを何に使うか? プロセッサの1 chip 化 (MMU, FPU, L1 cache) 機能の強化 ( 演算器の増加 強化 高性能分岐予測, SIMD 命令 etc.) 並列実行 (super-scalar, OoO, multi-thread) キャッシュメモリの容量増大 (L2, L3 ) multi-core, many-core システム機能の統合 Memory Controller, GPU,, SoC 9
10 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 10
11 IBM z196 [ISSCC ] [4.1] A 5.2GHz Microprocessor Chip for the IBM zenterprise System, IBM 45nm SOI, 1.4B Tr, 512mm 2 5.2GHz 4 cores 1.5MB L2/core 30MB shared L3 (edram) 11
12 Intel Westmere-EX Xeon [ISSCC ] [4.3] A 32nm Westmere-EX Xeon Enterprise Processor, Intel 10 Westmere core 2 DDR2C x2 QPI x4 Ring based on-die interconnect 32B wide, x2 (bi-directional) 12
13 Intel Poulson [ISSCC ] [4.8] A 32nm 3.1 Billion Transistor 12-Wide-Issue Itanium, Intel 32nm bulk CMOS, 8layer 3.1B Tr, 544mm 2 8 HT 64bit cores 32MB Last Level $ total 50MB SRAM on die On die Ring interconnect TDP 170W 13
14 Intel Sandy Bridge [ISSCC ] [15.1] A Fully Integrated Multi-CPU, GPU and Memory Controller 32nm Processor, Intel HK/MG 32nm process 1.16B tr, 216mm 2 Highly Integrated SoC x86 プロセッサ x2 or x4 2.2GHz 3.4GHz GPU (12 or 6 EU) DDR ch PCI Express gen2 I/F 20lane 3/4/8MB L3, Ring Bus TDP 95W for DT 17W (2core), 45W (4core) for mobile 14
15 AMD Zacate [ISSCC ] [15.4] A Low-Power Integrated x86-64 and Graphics Processor for Mobile Computing Devices, AMD 32nm, 450Mtr, 10 metal layers, 75mm 2 Highly Integrated SoC x86 プロセッサ (Bobcat コア ) x2 1.6GHz L2 512KB/core Radeon HD5000 シリーズ GPU マルチメディアエンジン DDR PCI Express Gen2 I/F 4lane x2 TDP 18W 15
16 Intel Sandy Bridge vs. AMD Zacate Intel Sandy Bridge AMD Zacate プロセス 32nm HK/MG CMOS 40nm Bulk CMOS # of Trs. 1.16B N/A Die Size 216mm2 (4 CPUs & 8M L3$) 75mm2 # of CPUs 2 or 4 Two x86 Bobcat CPU cores CPU 2.2GHz to 3.4GHz (3.8GHz Turbo) 1.6GHz, 4.9mm2 GPU 6 or 12 EU processor 80 SPUs, GFLOPS, 492MHz Memory I/F DDR3 (1066/1333/1600) 2ch. DDR 1066 (64b) I/O PCIe Gen.2 x20 PCIe Gen.2 x4 2ch. Power 16-50W(Mobile), 35-95W(DT) 18W TDP (Thermal Design Power) 16
17 Renesas [ISSCC ] [15.2] An 80Gbps Dependable Communication SoC with PCI Express I/F and 8 CPUs, Renesas 45nm LP CMOS, 8 layers, 121mm 2 80Gb/s communication SOC 8 コア, max 400MHz 512KB L2 PCI Express (Rev.2) 4lane x4 512KB SRAM DDR3 interface 3.2W@25, 0.04W/Gb/s 17
18 Godson-3B [ISSCC ] Highest energy efficiency in a processor! [4.4] Godson-3B: A 1GHz 40W 8-Core 128GFLOPS Processor in 65nm CMOS, Chinese Academy of Sciences Godson-3B プロセッサは 8 コアのプロセッサ 65nm CMOS で ピーク性能は 128GFlops( 倍精度演算 ) 40W と低消費電力であり 3.2GFlops/Watt の消費電力効率を達成 18
19 Intel Westmere [ISSCC ] 32nm プロセス Intel の第 2 世代となる High-k ゲート絶縁膜 / メタル ゲートを採用 高性能プロセッサといっても低消費電力中心の発表 Uncore と呼ぶ L3 キャッシュなどのプロセッサコア以外の部分も電源遮断 LVDDR3(Low Voltage DDR3) を採用 ISSCC 09 で発表した 65nm の Nehalem 4 コアと 面積 (262mm2 240mm2) 消費電力 (60~130W) は同じのまま 6 コアにコア数を増やせた 19
20 AMD x86-64 Core [ISSCC ] プロセッサコアのみ 32nm High-k / メタル ゲートの SOI(silicon-on-insulator) プロセス SOI プロセスの採用 通常の閾値電圧の NMOS トランジスタを電源スイッチ グランドラインにパッケージ層の配線を使用 20
21 Intel Nehalem Family [ISSCC ] (1) 4 コアの Die 写真 45nm, high-k metal gate CMOS 4 コア 8MB L3 キャッシュで 731M トランジスタ QuickPath Interconnect (QPI) 6.4GT/s(25.6GB/s) DDR3 3ch. パワーゲーティング Ultra-low-leakage, 高オフ抵抗の専用トランジスタ 7um の低抵抗 ( 通常の 1/10 以下 )M9 配線 21
22 Intel Nehalem Family [ISSCC ] (2) IDF2008 より フルスタティック CMOS ドミノ回路 LVS(Low Voltage Swing) 回路を廃止 ( ドミノ回路は フルスタティックの 2~5 倍の電力を食う ) IBM Cell Sun Rock でも 同様に極力ダイナミック回路を使わず スタティック回路 22
23 IBM Power7 [ISSCC ] 45nm SOI プロセスを使っており Power7 では 32MB の L3 キャッシュのデータ部に混載 DRAM を使用 edram のセルサイズは 0.067mm2(Intel Westmere の L3 キャッシュの SRAM のセルサイズは 32nm でも 0.171mm2) IBM Wire-Speed Power Processor の発表 [5.5] では SRAM に比べて面積で 2 倍 消費電力で 5 倍以上改善 23
24 Sun Rainbow Fall [ISSCC ] 同時実行できるスレッド数は毎年 2 倍のペースをキープ 24
25 Sun SPARC Rock [ISSCC /4.2] 16 cores (4 clusters of 4 cores), 32-thread + 32-scout-thread Checkpoint based architecture Simultaneous speculative threading / Scout threading / Hardware transactional memory 命令キャッシュ (32+8KB) 4 つのコアで共有 データキャッシュ (32KB) FPU 2 つのコアで共有 L2 キャッシュ : 2MB 4-bank 8-way, pseudo-lru 2.3GHz, 396mm2, 250mW, 65nm Memory I/F: 2.67Gb/s, 96-transmit and 160-receive channels 0.68Tb/s 25
26 Niagara2[ISSCC ] との違い Niagara2 [ISSCC ] Rock [ISSCC /4.2] 動作周波数 1.4GHz 2.3GHz 2GHz CPU コアの数 CPU コア当たりの最大実行スレッド数 CPU コアパイプライン方式 L1 命令キャッシュ 8 2+2(Scout thread) 8 Single Issue In-Order 16KB, 8-way ( コアごと ) 4 Issues Out-of-Order (Checkpoint based) 32+8KB, 4-way (4 コア共有 ) L1 データキャッシュ 8KB, 4-way ( コアごと ) 32KB, 4-way (2コア共 有 ) Rainbow Fall [ISSCC ] Single Issue In-Order? 16KB, 8-way ( コアごと ) 8KB, 4-way ( コアごと ) L2 キャッシュ 4MB, 8-bank, 16-way 2MB, 4-bank, 4-way 6MB, 16-bank, 24-way FPU コアごと 2 コア共有コアごと プロセス 65nm CMOS, 11LM 65nm CMOS, 11LM TSMC N40GP, 11Cu+AL RDL チップ面積 342mm2 396mm2 376mm2 電源電圧 1.1V 1.2V V (Core) 消費電力 123W 250W 120W 26
27 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 27
28 Toshiba T6G [ISSCC ] Hybrid application T6G processor H.264 full-hd video engine 3D/2D graphics engine Video/Audio multiprocessor ARM processor General controller DMAC Peripheral I/F Bus DRAMC x4 DDRC Camera I/F Display I/F Host I/F TS I/F MEMC 128bits x4 32bits SCS-DRAM DDR-SDRAM Camera LCD Panel HDMI driver HDTV Host CPU OFDM/RF NAND / NOR flash 28
29 CAM High speed I/O Chip micrograph Video/Audio multiprocessor Bus A ARM processor PLL PLL PLL PLL Micro bump Bus B Micro bump Bus C Bus D H.264 full-hd Display 3D/2D graphics PLL 29
30 Chip features Technology Chip size Gate counts Voltage CPU Video/Audio 3D/2D graph. Memory I/F Camera I/F Display I/F 40nm CMOS, triple-well,7-layer-metal 6.0mm x 6.2mm 18.5M gates (Logic), 9M bits (SRAM) 1.1V, 1.2V(PLL), 1.1/1.2/1.8/3.0V(I/O) Heterogeneous 14 cores H.264 HP 1080i/p codec, MPEG-4 SP FWVGA codec, MPEG-2 MP@HL Half decoding, VC1 MP QHD decoding, MP3, eaac+, WMA 40M polygons/s, 300M pixels/s SCS-DRAM 128bits x4 166MHz, DDR-SDRAM 32bits 166MHz 1080p 30fps(Movie), 24M pixel (Image) Main LCD (720p 60fps 24bits), Sub LCD (FWVGA 60fps 24bits), TV (1080p 30fps) 30
31 Video/Audio multiprocessor MPE I$ D$ MPE I$ D$ MPE I$ D$ MPE I$ D$ MPE I$ D$ MPE MPE I$ D$ I$ D$ L2$ SRAM L2$ controller MPE Others I$ D$ 8 Media Processing Engines (MPEs) L1$ (I$ 16KB / D$ 8KB) L2$ controller L2$ SRAM 256KB Others : Assistant logic for specific video codec 31
32 SCS-DRAM & DDR-SDRAM Micro bump SCS-DRAM & App. Micro bump DDR-SDRAM & App. Wire & RDL & Bump Wire RDL Re-Distribution Layer DDR-SDRAM Application Processor SCS-DRAM SCS-DRAM: Stacked-Chip SoC DRAM 32
33 Chip power domain (2)-(11) Video/Audio multiprocessor (17) H.264 Full-HD video engine (19) 3D/2D graphics engine (20)-(22) ARM processor (15) Camera I/F (14) Display I/F (16) Image composition (12) JPEG/Video scaling (1)(13)(18)(23) Main bus (24) Control bus / Peripheral I/F (25) I/O 33
34 Power supply system chart VDD1D(1.1V) On-chip LV-PMOS switch VDD1P(1.1V) (24) (1) (2) (23) (25) VSS Logic I/O 23 power domains are controlled by on-chip switches. Control bus (24) & I/O (25) does not have on-chip switches. 34
35 Use case Audio playback Audio playback + Video decoding + LCD out L2$ SRAM & controller (2) + 1MPE (3) L2$ SRAM & controller(2) + 8MPEs (3)-(10) Power consumption increases 10 times. 35
36 ルネサス SH 8 コア [ISSCC ] 日立 早大笠原研との共同発表 8640MIPS@600MHz, [email protected] 17 個のパワードメイン (CPUコアx8 RAMx8) レジュームRAM(RAMにデータ保持 CPUコアはパワーオフ ) 自動並列化コンパイラが電源モードを制御 バリア同期レジスタ 36
37 5 つのパワーモード レジュームパワーオフ 各 CPU コアの URAM(64KB) だけ電源オン CPU の内部状態を URAM に退避 従来のスリープモードから 88% の消費電力減 37
38 Renesas Heterogeneous Multi-Core SoC [ISSCC ] ルネサス 日立 早稲田 東工大の共同発表 非対称型 ( ヘテロジーニアス ) マルチコア SoC 8 つの汎用 CPU コア (SH-4A) 4 つの動的再構成可能型プロセッサ (FE) 2 つの 1024-way マトリックス型プロセッサを集積 (MX-2) 38
39 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 39
40 Thousand Core Chips A Technology Perspective (Intel) 2015 年には 300mm2 のチップ上に 100B トランジスタが集積でき そのうち 1.5B がロジックに使えるとしている 一方で プロセッサコアのロジック数を 2 倍にしても性能は 40% しか向上しない ( ポラックの法則 ) という経験則があり また 従来の周波数を上げるアプローチでは 1000W となると予測している 1B トランジスタをバジェットとした場合に 10 個の巨大な 100M トランジスタのプロセッサという従来のマルチコアではなくて 100 個の 10M トランジスタ さらには 1000 個の 1M トランジスタのコアを集積するメニーコアを提案している Shekhar Borkar, Thousand Core Chips A Technology Perspective, DAC 2007, June 2007, pp
41 Intel 80-Tile 1.28TFLOPS Network-on-Chip [ISSCC ] Architecture: 80PE, 4GHz, 15FO4 desegin FPMAC: Fast single-cycle accumulate loop NoC: 2D mesh topology Router: with double-pumped crossbar Mesochronous clock distribution Low power: clock gating, power gating, and body bias control 65nm, 8-LM CMOS 41
42 Intel 48-Core (SCC: Single Chip Cloud Computer) [ISSCC ] 48 IA-32 コア, 1GHz NoC 2-D mesh topology, 256GB/s bisection bandwidth 5-Port rounter, 64GB/s per 4 DDR3 memory controller Dynamic voltage & frequency scaling Novel message passing protocol 567.1mm2, 1.3B Trs., 45nm Hi-K CMOS 42
43 Voltage & Frequency Islands 8 つの Voltage Island と 28 の Frequency Island Voltage Islands オンチップのレギュレータ (0-1.3V) ソフトウエアで制御可能 1ms 以下の応答時間 Frequency Island 最大 16 分周 ソフトウエアで制御可能 20 サイクル以下の応答時間 (~20ns@1GHz) 43
44 Message Passing Buffer と低消費電力化 16KB の MPB により PE 間のデータ転送 DRAM 経由に比べて 8% 性能向上 電圧 周波数を落として消費電力低減 44
45 消費電力の内訳 Full Power のとき コアが 69% を占める Low Power のとき コアは大幅に減少 (1GHz->125MHz, 1.14V->0.7V) DDR3 が 69% 45
46 メニーコアまとめ メニーコアでは NoC が重要な技術となっている [ISSCC ] Intel 8x8 の 2 次元メッシュの NoC の発表 データ転送の前にネットワークの経路を決めてしまうサーキットスイッチ方式を取り データの送り元と送り先の間のバッファをなくし 高いバンド幅と高いエネルギー効率を達成 バイセクションバンド幅は 4.1Tb/s で エネルギー効率は 1.1V のときで 560Gb/s/W [ISSCC ] Intel 8 コアの Xeon に搭載した 1.2TB/s のリング型の接続方式 メモリシステムも重要 Intel 三次元実装 [Black, Die Stacking(3D) Microarchitecture, MICRO39, 2006] 46
47 NEC Reconfigurable Memory Chip [ISSCC ] H. Saito, et al, A Chip-Stacked Memory for On-Chip SRAM-Rich SoCs and Processors SoC チップと Memory(SRAM) チップを張り合わせる 2D メッシュのインターコネクト SRAM ブロックは 動的に容量 ビット幅を変更可能 物理的な動的なメモリ管理が可能 47
48 Keio Inductive-Coupling Link [ISSCC ] ルネサス SH マルチコア (8 コア ) と SRAM を接続 バンド幅 : 2.4GB/s(19.2Gbps=600MHzx16bx2) 48
49 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 49
50 ピーク性能 (GOPS) 画像処理 認識プロセッサの動向 [22.5]MTX(Renesas) [16.4]FIESTA (Sony) [15.2]Stream Processor (Stream Processors, Inc/ Stanford) [15.1]XETAL-II (Philips/NXP) [8.3] 認識プロセッサ (KAIST) 130nm 90nm 65nm [18.5]MX-2 (Renesas) 1080p/60fps 1080p( フル HD)/ 30fps 720p フル HD の画像処理が可能 50
51 ピーク性能 (GOPS) 動作周波数とピーク性能 並列度が高い [2007, 15.1]XETAL-II (Philips/NXP) [2008, 16.4]FIESTA (Sony) [2009, 8.3] 認識プロセッサ (KAIST) [2006, 22.5]MTX(Renesas) 動作周波数 (MHz) 周波数は100MHz~ 最大 800MHz 並列度は 1000 並列を超える 1000 並列 [2007, 15.2]Stream Processor (Stream Processors, Inc/ Stanford) [2010, 18.5]MX-2(Renesas) ( 注 )16b 演算換算 MTX, MX-2 の PE 数は 2048 であるが 2b のため並列度が低い点でプロットされている 500 並列 200 並列 51
52 開発背景 [ISSCC ] MTX(Renesas) [ISSCC ] FIESTA(Sony) 横軸 = 性能 / 消費電力, 縦軸 = 柔軟性 プログラム性 演算器を多数並べて 並列処理することで効率アップ cf. 典型的なプロセッサでのエネルギー消費 (130nm) [ISSCC ] 命令フェッチ & デコード >1000pJ Off-chip DRAMアクセス >1000pJ(32b) On-chipメモリ参照 ~100pJ(32b) 長距離配線 ~10pJ/mm (32bバス) レジスタ読み出し 10pJ(32b)* 算術演算 5pJ(32b)* *)[Dally ACM QUEUE 2004] 52
53 Sony FIESTA [ISSCC ] 4 つの 64PE SIMD アレイプロセッサ 512 GOPS@500MHz 低消費電力 : DVFS vs. 電源遮断 Body Bias: 40% measured power reduction HD 1080p(60fps) 画像処理で 115MOPS/mW 53
54 Renesas MX-2 [ISSCC ] PE の粒度を 2 ビットから 4 ビットへ 特に Booth Encoder をもつことで 乗算が高速化 面積効率も改善 コマンドキュー追加 倍速モードサポート 54
55 MX-2 の内部構成とチップ写真 1280PE と 2048PE を搭載 65nm 1P7M CMOS 24mm2(4.4mm x 5.5mm) MX-2 コアは 5.29mm2(2048PE), 3.56mm2(1280PE) 55
56 MX-2 の評価結果 消費電力効率 面積効率で過去の発表より優れている アプリレベルでの評価 S-T MRF( 時空間 Markov Random Field Model) 東大上條研で開発された 時空間画像を領域分割する確率モデル 56
57 画像処理 認識プロセッサまとめ ISSCC にコンスタントに採択されている 動作周波数は 100~800MHz とそれほど高くない ピーク性能は 512GOPS 次は 1TOPS? 並列性は 1000 を超えるレベル 効率 ( 性能 / 消費電力など ) の指標も重要 [Renesas ISSCC ] アプリに近い処理での評価結果 H.264 エンコード ISP 処理 画像認識処理 認識プロセッサ ( エンジン ) に特化 [Keio Univ, ISSCC 09, 8.2] 画像 ( オブジェクト ) 認識 SoC 低消費電力 消費電力効率がポイント [KAIST ISSCC ] [KAIST ISSCC ] 57mW, 655GOPS/W 57
58 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 58
59 高性能デジタル向けの要素技術 < オンチップ通信 > A 4Gb/s/ch 356fJ/b 10mm Equalized On-chip Interconnect with Nonlinear Charge- Injecting Transmit Filter and Transimpedance Receiver in 90nm CMOS, MIT [ISSCC ] High-Bandwidth and Low-Energy On-Chip Signaling with Adaptive Pre-Emphasis in 90nm CMOS, U. of Michigan [ISSCC ] (4.4Gb/s/μm over 5mm on-chip links with 0.34 pj/b energy consumption) A 1.2 TB/s On-Chip Ring Interconnect for 45nm 8-Core Enterprise Xeon Processor, Intel [ISSCC ] < オンチップセンサ モニタ > Dual-DLL-Based CMOS All-Digital Temperature Sensor for Microprocessor Thermal Monitoring, Harvard Univ.[ISSCC ] Accurate Characterization of Random Process Variations Using A Robust Low Voltage High Sensitivity Sensor Featuring Replica-Bias Circuit, Intel [ISSCC ] In Situ Delay-Slack Monitor for High-Performance Processors Using An All-digital Self-Calibrating 5ps Resolution Time-to-Digital Converter, U. of Michigan [ISSCC ] Early Detection of Oxide Breakdown Through In Situ Degradation Sensing, U. of Michigan [ISSCC ] A Precise-Tracking NBTI-Degradation Monitor Independent of NBTI Recovery Effect, NEC [ISSCC 9.10] 59
60 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア 低消費電力マルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 60
61 High-Performance C Digital 概要 Session 3: Processors CMOS スケーリングの継続に向けて 製品レベルのプロセッサに 3D FinFET 型トランジスタが初採用 低電圧設計 先進的なクロック技術などの回路技術の革新が 高性能プロセッサにおいても高いエネルギー効率を実現 FE:2 (Fudan University ( 復旦大学 ): 1, Intel Banglore: 1) NA:6 (Intel: 3, Oracle: 1, AMD: 1, Cavium: 1) Session 10: High-Performance Digital 本セッションは 単一の演算器から超並列スーパーコンピュータまで 高性能デジタル回路からシステムまでの幅広い領域をカバーします 最新の 22nm 32nm プロセスプラットフォームでの 3 次元実装 SIMD/FPU ブロック 高速オンチップリンクなどの回路技術が示されます FE:1 ( 富士通 :1) NA:6 (Intel: 3, IBM: 1, GeorgiaTech: 1, UMich: 1) EU:1 (Technische Universität Dresden: 1) Session 14: Digital Clocking and PLLs PLL は より多くのデジタル技術や機能ブロックを統合し デジタル SoC チップに内蔵され システムレベルの消費電力 およびコストの削減に貢献しています FE:3 (Samsung: 1, NTU: 1, 東芝 : 1) NA:2 (Intel: 1, Oregon State: 1) 61
62 Clock Frequency vs. Year No more speed game! 500nm 350nm 250nm 180nm 130nm 90nm 65nm 45nm 32nm 22nm 62
63 Session 3: Processors [3.1] A 22nm IA Multi-CPU and GPU System-on-Chip, Intel [3.2] A 32-Core RISC Microprocessor With Network Accelerators, Power Management and Testability Features, Cavium [3.3] The Next-Generation 64b SPARC Core in a T4 SoC Processor, Oracle [3.4] 32nm x86 OS-Compliant PC On-Chip With Dual-Core Atom Processor and RF WiFi Transceiver, Intel [3.5] An 800MHz 320mW 16-Core Processor With Message- Passing and Shared-Memory Inter-Core Communication Mechanisms, Fudan University [3.6] A 280mV-to-1.2V Wide-Operating-Range IA-32 Processor in 32nm CMOS, Intel [3.7] Resonant Clock Design for a Power-Efficient High- Volume x86-64 Microprocessor, AMD (University of Michigan) [3.8] A Reconfigurable Distributed All-Digital Clock Generator Core With SSC and Skew Correction in 22nm High-k Tri-Gate LP CMOS, Intel 63
64 Session 3: Processors Intel 22nm プロセス技術と 3D FinFET 型トランジスタを使った新 CPU IvyBridge を発表! [3.1] A 22 nm IA Multi-CPU and GPU System-on-Chip, Intel Intel が 業界初の 22nm 3D FinFET 型トランジスタを用いた 4 つの IA-32 コア GPU メモリおよび PCIe コントローラを内蔵する 次世代プロセッサを発表 中国の大学による コア間通信を改善した組み込みマルチコアプロセッサ! [3.5] An 800MHz 320mW 16-core Processor with Message-passing and Shared-memory Inter-core Communication Mechanisms, Fudan University 高効率のコア間通信を実現するために メッセージパッシングと共有メモリ機構を両方サポートする 65nm テクノロジ 16 コアのマルチコアプロセッサ 800MHz 1.2V で各コア 20mW で動作 64
65 Session 10: High-Performance Digital [10.1] A 280mV-to-1.1V 256b Reconfigurable SIMD Vector Permutation Engine With 2-Dimensional Shuffle in 22nm CMOS, Intel [10.2] A Source-Synchronous 90Gb/s Capacitively Driven Serial On-Chip Link Over 6mm in 65nm CMOS, Technical University Dresden [10.3] A 1.45GHz 52-to-162GFLOPS/W Variable-Precision Floating-Point Fused Multiply-Add Unit With Certainty Tracking in 32nm CMOS, Intel [10.4] A 2.05GVertices/s 151mW Lighting Accelerator for 3D Graphics Vertex and Pixel Shading in 32nm CMOS, Intel [10.5] A 3D System Prototype of an edram Cache Stacked Over Processor-Like Logic Using Through-Silicon Vias, IBM [10.6] 3D-MAPS: 3D Massively Parallel Processor With Stacked Memory, Georgia Institute of Technology [10.7] Centip3De: A 3930DMIPS/W Configurable Near- Threshold 3D Stacked System With 64 ARM Cortex-M3 Cores, University of Michigan [10.8] K Computer: PetaFLOPS Massively Parallel Scalar Supercomputer Built With Over 548k Cores, Fujitsu 65
66 Session 10: High-Performance Digital 世界最速の浮動小数点演算性能をもつ超並列スーパーコンピュータ! [10.8] K computer: An petaflop massively parallel scalar supercomputer built with over 548k cores, Fujitsu 富士通が 54 万 8 千個以上 ) のプロセッサコアからなる超並列スーパーコンピュータ 京 について発表 京 は ペタフロップス ) の速度と 9.89MW の消費電力でスーパーコンピュータの TOP500 リストで第 1 位にランキング ( 11/2 付けプレスリリース : プロセッサコア数 70 万 4 千個 ペタフロップスを達成 ) シリコン貫通電極 (TSV) を用いた積層 edram の >1GHz 動作の初実証! [10.5] A 3D System Prototype of an edram Cache Stacked over Processor-like Logic using Through Silicon Vias, IBM IBM による 擬似プロセッサチップ上に 50μm ピッチのシリコン貫通電極 (TSV) を用いて edram のキャッシュメモリを積層した 3D プロトタイプシステムの発表 高周波数の同期信号伝送のために層をまたいだクロックツリーなどにより 2.7GHz の動作を実現 66
67 Session 14: Digital Clocking & PLLs [14.1] A 0.004mm2 250μW ΔΣ TDC With Time- Difference Accumulator and a 0.012mm2 2.5mW Bang- Bang Digital PLL Using PRNG for Low-Power SoC Applications, Samsung [14.2] A 1.5GHz 890μW Digital MDLL With 400fsrms Integrated Jitter, -55.6dBc Reference Spur and 20fs/mV Supply-Noise Sensitivity Using 1b TDC, Oregon State University [14.3] A 6.7MHz-to-1.24GHz mm2 Fast-Locking All-Digital DLL in 90nm CMOS, National Taiwan University [14.4] A TDC-Less ADPLL With 200-to-3200MHz Range and 3mW Power Dissipation for Mobile SoC Clocking in 22nm CMOS, Intel [14.5] A Digitally Stabilized Type-III PLL Using Ring VCO With 1.01psrms Integrated Jitter in 65nm CMOS, Toshiba 67
68 Session 14: Digital Clocking & PLLs 最も典型的なアナログブロックである PLL がデジタル技術を取り込む! [14.1] A 0.004mm 2 250uW ΣΔTDC with Time-Difference Accumulator and a 0.012mm 2 2.5mW Bang-Bang Digital PLL using PRNG for Low Power SoC Applications, Samsung Electronics サムソンがモバイル応用向けに 32nm CMOS テクノロジで小面積 (0.012mm 2 ) 低消費電力 (2.5mW) のオールデジタル PLL を発表 [14.5] A Digitally Stabilized Type-III PLL using Ring VCO with 1.01ps rms Integrated Jitter in 65nm CMOS, Toshiba 東芝がデジタル制御安定化したリング VCO 付き type-iii PLL を発表 65nm CMOS テクノロジで 3.24GHz 動作時 1.01ps rms のジッタと 27.5mW の低消費電力を実現 68
69 Session 12: MULTIMEDIA & COMMUNICATIONS SOCs [12.1] A 32nm High-k Metal Gate Application Processor with GHz Multi-Core CPU, Samsung [12.2] A 335Mb/s 3.9mm2 65nm CMOS Flexible MIMO Detection-Decoding Engine Achieving 4G Wireless Data Rates, Technical University Dresden [12.3] A Full 4-Channel 6.3Gb/s 60GHz Direct-Conversion Transceiver with Low-Power Analog and Digital Baseband Circuitry, Tokyo Institute of Technology [12.4] A 320mW 342GOPS Real-Time Moving Object Recognition Processor for HD 720p Video Streams, KAIST [12.5] A 464GOPS 620GOPS/W Heterogeneous Multi-Core SoC for Image-Recognition Applications, Toshiba [12.6] A 2Gpixel/s H.264/AVC HP/MVC Video Decoder Chip for Super Hi-Vision and 3DTV/FTV Applications, Waseda University [12.7] A True Multistandard, Programmable, Low-Power, Full HD Video-Codec Engine for Smartphone SoC, TI 69
70 Session 12: Multimedia & Communications SoCs リアルタイム動作のオブジェクト認識 SoC [12.5] A 464GOPS 620GOPS/W Image Recognition SoC, Toshiba ヘテロジニアスのマルチコアと画像処理アクセラレータを搭載したリアルタイム画像認識プロセッサ SoC の消費電力は 620GOPS/W の時 749mW を達成 [12.4] 320mW 342GOPS Moving Target Recognition Processor, KAIST マルチスレショールド特徴抽出 キーポイントマッチング ダイナミックリソース制御技術を搭載した移動体認識プロセッサ 130nmCMOS プロセス技術で 720p 画像認識動作時 消費電力は 320mW を実現 Highest-speed Mobile AP [12.1] 1.5GHz Quad-core Samsung s Exynos TM in 32nm HKMG LP- CMOS, Samsung 4 (2) 個のマルチコア 1.5GHz のアプリケーションプロセッサの論文 多電源分離した 4 つの GPU エンジン 1MB L2 キャッシュ チップの多数ポイントをモニタする温度を搭載し 高度なパワマネジメント技術をサポート. 70
71 Outline ISSCCのデータで見る高性能プロセッサの動向 ハイエンドマルチコア メニーコア 画像処理 画像認識プロセッサ 高性能デジタル向けの要素技術 ISSCC 2012プレスリリースより まとめ 71
72 まとめ プロセッサの動向 2004 年以降 動作周波数 電力 電力密度の平均は変わらなくなっている 一方 チップの集積度は向上し続けている (Moore の法則が継続 ) L2, L3 キャッシュ容量の増大 マルチコア化 North Bridge/GPU の統合 ハイエンドプロセッサ 高性能 ( 高速 I/O クロックシステム ) 高信頼性に加え 低消費電力技術に注目 メニーコア 64~80 コアが発表 (Intel 80 コア (2007) Tile64(2008) Intel SCC(2010)) NoC ( ネットワークオンチップ ) やメモリアーキテクチャがポイント 画像処理プロセッサ ピーク性能 /W の向上 (600 GOPS/W 超 ) アプリケーションレベルでの評価 認識エンジンなど特定アプリへ特化 要素技術 3 次元実装 高速 高効率なオンチップ通信方式 72
特集新世代マイクロプロセッサアーキテクチャ ( 後編 ) 3. 実例 3 ユビキタス コンピューティング時代の組み込みマイクロコンピュータ, SuperH と M32R 清水徹 * 1 長谷川淳 * 2 服部俊洋 * 3 近藤弘郁 * 4 ( 株 ) ルネサステクノロジシステムソリューション統括本部
3. 実例 3 ユビキタス コンピューティング時代の組み込みマイクロコンピュータ, SuperH と M32R 清水徹 * 1 長谷川淳 * 2 服部俊洋 * 3 近藤弘郁 * 4 ( 株 ) ルネサステクノロジシステムソリューション統括本部システムコア技術統括部 * 1 [email protected] * 2 [email protected] * 3 [email protected]
VLSI工学
2008//5/ () 2008//5/ () 2 () http://ssc.pe.titech.ac.jp 2008//5/ () 3!! A (WCDMA/GSM) DD DoCoMo 905iP905i 2008//5/ () 4 minisd P900i SemiConsult SDRAM, MPEG4 UIMIrDA LCD/ AF ADC/DAC IC CCD C-CPUA-CPU DSPSRAM
23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h
23 FPGA CUDA Performance Comparison of FPGA Array with CUDA on Poisson Equation ([email protected]), ([email protected]), ([email protected]), ([email protected]),
6 ZettaScaler-1.x Supercomputer systems
VDEC20 周年記念行事講演 次世代 AI とスーパーコンピュータが実現する近未来に向けて ~ 国産技術による独自 AI エンジンとスパコン開発のご紹介 ~ 2017 年 1 月 20 日 齊藤 元章 ( 株式会社 PEZY Computing/ 株式会社 ExaScaler/UltraMemory 株式会社株式会社 Deep Insights/ 株式会社 Infinite Curation) 6
A Responsive Processor for Parallel/Distributed Real-time Processing
E-mail: yamasaki@{ics.keio.ac.jp, etl.go.jp} http://www.ny.ics.keio.ac.jp etc. CPU) I/O I/O or Home Automation, Factory Automation, (SPARC) (SDRAM I/F, DMAC, PCI, USB, Timers/Counters, SIO, PIO, )
02_Matrox Frame Grabbers_1612
Matrox - - Frame Grabbers MatroxRadient ev-cxp Equalizer Equalizer Equalizer Equalizer 6.25 Gbps 20 Mbps Stream channel Control channel Stream channel Control channel Stream channel Control channel Stream
システムソリューションのご紹介
HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ
Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments
計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];
テストコスト抑制のための技術課題-DFTとATEの観点から
2 -at -talk -talk -drop 3 4 5 6 7 Year of Production 2003 2004 2005 2006 2007 2008 Embedded Cores Standardization of core Standard format Standard format Standard format Extension to Extension to test
matrox0
Image processing products Hardware/Software Software Hardware INDEX 4 3 2 12 13 15 18 14 11 10 21 26 20 9 8 7 6 5 Hardware 2 MatroxRadient 3 MatroxSolios MatroxMorphis MatroxVio 10 MatroxOrionHD 11 MatroxConcord
RW1097-0A-001_V0.1_170106
INTRODUCTION RW1097 is a dot matrix LCD driver & controller LSI which is fabricated by low power CMOS technology. It can display 1line/2line/3line/4line/5line/6lines x 12 (16 x 16 dot format) with the
デジタルカメラ用ISP:Milbeaut
ISP Milbeaut Image Signal Processor: Milbeaut あらまし MilbeautISP Image Signal Processor 20 Mpixel Milbeaut6 MB91696AM MB91696AM Abstract Milbeaut is an image signal processor (ISP) that realizes a digital
mobicom.dvi
13Dynamic Voltage Scaling on a Low-Power Microprocessor Johan Pouwelse 5 Koen Langendoen Henk Sips Faculty of Information Technology and Systems Delft University of Technology, The Netherlands 1 78724
富士通セミコンダクター株式会社発表資料
安心 安全を実現する安全を実現する FM3 マイコン 2012 年 6 月富士通セミコンダクター株式会社マイコンソリューション事業本部五十嵐稔行 Copyright 2010 FUJITSU LIMITED 目次 FM3 ロードマップ 安心 安全への取り組み安全への取り組み 1 Copyright 2010 FUJITSU LIMITED CPUロードマップとITRON系RTOS製品 T-Kernel/μT-Kernel
I/F Memory Array Control Row/Column Decoder I/F Memory Array DRAM Voltage Generator
- - 18 I/F Memory Array Control Row/Column Decoder I/F Memory Array DRAM Voltage Generator - - 19 - - 20 N P P - - 21 - - 22 DRAM - - 23 a b MC-Tr avcc=2.5vvbb=-1.5vvpp=4.0v bvcc=1.7vvbb=-1.0vvpp=3.0v
富士通セミコンダクタープレスリリース 2009/05/19
[ デバイス ] 2009 年 5 月 19 日富士通マイクロエレクトロニクス株式会社 世界初!125 動作の SiP 向け低消費電力メモリを新発売 ~ メモリの耐熱性向上により 消費電力の大きな高性能デジタル家電に最適 ~ 富士通マイクロエレクトロニクス株式会社 ( 注 1) は DDR SDRAM インターフェースを持つメモリでは世界で初めて動作温度範囲を 125 まで拡張したコンシューマ FCRAM(
Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx
シングルコアとマルチコア 長岡技術科学大学電気電子情報工学専攻出川智啓 今回の内容 前々回の授業の復習 CPUの進化 半導体集積率の向上 CPUの動作周波数の向上 + 複雑な処理を実行する回路を構成 ( 前々回の授業 ) マルチコア CPU への進化 均一 不均一なプロセッサ コプロセッサ, アクセラレータ 210 コンピュータの歴史 世界初のデジタルコンピュータ 1944 年ハーバードMark I
HP Workstation 総合カタログ
HP Workstation Z HP 6 Z HP HP Z840 Workstation P.9 HP Z640 Workstation & CPU P.10 HP Z440 Workstation P.11 17.3in WIDE HP ZBook 17 G2 Mobile Workstation P.15 15.6in WIDE HP ZBook 15 G2 Mobile Workstation
Microsoft PowerPoint - GPU_computing_2013_01.pptx
GPU コンピューティン No.1 導入 東京工業大学 学術国際情報センター 青木尊之 1 GPU とは 2 GPGPU (General-purpose computing on graphics processing units) GPU を画像処理以外の一般的計算に使う GPU の魅力 高性能 : ハイエンド GPU はピーク 4 TFLOPS 超 手軽さ : 普通の PC にも装着できる 低価格
1 [email protected] : FPGA : HDL, Xilinx Vivado + Digilent Nexys4 (Artix-7 100T) LSI / PC clock accurate / Artix-7 XC7A100T Kintex-7 XC7K325T : CAD Hands-on: HDL (Verilog) CAD (Vivado HLx) : 28y4
Slide 1
INTEL プロセッサの 技術ロードマップ 2014 年 7 月 目次 Pentium から Ivy Bridge までの Intel の製品ライン 100 nm ノード超 (Gate-First) サブ 100 nm ノード : 90 nm および 65 nm (Gate-First) 45 nm 32nm および 22nm (Gate-Last 高誘電 メタルゲート ) 技術ノード 関連パラメータコンタクテッドゲートピッチ
Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments
加藤真平計算機アーキテクチャ特論 計算機アーキテクチャ特論後半第 1 回最先端アーキテクチャのトレンド 本資料は授業用です 無断で転載することを禁じます 講師加藤真平 前半の趣旨 : 並列化プログラミング for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } シングルプロセッサ マルチプロセッサ x[0]=a[0]+b[0]; x[1]=a[1]+b[1];
AMD/ATI Radeon HD 5870 GPU DEGIMA LINPACK HD 5870 GPU DEGIMA LINPACK GFlops/Watt GFlops/Watt Abstract GPU Computing has lately attracted
DEGIMA LINPACK Energy Performance for LINPACK Benchmark on DEGIMA 1 AMD/ATI Radeon HD 5870 GPU DEGIMA LINPACK HD 5870 GPU DEGIMA LINPACK 1.4698 GFlops/Watt 1.9658 GFlops/Watt Abstract GPU Computing has
12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-
12ways-12th Generation PowerEdge Servers improve your IT experience 12 PowerEdge 12 1 6 2 GPU 8 4 PERC RAID I/O Cachecade I/O 5 Dell Express Flash PCIe SSD 6 7 OS 8 85.5% 9 Dell OpenManage PowerCenter
(Microsoft PowerPoint - E6x5C SDXC Demo Seminar [\214\335\212\267\203\202\201[\203h])
Atom プロセッサ E6x5C の紹介と FPGA IP Core 活 例の紹介 アイウェーブ ジャパン株式会社 神奈川県横浜市中区住吉町 3 丁目 29 番住吉関内ビル8 階 B Tel: 045-227-7626 Fax: 045-227-7646 Mail: [email protected] Web: www.iwavejapan.co.jp 2011/5/30 1 iwave Japan,
untitled
PC [email protected] muscle server blade server PC PC + EHPC/Eric (Embedded HPC with Eric) 1216 Compact PCI Compact PCIPC Compact PCISH-4 Compact PCISH-4 Eric Eric EHPC/Eric EHPC/Eric Gigabit
Microsoft PowerPoint - 集積回路工学(5)_ pptm
集積回路工学 東京工業大学大学院理工学研究科電子物理工学専攻 松澤昭 2009/0/4 集積回路工学 A.Matuzawa (5MOS 論理回路の電気特性とスケーリング則 資料は松澤研のホームページ htt://c.e.titech.ac.j にあります 2009/0/4 集積回路工学 A.Matuzawa 2 インバータ回路 このようなインバータ回路をシミュレーションした 2009/0/4 集積回路工学
Microsoft PowerPoint - ICD-ARCパネル
ICD-ARC 共 催 研 究 会 パネル 討 論 新 時 代 におけるマルチコア 戦 略 ( 株 ) 東 芝 セミコンダクター 社 2008 年 5 月 13 日 斎 藤 光 男 プロセッサ 周 波 数 の 年 代 別 の 伸 び 10000 CISCプロセッサの 時 代 アウトオブオーダーの 導 入 3.2GHz P4 3.0GHz P4 3.8GHz P4 3.4GHz 3.6GHz P4 P4
1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU
GPGPU (I) GPU GPGPU 1 GPU(Graphics Processing Unit) GPU GPGPU(General-Purpose computing on GPUs) GPU GPGPU GPU ( PC ) PC PC GPU PC PC GPU GPU 2008 TSUBAME NVIDIA GPU(Tesla S1070) TOP500 29 [1] 2009 AMD
IPSJ SIG Technical Report Vol.2013-ARC-206 No /8/1 Android Dominic Hillenbrand ODROID-X2 GPIO Android OSCAR WFI 500[us] GPIO GP
Android 1 1 1 1 1 Dominic Hillenbrand 1 1 1 ODROID-X2 GPIO Android OSCAR WFI 500[us] GPIO GPIO API GPIO API GPIO MPEG2 Optical Flow MPEG2 1PE 0.97[W] 0.63[W] 2PE 1.88[w] 0.46[W] 3PE 2.79[W] 0.37[W] Optical
GPGPU
GPGPU 2013 1008 2015 1 23 Abstract In recent years, with the advance of microscope technology, the alive cells have been able to observe. On the other hand, from the standpoint of image processing, the
10 IDM NEC
No.29 1 29 SEAJ SEAJ 2 3 63 1 1 2 2002 2003 6 News 9 IEDM 11 13 15 16 17 10 IDM NEC 3 12 3 10 10 2 3 3 20 110 1985 1995 1988 912001 1 1993 95 9798 199010 90 200 2 1950 2 1950 3 1311 10 3 4 4 5 51929 3
LM35 高精度・摂氏直読温度センサIC
Precision Centigrade Temperature Sensors Literature Number: JAJSB56 IC A IC D IC IC ( ) IC ( K) 1/4 55 150 3/4 60 A 0.1 55 150 C 40 110 ( 10 ) TO-46 C CA D TO-92 C IC CA IC 19831026 24120 11800 ds005516
計算機ハードウエア
計算機ハードウエア 2017 年度前期 第 4 回 前回の話 コンピュータバスの構成 データバス I/O (Input/ Output) CPU メモリ アドレスバス コントロールバス コンピュータバスは コンピュータ本体 (CPU) と そのコンピュータ本体とデータのやり取りをする複数の相手との間を結ぶ 共用の信号伝送路である CPU は バス を制御して 複数のデバイス ( メモリや I/O)
スパコンに通じる並列プログラミングの基礎
2018.09.10 [email protected] ( ) 2018.09.10 1 / 59 [email protected] ( ) 2018.09.10 2 / 59 Windows, Mac Unix 0444-J [email protected] ( ) 2018.09.10 3 / 59 Part I Unix GUI CUI:
Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops
Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops ボードの概要 Control processor (FPGA by Altera) GRAPE-MP chip[nextreme
日立評論2008年1月号 : 基盤技術製品
Infrastructure Technology / Products HIGHLIGHTS 2008 HDD 2.5 HDD3.5 HDD 1 Deskstar 7K1000 HDD Hard Disk Drive 2006 5 PC 2.5 HDD HDD 3.5 HDD1 1 2007 3Deskstar 7K1000 3.5 HDD 1149 Deskstar 7K500 2 GMR Giant
2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC
H.264 CABAC 1 1 1 1 1 2, CABAC(Context-based Adaptive Binary Arithmetic Coding) H.264, CABAC, A Parallelization Technology of H.264 CABAC For Real Time Encoder of Moving Picture YUSUKE YATABE 1 HIRONORI
計算機ハードウエア
計算機ハードウエア 209 年度前期 第 5 回 前回の話 (SH745) (32 bit) コンピュータバスの構成 インタフェース (6 bit) I/O (Input/ Output) I/O (22 bit) (22 bit) 割り込み信号リセット信号 コンピュータバスは コンピュータ本体 () と そのコンピュータ本体とデータのやり取りをする複数の相手との間を結ぶ 共用の信号伝送路である クロック用クリスタル
DVI
DVI December 2003 December 2003 ? December 2003 Page 3 Host Data Device Clock December 2003 Page 4 Data Skew Host Data Device Clock Setup Hold Data Skew December 2003 Page 5 Host Data Device Clock Setup
untitled
1 CMOS 0.35um CMOS, 3V CMOS 2 RF CMOS RF CMOS RF CMOS RFCMOS (ADC Fabless 3 RF CMOS 1990 Abidi (UCLA): Fabless RF CMOS CMOS 90% 4 5 f T [GHz] 450 400 350 300 250 200 150 Technology loadmap L[nm] f T [GHz]
160311_icm2015-muramatsu-v2.pptx
Linux におけるパケット処理機構の 性能評価に基づいた NFV 導 の 検討 村松真, 川島 太, 中 裕貴, 林經正, 松尾啓志 名古屋 業 学 学院 株式会社ボスコ テクノロジーズ ICM 研究会 2016/03/11 研究 的 VM 仮想 NIC バックエンド機構 仮想化環境 仮想スイッチ パケット処理機構 物理環境 性能要因を考察 汎 IA サーバ NFV 環境に適したサーバ構成を検討
スライド 1
GPU クラスタによる格子 QCD 計算 広大理尾崎裕介 石川健一 1.1 Introduction Graphic Processing Units 1 チップに数百個の演算器 多数の演算器による並列計算 ~TFLOPS ( 単精度 ) CPU 数十 GFLOPS バンド幅 ~100GB/s コストパフォーマンス ~$400 GPU の開発環境 NVIDIA CUDA http://www.nvidia.co.jp/object/cuda_home_new_jp.html
エミフィルによるノイズ対策 アプリケーション編
.pdf Noise Suppression by EMIFIL Application Guide Application Manual Cat.No.C35-2 .pdf .pdf .pdf 2 .pdf CD-ROM Power Supply CPU Gate Array RAM ROM Driver Driver Driver USB Chip Set Mouse Keyboard Display
HPEハイパフォーマンスコンピューティング ソリューション
HPE HPC / AI Page 2 No.1 * 24.8% No.1 * HPE HPC / AI HPC AI SGIHPE HPC / AI GPU TOP500 50th edition Nov. 2017 HPE No.1 124 www.top500.org HPE HPC / AI TSUBAME 3.0 2017 7 AI TSUBAME 3.0 HPE SGI 8600 System
Microsoft PowerPoint - ★13_日立_清水.ppt
PC クラスタワークショップ in 京都 日立テクニカルコンピューティングクラスタ 2008/7/25 清水正明 日立製作所中央研究所 1 目次 1 2 3 4 日立テクニカルサーバラインナップ SR16000 シリーズ HA8000-tc/RS425 日立自動並列化コンパイラ 2 1 1-1 日立テクニカルサーバの歴史 最大性能 100TF 10TF 30 年間で百万倍以上の向上 (5 年で 10
strtok-count.eps
IoT FPGA 2016/12/1 IoT FPGA 200MHz 32 ASCII PCI Express FPGA OpenCL (Volvox) Volvox CPU 10 1 IoT (Internet of Things) 2020 208 [1] IoT IoT HTTP JSON ( Python Ruby) IoT IoT IoT (Hadoop [2] ) AI (Artificial
スライド 1
SoC -SWG ATE -SWG 2004 2005 1 SEAJ 2 VLSI 3 How can we improve manageability of the divergence between validation and manufacturing equipment? What is the cost and capability optimal SOC test approach?
アナログ IC の分野で世界ナンバー 1のサプライヤであるテキサス インスツルメンツは 広範な用途向けにクロック バッファ / クロックジェネレータから ジッタ アッテネータ RF PLL/ シンセサイザにいたる包括的なクロック / タイミング IC 製品ポートフォリオを提供しています こうした使い
& 高い柔軟性と使いやすさを実現する包括的製品ポートフォリオ tij.co.jp/clocks 2013 アナログ IC の分野で世界ナンバー 1のサプライヤであるテキサス インスツルメンツは 広範な用途向けにクロック バッファ / クロックジェネレータから ジッタ アッテネータ RF PLL/ シンセサイザにいたる包括的なクロック / タイミング IC 製品ポートフォリオを提供しています こうした使いやすく
AN15880A
DATA SHEET 品種名 パッケージコード QFH064-P-1414H 発行年月 : 2008 年 12 月 1 目次 概要.. 3 特長.. 3 用途.. 3 外形.. 3 構造...... 3 応用回路例.. 4 ブロック図.... 5 端子.. 6 絶対最大定格.. 8 動作電源電圧範囲.. 8 電気的特性. 9 電気的特性 ( 設計参考値 )... 10 技術資料.. 11 入出力部の回路図および端子機能の
PRECISION COMPACT DISC PLAYER DP-75V
PRECISION COMPACT DISC PLAYER DP-75V Accuphase warranty is valid only in Japan. 7 6 8 9 10 1 2 3 5 4 11 13 14 15 12 16 = CD/PROC PLAY PROGRAM REPEAT ALLONE A B LEVEL khz INDEX TRACK EXT M S db PROCESSOR
2017 (413812)
2017 (413812) Deep Learning ( NN) 2012 Google ASIC(Application Specific Integrated Circuit: IC) 10 ASIC Deep Learning TPU(Tensor Processing Unit) NN 12 20 30 Abstract Multi-layered neural network(nn) has
Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc
2.3. アプリ性能 2.3.1. Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア
スパコンに通じる並列プログラミングの基礎
2018.06.04 2018.06.04 1 / 62 2018.06.04 2 / 62 Windows, Mac Unix 0444-J 2018.06.04 3 / 62 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 2018.06.04 4 / 62 0444-J ( : ) 6 4 ( ) 6 5 * 6 19 SX-ACE * 6
untitled
LVDS 1 ( LVDS) / 50% 2 ( LVDS) / 50% 3 USB2.0 480Mbps Serial ATA Gen1 1.5Gbps PCI Express Gen1 2.5Gbps 4 Host Data Device Clock 5 Data Skew Host Data Device Clock Setup Hold Data Skew 6 Host Data Device
HP Workstation 総合カタログ
HP Workstation E5 v2 Z Z SFF E5 v2 2 HP Windows Z 3 Performance Innovation Reliability 3 HPZ HP HP Z820 Workstation P.11 HP Z620 Workstation & CPU P.12 HP Z420 Workstation P.13 17.3in WIDE HP ZBook 17
Microsoft PowerPoint - CCS学際共同boku-08b.ppt
マルチコア / マルチソケットノードに おけるメモリ性能のインパクト 研究代表者朴泰祐筑波大学システム情報工学研究科 [email protected] アウトライン 近年の高性能 PC クラスタの傾向と問題 multi-core/multi-socket ノードとメモリ性能 メモリバンド幅に着目した性能測定 multi-link network 性能評価 まとめ 近年の高性能 PC
GPU n Graphics Processing Unit CG CAD
GPU 2016/06/27 第 20 回 GPU コンピューティング講習会 ( 東京工業大学 ) 1 GPU n Graphics Processing Unit CG CAD www.nvidia.co.jp www.autodesk.co.jp www.pixar.com GPU n GPU ü n NVIDIA CUDA ü NVIDIA GPU ü OS Linux, Windows, Mac
untitled
RADEON X1900 G5 MAC EDITION P/N 137-41057-10 ATI ii Copyright 2006, ATI Technologies Inc. All rights reserved. ATI ATI ATI ATI Technologies Inc. ATI Technologies Inc. ATI Technologies Inc. ATI Technologies
DRAM SRAM SDRAM (Synchronous DRAM) DDR SDRAM (Double Data Rate SDRAM) DRAM 4 C Wikipedia 1.8 SRAM DRAM DRAM SRAM DRAM SRAM (256M 1G bit) (32 64M bit)
2016.4.1 II ( ) 1 1.1 DRAM RAM DRAM DRAM SRAM RAM SRAM SRAM SRAM SRAM DRAM SRAM SRAM DRAM SRAM 1.2 (DRAM, Dynamic RAM) (SRAM, Static RAM) (RAM Random Access Memory ) DRAM 1 1 1 1 SRAM 4 1 2 DRAM 4 DRAM
untitled
ITRS2005 DFM STRJ : () 1 ITRS STRJ ITRS2005DFM STRJ DFM ITRS: International Technology Roadmap for Semiconductors STRJ: Semiconductor Technology Roadmap committee of Japan 2 ITRS STRJ 1990 1998 2000 2005
