DRAM SRAM SDRAM (Synchronous DRAM) DDR SDRAM (Double Data Rate SDRAM) DRAM 4 C Wikipedia 1.8 SRAM DRAM DRAM SRAM DRAM SRAM (256M 1G bit) (32 64M bit)



Similar documents
システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

Microsoft PowerPoint - NxLec ppt

スライド 1

xi21-x.dvi

cpu2007lectureno2.ppt

スライド 1

テクニカルガイド「増設メモリ」(2006/09/15)

26 FPGA FPGA (Field Programmable Gate Array) ASIC (Application Specific Integrated Circuit) FPGA FPGA FPGA FPGA Linux FreeDOS skewed way L1

増設メモリ (2006/11/20)

スライド 1

Microsoft PowerPoint - OS08 [互換モード]

M SRAM 1 25 ns ,000 DRAM ns ms 5,000,

定 義 アクセス 要 求 を 発 行 する 機 構 と,その 供 給 に 応 える 機 構 との 中 間 に 位 置 し,すべての 要 求 を 検 知 して 処 理 するよう 構 築 される. キャッシュは 選 択 されたデータの 局 所 的 なコピーを 保 持 し, 可 能 な 場 合 にはアクセ

計算機ハードウエア

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

スライド タイトルなし

6. パイプライン制御

Microsoft PowerPoint - OS10.pptx

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx

Microsoft PowerPoint - No14…L………b…V…–…†…‡…−.ppt

の 内 容 の 一 貫 性 )を 保 つために 用 いられるのが スヌープ キャッシュ 方 式 である. キャッシュメモリにおいて, 主 記 憶 のアドレスの 下 部 (インデックス)を 用 いてキャッシュメモリ 上 のインデックスを 求 める 方 法 を ダイレクトマッピング と 呼 ぶ.キャッシ

計算機ハードウエア

PowerPoint プレゼンテーション

Microsoft PowerPoint - os ppt [互換モード]

スライド 1

Microsoft PowerPoint - sp ppt [互換モード]

メモリ管理

16.16%

Microsoft PowerPoint - No15›¼‚z‰L›¯.ppt

Microsoft PowerPoint mm

スライド 1

4.1 % 7.5 %

増設メモリ 1. 機能 型名 N N N N N GB 16GB 3 (x2 枚 ) (x2 枚 ) (x2 枚 ) (8GBx2 枚 ) (16GBx2 枚 ) DDR3-1066(PC3-8500) 動作クロック

Microsoft PowerPoint - CompArch_Exercise3.pptx

増設メモリ 1. 機能 型名 N N N (x1 枚 ) (x1 枚 ) (x1 枚 ) DDR2-800(PC2-6400) 動作クロック 400MHz( 差動 ) 110Ge, 110Ge-S 型名 N N N810

増設メモリ 1. 機能 型名 N N N (x1 枚 ) (x1 枚 ) (x1 枚 ) DDR3-1333(PC ) SDRAM-DIMM, Unbuffered,ECC 動作クロック 667MHz( 差動 ) 1.5V 型名 N8102

増設メモリ (2010/06/17)

増設メモリ 1. 機能 型名 N8102-G342 N8102-G343 N8102-G344 1GB (1GBx1 枚 ) (x1 枚 ) (x1 枚 ) SDRAM-DIMM, Unbuffered,ECC 1.5V 型名 N N N (1GBx1

増設メモリ 1. 機能仕様 型番製品名備考 N GB 増設メモリボード (2x 4 GB/U) DDR3L-1333(PC3L-10600) SDRAM ECC 付 Registered, 2GBx2 枚の N GB 増設メモリボード DDR3L-1600(PC3

untitled

増設メモリ 1. 機能 型名 N N N N GB (x1 枚 ) (x1 枚 ) (x1 枚 ) (8GBx1 枚 ) DDR3-1333(PC ) 動作クロック 667MHz( 差動 ) 1.5V 型名 N8102-3

増設メモリ 1. 機能 型名 N N N N GB (x1 枚 ) (x1 枚 ) (x1 枚 ) (8GBx1 枚 ) DDR3-1066(PC3-8500) SDRAM-DIMM, Registered,ECC 動作クロック 53

.,. 0. (MSB). =2, =1/2.,. MSB LSB, LSB MSB. MSB 0 LSB 0 0 P

テクニカルガイド 増設メモリ

OS

SDRAM および DRAM の メモリ システムの概要

プロセッサ・アーキテクチャ

テクニカルガイド 増設メモリ

増設メモリ 1. 機能仕様 型番 製品名 備考 N GB 増設メモリボード DDR3-1333(PC ) SDRAM, Unbuffered N GB 増設メモリボード DDR3-1333(PC ) SDRAM, Unbuffered N8

Operating System 仮想記憶

「FPGAを用いたプロセッサ検証システムの製作」

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の

Microsoft PowerPoint - Lec pptx

スライド 1

cmpsys14w04_mem_hp.ppt

Microsoft PowerPoint - arc5

Microsoft PowerPoint - 6.memory.ppt

c t WC 1 2: SRAM 1.2 DRAM DRAM DRAM DRAM 3 4M 1 DRAM 22 1 A0 A10 11 DRAM 22 DIN DOUT 1 DRAM

スライド 1

ごあいさつ

SCIMA アーキテクチャと性能評価 - SCIMA アーキテクチャの概要 - 中村宏東京大学先端科学技術研究センター

ディジタルシステム設計

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

スライド 1

ex04_2012.ppt

講義計画 1. コンピュータの歴史 1 2. コンピュータの歴史 2 3. コンピュータの歴史 3 4. 論理回路と記憶, 計算 : レジスタとALU 5. 主記憶装置とALU, レジスタの制御 6. 命令セットアーキテクチャ 7. 演習問題 8. パイプライン処理 9. メモリ階層 : キャッシュ

Microsoft PowerPoint - NxLecture ppt [互換モード]

hard5.pptx

untitled

1 1 (1) (2) 1 (3) (1) 6 (2) (1) (2) (3) (4)


ためのオーバーヘッドが課題となりつつある しかしこのオーバーヘッドに関する数値はほとんど公開されていない この論文ではこの cache coherency の時間を Linux カーネルで提供されている atomic_inc 関数を用いて測定する方法を新たに考案し 実測プログラムを作成した 実測はプ

ex05_2012.pptx

3 SIMPLE ver 3.2: SIMPLE (SIxteen-bit MicroProcessor for Laboratory Experiment) 1 16 SIMPLE SIMPLE 2 SIMPLE 2.1 SIMPLE (main memo

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1


スライド 1

VNXe3100 ハードウェア情報ガイド

OS

main.dvi

Microsoft PowerPoint - NxLec ppt

P33W・P28X カタログ

10-vm1.ppt

PowerPoint プレゼンテーション

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co

2005 1

&A : A = k j 1: 4-way., A set x, way y, way y LRU y, way., A (x,y).,,, L1( 1) L2, L3 3. L1., L2,L3., TLB(Translation Lookaside Buffer). OS,. TLB, ( ),

利用のためのPC環境設定

ソフトウェア基礎技術研修

< B8CDD8AB B83685D>


200Ma_ PDF

単位、情報量、デジタルデータ、CPUと高速化 ~ICT用語集~

Express5800/120Lf 1. Express5800/120Lf N N N Express5800/120Lf Express5800/120Lf Express5800/120Lf ( /1BG(256)) ( /1BG(256)) (

ソフトウェア基礎技術研修

スライド 1

以 前 の 環 境 1.ハードウェア 構 成 新 機 器 導 入 前 の 構 成 を 示 す No 機 器 CPU メモリ ハードディスク 用 途 1 ノートPC 01 Pentium M 1.60 GHz 2 GB 60 GB 普 段 使 い 用 (ネット 動 画 再 生 等 ) 2 PC A P

-- Home TOC Slide 1 of 32?? (zone, page), Home TOC Slide 1 of 32

C に必要なコンピュータ知識 C はコンピュータの力を引き出せるように設計 コンピュータの知識が必要

Express5800/120Rb-1 (2002/01/22)

Transcription:

2016.4.1 II ( ) 1 1.1 DRAM RAM DRAM DRAM SRAM RAM SRAM SRAM SRAM SRAM DRAM SRAM SRAM DRAM SRAM 1.2 (DRAM, Dynamic RAM) (SRAM, Static RAM) (RAM Random Access Memory ) DRAM 1 1 1 1 SRAM 4 1 2 DRAM 4 DRAM 3 DRAM 2 C CDROM 1 1 0 2 3 Dynamic RAM SRAM 1

DRAM SRAM SDRAM (Synchronous DRAM) DDR SDRAM (Double Data Rate SDRAM) DRAM 4 C Wikipedia 1.8 SRAM DRAM DRAM SRAM DRAM SRAM (256M 1G bit) (32 64M bit) (50 70 ns) (0.5 5 ns) IC 20-80 80% 20% 1 プロセッサ 大 容 量 低 速 メモリ 小 容 量 高 速 メモリ 1: 4 DDR2 SDRAM, DDR3 SDRAM 2

プロセッサ 命 令 メモリ データメモリ 大 容 量 メモリ( 主 記 憶 ) 2: 20-80 100 98 (cache) 2 1 2 1 2 CPU 1 3

0 1 2 3 4 5 6 7 キャッシュ 0mod 8 = 0 27 mod 8 = 3 31 mod 8 = 7 メインメモリ 0 1 2 3 4 5 6 7 27 28 29 30 31 3: 1.3 1.3.1 1 4 1 8 32 8 32 32KB 32 128 4GB 0 7 0 31 3 (direct map) 3 5 4 4 4 4KB 4GB 6 4 5 6 4GB 32 4GB 32 4

20 アドレス 10 2 120627 512 00 インデックス 有 効 タグ データ 1 20 32 キャッシュメモリ 0 1 512 1 120627 1234567890 1022 1023 = データ ヒット 4: 1 4 2 10 I (9) ALU 5

OS OS 1 4 1. (PC-4) 2. 3. 4. 7 5. PC 8 1 2 3 4 1.3.2 (consistency) (write-through) (write buffer) 1 (write-back) 7 8 OS 6

16 12 2 2 アドレス タグ インデックス bidx bofs 0x1234 0xFFE 1 0 0x5678 0x1 0 0 読 出 しの 例 書 込 みの 例 書 込 みデータ 0x00005555 1 1 0x5678 有 効 書 込 タグ 1 0x1234 デマルチプレクサ 0 1 2 3 0x5555 キャッシュブロック 0x1111 0x2222 0x3333 0x4444 0 1 0xFFE 0xFFF キャッシュ メモリ 比 較 (=) 0 1 2 3 マルチプレクサ ヒット 読 出 しデータ 0x00002222 5: 1.3.2 1 5 1 4 16 4096 1 7

1.4 1.4.1 CPU CPU CPU =(CPU + ) 9 LRU = 9 8

10 [ ] 2% 4% CPI 2 100 36% [ ] I 2% = I 2% 100 = 2.00 I 4% = I 36% 4% 100 = 1.44 I CPI 2 = 2 I + 2.00 I + 1.44 I = 5.44 I 2 I 2.72 5.44 2 = 2.72 11 [ ] 2 [ ] T clock A = 5.44I T clock B = 8.88I T clock 1 2 A B = 1.23 2 1.23 CPU CPU CPI CPI clock per instruction 1 CPI 1 10 4 p.441 11 3 9

CPI 1.3.1 1.5 ( ) (fully associative) 12 (set associative) 1.5.1 n n 6 4-way 1 4 22 6 4:1 12 TLB 10

22 0627 アドレス 8 71 2 00 キャッシュ メモリ インデッ クス 有 効 タグ データ 1 22 32 有 効 タグ データ 1 22 32 有 効 タグ データ 1 22 32 有 効 タグ データ 1 22 32 0 1 71 1 0627 10345678 1 0727 12045678 0 0637 12305678 1 1627 12340678 255 = = = = ヒット 4:1 MUX データ 6: 4-way 71 71 0 LRU(Least Recently Used) 2 (FF) FF 2 FF FF FF LRU 4 1.6 8 11

n=2 adr blk 0x0100 0 fact: sub $sp, $sp, 8 0x0104 1 sw $ra, 4($sp) 0x0108 2 sw $a0, 0($sp) 0x010C 3 slt $t0, $a0, 1 0x0110 4 beq $t0, $zero, L1 0x0114 5 add $v0, $zero, 1 0x0118 6 add $sp, $sp, 8 0x011C 7 jr $ra 0x0120 8 L1: sub $a0, $a0, 1 0x0124 9 jal fact 0x0128 10 lw $a0, 0($sp) 0x012C 11 lw $ra, 4($sp) 0x0130 12 add $sp, $sp, 8 0x0134 13 mul $v0, $a0, $v0 0x0138 14 jr $ra 1.9 1.7 [ ] 4K 4 32 2 4 [ ] 4 16 28 log 4K = 12 32-12-4=16 16 4K = 64K 2 = /2 log(4k/2) = 11 32-11-4=17 17 2 2K = 64K 2 4 = /4 10 18 4 1K = 72K =1 28 28 4K = 112K 12

[ ] CPI 1 1 4GHz 100ns 1 2% 2 5ns 0.5% [ ] 100ns / 0.25ns = 400 clock cycle 1 CPI 1+0.02*400=9 8 CPI 2 1 2 5ns / 0.25 ns = 20 clock cycle 2% 1 0.5% 2 CPI 1 + 0.02 20 + 0.005 400 = 1 + 0.4 + 2 = 3.4 2 9/3.4 = 2.6 (associative memory) 1.8 7 7 SRAM 1 4 ( ) ( ) ROM RAM SRAM ( ) ( ) (1or0) (Vcc) (Tr1) P P ( ) Tr1 P 13

SRAMのメモリセル 構 成 DRAMのメモリセル 構 成 7: SRAM DRAM MYCOM ) 1 0 1.9 0,1,2,3,4,8,9,0,1,2,3,4,8,9,0,1,2,3,4,5,6,7,10,11,12,13,14,10,11,12,13,14 32 8 () m/h ( ) LRU 14

/ () 0 (0) m 1 (0,1) m 2 (0,1,2) m 3 (0,1,2,3) m 4 (0,1,2,3,4) m 8 (0,1,2,3,4,8) m 9 (0,1,2,3,4,8,9) m 0 (1,2,3,4,8,9,0) h 0 1 (2,3,4,8,9,0,1) h 2 (3,4,8,9,0,1,2) h 3 (4,8,9,0,1,2,3) h 19 5 (8,9,0,1,2,3,4,5) m 6 (9,0,1,2,3,4,5,6) m LRU 8 7 (0,1,2,3,4,5,6,7) m 10 (1,2,3,4,5,6,7,10) m 11 (2,3,4,5,6,7,10,11) m 12 (3,4,5,6,7,10,11,12) m 13 (4,5,6,7,10,11,12,13) m 14 (5,6,7,10,11,12,13,14) m 10 (5,6,7,11,12,13,14,10) h 10 11 (5,6,7,12,13,14,10,11) h 12 (5,6,7,13,14,10,11,12) h 13 (5,6,7,14,10,11,12,13) h 14 (5,6,7,10,11,12,13,14) h 15 17 15

2 ((),(),(),()) m/h / ((),(),(),()) 0 ((0),(),(),()) m 1 ((0),(1),(),()) m 2 ((0),(1),(2),()) m 3 ((0),(1),(2),(3)) m 4 ((0,4),(1),(2),(3)) m 8 ((4,8),(1),(2),(3)) m 9 ((4,8),(1,9),(2),(3)) m 0 ((8,0),(1,9),(2),(3)) m 1 ((8,0),(9,1),(2),(3)) h 2 ((8,0),(9,1),(2),(3)) h 3 ((8,0),(9,1),(2),(3)) h 4 ((0,4),(9,1),(2),(3)) m 8 ((4,8),(9,1),(2),(3)) m 9 ((4,8),(1,9),(2),(3)) h 0 ((8,0),(1,9),(2),(3)) m 1 ((8,0),(9,1),(2),(3)) h 2 ((8,0),(9,1),(2),(3)) h 3 ((8,0),(9,1),(2),(3)) h 4 ((0,4),(9,1),(2),(3)) m 5 ((0,4),(1,5),(2),(3)) m 6 ((0,4),(1,5),(2,6),(3)) m 7 ((0,4),(1,5),(2,6),(3,7)) m 10 ((0,4),(1,5),(6,10),(3,7)) m 11 ((0,4),(1,5),(6,10),(7,11)) m 12 ((4,12),(1,5),(6,10),(7,11)) m 13 ((4,12),(5,13),(6,10),(7,11)) m 14 ((4,12),(5,13),(10,14),(7,11)) m 10 ((4,12),(5,13),(14,10),(7,11)) h 11 ((4,12),(5,13),(14,10),(7,11)) h 12 ((4,12),(5,13),(14,10),(7,11)) h 13 ((4,12),(5,13),(14,10),(7,11)) h 14 ((4,12),(5,13),(14,10),(7,11)) h 20 12 16

(,,,,,,,) m/h / (,,,,,,,) 0 (0,,,,,,,) m 1 (0,1,,,,,,) m 2 (0,1,2,,,,,) m 3 (0,1,2,3,,,,) m 4 (0,1,2,3,4,,,) m 8 (8,1,2,3,4,,,) m 9 (8,9,2,3,4,,,) m 0 (0,9,2,3,4,,,) m 1 (0,1,2,3,4,,,) m 2 (0,1,2,3,4,,,) h 3 (0,1,2,3,4,,,) h 4 (0,1,2,3,4,,,) h 8 (8,1,2,3,4,,,) m 9 (8,9,2,3,4,,,) m 0 (0,9,2,3,4,,,) m 1 (0,1,2,3,4,,,) m 2 (0,1,2,3,4,,,) h 3 (0,1,2,3,4,,,) h 4 (0,1,2,3,4,,,) h 5 (0,1,2,3,4,5,,) m 6 (0,1,2,3,4,5,6,) m 7 (0,1,2,3,4,5,6,7) m 10 (0,1,10,3,4,5,6,7) m 11 (0,1,10,11,4,5,6,7) m 12 (0,1,10,11,12,5,6,7) m 13 (0,1,10,11,12,13,6,7) m 14 (0,1,10,11,12,13,14,7) m 10 (0,1,10,11,12,13,14,7) h 11 (0,1,10,11,12,13,14,7) h 12 (0,1,10,11,12,13,14,7) h 13 (0,1,10,11,12,13,14,7) h 14 (0,1,10,11,12,13,14,7) h 21 11 17

2 2.1 13 36 64GB 4GB 8GB 32GB 14 64GB 8GB 15 16 2.2 (virtual memory) 0 0 8GB 0 8G 17 2 2 OS ( 13 14 15 16 10 17 8GB 4GB 0 4GB 4GB 0xF00000000 36 8GB 2 18

仮 想 アドレス ページ0 物 理 アドレス ページ0 ページk ページn ページm 2 次 記 憶 :ハードディスク 8: ( ) 8 8 k 2 2.3 9 9 18 8 18 19

24 仮 想 アドレス 12 仮 想 ページ 番 号 ページ 内 オフセット 変 換 20 12 物 理 ページ 番 号 ページ 内 オフセット 物 理 アドレス 9: 2 8 2 CPU 4KB 16KB 32KB 64KB 2.4 2.4.1 10 1 4 10 64MB 20

24 仮 想 アドレス 12 ページ 表 レジスタ 有 効 仮 想 ページ 番 号 物 理 ページ 番 号 ページ 内 オフセット + ページ 表 0ならページフォールト 1なら 物 理 ページ 番 号 20 物 理 ページ 番 号 12 ページ 内 オフセット 物 理 アドレス 10: 2.4.2 1 2 2 OS 0 LRU 5 10,12,9,7,11,10 8 LRU 12 12 8 LRU OS LRU 2.4.3 11 21

アドレス 上 位 メモリ 空 間 スタック 領 域 ~~ 下 に 伸 びる ~~ 上 に 伸 びる ヒープ 領 域 静 的 データ アドレス 下 位 プログラム 11: 11 2 2.4.4 2.5 TLB 2 1 (Translation-Lookaside Buffer)TLB TLB 12 36 32 12 TLB 22

仮 想 ページ 番 号 有 効 タグ 物 理 ページ 1 1 1 0 1 TLB ページ 表 有 効 物 理 ページ ページ0 物 理 メモリ ページ0 ページn ページm 2 次 記 憶 :ハードディスク 12: (TLB) 1: TLB TLB 16 512 4 8 0.5 1 10 100 0.01 1 % TLB TLB TLB TLB TLB 1 TLB 1 TLB LRU 2.4.2 TLB TLB TLB TLB LRU 2 TBL LRU 1 TLB 1 16 512 TLB LRU TLB TLB 13 23

仮 想 アドレス 35 12 11 0 仮 想 ページ 番 号 ページ 内 オフセット 有 効 24 ダーティ タグ 物 理 ページ 番 号 12 TLB ヒット TLB 20 タグ 部 分 は 連 想 メモリ 物 理 ページ 番 号 ページ 内 オフセット 物 理 アドレス 物 理 アドレスタグ バイト 16 キャッシュインデックス オフセット 14 2 有 効 タグ データ キャッシュ キャッシュ ヒット = 32 データ 13: TLB 13 TLB 14 TLB TLB TLB TLB TLB TLB TLB 14 TLB TLB TLB TLB TLB TLB 100 99 19 19 20-80 20-80 20-80 10-90 5-95 24

仮 想 アドレス Load block to cache TLBミス 例 外 処 理 no no TLBアクセス Hit? Cache read Hit? yes yes no 読 出 しデータ Write? no 書 込 保 護 例 外 処 理 物 理 アドレス yes Write allowed? Load block to cache yes Cache write no yes Hit? 書 込 み, TLBのダーティビットセット 14: TLB, 2.6 MIPS EPC 1 EPC 2.7 A B OS 0 25

OS OS OS OS OS OS OS OS OS A B A B OS 20 B A OS OS 21 20 OS 21 26