Microsoft PowerPoint - ARC-SWoPP2011OkaSlides.pptx

Size: px
Start display at page:

Download "Microsoft PowerPoint - ARC-SWoPP2011OkaSlides.pptx"

Transcription

1 データ値の局所性を利用した ライン共有キャッシュの提案 九州大学大学院 岡慶太郎 福本尚人 井上弘士 村上和彰 1

2 キャッシュメモリの大容量化 マルチコア プロセッサが主流 メモリウォール問題の深刻化 メモリアクセス要求増加 IOピンの制限 大容量の LL(Last Level) キャッシュを搭載 8MB の L3 キャッシュを搭載 Core i7 のチップ写真 * * 2

3 キャッシュメモリの大容量化の問題点 リーク消費電力増加 容量 1MB 8MB で 8 倍 * アクセスレイテンシ増加 容量 1MB 8MB で 2.1 倍 * 大幅な面積増加を伴わず, オフチップメモリアクセス回数を削減する手法が必要 * CACTI によりブロックサイズ 64B, 連想度 8 で実験した結果 3

4 目次 研究背景 着目点 : データ値の局所性 ライン共有キャッシュ 評価 ミス率, 面積,L1ミスペナルティ まとめ 今後の課題 4

5 従来型キャッシュメモリは 容量を無駄遣い!? 従来型キャッシュメモリのキャッシング方法 参照アドレスに基づいてブロックの格納場所を決定 データ値の局所性が高い 仮説 データ値の局所性 : メモリアドレスが異なる多数のデータが同一の値を有する性質 キャッシュ内に同一データ値を有するブロックが多数存在 LL キャッシュメモリ参照アドレスブロックの格納場所インデックスタグラインタグインデックス ブロック : A 書込みブロック 010 キャッシュのレベル間で 011 取り交わすデータ A データ値 : 110 ブロックのデータの値 111 B 5

6 従来型キャッシュメモリは 容量を無駄遣い!? 従来型キャッシュメモリのキャッシング方法 参照アドレスに基づいてブロックの格納場所を決定 データ値の局所性が高い 仮説 データ値の局所性 : メモリアドレスが異なる多数のデータが同一の値を有する性質 キャッシュ内に同一データ値を有するブロックが多数存在 LL キャッシュメモリ参照アドレスブロックの格納場所インデックスタグラインタグインデックス ブロック : A 書込みブロック 010 キャッシュのレベル間で 011 取り交わすデータ A A データ値 : 110 ブロックのデータの値 111 B 6

7 従来型キャッシュメモリにおけるデータ値の局所性分析 キャッシュメモリ内のデータ値の局所性を平均圧縮率を用いて分析 n: ブロック置き換え回数 平均圧縮率が低い程, キャッシュメモリ内のデータ値の局所性が高い キャッシュ容量 :1MB 平均圧圧縮率 ブロックサイズ 64B 32B 16B 8B キャッシュメモリ A B A C B 多くのプログラムでキャッシュメモリ内のデータ値の局所性が高い 7

8 研究概要 着目点 キャッシュメモリ内に同一値を有するデータが多く存在 研究目的 LL キャッシュメモリの面積を大きく増加することなく LLキャッシュミス率を削減 提案手法 同一データ値を有するラインを共有し, 容量を効率的に利用 同容量の従来型キャッシュと比較し最大でミス率を 同容量の従来型キャッシュと比較し, 最大でミス率を 18 ポイント削減可能 8

9 目次 研究背景 着目点 : データ値の局所性 ライン共有キャッシュ 評価 ミス率, 面積,L1ミスペナルティ まとめ 今後の課題 9

10 ライン共有キャッシュの概念 LSC(Line Sharing Cache) 従来型キャッシュ 参照アドレスに基づきブロックを格納するラインを決定 ライン共有キャッシュ 同一データ値を有するブロックを格納するラインを 1 箇所に限定 タグアレイデータアレイタグアレイデータアレイ A A A A タグのエントリ数増加 従来型キャッシュに比べ, より多くのデータ値をキャッシュメモリに格納可能 10

11 解決すべき課題その 1 ~ 如何にしてタグとラインを紐付けるか?~ タグに対応するラインを特定する必要あり 問題点 : 各タグに対応するラインを特定不可能 解決策 : 行番号によるラインの区別と各タグに行ポインタ配置 タグアレイ タグ データアレイ ライン ?? 各タグは対応するラインを特定できない 11

12 解決すべき課題その 1 ~ 如何にしてタグとラインを紐付けるか?~ タグに対応するラインを特定する必要あり 問題点 : 各タグに対応するラインを特定不可能 解決策 : 行番号によるラインの区別と各タグに行ポインタ配置 タグアレイ タグ ?? 行番号 データアレイ ライン 各タグは対応するラインを特定できない 12

13 解決すべき課題その 1 ~ 如何にしてタグとラインを紐付けるか?~ タグに対応するラインを特定する必要あり 問題点 : 各タグに対応するラインを特定不可能 解決策 : 行番号によるラインの区別と各タグに行ポインタ配置 タグ ポインタアレイタグアレイ タグ 行ポインタ 行番号 データアレイ ライン

14 解決すべき課題その 2 ~ 如何にして効率の良いデータ検索を実現するか?~ 書込み動作 : データアレイの全ラインを探索する必要ありイ 問題点 : 検索コストが大 解決策 : データ値を用いたハッシング インデックス参照アドレス タグインデックス 書込みブロック タグ ポインタアレイタグ行ポインタ 行番号 データアレイ み = タ101 一致 書き込ライン デー値の検索

15 解決すべき課題その 2 ~ 如何にして効率の良いデータ検索を実現するか?~ 書込み動作 : データアレイの全ラインを探索する必要ありイ 問題点 : 検索コストが大 解決策 : データ値を用いたハッシング タグ ポインタアレイデータアレイ行番号書インデックスタグ行ポインタき参照アドレス 込ライン みタグインデックス デ ー100 タ11111 値書込みブロック 行番号の のサイズ検 索 行番号とデータ値の下位 3ビット 1111 を対応付けてブロックを配置 15

16 解決すべき課題その 2 ~ 如何にして効率の良いデータ検索を実現するか?~ 書込み動作 : データアレイの全ラインを探索する必要ありイ 問題点 : 検索コストが大 解決策 : データ値を用いたハッシング タグ ポインタアレイデータアレイ行番号インデックスタグ行ポインタ参照アドレス みタグインデックス = 100 値書込みブロック 1001 一致 行番号のサイズ 書込みデータ値の下位 3ビット書込みデータ値がラインに存在 1111 に対応する行番号にアクセス ( データ値ヒット ) 書き込ライン データ の検11111 索16

17 解決すべき課題その 2 ~ 如何にして効率の良いデータ検索を実現するか?~ 書込み動作 : データアレイの全ラインを探索する必要ありイ 問題点 : 検索コストが大 解決策 : データ値を用いたハッシング タグ ポインタアレイ データアレイ インデックスタグ行ポインタライン参照アドレス 行番号を行ポインタに 001 タグインデックス 書込み 書込みブロック 行番号のサイズ 書込みデータ値の下位 3ビット書込みデータ値がラインに存在 1111 に対応する行番号にアクセス ( データ値ヒット ) 17

18 解決すべき課題その3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 タグ ポインタアレイデータアレイインデックスタグ行ポインタ行番号ライン参照アドレス tag index = 100 書込みブロック 一致

19 解決すべき課題その3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 タグ ポインタアレイ インデックスタグ行ポインタ行番号参照アドレス tag index 書込みブロック 行番号のサイズ 書込みデータ値の下位 3ビット 1111 に対応する行番号にアクセス データアレイ ライン ブロックの追出しが必要 書込みデータ値がラインに非存在 ( データ値ミス ) 19

20 解決すべき課題その3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 タグ ポインタアレイデータアレイインデックスタグ行ポインタ行番号ライン参照アドレス tag index 書込みブロック

21 解決すべき課題その 3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 インデックス参照アドレス tag index タグ ポインタアレイタグ行ポインタ 0100 行番号ライン データアレイ ライン 書込みブロック 各行番号に複数のラインを対応付け 21

22 解決すべき課題その3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 インデックス参照アドレス tag index タグ ポインタアレイタグ行ポインタ 0100 行番号ライン データアレイ ライン 書込みブロック 列番号 0 列番号 行番号, 列番号により 1110 ラインを区別

23 解決すべき課題その 3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 インデックス タグ 参照アドレス tag index タグ ポインタアレイ 行ポインタ 列ポインタ 行番号ライン データアレイ ライン 書込みブロック 列番号 0 列番号 列番号を格納するために列ポインタの導入

24 解決すべき課題その 3 ~ 如何にしてデータアレイでの書込み競合を回避するか?~ データアレイ : 各行番号に 1ラインを対応付け 問題点 : ブロックの追出しが頻発 解決策 : データアレイの水平分割と列ポインタの導入 インデックス参照アドレス tag index タグ ポインタアレイ タグ 0100 行ポインタ 列ポインタ 行番号ライン データアレイ ライン 書込みブロック 一致データ値ミス列番号 0 列番号 行番号のサイズ 1100 ブロックを追い出すことなく 1101 書込み 1110 書込みデータ値の下位 2ビット に対応する行番号にアクセス = 00111

25 読出し要求発行後の動作 1. インデックスアクセス 2. タグ比較 3. ポインタ読出し 4. ブロック読出し 読み出し動作 タグ ポインタアレイ インデックスタグ行ポインタ参照アドレス tag index 列ポインタ 行番号ライン データアレイ ライン 列番号 0 列番号 1 25

26 読出し要求発行後の動作 1. インデックスアクセス 2. タグ比較 3. ポインタ読出し 4. ブロック読出し 読み出し動作 タグ ポインタアレイ インデックスタグ行ポインタ参照アドレス tag index 列ポインタ 行番号ライン = 一致 データアレイ ライン 列番号 0 列番号 1 26

27 読出し要求発行後の動作 1. インデックスアクセス 2. タグ比較 3. ポインタ読出し 4. ブロック読出し 読み出し動作 同時に動作可能 タグ ポインタアレイ インデックスタグ行ポインタ参照アドレス tag index 列ポインタ 行番号ライン データアレイ ライン 列番号 0 列番号 1 27

28 読出し要求発行後の動作 1. インデックスアクセス 2. タグ比較 3. ポインタ読出し 4. ブロック読出し 読み出し動作 同時に動作可能 タグ ポインタアレイ インデックスタグ行ポインタ参照アドレス tag index 列ポインタ 行番号ライン データアレイ ライン 列番号 0 列番号

29 従来型キャッシュ VS ライン共有キャッシュ LSC の従来型キャッシュに対する違い 理由 ミス率 減少 データアレイ容量を有効利用 読出しレイテンシ 変化なし タグとポインタを同時に読み出し 書込み 書込みデータ値の探索増加レイテンシ 追出しの動作が複雑化 データアレイに対する書込み回数 減少 データ値ヒットの場合データアレイに対する書込みを行わない 29

30 目次 研究背景 データ値の局所性 ライン共有キャッシュ 評価 ミス率, 面積,L1ミスペナルティ まとめ 今後の課題 30

31 面積 評価指標と求め方 実装に必要な SRAM ビット数で評価 L1 ミスペナルティ モデルにより評価 L2 アクセスレインテンシ キャッシュメモリシミュレータ CACTI キャッシュミス率 従来型キャッシュのミス率と平均圧縮率からの見積もりにより評価 LSC のミス率の評価方法 従来型キャッシュのミス率 マルチコアシミュレータ M5 ベンチマーク プログラム splash2 M5によるシミュレーション L2 アクセストレース 従来型キャッシュの L2 ミス率 ミスス率 容量 平均圧圧縮率 平均圧縮率 容量 LSCのミス率に換算 31

32 評価方法 面積 : ミス率を従来型キャッシュ 8MB における値に固定 ミス率 : データアレイ容量を1MBに固定 L1ミスペナルティ : データアレイ容量を1MBに固定従来型キャッシュ L2 キャッシュュミス率 LSC の容量 LSC 従来型キャッシュ L2 キャッシュサイズ 8MB L2 キャッシシュミス率 従来型キャッシュのミス率 LSC のミス率 必要ビット数 面積の比較ミス率および L1ミスペナルティの比較 LSC データメモリ :1MB M5の評価環境 コア数 8 L1キャッシュ サイズ :32KB, 連想度 :2, ブロックサイズ :64B L2キャッシュ 連想度 :8ブロックサイズ:64B 32

33 キャッシュミス率一定とした場合の面積削減効果 ブロックサイズ 64B, 従来型キャッシュ容量 8MB 圧縮率 必要メモモリ容量 [MB] データアレイ容量 ポインタアレイ容量 タグ容量 52% 面積削減 base LSC base LSC base LSC base LSC base LSC base LSC Cholesky Barnes FFT FMM LUCon OceanCon ベンチマーク プログラム 圧縮率が低い程, 面積を大幅に削減 33

34 キャッシシュミス率 データアレイ容量を一定とした場合の ミス率削減効果ブロックサイズ64B, データアレイ容量 1MB base LSC 圧縮率 0.21 L2 キャッシシュミス率 ミス率を大幅に削減できない ポイント削減 L2キャッシュ容量 [MB] 容量を増加した場合容量を増加するとミス率がすぐに飽和, ミス率の減少幅小 ベンチマーク プログラム すべてのプログラムでミス率を削減 34

35 L2 キャッシシュミス率キャッシシュミス率 データアレイ容量を一定とした場合の ミス率削減効果ブロックサイズ64B, データアレイ容量 1MB base LSC 0.8 圧縮率 ミス率を 18 ポイント削減 L2キャッシュ容量 [MB] 容量を増加する場合, ミス率の減少幅大 ベンチマーク プログラム すべてのプログラムでミス率を削減 35

36 ィ比 L1 ミスペペナルテ データアレイ容量一定とした場合の L1 ミスペナルティ削減効果 ブロックサイズ64B, データアレイ容量 1MB 従来型キャッシュの L1 ミスペナルティで正規化 L1ミスペナルティ 30% 削減 ベンチマーク プログラム アクセス時間を考慮した場合でも L1ミスペナルティを大幅に削減 36

37 まとめ データ値の局所性を利用したライン共有キャッシュを提案 ミス率一定条件において 面積 : 最大 52% 削減 容量一定条件において ミス率 : 最大 18ポイント削減 L1ミスペナルティ : 最大 30% 削減 ライン共有キャッシュの有効性を確認 37

38 今後の課題 ライン共有キャッシュの詳細な評価 キャッシュミス率 アクセスレイテンシ アクセスあたりの消費電力 ライン共有キャッシュの適用範囲を拡張 LSC はデータアレイへの書込み回数を削減 不揮発性メモリに利用 既存研究との比較 38

39 ご清聴ありがとうございました 39

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx 3 次元 DRAM プロセッサ積層実装を 対象としたオンチップ メモリ アーキテクチャの提案と評価 橋口慎哉 小野貴継 ( 現 ) 井上弘士 村上和彰 九州大学大学院システム情報科学府 九州大学大学院システム情報科学研究院 発表手順 研究背景 研究目的 ハイブリッド キャッシュ アーキテクチャ 評価実験 まとめと今後の課題 2 3 次元実装技術 研究背景 グローバル配線長の削減 チップ面積縮小 異なるプロセスを経て製造されたダイ同士の積層

More information

Microsoft PowerPoint - ARCICD07FukumotoSlides.pptx

Microsoft PowerPoint - ARCICD07FukumotoSlides.pptx チップマルチプロセッサにおける データ プリフェッチ効果の分析 福本尚人, 三原智伸九州大学大学院システム情報科学府情報理学専攻 井上弘士, 村上和彰九州大学大学院システム情報科学研究院情報理学部門 2007/6/1 1 発表手順 研究の背景 目的 効果に基づくプリフェッチの分類法 マルチプロセッサ チップマルチプロセッサ 性能モデル式による定性的評価 定量的評価 まとめ 2007/6/1 2 研究の背景

More information

Microsoft PowerPoint - ARCEMB08HayashiSlides.ppt [互換モード]

Microsoft PowerPoint - ARCEMB08HayashiSlides.ppt [互換モード] 演算 / メモリ性能バランスを考慮した CMP 向けオンチップ メモリ貸与法の提案 九州大学 林徹生今里賢一井上弘士村上和彰 1 発表手順 背景 目的 演算 / メモリ性能バランシング 概要 アクセスレイテンシの削減とオーバーヘッド 提案手法の実現方法 着目する命令 (Cell プロセッサへの ) 実装 性能評価 姫野ベンチマーク Susan@MiBench おわりに 2 チップマルチプロセッサ (CMP)

More information

スライド 1

スライド 1 知能制御システム学 画像処理の高速化 OpenCV による基礎的な例 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2007.07.03 リアルタイム処理と高速化 リアルタイム = 高速 ではない 目標となる時間制約が定められているのがリアルタイム処理である.34 ms かかった処理が 33 ms に縮んだだけでも, それによって与えられた時間制約が満たされるのであれば,

More information

スライド 1

スライド 1 東北大学工学部機械知能 航空工学科 2016 年度 5 セメスター クラス C3 D1 D2 D3 計算機工学 13. メモリシステム ( 教科書 8 章 ) 大学院情報科学研究科 鏡慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ レジスタ選択( 復習 ) MIPS の構造 PC 命令デコーダ 次 PC 計算 mux 32x32 ビットレジスタファイル

More information

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2010-ARC-187 No.3 Vol.2010-EMB-15 No /1/28 マルチコアプロセッサのコアごとのアクセス局所性を利用した共有キャッシュの消費電力削減 1 1 L2 キャッシュに共有キャ

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2010-ARC-187 No.3 Vol.2010-EMB-15 No /1/28 マルチコアプロセッサのコアごとのアクセス局所性を利用した共有キャッシュの消費電力削減 1 1 L2 キャッシュに共有キャ マルチコアプロセッサのコアごとのアクセス局所性を利用した共有キャッシュの消費電力削減 1 1 L2 キャッシュに共有キャッシュ方式を用いたマルチコアプロセッサにおいて, ラインごとのコア局所性に着目し, タグ比較の回数を減らすことにより動的な消費電力を削減することを考える. L2 キャッシュの各ラインごとに前回アクセスしたコアの番号を記憶させ, 次回のアクセスに利用する手法を提案する. 本手法の有効性を調べるために,

More information

Microsoft PowerPoint - ICD2011TakadaSlides.pptx

Microsoft PowerPoint - ICD2011TakadaSlides.pptx キャッシュウェイ割り当てと コード配置の同時最適化による メモリアクセスエネルギーの削減 九州大学 高田純司井上弘士京都大学石原亨 2012/8/9 1 目次 研究背景 組込みプロセッサにおけるエネルギー削減の必要性 キャッシュウェイ割り当て 提案手法 キャッシュウェイ割り当てとコード配置の組み合わせ 同時最適化 評価実験 まとめ 2012/8/9 2 組込みプロセッサの課題 研究背景 低消費エネルギー化,

More information

講義計画 1. コンピュータの歴史 1 2. コンピュータの歴史 2 3. コンピュータの歴史 3 4. 論理回路と記憶, 計算 : レジスタとALU 5. 主記憶装置とALU, レジスタの制御 6. 命令セットアーキテクチャ 7. 演習問題 8. パイプライン処理 9. メモリ階層 : キャッシュ

講義計画 1. コンピュータの歴史 1 2. コンピュータの歴史 2 3. コンピュータの歴史 3 4. 論理回路と記憶, 計算 : レジスタとALU 5. 主記憶装置とALU, レジスタの制御 6. 命令セットアーキテクチャ 7. 演習問題 8. パイプライン処理 9. メモリ階層 : キャッシュ 計算機システム Ⅱ キャッシュと仮想記憶 和田俊和 講義計画 1. コンピュータの歴史 1 2. コンピュータの歴史 2 3. コンピュータの歴史 3 4. 論理回路と記憶, 計算 : レジスタとALU 5. 主記憶装置とALU, レジスタの制御 6. 命令セットアーキテクチャ 7. 演習問題 8. パイプライン処理 9. メモリ階層 : キャッシュと仮想記憶 ( 本日 ) 10. 命令レベル並列処理

More information

Microsoft PowerPoint - OS09.pptx

Microsoft PowerPoint - OS09.pptx この資料は 情報工学レクチャーシリーズ松尾啓志著 ( 森北出版株式会社 ) を用いて授業を行うために 名古屋工業大学松尾啓志 津邑公暁が作成しました 主記憶管理 ページング パワーポイント 7 で最終版として保存しているため 変更はできませんが 授業でお使いなる場合は松尾 (matsuo@nitech.ac.jp) まで連絡いただければ 編集可能なバージョンをお渡しする事も可能です 復習 復習 主記憶管理

More information

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ) コンピュータ基礎記憶階層とキャッシュその2 テキスト第 10 章 天野英晴 hunga@am.ics.keio.ac.jp 記憶システム 膨大な容量を持ち アクセス時間 ( 読み出し 書き込み ) が短いメモリが欲しい! しかし 容量の大きい ( ビット単価が安い ) メモリは遅い 高速なメモリは容量が小さいお金にモノを言わせて高速なメモリをたくさん揃えても大容量化の段階で遅くなってしまう そこでアクセスの局所性

More information

Microsoft PowerPoint - No6note.ppt

Microsoft PowerPoint - No6note.ppt 前回 : 管理 管理の目的 : の効率的利用 ( 固定区画方式 可変区画方式 ) しかし, いかに効率よく使ったとしても, 実行可能なプログラムサイズや同時に実行できるプロセス数は実装されているの大きさ ( 容量 ) に制限される 256kB の上で,28kB のプロセスを同時に 4 個実行させることはできないか? 2 256kB の上で,52kB のプロセスを実行させることはできないか? 方策 :

More information

020105.メモリの高機能化

020105.メモリの高機能化 速化記憶階層の活用 5. メモリの高機能化 メモリインタリーブ メモリインタリーブとは 0 2 3 5 バンク番号 0 2 3 5 8 9 0 2 3 5 8 9 20 並列アクセス 主記憶装置をいくつかのバンクに分割し 各バンク毎にアクセスパスを設定する あるバンクの情報に対するアクセスがある時は それに続く全てのバンクの情報を同時にそれぞれのアクセスパスを経由して読み出す バンク数をウェイといい

More information

スライド 1

スライド 1 知能制御システム学 画像処理の高速化 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2008.07.22 今日の内容 ビジュアルサーボのようなリアルタイム応用を考える場合, 画像処理を高速に実装することも重要となる いくつかの基本的な知識を押さえておかないと, 同じアルゴリズムを実行しているのに性能が上がらないということがしばしば生じる 今日は, あくまで普通の

More information

スライド 1

スライド 1 東北大学工学部機械知能 航空工学科 2017 年度 5 セメスター クラス C3 D1 D2 D3 計算機工学 13. メモリシステム ( 教科書 8 章 ) 大学院情報科学研究科 鏡慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ ジスタ( 復習 ) MIPS の構造 PC 次 PC 計算 メモリ 命令デコーダ 制御回路 選択演算選択レmux 32x32

More information

Microsoft PowerPoint - MATE2010Inoue.pptx

Microsoft PowerPoint - MATE2010Inoue.pptx 3 次元積層が可能にする 次世代マイクロプロセッサ アーキテクチャ 九州大学井上こうじ (inoue@ait.kyushu u.a.jp) 1 More Than Moore を目指して なぜ 3 次元積層なのか? 2 半導体も 2D から 3D の世界へ! 複数のダイを同一パッケージに集積 ダイ間を貫通ビア (Through Silion Via:TSV) で接続 Wire bonding (WB)

More information

招待論文 フルスペック 8K スーパーハイビジョン圧縮記録装置の開発 3.3 記録制御機能と記録媒体 144 Gbps の映像信号を 1/8 に圧縮した場合 18 Gbps 程度 の転送速度が要求される さらに音声データやその他のメ タデータを同時に記録すると 記録再生には 20 Gbps 程度 の転送性能が必要となる また 記録媒体は記録装置から 着脱して持ち運ぶため 不慮の落下などにも耐性のあるこ

More information

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の 計算機システム Ⅱ 演習問題学科学籍番号氏名 1. 以下の分の空白を埋めなさい. CPUは, 命令フェッチ (F), 命令デコード (D), 実行 (E), 計算結果の書き戻し (W), の異なるステージの処理を反復実行するが, ある命令の計算結果の書き戻しをするまで, 次の命令のフェッチをしない場合, ( 単位時間当たりに実行できる命令数 ) が低くなる. これを解決するために考案されたのがパイプライン処理である.

More information

スライド 1

スライド 1 東北大学工学部機械知能 航空工学科 2019 年度クラス C D 情報科学基礎 I 13. メモリシステム ( 教科書 8 章 ) 大学院情報科学研究科 鏡慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ ( 復習 ) MIPS の構造 PC 命令デコーダ 次 PC 計算 レジ選ス択タ mux 32x32 ビットレジスタファイル メモリ mux 制御回路

More information

アプリケーションから発行された要求が, の両キャッシュでミスヒットした場合, 両キャッシュには同一のデータが格納される. しかし, 最近アクセスされたデータへのアクセス要求は上で処理され, に届くことはない. 従ってでは 最近アクセスされたデータは近い将来再度アクセスされる可能性が低い という通常と

アプリケーションから発行された要求が, の両キャッシュでミスヒットした場合, 両キャッシュには同一のデータが格納される. しかし, 最近アクセスされたデータへのアクセス要求は上で処理され, に届くことはない. 従ってでは 最近アクセスされたデータは近い将来再度アクセスされる可能性が低い という通常と マルチメディア, 分散, 協調とモバイル (DICOMO214) シンポジウム 平成 26 年 7 月 二重キャッシュ環境における負の参照の時間的局所性を考慮したキャッシュ管理手法 1 杉本洋輝 1 山口実靖 近年, クラウドコンピューティングの普及に伴い仮想化環境の重要性が高まっている. 仮想化環境下において, ( 下位キャッシュ ) へのアクセスは ( 上位キャッシュ ) を介して行われる. このような二重キャッシュ環境下において上位キャッシュの置換アルゴリズムに

More information

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ) 今回は前回の続きでキャッシュの書き込みポリシー 性能の検討をやって 仮想記憶を紹介します 1 ではメモリの基本がわかったところでキャッシュの話をしましょう キャッシュとは頻繁にアクセスされるデータ ( 命令もデータの一種と考える ) を入れておく小規模高速なメモリを指します 小銭の Cash ではなく Cache( 貴重なものを入れておく小物入れ ) なのでご注意ください この言葉はコンピュータの世界で大変有名になったので

More information

hpc141_shirahata.pdf

hpc141_shirahata.pdf GPU アクセラレータと不揮発性メモリ を考慮した I/O 性能の予備評価 白幡晃一 1,2 佐藤仁 1,2 松岡聡 1 1: 東京工業大学 2: JST CREST 1 GPU と不揮発性メモリを用いた 大規模データ処理 大規模データ処理 センサーネットワーク 遺伝子情報 SNS など ペタ ヨッタバイト級 高速処理が必要 スーパーコンピュータ上での大規模データ処理 GPU 高性能 高バンド幅 例

More information

Microsoft Word LenovoSystemx.docx

Microsoft Word LenovoSystemx.docx Lenovo System x シリーズ データベースサーバー移行時の ハードウェア選定のポイント 2015 年 5 月作成 1 目次 1) 本ガイドの目的... 3 2) System x3550 M3 と x3550 M5 の比較ポイント... 3 CPU コア数の増加... 4 仮想化支援技術の性能向上... 4 メモリモジュールの大容量化... 5 低消費電力化... 5 ストレージの大容量化と搭載可能数の増加...

More information

定 義 アクセス 要 求 を 発 行 する 機 構 と,その 供 給 に 応 える 機 構 との 中 間 に 位 置 し,すべての 要 求 を 検 知 して 処 理 するよう 構 築 される. キャッシュは 選 択 されたデータの 局 所 的 なコピーを 保 持 し, 可 能 な 場 合 にはアクセ

定 義 アクセス 要 求 を 発 行 する 機 構 と,その 供 給 に 応 える 機 構 との 中 間 に 位 置 し,すべての 要 求 を 検 知 して 処 理 するよう 構 築 される. キャッシュは 選 択 されたデータの 局 所 的 なコピーを 保 持 し, 可 能 な 場 合 にはアクセ キャッシュとキャッシュ 技 術 71 定 義 アクセス 要 求 を 発 行 する 機 構 と,その 供 給 に 応 える 機 構 との 中 間 に 位 置 し,すべての 要 求 を 検 知 して 処 理 するよう 構 築 される. キャッシュは 選 択 されたデータの 局 所 的 なコピーを 保 持 し, 可 能 な 場 合 にはアクセス 要 求 にこたえる. 通 常 のメモリ 機 構 より 高 速

More information

2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹

2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹 ネットワークシステム B- 6-164 DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹 早稲田大学基幹理工学研究科情報理工学専攻 1 研究の背景 n インターネットトラフィックが増大 世界の IP トラフィックは 2012

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション コンピュータアーキテクチャ 第 13 週 割込みアーキテクチャ 2013 年 12 月 18 日 金岡晃 授業計画 第 1 週 (9/25) 第 2 週 (10/2) 第 3 週 (10/9) 第 4 週 (10/16) 第 5 週 (10/23) 第 6 週 (10/30) 第 7 週 (11/6) 授業概要 2 進数表現 論理回路の復習 2 進演算 ( 数の表現 ) 演算アーキテクチャ ( 演算アルゴリズムと回路

More information

Microsoft PowerPoint - No15›¼‚z‰L›¯.ppt

Microsoft PowerPoint - No15›¼‚z‰L›¯.ppt メモリ アーキテクチャ 3 仮想記憶 計算機アーキテクチャ ( 第 15 回目 ) 今井慈郎 (imai@eng.kagawa-u.ac.jp) 仮想記憶とは コンピュータ上に実装されている主記憶よりも大きな記憶領域を仮想的に提供する仕組み メモリ空間の一部をハードディスク装置等の大容量外部記憶にマッピングし実装したメモリ量以上のメモリ空間を利用できる環境をユーザに提供 実装したメモリ : 実記憶

More information

Microsoft PowerPoint - arc5

Microsoft PowerPoint - arc5 工学部講義 (5) 坂井 修一 東京大学大学院情報理工学系研究科電子情報学専攻東京大学工学部電子情報工学科 / 電気電子工学科 はじめに キャッシュ はじめに 本講義の目的 の基本を学ぶ 時間場所 火曜日 8:40-10:10 工学部 2 号館 241 ホームページ ( ダウンロード可能 ) url: http://www.mtl.t.u-tokyo.ac.jp/~sakai/hard/ 教科書 坂井修一

More information

Microsoft PowerPoint - os ppt [互換モード]

Microsoft PowerPoint - os ppt [互換モード] 4. メモリ管理 (1) 概要メモリ管理の必要性静的メモリ管理と動的メモリ管理スワッピング, 仮想記憶ページングとセグメンテーション 2008/5/ 20 メモリ管理 (1) 1 メモリはコンピュータの 5 大構成要素 装置 ( キーボード, マウス ) CPU ( 中央演算装置 ) 出 装置 ( モニタ, プリンタ ) 主記憶装置 ( メインメモリ ) 外部記憶装置 (HDD) 2008/5/ 20

More information

ICDE’15 勉強会 R24-4: R27-3 (R24:Query Processing 3, R27 Indexing)

ICDE’15 勉強会 R24-4:  R27-3 (R24:Query Processing 3, R27 Indexing) R24-4: The DBMS - your Big Data Sommelier (R24: Query Processing 3) R27-3: A Comparison of Adaptive Radix Trees and Hash Tables (R27: Indexing) 小山田 (NEC) ICDE 15 勉強会 R24-4: The DBMS - your Big Data Sommelier

More information

Operating System 仮想記憶

Operating System 仮想記憶 Operating System 仮想記憶 2018-12 記憶階層 高速 & 小容量 ( 高価 ) レジスタ アクセスタイム 数ナノ秒 容量 ~1KB CPU 内キャッシュ (SRAM) 数ナノ秒 1MB 程度 ランダムアクセス 主記憶 (DRAM) 数十ナノ秒 数 GB 程度 ランダムアクセス フラッシュメモリ (SSD) 約 100 万倍 シーケンシャルアクセス 磁気ディスク (HDD) 数十ミリ秒

More information

Microsoft PowerPoint - No7note.ppt

Microsoft PowerPoint - No7note.ppt 仮想記憶 (2) 実際に存在する主記憶 ( 物理メモリ ) の容量に制限されない 仮想的な記憶空間 をユーザに提供する 仮想記憶の基本アイディア 主記憶に入りきらない大きなプログラムでも, ある時点で実行されているのはプログラムの一部のみ, 必要となるデータも一時には一部のデータのみ ( 参照の局所性 ) プログラム全体はディスク装置に入れておき, 実行時に必要な部分を主記憶にもってくればよい 主記憶容量

More information

Microsoft PowerPoint - sp ppt [互換モード]

Microsoft PowerPoint - sp ppt [互換モード] システムプログラム概論 メモリ管理 (1) 第 x 講 : 平成 20 年 10 月 15 日 ( 水 ) 2 限 S1 教室 今日の講義概要 メモリ管理の必要性 静的メモリ管理と動的メモリ管理 スワッピング, 仮想記憶 ページングとセグメンテーション 中村嘉隆 ( なかむらよしたか ) 奈良先端科学技術大学院大学助教 y-nakamr@is.naist.jp http://narayama.naist.jp/~y-nakamr/

More information

DRAM SRAM SDRAM (Synchronous DRAM) DDR SDRAM (Double Data Rate SDRAM) DRAM 4 C Wikipedia 1.8 SRAM DRAM DRAM SRAM DRAM SRAM (256M 1G bit) (32 64M bit)

DRAM SRAM SDRAM (Synchronous DRAM) DDR SDRAM (Double Data Rate SDRAM) DRAM 4 C Wikipedia 1.8 SRAM DRAM DRAM SRAM DRAM SRAM (256M 1G bit) (32 64M bit) 2016.4.1 II ( ) 1 1.1 DRAM RAM DRAM DRAM SRAM RAM SRAM SRAM SRAM SRAM DRAM SRAM SRAM DRAM SRAM 1.2 (DRAM, Dynamic RAM) (SRAM, Static RAM) (RAM Random Access Memory ) DRAM 1 1 1 1 SRAM 4 1 2 DRAM 4 DRAM

More information

OS

OS Operatig System 仮想記憶 2017-12 記憶階層 高速 & 小容量 ( 高価 ) レジスタ アクセスタイム 数ナノ秒 容量 ~1KB ランダムアクセス ランダムアクセス CPU 内キャッシュ (SRAM) 主記憶 (DRAM) フラッシュメモリ 数ナノ秒 数十ナノ秒 1MB 程度 数 GB 程度 シーケンシャルアクセス 磁気ディスク (HDD) 光磁気ディスク (CD-R DVD-RW

More information

MMUなしプロセッサ用Linuxの共有ライブラリ機構

MMUなしプロセッサ用Linuxの共有ライブラリ機構 MMU なしプロセッサ用 Linux の共有ライブラリ機構 大谷浩司 高岡正 近藤政雄 臼田尚志株式会社アックス はじめに μclinux には 仮想メモリ機構がないので共有ライブラリ機構が使えない でもメモリ消費抑制 ストレージ消費抑制 保守性の向上のためには 欲しい 幾つかの実装があるが CPU ライセンス 機能の制限のためにそのまま利用できない RidgeRun 社 (Cadenux 社 )

More information

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ) 今までは CPU の設計に注力して来ました これからしばらくコンピュータの記憶システムについて紹介します 1 コンピュータの記憶システムに必要なことは容量とアクセスの高速性です 簡単に言えば 膨大な記憶容量を持っていて 瞬時に読み書きできるメモリが理想のメモリです しかし 残念なことに容量の大きい すなわちビット単価の安いメモリは遅く 高速なメモリほど容量が小さいです ではお金が無限にあるとして 高速なメモリを山ほどそろえれば

More information

hard5.pptx

hard5.pptx (5) 坂井 修一 東京大学大学院情報理工学系研究科電子情報学専攻東京大学工学部電子情報工学科 / 電気電子工学科 はじめに 工学部講義 はじめに 本講義の目的 の基本を学ぶ 時間場所 火曜日 8:40-10:10 工学部 2 号館 241 ホームページ ( ダウンロード可能 ) url: http://www.mtl.t.u-tokyo.ac.jp/~sakai/hard/ 教科書 坂井修一 (

More information

ソフトウェア基礎技術研修

ソフトウェア基礎技術研修 マルチサイクルを用いた実現方式 ( 教科書 5. 節 ) マルチサイクル方式 () 2 つのデータパス実現方式 単一クロックサイクル : 命令を クロックサイクルで処理 マルチクロックサイクル : 命令を複数クロックサイクルで処理 単一クロックサイクル方式は処理効率が悪い. CLK 処理時間 命令命令命令命令命令 時間のかかる命令にクロック サイクル時間をあわさなければならない. 余り時間の発生 クロック

More information

本文ALL.indd

本文ALL.indd Intel Xeon プロセッサにおける Cache Coherency 時間の性能測定方法河辺峻田口成美古谷英祐 Intel Xeon プロセッサにおける Cache Coherency 時間の性能測定方法 Performance Measurement Method of Cache Coherency Effects on an Intel Xeon Processor System 河辺峻田口成美古谷英祐

More information

富士通セミコンダクタープレスリリース 2009/05/19

富士通セミコンダクタープレスリリース 2009/05/19 [ デバイス ] 2009 年 5 月 19 日富士通マイクロエレクトロニクス株式会社 世界初!125 動作の SiP 向け低消費電力メモリを新発売 ~ メモリの耐熱性向上により 消費電力の大きな高性能デジタル家電に最適 ~ 富士通マイクロエレクトロニクス株式会社 ( 注 1) は DDR SDRAM インターフェースを持つメモリでは世界で初めて動作温度範囲を 125 まで拡張したコンシューマ FCRAM(

More information

Microsoft PowerPoint - 6.memory.ppt

Microsoft PowerPoint - 6.memory.ppt 6 章半導体メモリ 広島大学岩田穆 1 メモリの分類 リードライトメモリ : RWM リードとライトができる ( 同程度に高速 ) リードオンリメモリ : ROM 読み出し専用メモリ, ライトできない or ライトは非常に遅い ランダムアクセスメモリ : RAM 全番地を同時間でリードライトできる SRAM (Static Random Access Memory) 高速 DRAM (Dynamic

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Oracle GRID Center Flash SSD + 最新ストレージと Oracle Database で実現するデータベース統合の新しい形 2011 年 2 月 23 日日本オラクル Grid Center エンジニア岩本知博 進化し続けるストレージ関連技術 高速ストレージネットワークの多様化 低価格化 10GbE FCoE 8Gb FC ディスクドライブの多様化および大容量 / 低価格化

More information

001 No.3/12 1 1 2 3 4 5 6 4 8 13 27 33 39 001 No.3/12 4 001 No.3/12 5 001 No.3/12 6 001 No.3/12 7 001 8 No.3/12 001 No.3/12 9 001 10 No.3/12 001 No.3/12 11 Index 1 2 3 14 18 21 001 No.3/12 14 001 No.3/12

More information

Microsoft Word - swopp04.doc

Microsoft Word - swopp04.doc 不正プログラムの実行防止を目的とする オンチップ キャッシュ アーキテクチャ 井上弘士 本稿では, コンピュータ システムの安全性向上を目的とし, それを実現するためのアーキテクチャ アプローチとしてセキュア キャッシュ (SCache) を提案する. また, その安全性, 性能, ならびに, 消費エネルギーに関する評価を行う. 近年, 多くのコンピュータ ウィルスはバッファ オーバフローを引き起こし,

More information

2.

2. 2. 10 2. 2. 1995/12006/111995/42006/12 2. 10 1995120061119954200612 02505 025 05 025 02505 0303 02505 250100 250 200 100200 5010050 100200 100 100 50100 100200 50100 10 75100100 0250512 02505 1 025051205

More information

PowerPoint Presentation

PowerPoint Presentation ストレージの常識を変えた! ニンブルストレージのアーキテクチャー 企業システムがストレージに抱える課題 アプリケーションパフォーマンス不足 増え続けるデータ 仮想マシン アプリケーションデータ管理の複雑化 Compute Network 20X 10X 40-45% * CRM ERP CRM ERP CRM CRM ERP CRM Storage Same 年間データ増加率 CRM ERP CRM

More information

Microsoft PowerPoint - OS07.pptx

Microsoft PowerPoint - OS07.pptx この資料は 情報工学レクチャーシリーズ松尾啓志著 ( 森北出版株式会社 ) を用いて授業を行うために 名古屋工業大学松尾啓志 津邑公暁が作成しました 主記憶管理 主記憶管理基礎 パワーポイント 27 で最終版として保存しているため 変更はできませんが 授業でお使いなる場合は松尾 (matsuo@nitech.ac.jp) まで連絡いただければ 編集可能なバージョンをお渡しする事も可能です 復習 OS

More information

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

Microsoft PowerPoint - sales2.ppt

Microsoft PowerPoint - sales2.ppt 最適化とは何? CPU アーキテクチャに沿った形で最適な性能を抽出できるようにする技法 ( 性能向上技法 ) コンパイラによるプログラム最適化 コンパイラメーカの技量 経験量に依存 最適化ツールによるプログラム最適化 KAP (Kuck & Associates, Inc. ) 人によるプログラム最適化 アーキテクチャのボトルネックを知ること 3 使用コンパイラによる性能の違い MFLOPS 90

More information

高速バックボーンネットワークにおける公平性を考慮した階層化パケットスケジューリング方式

高速バックボーンネットワークにおける公平性を考慮した階層化パケットスケジューリング方式 Advanced Network Architecture Research Group 高速バックボーンネットワークにおける 公平性を考慮した 階層化パケットスケジューリング方式 大阪大学大学院基礎工学研究科情報数理系専攻博士前期課程 牧一之進 発表内容 研究の背景 研究の目的 階層化パケットスケジューリング方式の提案 評価モデル シミュレーションによる評価 まとめと今後の課題 研究の背景 インターネットのインフラ化

More information

スライド タイトルなし

スライド タイトルなし 2019. 7.18 Ibaraki Univ. Dept of Electrical & Electronic Eng. Keiichi MIYAJIMA 今後の予定 7 月 18 日メモリアーキテクチャ1 7 月 22 日メモリアーキテクチャ2 7 月 29 日まとめと 期末テストについて 8 月 5 日期末試験 メモリアーキテクチャ - メモリ装置とメモリアーキテクチャ - メモリアーキテクチャメモリ装置とは?

More information

なる 次元積層 L2 キャッシュのリーク消費電力増加問題 一般にコアの温度分布はそのコアが割り当てられているプログラムによって異なる. した がって, マルチプログラム実行を考えた場合, コアひとつひとつの温度分布が異なる. この ため, 上層のキャッシュメモリの温度分布は, 下層コア

なる 次元積層 L2 キャッシュのリーク消費電力増加問題 一般にコアの温度分布はそのコアが割り当てられているプログラムによって異なる. した がって, マルチプログラム実行を考えた場合, コアひとつひとつの温度分布が異なる. この ため, 上層のキャッシュメモリの温度分布は, 下層コア 温度を考慮した 3 次元積層 LSI 向け低消費エネルギー L2 キャッシュの提案 阿部祐希 1 花田高彬 1 井上弘士 2 村上和彰 2 本稿では, 温度を考慮した 3 次元積層 L2 キャッシュ向けバンク電源遮断による消費エネルギー削減手法について検討し, 有効性評価を行う.3 次元積層 L2 キャッシュは, 垂直方向に隣接するコアの熱伝導のため, 平面実装時の L2 キャッシュと比較して高温となり,

More information

Oracle Web CacheによるOracle WebCenter Spacesパフォーマンスの向上

Oracle Web CacheによるOracle WebCenter Spacesパフォーマンスの向上 Oracle ホワイト ペーパー 2010 年 2 月 Oracle Web Cache による Oracle WebCenter Spaces パフォーマンスの向上 免責事項 以下の事項は 弊社の一般的な製品の方向性に関する概要を説明するものです また 情報提供を唯一の目的とするものであり いかなる契約にも組み込むことはできません 以下の事項は マテリアルやコード 機能を提供することをコミットメント

More information

Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2016 年 06 月 Arcserve Japan Ver

Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2016 年 06 月 Arcserve Japan Ver Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2016 年 06 月 Arcserve Japan Ver. 1.1 1 はじめに 本資料ではバックアップ要件に基づき Arcserve Unified Data Protection(UDP) の 管理サーバ と 復 旧ポイントサーバ を導入するサーバスペックの見積もり例を記載しています 見積もり例はバックアップ対象容量を

More information

Vol.-ARC-8 No.8 Vol.-OS- No.8 // DRAM DRAM DRAM DRAM ) DRAM. DRAM. ) DRAM DRAM DRAM DRAM DRAM SRAM DRAM MB B MB DRAM SRAM.. DRAM DRAM SRAM DRAM SRAM C

Vol.-ARC-8 No.8 Vol.-OS- No.8 // DRAM DRAM DRAM DRAM ) DRAM. DRAM. ) DRAM DRAM DRAM DRAM DRAM SRAM DRAM MB B MB DRAM SRAM.. DRAM DRAM SRAM DRAM SRAM C IPSJ SIG Technical Report Vol.-ARC-8 No.8 Vol.-OS- No.8 // DRAM- DRAM DRAM DRAM % % On-Chip Memory Architecture for DRAM Stacking Microprocessors SHINYA HASHIGUCHI, TAKATSUGU ONO, KOJI INOUE and KAZUAKI

More information

Microsoft PowerPoint - yamagata.ppt

Microsoft PowerPoint - yamagata.ppt グリッド上におけるにおける仮想計算 機を用いたいたジョブジョブ実行環境 構築システムシステムの高速化 山形育平 高宮安仁 中田秀基, 松岡聡, : 東京工業大学 : 産業技術総合研究所 : 国立情報学研究所 1 背景 グリッド技術の普及 複数ユーザがネットワーク接続された計算機資源を共有する機会が増加 ユーザが利用する OS やライブラリが多様化 各計算機にインストールされている必要がある 各計算機間で管理ポリシーが異なる

More information

Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2018 年 10 月 Arcserve Japan Ver

Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2018 年 10 月 Arcserve Japan Ver Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2018 年 10 月 Arcserve Japan Ver. 1.2 1 はじめに 本資料ではバックアップ要件に基づき Arcserve Unified Data Protection(UDP) の 管理サーバ と 復 旧ポイントサーバ を導入するサーバスペックの見積もり例を記載しています 見積もり例はバックアップ対象容量を

More information

< B8CDD8AB B83685D>

< B8CDD8AB B83685D> () 坂井 修一 東京大学大学院情報理工学系研究科電子情報学専攻東京大学工学部電子情報工学科 / 電気電子工学科 はじめに アウトオブオーダ処理 工学部講義 はじめに 本講義の目的 の基本を学ぶ 場所 火曜日 8:40-0:0 工学部 号館 4 ホームページ ( ダウンロード可能 ) url: http://www.mtl.t.u-tokyo.ac.jp/~sakai/hard/ 教科書 坂井修一

More information

目次 1. はじめに 用語説明 対象アダプタ P HBA/2P HBAで異なる性能 付録 ( 性能測定環境 ) P HBAでの性能測定環境 P HBAでの性能測定環境 本書の

目次 1. はじめに 用語説明 対象アダプタ P HBA/2P HBAで異なる性能 付録 ( 性能測定環境 ) P HBAでの性能測定環境 P HBAでの性能測定環境 本書の ホワイトペーパー Hitachi Gigabit Fibre Channel アダプタ - 16G FC アダプタに搭載される FC ポート数の性能への影響 について - 2014 年 4 月発行 株式会社日立製作所 1 / 9 Copyright 2014 Hitachi, Ltd. All rights reserved 目次 1. はじめに... 3 2. 用語説明... 4 3. 対象アダプタ...

More information

038_h01.pdf

038_h01.pdf 04 12Gb/ & PCIe Gen3 RAID P.09 P.16 P.12 P.13 P.10 P.14 P.12 P.12 P.16 P.08 P.09 P.10 P.14 P.16 P.09 12Gb/ & PCIe Gen3 RAID 05 12Gb/秒 & PCIe Gen3 6Gb/秒 & PCIe Gen3 6Gb/秒 & PCIe Gen3 Adaptec 7シリーズRAIDアダプタファミリ

More information

共有辞書を用いた 効率の良い圧縮アルゴリズム

共有辞書を用いた 効率の良い圧縮アルゴリズム 大規模テキストに対する 共有辞書を用いた Re-Pair 圧縮法 Variable-to-Fixed-Length Encoding for Large Texts Using Re-Pair Algorithm with Efficient Shared Dictionaries 関根渓, 笹川裕人, 吉田諭史, 喜田拓也 北海道大学大学院情報科学研究科 1 背景 : 巨大なデータ 計算機上で扱うデータの巨大化.

More information

メモリ管理

メモリ管理 メモリ管理 (1) メモリ 思い出そう プログラムの実行のために, ありとあらゆるものがメモリに格納されなくてはならなかったことを グローバル変数, 配列 局所変数 配列 ( スタック ) 実行中に確保される領域 (malloc, new) プログラムのコード メモリの 管理 とは 誰が, メモリの どの部分を, 今, 使ってよいかを記憶しておき, メモリ割り当て要求 にこたえることができるようにすること

More information

SDRAM および DRAM の メモリ システムの概要

SDRAM および DRAM の メモリ システムの概要 CHAPTER 製品番号 :MEM-NPE-3MB= MEM-NPE-64MB= MEM-NPE-8MB= MEM-SD-NPE-3MB= MEM-SD-NPE-64MB= MEM-SD-NPE-8MB= MEM-SD-NSE-56MB= MEM-NPE-400-8MB= MEM-NPE-400-56MB= MEM-NPE-400-5MB= NPE-00= NPE-50= NPE-75= NPE-00=

More information

EMC Data Domain SISL Scaling Architecture

EMC Data Domain SISL Scaling Architecture ホワイト ペーパー 詳細レビュー 要約 数十年にわたり テープはその低コストによって最も有力なデータ保護のストレージ メディアであり続けてきましたが その地位はディスク ベースの重複排除ストレージ システムによって確実に失われつつあります EMC Data Domain システムの CPU 中心の設計は ボトルネックであるディスク I/O の負荷を解消しました 過去 20 年間で ディスクは約 10

More information

平成20年度成果報告書

平成20年度成果報告書 ベンチマークレポート - データグリッド Caché 編 - 平成 22 年 9 月 グリッド協議会先端金融テクノロジー研究会ベンチマーク WG - i - 目次 1. CACHÉ (INTERSYSTEMS)... 1 1.1 Caché の機能概要... 1 1.2 Caché の評価結果... 2 1.2.1 ベンチマーク実行環境... 2 1.2.2 評価シナリオ: 事前テスト... 3 -

More information

CheckPoint Endpoint Security メトロリリース製品について 株式会社メトロ 2018 年 07 月 25 日

CheckPoint Endpoint Security メトロリリース製品について 株式会社メトロ 2018 年 07 月 25 日 CheckPoint Endpoint Security メトロリリース製品について 株式会社メトロ 2018 年 07 月 25 日 製品ラインナップについて リリースするバージョンと機能について バージョン表記タイプ利 可能機能 Endpoint Security E80.83 (R77.30 サーバ ) E80.83 クライアントサーバ FDE ME Remote Access Anti-Malware

More information

スライド 1

スライド 1 NetApp 2009 年 9 月 新製品情報 スライド内で 予定 となっている情報は未確定情報のため 参考としてください 2009/09/15 マーケティング 1 部 SBG NetApp 担当 目次 1. FAS2040 ~NEW ストレージ筐体 ~ 2. DS4243 ~NEW ディスクシェルフ ~ 3. PAMⅡ ~NEW パフォーマンス UP 用モジュール ~ 2 1. FAS2040 2009

More information

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ) コンピュータ基礎記憶階層とキャッシュテキスト第 10 章 天野英晴 hunga@am.ics.keio.ac.jp 記憶システム 膨大な容量を持ち アクセス時間 ( 読み出し 書き込み ) が短いメモリが欲しい! しかし 容量の大きい ( ビット単価が安い ) メモリは遅い 高速なメモリは容量が小さいお金にモノを言わせて高速なメモリをたくさん揃えても大容量化の段階で遅くなってしまう そこでアクセスの局所性

More information

メモリと記憶装置 2

メモリと記憶装置 2 インターフェイス設計論 1 鳥取大学工学研究科菅原一孔 メモリと記憶装置 2 メモリと記憶装置 コンピュータシステムにおいて重要な構成要素 : メモリ 基本メモリ方式 : 物理メモリ, 仮想メモリ, キャッシュ プログラマのメモリの想定 メインメモリに焦点アーキテクトの観点 データを保存するための半導体ディジタル装置 メモリの技術と構造 3 メモリ技術の特徴 メモリの揮発性 電源停止後のデータの保持

More information

Microsoft Word - FORMAT.EXE使用説明.doc

Microsoft Word - FORMAT.EXE使用説明.doc セキュリティソフトウェア USB Flash Disk フォーマットツール使用説明 USB Flash Disk フォーマットツール ( 以下 FORMAT.EXE ) を使用するとフラッシュドライブにパスワードで保護されたセキュリティエリアを設定することができます 対応環境 Microsoft Windows ME 2000 Professional Windows XP Home & Professional

More information

Microsoft PowerPoint - 11_4-4-5pagerepl.pptx

Microsoft PowerPoint - 11_4-4-5pagerepl.pptx オペレーティングシステム 11 4.4 ページ置き換えアルゴリズム 4.5 ページ置き換えアルゴリズムのモデル化 前提 一度でも書き込みがあると修正 (modified,dirty) ビットを 1 にする リセットされない 参照されると参照ビットを 1 にする 定期的に 又はページフォルト時に OS への割込みが起こり 参照ビットは に戻される Operating System 216 4.4 Page

More information

router_cachehit.eps

router_cachehit.eps 人気度推定を用いたキャッシュ方式とネットワーク誘導型キャッシュ発見方式の融合 柳生智彦 (NEC / 電通大 ), 藤井厚太朗 ( 電通大 ) 情報指向ネットワーク技術時限研究会 2015/4/7 研究背景 増加するトラフィック モバイルデータトラヒック総量は 5 年間で 10 倍に [1] WEB やビデオなどコンテンツ流通が大半 現在, コンテンツ流通はトラヒックの約半分で毎年 69% 増加 増え続けるトラヒックへ対応

More information

Microsoft PowerPoint - 11Web.pptx

Microsoft PowerPoint - 11Web.pptx 計算機システムの基礎 ( 第 10 回配布 ) 第 7 章 2 節コンピュータの性能の推移 (1) コンピュータの歴史 (2) コンピュータの性能 (3) 集積回路の進歩 (4) アーキテクチャ 第 4 章プロセッサ (1) プロセッサの基本機能 (2) プロセッサの構成回路 (3) コンピュータアーキテクチャ 第 5 章メモリアーキテクチャ 1. コンピュータの世代 計算する機械 解析機関 by

More information

CLEFIA_ISEC発表

CLEFIA_ISEC発表 128 ビットブロック暗号 CLEFIA 白井太三 渋谷香士 秋下徹 盛合志帆 岩田哲 ソニー株式会社 名古屋大学 目次 背景 アルゴリズム仕様 設計方針 安全性評価 実装性能評価 まとめ 2 背景 AES プロジェクト開始 (1997~) から 10 年 AES プロジェクト 攻撃法の進化 代数攻撃 関連鍵攻撃 新しい攻撃法への対策 暗号設計法の進化 IC カード, RFID などのアプリケーション拡大

More information

JA2008

JA2008 A1 1 10 vs 3 2 1 3 2 0 3 2 10 2 0 0 2 1 0 3 A2 3 11 vs 0 4 4 0 0 0 0 0 3 6 0 1 4 x 11 A3 5 4 vs 5 6 5 1 0 0 3 0 4 6 0 0 1 0 4 5 A4 7 11 vs 2 8 8 2 0 0 0 0 2 7 2 7 0 2 x 11 A5 9 5 vs 3 10 9 4 0 1 0 0 5

More information

トランスポート層 TCP輻輳制御(3.7)

トランスポート層 TCP輻輳制御(3.7) 情報指向ネットワークへの適正と実現可能性を有する に基づいた置換方式の提案と評価 大岡睦, オムスーヨン, 阿多信吾, 村田正幸 大阪大学大学院情報科学研究科 大阪市立大学大学院工学研究科 発表内容 研究背景 ICN ルータにおけるキャッシング 置換方式の課題 提案手法 CUSH ( Usig Switchig Hash-tables) 評価 ネットワークトラフィックに適した戦略 ルータで実現可能な低コストの実装

More information

今週の進捗

今週の進捗 Virtualize APIC access による APIC フック手法 立命館大学富田崇詠, 明田修平, 瀧本栄二, 毛利公一 2016/11/30 1 はじめに (1/2) マルウェアの脅威が問題となっている 2015年に4 億 3000 万以上の検体が新たに発見されている マルウェア対策にはマルウェアが持つ機能 挙動の正確な解析が重要 マルウェア動的解析システム : Alkanet 仮想計算機モニタのBitVisorの拡張機能として動作

More information

報道機関各位 平成 30 年 5 月 14 日 東北大学国際集積エレクトロニクス研究開発センター 株式会社アドバンテスト アドバンテスト社製メモリテスターを用いて 磁気ランダムアクセスメモリ (STT-MRAM) の歩留まり率の向上と高性能化を実証 300mm ウェハ全面における平均値で歩留まり率の

報道機関各位 平成 30 年 5 月 14 日 東北大学国際集積エレクトロニクス研究開発センター 株式会社アドバンテスト アドバンテスト社製メモリテスターを用いて 磁気ランダムアクセスメモリ (STT-MRAM) の歩留まり率の向上と高性能化を実証 300mm ウェハ全面における平均値で歩留まり率の 報道機関各位 平成 30 年 5 月 1 日 東北大学国際集積エレクトロニクス研究開発センター 株式会社アドバンテスト アドバンテスト社製メモリテスターを用いて 磁気ランダムアクセスメモリ (STT-MRAM) の歩留まり率の向上と高性能化を実証 300mm ウェハ全面における平均値で歩留まり率の向上 (91% から 97%) と 高速動作特性の向上を実証する実験に成功 標記について 別添のとおりプレスリリースいたしますので

More information

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果 Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7

More information

システムソリューションのご紹介

システムソリューションのご紹介 HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ

More information

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx GPU のメモリ階層 長岡技術科学大学電気電子情報工学専攻出川智啓 今回の内容 GPU のメモリ階層 グローバルメモリ 共有メモリ モザイク処理への適用 コンスタントメモリ 空間フィルタへの適用 577 GPU の主要部品 基盤 GPU( チップ )+ 冷却部品 画面出力端子 電源入力端子 メモリ 特性の把握が重要 電源入力端子 画面出力端子 メモリ チップ PCI Ex 端子 http://www.geforce.com/whats

More information

V8_教育テキスト.dot

V8_教育テキスト.dot 1.1 Universal Volume Manager 概要 1.1.1 Universal Volume Manager とは Universal Volume Manager は VSP ファミリーに 機種の異なる複数のストレージ ( 外部ストレージ と呼ぶ ) を接続機能です 外部ストレージ接続時 Universal Volume Manager はこの外部ストレージをストレージシステムの内部ストレージ

More information

Microsoft PowerPoint - ICD2011UenoSlides.pptx

Microsoft PowerPoint - ICD2011UenoSlides.pptx 画像認識向け 3 次元積層 アクセラレータ アーキテクチャの検討 九州大学大学院システム情報科学府学院 * 九州大学大学院システム情報科学研究院 ** 上野伸也 * Gauthier Lovic Eric** 井上弘士 ** 村上和彰 ** 1 概要 画像認識技術 アクセラレータによる高性能 低消費エネルギー化 アプリケーション分析 アクセラレータ アーキテクチャ検討ア 性能 消費エネルギー評価 まとめ

More information

変更の影響範囲を特定するための 「標準調査プロセス」の提案 2014年ソフトウェア品質管理研究会(30SQiP-A)

変更の影響範囲を特定するための 「標準調査プロセス」の提案  2014年ソフトウェア品質管理研究会(30SQiP-A) 変更の影響範囲を特定するための 標準調査プロセス の提案 2014 年ソフトウェア品質管理研究会 [ 第 6 分科会 A グループ ] リーダー : 宇田泰子 ( アンリツエンジニアリング株式会社 ) 夛田一成 ( アンリツエンジニアリング株式会社 ) 川井めぐみ ( サントリーシステムテクノロジー株式会社 ) 伊藤友一 (TIS 株式会社 ) 1. 研究の動機 研究員の現場では 調査を行なっているにも関わらず

More information

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc 2.3. アプリ性能 2.3.1. Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア

More information

1.システム構成図

1.システム構成図 1. システム構成図 取込 定型資料作成等システムのシステム全体構成を以下に示す CPU:Dual Core 3.33GHz 以上 /6MB 2 LAN:1000BaseT 2 Disk:146GB 以上 2 300GB 2 メモリ :4GB 1 テープ装置 :DAT 運用管理サーバ 運用管理端末 4 台内訳 : 運用サイト 2 台センター設置 1 台ダウンロード端末 1 台 ( 運用サイトに配置

More information