Microsoft PowerPoint ppt [互換モード]

Size: px

Start display at page:

Download "Microsoft PowerPoint ppt [互換モード]"

みさきじゅふく
4 years ago
Views:

1 計算機アーキテクチャ特論前半 ( 並列アーキテクチャの基本枝廣 ) 10/1, 10/15, 10/22, 10/29, 11/5, 11/12( 程は予定 ) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュコヒーレンシメモリコンシステンシ並列アーキテクチャモデル OSモデルスケーラビリティに関する法則並列プログラミングモデル語後半 ( 最先端トピックス加藤 ) 11/19, 11/26, 12/3, 12/10, 12/17, (12/25), (1/9), 1/21 内容 ( 変更の可能性あり ) 最先端計算機アーキテクチャのトレンド Very Large Instruction Word (VLIW) Simultaneous Multithreading (SMT) Chip Multiprocessor (CMP) Networks on Chips (NoC) Graphics Processing Unit (GPU) Many Integrate Core (MIC) 2012 年 10 月 1 日枝廣 Page 1

2 前半の進め講義 + 理解度テスト ( およそ半分の時間 ) 理解度テストが終われば帰ってよい理解度テストの配点 : 出席 =5, 問題 =5 ( 提出 =1, Q1=3, Q2=1) アンケート1 回 (10 点 ) 単位が欲しいのに席が多い場合要相談 ( 基本的に前半部に関しては試験もレポートもない ) インターンシップなどは配慮する ( 注 ) 後半の進めは異なる第回アンケート第回講義 ( 概要 ) 理解度テストはなし Page 2

3 次マルチコア化の背景マルチコアアーキテクチャとソフトウェアのモデルマルチコア向けソフトウェア開発 Page 3

4 あらゆる機器にマルチコアシングル: 性能向上に限界半導体の微細化は継続低電または性能 ( 従来は両達成 ) あらゆる機器にマルチコア厳しい電制約マルチ低電サーバーパソコン性能組込機器 ( 携帯載情報家電 etc.) ソフトウェアにきな課題 : 並列性がなければ今後性能向上しない ( 従来はが新しくなれば勝に性能向上した ) Page 4

5 背景 : ハイエンドプロセッサでの電傾向 Power (W) 100W クラスに到達しこれ以上電力は増やしずらくなってきた ( 冷却や信頼性確保などでコスト増 ECO が問われる時代でもある ) um Power Limitation 0.25um 0.18um Performance (MIPS) 0.13um 90nm Pentium4 PentiumIII PentiumII Pentium PentiumPro Itanium NEC Corporation 2010 Page 5 Xeon K6 Athlon Opteron Alpha PowerPC Sparc MIPS

6 背景 : 周波数向上だけには頼れない時代にハイエンド MPU の回路は 9FO4 ( インバータ 9 段 ) に到達最高速動作回路 (e.g. ALU) では 4FO4 も出現 NEC Corporation 2010 Page 6

7 背景 : 今後のテクノロジスケーリングが直する課題長期レンジでは電力増大問題のみならずトランジスタ性能向上にも課題が生じる可能性がある (32nm ノードから ) 半導体デバイスプロセスの研究開発ブレークスルー創出がより重要に! CMOS のマクロトレンド集積度は継続して向上トランジスタの性能向上は鈍化 ( 速度や電力のスケーリング ) 並列化 ( 面積活用 ) アプローチであるマルチコア化が進展 Gate delay time CV/I [psec] in progress LSTP LOP HP ITRS2003, nmos Open: pmos Close: nmos L g 2 L g NiSi Fin Physical gate length L g [nm] NEC Corporation 2010 Page 7

8 背景 : リーク電流の増リーク電流トランジスタの微細化により漏れ ( リーク ) が発動作していないトランジスタでも電流消費もはや無視できないきさ ( 将来的に動作時電よりもきくなる ) 速トランジスタほどリーク電流はきいリーク電流削減低速プロセッサの利 ( 性能を達成するためにはマルチコア化が必然 ) 使われていないプロセッサは電源 OFF CREST 資料より NEC Corporation 2010 Page 8

9 マルチコアプロセッサの必要性 ( 性能電 ) ある単一機能を低電力化したい場合汎用よりもヘテロジニアスマルチコアが有利 MPEG4 CODEC 実行時の性能 / 電力 MPEG4 専用 HW 性能電力比においてヘテロジニアスマルチコアが有利! DSP 他アプリケーションへの適用可能性 NEC Corporation 2010 Page 9

10 マルチコアプロセッサの必要性 ( 性能電 ) ホモジニアスマルチコアにより同じ性能を低電力で達成性能を並列によって確保し動作周波数を下げ低電圧低電力化動作周波数 1/4 4 並列の場合 f x C x V 2 (1/4 f) x (4 x C) x V 2 電力の基本式 Power f x C x V 2 (1/4 f) x (4 x C) x (Lower V) 2 Ferq. C Power (1/4f) 4C 4PEs (1/4f) 4C 4PEs Voltage シングルプロセッサ電圧不変周波数 => (1/(#PEs)) 電力は変わらない低電圧化周波数 => (1/(#PEs)) 性能同じで電力低減 NEC Corporation 2010 Page 10

11 マルチコアプロセッサの必要性 ( リアルタイム性能 ) 処理時間の見通し : 難マルチコアによりリアルタイム性を向上させ性能保証を容易にシングルプロセッサ方式 MPEG-4 CODEC 割込み処理 MPEG-4 CODEC 割込み等予測不能要因キャッシュミス等予測不能要因 ( 性能保証のため大きな性能マージンが必要 ) マルチプロセッサ方式専用エンジン起動処理他からの割込み処理終了処理 MPEG-4 CODEC 処理時間の見通しが悪いシステムは組込みで使いにくい! NEC Corporation 2010 Page 11 時間処理時間の見通し : 易

12 マルチコアプロセッサの必要性 ( 性能電スケーラビリティ ) 同じソフトウェアプラットフォームで様々な製品対応今後リーク電流が増大する時代に電力制御容易ハイエンド TV ミドルレンジローエンド SMP 対応 OS x4 SMP 対応 OS x2 SMP 対応 OS x1 専用HW DSP DSP NEC Corporation 2010 Page 12 消費電力 ( 正規化 ) 低負荷時 ( 電源遮断 ) Better 高負荷時シングルプロセッサ 3 s 1 2 sマルチコア性能 ( 正規化 ) シングルプロセッサとの性能電力スケーラビリティ比較

13 ここまでのまとめマルチコアは広まっている組込みシステムの性能向上に対し電やリアルタイム性能のから考えると DSP や専ハードウェアの追加が有利であり LSI の微細化と共にヘテロジニアスマルチコアとして進化しているところが組込みシステムであっても携帯電話関連等において様々なアプリケーションが実されるようになりい性能が要求される分野が出てきたこのような要求に対してい動作周波数ので対応すると電ので合わなくなるためパソコンと同様ホモジニアスマルチコアの時代にりつつある NEC Corporation 2010 Page 13

14 次マルチコア化の背景マルチコアアーキテクチャとソフトウェアのモデルマルチコア向けソフトウェア開発 Page 14

15 マルチコアプロセッサの分類 ( ハードウェアの AMP vs. SMP) ヘテロジニアス vs. ホモジニアスヘテロジニアス : 異種コアによるマルチプロセッサホモジニアス : 同種コアによるマルチプロセッサ ( システムの )AMP vs. SMP AMP (Asymmetric Multi-Processor 対称型 ) 各コアが別々のソフトを実 ( 機能分散 ) SMP (Symmetric Multi-Processor 対称型 ) OS が複数ソフトウェアを複数コアに負荷分散しながら実 (SMP はホモジニアス型のみ ) DSP HW ヘテロジニアスホモジニアスただし組込み向け SoC では様々な専エンジンを搭載するため全体はヘテロジニアス AMP になりその中の部のやメディアエンジンがホモジニアス AMP/SMP になることが多い Page 15

16 SMP 型の定義様々な定義があるここでは以下のように考える SMP 型 = つの OS で管理され, すべての処理 ( タスク, プロセス, スレッドなど ) がすべてのにおいて対称的に実可能であるようなマルチプロセッサによる並列処理式 AMP 型 =SMP 型以外のもの同じバイナリがすべてので動作する必要がある ( 少なくとも命令セットは ) 同じである必要がある = ホモジニアスホモジニアス AMP 型と SMP 型とはキャッシュ貫性に対するハードウェアサポートに違いがあるキャッシュの貫性とは? SW1 SW2 SW3 SW4 SMP OS ポイント 2: ポイント 1: 一つの OS 対称的に実行可能 = 別のに移すことが可能 (1 で動作させ中断していたものを 2 で再開することが可能問題はキャッシュに一時保存しているデータの扱い ) Page 16

17 キャッシュと対称的動作 SW1 を 1 から 2 に移したときキャッシュにデータが残っていると正しく動作しない? SW1 SW1 SW1 SW ? 3 キャッシュ 3 4 キャッシュ 3 4 キャッシュメモリバスメモリバス SW1 があるメモリ番地から値 3 を読む 2.SW1 が値を 4 に書き換える 3.SW1 を 1 から 2 に移して同じメモリ番地からデータを読んだときキャッシュにデータが残っていると正しく動作しない? Page 17

18 AMP と SMP の違い ( キャッシュの貫性 (coherency) (1)) AMP 型 ( ハードウェアサポートなし ) SMP 型 ( キャッシュの Snoop( 盗み見 ) 機構 ) SW1 SW1 SW1 SW ? キャッシュ 3 4 キャッシュ 4 メモリバス 3 AMP 型の場合キャッシュ一貫性を保つためのハードウェアサポートがないそのためSW1を移動後にメモリ上の同じデータを使いたい場合キャッシュの内容を一度共有メモリに戻す必要があるそのオーバーヘッドが大きいため別に移すことは普通は考えない共有メモリ 3 SMP 型では隣ののキャッシュの内容を盗み見る (Snoop) ハードウェア機構を持つそのため比較的容易にSW1を1から2に移すことができ対称的動作が可能になる Page 18

19 AMP と SMP の違い ( キャッシュの貫性 (coherency) (2)) シングルプロセッサ SW1 1 SW2 3 4 キャッシュメモリバス AMP 型 ( ハードウェアサポートなし ) キャッシュ 2 3? メモリバス SMP 型 ( キャッシュの Snoop( 盗み見 ) 機構 ) SW1 SW2 SW1 SW キャッシュシングルプロセッサの場合 SW1 も SW2 も同じキャッシュから読むのでオーバーヘッドなく正しい値が読める共有メモリ 3 共有メモリ 3 AMP 型の場合 SW2でメモ SMP 型では隣ののリ上の同じデータを使いたいキャッシュの内容を盗み見場合 SW1はキャッシュの内る (Snoop) ハードウェア機容を一度共有メモリに戻す必構を持つソフトでは気に要があるせずにSW1とSW2のデー SW1からSW2への通信をタ共有ができるプログラムに明示的に書く ( オーバーヘッドが小さい ) Page 19

20 AMP と SMP の違い ( まとめ ) SMP 型 = つの OS で管理され, すべての処理 ( タスク, プロセス, スレッドなど ) がすべてのにおいて対称的に実可能であるようなマルチプロセッサによる並列処理式 SMP 型にはホモジニアスしかない SMP 型はつのOSがすべてのソフトウェアを動的に負荷分散しながら実する AMP 型は各プロセッサにOS * を持ち各プロセッサが実するソフトウェアが静的に決められている * プロセッサ管理のみの簡易的な基本ソフトウェアも含む従ってAMP 型はそれぞれのプロセッサがサブシステムとなる Page 20

21 マルチコアプロセッサの分類ヘテロジニアス AMP ホモジニアス AMP ホモジニアス SMP SW1 OS SW2 OS DSP SW3 HW1 SW4 HW2 SW1 SW2 SW3 SW4 OS OS OS OS SW1 SW2 SW3 SW4 SMP OS HW&SW 一体でサブシステム最適化サブシステム内変更が他に影響しにくいリアルタイム性確保やテストで有利ヘテロジニアスでは電力性能コスト面で最適なHWを選択ホモジニアスではHWを同一化 SW 環境を同じにしつつサブシステム分離性確保 SW-HWの割り当ては固定的 HW 能力に分割損が発生しがち OS が SW モジュール ( スレッド ) を動的に HW へマッピング SW モジュール変更が全体性能に影響リアルタイム性確保やテストで不利 SW 機能のマッピング自由度が大 HW 能力の分割損は発生しにくい Page 21

22 AMP 型マルチコアシステムのリアルタイム性 Delay from Scheduled Time (= Points above 40ms) Discontinuity of Audio & Video Execute Time for Periodical Processes Time a) 1 b) 3 Many Delays NO DELAY 22

SMP 型マルチコアシステムのスケーラビリティぶれ補正処理シャッタースピードを遅くするとぶれ発速くすると暗くなる

性能が必要並列性能向上率 (1 対 4) --- VGA: 2.94 倍, QVGA: 3.15 倍 Speedup 3.

5 0 QVGA VGA 1 2 3 4 Number of Processors (I) slow shutter:

23 SMP 型マルチコアシステムのスケーラビリティぶれ補正処理シャッタースピードを遅くするとぶれ発速くすると暗くなる (I, II) シャッタースピードを速くしつつ複数枚撮影し画像補正 (III) 画質をくすればするほどい性能が必要並列性能向上率 (1 対 4) --- VGA: 2.94 倍, QVGA: 3.15 倍 Speedup QVGA VGA Number of Processors (I) slow shutter: bright but blurry (II) fast shutter: dark but not blurry Page 23 Image Stabilizer (III) bright and not blurry

24 マルチプロセッサの分類ヘテロジニアス AMP CELL( ソニー東芝 IBM) Uniphier( 松下 ) MeP( 東芝 ) EMMA(NEC) など SMP ホモジニアス MP211(NEC) FR-1000( 富士通 ) など MPCore(NEC) SH-X3( ルネサス ) など (SoC 中の主たる構成部分における分類であり実際には混在している ) Page 24

25 ヘテロジニアス AMP の例 : CELL 同一構造をした多数の SPE を結合しメディアエンジンを構成しひとつのホストプロセッサである PPE を結合する. SPE (PPE: 管理コア /OS が走行 : PowerPC ベース, SPE: 小型 DSP- メディアエンジン 8 個の SPE はホモジニアス AMP と考えることもできる ) ハードウエアを簡単化して極ソフトにオフロードクロックを重視 HW/SWのライフタイムがいゲーム途からの展開を配慮 PPE 出展 : 10.2 The Design and Implementation of a First-Generation CELL Processor, D. Pham, et.al ISSCC 2005 Page 25

26 ヘテロジニアス AMP の例 : UniPhier 基本ユニットである命令並列コア (IPP) にアレイ拡張可能な DPP ハードウエアアクセラレータを追加しメディア処理部である UniPhier プロセッサを構成するさらに汎用コア ( ホストプロセッサ ) を結合するコスト電力を考慮すべてをシングルチップ化情報家電向け出典 : 日経エレクトロニクス Page 26

27 ヘテロジニアス AMP の例 : MeP 命令やアーキテクチャを個別 ( ヘテロジェニアス ) に拡張したプロセッサを疎結合しメディア処理部を構成しひとつのホストプロセッサで制御する部メディア処理部ホストプロセッサ : ARM or MIPS (TX) 出典 : Page 27

28 ホモジニアス AMP の例 : MP211 ARM926(200MHz) 3, DSP(200MHz), Graphics Engine, Image Processor, Security Engine, etc. はARM3 個のホモジニアス AMPであるが SoC 全体でみると多くの携帯電話向けエンジンを搭載したヘテロジニアスマルチコア Power Switched Area (Logic1) ARM926 PE0 ARM926 PE1 ARM926 PE2 DSP SPX-K602 MP nm -8.9mm 角 DMAC Async Bridge0 FLASH USB OTG Async Bridge1 I 2 C APB Bridge0 UA RT 3D Acc. Mem. Card Rotat Image er Acc. Multi -Layer AHB TIM1 TIM2 TIM3 WDT SIO Quad BUS Interface PCM CCP I/F Scheduler SDRAM Controller Mobile DDR SDRAM DDR SDRAM NSTC I/F APB Bridge 1 DTV I/F Cam I/F Frame Cache SRAMIF LCD I/F On-Chip SRAM Inst. RAM (512KB) PMU PLLOSC SMUuWIRE INTC TIM0 CameraLCD GPIO SIO Always On Area (Logic0) BaseBand 出展 : S. Torii et al., A 600MIPS 120mW 70uA Leakage Triple- Mobile Application Processor Chip, ISSCC2005 Page 28

ホモジニアス SMP の例 : MPCore ARM11 ベース (VFP: 浮動数点演算ユニット ) 1 4コア構成 SCU (Snoop Control Unit) によりキャッシュの貫性をハードウェアで保証効率なSMPを実現負荷量に応じ動的にコア電源のON/OFFが可能 AMPモードハイブリッド (AMP+SMP) モードも可能 Configurable number of

29 ホモジニアス SMP の例 : MPCore ARM11 ベース (VFP: 浮動数点演算ユニット ) 1 4コア構成 SCU (Snoop Control Unit) によりキャッシュの貫性をハードウェアで保証効率なSMPを実現負荷量に応じ動的にコア電源のON/OFFが可能 AMPモードハイブリッド (AMP+SMP) モードも可能 Configurable number of hardware interrupt lines Private lines PE0 FPU PE2 Interrupt Distributor Per Peripheral s Configurable SMP (1 and 4 PEs) Timer Wdog interface IRQ /VFP L1 Cache Timer Wdog interface /VFP L1 Cache Timer Wdog interface /VFP L1 Cache Timer Wdog interface /VFP L1 Cache PE1 SCU PE3 Snoop Control Unit (SCU) I & D 64bit Primary AXI R/W 64bit bus bus Optional 2 nd AXI R/W 64bit bus Coherence Control Bus 出展 : P. Middleton, A New ARMv6 Symmetric Multiprocessing Core, Embedded Processor Forum, 2004 Page 29

タスク並列のメリットをかしながらスケーラビリティも実現 SMP LinuxのAffinity: タスクを固定的に特定に割り付け可能 AMP-SMPハイブリッドリアルタイム系連携タスクと度なマルチメディアタスクが混在する今後の組み込みシステムに適合 MMタスクを自動負荷分散 Task A Task C Task B Task F Task

30 タスク並列のメリットをかしながらスケーラビリティも実現 SMP LinuxのAffinity: タスクを固定的に特定に割り付け可能 AMP-SMPハイブリッドリアルタイム系連携タスクと度なマルチメディアタスクが混在する今後の組み込みシステムに適合 MMタスクを自動負荷分散 Task A Task C Task B Task F Task D Task E Task A Task C Task B Task D 固定割付タタススククEF Snoop Cache Cache スレッド化されたタスク A~D Task E 制御系連携タスク Task F OS シングル, マルチタスク SMP Linux RTOS MPCore マルチ, マルチタスクマルチスレッド Page 30

31 次マルチコア化の背景マルチコアアーキテクチャとソフトウェアのモデルマルチコア向けソフトウェア開発 Page 31

32 マルチコア活かすも殺すもソフト次第ソフトが複数のコアを有効利しなければマルチコアの意味が無いシステムソフトウェアの並処理並列処理並並列化の種類複数ソフトウェアの並処理 ( 機能分割 ) 単ソフトウェアの並列処理 ( スレッド化など ) アルゴリズムシステムロジックが並列並実可能分割可能依存がないプログラムが並列並実可能に記述 Page 32

33 アルゴリズムが並列実可能 (1) アルゴリズムが並列実可能でなければマルチコア上で性能向上しない例 : 総和 (1からまでの和を求める ) int i, sum; for (i=1,sum=0; i<= ; i++) { sum += i; } return sum; i=k-1の時のsumの値をいて i=kの時の sumを計算するため並列化は難しい Page 33

34 アルゴリズムが並列実可能 (2) 並列実可能なアルゴリズム例 : 総和 (4 コアで 1 からまでの和を求める ) int i, j, p, sum; for (p=0,sum=0; p<4; p++) { for(i=0,j=p* ,s=0; i<=250000; i++, j++) { s += j; } sum += s; } return sum; 4 コアで並列実可能変数 i, j, s をコアごとの局所変数として割り当てて計算し最後にそれぞれのコアの結果 s を集計 ( 注意 : 現状の動並列化コンパイラでは前のプログラムから動的に上記のような並列化はわれる従ってアルゴリズム変更が必要な場合はより複雑な例となる ) Page 34

35 システムロジックが並実可能並行実行で性能向上する例並行実行で性能向上しない例 START START 処理の依存関係処理 A 処理 B 処理 C 処理 D 処理 A 処理 B 処理 C END 処理 D END Page 35

36 プログラムが並列並実可能に記述 AMP 型と SMP 型 AMP 型はプロセッサごとの ( 別々の OS 上の ) プログラムとなりプログラム間の同期通信を記載するへのタスク ( スレッド ) 割り当てはプログラム時に静的にわれる SMP 型は SMP OS 上のつのプログラムとなり同期通信も含め並列化援語 API として記載する SMP OS が負荷分散を考慮しながら動的にタスク ( スレッド ) をプロセッサに割り当てる 1 向けプログラムタスク1 タスク4 タスク6 2 向けプログラムタスク 2 タスク 7 3 向けプログラムタスク3 タスク5 並列化プログラムタスク1 タスク2 タスク4 タスク 3 タスク 5 タスク 7 タスク 6 OS 1 OS OS 2 AMP 型 3 SMP OS SMP 型 Page 36

37 プログラムが並列並実可能に記述 AMP 型のプログラム同期通信以外は通常のソフトウェア SMP 型のプログラムスレッドプログラミングその他ヘテロジニアスマルチコア向け OpenCL GPU 向け CUDA Page 37

38 AMP 型マルチコアの同期通信 ( 起動終了 ) 起動 : から専エンジンのレジスタに書き込み終了 : 専エンジンからへの割込み専エンジンのレジスタをからポーリング起動終了に多少の時間オーバーヘッドがある変数共有を考えなくても数数百サイクル必要 (SMP 型のような ) 変数共有を考えるならば 1 変数を 1 回共有するのにさらに数数百サイクル必要時ソフトウェアモデルハードウェアモデル (AMP 型 ) 間専用エンジン起動処理他からの割込み処理終了処理 MPEG-4 CODEC Reg. MPEG-4 専用 HW Page 38

39 AMP 型マルチコアの同期通信 ( 共有メモリ ) AMP 型ではデータ共有オーバーヘッドがきいため画像データ転送などを除き可能な限りメモリ共有しない共有メモリをいたプロセッサ間データ授受専エンジンでデータを使う前に必要なデータがのキャッシュからメモリに戻されている必要ありキャッシュ無効化などの処理が必要となり同プロセッサでのデータ授受より時間オーバーヘッドがあるデータ書込後起動終了または割り込みなどで通知時間ソフトウェアモデル専用エンジンデータ書込起動処理データ読込 MPEG-4 CODEC データ書込終了処理データ読込ハードウェアモデル Mem Reg. MPEG-4 専用 HW Page 39

40 スレッド化プログラミングスレッドライブラリの例 pthread IEEE の POSIX Section c 規格 POSIX: Portable Operating System Interface Linux などで標準的にサポート Java Thread Java 語の中に標準で定義 OpenMP C/C++/FORTRAN を並列プログラム可能にするために国コンパイラベンダグループによって作られた指パソコン向けの開発環境などで標準的にサポート TBB Intel 社が開発した語 OpenMP と似ているレベルであるが動的な負荷分散などをランタイムでう TPL Microsoft 社の語同様のレベル.NET に含まれる参考献 : Nichols, Buttlar, and Farrell( 榊訳 ): PThreads プログラミングオライリージャパン 1998 : Oaks and Wong( 松村訳 ): Java スレッドプログラミングオライリージャパン 1997 : : James Reinders ( 菅原訳 ): インテルスレッドビルディングブロックオライリージャパン 2008 Page 40

41 スレッド化プログラミング (OpenMP) OpenMPでの記述例 ( 銀系サーバの例 ) sections 指されたブロック内の各 sectionは並列実可能 #pragma omp parallel sections メインスレッド { 客#pragma omp section リwithdraw() main(); ク支払スレッド #pragma omp section エwithdraw(); ス#pragma omp section トdeposit() deposit(); 預金スレッド #pragma omp section balance(); balance() } 残高スレッド顧 sectionsの } において同期する ( つまりすべてのsectionが終了後に待ち合わせる ) -41- 銀行系サーバ main()

42 スレッド化プログラミング (OpenMP) OpenMP での記述例 ( 画像復号処理の例 ) for 指されたループは並列実可能 #pragma omp parallel for for(i=1; i<=n; i++) 復号処理 #i; 複号処理 #1 画像復号処理複号処理 #2 複号処理 #3 複号処理 # 4 複号処理 #5 複号処理 #8 複号処理 #7 複号処理 #5-42-

43 演習問題 1 ( マルチプロセッサ : 電 ) あるプロセッサの負荷容量を 1[nF] とするまたこのプロセッサは 1 クロックに最 1 命令の処理をするこのとき以下の問いに答えよなお電 = 動作周波数負荷容量電圧 2 とする 1 このプロセッサは 1.5V の電源電圧で動作周波数 300MHz の性能が出せると仮定するこの時の最 MIPS 値および電を求めよなお MIPS=Million Instructions Per Second(1 秒間に処理できる命令数 ) 2 このプロセッサは 1.2V の電源電圧で動作周波数 150MHz の性能が出せると仮定するこのプロセッサを 2 並列で使ったときの最 MIPS 値および電を求めよ 3 このプロセッサは 0.9V の電源電圧で動作周波数 100MHz の性能が出せると仮定するこのプロセッサを 3 並列で使ったときの最 MIPS 値および電を求めよ 43

Microsoft PowerPoint ppt [互換モード]

Microsoft PowerPoint ppt [互換モード] 計算機アーキテクチャ特論前半 ( 並列アーキテクチャの基本枝廣 ) 10/1, 10/15, 10/22, 10/29, 11/5, 11/12( 程は予定 ) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュコヒーレンシメモリコンシステンシ並列アーキテクチャモデル OSモデルスケーラビリティに関する法則 2012 年 10 月 22 日枝廣