Microsoft PowerPoint ppt [互換モード]

Size: px
Start display at page:

Download "Microsoft PowerPoint ppt [互換モード]"

Transcription

1 計算機アーキテクチャ特論 前半 ( 並列アーキテクチャの基本 枝廣 ) 10/1, 10/15, 10/22, 10/29, 11/5, 11/12( 程は予定 ) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュ コヒーレンシ メモリ コンシステンシ 並列アーキテクチャモデル OSモデル スケーラビリティに関する法則 並列プログラミングモデル 語 後半 ( 最先端トピックス 加藤 ) 11/19, 11/26, 12/3, 12/10, 12/17, (12/25), (1/9), 1/21 内容 ( 変更の可能性あり ) 最先端計算機アーキテクチャのトレンド Very Large Instruction Word (VLIW) Simultaneous Multithreading (SMT) Chip Multiprocessor (CMP) Networks on Chips (NoC) Graphics Processing Unit (GPU) Many Integrate Core (MIC) 2012 年 10 月 1 日枝廣 Page 1

2 前半の進め 講義 + 理解度テスト ( およそ半分の時間 ) 理解度テストが終われば帰ってよい 理解度テストの配点 : 出席 =5, 問題 =5 ( 提出 =1, Q1=3, Q2=1) アンケート1 回 (10 点 ) 単位が欲しいのに 席が多い場合 要相談 ( 基本的に前半部に関しては試験もレポートもない ) インターンシップなどは配慮する ( 注 ) 後半の進め は異なる 第 回アンケート 第 回講義 ( 概要 ) 理解度テストはなし Page 2

3 次 マルチコア化の背景 マルチコア アーキテクチャとソフトウェアのモデル マルチコア向けソフトウェア開発 Page 3

4 あらゆる機器にマルチコア シングル: 性能向上に限界 半導体の微細化は継続 低電 または 性能 ( 従来は両 達成 ) あらゆる機器にマルチコア 厳しい電 制約 マルチ 低電 サーバー パソコン 性能組込機器 ( 携帯 載 情報家電 etc.) ソフトウェアに きな課題 : 並列性がなければ今後性能向上しない ( 従来は が新しくなれば勝 に性能向上した ) Page 4

5 背景 : ハイエンドプロセッサでの電 傾向 Power (W) 100W クラスに到達し これ以上電力は増やしずらくなってきた ( 冷却や信頼性確保などでコスト増 ECO が問われる時代でもある ) um Power Limitation 0.25um 0.18um Performance (MIPS) 0.13um 90nm Pentium4 PentiumIII PentiumII Pentium PentiumPro Itanium NEC Corporation 2010 Page 5 Xeon K6 Athlon Opteron Alpha PowerPC Sparc MIPS

6 背景 : 周波数向上だけには頼れない時代に ハイエンド MPU の回路は 9FO4 ( インバータ 9 段 ) に到達 最高速動作回路 (e.g. ALU) では 4FO4 も出現 NEC Corporation 2010 Page 6

7 背景 : 今後のテクノロジスケーリングが直 する課題 長期レンジでは 電力増大問題のみならず トランジスタ性能向上にも課題が生じる可能性がある (32nm ノードから ) 半導体デバイス プロセスの研究開発 ブレークスルー創出がより重要に! CMOS のマクロ トレンド 集積度は継続して向上 トランジスタの性能向上は鈍化 ( 速度や電力のスケーリング ) 並列化 ( 面積活用 ) アプローチであるマルチコア化が進展 Gate delay time CV/I [psec] in progress LSTP LOP HP ITRS2003, nmos Open: pmos Close: nmos L g 2 L g NiSi Fin Physical gate length L g [nm] NEC Corporation 2010 Page 7

8 背景 : リーク電流の増 リーク電流 トランジスタの微細化により 漏れ ( リーク ) が発 動作していないトランジスタでも電流消費 もはや無視できない きさ ( 将来的に動作時電 よりも きくなる ) 速トランジスタほどリーク電流は きい リーク電流削減 低速プロセッサの利 ( 性能を達成するためにはマルチコア化が必然 ) 使われていないプロセッサは電源 OFF CREST 資料より NEC Corporation 2010 Page 8

9 マルチコアプロセッサの必要性 ( 性能電 ) ある単一機能を低電力化したい場合 汎用 よりもヘテロジニアス マルチコアが有利 MPEG4 CODEC 実行時の性能 / 電力 MPEG4 専用 HW 性能電力比においてヘテロジニアス マルチコアが有利! DSP 他アプリケーションへの適用可能性 NEC Corporation 2010 Page 9

10 マルチコアプロセッサの必要性 ( 性能電 ) ホモジニアス マルチコアにより同じ性能を低電力で達成性能を並列によって確保し 動作周波数を下げ低電圧 低電力化 動作周波数 1/4 4 並列の場合 f x C x V 2 (1/4 f) x (4 x C) x V 2 電力の基本式 Power f x C x V 2 (1/4 f) x (4 x C) x (Lower V) 2 Ferq. C Power (1/4f) 4C 4PEs (1/4f) 4C 4PEs Voltage シングルプロセッサ 電圧不変周波数 => (1/(#PEs)) 電力は変わらない 低電圧化周波数 => (1/(#PEs)) 性能同じで電力低減 NEC Corporation 2010 Page 10

11 マルチコアプロセッサの必要性 ( リアルタイム性能 ) 処理時間の見通し : 難 マルチコアにより リアルタイム性を向上させ 性能保証を容易に シングルプロセッサ方式 MPEG-4 CODEC 割込み処理 MPEG-4 CODEC 割込み等予測不能要因 キャッシュミス等予測不能要因 ( 性能保証のため大きな 性能マージンが必要 ) マルチプロセッサ方式 専用エンジン 起動処理 他からの割込み処理 終了処理 MPEG-4 CODEC 処理時間の見通しが悪いシステムは組込みで使いにくい! NEC Corporation 2010 Page 11 時間処理時間の見通し : 易

12 マルチコアプロセッサの必要性 ( 性能 電 スケーラビリティ ) 同じソフトウェアプラットフォームで様々な製品対応 今後リーク電流が増大する時代に 電力制御容易 ハイエンド TV ミドルレンジ ローエンド SMP 対応 OS x4 SMP 対応 OS x2 SMP 対応 OS x1 専用HW DSP DSP NEC Corporation 2010 Page 12 消費電力 ( 正規化 ) 低負荷時 ( 電源遮断 ) Better 高負荷時 シングルプロセッサ 3 s 1 2 sマルチコア 性能 ( 正規化 ) シングルプロセッサとの性能 電力スケーラビリティ比較

13 ここまでのまとめ マルチコアは広まっている 組込みシステムの性能向上に対し 電 や リアルタイム性能の から考えると DSP や専 ハードウェアの追加が有利であり LSI の微細化と共にヘテロジニアス マルチコアとして進化している ところが組込みシステムであっても 携帯電話関連等において様々なアプリケーションが実 されるようになり い 性能が要求される分野が出てきた このような要求に対して い動作周波数の で対応すると電 の で 合わなくなるため パソコンと同様 ホモジニアス マルチコアの時代に りつつある NEC Corporation 2010 Page 13

14 次 マルチコア化の背景 マルチコア アーキテクチャとソフトウェアのモデル マルチコア向けソフトウェア開発 Page 14

15 マルチコアプロセッサの分類 ( ハードウェアの AMP vs. SMP) ヘテロジニアス vs. ホモジニアス ヘテロジニアス : 異種コアによるマルチプロセッサ ホモジニアス : 同種コアによるマルチプロセッサ ( システムの )AMP vs. SMP AMP (Asymmetric Multi-Processor 対称型 ) 各コアが別々のソフトを実 ( 機能分散 ) SMP (Symmetric Multi-Processor 対称型 ) OS が複数ソフトウェアを複数コアに負荷分散しながら実 (SMP はホモジニアス型のみ ) DSP HW ヘテロジニアス ホモジニアス ただし組込み向け SoC では様々な専 エンジンを搭載するため 全体はヘテロジニアス AMP になり その中の 部の やメディアエンジンがホモジニアス AMP/SMP になることが多い Page 15

16 SMP 型の定義 様々な定義がある ここでは以下のように考える SMP 型 = つの OS で管理され, すべての処理 ( タスク, プロセス, スレッドなど ) がすべての において対称的に実 可能であるようなマルチプロセッサによる並列処理 式 AMP 型 =SMP 型以外のもの 同じバイナリがすべての で動作する必要がある ( 少なくとも命令セットは ) 同じ である必要がある = ホモジニアス ホモジニアス AMP 型と SMP 型とはキャッシュ 貫性に対するハードウェアサポートに違いがある キャッシュの 貫性とは? SW1 SW2 SW3 SW4 SMP OS ポイント 2: ポイント 1: 一つの OS 対称的に実行可能 = 別の に移すことが可能 (1 で動作させ中断していたものを 2 で再開することが可能 問題はキャッシュに一時保存しているデータの扱い ) Page 16

17 キャッシュと対称的動作 SW1 を 1 から 2 に移したとき キャッシュにデータが残っていると正しく動作しない? SW1 SW1 SW1 SW ? 3 キャッシュ 3 4 キャッシュ 3 4 キャッシュ メモリバス メモリバス SW1 があるメモリ番地から値 3 を読む 2.SW1 が値を 4 に書き換える 3.SW1 を 1 から 2 に移して同じメモリ番地からデータを読んだとき キャッシュにデータが残っていると正しく動作しない? Page 17

18 AMP と SMP の違い ( キャッシュの 貫性 (coherency) (1)) AMP 型 ( ハードウェアサポートなし ) SMP 型 ( キャッシュの Snoop( 盗み見 ) 機構 ) SW1 SW1 SW1 SW ? キャッシュ 3 4 キャッシュ 4 メモリバス 3 AMP 型の場合 キャッシュ一貫性を保つためのハードウェアサポートがない そのためSW1を移動後にメモリ上の同じデータを使いたい場合 キャッシュの内容を一度共有メモリに戻す必要がある そのオーバーヘッドが大きいため 別 に移すことは普通は考えない 共有メモリ 3 SMP 型では隣ののキャッシュの内容を盗み見る (Snoop) ハードウェア機構を持つ そのため 比較的容易にSW1を1から2に移すことができ 対称的動作 が可能になる Page 18

19 AMP と SMP の違い ( キャッシュの 貫性 (coherency) (2)) シングルプロセッサ SW1 1 SW2 3 4 キャッシュ メモリバス AMP 型 ( ハードウェアサポートなし ) キャッシュ 2 3? メモリバス SMP 型 ( キャッシュの Snoop( 盗み見 ) 機構 ) SW1 SW2 SW1 SW キャッシュ シングルプロセッサの場合 SW1 も SW2 も同じキャッシュから読むので オーバーヘッドなく正しい値が読める 共有メモリ 3 共有メモリ 3 AMP 型の場合 SW2でメモ SMP 型では隣のの リ上の同じデータを使いたい キャッシュの内容を盗み見 場合 SW1はキャッシュの内 る (Snoop) ハードウェア機 容を一度共有メモリに戻す必 構を持つ ソフトでは気に 要がある せずにSW1とSW2のデー SW1からSW2への 通信 を タ共有ができる プログラムに明示的に書く ( オーバーヘッドが小さい ) Page 19

20 AMP と SMP の違い ( まとめ ) SMP 型 = つの OS で管理され, すべての処理 ( タスク, プロセス, スレッドなど ) がすべての において対称的に実 可能であるようなマルチプロセッサによる並列処理 式 SMP 型にはホモジニアスしかない SMP 型は つのOSがすべてのソフトウェアを動的に負荷分散しながら実 する AMP 型は 各プロセッサにOS * を持ち 各プロセッサが実 するソフトウェアが静的に決められている * プロセッサ管理のみの簡易的な基本ソフトウェアも含む 従ってAMP 型はそれぞれのプロセッサがサブシステムとなる Page 20

21 マルチコアプロセッサの分類 ヘテロジニアス AMP ホモジニアス AMP ホモジニアス SMP SW1 OS SW2 OS DSP SW3 HW1 SW4 HW2 SW1 SW2 SW3 SW4 OS OS OS OS SW1 SW2 SW3 SW4 SMP OS HW&SW 一体でサブシステム最適化 サブシステム内変更が他に影響しにくい リアルタイム性確保や テストで有利 ヘテロジニアスでは電力 性能 コスト面で最適なHWを選択 ホモジニアスではHWを同一化 SW 環境を同じにしつつサブシステム分離性確保 SW-HWの割り当ては固定的 HW 能力に分割損が発生しがち OS が SW モジュール ( スレッド ) を動的に HW へマッピング SW モジュール変更が全体性能に影響 リアルタイム性確保やテストで不利 SW 機能のマッピング自由度が大 HW 能力の分割損は発生しにくい Page 21

22 AMP 型マルチコアシステムのリアルタイム性 Delay from Scheduled Time (= Points above 40ms) Discontinuity of Audio & Video Execute Time for Periodical Processes Time a) 1 b) 3 Many Delays NO DELAY 22

23 SMP 型マルチコアシステムのスケーラビリティ ぶれ補正処理 シャッタースピードを遅くすると ぶれ発 速くすると暗くなる (I, II) シャッタースピードを速くしつつ 複数枚撮影し 画像補正 (III) 画質を くすればするほど い 性能が必要 並列性能向上率 (1 対 4) --- VGA: 2.94 倍, QVGA: 3.15 倍 Speedup QVGA VGA Number of Processors (I) slow shutter: bright but blurry (II) fast shutter: dark but not blurry Page 23 Image Stabilizer (III) bright and not blurry

24 マルチプロセッサの分類 ヘテロジニアス AMP CELL( ソニー 東芝 IBM) Uniphier( 松下 ) MeP( 東芝 ) EMMA(NEC) など SMP ホモジニアス MP211(NEC) FR-1000( 富士通 ) など MPCore(NEC) SH-X3( ルネサス ) など (SoC 中の主たる構成部分における分類であり 実際には混在している ) Page 24

25 ヘテロジニアス AMP の例 : CELL 同一構造をした多数の SPE を結合しメディアエンジンを構成し ひとつのホストプロセッサである PPE を結合する. SPE (PPE: 管理コア /OS が走行 : PowerPC ベース, SPE: 小型 DSP- メディアエンジン 8 個の SPE はホモジニアス AMP と考えることもできる ) ハードウエアを簡単化して極 ソフトにオフロード クロックを重視 HW/SWのライフタイムが いゲーム 途からの展開を配慮 PPE 出展 : 10.2 The Design and Implementation of a First-Generation CELL Processor, D. Pham, et.al ISSCC 2005 Page 25

26 ヘテロジニアス AMP の例 : UniPhier 基本ユニットである命令並列コア (IPP) に アレイ拡張可能な DPP ハードウエアアクセラレータを追加し メディア処理部である UniPhier プロセッサを構成する さらに汎用コア ( ホストプロセッサ ) を結合する コスト 電力を考慮 すべてをシングルチップ化情報家電向け 出典 : 日経エレクトロニクス Page 26

27 ヘテロジニアス AMP の例 : MeP 命令やアーキテクチャを個別 ( ヘテロジェニアス ) に拡張したプロセッサを疎結合しメディア処理部を構成し ひとつのホストプロセッサで制御する 部 メディア処理部 ホストプロセッサ : ARM or MIPS (TX) 出典 : Page 27

28 ホモジニアス AMP の例 : MP211 ARM926(200MHz) 3, DSP(200MHz), Graphics Engine, Image Processor, Security Engine, etc. はARM3 個のホモジニアス AMPであるが SoC 全体でみると多くの携帯電話向けエンジンを搭載したヘテロジニアス マルチコア Power Switched Area (Logic1) ARM926 PE0 ARM926 PE1 ARM926 PE2 DSP SPX-K602 MP nm -8.9mm 角 DMAC Async Bridge0 FLASH USB OTG Async Bridge1 I 2 C APB Bridge0 UA RT 3D Acc. Mem. Card Rotat Image er Acc. Multi -Layer AHB TIM1 TIM2 TIM3 WDT SIO Quad BUS Interface PCM CCP I/F Scheduler SDRAM Controller Mobile DDR SDRAM DDR SDRAM NSTC I/F APB Bridge 1 DTV I/F Cam I/F Frame Cache SRAMIF LCD I/F On-Chip SRAM Inst. RAM (512KB) PMU PLLOSC SMUuWIRE INTC TIM0 CameraLCD GPIO SIO Always On Area (Logic0) BaseBand 出展 : S. Torii et al., A 600MIPS 120mW 70uA Leakage Triple- Mobile Application Processor Chip, ISSCC2005 Page 28

29 ホモジニアス SMP の例 : MPCore ARM11 ベース (VFP: 浮動 数点演算ユニット ) 1 4コア構成 SCU (Snoop Control Unit) によりキャッシュの 貫性をハードウェアで保証 効率なSMPを実現 負荷量に応じ動的にコア電源のON/OFFが可能 AMPモード ハイブリッド (AMP+SMP) モードも可能 Configurable number of hardware interrupt lines Private lines PE0 FPU PE2 Interrupt Distributor Per Peripheral s Configurable SMP (1 and 4 PEs) Timer Wdog interface IRQ /VFP L1 Cache Timer Wdog interface /VFP L1 Cache Timer Wdog interface /VFP L1 Cache Timer Wdog interface /VFP L1 Cache PE1 SCU PE3 Snoop Control Unit (SCU) I & D 64bit Primary AXI R/W 64bit bus bus Optional 2 nd AXI R/W 64bit bus Coherence Control Bus 出展 : P. Middleton, A New ARMv6 Symmetric Multiprocessing Core, Embedded Processor Forum, 2004 Page 29

30 タスク並列のメリットを かしながらスケーラビリティも実現 SMP LinuxのAffinity: タスクを固定的に特定 に割り付け可能 AMP-SMPハイブリッド リアルタイム系連携タスクと 度なマルチメディアタスクが混在する今後の組み込みシステムに適合 MMタスクを自動負荷分散 Task A Task C Task B Task F Task D Task E Task A Task C Task B Task D 固定割付 タタススククEF Snoop Cache Cache スレッド化されたタスク A~D Task E 制御系連携タスク Task F OS シングル, マルチタスク SMP Linux RTOS MPCore マルチ, マルチタスク マルチスレッド Page 30

31 次 マルチコア化の背景 マルチコア アーキテクチャとソフトウェアのモデル マルチコア向けソフトウェア開発 Page 31

32 マルチコア活かすも殺すもソフト次第 ソフトが複数のコアを有効利 しなければマルチコアの意味が無い システム ソフトウェアの並 処理 並列処理 並 並列化の種類 複数ソフトウェアの並 処理 ( 機能分割 ) 単 ソフトウェアの並列処理 ( スレッド化など ) アルゴリズム システムロジックが並列 並 実 可能 分割可能 依存がない プログラムが並列 並 実 可能に記述 Page 32

33 アルゴリズムが並列実 可能 (1) アルゴリズムが並列実 可能でなければマルチコア上で性能向上しない 例 : 総和 (1から までの和を求める ) int i, sum; for (i=1,sum=0; i<= ; i++) { sum += i; } return sum; i=k-1の時のsumの値を いて i=kの時の sumを計算するため 並列化は難しい Page 33

34 アルゴリズムが並列実 可能 (2) 並列実 可能なアルゴリズム 例 : 総和 (4 コアで 1 から までの和を求める ) int i, j, p, sum; for (p=0,sum=0; p<4; p++) { for(i=0,j=p* ,s=0; i<=250000; i++, j++) { s += j; } sum += s; } return sum; 4 コアで並列実 可能 変数 i, j, s をコアごとの局所変数として割り当てて計算し 最後にそれぞれのコアの結果 s を集計 ( 注意 : 現状の 動並列化コンパイラでは 前 のプログラムから 動的に上記のような並列化は われる 従ってアルゴリズム変更が必要な場合は より複雑な例となる ) Page 34

35 システムロジックが並 実 可能 並行実行で性能向上する例 並行実行で性能向上しない例 START START 処理の依存関係 処理 A 処理 B 処理 C 処理 D 処理 A 処理 B 処理 C END 処理 D END Page 35

36 プログラムが並列 並 実 可能に記述 AMP 型と SMP 型 AMP 型はプロセッサごとの ( 別々の OS 上の ) プログラムとなり プログラム間の同期 通信を記載する へのタスク ( スレッド ) 割り当てはプログラム時に静的に われる SMP 型は SMP OS 上の つのプログラムとなり 同期 通信も含め 並列化 援 語 API として記載する SMP OS が負荷分散を考慮しながら動的にタスク ( スレッド ) をプロセッサに割り当てる 1 向けプログラムタスク1 タスク4 タスク6 2 向けプログラム タスク 2 タスク 7 3 向けプログラムタスク3 タスク5 並列化プログラム タスク1 タスク2 タスク4 タスク 3 タスク 5 タスク 7 タスク 6 OS 1 OS OS 2 AMP 型 3 SMP OS SMP 型 Page 36

37 プログラムが並列 並 実 可能に記述 AMP 型のプログラム 同期 通信以外は通常のソフトウェア SMP 型のプログラム スレッド プログラミング その他 ヘテロジニアス マルチコア向け OpenCL GPU 向け CUDA Page 37

38 AMP 型マルチコアの同期 通信 ( 起動 終了 ) 起動 : から専 エンジンのレジスタに書き込み 終了 : 専 エンジンから への割込み 専 エンジンのレジスタを からポーリング 起動 終了に多少の時間オーバーヘッドがある 変数共有を考えなくても数 数百サイクル必要 (SMP 型のような ) 変数共有を考えるならば 1 変数を 1 回共有するのにさらに数 数百サイクル必要 時ソフトウェアモデルハードウェアモデル (AMP 型 ) 間 専用エンジン 起動処理 他からの割込み処理 終了処理 MPEG-4 CODEC Reg. MPEG-4 専用 HW Page 38

39 AMP 型マルチコアの同期 通信 ( 共有メモリ ) AMP 型ではデータ共有オーバーヘッドが きいため 画像データ転送などを除き 可能な限りメモリ共有しない 共有メモリを いたプロセッサ間データ授受 専 エンジンでデータを使う前に 必要なデータが のキャッシュからメモリに戻されている必要あり キャッシュ無効化などの処理が必要となり 同 プロセッサでのデータ授受より時間オーバーヘッドがある データ書込後 起動 終了または割り込みなどで通知 時間ソフトウェアモデル 専用エンジンデータ書込起動処理データ読込 MPEG-4 CODEC データ書込終了処理データ読込 ハードウェアモデル Mem Reg. MPEG-4 専用 HW Page 39

40 スレッド化プログラミング スレッドライブラリの例 pthread IEEE の POSIX Section c 規格 POSIX: Portable Operating System Interface Linux などで標準的にサポート Java Thread Java 語の中に標準で定義 OpenMP C/C++/FORTRAN を並列プログラム可能にするために 国コンパイラベンダグループによって作られた指 パソコン向けの開発環境などで標準的にサポート TBB Intel 社が開発した 語 OpenMP と似ているレベルであるが 動的な負荷分散などをランタイムで う TPL Microsoft 社の 語 同様のレベル.NET に含まれる参考 献 : Nichols, Buttlar, and Farrell( 榊訳 ): PThreads プログラミング オライリー ジャパン 1998 : Oaks and Wong( 松 村訳 ): Java スレッドプログラミング オライリー ジャパン 1997 : : James Reinders ( 菅原訳 ): インテルスレッドビルディングブロック オライリー ジャパン 2008 Page 40

41 スレッド化プログラミング (OpenMP) OpenMPでの記述例 ( 銀 系サーバの例 ) sections 指 されたブロック内の各 sectionは並列実 可能 #pragma omp parallel sections メインスレッド { 客#pragma omp section リwithdraw() main(); ク支払スレッド #pragma omp section エwithdraw(); ス#pragma omp section トdeposit() deposit(); 預金スレッド #pragma omp section balance(); balance() } 残高スレッド顧 sectionsの } において同期する ( つまりすべてのsectionが終了後に待ち合わせ る ) -41- 銀行系サーバ main()

42 スレッド化プログラミング (OpenMP) OpenMP での記述例 ( 画像復号処理の例 ) for 指 されたループは並列実 可能 #pragma omp parallel for for(i=1; i<=n; i++) 復号処理 #i; 複号処理 #1 画像復号処理 複号処理 #2 複号処理 #3 複号処理 # 4 複号処理 #5 複号処理 #8 複号処理 #7 複号処理 #5-42-

43 演習問題 1 ( マルチプロセッサ : 電 ) あるプロセッサの負荷容量を 1[nF] とする また このプロセッサは 1 クロックに最 1 命令の処理をする このとき以下の問いに答えよ なお 電 = 動作周波数 負荷容量 電圧 2 とする 1 このプロセッサは 1.5V の電源電圧で動作周波数 300MHz の性能が出せると仮定する この時の最 MIPS 値および電 を求めよ なお MIPS=Million Instructions Per Second(1 秒間に処理できる命令数 ) 2 このプロセッサは 1.2V の電源電圧で動作周波数 150MHz の性能が出せると仮定する このプロセッサを 2 並列で使ったときの最 MIPS 値および電 を求めよ 3 このプロセッサは 0.9V の電源電圧で動作周波数 100MHz の性能が出せると仮定する このプロセッサを 3 並列で使ったときの最 MIPS 値および電 を求めよ 43

Microsoft PowerPoint ppt [互換モード]

Microsoft PowerPoint ppt [互換モード] 計算機アーキテクチャ特論 前半 ( 並列アーキテクチャの基本 枝廣 ) 10/1, 10/15, 10/22, 10/29, 11/5, 11/12( 程は予定 ) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュ コヒーレンシ メモリ コンシステンシ 並列アーキテクチャモデル OSモデル スケーラビリティに関する法則 2012 年 10 月 22 日枝廣

More information

特集新世代マイクロプロセッサアーキテクチャ ( 後編 ) 3. 実例 3 ユビキタス コンピューティング時代の組み込みマイクロコンピュータ, SuperH と M32R 清水徹 * 1 長谷川淳 * 2 服部俊洋 * 3 近藤弘郁 * 4 ( 株 ) ルネサステクノロジシステムソリューション統括本部

特集新世代マイクロプロセッサアーキテクチャ ( 後編 ) 3. 実例 3 ユビキタス コンピューティング時代の組み込みマイクロコンピュータ, SuperH と M32R 清水徹 * 1 長谷川淳 * 2 服部俊洋 * 3 近藤弘郁 * 4 ( 株 ) ルネサステクノロジシステムソリューション統括本部 3. 実例 3 ユビキタス コンピューティング時代の組み込みマイクロコンピュータ, SuperH と M32R 清水徹 * 1 長谷川淳 * 2 服部俊洋 * 3 近藤弘郁 * 4 ( 株 ) ルネサステクノロジシステムソリューション統括本部システムコア技術統括部 * 1 shimizu.toru@renesas.com * 2 hasegawa.atsushi@renesas.com * 3 hattori.toshihiro@renesas.com

More information

本文ALL.indd

本文ALL.indd Intel Xeon プロセッサにおける Cache Coherency 時間の性能測定方法河辺峻田口成美古谷英祐 Intel Xeon プロセッサにおける Cache Coherency 時間の性能測定方法 Performance Measurement Method of Cache Coherency Effects on an Intel Xeon Processor System 河辺峻田口成美古谷英祐

More information

Microsoft PowerPoint ppt [互換モード]

Microsoft PowerPoint ppt [互換モード] 計算機アーキテクチャ特論 2013 年 10 28 枝廣 前半 ( 並列アーキテクチャの基本 枝廣 ) 10/7, 10/21, 10/28, 11/11, 11/18, (12/2)( 程は予定 ) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュ コヒーレンシ メモリ コンシステンシ 並列アーキテクチャモデル OSモデル 並列プログラミングモデル 語

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information

Microsoft PowerPoint ppt [互換モード]

Microsoft PowerPoint ppt [互換モード] 計算機アーキテクチャ特論 2016 年 10 24 枝廣 前半 ( 並列アーキテクチャの基本 枝廣 ) 10/3, 10/17, 10/24, 10/31, 11/7, 11/14( 程は予定 ) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュ コヒーレンシ メモリ コンシステンシ 並列プログラミングモデル 語 スケーラビリティに関する法則 同期 並列アルゴリズム

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 加藤真平計算機アーキテクチャ特論 計算機アーキテクチャ特論後半第 1 回最先端アーキテクチャのトレンド 本資料は授業用です 無断で転載することを禁じます 講師加藤真平 前半の趣旨 : 並列化プログラミング for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } シングルプロセッサ マルチプロセッサ x[0]=a[0]+b[0]; x[1]=a[1]+b[1];

More information

富士通セミコンダクター株式会社発表資料

富士通セミコンダクター株式会社発表資料 安心 安全を実現する安全を実現する FM3 マイコン 2012 年 6 月富士通セミコンダクター株式会社マイコンソリューション事業本部五十嵐稔行 Copyright 2010 FUJITSU LIMITED 目次 FM3 ロードマップ 安心 安全への取り組み安全への取り組み 1 Copyright 2010 FUJITSU LIMITED CPUロードマップとITRON系RTOS製品 T-Kernel/μT-Kernel

More information

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

車載マイコンの動向

車載マイコンの動向 車載マイコンの現状について ~2008 年度サーベイ ~ 2008 年 11 月 28 日 ( 財 ) 九州先端科学技術研究所 車のエレクトロニクス化 トヨタ自動車 (1996 - *1936) 燃費 : 7 km/l トヨタ自動車 (Prius HEV 2006) 燃費 :35.5 km/l センサー : 無 ECUs: 無 センサー : 約 100 ECUs: 約 70 ECU: Electronic

More information

SpeC記述のC記述への変換 (SpecCによるソフトウェア記述の実装記述への変換)

SpeC記述のC記述への変換 (SpecCによるソフトウェア記述の実装記述への変換) TOPPERS プロジェクトプレス発表 2009 年 4 月 23 日 TOPPERS/FMP カーネル TraceLogVisualizer(TLV) 本田晋也 名古屋大学大学院情報科学研究科附属組込みシステム研究センター (NCES) 助教 honda@ertl.jp 1 TOPPERS/FMP カーネル 2 組込みシステムにおけるマルチプロセッサの利用 大きく二つの理由により利用が進んでいる

More information

Microsoft PowerPoint - ICD-ARCパネル

Microsoft PowerPoint - ICD-ARCパネル ICD-ARC 共 催 研 究 会 パネル 討 論 新 時 代 におけるマルチコア 戦 略 ( 株 ) 東 芝 セミコンダクター 社 2008 年 5 月 13 日 斎 藤 光 男 プロセッサ 周 波 数 の 年 代 別 の 伸 び 10000 CISCプロセッサの 時 代 アウトオブオーダーの 導 入 3.2GHz P4 3.0GHz P4 3.8GHz P4 3.4GHz 3.6GHz P4 P4

More information

A Responsive Processor for Parallel/Distributed Real-time Processing

A Responsive Processor for Parallel/Distributed Real-time Processing E-mail: yamasaki@{ics.keio.ac.jp, etl.go.jp} http://www.ny.ics.keio.ac.jp etc. CPU) I/O I/O or Home Automation, Factory Automation, (SPARC) (SDRAM I/F, DMAC, PCI, USB, Timers/Counters, SIO, PIO, )

More information

STRJ WS: March 4, 2003, 設計 TF/PIDS/FEP クロスカット 設計 TF/PIDS/FEP クロスカット報告 低電力 SoC のロードマップ - モバイルマルチメディアへのアプローチ - 設計 TF 主査日立製作所内山邦男

STRJ WS: March 4, 2003, 設計 TF/PIDS/FEP クロスカット 設計 TF/PIDS/FEP クロスカット報告 低電力 SoC のロードマップ - モバイルマルチメディアへのアプローチ - 設計 TF 主査日立製作所内山邦男 設計 TF/PIDS/FEP クロスカット報告 低電力 SoC のロードマップ - モバイルマルチメディアへのアプローチ - 設計 TF 主査日立製作所内山邦男 本クロスカットの目的と活動内容 低電力 SoCのロードマップ作成と問題点 技術課題の明確化 (1) モバイルマルチメディアの動向調査 (2) 現状 (0.18um) の低電力 SoCの分析 (3) 低電力 SoC 設計モデルの作成 ( 初期モデル

More information

スライド 1

スライド 1 東北大学工学部機械知能 航空工学科 2019 年度クラス C D 情報科学基礎 I 14. さらに勉強するために 大学院情報科学研究科 鏡慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ 0 と 1 の世界 これまで何を学んだか 2 進数, 算術演算, 論理演算 計算機はどのように動くのか プロセッサとメモリ 演算命令, ロード ストア命令, 分岐命令 計算機はどのように構成されているのか

More information

NUMAの構成

NUMAの構成 共有メモリを使ったデータ交換と同期 慶應義塾大学理工学部 天野英晴 hunga@am.ics.keio.ac.jp 同期の必要性 あるプロセッサが共有メモリに書いても 別のプロセッサにはそのことが分からない 同時に同じ共有変数に書き込みすると 結果がどうなるか分からない そもそも共有メモリって結構危険な代物 多くのプロセッサが並列に動くには何かの制御機構が要る 不可分命令 同期用メモリ バリア同期機構

More information

VLSI工学

VLSI工学 2008/1/15 (12) 1 2008/1/15 (12) 2 (12) http://ssc.pe.titech.ac.jp 2008/1/15 (12) 3 VLSI 100W P d f clk C V 2 dd I I I leak sub g = I sub + I g qv exp nkt exp ( 5. 6V 10T 2. 5) gd T V T ox Gordon E. Moore,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション コンピュータアーキテクチャ 第 13 週 割込みアーキテクチャ 2013 年 12 月 18 日 金岡晃 授業計画 第 1 週 (9/25) 第 2 週 (10/2) 第 3 週 (10/9) 第 4 週 (10/16) 第 5 週 (10/23) 第 6 週 (10/30) 第 7 週 (11/6) 授業概要 2 進数表現 論理回路の復習 2 進演算 ( 数の表現 ) 演算アーキテクチャ ( 演算アルゴリズムと回路

More information

インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美

インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美 インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美 インテル アーキテクチャ プロセッサロードマップ 2000 年第 4 四半期 2001 年上半期 サーバ / インテル Pentium III インテル Itanium ワークステーション Xeon プロセッサプロセッサ パフォーマンスインテル

More information

Microsoft PowerPoint - ARCEMB08HayashiSlides.ppt [互換モード]

Microsoft PowerPoint - ARCEMB08HayashiSlides.ppt [互換モード] 演算 / メモリ性能バランスを考慮した CMP 向けオンチップ メモリ貸与法の提案 九州大学 林徹生今里賢一井上弘士村上和彰 1 発表手順 背景 目的 演算 / メモリ性能バランシング 概要 アクセスレイテンシの削減とオーバーヘッド 提案手法の実現方法 着目する命令 (Cell プロセッサへの ) 実装 性能評価 姫野ベンチマーク Susan@MiBench おわりに 2 チップマルチプロセッサ (CMP)

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション vsmp Foundation スケーラブル SMP システム スケーラブル SMP システム 製品コンセプト 2U サイズの 8 ソケット SMP サーバ コンパクトな筐体に多くのコアとメモリを実装し SMP システムとして利用可能 スイッチなし構成でのシステム構築によりラックスペースを無駄にしない構成 将来的な拡張性を保証 8 ソケット以上への拡張も可能 2 システム構成例 ベースシステム 2U

More information

Microsoft Word - openmp-txt.doc

Microsoft Word - openmp-txt.doc ( 付録 A) OpenMP チュートリアル OepnMP は 共有メモリマルチプロセッサ上のマルチスレッドプログラミングのための API です 本稿では OpenMP の簡単な解説とともにプログラム例をつかって説明します 詳しくは OpenMP の規約を決めている OpenMP ARB の http://www.openmp.org/ にある仕様書を参照してください 日本語訳は http://www.hpcc.jp/omni/spec.ja/

More information

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h 23 FPGA CUDA Performance Comparison of FPGA Array with CUDA on Poisson Equation (lijiang@sekine-lab.ei.tuat.ac.jp), (kazuki@sekine-lab.ei.tuat.ac.jp), (takahashi@sekine-lab.ei.tuat.ac.jp), (tamukoh@cc.tuat.ac.jp),

More information

Microsoft PowerPoint - 集積回路工学(5)_ pptm

Microsoft PowerPoint - 集積回路工学(5)_ pptm 集積回路工学 東京工業大学大学院理工学研究科電子物理工学専攻 松澤昭 2009/0/4 集積回路工学 A.Matuzawa (5MOS 論理回路の電気特性とスケーリング則 資料は松澤研のホームページ htt://c.e.titech.ac.j にあります 2009/0/4 集積回路工学 A.Matuzawa 2 インバータ回路 このようなインバータ回路をシミュレーションした 2009/0/4 集積回路工学

More information

スライド 1

スライド 1 東北大学工学部機械知能 航空工学科 2015 年度 5 セメスター クラス D 計算機工学 5. 命令セットアーキテクチャ ( 教科書 6.1 節, 6.2 節 ) 大学院情報科学研究科鏡慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ 計算機の基本構成 メモリ プロセッサ データ領域 データデータデータ load store レジスタ PC プログラム領域

More information

cmpsys15w07_os.ppt

cmpsys15w07_os.ppt 情報システム論 第 7 週ソフトウェアシステム Operating System (part I) 根來 均 ソフトウェア (Software) とは プログラムと同義もしくは各種プログラムの総称 ソフトウェアは 記憶装置上などに 電子的にのみ (0/1 で記録された情報として ) 存在する ソフトウェアに対して 物理的に存在する CPU 等の各種装置をハードウェア Hardware と呼ぶ 例えば

More information

Microsoft PowerPoint - ICD2011TakadaSlides.pptx

Microsoft PowerPoint - ICD2011TakadaSlides.pptx キャッシュウェイ割り当てと コード配置の同時最適化による メモリアクセスエネルギーの削減 九州大学 高田純司井上弘士京都大学石原亨 2012/8/9 1 目次 研究背景 組込みプロセッサにおけるエネルギー削減の必要性 キャッシュウェイ割り当て 提案手法 キャッシュウェイ割り当てとコード配置の組み合わせ 同時最適化 評価実験 まとめ 2012/8/9 2 組込みプロセッサの課題 研究背景 低消費エネルギー化,

More information

2015 TRON Symposium セッション 組込み機器のための機能安全対応 TRON Safe Kernel TRON Safe Kernel の紹介 2015/12/10 株式会社日立超 LSIシステムズ製品ソリューション設計部トロンフォーラム TRON Safe Kernel WG 幹事

2015 TRON Symposium セッション 組込み機器のための機能安全対応 TRON Safe Kernel TRON Safe Kernel の紹介 2015/12/10 株式会社日立超 LSIシステムズ製品ソリューション設計部トロンフォーラム TRON Safe Kernel WG 幹事 2015 TRON Symposium セッション 組込み機器のための機能安全対応 TRON Safe Kernel TRON Safe Kernel の紹介 2015/12/10 株式会社日立超 LSIシステムズ製品ソリューション設計部トロンフォーラム TRON Safe Kernel WG 幹事 豊山 祐一 Hitachi ULSI Systems Co., Ltd. 2015. All rights

More information

N08

N08 CPU のキモチ C.John 自己紹介 英語きらい 絵かけない 人の話を素直に信じない CPUにキモチなんてない お詫び 予告ではCとC# とありましたがやる気と時間の都合上 C++のみを対象とします 今日のネタ元 MSDN マガジン 2010 年 10 月号 http://msdn.microsoft.com/ja-jp/magazine/cc850829.aspx Windows と C++

More information

スライド 1

スライド 1 東北大学工学部機械知能 航空工学科 2016 年度 5 セメスター クラス C3 D1 D2 D3 計算機工学 14. さらに勉強するために 大学院情報科学研究科 鏡慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ 0 と 1 の世界 これまで何を学んだか 2 進数, 算術演算, 論理演算 計算機はどのように動くのか プロセッサとメモリ 演算命令, ロード

More information

Microsoft PowerPoint - OpenMP入門.pptx

Microsoft PowerPoint - OpenMP入門.pptx OpenMP 入門 須田礼仁 2009/10/30 初版 OpenMP 共有メモリ並列処理の標準化 API http://openmp.org/ 最新版は 30 3.0 バージョンによる違いはあまり大きくない サポートしているバージョンはともかく csp で動きます gcc も対応しています やっぱり SPMD Single Program Multiple Data プログラム #pragma omp

More information

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果 Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7

More information

PNopenseminar_2011_開発stack

PNopenseminar_2011_開発stack PROFINET Open Seminar 開発セミナー Software Stack FPGA IP core PROFINET 対応製品の開発 2 ユーザ要求要求は多種多様 複雑な規格の仕様を一から勉強するのはちょっと.. できるだけ短期間で 柔軟なスケジュールで進めたい既存のハードウェアを変更することなく PN を対応させたい将来的な仕様拡張に対してシームレスに統合したい同じハードウェアで複数の

More information

はじめに Web アプリケーションの発展と普及の勢いは弱まる兆しがありません 弱まるどころか 加速し続けています これは これまでの ERP CRM Web 2.0 などの Web ベースアプリケーションが提供してきたメリットを考えると 不思議なことではありません Web アプリケーションの爆発的拡

はじめに Web アプリケーションの発展と普及の勢いは弱まる兆しがありません 弱まるどころか 加速し続けています これは これまでの ERP CRM Web 2.0 などの Web ベースアプリケーションが提供してきたメリットを考えると 不思議なことではありません Web アプリケーションの爆発的拡 ncore テクノロジー Web アプリケーションデリバリー性能の飛躍的向上 www.citrix.com はじめに Web アプリケーションの発展と普及の勢いは弱まる兆しがありません 弱まるどころか 加速し続けています これは これまでの ERP CRM Web 2.0 などの Web ベースアプリケーションが提供してきたメリットを考えると 不思議なことではありません Web アプリケーションの爆発的拡大の一方で

More information

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の

この方法では, 複数のアドレスが同じインデックスに対応づけられる可能性があるため, キャッシュラインのコピーと書き戻しが交互に起きる性のミスが発生する可能性がある. これを回避するために考案されたのが, 連想メモリアクセスができる形キャッシュである. この方式は, キャッシュに余裕がある限り主記憶の 計算機システム Ⅱ 演習問題学科学籍番号氏名 1. 以下の分の空白を埋めなさい. CPUは, 命令フェッチ (F), 命令デコード (D), 実行 (E), 計算結果の書き戻し (W), の異なるステージの処理を反復実行するが, ある命令の計算結果の書き戻しをするまで, 次の命令のフェッチをしない場合, ( 単位時間当たりに実行できる命令数 ) が低くなる. これを解決するために考案されたのがパイプライン処理である.

More information

openmp1_Yaguchi_version_170530

openmp1_Yaguchi_version_170530 並列計算とは /OpenMP の初歩 (1) 今 の内容 なぜ並列計算が必要か? スーパーコンピュータの性能動向 1ExaFLOPS 次世代スハ コン 京 1PFLOPS 性能 1TFLOPS 1GFLOPS スカラー機ベクトル機ベクトル並列機並列機 X-MP ncube2 CRAY-1 S-810 SR8000 VPP500 CM-5 ASCI-5 ASCI-4 S3800 T3E-900 SR2201

More information

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18 OpenMP* 4.x における拡張 OpenMP 4.0 と 4.5 の機能拡張 内容 OpenMP* 3.1 から 4.0 への拡張 OpenMP* 4.0 から 4.5 への拡張 2 追加された機能 (3.1 -> 4.0) C/C++ 配列シンタックスの拡張 SIMD と SIMD 対応関数 デバイスオフロード task 構 の依存性 taskgroup 構 cancel 句と cancellation

More information

(Microsoft PowerPoint - E6x5C SDXC Demo Seminar [\214\335\212\267\203\202\201[\203h])

(Microsoft PowerPoint - E6x5C SDXC Demo Seminar [\214\335\212\267\203\202\201[\203h]) Atom プロセッサ E6x5C の紹介と FPGA IP Core 活 例の紹介 アイウェーブ ジャパン株式会社 神奈川県横浜市中区住吉町 3 丁目 29 番住吉関内ビル8 階 B Tel: 045-227-7626 Fax: 045-227-7646 Mail: info@iwavejapan.co.jp Web: www.iwavejapan.co.jp 2011/5/30 1 iwave Japan,

More information

スライド 1

スライド 1 知能制御システム学 画像処理の高速化 OpenCV による基礎的な例 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2007.07.03 リアルタイム処理と高速化 リアルタイム = 高速 ではない 目標となる時間制約が定められているのがリアルタイム処理である.34 ms かかった処理が 33 ms に縮んだだけでも, それによって与えられた時間制約が満たされるのであれば,

More information

SH2A-DUALコア搭載製品SH7265のご紹介

SH2A-DUALコア搭載製品SH7265のご紹介 SH2A-DUAL コア搭載製品 SH7265 のご紹介 システムソリューション統括本部システムソリューション製品技術部 1 ルネサスのマルチコア化取組み (1) 業界動向 ニーズ : 機器のさらなる性能向上 高機能化 対応策 : 微細化による大規模集積化 高速化 消費電力問題 解の 1 つとして マルチコア化の流れ (2) ルネサスのマルチコア化取組み状況適用分野別のマルチコア製品を開発中 1 マルチメディア処理向けマイクロプロセッサ

More information

組込みシステムシンポジウム2011 Embedded Systems Symposium 2011 ESS /10/20 FPGA Android Android Java FPGA Java FPGA Dalvik VM Intel Atom FPGA PCI Express DM

組込みシステムシンポジウム2011 Embedded Systems Symposium 2011 ESS /10/20 FPGA Android Android Java FPGA Java FPGA Dalvik VM Intel Atom FPGA PCI Express DM Android Android Java Java Dalvik VM Intel Atom PCI Express DMA 1.25 Gbps Atom Android Java Acceleration with an Accelerator in an Android Mobile Terminal Keisuke Koike, Atsushi Ohta, Kohta Ohshima, Kaori

More information

IPSJ SIG Technical Report Vol.2013-ARC-203 No /2/1 SMYLE OpenCL (NEDO) IT FPGA SMYLEref SMYLE OpenCL SMYLE OpenCL FPGA 1

IPSJ SIG Technical Report Vol.2013-ARC-203 No /2/1 SMYLE OpenCL (NEDO) IT FPGA SMYLEref SMYLE OpenCL SMYLE OpenCL FPGA 1 SMYLE OpenCL 128 1 1 1 1 1 2 2 3 3 3 (NEDO) IT FPGA SMYLEref SMYLE OpenCL SMYLE OpenCL FPGA 128 SMYLEref SMYLE OpenCL SMYLE OpenCL Implementation and Evaluations on 128 Cores Takuji Hieda 1 Noriko Etani

More information

SafeG 高信頼組込みシステム向けデュアル OS モニタ Daniel Sangorrín, 本田晋也, 高田広章 名古屋大学 2010 年 12 月 3 日 この研究の一部は文部科学省のサポート受けて実施しています Daniel Sangorrín ( 名古屋大学 ) ET 横浜 2

SafeG 高信頼組込みシステム向けデュアル OS モニタ Daniel Sangorrín, 本田晋也, 高田広章 名古屋大学 2010 年 12 月 3 日 この研究の一部は文部科学省のサポート受けて実施しています Daniel Sangorrín ( 名古屋大学 ) ET 横浜 2 SafeG 高信頼組込みシステム向けデュアル OS モニタ Daniel Sangorrín, 本田晋也, 高田広章 名古屋大学 2010 年 12 月 3 日 この研究の一部は文部科学省のサポート受けて実施しています Daniel Sangorrín ( 名古屋大学 ) ET2010 - 横浜 2010 年 12 月 3 日 1 / 25 目次 1 Introduction 2 SafeG 3 Evaluation

More information

システムソリューションのご紹介

システムソリューションのご紹介 HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ

More information

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx

Microsoft PowerPoint - ARC2009HashiguchiSlides.pptx 3 次元 DRAM プロセッサ積層実装を 対象としたオンチップ メモリ アーキテクチャの提案と評価 橋口慎哉 小野貴継 ( 現 ) 井上弘士 村上和彰 九州大学大学院システム情報科学府 九州大学大学院システム情報科学研究院 発表手順 研究背景 研究目的 ハイブリッド キャッシュ アーキテクチャ 評価実験 まとめと今後の課題 2 3 次元実装技術 研究背景 グローバル配線長の削減 チップ面積縮小 異なるプロセスを経て製造されたダイ同士の積層

More information

橡松下発表資料.PDF

橡松下発表資料.PDF ... TV TV MPEG2 1394 JAVA HTML BML LSI Bluetooth 802.11 Linux PLC Internet ITRON 1. 2. TV -1-2 -3 3. 1. 2. TV -1-2 -3 3. 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12 96/9 PerfecTV 98/4 SkyPerfecTV

More information

untitled

untitled PC murakami@cc.kyushu-u.ac.jp muscle server blade server PC PC + EHPC/Eric (Embedded HPC with Eric) 1216 Compact PCI Compact PCIPC Compact PCISH-4 Compact PCISH-4 Eric Eric EHPC/Eric EHPC/Eric Gigabit

More information

Microsoft PowerPoint - ARCICD07FukumotoSlides.pptx

Microsoft PowerPoint - ARCICD07FukumotoSlides.pptx チップマルチプロセッサにおける データ プリフェッチ効果の分析 福本尚人, 三原智伸九州大学大学院システム情報科学府情報理学専攻 井上弘士, 村上和彰九州大学大学院システム情報科学研究院情報理学部門 2007/6/1 1 発表手順 研究の背景 目的 効果に基づくプリフェッチの分類法 マルチプロセッサ チップマルチプロセッサ 性能モデル式による定性的評価 定量的評価 まとめ 2007/6/1 2 研究の背景

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Dell PowerEdge C6320 スケーラブルサーバアプライアンス 仮想化アプライアンスサーバ 最新のプロセッサを搭載したサーバプラットフォーム vsmp Foundation によるサーバ仮想化と統合化の適用 システムはセットアップを完了した状態でご提供 基本構成ではバックプレーン用のスイッチなどが不要 各ノード間を直接接続 冗長性の高いバックプレーン構成 利用するサーバプラットフォームは

More information

(Microsoft PowerPoint - \221g\202\335\215\236\202\335\203\\\203t\203g\203E\203F\203A\215H\212w No03\201i\224z\225z\227p\201j.pptx)

(Microsoft PowerPoint - \221g\202\335\215\236\202\335\203\\\203t\203g\203E\203F\203A\215H\212w No03\201i\224z\225z\227p\201j.pptx) 前回の講義のおさらい 組み込みソフトウェア工学 第 3 回組み込みシステムアーキテクチャ 開発プロセス 製品を開発する上での必要なプロセス 何を作るか ( 要求, 戦略 ) どうやって作るか ( 開発プロセス ) 開発で必要な要因 ( 人物金情報 ) スケジュールと仕様書 本日の内容 組み込みシステムアーキテクチャ 組み込みシステムにおけるソフトウェアを作成する上で必要な構成要素をどのように考えるかについて理解する

More information

テストコスト抑制のための技術課題-DFTとATEの観点から

テストコスト抑制のための技術課題-DFTとATEの観点から 2 -at -talk -talk -drop 3 4 5 6 7 Year of Production 2003 2004 2005 2006 2007 2008 Embedded Cores Standardization of core Standard format Standard format Standard format Extension to Extension to test

More information

ルネサス半導体セミナースケジュール

ルネサス半導体セミナースケジュール 1 3ページ 2018 年 7 12 4 6ページ 2018 年 1 6 2018/6/25 ルネサス半導体トレーニングセンター 2018 年 7 12 セミナースケジュール 製品セミナー RL78 RX RZ Renesas Synergy 7 8 9 10 11 12 RL78 1day 速習 動かしてみよう編 コース 8/7 9/26 12/11 1 間 ( 無料 ) 8/23 12/20 RL78

More information

スライド 1

スライド 1 入出力,OS, 計算機の高速化 1 0 と 1 の世界 これまで何を学んだか 2 進数, 算術演算, 論理演算, 浮動小数点数 計算機はどのように動くのか プロセッサとメモリ 演算命令, ロード ストア命令, 分岐命令 計算機はどのように構成されているのか 組合せ回路 論理関数 論理式の標準形, 論理式の簡単化 順序回路 有限状態機械 メインメモリ, キャッシュメモリ 2 目次 プロセッサとメモリ

More information

untitled

untitled ITRS2005 DFM STRJ : () 1 ITRS STRJ ITRS2005DFM STRJ DFM ITRS: International Technology Roadmap for Semiconductors STRJ: Semiconductor Technology Roadmap committee of Japan 2 ITRS STRJ 1990 1998 2000 2005

More information

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

White Paper 高速部分画像検索キット(FPGA アクセラレーション) White Paper 高速部分画像検索キット (FPGA アクセラレーション ) White Paper 高速部分画像検索キット (FPGA アクセラレーション ) Page 1 of 7 http://www.fujitsu.com/primergy Content はじめに 3 部分画像検索とは 4 高速部分画像検索システム 5 高速部分画像検索の適用時の改善効果 6 検索結果 ( 一例 )

More information

Microsoft PowerPoint - 11Web.pptx

Microsoft PowerPoint - 11Web.pptx 計算機システムの基礎 ( 第 10 回配布 ) 第 7 章 2 節コンピュータの性能の推移 (1) コンピュータの歴史 (2) コンピュータの性能 (3) 集積回路の進歩 (4) アーキテクチャ 第 4 章プロセッサ (1) プロセッサの基本機能 (2) プロセッサの構成回路 (3) コンピュータアーキテクチャ 第 5 章メモリアーキテクチャ 1. コンピュータの世代 計算する機械 解析機関 by

More information

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops ボードの概要 Control processor (FPGA by Altera) GRAPE-MP chip[nextreme

More information

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx)

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx) AICS 村井均 RIKEN AICS HPC Summer School 2012 8/7/2012 1 背景 OpenMP とは OpenMP の基本 OpenMP プログラミングにおける注意点 やや高度な話題 2 共有メモリマルチプロセッサシステムの普及 共有メモリマルチプロセッサシステムのための並列化指示文を共通化する必要性 各社で仕様が異なり 移植性がない そして いまやマルチコア プロセッサが主流となり

More information

ためのオーバーヘッドが課題となりつつある しかしこのオーバーヘッドに関する数値はほとんど公開されていない この論文ではこの cache coherency の時間を Linux カーネルで提供されている atomic_inc 関数を用いて測定する方法を新たに考案し 実測プログラムを作成した 実測はプ

ためのオーバーヘッドが課題となりつつある しかしこのオーバーヘッドに関する数値はほとんど公開されていない この論文ではこの cache coherency の時間を Linux カーネルで提供されている atomic_inc 関数を用いて測定する方法を新たに考案し 実測プログラムを作成した 実測はプ Intel Xeon プロセッサにおける Cache Coherency 時間の測定方法と大規模システムにおける実測結果 Performance Measurement Method of Cache Coherency Effects on a large Intel Xeon Processor System 河辺峻 1 古谷英祐 2 KAWABE Shun, FURUYA Eisuke 要旨現在のプロセッサの構成は,

More information

CELSIUSカタログ(2012年5月版)

CELSIUSカタログ(2012年5月版) CELSIUS PC "MADE IN JAPAN" 2012.5 New W520 ハイエンドの過酷な要求に応えるパワフルなデュアルと高信頼を搭載 トを搭載 RAID構成 選択可能 New グラフィックス/GPUカード 500GB 1TB 500GB 2 RAID1 Quadro 5000 Quadro 4000 Quadro 2000 Quadro 600 4 Quadro 4000 TeslaTM

More information

Presentation Title

Presentation Title コード生成製品の普及と最新の技術動向 MathWorks Japan パイロットエンジニアリング部 東達也 2014 The MathWorks, Inc. 1 MBD 概要 MATLABおよびSimulinkを使用したモデルベース デザイン ( モデルベース開発 ) 紹介ビデオ 2 MBD による制御開発フローとコード生成製品の活用 制御設計の最適化で性能改善 設計図ですぐに挙動確認 MILS:

More information

POSIXプログラミング Pthreads編

POSIXプログラミング Pthreads編 POSIXプログラミング Pthreads 編 デジタルビジョンソリューション 中山一弘佐藤史明 参考図書 Pthreads プログラミング, Bradford Nichols, Dick Buttlar, Jacqeline Proulx Farrell, ISBN4-900900-66-4 Pthreads POSIX スレッド標準を実装したライブラリを Pthreads と呼ぶ C 言語のデータ型

More information

最新の並列計算事情とCAE

最新の並列計算事情とCAE 1 大島聡史 ( 東京大学情報基盤センター助教 / 並列計算分科会主査 ) 最新の並列計算事情と CAE アウトライン 最新の並列計算機事情と CAE 世界一の性能を達成した 京 について マルチコア メニーコア GPU クラスタ 最新の並列計算事情と CAE MPI OpenMP CUDA OpenCL etc. 京 については 仕分けやら予算やら計画やらの面で問題視する意見もあるかと思いますが

More information

VLSI工学

VLSI工学 2008//5/ () 2008//5/ () 2 () http://ssc.pe.titech.ac.jp 2008//5/ () 3!! A (WCDMA/GSM) DD DoCoMo 905iP905i 2008//5/ () 4 minisd P900i SemiConsult SDRAM, MPEG4 UIMIrDA LCD/ AF ADC/DAC IC CCD C-CPUA-CPU DSPSRAM

More information

スライド 1

スライド 1 Nehalem 新マイクロアーキテクチャ スケーラブルシステムズ株式会社 はじめに 現在も続く x86 マイクロプロセッサマーケットでの競合において Intel と AMD という 2 つの会社は 常に新しい技術 製品を提供し マーケットでのシェアの獲得を目指しています この技術開発と製品開発では この 2 社はある時は 他社に対して優位な技術を開発し 製品面での優位性を示すことに成功してきましたが

More information

スライド 1

スライド 1 計算科学が拓く世界スーパーコンピュータは何故スーパーか 学術情報メディアセンター中島浩 http://www.para.media.kyoto-u.ac.jp/jp/ username=super password=computer 講義の概要 目的 計算科学に不可欠の道具スーパーコンピュータが どういうものか なぜスーパーなのか どう使うとスーパーなのかについて雰囲気をつかむ 内容 スーパーコンピュータの歴史を概観しつつ

More information

01-introduction.ppt

01-introduction.ppt オペレーティングシステム ~ イントロダクション ~ 山田浩史 hiroshiy @ cc.tuat.ac.jp 2015/04/10 オペレーティングシステム 担当 : 山田浩史 ( やまだひろし ) mail: hiroshiy @ cc.tuat.ac.jp 質問等ありましたら気軽にメールをしてください 専門分野 オペレーティングシステムや仮想マシンモニタといった システムソフトウェア と呼ばれる分野

More information

複数の Nios II を構成する際の注意事項

複数の Nios II を構成する際の注意事項 ver. 1.0 2009 年 4 月 1. はじめに Nios II IDE で ソフトウェアをビルドすると SOPC Builder の GUI 上で Nios II と接続されているペリフェラル用の初期化コードを自動で生成します この各ペリフェラルに対応した初期化コードで ペリフェラルを制御するためにアルテラ社から提供された HAL を利用するための準備や 各ペリフェラルの一般的な理想と考えられる初期状態のレジスタ設定等を行います

More information

160311_icm2015-muramatsu-v2.pptx

160311_icm2015-muramatsu-v2.pptx Linux におけるパケット処理機構の 性能評価に基づいた NFV 導 の 検討 村松真, 川島 太, 中 裕貴, 林經正, 松尾啓志 名古屋 業 学 学院 株式会社ボスコ テクノロジーズ ICM 研究会 2016/03/11 研究 的 VM 仮想 NIC バックエンド機構 仮想化環境 仮想スイッチ パケット処理機構 物理環境 性能要因を考察 汎 IA サーバ NFV 環境に適したサーバ構成を検討

More information

Core1 FabScalar VerilogHDL Cache Cache FabScalar 1 CoreConnect[2] Wishbone[3] AMBA[4] AMBA 1 AMBA ARM L2 AMBA2.0 AMBA2.0 FabScalar AHB APB AHB AMBA2.0

Core1 FabScalar VerilogHDL Cache Cache FabScalar 1 CoreConnect[2] Wishbone[3] AMBA[4] AMBA 1 AMBA ARM L2 AMBA2.0 AMBA2.0 FabScalar AHB APB AHB AMBA2.0 AMBA 1 1 1 1 FabScalar FabScalar AMBA AMBA FutureBus Improvement of AMBA Bus Frame-work for Heterogeneos Multi-processor Seto Yusuke 1 Takahiro Sasaki 1 Kazuhiko Ohno 1 Toshio Kondo 1 Abstract: The demand

More information

プロセッサ・アーキテクチャ

プロセッサ・アーキテクチャ 2. NII51002-8.0.0 Nios II Nios II Nios II 2-3 2-4 2-4 2-6 2-7 2-9 I/O 2-18 JTAG Nios II ISA ISA Nios II Nios II Nios II 2 1 Nios II Altera Corporation 2 1 2 1. Nios II Nios II Processor Core JTAG interface

More information

Microsoft PowerPoint ppt [互換モード]

Microsoft PowerPoint ppt [互換モード] 計算機アーキテクチャ特論 A 2017 年 11 6 枝廣 計算機アーキテクチャ特論 A 並列アーキテクチャの基本 ( 枝廣 ) 10/2, 10/16, 10/23, 10/30, 11/6, 11/13, (11/20( 予備 )) 内容 ( 変更の可能性あり ) 序論 ( マルチコア= 並列アーキテクチャ概論 ) キャッシュ コヒーレンシ メモリ コンシステンシ 並列プログラミングモデル 語

More information

Insert your Title here

Insert your Title here マルチコア マルチスレッド環境での静的解析ツールの応用 米 GrammaTech 社 CodeSonar によるスレッド間のデータ競合の検出 2013 GrammaTech, Inc. All rights reserved Agenda 並列実行に起因する不具合の摘出 なぜ 並列実行されるプログラミングは難しいのか データの競合 デッドロック どのようにして静的解析ツールで並列実行の問題を見つけるのか?

More information

Microsoft PowerPoint - ICD2011UenoSlides.pptx

Microsoft PowerPoint - ICD2011UenoSlides.pptx 画像認識向け 3 次元積層 アクセラレータ アーキテクチャの検討 九州大学大学院システム情報科学府学院 * 九州大学大学院システム情報科学研究院 ** 上野伸也 * Gauthier Lovic Eric** 井上弘士 ** 村上和彰 ** 1 概要 画像認識技術 アクセラレータによる高性能 低消費エネルギー化 アプリケーション分析 アクセラレータ アーキテクチャ検討ア 性能 消費エネルギー評価 まとめ

More information

デジタルカメラ用ISP:Milbeaut

デジタルカメラ用ISP:Milbeaut ISP Milbeaut Image Signal Processor: Milbeaut あらまし MilbeautISP Image Signal Processor 20 Mpixel Milbeaut6 MB91696AM MB91696AM Abstract Milbeaut is an image signal processor (ISP) that realizes a digital

More information

/

/ / CoMET とは? APPLICATIONS IP -PROCESSOR IP Application Programs (C/C++) Reactive Operating System Kernels PROPRIETARY OPERATING SYSTEM IP BUS, CACHE, TLB IP SOFTWARE TEST SETS Interactive Software Debugging

More information

CELSIUSカタログ(2012年7月版)

CELSIUSカタログ(2012年7月版) CELSIUS PC "MADE IN JAPAN" 2012.7 W520 ハイエンドの過酷な要求に応えるパワフルなデュアルと高信頼を搭載 RAID構成 選択可能 富士通がお勧めする Windows 7. ミニタワーエントリーモデル より速く より強力に 最新の技術をフル投入 スピードとパワー 安定性を提供 RAID構成 選択可能 Windows 7 Professional 32bit版 正規版

More information

2005 1

2005 1 25 SPARCstation 2 CPU central processor unit 25 2 25 3 25 4 DRAM 25 5 25 6 : DRAM 25 7 2 25 8 2 25 9 2 bit: binary digit V 2V 25 2 2 2 2 4 5 2 6 3 7 25 A B C A B C A B C A B C A C A B 3 25 2 25 3 Co Cin

More information

-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR

-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR 第 回マイクロプロセッサのしくみ マイクロプロセッサの基本的なしくみについて解説する. -1 マイクロプロセッサと周辺回路の接続 制御バス プロセッサ データ バス アドレス バス メモリ 周辺インタフェース バスの基本構成 Fig.-1 バスによる相互接続は, 現在のコンピュータシステムのハードウェアを特徴づけている. バス (Bus): 複数のユニットで共有される信号線システム内の データの通り道

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.09.10 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 1 / 59 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 2 / 59 Windows, Mac Unix 0444-J furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 3 / 59 Part I Unix GUI CUI:

More information

??

?? Real-time Remote Control & Monitoring System EDUNET HYBRID EDITION 製品紹介 創造デザイン http://sozodg.com Real-time Remote Control & Monitoring System 1. 概要 1) EduNet Hybrid System は設備 PC の CPU リソースを使用せずに Full

More information

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc 2.3. アプリ性能 2.3.1. Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア

More information

ハード・ソフト協調検証サービス

ハード・ソフト協調検証サービス ハード ソフトのトータルサービス 富士通エレクトロニクス株式会社株式会社富士通ソフトウェアテクノロジーズ 目次 モデル概要 モデル 特徴 このサービス利用のメリット サービスメニュー 1 企画から開発 量産までトータルでサポート 富士通エレクトロニクスと富士通ソフトウェアテクノロジーズはお客様の製品開発を 企画段階から開発 量産までサポートします 製品開発をサポートする検証 認定作業のご提供 製品要求仕様の作成をコンサルティング

More information

Monthly Research / セキュアハードウェアの登場とその分析

Monthly Research / セキュアハードウェアの登場とその分析 Monthly Research セキュアハードウェアの登場とその分析 株式会社フォティーンフォティ技術研究所 http://www.fourteenforty.jp Ver2.00.02 1 セキュアハードウェア ハードウェアレベルでのセキュリティ拡張や それを実装したハードウェアが提案されている 通常のマイクロプロセッサを拡張することで柔軟性を確保する試みもある 今回は主に ARM TrustZone

More information

完成版_セミナー発表資料110928

完成版_セミナー発表資料110928 PROFINET オープンセミナー ASIC を使用した開発 開発セミナー 目次 2 PROFINET の実装 ASIC という選択 PROFINET 機器開発における課題 ASIC による課題の解決 ASIC の特徴ターゲットアプリケーション適用例ラインアップ ASIC 製品紹介 1 PROFINET の実装 3 PROFINET の実装手法 Ethernet ポート付きマイコン FPGA PROFINET

More information

IPSJ SIG Technical Report Vol.2013-ARC-206 No /8/1 Android Dominic Hillenbrand ODROID-X2 GPIO Android OSCAR WFI 500[us] GPIO GP

IPSJ SIG Technical Report Vol.2013-ARC-206 No /8/1 Android Dominic Hillenbrand ODROID-X2 GPIO Android OSCAR WFI 500[us] GPIO GP Android 1 1 1 1 1 Dominic Hillenbrand 1 1 1 ODROID-X2 GPIO Android OSCAR WFI 500[us] GPIO GPIO API GPIO API GPIO MPEG2 Optical Flow MPEG2 1PE 0.97[W] 0.63[W] 2PE 1.88[w] 0.46[W] 3PE 2.79[W] 0.37[W] Optical

More information

Microsoft PowerPoint - sales2.ppt

Microsoft PowerPoint - sales2.ppt 最適化とは何? CPU アーキテクチャに沿った形で最適な性能を抽出できるようにする技法 ( 性能向上技法 ) コンパイラによるプログラム最適化 コンパイラメーカの技量 経験量に依存 最適化ツールによるプログラム最適化 KAP (Kuck & Associates, Inc. ) 人によるプログラム最適化 アーキテクチャのボトルネックを知ること 3 使用コンパイラによる性能の違い MFLOPS 90

More information

cmpsys13w03_cpu_hp.ppt

cmpsys13w03_cpu_hp.ppt 情報システム論 第 3 章! CPU! 根来 均 Outline! u CPU の主な働き! u CPU での命令実行処理! u CPU の高速化技術! u CPU の性能評価方法 手段! u 並列計算機! u 現在の CPU の動向 CPU の主な働き u 制御装置 (Control Unit, CU)! プログラム制御 ( 命令の解読 実行 分岐命令 データ転送命令 )! 入出力制御 ( 入出力動作と内部処理

More information

ComputerArchitecture.ppt

ComputerArchitecture.ppt 1 人間とコンピュータの違い コンピュータ 複雑な科学計算や膨大な量のデータの処理, さまざまな装置の制御, 通信などを定められた手順に従って間違いなく高速に実行する 人間 誰かに命令されなくても自発的に処理したり, 条件が変化しても臨機応変に対処できる 多くの問題解決を経験することで, より高度な問題解決法を考え出す 数値では表しにくい情報の処理ができる 2 コンピュータの構成要素 構成要素 ハードウェア

More information

HP ProLiant 500シリーズ

HP ProLiant 500シリーズ HPProLiant5 DL58/585 HPProLiant5 4 HPProLiant5 HPProLiant5 64 HPProLiant5 TPC-H@1GB 4, 34,99 SAP SD Benchmark Users QphH@1GB 3, 2, 1, 4, 3, 2, 1, DL58 G5, Xeon X735 DL585 G5, AMD Opteron 836SE 17,12 DL58

More information

TRQerS - Introduction

TRQerS - Introduction TRQerS 導入概要 横河ディジタルコンピュータ株式会社エンベデッドソリューション事業本部サポート部 (ESC-APN-035-02 Dec,25,2015) 1 システムマクロトレースの特徴 製品構成と導入フロー 2 システムマクロトレースの特徴 システムマクロトレース printf ログ出力の発展形 (printf より高速 文字列 / タグ情報 / タスク遷移 / 関数遷移 ) ハードウェアインターフェース

More information

計算機アーキテクチャ

計算機アーキテクチャ 計算機アーキテクチャ 第 11 回命令実行の流れ 2014 年 6 月 20 日 電気情報工学科 田島孝治 1 授業スケジュール ( 前期 ) 2 回日付タイトル 1 4/7 コンピュータ技術の歴史と コンピュータアーキテクチャ 2 4/14 ノイマン型コンピュータ 3 4/21 コンピュータのハードウェア 4 4/28 数と文字の表現 5 5/12 固定小数点数と浮動小数点表現 6 5/19 計算アーキテクチャ

More information

目的 システムLSIの電力性能比 ( 性能 / 電力 ) 向上 背景 : 通勤電車のひとコマ 一昔前 今は 社会全体が要求する情報処理能力の飛躍的増大 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 2

目的 システムLSIの電力性能比 ( 性能 / 電力 ) 向上 背景 : 通勤電車のひとコマ 一昔前 今は 社会全体が要求する情報処理能力の飛躍的増大 CREST ULP 領域公開シンポジウム ( 東京大学中村宏 ) 2012/11/30 2 回路 ~ アーキテクチャ ~ システムソフトウェア協調で実現する低消費電力化技術 プロジェクト名 : 革新的電源制御による次世代超低電力高性能システム LSI の研究 中村宏 ( 東京大学 ) 宇佐美公良 ( 芝浦工業大学 ) 天野英晴 ( 慶應義塾大学 ) 近藤正章 ( 電気通信大学 ) 並木美太郎 ( 東京農工大学 ) 黒田忠広 ( 慶應義塾大学 ) 目的 システムLSIの電力性能比 ( 性能

More information

1 概要

1 概要 本文書は株式会社マイクロネットの所有物です 許可無く複製 利用することはできません プラットフォーム適合評価レポート 被評価機 : たけびし XRT-7100 INtime 機能適合性結果 適合 リアルタイム性能評価結果 優良 評価年月日 : 2008/03/21 プラットフォームベンダ名 たけびし プラットフォーム XRT-7100 314-0135 茨城県神栖市掘割 Windows Version

More information

Microsoft PowerPoint - 6-盛合--日文.ppt

Microsoft PowerPoint - 6-盛合--日文.ppt CLEFIA Sony s s Lightweight Block Cipher Shiho Moriai Sony Corporation 1 目次 ソニーにおける暗号技術 ソニーのブロック暗号 :CLEFIA 設計の背景 アルゴリズム仕様 設計方針 実装性能評価 まとめ 2 ソニーにおける暗号技術 暗号 / 情報セキュリティ技術搭載製品の増加 各種暗号アルゴリズム 著作権保護 機器認証 電子マネー

More information

(速報) Xeon E 系モデル 新プロセッサ性能について

(速報) Xeon E 系モデル 新プロセッサ性能について ( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690

More information

Microsoft Word - SSTC_Intel_Core.doc

Microsoft Word - SSTC_Intel_Core.doc 技術メモ インテル Core マイクロアーキテクチャ スケーラブルシステムズ株式会社 技術メモ インテル Core マイクロアーキテクチャ 1. はじめに... 2 2. Intel Core マイクロアーキテクチャ... 3 3. マイクロプロセッサの性能を左右するものは?... 5 4. Intel Core マイクロアーキテクチャに投入された主要技術... 6 Advanced Digital

More information

<4D F736F F F696E74202D D4C82F08A B582BD A A F2E707074>

<4D F736F F F696E74202D D4C82F08A B582BD A A F2E707074> SysML を活用したシステムエンジニアリング オージス総研組み込みソリューション部 1 アジェンダ 概要編なぜシステムエンジニアリングかシステムエンジニアリングとはシステムエンジニアリングとモデリング言語 SysML の特徴実践編機能要求を検討する要求を仕様化する振る舞いを検討する構造を検討する論理ブロックを物理ブロックに割り当てる性能を検討するまとめ 2 概要編 : なぜシステムエンジニアリングか

More information

組込み Linux の起動高速化 株式会社富士通コンピュータテクノロジーズ 亀山英司 1218ka01 Copyright 2013 FUJITSU COMPUTER TECHNOLOGIES LIMITED

組込み Linux の起動高速化 株式会社富士通コンピュータテクノロジーズ 亀山英司 1218ka01 Copyright 2013 FUJITSU COMPUTER TECHNOLOGIES LIMITED 組込み Linux の起動高速化 株式会社富士通コンピュータテクノロジーズ 亀山英司 1218ka01 組込み Linux における起動高速化 組込み Linux の起動時間短縮について依頼あり スペック CPU : Cortex-A9 ( 800MB - single) RAM: 500MB 程度 要件 起動時間 画出し 5 秒 音出し 3 秒 終了時間 数 ms で電源断 1 課題と対策 問題点

More information