Slide 1

Similar documents
スライド 1

VXPRO R1400® ご提案資料

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

スライド 1

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

6 構 造 等 コンクリートブロック 造 平 屋 建 て4 戸 長 屋 16 棟 64 戸 建 築 年 1 戸 当 床 面 積 棟 数 住 戸 改 善 後 床 面 積 昭 和 42 年 36.00m m2 昭 和 43 年 36.50m m2 昭 和 44 年 36.

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

PowerPoint プレゼンテーション

<4D F736F F F696E74202D B E E88E68C9A90DD8BC65F E DC58F4994C52E >

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

●電力自由化推進法案

<819A955D89BF92B28F BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

PowerPoint プレゼンテーション

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

平成19年9月改定

その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

容 積 率 制 限 の 概 要 1 容 積 率 制 限 の 目 的 地 域 で 行 われる 各 種 の 社 会 経 済 活 動 の 総 量 を 誘 導 することにより 建 築 物 と 道 路 等 の 公 共 施 設 とのバランスを 確 保 することを 目 的 として 行 われており 市 街 地 環

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

<4D F736F F D F8D828D5A939982CC8EF68BC697BF96B38F9E89BB82CC8A6791E52E646F63>

4 参 加 資 格 要 件 本 提 案 への 参 加 予 定 者 は 以 下 の 条 件 を 全 て 満 たすこと 1 地 方 自 治 法 施 行 令 ( 昭 和 22 年 政 令 第 16 号 ) 第 167 条 の4 第 1 項 各 号 の 規 定 に 該 当 しない 者 であること 2 会 社

(Microsoft Word - \212\356\226{\225\373\220j _\217C\220\263\201j.doc)

総合評価点算定基準(簡易型建築・電気・管工事)

<4D F736F F D2095CA8E A90DA91B18C9F93A289F1939A8F D8288B3816A5F E646F63>

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や

ていることから それに 先 行 する 形 で 下 請 業 者 についても 対 策 を 講 じることとしまし た 本 県 としましては それまでの 間 に 未 加 入 の 建 設 業 者 に 加 入 していただきますよう 28 年 4 月 から 実 施 することとしました 問 6 公 共 工 事 の


TOP500 Processor Family share(システム数) Intel EM64T .vs. AMD x86_64

IAF ID x:2010 International Accreditation Forum, Inc. Page 2 of 8 国 際 認 定 機 関 フォーラム(IAF)は 適 合 性 評 価 サービスを 提 供 する 機 関 の 認 定 のためのプログラ ムを 運 営 している この 認 定

(2) 共 通 費 について 第 2 編 共 通 費 2 12 共 通 費 算 定 に 関 する 数 値 の 取 り 扱 い (1) 積 み 上 げによる 算 定 積 み 上 げによる 算 定 は 第 3 編 18に 準 ずる (2) 率 による 算 定 公 共 建 築 工 事 共 通 費 積 算

平 成 27 年 11 月 ~ 平 成 28 年 4 月 に 公 開 の 対 象 となった 専 門 協 議 等 における 各 専 門 委 員 等 の 寄 附 金 契 約 金 等 の 受 取 状 況 審 査 ( 別 紙 ) 専 門 協 議 等 の 件 数 専 門 委 員 数 500 万 円 超 の 受

入札公告 機動装備センター

文化政策情報システムの運用等

Microsoft Word - 佐野市生活排水処理構想(案).doc

スライド 1

<8C9A90DD94AD90B696D88DDE939982CC8DC48E918CB989BB82C98AD682B782E98E9696B18EE688B CC FC90B3816A2E786477>

平成21年9月29日

第 1 条 適 用 範 囲 本 業 務 方 法 書 は 以 下 の 性 能 評 価 に 適 用 する (1) 建 築 基 準 法 施 行 令 ( 以 下 令 という ) 第 20 条 の7 第 1 項 第 二 号 表 及 び 令 第 20 条 の 8 第 2 項 の 認 定 に 係 る 性 能 評

<4D F736F F D E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A C98AD682B782E993C195CA915B C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

1.システム 構 成 1.1 ハードウェア 及 ぶ 基 本 ソフトウェア (1) システム 構 成 の 基 本 方 針 システム 構 成 のコンセンプトについて 2 頁 以 内 で 記 述 してください 1ハードウェア 構 成 のコンセプト

3. 選 任 固 定 資 産 評 価 員 は 固 定 資 産 の 評 価 に 関 する 知 識 及 び 経 験 を 有 する 者 のうちから 市 町 村 長 が 当 該 市 町 村 の 議 会 の 同 意 を 得 て 選 任 する 二 以 上 の 市 町 村 の 長 は 当 該 市 町 村 の 議

< F2D8AC493C CC81698EF3928D8ED2816A2E6A7464>

一般競争入札について

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

Microsoft Word - ★HP版平成27年度検査の結果

質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

った 場 合 など 監 事 の 任 務 懈 怠 の 場 合 は その 程 度 に 応 じて 業 績 勘 案 率 を 減 算 する (8) 役 員 の 法 人 に 対 する 特 段 の 貢 献 が 認 められる 場 合 は その 程 度 に 応 じて 業 績 勘 案 率 を 加 算 することができる

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

頸 がん 予 防 措 置 の 実 施 の 推 進 のために 講 ずる 具 体 的 な 施 策 等 について 定 めることにより 子 宮 頸 がんの 確 実 な 予 防 を 図 ることを 目 的 とする ( 定 義 ) 第 二 条 この 法 律 において 子 宮 頸 がん 予 防 措 置 とは 子 宮

03_主要処理画面.xlsx

は 固 定 流 動 及 び 繰 延 に 区 分 することとし 減 価 償 却 を 行 うべき 固 定 の 取 得 又 は 改 良 に 充 てるための 補 助 金 等 の 交 付 を 受 けた 場 合 にお いては その 交 付 を 受 けた 金 額 に 相 当 する 額 を 長 期 前 受 金 とし

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36

1 狭 あい 道 路 等 整 備 事 業 について 1-1 はじめに 私 たちが 安 心 して 安 全 に 暮 らしていくうえで, 道 は 重 要 な 役 割 を 担 っています しかし, 道 が 狭 いと, 日 照 通 風 等 の 確 保 が 難 しいといった 住 環 境 の 面 だけでなく, 災

別 紙 第 号 高 知 県 立 学 校 授 業 料 等 徴 収 条 例 の 一 部 を 改 正 する 条 例 議 案 高 知 県 立 学 校 授 業 料 等 徴 収 条 例 の 一 部 を 改 正 する 条 例 を 次 のように 定 める 平 成 26 年 2 月 日 提 出 高 知 県 知 事 尾

スライド 1

説 明 内 容 料 金 の 算 定 期 間 と 請 求 の 単 位 について 分 散 検 針 制 日 程 等 別 料 金 料 金 の 算 定 期 間 と 支 払 義 務 発 生 日 日 程 等 別 料 金 の 請 求 スケジュール 料 金 のお 支 払 い 方 法 その 他 各 種 料 金 支 払

平成22年度

(Microsoft PowerPoint \213\306\213\226\211\302\215X\220V\220\340\226\276\211\357\201i3\201j)

(2) 地 域 の 実 情 に 応 じた 子 ども 子 育 て 支 援 の 充 実 保 育 の 必 要 な 子 どものいる 家 庭 だけでなく 地 域 の 実 情 に 応 じた 子 ども 子 育 て 支 援 の 充 実 のために 利 用 者 支 援 事 業 や 地 域 子 育 て 支 援 事 業 な

参加表明書・企画提案書様式

< 目 次 > 1 軽 四 輪 車 等 に 係 る 税 率 引 上 げ Q1 1 軽 四 輪 車 等 についてなぜ 標 準 税 率 を 引 き 上 げることにしたのですか? 3 Q1 2 自 家 用 乗 用 車 については 税 率 を 1.5 倍 に 引 き 上 げ それ 以 外 ( 貨 物 用 営

2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数

様式第4号

私立大学等研究設備整備費等補助金(私立大学等

0439 研究開発推進事業(防衛省所管計上)250614

資料2 利用者負担(保育費用)

(2) 支 状 況 保 育 所 ( 定 員 60 人 以 上 ) 支 状 況 は 次 とおりです 1 総 入 構 成 比 は 割 合 が88.1% 活 動 外 入 が2.1% 特 別 入 が9.8%でした 2 構 成 比 は 運 営 費 入 が80.1% 経 常 経 費 補 助 金 入 が17.8%

Sea-NACCS 利用者研修 【通関編】

主要生活道路について

<4D F736F F F696E74202D2082C882E982D982C DD8ED88EE688F882CC82B582AD82DD C668DDA9770>

第 40 回 中 央 近 代 化 基 金 補 完 融 資 推 薦 申 込 み 公 募 要 綱 1 公 募 推 薦 総 枠 30 億 円 一 般 物 流 効 率 化 促 進 中 小 企 業 高 度 化 資 金 貸 付 対 象 事 業 の 合 計 枠 2 公 募 期 間 平 成 28 年 6 月 20

現 行 工 業 地 域 準 工 業 地 域 商 業 地 域 近 隣 商 業 地 域 改 正 後 準 工 業 地 域 ( 特 別 業 務 地 区 ( 第 2 種 ) 及 び 指 定 集 積 区 域 を 除 く) 近 隣 商 業 地 域 2 / 7

平成15・16年度の建設工事入札参加資格の認定について

マネジメントシステム 認 証 規 則 目 次 1 章 総 則 1.1 一 般 2 章 マネジメントシステムの 登 録 2.1 一 般 2.2 登 録 原 簿 2.3 登 録 証 書 2.4 登 録 マークの 使 用 及 び 認 証 の 引 用 2.5 登 録 維 持 2.6 登 録 継 続 2.7

企 業 の 採 用 予 定 数 採 用 予 定 数 は 増 やす と 回 答 した 企 業 が 減 らす と 回 答 した 企 業 を3 年 連 続 上 回 り 採 用 は 増 加 傾 向 にある 特 に 非 上 場 非 製 造 において 採 用 数 を 増 やす と 回 答 する 割 合 が 大

独立行政法人国立病院機構

よりメンバーに 配 布 した 第 2 期 は 第 1 期 に 開 発 した 大 気 時 間 値 集 計 解 析 ツールをベースに 機 能 改 良 を 行 った 国 立 環 境 研 究 所 では メンバーから 寄 せられる 要 望 使 い 勝 手 に 関 する 意 見 感 想 不 具 合 発 生 など

<4D F736F F D2088CF88F589EF814395AA89C889EF E E834F838B815B83768B4B96F E322E323089FC92E8816A2E646F63>

高松市緊急輸送道路沿道建築物耐震改修等事業補助金交付要綱(案)

Microsoft Word - TS _J Edited3.doc

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安

国 税 クレジットカード 納 付 の 創 設 国 税 のクレジットカード 納 付 については マイナンバー 制 度 の 活 用 による 年 金 保 険 料 税 に 係 る 利 便 性 向 上 に 関 するアクションプログラム( 報 告 書 ) においてその 導 入 の 方 向 性 が 示 されている

災害時の賃貸住宅居住者の居住の安定確保について

長崎市民間建築物耐震化推進事業の概要

学校教育法施行令・施行規則等の改正について

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

(2)大学・学部・研究科等の理念・目的が、大学構成員(教職員および学生)に周知され、社会に公表されているか

<6E32355F8D918DDB8BA697CD8BE28D C8EAE312E786C73>


Microsoft Word 印刷ver 本編最終no1(黒字化) .doc

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている

岡山県警察用航空機の運用等に関する訓令

<4D F736F F D C689D789B582B581698AAE90AC92CA926D816A2E646F63>

川崎市木造住宅耐震診断助成金交付要綱

PowerPoint プレゼンテーション

10【交付要綱】様式第5-1~13

Transcription:

マイクロプロセッサと 並 列 処 理 期 待 と 現 実 の 狭 間 で 考 えること スケーラブルシステムズ 株 式 会 社

説 明 概 要 はじめに 並 列 処 理 技 術 の 動 向 Peta-ScaleコンピューティングとCommodity コンピューティング Commodityコンピューティングでの 課 題 マイクロプロセッサと 並 列 処 理 並 列 処 理 での 重 要 なポイント マイクロプロセッサの 進 化 スケーラブルCommodityコンピューティング クラスタOpenMP ハイブリッド 並 列 処 理 SMP 仮 想 化 まとめとして 一 部 配 布 資 料 にIDF2009の 資 料 を 追 加 致 しました スケーラブルシステムズ 株 式 会 社

ユビキタス 並 列 処 理 プログラミング 現 在 の 状 況 全 てのプロセッサはマルチコアプロセッサ コンピュータは 様 々な 並 列 処 理 により 性 能 向 上 を 図 っている コンパイラやコンピュータ 自 身 が 並 列 処 理 の 適 用 を 行 う 場 合 もあるが 本 質 的 な 並 列 プログラ ミングはユーザが 行 う 必 要 がある 課 題 並 列 プログラミングの 専 門 家 が 並 列 化 プログラ ミングを 行 い より 高 速 実 行 を 目 指 すことは 容 易 より 広 範 囲 なユーザが 並 列 処 理 を 行 い その 効 果 を 実 現 出 来 ることが 課 題

なぜ 並 列 処 理 は 容 易 でないのか? 1. 並 列 化 について 学 ぶ 2. 並 列 化 手 法 の 正 しい 選 択 3. スレッドについて 考 えるのではな く タスクでのプログラムを 考 える 4. 並 列 実 行 をオフに 出 来 るようにプ ログラムをデザインする 5. ロック( 同 期 ) 処 理 などは 可 能 な 限 り 行 わない 6. 良 い 並 列 支 援 ツールを 使 う 7. メモリアロケーションに 注 意 する 8. ワークロードに 合 わせてスケーリ ング 出 来 るデザインとする http://www.ddj.com/hpc-high-performancecomputing/201804248 マルチコアでのプログラミングでの ルール:これら8つのルール 全 てを 理 解 して プログラミングに 取 り 組 む 必 要 がある スケーラブルシステムズ 株 式 会 社

なぜ 並 列 処 理 は 容 易 でないのか? 不 規 則 なオペレーション 複 雑 なデータ 構 造 アルゴリズム 上 の 問 題 マルチコア 上 での 並 列 処 理 の 難 しさ 継 続 的 なプロセッサコア 数 の 増 加 ベクトル 処 理 の 強 化 メモリシステムの 強 化 キャッシュシステムの 改 善

システムとユーザの 尺 度 システムの 尺 度 ユーザの 尺 度 Flop/s 計 算 終 了 までの 時 間 メモリサイズ(GB) モデルのサイズと 計 算 結 果 プロセッサ 数 ワークロードでの 同 時 実 行 ジョブ 数 データ 長 計 算 精 度 システム 構 成 (クラスタ) 導 入 コストと 運 用 コスト スケーラビリティ 評 価 対 象 での 尺 度 ユーザの 尺 度 での 性 能 (Performance)は 時 間 当 たりにどれ だけの 仕 事 を 処 理 出 来 るか( 仕 事 量 / 時 間 ) Flopsでの 評 価 は 実 際 には 意 味 がない また 問 題 の 規 模 (small, medium, large) という 評 価 も 難 しい スケーラビリティ は 対 象 を 明 確 に 規 定 する 必 要 がある

Peta-Scaleコンピューティングと Commodityコンピューティング 並 列 処 理 技 術 の 動 向

コンピューティングのギャップ Peta-Scale コンピューティング 独 自 のアプリケーション 開 発 複 雑 なシステム 構 成 新 しいAPIの 提 案 ギャップの 広 がり Pleiades Supercomputer Photo Credit: NASA Ames Research Center コンパクトでより 多 くのプロ セッサコアを 搭 載 したサーバ 製 品 スケーラブル Commodity コンピューティング 商 用 HW/SW オープンソース 商 用 アプリケーション マルチスレッド マルチコア マルチプロセッサ クラスタ システムの 利 用 の 拡 大 と 広 範 囲 なユーザ 環 境 2Uサイズ 32コア 搭 載 サーバ 1Uサイズ CPU+GPU Hybridサーバ

MPI OpenMP threads C++ Fortran Chapel UPC Co-array hybrid C HPF X10 Fortress Java Titanium posix threads スケーラブルシステムズ 株 式 会 社 First Petascale Book 検 索 700 600 500 400 300 200 100 0 Petascale Computing: Algorithms and Applications (Chapman & Hall/Crc Computational Science Series) Scalable OpenMP Programming Dieter an Mey RWTH Aachen Universityより 抜 粋

マルチスレッドアプリケーション Intel Software Product Conference:Parallel Programming AdoptionMarket Situation and Outlook presentations from Multicore Days 2008, 11-12 September / James Reinders, Intel

プログラミングのギャップ Peta-Scale コンピューティング 独 自 のアプリケーション 開 発 複 雑 なシステム 構 成 新 しいAPIの 提 案 MPIなどが 主 流 Commodity コンピューティング 商 用 HW/SW オープンソース 商 用 アプリケーション マルチスレッド OpenMPやライブラリ などの 活 用

プログラミングのギャップ 数 ヶ 月 - 数 年 プロダクション シュミレーション スケーラブルな 性 能 の アプリケーションの 開 発 プロトタイプ 開 発 並 列 プログラミング C/C++,MPI OpenMP テストと 性 能 向 上 のための 作 業 プロトタイプ 開 発 デスクトップ テストと 性 能 向 上 の ための 作 業

マイクロプロセッサの 進 化 と 並 列 処 理 への 貢 献 マイクロプロセッサと 並 列 処 理

Performance スケーラブルシステムズ 株 式 会 社 アプリケーションの 性 能 向 上 ギャップの 広 がり GHz Era Multi-core Era 並 列 処 理 は 誰 でも 利 用 可 能 ( 利 用 のメリット) より 少 ないコスト( 低 価 格 なシステム)でより 効 率 の 良 い 処 理 が 可 能 ( 対 費 用 効 果 ) より 短 時 間 でシュミレーションを 完 了 ( 開 発 サイク ルの 短 縮 によるコスト 削 減 ) Time

アプリケーション 実 行 階 層 仮 想 マシン OS OS OS オペレーティング システム App App App アプリケーション Threads Threads Threads スレッド Code Fragment Code Fragment Code Fragment

プログラミング 階 層 クラスタプログラミング(MPI) マルチノード クラスタ マルチスレッド(OpenMP) プロセッサ 最 適 化 キャッシュ 複 数 命 令 実 行 SIMD 命 令 (ベクトル 化 ) シングルノード(SMP) シングルプロセッサ シングルコア do izone = 1, nzone. do j = 1, jmax. do i = 1, imax. ノード 内 ノード 間 並 列 化 ノード 内 でのマルチスレッド 並 列 化 プロセッサリソースの 並 列 利 用 スケーラブルシステムズ 株 式 会 社

プログラミング 階 層 do izone = 1, nzone ノード 内 ノード 間 並 列 化. MPIやCluster OpenMPなどの 利 用 do j = 1, jmax ノード 内 でのマルチスレッド 並 列 化. OpenMPやスレッドプログラミング do i = 1, imax プロセッサリソースの 並 列 利 用. ベクトル 化.. スーパースカラ 実 行 パイプライン 処 理 end do キャッシュ 最 適 化 など 最 適 化 と 並 列 化 の 適 用 作 業 プログラマー コンパイラ

時 間 時 間 時 間 時 間 スケーラブルシステムズ 株 式 会 社 並 列 性 (Parallelism)の 利 用 パイプライン 処 理 データレベル 並 列 処 理 (DLP) スレッドレベル 並 列 処 理 (TLP) 命 令 レベル 並 列 処 理 (ILP)

ループのベクトル 化 処 理 プログラム 例 : for (I=0;I<=MAX;I++) C[I]=A[I]+B[I]; 利 用 方 法 : (Linux) (Windows) -[a]xn, -[a]xb, -[a]xp, -[a]xt -Q[a]xN, -Q[a]xB, -Q[a]xP, -Q[a]xT A[3] A[2] + + B[3] B[2] A[1] A[0] + + B[1] 128-bit Registers B[0] C[3] C[2] C[1] C[0]

インテルプロセッサでのSIMD 処 理 Source SSE/2/3 Dest Intel Core Microarchitecture NetBurst CLOCK CYCLE 1 CLOCK CYCLE 2 X4 X3 X2 X1 Y4 Y3 Y2 Y1 X4opY 4 X4opY 4 SSE Operation CLOCK CYCLE 1 X3opY 3 X3opY 3 X2opY 2 X2opY 2 X1opY 1 X1opY 1 各 MMX/SSE 演 算 は 128ビットの 演 算 をシングルサイ クルで 実 行 可 能 と なる MMX/SSE 演 算 器 は2セットあ り 同 時 実 行 が 可 能 となる 従 って 単 精 度 では 8 浮 動 小 数 点 演 算 倍 精 度 では 4 浮 動 小 数 点 演 算 を1ク ロックで 実 行 するこ とが 出 来 る スケーラブルシステムズ 株 式 会 社

並 列 処 理 での 重 要 なポイント 並 列 化 最 適 な 並 列 化 アルゴリズムの 選 択 プロセッサ 数 や 問 題 の 規 模 に 対 応 可 能 な 並 列 化 実 装 コア 数 やプロセッサ 数 に 依 存 しないこと メモリの 局 所 性 メモリ 階 層 を 効 率 的 に 利 用 頻 繁 にアクセスするデータをよりコアの 近 傍 に 配 置

Performance / core Intel マイクロアーキテクチャ 新 マイクロアーキテクチャ 新 製 造 プロセス 次 世 代 マイクロアーキテクチャ(Nehalem) メモリバンド 幅 とレイテンシの 改 善 マイクロアーキテクチャの 改 善 Intelマイクロアーキテクチャ (Westmere) 32nm 製 造 プロセス 6コア SSE 4.2 新 マイクロアーキテクチャ(Sandy Bridge) Intel AVX ベクトル 演 算 ( 浮 動 小 数 点 演 算 性 能 x2) Core Core Memory Controller 3 DDR3 channels Core Core 12M Shared Cache Core Link Controller Core 2 Intel QuickPath interconnect links 2008 2009 2010 >2010 Intel AVX (Advanced Vector Extensions) スケーラブルシステムズ 株 式 会 社

SpeedUp スケーラブルシステムズ 株 式 会 社 並 列 処 理 スケーラビリティ 8 7 Linpack Stream スケーラビリティの 向 上 6 5 4 3 ロードバランスの 改 善 メモリ 階 層 の 効 率 的 な 活 用 (メモリアクセスの 低 減 ) 高 速 なメモリシステムの 採 用 (Xeon 5500) テスト 事 例 2 1 0 1 2 3 4 5 6 7 8 N プロセッサコア

MFLOPS/s Speedup スケーラブルシステムズ 株 式 会 社 並 列 処 理 スケーラビリティ 30000 10 27000 Xeon 5400(MFLOPS/s) Xeon 5400(Speedup) Xeon 5500(MFLOPS/s) Xeon 5500(Speedup) 9 24000 8 システムアーキテクチャの 進 化 21000 18000 7 6 シングル( 逐 次 処 理 ) 性 能 の 向 上 スケーラビリティの 向 上 15000 5 12000 4 9000 3 6000 2 3000 0 1 4 8 16 N プロセッサコア 1 0 効 率 的 な 並 列 処 理 には プラットフォームが 重 要 Himeno Benchmark http://w3cic.riken.go.jp/hpc/himenobmt/index.html

ピーク 性 能 (GFLOPS/sec) バンド 幅 (MB/sec) プロセッサ 性 能 向 上 比 率 120 Quad-Core Intel Xeon 5570 メモリコントローラ 内 蔵 QPIインターコネクト 80 100 ピーク 性 能 バンド 幅 1.35 倍 3.6 倍 70 60 80 60 1.5 倍 50 40 40 3.3 倍 30 20 20 3.3 倍 10 0 2005 年 2006 年 2007 年 2008 年 2009 年 0 64-bit Intel Xeon 3.6GHz 2M Dual-Core Intel Xeon 5160 デュアルコア Quad-Core Intel Xeon 5355 クァッドコア 4 浮 動 小 数 点 演 算 /クロック デュアルFSBバス Quad-Core Intel Xeon460 45nm 製 造 プロセス 動 作 クロック スケーラブルシステムズ 株 式 会 社

ピーク 性 能 (GFLOPS/sec) バンド 幅 (MB/sec) プロセッサ 性 能 向 上 比 率 120 Quad-Core Intel Xeon 5570 メモリコントローラ 内 蔵 QPIインターコネクト 80 ピーク 性 能 100 ベクトル 80 処 理 60 40 3.3 倍 バンド 幅 1.5 倍 1.35 倍 3.6 倍 70 60 50 NUMA 40 Non-Uniform 30 Memory Architecture 20 20 3.3 倍 10 0 2005 年 2006 年 2007 年 2008 年 2009 年 0 64-bit Intel Xeon 3.6GHz 2M Dual-Core Intel Xeon 5160 デュアルコア Quad-Core Intel Xeon 5355 クァッドコア 4 浮 動 小 数 点 演 算 /クロック デュアルFSBバス Quad-Core Intel Xeon460 45nm 製 造 プロセス 動 作 クロック スケーラブルシステムズ 株 式 会 社

メモリ 性 能 とスケーラビリティ Core 2 Extreme QX6700 Nehalem Core 0 Core 2 Core 0 Core 2 Core 0 Core 2 Core 0 Core 2 4MB shared L2 Cache Bus I/F 4MB shared L2 Cache Bus I/F Memory Controller 4MB shared L2 Cache Link Controller MCH FSB 3x DDR3 channels 2x Intel QuickPath interconnect

スケーラビリティ(シングルスレッドに 対 する 相 対 性 能 比 ) スケーラブルシステムズ 株 式 会 社 NPB OpenMP スケーラビリティ 4.0 Core2Quad Core i7 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 BT CG EP FT IS LU MG SP

相 対 性 能 (Core 2 Extreme QX6700 =1) スケーラブルシステムズ 株 式 会 社 NPB OpenMP 相 対 性 能 8.0 7.0 QX6700/1 QX6700/4 Core i7/1 Core i7/4 シングルコアでの 性 能 差 << マルチスレッドでの 性 能 差 6.0 5.0 4.0 3.0 2.0 1.0 0.0 BT CG EP FT IS LU MG SP

MB/sec スケーラブルシステムズ 株 式 会 社 メモリ 階 層 ベンチマーク 70000 60000 50000 Double read/modify/write Cache Test Opteron 2.8GHz Core2Quad 2.6GHz Core i7 2.6GHz 40000 30000 20000 10000 0 100 400 1600 6400 25600 102400 409600 1638400 6553600 26214400 104857600 C Size (bytes)

性 能 向 上 比 率 (Baseline = 1) スケーラブルシステムズ 株 式 会 社 ベクトル 化 マルチスレッド 30 25 20 15 Intel Xeon W5580 (2 sockets x 4 cores)3.2ghz 27.5 Baseline - Compile with Intel compiler Vectorized with Intel compiler Vectorized with Intel compiler - threading 17.6 Vectorized / ベクトル 化 コンパイラ 指 示 行 の 追 加 コードのアンローリング ループの 分 割 Threading/ 自 動 並 列 化 OpenMP 指 示 行 の 追 加 10 5 0 2.40 1.82 1.80 1.00 1.00 1.00 Black-Sholes Monte Carlo Covertible Bonds コンパイラの 自 動 ベクトル 化 と 自 動 並 列 化 にユーザの 最 適 化 作 業 でより 高 い 性 能 を 実 現 Money Tree Optimizing FSI Benchmarkswith Intel Software Tools for Multicore & Manycore Intel Developer Forum

スケーラブルCommodityコンピューティング 並 列 処 理 の 課 題 と 挑 戦

Many core CPU 2012(?)に 想 定 される 計 算 ノード 1) Node : 960 GFLOPS/CPU Many core CPU, 48 cores, 2.5GHz, 共 有 キャッ シュ シンプルな 実 行 コア(in-orderでSMT 機 能 付 き) メモリバンド 幅 を 最 大 限 に 活 用 するアーキテクチャ SIMDベクトルユニット... 8 FLOP / cycle / core 複 数 の 計 算 ノードがNUMA 構 成 で 接 続 複 数 の 計 算 サーバ ブレードでクラスタ 構 成 効 率 の 良 い 並 列 化 が 求 められる 1) 仮 定 として 想 定 したプロセッサに 基 づく 推 察

並 列 プログラミングで 留 意 点 十 分 な 計 算 量 (Amdahl s Law) 計 算 粒 度 データの 局 所 性 ロードバランス 分 散 と 同 期 処 理 並 列 処 理 階 層 での 最 適 化 逐 次 処 理 (シングルスレッド)アプリケーションと 比 較 しても 検 討 課 題 が 多 いことが 並 列 処 理 をより 困 難 にしています

Speedup スケーラブルシステムズ 株 式 会 社 並 列 プログラミングで 留 意 点 十 分 な 計 算 量 計 算 粒 度 データの 局 所 性 ロードバランス 分 散 と 同 期 処 理 並 列 処 理 階 層 での 最 適 化 ロードバランス データ 配 置 による 低 下 同 期 処 理 データ 競 合 などによるオーバーヘッド Nプロセッサコア

S スケーラブルシステムズ 株 式 会 社 アムダールの 法 則 並 列 処 理 での 性 能 向 上 の 上 限 値 (スケーリング) T parallel = (S+ P/n) T serial + O T serial S P P/n n = number of processors Speedup = T serial / T parallel = 1 / (S + P/n) プログラムの 逐 次 処 理 部 分 ( 非 並 列 処 理 ) 部 分 の 排 除 が 必 要 例 えば n=, P = 0.5 の 場 合 Speedup = 1.0 / (0.5 + 0) = 2.0

グスタフソンの 法 則 T serial = (S + n x P) T parallel アムダールの 法 則 作 業 負 荷 や 問 題 の 規 模 が 一 定 であることを 仮 定 グスタフソンの 法 則 ( Gustafson-Barsis law) 並 列 処 理 では 問 題 の 規 模 や 作 業 負 荷 がプロセッサコア 数 に 比 例 して 大 きくなり その 負 荷 増 加 は 逐 次 処 理 部 分 に 影 響 しないことを 仮 定 Speedup = T serial / T parallel = (S + n x P) 例 えば n=16, P = 0.5 の 場 合 Speedup = 0.5 + 16 x 0.5 = 8.5 アムダールの 法 則 の 限 界 から 並 列 処 理 を 救 い 出 すこと が 可 能? 適 用 出 来 る 問 題 と 利 用 環 境 に 大 きな 制 限 がある T parallel = {S + P/n} T serial + O Speedup = T serial / T parallel = 1 / (S + P/n)

Speedup Speedup スケーラブルシステムズ 株 式 会 社 スケーラビリティ 64 56 Gustafson's Law(5%) 48 40 32 Gustafson's Law(50%) 16 14 12 24 10 8 16 Amdahl's Law(5%) 6 4 8 0 Amdahl's Law(50%) 0 8 16 24 32 40 48 56 64 2 0 0 2 4 6 8 10 12 14 16 Nプロセッサ N プロセッサコア

NASAによる 流 体 解 析 コード Virtual Flight on High-Performance Architectures M. J. Aftosmis, S. M. Murman, M. Nemec, NASA Ames SC2004,Pittsburgh, PA, Nov. 6-12, 2004 Graphics courtesy of NASA Ames 並 列 性 能 496プロセッサで405 倍 の 性 能 向 上 が 可 能 540 GFLOP/s CPUあたりの 性 能 :1.33 GFLOP/s 短 時 間 でのシュミレーションを 可 能 とし 問 題 への 緊 急 的 な 対 応 を 可 能 となります スケーラブルシステムズ 株 式 会 社

計 算 粒 度 スケーラブルシステムズ 株 式 会 社 並 列 化 よりハイレベルでの 並 列 化 全 体 処 理 の 把 握 とその 並 列 化 の 検 討 大 困 難 複 雑 より 上 位 ( 領 域 範 囲 対 象 )での 並 列 化 小 容 易 処 理 の 末 端 での 並 列 化 個 々の 処 理 の 並 列 化 の 検 討 コンパイラによる 並 列 化 (ベクトル 化 や 自 動 並 列 化 ) は 一 般 にはこのレベルでの 並 列 化

Vertical Scaling スケーラブルシステムズ 株 式 会 社 シングルAPIでの 並 列 処 理 MPI OpenMP OpenMP MPI ノード 内 ノード 間??? Horizontal Scaling MPI OpenMP????

OpenMPの 価 値 シュミレーションでのソフトウエア 開 発 大 規 模 なシュミレーションを 行 うアプリケーションは C++ C Fortranで 記 述 されている ソフトウエア 開 発 と 利 用 は 数 十 年 単 位 で 継 続 して 行 われ る クラスタやスーパーコンピュータ MPIを 利 用 した 大 規 模 並 列 処 理 が 一 般 的 MPI 利 用 の 限 界 と 課 題 全 てのアプリケーションに 適 用 出 来 る 訳 ではない スケーラビリティは 様 々な 制 限 を 受 ける many cores への 対 応 がMPIタイプのAPIでは 非 常 に 難 しい OpenMPはこのようなMPIに 対 する 他 の 選 択 肢 の 提 供 と 同 時 にMPIを 補 完 する 役 割 を 担 う(MPI + OpenMP)

インテルクラスタOpenMP 共 用 データ 分 散 仮 想 共 有 メモリ DVSM マルチスレッド 化 されたプログラム...

一 般 的 OpenMPの 課 題 OpenMP 版 のコンパイル 時 の 問 題 OpenMP 構 文 に 基 づく 並 列 化 によって マイクり プロセッサ 向 け 最 適 化 が 阻 害 される 実 行 時 ライブラリでのオーバヘッド 頻 繁 なライブラリ 呼 び 出 しの 悪 影 響 アルゴリズムの 変 更 のオーバヘッド プログラム 並 列 化 のためのコードの 冗 長 化 やコード の 追 加 同 期 処 理 Fork-Join モデルによる 過 大 な 同 期 処 理 負 荷 分 散 メモリ 階 層 の 有 効 活 用 キャッシュ ローカルメモリ リモートメモリの 参 照 頻 度

OpenMPの 課 題 ハードウエアの 動 向 今 後 は 複 数 ソケットの 製 品 はすべてNUMAアーキテク チャ OpenMP 3.0リリース NUMA 対 応 の 拡 張 無 し アフィニティ 問 題 データの 配 置 及 び 利 用 と スレッド 実 行 の 管 理 OpenMP 3.0: The World is still flat, no support for cc-numa (yet)! http://terboven.wordpress.com/category/openmp/

ハイブリッド: 現 代 のトレンド? ハイブリッドカー 内 燃 機 関 動 力 (ガソリンエンジンや ディーゼルエンジン)と 蓄 電 池 ハイブリッドコンピューティング GPU+CPUによるハイパフォーマ ンスコンピューティング ハイブリッド 並 列 プログラミング スレッドプログラング+MPI

MPI/OpenMPハイブリッドモデル MPIでは 領 域 分 割 などの 疎 粒 度 での 並 列 処 理 を 行 う OpenMPは 各 MPIタスク 内 で ループの 並 列 化 な どのより 細 粒 度 での 並 列 化 を 担 う 計 算 は タスク-スレッドの 階 層 構 造 を 持 つ MPIタスク 高 性 能 インターコネクト Memory Memory Memory Memory P P P P P P P P P P P P P P P P OpenMPスレッド スケーラブルシステムズ 株 式 会 社

MPI/OpenMPハイブリッドコード MPIで 並 列 化 されたアプリケーションにOpenMPでの 並 列 化 を 追 加 MPI 通 信 とOpenMPでのワークシェアを 利 用 して 効 率 良 い 並 列 処 理 の 実 現 include mpif.h program hybsimp Fortran #include <mpi.h> int main(int argc, char **argv){ int rank, size, ierr, i; C/C++ call MPI_Init(ierr) call MPI_Comm_rank (...,irank,ierr) call MPI_Comm_size (...,isize,ierr)! Setup shared mem, comp. & Comm!$OMP parallel do do i=1,n <work> enddo! compute & communicate call MPI_Finalize(ierr) end ierr= MPI_Init(&argc,&argv[]); ierr= MPI_Comm_rank (...,&rank); ierr= MPI_Comm_size (...,&size); //Setup shared mem, compute & Comm #pragma omp parallel for for(i=0; i<n; i++){ <work> } // compute & communicate ierr= MPI_Finalize();

OpenMP/MPIハイブリッドモデル MPIは 実 績 のある 高 性 能 な 通 信 ライブラリ 計 算 と 通 信 を 非 同 期 に 実 行 することも 可 能 通 信 はマスタースレッド シングルスレッド 全 スレッドで 実 行 することが 可 能 MPIタスク 高 性 能 インターコネクト Memory Memory Memory Memory P P P P P P P P P P P P P P P P OpenMPスレッド スケーラブルシステムズ 株 式 会 社

OpenMP/MPIハイブリッドコード OpenMPのプログラムにMPI 通 信 を 追 加 既 存 のOpenMPプログラムの 拡 張 やスレッドプログラムの 新 規 開 発 時 のオプションとして 選 択 MPIは 非 常 に 高 速 また 最 適 化 されたデータ 通 信 ライブラリ include mpif.h program hybmas Fortran #include <mpi.h> int main(int argc, char **argv){ int rank, size, ierr, i; C/C++!$OMP parallel!$omp barrier!$omp master call MPI_<Whatever>(,ierr)!$OMP end master!$omp barrier!$omp end parallel end #pragma omp parallel { #pragma omp barrier #pragma omp master { ierr=mpi_<whatever>( ) } #pragma omp barrier }

ハイエンド 仮 想 化 複 数 の 仮 想 マシン サーバ( 仮 想 化 なし) 仮 想 化 ソフトウエア アプリケーション オペレーティング システム 一 台 の 仮 想 マシン アプリケー ション アプリケー ション アプリケー ション アプリケー ション アプリケー ション オペレーティングシステム 仮 想 化 ソフトウエア

ScaleMP vsmpアーキテクチャ アプリケーションについては 他 のx86システムと 100%のバイナリ 互 換 を 実 現 OSは 通 常 のLinuxディストリビューションが 利 用 可 能 Hardwareは 一 般 のx86チップセットと 標 準 インターコネクトでシス テムの 構 築 が 可 能 vsmp Foundation でのシステムのSMP 拡 張 を 実 現 スケーラブルシステムズ 株 式 会 社

OpenMPスレッド 数 SpeedUP OpenMP/MPI/ハイブリッド Hybrid OpenMP MPI Benchmarkproject ("homb") This is the Hybrid OpenMP MPI Benchmarkproject ("homb") This project was registered on SourceForge.net on May 16, 2009, and is described by the project team as follows: HOMB is a simple benchmark based on a parallel iterative Laplace solver aimed at comparing the performance of MPI, OpenMP, and hybrid codes on SMP and multi-core based machines. 32 28 24 20 16 12 8 4 0 1 2 4 8 MPIタスク 数 Xeon 5550 (2.66GHz) vsmp Foundation 16 32 1 16 32 8 4 2 スケーラブルシステムズ 株 式 会 社

MFLOPS/S スケーラブルシステムズ 株 式 会 社 OpenMPベンチマーク NAS Parallel Benchmark (Multi-Zone) z y x 45000 40000 35000 30000 25000 SP-MZ 20000 x-zones 15000 10000 5000 0 2 4 8 16 32 OpenMPスレッド 数 /N プロセッサコア 著 名 な 公 開 ベンチマークツールである NAS Parallel Benchmark (NPB) の 一 つであるNPB-MZ (NPB Multi-Zone)はより 粒 度 の 大 きな 並 列 化 の 提 供 を 行 っています NPB-MZでは ハイブリッド 型 の 並 列 処 理 やネストしたOpenMPのテストが 可 能 です ここでの 結 果 は OpenMPだけでの 並 列 処 理 の 性 能 を 評 価 しています Xeon 5550 (2.66GHz) vsmp Foundation

Nehalem-EX トポロジ 4プロセッサトポロジ 32プロセッサコア 8プロセッサトポロジ 64プロセッサコア スケーラブルシステムズ 株 式 会 社

ユビキタス 並 列 処 理 プログラミング まとめとして

並 列 処 理 はITの 根 幹 pnfs 10GbE InfiniBand クラスタ リング スト レージ クラス タ SSE マルチ コア コンパイラベクトル 化 最 適 化 ライブラリ マルチスレッド OpenMP 開 発 環 境 ハイブリッド クラスタ GPU マルチ プロ セッサ MPI 開 発 環 境 アプリケーション

まとめとして( 並 列 処 理 ) 並 列 処 理 技 術 の 課 題 Peta-ScaleコンピューティングとCommodity コンピューティングでのギャップの 克 服 マイクロプロセッサと 並 列 処 理 マイクロプロセッサでの 並 列 実 行 ユニットの 増 加 ベクトル 演 算 (x8) プロセッサコア(+6 以 上 ) プロセッサ 内 部 での 並 列 処 理 の 重 要 性 スケーラブルCommodityコンピューティング 今 後 の 技 術 的 な 課 題 と 幾 つかの 提 案 試 行 クラスタOpenMP ハイブリッド 並 列 処 理 SMP 仮 想 化

まとめとして(マルチスレッド) 継 続 的 なプロセッサコア 数 の 増 加 ベクトル 処 理 の 強 化 メモリシステムの 強 化 キャッシュシステムの 改 善 マルチコア 上 での 並 列 処 理 低 価 格 ( 低 い 導 入 コスト)での スケーラブルなプラットフォーム マルチスレッドプログラムの 可 能 性

この 資 料 について ここに 掲 載 した 資 料 は 弊 社 の 調 査 と 見 解 に 基 くものであ り 資 料 の 中 で 示 されている 製 品 やサービスを 提 供 してい る 各 社 の 公 式 な 見 解 でも また マーケティング 戦 略 に 基 くものではありません あくまで 弊 社 としての 意 見 だと いうことにご 注 意 ください 本 資 料 は 情 報 提 供 のみを 目 的 として 作 成 されたものであり 商 品 の 勧 誘 を 目 的 としたものではありません また 本 資 料 は 弊 社 が 信 頼 できると 判 断 した 各 種 データに 基 づき 作 成 されておりますが その 正 確 性 確 実 性 を 保 証 するもので はありません 本 資 料 に 記 載 された 内 容 は 予 告 なしに 変 更 されることもあります これらの 資 料 の 無 断 での 引 用 転 載 を 禁 じます 社 名 製 品 名 などは 一 般 に 各 社 の 商 標 または 登 録 商 標 で す なお 本 文 中 では 特 に TMマークは 明 記 しており ません In general, the name of the company and the product name, etc. are the trademarks or, registered trademarks of each company. Copyright Scalable Systems Co., Ltd., 2009. Unauthorized use is strictly forbidden. 2009 年 9 月