コピー 通 信 を 可 能 とした Ethernet 通 信 機 構 の 実 現 方 式 について 述 べ, 評 価 を 行 う. 2. 既 存 手 法 の 問 題 点 2.1 データ 送 信 時 のゼロコピー 通 信 OPEN-MX では, 送 信 対 象 データのサイズに 応 じてデータ 複 写



Similar documents
1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

郵 便 為 替 により 公 売 保 証 金 を 納 付 する 場 合 郵 便 為 替 証 書 は 発 効 日 から 起 算 して 175 日 を 経 過 していないものに 限 ります 4) 現 金 及 び 銀 行 振 出 の 小 切 手 で 平 川 市 に 直 接 納 付 銀 行 振 出 の 小 切

[2] 控 除 限 度 額 繰 越 欠 損 金 を 有 する 法 人 において 欠 損 金 発 生 事 業 年 度 の 翌 事 業 年 度 以 後 の 欠 損 金 の 繰 越 控 除 にあ たっては 平 成 27 年 度 税 制 改 正 により 次 ページ 以 降 で 解 説 する の 特 例 (

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

N 一 般 の 住 宅 について 控 除 の 対 象 となる 借 入 金 は 平 成 26 年 4 月 平 成 31 年 6 月 30 日 までの 入 居 の 場 合 は4,000 万 円 ( 平 成 26 年 3 月 までの 入 居 の 場 合 は2,000 万 円 )までとなります 建 物 や

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安

・モニター広告運営事業仕様書

スライド 1

Taro-2220(修正).jtd

2 出 願 資 格 審 査 前 記 1の 出 願 資 格 (5) 又 は(6) により 出 願 を 希 望 する 者 には, 出 願 に 先 立 ち 出 願 資 格 審 査 を 行 いますので, 次 の 書 類 を 以 下 の 期 間 に 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 等

(Microsoft Word - \203A \225\345\217W\227v\227\314 .doc)

PowerPoint プレゼンテーション

任意整理について | 多重債務Q&A | 公益財団法人 日本クレジットカウンセリング協会

<4D F736F F D F4390B3208A948C E7189BB8CE F F8C668DDA97702E646F63>

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

2 1.ヒアリング 対 象 (1) 対 象 範 囲 分 類 年 金 医 療 保 険 雇 用 保 険 税 備 考 厚 生 年 金 の 資 格 喪 失 国 民 年 金 の 加 入 老 齢 給 付 裁 定 請 求 など 健 康 保 険 の 資 格 喪 失 国 民 健 康 保 険 の 加 入 健 康 保 険

入 札 参 加 者 は 入 札 の 執 行 完 了 に 至 るまではいつでも 入 札 を 辞 退 することができ これを 理 由 として 以 降 の 指 名 等 において 不 利 益 な 取 扱 いを 受 けることはない 12 入 札 保 証 金 免 除 13 契 約 保 証 金 免 除 14 入

第1回

Microsoft PowerPoint - 報告書(概要).ppt

3. 選 任 固 定 資 産 評 価 員 は 固 定 資 産 の 評 価 に 関 する 知 識 及 び 経 験 を 有 する 者 のうちから 市 町 村 長 が 当 該 市 町 村 の 議 会 の 同 意 を 得 て 選 任 する 二 以 上 の 市 町 村 の 長 は 当 該 市 町 村 の 議

●電力自由化推進法案

スライド 1

Microsoft Word - 佐野市生活排水処理構想(案).doc

(2) 単 身 者 向 け 以 外 の 賃 貸 共 同 住 宅 等 当 該 建 物 に 対 して 新 たに 固 定 資 産 税 等 が 課 税 される 年 から 起 算 して5 年 間 とする ( 交 付 申 請 及 び 決 定 ) 第 5 条 補 助 金 の 交 付 を 受 けようとする 者 は

私立大学等研究設備整備費等補助金(私立大学等

(1) 社 会 保 険 等 未 加 入 建 設 業 者 の 確 認 方 法 等 受 注 者 から 提 出 される 施 工 体 制 台 帳 及 び 添 付 書 類 により 確 認 を 行 います (2) 違 反 した 受 注 者 へのペナルティー 違 反 した 受 注 者 に 対 しては 下 記 のペ

中根・金田台地区 平成23年度補償説明業務

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定

b) 参 加 表 明 書 の 提 出 時 において 東 北 地 方 整 備 局 ( 港 湾 空 港 関 係 を 除 く) における 平 成 年 度 土 木 関 係 建 設 コンサルタント 業 務 に 係 る 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 認 定 を 受 けて

平成19年9月改定

2. ど の 様 な 経 緯 で 発 覚 し た の か ま た 遡 っ た の を 昨 年 4 月 ま で と し た の は 何 故 か 明 ら か に す る こ と 回 答 3 月 17 日 に 実 施 し た ダ イ ヤ 改 正 で 静 岡 車 両 区 の 構 内 運 転 が 静 岡 運

第4回税制調査会 総4-1

平成22年度

るよう 工 事 打 合 せ 簿 ( 様 式 2)により 受 注 者 に 求 めます 5-1 理 由 書 ( 様 式 3)が 提 出 され 特 別 の 事 情 を 有 すると 認 めた 場 合 は 社 会 保 険 等 の 加 入 が 確 認 できる 書 類 を 提 出 するよう 工 事 打 合 せ 簿

Microsoft PowerPoint - OS10.pptx

弁護士報酬規定(抜粋)

本 試 験 模 範 解 答 固 定 資 産 税 第 一 問 問 1 1 住 宅 用 地 に 対 する 課 税 標 準 の 特 例 (1) 宅 地 のうち 住 宅 用 地 については 住 宅 政 策 上 の 見 地 から 次 のような 課 税 標 準 の 特 例 が 認 められている 小 規 模 住

Microsoft Word - 第3章.doc

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

法 人 等 に 対 する 課 税 際 課 税 原 則 の 帰 属 主 義 への 見 直 しのポイント 総 合 主 義 から 帰 属 主 義 への 移 行 法 人 及 び 非 居 住 者 ( 法 人 等 )に 対 する 課 税 原 則 について 従 来 のいわゆる 総 合 主 義 を 改 め OECD

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

総合評価点算定基準(簡易型建築・電気・管工事)

Taro-1-14A記載例.jtd

学校教育法等の一部を改正する法律の施行に伴う文部科学省関係省令の整備に関する省令等について(通知)

目 次 機 能 運 用 上 の 注 意 処 理 手 順 画 面 説 明 ログイン 直 送 先 選 択

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

ìäçeãKíˆÅEç◊ë•Åiç≈èIî≈àÛç¸ópÅj

別記

第2回 制度設計専門会合 事務局提出資料

コスト縮減を考慮した整備計画案について

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

(別紙3)保険会社向けの総合的な監督指針の一部を改正する(案)

別 紙 第 号 高 知 県 立 学 校 授 業 料 等 徴 収 条 例 の 一 部 を 改 正 する 条 例 議 案 高 知 県 立 学 校 授 業 料 等 徴 収 条 例 の 一 部 を 改 正 する 条 例 を 次 のように 定 める 平 成 26 年 2 月 日 提 出 高 知 県 知 事 尾

4 承 認 コミュニティ 組 織 は 市 長 若 しくはその 委 任 を 受 けた 者 又 は 監 査 委 員 の 監 査 に 応 じなければ ならない ( 状 況 報 告 ) 第 7 条 承 認 コミュニティ 組 織 は 市 長 が 必 要 と 認 めるときは 交 付 金 事 業 の 遂 行 の

クレジットカード納付導入に伴う指定代理納付書の選定に係る実施要領

株主優待ポイント制度運用規約

< F2D8ED089EF95DB8CAF939996A289C193FC91CE8DF42E6A7464>

表紙

(5) 人 権 侵 害, 差 別 又 は 名 誉 毀 損 となるもの, 又 はおそれがあるもの (6) 他 人 を 誹 謗 し, 中 傷 し, 又 は 排 斥 するもの (7) 投 機 心, 射 幸 心 をあおるもの, 又 はそのおそれがあるもの (8) 内 容 が 虚 偽 誇 大 であるなど 過

<4D F736F F D A948EAE95B98D8782A882E682D192508CB38A948EAE909482CC95CF8D A CF8D58>

工 事 名 渟 城 西 小 学 校 体 育 館 非 構 造 部 材 耐 震 改 修 工 事 ( 建 築 主 体 工 事 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 1 設 計 図 書 等 の 閲 覧 貸 出 平 成 28 年 2 月 23 日 ( 火

Microsoft PowerPoint - OS08 [互換モード]

OKIKAE-KAIRYOU-V3.xdw

Microsoft PowerPoint - 基金制度

<4D F736F F D F5A91EE8BC F368C8E3393FA8DC48D F C8E323893FA916493C B95AA8D CE3816A>

奨学事業戦略部個人情報ファイル簿


(3) 小 単 元 の 指 導 と 評 価 の 計 画 小 単 元 第 11 章 税 のあらまし の 指 導 と 評 価 の 計 画 ( 四 次 確 定 申 告 制 度 抜 粋 ) 関 心 意 欲 態 度 思 考 判 断 技 能 表 現 知 識 理 解 小 単 元 の 評 価 規 準 税 に 関 す

第 40 回 中 央 近 代 化 基 金 補 完 融 資 推 薦 申 込 み 公 募 要 綱 1 公 募 推 薦 総 枠 30 億 円 一 般 物 流 効 率 化 促 進 中 小 企 業 高 度 化 資 金 貸 付 対 象 事 業 の 合 計 枠 2 公 募 期 間 平 成 28 年 6 月 20

国 税 クレジットカード 納 付 の 創 設 国 税 のクレジットカード 納 付 については マイナンバー 制 度 の 活 用 による 年 金 保 険 料 税 に 係 る 利 便 性 向 上 に 関 するアクションプログラム( 報 告 書 ) においてその 導 入 の 方 向 性 が 示 されている

養 老 保 険 の 減 額 払 済 保 険 への 変 更 1. 設 例 会 社 が 役 員 を 被 保 険 者 とし 死 亡 保 険 金 及 び 満 期 保 険 金 のいずれも 会 社 を 受 取 人 とする 養 老 保 険 に 加 入 してい る 場 合 を 解 説 します 資 金 繰 りの 都

untitled

H28記入説明書(納付金・調整金)8

< F2D8AC493C CC81698EF3928D8ED2816A2E6A7464>

第 1 条 適 用 範 囲 本 業 務 方 法 書 は 以 下 の 性 能 評 価 に 適 用 する (1) 建 築 基 準 法 施 行 令 ( 以 下 令 という ) 第 20 条 の7 第 1 項 第 二 号 表 及 び 令 第 20 条 の 8 第 2 項 の 認 定 に 係 る 性 能 評

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63>

は 固 定 流 動 及 び 繰 延 に 区 分 することとし 減 価 償 却 を 行 うべき 固 定 の 取 得 又 は 改 良 に 充 てるための 補 助 金 等 の 交 付 を 受 けた 場 合 にお いては その 交 付 を 受 けた 金 額 に 相 当 する 額 を 長 期 前 受 金 とし

入札公告 機動装備センター

安 芸 太 田 町 学 校 適 正 配 置 基 本 方 針 の 一 部 修 正 について 1 議 会 学 校 適 正 配 置 調 査 特 別 委 員 会 調 査 報 告 書 について 安 芸 太 田 町 教 育 委 員 会 が 平 成 25 年 10 月 30 日 に 決 定 した 安 芸 太 田

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や


その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

1_2013BS(0414)

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について

国立研究開発法人土木研究所の役職員の報酬・給与等について

返還同意書作成支援 操作説明書

第316回取締役会議案

<4D F736F F F696E74202D2082C882E982D982C DD8ED88EE688F882CC82B582AD82DD C668DDA9770>

ニュースリリース

第1号様式

1

の と す る (1) 防 犯 カ メ ラ を 購 入 し 設 置 ( 新 設 又 は 増 設 に 限 る ) す る こ と (2) 設 置 す る 防 犯 カ メ ラ は 新 設 又 は 既 設 の 録 画 機 と 接 続 す る こ と た だ し 録 画 機 能 付 防 犯 カ メ ラ は

工 事 名 能 代 南 中 学 校 体 育 館 非 構 造 部 材 耐 震 改 修 工 事 ( 建 築 主 体 工 事 ) 入 札 スケジュール 手 続 等 期 間 期 日 期 限 等 手 続 きの 方 法 等 1 設 計 図 書 等 の 閲 覧 貸 出 平 成 28 年 5 月 24 日 ( 火

< 現 在 の 我 が 国 D&O 保 険 の 基 本 的 な 設 計 (イメージ)> < 一 般 的 な 補 償 の 範 囲 の 概 要 > 請 求 の 形 態 会 社 の 役 員 会 社 による 請 求 に 対 する 損 免 責 事 由 の 場 合 に 害 賠 償 請 求 は 補 償 されず(

調 査 結 果 トピック1: 性 年 代 別 利 用 率 の 利 用 率 は 男 女 ともに 各 年 代 で 大 きく 伸 長 している 2011 年 9 月 の 調 査 では の 年 代 別 利 用 率 は 男 女 とも が 最 も 高 く が 23.9% が 20.5%だったが 今 年 の 調

Microsoft Word 役員選挙規程.doc

(1)1オールゼロ 記 録 ケース 厚 生 年 金 期 間 A B 及 びCに 係 る 旧 厚 生 年 金 保 険 法 の 老 齢 年 金 ( 以 下 旧 厚 老 という )の 受 給 者 に 時 効 特 例 法 施 行 後 厚 生 年 金 期 間 Dが 判 明 した Bは 事 業 所 記 号 が

Microsoft Word - 養生学研究投稿規定(改)

募集新株予約権(有償ストック・オプション)の発行に関するお知らせ

Transcription:

ゼロコピー 通 信 処 理 を 可 能 にする 実 メモリ 交 換 機 能 の 提 案 門 直 史 1 田 端 利 宏 1 谷 口 秀 夫 1 Ethernet 通 信 環 境 において 1GbEthernet や 10GbEthernet のような 高 速 な 通 信 路 が 普 及 した 結 果, 分 散 処 理 環 境 を 構 成 する 計 算 機 間 のデータ 通 信 処 理 全 体 における プロセッサ 処 理 の 比 率 は 高 くなってきている.このため, 各 パケットに 対 する 送 受 信 処 理, 特 にデータ 複 写 処 理 を 削 減 することが 全 体 の 速 度 向 上 に 大 きな 意 味 を 持 つ. 既 存 手 法 によるゼロコピー 通 信 では,データ 受 信 時 のゼロコピー 通 信 の 実 現 は 難 しい. 本 稿 では, 実 メモリ 交 換 機 能 を 提 案 し,データ 送 信 処 理 に 加 えデータ 受 信 処 理 もゼロコ ピー 通 信 とすることができることを 示 す.また,T ender の 資 源 の 分 離 と 独 立 化 を 利 用 してデータ 送 信 処 理 とデータ 受 信 処 理 においてゼロコピー 通 信 を 実 現 した Ethernet 通 信 機 構 の 実 現 方 式 について 述 べ, 評 価 を 行 う. A proposal of physical memory exchange function to enable Zero-copy communication processing Naofumi Kado, 1 Toshihiro Tabata 1 and Hideo Taniguchi 1 The ratio of the processor processing in the whole data communication processing between a computer constituting distributed processing environment rises as a result that high-speed channels such as 1GbEthernet and 10GbEthernet spread in Ethernet communication environment. Thus reducing data copy processing contribute for total speedup transmission and receiving processing for each packet. As for the realization of Zero-copy communication at the time of the data receiving, it is difficult to be Zero-copy communication by the existing technique. In this paper, we propose physical memory exchange function and show what we can do with Zero-copy communication processing using separation and the independence of resources of T ender. We also describe and evaluate data transmission and receiving a realization method of the Ethernet communication mechanism that realized Zero-copy communication. 1. は じ め に 計 算 機 間 の 通 信 路 の 高 速 化 が 進 み, 計 算 機 間 を 高 速 な 通 信 路 で 結 んだ 分 散 処 理 環 境 の 構 築 が 容 易 となってきている.このような 分 散 処 理 環 境 では, 計 算 機 同 士 の 協 調 した 動 作 のため に,データの 送 受 信 を 行 う 必 要 がある.このため, 各 計 算 機 間 のデータ 通 信 性 能 が 全 体 の 処 理 性 能 に 与 える 影 響 は 大 きく, 分 散 処 理 環 境 下 におけるデータ 通 信 は 高 速 である 必 要 がある. 分 散 処 理 環 境 の 場 合, 遠 隔 の 計 算 機 とのデータ 通 信 を 行 うために Ethernet を 用 いることが 多 い.Ethernet 通 信 環 境 では,1GbEthernet や 10GbEthernet のような 高 速 な 通 信 路 の 普 及 に 伴 い,データ 通 信 処 理 全 体 におけるプロセッサ 処 理 の 比 率 が 高 くなっている.このた め,TCP/IP のプロトコル 処 理 を H/W が 肩 代 わりする TOE(TCP/IP Offload Engine) の 研 究 1),および TCP/IP 通 信 処 理 中 のプロセッサ 処 理 時 間 の 削 減 が 進 められている 2). 一 方 で,シンクライアントシステムやネットワークストレージシステムが 普 及 して 大 容 量 データに 対 する 送 受 信 処 理 が 頻 発 するようになり,メモリ 間 データ 複 写 処 理 によるオー バヘッドが 増 加 している. 大 容 量 データに 対 するデータ 送 受 信 処 理 時 間 を 削 減 する 手 法 の 1 つとしてゼロコピー 通 信 がある.PM/Ethernet 3)4)5) や OPEN-MX 6) といった 高 速 なデー タ 通 信 機 構 では, 送 信 対 象 データを 格 納 した 領 域 を 物 理 メモリにピンダウンしておくこと でカーネル 空 間 を 介 さずに NIC への 直 接 の DMA 転 送 を 可 能 にし,データ 送 信 時 のゼロコ ピー 通 信 を 実 現 している.しかし,データ 受 信 処 理 の 場 合 には 同 様 の 手 法 でゼロコピー 通 信 を 実 現 することはできない.これは, 受 信 したパケットは 最 初 にカーネル 空 間 にマッピング された 受 信 バッファに 格 納 されるためである. ここでは, 実 メモリ 交 換 機 能 を 提 案 する. 実 メモリ 交 換 機 能 は,2 つの 仮 想 メモリ 空 間 上 の 領 域 の 間 で 仮 想 メモリに 割 り 当 てている 実 メモリを 交 換 することでメモリ 間 データ 授 受 を 複 写 レスで 実 現 する 機 能 である.これにより,データ 送 信 時 だけでなくデータ 受 信 時 でも ゼロコピー 通 信 を 実 現 してデータ 送 受 信 処 理 時 間 の 削 減 を 実 現 する. T ender オペレーティングシステム 7) ( 以 下 T ender と 略 す)では,OS の 操 作 する 対 象 を 資 源 として, 分 離 し 独 立 化 している.これにより, 資 源 実 メモリ のように 既 存 OS では 単 体 で 存 在 できない 資 源 を 管 理 して 操 作 することが 可 能 である. 本 稿 では,この 資 源 の 分 離 と 独 立 化 を 利 用 して 実 メモリ 交 換 機 能 を T ender に 実 現 し,データ 送 受 信 ともにゼロ 1 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 Graduate School of Natural Science and Technology, Okayama University 1 c2010 Information Processing Society of Japan

コピー 通 信 を 可 能 とした Ethernet 通 信 機 構 の 実 現 方 式 について 述 べ, 評 価 を 行 う. 2. 既 存 手 法 の 問 題 点 2.1 データ 送 信 時 のゼロコピー 通 信 OPEN-MX では, 送 信 対 象 データのサイズに 応 じてデータ 複 写 による 送 信 とゼロコピー 送 信 を 使 い 分 けている. 送 信 対 象 データが 128 バイト 未 満 の 場 合, 送 信 バッファ(skbuff) のデータ 格 納 領 域 へ 送 信 対 象 データを 複 写 する. 送 信 対 象 データが 129 バイト 以 上 32KB 未 満 の 場 合,ユーザプロセスとカーネルの 共 有 領 域 をピンダウンしておき,この 共 有 領 域 へ 送 信 対 象 データを 複 写 する. 複 写 を 行 った 後, 共 有 領 域 を skbuff にアタッチしてデータ 送 信 を 行 う. 送 信 対 象 データが 32KB 以 上 の 場 合, 送 信 対 象 データを 格 納 する 領 域 に 対 して ピンダウンを 行 い,skbuff にアタッチすることでゼロコピーでの 送 信 を 行 う. SCore では,クラスタを 構 成 する 計 算 機 間 での 高 速 なデータ 通 信 を 提 供 する PM ライブ ラリの 1 つとして PM/Ethernet が 実 装 されている.PM/Ethernet では,データ 送 信 に 利 用 するバッファを 確 保 し,この 送 信 バッファ 上 の 送 信 対 象 メッセージを 構 築 した 後 にデータ 送 信 を 行 う. 上 記 のように, 特 殊 なハードウェアを 利 用 しない 一 般 的 な Ethernet 通 信 環 境 でのゼロコ ピー 通 信 を 可 能 にするために 送 信 対 象 データを 格 納 している 領 域 を 物 理 メモリにピンダウ ンしておき,カーネル 空 間 を 介 さずに NIC へ DMA 転 送 を 行 うことでゼロコピー 通 信 を 実 現 している. 2.2 データ 受 信 時 のゼロコピー 通 信 OPEN-MX では,データ 受 信 時 のゼロコピー 通 信 は 実 現 されておらず,1 回 以 上 のデー タ 複 写 が 発 生 する. 受 信 データが 32KB 未 満 の 場 合,ユーザプロセスとカーネルの 共 有 領 域 をピンダウンしておき, 受 信 バッファ(skbuff)からこの 共 有 領 域 へ 受 信 データを 複 写 し, その 後 受 信 データ 格 納 領 域 へデータ 複 写 を 行 う. 受 信 データが 32KB 以 上 の 場 合, 受 信 デー タを 格 納 する 領 域 に 対 してピンダウンを 行 い,skbuff から 受 信 領 域 へデータ 複 写 を 行 う. PM/Ethernet では,PACS-CS でのデータ 通 信 用 に 設 計 された PM/Ethernet-HXB で ゼロコピー 受 信 の 手 法 が 提 案 されている.これは, 受 信 用 skbuff に ID を 与 えておき,デー タ 受 信 前 に 全 ての skbuff をユーザ 空 間 にマッピングしておく.デバイスドライバでの 受 信 処 理 終 了 後, 受 信 データを 格 納 した skbuff の ID をユーザプロセスに 通 知 することでゼロ コピーで 受 信 データを 参 照 することが 可 能 になる. 2.3 問 題 点 1 仮 想 メモリ 空 間 2 図 1 アドレス 変 換 表 実 メモリ 仮 実 想 メモリを アドレスに 交 換 する 対 応 付 ける 実 メモリ 交 換 機 能 ピンダウンを 用 いる 手 法 では,データ 受 信 時 にはゼロコピー 通 信 を 行 うことができない. この 理 由 を Linux を 例 に 述 べる.NIC がパケットを 受 信 すると 最 初 に 受 信 用 skbuff に 格 納 される.この skbuff は,カーネルによって 確 保 されており,カーネル 用 の 仮 想 空 間 にマッ ピングされている.このため,ピンダウンした 受 信 領 域 を 用 意 しても NIC から 受 信 データ 格 納 先 領 域 への 直 接 の DMA 転 送 を 行 うことはできない. RDMA(Remote Direct Memory Access) 8) のようにデータ 送 受 信 処 理 ともに NIC と ユーザプロセスの 仮 想 メモリ 空 間 上 の 領 域 間 で DMA 転 送 を 行 う 手 法 も 提 案 されている.し かし,RDMA に 対 応 した NIC が 必 要 になりコストが 高 くなる. 3. 実 メモリ 交 換 機 能 3.1 考 え 方 実 メモリ 交 換 機 能 は, 仮 想 メモリ 空 間 上 の n ページの 大 きさの 2 つの 領 域 について, 仮 想 メモリに 対 応 する 実 ページを 交 換 する 機 能 である. 実 メモリ 交 換 機 能 の 様 子 を 図 1 に 示 す. 仮 想 メモリ 空 間 上 の 領 域 は,アドレス 変 換 表 によって 仮 想 アドレスと 実 メモリを 対 応 付 けられており, 領 域 のデータを 参 照 する 際 はアドレス 変 換 表 によって 仮 想 アドレスを 実 アド レスに 変 換 して 参 照 する. 本 機 能 では, 仮 想 メモリ 空 間 上 の 2 つの 領 域 について,それぞれ の 領 域 に 対 応 するアドレス 変 換 表 を 参 照 して 各 ページの 仮 想 アドレスに 対 応 する 実 アドレ スを 交 換 し,アドレス 変 換 表 を 更 新 する.これにより,2 つの 領 域 間 で 複 写 レスでのメモリ 間 データ 授 受 を 実 現 する.この 時, 複 数 ページ 分 の 実 メモリに 対 しても 交 換 を 行 うことが 可 能 である.また,2 つの 領 域 は 異 なる 仮 想 メモリ 空 間 上 に 存 在 していても 良 い. 2 c2010 Information Processing Society of Japan

なお, 本 機 能 は,アドレス 変 換 表 の 実 メモリの 内 容 を 変 更 するのみであるため, 仮 想 アド レスに 対 しての 変 更 は 発 生 しない. 3.2 期 待 される 効 果 実 メモリ 交 換 機 能 を 利 用 することで 期 待 される 効 果 として, 以 下 のものがある. ( 1 ) 複 写 レスでのメモリ 間 データ 授 受 を 実 現 OS 処 理 にとって,メモリ 間 複 写 は 非 常 に 大 きなオーバヘッドであり,データサイズ に 比 例 して 処 理 時 間 が 増 加 する.このため, 複 写 レスでのメモリ 間 データ 授 受 を 実 現 することによって,OS 処 理 全 体 の 処 理 時 間 を 削 減 することが 期 待 できる.このため, データ 複 写 処 理 が 主 となる 処 理, 例 えばプロセス 間 通 信 や 計 算 機 間 での LAN 通 信 に 関 しては, 実 メモリ 交 換 を 実 現 することによる 効 果 は 特 に 大 きいと 考 えられる. ( 2 ) 仮 想 アドレスの 再 マッピングと 比 べ, 領 域 の 解 放 確 保 を 削 減 複 写 レスでのメモリ 間 データ 授 受 を 行 う 他 の 手 法 としては, 仮 想 アドレスの 再 マッピ ングがある.この 処 理 では, 仮 想 メモリ 空 間 上 の 領 域 の 移 動 を 伴 うため, 領 域 の 解 放 や 再 確 保 といった 処 理 が 必 要 になる 場 合 がある. 一 方, 実 メモリ 交 換 機 能 の 場 合 は, 仮 想 メモリ 空 間 上 の 領 域 の 移 動 は 発 生 しないため, 領 域 の 解 放 や 再 確 保 といった 処 理 は 不 要 である. 次 に 欠 点 について 述 べる. ( 1 ) 実 メモリ 交 換 を 行 う 単 位 は,ページの 整 数 倍 実 メモリ 交 換 を 行 った 場 合, 交 換 対 象 のページに 格 納 されているデータ 全 てが 交 換 さ れてしまう.このため, 交 換 を 行 うページの 実 メモリ 領 域 内 に 交 換 を 望 まないデータ を 格 納 しておくことはできず, 内 部 断 片 化 が 発 生 しやすくなる. ( 2 ) TLB フラッシュが 必 要 ページ 変 換 テーブルの 更 新 を 行 うため,TLB フラッシュが 必 要 になる. 4. T ender への 実 装 と 評 価 4.1 資 源 の 分 離, 独 立 化 T ender では,OS の 操 作 する 対 象 を 資 源 として, 分 離 し 独 立 化 している. 資 源 には, 資 源 名 と 資 源 識 別 子 を 付 与 し, 資 源 操 作 のインタフェースを 統 一 している. 更 に, 各 資 源 を 操 作 するプログラム 部 品 ( 資 源 管 理 処 理 部 と 呼 ぶ)を 資 源 ごとに 分 離 し, 共 有 プログラムを 排 除 している.また, 各 資 源 の 管 理 情 報 も 資 源 ごとに 分 離 し, 各 資 源 の 管 理 表 の 間 の 参 照 関 係 を 禁 止 している. ユーザ 用 カーネル 用 領 空 域 間 カーネル 資 源 仮 想 ユーザ 空 空 間 間 図 2 T ender のメモリ 管 理 機 構 メモリ 外 部 記 憶 装 置 資 源 仮 永 実 想 続 メモリ ユニット ユニット 資 源 プレート このように, 資 源 の 分 離 と 独 立 化 を 行 うことで, 資 源 の 事 前 用 意 や 保 留 により, 資 源 の 作 成 や 削 除 を 伴 う 処 理 を 高 速 化 している.さらに,プログラムを 部 品 化 できるため, 機 能 の 追 加 や 変 更 が 容 易 になっている. 4.2 メモリ 管 理 機 構 T ender のメモリ 管 理 機 構 を 図 2 に 示 す. 資 源 仮 想 空 間 とは, 特 定 のアドレス 領 域 を 持 つ 仮 想 的 な 空 間 であり, 仮 想 アドレスから 実 アドレスへのアドレス 変 換 表 に 相 当 する. 資 源 仮 想 領 域 は,メモリイメージを 仮 想 化 した 資 源 であり, 実 体 は 実 メモリもしくは 外 部 記 憶 装 置 に 存 在 する. 仮 想 領 域 管 理 のインタフェースを 表 1 に 示 す. 資 源 仮 想 領 域 を 作 成 する 際 に 資 源 実 メモリ を 割 り 当 てる 場 合, 作 成 する 資 源 仮 想 領 域 のサイズに 応 じてページ 単 位 で 資 源 実 メモリ を 作 成 して 割 り 当 てる.T ender での 1 ページは 4KB である. 資 源 仮 想 ユーザ 空 間 は,メモリイメージを 仮 想 化 した 領 域 である 資 源 仮 想 領 域 をユーザ 用 の 資 源 仮 想 空 間 に 貼 り 付 けることで 作 成 できる. 貼 り 付 ける とは, 仮 想 アドレスを 実 アドレスに 対 応 付 けすることであり, 具 体 的 には, 当 該 の 仮 想 アドレスに 対 応 するアドレス 変 換 表 のエントリに, 実 アドレスまたは 外 部 記 憶 装 置 のアドレスを 設 定 する. 一 方, 仮 想 アドレスと 実 アドレスの 対 応 付 け 解 除 を 剥 がし と 呼 ぶ. 資 源 仮 想 領 域 の 実 体 は, 資 源 実 メモリ または 外 部 記 憶 装 置 上 に 存 在 する.なお, 外 部 記 憶 装 置 上 3 c2010 Information Processing Society of Japan

表 1 仮 想 領 域 管 理 の 提 供 インタフェース 形 式 create vr(size, mem, dk, vr op, name) delete vr(vrid) size で 指 定 された 大 きさの 仮 想 領 域 を 確 保 する.mem=1 の 場 合, 実 メモリを 確 保 しない.mem=2 の 場 合,vr op にしたがって 実 メモリを 確 保 する. vrid で 指 定 した 仮 想 領 域 を 削 除 する. read vr(vrid, vaddr, offset) vrid で 指 定 した 仮 想 領 域 に 対 応 するディスク 領 域 の offset からのデータをメモリ 上 の vaddr で 指 定 するアドレスに 読 み 込 む. write vr(vrid, vaddr, offset) vrid で 指 定 したメモリ 上 の vaddr で 指 定 するアドレスのデータを vrid で 指 定 した 仮 想 領 域 に 対 応 するディスク 領 域 の offset から 書 き 出 す. ctrl vr(vrid, vr op, offset, size, *name, vr op=0x1 の 場 合,vrid で 指 定 した 仮 想 領 域 のサイズを 返 す.vr op=0x2 の 場 合,vrid で 指 定 した 仮 想 領 域 の offset からの 実 アドレスを 返 す.vr op=0x100 の 場 合, vaddr, reserve, *buff, change size, offset1, 仮 想 領 域 の offset から size 分 の 実 メモリを 割 り 当 てる.vr op=0x200 の 場 合,vrid で 指 定 した 仮 想 領 域 の offset から size 分 の 実 メモリを 解 放 する. vrid2, offset2, pagesize, *raddr1, *raddr2) vr op=0x8000 の 場 合,vrid で 指 定 した 仮 想 領 域 の offset1 から pagesize 分 の 実 メモリと vrid2 で 指 定 した 仮 想 領 域 の offset2 から pagesize 分 の 実 メモリを 交 換 する. 機 能 表 2 実 メモリ 交 換 機 能 の 提 供 インタフェース 形 式 機 能 exchange pmem(vrid1,vrid2, 仮 想 領 域 vrid1 の offset1 からの 実 メモリと 仮 想 領 域 vrid2 の offset1,offset2,pagesize) offset2 からの 実 メモリを pagesize 分 交 換 する の 領 域 の 種 類 として, 資 源 永 続 ユニット と 資 源 仮 想 ユニット の 2 種 類 がある. 資 源 仮 想 カーネル 空 間 は, 資 源 仮 想 領 域 をカーネル 用 の 資 源 仮 想 空 間 に 貼 り 付 け ることにより 作 成 される. 4.3 実 メモリ 交 換 機 能 T ender で 実 現 した 実 メモリ 交 換 機 能 の 提 供 インタフェースを 表 2 に 示 す. 実 メモリ 交 換 機 能 は,vrid1 と vrid2 に 対 応 付 けられている 資 源 実 メモリ を 交 換 することで 仮 想 空 間 1 と 仮 想 空 間 2 の 間 のデータ 授 受 を 実 現 する.この 時, 仮 想 領 域 を 特 定 する 情 報 として カーネルに 対 して 仮 想 領 域 の 資 源 識 別 子 を 渡 す.カーネルは,この 仮 想 領 域 識 別 子 から 仮 想 領 域 を 特 定 し, 対 応 付 けられている 実 メモリ 情 報 を 参 照 する.この 際, 仮 想 領 域 に 対 応 付 け ている 実 メモリの 先 頭 からのオフセットと 交 換 するページ 数 を 指 定 することで 複 数 ページの 交 換 も 可 能 である. 4.4 資 源 入 出 力 T ender では,NIC を 含 む 入 出 力 デバイスを 統 一 的 に 管 理 する 資 源 として 資 源 入 出 力 を 持 つ 9). 資 源 入 出 力 は 入 出 力 管 理 によって 管 理 制 御 され, 入 力 領 域 と 出 力 領 域 を 用 い てデータの 入 出 力 を 行 う 機 能 を 提 供 する 資 源 である. 資 源 入 出 力 は,HDD,Myrinet, および Ethernet といった 入 出 力 デバイスを 抽 象 化 してどの 入 出 力 デバイスに 対 しても 統 一 的 なインタフェースを 提 供 する. 資 源 入 出 力 では, 入 出 力 を 生 成 して 各 入 出 力 ごとに 出 力 (データ 送 信 に 相 当 )と 入 力 (データ 受 信 に 相 当 )を 行 う.この 時, 入 出 力 の 生 成 時 に 出 力 の 個 数 と 入 力 の 個 数 を 決 定 し ており, 複 数 のデータを 連 続 して 送 受 信 する 場 合 に 逐 次 的 に 送 受 信 処 理 を 行 うのではなく 一 括 して 送 受 信 処 理 を 行 うことができる.これにより,カーネルへの 処 理 依 頼 回 数 や 受 信 待 ち 状 態 のプロセスを 起 床 させる 処 理 を 削 減 できる.また,T ender では,データ 送 信 時 に 使 用 する mbuf は T ender の 初 期 化 処 理 時 に 確 保 しておき 繰 り 返 して 使 用 する. 入 出 力 管 理 の 提 供 インタフェースを 表 3 に 示 し,その 機 能 を 以 下 に 説 明 する. ( 1 ) 生 成 入 出 力 の 種 類 により 指 定 された 入 出 力 デバイスに 対 する 資 源 入 出 力 を 生 成 する. 入 出 力 識 別 子 を 返 却 する. ( 2 ) 削 除 指 定 された 資 源 入 出 力 を 削 除 する. ( 3 ) 入 力 指 定 された 入 出 力 識 別 子 に 対 応 する 資 源 入 出 力 の 入 力 領 域 へデータを 入 力 する. ( 4 ) 出 力 指 定 された 入 出 力 識 別 子 に 対 応 する 資 源 入 出 力 の 出 力 領 域 からデータを 出 力 する. ( 5 ) 入 出 力 への 入 出 力 領 域 の 登 録, 入 出 力 相 手 装 置 のアドレス 情 報 登 録 指 定 された 入 出 力 識 別 子 に 対 応 する 資 源 入 出 力 に 対 し, 入 力 領 域 と 出 力 領 域 の 登 録, 入 出 力 相 手 装 置 へのアドレス 情 報 登 録 を 行 う. 入 出 力 の 種 類 として, 通 信 相 手 を 特 定 する 情 報 ( 通 信 路 の 種 類 など)に 加 え, 入 出 力 装 置 を 特 定 する 情 報 も 含 めている. 資 源 入 出 力 によるデータ 送 受 信 処 理 の 流 れを 以 下 に 説 明 する.なお,データ 送 受 信 処 理 を 行 う 前 に 入 出 力 領 域 の 登 録 を 行 い, 入 力 領 域 と 出 力 領 域 の 実 アドレスと 仮 想 領 域 識 別 子 を 登 録 しておく 必 要 がある. 4 c2010 Information Processing Society of Japan

表 3 入 出 力 管 理 の 提 供 インタフェース 形 式 get io(dev no,numofinput,numofoutput,ioid) free io(ioid) input io(ioid, size, position) output io(ioid, vars, size, position) 入 出 力 の 種 類, 入 力 の 個 数, 出 力 の 個 数, 入 出 力 識 別 子 を dev no,numofinput,numofoutput,ioid で 指 定 して 入 出 力 を 生 成 する. ioid で 指 定 した 入 出 力 を 削 除 する. 機 能 ioid で 指 定 した 入 出 力 に 対 して 入 力 を 行 う. 入 力 の 位 置 を 指 定 する 場 合,position で 指 定 した 配 列 に 格 納 する.size には 入 力 したデータサイズを 格 納 する. ioid で 指 定 した 入 出 力 から 出 力 を 行 う. 出 力 の 位 置 を 指 定 する 場 合,position で 指 定 した 配 列 に 格 納 する.size には 出 力 するデータサイズを 格 納 する. ctrl io(ioid,io op, buff, input vmid, input vrid, io op=0x01 の 場 合,ioid で 指 定 した 入 出 力 に 対 して 入 力 領 域 と 出 力 領 域 の 仮 想 空 間 識 別 子 vmid, 仮 想 領 域 識 別 子 vrid, 仮 想 アドレス addr を 登 録 する. input addr, input size, output vmid, output vrid, io op=0x10 の 場 合,ioid で 指 定 した 入 出 力 に 対 して 入 出 力 相 手 装 置 番 号 machine num と buff に 格 納 したアドレス 情 報 を 対 応 付 ける. output addr, output size,machine num) ( 1 ) データ 送 信 処 理 ( A ) データ 送 信 プロセスは,カーネルに 対 してデータの 出 力 を 依 頼 する. ( B ) カーネルは,データ 送 信 用 mbuf のデータ 格 納 領 域 へのポインタを 繋 ぎ 変 えて 出 力 領 域 の 実 アドレスを 登 録 し,パケットヘッダを 生 成 する. 出 力 の 個 数 分 の 10 12 14 16 18 20 データに 送 信 処 理 を 終 えた 後 に NIC に 対 してパケット 送 信 処 理 を 依 頼 する. 処 理 時 間 (μ 秒 ) 02468 ( C ) NIC は,mbuf のデータ 格 納 領 域 へのポインタを 参 照 する.これにより,ユー ザ 用 仮 想 空 間 上 に 存 在 するデータをカーネル 用 仮 想 空 間 に 複 写 することなく 直 接 NIC へと DMA 転 送 を 行 うことができる.その 後, 送 信 パケットを 生 成 し て 通 信 路 上 に 送 信 する. ( 2 ) データ 受 信 処 理 0 1000 2000 3000 ( A ) データサイズ(バイト) 4000 5000 6000 7000 8000 9000 データ 受 信 プロセスは,カーネルに 対 してデータの 入 力 を 依 頼 する. ( B ) カーネルは, 受 信 パケットが 未 だ 到 着 していない 場 合 は 受 信 プロセスを 休 眠 さ せ,パケット 受 信 待 ち 状 態 にする. 図 3 実 メモリ 交 換 とデータ 複 写 の 処 理 時 間 比 較 ( C ) NIC は,パケットを 受 信 するとデータ 受 信 用 mbuf に 受 信 パケットを DMA 転 送 し, 受 信 割 り 込 みを 発 生 させる. ( D ) カーネルは,パケット 受 信 処 理 を 開 始 する.この 時 に 受 信 割 り 込 み 発 生 を 禁 止 し, 以 降 はポーリングによる 受 信 パケット 検 出 を 行 う.パケット 受 信 処 理 とし てパケットヘッダの 解 析 を 行 い, 受 信 データ 格 納 先 の 入 力 領 域 と mbuf のデー タ 格 納 領 域 に 対 して 実 メモリ 交 換 によるデータ 授 受 を 行 う. 入 力 の 個 数 分 のパ ケットを 受 信 すると 受 信 割 り 込 みを 許 可 し, 受 信 プロセスを 起 床 させる. 上 記 のようにデータ 送 受 信 処 理 を 行 うことで 送 受 信 処 理 ともにゼロコピー 通 信 を 実 現 す ることができる. 4.5 評 価 4.5.1 評 価 環 境 データ 複 写 実 メモリ 交 換 実 メモリ 交 換 機 能 を T ender に 実 現 し,Linux でのデータ 送 受 信 処 理 と 比 較 する.Linux は Fedora 10(2.6.30 カーネル)であり,Packet Socket を 用 いる. 測 定 は, 計 算 機 2 台 を 直 結 して 行 った. 4.5.2 データ 複 写 との 比 較 実 メモリ 交 換 とデータ 複 写 でのメモリ 間 データ 授 受 に 要 するプロセッサ 処 理 時 間 を T ender で 測 定 した. 測 定 結 果 を 図 3 に 示 す. ( 1 ) データサイズが 小 さい 場 合, 実 メモリ 交 換 よりもデータ 複 写 の 方 が 処 理 時 間 が 短 い. 5 c2010 Information Processing Society of Japan

IPSJ SIG Technical カーネル Report NIC T0 T1 T2 送 信 側 計 算 機 受 信 側 計 算 機 Xバイト 128 個 1バイト (A)Linux 図 4 T0 T1 T2 測 定 処 理 の 流 れ カーネル 送 信 側 計 算 NIC 機 受 信 側 計 算 機 Xバイト 128 個 1バイト (B)Tender これは, 実 メモリ 交 換 処 理 のオーバヘッドがデータ 複 写 処 理 のオーバヘッドを 上 回 る ためである. ( 2 ) データ 複 写 はデータサイズに 比 例 して 処 理 時 間 が 増 加 するが, 実 メモリ 交 換 は,デー タサイズが 4KB 以 下 の 場 合 に 処 理 時 間 の 変 化 はない.これは, 実 メモリ 交 換 の 処 理 時 間 はページ 数 に 依 存 するためであり,ページ 数 が 一 定 であればデータサイズに 変 更 が 生 じても 処 理 時 間 への 影 響 はない. ( 3 ) データサイズが 大 きくなるほど 実 メモリ 交 換 とデータ 複 写 の 処 理 時 間 差 は 大 きくな り,データサイズが 4KB の 場 合 には 約 2.8 倍,8KB の 場 合 には 約 4.8 倍 の 処 理 時 間 差 となる. 以 上 のことから, 実 メモリ 交 換 は 大 容 量 データ 授 受 に 対 して 大 きな 効 果 を 発 揮 することが 分 かる. 4.5.3 スループット スループット 測 定 処 理 の 流 れを 図 4 に 示 す. 送 信 側 計 算 機 から 128 個 のパケットを 受 信 側 計 算 機 に 対 して 連 続 で 送 信 し, 受 信 側 計 算 機 では 全 ての 受 信 パケットを 処 理 した 後 に 1 バ イトのデータを 持 つパケットを 送 信 側 計 算 機 に 対 して 返 信 する.この 処 理 に 要 する 処 理 時 間 を 測 定 してスループットを 算 出 した.ここで,T 0 は 送 信 側 計 算 機 がデータ 送 信 処 理 を 開 始 した 時 間 から 受 信 側 計 算 機 からの 返 信 パケットの 受 信 処 理 を 完 了 するまでの 時 間,T 1 は, 送 信 側 計 算 機 がデータ 送 信 処 理 に 要 するプロセッサ 処 理 時 間,T 2 は, 送 信 側 計 算 機 がデー 100 200 300 400 500 600 700 800 900 スループット(Mbps) Tender Linux 00 1000 2000 3000送 信 データサイズ(バイト) 4000 5000 6000 7000 8000 9000 図 5 スループット タ 送 信 処 理 中 のプロセッサ 処 理 を 終 了 した 時 間 から 返 信 パケットの 受 信 処 理 を 完 了 するまで の 時 間 である. T 0 から 算 出 したスループットを 図 5 に 示 し,T 1 と T 2 の 時 間 を 図 6 に 示 す. ( 1 ) データサイズが 小 さい 場 合,T ender より Linux の 方 がスループットが 高 い.これ は,パケット 受 信 時 の 実 メモリ 交 換 処 理 のオーバヘッドがデータ 複 写 処 理 のオーバ ヘッドを 上 回 るためである. ( 2 ) T ender と Linux の 両 者 ともスループットの 上 昇 は 800Mbps 前 後 で 停 止 しており. 通 信 路 の 提 供 するスループットの 8 割 程 度 しか 性 能 を 発 揮 できていない.これは,T 0 に 返 信 パケットの 送 受 信 処 理 に 要 する 時 間 を 含 んでいるためであり, 一 方 向 の 転 送 能 力 はさらに 高 いと 考 えられる. ( 3 ) T ender の T 1 はデータサイズを 増 加 させても 変 化 がなく,Linux と 比 較 して 非 常 に 短 い(データサイズが 8KB の 場 合 には Linux の 約 3.4% 程 度 ).これは,データ 送 信 時 にゼロコピー 通 信 を 実 現 していること,および 送 信 対 象 のデータ 全 てに 対 して カーネルの 送 信 処 理 を 終 えてから NIC にパケット 送 信 処 理 を 依 頼 しているためであ る.このようにデータ 送 信 処 理 を 行 う 場 合,カーネルの 送 信 処 理 と NIC の 送 信 処 理 6 c2010 Information Processing Society of Japan

12000 情 報 処 理 学 会 研 究 報 告 10000 8000 処 理 時 間 (μ 秒 ) 6000 4000 2000 0 返 信 パケット 処 理 までの 時 間 (T2) データ 送 信 処 理 のプロセッサ 時 間 (T1) Tender Linux Tender Linux Tender Linux Tender Linux Tender Linux Tender Linux 256 512 データサイズ(バイト) 1024 2048 4096 8192 図 6 処 理 時 間 (スループット) 1000 100 200 300 400 500 600 700 800 900 処 理 時 間 (μ 秒 ) 0 返 信 パケット 処 理 までの 時 間 (T2) データ 送 信 処 理 のプロセッサ 時 間 (T1) Tender Linux Tender Linux Tender Linux Tender Linux Tender Linux Tender Linux 256 512 データサイズ(バイト) 1024 2048 4096 8192 図 7 処 理 時 間 (ラウンドトリップタイム) を 並 列 に 行 えないという 欠 点 がある.しかし,プロセッサ 処 理 を 早 期 に 終 了 させるこ とでプロセッサ 負 荷 を 大 きく 軽 減 できる 点 は 大 きな 利 点 である. 4.5.4 ラウンドトリップタイム 図 4 での 送 信 パケットを 1 個 とし, 受 信 側 計 算 機 からの 返 信 パケットのデータサイズを 送 信 パケットと 同 じサイズにした 場 合 の 処 理 時 間 (ラウンドトリップタイム:RTT)を 測 定 した.T 1 と T 2 の 時 間 を 図 7 に 示 す. ( 1 ) データサイズが 小 さい 場 合,T ender より Linux の 方 が T 0 が 短 い.これは,パケッ ト 受 信 時 の 実 メモリ 交 換 処 理 のオーバヘッドがデータ 複 写 処 理 のオーバヘッドを 上 回 るためである. ( 2 ) Linux はデータサイズが 大 きくなるにつれて T 1 が 増 加 するのに 対 し,T ender は データサイズを 増 加 させても 変 化 がない.これは,T ender はデータ 送 信 時 にゼロ コピー 通 信 を 実 現 しており,データサイズの 影 響 を 受 けないためである. ( 3 ) データサイズが 大 きい 場 合,T ender の 方 が Linux よりも T 0 が 短 くなり,データサ イズが 大 きくなるほど T ender と Linux の 処 理 時 間 差 は 大 きくなる.これは,Linux ではデータ 複 写 に 要 する 処 理 時 間 が 増 大 するためである.データサイズが 8KB の 場 合 には Linux と 比 較 して T 0 を 約 63% 程 度 削 減 できており, 計 算 機 間 で 大 容 量 デー タに 対 して 逐 次 応 答 処 理 を 実 行 する 場 合 に 非 常 に 大 きな 効 果 を 発 揮 することが 期 待 で きる. 5. お わ り に 仮 想 メモリ 空 間 上 の 2 つの 領 域 に 対 して 対 応 付 ける 実 メモリを 交 換 することでデータ 授 受 を 実 現 する 実 メモリ 交 換 機 能 を 提 案 した. 実 メモリ 交 換 機 能 を 実 現 することにより, 複 写 レスでのメモリ 間 データ 授 受 を 行 うことが 可 能 になる.T ender における 資 源 の 分 離 と 独 立 化 を 利 用 して 実 メモリ 交 換 機 能 を 実 現 することでデータ 送 信 時 のみでなくデータ 受 信 時 もゼロコピー 通 信 とすることを 可 能 にした. データ 複 写 と 実 メモリ 交 換 の 処 理 時 間 の 評 価 により,データサイズが 8KB の 時 にはデー タ 複 写 処 理 よりも 約 4.8 倍 高 速 になることを 示 し, 大 容 量 データ 授 受 に 対 して 非 常 に 大 き な 効 果 があることを 示 した.また,Linux とのラウンドトリップタイムの 評 価 により, 処 理 時 間 を 約 37% 削 減 した.しかし,データサイズが 小 さい 場 合 には, 実 メモリ 交 換 のオーバ 7 c2010 Information Processing Society of Japan

ヘッドがデータ 複 写 のオーバヘッドを 上 回 るため,データサイズに 応 じてデータ 複 写 と 実 メ モリ 交 換 を 使 い 分 けるといった 対 処 を 行 う 必 要 がある. 残 された 課 題 として, 送 受 信 対 象 データのサイズに 応 じて 実 メモリ 交 換 とデータ 複 写 を 使 い 分 けるといった 対 処 を 行 い,データサイズに 適 した 送 受 信 方 式 を 実 現 することがある. 参 考 文 献 1) Feng,W.,Balaji,P.,Baron,C.,Bhuyan,L.N. and Panda,D.K.:Performance characterization of a 10-Gigabit Ethernet TOE,Proc. 13th Symposium on High Performance Interconnects,pp.58-63,(2005). 2) Menon,A. and Zwaenepoel,W.:Optimizing TCP Receive Performance,Proc. USENIX 2008 Annual Technical Conference on Annual Technical Conference, pp.85-98,(2008) 3) 住 元 真 司, 堀 敦 史, 手 塚 宏 史, 原 田 浩, 高 橋 俊 行, 石 川 裕,: 既 存 OS の 枠 組 を 用 いたクラスタシステム 向 け 高 速 通 信 機 構 の 提 案, 情 報 処 理 学 会 論 文 誌,Vol.41,No.6, pp.1688-1696,(2000). 4) 住 元 真 司, 堀 敦 史, 手 塚 宏 史, 原 田 浩, 高 橋 俊 行, 石 川 裕,: 高 速 通 信 機 構 PM2 の 設 計 と 評 価, 情 報 処 理 学 会 論 文 誌,Vol.41,No.SIG 5(HPS 1),pp.80-90,(2000). 5) 住 元 真 司, 大 江 和 一, 久 門 耕 一, 朴 泰 祐, 佐 藤 三 久, 宇 川 彰,: 複 数 Gigabit Ethernet を 用 いた PACS-CS のための 高 性 能 通 信 機 構 の 設 計 と 評 価, 情 報 処 理 学 会 論 文 誌 コン ピューティングシステム,Vol.49,No.SIG 12(ACS 15),pp.25-34,(2006). 6) Goglin,B.:Design and Implementation of Open-MX: High-Performance Message Passing over generic Ethernet hardware,workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2008,(2008). 7) 谷 口 秀 夫, 青 木 義 則, 後 藤 真 孝, 村 上 大 介, 田 端 利 宏,: 資 源 の 独 立 化 機 構 による T ender オペレーティングシステム, 情 報 処 理 学 会 論 文 誌,Vol.41,No.12,pp.3363-3374(2000) 8) Pinkerton,J.:The Case for RDMA,RDMA Consortium(online),available from http://www.rdmaconsortium.org/home/. 9) 門 直 史, 田 端 利 宏, 谷 口 秀 夫,:T ender における 資 源 入 出 力 を 用 いた Ethernet 通 信 の 設 計, 電 子 情 報 通 信 学 会 2008 年 総 合 大 会 講 演 論 文 集,Vol.2008, pp.94,(2008) 8 c2010 Information Processing Society of Japan