検 索 エンジンを 利 用 した Covert Channelの 検 出 木 下 研 究 室 200602824 久 保 直 也
研 究 の 背 景 目 的 近 年 ネットワークの 巨 大 化 によりアクセス 権 限 も 複 雑 に 絡 み 合 ってい る ネットワーク 内 では 不 正 な 情 報 経 路 が 発 生 し 情 報 流 出 の 危 険 性 が 増 大 してしまっている このような 情 報 流 出 経 路 の 解 析 法 としてCovert Channel 解 析 があるが 従 来 のように 把 握 したコミュニティーの(Access Control List)のみを 用 いたCovert Channelの 解 析 だけでは 検 出 できないアクセス 権 の 矛 盾 が 存 在 する 場 合 がある
研 究 の 背 景 目 的 検 索 エンジンで 得 られた 情 報 にオントロジーを 用 いたセマンティックな 解 析 手 法 を 適 用 することでの 矛 盾 や 経 路 を 効 率 よく 見 つけることを 目 的 とする 検 出 できない 可 能 性 のあるアクセス 権 の 矛 盾 を 検 出 するため オントロジーDBを 作 成 し 検 索 エンジンで 収 集 した 情 報 を 形 態 素 解 析 構 文 解 析 しRDF 化 し 意 味 まで 考 慮 したマッチングを 行 うことで 外 的 要 因 まで 考 慮 したの 矛 盾 や 経 路 を 見 つける 方 法 を 提 案 する
Covert Channel Covert Channelは 意 図 しない 情 報 経 路 のことで アクセス 行 列 において Subject Object permissionを アクセストリプルと 定 義 した 時 始 点 から 終 点 への 流 れで 情 報 流 出 が 発 生 してしまうことを 言 う 終 点 中 間 点 2 S2 O1 φ R O2 R W 始 点 中 間 点 1 アクセス 行 列 S:Subject O:Object R:READ W:WRITE
検 索 エンジンとCovert Channel
検 索 エンジンとCovert Channel 内 的 とはコミュニティ 内 のこと 外 的 とはコミュニティ 外 のこと 内 的 なではS3はO1を 読 むことができない
検 索 エンジンとCovert Channel 外 的 要 因 を 考 慮 した 場 合 O1を 読 み 書 きできるS2がO8にコピペ することで
検 索 エンジンとCovert Channel SOthersに 読 まれてしまう
検 索 エンジンとCovert Channel それをクローラが 収 集 しそれをサーチ する またはO8から 直 接 S3はO1を 読 むことができるようになってしまう
研 究 の 概 略 検 索 エンジン 全 体 図 クローラ 述 語 論 理 化 形 態 素 解 析 構 文 解 析 Hadoop RDF 解 析 エ ンジン オント ロジー DB コンテンツ 電 番 R R 電 番 R
研 究 の 概 略 検 索 エンジン 全 体 図 Web 上 を 自 動 的 に 巡 回 してWeb ページを 収 集 する 検 索 ロボット プログラムのこと 述 語 論 理 化 既 知 のHTML 文 書 の 新 しいコ ピーを 要 求 文 書 中 に 含 まれるリンクをたどる RDF 別 の 文 書 を 収 集 する という 動 作 を 繰 り 返 す 新 しい 文 書 を 見 つけた 場 合 は データベースに 登 録 する コンテンツ R 電 番 R クローラ 形 態 素 解 析 構 文 解 析 オント ロジー DB Hadoop 電 番 R
研 究 の 概 略 検 索 エンジン 全 体 図 形 態 素 解 析 では 単 語 分 割 品 詞 タグ 付 けをする 単 語 述 分 語 論 割 理 化 とは 文 中 の 単 語 を 同 定 する 作 業 である 例 えば 子 供 の 体 力 低 下 RDF クローラ 形 態 素 解 析 構 文 解 析 Hadoop と 単 語 分 割 される 品 詞 タグ 付 けとは 各 単 語 の 品 詞 を 同 定 する 作 業 である コンテンツ R 電 番 R オント ロジー DB 電 番 R
コンテンツ 電 番 研 究 の 概 略 構 文 解 析 では 主 に 係 り 受 けを 全 体 図 解 析 する 先 程 の 例 を 係 り 受 け では R 述 語 論 理 化 子 供 体 力 体 力 低 下 と 表 される RDF 形 態 素 解 析 構 文 解 析 両 方 か ら 検 索 することによって 検 索 の 精 度 が 上 がる R 検 索 エンジン クローラ 形 態 素 解 析 構 文 解 析 オント ロジー DB Hadoop 電 番 R
研 究 の 概 略 Hadoopは,Google 検 索 全 システムにおいて 体 図 大 量 の メタ 言 語 のインデック ス を 整 理 分 類 する インターネット 内 に 散 ら ばったリソースのファイ ル 名,ファイル 内 容 の 語 述 語 論 理 化 RDF を 収 集 分 析 する インデックスとしてまとめ る 機 能 Mapフェーズと 解 析 エ ンジン Reduceフェーズの2つか ら コンテンツ 成 り, 計 R算 処 理 を 分 散 電 番 R して 行 う 検 索 エンジン クローラ 形 態 素 解 析 構 文 解 析 オント ロジー DB Hadoop 電 番 R
研 究 の 概 略 主 語 Xを 変 えるとそれ 全 体 図 に 応 じた 命 題 P(X)が 得 られるのだが 変 数 X を 具 体 的 に 指 定 するこ となしに P(X) 述 語 論 理 化 RDF 検 索 エンジン クローラ 形 態 素 解 析 構 文 解 析 Hadoop という 命 題 を 考 えるの が 述 語 論 理 である ここでは 意 味 まで 考 慮 コンテンツ R したマッチングを 行 うた 電 番 R めに 述 語 論 理 化 します 解 析 エ ンジン オント ロジー DB 電 番 R
RDF は,リソースを 研 究 内 容 表 記 す る 枠 組 みで,SPO のトリプ ルでリソースとオブジェク ト 間 の 全 関 体 係 図 を 厳 密 に 記 述 することができる 例 http://www.kanzaki.com の 作 者 は 神 崎 正 英 です と いった 文 があった 場 合 主 語 (Subject ) 述 語 (Predica te) 目 的 語 (Object ) コンテンツ 電 番 リソース プロパ ティ R プロパ ティの 値 R http://w ww.kanz aki.com 作 者 神 崎 正 英 述 語 論 理 化 RDF 解 析 エ ンジン 検 索 エンジン クローラ 形 態 素 解 析 構 文 解 析 オント ロジー DB Hadoop 電 番 R
研 究 内 容 検 索 エンジン Ontology 全 体 にはさまざまな 図 定 義 があるが, 工 学 的 には 概 念 化 の 明 示 的 な 記 述 とされている. その 目 的 は, 自 然 言 語 に よって 記 述 されたメタデー タに 存 在 する 曖 昧 さを 排 除 することである. それによりコンピュータが 知 識 を 意 味 論 的 に 扱 うこと を 可 能 とすることである. コンテンツ 電 番 R R 述 語 論 理 化 RDF クローラ 形 態 素 解 析 構 文 解 析 オント ロジー DB Hadoop? 電 番 R
研 究 の 概 略 検 索 エンジン 全 体 図 クローラ Web 検 索 の 結 果 を 解 析 して 得 られた 外 的 要 因 まで 考 慮 した 実 質 的 な 述 語 論 理 化 RDF 形 態 素 解 析 構 文 解 析 Hadoop? 内 的 なで は 電 話 番 号 は 読 めない ことになって いる コンテンツ R 電 番 R 解 析 エ ンジン 外 的 要 因 を 考 慮 矛 盾 し て い る オント ロジー DB 内 的 な 電 番 R
Covert Channelの 検 出 手 順 1 クローラで 収 集 された 情 報 のタグを 取 り 除 き 形 態 素 解 析 構 文 解 析 を 行 う 形 態 素 解 析, 構 文 解 析 を 行 うことで, 検 索 の 精 度 を 上 げることがで きる ここではHTMLファイルからタグ 部 分 を 取 り 除 き 検 索 対 象 とな る 文 章 を 取 りだし 形 態 素 解 析 を 行 う
先 程 のHTMLファイルから Koganeの 日 記 携 帯 ホームページ02/01の 日 記 11:53 研 究 とし て 使 用 します 久 保 直 也 の 個 人 情 報 は090-4216-0000です という 文 を 取 りだし 形 態 素 解 析 を 行 う
2 形 態 素 解 析, 構 文 解 析 された 情 報 を 述 語 論 理 化 RDF 化 する. 述 語 論 理 化 して,RDF 化 しなければ 意 味 まで 考 慮 したマッチングが 取 れないためRDF 化 を 行 う. 例 えば 久 保 直 也 の 電 話 番 号 は090-4216-0000 です, という 文 があっ た 場 合 久 保 直 也 を 主 語 (リソース) 電 話 番 号 を 述 語 (プロパティ)090-4216-0000 を 目 的 語 (プロパティの 値 ) となる.
3 オントロジーDBを 記 述 しておく. 例 えば090-4216-0000instance-of 電 話 番 号 is-a 個 人 情 報 is-a 久 保 直 也 といった 記 述 ができる. ここではオントロ ジーDBの 記 述 にはprotege を 使 用 する.
4 を 導 く RDF で 検 索 された 処 理 結 果 とオントロジーDBから 外 的 要 因 を 考 慮 した を 導 き 出 す 解 析 エンジンにより を 検 出 する. 5 Covert Channelの 検 出 さらに 矛 盾 があった 場 合 Covert Channel の 経 路 を 表 示 される. 以 上 により, 内 的 な では 読 めない ことになっている 情 報 がWeb 検 索 の 結 果 を 解 析 して 得 られ た 外 的 要 因 まで 考 慮 した 実 質 的 な では 読 めると 言 った ような 矛 盾 を 見 つけ ることができる.
4 を 導 く RDF で 検 索 された 処 理 結 果 とオントロジーDBがら 外 的 要 因 を 考 慮 した を 導 き 出 す 解 析 エンジンにより を 検 出 する. 5 Covert Channelの 検 出 が 読 み 書 きのできない 電 話 番 号 情 報 をS2 が 読 み 書 きすることができた 場 合 S2 がその 情 報 を 読 み が 読 み 書 きのできるコンテンツに コピペしてそこから が 本 来 読 み 書 きのでき ない 電 話 番 号 情 報 を 読 み 書 きすることができる ようになってしまった.といった 経 路 を 表 示 する.
まとめ 本 稿 では 検 索 エンジンを 用 いたCovertChannel の 検 出 方 法 を 提 案 した これにより 従 来 のように 把 握 したコミュニティののみを 用 いたCovertChannel だけでは 検 出 できないアクセス 権 の 矛 盾 が 存 在 する 場 合 でも 検 索 エンジンによって 得 られた 情 報 にオントロジーを 用 いたセマンティックな 解 析 手 法 を 適 用 することで 外 的 要 因 を 考 慮 し た 場 合 の の 矛 盾 や 経 路 を 効 率 よく 見 つけることが 可 能 となり 従 来 のCovert Channel 解 析 法 での 外 的 要 因 を 考 慮 した 場 合 検 出 で きないアクセス 権 の 矛 盾 が 存 在 する, という 問 題 点 を 解 決 することが できるかもしれない.
今 後 の 課 題 Hadoop によるRDF 導 出 効 率 化 RDFで 検 索 された 処 理 結 果 とオントロジーDBから 外 的 要 因 を 考 慮 したを 導 き 出 す 解 析 エンジンの 構 築 の 矛 盾 や 経 路 を 検 出 するのに 最 も 適 したオントロジー の 記 述 法 の 検 討