日本語Wikipediaオントロジーの自動構築と評価(本文)

Size: px
Start display at page:

Download "日本語Wikipediaオントロジーの自動構築と評価(本文)"

Transcription

1 日 本 語 Wikipedia オントロジーの 自 動 構 築 と 評 価 2013 年 度 玉 川 奨

2

3 学 位 論 文 博 士 ( 工 学 ) 日 本 語 Wikipedia オントロジーの 自 動 構 築 と 評 価 2013 年 度 慶 應 義 塾 大 学 大 学 院 理 工 学 研 究 科 玉 川 奨

4

5 要 旨 大 規 模 オントロジーは,データ 統 合 などの 情 報 基 盤 として 期 待 されているが,オントロ ジーの 手 動 構 築 には,コストと 保 守 に 大 きな 課 題 を 抱 えている.その 課 題 を 解 決 するため に,フリーテキストからのオントロジー 自 動 構 築 が 試 みられてきたが, 自 然 言 語 理 解 に 限 界 があり, 実 用 レベルに 到 達 しないことから, 近 年, 半 構 造 情 報 を 有 する 情 報 資 源 からオ ントロジーを 自 動 的 に 構 築 する 方 法 が 注 目 されてきた. 以 上 の 背 景 から, 本 論 文 では,Web 上 のオンライン 百 科 事 典 である 日 本 語 版 Wikipedia の 有 する 半 構 造 情 報 から,インスタン スの 抽 出, 概 念 抽 出, 概 念 間 の 上 位 下 位 関 係,インスタンス 間 の 意 味 的 関 係 (プロパティ), プロパティの 定 義 域 と 値 域,プロパティタイプなど,オントロジーとして 重 要 な 情 報 を 抽 出 する 方 法 を 検 討 し, 大 規 模 汎 用 オントロジー( 日 本 語 Wikipedia オントロジーと 呼 ぶ) を 自 動 構 築 し, 日 本 語 Wikipedia オントロジーの 領 域 オントロジー 構 築 支 援 可 能 性 と Linked Open Data のハブの 観 点 から,その 有 用 性 を 評 価 する. 以 下 に 本 論 文 の 構 成 を 示 す. はじめに, 第 1 章 において, 本 研 究 の 背 景, 問 題, 目 的 について 述 べる. 第 2 章 では, 本 研 究 の 関 連 技 術 として,オントロジーの 定 義 および 具 体 例,オントロジ ー 構 築 方 法 論,Wikipedia,Linked Open Data について 述 べると 共 に,それらの 関 連 研 究 についても 述 べる. 第 3 章 では, 日 本 語 版 Wikipedia から 概 念 および 概 念 間 の 関 係 (is-a 関 係,クラス-イ ンスタンス 関 係,プロパティ 定 義 域,プロパティ 値 域,プロパティ 上 位 下 位 関 係,インス タンス 間 関 係,その 他 の 関 係 )を 抽 出 することで, 日 本 語 Wikipedia オントロジーを 自 動 構 築 する 手 法 の 提 案 と 各 手 法 の 評 価 について 述 べる. 第 4 章 では, 日 本 語 Wikipedia オントロジーの 領 域 オントロジー 構 築 支 援 としての 評 価 について 述 べる.また,Linked Open Data としての 設 計 と 公 開,Linked Open Vocabularies との 連 携 による 日 本 語 語 彙 構 築 手 法 の 提 案 と 評 価, 検 索 支 援 ツール WiLD の 設 計 と 評 価 により,Linked Open Data のハブとしての 評 価 について 述 べる.これらの 評 価 から 日 本 語 Wikipedia オントロジーの 有 用 性 を 示 す. 最 後 に 第 5 章 では, 本 論 文 のまとめと 今 後 の 課 題 および 展 望 について 述 べる.

6 Title: Building up Japanese Wikipedia Ontology with Semistructured Information Abstract: Large-scale ontologies are expected to work as an information infrastructure for information services, such as information retrieval and data integration. Because it takes many costs for human experts to build and maintain ontologies, much attention has been come to the work on automatic ontology construction from free text. However, natural language processing still has much limitation to free text and so the work has not been in practice yet. Thus more attention moves to automatic ontology construction from semi-structured information resources, such as Wikipedia. This dissertation discusses how to extract important information to compose ontologies from Japanese Wikipedia (Japanese Wikipedia Ontology). They include instances, classes, super-sub relationships between classes, properties between instances, property domains and ranges, and property types. Furthermore, Japanese Wikipedia Ontology has been evaluated from the following points: how much to support for human experts to build up domain ontologies and how much it works as Japanese Linked Open Data Cloud Hub. This dissertation has the following structure. Chapter 1 describes backgrounds and goals of this research. Chapter 2 explains what ontologies in information science are, and shows us ontology development process and environment, Wikipedia, and Linked Open Data. Chapter 3 discusses how to extract important information to compose Japanese Wikipedia Ontology methods with extraction metrics, such as precision. Chapter 4 evaluates how much Japanese Wikipedia Ontology support human experts to build up domain ontologies in the field of hydroelectricity and how much Japanese Wikipedia Ontology works as Japanese Linked Open Data Cloud Hub. Chapter 5 wraps up lessons learned from building Japanese Wikipedia Ontology with case studies and shows us what future issues are.

7 1.1 背 景 と 目 的 i 目 次 第 1 章 序 論 背 景 と 目 的 日 本 語 Wikipedia オントロジーの 自 動 構 築 日 本 語 Wikipedia オントロジーの 評 価 論 文 の 構 成... 3 第 2 章 関 連 研 究 概 要 オントロジー オントロジーの 概 要 オントロジーの 構 成 オントロジーの 役 割 オントロジーの 分 類 オントロジー 記 述 言 語 オントロジー 構 築 支 援 ツール 汎 用 オントロジー オントロジーの 応 用 例 Wikipedia Wikipedia の 概 要 Wikipedia の 利 点 Wikipedia のデータ Wikipedia 関 連 研 究 DBpedia YAGO(Yet Another Great Ontology) Wikipedia からの 上 位 下 位 関 係 抽 出 Wikipedia の Infobox を 用 いた 意 味 関 係 抽 出 日 本 語 版 Wikipedia を 用 いた 研 究 関 連 研 究 の 総 括 Linked Open Data Open Government Data の 始 まり Open Data から Linked Open Data へ 日 本 における Linked Open Data の 現 状... 37

8 ii Linked Open Vocabularies まとめ 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 概 要 日 本 語 Wikipedia オントロジーの 概 要 日 本 語 Wikipedia オントロジー 構 築 手 法 is-a 関 係 の 抽 出 クラス-インスタンス 関 係 の 抽 出 プロパティ 名 の 抽 出 プロパティ 定 義 域 の 抽 出 プロパティ 値 域 の 抽 出 プロパティ 上 位 下 位 関 係 の 抽 出 プロパティタイプの 推 定 jwo 語 彙 関 係 の 抽 出 抽 出 した 関 係 の 洗 練 実 験 と 考 察 is-a 関 係 の 抽 出 結 果 と 考 察 クラス-インスタンス 関 係 の 抽 出 結 果 と 考 察 プロパティ 名 の 抽 出 結 果 と 考 察 プロパティ 定 義 域 の 抽 出 結 果 と 考 察 プロパティ 値 域 の 抽 出 結 果 と 考 察 プロパティ 上 位 下 位 関 係 の 抽 出 結 果 と 考 察 プロパティタイプの 抽 出 結 果 と 考 察 抽 出 関 係 の 洗 練 日 本 語 Wikipedia オントロジーの 全 体 像 まとめ 第 4 章 日 本 語 Wikipedia オントロジーの 評 価 概 要 領 域 オントロジー 構 築 支 援 汎 用 オントロジーとの 比 較 水 力 発 電 領 域 人 物 領 域 都 市 領 域 抽 象 的 な 概 念 の 領 域... 91

9 1.1 背 景 と 目 的 iii 4.3 日 本 語 Wikipedia オントロジーLinked Open Data 日 本 語 Wikipedia オントロジーLOD の 設 計 と 公 開 日 本 語 Wikipedia オントロジーからの 日 本 語 語 彙 構 築 Linked Open Vocabularies からのプロパティ 抽 出 日 本 語 Wikipedia オントロジープロパティとの 対 応 付 け 日 本 語 Wikipedia オントロジーLinked Open Data の 評 価 日 本 語 Wikipedia オントロジーからの 日 本 語 語 彙 構 築 結 果 と 考 察 DBpedia との 比 較 評 価 日 本 語 Wikipedia オントロジーLinked Open Data を 利 用 したアプリケーシ ョン まとめ 第 5 章 結 論 参 考 文 献 学 位 論 文 に 関 連 する 論 文 および 口 頭 発 表 謝 辞

10 iv 図 目 次 2.1 クラス-インスタンス 関 係 の 例 is-a 関 係 の 例 オントロジーにおける 公 理 と 関 係 制 約 の 例 セマンティック Web のレイヤーケーキ owl:objectproperty と owl:datatypeproperty の 例 Protégé のクラス 階 層 画 面 DODDLE-OWL の 構 成 WordNet の 概 観 日 本 語 語 彙 大 系 の 意 味 カテゴリと 単 語 (ホテル)の 対 応 関 係 の 例 エンタープライズ 統 合 のワークフロー jspace ブラウザの 検 索 結 果 の 例 AquaLog の RDF トリプルを 用 いた 自 然 言 語 検 索 の 仕 組 み WolframAlpha Faviki Wikipedia のトップページ 記 事 ページの 例 Infobox を 持 つ 記 事 ページ( 左 )と Infobox( 右 )の 例 カテゴリページ( 左 )とカテゴリ 階 層 の 概 念 図 ( 右 )の 例 一 覧 ページ( 左 )とその 概 念 図 ( 右 )の 例 DBpedia の 記 事 の 例 YAGO における 階 層 関 係 の 構 築 の 例 近 年 の Linked Open Data の 広 がり 日 本 版 LOD クラウド Linked Open Vocabularies 名 前 空 間 の 全 体 像 日 本 語 Wikipedia オントロジーの 概 略 図 後 方 文 字 列 照 合 前 方 文 字 列 字 照 合 部 除 去 Infobox テンプレートとカテゴリ 名 の 照 合 目 次 見 出 しのスクレイピングによる is-a 関 係 の 抽 出 一 覧 記 事 ソーステキストの 一 部 一 覧 記 事 の 不 要 な 情 報 の 例 * 行 中 でインスタンス 箇 所 を 特 定 するパターン... 50

11 1.1 背 景 と 目 的 v 3.9 Infobox トリプルからのプロパティ 名 抽 出 の 一 例 記 事 のリスト 構 造 からのプロパティ 名 抽 出 の 一 例 プロパティ 定 義 域 と 記 事 が 属 するカテゴリの 対 応 例 テンプレートで 定 義 されていないプロパティ 定 義 域 の 抽 出 プロパティ 値 域 の 抽 出 の 一 例 プロパティ 上 位 下 位 関 係 の 抽 出 の 一 例 プロパティタイプの 抽 出 の 一 例 福 澤 諭 吉 記 事 のアブストラクト クラス-インスタンス 関 係 の 洗 練 の 一 例 プロパティ 定 義 域 値 域 の 洗 練 の 一 例 出 現 数 n と 上 位 下 位 関 係 数 及 び 正 答 率 包 含 率 x と 対 称 関 係 プロパティ 数 及 び 正 答 率 プロパティ 定 義 域 値 域 の 洗 練 結 果 オントロジーの 階 層 の 深 さとルートの 関 係 GEN の 設 備 オントロジーの 一 部 日 本 語 Wikipedia オントロジーの 水 力 発 電 領 域 に 関 する 概 念 人 物 ( 作 家 クラス) 領 域 の 一 部 土 地 ( 都 市 クラス) 領 域 の 一 部 日 本 語 Wikipedia オントロジーLOD のシステム 概 要 図 日 本 語 Wikipedia オントロジー 統 計 情 報 ( 版 ) SPARQL クエリの 一 例 HTTP ページの 一 例 ( 福 澤 諭 吉 インスタンス) 検 索 実 行 結 果 の 一 例 日 本 語 Wikipedia オントロジーのプロパティと 語 彙 の 対 応 付 けの 一 例 日 本 語 Wikipedia オントロジーと DBpedia のクラス 階 層 比 較 例 WiLD のシステムアーキテクチャ WiLD のユーザインタフェース WiLD の 検 索 インタフェース 画 面 検 索 結 果 画 面 検 索 結 果 画 面 検 索 結 果 画 面 検 索 結 果 画 面 検 索 結 果 画 面 検 索 結 果 画 面 検 索 結 果 画 面

12 vi 4.22 検 索 結 果 画 面 検 索 結 果 画 面 一 般 的 な 比 較 分 析 プロセスと WiLD における 比 較 分 析 プロセスの 一 例 XBRL Linked Open Data のモデル 検 索 結 果 画 面 検 索 結 果 画 面

13 1.1 背 景 と 目 的 vii 表 目 次 2.1 WordNet (version 3.0) の 辞 書 サイズ 年 9 月 時 点 の DBpedia のデータ Linked Data のための 5 つ 星 正 しく 抽 出 した 同 義 語 の 例 誤 って 抽 出 した 同 義 語 の 例 実 験 環 境 後 方 文 字 列 照 合 で 抽 出 した is-a 関 係 の 例 前 方 文 字 列 照 合 部 除 去 で 抽 出 した is-a 関 係 の 例 文 字 列 照 合 で 抽 出 した is-a 関 係 の 誤 りの 例 Infobox テンプレート 名 と 掲 載 記 事 数 Infobox テンプレート 名 とカテゴリ 名 の 照 合 結 果 カテゴリ 名 と Infobox テンプレートの 照 合 により 抽 出 した is-a 関 係 の 評 価 目 次 見 出 しのスクレイピングで 抽 出 した is-a 関 係 の 例 下 位 概 念 数 が 多 いルート 概 念 の 例 目 次 見 出 しから 抽 出 した is-a 関 係 の 誤 りの 例 正 しく 抽 出 したクラス-インスタンスの 例 インスタンスの 誤 りの 例 Infobox から 抽 出 した, 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 記 事 のリスト 構 造 から 抽 出 した, 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 つの 手 法 により 抽 出 したプロパティ 数,トリプル, 主 語 となるインスタンス 数, トリプルの 正 解 率 プロパティ 名 とプロパティ 定 義 域 の 例 クラス-インスタンス 関 係 を 用 いたプロパティ 値 域 抽 出 法 により 抽 出 した 利 用 頻 度 が 高 い 値 域 の 例 is-a 関 係 を 用 いたプロパティ 値 域 抽 出 法 により 抽 出 した 値 域 の 例 プロパティ 上 位 下 位 関 係 の 例 対 称 関 係 プロパティとその 対 称 関 係 数, 全 トリプル 数, 包 含 率 の 一 例 クラス-インスタンス 関 係 の 洗 練 結 果 の 一 例 日 本 語 Wikipedia オントロジーのクラス 数,プロパティ 数,インスタンス 数 日 本 語 Wikipedia オントロジーの 関 係 数 と 正 解 率 日 本 語 Wikipedia オントロジーのプロパティタイプ 別,プロパティ 数, 正 答 率, トリプル 数... 84

14 viii 4.1 オントロジー 比 較 の 例 日 本 語 Wikipedia オントロジーURI 他 の LOD リソースとの 関 連 付 けの 一 例 Linked Open Vocabularies に 存 在 するタイプごとのプロパティ 数 日 本 語 Wikipedia オントロジークラスとクラス 名 の 対 応 付 けの 一 例 プロパティの 日 本 語 語 彙 候 補 の 一 例 日 本 語 Wikipedia オントロジークラスとクラス 名 の 対 応 付 けの 一 例 schema.org 語 彙 の 各 領 域 と 構 築 した 日 本 語 語 彙 の 比 較 例 日 本 語 Wikipedia オントロジーと DBpedia の 比 較 結 果 日 本 語 Wikipedia オントロジーと DBpedia の 同 義 語 比 較 例 日 本 語 Wikipedia オントロジーと DBpedia のプロパティ 比 較 例

15 1 第 1 章 序 論 1.1 背 景 と 目 的 近 年, 次 世 代 Web の 候 補 の 一 つとして,セマンティック Web [1, 2]が 多 くの 企 業 および 研 究 者 から 注 目 を 集 めている.セマンティック Web は,ソフトウェアが 意 味 理 解 可 能 な 辞 書 に 基 づき,Web コンテンツにソフトウェア 可 読 なメタデータを 付 与 することによって, ソフトウェアが Web コンテンツの 意 味 を 理 解 し, 推 論 することを 可 能 にしようという 試 み であり,メタデータを 記 述 した 機 械 可 読 目 録 として W3C (World Wide Web Consortium) 1 により 標 準 化 されているのがオントロジーである. 現 在 米 国 では 政 府 機 関 および 民 間 企 業 において,データ 統 合, 情 報 検 索, 情 報 共 有 などをはじめ 様 々な 分 野 で,オントロジーを 利 用 したソリューションが 提 供 され 始 めている. 特 に, 大 規 模 なオントロジーの 構 築 は 情 報 検 索 やデータ 統 合 において 有 用 であり, 日 本 語 の 大 規 模 オントロジーとしては, 日 本 語 WordNet [3]や 日 本 語 語 彙 大 系 [4]などが 存 在 している.しかし,これらは 手 動 で 構 築 され ており, 構 築 コストが 大 きい.オントロジーの 手 動 構 築 には, 膨 大 な 時 間 がかかり,オン トロジーの 保 守 や 更 新 が 困 難 という 問 題 がある.そこで 近 年,オントロジー 工 学 のコミュ ニティは,オントロジー 開 発 コストを 削 減 するために,オントロジー 学 習 (Ontology Learning)とも 呼 ばれる,( 半 ) 自 動 的 にオントロジーを 構 築 する 手 法, 方 法 論,アルゴリ ズム,ツールなどの 研 究 開 発 に 取 り 組 んできた. 特 に,フリーテキストからのオントロジ ー 学 習 に 関 しては, 機 械 学 習, 知 識 獲 得, 自 然 言 語 処 理, 情 報 検 索 など, 様 々な 専 門 分 野 の 手 法 を 組 み 合 わせた 手 法 がこれまで 数 多 く 提 案 されている[5]. 一 方,ユーザ 参 加 型 の 大 規 模 な 半 構 造 化 情 報 資 源 が 広 がりをみせている. 中 でも 情 報 鮮 度 語 彙 網 羅 性 の 優 れた 百 科 事 典 Wikipedia 2 がその 代 表 例 である.Wikipedia は Wiki ベ ースのオンライン 百 科 事 典 であり, 日 本 語 版 Wikipedia は 2013 年 10 月 現 在,87 万 を 超 える 記 事 が 存 在 する 3.これは EDR 電 子 化 辞 書 [6]が 持 つ 日 本 語 登 録 数 の 3 倍 を 上 回 って いる.Wikipedia のような 知 識 形 態 は 集 合 知 とも 呼 ばれ, 一 般 的 な 概 念 から 最 新 の 技 術 動 向 に 関 する 記 事 まで 幅 広 い 分 野 の 記 事 が 網 羅 されており, 膨 大 なコンテンツ 量 が 存 在 する.Wikipedia のデータは GFDL (GNU Free Documentation License) [7]のライセンス の 下 にフリーで 公 開 され,SQL [8]や XML (Extensible Markup Language) [9]の 形 式 でダ ウンロードすることができる.このような 特 色 を 持 つ Wikipedia は, 半 構 造 情 報 資 源 であ るため,フリーテキストに 比 べ, 構 造 情 報 資 源 であるオントロジーとのギャップが 小 さく, 大 規 模 で 汎 用 的 なオントロジー 構 築 のためのコーパスとして 非 常 に 注 目 されており, 現 在 日 本 語 版 の 統 計

16 2 第 1 章 序 論 Wikipedia からオントロジーを 構 築 する 様 々な 研 究 が 行 われている [10].しかしながら, Wikipedia はユーザ 参 加 型 という 性 質 上, 厳 密 な 体 系 化 が 行 われていないため,Wikipedia からのオントロジー 学 習 にも 多 くの 課 題 が 存 在 している. また, 構 造 情 報 の 利 用 方 法 として,セマンティック Web の 研 究 分 野 では, 各 Web サイ トで 公 開 されている 政 府, 科 学, 写 真, 音 楽 などのデータベースを RDF (Resource Description Framework) [11] 化 して 連 携 する,LOD (Linked Open Data) [12]が 注 目 を 集 めている.LOD では, 各 RDF データベース 間 を 相 互 にリンクするためのハブとして, 英 語 版 Wikipedia から 自 動 構 築 した DBpedia [13]と 呼 ばれるオントロジーおよび RDF デー タが 活 用 されている. 本 論 文 では 日 本 語 版 Wikipedia を 情 報 資 源 として, 大 規 模 で 汎 用 的 なオントロジーを 自 動 構 築 し, 構 築 したオントロジー( 日 本 語 Wikipedia オントロジー)の 有 用 性 を 評 価 する. 第 一 に 日 本 語 版 Wikipedia の 有 する 半 構 造 情 報 から 日 本 語 Wikipedia オントロジーを 自 動 構 築 する 手 法 の 提 案 と 評 価 を 示 す. 第 二 に 日 本 語 Wikipedia オントロジーの 領 域 オントロ ジー 構 築 支 援 可 能 性 と LOD ハブの 観 点 から, 日 本 語 Wikipedia オントロジーの 有 用 性 を 示 す. 1.2 日 本 語 Wikipedia オントロジーの 自 動 構 築 大 規 模 オントロジーは,データ 統 合 などの 情 報 基 盤 として 期 待 されおり, 日 本 語 の 大 規 模 オントロジーとしては, 日 本 語 WordNet [3]や 日 本 語 語 彙 大 系 [4]などが 存 在 している. しかし,これらは 手 動 で 構 築 されており,オントロジーの 手 動 構 築 には, 膨 大 な 時 間 がか かり, 保 守 や 更 新 が 困 難 という 問 題 がある.その 課 題 を 解 決 するために,フリーテキスト からのオントロジー 自 動 構 築 が 試 みられてきたが, 自 然 言 語 理 解 に 限 界 があり, 実 用 レベ ルに 到 達 しないことから, 近 年, 半 構 造 情 報 を 有 する 情 報 資 源 からオントロジーを 自 動 的 に 構 築 する 方 法 が 注 目 されてきた.その 情 報 資 源 として,Web 上 の 百 科 事 典 である Wikipedia は 語 彙 網 羅 性, 即 時 更 新 性 に 優 れており, 半 構 造 情 報 資 源 であることからフリ ーテキストと 比 べてオントロジーとのギャップが 小 さいため,Wikipedia を 利 用 した 研 究 は 多 い.しかしながら,Wikipedia はユーザ 参 加 型 という 性 質 上, 厳 密 な 体 系 化 が 行 われ ていないため,Wikipedia からのオントロジー 構 築 にも 多 くの 課 題 が 存 在 している. 特 に 日 本 語 版 Wikipedia に 適 用 可 能 なオントロジー 構 築 手 法 はほとんど 提 案 されていない. 以 上 より, 本 論 文 では, 日 本 語 版 Wikipedia から 概 念 および 概 念 間 の 関 係 (is-a 関 係, クラス-インスタンス 関 係,プロパティ 定 義 域,プロパティ 値 域,インスタンス 間 関 係, その 他 の 関 係 )を 抽 出 することで, 大 規 模 で 汎 用 的 なオントロジー( 日 本 語 Wikipedia オ ントロジー)を 学 習 する 手 法 の 提 案 と 各 手 法 での 評 価 を 行 う.

17 1.3 日 本 語 Wikipedia オントロジーの 評 価 日 本 語 Wikipedia オントロジーの 評 価 領 域 オントロジーとは, 特 定 の 領 域 ( 法 律 やビジネスなど)に 存 在 する 概 念 とその 間 の 関 係 を 定 義 したものであり,ソフトウェアが RDF コンテンツを 理 解 する 際 に, 辞 書 的 な 役 割 を 果 たす.しかしながら, 領 域 オントロジーの 構 築 と 保 守 には 多 大 なコストがかかる. そのため, 多 くの 研 究 は, 知 識 工 学, 自 然 言 語 処 理,データマイニングなどの 技 術 を 用 い て,テキストや 汎 用 オントロジーなどの 既 存 情 報 資 源 から( 半 ) 自 動 的 に 領 域 オントロジ ーを 構 築 している[14, 15]. 加 えて, 構 造 情 報 の 利 用 方 法 として,セマンティック Web の 研 究 分 野 では, 各 Web サ イトで 公 開 されている 政 府, 科 学, 写 真, 音 楽 などのデータベースを RDF 化 して 連 携 す る,LOD が 注 目 を 集 めている. 各 データベース 間 の 情 報 を 繋 げることで, 情 報 を 容 易 に 引 き 出 してくる 事 が 可 能 であり,これにより 多 くのアプリケーションやサービスでデータを 簡 単 に 参 照 し, 利 用 することができる. 海 外 の LOD では, 各 RDF データベース 間 を 相 互 にリンクするためのハブとして, 英 語 版 Wikipedia から 自 動 構 築 した DBpedia と 呼 ばれ るオントロジーおよび RDF データが 活 用 されている. 一 方,LOD の 語 彙 に 着 目 した LOV (Linked Open Vocabularies) [16]という 取 り 組 みも 存 在 している.LOV は,LOD の 各 データベースで 使 用 されている 関 係 名 となる 語 彙 を 集 めて, 語 彙 の 検 索 を 可 能 にすることで, 新 たな LOD を 構 築 する 際 に 語 彙 の 再 利 用 を 促 す 取 り 組 みである.しかしながら,LOD を 構 築 する 際 に, 新 たに 語 彙 を 作 ってしまう 方 が, 目 的 に 合 致 する 語 彙 を 見 つけてくるよりもはるかに 容 易 であり, 標 準 語 彙 と 呼 ばれる, 既 に 普 及 している 一 部 の 語 彙 を 除 いて, 再 利 用 されているケースは 少 ない. 加 えて, 国 内 で は Linked Open Vocabularies に 相 当 する 取 り 組 みがまだ 存 在 しておらず, 日 本 語 の 標 準 語 彙 というものがないため, 今 後 さらに 国 内 の LOD が 普 及 する 際 に,LOD 構 築 者 にとっ て 障 壁 となりうる. 以 上 により, 本 論 文 では 領 域 オントロジー 構 築 支 援 可 能 性 と LOD ハブの 観 点 から, 日 本 語 Wikipedia オントロジーの 有 用 性 を 評 価 する. 1.4 論 文 の 構 成 以 降, 本 論 文 の 構 成 は 次 のとおりである. 第 2 章 では, 本 研 究 の 関 連 技 術 として,オン トロジーの 定 義 および 具 体 例,オントロジー 構 築 方 法 論,Wikipedia,Linked Open Data について 述 べると 共 に,それらの 関 連 研 究 についても 述 べる. 第 3 章 では, 日 本 語 版 Wikipedia から 概 念 および 概 念 間 の 関 係 (is-a 関 係,クラス-インスタンス 関 係,プロパ ティ 定 義 域,プロパティ 値 域,インスタンス 間 関 係,その 他 の 関 係 )を 抽 出 することで, 大 規 模 で 汎 用 的 なオントロジー( 日 本 語 Wikipedia オントロジー)を 学 習 する 手 法 の 提 案 と 各 手 法 での 評 価 を 述 べる. 第 4 章 では, 日 本 語 Wikipedia オントロジーの 領 域 オントロジ

18 4 第 1 章 序 論 ー 構 築 支 援 としての 評 価 を 述 べる.また,Linked Open Data としての 設 計 と 公 開,Linked Open Vocabularies との 連 携 による 日 本 語 Linked Open Data のための 日 本 語 語 彙 構 築 手 法 の 提 案 と 評 価, 検 索 支 援 ツール WiLD の 設 計 と 評 価 により,Linked Open Data ハブと しての 評 価 を 述 べる.これら 2 点 の 評 価 から 日 本 語 Wikipedia オントロジーの 有 用 性 を 示 す. 最 後 に 第 5 章 では, 本 論 文 のまとめと 今 後 の 課 題 および 展 望 について 述 べる.

19 5 第 2 章 関 連 研 究 2.1 概 要 本 章 では, 本 論 文 に 関 連 する 技 術 および 関 連 研 究 を 述 べる.はじめに,2.2 節 では,オ ントロジーの 定 義 を 述 べ, 代 表 的 な 汎 用 オントロジーとオントロジーの 応 用 例 について 述 べる.2.3 節 では,Wikipedia と Wikipedia を 用 いたオントロジー 構 築 についての 既 存 研 究 を 述 べる.2.4 節 では,Linked Open Data と Linked Open Vocabularies について 述 べ, いくつかの 代 表 的 な 取 り 組 みを 紹 介 する. 2.2 オントロジー セマンティック Web では,Web 上 のリソースにメタデータを 付 与 し, 計 算 機 がそれを 理 解 して 推 論 を 行 うなど,Web そのものを 知 識 ベースとして 扱 えるようにすることが 大 き な 目 標 であり, 各 種 関 連 技 術 の 仕 様 策 定 が 行 われている. 現 在,オントロジーは,メタデ ータを 記 述 した 機 械 可 読 目 録 として W3C により 標 準 化 されており,セマンティック Web の 核 となる 要 素 となっている. 以 下 では,オントロジーの 定 義 と 技 術 的 な 仕 様 を 述 べ, 代 表 的 な 汎 用 オントロジーとオントロジーの 応 用 例 を 述 べる オントロジーの 概 要 オントロジーは, 元 々は 哲 学 の 世 界 における 用 語 であり,その 意 味 は 存 在 に 関 する 体 系 的 な 理 論 ( 存 在 論 ) である. 世 の 中 に 存 在 するすべてのものを 系 統 立 てて 説 明 するとい いうことを 目 指 したものである. 一 方, 人 工 知 能 の 立 場 からのオントロジーとしては, 概 念 化 の 明 示 的 な 仕 様 書 (explicit specification of conceptualization) という 定 義 がなされ ている.ここでいう 概 念 化 とは, 対 象 ( 世 界 )において 興 味 を 持 つ 概 念 と 概 念 間 の 関 係 と を 指 している.オントロジーの 構 成 物 として, 溝 口 理 一 郎 著 の 書 籍 [17]では 以 下 の 構 成 物 があると 定 義 されている. 対 象 世 界 から 基 本 概 念 を 切 り 出 した 結 果 としての 概 念 の 集 合 概 念 の is-a 関 係 is-a 関 係 以 外 で 必 要 となる 概 念 間 の 関 係 抽 出 した 概 念 と 関 係 の 定 義,あるいは 意 味 制 約 の 公 理 化 しかしながら,オントロジーは 決 定 的 な 構 築 論 が 存 在 しないため, 構 築 に 膨 大 なコスト がかかる.

20 6 第 2 章 関 連 研 究 図 2.1 クラス-インスタンス 関 係 の 例 オントロジーの 構 成 クラス( 概 念 ) オントロジーにおいては,インスタンス( 実 体 )の 集 合 にふるラベルを 概 念 という. 従 って, 概 念 化 とは,その 集 合 にラベルをつけることを 意 味 する.オブジェクト 指 向 にお けるクラスに 近 い 要 素 であるが,オントロジーの 概 念 は 状 態 や 振 る 舞 いをひとまず 考 慮 し ない. 例 えば, 研 究 室 に 在 籍 する 各 メンバーをインスタンスとした 場 合,このメンバー 全 体 に 生 徒 というラベルをつけることができる.もちろん,ラベルは 他 のもの( 大 学 生, 人 間 など)をいくらでもつけることができ,これら 全 てをオントロジーにおける 概 念 と 考 えることができる. is-a 関 係 is-a 関 係 (もしくは Kind-of 関 係 )とは, 日 本 語 で 言 えば, 汎 化 - 特 化 関 係 といえる. 言 葉 のとおり, A is a B といえる 関 係 を 指 す.このとき,B の 方 がより 抽 象 的 な 概 念 と なり, 両 者 の 上 位 関 係 として,B が 上 位 概 念 となり,A が 下 位 概 念 となる.より 抽 象 的 な 概 念 が 上 位 に 位 置 し,より 具 体 的 な 概 念 が 下 位 概 念 に 位 置 することになる.ただし, 概 念 と 実 体 のインスタンス 関 係 も A is a B と 言 えてしまうため, A is a B となる 関 係 が 全 て is-a 関 係 とは 言 えない.オブジェクト 指 向 における 継 承 関 係 とほぼ 同 様 の 意 味 づけを できるが, 何 を 継 承 するのかは 場 合 による. 図 2.2 に,is-a 関 係 の 具 体 例 を 示 す. 図 2.2 is-a 関 係 の 例

21 2.2 オントロジー 7 例 えば, 人 間 is a 哺 乳 類 であり, 人 間 と 哺 乳 類 の 間 には is-a 関 係 が 成 り 立 ち, 哺 乳 類 が 上 位 概 念, 人 間 が 下 位 概 念 である. 概 念 を 集 合 に 付 けられたラベルと 考 えると, 哺 乳 類 というラベルを 振 られたインスタンスの 集 合 は, 人 間 というラベルを 振 られたインス タンス 集 合 より 大 きい.つまり 哺 乳 類 人 間 といえる.カバーしているインスタンスの 集 合 が 大 きい 方 を, 小 さい 方 から 見 た 場 合, 一 般 化 といい,ラベル 内 のインスタンスの 中 か ら, 特 定 のサブセットを 取 り 出 すことが, 特 殊 化 である. その 他 の 関 係 その 他 の 関 係 として 定 義 できるものは 無 数 にある. 例 えば 現 実 世 界 における 人 間 の 親 子 関 係 や 順 番 の 前 後 関 係 等 をオントロジーで 表 現 でき, 必 要 であれば,どんな 関 係 を 定 義 し ても 良 い. 意 味 制 約 の 公 理 化 オントロジーでは,インスタンスの 集 合 の 組 み 合 わせにおける 和 集 合 や 積 集 合 を 概 念 と して 定 義 することができる.このような 論 理 的 組 み 合 わせによる 概 念 定 義 の 他 に, 関 係 を 利 用 して, 意 味 制 約 から 概 念 を 定 義 することもできる. 例 えば, 本 名 という 関 係 を 1 つ 持 ち, 少 なくとも 1 つの 親 という 関 係 を 持 っている 概 念 を 人 間 として 定 義 できる. 論 理 的 組 み 合 わせや 意 味 制 約 から 公 理 を 形 成 し, 概 念 を 定 義 でき,これをクラス 公 理 という. 図 2.3 に 公 理 と 関 係 制 約 の 概 念 図 を 示 す. 図 2.3 の 左 では, 倫 理 的 組 み 合 わせにより, 哺 乳 類 と いう 概 念 かつ 草 食 動 物 という 概 念 の 積 集 合 を 草 食 哺 乳 類 という 概 念 として 定 義 していおり, 右 では 哺 乳 類 という 概 念 に 含 まれるインスタンスのうち, 植 物 という 概 念 に 含 まれるイン スタンスを 食 料 としているインスタンスを 草 食 哺 乳 類 という 概 念 として 定 義 している オントロジーの 役 割 オントロジーの 使 用 場 面 とその 効 用 として, 溝 口 理 一 郎 著 の 書 籍 から 合 意 を 得 る 手 段, 暗 黙 情 報 と 明 示 化, 再 利 用 と 共 有, 知 識 の 体 系 化, 標 準 化, メタモデ ル 的 機 能, 統 合 的 効 用 の 7 つについて 述 べる. 図 2.3 オントロジーにおける 公 理 と 関 係 制 約 の 例

22 8 第 2 章 関 連 研 究 合 意 に 達 する 手 段 他 人 と 知 識 に 関 する 合 意 のような, 細 部 にわたる 合 意 に 達 することは, 容 易 ではない. オントロジーとは 知 識 そのものとは 異 なり, 知 識 を 体 系 化 したものであり, 対 象 世 界 の 骨 格 を 明 示 化 し, 対 象 世 界 をよりシンプルにとらえたものといえる.それゆえ,オントロジ ーを 媒 介 とすることで, 複 雑 な 事 象 をシンプルに 捉 えることができ, 合 意 形 成 において 有 効 となる. 暗 黙 情 報 を 明 示 化 対 象 世 界 の 概 念 化 とは, 通 常 無 意 識 のうちに 仮 定 し, 前 提 としている 概 念 を 明 示 化 する ことである. 知 識 ベースはもちろん, 一 般 にソフトウェアは 何 らかの 概 念 化 に 基 づいてい るが,その 概 念 化 に 関 する 情 報 は 多 くの 場 合 暗 黙 的 である.オントロジーはまさにこのよ うな 暗 黙 知 識 を 記 述 しようとするものであり,その 暗 黙 情 報 を 明 示 化 する 役 割 を 持 ってい る. 再 利 用 と 共 有 知 識 の 共 有 と 再 利 用 は, 知 識 の 前 提 となる 概 念 が 暗 黙 的 であるため, 困 難 である. 特 に, 専 門 家 の 経 験 則 などは 多 様 な 概 念 の 集 合 であり, 主 観 的 要 素 が 強 いものも 多 く, 共 有 と 再 利 用 は 難 しい.オントロジー 構 築 の 際 に, 知 識 を 構 成 する 基 本 概 念 に 立 ち 戻 って, 対 象 世 界 を 客 観 的 な 存 在 として 考 察 することによって,そのような 知 識 を 構 成 する 基 本 概 念 を 同 定 するため, 物 事 や 対 象 の 成 り 立 ちを 基 本 から 検 討 し, 共 有 再 利 用 可 能 な 知 識 を 見 出 す 糸 口 を 与 えることができる. 知 識 の 体 系 化 人 間 は, 情 報 の 整 理 や 前 述 したような 再 利 用 や 共 有 のために 知 識 を 体 系 化 するが,それ は 人 間 が 理 解 するための 体 系 化 であり,コンピュータには 理 解 できない.コンピュータ 上 で 知 識 の 体 系 化 ができるとすれば 非 常 に 有 用 性 が 高 いことは 間 違 いない. 知 識 の 体 系 化 に とって, 最 も 重 要 なことは, 関 係 する 対 象 世 界 を 構 成 している 概 念 を 明 確 化 することと 知 識 を 記 述 するための 共 通 語 彙 を 定 めることである.オントロジーはその 両 方 を 与 えること ができ,さらにコンピュータで 処 理 可 能 である. 標 準 化 オントロジーは, 少 なくともあるコミュニティで 共 有 させることを 目 指 して 開 発 される. このことが 示 唆 するように,オントロジーに 含 まれる 概 念 や 語 彙 は 共 有 性 が 高 く, 知 識 の 標 準 化 へとつながる. メタモデル 的 効 力 オントロジーとは, 人 工 システムを 構 築 する 際 にビルディングブロックとして 用 いられ る 基 本 概 念 と 語 彙 の 体 系 とも 定 義 することができる.オントロジーの 概 念 から,その 概 念 に 含 まれるインスタンスを 生 成 し,ある 事 象 のモデルを 構 築 するというオントロジー 利 用

23 2.2 オントロジー 9 プロセスを 考 えると,オントロジーはモデル 構 築 に 必 要 な 基 本 概 念 とガイドラインを 提 供 する 効 力 があるといえる. 統 合 的 効 用 以 上, 述 べてきたオントロジーの 効 用 を 眺 めてみると,オントロジーがいかに 有 用 であ るかが 見 てとれる.オントロジーにより, 通 常 暗 黙 となっている 基 本 的 な 概 念 が 明 示 化 さ れ,それを 共 有 することにより 知 識 の 根 元 となる 概 念 も 明 示 化 することができ, 複 数 の 人 々 の 間 の 合 意 形 成, 知 識 の 標 準 化, 事 象 のモデル 構 築 に 役 立 つ. 構 築 されたモデルは, 透 明 度 の 高 い, 共 有 することができる 規 範 的 なモデルとなる.オントロジーは,これらのこと を 実 現 する 可 能 性 を 持 っていて, 知 識 マネジメントに 貢 献 することができる オントロジーの 分 類 オントロジーは 概 念 化 の 構 造 形 式 と 概 念 化 の 対 象 という 2 つの 特 徴 により 分 類 すること ができる. 以 下 順 に, 溝 口 理 一 郎 著 の 書 籍 より 本 論 文 の 内 容 に 沿 うように 一 部 改 編 して 引 用 する. 概 念 化 の 構 造 形 式 による 分 類 Terminological Ontology( 用 語 オントロジー) 辞 書 のように,あるドメインの 知 識 を 表 現 するために 使 われる 用 語 を 体 系 化 した ものである. 医 療 分 野 におけるこの 種 類 のオントロジーの 例 としては,UMLS (Unified Medical Language System:1993)の 意 味 ネットワークが 挙 げられる. Information Ontology( 情 報 オントロジー) データベースの 記 憶 構 造 を 体 系 化 したもので, 例 として,データベースの 概 念 ス キーマが 挙 げられる.また, 患 者 の 医 療 記 録 をモデル 化 するためのフレームワーク ( 枠 組 )である PEN&PAD model の Level1 は, 医 療 分 野 における 情 報 オントロジ ーの 典 型 的 な 例 である.Level1 において,そのモデルは 患 者 の 基 本 的 な 観 察 につい て 記 録 するためのフレームワークを 提 供 する. Knowledge Modeling Ontology( 知 識 モデルオントロジー) 知 識 を 体 系 化 したものであり, 情 報 オントロジーと 比 較 すると,このオントロジ ーは 大 抵,より 豊 かな 内 部 構 造 を 持 っている.さらにこのオントロジーはしばしば, 記 述 すべき 知 識 が 特 殊 な 場 合 に 使 われる. 知 識 ベースシステム 開 発 の 分 野 に 限 定 す ると, 知 識 モデルオントロジーは, 多 くの 研 究 者 から 注 目 を 集 めている.PEN&PAD model の Level2 の 記 述 が, 医 療 分 野 におけるこのオントロジーの 例 である.Level2 において,Level1 での 観 察 結 果 は, 意 思 決 定 プロセスの 記 述 のために 系 統 的 分 類 が なされる.

24 10 第 2 章 関 連 研 究 概 念 化 の 対 象 による 分 類 Application Ontology(アプリケーションオントロジー) アプリケーションオントロジーは, 特 定 のアプリケーションで 要 求 される 知 識 を モデル 化 するために, 必 要 となる 全 ての 定 義 を 含 む. 一 般 的 に,アプリケーション オントロジーはドメインオントロジーと 汎 用 オントロジーを 総 合 したものとなる. さらに,アプリケーションオントロジーはタスク 固 有 の 拡 張 を 含 む 場 合 がある.ま た,アプリケーションオントロジーはそれ 自 体 再 利 用 可 能 ではない. 再 利 用 可 能 な 部 分 は, 特 定 のアプリケーションの 為 に 微 調 整 されたオントロジーライブラリーか ら,いくつかの theory を 選 択 することによって 得 られる 場 合 がある. Domain Ontology( 領 域 オントロジー) 日 本 語 では 領 域 オントロジーと 訳 されており, 特 定 の 専 門 領 域 についての 知 識 を 明 確 に 定 義 したものである. 現 在 の 知 識 工 学 の 方 法 論 では,ドメインオントロジー とドメイン 知 識 の 間 に 明 確 な 区 別 をする.ドメイン 知 識 は,あるドメインにおける 実 際 の 状 況 を 記 述 する( 例, 胸 の 痛 みはアテローム 性 動 脈 硬 化 症 の 兆 候 である)の に 対 して,ドメインオントロジーは,ドメイン 知 識 の 構 造 と 内 容 に 制 限 を 与 える( 例, 病 気 には 兆 候 がある). Generic Ontology( 汎 用 オントロジー) ドメインオントロジーと 類 似 しているが, 汎 用 オントロジーで 定 義 される 概 念 は, 多 くの 分 野 にわたっており, 一 般 的 と 考 えられている. 一 般 的 に, 汎 用 オントロジ ーは 状 態, 出 来 事, 仮 定, 行 動, 部 分 などの 概 念 を 定 義 する.ドメインオントロジ ーの 中 の 概 念 は,しばしば 汎 用 オントロジー 中 の 概 念 を 特 殊 化 したものとして 定 義 される.もちろん, 汎 用 オントロジーは 全 ての 分 野 の 概 念 化 を 網 羅 的 に 列 挙 したわ けではないため, 汎 用 オントロジーとドメインオントロジーの 間 の 境 界 は 曖 昧 であ る.しかしながら,その 区 別 は 直 感 的 に 意 味 のあるものであり,ライブラリ 構 築 の 際 に 役 立 つ.また,このオントロジーが 最 初 に 研 究 されたオントロジーである.そ の 後,ドメインオントロジーやアプリケーションオントロジーといったものが 研 究 されていった. Representation Ontology( 表 現 オントロジー) 対 象 世 界 に 立 ち 入 らずにフレームワークのみを 提 供 するオントロジーであり,こ のオントロジーはドメイン 固 有 性 を 持 たない. 言 葉 のシンタックスを 定 義 するよう なものである.ドメインオントロジーと 汎 用 オントロジーは, 表 現 オントロジーに よって 提 供 されるプリミティブを 使 って 記 述 される.この 種 類 のオントロジーの 例 として,ontolingua [18]で 使 われるフレームオントロジーがあげられる. 表 現 オン トロジーは,オントロジーのためのオントロジーであり,そういう 意 味 からメタオ

25 2.2 オントロジー 11 ントロジーとも 呼 ばれる オントロジー 記 述 言 語 オントロジー 工 学 の 考 え 方 が 定 まっていくと 同 時 に,オントロジーを 記 述 するための 言 語 が 登 場 した.ここでは,W3C によって 策 定 された OWL (Web Ontology Language) [19] 及 びそのバージョンアップ 版 である OWL2 [20]について 解 説 する.OWL は, 前 身 である DAML と OIL という 二 つのオントロジー 記 述 言 語 を 統 合 し, 改 訂 することによって 完 成 した.この OWL は DAML+OIL [21]と 同 様 に,XML によるリソース 記 述 用 のフレームワ ークである RDF の 拡 張 として 提 供 されている. 図 2.4 にセマンティック Web の 技 術 的 階 層 図 (レイヤーケーキ) 4 を 示 す.OWL は,セマンティック Web の 技 術 階 層 に 組 み 込 ま れており,セマンティック Web の 核 として 期 待 されている. 以 下 では,OWL と OWL を 支 える 技 術 である URI/IRI,XML,RDF,RDFS について 説 明 する. 図 2.4 セマンティック Web のレイヤーケーキ ( 出 所 ) 4 出 典 : W3C Semantic Web Activity,

26 12 第 2 章 関 連 研 究 URI/IRI (Uniform Resource Identifier / Internationalized Resource Identifier) URI [22]は Web 上 のリソース(あらゆるもの)を 一 定 の 書 式 の 下 で 識 別 するために 定 め られた 識 別 子 である. 具 体 例 としては,Web サイトにおける 始 まる URL (Uniform Resource Locator)が URI の 一 種 と 言 える.URI は URL のような 識 別 子 と 考 え てよいが,URI としては,リソースが 実 際 に Web 上 にあるかどうかは 問 われない.つま り,HTML 文 書 や 画 像 のような Web 上 に 置 いておけるリソースでない 人 や 物 に 対 しても 一 意 の 名 前 を 付 け,Web 上 で 識 別 することができる. IRI [23]に 関 しては 多 国 語 を 使 える URI である.Unicode の 文 字 レパートリを 使 えるよ うにした URI であり, 例 えば 以 前 ではエスケープ 文 字 で 表 現 されていた 日 本 語 での URI が 日 本 語 そのままで 識 別 可 能 となる. XML (Extensible Markup Language) XML [9]は 文 字 列 である 文 書 にデータの 意 味 や 構 造 を 表 現 できるようにするためのマー クアップ 言 語 兼 マークアップ 言 語 のメタ 言 語 である.マークアップ 言 語 はタグと 呼 ばれる 特 殊 文 字 を 用 いて, 文 章 に 構 造 を 埋 め 込 むことができる 言 語 で, 例 えば HTML もマーク アップ 言 語 に 相 当 する.XML を 単 純 に 言 語 として,そのまま 意 味 や 構 造 を 付 け 加 えるた めに 使 用 することができるが, 本 来 XML はメタ 言 語 のため, 意 味 や 構 造 の 種 類 や 決 まり を 記 述 することもできる. RDF (Resource Description Framework) RDF [11]は Web 上 にリソースを 表 現 するためのフレームワークである.RDF では 主 語 (subject)- 述 語 (predicate)- 目 的 語 (object) の 三 つ 組 み(トリプル)により,リソース とリソースの 関 係 情 報 を 表 現 する.トリプルは XML の 表 記 に 従 い,タグで 入 れ 子 にする ことで 表 現 される.また,リソースは 上 述 の URI によって 識 別 されるものと,URI を 持 たない 空 白 ノードがあり, 述 語 部 分 は URI により 表 現 されている. 結 果 として,トリプル は リソース-URI-リソース とあらわすことができる.このトリプルを 複 数 定 義 する ことで,ネットワーク 構 造 のリソース 集 合 とその 関 係 を 記 述 することができる. RDFS (RDF Vocabulary Description Language: RDF Schema) RDFS [24]は RDF に 基 づき,トリプルにおけるリソースのカテゴリや 述 語 の 定 義 をす るための 語 彙 を 提 供 する.オブジェクト 指 向 において,インスタンスを 生 成 するためのク ラスを 定 義 することと 同 等 な 意 味 を 持 つ.RDFS では,リソース 集 合 の 外 延 であるクラス (rdfs:class)と, 述 語 の 定 義 であるプロパティ(rdfs:Property)が 提 供 される.また,RDFS ではこのクラスもしくはプロパティ 同 士 で 継 承 関 係 を 定 義 できる.RDFS ではこの 継 承 関 係 と,プロパティにおける 値 域 定 義 域,またラベルやコメントのみしか 提 供 していないが, クラスや 継 承 関 係 を 定 義 できるため,RDFS はライトウェイトなオントロジー 記 述 言 語 と 言 える.

27 2.2 オントロジー 13 OWL (Web Ontology Language) OWL [19]は RDF 形 式 の 記 述 方 法 によってオントロジーを 記 述 するために 策 定 されたオ ントロジー 記 述 言 語 である.OWL では RDF トリプルの 集 合 としてオントロジーが 記 述 さ れ,OWL で 記 述 されたオントロジーには 以 下 の 4 つの 構 成 要 素 を 含 む. (1) オントロジー ヘッダ (2) クラスを 定 義 するクラス 公 理 (3) プロパティを 定 義 するプロパティ 公 理 (4) 個 体 (Individual):クラスのインスタンスによる 事 実 の 記 述 RDFS では 基 本 的 なクラスとプロパティ,また 継 承 を 定 義 していたが,オントロジーの 構 成 物 を 全 て 記 述 するには 表 現 形 式 が 不 十 分 である.OWL ではクラスの 論 理 的 組 み 合 わ せによる 新 たなクラスの 定 義 や,プロパティによる 制 約 されたクラスの 定 義,また,プロ パティの 特 性 を 定 義 できる.また,オブジェクト 指 向 におけるクラス-インスタンス 関 係 のように,あるクラスにおけるインスタンスである 実 体 (Individual)が 定 義 できる.このよ うな OWL の 特 徴 は OWL によって 記 述 したオントロジーを 機 械 的 に 処 理 によって 推 論 な どを 行 うことを 目 的 に 作 られている. また,OWL は 記 述 論 理 の 厳 密 性 の 違 いにより,DL,Full,Lite の 三 つのサブセットが 用 意 されている. 以 下 に 述 べるこれらサブセットは,オントロジーを 利 用 する 状 況 によっ て 使 い 分 けることが 望 まれる. OWL Full OWL サブセットの 中 では 最 大 の 表 現 力 を 持 ち,OWL で 提 供 される 全 ての 語 彙 を 用 いて 制 約 無 くオントロジーの 記 述 ができる. 複 雑 なクラス 定 義 が 可 能 であるが, 推 論 における 計 算 の 完 全 性, 決 定 可 能 性 は 保 証 されない. 複 雑 なオントロジーを 機 械 可 読 な 形 式 で 記 述 したいと 言 う 場 合 に OWL Full の 使 用 が 望 まれる. OWL DL 記 述 論 理 に 対 応 して 作 られた,OWL サブセットであり,DL は Description Logic の 略 である. 語 彙 としては OWL Full と 同 じものを 使 用 できるが, 記 述 論 理 に 基 づ いた 決 定 可 能 性 を 保 証 するために, 記 述 するための 制 約 がある. 機 械 的 な 推 論 を 目 的 としたオントロジーでは OWL DL の 使 用 が 望 まれる. OWL Lite Full や DL で 用 意 された 語 彙 の 一 部 が 使 用 できない,OWL Lite であるが,その 分 簡 単 に, 単 純 な 制 約 のみのオントロジーを 記 述 することができる. 形 式 が 複 雑 で ないため,オントロジーを 利 用 したソフトウェアなどが 実 装 しやすい. 以 下 に 4 つの 構 成 要 素 の 簡 単 な 説 明 を 示 す.

28 14 第 2 章 関 連 研 究 (1) オントロジー ヘッダ ヘッダは owl:ontology 要 素 として 記 述 し,バージョン 情 報 と 他 のオントロジーのイン ポートを 示 す.さらに,OWL 以 外 の RDF 要 素 を 埋 め 込 む 事 ができる. (2) クラス 公 理 概 念 であるクラスは owl:class 要 素 によって 表 現 し, 次 の 要 素 でクラス 公 理 を 構 成 する. rdfs:subclassof 参 照 クラスのサブクラスとして,クラス 間 の 必 要 条 件 ( 部 分 公 理 )を 記 述 する. オントロジーにおける is-a 関 係 にあたる. owl:disjointwith 参 照 クラスとは 分 離 している( 共 通 インスタンスがない)というクラス 間 の 必 要 条 件 を 記 述 する. owl:equivalentclass 参 照 クラスと 同 じインスタンスを 持 つクラスというクラス 間 の 必 要 十 分 条 件 ( 完 全 公 理 )を 記 述 する. owl:oneof インスタンスとなる 個 体 を 全 て 列 挙 することで 必 要 十 分 条 件 ( 完 全 公 理 )を 記 述 する. クラス 式 の 組 み 合 わせ 匿 名 クラス(owl:Restriction)をつくり,クラス 名,クラスの 列 挙,プロパティ の 制 約 条 件,もしくはこれらの 論 理 的 組 み 合 わせによって owl:class に 結 びつけて 公 理 を 記 述 する. (3) プロパティ 公 理 プロパティは,オントロジーでの is-a 関 係 以 外 の 関 係 を 定 義 する 部 分 になる.クラス 公 理 でのプロパティの 制 約 は,あるプロパティがそのクラスと 共 に 用 いられる 際 のローカル な 制 約 を 定 義 するが,プロパティ 要 素 はそのプロパティそのものをグローバルに 定 義 する. プロパティには, 個 体 (オブジェクト)を 別 の 個 体 (オブジェクト)と 関 連 づける 個 体 値 型 プロパティと,オブジェクトをデータ 型 値 に 結 びつけるデータ 値 型 プロパティがあり, 両 者 はそれぞれ owl:objectproperty 要 素,owl:DatatypeProperty 要 素 で 定 義 する.また, 特 別 なプロパティとしてオントロジーの 管 理 情 報 を 記 述 する owl:ontologyproperty,オン トロジーの 注 釈 に 用 いる owl:annotationproperty がある.OWL でのプロパティは, 必 ず この 4 つのどれかのタイプを 持 たなければならない.

29 2.2 オントロジー 15 図 2.5 owl:objectproperty と owl:datatypeproperty の 例 図 2.5 に owl:objectproperty と owl:datatypeproperty の 一 例 を 示 す. 図 2.5 では, 人 間 クラスのインスタンスである 人 物 A は 親 族 プロパティにより,インスタンスである 人 物 B と 関 連 付 けられており,さらに, 年 齢 プロパティによりデータ 型 である 24 と 結 びつい ている. 個 体 値 型 プロパティ,データ 値 型 プロパティの 基 本 的 な 公 理 は 次 の 構 成 要 素 で 記 述 する. rdfs:subpropertyof 参 照 プロパティのサブプロパティ rdfs:range プロパティの 値 域 である.プロパティの 目 的 語 は, 参 照 クラスのインスタンスで ある. rdfs:domain プロパティの 定 義 域 である.プロパティの 主 語 は, 参 照 クラスのインスタンスで ある. owl:equivalentproperty 参 照 プロパティと 同 じインスタンス( 主 語, 目 的 語 リソースの 組 み 合 わせ)を 持 つ. owl:inverseof 参 照 プロパティと 反 対 の 関 係 を 表 現 する. 図 2.5 を 例 にすると, 親 族 プロパティの 主 語 であるインスタンス 人 物 A は 人 間 クラスに 属 している.そのため,rdfs:domain は 人 間 クラスとなる. 同 様 に 目 的 語 で あるインスタンス 人 物 B も 人 間 クラスのため,rdfs:range も 人 間 クラスとな る. 親 族 プロパティのサブプロパティとしては, 家 族, 兄 弟, 親 などが 考 えら

30 16 第 2 章 関 連 研 究 れる. OWL では,プロパティの 論 理 的 な 性 質 (タイプ)を 示 すことで,その 関 係 を 利 用 した 推 論 などを 可 能 にする. 以 下 の 4 つのタイプが 存 在 する. owl:transitiveproperty 推 移 関 係 プロパティ. 子 孫 プロパティのように,P(x,y)と P(y,z)が 真 なら P(x,z) も 真 であるという 関 係 が 推 移 していくプロパティ owl:symmetricproperty 対 称 関 係 であるプロパティ. 夫 婦 プロパティのように,P(x,y) P(y,x)が 成 り 立 つプロパティ owl:functionalproperty 関 数 関 係 プロパティ. 本 名 のように, 値 が 唯 一 に 定 まるプロパティ owl:inversefunctionalproperty 逆 関 数 関 係 プロパティ. ISBN のように,その 値 から 主 語 が 特 定 できるよう なプロパティ (4) 個 体 による 事 実 の 記 述 クラスやプロパティの 公 理 は, 用 語 集 や 推 論 などを 行 うためのルール 集 のような 役 割 を 果 たし,これを 用 いて, 実 際 に 存 在 するものを 具 体 的 に 描 くのがインスタンスとなり,OWL では,インスタンスは 必 ず 何 かのクラスに 属 する オントロジー 構 築 支 援 ツール 前 項 で 紹 介 した OWL 等 のオントロジー 記 述 言 語 は 人 間 が 記 述 でき, 機 械 が 読 める 特 徴 がある.しかし,いくらマークアップ 言 語 として 見 通 しが 良 く 構 造 化 されていても,URI とタグの 羅 列 となってしまう 平 文 をそのまま 人 間 が 読 み 解 いたり 記 述 したりすることは 難 しい. 特 にオントロジーが 大 規 模 になってくるほど,この 問 題 は 顕 著 になり,オントロジ ーを 簡 単 に 構 築 するツールの 必 要 性 が 高 まる. 現 在 までに 多 数 のオントロジー 構 築 ツール が 開 発 されたが,ここでは,OWL オントロジー 構 築 ツールにおいて 幅 広 く 利 用 されてい る Protégé [25]と, 半 自 動 オントロジー 構 築 ツール DODDLE-OWL [26]を 紹 介 する. Protégé Protégé [25]はスタンフォード 大 学 で 開 発 された Java ベースのオントロジー 構 築 ツー ルである.OWL におけるクラスの 階 層 定 義 と,プロパティの 階 層 定 義, 及 び 実 体 (Individual)の 定 義 をグラフィカルに 記 述 していくことができる.Protégé は OWL 専 用 の オントロジー 構 築 ツールではないが, 特 に OWL に 適 合 して 改 良 されてきており,OWL DL

31 2.2 オントロジー 17 におけるクラス 公 理 やプロパティ 制 約 を 分 かりやすく 記 述 することができる.また, Protégé はプラグインに 対 応 しており, 現 在 までにグラフィカルツールなど, 様 々なプラ グインが 開 発 されている. DODDLE-OWL DODDLE-OWL [26]は Protégé とは 趣 向 が 違 い,オントロジーを 半 自 動 で 構 築 すること を 目 的 としている. 入 力 は, 対 象 ドメインの 専 門 文 書 等 で, 自 然 言 語 文 を 入 力 とすること ができ,ユーザとの 対 話 的 半 自 動 構 築 によって, 最 終 的 に OWL 形 式 のドメインオントロ ジーを 出 力 することができる.DODDLE-OWL は 図 2.7 のように 6 つのモジュールから 成 り 立 っている. 入 力 モジュールでは, 専 門 文 書 から 形 態 素 解 析 などの 自 然 言 語 処 理 を 駆 使 して 用 語 を 抽 出 する.こうして 抽 出 された 用 語 はオントロジー 構 築 モジュールにおいて,WordNet 等 の 汎 用 オントロジーと 照 らし 合 わせることで 概 念 階 層 が 構 築 される. 一 方 で, 専 門 文 書 から 相 関 ルールなどを 用 いて 概 念 間 の 関 係 を 抽 出 し, 概 念 対 集 合 とする. 概 念 階 層 と 概 念 対 集 合 は,オントロジー 洗 練 モジュールにおいて, 視 覚 化 モジュールを 通 してユーザに 提 示 さ れ,ここで, 階 層 の 修 正 を 行 うことで,オントロジーを 完 成 させる. 完 成 したオントロジ ーは 変 換 モジュールによって,OWL 形 式 のオントロジーに 変 換 され 出 力 される. 図 2.6 Protégé のクラス 階 層 画 面

32 18 第 2 章 関 連 研 究 オントロジー 選 択 モジュール 既 存 OWL オントロジー Wikipedia オントロジー 汎 用 オントロジー WordNet EDR 電 子 化 辞 書 参 照 オントロジー 入 力 モジュール 入 力 文 書 選 択 入 力 単 語 選 択 入 力 概 念 選 択 オントロジー 構 築 モジュール 階 層 構 築 関 係 構 築 照 合 と 剪 定 相 関 ルール WordSpace Wikipedia 初 期 モデル 概 念 対 集 合 専 門 文 書 階 層 洗 練 照 合 結 果 分 析 剪 定 結 果 分 析 多 重 継 承 の 除 去 オントロジー 洗 練 モジュール ユーザ 関 係 洗 練 評 価 値 算 出 視 覚 化 モジュール 概 念 階 層 変 換 モジュール 概 念 仕 様 テンプレート 領 域 オントロジー(OWL 形 式 ) 図 2.7 DODDLE-OWL の 構 成 ( 出 所 )DODDLE プロジェクト 5 基 本 設 計, DODDLE-OWL のシステムフロー 汎 用 オントロジー 自 然 言 語 理 解 の 研 究 分 野 では, 電 子 化 辞 書 (MRD: a Machine Readable Dictionary)の 開 発 が 精 力 的 に 行 われており,オントロジーというと 電 子 化 辞 書 を 指 す 場 合 が 多 い.よく 知 られている 電 子 化 辞 書 としては,WordNet(プリンストン 大 学 ),EDR 電 子 化 辞 書 ( 情 報 通 信 研 究 機 構 ), 日 本 語 語 彙 大 系 (NTT コミュニケーション 科 学 基 礎 研 究 所 )などがあ る. 電 子 化 辞 書 の 特 徴 として, 定 義 される 概 念 が 一 般 的 かつ 多 くの 分 野 にわたっている 点 があげられる.そのため, 電 子 化 辞 書 は 汎 用 オントロジーとしてとらえることができる. 以 下 では, 概 念 階 層 構 造 が 整 っていることから 広 く 使 われている WordNet, 階 層 構 造 とし ての is-a 関 係 だけでなく 他 の 概 念 関 係 子 もサポートしている EDR 電 子 化 辞 書, 日 本 語 に 特 化 することで 最 大 規 模 の 概 念 を 有 する 日 本 語 語 彙 大 系 について 概 略 を 述 べる. 5

33 2.2 オントロジー 19 図 2.8 WordNet の 概 観 表 2.1 WordNet (version 3.0) の 辞 書 サイズ 辞 書 名 見 出 し( 語 彙 ) 数 意 味 ( 概 念 ) 数 名 詞 句 辞 書 117,798 82,115 動 詞 句 辞 書 11,529 13,767 形 容 詞 句 辞 書 21,479 18,156 副 詞 句 辞 書 4,481 3,621 合 計 155, ,659 WordNet WordNet [3] (version 3.0) は, 図 2.8 に 示 すように, 名 詞 句 辞 書, 動 詞 句 辞 書, 形 容 詞 句 辞 書, 副 詞 句 辞 書 から 構 成 されており, 総 計 約 15 万 の 語 彙 を 保 持 している. 各 々の 辞 書 に 記 録 されている 見 出 し 数 および 概 念 数 を 表 2.1 に 示 す. 同 じ 概 念 を 意 味 するいくつかの 単 語 見 出 しが, 同 じ 概 念 ID によって 一 つの 概 念 にまと められており,この 集 合 を synset (synonym set) と 呼 ぶ.WordNet 内 では,この synset を 単 位 として 階 層 定 義 の 記 述 が 成 されている. 名 詞 句 辞 書 と 動 詞 句 辞 書 のみが 階 層 構 造 を 持 ち, 一 部 の 概 念 ID には, 反 対 概 念 の 概 念 ID,part of,member of,substance of 関 係 の 概 念 ID なども 与 えられている.

34 20 第 2 章 関 連 研 究 図 2.9 日 本 語 語 彙 大 系 の 意 味 カテゴリと 単 語 (ホテル)の 対 応 関 係 の 例 EDR 電 子 化 辞 書 EDR 電 子 化 辞 書 [6] は, 単 語 辞 書, 対 訳 辞 書, 概 念 辞 書, 共 起 辞 書, 専 門 用 語 辞 書 ( 情 報 処 理 ),EDR コーパスから 構 成 され, 日 本 語 単 語 辞 書 は 約 27 万 語, 概 念 辞 書 は 約 40 万 概 念 が 収 録 されている. 単 語 辞 書 は, 見 出 し 情 報, 文 法 情 報, 意 味 情 報, 運 用 その 他 の 情 報 から 構 成 されており, 意 味 情 報 には, 概 念 辞 書 の 各 概 念 ノードを 識 別 するための 概 念 識 別 子 が 割 り 当 てられ, 単 語 辞 書 と 概 念 辞 書 を 結 合 する 働 きを 持 っている. 一 方, 概 念 辞 書 には, 多 重 継 承 を 許 す 概 念 階 層 関 係 を 定 義 した 概 念 体 系 辞 書 と,agent( 動 作 主 体 ), object( 対 象 ), goal( 目 標 ), implement( 道 具 手 段 ), cause( 原 因 ), place( 場 所 ), scene( 場 面 ), a-object( 属 性 を 持 つ 対 象 )という 8 種 類 の 概 念 関 係 子 による 概 念 間 関 係 を 定 義 した 概 念 記 述 辞 書 がある. 各 概 念 は, 主 に, 概 念 識 別 子, 概 念 見 出 し, 概 念 の 説 明 を 持 つ. 日 本 語 語 彙 大 系 日 本 語 語 彙 大 系 [4]は 約 3,000 種 の 意 味 カテゴリと 約 30 万 語 の 単 語 から 構 成 されており, 意 味 カテゴリは 名 詞, 固 有 名 詞, 用 言 という 3 つのルート 意 味 体 系 から 階 層 構 造 により 構 成 され, 各 単 語 は 意 味 カテゴリを 持 つ. 図 2.9 に, 日 本 語 語 彙 大 系 の 意 味 カテゴリと 単 語 (ホテル)の 対 応 関 係 の 例 を 示 す オントロジーの 応 用 例 オントロジーの 応 用 は 幅 広 い. 現 在, 米 国 では, 政 府 機 関 および 民 間 企 業 において,デ ータ 統 合, 情 報 検 索, 情 報 共 有 などをはじめ 様 々な 分 野 で,オントロジーを 利 用 したソリ ューションが 提 供 され 始 めている. 応 用 の 対 象 として,ソフトウェア 開 発,インフラスト ラクチャ, 情 報 システム,ナレッジシステム, 行 動 システムなどが 挙 げられる.

35 2.2 オントロジー 21 本 項 では,オントロジーの 応 用 例 として,データ 統 合, 自 然 言 語 検 索,ソーシャルブッ クマークへの 応 用 について 述 べる. データ 統 合 への 応 用 機 械 に 対 して 共 通 理 解 を 提 供 するオントロジーをデータ 統 合 に 応 用 する 事 例 が 多 く 存 在 し, 実 際 のビジネスシーンの 中 でオントロジーを 利 用 したソリューションが 登 場 している. 例 えば,オラクル 社 は 企 業 データの 統 合 の 技 術 として RDF とオントロジーを 利 用 したデ ータベース 製 品 を 開 発 している. 各 企 業 組 織 または 業 界 から 抽 出 したデータ スキーマに 基 づき 作 成 されたオントロジーを 利 用 し, 様 々なアプリケーション 固 有 のデータ スキー マを 統 合 する 技 術 を 提 案 している [27]. 図 2.10 が 表 すように,オントロジーが 異 機 種 間 のデータソースへの 問 い 合 わせとアプリ ケーション 固 有 のスキーマを 一 致 させる.オントロジーによるデータモデル 管 理 は,ファ イルベースまたは 特 殊 データベースによるアプローチにはない 大 きな 利 点 を 持 つ. 主 な 5 つを 以 下 にまとめる. 総 所 有 コストの 削 減 セマンティック アプリケーションは, 他 のアプリケーションと 組 み 合 わせるこ とができ,データを 中 央 に 保 存 して 企 業 レベルで 配 置 できるので, 所 有 コストが 削 減 される. 企 業 データベース 以 外 では,サービス 指 向 型 アーキテクチャ (SOA : Service Oriented Architecture)によって,クライアント 側 のソフトウェアのデスク トップへのインストールや,データの 個 別 管 理 等 をする 必 要 がなくなる. 保 守 や 更 新 によるリスクを 低 下 RDF および OWL モデルは, 既 存 の 組 織 データ,XML, 空 間 的 情 報,およびテ キスト 文 書 とともに, 企 業 の DBMS に 直 接 統 合 できる.その 結 果, 結 合 されたス ケーラブルでセキュアな 高 性 能 アプリケーションの 実 現 が 可 能 となる. 既 存 の IT リソースを 使 用 する 任 意 のサーバプラットフォームにこれらのアプリケーションを 配 置 し, 管 理 できる. 図 2.10 エンタープライズ 統 合 のワークフロー

36 22 第 2 章 関 連 研 究 高 い 価 値 インターネットを 使 用 して,より 多 数 のユーザが, 実 質 的 な 追 加 コストなしに, 組 織 のアプリケーションにアクセスできる.そのため,ミッションクリティカルな 情 報 にアクセスする 必 要 のあるすべてのユーザは 年 間 365 日,1 日 24 時 間 いつで も 情 報 にアクセスできる. パフォーマンスとセキュリティ マルチテラバイトの RDF データベースを 管 理 し,ミッションクリティカルなセ マンティックデータモデルに 対 して,データベースのセキュリティ,スケーラビリ ティおよびパフォーマンスの 提 供 が 可 能 となる. ビジネス 情 報, 科 学 的 データ, 政 府 文 書, 電 子 メール メッセージ,および Web コンテ ンツの 増 加 が 止 まらない 現 状 では,データを 統 合 し,ビジネス 情 報 のエンタープライズリ ポジトリから 新 しい 意 味 や 価 値, 情 報 を 得 る 多 くの 機 会 が 存 在 する. 企 業, 科 学 者, 政 府 アナリストは, 構 造 化 および 非 構 造 化 データの 異 機 種 間 ソースへのアクセスを 試 みるシス テムの 構 築 を 始 めている. 現 在 までは,これらのシステムにはそのようなドメイン 間 の 統 合 を 可 能 にするように 構 造 化 されたものは 存 在 しなかった.データ 統 合 は, 異 なるドメイ ンおよびアプリケーションの 領 域 に, 具 体 的 なメリットを 提 供 する. 米 国 では 以 下 に 示 す 領 域 でのケーススタディが 盛 んに 行 われている. エンタープライズ データ 統 合 ドメイン データ アグリゲーション コンテキスト アグリゲーション/ナレッジ 管 理 企 業 向 け 検 索 以 下, 情 報 集 約 型 ナレッジワークの 自 動 化 やセマンティック インフラに 含 まれるセマ ンティック Web 関 連 のソリューションとして, 複 雑 なデータの 統 合 を 行 った 航 空 宇 宙 局 (NASA)の 事 例 [28]を 紹 介 する. 全 米 11 ヶ 所 に 宇 宙 センターおよび 研 究 機 関 などを 抱 える NASA では, 毎 日 膨 大 な 量 のデータが 生 成 されている.しかし, 同 局 では,これら 11 機 関 によって 生 成 されるデータをひとつに 集 合 させるといった 中 央 集 中 型 のデータ 構 造 を 採 用 しておらず,データ 統 合 が 非 常 に 複 雑 となっている.また, 同 局 のデータは, 異 なるデータベースに 保 管 されており,データ フォーマットが 統 一 されていないため,デー タの 検 索 が 困 難 であり, 見 つかりにくいデータなどは 何 度 も 作 成 されるなど,データ 重 複 の 原 因 となっていたという.こうした 状 況 を 改 善 するために, 同 局 は 現 在, 既 存 データソ ースを 利 用 して 効 率 的 なデータ 管 理 を 行 っていくために, 同 局 内 のグループやプロジェク トに 対 して,セマンティック Web 技 術 の RDF やオントロジーの 利 用 を 推 進 し,NASA 全 体 におけるデータの 統 合 を 進 めた. 同 局 では, 地 球 科 学 分 野 における 情 報 の 発 見, 利 用, 共 有 を 促 進 するために 大 規 模 なオントロジー SWEET(Semantic Web for Earth and

37 2.2 オントロジー 23 Environmental Terminology) が 開 発 され, 既 に 複 数 のプロジェクトによって 使 用 されて いるほか,JAVA を 使 ったセマンティック ブラウザ アプリケーションである mspace や jspace などのユーザインタフェースも 開 発 した.NASA の 最 高 技 術 責 任 者 (CTO) である Andrew Schain 氏 によると, 同 局 のチーフエンジニア 室 (Office of Chief Engineer) では,セマンティック Web の 研 究 開 発 に 取 り 組 んでいる Clark & Parsia 社 と 協 力 し,4 つの 異 なるデータベースの 情 報 を RDF でエンコードし,ブラウズした 情 報 を 表 示 するユ ーザインタフェース jspace を 構 築 した.ユーザは, 同 ユーザインタフェースを 利 用 す ることによって,4 つの 異 なるデータベースにある 情 報 を 自 由 にブラウズすることが 可 能 となった.jSpace ブラウザは, 異 なるデータベースの 情 報 を 包 括 的 に 検 索 し,その 結 果 を 人 物 (People), 機 関 (Organizations), プロジェクト(Projects),スキル(Skills)の 4 つのフィールド( 通 称 :POPS)にあわせて 表 示 できるように,それらに 適 合 した 情 報 を 導 き 出 すことができる. 自 然 言 語 検 索 ( 質 問 応 答 システム)への 応 用 RDF で 表 現 している Triple と 呼 ばれる 主 語 - 述 語 - 目 的 語 の 関 係 を 持 つデータの 検 索 を, 自 然 言 語 から 変 換 したクエリにより 行 う 研 究 が 多 くなされている. 例 えば,AquaLog [29]などがある.この 研 究 において 自 然 言 語 検 索 の 仕 組 みは, 自 然 言 語 による 質 問 クエ リトリプルの 生 成 オントロジーと 互 換 性 のあるトリプル 生 成 答 え という 流 れで 構 成 されている. 図 2.12 が,その 概 要 である. 例 えば, 日 本 の 首 都 はどこですか? というクエリに 対 して, 日 本 [ 首 都 ] ( 答 え) というクエリトリプルを 生 成 し,データベースを 対 応 させることで 答 えを 返 す. 図 2.11 jspace ブラウザの 検 索 結 果 の 例

38 24 第 2 章 関 連 研 究 図 2.12 AquaLog の RDF トリプルを 用 いた 自 然 言 語 検 索 の 仕 組 み ( 出 所 )AquaLog: An Ontology-Portable Question Answering System for the Semantic Web [29],p.548 実 際 に WolframAlpha 6 という 自 然 言 語 と 独 自 の 知 識 ベースを 用 いて 質 問 応 答 システム として 公 開 されているサービスも 存 在 する. WolframAlpha は 自 然 言 語 の 質 問 から, 知 識 ベースの 構 造 化 データ 内 の 答 えと 関 連 する 情 報 を 検 索 し, 出 力 する. 例 えば, 2005 年 にローマ 教 皇 は 何 歳 か?( How old was Bishop of Rome in 2005?) という 問 いに 対 して,Google による 検 索 結 果 は Wikipedia のフラン シスコ 教 皇 に 関 する 記 事 である. 一 方,WolframAlpha による 回 答 は how old という フレースから age を 認 識 し, Bishop of Rome から Pope Francis を 認 識 する.さ らに,2005 年 時 点 での 年 齢 を 算 出 し 68 years という 結 果 を 出 力 する.また, 国 民 1 人 あたりの 国 内 総 生 産 が 21 番 目 に 大 きい 国 は?(What is the twenty-first country by GDP per capita?) という 検 索 文 に 対 して,Google では,Wikipedia の 国 の 国 内 総 生 産 順 リスト ( 一 人 当 り 為 替 レート)の 記 事 が 出 力 されるが,WolframAlpha では,GDP から capita を 割 った 値 のうち,21 番 目 の 国 である 日 本 が 出 力 され,その 計 算 結 果 である $46,720 という 値 も 出 力 される. 図 2.13 WolframAlpha 6

39 2.2 オントロジー 25 このように, 現 在 RDF データベースやオントロジーに 対 する 自 然 言 語 検 索 技 術 に 関 す る 多 くの 研 究 がなされている. 自 然 言 語 によるクエリは RDF のトリプル 群 に 変 換 され, 回 答 結 果 を 出 す 際 に 必 要 になるのが 検 索 対 象 となるデータと,そのデータが 持 つ 関 係 も 含 めたメタデータである. 領 域 オントロジーは, 検 索 分 野 において 専 門 的 な 概 念 体 系 を 持 つ 参 照 情 報 として 応 用 することができる. ソーシャルブックマークへの 応 用 領 域 オントロジーの 応 用 例 としてソーシャルブックマークサービスへの 応 用 を 紹 介 する. 現 在,セマンティックなタグ 付 けが 可 能 である Faviki 7 というサービスが 存 在 する. Faviki は 基 本 的 にはソーシャルブックマークであり,はてなブックマークや del.icio.us などと 似 ているが,タグが Wikipedia の 項 目 名 と 連 動 している 点 が 異 なる. 参 照 している データベースは 関 連 研 究 で 述 べた DBpedia をベースとして,タグ 間 の 意 味 関 係 を 用 いた セマンティックなタグ 付 を 実 現 している.つまり Faviki は, 自 由 で 乱 雑 な 語 彙 が 付 与 され やすいタグシステムに 対 して Wikipedia のフィルターを 介 すことで 語 彙 の 統 制 を 行 い, DBpedia が 提 供 するオントロジーを 利 用 し 意 味 関 係 を 抽 出 している.タグ 間 において 関 係 が 定 義 されているため, 従 来 のソーシャルブックマークサービスよりも 意 味 的 な 検 索, 整 理 が 可 能 となる. 本 研 究 での 構 築 対 象 である 領 域 オントロジーは,より 専 門 性 に 特 化 した コミュニティでのタグシステムへの 利 用 へ 応 用 することができると 考 えられる. 図 2.14 Faviki 7

40 26 第 2 章 関 連 研 究 2.3 Wikipedia Wikipedia の 概 要 Wikipedia 8 は 誰 もが 無 料 で 自 由 に 編 集 に 参 加 できるオンライン 百 科 事 典 であり, 日 本 語 版 Wikipedia は 2013 年 10 月 現 在, 既 に 87 万 を 超 えるページ 数 が 存 在 する 9.Wikipedia のような 知 識 形 態 は 集 合 知 とも 呼 ばれ, 語 彙 の 現 在 使 用 されている 意 味 の 定 義 が 掲 載 されており, 既 存 の 辞 書 よりも 真 の 意 味 を 表 すという 考 え 方 も 広 まってきている. Wikipedia は 一 般 的 な 概 念 から 最 新 の 技 術 動 向 に 関 する 記 事 まで 幅 広 い 分 野 の 記 事 が 網 羅 されていて 膨 大 なコンテンツが 存 在 し,さらに 記 事 内 の 単 語 それぞれから 対 応 したページ へのリンクや 言 語 リンク, 関 連 項 目 のページへのリンクなど,Wikipedia 内 の 各 ページ 間 でのハイパーリンクも 充 実 している.Wikipedia ではカテゴリ 階 層,Infobox といった 構 造 フォーマットを 利 用 してこの 膨 大 な 量 のコンテンツを 整 理 している.Wikipedia のデー タは 記 事 本 文,リンク 構 造 などは GFDL (GNU Free Documentation License) [7]のライ センスの 下 にフリーで 公 開 され,SQL や XML の 形 式 でダウンロードすることができる Wikipedia の 利 点 Wikipedia はオントロジー 構 築 の 観 点 から 見 て 有 用 な 点 が 多 いコーパスである. 以 下 に その 点 を 3 つ 述 べる. 図 2.15 Wikipedia のトップページ 日 本 語 版 の 統 計

41 2.3 Wikipedia 27 (1) URL による 語 彙 の 一 意 性 確 立 URL によって 語 彙 の 一 意 性 が 確 立 されている 点 は,Wikipedia の 大 きな 特 徴 の 一 つであ る. 電 子 辞 書 では, 通 常 一 つの 見 出 し 語 が 一 つのページに 割 り 当 てられており,その 中 で 複 数 の 意 味 について 詳 述 される. 一 方,Wikipedia では 一 つの URL(ページ)に 一 つの 概 念 が 割 り 当 てられており, 多 義 性 が URL によって 解 決 されている 点 が 大 きな 特 徴 である. たとえば, Football は 強 いコンテキスト 依 存 を 持 つ 単 語 であり,アメリカンフットボー ルを 示 す 場 合 もサッカーを 示 す 場 合 もある.Wikipedia では,これら 二 つの 概 念 は 別 々の ページで 管 理 されており, tball_%28soccer%29 という 別 々の URL が 割 り 当 てられている. (2) 辞 書 更 新 の 即 時 性 従 来 の 辞 書 では, 一 般 的 な 語 からトップダウン 的 に 追 加 されていくのが 通 常 であり, 一 般 的 でない 語 や 専 門 的 な 語 は 辞 書 に 追 加 されるのが 遅 れる.もしくはいつまでも 登 録 され ないのが 一 般 的 である.しかし,Wikipedia では,インターネットを 通 じてリアルタイム に 記 事 が 編 集 アップロードされ,リンクが 構 築 されていくため, 極 めて 即 時 性 が 高 い. 例 えば,ある 企 業 から 最 新 の 技 術 の 発 表 があった 数 時 間 後 には,エントリが 生 成 され,そ の 説 明 や 詳 細 なスペック, 画 像 などが 他 の 語 へのリンク 付 きで 公 開 されたというケースも ある.このような 新 しい 概 念 に 対 する 網 羅 性 の 高 さはコーパスとしてみたときの 重 要 な 特 徴 の 一 つである. (3) コンテンツの 網 羅 性 従 来,WWW を 自 然 言 語 処 理 のコーパスとして 利 用 する 場 合,その 探 索 空 間 が 膨 大 すぎ ることから, 解 析 内 容 が 発 散 もしくは 偏 ってしまうという 問 題 があった.これを 回 避 する ためにはクローリングの 方 法 を 工 夫 するか 大 規 模 な 並 列 システムを 構 築 しなければならな かった.これに 対 し,Wikipedia は, 一 般 的 な 概 念 から 最 新 の 技 術 動 向 に 関 する 記 事 まで 幅 広 い 分 野 の 記 事 が 網 羅 されており, 膨 大 なコンテンツ 量 が 存 在 するものの,WWW の 探 索 空 間 に 比 較 するとそのリンク 構 造 はサイト 内 で 閉 じられており, 現 実 的 な 時 間 での 解 析 が 可 能 となる Wikipedia のデータ Wikipedia を 構 成 するデータとその 構 造 のうち, 主 要 なものを 説 明 する. 記 事 ページ Wikipedia の 構 成 単 位 としては 最 も 主 要 なものである. 電 子 辞 書 でいう 見 出 し 語 の 一 つ を 記 述 しているページである. 一 つのページに 一 つの 概 念 が 割 り 当 てられており, 多 義 性 が URL によって 解 決 されている. 図 2.16 に 記 事 ページの 例 を 示 す.

42 28 第 2 章 関 連 研 究 図 2.16 記 事 ページの 例 Infobox 記 事 ページの 中 には,Infobox と 呼 ばれる 構 造 を 持 つページもある.Infobox は,その 概 念 の 基 本 的 な 情 報 をテーブル 形 式 でまとめたもので, 動 物, 果 物, 国 など 種 類 ごとにテン プレートが 存 在 する. 図 2.17 は Infobox を 持 つ 記 事 ページと Infobox である. 図 2.17 Infobox を 持 つ 記 事 ページ( 左 )と Infobox( 右 )の 例

43 2.3 Wikipedia 29 図 2.18 カテゴリページ( 左 )とカテゴリ 階 層 の 概 念 図 ( 右 )の 例 カテゴリとカテゴリ 階 層 カテゴリには 記 事 ページが 割 り 当 てられ, 記 事 ページの 分 類 整 理 の 役 割 を 果 たしてい る. 記 事 ページは 複 数 のカテゴリに 属 している 場 合 もある.カテゴリ 自 体 も 親 カテゴリ, 子 カテゴリが 割 り 当 てられ,ネットワークを 形 成 しているが,ある 部 分 だけを 一 種 の 木 構 造 をとみなし,カテゴリ 階 層 と 捉 えることができる. 一 覧 ページ 記 事 ページの 中 には, ~の 一 覧 というタイトルのページがあり,そのページには, 記 事 のタイトルをクラスと 見 立 てた 場 合 にそのインスタンスとなるものが 項 目 として 列 挙 されている. 一 覧 ページは 主 に 記 事 タイトル,その 項 目 (インスタンス),インスタンス を 整 理 分 別 している 目 次 から 成 り, 図 2.19 のような 形 態 をしている.Wikipedia が 多 く の 分 野 の 知 識 をカバーしているのと 同 様, 一 覧 ページも 数 多 くの 分 野 のものが 存 在 する. 数 多 く 存 在 する 一 覧 ページは 本 研 究 でも 着 目 している 構 造 化 情 報 であり, 豊 富 なインスタ ンスの 情 報 を 抽 出 できる 可 能 性 を 持 っている. 図 2.19 一 覧 ページ( 左 )とその 概 念 図 ( 右 )の 例

44 30 第 2 章 関 連 研 究 図 2.20 DBpedia の 記 事 の 例 2.4 Wikipedia 関 連 研 究 現 在,Wikipedia を 情 報 資 源 としてオントロジーの 構 築 を 行 っている 研 究 は 多 い. 本 節 では, 国 内 外 での,いくつかの 代 表 的 な 研 究 を 紹 介 する DBpedia DBpedia [13]は,RDF を 基 盤 とした 記 事 タイトルについての 膨 大 な 量 のメタデータベー スを 構 築 した. 主 に 英 語 Wikipedia の Infobox に 着 目 しているが, 外 部 リンクや 所 属 カテ ゴリも 応 用 している.また, 記 事 のアブストラクトに 関 しては 主 要 11 言 語 で 抽 出 してい る.しかし, 抽 出 した 情 報 は 何 もフィルタリングされておらず,ノイズも 大 量 に 含 まれて しまっている. 図 2.20 は DBpedia の 一 概 念 を 表 すページの 一 部 である. なお,DBpedia は 多 言 語 に 対 応 している.2013 年 9 月 時 点 での DBpedia の 持 つ 言 語 別 のデータ 量 を 表 2.2 に 示 す. 表 年 9 月 時 点 の DBpedia のデータ 言 語 アブストラクトの 数 言 語 アブストラクトの 数 English 4,004,000 Polish 961,000 Dutch 1,405,000 Swedish 957,000 German 1,368,000 Russian 954,000 French 1,315,000 Japanese 825,000 Italian 980,000 Portuguese 736,000 Spanish 965,000 Chinese 653,000

45 2.4 Wikipedia 関 連 研 究 31 DBpedia では, 一 意 に 定 義 した 膨 大 な 数 の 個 体 を 他 の RDF データベースの 個 体 と 結 び つけることで Web 上 に 存 在 するデータの 意 味 付 けされたネットワークを 構 築 している. 現 在 も 様 々な RDF データが 公 開 されては DBpedia とのリンクが 構 築 され,DBpedia はいわ ば Web 上 のインスタンスデータのハブとなっている.このように, 公 開 された RDF デー タで 他 のデータベースと 結 合 されているものは LOD (Linked Open Data)と 呼 ばれ, 現 在 のセマンティック Web 研 究 において 一 つの 大 きな 流 れとなっている. DBpedia は 非 常 に 大 規 模 なデータベースであるが, 手 動 構 築 した 170 のクラスと 720 のプロパティを 利 用 し,Infobox の 構 造 をそのまま 抽 出 している. 手 動 構 築 のプロパティ と Infobox からのプロパティは 分 離 しており,Infobox からのプロパティの 多 くはオント ロジー 内 で 統 合 されていない.さらに, 日 本 語 固 有 の Wikipedia の 記 事 には 対 応 しておら ず, 日 本 語 LOD のハブとして 利 用 するために 十 分 とはいえない. 本 家 DBpedia が 英 語 版 Wikipedia のテンプレートをベースに 構 築 しているのに 対 し, 日 本 語 版 Wikipedia を 対 象 とし, 独 自 でマッピング 作 業 を 行 なっている DBpedia Japanese 10 も 存 在 しているが, 日 本 語 特 有 のクラス 階 層 を 持 っていない YAGO(Yet Another Great Ontology) YAGO [30]は, 概 念 階 層 部 分 として 英 語 版 汎 用 オントロジーの WordNet を 利 用 し, 末 端 のクラスに 英 語 Wikipedia に 存 在 する 膨 大 な 量 のインスタンス 情 報 を 付 加 したオントロ ジーである. どの 記 事 をどの WordNet クラスのインスタンスとするかの 判 断 は,その 記 事 がどの Conceptual Category と 呼 ばれるカテゴリに 属 しているかで 決 めている.Conceptual Category は, 経 験 則 に 基 づいた 簡 単 なカテゴリ 名 の 構 文 解 析 から 定 義 している.ここで 提 案 されている 手 法 は 英 語 においてのみ 適 用 可 能 であり, 所 属 カテゴリを 利 用 してさまざま なプロパティを 手 動 で 定 義 し, 記 述 している.YAGO は Wikipedia のインスタンス 情 報 を 主 に 利 用 している 点 が 特 徴 である. 図 2.21 は YAGO の 一 部 である. YAGO は 関 係 の 種 類 数 としては is-a 関 係 も 含 めて 15 種 しかなく,プロパティを 設 けて いるが, 手 動 で 170 種 程 度 であり,プロパティの 定 義 域 や 値 域 については 扱 っていなかっ た. 10

46 32 第 2 章 関 連 研 究 図 2.21 YAGO における 階 層 関 係 の 構 築 の 例 YAGO2 および YAGO2s [31]では YAGO の 知 識 ベースの 拡 張 として,これまでの WordNet に Wikipedia のカテゴリを 付 加 してオントロジーの 拡 張 を 行 うだけでなく, GeoNames 11 などの Wikipedia 以 外 の 情 報 資 源 を 用 いて, 時 空 間 的 情 報 を 抽 出 する 事 で, さらなるオントロジーの 拡 張 を 目 指 している.これら 時 空 間 的 情 報 は wasbornondate や islocatedin といった 関 係 を 定 義 し,インスタンスとつないでおり, 非 階 層 関 係 となって いる. 非 階 層 関 係 に 着 目 し, 時 空 間 も 含 めた 高 度 なオントロジーを 構 築 しているが,これ らの 関 係 は 手 動 で 定 義 されており,プロパティの 定 義 域 や 値 域 についても 手 動 で 定 義 され ている Wikipedia からの 上 位 下 位 関 係 抽 出 Ponzetto ら [32]は,Wikipedia カテゴリから 上 位 下 位 概 念 関 係 の 抽 出 を 試 みている. 手 法 としては,カテゴリリンクに 以 下 のようなメソッドを 適 用 することによって 主 に 関 係 を 抽 出 している. Category network cleanup Wikipedia 独 自 のノイズを 取 り 除 く Refinement link identification Y X - X by Z というカテゴリリンクを X by Z is-refined-by Y X と 定 義 Syntax-based methods カテゴリ 名 の head( 主 要 部 )と modifier( 修 飾 部 )のマッチで 分 類 British Computer Scientists is-a Computer Scientists Crime Comic not-is-a Crime(is-a ではないカテゴリ 分 けを 指 摘 ) 11

47 2.4 Wikipedia 関 連 研 究 33 Connectivity-based methods 複 数 形 の head を 持 つカテゴリとそのサブカテゴリを is-a で 結 ぶ Wikipedia カテゴリだけでなく, 記 事 の 自 然 言 語 文 やハイパーリンクから 機 械 学 習 によ り, 上 位 階 関 係 を 抽 出 する 研 究 もある.Wei ら [33]は,Wikipedia 記 事 内 のハンパーリン クを, 自 動 的 に 13 次 元 の 特 徴 ベクトルにマッピングし,Wikipedia の 構 造 情 報 から 抽 出 したトレーニングデータを 基 に, 分 類 器 を 生 成 している. 分 類 器 はドメインごとの 特 徴 を 備 えており,ドメイン 固 有 の 上 位 下 位 関 係 を 発 見 する 事 が 可 能 である. 実 際 に,いくつか のドメインに 分 類 器 を 適 用 した 結 果, 辞 書 と 構 文 パターンによるアプローチに 比 べ,パフ ォーマンスの 向 上 が 見 られる Wikipedia の Infobox を 用 いた 意 味 関 係 抽 出 Wu ら [34]は,Wikipedia の Infobox が 持 つテンプレートに 着 目 し,Infobox テンプレ ートを WordNet のクラス 階 層 に 写 像 することで,is-a 関 係 を 構 築 している. 写 像 した Infobox テンプレートが 持 つ 各 プロパティは is-a 関 係 により 継 承 される. 各 プロパティが Infobox テンプレートという 定 義 域 を 持 ち, 継 承 される 点 で 高 度 なオントロジーと 言 える が,プロパティ 自 体 は Infobox からの 情 報 のみであり,さらにプロパティのタイプについ ては 検 討 していない. Xu ら [35]は,Wikipedia の Infobox からトリプルを 抽 出 する 際 に, 欠 けてしまった 要 素 間 のリンクを 発 見 し, 補 完 する 手 法 を 提 案 している.DBpedia などの Infobox からのプ ロパティ 抽 出 では,Wikipedia の 記 者 に 依 存 し,Infobox 内 にハイパーリンクをつけてい ない, 余 分 な 注 釈 を 入 れているなどの 理 由 により,トリプルを 抽 出 できないことが 多 い. 本 手 法 は 各 プロパティの 値 となる 部 分 の 特 徴 を 重 みとして 取 得 し, 学 習 することで,プロ パティの 値 となる 要 素 を 予 測 し, 欠 けてしまった 要 素 を 補 完 している 日 本 語 版 Wikipedia を 用 いた 研 究 日 本 語 版 Wikipedia を 用 いて 日 本 語 語 彙 体 系 を 拡 張 する 研 究 も 行 われている[36, 37]. 柴 木 らは [37], 日 本 語 版 Wikipedia を 用 いて 日 本 語 語 彙 体 系 を 拡 張 する 研 究 を 行 っている. 日 本 語 語 彙 大 系 を 上 位 階 層 とし, 日 本 語 版 Wikipedia のカテゴリと 対 応 付 けることで is-a 階 層 を 構 築 し,さらに Wikipedia の 見 出 し 語 に 着 目 し, 記 事 からインスタンスを 抽 出 する ことで 汎 用 オントロジーを 構 築 する 手 法 を 提 案 している. 本 論 文 と 同 様 に, 後 方 文 字 列 照 合 を 用 いて 精 度 の 高 い is-a 階 層 とインスタンスを 抽 出 しているが, 非 階 層 関 係 については 言 及 されていない. 隅 田 らは [38],Wikipedia の 記 事 構 造 に 機 械 学 習 によるフィルタリングを 用 いることで, 大 規 模 な 上 位 下 位 関 係 にある 単 語 ペアの 獲 得 を 行 っている. 獲 得 された 単 語 ペアにおける

48 34 第 2 章 関 連 研 究 上 位 下 位 関 係 の 精 度 は 高 いが 独 立 しており, 本 論 文 のように 階 層 構 造 になっていない.ま た,クラスやインスタンスの 区 別 もされていない 関 連 研 究 の 総 括 クラス-インスタンス 関 係 および 階 層 関 係 に 焦 点 が 当 てられたものが 多 く,プロパティ を 含 むオントロジーを 構 築 している 研 究 は 少 ない.また,プロパティを 含 むオントロジー も Wikipedia の Infobox のみに 着 目 しており, 他 の 構 造 を 利 用 したプロパティ 構 築 研 究 は 少 なく,プロパティのタイプやプロパティ 間 の 関 係 にまで 着 目 した 研 究 は 見 られない.さ らに, 日 本 語 版 Wikipedia からのオントロジー 構 築 研 究 については, 非 階 層 関 係 の 抽 出 に 焦 点 を 絞 った 研 究 は 少 ない. 2.5 Linked Open Data LOD (Linked Open Data)とは 今 まで 互 いに 関 連 していなかったデータ 同 士 を Web の 仕 組 みを 利 用 することによって 繋 げ,データをつなげることに 対 する 敷 居 を 低 くするための 試 みである.LOD は Semantic Web における URIs と RDF を 利 用 することにより,1つ 1つのデータ, 情 報,そして 知 識 をつなげるために 実 践 的 な 方 法 の1つである.ここでは Linked Open Data 概 要 と 現 状 について 述 べる Open Government Data の 始 まり LOD はデータを 開 示 しようという 世 界 的 な 流 れの 中 で 生 まれ, 政 府 の 保 有 する 大 量 のデ ータを 如 何 にして 使 いやすい 形 で 公 開 できるかという 活 動 から 始 まった.この 活 動 を Open Government 12 と 呼 ぶ. 何 層 にも 重 なっているデータ, 特 定 の 領 域 についてごく 詳 し く 述 べられているデータをどのように 公 開 したら 良 いかというのはデータの 開 示 という 側 面 からは1つの 大 きな 問 題 である.そこでセマンティック Web の 技 術 を 利 用 してオープ ンに 結 び 付 けられたデータを 作 ろうというのが,LOD のビジョンである 年,30 の Open Government の 団 体 がアメリカ 合 衆 国 カリフォルニア 州 の Sebastopol で 会 合 を 行 い,Open Government Data Principles [39]を 作 成 した.ここで 定 められた 8 つの 原 則 は 次 のとおりである. 12

49 2.5 Linked Open Data 35 (1) データは 完 全 でなければならない. (2) データは 一 次 情 報 でなければならない. (3) データは 直 ちに 開 示 されなければならない. (4) データはアクセス 可 能 でなければならない. (5) データは 機 械 処 理 可 能 でなければならない. (6) データは 平 等 にアクセス 可 能 である. (7) データの 形 式 は 専 売 的 ではないものが 望 ましい. (8) データはライセンスフリーでなければならない. これらは Open Government Data Principles の 世 界 標 準 となっており,オーストラリア, ニュージーランド, 欧 州, 北 アメリカで 活 動 が 始 まった. 今 日 ではアジア, 南 アメリカ, アフリカでも Open Government Data Principles の 活 動 が 広 まりつつある Open Data から Linked Open Data へ Open Government Data は 情 報 とデータをオープンにしてそれらの 再 利 用 を 高 める 役 割 がある.Open Government Data を 具 体 的 な 事 例 としつつ,より 汎 用 的 に 色 々なデータ を Open Government Data のような 形 で 公 開 し 再 利 用 していくことはできないだろうか という 議 論 が 進 んだ. Open Data の 恩 恵 を 十 分 に 受 けるには, 情 報 とデータを 新 しい 知 識 を 生 み 出 すコンテキ ストにおき,かつ, 魅 力 的 なサービスやアプリケーションが 存 在 する 必 要 がある.LOD の 活 動 を 促 進 させるためには, 各 企 業 や 特 定 のドメインの 中 で 閉 じられているデータを 最 利 用 する 際 の 情 報 管 理 と 情 報 の 統 合 のメカニズムが 重 要 になる. Tim Berners-Lee は 2010 年 のワシントン DC での Gov2.0 Expo において Open Government Data 及 び LOD のためのプレゼンテーションを 行 った.2006 年 に 公 開 され た Linked Data Design Issue [40]において,Linked Data の 条 件 として 以 下 の4つが 述 べ られている. (1) モノの 名 前 に URI を 利 用 する (2) HTTP URI で 名 前 を 参 照 できる (3) URI を 参 照 した 時, 関 連 する 情 報 を 提 供 できるように,Web 標 準 の 技 術 (RDF/SPARQL 等 )を 使 う (4) より 多 くの 関 連 情 報 を 引 き 出 せるよう, 外 部 データへのリンク(URI)を 含 める また,Michael Hausenblas がそのプレゼンテーションの 核 となる 部 分 をまとめ,5つ 星 モデルを 提 唱 した. 表 2.3 に 5 つ 星 モデルを 示 す.

50 36 第 2 章 関 連 研 究 表 2.3 Linked Data のための 5 つ 星 情 報 はオープンなライセンスにおいてweb 上 で 公 開 されている.(フォー マットは 問 わない) 情 報 は 構 造 化 されたデータとして 公 開 されている,( 例 えば,スキャンさ れた 画 像 の 代 わりにExcelを 用 いる) 専 有 的 でないフォーマットが 利 用 されている.( 例 えば,Excelの 代 わり にCSVを 用 いる) 利 用 者 が 個 々のデータを 選 ぶためにURI 識 別 子 が 利 用 されている. データは 所 与 のコンテキストのデータと 結 び 付 けられている. 現 在 も LOD は 広 がり 続 けており, 様 々な 領 域 において 増 々 重 要 な 位 置 を 占 めるように なってきている.LOD は 既 に 多 くの 著 名 な 組 織,プロダクト,そしてサービスのために 利 用 されており,ポータルサイトやプラットフォームなどのインターネットをベースとした サービスやシステムを 構 築 するために 活 用 されている. 図 2.22 は,Linked Open Data の 近 年 の 成 長 の 様 子 を 示 した Linked Open Data Cloud 13 である. 総 データセット 数 は 295 である. 図 2.22 近 年 の Linked Open Data の 広 がり ( 出 所 ) 13

51 2.5 Linked Open Data 日 本 における Linked Open Data の 現 状 アメリカや 欧 州 においては LOD の 活 動 が 広 がり, 国 内 における 様 々な 普 及 活 動 の 効 果 もあり, 普 及 し 始 めている. 日 本 における LOD の 活 動 を 紹 介 し, 現 状 をまとめる. DBpedia Japanese 14 前 述 した DBpedia の 日 本 語 版 である. 本 家 DBpedia は 英 語 版 Wikipedia のテンプレー トをベースに 構 築 しているため, 日 本 語 特 有 の 記 事 については 対 応 していなかった. DBpedia Japanese では, 日 本 語 版 Wikipedia を 対 象 とし, 独 自 でマッピング 作 業 を 行 な うことで, 日 本 語 特 有 の 記 事 にも 対 応 可 能 であるが, 日 本 語 特 有 のクラス 階 層 を 持 ってい ない. CiNii( 国 立 情 報 学 研 究 所 ) 15 論 文 のデータベースである CiNii でも RDF データを 公 開 している.CiNii とは 論 文 や 図 書 雑 誌 などの 学 術 情 報 で 検 索 できるデータベース サービスのことである.RDF で 取 得 できる 情 報 としては, 論 文 情 報, 著 者 情 報, 図 書 雑 誌 情 報, 図 書 館 情 報 がある. LOD チャレンジ Japan 16 日 本 国 内 での LOD に 関 するコンテストであり, 第 1 回 大 会 は 2011 年 末 から 2012 年 初 めにかけて 開 催 され, 日 本 国 内 初 の 取 組 みであった.このチャレンジでは 一 般 の 応 募 者 か ら LOD 活 用 のためのアイデア, 及 び, 実 際 の LOD データ,LOD を 利 用 したアプリケー ションを 募 集 している.2012 年 に 第 2 回,2013 年 に 第 3 回 と 毎 年 開 催 されている. LODAC 17 国 立 情 報 学 研 究 所 が 保 有 しているデータを LOD 化 するプロジェクトが LODAC [42]で ある. LODAC プロジェクトでは 学 術 情 報 の LOD 化 を 目 的 としおり, 博 物 館 情 報 を 対 象 に LOD 化 を 行 なっている. 情 報 源 としては 14 館 の 博 物 館 資 料, 及 び, 日 本 美 術 シソーラ ス 18, 国 指 定 文 化 財 データベース 19, 文 化 遺 産 オンライン 20,DBpedia Japanese を 利 用 し ている NDLSH( 国 立 国 会 図 書 館 ) 21 国 立 国 会 図 書 館 典 拠 データ 検 索 サービスである Web NDL Authorities が 公 開 されてい

52 38 第 2 章 関 連 研 究 る.このサービスは 国 立 国 会 図 書 館 の 典 拠 データを 一 元 的 に 検 索 閲 覧 ダウンロードす ることができる. 収 録 データは 日 次 で 更 新 されており, 国 立 国 会 図 書 館 件 名 標 目 表 (National Diet Library Subject Headings: NDLSH)に 基 づいている. 件 名 標 目 とは, 目 録 を 検 索 する 際 の 手 がかりとして 資 料 の 主 題 をことばで 表 現 したものである.Web NDL Authorities においては NDLSH の 収 録 範 囲 に 該 当 する 全 件 データを RDF/XML TSV の 形 式 でダウンロードすることが 可 能 となっている. 図 2.23 は Linked Open Data Initiative 22 がまとめた 2013 年 10 月 時 点 の 日 本 語 LOD クラウドである. 総 データセット 数 は 2008 年 時 点 の LOD クラウドと 同 程 度 であり, 今 後 のさらなる 普 及 が 期 待 できる Linked Open Vocabularies LOV (Linked Open Vocabularies) 23 [16]は,LOD の 語 彙 に 着 目 した 取 り 組 みである. 各 LOD で 使 用 されている 語 彙 を 集 めて, 語 彙 の 検 索 を 可 能 にすることで, 新 たな LOD を 構 築 する 際 に 語 彙 の 再 利 用 を 促 す 取 り 組 みである. 図 2.24 は LOV における 名 前 空 間 の 集 合 であり,2013 年 10 月 時 点 で 370 の 名 前 空 間 から 語 彙 が 登 録 されており,これらには FOAF (Friend of a Friend) [43]や SKOS (Simple Knowledge Organization System) [44] といった 代 表 的 な 語 彙 を 含 んでいる. 図 2.23 日 本 版 LOD クラウド ( 出 所 ) 日 本 語 版 Linked Data クラウド 図,

53 2.5 Linked Open Data 39 図 2.24 Linked Open Vocabularies 名 前 空 間 の 全 体 像 ( 出 所 )Linked Open Vocabularies (LOV), しかしながら,LOD を 構 築 する 際 に, 新 たに 語 彙 を 作 成 する 方 が, 目 的 に 合 致 する 語 彙 を 見 つけてくるよりもはるかに 容 易 である.そのため, 標 準 語 彙 と 呼 ばれる, 既 に 普 及 している 一 部 の 語 彙 を 除 いて, 再 利 用 されているケースは 少 ない. 加 えて, 国 内 では LOV に 相 当 する 取 り 組 みがまだ 存 在 しておらず, 日 本 語 の 標 準 語 彙 というものがないため, 今 後 さらに 国 内 の LOD が 広 がることを 想 定 すると,LOD 構 築 者 にとって 障 壁 となりうる. FOAF (Friend of a Friend) Friend of a Friend 24 [43]は 友 達 の 友 達 という 人 物 間 の 繋 がりをメタデータとして 表 現 することで, 人 物 の 属 性 や 関 係 を 理 解 可 能 にする 試 みである. 名 前 や 年 齢 といった 一 般 的 な 属 性 だけでなく, 関 心 領 域,ホームページなどといった, 人 を 描 写 するための 様 々 な 語 彙 を 定 義 している. gr (GoodRelations) Good Relations 25 [45]は e-コマースのための 語 彙 を 定 義 している. 商 品 や 製 品 のブラン ドや 店 舗 の 所 在 地 や 営 業 日 などの 属 性 が 定 義 されており, 商 品 レビューの 検 索 や 分 析 の 際 に 有 用 なメタデータを 付 加 することができる

54 40 第 2 章 関 連 研 究 gn(geonames) GeoNames 26 [46]は 地 理 や 位 置 情 報 のための 語 彙 を 定 義 している. 所 在 地 や 座 標 だけで なく, 近 隣 施 設 や 隣 接 施 設 などのメタデータを 付 加 することで, 施 設 情 報 の 空 間 的 な 検 索 が 可 能 になる. schema (schema.org) schema.org 27 [47]は Google,Yahoo!,Microsoft の 3 社 が 共 同 でセマンティック Web を 導 入 しやすい 環 境 作 りのために 発 足 したイニシアティブである.HTML に 埋 め 込 むこ とで, 検 索 エンジンがマークアップを 通 してより 質 の 高 い 検 索 結 果 を 返 せるようになるこ とを 目 指 している. 大 分 類 として 7 つのクラスがあり,それぞれが 幾 つかの 下 位 クラスを もっている.これらのクラスを 定 義 域 として 非 常 に 多 岐 にわたる 語 彙 があり, 広 く 汎 用 的 に 利 用 可 能 な 語 彙 となっている.このため,HTML だけでなく LOD の 語 彙 としても 広 く 利 用 されている. 2.6 まとめ 本 章 では,はじめにオントロジーの 定 義 を 述 べ, 代 表 的 な 汎 用 オントロジーとオントロ ジーの 応 用 例 について 述 べた.また,Wikipedia と Wikipedia を 用 いたオントロジー 構 築 についての 既 存 研 究 を 述 べた, 最 後 に Linked Open Data と Linked Open Vocabularies について 述 べ, 国 内 外 のいくつかの 代 表 的 な 取 り 組 みを 紹 介 した. オントロジーの 有 用 性 が 高 まる 一 方,いくつかのオントロジー 構 築 支 援 ツールは 存 在 し ているが,オントロジーの 手 動 構 築 にかかるコストは 大 きな 課 題 となっている.その 課 題 を 解 決 するため,フリーテキストからのオントロジー 自 動 構 築 が 試 みられてきたが, 自 然 言 語 理 解 に 限 界 があり, 実 用 レベルに 到 達 しない.そのため, 半 構 造 情 報 を 有 する 情 報 資 源 からオントロジーを 自 動 的 に 構 築 する 方 法 が 提 案 されており,その 情 報 資 源 として Wikipedia は 大 きな 注 目 を 集 めている.しかしながら,Wikipedia からのオントロジーの 自 動 構 築 に 関 する 研 究 は,クラス 階 層 構 築 に 焦 点 を 当 てているものが 多 く,プロパティの 定 義 域 値 域 を 含 めたクラススキーマ 階 層 を 持 つような 質 の 高 いオントロジーを 構 築 する 研 究 は 少 ない. セマンティック Web の 分 野 でのオントロジーの 応 用 に 関 しては,Linked Open Data が 注 目 を 集 めており, 様 々な 領 域 の RDF のデータベースが 共 有 公 開 されている.しかし ながら, 国 内 では 欧 米 における DBpedia のようなハブが 確 立 されておらず,データベー ス 数 も 依 然 少 ない. 加 えて,Linked Open Vocabularies のような 取 り 組 みが 存 在 していな いため, 今 後 国 内 LOD が 普 及 する 上 で 大 きな 課 題 となっている

55 第 3 章 日 本 語 Wikipedia オントロジ ーの 自 動 構 築 41 本 章 の 内 容 は, 文 献 [48, 49]に 基 づいている. 3.1 概 要 大 規 模 なオントロジーの 構 築 は 情 報 検 索 やデータ 統 合 において 有 用 であり, 日 本 語 の 大 規 模 オントロジーとしては 日 本 語 WordNet [3]や 日 本 語 語 彙 大 系 [4] などが 存 在 している. しかし,これらは 手 動 で 構 築 されており, 構 築 コストが 大 きい.オントロジーの 手 動 構 築 には, 膨 大 な 時 間 がかかり, 間 違 いを 起 こしやすく,オントロジーの 保 守 や 更 新 が 困 難 と いう 問 題 がある.そこで, 近 年,オントロジー 工 学 のコミュニティは,オントロジー 開 発 コストを 削 減 するために,オントロジー 学 習 (Ontology Learning) と 呼 ばれる,( 半 ) 自 動 的 にオントロジーを 構 築 する 手 法, 方 法 論,アルゴリズム,ツールなどの 研 究 開 発 に 取 り 組 んできた. 特 に,フリーテキストからのオントロジー 学 習 に 関 しては, 機 械 学 習, 知 識 獲 得, 自 然 言 語 処 理, 情 報 検 索 など, 様 々な 専 門 分 野 の 手 法 を 組 み 合 わせた 手 法 がこれ まで 数 多 く 提 案 されている [5].しかしながら, 非 構 造 情 報 資 源 であるフリーテキストと 構 造 情 報 資 源 であるオントロジーの 間 のギャップは 大 きく, 高 精 度 で, 大 規 模 なオントロ ジーを 構 築 することは 困 難 であるのが 現 状 である. 一 方, 近 年,Web 上 の 百 科 事 典 である Wikipedia が, 新 たな 情 報 資 源 として 注 目 を 集 めている [10].Wikipedia は 語 彙 網 羅 性, 即 時 更 新 性 に 優 れており, 半 構 造 情 報 資 源 であ ることからフリーテキストと 比 べてオントロジーとのギャップが 小 さい.そのため, Wikipedia からのオントロジー 学 習 研 究 が 近 年, 盛 んに 行 われている.しかしながら, Wikipedia はユーザ 参 加 型 という 性 質 上, 厳 密 な 体 系 化 が 行 われていないため,Wikipedia からのオントロジー 学 習 にも, 多 くの 課 題 が 存 在 している. 加 えて,Wikipedia を 用 いた オントロジー 構 築 の 多 くはクラス 階 層 構 築 に 焦 点 を 当 てており,プロパティの 定 義 域 値 域 を 含 めたクラススキーマ 階 層 を 構 築 する 研 究 は 少 ない. そこで 本 論 文 では, 日 本 語 版 Wikipedia をリソースとして, 概 念 および 概 念 間 の 関 係 を 抽 出 する 事 で, 大 規 模 で 汎 用 的 であり,クラススキーマ 階 層 を 持 つオントロジーを 自 動 構 築 する 手 法 の 提 案 を 行 う. 以 降, 本 章 の 構 成 は 次 のとおりである.3.2 節 では, 日 本 語 Wikipedia オントロジーの 概 要 を 示 す.3.3 節 では, 日 本 語 Wikipedia オントロジーの 自 動 構 築 手 法 を 説 明 する.3.4 節 で 各 関 係 抽 出 手 法 についての 実 験 結 果 と 考 察 と,オントロジー 全 体 の 評 価 と 考 察 を 述 べ る. 最 後 にまとめと 今 後 の 課 題 について 述 べる.

56 42 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 3.2 日 本 語 Wikipedia オントロジーの 概 要 日 本 語 Wikipedia オントロジーは 日 本 語 版 Wikipedia から, 以 下 に 示 す 関 係 とタイプを 抽 出 し 自 動 構 築 される.ただし,() 内 は, 抽 出 した 関 係 に 対 応 する,OWL [19],RDFS[24], RDF [11], 日 本 語 Wikipedia オントロジーで 定 義 した 語 彙 (クラス 及 びプロパティ) を 示 す. 図 3.1 に 日 本 語 Wikipedia オントロジーの 概 略 図 を 示 した. (1) is-a 関 係 (rdfs:subclassof) (2) クラス-インスタンス 関 係 (rdf:type) (3) プロパティ 名 とトリプル( 以 下 のプロパティタイプを 含 む) (A) オブジェクトプロパティ(owl:ObjectProperty) (B) データタイププロパティ(owl:DatatypeProperty) (C) 対 称 関 係 プロパティ(owl:SymmetricProperty) (D) 推 移 関 係 プロパティ(owl:TransitiveProperty) (E) 関 数 関 係 プロパティ(owl:FunctionalProperty) (F) 逆 関 数 関 係 プロパティ(owl:InverseFunctionalProperty) (4) プロパティ 定 義 域 (rdfs:domain) (5) プロパティ 値 域 (rdfs:range) (6) プロパティ 上 位 下 位 関 係 (rdfs:subpropertyof) (7) 上 位 下 位 関 係 (jwo:hyper) (8) 関 連 語 同 義 語 (jwo:nearly) (9) 動 詞 とプロパティの 関 係 (jwo:verb) 図 3.1 日 本 語 Wikipedia オントロジーの 概 略 図

57 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 日 本 語 Wikipedia オントロジー 構 築 手 法 is-a 関 係 の 抽 出 Wikipedia には, 記 事 の 分 類 を 目 的 とした 階 層 的 なカテゴリが 存 在 する.しかし, 下 位 カテゴリと 上 位 カテゴリとの 関 係 は, 性 質 の 継 承 という 観 点 から 捉 えた is-a 関 係 ではな い 場 合 が 多 々 見 られる. 実 際 にカテゴリ 階 層 がどの 程 度 is-a 関 係 を 持 っているかを 知 るた めに, 日 本 語 版 Wikipedia のカテゴリ 関 係 のダンプデータから 1,000 個 の 標 本 を 抽 出 し, 下 位 カテゴリと 上 位 カテゴリがどのような 関 係 になっているのか 予 備 実 験 を 行 った.その 結 果,is-a 関 係 は 50.9%であった. 誤 りの 例 としては,アニメキャラクターとその 声 優 が 階 層 構 造 になっているものや,オリンピックメダリスト-オリンピックといった 人 物 と 事 象 が 階 層 関 係 になっているものなどが 多 く 見 られた.また,クラス-インスタンス 関 係 も 全 体 の 10.1%であり, スーパーマリオ や SONY といった ゲーム 作 品 や 企 業 クラスのインスタンスも 存 在 した. 以 上 の 予 備 実 験 の 結 果 から,Wikipedia カテゴリ 階 層 をそのまま is-a 関 係 に 利 用 する 事 は 困 難 である.そのため, 本 論 文 では is-a 関 係 を 以 下 の 3 つの 手 法 により 構 築 する. (1) カテゴリ 階 層 に 対 する 文 字 列 照 合 (2) カテゴリ 名 と Infobox テンプレートの 照 合 (3) 目 次 見 出 しのスクレイピング (1) カテゴリ 階 層 に 対 する 文 字 列 照 合 あるカテゴリから 相 対 的 に 下 位 に 存 在 するサブカテゴリは, 増 加 した 記 事 を 細 分 化 する ために 作 成 されるという 性 質 から, 上 位 カテゴリの 名 称 を 含 む 複 合 語 で 形 成 される 場 合 が 多 い. 例 えば 原 子 力 - 原 子 力 発 電 所 や ソフトウェア-フリーソフトウェア といっ た 階 層 である. 前 者 は 性 質 の 継 承 という 観 点 からみた is-a 関 係 としては 不 適 切 な 関 係 であ るが, 後 者 は is-a 関 係 に 相 当 する 関 係 となっている. 本 論 文 では,is-a 関 係 を 抽 出 するた めのカテゴリ 階 層 の 複 合 語 に 対 する 文 字 列 照 合 として, 後 方 文 字 列 照 合 と 前 方 文 字 列 照 合 部 除 去 を 行 う. 空 港 日 本 の 空 港 カテゴリ 階 層 サブカテゴリ 空 港 is-a 日 本 の 空 港 クラス 階 層 図 3.2 後 方 文 字 列 照 合

58 44 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 日 本 のスポーツ 選 手 サブカテゴリ 日 本 のゴルファー カテゴリ 階 層 スポーツ 選 手 is-a ゴルファー クラス 階 層 図 3.3 前 方 文 字 列 字 照 合 部 除 去 後 方 文 字 列 照 合 後 方 文 字 列 照 合 とはカテゴリ 階 層 を 構 成 する 親 カテゴリ 名 と 子 カテゴリ 名 とを 比 較 し, 子 カテゴリ 名 が 任 意 の 文 字 列 + 親 カテゴリ 名 となっているものを 抽 出 する 手 法 である. 図 3.2 の 例 では 空 港 という 文 字 列 の 後 方 文 字 列 照 合 により, 日 本 の 空 港 is-a 空 港 という 関 係 を 得 ることができる.この 手 法 は,Ponzetto ら [32]によって 実 践 されている 手 法 である.また,この 手 法 は 1 世 代 の 親 - 子 カテゴリリンクだけではなく,N 世 代 離 れ たカテゴリリンクにまで 適 用 することが 可 能 である. 例 としては, 心 理 学 - 精 神 医 学 - 分 析 心 理 学 といった 親 - 孫 のリンクからは 分 析 心 理 学 is-a 心 理 学 というリ ンクを 抽 出 できる. また,2 世 代 のカテゴリリンクまで 検 索 の 対 象 を 広 げて 文 字 列 マッチングを 適 用 し,ク ラス 階 層 の 抽 出 を 行 った. 前 方 文 字 列 照 合 部 除 去 前 方 文 字 列 照 合 部 除 去 とは 親 カテゴリ 名 と 子 カテゴリ 名 とを 比 較 し, 親 カテゴリ 名 と 子 カテゴリ 名 で 任 意 の 文 字 列 +の という 部 分 が 先 頭 から 一 致 しているものを 抽 出, 照 合 部 を 除 去 する 手 法 である. 図 3.3 の 例 では 日 本 の という 前 方 文 字 列 照 合 部 を 除 去 する ことにより, ゴルファー is-a スポーツ 選 手 という 関 係 を 得 ることができる.この 手 法 は, 文 字 列 の 重 複 に 依 存 しない is-a 関 係 を 取 得 できる 点 が 大 きな 利 点 である.この 手 法 も N 世 代 離 れたカテゴリリンクにまで 適 用 することが 可 能 である. (2) カテゴリ 名 と Infobox テンプレートの 照 合 Infobox は,テーブルを 利 用 して Wikipedia の 記 事 の 属 性 (Wikipedia では 主 に 項 目 と 呼 ばれている)と 属 性 値 を 整 理 して 表 示 しているもので, 記 事 の 中 にしばしば 掲 載 され ている.ここで 使 用 される 項 目 が,ドメインごとにある 程 度 フォーマット 化 されていると いうことが 大 きな 特 徴 である. 例 えば Java の 記 事 に 掲 載 されている Infobox には 開 発 者 や プラットフォーム などの 項 目 とそれぞれに 対 応 する 値 が 記 述 されており,こ の 開 発 者 や プラットフォーム という 項 目 は,Infobox のテンプレート プログラ ミング 言 語 で 定 められている. 本 手 法 は, 各 Infobox の 持 つ 抽 象 的 なテンプレート 名 と, 領 域 によっては 多 くの 具 体 的 な 概 念 を 持 つカテゴリ 名 との 関 係 に 着 目 する.テンプレート 名 とカテゴリ 名 の 照 合 を 行 い is-a 関 係 を 抽 出 する.is-a 関 係 の 抽 出 手 順 は 以 下 の1~4の 通 り 行 う.

59 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 45 1 カテゴリとテンプレートの 情 報 を MySQL に 格 納 2 カテゴリ 名 とテンプレート 名 の 単 純 文 字 列 照 合 3 照 合 したカテゴリ 以 下 に 存 在 するサブカテゴリ 名 と, 照 合 したテンプレートを 持 つ 記 事 が 所 属 する 全 てのカテゴリ 名 とのマッチング 4 マッチングによって 得 られたサブカテゴリ 名 をテンプレート 名 と is-a 関 係 が 成 り 立 つとして 抽 出 図 3.4 に,Infobox テンプレートとカテゴリ 名 の 照 合 による is-a 関 係 抽 出 の 具 体 例 を 示 す. 図 3.4 は, 楽 器 テンプレート, 楽 器 テンプレートを 用 いて 作 成 した Infobox を 持 つ ピアノ と フルート 記 事, ピアノ と フルート 記 事 が 所 属 するカテゴリ, カテゴリツリーとそれらの 間 の 関 係 を 示 している.まず, 楽 器 テンプレート 名 とカテゴ リツリーの 照 合 を 行 い, 楽 器 カテゴリを 同 定 する. 次 に, 楽 器 カテゴリのサブカテゴリ 名 と ピアノ および フルート 記 事 が 属 するカテゴリ 名 を 照 合 する.その 結 果, 鍵 盤 楽 器 is-a 楽 器, ピアノ is-a 鍵 盤 楽 器, 木 管 楽 器 is-a 楽 器, フルート is-a 木 管 楽 器 の 4 つの is-a 関 係 が 抽 出 できる.ここで, ピアノ is-a 鍵 盤 楽 器 と フ ルート is-a 木 管 楽 器 は, 文 字 列 照 合 では 抽 出 できない is-a 関 係 である. 以 上 の 手 順 を 行 うことによって,3 2 1(1)で 述 べた 文 字 列 の 特 性 を 利 用 した カテゴリ 階 層 に 対 する 文 字 列 照 合 では 抽 出 することのできなかった is-a 関 係 を 抽 出 できる.それに 伴 い, 正 し くない is-a 関 係 を 多 く 持 つ Wikipedia カテゴリツリーの 洗 練 が 可 能 になると 考 えられる. 図 3.4 Infobox テンプレートとカテゴリ 名 の 照 合

60 46 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 口 内 炎 = == * * == * * 分 類 = 細 菌 感 染 によるもの == カタル 性 口 内 炎 ジフテリア 性 口 内 炎 ウイルス 感 染 によるもの == 単 純 疱 疹 帯 状 疱 疹 カタル 性 口 内 炎 細 菌 感 染 によるもの Is-a ジフテリア 性 口 内 炎 口 内 炎 Is-a 単 純 疱 疹 ウイルス 感 染 によるもの Is-a 帯 状 疱 疹 = = 原 因 症 状 = = 図 3.5 目 次 見 出 しのスクレイピングによる is-a 関 係 の 抽 出 (3) 目 次 見 出 しのスクレイピング Wikipedia の 記 事 には 目 次 が 存 在 する.この 目 次 となる 見 出 し 語 に 着 目 し 柴 木 らはイン スタンスの 抽 出 を 行 っていた [37]. 本 手 法 では,カテゴリ 階 層 以 外 からの is-a 関 係 抽 出 法 として 目 次 見 出 しのスクレイピング を 用 いて,Wikipedia 記 事 の 見 出 し 構 造 から is-a 関 係 の 抽 出 を 試 みる.Wikipedia 各 記 事 の 目 次 は 階 層 化 された 記 述 が 見 られるが,その 上 位 と 下 位 の 関 係 は 必 ずしも is-a の 関 係 になっているわけではない. 例 えば 口 内 炎 とい う 記 事 は 分 類 - 細 菌 感 染 によるもの という 目 次 が 存 在 し, 細 菌 感 染 によるもの を 見 出 し 語 として カタル 性 口 内 炎, 壊 死 性 潰 瘍 性 口 内 炎 といった 項 目 が 箇 条 書 きされ ている. 一 方, カクテル という 記 事 は カクテルの 用 語 -カクテルの 用 具 という 目 次 が 存 在 し, カクテルの 用 具 を 見 出 し 語 として シェイカー, マドラー といった 項 目 が 箇 条 書 きされている. 前 者 はクラスの is-a 関 係 だが, 後 者 はクラス-インスタンス 関 係 となっている.そこで, 本 論 文 では 目 次 が 分 類 や 種 類 という 語 を 含 む 場 合 は is-a 関 係 となりやすいことに 着 目 し, 分 類 や 種 類 という 語 を 含 む 目 次 を 持 つ 記 事 をスク レイピングすることで is-a 関 係 の 抽 出 を 行 う. 具 体 的 な 手 法 を 表 しているのが 図 3.5 であ る. 口 内 炎 記 事 は 分 類 という 単 語 が 目 次 となっており,そこから 階 層 化 された 記 述 が 見 られ, ウイルス 感 染 と 細 菌 感 染 という 分 類 を 弁 別 属 性 として, カタル 性 口 内 炎 などが 箇 条 書 きされている.これらは 口 内 炎 を 最 上 位 の 概 念 として is-a 階 層 を 構 築 している クラス-インスタンス 関 係 の 抽 出 Wikipedia は 物 事 のリストが 記 述 された 記 事, 一 覧 記 事 をもつ. 例 えば, 言 語 の 一 覧 には 世 界 の 言 語 のリストが 記 述 されている. 文 章 表 現 を 工 夫 したり 細 かな 事 実 を 確 認 した

61 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 47 りする 必 要 がないために, 一 覧 記 事 の 執 筆 者 は 非 常 に 多 いと 考 えられる.このため 情 報 量 は 豊 富 であり,かつ 記 述 形 式 がある 程 度 統 一 されているため, 一 覧 記 事 から 大 規 模 なイン スタンスを 収 集 することが 可 能 である. しかし, 一 覧 記 事 はインスタンスを 収 集 するためには 不 要 な 情 報 を 含 んでいる. 本 実 験 では 一 覧 記 事 から 不 要 な 情 報 を 取 り 除 くための 手 法 としてスクレイピングを 行 うことによ って,インスタンスの 収 集 を 試 みる.ダンプデータの pages-articles.xml は 全 記 事 の xml テキストファイルであり, 図 3.6 が 示 すようになっている. 本 項 では, 一 覧 記 事 のソースに 対 してスクレイピングを 行 う. 以 下 (1)~(7)で,スクレイ ピングの 具 体 的 な 手 法 を 解 説 する. (1) 大 まかな 不 要 情 報 の 除 去 図 3.6 の a の page タグ title タグを 利 用 して, 一 覧 記 事 のテキスト 以 外 を 除 去 し,title タグ 部 分 も 除 去 する. 一 覧 記 事 では d のように * または # から 始 まる 行 ( 以 下, * 行 と 呼 ぶ)にインスタンスが 記 述 されており,c のように = で 囲 まれた 部 分 には インスタンスを 分 類 する 単 語 が 記 述 されている( 本 論 文 ではこれを 目 次 見 出 しと 呼 ぶ).こ の c,d を 残 し,b の * や = 以 外 から 始 まる 行 を 除 去 する. 図 3.6 中 の [[ ]] は, Wikipedia の 内 部 リンクを 表 している. 一 覧 記 事 の 中 には, * や # を 利 用 した 箇 条 書 きによる 記 述 ではなく,テーブル 形 式 でインスタンスを 列 挙 している 記 事 がある. 例 としては 内 閣 総 理 大 臣 の 一 覧 がある. この 記 述 形 式 は 多 数 存 在 し,インスタンスがどのように 列 挙 されているかのパターン 化 が 難 しい. 本 実 験 では,テーブル 形 式 でインスタンスが 記 述 されている 一 覧 記 事 からの 抽 出 は 行 わない. a b c d 図 3.6 一 覧 記 事 ソーステキストの 一 部

62 48 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 (2) (3) 日 本 の 地 域 別 鉄 道 路 線 の 一 覧 人 名 一 覧 (4) 日 本 の 映 画 監 督 一 覧 (5) 日 本 の 信 用 金 庫 一 覧 (6) 条 約 の 一 覧 図 3.7 一 覧 記 事 の 不 要 な 情 報 の 例 以 下 からは 図 3.7 に 示 される 例 のような,(1)で 抽 出 した * 行 に 存 在 する, 正 しいイ ンスタンスを 含 んではいない 行 を 除 去 していく. 以 下 (2)~(6)は, 図 3.7 の 例 に 対 応 してい る. (2) 一 覧 記 事 の 説 明 に 使 用 される * 行 を 除 去 一 覧 記 事 の 多 くは,インスタンスを 列 挙 する 前 に 一 覧 の 内 容 の 説 明 を 加 えたり, 類 似 し た 一 覧 記 事 へのリンクを 紹 介 したりしている. 図 3.7 のように,それらの 記 述 の 中 で 箇 条 書 きを 用 いる 場 合 も, * が 使 用 されていることになる.この 行 の 中 には 記 事 名 に 対 する インスタンスは 記 述 されていないため, 除 去 する 必 要 がある.このような * 行 は,タ イトルと 一 つ 目 の 目 次 見 出 しの 間 にある 場 合 がほとんどであるため,その 位 置 にある * 行 を 除 去 すればよい. (3) *~ 一 覧 と 同 じ 目 次 見 出 しの 下 位 にある * 行 を 除 去 図 3.7 を 見 ると, 日 本 の 哲 学 者 は 人 名 のインスタンスではないといったように, * 行 がタイトルに 対 するインスタンスになっていないことがわかる. 一 覧 記 事 中 には 閲 覧 者 の 利 便 性 向 上 のために 関 連 の 高 いページへのリンクが 列 挙 されている 部 分 があり, これが * 行 として 記 述 されてしまっている 場 合 がある.このような * 行 の 特 徴 は, 同 じ 目 次 見 出 しに 属 する * 行 のどれかに ~ 一 覧 という 文 字 列 を 含 んでいることで ある. 図 3.7 でも, 聖 書 学 者 の 一 覧 という * 行 が 同 じ 目 次 見 出 し 以 下 に 含 まれてい ることがわかる.このように ~ 一 覧 という 文 字 列 を 含 む * 行 を 特 定 し,それが 属 する 目 次 見 出 しに 属 する 行 をすべて 除 去 する. (4) 不 要 な 目 次 見 出 し 下 位 の * 行 を 除 去 ある 特 定 の 目 次 見 出 しに 属 する * 行 は,タイトルに 対 するインスタンスとしては 誤

63 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 49 りである.そのような 目 次 見 出 しの 条 件 は 関 連, 外 部, 備 考, 参 考, related, 凡 例, カテゴリ, 出 典, 特 記 事 項 を 含 むことである.これらのキーワードを 含 む 目 次 見 出 しに 属 する * 行 はすべて 除 去 する. (5) 不 要 な * 行 を 除 去 抽 出 した * 行 の 中 に 未 だ 存 在 する 不 適 な 行 で, 行 単 位 でパターン 化 できるものも 存 在 する. 不 適 な 行 のパターンとしては, *[[Wikipedia: から 始 まる, *[[:Category: から 始 まる, #REDIRECT から 始 まる, * 人 名 あ 行 のように, 五 十 音 のイン デックスをもつ, *[[~ 一 覧 ]], * 関 連 項 目 がある.このパターンに 当 てはまる * 行 を 除 去 する. (6) 不 要 な 年 号 記 述 部 分 を 除 去 (7)で 述 べるが,インスタンスは * や # の 直 後 に 配 置 されていることが 収 集 可 能 な 条 件 である. 図 3.7 のような 年 号 の 記 述 は 除 去 し,そのような 配 置 に 修 正 する. (7) * 行 からのインスタンスの 抽 出 (7)までのスクレイピングで,ほぼ 全 ての * 行 の 中 には 適 切 なインスタンスが 記 述 さ れているという 状 態 になった. 最 後 に, * 行 の 中 でどの 部 分 がインスタンスを 表 す 文 字 列 であるかを 特 定 する 六 つのパターンを 作 成 し,これに 従 ってインスタンス 以 外 の 部 分 を スクレイピングし, 最 終 的 に 記 事 名 で 表 されるクラスとインスタンスの 残 し,インスタン スを 収 集 する. 一 覧 記 事 では * や # の 直 後 にインスタンスが 配 置 されている 行 が 圧 倒 的 に 多 い. 逆 に * や # の 直 後 ではない 箇 所 にインスタンスが 配 置 されている 場 合,その 箇 所 の 特 定 は 難 しい.また, * や # の 直 後 といっても 何 文 字 目 までがインスタンスの1 語 を 表 しているかの 特 定 も 難 しい.このため, 図 3.8 が 示 す 六 つのパターンでは, 基 本 的 に * や # の 直 後 のリンク 記 号 [[ ]] に 着 目 してインスタンス 文 字 列 を 特 定 し, 抽 出 を 行 う.

64 50 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 1*[[ ]] 2*[[ ]] ()() 3*[[ ]] : 5*[[ ]] ()() : 4*[[ ]] - 6*[[ ]] ()() - 図 3.8 * 行 中 でインスタンス 箇 所 を 特 定 するパターン プロパティ 名 の 抽 出 本 項 では, 以 下 の 2 つの 手 法 を 用 いて,Wikipedia からプロパティ 名 の 抽 出 を 行 う. (1) Infobox のモデリングによるプロパティ 名 抽 出 (2) 記 事 のリスト 構 造 からのスクレイピングによるプロパティ 名 抽 出 (1) Infobox のモデリングによるプロパティ 名 抽 出 Infobox を 有 する 記 事 - 項 目 - 値 という 三 つ 組 は, インスタンス-プロパティ 名 - プロパティの 値 という 三 つ 組 と 捉 えることができる.そのため,Wikipedia ダンプデー タから 直 接 トリプルとして 記 事 タイトルごとのプロパティ 名 を 抽 出 できるが,いくつかの 問 題 点 が 存 在 する.まず,Media Wiki 書 式 から Infobox を 表 示 するための 構 造 上 の 問 題 がある.Infobox には 記 事 の 種 類 ごとにテンプレートが 存 在 し,かつ 英 語 Wikipedia のテ ンプレートを 利 用 できる.これは Media Wiki を 用 いて 日 本 語 と 英 語 で 完 全 互 換 性 をとっ ており,そのため 記 事 の 執 筆 者 が 簡 単 に 編 集 できるための 措 置 であるが,ダンプデータか らトリプルを 抽 出 する 際 には 英 語 表 記 と 日 本 語 表 記 でプロパティ 名 が 別 のものとなってし まう. 図 3.9 の 例 では, 記 事 ソース 内 には Genre という 単 語 が 述 語 になっているが, 実 際 の 記 事 では ジャンル に 変 換 される.このため, 記 事 ソースから 直 接 Infobox トリ プルを 抽 出 すると, ジャンル プロパティではなく, Genre プロパティとして 抽 出 し てしまう. 次 に, 全 てのプロパティの 値 をリテラルとして 抽 出 してしまうと,プロパティ のとる 値 がデータ 値 となるのかインスタンスとなるのかの 区 別 が 出 来 ず,プロパティタイ プがわからないという 問 題 がある. 図 3.9 の 例 では,ジャンルや 開 発 元 プロパティの 値 は owl:objectproperty によりインスタンスと 関 連 付 けるべきであるが, 人 数 プロパティの 値 は owl:datatypeproperty によりリテラルと 関 連 づけるべきである.

65 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 51 図 3.9 Infobox トリプルからのプロパティ 名 抽 出 の 一 例 以 上 2 つの 問 題 点 に 対 応 するため,40 種 類 の Infobox テンプレートにモデリングを 行 い, プロパティ 名 を 抽 出 する.ここでモデリングとは, 各 テンプレートのプロパティの 目 的 語 がインスタンスになるかリテラルになるか,また, 目 的 語 がリテラルになる 場 合 にはその データ 型 を 記 述 することを 意 味 する.この 際 用 いる Infobox テンプレート 数 を 40 と 指 定 したのは,2009 年 10 月 の Wikipedia ダンプデータにおいて,Infobox の 総 数 約 20 万 2000 個 に 対 し, 出 現 頻 度 が 高 かった 上 位 40 種 類 の Infobox テンプレートで 約 14 万 6000 個 ( 約 72%)の Infobox のモデリングが 行 えたためである. (2) 記 事 のリスト 構 造 からのスクレイピングによるプロパティ 名 抽 出 多 くの Wikipedia の 記 事 はリスト 構 造 を 有 している. 本 手 法 はこのリスト 構 造 に 着 目 し, 記 事 名 -リスト 構 造 の 見 出 し 語 -リスト 構 造 の 各 値 をトリプルと 据 えてプロパティ 名 を 抽 出 する.この 際 に, 各 記 事 が 属 するカテゴリを 照 合 し,カテゴリごとに 多 く 含 まれている 見 出 し 語 を 収 集 する.これにより, 記 事 が 属 するカテゴリをプロパティの 定 義 域 として 抽 出 することが 可 能 となる.ここで,リスト 構 造 の 各 値 とは Wikitext において * から 始 まる 箇 条 書 き 文 である. 抽 出 の 手 順 を(a)~(d)に 示 す. (a) ダンプデータから 記 事 ごとにカテゴリと 見 出 し 語 を 抽 出 (b) (a)で 抽 出 したデータから, 各 カテゴリの 見 出 し 語 の 出 現 頻 度 を 測 定 (c) (b)から 出 現 頻 度 が 少 ないものを 除 去 ( 今 回 は 5 以 下 を 除 去 した) (d) (c)で 得 た 見 出 し 語 をプロパティ 名 として, 記 事 毎 にリスト 構 造 の 各 値 を 抽 出 図 3.10 に, 記 事 のリスト 構 造 のスクレイピングによるプロパティ 名 抽 出 の 具 体 例 を 示 す.

66 52 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 図 3.10 記 事 のリスト 構 造 からのプロパティ 名 抽 出 の 一 例 図 3.10 は 芥 川 龍 之 介 記 事 から 見 出 し 語 著 作 をプロパティ 名 として,リスト 構 造 の 各 値 である 老 年, 羅 生 門, 芋 粥 などのプロパティ 値 を 抽 出 している.プロパテ ィ 値 羅 生 門 は, 前 述 した Infobox のモデリングによる 抽 出 法 から 抽 出 可 能 であるが, 老 年 や 芋 粥 は, 本 手 法 により 抽 出 可 能 な 値 である. 本 手 法 は,Infobox からは 抽 出 できないプロパティ 名 だけでなく,プロパティの 値 をトリプルとして 抽 出 することもで きる プロパティ 定 義 域 の 抽 出 項 で 述 べた 抽 出 法 で 得 たトリプルにおける 主 語 は, 記 事 名 をインスタンスとして 据 えていた.そのため, 主 語 である 記 事 が 属 するカテゴリを 調 べることで,プロパティの 定 義 域 を 定 義 できる 可 能 性 がある. 図 3.11 は, 記 事 Ruby が 属 するカテゴリが Infobox トリプルにおける 設 計 者 プロパティの 定 義 域 として 定 義 できる 可 能 性 があることを 表 している. 本 手 法 では 以 下 に 述 べる 手 順 でプロパティ 定 義 域 の 抽 出 を 行 う. まず,Infobox テンプレート 名 を,Infobox が 持 つ 各 プロパティの 定 義 域 として 抽 出 する. 次 に,3.3.1 項 (2)で 述 べた カテゴリ 名 と Infobox テンプレートの 照 合 により 得 た is-a 関 係 として 正 しいサブカテゴリを,テンプレートの 持 つ 各 プロパティの 定 義 域 として 対 応 付 ける.さらに,テンプレートで 定 義 されていないプロパティの 定 義 域 抽 出 を 試 みる. 実 際 に 記 事 に 記 載 された Infobox に 登 場 するプロパティは,テンプレートで 定 義 されて いるプロパティ 以 外 のものが 使 用 されるケースが 多 数 存 在 する. 例 えば, 有 機 化 合 物 と いうテンプレートで 定 義 されているプロパティは 構 造 式, 形 状, 沸 点 など 合 計 21 あるが, 実 際 の 記 事 に 掲 載 されている Infobox のソースから 収 集 したプロパティは, 揮 発 性, 臭 気, 蒸 気 圧 などテンプレートで 定 義 されていないものが 多 く 存 在 し, 合 計 33 のプロパティを 持 つ.

67 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 53 図 3.11 プロパティ 定 義 域 と 記 事 が 属 するカテゴリの 対 応 例 図 3.12 テンプレートで 定 義 されていないプロパティ 定 義 域 の 抽 出 そこで, 本 提 案 手 法 では,3.3.1 項 (2)で 述 べた 手 法 により 得 たサブカテゴリと,そのカ テゴリに 属 する 記 事 が 持 つ Infobox テンプレートで 定 義 されていないプロパティとの 関 係 に 着 目 する.Infobox テンプレートで 定 義 されていないプロパティは 項 (2)で 述 べた 手 法 により 得 たサブカテゴリのいずれかをドメインとする 可 能 性 があり,これらを 対 応 付 けることで, 各 プロパティの 定 義 域 として 最 上 位 の 概 念 であるテンプレート 名 が 得 られる だけではなく,より 具 体 化 し,ドメインに 特 化 したプロパティおよび 定 義 域 の 抽 出 が 可 能 になると 考 えられる. 図 3.12 がプロパティ 定 義 域 の 抽 出 手 法 の 全 体 像 である 項 (2) で 述 べた 手 法 により 得 たサブカテゴリと,この 記 事 が 属 するカテゴリを 比 較 することで, 新 たに 限 定 した 定 義 域 が 抽 出 できる.

68 54 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 プロパティ 値 域 の 抽 出 項 の 手 法 により 抽 出 した 各 プロパティから,プロパティ 値 域 の 抽 出 を 試 みる. Infobox トリプルにおいて 主 語 となるインスタンス 名 は 記 事 名 と 対 応 し,その 記 事 が 持 つ Infobox の 元 となる Infobox テンプレート 名 をプロパティ 定 義 域 とみなすことができるた め, 定 義 域 の 定 義 は 比 較 的 容 易 であった.しかし,プロパティ 値 域 は 目 的 語 となるインス タンスが 記 事 名 とは 断 定 できず, 定 義 域 のように 全 てのプロパティについて 定 義 すること は 難 しい.そこでプロパティ 値 域 の 抽 出 には, 以 下 の 2 つの 手 法 を 用 いる. (1) クラス-インスタンス 関 係 からの 抽 出 (2) is-a 関 係 からの 抽 出 (1) クラス-インスタンス 関 係 からの 抽 出 まず,3.3.3 項 で 抽 出 したトリプルの 目 的 語 (インスタンス)に 着 目 する.Wikipedia の 性 質 上,ある 単 語 が 既 存 記 事 名 と 対 応 する 場 合 には 該 当 記 事 にリンクされている 場 合 が 多 く,とりわけ Infobox トリプルにおける 値 に 既 存 記 事 名 が 含 まれている 場 合 には, 該 当 記 事 にリンクされている 可 能 性 が 高 い.また, 日 本 語 Wikipedia オントロジーでは, 記 事 名 はインスタンス 名 に 対 応 している.そこで,Infobox トリプルにおけるプロパティ 値 に 含 まれる 既 存 記 事 へのリンク(アンカーテキスト)と 日 本 語 Wikipedia オントロジーにお けるインスタンス 名 を 文 字 列 照 合 し, 照 合 したインスタンスのタイプ(クラス)をプロパ ティ 値 域 として 抽 出 する. (2) is-a 関 係 からの 抽 出 次 に, 先 の 手 法 では 抽 出 できないプロパティ 値 域 を 抽 出 するために, 前 述 した 手 法 と 同 様 に,トリプルの 目 的 語 となるインスタンスに 着 目 し,インスタンス 名 と 同 名 の 記 事 が 属 するカテゴリ 名 と 日 本 語 Wikipedia オントロジーにおいて 既 知 である is-a 関 係 のクラス 名 との 文 字 列 照 合 を 行 い, 照 合 したクラスを 値 域 として 抽 出 する.さらに 抽 出 したクラスの is-a 関 係 における 最 上 位 概 念 も 値 域 として 抽 出 する.これは, 値 域 として 定 義 されたクラ スがプロパティごとに 複 数 存 在 するため, 今 後, 上 位 概 念 に 統 合 する 際 の 指 標 となる. 図 3.13 がプロパティ 値 域 の 抽 出 法 の 一 例 である. 開 発 元 プロパティの 値 である 任 天 堂 はクラス-インスタンス 関 係 において 日 本 の 企 業 クラスに 属 するため,これを 値 域 として 抽 出 する.さらに, 任 天 堂 記 事 が 属 するカテゴリと 日 本 語 Wikipedia オン トロジーにおける is-a 階 層 を 照 合 し,カテゴリと 照 合 したクラスとその 最 上 位 概 念 となる Infobox テンプレート 名 (この 例 では 会 社 )を 値 域 として 抽 出 する.

69 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 55 図 3.13 プロパティ 値 域 の 抽 出 の 一 例 プロパティ 上 位 下 位 関 係 の 抽 出 Wikipedia の Infobox が 記 事 の 概 要 を 表 しているという Wikipedia の 特 徴 に 着 目 し, 項 (1)で Infobox から 抽 出 したプロパティ 名 と 項 (2)でリスト 構 造 から 抽 出 した プロパティ 名 の 上 位 下 位 関 係 の 抽 出 を 試 みる.まず,トリプルの 主 語 となるインスタンス ごとにリスト 構 造 から 抽 出 した 各 プロパティの 値 と Infobox から 抽 出 した 各 プロパティの 値 を 照 合 し,プロパティの 値 が 少 なくとも 1 つ 存 在 していた 場 合 に,リスト 構 造 から 抽 出 したプロパティ 名 を Infobox から 抽 出 したプロパティ 名 の 上 位 プロパティ 候 補 として 抽 出 する. 次 に, 先 ほど 抽 出 したプロパティ 候 補 の 上 位 プロパティと 下 位 プロパティの 定 義 域 と 値 域 を 照 合 し,どちらのプロパティにも 同 じ 定 義 域 と 値 域 が 存 在 していた 場 合 にプロパ ティの 上 位 下 位 関 係 として 抽 出 する. 図 3.14 がプロパティ 上 位 下 位 関 係 の 抽 出 の 一 例 である.トリプルの 主 語 である 芥 川 龍 之 介 は 項 (2)で 抽 出 した 著 作 プロパティと,その 値 である 老 年, 羅 生 門, 芋 粥 等 を 持 っており,さらに 項 (1)で 抽 出 した 代 表 作 プロパティと,その 値 である 羅 生 門, 鼻 等 を 持 っている.そのため, 上 位 プロパティとして 著 作, 下 位 プロパティとして 代 表 作 というプロパティ 上 位 下 位 関 係 候 補 を 得 る. 次 に,これらの 定 義 域 と 値 域 を 照 合 すると,どちらも 定 義 域 として 作 家, 値 域 として 日 本 の 小 説 を 持 っている.このため,プロパティの 上 位 下 位 関 係 として 著 作 - 代 表 作 という 関 係 が 抽 出 できる.

70 56 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 図 3.14 プロパティ 上 位 下 位 関 係 の 抽 出 の 一 例 プロパティタイプの 推 定 項 (1)の 手 法 で 抽 出 したプロパティは Infobox のモデリングにより,オブジェクト プロパティとデータタイププロパティの 分 類 がなされている. 本 手 法 ではオブジェクトプ ロパティとデータタイププロパティのプロパティタイプに 加 え,3.3.3 項 で 抽 出 したトリプ ルを 用 いて, 以 下 の 4 つのプロパティタイプの 推 定 を 行 う. (1) 対 称 関 係 プロパティ(owl:SymmetricProperty) (2) 推 移 関 係 プロパティ(owl:TransitiveProperty) (3) 関 数 関 係 プロパティ(owl:FunctionalProperty) (4) 逆 関 数 関 係 プロパティ(owl:InverseFunctionalProperty) ここで 対 称 関 係 プロパティとは, 主 語 X(n)-プロパティ P(n)- 目 的 語 Y(n)となるプロ パティ P(n)が 存 在 した 場 合 に,Y(n)-P(n)-X(n)も 成 り 立 つプロパティであり, 推 移 関 係 プロパティとは, 主 語 X(n)-プロパティ P(n)- 目 的 語 Y(n), 主 語 Y(n)-プロパティ P(n) - 目 的 語 Z(n),となるプロパティ P(n)が 存 在 した 場 合 に,X(n)-P(n)-Z(n)も 成 り 立 つプ ロパティであり, 関 数 関 係 プロパティとは,プロパティ P(n)について 全 ての 主 語 X から 目 的 語 Y(n)が 1 つに 決 まるプロパティであり, 逆 関 数 関 係 プロパティとは,P(n)について 全 ての 目 的 語 Y から 主 語 X(n)が 1 つに 決 まるプロパティである.

71 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 57 図 3.15 プロパティタイプの 抽 出 の 一 例 (1) 対 称 関 係 プロパティ(owl:SymmetricProperty) はじめに, 対 称 関 係 プロパティの 推 定 を 行 う 項 で 抽 出 した 各 プロパティ P(n)の 主 語 であるインスタンス X(n)とプロパティの 値 であるインスタンス Y(n)を 取 り 出 し,プロ パティ P(n)において Y(n)-P(n)-X(n)も 成 り 立 っていた 場 合 にプロパティ P(n)を 対 称 関 係 プロパティの 候 補 として 抽 出 する.さらに,プロパティ P(n)の 全 トリプル 数 A と 対 称 関 係 として 抽 出 したトリプル 数 αの 割 合 から 対 称 関 係 プロパティの 推 定 を 行 う. 図 3.15 にお いて, 親 族 プロパティは,そのトリプルである 小 泉 純 一 郎 - 親 族 - 小 泉 進 次 郎 と 小 泉 進 次 郎 - 親 族 - 小 泉 純 一 郎 という 対 称 関 係 が 成 立 している. (2) 推 移 関 係 プロパティ(owl:TransitiveProperty) 次 に, 推 移 関 係 プロパティの 推 定 を 行 う. 各 プロパティ P(n)の 主 語 であるインスタンス X(n)とプロパティの 値 であるインスタンス Y(n)を 取 り 出 し,さらに,インスタンス Y(n) とプロパティの 値 であるインスタンス Z(n)を 取 り 出 す.このプロパティ P(n)において X(n) -P(n)-Z(n)も 成 り 立 っていた 場 合 にプロパティ P(n)を 推 移 関 係 プロパティの 候 補 として 抽 出 する.さらに,プロパティ P(n)の 全 トリプル 数 A と 推 移 関 係 として 抽 出 したトリプル 数 αの 割 合 から 推 移 関 係 プロパティの 推 定 を 行 う. 図 3.15 において, 後 方 互 換 プロパ ティは 推 移 関 係 プロパティであり,そのトリプルとして PS3- 後 方 互 換 -PS2 と, PS2 - 後 方 互 換 -PS が 成 り 立 つとき, PS3- 後 方 互 換 -PS も 成 り 立 つ. (3) 関 数 関 係 プロパティ(owl:FunctionalProperty) 同 様 に 関 数 関 係 プロパティと 逆 関 数 関 係 プロパティの 推 定 を 行 う. 各 プロパティ P(n) の 主 語 X(n)と 目 的 語 Y(n)を 取 り 出 し,プロパティ P(n)において, 全 ての 主 語 X から 目 的

72 58 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 語 Y(n)が 特 定 できるとき,このプロパティ P(n)を 関 数 関 係 プロパティとして 抽 出 する. 図 3.15 において, 国 籍 プロパティは 関 数 関 係 プロパティであり,そのトリプルとして, 芥 川 龍 之 介 - 国 籍 - 日 本 や 夏 目 漱 石 - 国 籍 - 日 本 など, 全 トリプルにおいて,プロパ ティの 主 語 が 決 まれば,プロパティの 値 が 特 定 できる. (4) 逆 関 数 関 係 プロパティ(owl:InverseFunctionalProperty) 関 数 関 係 プロパティと 同 様 に, 全 ての 目 的 語 Y から 主 語 X(n)が 特 定 できるとき,このプ ロパティ P(n)を 逆 関 数 関 係 プロパティとして 抽 出 する. 図 3.15 では, 代 表 作 プロパテ ィは 逆 関 数 関 係 プロパティであり,そのトリプルとして, 芥 川 龍 之 介 - 代 表 作 - 羅 生 門 や 芥 川 龍 之 介 - 代 表 作 - 藪 の 中 など, 全 トリプルにおいて,プロパティの 値 が 決 まれ ば,プロパティの 主 語 が 特 定 できる jwo 語 彙 関 係 の 抽 出 ここまで 抽 出 した 大 規 模 オントロジー 構 築 のための 関 係 に 加 え,LOD としての 有 用 性 を 高 めるため, 下 記 の 3 つの 関 係 を 抽 出 する.これら 3 つの 関 係 はこれまでの 手 法 に 比 べ, 曖 昧 で 誤 りも 多 い.しかしながら,LOD として 公 開 した 場 合 に, 検 索 やデータの 対 応 付 け の 際 に 指 標 として 利 用 可 能 である. (1) 上 位 下 位 関 係 (jwo:hyper) (2) 関 連 語 同 義 語 (jwo:nearly) (3) 動 詞 とプロパティの 関 係 (jwo:verb) (1) 上 位 下 位 関 係 の 抽 出 項 と 項 で,クラス 及 びインスタンスを 明 確 に 定 義 しており, 上 位 下 位 関 係 を is-a 関 係 とクラス-インスタンス 関 係 に 分 類 していた.しかしながら, 上 位 のクラスを 持 たない 記 事 も 多 く 存 在 しているため, 新 たに 記 事 のアブストラクトから 上 位 下 位 関 係 を 抽 出 し,jwo:hyper 語 彙 により 関 係 を 定 義 する. 実 際 の 抽 出 手 順 は 次 のとおりである. (1) Wikipedia 記 事 の 最 初 の 段 落 をアブストラクトとして 抽 出 (2) いくつかのパターンから 記 事 名 を 下 位 語 とする 上 位 下 位 関 係 を 抽 出 (3) jwo:hyper を 語 彙 として 関 係 を 定 義 図 3.16 は 福 澤 諭 吉 の 記 事 のアブストラクトである. 多 くの Wikipedia の 記 事 には 図 の ように 記 事 名 (よみ 生 年 - 没 年 ) は 上 位 語 1 上 位 語 2 という 記 述 が 見 られ る.このようなパターンから 記 事 名 を 下 位 語 として 上 位 下 位 の 関 係 を 構 築 する. 結 果 として, 福 澤 諭 吉 記 事 から 著 述 家 蘭 学 者, トヨタ 自 動 車 記 事 から 自 動 車 メーカー, 吾 輩 は 猫 である 記 事 から 長 編 小 説 などを 上 位 語 として 抽 出 した.

73 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 59 図 3.16 福 澤 諭 吉 記 事 のアブストラクト (2) 関 連 語 同 義 語 の 抽 出 Wikipedia にはリダイレクトという 機 能 が 存 在 する.これは,あるページを 表 示 した 際 に 同 義 語 のページへ 自 動 的 にリンクさせる 機 能 である.リダイレクト 元 の 記 事 名 とリダイ レクト 先 の 記 事 名 との 関 係 は 同 義 語 の 関 係 にあり,Wikipedia のリダイレクト 情 報 を 利 用 することで 同 義 語 の 抽 出 が 可 能 となる. 実 際 に,Wikipedia ダンプデータから 313,527 の リダイレクトリンクを 抽 出 し,3.3.1 項 と 項 の 手 法 で 得 たクラスおよびインスタンス の 同 義 語 として, 約 10 万 の 語 彙 を 得 た. 表 3.1 に 正 しく 抽 出 した 同 義 語 の 例 を, 表 3.2 に 誤 って 抽 出 した 同 義 語 の 例 を 示 す. 抽 出 した 同 義 語 から 1,000 個 の 標 本 抽 出 を 行 い, 同 義 語 の 正 解 率 の 区 間 推 定 を 行 った. その 結 果, 正 解 率 の 95% 信 頼 区 間 は,67.0 ± 2.90%だった.リダイレクトリンクから 直 接, クラスおよびインスタンスにおける 同 義 語 を 高 精 度 に 抽 出 できないことがわかる. 同 義 語 としての 精 度 が 低 いため,よりゆるいリソース 間 をつなぐ 語 彙 として jwo:nearly を 用 いて 関 係 を 定 義 する.また,Infobox から 直 接 抽 出 した Infobox プロパティと 日 本 語 Wikipedia オントロジー 独 自 のプロパティの 関 係 も jwo:nearly 語 彙 により 定 義 する. 結 果 として, 福 澤 諭 吉 と 福 沢 諭 吉, スティーヴジョブス と スティーブジョブ ズ, 国 籍 プロパティと nationality プロパティなどを 関 連 語 同 意 語 の 関 係 として 抽 出 した. 表 3.1 正 しく 抽 出 した 同 義 語 の 例 クラス 名 インスタンス 名 ソフトウェア 工 学 イギリス 国 際 連 合 横 浜 ベイスターズ アメリカ 特 殊 作 戦 軍 同 義 語 ソフトウエア 工 学 英 国 UN 太 洋 ホエールズ SOCOM

74 60 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.2 誤 って 抽 出 した 同 義 語 の 例 クラス 名 インスタンス 名 同 義 語 誤 りの 内 容 アイドル 男 性 アイドル is-a 関 係 ビール 非 熱 処 理 ビール is-a 関 係 イタリアの 戦 車 L5/30 クラス-インスタンス 関 係 警 察 警 察 力 has-a 関 係 社 会 科 学 部 社 会 科 学 科 has-a 関 係 (3) 動 詞 とプロパティ 関 係 の 抽 出 プロパティトリプルを 用 いて,Wikipedia 記 事 内 の 文 章 から 同 一 の 目 的 語 が 出 現 する 文 に 注 目 し,その 文 中 の 動 詞 を 抽 出 する.これにより,プロパティと 意 味 的 に 近 い 動 詞 が 抽 出 できる 可 能 性 があり, 今 後 プロパティの 表 記 揺 れ 問 題 の 対 策 に 利 用 できる. 本 関 係 は jwo:verb 語 彙 により 表 記 する. 例 えば, 日 本 語 Wikipedia オントロジーの 周 辺 情 報 プロパティを 含 むトリプルの 目 的 語 は 文 中 で 位 置 する 隣 接 する といった 動 詞 と 共 に 出 現 することが 多 い.こうしたプロパティと 動 詞 を jwo:verb により 対 応 付 ける. 結 果 とし て, 先 の 周 辺 情 報 プロパティと 位 置 する 隣 接 する, 発 売 元 プロパティと 発 売 する 販 売 する, 掲 載 誌 プロパティと 掲 載 する などを 抽 出 した 抽 出 した 関 係 の 洗 練 本 項 では,3.3.2 項,3.3.3 項 で 抽 出 した 以 下 の 2 つの 関 係 を 洗 練 することで, 精 度 の 向 上 を 行 う. (1) クラス-インスタンス 関 係 の 洗 練 (2) プロパティ 定 義 域 値 域 の 洗 練 (1) クラス-インスタンス 関 係 の 洗 練 項 で 述 べたように,クラス インスタンス 関 係 は 一 覧 記 事 のスクレイピングにより 構 築 している. 本 手 法 によって 抽 出 したクラス 名 は 一 覧 記 事 名 となるため, 例 えば, 芥 川 龍 之 介 インスタンスは 日 本 の 小 説 家 クラスに 属 していることとなる. 本 手 法 は 多 くのクラス インスタンス 関 係 を 抽 出 することが 可 能 になるが, 日 本 の 小 説 家, アメリ カの 小 説 家 といった,クラス 階 層 にハイブランチ 構 造 を 生 じさせる 問 題 がある. 事 前 実 験 として,Wikipedia ダンプデータから 抽 出 した 10,854 の 一 覧 記 事 のうち, 日 本 の か らはじまる 記 事 は 624 であった.このような 国 名 や 地 域 名 + 格 助 詞 の +クラス 名 となるクラスは 多 く,これらがハイブランチ 構 造 を 生 む 要 因 となっている.ハイブランチ 構 造 によりプロパティ 定 義 域 値 域 の 洗 練 の 際 に, 問 題 が 生 じるため,まずこの 除 去 を 行 う. 実 際 の 除 去 の 手 順 は 次 のとおりである.

75 3.3 日 本 語 Wikipedia オントロジー 構 築 手 法 61 図 3.17 クラス-インスタンス 関 係 の 洗 練 の 一 例 (1) クラス インスタンス 関 係 のクラス 名 に 注 目 し, 格 助 詞 の が 含 まれるクラス 名 を 抽 出 (2) (1) で 抽 出 したクラスに 含 まれるインスタンスのうちプロパティの 値 が 格 助 詞 の の 前 方 部 となっているプロパティを 抽 出 (3) (2) から 出 現 頻 度 が 少 ないものを 除 去 ( 今 回 は 5 以 下 を 除 去 した) (4) 格 助 詞 の の 後 方 部 を 新 たなクラス インスタンス 関 係 として 抽 出 (5) プロパティとプロパティの 値 を 持 たないインスタンスは 抽 出 した 関 係 を 補 完 図 3.17 は, 本 手 法 の 一 例 である. 日 本 の 小 説 家 クラスには 芥 川 龍 之 介, 夏 目 漱 石, 秋 元 康 など 多 くのインスタンスが 属 している.まずクラス 名 の 格 助 詞 の に 注 目 し,クラスに 属 するインスタンスのプロパティの 値 に 日 本 が 含 まれるプロパティを 抽 出 する. 多 くのインスタンスは 国 籍 プロパティを 持 っており,その 値 は 日 本 に なっている.そこで,クラス 名 から 日 本 を 除 去 し, 新 たに 小 説 家 クラスのインスタン スとして 定 義 する.さらに,これまでの 日 本 の 小 説 家 クラスのインスタンスのうち 国 籍 プロパティとその 値 日 本 を 持 っていないインスタンス(この 例 では 秋 元 康 インス タンス) にその 関 係 を 補 完 する. (2) プロパティ 定 義 域 値 域 の 洗 練 日 本 語 Wikipedia オントロジーの 多 くのプロパティ 定 義 域 はリーフとなるクラスに 偏 っ ているという 問 題 がある.これは,プロパティ 抽 出 をインスタンス( 記 事 名 ) をベースに 行 っていることに 起 因 する.インスタンスは 主 にリーフクラスに 属 するため, 各 記 事 がもつ プロパティはリーフクラスに 直 接 定 義 されてしまう. 例 えば, 野 球 選 手 である イチロー というインスタンスは 日 本 語 Wikipedia オントロジーにおいて 日 本 のプロ 野 球 選 手 と いうクラスに 属 しているため, イチロー (および 他 の 日 本 のプロ 野 球 選 手 ) が 持 つ 国 籍 や ポジション や 年 度 別 打 撃 成 績 といったプロパティは, 日 本 のプロ 野 球 選 手

76 62 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 クラスを 定 義 域 として 持 つ. 同 様 に, 日 本 のサッカー 選 手 クラスのインスタンスが 持 つ 国 籍 や 生 年 月 日 や ポジション といったプロパティは 日 本 のサッカー 選 手 クラスを 定 義 域 とし, 小 説 家 クラスのインスタンスが 持 つ 国 籍 生 年 月 日 処 女 作 受 賞 歴 といったプロパティは 小 説 家 クラスを 定 義 域 として 持 つ.しかし, 生 年 月 日 や 国 籍 といったプロパティは 本 来 人 物 クラスに 定 義 されるべきものであ る.そして 人 物 クラスにそれらが 定 義 できれば,クラス 階 層 を 利 用 して 上 位 クラスか らプロパティ 継 承 を 用 いることで, 人 物 クラスの 下 位 にあるクラスは 人 物 クラス のプロパティセットを 継 承 することができる.そこで,プロパティを 持 つインスタンスと クラス インスタンス 関 係 を 用 いて, 各 プロパティをクラスに 紐 付 けし, 親 子 クラス 及 び 兄 弟 クラスに 紐 付 けされたプロパティを 参 照 する.これにより, 定 義 域 を 上 位 クラスに 統 合 (リフトアップ) が 可 能 になり, 先 の 問 題 を 解 消 する.しかしながら, 本 手 法 の 問 題 とし て,is-a 階 層 のハイブランチ 構 造 により,リフトアップがうまくいかないことがあった. そこで, 本 手 法 を 3.3.9(1)の 手 法 を 用 いて 新 たに 抽 出 した 定 義 域 値 域 に 適 用 することで, リフトアップ 精 度 をあげるとともに,これまで 行 っていなかった 値 域 にも 洗 練 を 行 う. 図 3.18 がプロパティ 定 義 域 値 域 の 洗 練 の 一 例 である. 3.4 実 験 と 考 察 本 節 では,はじめに 3.3 節 で 提 案 した 各 手 法 に 関 する 実 験 と 評 価 考 察 を 述 べる. 次 に, 日 本 語 Wikipedia オントロジー 全 体 の 評 価 と 考 察 を 述 べる. 本 実 験 における 実 験 環 境 を 表 3.3 に 示 す.なお, 本 章 の 実 験 は,2010 年 11 月 時 点 の Wikipedia ダンプデータをダ ウンロードして 行 った. 図 3.18 プロパティ 定 義 域 値 域 の 洗 練 の 一 例

77 3.4 実 験 と 考 察 63 表 3.3 実 験 環 境 CPU Intel Core i7 2.80GHz メモリ 16.0GB OS Windows 7 開 発 言 語 Java DBMS MySQL is-a 関 係 の 抽 出 結 果 と 考 察 (1) カテゴリ 階 層 に 対 する 文 字 列 照 合 による is-a 関 係 の 抽 出 結 果 と 考 察 実 験 の 結 果, 総 カテゴリ 数 91,316 個 のカテゴリを 持 つカテゴリ 階 層 から 後 方 文 字 列 照 合 によって 7,971 個, 前 方 文 字 列 照 合 部 除 去 によって 4,587 個, 計 12,558 個 の is-a 関 係 を 抽 出 した. 抽 出 した 12,558 個 の 母 集 団 の 中 から 1,000 個 の 標 本 を 抽 出 し, 正 誤 を 判 定 した.その 結 果 から 式 1[56]を 利 用 して 真 の 正 解 率 の 95% 信 頼 区 間 を 算 出 すると,93.1 ± 1.51%という 結 果 が 得 られた. 式 1において N は 母 数,n は 標 本 数, は 真 の 正 解 率 の 推 定 量 であり, 正 解 の 標 本 数 を 総 標 本 数 で 割 ったものである. 表 3.4 および 表 3.5 にそれぞ れ 後 方 文 字 列 照 合, 前 方 文 字 列 照 合 部 除 去 で 抽 出 されたリンクの 例 を 提 示 する. 表 3.6 は 誤 りの 例 とその 内 容 を 表 している. [ pˆ n N 1 pˆ n pˆ 1 pˆ pˆ n 1, pˆ N n 1 ] 1 表 3.4 後 方 文 字 列 照 合 で 抽 出 した is-a 関 係 の 例 親 クラス 俳 優 高 速 道 路 高 速 鉄 道 魚 介 料 理 魚 類 鳥 類 子 クラス アトラクション 俳 優 各 国 の 高 速 道 路 台 湾 高 速 鉄 道 日 本 の 魚 介 料 理 軟 骨 魚 類 絶 滅 鳥 類

78 64 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.5 前 方 文 字 列 照 合 部 除 去 で 抽 出 した is-a 関 係 の 例 親 クラス 食 品 メーカー 武 器 麺 料 理 輸 送 機 器 子 クラス 製 パン 業 者 刀 剣 焼 きそば 自 動 車 表 3.6 文 字 列 照 合 で 抽 出 した is-a 関 係 の 誤 りの 例 親 クラス 子 クラス 間 違 いの 内 容 グローバリゼーション 反 グローバリゼーション 反 非 などを 含 む 文 庫 富 士 見 ミステリー 文 庫 クラスーインスタンス 高 速 道 路 ジャンクション Has-a 関 係 経 済 企 業 抽 象 的 な 語 が 親 教 育 の 歴 史 旧 制 教 育 機 関 抽 象 的 な 語 が 親 文 化 アニメ 作 品 抽 象 的 な 語 が 親 歴 史 政 治 抽 象 的 な 語 が 親 社 会 事 件 抽 象 的 な 語 が 親 地 理 建 築 物 抽 象 的 な 語 が 親 全 体 的 な 正 解 率 としては 良 い 結 果 を 得 た. 表 3.4, 表 3.5 より, 後 方 文 字 列 照 合 では 複 合 語 からなる is-a 関 係 を 抽 出 できており, 前 方 文 字 列 照 合 部 除 去 では 文 字 列 に 依 存 しない is-a 関 係 の 抽 出 ができていることがわかる.しかし 汎 用 オントロジーとしての 階 層 の 規 模 としてはまだ 小 さい. 次 に 誤 りの 内 容 について 考 察 する. 表 3.6 の 1 つ 目 の 誤 りは, 反 や 非 などの 否 定 語 が 子 クラスの 先 頭 にくる 場 合 に, 後 方 文 字 列 照 合 により 誤 った is-a 関 係 を 抽 出 した 例 を 示 している. 表 3.6 の 2 つ 目 の 誤 りは, 後 方 文 字 列 照 合 により,クラ ス-インスタンス 関 係 を 誤 って 抽 出 した 例 を 示 している.Wikipedia では, 有 名 なインス タンスはカテゴリ 化 され,クラスに 相 当 するカテゴリと 下 位 カテゴリ 上 位 カテゴリの 関 係 が 構 築 されることがある.そのような 場 合, 後 方 文 字 列 照 合 により,is-a 関 係 ではなく クラス-インスタンス 関 係 を 誤 って 抽 出 することがある. 表 3.6 の 3 つ 目 の 誤 りは,Has-a 関 係 を 誤 って 抽 出 した 例 を 示 している. 表 3.6 の 4 つ 目 以 降 の 誤 りは, 経 済 - 企 業 のよ うに 抽 象 的 なクラスが 親 クラスとなっている 場 合 に, 誤 った is-a 関 係 を 抽 出 した 例 を 示 し ている. 抽 象 的 なクラスとは,Wikipedia カテゴリ 階 層 の 上 位 に 存 在 するカテゴリに 相 当 する. 日 本 語 版 Wikipedia のカテゴリ 階 層 は, 上 位 オントロジーのように 物 ごとの 厳 密 な 分 類 がなされておらず, 学 問, 技 術, 自 然, 社 会, 地 理, 人 間, 文 化, 歴 史 に 総 記 を 加 えた 9 の 主 要 カテゴリ がルートカテゴリとなっている.これらの ルートカテゴリとその 直 下 のカテゴリの 間 には,is-a 関 係 として 不 適 切 な 関 係 が 多 く 存 在 する. 抽 象 的 なクラスを 親 クラスに 持 つ 場 合 に, 誤 った is-a 関 係 を 抽 出 した 理 由 は,

79 3.4 実 験 と 考 察 65 Wikipedia では, 上 記 で 示 した 9 つのルートカテゴリは 分 類 の 基 幹 となっているため,ル ートカテゴリに 修 飾 語 を 追 加 したカテゴリが 数 多 く Wikipedia カテゴリ 中 に 存 在 するため である. 例 えば, 表 3.6 の 4 つ 目 の 誤 りの 例 では, 日 本 の 経 済 (ルートカテゴリ 経 済 に 日 本 の という 修 飾 語 を 追 加 したカテゴリ)と 日 本 の 企 業 という 上 位 下 位 カテ ゴリの 関 係 から, 前 方 文 字 列 照 合 部 除 去 により 経 済 is-a 企 業 という 誤 った is-a 関 係 を 抽 出 している. (2) カテゴリ 名 と Infobox テンプレートの 照 合 による is-a 関 係 の 抽 出 結 果 と 考 察 Wikipedia ダンプデータから 889 種 類 の Infobox テンプレートおよび 212,419 の Infobox を 抽 出 した. 表 3.7 に 頻 出 Infobox テンプレートおよびその Infobox テンプレー トを 用 いて 作 成 された Infobox を 掲 載 している 記 事 数 を 示 す.また,3.3.1 項 (2)で 述 べた 手 法 を 用 いた 結 果 を 以 下 の 表 3.8 にまとめる. 表 3.8 に 示 すように, 結 果 として 3,782 の is-a 関 係 が 抽 出 できた.テンプレート 名 とカ テゴリ 名 が 照 合 したカテゴリ( 以 下, 本 稿 ではルートカテゴリと 呼 ぶ)は 216 存 在 し, 各 ルートカテゴリにおいて Infobox を 持 つ 記 事 が 属 するカテゴリ 群 と 照 合 したサブカテゴリ を 持 つルートカテゴリは 157 であった.3 割 程 度 のルートカテゴリから is-a 関 係 が 抽 出 で きなかった 原 因 の 大 部 分 は,ルートカテゴリの 中 に オリンピック[ 国 名 ] 選 手 団 ([ 国 名 ] には, アメリカ や 日 本 などが 入 る)など,サブカテゴリを 1 つも 持 たないルート カテゴリが 存 在 したからである.Infobox を 持 つ 記 事 が 属 するカテゴリ 群 と 照 合 した 157 のルートカテゴリにおける 全 サブカテゴリ 数 は 50,107 個 であった.しかし, 国, 経 済, 解 剖 学 の 3 つのルートカテゴリで 42,468 個 を 占 めていた.この 原 因 として, 国, 経 済 は 概 念 として 抽 象 的 であり,Wikipedia では 各 国 の 人 物 などの 多 くの 国 に 関 係 す るカテゴリが 下 位 カテゴリとして 記 述 される 傾 向 があるためである. 解 剖 学 については 人 体 の 部 位 の 他, 解 剖 学 に 用 いられるコンピュータ 機 器 等 の 多 くの 関 係 する 概 念 がカテゴ リとして 記 述 されているためだと 考 えられる. 上 記 3 つのルートカテゴリから 抽 出 した is-a 関 係 数 は 518 個 であり,ルートカテゴリの 全 サブカテゴリからの 抽 出 率 は 非 常 に 低 い. 表 3.7 Infobox テンプレート 名 と 掲 載 記 事 数 基 礎 情 報 会 社 13,717 Infobox Album 11,984 駅 情 報 11,363 生 物 分 類 表 8,517 ActorActress 8,103 サッカー 選 手 7,750 Single 6,861 Baseball Player 6,672 Musician 6,645

80 66 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.8 Infobox テンプレート 名 とカテゴリ 名 の 照 合 結 果 Wikipediaカテゴ Infoboxテンプレ テンプレート 名 と is-a 関 係 として 抽 リの 数 ートの 種 類 カテゴリ 名 の 照 合 出 されたサブカテ 数 ゴリ 数 91, ,782 表 3.9 にカテゴリ 名 と Infobox テンプレートの 照 合 による is-a 関 係 抽 出 結 果 の 一 部 を 示 す.なお, 表 3.9 の 再 現 率 は,is-a 関 係 が 正 しく 成 り 立 つと 人 手 によって 判 断 した 各 ルー トカテゴリ 以 下 のサブカテゴリを 正 解 集 合 として 算 出 した. また, 国, 経 済, 解 剖 学 の 3 つのルートカテゴリについては, 上 記 で 述 べたように,サブカテゴリ 数 が 多 く, 再 現 率 の 算 出 が 困 難 なため, 表 3.9 の 評 価 結 果 には 反 映 していない. 抽 出 した is-a 関 係 から 1,000 個 の 標 本 抽 出 を 行 い, 式 1を 用 いて, 正 解 率 の 区 間 推 定 を 行 った. 正 解 率 の 95% 信 頼 区 間 は 93.2 ± 1.34%であり,9 割 以 上 の 精 度 で is-a 関 係 が 抽 出 できた. 楽 器 を 例 に 挙 げると, 項 (1)で 述 べた 文 字 列 照 合 による 手 法 では 抽 出 で きない ピアノ や トランペット などの 下 位 概 念 が 抽 出 できている. 先 の 国, 経 済, 解 剖 学 の 3 つのルートカテゴリを 含 めた 場 合 の 正 解 率 は 95.6 ± 1.09%であり,こ ちらも 9 割 以 上 の 精 度 で is-a 関 係 が 抽 出 できている. 再 現 率 に 関 しては 68.7%という 結 果 を 得 た. 日 本 の 温 泉 地 のように, 抽 出 した is-a 関 係 が 正 解 集 合 と 完 全 一 致 したケース もあるが, 新 聞 のように, 正 解 の is-a 関 係 がサブカテゴリ 以 下 に 38 存 在 しているにも 関 わらず, 抽 出 した is-a 関 係 は 4 であったケースもあった. 再 現 率 が 低 くなった 理 由 とし て,Wikipedia 全 記 事 数 に 対 して,Infobox を 持 つ 記 事 数 が 3 割 程 度 しかないことが 挙 げ られる. 全 体 の 記 事 に 対 して,Infobox を 持 つ 記 事 が 少 ないため,Infobox を 持 つ 記 事 が 属 するカテゴリを 網 羅 的 に 獲 得 することができず,is-a 関 係 の 抽 出 漏 れが 発 生 していると 考 えられる.また,カテゴリツリーは 正 しい is-a 関 係 を 多 数 含 むものの, 性 質 の 継 承 という 観 点 から 捉 えた 際,is-a 関 係 とは 呼 べないその 他 の 関 係 も 同 時 に 多 く 含 んでいる. 先 ほど 述 べた 国, 経 済, 解 剖 学 の 3 つのルートカテゴリおける 全 サブカテゴリについて, 1,000 の 標 本 を 抽 出 し,is-a が 成 立 する 割 合 を 人 手 により 調 べた 結 果, 約 7.2%であった. サブカテゴリを 多 く 持 つルートカテゴリは,そのほとんどが 間 違 って 記 述 された 下 位 カテ ゴリから 派 生 したもので 占 めていることがわかる.したがって, 提 案 手 法 を 用 いてより 多 くの is-a 関 係 を 抽 出 し, 再 現 率 を 高 めるためには, 洗 練 された 階 層 を 持 つカテゴリに 対 し て,それぞれのカテゴリに 属 する 記 事 の Infobox を 増 やすことが 効 果 的 であると 考 えられ る.そのためには,Wikipedia の 記 事 の 編 集 において, 記 事 に 与 えるべきカテゴリと Infobox が 完 全 に 独 立 している 現 状 を 変 える 必 要 がある. 例 えば,ユーザが 記 事 に 対 して 属 するカ テゴリを 追 加 する 際 に 関 連 する Infobox を 追 加,また,Infobox を 追 加 した 際 には 関 連 す るカテゴリを 追 加,といったようなカテゴリと Infobox の 自 動 連 携 など, 両 者 の 対 応 関 係 を 増 加 させる 仕 組 みの 検 討 が 必 要 である.

81 3.4 実 験 と 考 察 67 表 3.9 カテゴリ 名 と Infobox テンプレートの 照 合 により 抽 出 した is-a 関 係 の 評 価 ルートカテゴリ 名 抽 出 したサ ブカテゴリ 数 抽 出 したサブカ テゴリのis-a 正 答 率 正 しいis-aと 判 断 された 数 再 現 率 サッカークラブ 有 機 化 合 物 テニス 選 手 日 本 の 温 泉 地 サッカー 選 手 無 機 化 合 物 平 均 (3) 目 次 見 出 しのスクレイピングによる is-a 関 係 の 抽 出 結 果 と 考 察 Wikipedia ダンプデータから 目 次 に 分 類 種 類 が 含 まれる 記 事 10,124 記 事 におい てスクレイピングを 行 った 結 果, 83,288 個 の is-a 関 係 を 抽 出 した. 抽 出 した is-a 関 係 の ルートの 概 念 数 は 6,370 個,リーフ 数 は 55,081 個, 全 概 念 数 は 73,837 個 であった. 表 3.10 に 抽 出 した is-a 関 係 の 例 を 示 す. 表 3.11 に 下 位 概 念 数 が 多 いルート 概 念 の 例 を 示 す. 表 3.10 目 次 見 出 しのスクレイピングで 抽 出 した is-a 関 係 の 例 親 クラス コケ 植 物 木 材 パルプ 医 療 用 ロボット 哲 学 子 クラス ゼニゴケ 植 物 門 N 材 介 護 ロボッ 論 理 哲 学 表 3.11 下 位 概 念 数 が 多 いルート 概 念 の 例 ルート 概 念 ルート 概 念 に 含 まれる 下 位 概 念 の 数 カード 1,176 ゲーム 131 北 西 太 平 洋 岸 のインディアン 91 ニベ 科 66 ハタネズミ 属 47

82 68 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.12 目 次 見 出 しから 抽 出 した is-a 関 係 の 誤 りの 例 ルート 概 念 リーフ 概 念 までのis-a 階 層 構 造 阪 神 電 気 鉄 道 阪 神 電 気 鉄 道 - 分 類 について- 前 期 大 型 車 戦 争 戦 争 - 自 衛 権 の 容 認 理 由 暗 号 参 考 :コードの 例 - 例 1 ピアノ ピアノ-その 他 図 書 館 日 本 の 国 立 図 書 館 - 国 立 国 会 図 書 館 新 潟 県 新 潟 県 - 経 済 - 情 報 インフラ 抽 出 した is-a 関 係 から 1,000 個 の 標 本 抽 出 を 行 い, 式 (1) を 用 いて, 正 解 率 の 区 間 推 定 を 行 った.その 結 果, 正 解 率 の 95% 信 頼 区 間 は,72.6 ± 2.74%であった. 正 解 率 が 他 の is-a 関 係 抽 出 法 に 比 べ 低 くなっている 原 因 としては, 目 次 見 出 しから 抽 出 した is-a 階 層 には, その 他 などのコンテキストに 依 存 したクラスが 含 まれているためである. 例 えば, ピ アノ-その 他 といった is-a 関 係 が 目 次 見 出 しから 抽 出 できるが,ここでいう その 他 は その 他 のピアノ の 省 略 であり,コンテキストを 考 慮 して, 補 完 を 行 うことにより, 妥 当 な is-a 関 係 に 洗 練 できる 場 合 もある.そこで 新 たに, 抽 出 した is-a 階 層 構 造 のルート 概 念 からリーフ 概 念 までを 1 個 の 標 本 として,1,000 個 の 標 本 抽 出 を 行 い, 正 解 率 の 区 間 推 定 を 行 った.その 際, その 他 などコンテキストに 依 存 するクラスについては, 補 完 を 行 うことで 正 しいクラスに 修 正 した 上 で 評 価 を 行 った. 正 解 率 の 95% 信 頼 区 間 は,86.1 ± 2.13%であった 項 (1) 及 び 項 (2)で 述 べた 手 法 では 得 ることのできない パーソ ナルコンピュータ-デスクトップパソコン や 寿 司 - 巻 き 寿 司 - 太 巻 といった is-a 階 層 関 係 が 抽 出 できている. また, 抽 出 した 概 念 は 表 3.10 を 見 ると 分 かるように, 遊 戯 に 関 するもの,インディアン に 関 するもの, 生 物 の 分 類 体 系 に 関 するものが 多 かった.カードが 多 くなっている 理 由 と して,カードゲームに 関 する 概 念 も 含 まれているためと 考 えられる.インディアンや 生 物 分 類 に 関 する 概 念 が 多 い 理 由 は,Wikipedia のアメリカ 州 の 先 住 民 族 の 記 事 や 生 物 に 関 す る 記 事 は 綺 麗 な 階 層 的 記 述 が 多 いため, 今 回 の 抽 出 法 と 相 性 がよく, 比 較 的 多 い 概 念 を 抽 出 できたからである. 表 3.12 に 目 次 見 出 しから 抽 出 した is-a 関 係 の 誤 りの 例 を 表 す. 誤 りは,スクレイピン グのルールが 不 足 していることによるものが 大 部 分 を 占 めていた. 表 3.10 の 1 つ 目 と 2 つ 目 は, 分 類 種 類 は 含 まれていたが,その 後 に 説 明 文 が 箇 条 書 きされていたために, 誤 って 抽 出 した is-a 関 係 の 例 である. 表 3.10 の 3 つ 目 と 4 つ 目 は, 箇 条 書 きから is-a 関 係 を 抽 出 するためのスクレイピングのルールが 不 足 していたために, 誤 って 抽 出 した is-a 関 係 の 例 である.スクレイピングのルールの 不 足 以 外 に, 表 3.10 の 5 つ 目 のようにクラス -インスタンス 関 係 や 6 つ 目 のように 抽 象 的 な 概 念 を 含 むために, 誤 って is-a 関 係 を 抽 出 するケースもあった.

83 3.4 実 験 と 考 察 69 したがって, 提 案 手 法 による is-a 階 層 関 係 の 正 解 率 を 上 げるためにはより 厳 密 なスクレ イピングルールを 追 加 する 必 要 があると 考 えられる.しかし,is-a 関 係 の 抽 出 数 としては 項 (1) 及 び 項 (2)で 抽 出 できた is-a 関 係 数 のおよそ 5 倍 の 関 係 が 抽 出 できており, 規 模 としては 非 常 に 大 きいといえる クラス-インスタンス 関 係 の 抽 出 結 果 と 考 察 Wikipedia ダンプデータから 抽 出 した 8,796 の 一 覧 記 事 に 対 してスクレイピングを 行 い, クラス インスタンス 関 係 の 抽 出 を 行 った. 取 得 したインスタンスは 323,024 個, 一 覧 記 事 の 記 事 名 から 生 成 したクラス 数 は 2,902 個,クラス-インスタンス 関 係 数 は 421,989 で あった.また, 抽 出 したクラス-インスタンス 関 係 から 1,000 個 の 標 本 抽 出 および 正 誤 判 定 を 行 い, 式 1を 用 いて 正 解 率 の 区 間 推 定 を 行 った.その 結 果, 正 解 率 の 95% 信 頼 区 間 は, 97.2 ± 1.02%と 高 精 度 であった. 表 3.13 に 正 しく 抽 出 したクラス-インスタンス 関 係 の 例 を 示 す. 表 3.14 に 誤 って 抽 出 したクラス-インスタンス 関 係 の 例 を 示 す. インスタンスを 多 く 持 つクラスの 例 としては, 日 本 の 声 優 クラスが 3,658 個, 日 本 の 漫 画 家 クラスが 2,854 個, 日 本 の 男 優 クラスが 2,321 個 といったように, 人 物 のインスタン ス 数 が 圧 倒 的 に 多 い.これは Wikipedia 一 覧 記 事 が 人 物 のコンテンツを 特 に 多 く 持 つとい うことをよく 反 映 している 結 果 である.しかし, 表 3.13 に 示 す 例 のように, 人 物 以 外 のク ラス-インスタンス 関 係 も 数 多 く 抽 出 できている. 例 えば, 日 本 の 峠 クラスのインスタン スは 3,180 個, アメリカ 海 軍 駆 逐 艦 クラスのインスタンスは 2,144 個, 抽 出 できた. 表 3.13 正 しく 抽 出 したクラス-インスタンスの 例 クラス 楽 器 推 理 作 家 映 画 監 督 国 鉄 JRの 車 両 形 式 プログラミング 言 語 インスタンス ラッパ 松 本 清 張 ジョージ ルーカス クキ1000 Java 表 3.14 インスタンスの 誤 りの 例 クラス インスタンス 言 語 :en:ngumba language 千 葉 県 の 神 社 熊 野 神 社 ( 坂 田 ) 国 際 競 技 連 盟 相 撲 世 界 一 ハヤブサ スポーツ 競 技 野 球

84 70 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 誤 りは,スクレイピングのルールが 不 足 していることによるものが 大 部 分 を 占 めていた. 表 3.14 の 1 つ 目 と 2 つ 目 は,Wikipedia の 言 語 リンクを 表 す :( 言 語 コード): とい う 記 述 を 除 去 するスクレイピングのルールおよび () の 注 釈 を 除 去 するスクレイピング のルールが 不 足 していたために 生 じた 誤 りの 例 である. 表 3.14 の 3 つ 目 と 4 つ 目 は, * や # ではじまる 行 の 中 のどの 部 分 がインスタンスを 表 しているかを 特 定 するためのス クレイピングのルールが 不 足 していたために 生 じた 誤 りの 例 である.スクレイピングのル ールの 不 足 以 外 にも, 表 3.14 の 5 つ 目 の 誤 りのように is-a 関 係 を 誤 って 抽 出 するケース も 見 受 けられた プロパティ 名 の 抽 出 結 果 と 考 察 (1) Infobox トリプルからのプロパティ 名 の 抽 出 結 果 と 考 察 Wikipedia のダンプデータから 項 (1)で 提 案 した 手 法 により,7,137 のプロパティ 名 と 1,962,411 のトリプルを 抽 出 し,Infobox を 持 つ 記 事 のうちトリプルの 主 語 として 抽 出 したインスタンス 数 は 171,190 であった. 表 3.15 に Infobox トリプルから 抽 出 したプ ロパティ 名 のうち, 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 を 示 す. 表 3.15 より, 利 用 頻 度 が 高 いプロパティ 名 の 多 くは owl:objectproperty となっている. この 原 因 として, 英 語 記 述 からの 変 換 過 程 において 変 換 が 十 分 ではなく, 抽 出 できなかっ たものが 多 いことや,モデリングが 不 十 分 だったためにスクレイピングが 適 切 に 行 えなか ったことなどが 考 えられる.owl:DatatypeProperty の 例 としては 生 年 月 日 プロパティ, リリース プロパティ, 資 本 金 プロパティ, 身 長 プロパティなどがあった.これ らの owl:datatypeproperty は,Infobox テンプレートの 利 用 頻 度 が 高 い, 人 物,Album, Single, 会 社, 駅 などに 多 く 見 られる. 表 3.15 Infobox から 抽 出 した, 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 プロパティ 名 トリプル 数 プロパティのタイプ 所 在 地 59,751 owl:objectproperty 本 社 所 在 地 36,373 owl:objectproperty 出 身 地 30,042 owl:objectproperty 生 年 月 日 25,108 owl:datatypeproperty ジャンル 22,239 owl:objectproperty

85 3.4 実 験 と 考 察 71 全 7,137 のプロパティ 名 のうち,モデリングを 行 った 40 個 の Infobox テンプレートか ら 313 のプロパティ 名 について,owl:ObjectProperty と owl:datatypeproperty の 分 類 が できた.これら 313 のプロパティ 名 を 持 つトリプル 数 は 1,329,549 であった. 上 記 モデリ ングにより,67.8%のトリプルを 分 類 できた. 誤 りの 多 くはスクレイピングミスであり, 特 にプロパティ 値 に URL が 記 述 されている 際 のスクレイピングミスが 多 かった.また, モデリングにより 分 類 できたプロパティ 名 であっても, 主 要 株 主 プロパティの 値 のよう に, 複 数 の 値 が 混 在 するために 誤 りが 生 じるケースも 見 られた.( 例 えば,SONY の 場 合 には, 主 要 株 主 プロパティの 値 として, Moxley and Company, 日 本 トラスティ サ ービス 信 託 銀 行 ( 株 )( 信 託 口 ),State Street Bank and Trust Company を 抽 出 したが, これらは,3 つのトリプルに 分 けて 抽 出 すべきである.) (2) 記 事 のリスト 構 造 からのプロパティ 名 の 抽 出 結 果 と 考 察 Wikipedia のダンプデータから 項 (2)で 提 案 した 手 法 により,3,980 のプロパティ 名 と 2,919,470 のトリプルを 抽 出 し,トリプルの 主 語 として 抽 出 したインスタンス 数 は 233,247 個 であった. 表 3.16 に, 記 事 のリスト 構 造 から 抽 出 したプロパティ 名 のうち, 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 を 示 す. 先 の 手 法 では 抽 出 できない 表 3.16 のような 多 くのトリプルを 持 つプロパティ 名 を 抽 出 できた.2,919,470 のトリプルから 1,000 個 の 標 本 を 抽 出 し, 正 解 率 の 区 間 推 定 を 行 った. その 結 果, 正 解 率 の 95% 信 頼 区 間 は,92.5±1.63%であった. 誤 りの 多 くはスクレイピング ミスであり,リスト 構 造 の 各 行 に 多 くの 情 報 が 記 述 されている 場 合 に 誤 ったトリプルを 抽 出 している. 表 3.16 のプロパティ 名 を 例 にとると, 収 録 曲 プロパティは 歌 手 のアルバ ムやシングルの 記 事 に 多 く 見 られるが,これらには 収 録 曲 以 外 にも 作 詞 者 や 作 曲 者,リリ ース 年 といった 情 報 も 記 載 されている 場 合 が 多 く, 収 録 曲 プロパティの 値 として 作 詞 者 や 作 曲 者,リリース 年 が 取 れてしまっていた.しかし, 記 事 が 属 するカテゴリごとに,こ うした 構 造 はいくつかに 絞 られるため,より 詳 細 なリスト 構 造 のルールを 追 加 することで, これらの 誤 りを 取 り 除 く 事 ができる 可 能 性 がある. 表 3.17 に,3.3.3 項 (1)と 項 (2)の 両 方 の 手 法 により 抽 出 したプロパティ 数,トリプ ル 数, 主 語 となるインスタンス 数,トリプルの 正 解 率 を 示 す. 表 3.16 記 事 のリスト 構 造 から 抽 出 した, 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 プロパティ 名 トリプル 数 スタッフ 136,033 キャスト 102,617 テレビドラマ 70,839 映 画 69,690 収 録 曲 66,841

86 72 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 つの 手 法 により 抽 出 したプロパティ 数,トリプル, 主 語 となるインスタンス 数, トリプルの 正 解 率 手 法 プロパティ 数 トリプル 数 インスタンス 数 正 解 率 Infoboxトリプルから 7,137 1,962, , ± 1.33% 記 事 のリスト 構 造 から 3,980 2,919, , ± 1.63% 2つの 手 法 10,769 4,867, , ± 1.44% 表 3.17 より,Infobox からの 抽 出 法 と 記 事 のリスト 構 造 からの 抽 出 法 を 合 わせ, 重 複 を 除 外 すると,10,769 のプロパティ 名 について,4,867,882 ものトリプルが 抽 出 できている. 全 4,867,882 のトリプルの 正 解 率 は 94.3 ± 1.44%であり, 記 事 のリスト 構 造 からの 抽 出 法 により,Infobox からの 抽 出 法 に 比 べ, 多 少 正 解 率 は 下 がったものの,プロパティ 数 とし て 約 1.5 倍,トリプル 数 として 約 2.5 倍 も 増 加 している.さらに,Infobox からの 抽 出 法 と 記 事 のリスト 構 造 からの 抽 出 法 により, 重 複 を 除 外 すると,319,742 個 のインスタンスを トリプルの 主 語 として 抽 出 しており,Infobox を 持 たない 148,552 個 の 記 事 をトリプルの 主 語 であるインスタンスとして 追 加 できている プロパティ 定 義 域 の 抽 出 結 果 と 考 察 項 の 手 法 により 抽 出 した 10,769 のプロパティ 名 に 対 して,3.3.4 項 で 提 案 した 手 法 を 行 った 結 果,9,486 のプロパティ 定 義 域 が 抽 出 できた.Infobox から 抽 出 したプロパテ ィ 名 は Infobox テンプレートを 定 義 域 として 持 つため, 全 てのプロパティ 名 について 定 義 域 を 定 義 でき,さらにリスト 構 造 から 抽 出 したプロパティ 名 のうち,1,888 のプロパティ 名 について 定 義 域 を 定 義 できた. 全 体 として,8,831 のプロパティ 名 について 定 義 域 を 定 義 できたため,82%のプロパティ 名 が 定 義 域 を 持 つ 事 になる.9,486 のプロパティ 定 義 域 から 1,000 個 の 標 本 を 抽 出 し, 式 1を 利 用 して 正 解 率 の 95% 信 頼 区 間 を 算 出 した.その 結 果, 正 解 率 の 95% 信 頼 区 間 は,94.8 ± 1.22%だった. 表 3.18 にプロパティ 名 とプロパティ 定 義 域 のうち, 主 語 となるインスタンスを 多 く 持 つ 上 位 5 つのプロパティ 名 と 定 義 域 を 示 す. 表 3.18 プロパティ 名 とプロパティ 定 義 域 の 例 プロパティ 名 プロパティ 定 義 域 主 語 となるインスタンス 数 スタッフ テレビ 番 組 26,251 キャスト ドラマ 21,140 スタッフ ドラマ 10,871 施 設 道 の 駅 10,088 著 書 文 学 9,299

87 3.4 実 験 と 考 察 73 表 3.18 より,プロパティ 定 義 域 が 複 数 定 義 されている 場 合 に,それらの 共 通 上 位 クラス が 定 義 域 として 定 義 されていない 問 題 があることがわかる. 例 えば, 表 3.18 では スタッ フ プロパティは テレビ 番 組 クラスを 定 義 域 として 持 つが, スタッフ プロパティは ドラマ クラスも 定 義 域 として 持 っており,この 他 にも ラジオ 番 組, 野 球 チーム など 多 くのクラスを 定 義 域 として 持 っている.このような 複 数 の 定 義 域 を 持 つプロパティ 名 は 多 く 存 在 しており,より 上 位 のクラスに 統 合 するべきである プロパティ 値 域 の 抽 出 結 果 と 考 察 (1) クラス-インスタンス 関 係 からの 抽 出 法 による 結 果 と 考 察 項 (1)のクラス-インスタンス 関 係 からの 抽 出 法 により,4,007 のプロパティ 名 につ いて 値 域 を 定 義 でき,プロパティ 名 と 値 域 の 関 係 数 は 14,053 であった.14,053 のプロパ ティ 値 域 の 関 係 数 から 1,000 個 の 標 本 を 抽 出 し, 式 1を 利 用 して 正 解 率 の 95% 信 頼 区 間 を 算 出 した.その 結 果, 正 解 率 の 95% 信 頼 区 間 は,88.3 ± 1.92%だった. 表 3.19 に 利 用 頻 度 が 高 い 上 位 5 つのプロパティ 名 と 値 域 を 示 す. 表 3.19 より, テレビアニメ プロパティの 値 域 として 深 夜 アニメ や キャスト プロパティの 値 域 として 日 本 の 男 優 などドメインに 特 化 した 値 域 が 見 られる. 国 籍 プロパティの 値 域 として 島 国 が 抽 出 されている 理 由 は, 日 本 語 版 Wikipedia には 日 本 人 の 記 事 が 多 く,これらの 人 物 の 多 くは 国 籍 として 日 本 を 持 っており,さらに 日 本 語 Wikipedia オントロジーのクラス-インスタンス 関 係 において, 日 本 というインスタンス が 島 国 というクラスに 属 しているためである. 誤 りの 例 としては, 国 籍 プロパティの 値 域 として 世 界 各 国 の 著 作 権 保 護 期 間 や 民 族 衣 装 といったクラスが 抽 出 されていた ことが 挙 げられる.これは,Wikipedia の 世 界 各 国 の 著 作 権 保 護 期 間 や 民 族 衣 装 の 一 覧 記 事 の 記 述 において 国 名 が 箇 条 書 きされており,クラス-インスタンス 関 係 抽 出 に おいて 誤 った 関 係 を 抽 出 してしまったことが 原 因 である.プロパティ 値 域 の 定 義 における 誤 りの 多 くは,クラス-インスタンス 関 係 定 義 の 誤 りから 生 じているため,クラス-イン スタンス 関 係 の 精 度 を 上 げることで 値 域 の 精 度 も 上 がると 考 えられる. 表 3.19 クラス-インスタンス 関 係 を 用 いたプロパティ 値 域 抽 出 法 により 抽 出 した 利 用 頻 度 が 高 い 値 域 の 例 プロパティ 名 利 用 インスタンス 数 プロパティ 値 域 テレビアニメ 23,195 日 本 の 漫 画 作 品 キャスト 20,633 日 本 の 男 優 テレビアニメ 15,956 深 夜 アニメ キャスト 12,821 日 本 の 女 優 国 籍 11,569 島 国

88 74 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.20 is-a 関 係 を 用 いたプロパティ 値 域 抽 出 法 により 抽 出 した 値 域 の 例 プロパティ 名 利 用 インスタンス 数 プロパティ 値 域 キャスト 44,766 存 命 人 物 キャスト 43,532 日 本 の 俳 優 出 演 者 22,175 存 命 人 物 映 画 16,370 日 本 の 映 画 作 品 出 演 者 12,236 日 本 の 俳 優 (2) is-a 関 係 からの 抽 出 法 による 結 果 と 考 察 次 に,3.3.5 項 (2)の is-a 関 係 からの 抽 出 法 を 用 いて, 値 域 の 抽 出 を 行 った.3,234 のプ ロパティ 名 について 値 域 を 定 義 でき,35,946 のプロパティ 名 と 値 域 の 関 係 を 抽 出 した. 35,946 のプロパティ 値 域 の 関 係 数 から 1,000 個 の 標 本 を 抽 出 し, 式 1を 利 用 して 正 解 率 の 95% 信 頼 区 間 を 算 出 した.その 結 果, 正 解 率 の 95% 信 頼 区 間 は,92.1 ± 1.65%だった. 表 3.20 に is-a 関 係 を 用 いたプロパティ 値 域 抽 出 法 により 抽 出 したプロパティ 値 域 のうち,ト リプルを 多 く 持 つプロパティ 名 の 上 位 5 つを 示 す. 利 用 頻 度 が 高 い 値 域 の 殆 どが キャスト プロパティなどの 目 的 語 として 俳 優 を 中 心 と した 人 物 をインスタンスにするもの, 所 属 事 業 者 プロパティなどの 目 的 語 として 鉄 道 駅 に 関 するインスタンスを 持 つもの, 国 籍 プロパティなどの 目 的 語 として 国 名 をインスタ ンスとするものであり,そのため, 値 域 も 国, 人 物, 鉄 道 関 係 のクラスとなるものが 多 い. しかし,クラス-インスタンス 関 係 を 用 いた 抽 出 法 では 抽 出 できない, 在 籍 チーム プロ パティの 値 域 として サッカークラブ のような,より 抽 象 的 な 値 域 が 抽 出 されている 事 が 特 徴 である. 誤 りの 例 としては, 優 勝 回 数 プロパティや 宿 泊 施 設 数 プロパティの 値 域 として 数 学 に 関 する 記 事 が 抽 出 されていた.これはモデリングが 不 十 分 なために 生 じた 誤 りであ り, 本 来 はプロパティタイプが owl:datatypeproperty になるため, 値 域 はリテラル (rdfs:literal)となる.さらに, 収 録 曲 プロパティの 値 域 として 存 命 人 物 が 定 義 され ていた.これは 項 (2)で 述 べたリスト 構 造 のルール 不 足 により, 誤 って 抽 出 したトリ プルが 原 因 であり,このような 大 本 のトリプルが 原 因 となり 抽 出 してしまった 誤 った 値 域 は is-a 関 係 からの 抽 出 だけでなく,クラス-インスタンス 関 係 からの 抽 出 にも 見 られる. さらに, 定 義 域 と 同 様 の 問 題 も 存 在 する. 表 3.20 では キャスト プロパティは 日 本 の 俳 優 クラスを 値 域 として 持 つが, キャスト プロパティはこの 他 にも イギリスの 俳 優, 日 本 出 身 の 人 物 など 多 くのクラスを 値 域 として 持 っている. 定 義 域 と 同 様 に, 今 後 は 上 位 クラスへの 統 合 を 検 討 する 必 要 があるが, 出 演 者 プロパティの 値 域 である 存 命 人 物 などあまりに 抽 象 的 すぎる 概 念 になってしまっているものもあり,オントロジーとし ての 利 用 を 考 慮 した 際 に,どのレベルまで 統 合 するべきなのかも 併 せて 検 討 する 必 要 があ る.

89 3.4 実 験 と 考 察 75 図 3.19 出 現 数 n と 上 位 下 位 関 係 数 及 び 正 答 率 プロパティ 上 位 下 位 関 係 の 抽 出 結 果 と 考 察 項 で 提 案 した 手 法 により,2,322 の 上 位 下 位 関 係 の 候 補 を 抽 出 し,そのうち 定 義 域 と 値 域 が 共 通 であるものは 1,387 であった.1,387 のプロパティ 上 位 下 位 関 係 について, 手 作 業 ですべてのプロパティ 上 位 下 位 関 係 の 正 誤 を 測 定 した 結 果, 正 答 率 は 57.5%であっ た.そこで,それぞれの 上 位 下 位 関 係 について, 上 位 下 位 関 係 が 出 現 する 記 事 数 を 数 え, 出 現 数 と 正 答 率 の 関 係 を 計 測 した. 図 3.19 に 出 現 数 n 以 上 となる 上 位 下 位 関 係 数 及 び 正 答 率 を 示 す. 図 3.19 より, 出 現 数 n と 上 位 下 位 関 係 数 は 反 比 例 をしているが, 正 答 率 は 出 現 数 が 18 以 上 の 時 に 最 も 高 く,75.7%となっている. 表 3.21 に 上 位 下 位 関 係 の 例 を 示 す. キャスト や スタッフ といったテレビや 映 画 に 関 するプロパティ 上 位 下 位 関 係 が 非 常 に 多 かった.また, 祭 神 - 主 祭 神 や 作 品 - 代 表 作 のような 主 や 代 表 と った 語 を 含 む 関 係 も 多 い.さらに, 関 連 会 社 - 主 要 子 会 社 のように 関 連 という 語 を 含 む 関 係 も 多 い. 表 3.21 プロパティ 上 位 下 位 関 係 の 例 上 位 プロパティ 名 下 位 プロパティ 名 出 現 頻 度 キャスト 出 演 者 2,082 スタッフ 監 督 1,919 スタッフ 脚 本 1,514 祭 神 主 祭 神 237 関 連 会 社 主 要 子 会 社 227

90 76 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 誤 りの 例 としては, 主 要 株 主 - 主 な 株 主 のように, 同 じ 意 味 となるプロパティ 名 を 上 位 下 位 として 抽 出 してしまっているものが 最 も 多 い.これは,Infobox に 羅 列 された 情 報 が 記 事 内 でも 同 義 の 見 出 し 語 として 出 現 しており,プロパティ 名 抽 出 の 際 に 別 々のプロパ ティ 名 として 抽 出 してしまったためである.また, 学 科 - 学 部 のように 上 位 と 下 位 が 逆 となっているものもあった.これは,そもそもの Infobox のテンプレートに 学 科 という 項 目 が 無 いために, 記 者 は 新 たに 学 科 項 目 を 追 加 するのではなく, 学 部 項 目 に 学 科 を 列 挙 す るケースが 多 く,このため Infobox からのプロパティ 名 抽 出 の 際 に 学 部 プロパティの 値 として 各 学 科 が 抽 出 されており,それが 影 響 している 誤 りである プロパティタイプの 抽 出 結 果 と 考 察 項 で 提 案 した 手 法 により,3.4.3 項 で 抽 出 した 4,867,882 のトリプルを 用 いて, 10,769 のプロパティ 名 からプロパティタイプの 推 定 を 行 う. (1) 対 称 関 係 プロパティの 推 定 結 果 と 考 察 はじめに, 対 称 関 係 プロパティの 推 定 を 行 った 項 (1)で 提 案 した 手 法 により, 全 トリプルから 対 称 関 係 が 成 立 するトリプルのペアは 10,927 組 であった.このトリプルか ら,415 の 対 称 関 係 プロパティの 候 補 を 抽 出 した.415 の 対 称 関 係 プロパティ 候 補 を 手 作 業 ですべて 正 誤 判 定 した 結 果, 正 答 率 は 45.1%であった.さらに, 全 トリプル 数 と 対 称 関 係 として 抽 出 したトリプル 数 の 割 合 から 対 称 関 係 プロパティの 推 定 を 行 う. 今 回 は 既 に 手 作 業 により 対 称 関 係 プロパティを 抽 出 しているが,この 作 業 は 次 回 以 降 のプロパティタイ プの 自 動 推 定 の 際 の 指 標 となる. 図 3.20 にトリプルが 含 まれる 割 合 x 以 上 となる 対 称 関 係 プロパティ 数 及 び 正 答 率 を 示 す. 図 3.20 包 含 率 x と 対 称 関 係 プロパティ 数 及 び 正 答 率

91 3.4 実 験 と 考 察 77 表 3.22 対 称 関 係 プロパティとその 対 称 関 係 数, 全 トリプル 数, 包 含 率 の 一 例 対 称 関 係 プロパティ 対 称 関 係 数 全 トリプル 数 包 含 率 類 似 の 表 彰 記 章 隣 接 する 星 座 相 方 関 連 学 校 接 続 道 路 2,720 11, 図 3.20 より, 包 含 率 が 0.1 程 度 に 増 えると 正 答 率 は 8 割 程 度 に 上 がるが,それ 以 降 は 包 含 率 を 増 やしても 正 答 率 はあまり 上 がらないことがわかる.プロパティ 数 は 包 含 率 に 反 比 例 して 減 ることがわかる. 表 3.22 に 抽 出 した 対 称 関 係 プロパティとその 対 称 関 係 数, 全 ト リプル 数, 包 含 率 の 一 例 を 示 す. 表 3.22 より, 最 も 包 含 率 が 高 かったものは 類 似 の 表 彰 記 章 プロパティであった.こ のプロパティは 表 彰 記 章 記 事 に 存 在 するプロパティであり, 消 防 庁 長 官 表 彰 功 績 章 - 類 似 の 表 彰 記 章 - 消 防 庁 長 官 表 彰 特 別 功 労 章 といったトリプルを 作 っている. 本 手 法 によっ て 抽 出 した 対 称 関 係 プロパティの 多 くは 隣 接 する 正 座, 関 連 学 校, 接 続 する 道 路 のような 隣 接, 接 続, 関 連 といった 語 を 含 むプロパティが 多 い.しかし, 相 方 や 姉 妹 校, 親 族 のような 上 記 の 語 を 含 まないプロパティも 抽 出 されている. さらに, 包 含 率 0.5 以 上 のとき, 抽 出 した 34 の 対 称 関 係 プロパティについて,トリプル の 補 完 を 行 った.ここで,トリプルの 補 完 とは, 対 称 関 係 プロパティを 持 つトリプルにお いて, 一 方 向 のトリプルから 両 方 向 のトリプルを 定 義 する 事 である.この 結 果, 新 たに 55,887 のトリプルを 抽 出 した. 例 えば, 奈 良 公 園 - 周 辺 情 報 - 奈 良 国 立 博 物 館, おと め 座 - 隣 接 する 星 座 -うみへび 座 のようなトリプルを 補 完 できた.どちらのトリプルも 項 の 手 法 では 一 方 向 のトリプルしか 抽 出 できておらず, 実 際 の Wikipedia の 奈 良 公 園 記 事 には 周 辺 情 報 として 奈 良 国 立 博 物 館 は 存 在 しておらず, 奈 良 国 立 博 物 館 記 事 にのみ 存 在 している. おとめ 座 記 事 も 同 様 である. (2) 推 移 関 係 プロパティの 推 定 結 果 と 考 察 次 に, 推 移 関 係 プロパティの 推 定 を 行 った 項 (2)で 提 案 した 手 法 により, 全 トリ プルから 推 移 関 係 が 成 立 するトリプルは 340 組 であった.この 際, 対 称 関 係 プロパティと なるものは 除 外 している.このトリプルから,210 の 推 移 関 係 プロパティの 候 補 を 抽 出 し, 手 作 業 ですべて 正 誤 判 定 を 行 ったが, 推 移 関 係 プロパティと 思 われるプロパティを 見 つけ る 事 ができなかった. 包 含 率 が 最 も 高 いものでも,わずか 3 割 ほどしかなく, 誤 りの 中 に は 対 称 関 係 プロパティとなりうる 関 連 や 隣 接 といった 語 を 含 むプロパティも 多 い. 推 移 関 係 数 が 最 も 多 かったものは トレーナー プロパティで,その 値 は 54 であった. ト レーナー プロパティはプロレスラーやボクサーといった 格 闘 家 全 般 の 記 事 に 見 られるプ

92 78 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 ロパティであり, 複 数 の 人 物 に 教 わっている 場 合 が 多 いために 推 移 関 係 プロパティ 候 補 と して 抽 出 されているが, トレーナー プロパティは 必 ずしも 推 移 関 係 であるわけではない ため, 誤 りである. 推 移 関 係 プロパティとなりうるものとして, 登 山 ルート, 行 程 といったプロパティ が 存 在 した. 登 山 ルート プロパティは 山 岳 記 事 に 存 在 するプロパティであり, 本 来 は 小 蓮 華 山 - 三 国 境 - 鉢 ヶ 岳 のようなルートとして 抽 出 するべきものであるが,3.2.1 項 (2) の 手 法 によって 抽 出 したトリプルはそれぞれ 分 離 しており, 正 式 にプロパティ 名 を 定 義 す るならば 登 山 ルートでの 通 過 点 候 補 のようなプロパティである.この 場 合,トリプル は 推 移 しており, 推 移 関 係 プロパティとなりうる. 行 程 プロパティも 同 様 である 項 の 手 法 により 抽 出 したプロパティには 推 移 プロパティが 存 在 しないという 結 果 となった.このような 結 果 の 背 景 の 1 つとして,リスト 構 造 や Infobox の 構 造 からのプロ パティ 名 抽 出 の 限 界 が 言 えるのではと 考 えている. 今 回 の 手 法 により 推 移 関 係 を 抽 出 する 場 合 は, 推 移 関 係 となる 少 なくとも 3 つのトリプルが 抽 出 されていなければならない.そ のため,Wikipedia 記 事 内 で Infobox もしくはリスト 構 造 によりこれらの 情 報 が 同 一 のプ ロパティ 名 として, 網 羅 されていなければならないが,こうした 網 羅 された 情 報 は 非 常 に 少 ない. 実 際 に,3.3.7 項 の 例 として 示 した 後 方 互 換 の 場 合,Wikipedia の Infobox 内 でこの 後 方 互 換 はその 他 の 記 事 にもいくつか 見 られるが,トリプルとして 3 つのインスタ ンス 間 で 網 羅 されているのは PS, PS2, PS3 の 組 み 合 わせのみであり, ゲームボ ーイ, ゲームボーイカラー, ゲームボーイアドバンス も 後 方 互 換 であるが,ゲーム ボーイカラー 記 事 に 後 方 互 換 の 項 目 が 存 在 しない.このため, 今 回 の 手 法 では 推 移 関 係 プロパティとして 抽 出 できなかった. 推 移 関 係 プロパティを 抽 出 するためには,プロパ ティ 名 を 洗 練 し 同 一 のものを 統 合 する,より 記 事 内 部 の 構 造 化 されていない 部 分 に 踏 み 込 んだプロパティ 抽 出 を 試 みるなどの 対 応 が 必 要 である. (3) 関 数 関 係 プロパティの 推 定 結 果 と 考 察 次 に, 関 数 関 係 プロパティの 推 定 を 行 った 項 (3)で 提 案 した 手 法 により, 全 トリ プルから 関 数 関 係 が 成 立 するトリプルは 185,700 であった.このトリプルから,トリプル を 1 つしか 持 たないプロパティ 名 を 除 外 した 関 数 関 係 プロパティ 候 補 は 2,267 であった. 2,267 の 関 数 関 係 プロパティ 候 補 を 手 作 業 ですべて 正 誤 判 定 した 結 果, 正 答 率 は 54.3%で あった. 関 数 関 係 プロパティの 例 として, 最 もトリプル 数 が 多 かったものは 投 球 打 席 プロパティであった.これは 野 球 選 手 記 事 に 存 在 するプロパティである. 都 道 府 県 プロ パティは 市 町 村 記 事 に, 毛 色 プロパティは 馬 の 記 事 に, 築 城 主 プロパティは 城 の 記 事 に 存 在 するプロパティである.これらはすべて 関 数 関 係 となっており,プロパティの 値 としてインスタンスを 唯 一 つ 持 っている. 誤 りの 殆 どは, 実 際 には owl:datatypeproperty となるべきプロパティであり,インスタンスではなく,リテラルとして 値 を 持 つべきプロ パティであった. 例 えば, 総 試 合 数 プロパティや 泉 温 プロパティ, 着 工 年 プロ パ テ ィ が 関 数 関 係 プ ロ パ テ ィ と し て 抽 出 し て し ま っ た が, こ れ ら は 本 来

93 3.4 実 験 と 考 察 79 owl:datatypeproperty となるべきプロパティであり,3.3.3 項 (1) の 手 法 で owl:datatypeproperty か owl:objectproperty に 分 類 できなかったために, 誤 りとして 影 響 を 及 ぼしている. (4) 逆 関 数 関 係 プロパティの 推 定 結 果 と 考 察 最 後 に, 逆 関 数 関 係 プロパティの 推 定 を 行 った. 全 トリプルから 逆 関 数 関 係 が 成 立 する トリプルは 47,295 であった.このトリプルから,トリプルを 1 つしか 持 たないプロパテ ィ 名 を 除 外 した 逆 関 数 関 係 プロパティ 候 補 は 3,670 であった.3,670 の 逆 関 数 関 係 プロパ ティ 候 補 を 手 作 業 ですべて 正 誤 判 定 した 結 果, 正 答 率 は 22.4%であった. 非 常 に 低 い 正 答 率 となってしまっている 理 由 として, 関 数 関 係 プロパティと 同 様 に owl:datatypeproperty となるべきプロパティが 抽 出 されてしまっていることが 言 え,この 誤 りが 最 も 多 かった. さらに,プロパティ 名 抽 出 の 際 のプロパティ 名 の 定 義 が 不 十 分 である 事 も 言 える.プロパ ティの 表 記 ゆれの 問 題 に 起 因 し, 例 えば, 主 な 作 品 プロパティは 人 物 全 般 に 存 在 するプ ロパティであり,このプロパティは 逆 関 数 プロパティではないが, 表 記 ゆれのプロパティ 名 として おもな 作 品 プロパティも 存 在 する. おもな 作 品 プロパティはトリプルとし ての 抽 出 数 が 少 なく, 不 幸 にも 全 てのトリプルが 逆 関 数 関 係 となっていた.そのため, 主 な 作 品 プロパティと 同 義 であるはずの おもな 作 品 プロパティは 逆 関 数 関 係 として 抽 出 してしまっていた.このようなプロパティ 名 の 表 記 ゆれや, 先 の 推 移 関 係 プロパティの 抽 出 の 際 の 登 山 ルート プロパティのようなプロパティ 名 の 定 義 が 曖 昧 なために,トリ プル 数 が 少 なく, 逆 関 数 関 係 として 抽 出 してしまう 誤 りも 多 く, 今 後 は,プロパティ 名 の 表 記 の 問 題 の 対 策 をとる 必 要 がある. 正 当 な 逆 関 数 関 係 プロパティの 例 としては 主 な 所 属 アーティスト, 主 な 所 属 タレント, 収 録 作 品 タイトル, 同 州 出 身 の 有 名 人 など である. 主 な 所 属 アーティスト や 主 な 所 属 タレント プロパティは 音 楽 会 社 や 芸 能 事 務 所 記 事 に 存 在 するプロパティである. 収 録 作 品 タイトル プロパティは DVD 記 事 や 短 編 集 記 事 に, 同 州 出 身 の 有 名 人 は 州 記 事 に 存 在 するプロパティである. 収 録 作 品 タイ トル プロパティとは 別 に 収 録 作 品 プロパティや 同 州 出 身 の 有 名 人 プロパティと は 別 に 出 身 有 名 人 プロパティも 存 在 しており, 正 当 な 逆 関 数 関 係 プロパティでもプロ パティ 名 の 表 記 ゆれの 問 題 が 垣 間 見 える 抽 出 関 係 の 洗 練 本 項 では,3.4.2,3.4.3 で 抽 出 した 以 下 の 2 つの 関 係 を 洗 練 することで, 精 度 の 向 上 を 行 う. (1) クラス-インスタンス 関 係 の 洗 練 (2) プロパティ 定 義 域 値 域 の 洗 練

94 80 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.23 クラス-インスタンス 関 係 の 洗 練 結 果 の 一 例 元 のクラス 名 洗 練 後 のクラス 名 関 係 数 属 するインスタンスの 一 例 日 本 の 漫 画 作 品 漫 画 作 品 3,622 ドラゴンボール,ONE PIECE 日 本 の 漫 画 家 漫 画 家 3,592 鳥 山 明, 手 塚 治 虫 日 本 のラジオパー ラジオパーソナリテ 3,144 山 谷 親 平, 中 村 鋭 一 ソナリティ ィ 東 京 大 学 の 人 物 人 物 2,888 夏 目 漱 石, 鳩 山 邦 夫 早 稲 田 大 学 の 人 物 人 物 2,605 福 原 愛, 江 戸 川 乱 歩 (1) クラス-インスタンス 関 係 の 洗 練 項 で 抽 出 したのクラス インスタンス 関 係 を 使 用 し,3.3.8 項 (1)で 提 案 した 手 法 に より,378 のクラスと 131,235 の 関 係 を 洗 練 した. 表 3.23 に 洗 練 したクラス 名 のうち 関 係 数 が 多 い 上 位 5 つのクラスを 示 す. 最 も 多 くインスタンスを 持 つクラスは 日 本 の 漫 画 作 品 であった.これは 漫 画 作 品 のうちアニメ 化 されたものの 多 くは 放 送 国 プロパテ ィとその 値 日 本 をもつためである.このような 国 名 や 地 名 が 格 助 詞 の の 前 に 来 て いるものは 非 常 に 多 く, 日 本, 東 京 都, アメリカ 合 衆 国 などがある.しかし,その ほかにも 東 京 大 学, 早 稲 田 大 学 などの 学 校 名 や 平 安 時 代, 戦 国 時 代 などの 時 代 名 も 多 い.さらに,プロパティのトリプルとして 新 たに 12,051 の 関 係 を 補 完 した.ト リプルの 多 くは ビリー ジョエル 国 籍 アメリカ 合 衆 国 や 江 戸 橋 都 道 府 県 東 京 都 など,クラス 名 と 同 様 に 国 名 や 地 名 が 値 となるものが 多 かった.しかし, t.a.t.u. ジャンル ポピュラー 音 楽 や FRONT MISSION 対 応 機 種 プレイステーション といったものも 存 在 する.しかしながら, 本 手 法 は 格 助 詞 の に 注 目 しているため,そ れ 以 外 のクラス 名 については 抽 出 できない 点 や 格 助 詞 の を 含 んでいても,トリプルの 値 としてその 前 方 部 分 が 完 全 一 致 しないため 取 りこぼす 問 題 などがある. 例 えば, NHK のアナウンサー クラスは 格 助 詞 の を 持 ち, NHK のアナウンサー クラスに 属 する インスタンスは 放 送 局 プロパティを 持 っているが,その 値 は NHK 山 口 放 送 局 な どであり,NHK と 完 全 一 致 しないため, 本 手 法 では 洗 練 できない. 手 法 を 改 良 し, 洗 練 数 を 増 やすことが 今 後 の 課 題 といえる. (2) プロパティ 定 義 域 値 域 の 洗 練 項 (2)で 提 案 した 手 法 をプロパティ 定 義 域 値 域 に 適 用 した. 本 手 法 を 適 用 するこ とで, 定 義 域 については, 党 首 プロパティの 定 義 域 が 洗 練 前 は 日 本 の 政 党, 台 湾 の 政 党, 宗 教 政 党 などであったのに 対 し, 洗 練 後 は 政 党 クラスに, 国 籍 プロパテ ィや 身 長 プロパティの 定 義 域 は 人 物 クラスにリフトアップしている. 値 域 につい ても, 定 義 域 に 比 べ 非 常 に 分 散 しているが, 接 続 道 路 プロパティの 値 域 が 道 路 クラ スに, 付 属 校 プロパティの 値 域 が 幼 稚 園 クラスや 小 学 校 クラスにリフトアップ している.しかしながら, 閾 値 としての 兄 弟 クラスの 占 める 割 合 を 変 えることでリフトア

95 3.4 実 験 と 考 察 81 ップの 値 は 大 きく 変 わってしまう. 例 えば, 著 作 プロパティの 定 義 域 は 小 説 家 クラ スなどの 上 位 クラスである 著 作 者 クラスが 妥 当 であるが, 兄 弟 クラスが 定 義 域 として すべて 含 まれるものは 自 動 構 築 である 日 本 語 Wikipedia オントロジーでは 少 ないため, 兄 弟 クラスのうち 定 義 域 値 域 として 占 める 割 合 を 閾 値 として 設 定 している.そのため,こ の 値 が 高 ければあまりリフトアップが 起 こらず, 低 ければ 先 の 例 で 言 うと 人 物 クラス にまでリフトアップされてしまうことがある. 図 3.21 は 兄 弟 クラスに 占 める 割 合 を 変 えた 際 のプロパティ 定 義 域 値 域 の 洗 練 結 果 で ある.ここで 兄 弟 クラスが 占 める 割 合 を 変 化 させると, 例 えば, 背 番 号 プロパティの 定 義 域 が 野 球 選 手 クラスであり, 野 球 選 手 クラスの 上 位 クラスに スポーツ 選 手, 兄 弟 クラスに テニス 選 手 があった 場 合, 割 合 が 0.5 以 上 であればリフトアップは 行 わ ないが,0.5 より 低 い 場 合 はリフトアップが 行 われ, 背 番 号 プロパティの 定 義 域 は ス ポーツ 選 手 となる.なお, 洗 練 前 の 定 義 域 の 関 係 数 は 67,652, 値 域 の 関 係 数 は 54,567 であった. 図 を 見 ると, 定 義 域 の 減 少 率 が 値 域 に 比 べ 高 いことが 分 かる. 値 域 は 定 義 域 に 比 べ 同 じプロパティ 名 でも 値 の 概 念 が 広 く 分 散 していることが 主 な 原 因 である. 日 本 語 Wikipedia オントロジーでのプロパティトリプルの 主 語 は 主 に 記 事 名 に 対 応 付 けされてお り, 必 ず 定 義 域 を 持 つのに 対 し, 値 域 は 記 事 を 持 たないものも 多 い.そのため, 抽 出 が 不 十 分 で,クラス-インスタンス 関 係 や is-a 関 係 に 定 義 されず, 概 念 が 分 散 してしまってい ることが 考 えられる. 閾 値 を 低 く 設 定 すれば 定 義 域 で 5 割 程 度, 値 域 で 6 割 程 度, 関 係 数 を 減 少 させる 事 が 可 能 であるが, 先 のような 問 題 が 生 じてしまう. 高 く 設 定 すれば, 減 少 率 は 下 がってしまうが, 比 較 的 この 問 題 は 除 外 できる.ただし, 全 く 無 くすということは できない. 例 えば 著 名 な 出 身 者 プロパティの 値 域 は Wikipedia に 記 事 がある 人 物 は まず 間 違 いなく 著 名 な 人 物 であるので, 値 域 が 人 物 クラスの 下 位 クラス 全 域 に 分 散 し ており, 人 物 クラスにまでリフトアップしてしまう. 図 3.21 プロパティ 定 義 域 値 域 の 洗 練 結 果

96 82 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 3.5 日 本 語 Wikipedia オントロジーの 全 体 像 本 節 では, 日 本 語 Wikipedia オントロジーの 全 体 像 について 述 べる. 表 3.24 に 構 築 した 日 本 語 Wikipedia オントロジーのクラス 数,プロパティ 数,インス タンス 数 を 示 す. 表 3.25 に 日 本 語 Wikipedia オントロジーの is-a 関 係,クラス インス タンス 関 係,トリプル,プロパティ 定 義 域, 同 義 語 の 各 関 係 数 および 正 解 率 の 95% 信 頼 区 間 を 示 す. 表 3.24 日 本 語 Wikipedia オントロジーのクラス 数,プロパティ 数,インスタンス 数 クラス 数 (owl:class) プロパティ 数 (owl:object/datatypeproperty) インスタンス 数 87,159 10, ,024 表 3.25 日 本 語 Wikipedia オントロジーの 関 係 数 と 正 解 率 関 係 の 種 類 関 係 数 正 解 率 全 てのis-a 関 係 93, % is-a 関 係 文 字 列 照 合 12, ±1.51% (rdfs:subclassof) Infoboxテンプレート 照 合 3, ±1.09% 目 次 見 出 し 83, ±2.74% クラス-インスタンス 関 係 421, ±1.02% 全 てのトリプル 4,867, ± 1.44% トリプル Infoboxからの 抽 出 1,962, ± 1.33% リスト 構 造 からの 抽 出 2,919, ± 1.63% プロパティ 定 義 域 (rdfs:domain) 9, ± 1.22% プロパティ 値 域 (rdfs:range) 40, ± 1.81% クラス-インスタンス 関 係 か 14, ± 1.92% らの 抽 出 is-a 関 係 からの 抽 出 35, ± 1.65% プロパティ 上 位 下 位 1, % 上 位 下 位 関 係 (jwo:hyper) 274,363 - jwo 語 彙 関 係 関 連 語 同 義 語 (jwo:nearly) 258,853 - 動 詞 とプロパティの 対 応 63,670 - (jwo:verb) 全 関 係 6,031,214 -

97 3.5 日 本 語 Wikipedia オントロジーの 全 体 像 83 表 3.24 および 表 3.25 より,87,159 個 のクラスについて,93,322 もの is-a 関 係 を 抽 出 することができた. 目 次 見 出 しからの is-a 関 係 抽 出 手 法 は, 約 83,000 もの is-a 関 係 が 抽 出 できているものの, 正 解 率 は 約 72%と 低 く,is-a 関 係 全 体 の 正 解 率 を 下 げている.それ 以 外 の 手 法 により 抽 出 した is-a 関 係 数 は 約 16,000, 正 解 率 は 90% 以 上 で, 高 精 度 となっ ている.is-a 関 係 全 体 の 正 解 率 を 上 げるためには 目 次 見 出 しからの is-a 関 係 抽 出 精 度 を 上 げる 必 要 があり, 今 後 の 課 題 である. 次 に,クラス 階 層 のルートとなっている 各 クラス 数 とルートから 全 てのリーフのクラス へのパスを 調 べた. 全 ルートクラス 数 は 7,211,リーフ 数 は 65,721 であり, 抽 出 したパス の 本 数 は 257,313 本 であった. 構 造 全 体 の 階 層 の 深 さの 平 均 は 約 5.83 本 であった.さら にオントロジー 全 体 を 見 渡 すために, 各 ルートクラスについて 派 生 するリーフの 分 布 を 測 定 した. 横 軸 にルートクラスを, 縦 軸 にクラスの 階 層 の 深 さを 取 ったものが 図 3.22 であ る. 図 3.22 を 見 ると 分 かるように,1 つのツリーに 集 約 せず, 小 さなツリーが 散 在 してし まっている. 特 に 深 い 階 層 ができているツリーがいくつか 見 られるが,これは Wikipedia 主 要 カテゴリがルートとなっているツリーである.これらのことからも 上 位 概 念 や 中 間 概 念 が 不 足 していることが 分 かる. クラス-インスタンス 関 係 は 421,989 もの 関 係 を 抽 出 し,インスタンス 数 も 323,024 と 多 く,また 正 解 率 も 97.2%と 高 い.しかし,これらは 一 覧 記 事 から 抽 出 したインスタンス であり,Wikipedia の 記 事 数 が 現 在, 約 64 万 記 事 あることを 考 えるとさらに 多 くのイン スタンスを 抽 出 できる 可 能 性 がある. 表 3.26 に 構 築 した 日 本 語 Wikipedia オントロジー 内 のプロパティタイプ 別,プロパテ ィ 数, 正 答 率,トリプル 数 を 示 す. 図 3.22 オントロジーの 階 層 の 深 さとルートの 関 係

98 84 第 3 章 日 本 語 Wikipedia オントロジーの 自 動 構 築 表 3.26 日 本 語 Wikipedia オントロジーのプロパティタイプ 別,プロパティ 数, 正 答 率, トリプル 数 種 類 プロパティ 数 正 答 率 トリプル 数 全 プロパティ 10,769-4,867,882 owl:datatypeproperty ,803 owl:objectproperty ,746 owl:symmetricproperty % 21,854 owl:transitiveproperty 210 0% 1,020 owl:functionalproperty 2, % 185,700 owl:inversefunctionalproperty 3, % 47,295 表 3.25 および 表 3.26 より,10,769 のプロパティ 名 を 抽 出 することができ,トリプル 数 としては 4,867,882 ものトリプルを 抽 出 できている.リスト 構 造 からのトリプルの 抽 出 精 度 は Infobox からの 抽 出 に 比 べ 低 いものの, 約 2 倍 ものトリプルを 抽 出 できており, 全 体 としても 約 94%と 高 精 度 で 抽 出 できている. プロパティ 定 義 域 は,9,486 の 関 係 を 8,831 のプロパティ 名 について 定 義 できており, 82%のプロパティ 名 は 定 義 域 を 持 っていることとなる.プロパティ 値 域 は,2 つの 手 法 か らあわせて 49,262 の 関 係 を 抽 出 でき,5,120 のプロパティ 名 について 定 義 できており,48% のプロパティ 名 は 値 域 を 持 っていることとなる.どちらも 正 解 率 は 90% 程 であり, 高 精 度 となっているが, 半 分 以 上 のプロパティ 名 には 値 域 を 定 義 できておらず, 定 義 されていな い 値 域 の 定 義 が 今 後 の 課 題 である.さらに, 定 義 域 と 値 域 が 定 義 されているプロパティ 名 についても, 複 数 の 定 義 域 や 値 域 を 持 つものもあり,それらをどのように 統 合 していくか も 今 後 の 課 題 である. また,57.5%と 精 度 は 低 いものの,1,387 のプロパティ 上 位 下 位 関 係 を 抽 出 しており, プロパティ 間 の 上 位 下 位 関 係 の 抽 出 は 今 までにない 試 みである. さらに,プロパティタイプについてはこれまでの owl:object/datatypeproperty に 加 え, 新 たに, 対 称 関 係 (owl:symmetricproperty), 推 移 関 係 (owl:transitiveproperty), 関 数 関 係 (owl:functionalproperty), 逆 関 数 関 係 (owl:inversefunctionalproperty)の 推 定 を 行 っ た.そのままの 抽 出 結 果 では 精 度 は 高 くないものの,トリプルの 包 含 率 により 絞 り 込 む 事 により, 特 に 対 称 関 係 プロパティは 8 割 以 上 の 精 度 で 抽 出 できており,これらの 更 なる 精 度 向 上 が 今 後 の 課 題 と 言 える.

99 3.6 まとめ まとめ 本 章 では, 日 本 語 版 Wikipedia を 情 報 資 源 として, 日 本 語 版 Wikipedia から 概 念 およ び 概 念 間 の 関 係 (is-a 関 係,クラス-インスタンス 関 係,プロパティ 定 義 域,プロパティ 値 域,プロパティ 上 位 下 位 関 係,インスタンス 間 関 係,その 他 の 関 係 )を 抽 出 し, 自 動 構 築 により 大 規 模 かつ 汎 用 的 な 日 本 語 Wikipedia オントロジーの 構 築 手 法 の 提 案 とその 評 価 を 行 った.Wikipedia は,is-a 関 係 やクラス-インスタンス 関 係 だけでなく,プロパティ に 着 目 する 事 で, 多 くの 非 階 層 な 関 係 を 抽 出 できる 有 用 な 情 報 資 源 であることを 示 すこと ができた. 提 案 手 法 の 各 パートに 対 して 実 験 評 価 をした 結 果,Wikipedia に 対 して 提 案 手 法 を 適 用 することで,is-a 関 係,クラス-インスタンス 関 係,インスタンス 間 関 係 を 高 精 度 で 抽 出 し, 大 規 模 で 汎 用 的 な 日 本 語 Wikipedia オントロジーを 構 築 することが 可 能 であること がわかった.また,プロパティ 定 義 域,プロパティ 値 域,プロパティ 上 位 下 位 関 係 などの プロパティ 関 係 を 構 築 できたことで,クラススキーマ 階 層 を 構 築 できたと 言 え, 上 位 下 位 関 係 のみのオントロジーや, 手 動 でプロパティを 構 築 しているオントロジー,プロパティ 定 義 域 プロパティ 値 域 を 持 たないオントロジーなど, 他 の 関 連 研 究 より 質 の 高 いオント ロジーの 半 自 動 構 築 ができたと 言 える. 今 後 の 課 題 として,プロパティタイプなどの 十 分 に 抽 出 できなかった 部 分 について, 改 善 し,より 精 度 の 高 いオントロジーの 構 築 を 目 指 す.また,Wikipedia において, 本 文 に は 有 用 な 情 報 が 多 くあり,このような 構 造 化 されていない 部 分 から,オントロジー 構 築 の ためのルールを 自 動 生 成 することで,さらなる 規 模 の 拡 大 は 可 能 であり, 今 後 の 課 題 であ る.

100 第 4 章 日 本 語 Wikipedia オントロジ ーの 評 価 概 要 領 域 オントロジーは, 特 定 の 領 域 ( 法 律 やビジネスなど)に 存 在 する 概 念 とその 間 の 関 係 を 定 義 したものであり,ソフトウェアが RDF コンテンツを 理 解 する 際 に, 辞 書 的 な 役 割 を 果 たす.しかしながら, 領 域 オントロジーの 構 築 と 保 守 には 専 門 家 を 交 えたインタビ ューなどを 行 うことで 概 念 を 列 挙 し, 関 係 を 定 義 するというプロセスを 伴 う.そのため, 多 大 なコストがかかる.そこで, 多 くの 研 究 は, 知 識 工 学, 自 然 言 語 処 理,データマイニ ングなどの 技 術 を 用 いて,テキストや 汎 用 オントロジーなどの 既 存 情 報 資 源 から( 半 ) 自 動 的 に 領 域 オントロジーを 構 築 している[14, 15]. 日 本 語 Wikipedia オントロジーは 汎 用 オントロジーであるが, 特 定 の 領 域 に 存 在 する 概 念 や 関 係 を 再 利 用 することで, 構 築 コス トを 削 減 できる 可 能 性 があり, 領 域 オントロジー 構 築 のための 情 報 資 源 になりうる. 加 えて,セマンティック Web の 研 究 分 野 では, 近 年, 各 Web サイトで 公 開 されている 政 府, 科 学, 写 真, 音 楽 などのデータベースを RDF 化 して 連 携 する,LOD (Linked Open Data)が 注 目 を 集 めている. 各 データベース 間 の 情 報 を 繋 げることで, 情 報 を 容 易 に 引 き 出 してくる 事 が 可 能 であり,これにより 多 くのアプリケーションやサービスでデータを 簡 単 に 参 照 し, 利 用 することができる. 海 外 の LOD では, 各 RDF データベース 間 を 相 互 に リンクするためのハブとして, 英 語 版 Wikipedia から 自 動 構 築 した DBpedia [13]と 呼 ば れるオントロジーおよび RDF データが 活 用 されている. 一 方,LOD の 語 彙 に 着 目 した LOV (Linked Open Vocabularies) [16]という 取 り 組 みも 存 在 している. 各 LOD で 使 用 されているプロパティを 集 めて, 語 彙 の 検 索 を 可 能 にする ことで, 新 たな LOD を 構 築 する 際 に 語 彙 の 再 利 用 を 促 す 取 り 組 みである.しかしながら, LOD を 構 築 する 際 に, 新 たにプロパティを 作 ってしまう 方 が, 目 的 に 合 致 するプロパティ を 見 つけてくるよりもはるかに 容 易 であり, 標 準 語 彙 と 呼 ばれる, 既 に 普 及 している 一 部 の 語 彙 を 除 いて, 再 利 用 されているケースは 少 ない. 加 えて, 国 内 では Linked Open Vocabularies に 相 当 する 取 り 組 みがまだ 存 在 しておらず, 日 本 語 の 標 準 語 彙 というものが ないため, 今 後 さらに 国 内 の LOD が 広 がるために,LOD 構 築 者 にとって 障 壁 となりうる. 以 上 により, 本 論 文 では 大 規 模 で 汎 用 的 なオントロジーである 日 本 語 Wikipedia オント ロジーを, 領 域 オントロジー 構 築 支 援 としての 利 用 および LOD ハブとしての 利 用 という 2 つの 視 点 から 評 価 を 行 い,その 有 用 性 を 示 す. 以 降, 本 章 の 構 成 は 次 のとおりである.4.2 節 では,いくつかの 領 域 に 限 定 し, 各 領 域 のクラス,インスタンス,プロパティの 関 係 を 示 す 事 で 定 性 的 に 日 本 語 Wikipedia オント

101 4.2 領 域 オントロジー 構 築 支 援 87 ロジーの 領 域 オントロジー 構 築 支 援 としての 有 用 性 を 評 価 する.4.3 節 では, 日 本 語 LOD としての 設 計 と 公 開 方 法 を 述 べる.4.4 節 では, 日 本 語 Wikipedia オントロジーのプロパ ティと Linked Open Vocabularies の 語 彙 の 対 応 付 けによる 日 本 語 語 彙 構 築 手 法 を 述 べる. 4.5 節 では,4.4 節 で 述 べた 手 法 の 結 果 と 考 察, 代 表 的 な LOD ハブである DBpedia との 比 較, 検 索 支 援 ツール WiLD の 設 計 と 評 価 により, 日 本 語 Wikipedia オントロジーの LOD ハブとしての 有 用 性 を 示 す. 最 後 にまとめと 今 後 の 課 題 について 述 べる. 4.2 領 域 オントロジー 構 築 支 援 既 存 の 汎 用 オントロジーとの 比 較 と,いくつかの 領 域 に 限 定 し, 各 領 域 のクラス,イン スタンス,プロパティの 関 係 を 示 す 事 で, 定 性 的 に 日 本 語 Wikipedia オントロジーの 領 域 オントロジー 構 築 支 援 としての 有 用 性 の 評 価 を 行 った. 限 定 した 領 域 は 水 力 発 電, 人 物 ( 作 家 クラス), 土 地 ( 都 市 クラス), 抽 象 物 ( 過 去 など)である. 水 力 発 電 領 域 については 実 際 に 専 門 家 から 意 見 を 頂 いている 汎 用 オントロジーとの 比 較 日 本 語 Wikipedia オントロジーと 代 表 的 な 既 存 汎 用 オントロジーである, 日 本 語 語 彙 体 系 および 日 本 語 WordNet との 比 較 評 価 を 行 った. 表 4.1 に 日 本 語 Wikipedia オントロジ ーと 既 存 汎 用 オントロジーの 比 較 例 を 示 す. 表 4.1 中 の Wiki は 本 論 文 で 構 築 した 日 本 語 Wikipedia オントロジーを, W は 日 本 語 WordNet を, N は 日 本 語 語 彙 体 系 をそ れぞれ 表 している.また, Path はいくつかの 主 要 クラスからリーフまでのパスを 表 し ている. 日 本 語 Wikipedia オントロジーの 特 徴 として, 表 4.1 の 例 の ジャズ ギタリスト や イギリスの 空 対 空 ミサイル クラスのように, 特 定 分 野 に 特 化 して 詳 細 なクラス 階 層 を 定 義 している 点 があげられる.さらに, 日 本 語 Wikipedia オントロジーのクラスは 膨 大 な インスタンスを 持 っている.これらは, 他 の 既 存 汎 用 オントロジーにはない, 日 本 語 Wikipedia オントロジーの 特 徴 である. 表 4.1 の 事 物 - 人 物 の 関 係 のように, 構 築 した 日 本 語 Wikipedia オントロジーは 他 と 比 べて 上 位 概 念 が 不 足 していることが 分 かる.これは,Wikipedia のカテゴリが 9 種 の 主 要 カテゴリから 分 類 されているために 構 築 したオントロジーもこの 主 要 カテゴリをルー トとした 階 層 関 係 になっているためである.また, 人 物 から ギタリスト クラスまで のパスの 深 さが 浅 いことから, 中 間 概 念 が 不 足 していることもわかる.

102 88 第 4 章 日 本 語 Wikipedia オントロジーの 利 用 表 4.1 オントロジー 比 較 の 例 クラス オントロジー Path 人 ( 音 楽 家 ) 無 生 物 ( 兵 器 ) 抽 象 物 ( 過 去 ) Wiki W N Wiki W N Wiki W N 事 物 - 人 物 - 音 楽 家 - 演 奏 家 -ギタリスト-ジャズ ギタリスト ものー 全 般 - 生 き 物 - 生 物 - 人 -エンターテイナー - 公 演 者 -ミュージシャン-ギタリスト 名 詞 - 具 体 - 主 体 - 人 - 人 職 業 地 位 役 割 - 人 職 業 - 人 専 門 的 技 術 的 職 業 - 芸 術 家 - 音 楽 家 文 化 と 歴 史 - 出 来 事 - 政 治 - 行 政 - 軍 事 - 兵 器 - 航 空 兵 器 - 空 対 空 ミサイル-イギリスの 空 対 空 ミサイル もの- 全 般 - 出 土 品 - 機 器 - 機 器 - 装 甲 -ミサイル- 空 対 空 ミサイル 兵 器 の 類 はなし 過 去 は 未 定 義 属 性 - 時 - 古 - 過 去 名 詞 - 抽 象 - 抽 象 的 関 係 - 時 間 - 非 暦 日 - 現 在 過 去 未 来 - 過 去 水 力 発 電 領 域 知 識 マネジメントに 特 化 したオントロジー 構 築 ツール General knowledge Navigator (GEN)により 構 築 した 水 力 発 電 所 領 域 のオントロジー[55]と, 日 本 語 Wikipedia オントロ ジーの 水 力 発 電 領 域 について, 専 門 家 による 評 価 を 行 った. 図 4.1 に GEN の 設 備 オント ロジーの 一 部 を 示 す.また, 図 4.1 中 の 水 系, 発 電 機, 水 車, 変 電 所, 発 電 所 の 各 概 念 に ついて, 日 本 語 Wikipedia オントロジーから 得 た 概 念 を 図 4.2 に 示 す. 図 4.1 GEN の 設 備 オントロジーの 一 部

103 4.2 領 域 オントロジー 構 築 支 援 89 図 4.2 日 本 語 Wikipedia オントロジーの 水 力 発 電 領 域 に 関 する 概 念 以 下 に 専 門 家 による 各 概 念 での 評 価 を 記 す. 水 力 発 電 おおむね 良 くできている.ただし, 発 電 機 の 配 置 による 分 類 には 疑 問 が 残 る. 発 電 用 水 車 よくできている. 水 系 国 土 交 通 省 政 令 に 決 められている 分 類 に 従 っている. 形 状 による 分 類 は, 電 力 会 社 ではあまり 使 っていない. 発 電 機 専 門 家 の 聞 いたことの 無 い 単 語 ばかりでよく 分 からない. 変 電 所 形 式 による 分 類 において, 送 風 機 関 係 が 入 っているのはおかしい. 地 上 か 地 下 か という 分 類 と, 送 風 機 の 形 式 は 同 一 の 軸 で 扱 うものでない. 形 態 による 分 類 において,いろいろな 概 念 が 混 ざっている.GIS は 変 電 所 の 中 の 遮 断 機 の 形 式 としてよく 出 てくる.XX シリコン 型 は, 小 さな 変 圧 器 に 関 するも ので, 電 力 会 社 の 変 電 所 の 用 語 ではない. 以 上 の 評 価 から,おおむね 良 くできているという 評 価 をいただいた. 一 部 概 念 において

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図 平 成 2 8 年 3 月 25 日 NACSIS-CAT 検 討 作 業 部 会 NACSIS-CAT/ILL の 軽 量 化 合 理 化 について( 基 本 方 針 )( 案 ) これからの 学 術 情 報 システム 構 築 検 討 委 員 会 ( 以 下, これから 委 員 会 ) は これか らの 学 術 情 報 システムの 在 り 方 について ( 平 成 27 年 5 月 29 日 )

More information

2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数

2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数 2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数 学 社 会 理 科 英 語 の5 教 科 ) すべての 高 校 で 資 料 とする 2 調 査 書 (

More information

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2 目 次 動 作 環 境 特 長 方 法 方 法 起 動 終 了 方 法 方 法 操 作 方 法 使 方 使 方 使 方 詳 細 設 定 使 方 KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2 KINGSOFT Office 2016 特 長 主 特 長 以

More information

スライド 1

スライド 1 検 索 エンジンを 利 用 した Covert Channelの 検 出 木 下 研 究 室 200602824 久 保 直 也 研 究 の 背 景 目 的 近 年 ネットワークの 巨 大 化 によりアクセス 権 限 も 複 雑 に 絡 み 合 ってい る ネットワーク 内 では 不 正 な 情 報 経 路 が 発 生 し 情 報 流 出 の 危 険 性 が 増 大 してしまっている このような 情

More information

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可 ミスミグループ コーポレートガバナンス 基 本 方 針 本 基 本 方 針 は ミスミグループ( 以 下 当 社 グループ という)のコーポレートガバナン スに 関 する 基 本 的 な 考 え 方 を 定 めるものである 1. コーポレートガバナンスの 原 則 (1) 当 社 グループのコーポレートガバナンスは 当 社 グループの 持 続 的 な 成 長 と 中 長 期 的 な 企 業 価 値 の

More information

<819A955D89BF92B28F91816989638BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

<819A955D89BF92B28F91816989638BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378> 平 成 27 年 度 施 策 評 価 調 書 施 策 の 名 称 等 整 理 番 号 22 評 価 担 当 課 営 業 戦 略 課 職 氏 名 施 策 名 ( 基 本 事 業 ) 商 業 の 活 性 化 総 合 計 画 の 位 置 づけ 基 本 目 主 要 施 策 4 想 像 力 と 活 力 にあふれたまちづくり 商 業 の 振 興 2 施 策 の 現 状 分 析 と 意 図 施 策 の 対 象 意

More information

(2)大学・学部・研究科等の理念・目的が、大学構成員(教職員および学生)に周知され、社会に公表されているか

(2)大学・学部・研究科等の理念・目的が、大学構成員(教職員および学生)に周知され、社会に公表されているか 平 成 23 年 度 自 己 報 告 書 1 理 念 目 的 (1) 大 学 学 部 研 究 科 等 の 理 念 目 的 は 適 切 に 設 定 されているか 平 成 19 年 6 月 に の 目 標 として 大 学 の 発 展 に 貢 献 する 力 のある 組 織 とい う 共 通 の 目 標 を 掲 げ この 目 標 を 常 に 念 頭 に 置 きながら 日 々の 業 務 に 当 たっている さらに

More information

私立大学等研究設備整備費等補助金(私立大学等

私立大学等研究設備整備費等補助金(私立大学等 私 立 大 学 等 研 究 設 備 整 備 費 等 補 助 金 ( 私 立 大 学 等 研 究 設 備 等 整 備 費 ) 交 付 要 綱 目 次 第 1 章 通 則 ( 第 1 条 - 第 4 条 ) 第 2 章 私 立 大 学 等 ( 第 5 条 - 第 15 条 ) 第 3 章 専 修 学 校 ( 第 16 条 - 第 25 条 ) 第 4 章 補 助 金 の 返 還 ( 第 26 条 ) 第

More information

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc) (1) 1 ア 調 査 すべき の 手 法 情 報 できる 主 要 な 眺 望 地 点 及 び 主 要 で 身 近 な 視 点 の 状 況 な 実 視 施 点 地 ( 区 点 不 域 のうち 特 周 定 辺 の 多 主 数 の 要 な なものをいう 人 々 眺 望 又 地 は 点 周 ( 辺 の 不 以 住 特 下 民 定 が 同 多 じ ) 数 の する 人 及 々が 場 び 所 対 利 で 象

More information

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1 独 立 行 政 法 人 統 計 センター( 法 人 番 号 7011105002089)の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 役 員 報 酬 の 支 給 水 準 の 設 定 についての 考 え 方 独 立 行 政 法 人 通 則 法 第 52 条 第 3 項 の 規 定 に 基 づき

More information

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について 平 成 25 年 度 独 立 行 政 法 日 本 学 生 支 援 機 構 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 25 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 日 本 学 生 支 援 機 構 は 奨 学 金 貸 与 事 業 留 学 生 支 援

More information

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地 ( 資 料 3) 林 地 台 帳 及 び 地 図 整 備 マニュアル( 案 ) 概 要 本 資 料 は 現 時 点 での 検 討 状 況 を 基 に 作 成 したものであり 今 後 事 務 レベルの 検 討 会 等 を 経 て 成 案 を 得 ることとしてい ます 平 成 28 年 7 月 林 野 庁 計 画 課 1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル(

More information

質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定

質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定 62 (Q&A) 目 次 1 鑑 定 評 価 の 委 託 は 入 札 か 随 意 契 約 か またその 理 由 は 何 か 2 委 託 料 は 他 県 と 比 べて 妥 当 性 のある 金 額 か 3 地 価 公 示 ( 国 の 調 査 )との 違 いは 何 か また 国 の 調 査 結 果 はどう 活 用 しているか 4 路 線 価 を 利 用 しない 理 由 は 何 か 5 委 託 料 の 算

More information

2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36

2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36 独 立 行 政 法 人 駐 留 軍 等 労 働 者 労 務 管 理 機 構 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 25 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 検 証 結 果 理 事 長 は 今 中 期 計 画 に 掲 げた 新 たな 要

More information

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ Ⅰ 調 査 の 概 要 Ⅱ 札 幌 の 子 どもの 学 力 学 習 意 欲 等 について Ⅲ 学 力 調 査 の 結 果 概 要 及 び 改 善 の 方 向 等 について Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果

More information

4 教 科 に 関 する 調 査 結 果 の 概 況 校 種 学 年 小 学 校 2 年 生 3 年 生 4 年 生 5 年 生 6 年 生 教 科 平 均 到 達 度 目 標 値 差 達 成 率 国 語 77.8% 68.9% 8.9% 79.3% 算 数 92.0% 76.7% 15.3% 94

4 教 科 に 関 する 調 査 結 果 の 概 況 校 種 学 年 小 学 校 2 年 生 3 年 生 4 年 生 5 年 生 6 年 生 教 科 平 均 到 達 度 目 標 値 差 達 成 率 国 語 77.8% 68.9% 8.9% 79.3% 算 数 92.0% 76.7% 15.3% 94 4 教 科 に 関 する 調 査 結 果 の 概 況 校 種 学 年 小 学 校 2 年 生 3 年 生 4 年 生 5 年 生 6 年 生 教 科 平 均 到 達 度 目 標 値 差 達 成 率 国 語 77.8% 68.9% 8.9% 79.3% 算 数 92.0% 76.7% 15.3% 94.3% 国 語 84.7% 73.9% 10.8% 79.0% 算 数 87.7% 74.3% 13.4%

More information

平成16年年金制度改正 ~年金の昔・今・未来を考える~

平成16年年金制度改正 ~年金の昔・今・未来を考える~ 第 2 回 社 会 保 険 料 労 働 保 険 料 の 賦 課 対 象 となる 報 酬 等 の 範 囲 に 関 する 検 討 会 平 成 24 年 9 月 20 日 資 料 1 通 勤 手 当 について 1 これまでの 通 勤 に 要 する 費 用 に 関 する 考 え 方 では 通 勤 手 当 の 金 額 が 実 費 弁 償 的 に 算 定 される 場 合 でも それは 通 常 使 用 者 が 負

More information

平成17年度高知県県産材利用推進事業費補助金交付要綱

平成17年度高知県県産材利用推進事業費補助金交付要綱 高 知 県 副 業 型 林 家 育 成 支 援 事 業 募 集 要 領 第 1 趣 旨 この 要 領 は 高 知 県 副 業 型 林 家 育 成 支 援 事 業 費 補 助 金 交 付 要 綱 に 基 づき 当 該 補 助 金 の 交 付 の 対 象 となる 事 業 者 を 公 募 して 選 定 する 手 続 等 当 該 事 業 の 円 滑 な 実 施 を 図 るために 必 要 な 事 項 を 定

More information

<4D F736F F D F8D828D5A939982CC8EF68BC697BF96B38F9E89BB82CC8A6791E52E646F63>

<4D F736F F D F8D828D5A939982CC8EF68BC697BF96B38F9E89BB82CC8A6791E52E646F63> 平 成 22 年 11 月 9 日 高 校 等 の 授 業 料 無 償 化 の 拡 大 検 討 案 以 下 は 大 阪 府 の 検 討 案 の 概 要 であり 最 終 的 には 平 成 23 年 2 月 議 会 での 予 算 の 議 決 を 経 て 方 針 を 確 定 する 予 定 です Ⅰ. 検 討 案 の 骨 子 平 成 23 年 度 から 大 阪 の 子 どもたちが 中 学 校 卒 業 時 の

More information

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑 等 の 当 初 見 直 し 案 の 検 討 状 況 について 資 料 1-1 項 目 名 検 討 検 討 の 進 め 方 検 討 状 況 都 道 府 県 担 当 者 との 意 見 交 換 では 結 果 精 度 の 低 下 に 伴 い 結 果 が 活 用 されなくなった 場 合 の 員 のモチベーション 低 下 の 可 能 性 や 員 の 配 置 換 え 等 についての 考 慮 が 必 要 との 意

More information

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定 射 水 市 建 設 工 事 施 行 に 関 する 工 事 成 績 評 定 要 領 平 成 8 年 3 月 7 告 示 第 44 号 ( 目 的 ) 第 条 この 要 領 は 射 水 市 が 所 掌 する 工 事 の 成 績 評 定 ( 以 下 評 定 という )に 必 要 な 事 項 を 定 め 公 正 かつ 的 確 な 評 定 を 行 うことにより もって 請 負 業 者 の 選 定 及 び 指

More information

Microsoft PowerPoint - 報告書(概要).ppt

Microsoft PowerPoint - 報告書(概要).ppt 市 町 村 における 地 方 公 務 員 制 度 改 革 に 係 る 論 点 と 意 見 について ( 概 要 ) 神 奈 川 県 市 町 村 における 地 方 公 務 員 制 度 改 革 に 係 る 検 討 会 議 について 1 テーマ 地 方 公 務 員 制 度 改 革 ( 総 務 省 地 方 公 務 員 の 労 使 関 係 制 度 に 係 る 基 本 的 な 考 え 方 )の 課 題 の 整

More information

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている 清 瀬 市 の 給 与 定 員 管 理 等 について 1 総 括 (1) 件 費 の 状 況 ( 普 通 会 計 決 算 ) 住 民 基 本 台 帳 口 歳 出 額 実 質 収 支 件 費 件 費 率 ( 参 考 ) (25 年 度 末 ) 25 年 度 千 74,247 27,195,534 A 768,602 千 4,616,550 B 千 17.0 B/A 昨 年 度 の 件 費 率 17.3

More information

ていることから それに 先 行 する 形 で 下 請 業 者 についても 対 策 を 講 じることとしまし た 本 県 としましては それまでの 間 に 未 加 入 の 建 設 業 者 に 加 入 していただきますよう 28 年 4 月 から 実 施 することとしました 問 6 公 共 工 事 の

ていることから それに 先 行 する 形 で 下 請 業 者 についても 対 策 を 講 じることとしまし た 本 県 としましては それまでの 間 に 未 加 入 の 建 設 業 者 に 加 入 していただきますよう 28 年 4 月 から 実 施 することとしました 問 6 公 共 工 事 の 3 月 1 日 ( 火 )HP 公 表 基 本 関 係 社 会 保 険 等 未 加 入 対 策 に 関 する 想 定 問 答 問 1 社 会 保 険 等 とは 何 か 社 会 保 険 ( 健 康 保 険 及 び 厚 生 年 金 保 険 )と 労 働 保 険 ( 雇 用 保 険 )を 指 します 問 2 どのような 場 合 でも 元 請 と 未 加 入 業 者 との 一 次 下 請 契 約 が 禁 止

More information

Taro-学校だより学力調査号.jtd

Taro-学校だより学力調査号.jtd 第 5 号 ( H2 7. 1 1. 1 7 ) 舞 鶴 小 学 校 ま い づ る 発 行 人 大 澤 正 史 本 校 の 学 習 状 況 に つ い て ( 今 年 度 6 年 生 が 実 施 し た 全 国 学 力 学 習 状 況 調 査 の 結 果 ) 今 年 度 の 全 国 学 A1 2007 年 よ り 日 本 全 国 の 小 中 学 校 の 最 高 学 年 ( 小 学 6 年 力 学

More information

文化政策情報システムの運用等

文化政策情報システムの運用等 名 開 始 終 了 ( 予 定 ) 年 度 番 号 0406 平 成 25 年 行 政 レビューシート ( 文 部 科 学 省 ) 文 化 政 策 情 報 システム 運 用 等 担 当 部 局 庁 文 化 庁 作 成 責 任 者 平 成 8 年 度 なし 担 当 課 室 長 官 官 房 政 策 課 政 策 課 長 清 水 明 会 計 区 分 一 般 会 計 政 策 施 策 名 根 拠 法 令 ( 具

More information

参 考 様 式 再 就 者 から 依 頼 等 を 受 けた 場 合 の 届 出 公 平 委 員 会 委 員 長 様 年 月 日 地 方 公 務 員 法 ( 昭 和 25 年 法 律 第 261 号 ) 第 38 条 の2 第 7 項 規 定 に 基 づき 下 記 のとおり 届 出 を します この

参 考 様 式 再 就 者 から 依 頼 等 を 受 けた 場 合 の 届 出 公 平 委 員 会 委 員 長 様 年 月 日 地 方 公 務 員 法 ( 昭 和 25 年 法 律 第 261 号 ) 第 38 条 の2 第 7 項 規 定 に 基 づき 下 記 のとおり 届 出 を します この 現 員 退 された 元 地 方 公 務 員 の 退 管 理 の 適 正 の 確 保 について 員 のかたは ご 留 意 願 います 地 方 公 務 員 法 及 び 地 方 独 立 行 政 法 人 法 の 一 部 を 改 正 する 法 律 ( 平 成 26 年 法 律 第 34 号 )が 公 布 され 地 方 公 共 団 体 における 退 管 理 の 確 保 にため 以 下 のことについて 規 定 され

More information

<4D6963726F736F667420576F7264202D203032208E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A76905682C98AD682B782E993C195CA915B9275964082C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

<4D6963726F736F667420576F7264202D203032208E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A76905682C98AD682B782E993C195CA915B9275964082C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6 様 式 租 税 特 別 措 置 等 に 係 る 政 策 の 事 前 評 価 書 1 政 策 評 価 の 対 象 とした 産 業 活 力 の 再 生 及 び 産 業 活 動 の 革 新 に 関 する 特 別 措 置 法 に 基 づく 登 録 免 租 税 特 別 措 置 等 の 名 称 許 税 の 特 例 措 置 の 延 長 ( 国 税 32)( 登 録 免 許 税 : 外 ) 2 要 望 の 内 容

More information

0605調査用紙(公民)

0605調査用紙(公民) 社 会 公 民 番 号 2 略 称 東 京 書 籍 書 名 新 編 新 し 公 民 1 基 礎 基 本 確 実 な 定 着 を 図 るため を 促 すため や 個 応 じた 3 単 元 ( 単 元 設 定 4 各 年 ( び や 考 え 展 開 5 特 徴 的 な 単 元 おけ る 課 題 関 わり 等 ア 1 単 位 時 間 ( 見 開 き 2 頁 ) 毎 課 題 を 設 定 し 課 題 関 連

More information

1 変更の許可等(都市計画法第35条の2)

1 変更の許可等(都市計画法第35条の2) 第 11 章 建 築 物 の 建 ぺい 率 等 の 指 定 ( 都 市 計 画 法 第 41 条 ) 建 築 物 の 建 ぺい 率 等 の 指 定 ( 都 市 計 画 法 第 41 条 ) 法 律 ( 建 築 物 の 建 ぺい 率 等 の 指 定 ) 第 四 十 一 条 都 道 府 県 知 事 は 用 途 地 域 の 定 められていない 土 地 の 区 域 における 開 発 行 為 につい て 開

More information

●幼児教育振興法案

●幼児教育振興法案 第 一 九 〇 回 衆 第 五 〇 号 幼 児 教 育 振 興 法 案 目 次 前 文 第 一 章 総 則 ( 第 一 条 - 第 八 条 ) 第 二 章 幼 児 教 育 振 興 基 本 方 針 等 ( 第 九 条 第 十 条 ) 第 三 章 基 本 的 施 策 ( 第 十 一 条 - 第 十 七 条 ) 附 則 幼 児 期 において 人 は その 保 護 者 や 周 囲 の 大 人 との 愛 情

More information

( 別 紙 ) 以 下 法 とあるのは 改 正 法 第 5 条 の 規 定 による 改 正 後 の 健 康 保 険 法 を 指 す ( 施 行 期 日 は 平 成 28 年 4 月 1 日 ) 1. 標 準 報 酬 月 額 の 等 級 区 分 の 追 加 について 問 1 法 改 正 により 追 加

( 別 紙 ) 以 下 法 とあるのは 改 正 法 第 5 条 の 規 定 による 改 正 後 の 健 康 保 険 法 を 指 す ( 施 行 期 日 は 平 成 28 年 4 月 1 日 ) 1. 標 準 報 酬 月 額 の 等 級 区 分 の 追 加 について 問 1 法 改 正 により 追 加 別 添 事 務 連 絡 平 成 27 年 12 月 18 日 日 本 年 金 機 構 厚 生 年 金 保 険 部 長 殿 厚 生 労 働 省 年 金 局 事 業 管 理 課 長 持 続 可 能 な 医 療 保 険 制 度 を 構 築 するための 国 民 健 康 保 険 法 等 の 一 部 を 改 正 する 法 律 による 健 康 保 険 法 及 び 船 員 保 険 法 改 正 内 容 の 一 部 に

More information

<6D33335F976C8EAE825081698CF6955C9770816A2E786C73>

<6D33335F976C8EAE825081698CF6955C9770816A2E786C73> 国 立 大 学 法 人 新 潟 大 学 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 18 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 本 学 が 定 める 役 員 に 支 給 する 期 末 特 別 手 当 (ボーナス)において, 役 員 の 本 給

More information

リング 不 能 な 将 来 減 算 一 時 差 異 に 係 る 繰 延 税 金 資 産 について 回 収 可 能 性 がないも のとする 原 則 的 な 取 扱 いに 対 して スケジューリング 不 能 な 将 来 減 算 一 時 差 異 を 回 収 できることを 反 証 できる 場 合 に 原 則

リング 不 能 な 将 来 減 算 一 時 差 異 に 係 る 繰 延 税 金 資 産 について 回 収 可 能 性 がないも のとする 原 則 的 な 取 扱 いに 対 して スケジューリング 不 能 な 将 来 減 算 一 時 差 異 を 回 収 できることを 反 証 できる 場 合 に 原 則 第 323 回 企 業 会 計 基 準 委 員 会 資 料 番 号 日 付 審 議 事 項 (5)-4 2015 年 11 月 6 日 プロジェクト 項 目 税 効 果 会 計 公 開 草 案 に 対 するコメントへの 対 応 - 合 理 的 な 説 明 に 関 する 取 扱 い 本 資 料 の 目 的 1. 本 資 料 は 企 業 会 計 基 準 適 用 指 針 公 開 草 案 第 54 号 繰

More information

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63> 社 会 保 険 加 入 状 況 等 の 実 態 調 査 結 果 平 成 27 年 6 月 18 日 一 般 社 団 法 人 日 本 電 設 工 業 協 会 社 会 保 険 加 入 状 況 等 の 実 態 調 査 結 果 について 1. 調 査 の 目 的 社 会 保 険 加 入 促 進 計 画 の 計 画 期 間 (H24 年 度 ~H28 年 度 までの5 年 間 )の 中 間 時 点 として 1

More information

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定 資 料 10 減 損 損 失 及 び 資 本 金 の 変 動 に 関 する 調 査 記 載 上 の 注 意 事 項 当 調 査 は 減 損 損 失 を 認 識 するに 至 った 経 緯 資 本 金 の の 変 動 等 を 把 握 するために 調 査 する ものである 調 査 対 象 は 地 方 公 営 企 業 状 況 調 査 の 対 象 となっている 法 適 用 企 業 とする Ⅰ 提 出 物 について

More information

財団法人○○会における最初の評議員の選任方法(案)

財団法人○○会における最初の評議員の選任方法(案) 一 般 財 団 法 人 生 産 科 学 研 究 奨 励 会 定 款 第 1 章 総 則 ( 名 称 ) 第 1 条 この 法 人 は 一 般 財 団 法 人 生 産 科 学 研 究 奨 励 会 という ( 事 務 所 ) 第 2 条 この 法 人 は 事 務 所 を 福 岡 市 東 区 松 香 台 1 丁 目 10 番 1 号 におく 第 2 章 目 的 及 び 事 業 ( 目 的 ) 第 3 条

More information

学校教育法等の一部を改正する法律の施行に伴う文部科学省関係省令の整備に関する省令等について(通知)

学校教育法等の一部を改正する法律の施行に伴う文部科学省関係省令の整備に関する省令等について(通知) 27 文 科 初 第 1593 号 平 成 28 年 3 月 22 日 各 都 道 府 県 知 事 各 都 道 府 県 教 育 委 員 会 各 指 定 都 市 教 育 委 員 会 殿 附 属 学 校 を 置 く 各 国 立 大 学 法 人 学 長 構 造 改 革 特 別 区 域 法 第 12 条 第 1 項 の 認 定 を 受 けた 地 方 公 共 団 体 の 長 文 部 科 学 省 初 等 中 等

More information

経験発表

経験発表 共 通 性 を 持 つ 製 品 群 への USDMの 適 用 と 拡 張 アジェンダ 1. 表 現 を 拡 張 したUSDM 導 入 の 背 景 と 課 題 要 望 2. 表 現 を 拡 張 したUSDM 導 入 の 取 り 組 み 3. 表 現 を 拡 張 したUSDM 4. 表 現 を 拡 張 したUSDM 導 入 による 効 果 5. 表 現 を 拡 張 したUSDM 導 入 後 の 課 題

More information

2 1.ヒアリング 対 象 (1) 対 象 範 囲 分 類 年 金 医 療 保 険 雇 用 保 険 税 備 考 厚 生 年 金 の 資 格 喪 失 国 民 年 金 の 加 入 老 齢 給 付 裁 定 請 求 など 健 康 保 険 の 資 格 喪 失 国 民 健 康 保 険 の 加 入 健 康 保 険

2 1.ヒアリング 対 象 (1) 対 象 範 囲 分 類 年 金 医 療 保 険 雇 用 保 険 税 備 考 厚 生 年 金 の 資 格 喪 失 国 民 年 金 の 加 入 老 齢 給 付 裁 定 請 求 など 健 康 保 険 の 資 格 喪 失 国 民 健 康 保 険 の 加 入 健 康 保 険 1 参 考 資 料 6 退 職 関 連 手 続 の 現 行 業 務 分 析 1. ヒアリング 対 象 2. ワンストップ 化 に 向 けて 検 討 すべき 課 題 ( 参 考 )ヒアリング 結 果 分 析 2 1.ヒアリング 対 象 (1) 対 象 範 囲 分 類 年 金 医 療 保 険 雇 用 保 険 税 備 考 厚 生 年 金 の 資 格 喪 失 国 民 年 金 の 加 入 老 齢 給 付 裁

More information

1

1 精 華 町 個 人 情 報 保 護 条 例 改 正 に 向 けての 考 え 方 ( 案 ) 平 成 27 年 4 月 精 華 町 0 1 目 次 1 個 人 情 報 保 護 に 関 する 法 体 系 と 番 号 法 における 特 定 個 人 情 報 の 保 護 措 置... 1 2 番 号 法 と 精 華 町 個 人 情 報 保 護 条 例 における 個 人 情 報 の 定 義 上 の 差 異...

More information

定款  変更

定款  変更 公 益 社 団 法 人 宮 崎 県 農 業 振 興 公 社 定 款 公 益 社 団 法 人 宮 崎 県 農 業 振 興 公 社 公 益 社 団 法 人 宮 崎 県 農 業 振 興 公 社 定 款 第 1 章 総 則 ( 名 称 ) 第 1 条 この 法 人 は 公 益 社 団 法 人 宮 崎 県 農 業 振 興 公 社 ( 以 下 公 社 という )と 称 する ( 事 務 所 ) 第 2 条 公

More information

m07 北見工業大学 様式①

m07 北見工業大学 様式① 国 立 大 学 法 人 北 見 工 業 大 学 ( 法 人 番 号 6460305000387)の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 役 員 報 酬 の 支 給 水 準 の 設 定 についての 考 え 方 当 該 法 人 の 主 要 事 業 は 教 育 研 究 事 業 である 役

More information

Q IFRSの特徴について教えてください

Q IFRSの特徴について教えてください Q 改 正 後 の 退 職 給 付 に 関 する 会 計 基 準 と 改 訂 IAS 第 19 号 との 差 異 を 教 え てください A 数 理 計 算 上 の 差 異 過 去 勤 務 費 用 の 会 計 処 理 退 職 給 付 見 込 額 の 期 間 配 分 方 式 および 期 待 運 用 収 益 という 概 念 の 廃 止 が 主 な 差 異 として 残 っています 平 成 24 年 5 月

More information

(2) 広 島 国 際 学 院 大 学 ( 以 下 大 学 という ) (3) 広 島 国 際 学 院 大 学 自 動 車 短 期 大 学 部 ( 以 下 短 大 という ) (4) 広 島 国 際 学 院 高 等 学 校 ( 以 下 高 校 という ) ( 学 納 金 の 種 類 ) 第 3 条

(2) 広 島 国 際 学 院 大 学 ( 以 下 大 学 という ) (3) 広 島 国 際 学 院 大 学 自 動 車 短 期 大 学 部 ( 以 下 短 大 という ) (4) 広 島 国 際 学 院 高 等 学 校 ( 以 下 高 校 という ) ( 学 納 金 の 種 類 ) 第 3 条 学 生 生 徒 等 の 納 入 金 に 関 する 規 則 平 成 15 年 12 月 16 日 規 則 第 19 号 沿 革 1 平 成 17 年 5 月 17 日 改 正 2 平 成 17 年 10 月 3 日 改 正 3 平 成 18 年 1 月 25 日 改 正 5 平 成 21 年 9 月 16 日 改 正 7 平 成 22 年 2 月 12 日 改 正 9 平 成 23 年 12 月 6

More information

4 参 加 資 格 要 件 本 提 案 への 参 加 予 定 者 は 以 下 の 条 件 を 全 て 満 たすこと 1 地 方 自 治 法 施 行 令 ( 昭 和 22 年 政 令 第 16 号 ) 第 167 条 の4 第 1 項 各 号 の 規 定 に 該 当 しない 者 であること 2 会 社

4 参 加 資 格 要 件 本 提 案 への 参 加 予 定 者 は 以 下 の 条 件 を 全 て 満 たすこと 1 地 方 自 治 法 施 行 令 ( 昭 和 22 年 政 令 第 16 号 ) 第 167 条 の4 第 1 項 各 号 の 規 定 に 該 当 しない 者 であること 2 会 社 北 秋 田 市 クリーンリサイクルセンターエネルギー 回 収 推 進 施 設 等 長 期 包 括 的 運 転 維 持 管 理 業 務 委 託 に 係 る 発 注 支 援 業 務 公 募 型 プロポ-ザル 実 施 要 領 1 プロポーザルの 目 的 この 要 領 は 平 成 30 年 4 月 から 運 転 を 予 定 している 北 秋 田 市 クリーンリサイクルセンター エネルギー 回 収 推 進 施

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション スモールスタートによる テストツール 導 入 の 提 案 - 広 く 浅 く を 前 提 とした キャプチャ/リプレイツールの 簡 易 的 な 導 入 - 第 5 分 科 会 Aグループ(テストツールグループ) 主 査 奥 村 有 紀 子 ( 有 限 会 社 デバッグ 工 学 研 究 所 ) 副 主 査 秋 山 浩 一 ( 富 士 ゼロックス 株 式 会 社 ) 堀 田 文 明 ( 有 限 会 社

More information

平 成 27 年 11 月 ~ 平 成 28 年 4 月 に 公 開 の 対 象 となった 専 門 協 議 等 における 各 専 門 委 員 等 の 寄 附 金 契 約 金 等 の 受 取 状 況 審 査 ( 別 紙 ) 専 門 協 議 等 の 件 数 専 門 委 員 数 500 万 円 超 の 受

平 成 27 年 11 月 ~ 平 成 28 年 4 月 に 公 開 の 対 象 となった 専 門 協 議 等 における 各 専 門 委 員 等 の 寄 附 金 契 約 金 等 の 受 取 状 況 審 査 ( 別 紙 ) 専 門 協 議 等 の 件 数 専 門 委 員 数 500 万 円 超 の 受 資 料 5-1 平 成 28 年 6 月 16 日 専 門 協 議 等 の 実 施 に 関 する 各 専 門 委 員 における 寄 附 金 契 約 金 等 の 受 取 状 況 承 認 審 査 及 び 安 全 対 策 に 係 る 専 門 協 議 等 を 依 頼 した 専 門 委 員 の 寄 附 金 契 約 金 等 の 受 取 状 況 については 医 薬 品 医 療 機 器 総 合 機 構 における 専

More information

Microsoft PowerPoint - 経営事項審査.ppt

Microsoft PowerPoint - 経営事項審査.ppt 経 営 事 項 審 査 建 設 業 を 取 り 巻 く 環 境 工 事 不 足 は 深 刻 化 しており 建 設 業 者 の 統 廃 合 も 活 発 化 している 中 選 ばれる 企 業 となる 事 が 生 き 残 りをかけた 最 重 要 課 題 といえる 選 ばれる 企 業 の 指 標 となるものが 経 営 事 項 審 査 であり この 評 点 はインターネット 等 にて 公 開 されている 事

More information

慶應義塾利益相反対処規程

慶應義塾利益相反対処規程 慶 應 義 塾 利 益 相 反 マネジメント 内 規 平 成 17 年 12 月 6 日 制 定 平 成 23 年 4 月 1 日 施 行 平 成 26 年 4 月 1 日 改 正 平 成 27 年 10 月 30 日 改 正 ( 目 的 ) 第 1 条 慶 應 義 塾 利 益 相 反 マネジメント 内 規 ( 以 下 本 内 規 という )は, 慶 應 義 塾 利 益 相 反 マネジメント ポリシー(

More information

Microsoft Word - 佐野市生活排水処理構想(案).doc

Microsoft Word - 佐野市生活排水処理構想(案).doc 佐 野 市 生 活 排 水 処 理 構 想 ( 案 ) 平 成 27 年 12 月 佐 野 市 目 次 1. 生 活 排 水 処 理 構 想 について 1.1 生 活 排 水 処 理 構 想 とは P.1 1.2 生 活 排 水 処 理 施 設 の 種 類 P.1 2. 佐 野 市 の 現 状 と 課 題 2.1 整 備 状 況 P.2 2.2 主 な 汚 水 処 理 施 設 P.2 2.3 生 活

More information

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63>

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63> 平 成 18 年 7 月 独 立 行 政 法 人 国 立 大 学 財 務 経 営 センター 国 立 大 学 法 人 等 による 国 立 大 学 財 務 経 営 センターへの 土 地 譲 渡 収 入 の 一 部 納 付 の 仕 組 みについて 国 立 大 学 法 人 等 が 国 から 出 資 された 土 地 を 譲 渡 した 場 合 文 部 科 学 大 臣 が 定 める 基 準 に より 算 定 した

More information

Microsoft Word - 通達(参考).doc

Microsoft Word - 通達(参考).doc 参 考 1 基 発 第 0909001 号 平 成 20 年 9 月 9 日 都 道 府 県 労 働 局 長 殿 厚 生 労 働 省 労 働 基 準 局 長 ( 公 印 省 略 ) 多 店 舗 展 開 する 小 売 業 飲 食 業 等 の 店 舗 における 管 理 監 督 者 の 範 囲 の 適 正 化 について 小 売 業 飲 食 業 等 において いわゆるチェーン 店 の 形 態 により 相 当

More information

(4) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 国 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている.

(4) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 国 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている. 別 紙 高 山 村 の 給 与 定 員 管 理 等 について 総 括 () 件 費 の 状 況 ( 普 通 会 計 決 算 ) 住 民 基 本 台 帳 口 歳 出 額 実 質 収 支 件 費 件 費 率 ( 参 考 ) (26 年 月 日 ) A B B/A 24 年 度 の 件 費 率 年 度 千 千 千 2,9 2,64,628 6,8 467,928 8. 2.4 (2) 職 員 給 与 費

More information

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ 簡 易 公 募 型 競 争 入 札 方 式 ( 総 合 評 価 落 札 方 式 )に 係 る 手 続 開 始 の 公 示 次 のとおり 指 名 競 争 入 札 参 加 者 の 選 定 の 手 続 を 開 始 します 平 成 28 年 9 月 20 日 分 任 支 出 負 担 行 為 担 当 官 東 北 地 方 整 備 局 秋 田 河 川 国 道 事 務 所 長 渡 邊 政 義 1. 業 務 概 要

More information

6 構 造 等 コンクリートブロック 造 平 屋 建 て4 戸 長 屋 16 棟 64 戸 建 築 年 1 戸 当 床 面 積 棟 数 住 戸 改 善 後 床 面 積 昭 和 42 年 36.00m2 4 50.40m2 昭 和 43 年 36.50m2 3 50.90m2 昭 和 44 年 36.

6 構 造 等 コンクリートブロック 造 平 屋 建 て4 戸 長 屋 16 棟 64 戸 建 築 年 1 戸 当 床 面 積 棟 数 住 戸 改 善 後 床 面 積 昭 和 42 年 36.00m2 4 50.40m2 昭 和 43 年 36.50m2 3 50.90m2 昭 和 44 年 36. 市 営 住 宅 建 替 えPFI 等 導 入 可 能 性 調 査 業 務 委 託 仕 様 書 1. 適 用 範 囲 本 仕 様 書 は 十 和 田 市 ( 以 下 発 注 者 という )が 実 施 する 市 営 住 宅 建 替 えPFI 等 導 入 可 能 性 調 査 業 務 委 託 ( 以 下 本 業 務 委 託 という )に 適 用 するものとする 2. 業 務 目 的 十 和 田 市 営 住

More information

答申第585号

答申第585号 別 紙 諮 問 第 722 号 答 申 1 審 査 会 の 結 論 平 成 23 年 月 日 区 営 業 所 で 起 きた 物 損 事 故 に 関 する 全 ての 内 容 の 文 書 の 開 示 請 求 に 対 し 終 業 点 呼 記 録 簿 ほか7 件 を 対 象 公 文 書 として 特 定 し 一 部 開 示 と した 決 定 は 妥 当 である 2 審 査 請 求 の 内 容 (1) 審 査

More information

Taro-H19退職金(修正版).jtd

Taro-H19退職金(修正版).jtd 調 査 結 果 の 概 要 1 退 職 金 制 度 (1) 採 用 状 況 ( 表 1) 集 計 第 1 表 第 2 表 退 職 金 制 度 の 採 用 状 況 をみると 退 職 一 時 金 制 度 のみ 14 社 ( 退 職 金 制 度 採 用 企 業 246 社 の5.7 %) 退 職 年 金 制 度 のみ 27 社 ( 同 11.0%) 退 職 一 時 金 制 度 と 退 職 年 金 制 度

More information

東京都立産業技術高等専門学校

東京都立産業技術高等専門学校 東 京 都 立 産 業 技 術 高 等 専 門 学 校 卒 業 生 を 対 象 とした 調 査 (OB OG アンケート)の 結 果 について 1 は じ め に 東 京 都 立 産 業 技 術 高 等 専 門 学 校 で は 本 校 の 教 育 水 準 の 向 上 や 教 育 内 容 の 充 実 と 改 善 を 目 的 と し て 本 校 の 前 身 校 で あ る 東 京 都 立 工 業 高 等

More information

参加表明書・企画提案書様式

参加表明書・企画提案書様式 秋 田 市 道 路 除 排 雪 車 両 運 行 管 理 システム( 仮 称 ) 導 入 業 務 委 託 公 募 型 プロポーザル 参 加 表 明 書 企 画 提 案 書 様 式 平 成 25 年 7 月 秋 田 市 建 設 部 道 路 維 持 課 ( 様 式 1) 参 加 表 明 書 業 務 の 名 称 秋 田 市 除 排 雪 車 両 運 行 管 理 システム( 仮 称 ) 導 入 業 務 委 託

More information

資料2-2 定時制課程・通信制課程高等学校の現状

資料2-2 定時制課程・通信制課程高等学校の現状 資 料 2-2 定 時 制 課 程 通 信 制 課 程 高 等 学 校 の 現 状 1 学 校 の 設 置 形 態 及 び 規 模 組 織 形 態 等 1-1 高 等 学 校 の 学 校 数 ( 校 ) 6,000 5,000 4,856 4,812 4,960 5,222 5,466 5,518 5,506 5,507 5,476 5,517 5,505 5,488 5,477 5,452 5,383

More information

平 成 26 年 度 事 業 計 画 書 ( 平 成 26 年 4 月 1 日 から 平 成 27 年 3 月 31 日 まで) 公 益 目 的 事 業 事 業 の 趣 旨 共 用 品 共 用 サービス( 高 齢 者 障 害 のある 人 々 等 日 常 生 活 に 不 便 さのある 者 に 対 して

平 成 26 年 度 事 業 計 画 書 ( 平 成 26 年 4 月 1 日 から 平 成 27 年 3 月 31 日 まで) 公 益 目 的 事 業 事 業 の 趣 旨 共 用 品 共 用 サービス( 高 齢 者 障 害 のある 人 々 等 日 常 生 活 に 不 便 さのある 者 に 対 して 平 成 26 年 度 事 業 計 画 書 ( 平 成 26 年 4 月 1 日 から 平 成 27 年 3 月 31 日 まで) 公 益 財 団 法 人 共 用 品 推 進 機 構 平 成 26 年 度 事 業 計 画 書 ( 平 成 26 年 4 月 1 日 から 平 成 27 年 3 月 31 日 まで) 公 益 目 的 事 業 事 業 の 趣 旨 共 用 品 共 用 サービス( 高 齢 者 障

More information

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安

Microsoft Word - 不正アクセス行為の禁止等に関する法律等に基づく公安 不 正 アクセス 行 為 の 禁 止 等 に 関 する 法 律 等 に 基 づく 公 安 委 員 会 による 援 助 等 の 措 置 に 関 する 訓 令 平 成 12 年 7 月 1 日 警 察 本 部 訓 令 第 25 号 改 正 平 成 14 年 11 月 22 日 本 部 訓 令 第 29 号 平 成 16 年 3 月 25 日 本 部 訓 令 第 6 号 平 成 24 年 5 月 1 日

More information

Microsoft Word - 070219役員選挙規程.doc

Microsoft Word - 070219役員選挙規程.doc 役 員 選 挙 規 程 昭 和 55 年 10 月 21 日 制 定 昭 和 57 年 11 月 16 日 改 正 昭 和 61 年 5 月 27 日 改 正 昭 和 62 年 2 月 23 日 改 正 昭 和 63 年 3 月 7 日 改 正 平 成 2 年 5 月 14 日 改 正 平 成 6 年 5 月 24 日 改 正 平 成 8 年 2 月 27 日 改 正 平 成 11 年 2 月 23

More information

https://www.takara-dic-net.jp/xeditor_ne/xeditor_web/html_gene.

https://www.takara-dic-net.jp/xeditor_ne/xeditor_web/html_gene. 平 成 23 年 3 月 期 第 1 四 半 期 決 算 短 信 日 本 基 準 ( 連 結 ) 平 成 22 年 8 月 11 日 上 場 会 社 名 松 井 建 設 株 式 会 社 上 場 取 引 所 東 コ ー ド 番 号 1810 URL http://www.matsui-ken.co.jp/ 代 表 者 ( 役 職 名 ) 取 締 役 社 長 ( 氏 名 ) 松 井 隆 弘 ( 役 職

More information

添 付 資 料 の 目 次 1. 当 四 半 期 決 算 に 関 する 定 性 的 情 報 2 (1) 経 営 成 績 に 関 する 説 明 2 (2) 財 政 状 態 に 関 する 説 明 2 (3) 連 結 業 績 予 想 などの 将 来 予 測 情 報 に 関 する 説 明 2 2.サマリー 情 報 ( 注 記 事 項 )に 関 する 事 項 3 (1) 当 四 半 期 連 結 累 計 期 間

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Cybersecurity-Frameworkを 用 いた 対 策 案 合 意 形 成 手 法 の 提 案 東 京 電 機 大 学 情 報 セキュリティ 研 究 室 福 島 章 太 目 次 2 背 景 課 題 提 案 実 装 今 後 の 方 針 まとめ 目 次 3 背 景 課 題 提 案 実 装 今 後 の 方 針 まとめ 背 景 4 現 状 Cybersecurity-Frameworkについて

More information

Taro-条文.jtd

Taro-条文.jtd - 1 - 部 正 昭 和 部 正 目 ん 養 涵 養 ロ ん ロ 護 在 面 積 並 削 共 化 委 託 共 化 病 害 虫 駆 除 予 防 他 護 削 3 域 各 掲 げ ほ 全 努 - 2 - む ね 道 開 設 良 安 設 削 他 護 削 委 託 促 進 削 病 害 虫 駆 除 予 防 火 災 予 防 他 護 削 - 3 - 応 じ 6 案 作 学 識 験 意 聴 3 各 掲 げ ほ 掲 げ

More information

- 1 - 総 控 負 傷 疾 病 療 養 産 産 女 性 責 帰 べ 由 試 ~ 8 契 約 契 約 完 了 ほ 契 約 超 締 結 専 門 的 知 識 技 術 験 専 門 的 知 識 高 大 臣 専 門 的 知 識 高 専 門 的 知 識 締 結 契 約 満 歳 締 結 契 約 契 約 係 始

- 1 - 総 控 負 傷 疾 病 療 養 産 産 女 性 責 帰 べ 由 試 ~ 8 契 約 契 約 完 了 ほ 契 約 超 締 結 専 門 的 知 識 技 術 験 専 門 的 知 識 高 大 臣 専 門 的 知 識 高 専 門 的 知 識 締 結 契 約 満 歳 締 結 契 約 契 約 係 始 部 案 参 照 文 目 1 1 持 可 能 療 険 制 構 築 国 民 険 部 9 部 11 1 5 特 別 15 6 17 7 運 確 18 8 0 9 独 立 10 - 1 - 総 控 負 傷 疾 病 療 養 産 産 女 性 責 帰 べ 由 試 ~ 8 契 約 契 約 完 了 ほ 契 約 超 締 結 専 門 的 知 識 技 術 験 専 門 的 知 識 高 大 臣 専 門 的 知 識 高 専 門

More information

景品の換金行為と「三店方式」について

景品の換金行為と「三店方式」について 景 品 の 換 金 行 為 と 三 店 方 式 について 1 景 品 の 換 金 が 行 われる 背 景 と 法 令 の 規 定 について 2 三 店 方 式 の 歴 史 について 3 三 店 方 式 を 構 成 する3つの 要 素 について 4 三 店 方 式 に 関 する 行 政 の 見 解 について 5 三 店 方 式 に 関 する 裁 判 所 の 見 解 について 6 三 店 方 式 とパチンコ

More information

18 国立高等専門学校機構

18 国立高等専門学校機構 様 式 1 公 表 されるべき 事 項 独 立 行 政 法 人 国 立 高 等 専 門 学 校 機 構 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 25 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 当 機 構 役 員 給 与 規 則 で 文 部 科

More information

一般競争入札について

一般競争入札について ( 一 般 競 争 入 札 ) 総 合 評 価 落 札 方 式 ガイドライン 平 成 21 年 4 月 ( 独 ) 工 業 所 有 権 情 報 研 修 館 1.はじめに 現 在 公 共 調 達 の 透 明 性 公 正 性 をより 一 層 めることが 喫 緊 の 課 題 とな っており 独 立 行 政 法 人 も 含 めた 政 府 全 体 で 随 意 契 約 の 見 直 しに 取 り 組 んで おります

More information

/ 5 ページ 身 近 な 普 通 名 詞 を 覚 えさせ 絵 カードや 言 葉 絵 本 などを 使 い 身 近 な 生 活 に 関 わる 固 有 名 詞 をマッチングさせ 集 合 名 詞 の 概 念 を 身 に 付 けさせ 普 通 名 詞 の 絵 カードや 字 単 語 カードを 見 本 に 従 っ

/ 5 ページ 身 近 な 普 通 名 詞 を 覚 えさせ 絵 カードや 言 葉 絵 本 などを 使 い 身 近 な 生 活 に 関 わる 固 有 名 詞 をマッチングさせ 集 合 名 詞 の 概 念 を 身 に 付 けさせ 普 通 名 詞 の 絵 カードや 字 単 語 カードを 見 本 に 従 っ / 5 ページ 写 真 マークへの 興 味 を 持 たせ コミュニケーションの 補 助 手 段 として 日 課 生 活 習 慣 を 示 す 日 々の 活 動 カードなど を 見 せ 絵 写 真 を 用 いたコミュニケーションをはか 絵 本 の 絵 や 過 去 の 体 験 の 写 真 によってコミュニケーションを 楽 しませ カードによる 字 指 字 に 気 づかせ カードに 単 語 で 字 を 併

More information

Microsoft Word - 全国エリアマネジメントネットワーク規約.docx

Microsoft Word - 全国エリアマネジメントネットワーク規約.docx 全 国 エリアマネジメントネットワーク 規 約 第 1 章 総 則 ( 名 称 ) 第 1 条 この 会 は 全 国 エリアマネジメントネットワーク( 以 下 本 会 という )と 称 する ( 目 的 ) 第 2 条 本 会 は 全 国 のエリアマネジメント 組 織 による 連 携 協 議 の 場 を 提 供 し エリアマネジメン トに 係 る 政 策 提 案 情 報 共 有 及 び 普 及 啓

More information

社会保険加入促進計画に盛込むべき内容

社会保険加入促進計画に盛込むべき内容 一 般 社 団 法 人 日 本 造 園 建 設 業 協 会 社 会 保 険 等 加 入 促 進 計 画 平 成 24 年 10 月 一 般 社 団 法 人 日 本 造 園 建 設 業 協 会 1 計 画 策 定 の 趣 旨 目 的 この 計 画 は 一 般 社 団 法 人 日 本 造 園 建 設 業 協 会 ( 以 下 日 造 協 という ) 及 び 日 造 協 の 正 会 員 ( 以 下 会 員

More information

入札公告 機動装備センター

入札公告 機動装備センター 千 葉 県 一 般 競 争 入 札 公 告 県 警 第 18 号 機 動 装 備 センター 屋 内 舗 装 改 修 工 事 の 一 般 競 争 入 札 ( 事 後 審 査 型 )の 実 施 について 地 方 自 治 法 第 234 条 第 1 項 の 規 定 により 一 般 競 争 入 札 を 次 のとおり 実 施 する なお この 入 札 は ちば 電 子 調 達 システムに 係 る 電 子 入

More information

自衛官俸給表の1等陸佐、1等海佐及び1等空佐の(一)欄又は(二)欄に定める額の俸給の支給を受ける職員の占める官職を定める訓令

自衛官俸給表の1等陸佐、1等海佐及び1等空佐の(一)欄又は(二)欄に定める額の俸給の支給を受ける職員の占める官職を定める訓令 防 衛 省 訓 令 第 2 9 号 自 衛 隊 法 ( 昭 和 2 9 年 法 律 第 1 6 5 号 ) 第 3 0 条 の 2 第 1 項 第 5 号 の 規 定 に 基 づ き 自 衛 官 以 外 の 隊 員 の 標 準 職 務 遂 行 能 力 を 定 め る 訓 令 を 次 の よ う に 定 め る 平 成 2 6 年 5 月 3 0 日 防 衛 大 臣 小 野 寺 五 典 自 衛 官 以

More information

<5461726F2D8179835A8362836794C5817A313230333039817988C495B6817A>

<5461726F2D8179835A8362836794C5817A313230333039817988C495B6817A> - 1 - 省 百 七 旅 客 部 改 省 令 平 成 省 令 伴 並 平 成 省 令 並 ま づ 並 令 づ く 領 平 成 月 大 臣 前 田 武 志 づ く 領 語 お 使 語 監 督 針 平 成 省 千 百 お 使 語 - 2 - 務 名 簿 款 寄 附 為 登 記 証 明 組 織 図 保 制 証 機 器 機 器 設 設 備 記 載 決 算 報 足 経 的 礎 証 績 分 証 程 七 イ 概

More information

<4D F736F F D2095BD90AC E D738FEE816A939A905C91E D862E646F63>

<4D F736F F D2095BD90AC E D738FEE816A939A905C91E D862E646F63> 諮 問 庁 : 国 土 交 通 大 臣 諮 問 日 : 平 成 20 年 6 月 16 日 ( 平 成 20 年 ( 行 情 ) 諮 問 第 363 号 ) 答 申 日 : 平 成 21 年 4 月 8 日 ( 平 成 21 年 度 ( 行 情 ) 答 申 第 1 号 ) 事 件 名 : 引 継 書 の 一 部 開 示 決 定 に 関 する 件 答 申 書 第 1 審 査 会 の 結 論 平 成 19

More information

大田市固定資産台帳整備業務(プロポーザル審査要項)

大田市固定資産台帳整備業務(プロポーザル審査要項) 大 田 市 整 備 業 務 プロポーザル 審 査 要 項 大 田 市 業 務 プロポーザルの 審 査 は 提 案 書 等 を 下 記 のとおり 審 査 評 価 するものとす る. 審 査 の 対 象 事 業 者 審 査 の 対 象 事 業 者 は 次 の()から()に 掲 げる 条 件 をすべて 満 たし 一 つでも 満 たない 場 合 は 審 査 の 対 象 事 業 者 に 該 当 しないものとする

More information

小 売 電 気 の 登 録 数 の 推 移 昨 年 8 月 の 前 登 録 申 請 の 受 付 開 始 以 降 小 売 電 気 の 登 録 申 請 は 着 実 に 増 加 しており これまでに310 件 を 登 録 (6 月 30 日 時 点 ) 本 年 4 月 の 全 面 自 由 化 以 降 申

小 売 電 気 の 登 録 数 の 推 移 昨 年 8 月 の 前 登 録 申 請 の 受 付 開 始 以 降 小 売 電 気 の 登 録 申 請 は 着 実 に 増 加 しており これまでに310 件 を 登 録 (6 月 30 日 時 点 ) 本 年 4 月 の 全 面 自 由 化 以 降 申 資 料 3-1 小 売 全 面 自 由 化 に 関 する 進 捗 状 況 平 成 28 年 7 月 1 日 資 源 エネルギー 庁 小 売 電 気 の 登 録 数 の 推 移 昨 年 8 月 の 前 登 録 申 請 の 受 付 開 始 以 降 小 売 電 気 の 登 録 申 請 は 着 実 に 増 加 しており これまでに310 件 を 登 録 (6 月 30 日 時 点 ) 本 年 4 月 の 全

More information

<基礎領域>

<基礎領域> 1. 科 目 コード 1234 2. 科 目 名 情 報 アーキテクチャ 特 別 実 験 (Advanced Exercise in Information Architecture) 3. 担 当 教 員 藤 原 明 生 (Akio FUJIWARA) 4. 開 講 期 2 年 次 秋 1 期 ( 昼 ) 火 曜 3-4 時 限 ( 夜 ) 火 曜 6-7 時 限,( 昼 夜 合 同 ) 土 曜

More information

<4D6963726F736F667420576F7264202D208C6F81943134358146837D834383698393836F815B90A793782092BC914F82CC91CE899E8FF38BB582C982C282A282C42E646F63>

<4D6963726F736F667420576F7264202D208C6F81943134358146837D834383698393836F815B90A793782092BC914F82CC91CE899E8FF38BB582C982C282A282C42E646F63> マイナンバー 制 度 直 前 の 対 応 状 況 について はじめに 今 年 10 月 より 国 内 に 住 民 票 を 有 する 全 国 民 にマイナンバーが 順 次 通 知 されることを 受 け 事 業 者 で は 様 々な 対 応 が 必 要 となる そこで マイナンバー 通 知 直 前 の 対 応 状 況 について 当 金 庫 主 催 の マイナ ンバー 制 度 直 前 対 策 セミナー 参

More information

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について... 1 1.1.EXCEL 一 括 登 録... 1 1.2.EXCEL ダウンロード... 2 1.2.1. 検 索 条 件 の 指 定 プレビュー... 3 1.2.2.EXCEL ダウンロード(データ 抽 出 あ

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について... 1 1.1.EXCEL 一 括 登 録... 1 1.2.EXCEL ダウンロード... 2 1.2.1. 検 索 条 件 の 指 定 プレビュー... 3 1.2.2.EXCEL ダウンロード(データ 抽 出 あ 大 学 情 報 データベースシステム EXCEL 一 括 登 録 マニュアル 目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について... 1 1.1.EXCEL 一 括 登 録... 1 1.2.EXCEL ダウンロード... 2 1.2.1. 検 索 条 件 の 指 定 プレビュー... 3 1.2.2.EXCEL ダウンロード(データ 抽 出 あり)... 5 1.2.3.EXCEL

More information

[2] 控 除 限 度 額 繰 越 欠 損 金 を 有 する 法 人 において 欠 損 金 発 生 事 業 年 度 の 翌 事 業 年 度 以 後 の 欠 損 金 の 繰 越 控 除 にあ たっては 平 成 27 年 度 税 制 改 正 により 次 ページ 以 降 で 解 説 する の 特 例 (

[2] 控 除 限 度 額 繰 越 欠 損 金 を 有 する 法 人 において 欠 損 金 発 生 事 業 年 度 の 翌 事 業 年 度 以 後 の 欠 損 金 の 繰 越 控 除 にあ たっては 平 成 27 年 度 税 制 改 正 により 次 ページ 以 降 で 解 説 する の 特 例 ( 相 談 ~ 改 正 に 伴 い 改 めて 整 理 しておきたい~ 法 人 税 における 繰 越 欠 損 金 制 度 米 澤 潤 平 部 東 京 室 平 成 27 年 度 および28 年 度 の 税 制 改 正 による 法 人 税 率 引 き 下 げに 伴 う 課 税 ベース 拡 大 の 一 環 として 繰 越 欠 損 金 制 度 についても 大 改 正 が 行 われました 今 回 は 繰 越 欠 損

More information

4 承 認 コミュニティ 組 織 は 市 長 若 しくはその 委 任 を 受 けた 者 又 は 監 査 委 員 の 監 査 に 応 じなければ ならない ( 状 況 報 告 ) 第 7 条 承 認 コミュニティ 組 織 は 市 長 が 必 要 と 認 めるときは 交 付 金 事 業 の 遂 行 の

4 承 認 コミュニティ 組 織 は 市 長 若 しくはその 委 任 を 受 けた 者 又 は 監 査 委 員 の 監 査 に 応 じなければ ならない ( 状 況 報 告 ) 第 7 条 承 認 コミュニティ 組 織 は 市 長 が 必 要 と 認 めるときは 交 付 金 事 業 の 遂 行 の 地 域 づくり 一 括 交 付 金 の 交 付 に 関 する 要 綱 ( 趣 旨 ) 第 1 条 この 要 綱 は 川 西 市 地 域 分 権 の 推 進 に 関 する 条 例 ( 平 成 26 年 川 西 市 条 例 第 10 号 以 下 条 例 という ) 第 14 条 の 規 定 に 基 づく 地 域 づくり 一 括 交 付 金 ( 以 下 交 付 金 という )の 交 付 に 関 し 必 要

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 株 式 会 社 化 に 伴 う から 特 定 の 員 への 株 式 譲 渡 に 係 る 課 税 関 係 と 手 続 きについて 平 成 20 年 2 月 商 工 中 金 当 資 料 は 貴 において 本 件 取 引 に 関 する 検 討 をされるに 際 して ご 参 考 のための 情 報 提 供 のみを 目 的 として 国 税 庁 の 確 認 を 受 けた 内 容 に 基 づき 商 工 中 金 が

More information

2. 会 計 規 程 の 業 務 (1) 規 程 と 実 際 の 業 務 の 調 査 規 程 や 運 用 方 針 に 規 定 されている 業 務 ( 帳 票 )が 実 際 に 行 われているか( 作 成 されている か)どうかについて 調 べてみた 以 下 の 表 は 規 程 の 条 項 とそこに

2. 会 計 規 程 の 業 務 (1) 規 程 と 実 際 の 業 務 の 調 査 規 程 や 運 用 方 針 に 規 定 されている 業 務 ( 帳 票 )が 実 際 に 行 われているか( 作 成 されている か)どうかについて 調 べてみた 以 下 の 表 は 規 程 の 条 項 とそこに 第 7 章 会 計 規 程 1. 会 計 規 程 の 概 要 (1) 規 程 及 び 目 的 平 成 18 年 度 に 病 院 事 業 管 理 者 を 設 置 して 札 幌 市 病 院 局 会 計 規 程 ( 平 成 18 年 札 幌 市 病 院 局 規 程 第 37 号 以 下 この 章 で 規 程 という )を 定 め これに 則 って 会 計 処 理 が 行 わ れていなお 規 程 の 具 体

More information

・モニター広告運営事業仕様書

・モニター広告運営事業仕様書 秋 田 市 新 庁 舎 動 画 広 告 放 映 事 業 仕 様 書 1 目 的 多 く の 市 民 の 目 に 触 れ る 市 役 所 の 特 性 を 活 か し 映 像 や 音 声 を 活 用 し た モ ニ タ ー に よ る 動 画 広 告 を 新 庁 舎 内 に 導 入 し 新 庁 舎 の 主 要 機 能 の 一 つ で あ る 情 報 発 信 拠 点 と し て の 役 割 を 果 た す

More information

<4D6963726F736F667420576F7264202D20313431323235817988C482C682EA817A89BA90BF8E7793B1834B8343836883898343839381698A4F8D91906C8DDE8A889770816A>

<4D6963726F736F667420576F7264202D20313431323235817988C482C682EA817A89BA90BF8E7793B1834B8343836883898343839381698A4F8D91906C8DDE8A889770816A> 外 国 人 建 設 就 労 者 受 入 事 業 に 関 する 下 請 指 導 ガイドライン 第 1 趣 旨 復 興 事 業 の 更 なる 加 速 を 図 りつつ 2020 年 オリンピック パラリンピック 東 京 大 会 の 関 連 施 設 整 備 等 による 一 時 的 な 建 設 需 要 の 増 大 に 対 応 するため 2020 年 度 までの 緊 急 かつ 時 限 的 な 措 置 として 国

More information

検 索 しよう... 1 結 果 を 見 よう ~ 検 索 結 果 一 覧 ~... 2 結 果 を 見 よう ~ 検 索 結 果 詳 細 ( 図 書 )~... 3 結 果 を 見 よう ~ 検 索 結 果 詳 細 ( 雑 誌 )~... 4 ログインしよう... 5 私 の 本 棚 を 活 用

検 索 しよう... 1 結 果 を 見 よう ~ 検 索 結 果 一 覧 ~... 2 結 果 を 見 よう ~ 検 索 結 果 詳 細 ( 図 書 )~... 3 結 果 を 見 よう ~ 検 索 結 果 詳 細 ( 雑 誌 )~... 4 ログインしよう... 5 私 の 本 棚 を 活 用 蔵 書 検 索 (コンピュータ 目 録 (OPAC)による 図 書 雑 誌 検 索 方 法 ) OPAC(オーパック)=Online Public Access Catalog https://libwww.akita-pu.ac.jp/drupal/ 秋 田 県 立 大 学 図 書 情 報 センター 検 索 しよう... 1 結 果 を 見 よう ~ 検 索 結 果 一 覧 ~... 2 結 果

More information

Microsoft Word - 1-3 利子補給金交付要綱

Microsoft Word - 1-3 利子補給金交付要綱 宮 城 県 新 しい 公 共 支 援 事 業 つなぎ 融 資 利 子 補 給 金 交 付 要 綱 ( 趣 旨 ) 第 1 条 県 は,NPO 等 との 協 働 業 務 を 促 進 して 新 しい 公 共 の 拡 大 と 定 着 を 図 るため, 行 政 から 受 託 した 業 務 の 実 施 に 際 して 金 融 機 関 等 からの 借 入 れ(つなぎ 融 資 )を 利 用 するNPO 等 に 対

More information

容 積 率 制 限 の 概 要 1 容 積 率 制 限 の 目 的 地 域 で 行 われる 各 種 の 社 会 経 済 活 動 の 総 量 を 誘 導 することにより 建 築 物 と 道 路 等 の 公 共 施 設 とのバランスを 確 保 することを 目 的 として 行 われており 市 街 地 環

容 積 率 制 限 の 概 要 1 容 積 率 制 限 の 目 的 地 域 で 行 われる 各 種 の 社 会 経 済 活 動 の 総 量 を 誘 導 することにより 建 築 物 と 道 路 等 の 公 共 施 設 とのバランスを 確 保 することを 目 的 として 行 われており 市 街 地 環 資 料 2-2 容 積 率 規 制 等 について Ministry of Land, Infrastructure, Transport and Tourism 容 積 率 制 限 の 概 要 1 容 積 率 制 限 の 目 的 地 域 で 行 われる 各 種 の 社 会 経 済 活 動 の 総 量 を 誘 導 することにより 建 築 物 と 道 路 等 の 公 共 施 設 とのバランスを 確 保

More information

独立行政法人国立病院機構

独立行政法人国立病院機構 独 立 行 政 法 人 国 立 病 院 機 構 仙 台 医 療 センターにおける 医 薬 品 等 の 使 用 成 績 調 査 特 定 使 用 成 績 調 査 及 び 副 作 用 感 染 症 報 告 その 他 の 受 託 研 究 の 実 施 に 関 する 標 準 業 務 手 順 書 平 成 27 年 8 月 3 日 第 8 版 第 1 章 総 則 1. 目 的 と 適 用 範 囲 この 標 準 業 務

More information

<4D6963726F736F667420576F7264202D2083828366838B8E968BC695E58F5781698CA79770816A2E646F63>

<4D6963726F736F667420576F7264202D2083828366838B8E968BC695E58F5781698CA79770816A2E646F63> 新 しい 公 共 支 援 事 業 基 金 委 託 事 業 ( 新 しい 公 共 の 場 づくりのためのモデル 事 業 ( 県 対 象 )) の 平 成 23 年 度 募 集 について 第 1 目 的 本 事 業 は 愛 知 県 が 定 める 愛 知 県 新 しい 公 共 支 援 事 業 基 金 委 託 事 業 実 施 要 領 ( 平 成 23 年 6 月 以 下 実 施 要 領 という ) に 基

More information

添 付 資 料 の 目 次 1. 当 四 半 期 決 算 に 関 する 定 性 的 情 報 2 (1) 経 営 成 績 に 関 する 説 明 2 (2) 財 政 状 態 に 関 する 説 明 2 (3) 連 結 業 績 予 想 などの 将 来 予 測 情 報 に 関 する 説 明 2 2.サマリー 情 報 ( 注 記 事 項 )に 関 する 事 項 3 (1) 当 四 半 期 連 結 累 計 期 間

More information

( 運 用 制 限 ) 第 5 条 労 働 基 準 局 は 本 システムの 維 持 補 修 の 必 要 があるとき 天 災 地 変 その 他 の 事 由 によりシステムに 障 害 又 は 遅 延 の 生 じたとき その 他 理 由 の 如 何 を 問 わず その 裁 量 により システム 利 用 者

( 運 用 制 限 ) 第 5 条 労 働 基 準 局 は 本 システムの 維 持 補 修 の 必 要 があるとき 天 災 地 変 その 他 の 事 由 によりシステムに 障 害 又 は 遅 延 の 生 じたとき その 他 理 由 の 如 何 を 問 わず その 裁 量 により システム 利 用 者 労 災 レセプト 電 算 処 理 システム 利 用 規 約 ( 目 的 及 び 定 義 ) 第 1 条 本 規 約 は 厚 生 労 働 省 労 働 基 準 局 ( 以 下 労 働 基 準 局 という )が 運 営 する 労 災 レセプト 電 算 処 理 システムを 利 用 する 場 合 に 必 要 な 事 項 を 定 めるものです 2 本 規 約 において 使 用 する 用 語 の 意 義 は 次

More information

Taro-29職員退職手当支給規程

Taro-29職員退職手当支給規程 国 立 研 究 開 発 法 人 水 産 研 究 教 育 機 構 職 員 退 職 手 当 支 給 規 程 平 成 1 8 年 4 月 1 日 付 け 1 7 水 研 本 第 2 0 5 8 号 改 正 平 成 1 8 年 1 0 月 1 日 付 け 1 8 水 研 本 第 1 0 7 7 号 改 正 平 成 1 9 年 4 月 1 日 付 け 1 8 水 研 本 第 1 7 8 0 号 改 正 平 成

More information

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 改 訂 の 要 因 旧 新 (2013 年 4 月 版 ) 文 言 削 除 p.11(1. 基 本 事 項 ) (2) 保 証 すべき 実 数 の 精 度 p.5(1. 基 本 事 項 ) (2) 保 証 すべき 実 数 の 精 度 1. 用 紙 系 ( 線 種 ピッチ 等 用 紙 上 の 大 きさで

More information

調査結果の概要

調査結果の概要 調 査 結 果 の 概 要 調 査 の 概 要 1 調 査 対 象 (1) 事 業 所 調 査 都 内 の 常 用 従 業 者 規 模 30 人 以 上 の 3,000 事 業 所 1 調 査 対 象 (2) 契 約 社 員 調 査 事 業 所 調 査 の 結 果 から 協 力 を 得 られた 事 業 所 の 従 業 員 2,000 人 2 調 査 時 点 方 法 (1) 事 業 所 調 査 平 成

More information