Linked Data の現状と日本の課題 武田英明 国立情報学研究所東京大学人工物工学研究センター takeda@nii.ac.jp Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data 3
Linked Data とは Web of Data RDF で公開されるデータ Linked Data 外部から参照可能 (dereferenceable) Linked Data, TBL, http://www.w3.org/designissues/linkeddata.html RDF (Resource Description Framework) Semantic Web の階梯 最も原始的な意味記述の枠組みを提供ー >SVOモデル Entity-Relation Model( 実体関連モデル ) セマンティックネット RDF Schema RDFに最も原始的な概念記述の仕組みを追加 class-subclass 関係, 制約 OWL (Web Ontology Language) 記述論理 (description logics) に基づいた概念とその関係を記述する言語 Rule-ML もっと上へ もっと上へ Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ 4
抽象問題から具体問題への回帰 Semantic Web の階梯 クラスに関する記述 インスタンスに関する記述 オントロジー Linked Data Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ オントロジー クラスに関する記述 RDFS OWL オントロジー構築の課題 Semantic Web の階梯 オントロジー構築はそもそも大変 一貫性 網羅性 論理性 複数オントロジーの統合 関連付けはもっと大変 クラスに関する記述 インスタンスに関する記述 オントロジー Linked Data Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ 5
Linked Data Semantic Web の階梯 インスタンスに関する記述 = 個々の事物に関する記述 RDF + (RDFS, OWL) Linked Data の記述における利点 書きやすい ( 事実に関する記述が主 ) リンクしやすい ( 同 ) Linked Dataの記述における問題点 複雑な記述は難しい それでもクラス定義は必要 ( オントロジー) クラスに関する記述 オントロジー インスタンスに関する記述 Linked Data Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ Linked Data のための 4 条件 Linked Data 事柄の名前に URI を使うこと Use URIs as names for things すべてのモノ, コトに URI を! 名前の参照が HTTP URI でできること Use HTTP URIs so that people can look up those names. DOI とかいった URN は使わないでね URIを参照したときに関連情報が手に入るように When someone looks up a URI, provide useful information, using the standards d (RDF, SPARQL) 理解可能なデータを提供してね. 外部へのリンクも含めよう Include links to other URIs. so that they can discover more things. Webのようにリンクでつながるデータを作ろう Linked Data, TBL, http://www.w3.org/designissues/linkeddata.html 6
Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data Linking Open Data (LOD) 公開された Linked Data を集めるプロジェクト 主要な Linked Data ( データ変換 ) Dbpedia (Wikipedia) : 百科事典, 2.7 億文 Geonames: 地名と緯度経度, 9300 万文 MusicBrainz: 音楽 WordNet: 辞書 DBLP bibliography: 論文の書誌,2800 万文 US Census Data: 米国国勢調査 (2000 年 ), 10 億文 ( クロール ) FOAF (Friend Of A Friend): 個人と個人関係のプロファイル ( ラッパー ) Flickr Wrapper 7
Dbpedia の例 131 億文 141 万個のリンク 8
Music Web-based Information Geographic information Papers Life Science and Health Care 131 億文 141 万個のリンク LOD の発展 (1) As of March 2008 9
LOD の発展 (2) LOD の発展 (3) 10
LOD の発展 (4) 131 億文 141 万個のリンク Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data 11
Link Data 汎用サーチエンジン Swoogle Watson SWME http://swse.deri.org/ Sindice http://sindice.com/ 特殊サーチ Sameas http://sameas.org/ Linked Data Search Engine http://sameas.org/ 12
Linked Data Browser データを Web ページのようにみていくツール システム Mable リンクを順に表示 Tabulator Firefox plugin 版 /online 版 1ページの中にどんどん情報を追加 Sig.ma RDF のソースを同時提示して 操作可能 13
Tabulator 14
Linked Data Mashup Linked Data Browser Linked Data Mashup Linked Data Search Engine Things Things Things Things Things 15
How to use Linked Data Semantic Data Mash-up Applications SemaPlorer http://btc.isweb.uni-koblenz.de/ Dbpedia Mobile http://wiki.dbpedia.org/dbpediamobile Bio2RDF http://bio2rdf.org/ DBpedia Mobile 16
Bio2RDF Bio 系のリソース検索 RDFでないものは勝手に RDF 化 Bio2RDF 17
Linked Data のメリット Web API と Linked Data の比較 統一されたインタフェース RDF / SPARQL endpoint 意味の明示 サイトを越えた連携 sameas Linked Data のデメリット 速度 意味解釈の曖昧さ データの信頼性 由来 新鮮さ Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data 18
日本における Linked Data 課題 日本語の壁 URI ハブの欠如 Dbpedia RDF の普及の遅さ RDFa 我々の取り組み WordNet 日本語版 RDF ことはぶ CiNii RDF 日本語 WordNet (verson 0.9) 日本語 WordNet RDF NICT による WordNet の日本語化 Word の翻訳のみ (synset はそのまま ) 49,655 概念 (synset 数 ) 87,133 words 語 146,811 語義 (synset と単語のペア ) 日本語 WordNet RDF 日本語 WordNetのRDF 化 RDF/OWL Representation of WordNet, W3C Working Draft 19 June 2006 を WordNet 3.0 用に変更 HTML および RDF で表示 SUMO との統合 19
20
ことはぶ /KotoHub のコンセプト すべての言葉に URI を! 言葉から定義へのハブ ネット上に散在している日本語辞書 百科事典 用語集のリポジトリ Dictionary of Dictionary 分野を跨いだ横断検索 専門家によって編纂された知識体系と, ユーザ参加型コミュニティによって生成された知識体系の融合 21
辞書のソース Wikipedia 日本語版 : 549,521 語 http://download.wikimedia.org/jawiki/20090423/jawiki-20090423-pages-meta-history.xml.bz2 kotobank.jp : 333,780 語 http://kotobank.jp はてなキーワード : 247,690 語 http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv Yahoo! 百科事典 : 98,056 語 http://100.yahoo.co.jp/ ニコニコ大百科 ( 仮 ) : 48,911 語 http://dic.nicovideo.jp/m/a/a Weblio: 953,828 語 http://www.weblio.jp/ WordNet 日本語版 0.9: 227,753 語 ( うち日本語 85,966 語 ); 50,739 概念 ; 151,831 語義 http://nlpwww.nict.go.jp/wn-ja/ IPA 辞書 2.7: 231,900 語 http://sourceforge.jp/projects/ipadic/ のべ単語数 : 2,691,439 語 ; 正規化済み : 2,113,688 語 ; 読み : 546,364 語 22
RDF による Web サービス連携 http://wordnet.jp/kotohub/term/ 愛.rdf <?xml version='1.0' encoding='utf-8'?> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" schema# xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:linked="http://wordnet.jp/kotohub/ns/linked/0.1/" xml:lang="ja"> <rdf:description rdf:about="http://wordnet.jp/kotohub/term/ 愛 "> <foaf:isprimarytopicof rdf:resource="http://wordnet.jp/kotohub/term/ 愛 " /> <rdfs:seealso rdf:resource="http://dic.nicovideo.jp/a/ 愛 " /> <rdfs:seealso rdf:resource="http://ja.wikipedia.org/wiki/ 愛 " /> <rdfs:seealso rdf:resource="http://ja.wikipedia.org/wiki/ 愛 _(TBSテレビドラマ) " /> <rdfs:seealso rdf:resource="http://100.yahoo.co.jp/detail/ 愛 /" /> <rdfs:seealso rdf:resource="http://kotobank.jp/word/ 愛 " /> <rdfs:seealso rdf:resource="http://www.weblio.jp/content/ 愛 " /> <rdfs:seealso rdf:resource="http://wordnet.jp/jp09/instances/word- 愛 " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ あい " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ ちか " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ めぐみ " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ まな " /> </rdf:description> </rdf:rdf> CiNii RDF CiNii: NIIが提供する論文目録データベースサービス 約 1300 万件 この各論文のメタデータをタを RDF で提供 23
24
25
Linked Data は Web of Data 機械のため Web まとめ つながることで広がる新しい世界 cf. Web, SNS 敷居の低い Semantic Web 今すぐに参加できる Semantic Web 今すぐにつかえるSemantic Web 様々な問題点はあるが それは普及してから考えましょう 26