Microsoft PowerPoint takeda.pptx

Similar documents
アジェンダ オープンデータについて オープンガバメント セマンティック Web 技術 (RDF,SPARQL) RDF とは RDF の表現形式 : タートル,RDFa, マイクロデータ RDF グラフへの問い合わせ :SPARQL 利用環境 (SPARQL Timeliner,SparqlEPCU

平成17年度大学院 知識システム特論

橡dbweb2002-sato.PDF

RDF-lecture-01_ key

DC-NDLサンプルデータ集:Sample09:デジタル化資料(博士論文)の表現例[Mathematical Model of Muscle Contraction(筋収縮の数理的モデル) ]

PowerPoint Presentation

分散情報システム構成法 第5回 Semantic Webの基本とRDF

Web - DAML OIL DAML-S - 三菱電機情報技術総合研究所音声 言語処理技術部今村誠 1. Web 2. セマンティック Web とオントロジ 3. オントロジ記述言語 4. 関連ツールと実験システム 5. 従来技術との差異 6. 今後の課題 1

国立国会図書館ダブリンコアメタデータ記述

Microsoft PowerPoint - RSSによる情報流通S.ppt


第12回「RDF入門」

ウェブサービスとは WWWを介してデータの取得 解析などをサー バ側で行うサービス 人が直接使うことは意図されていない プログラム等を使って大量に処理できる(単純) 作業を意図している SOAP, REST

WebAPI 及びデータフォーマット (DC-NDL) の概要 国立国会図書館電子情報部 電子情報サービス課 1

情報システム 第11回講義資料

ビッグデータ時代の オントロジー技術

PowerPoint プレゼンテーション

メタデータスキーマレジストリ MetaBridge の概要

マルチエージェントシステムグループの研究計画

書誌情報の将来像:共同目録の観点から

セマンティックWebはWeb2.0を超えることができるか

IMI 共通語彙基盤ライブラリのご紹介 IPA 斉藤浩 / IPA 豊田耕司 2018 年 11 月 13 日 ( 火 ) 独立行政法人情報処理推進機構社会基盤センター産業プラットフォーム部データ活用推進グループ 1

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >

Oracle Secure Enterprise Search 10gを使用したセキュアな検索

スライド 1

Google( Scholar)から始める文献の集め方

Microsoft Word - CiNiiの使い方.doc

オンラインコンテンツにおけるDOIの役割

Bluemix いつでもWebinarシリーズ 第15回 「Bluemix概説(改訂版)」

NBDC-DBCLS-共同研究計画.key

ふくおか IT Workouts 2015 Presentation Workout 日時 :2015 年 11 月 27 日 ( 金 ) 場所 : 福岡大学 新宮町でのおもてなしに 向けた ICT 活用法の検討 新宮発見隊 福岡工業大学槇俊孝, 髙橋和生, 河野和音佐藤夏姫, 島添真帆, 丸田彩加

平成29年度「ジャパンサーチ(仮称)」利活用フォーマット検討成果物

HTML5無料セミナ.key

Transcription:

Linked Data の現状と日本の課題 武田英明 国立情報学研究所東京大学人工物工学研究センター takeda@nii.ac.jp Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data 3

Linked Data とは Web of Data RDF で公開されるデータ Linked Data 外部から参照可能 (dereferenceable) Linked Data, TBL, http://www.w3.org/designissues/linkeddata.html RDF (Resource Description Framework) Semantic Web の階梯 最も原始的な意味記述の枠組みを提供ー >SVOモデル Entity-Relation Model( 実体関連モデル ) セマンティックネット RDF Schema RDFに最も原始的な概念記述の仕組みを追加 class-subclass 関係, 制約 OWL (Web Ontology Language) 記述論理 (description logics) に基づいた概念とその関係を記述する言語 Rule-ML もっと上へ もっと上へ Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ 4

抽象問題から具体問題への回帰 Semantic Web の階梯 クラスに関する記述 インスタンスに関する記述 オントロジー Linked Data Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ オントロジー クラスに関する記述 RDFS OWL オントロジー構築の課題 Semantic Web の階梯 オントロジー構築はそもそも大変 一貫性 網羅性 論理性 複数オントロジーの統合 関連付けはもっと大変 クラスに関する記述 インスタンスに関する記述 オントロジー Linked Data Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ 5

Linked Data Semantic Web の階梯 インスタンスに関する記述 = 個々の事物に関する記述 RDF + (RDFS, OWL) Linked Data の記述における利点 書きやすい ( 事実に関する記述が主 ) リンクしやすい ( 同 ) Linked Dataの記述における問題点 複雑な記述は難しい それでもクラス定義は必要 ( オントロジー) クラスに関する記述 オントロジー インスタンスに関する記述 Linked Data Tim Berners-Lee http://www.w3.org/2002/talks/09-lcs-sweb-tbl/ Linked Data のための 4 条件 Linked Data 事柄の名前に URI を使うこと Use URIs as names for things すべてのモノ, コトに URI を! 名前の参照が HTTP URI でできること Use HTTP URIs so that people can look up those names. DOI とかいった URN は使わないでね URIを参照したときに関連情報が手に入るように When someone looks up a URI, provide useful information, using the standards d (RDF, SPARQL) 理解可能なデータを提供してね. 外部へのリンクも含めよう Include links to other URIs. so that they can discover more things. Webのようにリンクでつながるデータを作ろう Linked Data, TBL, http://www.w3.org/designissues/linkeddata.html 6

Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data Linking Open Data (LOD) 公開された Linked Data を集めるプロジェクト 主要な Linked Data ( データ変換 ) Dbpedia (Wikipedia) : 百科事典, 2.7 億文 Geonames: 地名と緯度経度, 9300 万文 MusicBrainz: 音楽 WordNet: 辞書 DBLP bibliography: 論文の書誌,2800 万文 US Census Data: 米国国勢調査 (2000 年 ), 10 億文 ( クロール ) FOAF (Friend Of A Friend): 個人と個人関係のプロファイル ( ラッパー ) Flickr Wrapper 7

Dbpedia の例 131 億文 141 万個のリンク 8

Music Web-based Information Geographic information Papers Life Science and Health Care 131 億文 141 万個のリンク LOD の発展 (1) As of March 2008 9

LOD の発展 (2) LOD の発展 (3) 10

LOD の発展 (4) 131 億文 141 万個のリンク Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data 11

Link Data 汎用サーチエンジン Swoogle Watson SWME http://swse.deri.org/ Sindice http://sindice.com/ 特殊サーチ Sameas http://sameas.org/ Linked Data Search Engine http://sameas.org/ 12

Linked Data Browser データを Web ページのようにみていくツール システム Mable リンクを順に表示 Tabulator Firefox plugin 版 /online 版 1ページの中にどんどん情報を追加 Sig.ma RDF のソースを同時提示して 操作可能 13

Tabulator 14

Linked Data Mashup Linked Data Browser Linked Data Mashup Linked Data Search Engine Things Things Things Things Things 15

How to use Linked Data Semantic Data Mash-up Applications SemaPlorer http://btc.isweb.uni-koblenz.de/ Dbpedia Mobile http://wiki.dbpedia.org/dbpediamobile Bio2RDF http://bio2rdf.org/ DBpedia Mobile 16

Bio2RDF Bio 系のリソース検索 RDFでないものは勝手に RDF 化 Bio2RDF 17

Linked Data のメリット Web API と Linked Data の比較 統一されたインタフェース RDF / SPARQL endpoint 意味の明示 サイトを越えた連携 sameas Linked Data のデメリット 速度 意味解釈の曖昧さ データの信頼性 由来 新鮮さ Linked Data とは何か Linked Data の現状 Linking Open Data (LOD) Linked Data の使い方 検索エンジン ブラウザ アプリ 日本における Linked Dataの課題 Linked Data 18

日本における Linked Data 課題 日本語の壁 URI ハブの欠如 Dbpedia RDF の普及の遅さ RDFa 我々の取り組み WordNet 日本語版 RDF ことはぶ CiNii RDF 日本語 WordNet (verson 0.9) 日本語 WordNet RDF NICT による WordNet の日本語化 Word の翻訳のみ (synset はそのまま ) 49,655 概念 (synset 数 ) 87,133 words 語 146,811 語義 (synset と単語のペア ) 日本語 WordNet RDF 日本語 WordNetのRDF 化 RDF/OWL Representation of WordNet, W3C Working Draft 19 June 2006 を WordNet 3.0 用に変更 HTML および RDF で表示 SUMO との統合 19

20

ことはぶ /KotoHub のコンセプト すべての言葉に URI を! 言葉から定義へのハブ ネット上に散在している日本語辞書 百科事典 用語集のリポジトリ Dictionary of Dictionary 分野を跨いだ横断検索 専門家によって編纂された知識体系と, ユーザ参加型コミュニティによって生成された知識体系の融合 21

辞書のソース Wikipedia 日本語版 : 549,521 語 http://download.wikimedia.org/jawiki/20090423/jawiki-20090423-pages-meta-history.xml.bz2 kotobank.jp : 333,780 語 http://kotobank.jp はてなキーワード : 247,690 語 http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv Yahoo! 百科事典 : 98,056 語 http://100.yahoo.co.jp/ ニコニコ大百科 ( 仮 ) : 48,911 語 http://dic.nicovideo.jp/m/a/a Weblio: 953,828 語 http://www.weblio.jp/ WordNet 日本語版 0.9: 227,753 語 ( うち日本語 85,966 語 ); 50,739 概念 ; 151,831 語義 http://nlpwww.nict.go.jp/wn-ja/ IPA 辞書 2.7: 231,900 語 http://sourceforge.jp/projects/ipadic/ のべ単語数 : 2,691,439 語 ; 正規化済み : 2,113,688 語 ; 読み : 546,364 語 22

RDF による Web サービス連携 http://wordnet.jp/kotohub/term/ 愛.rdf <?xml version='1.0' encoding='utf-8'?> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" schema# xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:linked="http://wordnet.jp/kotohub/ns/linked/0.1/" xml:lang="ja"> <rdf:description rdf:about="http://wordnet.jp/kotohub/term/ 愛 "> <foaf:isprimarytopicof rdf:resource="http://wordnet.jp/kotohub/term/ 愛 " /> <rdfs:seealso rdf:resource="http://dic.nicovideo.jp/a/ 愛 " /> <rdfs:seealso rdf:resource="http://ja.wikipedia.org/wiki/ 愛 " /> <rdfs:seealso rdf:resource="http://ja.wikipedia.org/wiki/ 愛 _(TBSテレビドラマ) " /> <rdfs:seealso rdf:resource="http://100.yahoo.co.jp/detail/ 愛 /" /> <rdfs:seealso rdf:resource="http://kotobank.jp/word/ 愛 " /> <rdfs:seealso rdf:resource="http://www.weblio.jp/content/ 愛 " /> <rdfs:seealso rdf:resource="http://wordnet.jp/jp09/instances/word- 愛 " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ あい " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ ちか " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ めぐみ " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ まな " /> </rdf:description> </rdf:rdf> CiNii RDF CiNii: NIIが提供する論文目録データベースサービス 約 1300 万件 この各論文のメタデータをタを RDF で提供 23

24

25

Linked Data は Web of Data 機械のため Web まとめ つながることで広がる新しい世界 cf. Web, SNS 敷居の低い Semantic Web 今すぐに参加できる Semantic Web 今すぐにつかえるSemantic Web 様々な問題点はあるが それは普及してから考えましょう 26