平成 24 年 10 月 17 日国立国会図書館 (NDL) データベースフォーラム 国立国会図書館サーチ 原田隆史同志社大学社会学部教育文化学科准教授 NDL サーチと業務基盤システム 2 1
NDLSearch ができるまで デジタルアーカイブポータル デジタルコンテンツの統合検索 NDL Search 紙 デジタルコンテンツの統合検索 National Diet Library (NDL) 中山正樹氏作成 3 クラウド ( 学術機関連携 ) NII JST 大学図書館 電子ジャーナル出版者 情報探索サービスの将来像 ( クラウドの世界でのサービスの連携 ) (CJK 連携 ) 中国 日本 韓国 ( 出版者等との連携 ) 日本電子出版協会 (JEPA) 日本印刷技術協会 (JAGAT) 書籍出版者 電子書籍出版者 インターネット書籍販売者 当館は巨大なデータプロバイダ 巨大なデサービスプロバイダータプロバイダとして 中核的なとなる ( 国際連携 ) WDL Europeana ( 商用ポータルサイト ) Google Yahoo 等 2009 年 サービス群 (MLA 連携 ) 国立公文書館 東京国立博物館 国立美術館人間文化研究機構 ( 資源共有化 ) 各美術館 博物館 公文書館 図書館 (NDL) NDLデジタルアーカイブ 蔵書目録 ナレッジ 各種データベース ユーザ群 ユーザ群 ( 公共図書館連携 ) 都道府県立図書館 政令指定都市立図書館 市町村立図書館クラウド 専門図書館 サービス群 ( 政府機関との連携 ) e-gov( 総務省行政管理局 ) 各府省支部図書館 国立印刷局 複数のサービスが連携して 新たなサービスを形成 ( 民間 個人サイト ) Blog Wiki SNS サイト ソーシャルブックマークサイト 利用者は 情報 サービスの所在場所を意識せず利用 利用者は 自由にサービスを組み合せて利用 National Diet Library (NDL) 中山正樹氏作成 2
式システムロトタイプ 原作 書誌 所蔵の視点でのコンテンツの体系的整理の概念 源氏物語 ( 紫式部 ) 著作 ( 書誌テキスト 音声ファミリー ) マンガ 動画 2009 年 3 月 書誌レコードの機能要件 (Functional Requirements for Bibliographic Records:FRBR) モデルに基づいた資源の管理 National Diet Library (NDL) 中山正樹氏作成 表現形 文字 文字英訳版 マンガ 動画アニメ 音声 ( 朗読 ) 体現形 ( 実現形 ) 単行本 文庫本 体現形の集合が目録 印刷用原本絵本 コミック デジタルスキャン PDF デジタルテキスト化 PDF デジタルプレーン Text 電子ブック XMDF 電子ブックデジタル携帯用 XML Docomo 電子ブック携帯用 AU デジタル MP4 電子ブック携帯用 SoftBank 映画 デジタル WMV デジタル MP3 デジタル MWA NDL サーチ目録検索 デジタル AAC 所蔵場所に無関係 個別資料 NDL 蔵書 XX 図書館蔵書 デジタル NDL がデジタル化 デジタル NDL が XX から収集 デジタル XX で公開 国文学研究資料館.. XX ミュージアム 所蔵館毎情報 5 所蔵情報 各種実施計画書 フォーカスグループインタビュー 一般ユーザアンケート調査 長尾ビジョン 館内各検討 G サービス要件定義 システム化要件定義作成 H21. 10 H21. 12 H22. 2 技術 製品開発及び適用動向調査 外部サービス動向調査利用者ニーズ調査正総合目録検討 G 総合目録業務要件 サービス要件定義書 総合評価 アクセスログ分析 ユーザビリティ アクセシビリティ調査ン技術標準適用指針各技術標準適用ガイドライン ガイドライサービス要件 G (案)館内各検討 システム化要件定義書 有識者検討会 National Diet Library (NDL) 中山正樹氏作成 プロトタイプ仕様書 テストベッド 基本機能構築プ6 3
適用すべき技術標準の指針 ( 一覧 ) 適用指針番号適用指針の名称 TD-01 TD-02 TD-03 TD-04 TD-05 TD-06 TD-07 TD-08 利用者の利便性向上に資する技術の積極的な採用オープンな標準に基づいた技術 仕様の採用技術 仕様の共通化システムの特性に応じた成熟度を持つ技術の採用パッケージ ソフトウェアやオープンソース ソフトウェアの活用資源の共同利用および柔軟な配分 拡張に資する技術の採用システムの重要度に応じた障害対策技術の選択情報セキュリティを考慮した技術の選択 TD-09 運用 保守業務の集約化 共通化に資する技術の採用 National Diet Library (NDL) 中山正樹氏作成 7 サービス構築の基本要件 NDLの新しい利用者サービスの方向性を打ち出す 網羅性が保証された情報資源へ利用者をナビゲート 利用者オリエンテッドでユーザビリティを追求する 利用者の検索プロセスを考慮したユーザインターフェースの提供 旧来のOPACのような表示にはこだわらない 利用者をターゲッティングする あくまでも 一般ユーザ 未利用者層を開拓 確証をもった形での利用 試行錯誤によりたどり着いた利用 検索エンジン経由で訪れるユーザを重視する NDLのサイトという認識なしに訪問したユーザを適切にナビゲートすることを重視 デザイン 操作性を磨き上げる 他の優れたアイデアや工夫は積極的に取り込み 無理なオリジナリティは追及しなは追及しない いつでも どこでも を実現する 携帯端末利用者にも 高い操作性とデザインのGUIを提供 新しい付加価値を生み出す 民間企業や非営利団体 個人が提供しているサービスとの連携や複数の異質なサービスの組み合わせ 従来の図書館の枠にとらわれない自由な発想による付加価値創造の仕掛け National Diet Library (NDL) 8 4
システ4 来館者管理システム旧 NDL サーチのシステム化要件 情報の収集 当館及び他機関のデータベースに格納された書籍 ジャーナル 雑誌 地図 画像 映像 音楽等のコンテンツのメタデータ ハーベスティングや横断検索 情報の組織化 収集したメタデータについて インデックスを作成して組織化 DC-NDL 形式により体系化された形でデータベースに保管 関連資料をグルーピングするなど 情報の構造的な見せ方も可能に データ管理 情報探索サービス用に収集 組織化したデータを最新の状態で管理 情報の検索 情報探索サービスシステム内のデータベース及び全国の公共図書館等のサイトから 簡易検索 詳細検索その他様々な検索方法を提供 その際 サジェスト機能やレファレンス情報 外部機関が提供する連想検索機能等のナビゲーションサービスを活用 付加価値サービスの提供 検索機能のほか RSS 配信やブックマーク機能など情報探索に役立つ検索以外のサービスも提供 また 公共図書館等に対し 情報提供 収集用のAPIも提供 民間企業や非営利団体 個人等と連携しながら 保有する情報資源を活用した様々なサービスを提供することを目指す National Diet Library (NDL) 9 NDL システムのリニューアル 基幹の図書館システムを全面リニューアルし 平成 24 年 1 月にリリース 1. 資料デジタル化の進展を踏まえ 紙資料とデジタルコンテンツの一元的な利用環境を整備 デジタルコンテンツの更なる活用を促進 2. 内外の情報資源への統合的なアクセス 3. システムの最適化 運用コストの合理化 電子図書館基盤システム H12~ ム雑誌記事索引オンライン処理システム H10~ 1 業務基盤システム アシ ア言語 OPAC H14~ (NDL-OPAC) 国立国会図書館総合目録ネットワーク H10~ 2 国立国会図書館サーチ統全国新聞総合目録データベース H11~ 合 3 館内サービスシステム 児童書総合目録 H12~ デジタルアーカイブポータル H19~ 館内電子情報提供システム H18~ 東京本館来館者管理システム H16~ 関西館来館者管理設備 H14~ National Diet Library (NDL) 中山正樹氏作成 10 5
NDL サーチをサービスの起点に 内外の情報資源を統合検索 一次情報の入手手段までナビゲート 連携対象 (82DB 7 千万件のメタデータを検索可能 ) JPO 近刊情報センターとの連携開始 出版前情報から 作成中書誌 完成書誌まで一貫した提供が可能に CiNii Books との連携により 大学図書館蔵書も検索可能に OpenURL による書誌間連携を実現 横断検索について調整中 韓国及び中国との連携 ( 中国国家図書館との連携が課題 ) シングルサインオン 象拡大 Shibboleth により OPAC とのシングルサインオンを実現 今後対 震災アーカイブ National Diet Library (NDL) 中山正樹氏作成 11 新システムの連携概要 利用者端末 ( 東京本館 ) 業務基盤システムバックグラウンドログイン 一般利用者 ( 館外 ) 館内サービスシステム (KSS) NDLサーチ簡易検索窓 資料を検索して申し込む (NDL- 複写を申し込 OPAC) む ( 複写申込書作成 ) 電子情報を利用する 申込状況を見る ( 複写申込書作成 ) はじめての方へ ( 利用案内 ) 国立国会図書館からのお知らせ Web NDL Authoriti es NDL サーチ 入退館ゲート ( 本館 ) 入退館ゲート ( 新館 ) カード発行機 業務基盤システム 来館者管理システム入退館ゲー (GW) REST X- PDS WebOPA ト通過 Service C ( 本館 ) 入退館ゲー REST MQ MQ ALEPH ト通過 ( 新館 ) FTP 登録利用者カード発行 職員端末職員端末 WebOPA AlephGUI Cの利用の利用 検索サービス SSO 統合認証 リンクリゾルバ (SFX) 職員端末 National ( Diet 東京本館 Library (NDL) ) 12 6
NDL サーチでの当面の連携イメージ 他のネットワークと相互補完して 連携機関のサービス 公文書館 美術館 博物館ネットワーク 大学図書館ネットワーク 商用 DB サービス 海外のデータベース 知識の集約と利用者への提供 2 外部 Webサービスとの連携 NDL から直接 統合検索サービスを提供 デジタルの総合目録 Google, Yahoo! 等検索エンジン 他サービスから 1 統合検索サービスの提供 国立国会図書館サーチ NDL Search 紙資料の総合目録 レファレンス情報の総合目録 研究開発機関 3 研究開発における連携 NDL 各機関デジタルデジタルアーカイブアーカイブ メタデータを集約 NDL 蔵書目録 4 統合利用促進のた National Diet めの環境整備 Library (NDL) 各図書館 NDL 各図書館蔵書目録レファレンスレファレンス 情報を集約し多様なルートで利用者に届ける 13 国立国会図書館サーチの機能とシステム構成 National Diet Library (NDL) 14 7
国立国会図書館サーチの役割 1. 情報検索ツールとして : ディスカバリインタフェース a. 広い収録範囲を統合して検索可能 - 冊子体に加えてデジタル資料も - 他機関が保有する資料も同時に b. 表示項目の充実 c. 広い範囲の利用者に対応 2. 情報源としての利用 a. 図書館業務での利用に b. Webサービスのひとつとして - 全国書誌, ゆにかねっと所蔵目録 - 新着図書のインプロセスデータ 3. ILLの拠点としての利用 4. オープンソース図書館システムとしての利用 ディスカバリインタフェース 近年, 大学図書館を中心に利用がはじまってきた新しい図書館 OPAC の姿 少し前まで次世代 OPAC と呼ばれていた 豊富な情報の提供 ユーザー目線のインターフェース 図書館が提供する多様なコンテンツを集約 高度な検索機能を提供 8
検索 表示 利用の各過程での改善 入力 検索 操作性 視認性の向上 検索性能の向上 対象出力利用 検索対象となる資料の範囲の拡大 表示される内容の充実 検索結果表示後の操作 環境 コスト, システムの柔軟性 検索 表示 利用の各過程での改善 入力検索対象出力利用 操作性 視認性の向上 検索性能の向上 検索対象となる資料の範囲の拡大 表示される内容の充実 検索結果表示後の操作 環境 コスト, システムの柔軟性 9
NDL サーチ : 操作性 視認性の向上に関して デザイン上の工夫, 検索項目の簡略化, 単純化 簡易検索と詳細検索, 視覚障碍者用インタフェースなど デザイン専門家主導の設計 : システムよりデザインを優先した例も 色づかい ( 開発版と変更 ), 文字の大きさ, 配置の工夫, コントラスト ユーザビリティ アクセシビリティに配慮した画面デザイン 読み上げソフトに配慮した画面構成, 文字拡大機能, 白黒反転機能, 検索結果中における検索語のハイライト表示など 類似操作に関わる手段の統一 左サイドに 絞り込み, 右サイドに 検索式の拡張 メニューを配置 ボタンの種類をできるたけ統一 簡易検索機能を中心に, 詳細検索もオプションで <トップページ簡易検索 > 2012/10/19 20 10
検索結果の配置, 検索結果中のハイライト表示 操作性の統一左に絞り込み / 右にアクセスポイントの拡張 ヒットした検索語のハイライト表示 検索 表示 利用の各過程での改善 入力検索対象出力利用 操作性 視認性の向上 検索性能の向上 検索対象となる資料の範囲の拡大 表示される内容の充実 検索結果表示後の操作 環境 コスト, システムの柔軟性 11
NDL サーチ : 検索性能の向上に関して 検索語の修正 拡張機能 あいまい検索 ( りんご リンゴ 林檎...) 翻訳検索機能 キーワードサジェスト機能も 開発版 では実装していた 形態素に分解した検索, 語幹処理なども 開発版 では実装していた 関連語の表示機能 国立国会図書館件名標目表,NDLA( 国立国会図書館各種典拠情報 ) J GLOBALの科学技術用語, 連想検索エンジンなどからの関連語 検索速度の高速化 約 7000 万件のデータを対象とする苦労 ( 後述 ) Solr のインデックス中に全ての検索語を搭載 関連キーワード提示機能 ( 再検索リンク ) 国立国会図書館件名標目表 (NDLSH) から導出 < 検索結果一覧 > 12
連想キーワード提示機能 ( 再検索リンク ) 連想検索エンジン GETAssoc から導出 < 検索結果一覧 > 検索 表示 利用の各過程での改善 入力検索対象出力利用 操作性 視認性の向上 検索性能の向上 検索対象となる資料の範囲の拡大 表示される内容の充実 検索結果表示後の操作 環境 コスト, システムの柔軟性 13
NDL サーチ : 検索対象資料の範囲の拡大 図書以外の資料に関しても統合的に検索 雑誌記事, デジタル資料, レファレンス記録, 立法情報など 視覚障碍者用資料については別のページも用意 他の図書館や図書館以外の機関が持つ資料 書誌データを収集して検索を行う機関と横断検索機関 横断検索と検索速度との相克 中国国家図書館, 韓国国立図書館等 現在も多くの機関との交渉を継続中 書誌データの早期提供 作成中の書誌情報を早期に提供 近刊情報の提供 : JPO 近刊情報センターとの提携 図書以外の資料についても統合的に検索 各種の資料を同時に提示 14
検索 表示 利用の各過程での改善 入力 操作性 視認性の向上 検索 検索性能の向上 対象出力利用 検索対象となる資料の範囲の拡大 表示される内容の充実 検索結果表示後の操作 環境 コスト, システムの柔軟性 NDL サーチ : 表示される内容の充実 登録内容の充実 書影, 目次, あらすじなど 極めて限られた資料のみしか登録されていない 書誌同定と著作同定結果の表示 書誌同定 書誌同定 複数の機関で所蔵している同一資料の同定 著作同定 出版年や形態の異なる資料の同定 FRBR 化を目指して 15
同一著作のグループ化表示機能 (FRBR の機能も視野にいれて ) 著作同定結果 書誌同定結果 < 検索結果一覧 > 31 検索 表示 利用の各過程での改善 入力検索対象出力利用 操作性 視認性の向上 検索性能の向上 検索対象となる資料の範囲の拡大 表示される内容の充実 検索結果表示後の操作 環境 コスト, システムの柔軟性 16
NDL サーチ : 検索結果表示後の操作 追加操作に関する情報 検索結果の絞り込み いくつもの視点からのファセット機能 資料へのアクセスに関する情報 図書館の所蔵状況 オンライン書店へのリンク 外部サービスとの連携 書評サイトなどへのリンク コメント, ソーシャルブックマークなどへのリンク 検索結果を利用してもらうための仕組み RefWorks などでの書式での出力 WebAPI の公開 標準的な仕組みで公開を行っている SRU/SRW, Z39.50, OAI PMH, RSS など 検索結果に対する追加操作 ( ファセット ) < 検索結果一覧 > ファセット機能 2012/10/19 34 17
CiNii Books オンライン書店で探す < 書誌詳細右側 > 35 外部サービス連携機能 Twitter 等の外部 Web サービスへの投稿が可能 < 書誌詳細 > 36 18
NDL 新着図書情報の提供 テキストファイル (http://iss.ndl.go.jp/pbs/news/) RSS(http://iss.ndl.go.jp/pbs/news/rss_list) 国立国会図書館サーチシステム構成図 19
NDL サーチ : データの収集 横断検索とメタデータ収集 横断検索 リアルタイムに他のサービスへの検索を行う メタデータ収集 国会図書館の所蔵する書誌のメタデータの収集 他機関が提供しているメタデータの収集 タの収集 従来からの FTP/HTTP によるデータ転送 OAI-PMH の利用 ( 現時点では計画のみ ) Web ページなどはオープンソースの Heritrix を使用 NDL サーチ : データの組織化 収集したメタデータは統一的なXMLに変換 以後の処理は XMLからデータを抽出して利用 XMLを元にDC-NDLを作成して提供も 書誌同定と著作同定を行う Hadoop/HDFSのMap/Reduce 機能を使用 Hadoop : オープンソースの分散ファイルシステム 大量データを複数台の安価なコンピュータで処理タで処理 全データを対象とした操作が基本のため, 数件の変更でも全データ処理が必要になることも 検索用には収集データから差分抽出し,Solrのインデックスを作成 20
NDL サーチ : データの検索と管理 Project Next-Lの開発したオープンソース統合図書館システム Next-L Enjuをベースに開発 データベースの構造はNext-L EnjuではFRBRの構造に忠実にDBを作成していたが,NDLサーチでは 1つのフィールドにXMLデータを格納して使用 検索のためのインデックス登録は全てHadoopで行うなどの改造を行った 翻訳機能の提供, スマートフォン 携帯への対応, 連想キーワード機能 (GETAssoc 連携 ) などを追加 翻訳機能は, 商用のシステムを使用 システム開発の今後 大量データを対象とするため, 検索速度の問題が常につきまとう 機能的には実用レベルのものでも, 応答時間短縮のために実装を見送った機能も 利用者からの反応を受け, 今後も機能の改善, 拡張を行う予定 どのようにすれば公開的に利用されるかについての検討も必要であると考えている 21
NDL サーチの機能改善 (2012 年度 ) National Diet Library (NDL) 43 知識インフラ震災アーカイブ この項全体の資料については National Diet Library (NDL) 中山正樹氏作成 44 22
NDLSearch をベースに 大学 学会 研究機関 企業 新たな知識の創造と還流 アクセス 社会 経済的な価値の創出 知識インフラ ナビゲーション ( ポータル ) 蓄積 保存 アクセス 国会 行政 ( 政策担当 ) 一般市民 海外 研究者と国民の相互作用 構造化 知識抽出 データ標準化 情報のデジタル化 知識インフラ連携機関 NDL 国の機関公共機関 学術情報研究情報機関 MLA 連携機関 商用 DB サービス機関 文献情報 研究データ その他の情報 様々な関係機関 研究者 研究機関 学会 学術出版社 データベース作成機関 アグリゲータ 図書館等狭義の情報基盤 様々な学術情報 社会科学 科学 技術 人文科学 National Diet Library (NDL) 中山正樹氏作成 45 NDL サーチは 知識インフラのポータルに 次世代図書館サービス 知識インフラ 知識インフラの提供を目指して 仮想的な図書館 知識を蓄積し提供する場所 物理的な組織の壁を越えて MLAの館種 学術 民間の業務業態を越えて 情報の内容で関連付け 現在の到達点 メタデータレベルでの統合検索 1つの社会で共有する中立的な知識構造 知識システム 資料 記事が 分解されて 各種観点からリンクされた巨大なネットワーク構造 関連付け 固有の関係 共通的な知識の体系化 構造化 人それぞれの観点での関係 利用者の要求に応じて知識を関連付けてられるもの NDLSearchは 知識インフラの入り口 情報の組織化と取出し機能を担う 組織化 メタデータの自動付与 類似性のある情報の検出と分類 ( 自動リンク付け ) 検索 マルチメディア情報の内容検索 知識インフラの目標イメージ 他の知識との関係がチェックされ 新しい関係のリンクが付けられていく仕組み 情報が単に記録されていくのではなく 自分のほしい情報そのものが出てくる仕組み 自分のほしい情報の書かれている本を取り出して 書かれている個所を探すのではなく National Diet Library (NDL) 中山正樹氏作成 46 23
知識インフラ構築に向けた NDL サーチの今後の展開 震災アーカイブの構築を目指して 知識インフラの構築を目指して 知識インフラ構築の一環で 先行する分野の 1 つとして構築 様々な分野の情報資産を知識として利活用し 知識の再生産を支援するサービスの提供を目指す National Diet Library (NDL) 中山正樹氏作成 47 終わり ご静聴ありがとうございました National Diet Library (NDL) 48 24