国立国会図書館サーチとのOAI-PMH連携時に障害となるポイント

Similar documents
目次 国立国会図書館サーチとの連携について 連携スケジュール概要 お申込み ヒアリングシートの提供 スケジュール調整 サンプルデータの抽出 送付 接続 連携試験 運用設計 公文書取り交わし

WebAPI 及びデータフォーマット (DC-NDL) の概要 国立国会図書館電子情報部 電子情報サービス課 1

<4D F736F F F696E74202D20837C815B835E838B82CC8DC590568B5A8F70899E BC91E58E52967B816A2E707074>

<4D F736F F F696E74202D D315F96BC8CC389AE5F947A A CF68A4A5F966B8A4393B991E58A775F E B835E8A54985F C815B835E838B8CA48F43816A E312E B8CDD8AB B83685D>

機関リポジトリのメタデータ概論

スライド 1

OAI-PMHの要点 参考用ドラフト版

国立国会図書館ダブリンコアメタデータ記述

<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >

<4D F736F F D FC8E448FEE95F1837C815B835E838B C8F92E88B608F912E646F63>

システム連携・メタデータ

Microsoft PowerPoint - 講義資料_九大片岡.pptx

サービス内容 サービス内容 ここでは サービス内容についてご案内します このたびは 本サービスをお申し込みいただきまして 誠にありがとうございます この手引きは サービスをご利用いただく方 ( 一般利用者 ) 向けの内容で構成されております お客様のご利用環境によってはご紹介した画面や操作とは異なる

目次 はじめに... 3 追加 / 強化機能... 4 所蔵情報と利用可否情報をまとめて表示... 4 メール送信できる書誌データの拡大... 5 出版年 ファセットの更新... 6 他の版 フォーマット のパフォーマンス改善... 7 不具合の修正... 8 検索結果一覧と書誌詳細における著者名の

XML基礎

< 障害一覧 > HULFT 配信機能 管理番号 内容 対象バージョン 39 コード変換の必要がない集信処理および配信処理を実行したにも関わ 7.0.0~7.3.1 らず コード変換処理でエラーとなる場合がある 44 システム動作環境設定再設定コマンド (hulclusterxxx -set) を使

WorldCat Discovery Services リリースノート 目次 リリース日 :2016/4/15 ( 日本標準時 ) はじめに... 2 追加 / 強化機能... 3 フィードバックリンクの実装... 3 個人リストの注記を追加 編集... 5 新規コンテンツ 紀伊國屋書

DMtoJPGISVer1.0 操作説明書 平成 19 年 3 月 国土交通省国土地理院

改訂履歴 項番版数作成日 / 改訂日変更箇所変更内容. 平成 28 年 5 月 3 日新規章構成の変更, 分冊化に伴い新規作成 (i)

位置参照情報 API 仕様 ( 試行版 ) 位置参照情報 API 仕様 ( 試行版 ) Ver 1.0b 平成 26 年 12 月 国土交通省国土政策局国土情報課

平成 30 年 5 月 国民健康保険中央会

9 WEB監視

国立国会図書館法によるインターネット資料の収集について 国立国会図書館 最終更新 : 平成 31 年 2 月

<95CA F8FDA8DD782C8928A8F6F8FF08C8F82CC8E7792E882CC90E096BE2E786C7378>

UMIN INDICE Lower level data communication protocol for CDISC ODM規約

メタデータスキーマレジストリ MetaBridge の概要

GlobalFlow5 Ver.1.00R04 リリースノート

HTTP 404 への対処

HDC-EDI Manager Ver レベルアップ詳細情報 < 製品一覧 > 製品名バージョン HDC-EDI Manager < 対応 JavaVM> Java 2 Software Development Kit, Standard Edition 1.4 Java 2

PowerPoint Presentation

サービス内容 サービス内容 ここでは サービス内容についてご案内します このたびは 本サービスをお申し込みいただきまして 誠にありがとうございます この手引きは サービスをご利用いただく方 ( 一般利用者 ) 向けの内容で構成されております お客様のご利用環境によってはご紹介した画面や操作とは異なる

書誌情報の将来像:共同目録の観点から

要求受付機能 管理番号内容対象バージョン 314 トレースログに重複してメッセージが出力される場合がある 6.3.2~ 大量のファイルトリガ情報が登録されている状態でファイルトリガプロセスを起動するとファイルトリガプロセスが停止する場合がある 7.2.0~7.3.1 ユーティリティ

変更履歴 No 版数 更新日 変更箇所 変更内容 版 2017/6/26 - 新規作成 版 2018/3/ 法令 API 対象外の法令取得対象外となる法令データに係に関する事項る留意事項を追記 HTTP レスポンスコ 版 2018/3/

インストーラー 管理番号 内容 対象バージョン 230 HULFT がすでにインストールされているパスに対してサイレントインストールを実行すると インストールされていた HULFT の動作環境が不正な状態になる 7.3.0~7.3.1 ユーティリティ 管理番号 内容 対象バージョン 231 管理情報

U/Cサーバ 業務システム間転送プログラムインターフェース仕様書

『国立国会図書館月報』 589(2010年4月)号

第4回 国際的動向を踏まえたオープンサイエンスに関する検討会 参考資料5

サービス内容 サービス内容 ここでは サービス内容についてご案内します このたびは 本サービスをお申し込みいただきまして 誠にありがとうございます この手引きは サービスの運用を管理される方向けの内容で構成されております お客様のご利用環境によってはご紹介した画面や操作とは異なる場合がありますが 快

BOM for Windows Ver.6.0 リリースノート

DTD Reference Guide

<4D F736F F D20837D836A B5F93C192E88C AC888D593FC97CD5F2E646F63>

J-STAGE 記事登載時の入力データのチェック強化について

Microsoft PowerPoint - OSS運用管理勉強会資料_ a.pptx

サービス内容 サービス内容 ここでは サービス内容についてご案内します このたびは 本サービスをお申し込みいただきまして 誠にありがとうございます この手引きは サービスの運用を管理される方向けの内容で構成されております お客様のご利用環境によってはご紹介した画面や操作とは異なる場合がありますが 快

Microsoft Windows Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Linux は Linus Torvalds 氏の日本およびその他の国における登録商標または商標です Red Hat

<4D F736F F D DEC90E096BE8F C E838B82CC836A C E312E31816A2E646F63>

第1部参考資料

"ソフトウェア カフェテリアサービス向けソフトウェア説明書

WEBシステムのセキュリティ技術

内容環境... 3 対応 OS の変更... 3 関連アプリケーションの追加... 4 機能追加... 5 グラフ機能... 5 稼働率... 8 サービス一括削除 自動復旧エスカレーションコマンド AWS カスタムメトリックス監視 NRPE 任意監視... 11

◎phpapi.indd

活用が広がる 共通語彙基盤 (IMI) イベント 技術セッション 公園への応用 加藤文彦 国立情報学研究所 2016 年 6 月 3 日

振込先マスタを登録しましょう

プレポスト【問題】

iNFUSE インフューズ

改訂履歴 版 更新日 改訂内容 Ver 1.0b 2014 年 12 月 試行版 国土数値情報 API 仕様 ( 試行版 )

Oracleセキュア・エンタープライズ・サーチ

改版履歴 版数 日付 内容 担当 V /5/26 初版発行 STS V /7/28 動作条件の変更 STS メール通知文の修正 V /2/7 Windows8 の追加 STS V /2/2 Windows8. の追加 STS V

OmniTrust

"ソフトウェア カフェテリアサービス向けソフトウェア説明書

Delphi/400開発ノウハウお教えします Googleマップ連携によるリッチなGUIアプリ開発

4. ファイルアップロード機能 使い方 ファイルをドラッグ & ドロップ した状態 図 4-1: ファイルアップロード画面 ( 例 ) 1. 送信するファイルをドラッグ & ドロップしてください 送信するファイルの右のエリアをマウスでクリックする事により 従来のエクスプローラー形式のアップロードも可

CA Federation ご紹介資料

ITdumpsFree Get free valid exam dumps and pass your exam test with confidence

スライド 1

intra-mart Accel Platform — IM-共通マスタ スマートフォン拡張プログラミングガイド   初版  

掲示板ガイド1


ek-Bridge Ver.2.0 リリースについて

◎ エラーメッセージ 画面別 対応一覧表 ◎

PowerPoint プレゼンテーション

H indd

intra-mart Accel Platform — イベントナビゲータ 開発ガイド   初版  

<4D F736F F F696E74202D208E9197BF B8BB38EF690E096BE8E9197BF2E707074>

SIMロック解除管理 利用マニュアル

<4D F736F F D D28F A82B582F182AB82F C DEC90E096BE8F E C52E646F63>

機能追加 2.1. ロール設定項目の追加 2.2. アカウント発行機能の追加 2.3. 修了証テンプレート管理機能を追加 2.4. バナー設定機能を追加 2.5. 修了証の置換文字列に修了証番号を追加 2.6. レスポンシブデザイン受講機能で修了証が出力できる機能を追加 2.7. レスポンシブデザイ

Microsoft Office Visioによる 施設管理について

BIP Smart FAQ

V05L14R1 Release News Letter

TALON Tips < カレンダー ( 月別 ) の画面を表示する > 株式会社 HOIPOI 第 1.1 版 p. 1

intra-mart QuickBinder Ver.5.0 リリース ノート 第 4 版 2016/7/15 1. バージョンアップ内容以下にこのバージョンで変更になった点を列挙します なお 各機能の詳細に関してはマニュアルを参照して下さい また 各機能の設定方法に関しては 操作説明書またはセット

操作方法 XXXTOEMF は コマンドライン形式のアプリケーションです 通常のコマンドと同じように コマンドラインからの実行やバッチファイルに組み込むことが可能です インストールについては, 別紙の KDxxxx コンバートソフトの特記事項について を参照してください ここでは 直接コマンドライン

2010年4月~6月 協業実績報告

Microsoft Windows Windows Server Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Oracle と Java は Oracle Corporation 及びその子会社 関

【手引き】完了時の手続について

PowerPoint プレゼンテーション

Microsoft Windows Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Linux は Linus Torvalds 氏の日本およびその他の国における登録商標または商標です Red Hat

資料安作 13-3 品質の低下についての考え方 総務省総合通信基盤局 電気通信技術システム課 平成 21 年 5 月 13 日

GHS混合物分類判定システムインストールマニュアル

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

intra-mart Accel Platform

Web型iEDIシステム操作説明書

/7/ /8/ /8/ /8/ /8/ /7/13 伝送請求 PI ライブラリの通常モードと サイレントモードとの違いは何か 伝送請求 PI ライブラリは通常 対話式のユーザインタフェースを備えて

PowerPoint プレゼンテーション

4. WIX アタッチエンジン 4. 1 FSDR 処理 システムの Web 資源結合動作であるアタッチ処理について 述べる. アタッチ処理は以下の 4 フェーズに分けられる. この一連の 流れを FSDR 処理とする. Find 処理 Select 処理 Decide 処理 Rewrite 処理

マニュアル訂正連絡票

別紙 1 無線局等情報検索 Web-API のリクエスト条件一覧 (Ver.1.1.1) 平成 31 年 2 月

Transcription:

国立国会図書館サーチとの OAI-PMH 連携時に障害となるポイント ~ スムーズな連携実現のためにご注意いただきたい点 ~ ( 平成 30 年 8 月 ) 国立国会図書館サーチでは これまで 100 を越えるデータベースと連携を行ってきました その経験から OAI-PMH で連携を開始する際に障害となりうるポイントをご案内します 国立国会図書館サーチとの OAI-PMH でのスムーズな連携実現のために OAI-PMH リポジトリの実装等にあたって 他の技術資料 1 や OAI-PMH 仕様 2 と合わせてご参考にしていただければ幸いです 1 OAI-PMH リポジトリの出力仕様について 1.1 OAI-PMH リポジトリがセッションの維持を要求する国立国会図書館サーチの OAI-PMH ハーベスタは resumptiontoken を使用してリクエストする際にセッションの維持を行いません そのため セッションの維持を要求するリポジトリからは resumptiontoken を使用したメタデータの収集が行えません セッションに関わらず OAI-PMH リクエストを処理できる実装としてください 1.2 OAI-PMH リポジトリが出力する XML が整形式でない国立国会図書館サーチの OAI-PMH ハーベスタは 連携先データベースの OAI-PMH リポジトリに対しリクエストを行い リポジトリから返戻された XML から resumptiontoken を特定し さらに resumptiontoken を指定したリクエストをリポジトリに送信するという繰り返しにより メタデータの収集を行います この際 リポジトリが返戻する XML が整形式でないことにより メタデータの収集に失敗することがあります 具体的な事例は次の通りです XML として許容する文字 3 以外の文字 ( 制御文字やサロゲートブロック 4 等 ) が出力されている ( 国立国会図書館サーチの実装においては文字参照 5 としての記述や CDATA セクション 6 としての記述でもエラーとなります ) 1 http://iss.ndl.go.jp/information/renkei/#5 2 https://www.nii.ac.jp/irp/archive/translation/oai-pmh2.0/openarchivesprotocol.htm 3 https://www.w3.org/tr/xml/#charsets 4 U+D800 ~ U+DFFF の領域 5 https://www.w3.org/tr/xml/#dt-charref 6 https://www.w3.org/tr/xml/#sec-cdata-sect 1

アンパサンド (&) や左山括弧 (<) 等の文字が適切にエスケープ 7 されていないリポジトリの返戻は W3C 勧告を満たす整形式の XML 文書 (Well-Formed XML Document) 8 である必要があります また 国立国会図書館サーチでは私用領域 (Private Use Area) 9 の文字や Unicode 基本多言語面 (Basic Multilingual Plane; BMP) 外の文字 10 が含まれる XML は正常に扱えません 私用領域 BMP 外の文字が含まれない実装とするようお願いします 1.3 OAI-PMH リポジトリが出力するメタデータが適切でないリポジトリが返戻するメタデータが 国立国会図書館サーチのフォーマット仕様 (DC- NDL(RDF) DC-NDL(Simple) 等 ) に適合していない場合 国立国会図書館サーチへのメタデータの格納や 書誌同定機能等に不具合が発生することがあります 場合によってはリポジトリの出力機能を修正いただく必要があります リポジトリが返戻するメタデータは国立国会図書館サーチのフォーマット仕様に適合するよう出力していただけるようお願いします リポジトリの実装にあたっては DC-NDL(RDF) DC-NDL(Simple) のフォーマット仕様 11 及び Web API によるシステム連携ガイドライン 12 の 2. メタデータ形式 を確実にご確認いただくとともに 提供するスキーマファイル 13 を用いて妥当性検証をいただければ幸いです 1.4 OAI-PMH リポジトリがエラー発生時に適切な HTTP ステータスを通知しない国立国会図書館サーチの OAI-PMH ハーベスタは 連携先データベースの OAI-PMH リポジトリに対しリクエストを行い 正常な返戻が行われなかった場合は処理の中断 あるいはリトライを行います この判断はリポジトリの通知する HTTP ステータスコードに基づいて行われます エラーが発生したにもかかわらずリポジトリが適切なステータスコードを返戻しない ( ステータスコード 200 を返戻する ) 場合 正常な返戻が行われなかったことを検知できずデータの取り漏れが発生します エラー発生時は状況に応じ 500 Internal Server Error 503 Service Unavailable 等の適 7 https://www.w3.org/tr/xml/#syntax 8 https://www.w3.org/tr/xml/#dt-wellformed 9 U+E000 U+F8FF の領域 10 U+10000 ~ U+10FFFF の領域 11 http://iss.ndl.go.jp/information/metadata/#1 12 http://iss.ndl.go.jp/information/renkei/#5 13 入手をご希望の方はお問い合わせください 2

切なエラーを出力くださるようお願いします 1.5 OAI-PMH リポジトリが resumptiontoken 指定時に仕様外の引数を要求する OAI-PMH の仕様上 resumptiontoken は排他 (exclusive) の引数として定義されている 14 ため OAI-PMH ハーベスタが resumptiontoken を指定してリクエストを送信する場合は 他の引数 (from, until, set, metadataprefix) は付加しないのが正しい仕様となります そのため リポジトリが他の引数がない場合に正常にリクエストが処理されない実装となっている場合は リポジトリ実装の修正を実施いただく等の対応が必要となり 連携開始までに時間を要することとなります resumptiontoken のみを引数に指定したリクエストについて 正常に処理できるリポジトリ実装とするようお願いします 1.6 OAI-PMH リポジトリが resumptiontoken 指定リクエストに対し冪等性がない OAI-PMH の仕様 15では 同一の resumptiontoken を指定してリクエストを行った場合に 同じレコードの集合を返戻する必要があります ( リポジトリのレコードに変更が生じた場合を除く ) 同一の resumptiontoken に対して返戻されるレコードが試行ごとに変わる実装の場合 失敗したリクエストの再試行が行えず メタデータの取得に失敗する原因となります リポジトリのレコードに変更がない限り 同一の resumptiontoken を指定したリクエストに対し 同一のレコードの集合を返戻するようお願いします なお ListRecords リクエストに対する返戻中の resumptiontoken 要素に completelistsize 属性 cursor 属性が含まれていると ListRecords リクエストの処理に問題が発生した際にハンドリングが容易となります 可能な範囲でご対応いただければ幸いです 1.7 OAI-PMH リポジトリの返戻性能に問題がある国立国会図書館サーチとの連携にあたっては 連携先データベースの OAI-PMH リポジトリに対して国立国会図書館サーチの OAI-PMH ハーベスタからリクエストを送信し OAI-PMH リポジトリがメタデータを返戻するというやりとりが行われます この際 リポジトリの返戻性能が低くリクエストの処理に長い時間がかかることが 連携 14 https://www.nii.ac.jp/irp/archive/translation/oaipmh2.0/openarchivesprotocol.htm#listrecords 15 https://www.nii.ac.jp/irp/archive/translation/oaipmh2.0/openarchivesprotocol.htm#idempotency 3

に支障となっている場合がございます 実際に必要となる返戻性能は 1 回の収集で出力される更新レコード数等によっても変わってきますが 1 回のリクエストに対し返戻まで 2 分以上かかる場合は 国立国会図書館サーチとの連携上支障があります (1 回の収集で出力される更新レコード数が多い場合は より高い返戻性能が要求されます ) また 返戻までの時間が出力対象のレコード数に応じて増加するようなケースについては とくに余裕を持った返戻性能を担保いただきますようお願いいたします ( 連携開始時の想定を超える数の更新レコードが出力された場合 タイムアウト等でメタデータの取得に失敗する可能性があります ) 国立国会図書館の公開する OAI-PMH の要点 16 の 2.5 正確性と速度 及び 3.5 出力する XML データの生成タイミング を参考に 想定される出力件数に応じ 連携上問題とならない範囲の時間でリクエストに返戻できる性能を満たすようにリポジトリを実装いただけるようお願いします また 特定の datestamp に多量のレコードが出力される場合には 出力レコードの datestamp を平準化することによって 1 回の収集における出力件数を調整いただけるよう依頼することがございます 1.8 OAI-PMH リポジトリが削除レコードをサポートしていない OAI-PMH リポジトリが削除レコードをサポートしていない場合 定期的なレコードの全件入替作業が必要となり OAI-PMH による連携の重要なメリットである当館 連携機関双方の運用負荷の軽減が実現できないこととなります また システムへの負荷が高くなるため運用設計等について当館と連携機関との間で調整の必要があり 連携開始までの時間を要します 原則として OAI-PMH リポジトリで削除レコードの出力 (persistent ないし transient) をサポートいただくようお願いします 1.9 OAI-PMH リポジトリが日単位の選択的ハーベストをサポートしていない OAI-PMH リポジトリが選択的ハーベスト 17 をサポートしていない場合 収集のたびにデータを全件取得することとなり 特にデータ件数が多い場合は当館 連携機関双方にとって運用上の負荷となります なお OAI-PMH での仕様では選択的ハーベストをサポートするリポジトリは日単位での選択的ハーベスティングをサポートするものとされています 16 http://iss.ndl.go.jp/information/renkei/#5 17 https://www.nii.ac.jp/irp/archive/translation/oaipmh2.0/openarchivesprotocol.htm#selectiveharvesting 4

原則として日単位の選択的ハーベストをサポートいただくようお願いします 2 その他 2.1 全件データの媒体提供ができない場合連携開始時は大量のデータを国立国会図書館サーチに投入する必要があるため 全件データの媒体提供をお願いしております 連携先データベースの仕様で出力ができない等の事情がある場合は 当館にて OAI-PMH でのデータ収集を検討いたしますが 連携先のデータ件数や返戻性能によっては 当館による全件データ収集が不可能あるいは非常に長期間を要する場合がございます ( 総合目録ネットワークのように件数が多い場合は OAI-PMH での全件取得が困難な場合が多く見られます ) 原則として 全件データの媒体提供が可能となるようにご準備をお願いします 2.2 遷移先リンクが永続的でない国立国会図書館サーチからの遷移先リンクの URL が永続的でない場合 システムリニューアル等で遷移先が変更になった際に 連携済みメタデータの全件更新が必要となります 遷移先リンクとして使用する URL は永続的なものとすることをおすすめします 5