機関リポジトリの公開 平成 24 年度機関リポジトリ新任担当者研修 国立情報学研究所学術基盤推進部学術コンテンツ課
概要 機関リポジトリ公開後 データプロバダとして 各種一覧リストに掲載され サービスプロバダの検索 分析対象になれば より多くの人に利活用してもらえます 2
目次 1 データプロバダの一覧リストに登録する 1) OAI(Open Archives Initiative) 2) NII の機関リポジトリ一覧 3) 各種デゖレクトリ (OpenDOAR,ROAR) 2 サービスプロバダの検索 分析対象になる 1) IRDB/JAIRO/CiNii 2) Google/Google Scholar 3) その他 (OAIster,RePEc etc.) 3
1 データプロバダの一覧リストに登録する 国内外で 機関リポジトリの一覧リストが維持管理されている 登録しておかないと 多くの人に存在を認知されず 統計にも反映されない 4
1-1) OAI(Open Archives Initiative) 概要 メタデータ収集を通じて 多様なリポジトリ間の相互運用の促進を目的とした国際的な取組み データプロバダの一覧も管理されている 日本のリポジトリは 126 機関分 登録されている (2012.7 時点 ) http://www.openarchives.org/register/browsesites 5
1-1) OAI(Open Archives Initiative) 登録方法 1 Register this を選択する 2 Base URL を入力後 submit を押す 3 確認メールが届くので 指示に従う テストだけ (validate only) でも可 http://www.openarchives.org/data/registerasprovider.html 6
1-2) NII の機関リポジトリ一覧概要 国立情報学研究所で維持管理している日本国内の機関リポジトリ一覧リスト 2012.7 時点で 178 機関リポジトリ ( 共同リポジトリ含む ) が登録されている http://www.nii.ac.jp/irp/list/ 7
1-2) NII の機関リポジトリ一覧登録方法 email 機関リポジトリ名称 ( 日 英 ) 機関リポジトリ URL( 日 英 ) 公開日 を ir@nii.ac.jp 宛までご連絡ください 8
1-3) 各種デゖレクトリ (OpenDOAR, ROAR) 概要 OpenDOAR SHERPA が運営する機関リポジトリのデゖレクトリ * 日本は 137 機関リポジトリ分登録 (2012.7 時点 ) ROAR サウサンプトン大学が管理する機関リポジトリのデゖレクトリ * 日本は 103 機関リポジトリ分登録 (2012.7 時点 ) http://www.opendoar.org/ http://roar.eprints.org/ 9
1-3) 各種デゖレクトリ (OpenDOAR, ROAR) 登録方法 OpenDOAR 機関リポジトリ名称と URL などをフォーム送信する ROAR ゕカウント作成後 登録申請する http://www.opendoar.org/suggest.php http://roar.eprints.org/cgi/roar_register 10
2 サービスプロバダの検索 分析対象になる 国内外で 機関リポジトリ ( データプロバダ ) のメタデータ等を収集して 新たなサービスを展開しているサービスプロバダがいる 検索対象になれば ゕクセス数が劇的に増加し 搭載コンテンツが多くの人に利活用される 11
2-1) IRDB/JAIRO/CiNii 概要 001 IRDB リポジトリの詳細情報及びコンテンツ内容のコンテンツ種別 機関別等の統計分析情報を提供するサービス JAIRO 国内の学術機関リポジトリに蓄積された学術情報を横断的に検索できるサービス * 約 140 万件のデータが対象 (2012.7 時点 ) http://irdb.nii.ac.jp/analysis/index.php http://jairo.nii.ac.jp/ 12
2-1) IRDB/JAIRO/CiNii 概要 002 申請していただければ CiNii とも連携します 目的 CiNii の本文到達率向上 IR の利用機会向上 方法水曜日に以下の条件でメタデータを抽出し 2~3 週間後に同定完了 http://ci.nii.ac.jp/ 対象 1) NIItype が論文系 (Journal Article, Departmental Bulletin Paper, Article) 2) fulltexturl に値があるもの 13
2-1) IRDB/JAIRO/CiNii 登録方法 申請用紙に必要事項を入力後 ir@nii.ac.jp 宛までご提出ください email CiNii 連携をご希望の場合は 通信欄に CiNii 連携 と明記のこと http://www.nii.ac.jp/irp/archive/system/ 14
2-1) IRDB/JAIRO/CiNii システム要件 OAI-PMH の全ての仕様に準拠すること メタデータフォーマットとして junii2 をサポートすること http://www.nii.ac.jp/irp/archive/system/junii2.html ハーベスタは 次のようなリクエストにより定期的にハーベステゖングを行います http://(baseurl)?verb=listrecords&metadataprefix=junii2&from=( 前回取得日付 )&until( 今回取得日付 ) 15
2-1) IRDB/JAIRO/CiNii 注意事項 001 URI を変更しないでください データの一括更新等で URI を変更してしまうケースが見られます 404 Not Found 差分でハーベストしていますが URI を変更すると URI を同定キーとして使用しているため IRDB/JAIRO/CiNii に同じメタデータが複数登録されてしまいます また 変更前の URI は各機関リポジトリに存在しないことになりますので JAIRO/CiNii でリンク切れが発生してしまいます 16
2-1) IRDB/JAIRO/CiNii 注意事項 002 削除履歴は残してください 404 Not Found OAI-PMH2.0 では レコードの削除について定義していますが 必ず transient もしくは persistent をサポートし 削除履歴を残すようにしてください - persistent: 削除履歴を永続的に保持 - transient: 削除履歴を保持するが永続性は保証しない データは差分でハーベストしています 削除履歴を残さない場合や 論理削除ではなく物理削除をしてしまった場合 そのデータが削除されたことがわからず 残り続けます その結果 JAIRO/CiNii でリンク切れが発生してしまいます 17
2-2) Google/Google Scholar 登録方法 Google ウェブマスターツールに サトマップを登録する Google に ンデキシングを依頼する http://scholar.google.co.jp/intl/ja/scholar/publishers.html https://www.google.com/webmasters/tools/home?hl=ja http://www.google-sitemaps.jp/ * その他 リンクをたどってすべてのコンテンツへゕクセス ( クロール ) できる構成にしておく HTML ヘッダに meta タグを埋め込んでおく ( クロールしやすくさせる ) 18
2-3) その他 (OAIster,RePEc etc.) OAIster OCLC が運用するリポジトリ検索サト 登録すると WorldCat からも検索可能 その他 他のサービスプロバダ等については 月刊 DRF 第 19 号等を参照のこと http://worldcat.org/digitalcollectiongateway/register.jsp http://drf.lib.hokudai.ac.jp/ 19
ありがとうございました ご不明な点は 次までお問い合わせください 学術機関リポジトリ構築連携支援事業 http://www.nii.ac.jp/irp/ 国立情報学研究所学術基盤推進部学術コンテンツ課図書館連携チーム機関リポジトリ担当 ir@nii.ac.jp 20
< 参考 > IRDB/JAIRO/CiNii 登録時のエラー事例 001 区分 URI がリンクできない 必須出力エレメントが未出力 重複出力が不可のエレメントに対し 重複出力している 概要 記述の間違え又はマッピング先が誤っている handle.net を使用した場合 登録手続きが完了していない フゔゕーウォール等 外部からの接続を許可していない Dspace の場合 初期値のままにすると http://hdl.handle.net/123456789/ という形式になり リンクができない URI となってしまう 必須出力エレメント (title NIItype URI) が出力されていない メタデータの登録自体ができない 登録時エラーとしてログメールで報告 重複不可エレメント (title NIItype URI jtitle volume issue spage epage dateofissued pmid doi textversion) が重複出力している メタデータの登録自体ができない 登録時エラーとしてログメールで報告 21
< 参考 > IRDB/JAIRO/CiNii 登録時のエラー事例 002 区分 異なるメタデータで 登録時 URIを同定キーとしているため 異なるデータで同一の URIが重複するもの URIが存在すると どちらか片方のみ登録される結果となる が存在している データ内容が無いが データ内容が無い要素については 要素自体を出力しないようにす要素だけが出力される必要がある ( 例 :<contributor></contributor>) ている CiNii 連携時に必要なエレメントが欠落している 概要 jtitle fulltexturl dateofissued は CiNii 同定時に重要なキーとなるため CiNii 連携を希望する場合は 出力をする データだけ出力され 要素が付いていない 要素タグに囲まれていないものがあるため 要素を付けて出力する 22
< 参考 > IRDB/JAIRO/CiNii 登録時のエラー事例 003 区分 文字コード変更により URI が変わる 概要 URI 内で文字パラメータをセットしていた場合 文字コード変更により 異なる URI の同一メタが重複して登録されてしまう resumptionto ken が正しく終了していない サーバ等の負荷を考え 一度に全件を取得するのでなく 100 件区切り等で分散して出力するように ローカルリポジトリ側で設定を行っていると思われます resumptiontoken は 一度の取得で全件が取れなかった時 (100 件以上 ) 続きを取得するために必要になります 続きが取れない場合は ローカル側には 1,000 件存在しているにもかかわらず 100 件しか取得できないという結果になってしまうため 注意が必要になります データ内に定義されていない区分が入っている NIItype 及び textversion エレメントにおいては 決められた区分があるため それ以外の区分がある場合エラーとなります 大小文字を含めて完全に一致させる必要があります 23