2. 項目検索 (1) 日本語による検索 発明の名称 要約 クレーム及び詳細な説明について 基本的に 2 文字単位で作成され た ( バイグラム (bi gram)) インデックスに対して検索を行います 1 1 文字での検索を行い たい場合は * ワイルドカード指定は不要です を用いて前方一致検索と

Similar documents
検索方法等についての説明の前に GPG/FX で近傍検索を行う際の注意点につ いて説明します 注意点 GPG/FX では 形態素解析で区切られた語句 1 ( 英語では単語 ) を基準に近傍検索が行われます 特に 以下の2 点に注意してください 注意 1: キーワードは区切られた語句の単位で検索される

<4D F736F F F696E74202D E82C582E08F6F978882E98AC FA967B93C18B9692A182C582CC93C18B9692B28DB895FB B8CDD8AB B83685D>

Contents 1. 新機能 2. 機能改善 3. その他の改善 Hitachi Systems, Ltd All rights reserved. 1

Cica-Web を快適にご利用いただくために Cica-Web は Internet Explorer で動作確認を行っております その他のブラウザでご利用いただく際は本来の動作と異なる動作をすること がありますので ご了承ください Cica-Web は Cookie を有効にする設定でご利用くだ

1. 主な機能追加項目 以下の検索項目をサポートしました 書誌 全文検索コマンド検索 国内 査定日 最新の査定日 ( 登録査定日または拒絶査定日 ) を検索します 査定種別 最新の登録 拒絶査定 または査定なしを検索します 審査最終処分日 最新の審査最終処分日を検索します 審査最終処分種別 最新の審

特許検索サービスに関する打ち合わせ資料

グーグル検索マクロの使い方

1. データベースへのアクセス ドイツ特許を調査するにあたっては ドイツ特許庁への出願( 以下 各国ルートとする ) と 欧州特許出願に基づくもの ( 以下 EPルートとする ) 両方を確認する事が必要となる このミニガイドではドイツ特許庁への出願 ( 各国ルート ) の解説を中心とし 必要に応じて

Shareresearchオンラインマニュアル

STN新プラットフォーム基本操作

5 章意匠 / 意匠番号照会 79 1章はじめに2章各サービスの概要3章トップページ及び共通機能の紹介4章特許 実用新案5章意匠6章商標7章審判8章経過情報9章参考情報 操作手順 (1) 照会条件の入力 1. 種別 を選択し 番号 を半角で入力します 画面は 意匠登録第 号 意匠登録

中国における特許を対象にした企業動向調査 Q ナイキ (NIKE) 社の出願動向を把握したい 1) 調査ツールの選択中国特許 実用新案は 中華人民共和国国家知識産権局 ( 以下 SIPO) が提供する CNIPR と PSS-System 日本国特許庁( 以下 JPO) が提供する

添付文書情報 の検索方法 1. 検索条件を設定の上 検索実行 ボタンをクリックすると検索します 検索結果として 右フレームに該当する医療用医薬品の販売名の一覧が 販売名の昇順で表示されます 2. 右のフレームで参照したい販売名をクリックすると 新しいタブで該当する医療用医薬品の添付文書情報が表示され

JP-NETを活用した特許マップ 作成マニュアル【基礎編】

23_ogawa.qxd

PowerPoint プレゼンテーション

医薬品の添付文書等を調べる場合 最後に 検索 をクリック ( 下部の 検索 ボタンでも可 ) 特定の文書 ( 添付文書以外の文書 ) の記載内容から調べる場合 検索 をクリック ( 下部の 検索 ボタンでも可 ) 最後に 調べたい医薬品の名称を入力 ( 名称の一部のみの入力でも検索可能

文字入力 ソフトウェアキーボードを切り替える...56 文字入力画面の見かた...56 文字を入力する...58 文字入力の便利な機能を利用する...60 iwnn IME の設定を行う

1. データベースへのアクセス ブラジル特許を収録したデータベース (DB) としては 無料 有料 ( 商用 ) を含めて非常に多くの情報源が存在する このミニガイドでは原則無料 かつ過去数年間にわたり安定運用されているDBを列挙する ブラジル国家産業財産権庁が運用する DB 1.1. Consul

Agenda 1. 新機能 2 (1) 検索項目の追加 ( 全ての検索方式 ) 3 (2) 検索項目の追加 ( 書誌 全文検索 ) 4 (3)BRICs オプション 5 (4)US 概念検索オプション 6 (5) 英語画面オプション 7 2. 機能改善 (1) 書誌 全文検索 8 (2) 公報種別の

サイボウズ Office 10「個人フォルダ」

Microsoft Word - Word1.doc

DataWare-NETご利用ガイド

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

書式に示すように表示したい文字列をダブルクォーテーション (") の間に書けば良い ダブルクォーテーションで囲まれた文字列は 文字列リテラル と呼ばれる プログラム中では以下のように用いる プログラム例 1 printf(" 情報処理基礎 "); printf("c 言語の練習 "); printf

改訂履歴 日付バージョン記載ページ改訂内容 V2.1 - 初版を発行しました V3.1 P5 ドキュメントラベルが新規追加された事を追記 P7 P8 新しくなったラベルのツリー表示説明を追記 新しくなったラベルの作成 削除操作を追記 P9 ラベルのグループ

クイックマニュアル(利用者編)

奈良県明日香村稲渕彼岸花祭り PATENTSCOPE( パテントスコープ ) は 国連の専門機関である世界知的所有権機関 (WIPO ワイポ ) が無償で提供する世界の特許情報のデータベースです インターネット接続ができれば PATENTSCOPE で世界の特許情報を検索できるし 特許情報の自動翻訳

掲示板の閲覧 掲示板の閲覧 登録権または参照権のある掲示板グループの掲示版を閲覧することができます 各利用者の権限は 管理者によって設定されます 掲示板を閲覧する 1 掲示板画面を表示し 閲覧する掲示が含まれている掲示板グループ 掲示板の順にクリックします 掲示板画面の表示方法 ポータル画面の画面説

サイボウズ Office 8 アドレス帳マニュアル

サイボウズ デヂエ 8 はじめに

実践編 まず Search term(s) に EP と入力し Search ボタンをクリックすると以下のような 画面が表示される この About this file の画面では欧州特許の権利状況や書誌事項についての情報を得ることができる が 最初に確認すべき項目は Status の

目次 1. はじめに 1.1 サービスをお使いになる前に サービス利用の流れ ダウンロードパスワードを設定 変更する 健診申込ファイル編集ツール (Opti) をダウンロードする 案内一覧送付の要否を登録する 2.1 案内一覧送付の

PAT-LIST-GLS V3.0 新機能のご紹介 ここでは PAT-LIST-GLS Ver2.1.1.X からの機能アップについて説明しています 特に 新しい TPL ファイル 2.0 は従来のバージョンの GLS ではお使いになれませんので 必ず本書 をお読みになり ご利用をお願い致します 1

DiscussNetPremium操作説明書


Transcription:

検索漏れを防ぐワイルドカードの使用について Japio 世界特許情報全文検索サービス (GPG/FX) にてテキスト検索を行う際 ワイルドカード ( ケーション ) を使用し 部分一致検索を行うことで 検索漏れを防ぐことができます 例えば 英語の単数形と複数形 現在形 進行形及び過去形など 語尾変化のある単語をまとめて検索する場合 イギリス英語とアメリカ英語とでスペルが異なる場合 表記揺れがある場合などにおいて有効です 以下に ワイルドカードの使用方法について説明いたします 1. ワイルドカードとはワイルドカード ( トランケーション ) とは 任意の文字を表す特殊記号であり 部分一致 ( 前方一致 後方一致 マスク ) 検索を行う際に用いられます GPG/FX では ワイルドカードとして? ( 文字数指定あり ) や * ( 文字数指定 ( いずれも半角 ) を使用することができます 特に 英語での検索の場合 項目検索 詳細検索のいずれでも単語単位のインデックスに対して検索を行うので 検索漏れを防ぐためにはワイルドカードの使用が有効です?:1 文字の任意の文字列 ( 例 :t?p top, tip, tap 等がヒット ) *:0 文字以上の任意の文字列 ( 例 :cat* cat, cats, category 等がヒッ項両者を比較すると 前者の場合 ノイズは減りますが検索漏れが増え 逆に後者の場合は ノイ ズは増えますが検索漏れが減ります 単語の文字数が分かっている場合には り ) を そうでない場合には * ( 文字数指定なし ) を使うことが有効です? ( 文字数指定あ なお 項目検索 での検索項目 ( 発明の名称 要約 クレーム等 ) や 詳細検索 で用いる 検索コード ( フィールド ) などに応じて ワイルドカード使用の可否が異なります 詳しくは GPG/ マニュアルの 2.3 検索機能 演算子 トランケーション をご覧ください 目検索詳細検索

2. 項目検索 (1) 日本語による検索 発明の名称 要約 クレーム及び詳細な説明について 基本的に 2 文字単位で作成され た ( バイグラム (bi gram)) インデックスに対して検索を行います 1 1 文字での検索を行い たい場合は * ワイルドカード指定は不要です を用いて前方一致検索としてください 2 文字以上の検索式用語であれば ( 例 ) 検索式用語として 車 から 車 * とすると検索結果が大きく増加します ( 国 公報種 別に すべての国 検索項目に 発明の名称 (TI) を選択 ) ( それぞれのヒット件数は文献蓄積状況等によって変わる場合があります ) 1 1 文字検索 (* なし ) 前方一致検索(* あり ) 出願人及び発明者については 前方一致検索となるよう検索式用語末尾にワイルドカード (*) が自動付加されて検索が実行されます ( 例 : 出願人(PA): 特許 と入力すると PA: 特許 * として検索) これに加えて 検索式用語の先頭や中間にワイルドカード(*, を使用することも可能です ( 例 : 出願人(PA):?? 特許 と入力すると PA:?? 特許して検索 ) (2) 英語による検索発明の名称 要約 クレーム 詳細な説明 出願人及び発明者について 単語切り出しにより作成されたインデックスに対して ワイルドカード (*?) を使用した検索が可能です なお出願人及び発明者については 前方一致検索となるよう検索式用語末尾にワイルドカード (*) が自動付加されます ( 日本語による検索の場合と同様です ) 具体例を以下に記載します 検索式用語 ヒットする例 colo*r colour( 英 ), color( 米 ) cent?? centre( 英 ), center( 米 ) machin* machine, machines, machinery, machin attach* attach, attaches, attaching, attache t??th tooth, teeth, truth, tenth 1 PCT( 国際公開 ) 公報の日本語検索は 1 文字単位で作成された ( ユニグラム (uni gram)) インデックスに対 検索を行います

(3) 分類 日付 文献 出願番号の検索分類 (IPC FI F ターム ECLA CPC) 日付( 出願日 公報発行日 優先権主張日 ) 文献番号 出願番号についても ワイルドカード(*?) を使用した検索が可能です なお 前方一致検索となるよう検索式用語末尾にワイルドカード (*) が自動付加されます 3. 詳細検索 (1) 日本語による検索 <バイグラム検索 > 検索コードを指定する詳細検索では 基本的には 項目検索と同様に 2 文字単位で作成された ( バイグラム (bi gram)) インデックスに対して検索を行います そのため 1 文 での検索を行いたい場合は * を用いて前方一致検索としてください 2 文字以上の検索式用語であれば ワイルドカード指定は不要です ( 上記 2.(1) を参照 ) < キーワード検索 > 一方 詳細検索で指定する検索コードのうち AL F ( 全文 ) TI F ( 発明の名 称 ) AB F ( 要約 ) CL F ( クレーム ) DS F ( 詳細な説明 ) については ーワード ( 形態素解析で区切られた語句 2 ) 単位で検索を行いますが ワイルドカード (*?) も使用できます なお キーワード ( 形態素 ) の切出し方により 入力した検索式用語でうまく ヒットしない場合があります その際は 前方一致検索を試してください 検索結果画面の左欄 に表示される キーワード ( 発明の名称 ) は キーワード単位なので どのように形態素解析 されたかを探るヒントとすることもできます ( 下図参照 ) この例では インタフェース インターフェイス のほか グラフィカルユーザインタフェース もキーワードであることが分かります 2 形態素解析とは文を形態素 ( 言語で意味を持つ最小単位 ) と呼ばれる語句に区切る技術です 文がどのような語句 に区切られるかについては 例えば http://www.atilika.com/ja/products/kuromoji を参考にしてくださ い

キーワードをインデックスとする検索コード ( AL F TI F AB F DS F ) についての具体例を以下に記載します 検索式用語 ヒットする例 インタ * フェイス インタフェイス インターフェイス インターフェ? ス インターフェイス インターフェース * インタフェイス インタフェイス グラフィカルユーザインタフェイス ユーザインタフェイス インタ * フェ? ス インタフェイス インターフェイス インタフェース インターフェース <キーワード検索とバイグラム検索の比較 > キーワード検索とバイグラム (N グラム ) 検索を比較すると 以下のようになります ( 詳細は 後述の 6. 参考資料 を参照ください ) キーワード検索 バイグラム検索 検索ノイズ 少ない 多い NOT 演算での絞り込みが有効 検索漏れ 多い ワイルドカード指定が有効 少ない <おすすめは検索漏れを防ぐバイグラム検索 > 検索漏れを防ぐ観点から バイグラム検索を利用することをおすすめします ( 検索コードに F を含まないもの) バイグラム検索では検索ノイズが増えますので NOT 演算を行い 絞り込みをすることが有効です (2) 英語による検索項目検索 ( 上記 2.(2)) の場合とおおむね同様です ( 項目検索とは異なり 出願人及び発明者について前方一致検索とするための検索式用語末尾へのワイルドカード (*) の自動付加はされません ) (3) 分類 日付 文献 出願番号の検索 項目検索 ( 上記 2.(3)) の場合とおおむね同様です ( 項目検索とは異なり 前方 一致検索にするための検索式用語末尾へのワイルドカード (*) の自動付加はされません )

項目検索詳細検索日本語4. 注意 : 近傍検索とワイルドカードの併用 詳細検索では キーワードをインデックスとするフィールドに対して近傍検索が可能ですが 3 システ ム上 日本語 英語ともに 近傍検索とワイルドカードを併用することができません ( 併用した場合 ワイルドカードは無視して検索されます ) そのため 近傍検索を行う際は キーワード( 形態素 ) 語尾変化 表記揺れなどに留意しながら 検索式を作成することが重要です 具体例を以下に記載します 索されます キーワード単位で 旋回 と 車 が近傍にあればヒッしますが キーワードが 車 でなく 車両 や 車体 といった場合 検索クエリ 説明 AL F:" 旋回 車 *" 10 ワイルドカード (*) は無視され AL F:" 旋回 車 ヒットしません AL F:" 旋回 車 " 10 OR AL F:" 旋回 車両 AL F:" 旋回 車体 " 10 など キーワードを意識して OR で ようにしてください AL F:"seal* ワイルドカード rib*" 20 (*) は無視され AL F:"seal rib" 索されます seal と rib が近傍にあればヒットしますが なく sealing seals などの場合 rib でなく にはヒットしません AL F:"seal rib" 20 OR AL F:" AL F:"sealing rib" 20 OR AL F:"s AL F:"seals ribs" 20 OR AL F:"sea 語尾のバリエーションを意識して OR でつなぐようにしてください 5. まとめ ワイルドカードの使用について 大まかには以下のようにまとめることができます バイグラム 1 文字で検索 : * を末尾に付ける 2 文字以上で検索 : ワイルドカード不要キーワード ワイルドカード (*,?) 使用可能英語ワイルドカード (*,?) 使用可能但し 近傍検索との併用は不可 キーワード : AL F ( 全文 ) CL F ( 請求項 ) AB F ( 要約 ) DS F ( 発明の詳細 を検索フィールドとするもの 3 GPG/FX 画面上部にある 検索お役立ち から 検索簡易マニュアル 近傍検索について を参照ください

6. 参考資料 <キーワード検索とバイグラム (N グラム ) 検索について> キーワード検索は 意味のある単語 ( キーワード ) に基づいて検索するため 部分的に文字が一致しているだけの意味のない文字列はヒットしません したがってノイズは少ないと言えます しかし 形態素解析で使用する辞書にはない言葉 ( 未知語 特に 新語, 造語 特殊用語などが考えられます ) については 意味のある単位で適切に語句が切り出されるかどうかは不明 ( 形態素解析のロジックに依存 ) なため 検索漏れが起こる可能性があります したがって キーワード検索は ノイズが少ない利点を考慮して お試し検索 ( どのような分類が付与されているかなどを探る検索 ) など 手軽に検索する用途が考えられます この際に ワイルドカードを使用すれば 一定程度検索漏れを防ぐことができます 例えば 検索語を スキー とした場合 キーワードとして スキー を含むものがヒットします スキー と アルペンスキー が異なるキーワードとされた場合には アルペンスキー が検索となります これを防ぐには ワイルドカードで AL F:* スキー や AL F:???? ス定することが有効です 一方 バイグラム (N グラム ) 検索は それ自体では意味のない文字列や 未知語であっても 文字面通りにヒットするため 検索漏れが少ないと言えます その反面 文字面だけを見て検索するので ノイズが増えます したがって バイグラム (N グラム ) 検索は 無効調査など検索漏れを防ぐための用途が考えられます この際に 絞り込み検索をすれば ノイズを一定程度減らすことができます 例えば 検索語を スキー とした場合 文字列として スキー を含むものがヒットするため スキーム ウイスキー などを含むものもヒットします これらは ノイズとなるため NO して AL: スキー NOT AL: スキーム NOT AL: ウイスキー などと絞り込みをすことが有効です