Microsoft Word - 修正_作業手順書.docx

Similar documents
やさしく名刺ファイリング v.3.0 操作マニュアル

Microsoft Word - word_05.docx

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について EXCEL 一 括 登 録 EXCEL ダウンロード 検 索 条 件 の 指 定 プレビュー EXCEL ダウンロード(データ 抽 出 あ

1-1 一覧画面からの印刷

POWER EGG V2.01 ユーザーズマニュアル ファイル管理編

01_07_01 データのインポート_エクスポート_1

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

(Microsoft Word - Word\211\236\227p8\217\315.docx)

目 次 はじめに.... デジカメからの 画 像 取 込 画 像 情 報 の 登 録 部 位 の 設 定 目 的 の 設 定 目 的 の 追 加 画 像 情 報 の 登 録 ( 備 考 の 設 定 ) 備 考

Microsoft Word - hagakiwriter3free-atenagaki-hou.doc

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

目 次 遺 失 物 管 理 プログラム 利 用 者 マニュアル 1. 動 作 条 件 遺 失 物 管 理 プログラムのインストール 運 用 の 流 れ 起 動 方 法 操 作 方 法 について 基 本 的 な 操

1.2. ご 利 用 環 境 推 奨 ブラウザ Internet Explorer Google Chrome(バージョン 32 時 点 で 動 作 確 認 済 み) Mozilla Firefox(バージョン 26 時 点 で 動 作 確 認 済 み) Safari 7

R4財務対応障害一覧

1

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

ひらがなを 入 力 する 濁 点 などを 入 力 する 漢 字 を 入 力 する 漢 字 に 変 換 する 一 度 入 力 した 文 字 の 再 変 換 は 全 角 半 角 文 字 を 切 り 替 える 文 章 を 入 力 し 漢 字 変 換 する 数 字 を 入 力 する 英 文 字 を 入 力

<4D F736F F D ED28FDA8DD7837D836A B2E646F6378>

研究者情報データベース

Microsoft Word - 第3章.doc

<4D F736F F D C97F195CF8AB DEC90E096BE8F912091E6312E313294C52E646F63>

Office 10 パッケージ版「リンク集」

目 次 JAVIS Appli の 基 本 機 能... 3 JAVIS Appli について... 3 音 声 確 認 機 能 JAVIS Appli( 有 償 版 )の 機 能... 4 音 声 で 読 みの 確 認 をする... 4 辞 書 機 能... 5 単 語 を 登 録 する... 5

2.4 箇 条 書 のスタイルを 変 更 する 右 クリックして 箇 条 書 と 番 号 付 け を 選 択 する. あとは 少 し 遊 べば, このようなことをやりたい 人 は 理 解 できると 思 います 3 いろいろな 入 力 ワープロを 使 う 上 で 肝 心 な 点 は, 空 白 調 整

目 次 1. 化 学 研 究 所 研 究 者 データベースについて 研 究 者 情 報 データベース 登 録 システムログイン 画 面 メニュー 画 面 パスワードの 変 更 公 開 時 の 表 示 / 非 表 示 の 設 定.

PowerPoint プレゼンテーション

アドイン翻訳について

【試用版】AppStudioクイズアプリ作成手順

PowerPoint プレゼンテーション

<4D F736F F D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A B E A2E646F63>

4 応 募 者 向 けメニュー 画 面 が 表 示 されます 応 募 者 向 けメニュー 画 面 で [ 交 付 内 定 時 の 手 続 を 行 う] [ 交 付 決 定 後 の 手 続 を 行 う]をクリックします 10

03_主要処理画面.xlsx

1. アクセスする 2. 簡 易 検 索 画 面 (fig. 1) アクセスすると 最 初 に 出 る 画 面 です 検 索 語 入 力 ボックスにキーワードを 入 力 して 論 文 検 索 ボタンをクリックし ます 3. ボックス 下 部 のチェック 項

地域ポータルサイト「こむねっと ひろしま」

CubePDF ユーザーズマニュアル

MapDK3のインストール

2 科 学 研 究 費 助 成 事 業 のトップページ 画 面 が 表 示 されます [ 研 究 者 ログイン]をクリック します 掲 載 している 画 面 は 例 示 です 随 時 変 更 されます 3 科 研 費 電 子 申 請 システムの 応 募 者 ログイン 画 面 が 表 示 されます e

目 次 1. Web メールのご 利 用 について Web メール 画 面 のフロー 図 Web メールへのアクセス ログイン 画 面 ログイン 後 (メール 一 覧 画 面 ) 画 面 共 通 項 目

基 本 操 作 2

年齢別人数計算ツールマニュアル

スライド 1

指 定 ( 又 は 選 択 ) 官 庁 PCT 出 願 人 の 手 引 - 国 内 段 階 - 国 内 編 - アイスランド 特 許 庁 国 内 段 階 に 入 るための 要 件 の 概 要 3 頁 概 要 国 内 段 階 に 入 るための 期 間 PCT 第 22 条 (3)に 基 づく 期 間

オムロンソフトウェア株式会社 [ 楽々中国語 ] 入力マニュアル

A

1.3 利 用 方 法 図 1 国 立 国 会 図 書 館 デジタルコレクション 送 信 サービスの 対 象 資 料 本 文 の 閲 覧 は 図 書 館 サービスカウンター 備 え 付 けの 専 用 パソコン(1 台 )のみでの 利 用 となります 利 用

Ver 改 訂 日 付 改 訂 内 容 1

MetaMoJi ClassRoom/ゼミナール 授業実施ガイド

目 次. WEB メールへのログイン.... メール 送 信 手 順.... メール 受 信 手 順 アドレス 帳 の 操 作 手 順 フォルダーの 操 作 手 順 メール 発 信 者 登 録 署 名 登 録 手 順 基 本 的 な 設 定

<4D F736F F D203193FA8AD45F95CA8E86325F89898F4B315F94F093EF8AA98D AD97DF914F82CC8FEE95F182CC8EFB8F C28E8B89BB2E646F63>

スライド 1

_責)Wordトレ2-1章_斉

PowerPoint プレゼンテーション

戦略担当者のための

電子納品チェックシステム利用マニュアル

ボタンをクリックします ( 警 告 が 表 示 されない 場 合 もあります ) 9 画 面 に Win SFX32M V と 表 示 されますので 保 存 する 箇 所 を 選 択 し OK をクリックしてください 選 択 した 箇 所 にインストールしたフォルダが 保 存 され

[1]メッセージ

Ⅰ 校 外 における 研 修 の 留 意 点 1 校 外 における 研 修 のコマ 数 の 考 え ア) 午 前 午 後 の 講 座 は 0.5 日 (0.5 コマ) イ) 全 日 の 講 座 は 1.0 日 (1.0 コマ) 2 校 外 における 研 修 として 選 択 できない 講 座 研 修

(Microsoft Word - Excel\211\236\227p2\217\315.docx)

Acrobat Reader DCのインストール・操作方法―Windows 10/8.1/7

e.Typist v.12.0 操作マニュアル 基本操作編

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 15ページに 汎 用 データ 受 入 に 関 する よくあるお 問 い 合 わせをご 紹 介 しています Step1 (

目 次 1.はじめに 1-1. はじめに 2. 操 作 2-1. 概 要 2-2. 操 作 方 法 ( 調 査 依 頼 の 確 認 ) 2-3. 操 作 方 法 ( 回 答 登 録 ) 2-4. 操 作 方 法 (ワークシート 出 力 ) 2-5. 操 作 方 法 (ワークシート 取 込 ) 3.

(Microsoft PowerPoint - Ver12\203o\201[\203W\203\207\203\223\203A\203b\203v\216\221\227\277.ppt)

目 次 1. 積 算 内 訳 書 に 関 する 留 意 事 項 1 ページ 2. 積 算 内 訳 書 のダウンロード 3 ページ 3. 積 算 内 訳 書 の 作 成 (Excel 2003の 場 合 ) 6 ページ 4. 積 算 内 訳 書 の 作 成 (Excel 2007の 場 合 ) 13

<4D F736F F D20819C B78AFA95DB91538C7689E68DEC90AC289

活用ガイド-編集しよう

技術報告会原稿フォーマット

GRIDY SFA カスタム 項 目 操 作 ガイド 用 本 書 はに 必 要 な 操 作 を 解 説 しております は GRIDY SFA ののことです GRIDY SFA へ 申 し 込 み 最 初 に 登 録 を 行 った 方 がそのままとなります カスタム 項 目 はの 方 のみ 操 作 可

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 4ページに 汎 用 データ 受 入 に 関 するよくあるお 問 い 合 わせをご 紹 介 しています Step (3ペー

第 1 章 PowerPoint を 始 める 前 に 第 1 章 PowerPoint を 始 める 前 に 1. 最 初 に 考 えること 2. PowerPoint の 画 面 -1- IBR2012-V1.0

「1 所得税及び復興特別所得税の確定申告書データをお持ちの方」からの更正の請求書・修正申告書作成編

治 験 実 施 管 理 システム NMGCP 向 け Excel 形 式 プロトコール 作 成 手 順 書 V4.0.3 対 応 版 第 1 版 株 式 会 社 富 士 通 アドバンストエンジニアリング All Rights Reserved,Copyright 株 式 会 社 富 士 通 アドバン

Microsoft Word - P doc

5-2 一 般 ユーザー 用 :メール 2 送 信 者 のリンクをクリックすると 受 信 メールの 内 容 を 見 ることができます 受 信 メール 内 容 画 面 項 目 送 信 者 宛 先 CC 本 文 (テキスト) 本 文 (HTML) メールアドレスのリンクをクリックするとアドレス 帳 へ

2. データを 検 索 する なごやコレクションのデータを 検 索 するための 方 法 として キーワード 検 索 詳 細 検 索 の 二 通 りの 検 索 方 法 が あります 2.1. キーワードから 探 す キーワードを 入 力 する トップページの 入 力 ボックスに 検 索

TIPS - 棚 割 りを 開 始 するまで Liteを 起 動 し 企 業 情 報 の 追 加 を 行 い 棚 割 を 行 う 企 業 の 追 加 をして 下 さい 企 業 情 報 の 追 加 時 に エラーメッセージが 表 示 された 場 合 別 途 TIPS トラブルが 発 生 した 場 合

2 課 題 管 理 ( 科 学 研 究 費 補 助 金 ) 画 面 が 表 示 されます 補 助 事 業 期 間 終 了 後 欄 の[ 入 力 ] をクリックします [ 入 力 ]ボタンが 表 示 されていない 場 合 には 所 属 する 研 究 機 関 の 事 務 局 等 へお 問 い 合 わせく

PowerPoint プレゼンテーション

設定フロー ★印は必須の設定です

WEBメールシステム 操作手順書

(Microsoft Word - \215u\213`\203m\201[\203g doc)

MapDK3のインストール

DN6(R04).vin

名 刺 Scan とは 名 刺 Scan 情 報 を 顧 客 パーソン 情 報 として 登 録 する 名 刺 Scan とは 複 合 機 やスマートフォンなどでスキャンした 名 刺 データを 弊 社 指 定 の 名 刺 管 理 ソフトを 利 用 して 文 字 認 識

Acrobat早分かりガイド

スライド 1

PC 移 行 は 以 下 の 流 れで 行 います 次 ページ 以 降 に 各 手 順 を 記 載 しますのでご 確 認 ください ( をクリックすると 該 当 の 説 明 にジャンプします ) 移 行 元 のPCでの 作 業 Step1 移 行 するデータをバックアップする (3ページ) [データ

2 研 究 資 源 共 通 化 統 合 検 索 システムソフトウェア 利 用 者 用 マニュアル(ゲートウェイシステム) 目 次 1. はじめに 主 な 利 用 の 流 れ 検 索 検 索 画 面 検 索 画 面 の 設 定...

Mac OS Xでの利用設定 マニュアル

給料らくだ7.5・かるがるできる給料5.5 追加マニュアル

第 1 章 共 通 操 作 1.1 ログイン PIN 番 号 入 力 (1) 大 阪 府 電 子 入 札 システム トップ 画 面 より 1 電 子 入 札 システム ボタンをクリックし ます 1 1-2

もくじ 0.はじめに 1 1. 用 紙 をスキャナで 用 紙 を 読 み 込 む 1 2. 書 式 定 義 マークした 部 分 を 個 々のデータとして 取 り 込 む 場 合 ( 複 数 回 答 対 応 ) マークした 部 分 をグループ 化 して 取 り 込 む 場 合

図 2 エクスポートによるシェープファイルの 新 規 保 存 新 規 保 存 するファイルは,より 分 かりやすい 名 前 をつけて 適 切 なフォルダ(shape フォル ダにまとめておくのがよい) 上 に 保 存 しておく 2 / 10


スライド 1

ワープロソフトウェア

Microsoft Word - CiNii&RefWorks doc

医療費控除の入力編

目 次 機 能 運 用 上 の 注 意 処 理 手 順 画 面 説 明 ログイン 直 送 先 選 択

検 索 文 字 列 が 住 所 にマッチするならば 地 図 画 面 を 表 示 します 検 索 文 字 列 が 住 所 の 一 部 ならば キーワードを 含 む 検 索 結 果 画 面 を 表 示 します

Transcription:

論 文 PDF OCR 作 業 手 順 書 国 立 情 報 学 研 究 所 阿 辺 川 武 2014 年 1 月 24 日

目 次 1.はじめに 2.OCR の 仕 様 2.1 認 識 領 域 2.2 領 域 の 種 類 と 機 能 2.3 認 識 誤 りの 修 正 対 象 3. 基 本 設 定 3.1 ソフトウェアアップデートの 確 認 3.2 ツールバーの 設 定 3.3 認 識 オプションの 設 定 3.3.1 ドキュメント 3.3.2 スキャン/ 開 く 3.3.3 読 み 取 り 3.3.4 保 存 /PDF 3.3.5 表 示 3.3.6 詳 細 設 定 4. 実 際 の 作 業 手 順 4.1 領 域 の 修 正 4.1.1 ファイルを 開 く 4.1.2 ヘッダーとフッター 4.1.3 領 域 の 削 除 4.1.4 認 識 順 の 変 更 4.1.5 領 域 の 機 能 4.1.6 図 表 の 削 除 4.1.7 図 表 を 残 す/ 領 域 の 種 類 4.1.8 文 字 の 向 き 4.1.9 修 正 後 の 読 み 込 み 4.2 認 識 誤 りの 修 正 4.2.1 一 文 字 から 一 文 字 への 修 正 4.2.2 一 文 字 から 二 文 字 への 修 正 4.2.3 二 文 字 から 一 文 字 への 修 正 4.2.4 文 献 リストの 番 号 確 認 4.2.5 その 他 5. 保 存 5.1 FineReader ドキュメントの 保 存 5.2 PDF ファイルの 保 存 2

1.はじめに 当 手 引 きでは スキャン 画 像 から 作 成 された 論 文 PDF ファイルに 対 して OCR ソフトウェアにより 文 字 認 識 をおこない 透 明 テキスト 付 き PDF ファイルに 変 換 する 手 順 を 説 明 する OCR ソフトウェアには ABBYY USA Software House 社 製 の ABBYY FineReader 11 Professional Edition を 使 用 する 実 際 の 作 業 では 複 数 の 論 文 PDF ファイルを 200 ページ 程 に 統 合 して 一 括 して 作 業 をおこなっている これは 作 業 を 効 率 的 に 進 めるためである 3

2.OCR 作 業 の 仕 様 2.1 認 識 領 域 対 象 の 領 域 : 標 題 著 者 名 所 属 抄 録 本 文 注 本 文 中 の 数 式 図 表 キャプション 謝 辞 参 考 文 献 対 象 外 の 領 域 : 柱 ノンブル 図 表 (ただし 認 識 対 象 となる 場 合 もある) 認 識 対 象 外 の 図 表 言 葉 として 意 味 を 持 たない 英 数 字 文 字 として 認 識 できない 図 形 ( 詳 しくは 4.1.6 図 表 の 削 除 で 説 明 ) 認 識 対 象 の 図 表 文 書 や 言 葉 として 意 味 をもつ 単 語 ( 詳 しくは 4.1.7 図 表 を 残 す/ 領 域 の 種 類 で 説 明 ) 2.2 領 域 の 種 類 と 機 能 領 域 の 種 類 :テキストもしくは 表 ( 詳 しくは 4.1.7 図 表 を 残 す/ 領 域 の 種 類 で 説 明 ) 領 域 の 機 能 : 自 動 本 文 ヘッダーフッター( 詳 しくは 4.1.5 領 域 の 機 能 で 説 明 ) 2.3 認 識 誤 りの 修 正 対 象 標 題 著 者 名 所 属 ( 著 者 名 直 下 に 記 述 されている 所 属 情 報 ) 本 文 見 出 し 文 献 リストの 番 号 一 字 一 句 目 視 で 確 認 し 修 正 する ( 詳 しくは 4.2 認 識 誤 りの 修 正 で 説 明 ) 4

3. 基 本 設 定 3.1 ソフトウェアアップデートの 確 認 定 期 的 にソフトウェアのアップデートを 確 認 し 最 新 バージョンを 保 つ (1) ABBYY FineReader 11 を 開 く (2) メニューバー/ヘルプ(H)/ 今 すぐ 更 新 を 確 認 (C) (3) ブラウザが 起 動 し ABBYY FineReader 11 Professional Edition のアップデートを 確 認 するページが 開 くので 新 しいバージョンがあればインストールする 図 1 アプリケーションの 起 動 図 2 ソフトウェアアップデート 5

3.2 ツールバーの 設 定 作 業 がスムーズに 進 むように ツールバーをカスタマイズする (1) メニューバー/ツール(T)/カスタマイズ(U) (2) カテゴリー(C):/ 画 像 から[ 領 域 の 並 べ 替 え]を 選 択 し ツールバー(T):/クイックアクセスに 移 動 させる 図 3 ツールバー カスタマイズ 図 4 ツールバー カスタマイズ 領 域 の 並 べ 替 え 6

3.3 認 識 オプションの 基 本 設 定 文 字 認 識 は 認 識 領 域 に 設 定 されたオプションに 沿 って 行 われる 領 域 のオプションによって 認 識 結 果 や 認 識 率 に 違 いが 生 じるので 必 ず 読 み 込 む 画 像 に 合 わせて 設 定 を 行 う 一 度 設 定 を 行 えば 次 回 以 降 は 設 定 が 記 憶 される オプションには [ドキュメント] [スキャン/ 開 く] [ 読 み 取 り] [ 保 存 ] [ 表 示 ] [ 詳 細 設 定 ]の6 項 目 がある 3.3.1 ドキュメント (1) メニューバー/ツール(T)/オプション(O)/ドキュメント (2) ドキュメント 言 語 (D): 日 本 語 と 英 語 (3) ドキュメントタイプ: 自 動 (A) (4) カラーモード:モノクロ(OCR は 高 速 になりますが 色 はすべて 失 われます) 図 5 認 識 オプション 図 6 認 識 オプション ドキュメント 7

3.3.2 スキャン/ 開 く (1) メニューバー/ツール(T)/オプション(O)/スキャン/ 開 く (2) 全 般 : 取 得 したページ 画 像 を 自 動 的 に 読 み 取 る(R) (3) 画 像 の 前 処 理 : 画 像 の 前 処 理 を 有 効 にする(E) 図 7 認 識 オプション スキャン/ 開 く 3.3.3 読 み 取 り (1) メニューバー/ツール(T)/オプション(O)/ 読 み 取 り (2) 読 み 取 りモード: 綿 密 な 読 み 取 り(T) (3) 調 整 :ビルトインパターンのみを 使 用 する(D) 図 8 認 識 オプション 読 み 取 り 8

3.3.4 保 存 PDF (1) メニューバー/ツール(T)/オプション(O)/ 保 存 /PDF (2) 既 定 の 用 紙 サイズ(D): 自 動 (3) 保 存 モード(A):ページ 画 像 の 下 にテキスト (4) 画 像 設 定 :カスタム / 解 像 度 : 元 のまま(O) / 品 質 (A): 品 質 低 下 を 許 容 しない (5) フォント 設 定 :Windows フォントを 使 用 (6) セキュリティ:PDF のセキュリティ 設 定 (S) セキュリティなし 図 9 認 識 オプション 保 存 PDF 3.3.5 表 示 デフォルト 設 定 から 変 更 なし 3.3.6 詳 細 設 定 デフォルト 設 定 から 変 更 なし 9

4. 実 際 の 作 業 手 順 PDF ファイルを 開 くと 事 前 に 設 定 した 認 識 オプションに 沿 って 画 像 が 読 み 込 まれる 読 み 込 まれたファ イルには 誤 認 識 があるので それらを 手 作 業 で 修 正 していく 修 正 には 認 識 領 域 の 修 正 と 認 識 結 果 の 誤 字 修 正 の 2 つがある 4.1 領 域 の 修 正 認 識 領 域 には 領 域 の 種 類 や 機 能 向 きや 順 番 があり それらが 間 違 っていると 正 しく 認 識 する 事 はでき ない 4.1 では 読 み 込 まれた 画 像 領 域 の 修 正 方 法 を 示 す 4.1.1 ファイルを 開 く (1) ファイル(F)/PDF ファイル/ 画 像 を 開 く(O) 任 意 のフォルダから 必 要 なファイルを 開 く (2) ファイルを 開 くと 全 てのページが 自 動 で 読 み 込 まれる 200 ページ 程 の 読 み 込 みに 数 分 必 要 図 10 PDF ファイルを 開 く 10

4.1.2 ヘッダーとフッター ファイルが 読 み 込 まれると 左 側 に 画 像 画 面 右 側 にテキスト 画 面 が 表 示 される 各 論 文 の 最 初 のページ には 柱 があり テキスト 画 面 で ヘッダーまたはフッター となっているか 確 認 する 領 域 オプション の 設 定 (3.3.4 保 存 PDF)で ヘッダーとフッターを 維 持 する のチェックを 外 しているので 柱 が ヘ ッダーまたはフッター の 場 合 は 文 字 として 反 映 されず 問 題 ない それ 以 外 の 場 合 は 文 字 認 識 に 反 映 される ので 領 域 を 削 除 する 最 初 の 読 み 込 みで 柱 が 認 識 領 域 に 入 っていなければそのままでよい ノンブルも 同 様 の 対 応 認 識 領 域 については 2.1 認 識 領 域 を 参 照 (1) テキスト 画 面 から 柱 と ノンブル の 領 域 が ヘッダーまたはフッター となっているか 確 認 図 11 では 柱 と ノンブル の 両 方 がヘッダーまたはフッターになっているので 問 題 ない 領 域 を 削 除 する 場 合 の 修 正 手 順 は 次 の 4.1.3 領 域 の 削 除 で 説 明 図 11 領 域 修 正 ヘッダーとフッター 11

4.1.3 領 域 の 削 除 対 象 外 の 部 分 が 認 識 領 域 に 入 っている 場 合 は 領 域 を 削 除 する 1 ページ 内 で 修 正 箇 所 が 多 い 場 合 は 一 度 全 ての 領 域 を 削 除 し 最 初 からやり 直 したほうが 早 い 一 部 分 の 削 除 (1) 図 12 では 認 識 領 域 の 対 象 外 であるノンブルが 文 字 として 認 識 されているので 削 除 する (2) 画 像 画 面 で 削 除 する 領 域 にマウスを 合 わせて 右 クリック (3) [ 領 域 の 削 除 (D)]を 選 択 (4) 並 べ 替 え から 領 域 の 認 識 順 を 確 認 ( 次 の 4.1.4 認 識 順 の 変 更 で 説 明 ) 領 域 の 修 正 は 全 て 画 面 左 側 の 画 像 画 面 から 行 う 図 12 領 域 修 正 削 除 図 12 領 域 修 正 削 除 12

全 削 除 図 13 を 見 ると 読 み 取 った 領 域 の 段 組 みが 崩 れ 分 かれたり 繋 がったりしている 一 つずつ 修 正 するに は 時 間 がかかるため 一 度 全 ての 領 域 を 削 除 し 新 たに 範 囲 を 指 定 する (1) 領 域 のどれかにマウスを 合 わせ 右 クリックし [ 領 域 とテキストをすべて 削 除 (E)]を 選 択 (2) 領 域 が 全 て 削 除 されるので 最 初 から 領 域 の 範 囲 を 指 定 する (3) 並 べ 替 え から 領 域 の 認 識 順 を 確 認 ( 次 の 4.1.4 認 識 順 の 変 更 で 説 明 ) 図 13 領 域 修 正 全 削 除 図 14 領 域 修 正 新 たに 領 域 を 指 定

4.1.4 認 識 順 の 変 更 1 ページで 領 域 が 複 数 に 分 かれている 場 合 認 識 順 が 通 常 論 文 を 読 み 進 める 場 合 に 即 しているか 確 認 する 領 域 の 順 番 各 論 文 最 初 のページ: 柱 標 題 著 者 名 著 者 名 直 下 の 所 属 情 報 本 文 注 ノンブル 各 論 文 最 後 のページ: 本 文 注 謝 辞 参 考 文 献 ノンブル それ 以 外 のページ: 本 文 注 ノンブル 段 組 み 一 段 : 上 から 下 二 段 : 左 カラム 上 から 下 右 カラム 上 から 下 図 表 の 位 置 によってはこの 通 りでなく できるだけ 自 然 な 流 れになるような 順 番 にする (1) 図 15 を 見 ると 左 カラムで 本 文 と 注 が 同 じ 領 域 に 入 っている このままでは 柱 タイトル 著 者 本 文 注 本 文 となり 誤 った 文 章 の 繋 がり 方 をしているので 領 域 と 順 番 を 修 正 する (2) 左 カラムの 領 域 を 本 文 と 注 で 分 ける( 一 般 的 な 範 囲 選 択 方 法 と 同 じ 手 順 ) (3) クイックアクセスに 追 加 した 並 べ 替 え を 選 択 し 認 識 したい 順 番 に 領 域 をクリックしていく (4) 図 16 のテキスト 画 面 を 見 ると 新 たに 指 定 した 領 域 が 読 み 取 られず 空 欄 になっている 修 正 した 領 域 の 読 み 取 りは 最 後 にまとめて 行 うので 今 はこのままでよい 各 ページで 必 ず 最 後 に 認 識 順 の 確 認 を 行 うこと 14

図 15 領 域 修 正 順 番 修 正 前 図 16 領 域 修 正 順 番 修 正 後 15

4.1.5 領 域 の 機 能 文 字 認 識 に 必 要 な 領 域 が ヘッダーもしくはフッター になっている 場 合 は 削 除 ではなく 領 域 の 機 能 を 本 文 に 変 更 する 領 域 の 機 能 は 通 常 自 動 になっており 文 字 が 認 識 されていればそのままでよい (1) 図 17 のテキスト 画 面 を 見 ると 表 のキャプションが ヘッダーとフッター になっている (2) 修 正 する 領 域 にマウスを 合 わせ 右 クリック [テキスト 機 能 (F)]を 選 択 (3) 機 能 を[ 本 文 (A)]に 変 更 (4) 並 べ 替 え から 領 域 の 認 識 順 を 確 認 図 17 領 域 修 正 機 能 16

4.1.6 図 表 の 削 除 図 表 に 入 っている 英 数 字 や 記 号 は 言 葉 として 意 味 を 持 たない 場 合 が 多 く それらは 文 字 として 認 識 して も 検 索 対 象 とならないので 削 除 する 図 形 も 同 様 に 削 除 する (1) 図 18 では 数 値 メインの 表 が 1 つと 図 形 が 1 つ 入 っている (2) 削 除 する 図 表 にマウスを 合 わせて 右 クリックし 領 域 の 削 除 を 選 択 この 時 キャプションは 残 す (3) 並 べ 替 え から 領 域 の 認 識 順 を 確 認 図 18 領 域 修 正 図 表 の 削 除 17

4.1.7 図 表 を 残 す/ 領 域 の 種 類 図 表 であっても 文 章 や 単 語 など 言 葉 として 意 味 を 持 つ 文 字 列 がメインの 場 合 は 認 識 領 域 として 残 す 最 初 の 読 み 込 みで 領 域 の 種 類 が[ 表 (A)]( 紫 色 )や[ 画 像 (P)]( 赤 色 )となっている 場 合 も 多 い 表 は 文 字 として 認 識 さ れているので 画 像 とテキストを 見 比 べて 認 識 率 が 悪 くなければそのままでよい 画 像 は 文 字 として 認 識 さ れていないので 領 域 の 種 類 をテキストに 変 更 する 図 を 残 す (1) 図 19 では 文 章 がメインの 図 が 画 像 領 域 となっており 文 字 として 認 識 されていない (2) 変 更 する 領 域 にマウスを 合 わせて 右 クリックし [ 領 域 の 種 類 変 更 (A)]からテキスト(T)に 変 更 (3) 並 べ 替 え から 領 域 の 認 識 順 を 確 認 図 19 領 域 修 正 図 を 残 す 表 を 残 す (1) 図 20 の 2 つの 表 は 単 語 一 覧 なので 認 識 領 域 として 残 す (2) 領 域 の 種 類 が 表 (A)で テキスト 画 面 から 文 字 として 正 しく 認 識 されている 事 を 確 認 (3) 誤 認 識 が 多 い 場 合 は 種 類 をテキスト(T)に 変 更 し どちらがよいか 比 べる 図 20 領 域 修 正 表 を 残 す 18

4.1.8 文 字 の 向 き 画 像 画 面 の 文 字 の 向 きと テキスト 画 面 の 文 字 の 向 きが 一 致 しない 時 は 修 正 する (1) 図 21 のテキスト 画 面 を 見 ると 右 カラムで 誤 って 縦 書 きになっている 領 域 がある (2) 変 更 領 域 にマウスを 合 わせて 右 クリックし [ 判 別 できないテキストの 向 き(H)]から[ 横 書 き(H)]を 選 択 (3) 並 べ 替 え から 領 域 の 認 識 順 を 確 認 図 21 領 域 修 正 文 字 の 向 き 19

4.1.9 修 正 後 の 読 み 込 み 全 ページの 領 域 修 正 が 終 わったら 再 度 読 み 込 み 修 正 をテキストに 反 映 させる (1) 画 面 左 側 のページ 一 覧 を 全 て 選 択 する (2) ツールバーの 読 み 取 り から 再 度 読 み 込 みを 行 う 図 22 領 域 修 正 読 み 取 り 領 域 毎 に 読 み 取 りを 行 いたい 場 合 は 画 像 画 面 で 該 当 の 領 域 にマウスを 合 わせて 右 クリックし[ 領 域 の 読 み 取 り(R)]を 選 択 する 次 の 4.2 認 識 誤 りの 修 正 では 画 像 画 面 から 修 正 を 行 ったら 必 ず 領 域 毎 に 読 み 取 り を 行 い 修 正 が 反 映 されているか 確 認 する 図 23 領 域 修 正 読 み 取 り(2)

4.2 認 識 誤 りの 修 正 領 域 の 修 正 と 再 読 み 込 みが 完 了 したら 一 部 については 目 視 で 一 字 一 句 確 認 する 対 象 は 標 題 著 者 名 所 属 ( 著 者 名 直 下 に 記 述 されている 所 属 先 ) 本 文 見 出 し 参 考 文 献 リストの 番 号 であり 画 像 とテキストを 見 比 べてながら 修 正 を 行 う 4.2.1 一 文 字 から 一 文 字 への 修 正 (1) 図 24 を 見 ると 標 題 の 日 が 曰 に 誤 認 識 されているので テキスト 画 面 から 該 当 文 字 の 左 側 にカ ーソルを 合 わせ 右 クリック (3) 修 正 候 補 の 文 字 が 表 示 されるので 図 25 のように 該 当 文 字 があれば 選 択 (4) 該 当 文 字 がない 場 合 は テキスト 画 面 から 文 字 を 削 除 し 直 接 正 しい 文 字 を 入 力 する (5) 1 つの 領 域 内 で 修 正 が 終 わったら その 都 度 読 み 込 み 確 認 する 図 24 誤 認 識 修 正 一 文 字 修 正 前 図 25 誤 認 識 修 正 一 文 字 修 正 後 21

4.2.2 一 文 字 から 二 文 字 への 修 正 (1) 図 26 のテキスト 画 面 を 見 ると 章 見 出 しが 2. 日 英 _の となっており 翻 訳 が _ に 誤 認 識 さ れている (2) _ の 左 側 にカーソルを 合 わせ 右 クリックすると 認 識 した 画 像 として 翻 訳 の 二 文 字 が 表 示 され 修 正 候 補 には 一 文 字 の 漢 字 がいくつか 表 示 される (3) ABBYY FineReader 11 Professional Edition では 複 数 の 文 字 が 一 文 字 として 誤 認 識 された 場 合 分 割 する 機 能 がない (4) そのため 本 来 別 々の 文 字 が 1 文 字 として 誤 認 識 された 場 合 は テキスト 画 面 から 該 当 文 字 を 削 除 し 直 接 正 しい 文 字 を 入 力 する (5) 1 つの 領 域 内 で 修 正 が 終 わったら その 都 度 読 み 込 み 確 認 する 図 26 誤 認 識 修 正 一 文 字 から 二 文 字 22

4.2.3 二 文 字 から 一 文 字 への 修 正 (1) 図 27 では 観 という 文 字 を 二 文 字 に 分 割 し!! と 誤 認 識 している (2) 誤 認 識 している!! の 両 方 を 選 択 し 右 クリック (3) 修 正 候 補 の 文 字 が 表 示 されるので 該 当 文 字 があれば 選 択 (4) 該 当 文 字 がない 場 合 は テキスト 画 面 から 文 字 を 削 除 し 直 接 正 しい 文 字 を 入 力 する (5) 1 つの 領 域 内 で 修 正 が 終 わったら その 都 度 読 み 込 み 確 認 する 図 27 誤 認 識 修 正 二 文 字 から 一 文 字 23

4.2.4 文 献 リストの 番 号 確 認 各 論 文 の 最 後 のページには 参 考 文 献 がついているので リスト 番 号 がついている 場 合 はその 番 号 のみ 確 認 し 誤 認 識 があれば 修 正 する (1) 図 28 の 参 考 文 献 リストを 見 ると[6]が 誤 認 識 されている (2) この 場 合 [6]の 三 文 字 が 一 文 字 として 誤 認 識 されているので 誤 った 文 字 を 削 除 し 直 接 正 しい 文 字 を 入 力 (3) 1 つの 領 域 内 で 修 正 が 終 わったら その 都 度 読 み 込 み 確 認 する 図 28 誤 認 識 修 正 文 献 リスト 番 号 24

4.2.5 その 他 誤 認 識 の 修 正 で 画 像 と 対 応 する 文 字 の 特 定 が 難 しい 場 合 や 拡 大 して 確 認 したい 時 は 検 証 画 面 を 利 用 する (1) テキスト 画 面 の 確 認 したい 箇 所 にカーソルを 合 わせ 左 クリック (2) テキスト 画 面 右 上 の 検 証 選 択 (3) 画 像 とテキストを 見 比 べながら 修 正 を 行 う 図 29 誤 認 識 修 正 検 証 25

画 像 画 面 で 領 域 に 入 っている 文 字 がテキスト 画 面 で 認 識 されない 場 合 その 領 域 を 再 度 読 み 込 むか 領 域 を 分 けて 読 み 込 む (1) 図 30 では 領 域 内 に 入 っている 著 者 の 所 属 がテキスト 画 面 では 認 識 されていない (2) 再 度 読 み 込 むも 認 識 されないので 著 者 と 所 属 の 領 域 を 分 割 (3) 領 域 の 数 が 増 えたので 順 番 を 修 正 し 再 読 み 込 み (4) 修 正 後 の 図 31 では 著 者 所 属 が 認 識 されている 図 30 認 識 されていない 領 域 図 31 修 正 で 認 識 された 領 域 26

5. 保 存 5.1FineReader ドキュメントの 保 存 作 業 の 中 断 や 修 正 が 一 段 落 した 時 には FineReader ドキュメント( 作 業 ファイル)を 保 存 する 次 に 作 業 を 再 開 する 時 は FineReader ドキュメントを 開 けば 前 回 の 続 きから 作 業 を 行 える (1) ファイル(F)/FineReader ドキュメントを 保 存 (U) 任 意 のフォルダに 保 存 図 32 FineReader ドキュメントの 保 存 27

5.2 PDF ファイルの 保 存 1 つのファイルの 認 識 が 終 了 したら PDF ファルを 保 存 する (1) ファイル(F)/ドキュメントに 名 前 を 付 けて 保 存 (V)/PDF ドキュメント(P) 任 意 のフォルダに 保 存 図 33 PDF ファイルの 保 存 28