タイトルは14ポイント&ボールドMS明朝



Similar documents
Microsoft Word - 生物学技研報告ONLINE ガイドブック.doc

電子申告直前研修会(所得税編)

<4D F736F F D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A B E A2E646F63>

2016 年 度 情 報 リテラシー 変 更 された 状 態 同 様 に 価 格 のセルを 書 式 設 定 する 場 合 は 金 額 のセルをすべて 選 択 し [ 書 式 ]のプルダウンメニューか ら[ 会 計 ]を 選 択 する すると が 追 加 され 金 額 としての 書 式 が 設 定 さ

(1) 言 語 資 料 の 収 集 ( 看 護 師 国 家 試 験 ) (2) 言 語 資 料 の 調 査 基 準 に 沿 った 単 位 への 分 割 (3) データベースとしての 年 度 別 付 加 情 報 付 単 位 語 表 の 作 成 例 : 1 単 位 語 2 見 出 し 語 3 読 み 4

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

TIPS - 棚 割 りを 開 始 するまで Liteを 起 動 し 企 業 情 報 の 追 加 を 行 い 棚 割 を 行 う 企 業 の 追 加 をして 下 さい 企 業 情 報 の 追 加 時 に エラーメッセージが 表 示 された 場 合 別 途 TIPS トラブルが 発 生 した 場 合

2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数

R4財務対応障害一覧

POWER EGG V2.01 ユーザーズマニュアル ファイル管理編

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について EXCEL 一 括 登 録 EXCEL ダウンロード 検 索 条 件 の 指 定 プレビュー EXCEL ダウンロード(データ 抽 出 あ

新 生産管理システム ご提案書 2002年10月15日 ムラテック情報システム株式会社

PowerPoint プレゼンテーション

富士山チェックリスト

第1回

(2) 広 島 国 際 学 院 大 学 ( 以 下 大 学 という ) (3) 広 島 国 際 学 院 大 学 自 動 車 短 期 大 学 部 ( 以 下 短 大 という ) (4) 広 島 国 際 学 院 高 等 学 校 ( 以 下 高 校 という ) ( 学 納 金 の 種 類 ) 第 3 条

Microsoft PowerPoint - 6

Microsoft PowerPoint - 報告書(概要).ppt

戦略担当者のための

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

目 次 機 能 概 要 配 信 管 理 1. メールの 配 信 履 歴 と 予 約 を 確 認 する

別冊資料-11

1.2. ご 利 用 環 境 推 奨 ブラウザ Internet Explorer Google Chrome(バージョン 32 時 点 で 動 作 確 認 済 み) Mozilla Firefox(バージョン 26 時 点 で 動 作 確 認 済 み) Safari 7

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

(3) 小 単 元 の 指 導 と 評 価 の 計 画 小 単 元 第 11 章 税 のあらまし の 指 導 と 評 価 の 計 画 ( 四 次 確 定 申 告 制 度 抜 粋 ) 関 心 意 欲 態 度 思 考 判 断 技 能 表 現 知 識 理 解 小 単 元 の 評 価 規 準 税 に 関 す

03_主要処理画面.xlsx

<819A955D89BF92B28F BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

[2] 控 除 限 度 額 繰 越 欠 損 金 を 有 する 法 人 において 欠 損 金 発 生 事 業 年 度 の 翌 事 業 年 度 以 後 の 欠 損 金 の 繰 越 控 除 にあ たっては 平 成 27 年 度 税 制 改 正 により 次 ページ 以 降 で 解 説 する の 特 例 (

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

<4D F736F F D20819C B78AFA95DB91538C7689E68DEC90AC289

PowerPoint プレゼンテーション

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63>

MetaMoJi ClassRoom/ゼミナール 授業実施ガイド

目 次 1. ログイン ユーザー 登 録 TOP 職 員...8 (1) 職 員 の 名 刺 表 示...8 (2) 職 員 の 名 刺 一 括 ダウンロード...8 (3) 職 員 の 名 刺 帳 から 検 索 検 索...9 (1) 氏 名

施 設 維 持 管 理 機 能 一 覧 1. 中 長 期 保 全 計 画 作 成 2. 中 長 期 保 全 計 画 集 計 3. 点 検 記 録 情 報 管 理 4. 修 繕 履 歴 情 報 管 理 2

<82C582F182B382A2322E3594C5837D836A B2E786C73>

スライド 1

Ver 改 訂 日 付 改 訂 内 容 1

目 次 電 子 申 請 を 使 用 した 申 請 の 流 れ 1ページ 申 請 書 ( 概 算 保 険 料 申 告 書 )の 作 成 2ページ 作 成 した 申 請 書 の 送 信 31ページ 状 況 照 会 電 子 納 付 を 行 う 62ページ 返 送 書 類 の 取 得 75ページ お 問 い

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ

2 出 願 資 格 審 査 前 記 1の 出 願 資 格 (5) 又 は(6) により 出 願 を 希 望 する 者 には, 出 願 に 先 立 ち 出 願 資 格 審 査 を 行 いますので, 次 の 書 類 を 以 下 の 期 間 に 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 等

研究者情報データベース

している 5. これに 対 して 親 会 社 の 持 分 変 動 による 差 額 を 資 本 剰 余 金 として 処 理 した 結 果 資 本 剰 余 金 残 高 が 負 の 値 となるような 場 合 の 取 扱 いの 明 確 化 を 求 めるコメントが 複 数 寄 せられた 6. コメントでは 親

< C8EAE81698B4C93FC8FE382CC97AF88D38E968D CA8E86816A2E786C73>

する ( 評 定 の 時 期 ) 第 条 成 績 評 定 の 時 期 は 第 3 次 評 定 者 にあっては 完 成 検 査 及 び 部 分 引 渡 しに 伴 う 検 査 の 時 とし 第 次 評 定 者 及 び 第 次 評 定 者 にあっては 工 事 の 完 成 の 時 とする ( 成 績 評 定

Microsoft Word - fiš“⁄.doc

PowerPoint プレゼンテーション

1 変更の許可等(都市計画法第35条の2)

特 徴 差 分 点 検 レセ 楽 netの 点 検 方 式 は レセ 電 データを 使 用 した 差 分 点 検 です 前 回 点 検 分 と 比 較 して データ 内 容 と 記 録 順 が 異 なる 場 合 のみ 点 検 を 行 います 追 加 されたデータの 点 検 実 施 病 名 追 加 さ

Mac OS Xでの利用設定 マニュアル

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

< 目 次 > 8. 雇 用 保 険 高 年 齢 雇 用 継 続 給 付 27 ( 育 児 休 業 給 付 介 護 休 業 給 付 ) 8.1 高 年 齢 雇 用 継 続 給 付 画 面 のマイナンバー 設 定 高 年 齢 雇 用 継 続 給 付 の 電 子 申 請 高

Microsoft Word - 05_roumuhisaisoku

2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36

第4回税制調査会 総4-1

特別徴収封入送付作業について

Microsoft Word - 03accessデータベース演習レジメ.doc

「1 所得税及び復興特別所得税の確定申告書データをお持ちの方」からの更正の請求書・修正申告書作成編

GRIDY SFA カスタム 項 目 操 作 ガイド 用 本 書 はに 必 要 な 操 作 を 解 説 しております は GRIDY SFA ののことです GRIDY SFA へ 申 し 込 み 最 初 に 登 録 を 行 った 方 がそのままとなります カスタム 項 目 はの 方 のみ 操 作 可

職 員 の 平 均 給 与 月 額 初 任 給 等 の 状 況 (1) 職 員 の 平 均 年 齢 平 均 給 料 月 額 及 び 平 均 給 与 月 額 の 状 況 ( 平 成 年 月 1 日 現 在 ) 1 一 般 行 政 職 福 岡 県 技 能 労 務 職 歳 1,19,98 9,9 歳 8,

公表表紙

V-CUBE One

<4D F736F F D C97F195CF8AB DEC90E096BE8F912091E6312E313294C52E646F63>

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 4ページに 汎 用 データ 受 入 に 関 するよくあるお 問 い 合 わせをご 紹 介 しています Step (3ペー

購買ポータルサイトyOASIS簡易説明書 b

<6D313588EF8FE991E58A778D9191E5834B C8EAE DC58F4992F18F6F816A F990B32E786C73>

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

b) 参 加 表 明 書 の 提 出 時 において 東 北 地 方 整 備 局 ( 港 湾 空 港 関 係 を 除 く) における 平 成 年 度 土 木 関 係 建 設 コンサルタント 業 務 に 係 る 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 認 定 を 受 けて

入 札 参 加 者 は 入 札 の 執 行 完 了 に 至 るまではいつでも 入 札 を 辞 退 することができ これを 理 由 として 以 降 の 指 名 等 において 不 利 益 な 取 扱 いを 受 けることはない 12 入 札 保 証 金 免 除 13 契 約 保 証 金 免 除 14 入

その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

表紙

JCLWorkshop_No.8

2 前 項 前 段 の 規 定 にかかわらず 年 俸 制 教 職 員 から 申 し 出 があった 場 合 においては 労 使 協 定 に 基 づき その 者 に 対 する 給 与 の 全 額 又 は 一 部 を 年 俸 制 教 職 員 が 希 望 する 金 融 機 関 等 の 本 人 名 義 の 口

登 載 システム 操 作 説 明 Ⅰ. 登 載 システムでの 公 開 までの 流 れ Ⅱ. 基 本 操 作 Ⅲ. 推 奨 動 作 環 境 2

PowerPoint プレゼンテーション

Microsoft PowerPoint _リビジョンアップ案内_最終.pptx

eol 操 作 マニュアル 目 次 基 本 機 能 トップページとナビゲーション 構 成 基 本 機 能 タブメニュー と プルダウンメニュー について 基 本 機 能 ダイレクト 企 業 検 索 について 企 業 検 索 企 業 基 本 情 報 企 業 情 報 の 閲 覧 ダウンロード 有 報 メ

目 次 画 面 遷 移 図 1.ログイン 画 面 2. 画 面 構 成 3.メニュー 4.タスク 一 覧 4-1.タスク: 新 規 4-2.タスク: 閲 覧 4-3.タスク: 更 新 5.タスク 検 索 6. 通 知 メール 6-1. 通 知 メール: 新 規 / 修 正 7. 連 絡 事 項 7-

目 次 1.はじめに 書 式 の 説 明 表 紙 スケジュール 組 入 れ 基 準 併 用 禁 止 薬 併 用 注 意 薬 同 種 同 効 薬 医 師 モニタリング..

d_cj01

<91808DEC837D836A B5F8F488E528A6D E786C7378>

Microsoft Word - 目次.doc

158 高 校 講 座 習 モ 現 ラ 習 モ 距 離 置 示 終 向 据 示 唆 与 取 ょ 第 7576 回 第 :

東近江行政組合職員の育児休業等に関する条例

<IE の 設 定 について> 従 来 版 をすでにご 利 用 の 方 の 場 合 互 換 表 示 設 定 がある 状 態 になっていると 思 わ れますので 必 ず 解 除 の 設 定 を 行 ってください 従 来 版 では IE の 10 以 上 では 互 換 表 示 設 定 が 必 要 でした

PowerPoint プレゼンテーション

1

「給与・年金の方」からの確定申告書作成編

<4D F736F F F696E74202D C90BF8F CC8DEC90AC97E181698A4F8D E8816A5F56322E707074>

2. データを 検 索 する なごやコレクションのデータを 検 索 するための 方 法 として キーワード 検 索 詳 細 検 索 の 二 通 りの 検 索 方 法 が あります 2.1. キーワードから 探 す キーワードを 入 力 する トップページの 入 力 ボックスに 検 索

<4D F736F F D208E9197BF342D8EC08F4B87428EF68BC B834A E646F6378>

01_07_01 データのインポート_エクスポート_1

2016 年 度 情 報 リテラシー 三 科 目 合 計 の 算 出 関 数 を 用 いて 各 教 科 の 平 均 点 と 最 高 点 を 求 めることにする この2つの 計 算 は [ホーム]タブのコマ ンドにも 用 意 されているが 今 回 は 関 数 として 作 成 する まず 表 に 三 科

国 税 クレジットカード 納 付 の 創 設 国 税 のクレジットカード 納 付 については マイナンバー 制 度 の 活 用 による 年 金 保 険 料 税 に 係 る 利 便 性 向 上 に 関 するアクションプログラム( 報 告 書 ) においてその 導 入 の 方 向 性 が 示 されている

H28記入説明書(納付金・調整金)8


(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

<95BD90AC E93788C888E5A82CC8A FEE95F18CF68A4A97702E786C73>


Transcription:

通 時 コーパス 用 中 納 言 : Web ベースの 古 典 語 コンコーダンサー 小 木 曽 智 信 ( 国 立 国 語 研 究 所 言 語 資 源 研 究 系 ) 中 村 壮 範 (マンパワージャパン 株 式 会 社 ) Chunagon for the NINJAL Diachronic Corpus: a Web-based Concordancer of Classical Japanese Toshinobu Ogiso (National Institute for Japanese Language and Linguistics) Takenori Nakamura (Manpower Japan Co., Ltd.) 1.はじめに 国 立 国 語 研 究 所 の 共 同 研 究 プロジェクト 通 時 コーパスの 設 計 1 では 日 本 語 の 歴 史 的 資 料 をコーパス 化 するための 研 究 が 行 われている その 一 環 として 先 行 して 整 備 が 進 ん でいる 一 部 のデータを 格 納 した Web アプリケーション 通 時 コーパス 用 中 納 言 の 共 同 研 究 者 向 けの 公 開 を 開 始 した 通 時 コーパス 用 中 納 言 は 現 代 日 本 語 書 き 言 葉 均 衡 コ ーパス ( 以 下 BCCWJ とする)の 公 開 にあたって 開 発 された Web ベースのコンコーダン サー 中 納 言 に 若 干 の 機 能 拡 張 を 行 い 源 氏 物 語 などの 通 時 コーパスの 一 部 のデー タを 格 納 したものである これにより 一 般 の 古 典 研 究 者 にも 使 いやすいインターフェイ スを 用 いて 通 時 コーパスを 利 用 することが 可 能 になった 本 発 表 では 通 時 コーパス 用 中 納 言 と 現 在 利 用 可 能 なデータについて 紹 介 する 2. 通 時 コーパス 用 中 納 言 の 概 要 中 納 言 はコーパスに 付 与 された 形 態 論 情 報 を 用 いて 高 度 な 検 索 を 行 うことが 可 能 な Web アプリケーションである 検 索 条 件 指 定 の 自 由 度 が 高 く 複 数 の 語 を 組 み 合 わせて 詳 細 な 条 件 指 定 を 行 うことができる 検 索 結 果 はキーとなる 語 の 形 態 論 情 報 サンプルの 書 誌 情 報 とともに KWIC 形 式 で 一 覧 表 示 されるほか 表 形 式 のテキストデータとしてダウ ンロードして 利 用 することもできる 今 回 準 備 中 の 通 時 コーパスデータをこのシステムに 格 納 して 利 用 することを 可 能 にし た( 次 ページ 図 1) BCCWJ では 短 単 位 と 長 単 位 の 二 つの 異 なるサイズの 形 態 論 情 報 を 用 いることができたが 通 時 コーパスのデータでは 今 のところ 長 単 位 の 整 備 が 進 ん でいないため 通 時 コーパス 用 中 納 言 では 短 単 位 だけが 利 用 可 能 となっている 通 時 コーパス 用 中 納 言 では 上 記 中 納 言 の 機 能 に 加 えて BCCWJ にはなかったテ キストに 関 する 情 報 が 利 用 できるようになっている 一 つは 本 文 種 別 と 呼 んでいる 情 報 で 小 学 館 新 編 古 典 文 学 全 集 に 付 けられている 情 報 を 元 に 会 話 手 紙 歌 詞 書 とそれ 以 外 ( 地 の 文 )の 別 が 個 々の 語 について 付 与 されている さらに 話 者 情 報 と して 会 話 についてはその 話 者 手 紙 については 書 き 手 歌 については 歌 番 号 な どの 情 報 が 付 与 されている togiso@ninjal.ac.jp 1 http://historicalcorpus.jp 109

図 1 通 時 コーパス 用 中 納 言 検 索 実 行 画 面 3. 収 録 データ 現 在 通 時 コーパス 用 中 納 言 に 格 納 され 利 用 可 能 になっているデータは 表 1 に 示 し た 13 作 品 約 87 万 語 である これらの 作 品 は 後 述 する 中 古 和 文 UniDic による 自 動 形 態 素 解 析 結 果 をもとに すべて 一 度 は 人 手 による 修 正 チェックを 経 たものである(た だし 一 部 データの 抜 き 取 り 調 査 によると 現 時 点 での 精 度 はおおむね 98% 程 度 であると 思 われる) 国 語 研 究 所 の 通 時 コーパスは 現 在 のところ 設 計 の 途 上 であり ごく 一 部 のデータ が 作 成 されているに 過 ぎない それでも 源 氏 物 語 をはじめとする 中 古 の 主 要 な 古 典 文 学 作 品 をカバーしている このうち 竹 取 物 語 伊 勢 物 語 土 佐 日 記 大 和 物 語 枕 草 子 源 氏 物 語 の 6 作 品 は 小 学 館 の 新 編 日 本 古 典 文 学 全 集 に 基 づくデータであり 最 終 的 な 通 時 コーパスにも 同 じテキストが 用 いられる 予 定 である 残 る 7 作 品 は 入 手 しやすいデータをもとに 形 態 素 解 析 の 学 習 用 データとしたものや 研 究 試 験 用 に 作 成 したものであり 参 考 データに とどまる 110

表 1 収 録 データ(2012 年 6 月 30 日 現 在 ) 作 品 名 語 数 ( 短 単 位 ) 備 考 竹 取 物 語 12583 小 学 館 新 編 日 本 古 典 文 学 全 伊 勢 物 語 15900 集 土 佐 日 記 8113 大 和 物 語 26733 枕 草 子 79879 源 氏 物 語 510714 古 今 仮 名 序 3107 その 他 紫 式 部 日 記 20346 大 鏡 82796 更 級 日 記 16652 方 丈 記 4191 徒 然 草 41675 恋 路 ゆかしき 大 将 44819 計 867508 ( 中 古 和 文 UniDic 学 習 用 デ ータ) 4. 形 態 論 情 報 通 時 コーパスのデータは BCCWJ と 同 様 に 形 態 素 解 析 技 術 を 用 いて 全 ての 本 文 テキス トに 単 語 の 切 れ 目 読 み 品 詞 活 用 などの 形 態 論 情 報 を 付 与 している 形 態 素 解 析 のた めの 辞 書 は BCCWJ の 構 築 に 用 いられた UniDic をもとに 中 古 和 文 を 解 析 できるよ うに 語 彙 を 増 補 しパラメータを 調 整 した 中 古 和 文 UniDic を 用 いている 中 古 和 文 UniDic は 未 知 語 のないテキストであればおおむね 96~97% 程 度 の 精 度 で 解 析 を 行 うこ とが 可 能 になっている 2 中 古 和 文 UniDic が 付 与 する 形 態 論 情 報 は BCCWJ と 同 様 の 短 単 位 を 採 用 し 中 古 語 であっても 現 代 語 とできるかぎり 基 準 を 揃 え 相 互 に 比 較 することができるように 配 慮 したものである ただし 語 の 歴 史 的 変 化 や 中 古 語 の 実 態 を 踏 まえ 時 代 別 に 異 なっ た 扱 いをしている 語 も 少 なくない たとえば 現 代 語 では 連 体 詞 とされる この その が 中 古 語 では 代 名 詞 こ そ と 格 助 詞 の に 分 けて 数 えられている この 中 古 和 文 用 の 短 単 位 の 規 定 は 小 椋 須 永 (2012)にまとめられている 3 通 時 コーパス 用 中 納 言 を 用 いて 中 古 語 の 検 索 をする 場 合 には この 短 単 位 の 規 定 に ついて 理 解 をしておく 必 要 がある 5. 検 索 方 法 中 納 言 に 格 納 されているデータは 形 態 論 情 報 が 付 与 されているため 表 層 の 文 字 列 だけでなく 形 態 論 情 報 を 利 用 することで 高 度 な 検 索 条 件 の 指 定 を 行 うことができる た とえば 語 彙 素 給 う ( 終 止 形 )を 指 定 することで 給 う 給 は 給 ひ 給 ふ など の 各 活 用 形 を 一 括 で 検 索 することが 可 能 である また UniDic の 見 出 し 語 の 階 層 構 造 によ り 見 出 し 語 を 語 彙 素 で 指 定 すれば その 異 表 記 を 一 括 検 索 することができる したがっ て 漢 字 表 記 と 仮 名 表 記 の 違 い 異 体 字 や 送 り 仮 名 の 揺 れなどを 一 々 意 識 することなく 検 索 できる 2 中 古 和 文 UniDic は 次 のサイトで 報 告 書 PDF と 共 に 一 般 公 開 している( 無 償 ) http://www2.ninjal.ac.jp/lrc/index.php?unidic 3 中 古 和 文 UniDic 短 単 位 規 程 集 の PDF ファイルも 上 記 ウェブサイトで 一 般 公 開 している 111

5.1 検 索 条 件 の 指 定 具 体 的 には 形 態 論 情 報 を 使 った 検 索 では 次 のコントロールで 検 索 条 件 を 設 定 する 選 択 で 条 件 指 定 する 属 性 ( 語 彙 素 出 現 書 字 形 など)を 選 び 右 の 空 欄 でその 中 身 を 指 定 する 短 単 位 の 条 件 の 追 加 ボタンで 一 つの 単 位 について 詳 細 な 条 件 指 定 を 追 加 できる 次 の 例 では 語 彙 素 が 読 む でかつ 活 用 形 が 連 体 形 の 例 を 検 索 している ( 活 用 形 など 選 択 肢 が 決 まっているものはドロップダウンメニューから 選 択 する) さらに 複 数 の 単 位 を 組 み 合 わせて 指 定 することもできる 前 方 共 起 条 件 の 追 加 ボタ ンでキーの 前 方 に 出 現 する 単 位 を 指 定 後 方 共 起 条 件 の 追 加 ボタンでキーの 後 方 に 出 現 する 単 位 を 指 定 する 共 起 条 件 は 前 方 後 方 合 わせて 最 大 10 個 まで 追 加 できる 共 起 位 置 は キーから または 文 頭 から を 基 準 として n 語 または n 語 以 内 のように 細 かく 指 定 する 事 ができる 次 の 例 は 美 しい の 連 体 形 の 直 後 ( 後 方 1 語 ) に 来 る 名 詞 を 検 索 したものである 中 納 言 では 形 態 論 情 報 を 使 った 検 索 以 外 に 文 字 列 検 索 によって 表 層 の 文 字 列 にもとづく 検 索 を 行 うこともできる この 場 合 にも 検 索 結 果 は 形 態 論 情 報 付 きで 表 示 さ れるため 調 査 したい 語 にどのような 形 態 論 情 報 が 付 与 されているか 分 からない 場 合 には いったん 文 字 列 検 索 で 形 態 論 情 報 を 確 認 すると 便 利 である なお このようにして 画 面 上 で 指 定 した 検 索 条 件 は システムが 解 釈 できる 検 索 条 件 式 に 変 換 されたのち 検 索 が 実 行 される この 検 索 条 件 式 は 検 索 履 歴 として 自 動 的 で サーバー 上 に 記 録 されるほか 画 面 上 で 編 集 をして 再 検 索 に 利 用 することが 可 能 になって いる たとえば 上 記 の 前 方 共 起 1 を 利 用 した 検 索 例 は 次 の 検 索 条 件 式 で 表 される キー: 品 詞 LIKE " 名 詞 %" AND 前 方 共 起 : ( 語 彙 素 = " 美 しい" AND 活 用 形 LIKE " 連 体 形 %") ON 1 WORDS FROM キー IN core="true" OR core="false" WITH OPTIONS unit="1" AND tglwords="20" AND tglkugiri=" " AND tglfixvariable="2" この 条 件 式 を 控 えておくことにより 中 納 言 のユーザーであれば 全 く 同 じ 検 索 を 再 現 す ることができる 112

5.2 検 索 実 行 とダウンロード 検 索 の 実 行 には 画 面 上 の 検 索 ボタンをクリックする これにより, 画 面 下 部 に 図 2 のような 検 索 結 果 が 表 示 される ただし 画 面 上 に 表 示 される 用 例 数 は 500 例 までとなっ ている これ 以 上 の 用 例 を 確 認 する 場 合 には 結 果 をダウンロードする 必 要 がある 図 2 検 索 結 果 の 表 示 この 検 索 結 果 の 各 列 は 列 の 表 示 のチェックボックスにより 表 示 の ON/OFF を 切 り 替 えることができる 検 索 結 果 のサンプル ID をクリックすることにより 当 該 位 置 周 辺 ( 前 後 30 単 位 )に 付 けられている 形 態 論 情 報 を 確 認 することができる( 図 3) 図 3 キー 周 辺 の 形 態 論 情 報 の 表 示 検 索 ボタンの 代 わりに 検 索 結 果 をダウンロード ボタンをクリックすることによ って 検 索 結 果 と 検 索 条 件 式 をテキストデータとしてダウンロードすることができる デ ータは zip 圧 縮 されており アーカイブ 中 のファイル kwic.txt が 検 索 結 果 のデータ(タブ 区 切 りの 表 形 式 テキスト 文 字 コードは UTF-8) summary.txt が 検 索 条 件 式 のデータとな っている 113

6. 検 索 例 検 索 例 として 完 了 の 助 動 詞 つ ぬ に 上 接 する 動 詞 のリストを 検 索 する 例 を 示 す( 図 4) ここでは 助 動 詞 の 前 方 2 語 以 内 に 来 る 動 詞 をキーとして 検 索 結 果 を 取 得 している 図 4 助 動 詞 つ の 上 接 動 詞 の 検 索 条 件 指 定 この 条 件 での 検 索 結 果 の 表 示 は 図 5 のようになる 図 5 助 動 詞 つ の 上 接 動 詞 の 検 索 結 果 上 記 の 画 面 は つ の 上 接 動 詞 を 検 索 するものだが 検 索 条 件 式 中 で 括 弧 と OR 演 算 子 を 用 いることで 二 つの 助 動 詞 を 一 度 に 検 索 するようにすることもできる キー: 品 詞 LIKE " 動 詞 %" AND 後 方 共 起 : (( 語 彙 素 = "つ" OR 語 彙 素 = "ぬ" ) AND 品 詞 LIKE " 助 動 詞 %") WITHIN 2 WORDS FROM キー IN core="true" OR core="false" WITH OPTIONS unit="1" AND tglwords="20" AND tglkugiri=" " AND tglfixvariable="2" 6.1 検 索 結 果 の 集 計 このような 検 索 によって 取 得 したデータをダウンロードすることで アプリケーション に 読 み 込 んでさまざまな 処 理 を 施 し 集 計 やデータの 分 析 に 利 用 することができる たと えば Microsoft Excel のピボットテーブル 機 能 を 利 用 することで 高 度 な 集 計 処 理 を 容 易 に 実 現 することができる 図 6 は 上 記 の 条 件 で 検 索 した 助 動 詞 つ と ぬ の 上 接 動 詞 のリストを Excel に 読 み 込 んで 助 動 詞 の 情 報 を 加 えたものである 114

図 6 助 動 詞 つ の 上 接 動 詞 の 検 索 結 果 ( 一 部 ) このデータをピボットテーブルで 集 計 することで 助 動 詞 別 に 高 頻 度 な 上 接 動 詞 をリスト アップすることができる( 図 7) 図 7 助 動 詞 つ ぬ の 高 頻 度 の 上 接 動 詞 ( 一 部 ) 115

7.おわりに 検 索 例 で 見 たように 従 来 であれば 大 変 な 労 力 と 時 間 を 要 していた 検 索 集 計 作 業 を 極 めて 簡 単 に 行 うことが 可 能 になった また 従 来 では 不 可 能 であった 高 度 な 組 み 合 わせ 検 索 が 可 能 になった 今 後 通 時 コーパス 用 中 納 言 を 用 いて 単 に 研 究 を 省 力 化 する だけでなく これまで 不 可 能 であった 新 次 元 の 古 典 語 研 究 がなされ 有 益 な 研 究 成 果 が 生 み 出 されることに 期 待 したい 現 在 通 時 コーパス 用 中 納 言 の 公 開 範 囲 は 共 同 研 究 者 の 一 部 に 限 定 しているが 今 後 は 公 開 範 囲 を 拡 大 していく 予 定 である 文 献 小 木 曽 智 信 中 村 壮 範 鈴 木 泰 山 八 木 豊 山 崎 誠 前 川 喜 久 雄 (2011) コーパス 検 索 シス テム 中 納 言 デモンストレーション 日 本 語 コーパス 完 成 記 念 講 演 会 予 稿 集 pp.43-46 小 木 曽 智 信 ほか(2012) 和 文 系 資 料 を 対 象 とした 形 態 素 解 析 辞 書 の 開 発 科 研 費 基 盤 研 究 (C) 和 文 系 資 料 を 対 象 とした 形 態 素 解 析 辞 書 の 開 発 ( 課 題 番 号 21520492) 研 究 成 果 報 告 書 (http://dl.dropbox.com/u/73297026/report/unidic-emj_report2012.pdf からダウン ロード 可 能 ) 小 椋 秀 樹 須 永 哲 矢 (2012) 中 古 和 文 UniDic 短 単 位 規 程 集 科 研 費 基 盤 研 究 (C) 和 文 系 資 料 を 対 象 とした 形 態 素 解 析 辞 書 の 開 発 ( 課 題 番 号 21520492) 研 究 成 果 報 告 書 2 (http://dl.dropbox.com/u/73297026/report/unidic-emj_rulebook2012.pdf からダウン ロード 可 能 ) Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. (2012) UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese. In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC), pp.911-915. Istanbul, May 2012.(http://www.lrec-conf.org/proceedings/lrec2012/pdf/906_Paper.pdf からダウンロード 可 能 ) 関 連 URL コーパス 検 索 アプリケーション 中 納 言 (BCCWJ) http://chunagon.ninjal.ac.jp/ NINJAL 通 時 コーパスプロジェクト ホームページ http://www.historicalcorpus.jp/ 中 古 和 文 UniDic http://www2.ninjal.ac.jp/lrc/index.php?unidic 116