演習 レシピテキストの係り受け解析

Similar documents
1. はじめに 2

1 ログインとログアウト 1.1 ログイン ログイン画面で [ password ] 欄にパスワードを入力します (図 1) 図 1 ログイン画面 正しくログインができると Ubuntu のデスクトップ画面 図2 が表示されます 図2 Ubuntu デスクトップ画面 2

V-Safe 100

AppsWF ワークフロー設定ガイド Ver.1.1 株式会社オプロ

Microsoft Word - HGWEB_Defender_クリーンアップツール_説明書_Rev.1.00.doc

インターネット EDI システムを使用する前の準備 目次 動作環境について... 2 Internet Explorer7.0 / 8.0 をご利用の場合の設定方法... 3 [1] インターネット EDI システムを利用するための標準的な設定... 3 [2] ブラウザ型で帳票を利用する場合に必要

目次 1. 概要 動作環境

迷惑メールフィルタリングサービス フィードバック機能マニュアル

Microsoft Edge の場合 (1) Mizdori 無料体験版ダウンロード画面の [ 体験版ダウンロード ] ボタンをクリックします (2) Edge の下部に mizdori_taiken_setup.zip について行う操作を選んでください と表示され ますので [ 開く ] をクリッ

(Microsoft Word - storengomini\203K\203C\203h.doc)

Zoiper 操作マニュアル Ver /8/10 作成 Ver /7/10 作成 Ver /4/30 作成 Ver /3/30 作成 *Zoiper は Zoiper so4ware 社の製品です

ESET Smart Security 7 リリースノート

Microsoft PowerPoint - install_NGSsokushu_windows(ver2.1).pptx

H-R041-2_j

POWER EGG V2.01 ユーザーズマニュアル 汎用申請編

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

目次 はじめに...3 チュートリアル素材のご利用に関して... 4 完成イメージ...5 一連の流れ 5 STEP 1. クイズの新規作成...6 STEP 2. 一般公開 ( オンラインストレージ ) 終わりに お問い合わせ お問い合わせ窓口 更新

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

目次 1. はじめに... 1 動作環境... 1 その他 他の人が利用する ID を発行したい... 2 ユーザー ID 作成を作成しましょう パソコンのデータを自動でアップロードしたい... 4 PC 自動保管機能を使用してみましょう 不特定多数の

Microsoft Word - HOBO雨量専用説明書_v1.1.doc

動作環境設定

タッチディスプレイランチャー

はじめに 動作環境の全ブラウザで 本書の設定を行ってください 本設定を行わない場合 システムが 正常に動作しない可能性がありますので 必ず設定をお願いいたします また 本書の中で 画 像に番号を付与している箇所以外の設定は お使いの環境のままでご使用ください 参考 : 動作環境の全ブラウザについては

受付代行 設定マニュアル このマニュアルでは 恵比寿ボイスプロダクションが Google アシスタントアプリで公開している 受付代行 ( ) を使って Google

ULTRA DRIVE とは インターネット上 ( クラウド ) に大切なデータを保存することができる便利なアプリケ ーション ( オンラインストレージ ) です 本資料について ULTRA DRIVE サービスは マイナーバージョンアップ等もあるため 実際のクライア ントと本資料に差分が発生する場

ログイン時の ID パスワードは マイページ と同一です インストール前の状態の場合 ログイン後に表示されるページの ライセンス一覧 に該当製品シリアルの表示はされません インストール完了後 ライセンス管理ページご利用シリアルの一覧が表示されます 以上でライセンス管理ページの作成は完了です なお セ

目次 1. はじめに...3 概要...3 利用環境 (HTML5)...3 利用環境 (Citrix Receiver) リモート PC への接続と終了...4 接続方法の変更...4 HTML5( 簡易バージョン ) での接続...5 リモート PC の操作メニュー...8 Cit

PowerPoint プレゼンテーション

利用ガイド

1. インストール方法 STEP 1 ダウンロードしたファイルを任意の場所に解凍します Windows 標準の機能を用いて解凍する場合は ファイルを選択して 右クリックメニューから [ すべて展開 ] を選択し 表示されたメッセージに従って解凍します STEP 2 解凍されたフォルダにある Setu

1. ボイステクノに問い合わせ スマホで議事録 Pro のご利用に際して 専用のお問合せページ(Ctrl キーを押しながらクリック ) ページを開き 必要事項を入力し 送信してください 手動で URL を入力する場合は を

グーグル検索マクロの使い方

一括請求Assist

1. ボイステクノに問い合わせ スマホで議事録 Pro のご利用に際して 専用のお問合せページ(Ctrl キーを押しながらクリック ) ページを開き 必要事項を入力し 送信してください 手動で URL を入力する場合は を

目次 はじめに... 2 動作環境... 2 ユーザーサポートについて... 2 セットアップ ( インストール ) 手順... 3 セットアップ手順 1 ソフトウェアのダウンロード... 4 セットアップ手順 2 Firebird データベースのインストール... 5 セットアップ手順 2 Fir

お役立ちフリーソフトの紹介その 3 5 EASEUS Partition Master を使用して C ドライブの容量を増やす メーカー製のノートパソコンには Windows7 のシステムが入っている C ドライブのみの場合と C ドライブとデータ用の D ドライブがある場合がある D ドライブを作

TRENDフォトビューアの起動方法と使い方

Copyright 2014 NTT DATA Corporation 2 INDEX 1. 一括請求 Assist とは 1-1. でんさいに係るサービスの関係性 1-2. 一括請求 Assist の必要性 1-3. 一括請求 Assist の特長 2. 機能紹介 2-1. 一括請求 Assist

整理番号変換ツール 操作説明書 平成 20 年 11 月 厚生労働省保険局調査課

はじめに 面的評価支援システム操作マニュアル ( 別冊 ) 国土地理院数値地図 25000( 空間データ基盤 ) 変換編 は 国土地理院の HP よりダウンロードした数値地図 25000( 空間データ基盤 ) の地図データを 面的評価支援システム 用に変換するツールの使用方法についてまとめたものです

PC にソフトをインストールすることによって OpenVPN でセキュア SAMBA へ接続することができます 注意 OpenVPN 接続は仮想 IP を使用します ローカル環境にて IP 設定が被らない事をご確認下さい 万が一仮想 IP とローカル環境 IP が被るとローカル環境内接続が行えなくな

<コンタクト>クイックマニュアル

目次 1. 謝辞 2. 特徴 3. 用意するもの 4. BCS MT2ePub で MT 形式ファイルを コンバートしてみよう 4.1 お試し版で コンバートする 4.2 ライセンス認証方法 4.3 ライセンス版で コンバートする 5. コンバートした epub 3 形式ファイルを 閲覧してみよう

1. インストール方法 STEP 1 ダウンロードしたファイルを任意の場所に解凍します Windows 標準の機能を用いて解凍する場合は ファイルを選択して 右クリックメニューから [ すべて展開 ] を選択し 表示されたメッセージに従って解凍します STEP 2 解凍されたフォルダにある Setu

迷惑メールフィルタリングサービス フィードバック機能マニュアル

SC-01Bソフトウェア更新手順書

外字インストーラユーザーズガイド Ver 1.20(2016 年 2 月改訂 )

オンライン・ワークショップ 参加マニュアル

工程’S 9 ヘルプ Excelバーチャート

目 次 1. All-In-One プリンタユーティリティ概要 All-In-One プリンタユーティティについて 対応プリンタ機種 システム要件 セットアップ方法 All-In-One プリンタユーティリテ

Zoiper User Guide

「Microsoft

Microsoft Word - NanoPhotometer用PCソフトウエア操作説明書 Rev 1.00.doc

nlp1-12.key

CompuSec SW 強制削除手順

【バーコード作成】マニュアル 第1版

迷惑メールフィルタリングサービス コントロールパネル利用者マニュアル

Road Hog / Road Hog Full Boar コンソール Flying Pig Systems 2012/06 起動可能な USB フラッシュドライブを使用したリストア USHIO LIGHTING Ver 1.0 この資料は コンソールのフル又はパーシャルリストアに使用できる USB

情報処理概論(第二日目)

Pirates Buster Series Secure Viewer セットアップマニュアル (Web インストーラ)

職人20 住所録移行マニュアル_outline.indd

TRENDフォトビューアの起動方法と使い方

RSS配信の設定方法 第2版(平成30年2月)

注意事項 (1)Windows 10 を使用する場合 注意事項 1 注意事項 3 注意事項 4 についてご対応をお願いします (2)Windows 8.1 を使用する場合 注意事項 2 注意事項 3 注意事項 4 についてご対応をお願いします (3)Windows 7 上で Internet Exp

1 はじめに 2016/7 に更新された Windows Update によりアドインファイルのブロックを解除しないと使用できなくなりました このため ファイルのプロパティにてブロックを解除してご使用ください リンク 設定方法はコチラをご覧ください 1.1 アドインの機能このツールは Microso

2. 研究者情報システムの登録画面 ログインすると 研究者プロフィール登録画面に移動します メニュー欄 3 2 入力エリア 2 入力エリアにて 登録されているデータを確認することができます データの新規登録 修正 更新を行う場合には のメニュー欄から該当の項目を選択して入力エリア上で編集してください

目次 1 はじめに 利用条件 動作環境 アドインのインストール アドインの操作方法 アドインの実行 Excel CSV の出力 テンプレートの作成 編集 テンプレートのレイアウト変更 特記

前準備 1. エクセルやエクスプローラで以下のような設定をしておくとこのサンプルがより便利にご使用いただけます Excel において バージョンにより操作は違いますが マクロ使用を許可 した上で実行してください 又 Excel で参照ファイルを開く場合便利になるように 下図の様に カレントフォルダを

管理機能編目次 目次 1 管理機能 1) 物件データ登録依頼 2 2) 物件情報検索 8 3) ユーザー情報照会 10 4)WEB 依頼検索 15 管理機能編 1

Inet-Builder Client 操作説明書

正誤表(FPT1501)

導入手順 1Forex Tester 2 のソフトをダウンロードしソフトをダウンロードし保存保存するする 下記 URL をクリックし Forex Tester の公式公式ページへアクセスし Download ボタンをクリックボタンをクリック ファイルをダウンロードしてください

1. インストール方法 STEP 1 ダウンロードしたファイルを任意の場所に解凍し Setup.exe をダブルクリックしてください 下記画面が表示されたときは [ 詳細情報 ] をクリックし 表示された画面で [ 実行 ] をクリックしてください STEP 2 Microsoft.Net Fram

2. 顔が える野菜 果物 ラベル印刷システム 操作マニュアル Ver.2.01 株式会社シフラ

CubePDF ユーザーズマニュアル

REX-USB56 「FAX送信」編 第6.0版

e 飛伝 Pro システム e 飛伝 Pro バージョンアップ手順書 第 11 版 平成 2 3 年 5 月 2 3 日

XAMPP で CMS のお手軽 テスト環境を手に入れよう 2011/5/21 上村崇 1

在宅せりシステム導入マニュアル

1.WebClass( ウェブクラス ) とは WebClass を利用される前に 学生の立場で WebClass を利用してみましょう... 4 開始方法... 4 資料を閲覧する 先生の立場で WebClass を利用してみましょう... 8 資料を

PowerPoint プレゼンテーション

共済会_Kねっと利用マニュアル(2018).indd

スライド 1

目次 専用アプリケーションをインストールする 1 アカウントを設定する 5 Windows クライアントから利用できる機能の紹介 7 1ファイル フォルダのアップロードとダウンロード 8 2ファイル更新履歴の管理 10 3 操作履歴の確認 12 4アクセスチケットの生成 ( フォルダ / ファイルの

PowerPoint プレゼンテーション

「Microsoft

HPシンクライアントイメージ入れ替え手順書

2019 年 6 月 20 日 2019 年 6 月現在対応クライアント環境について各バージョンごとの設定手順 2019 年 6 月現在の電子入札に参加するために必要なパソコンのソフトウェア推奨 環境です ご利用にあたっては以下をご参照ください 動作保証環境 (1)OS ブラウザのバージョン対応表

Microsoft PowerPoint ï½žéł»å�’å–¥æœ�ㇷㇹㅃㅀ㇤ㅳㇹㅋㅼㅫ曉逃.ppt [äº™æ‘łã…¢ã…¼ã…›]

注意事項 (1)Windows 10 を使用する場合 注意事項 1 注意事項 3 注意事項 4 についてご対応をお願いします (2)Windows 8.1 を使用する場合 注意事項 2 注意事項 3 注意事項 4 についてご対応をお願いします (3)Windows 7 上で Internet Exp

目次 1. システム概要 設置手順 注意事項 動作環境 初期設定 システム設定 ( 環境設定 ) システム設定 ( ログインパスワード変更 ) システム設定 ( ファイルのパスワード変

PowerPoint プレゼンテーション

迷惑メールフィルタリングサービス フィードバック機能マニュアル

注意事項 (1)Windows 10 を使用する場合 注意事項 1 注意事項 3 注意事項 4 についてご対応をお願いします (2)Windows 8.1 を使用する場合 注意事項 2 注意事項 3 注意事項 4 についてご対応をお願いします (3)Windows 7 上で Internet Exp

目次 1. はじめに 証明書ダウンロード方法 ブラウザの設定 アドオンの設定 証明書のダウンロード サインアップ サービスへのログイン

Microsoft Word - WindowsVista活用

Amazonポイントプログラム (設定編)

ライセンス認証ガイド Windows 10 Pro 本書は Download Station から Windows10 のライセンス情報をダウンロ ドし インストール済みの Windows 10 に適用する手順を記載しています 本手順は学内ネットワークに接続した状態で行う必要があります 認証プログラ

情報処理概論(第二日目)

スライド 1

Transcription:

実習 : レシピの言語処理の現状 京都大学 笹田鉄郎 前田浩邦 森信介 2013 年 8 月 18 日 1

公開に際しての注意 必要環境 Perl KyTea Eda Firefox (ver. 14.0.1 以前のバージョン ) 著作権の関係上 係り受け解析の実習で利用した学習コーパスを公開することはできません ご了承ください

目次 1. はじめに 2. 注意事項 3. アノテーション支援ツールPNAT 4. 自動単語分割 5. 固有表現認識 6. 係り受け解析 7. まとめ 3

1. はじめに よろしくおねがいします レシピの言語処理 情報の抽出と構造化 4

1. はじめに レシピの言語処理 情報の抽出と構造化 1. ねぎはみじん切りして レシピ002 1. ねぎはみじん切りして レシピ003 えびは背わたを取って 1. 豆腐は水気を切り レシピ001 えびは背わたを取って荒く刻む えびは背わたを取って荒く刻む 2. ボウルに豆腐とえびを入れる 荒く刻む 2. ボウルに豆腐とえびを入れる 2. ボウルに豆腐とえびを入れる 5

1. はじめに レシピの言語処理 情報の抽出と構造化 1. 豆腐は水気を切り レシピ001 えびは背わたを取って荒く刻む 2. ボウルに豆腐とえびを入れる 6

1. はじめに レシピの言語処理 情報の抽出と構造化 食べ物 道具 動作 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 7

1. はじめに レシピの言語処理 情報の抽出と構造化 自動単語分割 & 固有表現認識 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 8

1. はじめに レシピの言語処理 情報の抽出と構造化 切る 豆腐は切る 水気を取る えびは取る 背わたを 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 9

1. はじめに レシピの言語処理 情報の抽出と構造化 係り受け解析 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 10

1. はじめに レシピの言語処理 情報の抽出と構造化 フロー構築 (future work) 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 11

1. はじめに レシピの言語処理 情報の抽出と構造化 レシピ検索 調理補助 12

1. はじめに レシピの言語処理 情報の抽出と構造化 レシピ検索 調理補助 実際にやってみましょう 自動単語分割 固有表現抽出 係り受け解析 13

2. 注意事項 ご用意いただいた PC で実習します 用意した実習環境 (USBブートのLinux) を使用 Linux 環境があれば基本的に同じことができます 解説 -> 実習を 1 セット 3 回 自動単語分割 (practice/ws) 固有表現抽出 (practice/ne) 係り受け解析 (practice/da) 随時質問を受け付けます 14

3. アノテーション支援ツール PNAT http://plata.ar.media.kyoto-u.ac.jp/mori/research/topics/pnat/ 便利な機能色々 単語分割位置修正 GUI によるタグ 係り受け付与 不正 NE タグ判定 必要動作環境 Firefox(ver.14 以前, 全 OS) 最新版 ( 未公開 ) では Firefox, Google Chorome,Internet Explorer (Windows XP, Vista, 7) 15

4. 自動単語分割 日本語は分かち書きされない言語 様々な言語処理のためにまず単語分割 KyTea を使用してモデル学習 解析 点予測による単語分割 2 値分類 : 単語境界の有無を推定する 水 4-0-0 c-c 16

4. 自動単語分割 日本語は分かち書きされない言語 様々な言語処理のためにまず単語分割 KyTea を使用してモデル学習 解析 素性ファイルを使うことで BCCWJ と同様の言語資源から学習可能 ( 約 5 万文 ) 本実習ではノート PC 用の小規模セット ( 約 1 万文 ) 部分的アノテーションコーパスに対応 17

4. 自動単語分割 # 以下 [% 入力するコマンド ] # コピー & ペーストで入力すると確実です デスクトップ 端末 % cd ~/practice/ws # gedit, emacs, lv, less, more などでファイルの内容を参照できます 18

4. 自動単語分割 ## train-kytea によるモデル学習 # 基本はフルアノテーションコーパス # ( スペース区切り ) から学習 % cat train/sample.word % train-kytea -full train/sample.word -model sample.kwm # 作成したモデル (sample.kwm) を指定し テスト文 (test.sent) を kytea で解析 % kytea -model sample.kwm < test.sent 19

4. 自動単語分割 # 良いモデルを作る 学習コーパスを増やす # あらかじめ用意した素性頻度ファイルから学習 (BCCWJ 約 1 万文相当 ) % train-kytea -notags -feat train/base.feat -model base.kwm # 作成したモデル (base.kwm) を指定して解析 % kytea -model base.kwm < test.sent 20

4. 自動単語分割 # 解析結果を test01.word に保存 % kytea -model base.kwm < test.sent > work/test01.word # 単語分割精度を計算し 保存 確認 % perl WordAccu.pl work/test01.word test-gold.word >> accu.text % cat accu.text 21

4. 自動単語分割 精度 (Accuracy) について Precision( 適合率 精度 ) 正解単語数 / システム出力の単語数 ごみの少なさ ( 正確性 ) Recall ( 再現率 ) 正解単語数 / テストセットの単語数 もれの少なさ ( 網羅性 ) F-measure (F 値 ) 適合率と再現率の調和平均

4. 自動単語分割 # PNAT を使って結果を確認 # kytea の解析結果を tree 形式に変換 % perl word2tree.pl < work/test01.word > work/test01.tree 23

4. 自動単語分割 # デスクトップ ->PNAT (firefox が起動します ) # file:// のスクリプトが ~~ という警告文が出ます # 今後も同様に処理する をチェックし 許可 をクリック # cea/practice/ws/work/test01.tree を自動的に開きます ## 不許可 をクリックしてしまったり 開かなかった場合は必ずお知らせください # FILE OPEN から任意の tree ファイルを開けます # 自由に動かしてみましょう ## cea/practice/ws/work/test01.tree は以後使わないので 編集しても問題ありません 24

4. 自動単語分割 ( 分野適応 ) # 部分的アノテーションコーパスを追加して分野適応モデルを学習 % train-kytea -feat train/base.feat -part train/adapt.part -model adapt.kwm # 分野適応モデルで test.sent を解析 % kytea -model adapt.kwm < test.sent % kytea -model adapt.kwm < test.sent > work/test02.word 25

4. 自動単語分割 ( 分野適応 ) # 単語分割精度を測り 確認 % perl WordAccu.pl work/test02.word test-gold.word >> accu.text % cat accu.text # 約 8 時間の作業 (adapt.part の作成 ) による改善 26

5. 固有表現認識 構造化の前処理 各単語に対して BIO2 記法の NE タグを推定 本実習では 正しく単語分割されたテキストを入力とする KyTea を使用 点予測によるタグ推定 デスクトップ 端末 % cd ~/practice/ne 27

5. 固有表現認識 ## train-kytea によるタグ推定モデル学習 % cat train/base.iob2 % train-kytea -nows -full train/base.iob2 -global 1 - solver 6 -model base.knm # test.word (test.sent の正しい単語分割結果 ) に NE タグを確率的に付与 % kytea -out conf -nows -tagmax 0 -model base.knm < test.word > work/test01.conf % cat work/test01.conf 28

5. 固有表現認識 # 解釈可能な最適タグ列を探索 % perl NEsearch.pl work/test01.conf work/test01.iob2 % cat work/test01.iob2 # NE 推定精度を計算し 保存 確認 % perl NEAccu.pl work/test01.iob2 test-gold.iob2 >> accu.text % cat accu.text 29

5. 固有表現認識 ( 分野適応 ) # PNAT を用いたアノテーションの実習 # FILE OPEN -> cea/practice/ne/train/adapt.tree # 最後の 1 文を修正してください # F: 食材 T: 道具 D: 時間 Ac: 調理動作 # ex. オーブン : T-B # I タグ (inside) が先頭に来るなど 不正なフォーマットになると赤く表示されます # SAVE ボタンを押すと保存されます 30

5. 固有表現認識 ( 分野適応 ) # 編集した tree 形式のファイルを train-kytea 対応形式に変換 % perl tree2iob2.pl < train/adapt.tree > train/adapt.iob2 31

5. 固有表現認識 ( 分野適応 ) # アノテーションコーパスを追加して学習 % train-kytea -nows -full train/base.iob2 -full train/adapt.iob2 -global 1 -solver 6 -model adapt.knm # test.word に NE タグを確率的に付与 % kytea -model adapt.knm -out conf -nows -tagmax 0 < test.word > work/test02.conf 32

5. 固有表現認識 ( 分野適応 ) # 解釈可能な最適タグ列を探索 % perl NEsearch.pl work/test02.conf work/test02.iob2 # NE 推定精度を計算し 保存 確認 % perl NEAccu.pl work/test02.iob2 testgold.iob2 >> accu.text % cat accu.text 33

6. 係り受け解析 レシピテキストを構造化 修飾 被修飾の関係を各文に付与 被修飾語から修飾語へ矢印が行くように設定 Eda を使用 点予測による係り受け解析

6. 係り受け解析 点予測による係り受け解析 1. 係り先候補に対して独立にスコアを計算 σ(w w ) = exp{ feats(w w ) θ } / ( 正規化定数 ) 2. スコアの一番高い係り受けを選択 0.04 0.01 0.9 0.05 油揚げはオーブンで焼く

6. 係り受け解析 % cd ~/practice/da # 学習コーパスの確認 % cat train/base.tree # train-eda によるモデル学習 % train-eda -c train/base.tree -m base.edm

6. 係り受け解析 # 作成したモデルで test.tree を解析 % eda -m base.edm < test.tree > work/test01.tree # 解析精度を計算 結果を確認 % perl eval.pl test.gold work/test01.tree > accu01.text % cat accu01.text 37

分野適応 分野適応のコーパスが必要 一般分野のコーパスのみでは精度が低い レシピ特有の表現に対してアノテーションが必要 分野適応のコーパスは早く作りたい

部分的アノテーション フルアノテーション 部分的アノテーション 001 002 ジャガイモ名詞 0 002 005 は 助詞 0 003 004 皮 名詞 0 004 005 を 名詞 0 005 006 む 語尾 0 006 007 い 語尾 0 007 010 て 助詞 0 008 009 水 名詞 0 009 010 に 助詞 0 010 011 さら 動詞 0 011 012 し 語尾 0 001 002 ジャガイモ名詞 0 002 005 は 助詞 0 003-1 皮 名詞 0 004-1 を 名詞 0 005-1 む 語尾 0 006-1 い 語尾 0 007-1 て 助詞 0 008-1 水 名詞 0 009-1 に 助詞 0 010-1 さら 動詞 0 011-1 し 語尾 0 レシピ特有の係り受けのみをアノテーション 迅速な分野適応が可能

部分的アノテーション # PNAT を使って部分的アノテーションが可能 # 単語分割等と同様の作業なので省略します

6. 係り受け解析 ( 分野適応 ) # 分野適応のコーパスを確認 % cat train/adapt.tree # 部分的アノテーションコーパスを追加して学習 % train-eda -c train/base.tree -c train/adapt.tree -m adapt.edm

6. 係り受け解析 ( 分野適応 ) # 適応済みモデルで test.tree を解析 % eda -m adapt.edm < test.tree > work/test02.tree # 解析精度を計算 結果を確認 % perl eval.pl test.gold work/test02.tree > accu02.text % cat accu02.text 42

7. まとめ レシピの言語処理 情報の抽出と構造化 自動単語分割 & 固有表現認識 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 43

7. まとめ レシピの言語処理 情報の抽出と構造化 係り受け解析 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 44

7. まとめ レシピの言語処理 情報の抽出と構造化 フロー構築 (future work) 1. 豆腐は水気を切り レシピ 001 えびは背わたを取って 荒く刻む 2. ボウルに豆腐とえびを入れる 45