nlp1-04a.key

Similar documents
数理言語

文法と言語 ー文脈自由文法とLR構文解析2ー

Microsoft PowerPoint - 08LR-conflicts.ppt [互換モード]

Microsoft PowerPoint - アルデIII 02回目10月15日

Microsoft PowerPoint - 3.ppt [互換モード]

Microsoft PowerPoint - アルデIII 02回目10月14日

nlp1-05.key

日本内科学会雑誌第98巻第4号

日本内科学会雑誌第97巻第7号

Microsoft PowerPoint - ad11-09.pptx

情報工学実験 C コンパイラ第 2 回説明資料 (2017 年度 ) 担当 : 笹倉 佐藤

オートマトン 形式言語及び演習 3. 正規表現 酒井正彦 正規表現とは 正規表現 ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械正規表現 : 言語

オートマトンと言語

Microsoft PowerPoint - 03BNFScanner.ppt [互換モード]

Microsoft Word - Javacc.docx

オートマトンと言語

PowerPoint プレゼンテーション

Ł\”ƒ-2005

第90回日本感染症学会学術講演会抄録(I)

PowerPoint Presentation

C8

日本内科学会雑誌第102巻第4号

第86回日本感染症学会総会学術集会後抄録(I)

Microsoft PowerPoint - 09-search.ppt [互換モード]

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6

放射線専門医認定試験(2009・20回)/HOHS‐05(基礎二次)

プログラム


オートマトンと言語

Microsoft PowerPoint - 05.pptx

Microsoft PowerPoint - 11Syntax.ppt

線形代数とは

Microsoft PowerPoint - Compiler06.pptx

プログラム

Microsoft PowerPoint ppt

Microsoft PowerPoint - Compiler06note.pptx

2016.

第121回関東連合産科婦人科学会総会・学術集会 プログラム・抄録

Microsoft PowerPoint - 06.pptx

nlp1-12.key

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

Java Scriptプログラミング入門 3.6~ 茨城大学工学部情報工学科 08T4018Y 小幡智裕

情報処理Ⅰ

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint ppt

Microsoft PowerPoint - 03BNFScanner-print.ppt

Microsoft PowerPoint - Compiler05note.pptx

A Constructive Approach to Gene Expression Dynamics

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

Microsoft PowerPoint - 2.ppt [互換モード]

Microsoft PowerPoint - enshu4.ppt [äº™æ‘łã…¢ã…¼ã…›]

抄録/抄録1    (1)V

memo

Microsoft PowerPoint - 02LanguageTheory.ppt [互換モード]

An Automated Proof of Equivalence on Quantum Cryptographic Protocols

数理言語

パソコンシミュレータの現状

Microsoft PowerPoint - 7.pptx

Microsoft PowerPoint - アルデIII 10回目12月09日

文字数は1~6なので 同じ本数の枝を持つパスで生成される呪文の長さは最大で6 倍の差がある 例えば 上図のようなケースを考える 1サイクル終了した時点では スター節点のところに最強呪文として aaaaaac が求まる しかしながら サイクルを繰り返していくと やがてスター節点のところに aaaaaa

Microsoft PowerPoint - mp13-07.pptx

Microsoft Word - problem3.doc

memo

研修コーナー

生命情報学

tnbp59-21_Web:P2/ky132379509610002944

知識工学 II ( 第 2 回 ) 二宮崇 ( ) 論理的エージェント (7 章 ) 論理による推論 命題論理 述語論理 ブール関数 ( 論理回路 )+ 推論 ブール関数 +( 述語 限量子 ( ) 変数 関数 定数 等号 )+ 推論 7.1 知識

Microsoft PowerPoint - 10.pptx

かんたん携帯9 ユーザーガイド

AQUOS ケータイ ユーザーガイド

パーキンソン病治療ガイドライン2002

PowerPoint プレゼンテーション


Microsoft PowerPoint - Compiler05.pptx

人工知能入門

PowerPoint Template

_0212_68<5A66><4EBA><79D1>_<6821><4E86><FF08><30C8><30F3><30DC><306A><3057><FF09>.pdf

PowerPoint プレゼンテーション

Taro-再帰関数Ⅲ(公開版).jtd

コンピュータ工学講義プリント (7 月 17 日 ) 今回の講義では フローチャートについて学ぶ フローチャートとはフローチャートは コンピュータプログラムの処理の流れを視覚的に表し 処理の全体像を把握しやすくするために書く図である 日本語では流れ図という 図 1 は ユーザーに 0 以上の整数 n

関東/関西/九州同時開催 女性エンジニア大集合!新春LT 座談会 スクリプト インタプリタを 作ってみた 1 スクリプトインタプリタを作ってみた

18/12/06 情報工学実験 C コンパイラ (2018 年度 ) 担当 : 笹倉 佐藤 その 3 yacc の構造 定義部 %% 定義部の終了 規則部 %% 規則部の終了 ユーザ定義サブルーチン部 :C のプログラムを書く 形は lex と同じ 1

プログラミング実習I

目次 1. 図郭のCSVから矩形シェープファイル保存... i 1.1. 変換元のCSVファイル... i 1.2. ダイアログ... i 1.3. 作成するシェープファイル... ii 2. 図郭 TIN DEM 保存 ダイアログ TINについて... 3

オートマトンと言語

03実習2・松井.pptx

グラフの探索 JAVA での実装

OCW-iダランベールの原理

09.pptx

koji07-01.dvi

について 本機のの基礎知識 画面について メールや電話帳など 文字が入力できる状 態になると 右のような画面が表 示されます. この章は ことわりがない限り 画面 での操作を説明しています の基本操作 にはダイヤルキーを利用します つのキーには キー に印字されている複数の文字が割り当てられており

数理言語

Microsoft PowerPoint - 5.ppt [互換モード]

文字列操作と正規表現

snkp-14-2/ky347084220200019175

Microsoft Word - 補論3.2


Microsoft PowerPoint - suta.ppt [互換モード]

Transcription:

自然言語処理論 I. 文法 ( 構文解析 ) その 構文解析 sytctic lysis, prsig 文の構文的な構造を決定すること句構造文法が使われることが多い文法による構文木は一般に複数ある 構文木の違い = 解釈の違い 構文解析の目的 句構造文法の規則を使って, 文を生成できる構文木を全て見つけだすこと 文法が入力文を生成できるかどうかを調べるだけではない pro I 構文解析とは 構文木の違い = 解釈の違い drwer pro I drwer (hmmer) 前終端記号と辞書規則 前終端記号 (pre-termil symbol) 単語を生成する前のシンボル 品詞に相当する 種類の文法規則 句構造規則非終端記号と前終端記号からなる規則辞書規則前終端記号 単語という規則

( 句構造規則 ) ( 辞書規則 ) pro I pro,drwer 構文解析の入力 単語列を入力とする 膨大な数の辞書規則が必要 品詞列を入力とする 単語と品詞の対応付けは形態素解析で行う前終端記号を終端記号として扱う 句構造規則 句構造規則のみ使う 実際には品詞列を入力とする場合が多い pro I drwer 辞書規則 構文解析アルゴリズム 大きく分けて 種類ある トップダウンアルゴリズム 開始記号 () から品詞列へ ボトムアップアルゴリズム 品詞列から開始記号 () へ 代表的な構文解析アルゴリズム CKY 法, チャート法, アーリー法再帰遷移ネットワーク, 一般化 LR 法 CKY 法 Cocke-Ksmi-Youger 法文法はチョムスキー標準形に限る CKY 表 構文解析の途中経過を保持するためのテーブル

CKY 表 m 行列の対角成分に入力文の 単語を置く ijは, 入力文のi 番目からj 番目の 単語を支配する非終端記号を置く 9 drwer CKY 法のアルゴリズム for i:= to do ii = {A A wi} ( 辞書規則の適用 ) for d:= to - do for i:= to - d do j=i+d for k=i to j - do ijに {A(Bb,Cc) A B C, Bb ik,cc k+,j} を追加 に開始記号 があれば解析成功, それ以外は失敗 ( は入力単語数,b,c は識別番号 ) 0 CKY 法のアルゴリズム 表を埋める順序は以下の通り 変数 d が つの対角線を表す 辞書規則 d= d= d= d= d= d= d= m drwer CKY 法のアルゴリズム マス目 ijを埋める時 以下の順序でつの要素の組み合わせをチェック 数字は変数 k に対応 の場合 (,),(,),(,),(,) が規則の右辺になるかどうかをチェック m ij drwer

CKY 法 ( 解析例 / 構文木の復元 ) 解析例 文法 入力文 m drwer m drwer 解析過程 黒板 別紙資料 ( 後日配布 ) 構文木の復元 完成した CKY 表の履歴をたどる m m (,) drwer (,) (,) (,) drwer (,) (,) (,) (,) (,) (,) (,) m m (,) drwer (,) (,) (,) drwer (,) (,) (,) (,) (,) (,) (,) CKY 法の特徴 計算量 O( ) は入力文の長さ ( 単語数 ) ボトムアップアルゴリズムアルゴリズムが単純で理解しやすいチョムスキー標準形の文法でしか解析できない

チャート法 (chrt prsig) 通りの方式 トップダウンチャート法ボトムアップチャート法 構文解析の途中経過をチャートに保存 チャート法 用語節点 (ode) 単語と単語の間に存在する仮想的な点 弧 (rc) 節点間を結び 文の部分的な構造を表す [i, j, A α. β] i は弧の始点 j は弧の終点 ドットは解析が終了している位置を表す cup 0 [0,,. ] [,,. ] 用語不活性弧 (ictie rc) ドットが右辺の最後にある弧 活性弧 (ctie rc) 不活性弧以外の弧 チャート (chrt) ノード 弧の集合 アジェンダ (ged) 記号 チャートに追加するべき弧のリスト ( スタック ) : 入力単語の長さ X,Y,Z: 非終端記号 : 開始記号 トップダウンチャート法 アルゴリズム 辞書規則の適用 入力文の各単語 wkについて 不活性弧 [k,k+,a wk.] をアジェンダに追加 活性弧 [0,0,.α] をアジェンダの先頭に追加 は開始記号 α,β,γ: 終端記号または非終端記号の列 ( 空列を含む ) 9 0

アジェンダが空になるまで以下の操作を繰り返す. ( 弧の選択 ) アジェンダから弧を 個選びチャートに追加 ( 以下 rc). ( 弧の結合 ) rc が活性弧 [i, j, X α.yβ] のとき rc の右にある不活性弧 [j, k, Y γ] を探し 結合する rc が不活性弧 [i, j, Y γ.] のとき rc の左にある活性弧 [k, i, X α.yβ] を探し 結合する 結合してできた新しい弧 [i, k, X αy().β] をアジェンダに追加 ( は不活性弧のID( 履歴 ) ). ( 新しい弧の提案 ) rc が活性弧 [i, j, X α.yβ] のとき Y を左辺とする規則 Y γ ( 辞書規則を除く ) があれば 新しい活性弧 [j, j, Y. γ] を作ってアジェンダに追加 弧の結合 活性弧 + 不活性弧で新しい弧を作る [i, j, X α. Y β] + [j, k, Y γ.] [i, k, X αy.β] 同じ弧が既にチャートまたはアジェンダにあるときは追加しない トップダウンチャート法 チャートへの弧の追加 :X[α] と弧を省略表記するとよい : 弧番号, X: 規則の左辺, α:. の右にある記号列 次にどんな弧を結合すればいいか わかりやすい [0,, α.] という不活性弧ができていれば解析成功 それ以外は失敗 トップダウンチャート法 解析例 文法 cup cup 解析文 cup 解析過程 黒板 別紙資料 ( 後日配布 )

構文木の復元 弧に履歴を残す 弧に識別番号をつける 右辺がどの不活性弧によって構成されるかを記録 不活性弧 [0,, α.] の履歴をたどれば構文木が復元できる () 得られる構文木の例 () () 番号は不活性弧の番号 cup () () () チャート法の特徴 計算量はO( ) 任意の文脈自由文法が扱える 種類の方式 トップダウンとボトムアップ縦型探索と横型探索 文法の予測能力が使える 無駄な弧を生成しないので効率が良いトップダウンチャート法のみ 広く使われている 縦型探索と横型探索 縦型探索 つの解の候補の解析を優先的に進める 文が文法によって生成できるかだけを調べるときに便利 横型探索 全ての解の候補の解析を並列に進める ビームサーチに向いている チャート法では両方とも可能 アジェンダをスタックにしたときは縦型探索アジェンダをキューにしたときは横型探索 文法の予測能力 弧, b 無駄な弧 (cup の品詞が であるという解釈は誤り ) トップダウンチャート法では生成されない文法によって :[,,. ] :[] b:[,,. ] の後には が現われないことが予想されている :[] :[] :[] cup 0 :[,] :[,]