概要 CKY Parser(Section 9.1.2) の改良 事前にもつ知識の活用 実際のアプリケーションへの応用

Similar documents
数理言語

untitled

数理言語

nlp1-04a.key

nlp1-05.key

Microsoft PowerPoint - 08LR-conflicts.ppt [互換モード]

福岡大学人文論叢47-3


Microsoft PowerPoint PCFG.ppt

B's Recorderマニュアル_B's Recorderマニュアル

B's Recorderマニュアル

Handsout3.ppt

P.3 P.4 P.9 P.11

Microsoft PowerPoint SemanticAnalysis.ppt

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint - fol.ppt

記号と準備

Taro13-第6章(まとめ).PDF


: : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :

Microsoft PowerPoint - logic ppt [互換モード]

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

Microsoft PowerPoint - 06graph3.ppt [互換モード]

Microsoft PowerPoint - 3.ppt [互換モード]

xyr x y r x y r u u

untitled

untitled


Functional Programming

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株

オートマトンと言語

Microsoft PowerPoint - FOL2007.ppt

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

-2-

P.5 P.6 P.3 P.4 P.7 P.8 P.9 P.11 P.19

知識工学 II ( 第 2 回 ) 二宮崇 ( ) 論理的エージェント (7 章 ) 論理による推論 命題論理 述語論理 ブール関数 ( 論理回路 )+ 推論 ブール関数 +( 述語 限量子 ( ) 変数 関数 定数 等号 )+ 推論 7.1 知識

21 Pitman-Yor Pitman- Yor [7] n -gram W w n-gram G Pitman-Yor P Y (d, θ, G 0 ) (1) G P Y (d, θ, G 0 ) (1) Pitman-Yor d, θ, G 0 d 0 d 1 θ Pitman-Yor G

homes01_P _chousa_sai.indd

文法と言語 ー文脈自由文法とLR構文解析2ー

Learning Bayesian Network from data 本論文はデータから大規模なベイジアン ネットワークを構築する TPDA(Three Phase Dependency Analysis) のアルゴリズムを記述 2002 年の発表だが 現在も大規模用 BN モデルのベンチマークと

Microsoft PowerPoint - kyoto


A Constructive Approach to Gene Expression Dynamics

スライド 1

EPSON エプソンプリンタ共通 取扱説明書 ネットワーク編

untitled

ありがとうございました

EPSON エプソンプリンタ共通 取扱説明書 ネットワーク編

公務員人件費のシミュレーション分析


橡hashik-f.PDF

198

ネットショップ・オーナー2 ユーザーマニュアル


1

新婚世帯家賃あらまし

05[ ]戸田(責)村.indd

/9/ ) 1) 1 2 2) 4) ) ) 2x + y 42x + y + 1) 4) : 6 = x 5) : x 2) x ) x 2 8x + 10 = 0

NLP プログラミング勉強会 6 かな漢字変換 自然言語処理プログラミング勉強会 6 - かな漢字変換 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1


スライド 1

Microsoft PowerPoint - design-theory-6.pptx

untitled

PSCHG000.PS

IPSJ SIG Technical Report PIN(Personal Identification Number) An Examination of Icon-based User Authentication Method for Mobile Terminals Fum

B

Microsoft Word - 田中亮太郎.doc

_Print

122011pp

2

A p A p. 224, p B pp p. 3.

p

スラヴ_00A巻頭部分

Microsoft Word - 映画『東京裁判』を観て.doc

9

() L () 20 1

308 ( ) p.121

広報かみす 平成28年6月15日号

.

戦後の補欠選挙

日経テレコン料金表(2016年4月)

73 p p.152


カイ二乗フィット検定、パラメータの誤差

48 * *2

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1

PSCHG000.PS


NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

言語モデルの基礎 2


バイオプログラミング第 1 榊原康文 佐藤健吾 慶應義塾大学理工学部生命情報学科

レコードとオブジェクト

PowerPoint プレゼンテーション

15288解説_D.pptx

Microsoft PowerPoint - 13基礎演習C_ITプランナー_2StableMatching.pptx

Mimehand II[1] [2] 1 Suzuki [3] [3] [4] (1) (2) 1 [5] (3) 50 (4) 指文字, 3% (25 個 ) 漢字手話 + 指文字, 10% (80 個 ) 漢字手話, 43% (357 個 ) 地名 漢字手話 + 指文字, 21

, = = 7 6 = 42, =

PowerPoint プレゼンテーション

Transcription:

The Syntactic Process 9.2 Toward Psychologically Realistic Parsers 9.3 CCG Parsing for Practical Applications ( 自然言語処理システム論 :7/11) コンピュータ科学専攻米澤研究室 M1 佐藤秀明

概要 CKY Parser(Section 9.1.2) の改良 事前にもつ知識の活用 実際のアプリケーションへの応用

Plausibility の導入 各 constituent のもっともらしさを計算 もっともらしさ = 現実にあり得る可能性 あらかじめ用意した文脈との整合性を評価 様相命題の notation を流用

( 改良 )CKY アルゴリズム for j := 1 to n do begin end t (j -1, j ) := {A A is a lexical category for a j } for i := j -2 down to 0 do begin end t (i, j ) := {A there exists k, i<k<j, such that BC A for some B t (i, k ), C t (k, j ), and not present(a, i, j )} t (i, j ) := rank (t (i, j ))

rank 関数 Constituents を plausibility の高い順に整列 先頭の constituent のみに plausibility '1' を付与 その他はすべて plausibility '0' 別の戦略も可能だが 簡単のために採用しない

文脈 知識ベースを様相命題の集合で表す のついている event は : 起こり得る かつ Accommodate( instanciate) できる

文脈の例 (15) person' x person' z send ' xyz person' x person' y summon' xy arrive ' x doctor ' x person' x patient ' x person' x flowers ' x person' x 変数は暗黙に全称化 ( ) されている

Parsing の例 (1) 文 : The flowers sent for the patient arrived the と flowers を shift して reduce すると : (17) a. b. S / S NP : p. x. flowers ' x px S / S NP / N N : q. p. x. flowers ' x qx px

Parsing の例 (2) ι は definite existential quantifier ι で指定した部分が文脈に 1 つだけ存在することを要求 a. では flowers'x b. では flowers'x qx 文脈にはどちらも存在しない plausibility をどう評価するか?

Parsing の例 (3) 解決策 : 条件の緩いほうに高い plausibility を付与 a. : flowers'x plausibility '1' b. : flowers'x qx plausibility '0' a. のみについて accommodation( instantiation) を実施 (18) flowers' gensym' 1 gensym' 1 は任意の定数 (18) を文脈に追加

Parsing の例 (4) 次に読む sent は 3 種類のカテゴリをもつ (19) a. b. c. S NP / PP / NP : x. y. z. send ' yxz S NP / PP : x. y. summon' xy N N / PP : x. p. y. py send ' yxsomeone '

Parsing の例 (5) (19a,b) は (17a) とマッチする : (20) a. b. (20a,b) は各々以下の命題を文脈に要請 (22) S / PP / NP : y. z. x. flowers ' x send ' zyx S / PP : y. x. flowers ' x summon' yx a. b. flowers ' x send ' zyx flowers ' x summon' yx どちらも否定されている 低い plausibility を付与

Parsing の例 (6) (19c) は (17b) とマッチする : (21) (21) は以下の命題を文脈に要請 (23) 消去法で (21) に高い plausibility を付与 (21) について accommodation を行う (24) S / S NP / PP : y. p. x. flowers ' x send ' yxsomeone ' px flowers ' y send ' zyx send ' z gensym' 1 someone ' (24) を文脈に追加 Gensym' 1 は (18) で既出の定数

Parsing の例 (7) 次に for を shift して reduce reduce できるのは (20b) と (21) のみ (25) a. b. S / NP : y. x. flowers ' x summon' yx S / S NP / NP : y. p. x. flowers ' x send ' yxsomeone ' px 文脈による Plausibility の評価 flower は summon の主語になれない a:'0' flower は send の目的語になれる b:'1'

Parsing の例 (8) the patient の最も plausible なカテゴリは (26) (26) NP : p. x. patient ' x px 条件の制約が最も緩い 最も rank が高い (26) を accommodate (27) patient ' gensym' 2

Parsing の例 (9) (26) は (25a,b) のどちらともマッチする (28) a. b. S : y. patient ' y x. flowers ' x summon' yx S / S NP : p. y. patient ' y x. flowers ' x send ' yxsomeone ' px (28a) は再び implausible (28b) は plausible Flowers を patient に send できる Flowers と patient の実体がそれぞれ存在 send ' gensym' 2 gensym' 1 someone ' が導ける

Parsing の例 (10) 最後に arrive を読んで終了 (28b) にマッチ arrive の主語は何でもとれる

( 改良 )CKY Parser の特徴 Plausibility に関わらず legal な constituent はすべて生成 曖昧な語の正しい解釈がそれを読んだ時点で判明 例 :flower は send しない

他の Parsing 例 (1) The doctor sent for the patient arrived の場合 Modifier analysis より tensed-verb analysis が好ましい (?) (30) a. b. Doctor sent for the patient は plausible Simple NP の前提条件が少ない S : y. doctor ' y x. patient ' x summon' xy S / S NP : p. y. doctor ' y x. patient ' x send ' xysomeone ' px

他の Parsing 例 (2) すでに 1 人の医者が文脈に存在する場合 (31) doctor ' dexter ' Null 文脈上での分析とほとんど同じ Plausibility は低い (?) 2 人の医者が文脈に存在する場合 (32) doctor ' dexter ', (30a) は失敗 doctor ' warren' (30b) は高い plausibility を得る (?)

さらなる改良 もっとやりたいこと どの文と文脈が garden path を起こすのか constituent の構築に関する優先順位を考慮したい より積極的なアルゴリズムが効果的 Beam-searching CCG Parser Best-first chart-parser plausibility のとりうる値を 0 と 1 の間の小数に plausibility が閾値に達しない constituents を枝刈り

実用的なアプリケーション CKY は最悪 n 3 かかる Vijay-Shanker and Weir のものは n 6 複雑な構造共有がネック 実世界の文に対する平均計算量は許容範囲 [Komagata, 1997a, 1999] 意味論的明瞭化や統計的最適化すら不要

CKY のバリエーション 様々な Parsing アルゴリズムに CCG を組み込める 各々の文法理論に対し中立 各々の文法が許す限り incremental なアルゴリズム 共通課題 :Plausibility の評価基準となる知識の構築が困難 枝刈りできずに無駄な constituents が増加

Part-of-Speech-Tagging methods POS methods: 最初の単語の時点で枝刈り 単語のもつカテゴリをよくあるものから n 番目までに制限 Syntax とは独立に実施可能 POS と CCG を組み合わせる POS のカテゴリ種を CCG で拡張

Probabilistic Dependency Grammars (?) CFG の拡張 Rule に対して確率を算出 最尤法や backing-off method(?) を使う 現在最も正確な Parser Wall Street Journal に対し精度 再現率ともに 88% 非常に一般化された手法 Competence grammar Parsing アルゴリズム 確率の理論的整理と統合 CCG は dependency を無制限な破片構造へ導入したところが面白い

展望 Syntax から直接 plausibility を計算できるか? 統計の蓄積は用いない より能動的な解釈 ( 推論など ) が必要 Structural ambiguity Attachment ambiguity