(NICT) ( ) ( ) (NEC) ( )

Similar documents
-2-


言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin

nlp1-12.key

(1)2004年度 日本地理

Microsoft Word J.^...O.|Word.i10...j.doc

CARC, AIST

/27 (13 8/24) (9/27) (9/27) / / / /16 12



301-A2.pdf

r


エジプト、アブ・シール南丘陵頂部・石造建造物のロータス柱の建造方法

‚æ27›ñ06-…|…X…^†[

Ł\”ƒ53_4C

1 2


『こみの株式会社』の実践

,276 3,

EX-word_Library_JA

324.pdf

- 1 -

%

ID010-2

2


<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69>

人芯経営論 ・・・リーダーシップ考②

平成13年度 地域工業活性化支援事業報告書(多摩全域)

はたらく若者ハンドブック


1 TOKEN CORPORATION

1. はじめに 2

02

RITE (Recognizing Inference in TExt) NTCIR- 9総括と NTCIR- 10へ向けて Yotaro Junta Watanabe1 Mizuno1 1Tohoku University Shuming Shi6 6MicrosoS Research Asia

nlp1-04a.key

untitled

untitled


untitled

TypeB 新スローガンイメージ (4:3)

untitled

26 NPO %

演習 レシピテキストの係り受け解析

07ŁÄàV

コーパスに基づく言語学教育研究報告 8

Taro10-岩手県警察航空隊の運営及


untitled

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが

06-...c.x...qx

26号経営技術レポート「相連報の実務」.PDF

共有辞書を用いた 効率の良い圧縮アルゴリズム

untitled

2015taisetumatome.rtf

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

DocuPrint C2424 取扱説明書(詳細編)

PowerPoint プレゼンテーション

- 1 -

Microsoft PowerPoint - gijutsuenshu04_061024_2.ppt

Functional Programming

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx)

.w..01 (1-14)

…_…C…L…fi…J…o†[fiü“ePDF/−mflF™ƒ

WINS クラブ ニュース

p1_5.pmd

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using

多言語版「チュウ太のweb辞書」を用いた語彙学習

橡kaikei_QA_2001_05_11.PDF

先行研究 pp

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft Word - DEIM論文3.doc

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手

untitled

ã


1206 Funamura2


122 丸山眞男文庫所蔵未発表資料.indd

untitled

DEIM Forum 2019 C3-5 tweet

23_33.indd

nlp1-05.key

part 2 in

040402.ユニットテスト

2 116

Web PDF [7, 8] 1 1 [9, 10] OCR [9] HITS [10] 2. 3 [11] IDF TF-IDF [12] PageRank,, PageRank TF-IDF k-means PageRank Web ios 1 imac mac

() 1875( 8) 10

【アフィリコード】総合マニュアル

【アフィリコードプラス】総合マニュアル


教室案内.pptx

untitled

untitled



122

Transcription:

(NICT) ( ) () (NEC) ( )

! Paraphrase (Paraphrasing) l l

! l h"p://paraphrasing.org/bib- cat.html l 12 50 l 640 (2014 6)! l l l l l l

! [ ] 2! [ ] ( )! :............ 1 2 1 = 2 =

! [ ]! [ ]! :............

! l / e.g., / l e.g., () e.g., ( ) l l! ( ) l [ ] l [ ] ( ) l :

?! : l Ja: [ +, 12] l En/Fr: + [Max+, 12]! : l 18[ +, 03] 828k à 630 l l! : l En: MicrosoJ Research Paraphrase Corpus (MSRP) [Dolan+, 04] Ja: NTCIR Recognizing Inference in TExt (RITE2) [Watanabe+, 13]

FY2014!! l : l : l :! l l...

: MSRP! [Dolan+, 04] l 8-20 l 1147, 578 l state- of- the- art F : 84.1 MT [Madnani+, 12]! l [Xu+, 14] cf. : F 79.9 state- of- the- art l l? : 0.715, 0.600

: RITE- 2! [Watanabe+, 13] l Wikipedia l 4 : B ( ), F (), C ( ), I ( ) l state- of- the- art F : 69.3 [Ha]ori+, 13]!? l :? [Kaneko+, 13] l?: e.g.,! l : (!) l : WordNetWeb

RITE- 2! / l... l t 1 r 1 : 0.771 Token overlap ratio against t2 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 B 以外 0.408/0.607 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Token overlap ratio against t1 B 0.726/0.712 B F C I

! ID=242, B, r 1 =1.00: B(17), F(3), I(1) l! ID=186, B, r 1 =1.00: B(15), F(4), C(1), I(1) l

! ID=199, B, r 1 =0.79: B(12), F(2), C(0), I(6), (1) l +! ID=330, B, r 1 =0.75: B(10), F(2), C(4), I(5) l + / 20

false negaave! ID=292, B, r 1 =0.62: B(4), F(10), C(1), I(6) l + / + +...! ID=86, B, r 1 =0.56: B(4), F(3), C(1), I(12)! ID=26, B, r 1 =0.42: B(2), F(7), C(0), I(12)

false posiave! ID=20, C, r 1 =1.00: F(1), B(12), C(3), I(4)! ID=65, I, r 1 =0.94: F(5), B(11), C(4), I(1) 4 3! ID=91, F, r 1 =0.91: F(4), B(14), C(0), I(3)

: RITE- 2 (contd.)! [Kaneko+, 13] l l : / l : / l! l l? (cf. WSC [Levesque, 11])! : 70

! 1 l 3 :! 2 [Sammons+, 10] l () cf.! 3 l l [ +, 15( WS)] l

3 (Goal)! l cf.... l () ()!? state- of- the- art! l à l à! l / l

2 ( =)! l ( ) ( ) l l ( ) l l l? [ +, 15( WS)]

(1)! [ +, 15( WS)] 15 10 9 + 9 1 or 2 6 5 4 4 3 2 2 2 29

(2)! WSD [ +, 15( WS)] 教師あり機械学習に基づく手法の問題訓練データの不足他に手がかりなし素性抽出が不適切助詞の取り扱い格の交替の取り扱い連体修飾の取り扱い有効な素性の不足トピック素性長いコロケーション間接的な係り受け既存の素性の組み合わせ文脈に出現する語の語義語釈文と文脈の関連性手法の問題 (27)[0.134] 意味クラスの抽象度システムのバグ (21)[0.104] (2)[0.010] (5)[0.025] (10)[0.050] (3)[0.015] (8)[0.040] (3)[0.015] (7)[0.035] (10)[0.050] (2)[0.010] (3)[0.015] (7)[0.035] (2)[0.010] (3)[0.015] 素性のコーディングが困難文の解釈文脈の解釈学習アルゴリズムの問題過学習辞書の用例に基づく手法の問題 (1)[0.005] (20)[0.100] (18)[0.009] (14)[0.070] 照応 省略解析 (3)[0.015] 消去法知識の問題過学習辞書の文法的制約に基づく手法の問題文間類似度の不備類似度が低すぎる類似度が高すぎる表層的には似ていないシステムのバグタイブレークが不適切辞書の用例に基づく手法の問題文法的制約が緩い規則の不備分類器の組み合わせ手法の問題シソーラスの不備前処理の問題形態素解析の誤りデータの不備正解語義の誤り訓練データテストデータ問題設定の不備対象語が不適切文節の係り受け解析の誤り文脈不足人間でも判定が困難熟語 連語として扱う方が適切その他 (14)[0.070] (7)[0.035] (20)[0.100] (6)[0.030] (1)[0.005] (1)[0.005] (7)[0.035] (1)[0.005] (3)[0.015] (1)[0.005] (15)[0.075] (32)[0.159] (1)[0.005] (16)[0.080] (5)[0.025] (1)[0.005] (14)[0.070]

(3)! [ +, 03] 138 75 19 39 20 60 221 58 630 137 57 9 35 17 53 172 36 516 (a) 125 41 3 31 7 43 47 6 303 (b) 42 14 2 3 5 8 4 78 (c) 6 2 8 (d) 7 4 11 (e) 66 8 28 57 3 162 (f) 0 (g) (e) 3 28 5 36 (h) 30 1 31 (i) 1 5 3 13 22 (j) 2 1 3 6 (k) 1 1 (l) 23 2 7 2 34 (m) 10 1 10 1 22 (n) 2 4 2 8 38 16 2 7 8 3 19 22 115 (A) 9 1 26 4 40 (B) 18 20 38 (C) 7 5 5 1 22 1 41 (D) 8 1 1 1 1 1 2 15

2 ( =)! l [Sammons+, 10] / OntoNotes[Hovy+, 06] l? l

1( )! 3 l : l 8-20 [Dolan+, 04] [Dagan+, 05] l : ( ) l e.g., [Zaenen+, 05] l / [Fujita+, 05] Ref. WSC [Levesque, 11] l : :

! l l l l! l (1) l ( ) l ( )!!? l

()

?! RITE2[Kaneko+, 13] l l ( ) l! l 61 241 163 l l Ref.8 40 l h"p://paraphrasing.org/paraphrase.html

! ID=90-4, Type=synonymy:phrase トンネルズ& トロールズ第 5 版 はケン セント アンドレらによってデザインされた 助詞の交替 トンネルズ& トロールズ第 5 版 がケン セント アンドレらによってデザインされた 態の交替ケン セント アンドレらが トンネルズ & トロールズ第 5 版 をデザインした 分裂文 トンネルズ & トロールズ第 5 版 をデザインしたのはケン セント アンドレらである 節と名詞句の交替 ケン セント アンドレらは トンネルズ & トロールズ第 5 版 のデザイナーである 節と名詞句の交替 分裂文 スコープの変更 トンネルズ & トロールズ第 5 版 のデザイナーはケン セント アンドレらである ケン セント アンドレは トンネルズ & トロールズ第 5 版 のデザイナーの一人である スコープの変更 分裂文 トンネルズ & トロールズ第 5 版 のデザイナーの一人はケン セント アンドレである

! 163à 306 l : 108 l : 58 l : 45 (e.g., ) : 60à 203 l l : 156 : 47 l 42 +

. / 1 7 8 / 0 2 2 / 0 6 6 / 1 2 3 / 1 2 3 / 1 1 2 0 1 1 0 2 2 2 31 33 0 4 4 0 2 2 0 3 3 1 1 2 1 0 1 1 0 1 / 0 5 5 2 1 3 0 2 2 4 9 13 0 1 1 9 10 19 0 1 1 9 10 19 5 6 11 2 0 2 1 4 5 / 0 1 1 0 3 3 0 1 1 1 1 2 0 2 2 / 0 3 3 / 1 0 1 2 1 3 0 2 2 / 0 4 4 3 5 8 / 1 3 4 / 15 9 24 2 3 5 0 1 1 0 2 2 0 1 1 0 4 4 1 8 9 58 156 214

/! ID=bc580-0- 6:! ID=bc- 160-2- 1

! ( ) l : 100 l BCCWJ à 150 /5 ( ) l l trivial minimal pair l

! l? WSD in MT [+, 15( WS)] l l? cf. : etc. l?... e.g., RITE- 2 w/ 250à e.g., SMT OOVà X%

FY2014! l! l l : l ü ü