(NICT) ( ) ( ) (NEC) ( )

Size: px
Start display at page:

Download "(NICT) ( ) ( ) (NEC) ( )"

Transcription

1 (NICT) ( ) () (NEC) ( )

2 ! Paraphrase (Paraphrasing) l l

3 ! l h"p://paraphrasing.org/bib- cat.html l l 640 (2014 6)! l l l l l l

4 ! [ ] 2! [ ] ( )! : = 2 =

5 ! [ ]! [ ]! :

6 ! l / e.g., / l e.g., () e.g., ( ) l l! ( ) l [ ] l [ ] ( ) l :

7 ?! : l Ja: [ +, 12] l En/Fr: + [Max+, 12]! : l 18[ +, 03] 828k à 630 l l! : l En: MicrosoJ Research Paraphrase Corpus (MSRP) [Dolan+, 04] Ja: NTCIR Recognizing Inference in TExt (RITE2) [Watanabe+, 13]

8 FY2014!! l : l : l :! l l...

9

10 : MSRP! [Dolan+, 04] l 8-20 l 1147, 578 l state- of- the- art F : 84.1 MT [Madnani+, 12]! l [Xu+, 14] cf. : F 79.9 state- of- the- art l l? : 0.715, 0.600

11 : RITE- 2! [Watanabe+, 13] l Wikipedia l 4 : B ( ), F (), C ( ), I ( ) l state- of- the- art F : 69.3 [Ha]ori+, 13]!? l :? [Kaneko+, 13] l?: e.g.,! l : (!) l : WordNetWeb

12 RITE- 2! / l... l t 1 r 1 : Token overlap ratio against t B 以外 0.408/ Token overlap ratio against t1 B 0.726/0.712 B F C I

13 ! ID=242, B, r 1 =1.00: B(17), F(3), I(1) l! ID=186, B, r 1 =1.00: B(15), F(4), C(1), I(1) l

14 ! ID=199, B, r 1 =0.79: B(12), F(2), C(0), I(6), (1) l +! ID=330, B, r 1 =0.75: B(10), F(2), C(4), I(5) l + / 20

15 false negaave! ID=292, B, r 1 =0.62: B(4), F(10), C(1), I(6) l + / ! ID=86, B, r 1 =0.56: B(4), F(3), C(1), I(12)! ID=26, B, r 1 =0.42: B(2), F(7), C(0), I(12)

16 false posiave! ID=20, C, r 1 =1.00: F(1), B(12), C(3), I(4)! ID=65, I, r 1 =0.94: F(5), B(11), C(4), I(1) 4 3! ID=91, F, r 1 =0.91: F(4), B(14), C(0), I(3)

17 : RITE- 2 (contd.)! [Kaneko+, 13] l l : / l : / l! l l? (cf. WSC [Levesque, 11])! : 70

18

19 ! 1 l 3 :! 2 [Sammons+, 10] l () cf.! 3 l l [ +, 15( WS)] l

20 3 (Goal)! l cf.... l () ()!? state- of- the- art! l à l à! l / l

21 2 ( =)! l ( ) ( ) l l ( ) l l l? [ +, 15( WS)]

22 (1)! [ +, 15( WS)] or

23 (2)! WSD [ +, 15( WS)] 教師あり機械学習に基づく手法の問題訓練データの不足他に手がかりなし素性抽出が不適切助詞の取り扱い格の交替の取り扱い連体修飾の取り扱い有効な素性の不足トピック素性長いコロケーション間接的な係り受け既存の素性の組み合わせ文脈に出現する語の語義語釈文と文脈の関連性手法の問題 (27)[0.134] 意味クラスの抽象度システムのバグ (21)[0.104] (2)[0.010] (5)[0.025] (10)[0.050] (3)[0.015] (8)[0.040] (3)[0.015] (7)[0.035] (10)[0.050] (2)[0.010] (3)[0.015] (7)[0.035] (2)[0.010] (3)[0.015] 素性のコーディングが困難文の解釈文脈の解釈学習アルゴリズムの問題過学習辞書の用例に基づく手法の問題 (1)[0.005] (20)[0.100] (18)[0.009] (14)[0.070] 照応 省略解析 (3)[0.015] 消去法知識の問題過学習辞書の文法的制約に基づく手法の問題文間類似度の不備類似度が低すぎる類似度が高すぎる表層的には似ていないシステムのバグタイブレークが不適切辞書の用例に基づく手法の問題文法的制約が緩い規則の不備分類器の組み合わせ手法の問題シソーラスの不備前処理の問題形態素解析の誤りデータの不備正解語義の誤り訓練データテストデータ問題設定の不備対象語が不適切文節の係り受け解析の誤り文脈不足人間でも判定が困難熟語 連語として扱う方が適切その他 (14)[0.070] (7)[0.035] (20)[0.100] (6)[0.030] (1)[0.005] (1)[0.005] (7)[0.035] (1)[0.005] (3)[0.015] (1)[0.005] (15)[0.075] (32)[0.159] (1)[0.005] (16)[0.080] (5)[0.025] (1)[0.005] (14)[0.070]

24 (3)! [ +, 03] (a) (b) (c) (d) (e) (f) 0 (g) (e) (h) (i) (j) (k) 1 1 (l) (m) (n) (A) (B) (C) (D)

25 2 ( =)! l [Sammons+, 10] / OntoNotes[Hovy+, 06] l? l

26 1( )! 3 l : l 8-20 [Dolan+, 04] [Dagan+, 05] l : ( ) l e.g., [Zaenen+, 05] l / [Fujita+, 05] Ref. WSC [Levesque, 11] l : :

27 ! l l l l! l (1) l ( ) l ( )!!? l

28 ()

29

30 ?! RITE2[Kaneko+, 13] l l ( ) l! l l l Ref.8 40 l h"p://paraphrasing.org/paraphrase.html

31 ! ID=90-4, Type=synonymy:phrase トンネルズ& トロールズ第 5 版 はケン セント アンドレらによってデザインされた 助詞の交替 トンネルズ& トロールズ第 5 版 がケン セント アンドレらによってデザインされた 態の交替ケン セント アンドレらが トンネルズ & トロールズ第 5 版 をデザインした 分裂文 トンネルズ & トロールズ第 5 版 をデザインしたのはケン セント アンドレらである 節と名詞句の交替 ケン セント アンドレらは トンネルズ & トロールズ第 5 版 のデザイナーである 節と名詞句の交替 分裂文 スコープの変更 トンネルズ & トロールズ第 5 版 のデザイナーはケン セント アンドレらである ケン セント アンドレは トンネルズ & トロールズ第 5 版 のデザイナーの一人である スコープの変更 分裂文 トンネルズ & トロールズ第 5 版 のデザイナーの一人はケン セント アンドレである

32 ! 163à 306 l : 108 l : 58 l : 45 (e.g., ) : 60à 203 l l : 156 : 47 l 42 +

33 . / / / / / / / / / / / / /

34 /! ID=bc :! ID=bc

35

36 ! ( ) l : 100 l BCCWJ à 150 /5 ( ) l l trivial minimal pair l

37 ! l? WSD in MT [+, 15( WS)] l l? cf. : etc. l?... e.g., RITE- 2 w/ 250à e.g., SMT OOVà X%

38 FY2014! l! l l : l ü ü

-2-

-2- -1-2009 3 2 2 HP http://homepage3.nifty.com/office-wada/ -2- -3-1 01 X Y 100 Y Y 02 A B B C A -4- 2 03 X Y Y X XY Y X Y X Y Z XY Z Z X 261 24 14 49 41 77 1 48 6 21 27 6 712 11 1 53 9 14 906 88 X1 X2 X3

More information

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Using Unlabeled Examples of Each Genre Rie Yatabe (Ibaraki University) Minoru Sasaki

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

(1)2004年度 日本地理

(1)2004年度 日本地理 1 2 3 4 1 2 3 4 5 6 7 8 9 10 11 12-5.0-5.1-1.4 4.2 8.6 12.4 16.9 19.5 16.6 10.8 3.3-2.0 6.6 16.6 16.6 18.6 21.3 23.8 26.6 28.5 28.2 27.2 24.9 21.7 18.4 22.7 5 1 2 3 4 5 6 7 8 9 10 11 12 2.2 3.5 7.7 11.1

More information

Microsoft Word - .....J.^...O.|Word.i10...j.doc

Microsoft Word - .....J.^...O.|Word.i10...j.doc P 1. 2. R H C H, etc. R' n R' R C R'' R R H R R' R C C R R C R' R C R' R C C R 1-1 1-2 3. 1-3 1-4 4. 5. 1-5 5. 1-6 6. 10 1-7 7. 1-8 8. 2-1 2-2 2-3 9. 2-4 2-5 2-6 2-7 10. 2-8 10. 2-9 10. 2-10 10. 11. C

More information

CARC, AIST

CARC, AIST CARC, AIST 2005 4 14 1 3 2 3 2.1......................................... 3 2.2....................................... 3 2.3......................................... 4 2.4..........................................

More information

/27 (13 8/24) (9/27) (9/27) / / / /16 12

/27 (13 8/24) (9/27) (9/27) / / / /16 12 79 7 79 6 14 7/8 710 10 () 9 13 9/17 610 13 9/27 49 7 14 7/8 810 1 15 8/16 11 811 1 13 9/27 (13 8/24) (9/27) (9/27) 49 15 7/12 78 15 7/27 57 1 13 8/24 15 8/16 12 810 10 40 1 Wikipedia 13 8/18, 8/28 79

More information

301-A2.pdf

301-A2.pdf 301 21 1 (1),, (3), (4) 2 (1),, (3), (4), (5), (6), 3,?,?,??,?? 4 (1)!?, , 6 5 2 5 6 1205 22 1 (1) 60 (3) (4) (5) 2 (1) (3) (4) 3 (1) (3) (4) (5) (6) 4 (1) 5 (1) 6 331 331 7 A B A B A B A 23 1 2 (1) (3)

More information

r

r 73 29 2008 200 4 416 2008 20 042 0932 10 1977 200 1 2 3 4 5 7 8 9 11 12 14 15 16 17 18 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 200r 11 1 1 1 1 700200 200

More information

No. 1261 2003. 4. 9 14 14 14 14 15 30 21 19 150 35 464 37 38 40 20 970 90 80 90 181130 a 151731 48 11 151731 42 44 47 63 12 a 151731 47 10 11 16 2001 11000 11 2002 10 151731 46 5810 2795195261998 151731

More information

2002 715 02-13M 1. 200110 024 2. 3. 4. 100 60 5. 6. 2002715 1 1 1 4 9 9 12 12 13 14 14 15 15 17 17 18 22 22 23 25 25 25 29 200110 024 3 1 1965 500 800 3,000 2,000 1 1 60 2.84 1.173 1 2002 71 1,726 1,085

More information

『こみの株式会社』の実践

『こみの株式会社』の実践 2003 . JA JA A JA 811 2005/8/11 1003 452 10 960 28 2005/8/11 1003 452 6 120 29 2005/8/11 2003 151 10 420 33 2005/8/11 2003 211 3 180 31 2005/8/11 2003 211 3 150 32 827 400 5 80 221 2005/6/25 900 3 300

More information

15 7 26 1,276 3,800 1 16 15 1 2 3 4 2

15 7 26 1,276 3,800 1 16 15 1 2 3 4 2 1 15 7 26 1,276 3,800 1 16 15 1 2 3 4 2 JA 3 4 2 1 3 2001 1981 6 10% 10 30% 1 2 JA JA 2 4 JA 2 1 2 1 2 1 2 1 2 1 2 7 5 1 1 1 3 1 6 1 1 2 2 1 7 2 3 3 53 1 2000 30 8 250 53 435 20 35 3 1 8 2 4 3 2 2 232

More information

EX-word_Library_JA

EX-word_Library_JA JA 2 3 4 5 14 7 1 2 6 3 1 2 7 3 8 27 1 2 3 1 2 3 9 1 2 3 1 2 3 10 12 13 14 11 1 12 1 2 13 1 2 3 25 14 1 2 3 25 15 1 2 3 25 16 1 2 3 25 17 1 2 3 25 18 1 2 3 4 25 19 1 2 3 4 25 20 1 2 21 3 4 25 22 1 2 3

More information

324.pdf

324.pdf 50 50 10 30 11 26 12 27 14 16 27 18 20 21 22 22 22 22 23 24 24 1 No.324 JA 2 85 69 20 12 81 18 12 22 93 10 31 3 50 50 30 30 50 22 27 27 10 16 14 52 10 62 15 64 25 24 50 4 25 23 27 5 10 11 25 6 11 49 10

More information

- 1 - - 0.5%5 10 10 5 10 1 5 1

- 1 - - 0.5%5 10 10 5 10 1 5 1 - - - 1 - - 0.5%5 10 10 5 10 1 5 1 - 2 - - - - A B A A A B A B B A - 3 - - 100 100 100 - A) ( ) B) A) A B A B 110 A B 13 - 4 - A) 36 - - - 5 - - 1 - 6-1 - 7 - - 8 - Q.15 0% 10% 20% 30% 40% 50% 60% 70%

More information

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69>

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69> 短単位 長単位データマニュアル ver.1.0 (2004-03-24) 山口昌也, 小椋秀樹, 西川賢哉, 石塚京子, 木村睦子 ( 国立国語研究所 ) 内元清貴 ( 情報通信研究機構 ) 目次 1. はじめに 2. 収録内容 3. データ形式 3.1 ファイル形式とファイル名 3.2 短単位 長単位混合形式概要実例各フィールドの説明 3.3 長単位形式概要実例各フィールドの説明 4. 転記テキストとの関係

More information

人芯経営論 ・・・リーダーシップ考②

人芯経営論 ・・・リーダーシップ考② 2009/12/15 2009/11/17 2009/11/16 2009/10/19 2009/10/15 2009/10/1 2009/9/17 2009/9/1 2009/8/17 2009/8/17 2009/8/14 2009/8/12 2009/7/28 2009/7/17 2009/7/15 2009/6/24 2009/6/18 2009/6/15 2009/5/20 2009/5/15

More information

1 TOKEN CORPORATION

1 TOKEN CORPORATION 31 1 TOKEN CORPORATION Q1 TOKEN CORPORATION 2 Q2 3 TOKEN CORPORATION Q3 TOKEN CORPORATION 4 123 142 2,94 23.5 42 538 74 1,44 71 1,93 1,554 75.3 5 TOKEN CORPORATION TOKEN CORPORATION 6 4 35 3 25 2 15 1

More information

1. はじめに 2

1. はじめに 2 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1 1. はじめに 2 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 /

More information

RITE (Recognizing Inference in TExt) NTCIR- 9総括と NTCIR- 10へ向けて Yotaro Junta Watanabe1 Mizuno1 1Tohoku University Shuming Shi6 6MicrosoS Research Asia

RITE (Recognizing Inference in TExt) NTCIR- 9総括と NTCIR- 10へ向けて Yotaro Junta Watanabe1 Mizuno1 1Tohoku University Shuming Shi6 6MicrosoS Research Asia RITE (Recognizing Inference in TExt) NTCIR- 9総括と NTCIR- 10へ向けて Yotaro Junta Watanabe1 Mizuno1 1Tohoku University Shuming Shi6 6MicrosoS Research Asia Yusuke Miyao2 Tomohide Shibata3 2NaEonal InsEtute of

More information

nlp1-04a.key

nlp1-04a.key 自然言語処理論 I. 文法 ( 構文解析 ) その 構文解析 sytctic lysis, prsig 文の構文的な構造を決定すること句構造文法が使われることが多い文法による構文木は一般に複数ある 構文木の違い = 解釈の違い 構文解析の目的 句構造文法の規則を使って, 文を生成できる構文木を全て見つけだすこと 文法が入力文を生成できるかどうかを調べるだけではない pro I 構文解析とは 構文木の違い

More information

untitled

untitled 186 17 100160250 1 10.1 55 2 18.5 6.9 100 38 17 3.2 17 8.4 45 3.9 53 1.6 22 7.3 100 2.3 31 3.4 47 OR OR 3 1.20.76 63.4 2.16 4 38,937101,118 17 17 17 5 1,765 1,424 854 794 108 839 628 173 389 339 57 6 18613

More information

untitled

untitled 1. 3 14 2. 1 12 9 7.1 3. 5 10 17 8 5500 4. 6 11 5. 1 12 101977 1 21 45.31982.9.4 79.71996 / 1997 89.21983 41.01902 6. 7 5 10 2004 30 16.8 37.5 3.3 2004 10.0 7.5 37.0 2004 8. 2 7 9. 6 11 46 37 25 55 10.

More information

TypeB 新スローガンイメージ (4:3)

TypeB 新スローガンイメージ (4:3) 自然言語処理入門と活用 NTT コミュニケーションズ株式会社 村上優樹 竹越智也 Copyright NTT Communications Corporation. All rights reserved. 1 私は母と焼肉を食べた Copyright NTT Communications Corporation. All rights reserved. 2 私は母と焼肉を食べた Copyright

More information

untitled

untitled B 60 8 2 21 3 B - - 1 A. B. A B A A A B 2 A A 1830 A 10 - - 2 11 12 13 20 A 21 A B A 7 10 1830 1830 B - - 3 3 15 15 2 15 15 2 TO 15 TO 15 TO - - 4 1491 93 1493 17 2 = - - 5 , ZPANGRI P - - 6 1 8 1 15 15

More information

演習 レシピテキストの係り受け解析

演習 レシピテキストの係り受け解析 実習 : レシピの言語処理の現状 京都大学 笹田鉄郎 前田浩邦 森信介 2013 年 8 月 18 日 1 公開に際しての注意 必要環境 Perl KyTea Eda Firefox (ver. 14.0.1 以前のバージョン ) 著作権の関係上 係り受け解析の実習で利用した学習コーパスを公開することはできません ご了承ください 目次 1. はじめに 2. 注意事項 3. アノテーション支援ツールPNAT

More information

コーパスに基づく言語学教育研究報告 8

コーパスに基づく言語学教育研究報告 8 No.82012 5 5 1. 2. 2009 BCCWJ 2007 1 12 BCCWJ Yahoo! BCCWJ 57,807 4,459 5,110 854 1,500 Yahoo! 45,725 159 57,807 2009 3. 1 2 3 X A 3 20102011 1 2 X A 1 X X X X X A 2 1 X A 3 1 1 2 3 2 http://mainet.ath.cx/bbs/sst/sst.php?act=dump&cate=hxh&all=2035&n=2

More information

a a b a b c d e R c d e A a b e a b a b c d a b c d e f a M a b f d a M b a b a M b a M b M M M R M a M b M c a M a R b A a b b a CF a b c a b a M b a b M a M b c a A b a b M b a A b a M b C a M C a M

More information

untitled

untitled 1. 2. 3. 4. 5. 6. 7. 8. 9. 07060121 07060121 07060121 07060121 KA12345 200,000 1301 0089-339 1 07060121 KA12345 200,000 1 1301 0089-339 07060121 07060121 A 100,000 07060121 07060121 07060121 07060121 07060121

More information

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2 自然言語処理プログラミング勉強会 12 係り受け解析 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2 構文解析の種類 係り受け解析 : 単語と単語のつながりを重視 I saw a girl with a telescope 句構造解析

More information

テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが

テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが 可能になりました テキストマイニングは 世の中で流行っている話題 や 人々のニーズや不満を定量的に把握する手段とし

More information

06-...c.x...qx

06-...c.x...qx 200553.1 46.922.818.310.9 0.2 30 14 Initiation, rite of passage 15 18 6070 8090 1100 100 [2006]p.275 [:1997]p.117. [1991]p.317. [1998]p.125. [1998]p.125. 16 10 11 12 13 14 [1998]p.139. 10 [2005]p.271.

More information

共有辞書を用いた 効率の良い圧縮アルゴリズム

共有辞書を用いた 効率の良い圧縮アルゴリズム 大規模テキストに対する 共有辞書を用いた Re-Pair 圧縮法 Variable-to-Fixed-Length Encoding for Large Texts Using Re-Pair Algorithm with Efficient Shared Dictionaries 関根渓, 笹川裕人, 吉田諭史, 喜田拓也 北海道大学大学院情報科学研究科 1 背景 : 巨大なデータ 計算機上で扱うデータの巨大化.

More information

2015taisetumatome.rtf

2015taisetumatome.rtf B B B( ) B3 - B3 1 3g 1/3 B 1. B1() B1() 2. B2() B2() 3. B5() B5() 4. B6() B6()( ) 5. B12() B12() 6. 1q60 160m 50m 50m 20m 8520 80 10 64 5075 30 80 B B 1 30 BB BC EPA . ?? 6 C E C 1 30 1 0.4mg4

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

DocuPrint C2424 取扱説明書(詳細編)

DocuPrint C2424 取扱説明書(詳細編) 3 4 1 2 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 1.1 1 1 2 3 4 5 30 1.2 1 31 1.3 1 32 33 1 1.4 1 1.4.1 34 1.4.2 1 2 35 1 1.5 1 1 2 3 4 36 5 6 7 8 9 37 1 1 10 11 12 13 38 14 15

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Chinese Zero Pronoun Resolution with Deep Neural Networks Chen Chen and Vincent Ng 紹介する人 : 萩行正嗣 ( ウェザーニューズ ) Anaphoric Zero Pronoun Resolution の用語 Zero pronoun (ZP): ゼロ代名詞 省略された代名詞 ( ここでは ) 現実世界の何らかの Entity

More information

- 1 -

- 1 - - 1 - - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - - 9 - - 10 - - 11 - - 12 - - 13 - - 14 - - 15 - - 16 - - 17 - - 18 - - 19 - - 20 - - 21 - - 22 - - 23 - - 24 - - 25 - - 26 - EC NEC - 27 - NEC - 28 - R NEC

More information

Microsoft PowerPoint - gijutsuenshu04_061024_2.ppt

Microsoft PowerPoint - gijutsuenshu04_061024_2.ppt 情報技術演習 第 4 回 情報抽出と自然言語処理 2006/10/24 久保田秀和文学部 / 情報学研究科 kubota@ii.ist.i.kyoto-u.ac.jp http://www.ii.ist.i.kyoto-u.ac.jp/~kubota/ 本日の講義 演習 プログラミングの基礎 ( 復習 ) 前回提出されたレポートを題材に 計算機上の身近な情報へのアプローチ (CGUI) 情報抽出と自然言語処理

More information

Functional Programming

Functional Programming PROGRAMMING IN HASKELL プログラミング Haskell Chapter 10 - Declaring Types and Classes 型とクラスの定義 愛知県立大学情報科学部計算機言語論 ( 山本晋一郎 大久保弘崇 2011 年 ) 講義資料オリジナルは http://www.cs.nott.ac.uk/~gmh/book.html を参照のこと 0 型宣言 (Type Declarations)

More information

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx)

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx) DEIM Forum 2009 C6-4 Web 上のレビュー情報からユーザが重要視する製品の特徴を抽出する手法の提案 小林大祐 井上潮 東京電機大学工学研究科 101-8457 東京都千代田区神田錦町 2-2 E-mail: 08gmc13@ed.cck.dendai.ac.jp, inoue@c.dendai.ac.jp あらまし製品のレビューを書くための Web サイトが存在し, 利用者も多い.

More information

.w..01 (1-14)

.w..01 (1-14) ISSN 0386-7617 Annual Research Reports No.33, 2009 THE FOUNDATION FOR GROWTH SCIENCE ön é

More information

…_…C…L…fi…J…o†[fiü“ePDF/−mflF™ƒ

…_…C…L…fi…J…o†[fiü“ePDF/−mflF™ƒ 80 80 80 3 3 5 8 10 12 14 14 17 22 24 27 33 35 35 37 38 41 43 46 47 50 50 52 54 56 56 59 62 65 67 71 74 74 76 80 83 83 84 87 91 91 92 95 96 98 98 101 104 107 107 109 110 111 111 113 115

More information

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using Text Corpus Ziyu Dou(Graduate School of Engineering,

More information

多言語版「チュウ太のweb辞書」を用いた語彙学習

多言語版「チュウ太のweb辞書」を用いた語彙学習 < 日本語教育と AI: 研究実践例と今後の課題 > 読解支援システムへの AI 活用の可能性と留意点 東京国際大学 川村よし子 読解支援システムへの AI 活用の可能性と留意点 はじめに 1. 読解支援システムと自然言語処理技術 2. リーディング チュウ太 3. チュウ太のWeb 辞書 4. チュウ太のやさしくなーれ 5.AI 活用の可能性と留意点 はじめに はじめに AI( 人工知能 ) とは?

More information

先行研究 pp

先行研究 pp N N 1 BCCWJ 1 はじめに 2007 362 a a. b. a. b. a b 2007 363 A B A B A B A A B A B 1 2014 2 5 53 54 2007 363 2 先行研究 200719771989 1998 2001 1993 2004 1977 pp.122 130 N N 55 1989 2 pp.20 21 3 pp.34 35 2 3 56 1998

More information

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から 概要 コロケーションリストのもう一歩先へ : 英和辞書の執筆者と使用者の立場から 成城大学社会イノベーション学部石井康毅 コロケーションは学習者にとって重要だが 連語辞典は使いこなせないことが多い コーパスから簡単に連語リストが作れる これは執筆者から見て非常に有用だが これだけでは 学習者向け辞書における実際の記述や用例の作成には不十分 コンコーダンスラインを丁寧に見なくてはいけないが 限られた時間の中で

More information

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 スペクトルデータの特徴 1 波 ( 波数 ) が近いと 吸光度 ( 強度 ) の値も似ている ノイズが含まれる 吸光度 ( 強度 ) の極大値 ( ピーク ) 以外のデータも重要 時系列データの特徴 2 時刻が近いと プロセス変数の値も似ている ノイズが含まれる プロセス変数の極大値

More information

Microsoft Word - DEIM論文3.doc

Microsoft Word - DEIM論文3.doc DEIM Forum 2017 A2-1 ニュース記事を用いた時事問題自動作問システム 久田将史 前田亮 立命館大学情報理工学部 525-8577 滋賀県草津市野路東 1-1-1 E-mail: is0230kx@ed.ritsumei.ac.jp,amaeda@is.ritsumei.ac.jp あらまし コンピュータが問題を出題するシステムの多くが, あらかじめ用意しておいた問題文と解答を用いて出題してい

More information

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手 BCCWJ における固有表現抽出のエラー分析 市原正陽 ( 茨城大学工学部情報工学科 ) 山崎舞子 ( 東京工業大学大学院総合理工学研究科 ) 古宮嘉那子 ( 茨城大学工学部情報工学科 ) Error Analysis of Named Entity Extraction in BCCWJ Masaaki Ichihara(Department of Computer and Information

More information

untitled

untitled 5 1.() 2.() 3.(JA ) 2 3 4 5 6 7 8 9 10 11 12 13 1,000m 165.52km2 1,200-1- H15.8.1 1,163 2,121 278 H19.2.1 60 12 8 15 13 4 10 14 4 13 15 16 22 16 12 21 44 81-2- - 0 - - 1 - - 2 - - 3 - - 4 -

More information

untitled

untitled 1993 2 2.1 2 1 200235 1992 6 7 3 3 84 JA 1990 47.3% 46.5% 1990 31.7% 56.9% 37 6 4 1976 2.2 2.2 1976 1974 1976 1981 1 3.5 1985 60 2005 2006 2006 27 103 522 284 3.5 3.6 2003 109 59.6% 54.1% 31.2% 1970

More information

DEIM Forum 2019 C3-5 tweet

DEIM Forum 2019 C3-5 tweet DEIM Forum 2019 C3-5 tweet 163 8677 1 24 2 163 8677 1 24 2 163 8677 1 24 2 E-mail: c515029@ns.kogakuin.ac.jp, cm17051@ns.kogakuin.ac.jp, aki@cc.kogakuin.ac.jp Twitter tweet tweet tweet BoW Doc2vec SVM

More information

23_33.indd

23_33.indd 23 2TB 1TB 6TB 3TB 2TB 3TB 3TB 2TB 2TB 1TB 1TB 500GB 4TB 1TB 1TB 500GB 2TB 2TB 1TB 1TB RT RT RT RT RT RT RT MAC 10. 10. 10.6 10.5 MAC 10. 10. 10.6 10.5 MAC 10. 10.6 10.5 MAC 10. 10. 10.6 10.5 MAC 10. 10.6

More information

nlp1-05.key

nlp1-05.key 実用的な構文解析 自然言語処理論 I 今までの例に挙げた文法は非常に単純 実用的な文法 いろいろな文に対応しなければならない それだけ規則の数も増える 5. 文法 3( 素性構造と ) 規則を効率的に管理する必要がある 1 2 一致の例 英語における一致 (agreement) 数 ( 単数形, 複数形 ) 人称 (1 人称,2 人称,3 人称 ) 名詞句の例 a desk the desks a

More information

040402.ユニットテスト

040402.ユニットテスト 2. ユニットテスト ユニットテスト ( 単体テスト ) ユニットテストとはユニットテストはプログラムの最小単位であるモジュールの品質をテストすることであり その目的は結合テスト前にモジュール内のエラーを発見することである テストは機能テストと構造テストの2つの観点から行う モジュールはプログラムを構成する要素であるから 単体では動作しない ドライバとスタブというテスト支援ツールを使用してテストを行う

More information

2 116

2 116 1 北陸大学 紀要 第27号 2003 pp. 115 122 中国人日本語学習者が間違えやすい表現について 王 国 華 A Study on the Expressions in which Chinese Learners of Japanese Frequently Make Mistakes Wang GuoHua Received October 28, 2003 1 はじめに 中国語を母国語とする日本語学習者の数は年々増え続けている

More information

Web PDF [7, 8] 1 1 [9, 10] OCR [9] HITS [10] 2. 3 [11] IDF TF-IDF [12] PageRank,, PageRank TF-IDF k-means PageRank Web ios 1 imac mac

Web PDF [7, 8] 1 1 [9, 10] OCR [9] HITS [10] 2. 3 [11] IDF TF-IDF [12] PageRank,, PageRank TF-IDF k-means PageRank Web ios 1 imac mac DEIM Forum 2018 E3-5 700 8530 3-1-1 101 8430 2-1-2 E-mail: {tanijiri, ohta}@de.cs.okayama-u.ac.jp, {takasu, adachi}@nii.ac.jp ipad Web ibooks ibooks 1. OCR [1 3] PDF PDF 1 2 Web Web PDF ipad Web ipad 2

More information

() 1875( 8) 10

() 1875( 8) 10 21 3 1 A3 1888 21 3 1 12 3 52 8 1 3 927.27 60 1 6 1.818 109.08 () 1875( 8) 10 1869 5 4 1873 6 3 1874 7 8 31 20 11874 7 1 1876( 9) 1876( 9) 1878( 11) 1874 7 4 1875 5 1875( 8) 7 1875 8 10 1875 8 10 1875

More information

untitled

untitled 2 3-22 23-24 25-1 - - 2 - 2-3 - 1848 1901 1936 3 1960 2005 10 27.8 1-4 - 2 5 A 3000 4-5 - 4 20 120 160 70 10-6 - 12 40 6070 80 20 20 7 5 9 15 130 I U 8 4 2 3-7 - 4 1,600 500 200 48 100 80-8 - - 9 - 1 12

More information

( ) ( ) 20 11 11-13 15 20 21 ( ) 114cm 100cm 85cm () () 11 18 19 19-25 26 ( 1 ) 1 2 10 ( ) () 11 16 19 21 24-13 20 3 20 ( ) ( ) 14 15 19 20 23 29 13 20 4/15 600 400 5 7 1 8 5 7 20 3 1999 1000 100 86

More information

122

122 121 122 123 1 124 2 3 125 4 5 126 7 127 8 9 128 17301 10 1. 2. 3. 4. 5. 11 129 12 13 130 211822 14 15 131 16 17 132 5 19 133 20 21 134 22 23 135 24 25 136 26 137 1. 2. 3. 4. 5. 5 28 1. 5 2. 3. 3 29 138

More information