(Microsoft Word - JCLWorkshop2013_2\214\303\213{.doc)

Size: px
Start display at page:

Download "(Microsoft Word - JCLWorkshop2013_2\214\303\213{.doc)"

Transcription

1 分類器の確信度確信度を用いたいた合議制合議制によるによる語義曖昧性解消語義曖昧性解消の unsupervised な領域適応 古宮嘉那子 ( 東京農工大学工学研究院 ) 奥村学 ( 東京工業大学精密工学研究所 ) 小谷善行 ( 東京農工大学工学研究院 ) Unsupervised Domain Adaptation in Word Sense Disambiguation Based upon the Comparison of Multiple Classifiers Kanako Komiya (Institution of Engineering, Tokyo University of Agriculture and Technology) Manabu Okumura (Precision and Intelligence Laboratory, Tokyo Institution of Technology) Yoshiyuki Kotani (Institution of Engineering, Tokyo University of Agriculture and Technology) 1. はじめにテストのターゲットとなるドメインとは異なるドメインのデータ ( ソースデータ ) を利用して学習を行い, ターゲットドメインのデータ ( ターゲットデータ ) に適応することを領域適応といい, 近年さまざまな手法が研究されている. 本稿では, あるドメイン ( ジャンル ) のターゲットデータに対して, 複数のジャンルのコーパスの集合になっているソースデータがある場合, ソースデータの全体集合から, ターゲットデータに適した訓練事例の部分集合を自動的に選択する試みについて述べる. なお, ターゲットデータのラベルは未知とし, 語義曖昧性解消 (Word Sense Disambiguation, WSD) について領域適応を行った. また本稿では, ターゲットデータの用例ごとに適切な訓練事例は異なると仮定し, 用例ごとに訓練事例の選択を行った. 具体的には, あるターゲットデータに対して, 二つのジャンルからなるコーパスがソースデータとして与えられた際, それぞれのジャンルのコーパスによって訓練する方式と, コーパス全体によって訓練する方式を使って三つの分類器を作成し, 用例ごとに学習された分類器の出力する確信度が最大である答えを採用することにより, 分類の精度を向上させる手法を示す. 2. 関連研究領域適応は, 学習に使用する情報により,fully supervised,semi-supervised,unsupervised の三種に分けられる.(Daumé III, Kumar and Saha, (2010)) によれば,fully supervised の領域適応は, ラベルつきのソースデータに加え少量のラベルつきのターゲットデータを用いて学習を行うもので, 訓練事例としてソースデータまたは少量のターゲットデータだけを利用する場合よりも, 分類器を改良することを目指す. 次の semi-supervised の領域適応は, 多量なラベルつきのソースデータに加え, 多量なラベルなしのターゲットデータと少量のラベルつきのターゲットデータを利用するものである. また, 最後の unsupervised の領域適応は, ラベルつきのソースデータと, ラベルなしのターゲットデータを利用するものである 1. 本研究で扱うのは unsupervised の領域適応である. 領域適応の研究は自然言語処理の分野の内外においてさまざまなされており,supervised のものには (Chan and Ng (2006)),(Daumé III(2007)),(Jiang and Zhai (2007)) などがある. 本稿では, 分類器の確信度により領域適応に用いる訓練事例集合を選択する手法につい て述べる. これに関連した研究として ( 張本, 宮尾, 辻井 (2010)) や (Asch and Daelemans kkomiya@cc.tuat.ac.jp 1 (Daumé III(2007)) では (Daumé III, Kumar and Saha, (2010)) で unsupervised としているものを semi-supervised としているが, 本稿では新しい方を採用した. 1

2 (2010)),(McClosky, Charniak, and Johnson (2010)),( 古宮, 奥村 (2012)),(Komiya and Okumura (2012)),( 古宮, 小谷, 奥村 (2013)), がある.( 張本, 宮尾, 辻井 (2010)) は, 構文解析において, 分野間距離をはかり, より適切なコーパスを利用して領域適応を行えるようにした. また,(Asch and Daelemans (2010)) は, 構文解析において, 自動的にタグ付けされたコーパスを用いて, ソースデータとターゲットデータの類似度から性能を予測できることを示した.( 古宮, 奥村 (2012)) は WSD について supervised な領域適応を行った場合, 最も効果的な領域適応手法はソースデータとターゲットデータの性質により異なることを示し, 最も効果的な領域適応手法を,WSD の対象単語タイプ, ソースデータ, ターゲットデータの三つ組ごとに自動的に選択する手法について述べた. また,(Komiya and Okumura (2012)) は,WSD の supervised な領域適応において, 本稿でも使用する確信度という尺度を用い, 用例ごとに適切な領域適応手法を自動的に選択した. また,( 古宮, 小谷, 奥村 (2013)), unsupervised な領域適応において, あるターゲットデータに対して複数のジャンルのソースデータが混在した場合, 確信度と LOO-bound という指標を利用して, 領域適応のための訓練事例の部分集合を WSD の対象単語タイプごとに自動的に選択する手法について述べた. 3. 用例ごとの訓練事例集合の自動選択あるドメイン ( ジャンル ) のターゲットデータを対象に WSD を行うことを考える. このターゲットデータのラベル ( 語義 ) は未知であるとする. 一方, 複数のジャンルのコーパスの集合となっているソースデータが入手可能であるとすると, 本稿ではこれらのソースデータの全体集合から, ターゲットデータに適した訓練事例の部分集合を自動的に選択する. この際, 以下の手順で訓練事例の部分集合の選択を行う. なお, 我々は最も効果的な訓練事例集合は用例ごとに異なると仮定しているため, 訓練事例集合の選択はターゲットデータの用例ごとに行う. (1) 訓練事例集合を変えて複数の分類器を学習する. (2) 用例ごとに, 複数の訓練事例集合による分類器の確信度を比較する. (3) 分類器の確信度の最も高い訓練事例集合による結果を採用する. ここでの分類器の確信度 (Komiya and Okumura (2012)) は, 分類の確からしさの度合いの予測値であり, 能動学習においてラベル付けする用例を選択するのによく利用される. 本手法では (Komiya and Okumura (2012)) と同様に, この確信度が確率として出力されることに注目し, 確信度を比較することで, 複数の分類器の合議を行う. 4. 実験 4.1WSD のための訓練事例集合 WSD のための訓練事例集合として, 本研究では以下に示す三つを用いる. One: 複数のジャンルのコーパスの集合であるソースデータのうち, ひとつのジャンルのコーパスを訓練事例に用いる. Another: One とは別のひとつのジャンルのコーパスを訓練事例に用いる. Together: One と Another で利用したふたつのコーパスを訓練事例に用いる. 分類器としてはマルチクラス対応の SVM(libsvm)(Chang and Lin (2001)) を使用した. ま 2

3 た,libsvm の確率として出力される分類の確からしさを確信度として用いた. カーネルは 予備実験の結果, 線形カーネルが最も高い正解率を示したため, これを採用した. また, 学習の素性には, 以下の 17 種類の素性を用いた. WSD の対象単語の前後二語までの形態素の表記 (4 種類 ) WSD の対象単語の前後二語までの品詞 (4 種類 ) WSD の対象単語の前後二語までの品詞の細分類 (4 種類 ) WSD の対象単語の前後二語までの分類コード (4 種類 ) 係り受け (1 種類 ) - 対象単語が名詞の場合はその名詞が係る動詞 - 対象単語が動詞の場合はその動詞のヲ格の格要素 分類語彙表の分類コードには ( 国立国語研究所 (1964)) を使用した. 4.2 合議の方法上記で示した One, Another の二つ, また Together を含めた三つのうちから確信度を用いて, 最も適切な分類器の結果を合議により決定した. One, Another の二種類から選ぶ際には, より確信度が高い方の分類器の結果を採用した. Together を含めた三種類の合議の方法は, 以下の 4 通りを試した. なお, 一番が複数あるときには最も高い確信度の分類器の語義を採用した. Highest: 最も高い確信度の分類器の結果 ( 語義 ) を採用する Time: 語義ごとに, 複数分類器から出力された確信度を積算し, 最も高い確信度となった語義を採用する Plus: 語義ごとに, 複数分類器から出力された確信度を足しあわせ, 最も高い確信度となった語義を採用する Majority ajority: 分類器ごとに, 最も高い確信度となった語義に一票入れ, 最も多数の票が入った語義を採用する 4.3 実験データ実験には, 現代日本語書き言葉均衡コーパス (BCCWJ コーパス )(Maekawa (2008)) の白書のデータと Yahoo! 知恵袋のデータ, また RWC コーパスの毎日新聞コーパス (Hashida et al. (1998)) の三つのジャンルのデータを利用した. これらのデータには岩波国語辞典 ( 西尾ら (1994)) の語義が付与されている. 三つのジャンルのコーパスのうち, ひとつをターゲットデータにし, 残りの二つを利用可能なソースデータとして利用することで, 全部で 3 通りの領域適応を行った. これらのコーパス中の多義語のうち, 三つのコーパス中全てに 50 トークン以上存在する単語を実験対象としたところ, 全体で 22 種類となった. それぞれのジャンルのコーパスにおけるケースごとの最小, 最大, 平均用例数を表 1 に示す. また, 実験には岩波国語辞典の小分類の語義を採用した. 語義数ごとの単語の内訳は,2 語義 : 場合, 自分,3 語義 : 事業, 情報, 地方, 社会, 思う, 子供,4 語義 : 考える,5 語義 : 含む, 技術,6 語義 : 関係, 時間, 一般, 現在,7 語義 : 今,8 語義 : 前,10 語義 : 持つ, 12 語義 : 見る,14 語義 : 入る,16 語義 : 言う,22 語義 : 手 である. 3

4 表 1 それぞれのジャンルのコーパスにおける単語ごとの最小, 最大, 平均用例数 コーパスの種類 最小 最多 平均 BCCWJ 白書 BCCWJ Yahoo! 知恵袋 RWC 新聞 結果表 2 に全体の合議の方法別の実験結果を, また, 表 3 にターゲットデータと合議の方法別の実験結果を示す. これらの表において, Self は, タグつきターゲットデータが手に入ったと仮定して,supervised の学習を 5 分割交差検定を用いて行った結果である. ふたつのコーパスの平均 は, ふたつのジャンルのソースデータそれぞれをジャンルごとに分けて訓練事例とした場合の結果の平均である. 入手可能なジャンルのコーパスをそれぞれソースデータとして使用した場合の平均的な結果を示している. 例えば,Yahoo! 知恵袋のデータがターゲットデータの時のソースデータは白書と新聞であるが, このときの ふたつのコーパスの平均 は, 白書の全データで訓練した Yahoo! 知恵袋のデータの正解率と, 新聞の全データで訓練した Yahoo! 知恵袋のデータの正解率の平均となる. また, 大きい方のコーパス は, ふたつのジャンルのソースデータのうち, 用例数が多いジャンルのソースデータをすべて訓練事例とした場合の結果である. 例えば,Yahoo! 知恵袋のデータがターゲットデータの時の 大きい方のコーパス は, 白書よりも新聞のほうが全単語タイプで比較したときに用例数が多かったため, 新聞の全データで訓練した Yahoo! 知恵袋のデータの正解率の平均となる. 最後に, 全てのコーパス とは, ふたつのジャンルのソースデータ全て ( つまり全ソースデータ ) を訓練事例とした際の結果である. 例えば,Yahoo! 知恵袋のデータがターゲットデータの時の 全てのコーパス は, 白書と新聞のコーパス全てを訓練事例として利用した際の結果である. 表 2 全体の合議の方法別の実験結果 マイクロ平均 マクロ平均 Self 93.29% 85.97% ふたつのコーパスの平均 76.92% 71.20% 大きいきい方のコーパス 81.99% 74.25% 全てのコーパス 81.76% 75.86% 二種類からから選択 82.46% 74.71% Highest 82.62% 74.92% Time 77.11% 65.85% Plus 82.48% 74.07% Majority 80.89% 70.88% このとき, Self は upper bound であり, ふたつのコーパスの平均, 大きい方のコー パス, 全てのコーパス はベースラインである. 表において Self 以外でコーパスごとに 4

5 一番高い正解率を太字で示した. またその値をベースラインのうち一番目に高い正解率と 比較した際,0.05 水準で有意である場合にはその値に下線を引いた. 表 3 ターゲットデータと合議の方法別の実験結果 マイクロ平均 マクロ平均 ターゲットデータ 白書 新聞 Yahoo! 知恵袋 白書 新聞 Yahoo! 知恵袋 Self 96.07% 79.57% 91.93% 91.53% 78.59% 87.80% ふたつのコーパスの平均 73.54% 72.94% 79.95% 70.80% 71.23% 71.57% 大きいきい方のコーパス 80.72% 74.86% 83.50% 75.64% 74.39% 72.73% 全てのコーパス 81.80% 75.95% 82.11% 76.91% 74.91% 75.76% 二種類からから選択 82.02% 74.81% 83.33% 76.68% 72.71% 74.75% Highest 82.28% 74.94% 83.42% 76.88% 72.80% 75.07% Time 76.72% 66.39% 78.13% 65.94% 62.28% 69.32% Plus 81.93% 71.44% 83.67% 75.81% 70.65% 75.75% Majority 80.10% 67.03% 82.46% 71.45% 67.28% 73.92% 6. 考察まず, 表 2 と表 3 においてマイクロ平均を比べると,Yahoo! 知恵袋コーパスがターゲットデータの時と全体で比較した際には, 全てのコーパス の正解率より 大きい方のコーパス の正解率の方が高い. このことから, 訓練事例は必ずしも多ければ良いわけではないことが分かる. 次に, 同じ二つの表から, 二種類から選択 のマイクロ平均は新聞がターゲットデータのとき以外は総じて良いことが分かる. しかし Together を含めた三種類から選択する Highest の方が, マイクロ平均, マクロ平均ともにいつも良い. その Highest は, 提案手法で最も高い正解率を示している. 特にマイクロ平均においては, ベースライン中で最も高い正解率の 大きい方のコーパス を有意に上回っている. しかし, マクロ平均についてはどの提案手法も 全てのコーパス というベースラインを上回ることが出来なかった. マクロ平均をあげることが今後の課題である. また, 二つの表から, Highest と Plus は Time や Majority よりも正解率が高いことが分かる. 最後に, 表 3 から, マイクロ平均において, 新聞がターゲットデータになった際には 全てのコーパス が全てのうちで最も高い正解率である. これは, 訓練事例となった Yahoo! 知恵袋と白書のコーパスがふたつとも大きいため, 全てのコーパスを利用した場合には片方のコーパスよりずっと大きくなるためであると考えられる. 訓練事例数は必ずしも多ければいいわけではないが, 一方で, 訓練事例数に大きな差があった場合には, 多い方を選ぶと高い正解率となると思われるので, 今後は訓練事例数を加味した指標を考える予定である. 7. まとめテストのターゲットとなるドメインとは異なるドメインのデータを利用して学習を行い, ターゲットドメインのデータに適応することを領域適応といい, 近年さまざまな手法が研究されている. 我々は, 語義曖昧性解消 (WSD: Word Sense Disambiguation) の領域適応を行う際, ターゲットデータの用例によって適切な訓練事例集合は異なると考え, ソースデータとして二つのジャンルによるコーパスが与えられた際, それぞれのジャンルのコ 5

6 ーパスによって訓練する方式と, 全体のコーパスによって訓練する方式を使って三つの分類器を作成し, 用例ごとに学習された分類器の出力する確信度が最大である答えを採用することにより, 分類の精度を向上させる手法を示した. 用例ごとに自動的に選択された訓練事例集合を用いて領域適応を行うことで, 全体のコーパスを使用して学習した時や大きい方のコーパスを利用して学習した時に比べ,WSD の平均正解率がマイクロ平均に関して有意に向上した. マクロ平均を上昇させることが今後の課題である. 謝辞本研究は, 文部科学省科学研究費補助金 [ 若手 B(No: )] の助成により行われた. ここに, 謹んで御礼申し上げる. 文献 Vincent Van Asch and Walter Daelemans (2010). Using Domain Similarity for Performance Estimation. Proceedings of the 2010 Workshop on Domain Adaptation for Natural Language Processing, ACL 2010, pp Yee Seng Chan and Hwee Tou Ng (2006). "Estimating Class Priors in Domain Adaptation for Word Sense Disambiguation." Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics, pp Hal Daumé III(2007). Frustratingly Easy Domain Adaptation. Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics, pp Hal Daumé III, Abhishek Kumar, Avishek Saha, (2010). Frustratingly Easy Semi-Supervised Domain Adaptation, Proceedings of the 2010 Workshop on Domain Adaptation for Natural Language Processing, ACL 2010, pages Koichi Hashida, Hitoshi Isahara, Takenobu Tokunaga, Minako Hashimoto, Shiho Ogino, and Wakako Kashino (1998). The Rwc Text Databases. In Proceedings of The First International Conference on Language Resource and Evaluation, pp Jing Jiang and ChengXiang Zhai (2007). Instance Weighting for Domain Adaptation in NLP, Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics, pp49-56, pp Kanako Komiya and Manabu Okumura (2012). Automatic Domain Adaptation for Word Sense Disambiguation Based on Comparison of Multiple Classifiers, Proceedings of 26 th Conference on Language Information and Computation, pp Pacific Asia David McClosky, Eugene Charniak, and Mark Johnson (2010). Automatic domain adaptation for parsing. Proceedings of the 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, pp Kikuo Maekawa (2008). Balanced Corpus of Contemporary Written Japanese. In Proceedings of the 6th Workshop on Asian Language Resources (ALR), pp 国立国語研究所 (1964). 分類語彙表. 秀英出版. 古宮嘉那子, 奥村学 (2012). 語義曖昧性解消のための領域適応手法の決定木学習による自動選択, 自然言語処理,Vol.19, No.3, pp 古宮嘉那子, 小谷善行, 奥村学 (2013). 語義曖昧性解消の領域適応のための訓練事例集合の選択, 第 19 回言語処理学会年次大会予稿集,In Press. 西尾実, 岩淵悦太郎, 水谷静夫 (1994). 岩波国語辞典第五版. 岩波書店. 張本佳子, 宮尾祐介, 辻井潤一 (2010). 構文解析の分野適応における精度低下要因の分析及び分野間距離の測定手法. 言語処理学会第 16 回年次大会発表論文集, pp

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Using Unlabeled Examples of Each Genre Rie Yatabe (Ibaraki University) Minoru Sasaki

More information

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using Text Corpus Ziyu Dou(Graduate School of Engineering,

More information

A Japanese Word Dependency Corpus ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹

A Japanese Word Dependency Corpus   ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹ A Japanese Word Dependency Corpus 2015 3 18 Special thanks to NTT CS, 1 /27 Bunsetsu? What is it? ( ) Cf. CoNLL Multilingual Dependency Parsing [Buchholz+ 2006] (, Penn Treebank [Marcus 93]) 2 /27 1. 2.

More information

自然言語処理24_705

自然言語処理24_705 nwjc2vec: word2vec nwjc2vec nwjc2vec nwjc2vec 2 nwjc2vec 7 nwjc2vec word2vec nwjc2vec: Word Embedding Data Constructed from NINJAL Web Japanese Corpus Hiroyuki Shinnou, Masayuki Asahara, Kanako Komiya

More information

IPSJ-TOD

IPSJ-TOD Vol. 3 No. 2 91 101 (June 2010) 1 1 1 2 1 TSC2 Automatic Evaluation of Text Summaries by Using Paraphrase Kazuho Hirahara, 1 Hidetsugu Nanba, 1 Toshiyuki Takezawa 1 and Manabu Okumura 2 The evaluation

More information

1. はじめに 2

1. はじめに 2 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1 1. はじめに 2 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 /

More information

x i 2 x x i i 1 i xi+ 1xi+ 2x i+ 3 健康児に本剤を接種し ( 窓幅 3 n-gram 長の上限 3 の場合 ) 文字 ( 種 )1-gram: -3/ 児 (K) -2/ に (H) -1/ 本 (K) 1/ 剤 (K) 2/ を (H) 3/ 接 (K) 文字 (

x i 2 x x i i 1 i xi+ 1xi+ 2x i+ 3 健康児に本剤を接種し ( 窓幅 3 n-gram 長の上限 3 の場合 ) 文字 ( 種 )1-gram: -3/ 児 (K) -2/ に (H) -1/ 本 (K) 1/ 剤 (K) 2/ を (H) 3/ 接 (K) 文字 ( 1. 2 1 NEUBIG Graham 1 1 1 Improving Part-of-Speech Tagging by Combining Pointwise and Sequence-based Predictors Yosuke NAKATA, 1 Graham NEUBIG, 1 Shinsuke MORI 1 and Tatsuya KAWAHARA 1 This paper proposes

More information

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手 BCCWJ における固有表現抽出のエラー分析 市原正陽 ( 茨城大学工学部情報工学科 ) 山崎舞子 ( 東京工業大学大学院総合理工学研究科 ) 古宮嘉那子 ( 茨城大学工学部情報工学科 ) Error Analysis of Named Entity Extraction in BCCWJ Masaaki Ichihara(Department of Computer and Information

More information

¥ì¥·¥Ô¤Î¸À¸ì½èÍý¤Î¸½¾õ

¥ì¥·¥Ô¤Î¸À¸ì½èÍý¤Î¸½¾õ 2013 8 18 Table of Contents = + 1. 2. 3. 4. 5. etc. 1. ( + + ( )) 2. :,,,,,, (MUC 1 ) 3. 4. (subj: person, i-obj: org. ) 1 Message Understanding Conference ( ) UGC 2 ( ) : : 2 User-Generated Content [

More information

コーパスに基づく言語学教育研究報告 8

コーパスに基づく言語学教育研究報告 8 No.82012 5 5 1. 2. 2009 BCCWJ 2007 1 12 BCCWJ Yahoo! BCCWJ 57,807 4,459 5,110 854 1,500 Yahoo! 45,725 159 57,807 2009 3. 1 2 3 X A 3 20102011 1 2 X A 1 X X X X X A 2 1 X A 3 1 1 2 3 2 http://mainet.ath.cx/bbs/sst/sst.php?act=dump&cate=hxh&all=2035&n=2

More information

( : A8TB2163)

( : A8TB2163) 2011 2012 3 26 ( : A8TB2163) ( A B [1] A B A B B i 1 1 2 3 2.1... 3 2.1.1... 3 2.1.2... 4 2.2... 5 3 7 3.1... 7 3.2... 7 3.3 A B... 7 4 8 4.1... 8 4.1.1... 9 4.1.2... 9 4.1.3... 9 4.1.4... 10 4.2 A B...

More information

Microsoft PowerPoint LRW.pptx

Microsoft PowerPoint LRW.pptx Reading Time Balanced Corpus Corpus Annotation Data 文節 文 画面 A 470 66 19 B 455 67 21 C 355 44 16 D 363 41 15 Group 視線走査法自己ペース読文法 1 A 境界なし B 境界あり C 境界なし D 境界あり 2 A 境界あり B 境界なし C 境界あり D 境界なし 3 C 境界なし

More information

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1 ACL2013 TACL 1 ACL2013 Grounded Language Learning from Video Described with Sentences (Yu and Siskind 2013) TACL Transactions of the Association for Computational Linguistics What Makes Writing Great?

More information

自然言語処理21_249

自然言語処理21_249 1,327 Annotation of Focus for Negation in Japanese Text Suguru Matsuyoshi This paper proposes an annotation scheme for the focus of negation in Japanese text. Negation has a scope, and its focus falls

More information

21 Pitman-Yor Pitman- Yor [7] n -gram W w n-gram G Pitman-Yor P Y (d, θ, G 0 ) (1) G P Y (d, θ, G 0 ) (1) Pitman-Yor d, θ, G 0 d 0 d 1 θ Pitman-Yor G

21 Pitman-Yor Pitman- Yor [7] n -gram W w n-gram G Pitman-Yor P Y (d, θ, G 0 ) (1) G P Y (d, θ, G 0 ) (1) Pitman-Yor d, θ, G 0 d 0 d 1 θ Pitman-Yor G ol2013-nl-214 No6 1,a) 2,b) n-gram 1 M [1] (TG: Tree ubstitution Grammar) [2], [3] TG TG 1 2 a) ohno@ilabdoshishaacjp b) khatano@maildoshishaacjp [4], [5] [6] 2 Pitman-Yor 3 Pitman-Yor 1 21 Pitman-Yor

More information

114 583/4 2012

114 583/4 2012 5-5 Fundamental Language Resources HASHIMOTO Chikara, Jong-Hoon Oh, SANO Motoki, and KAWADA Takuya Fundamental language resources are classifi ed into natural language processing tools and natural language

More information

[4], [5] [6] [7] [7], [8] [9] 70 [3] 85 40% [10] Snowdon 50 [5] Kemper [3] 2.2 [11], [12], [13] [14] [15] [16]

[4], [5] [6] [7] [7], [8] [9] 70 [3] 85 40% [10] Snowdon 50 [5] Kemper [3] 2.2 [11], [12], [13] [14] [15] [16] 1,a) 1 2 1 12 1 2Type Token 2 1 2 1. 2013 25.1% *1 2012 8 2010 II *2 *3 280 2025 323 65 9.3% *4 10 18 64 47.6 1 Center for the Promotion of Interdisciplinary Education and Research, Kyoto University 2

More information

jpaper : 2017/4/17(17:52),,.,,,.,.,.,, Improvement in Domain Specific Word Segmentation by Symbol Grounding suzushi tomori, hirotaka kameko, takashi n

jpaper : 2017/4/17(17:52),,.,,,.,.,.,, Improvement in Domain Specific Word Segmentation by Symbol Grounding suzushi tomori, hirotaka kameko, takashi n ,,.,,,.,.,.,, Improvement in Domain Specific Word Segmentation by Symbol Grounding suzushi tomori, hirotaka kameko, takashi ninomiya, shinsuke mori and yoshimasa tsuruoka We propose a novel framework for

More information

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. fnirs Kai Kunze 599 8531 1 1 223 8526 4 1 1 E-mail: yoshimura@m.cs.osakafu-u.ac.jp, kai@kmd.keio.ac.jp,

More information

(Microsoft Word - JCLWorkshop2013_2\214\303\213{.doc)

(Microsoft Word - JCLWorkshop2013_2\214\303\213{.doc) 分 類 器 の 確 信 度 を 用 いた 合 議 制 による 語 義 曖 昧 性 解 消 の unsupervised な 領 域 適 応 古 宮 嘉 那 子 ( 東 京 農 工 大 学 工 学 研 究 院 ) 奥 村 学 ( 東 京 工 業 大 学 精 密 工 学 研 究 所 ) 小 谷 善 行 ( 東 京 農 工 大 学 工 学 研 究 院 ) Unsupervised Domain Adaptation

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

(2008) JUMAN *1 (, 2000) google MeCab *2 KH coder TinyTextMiner KNP(, 2000) google cabocha(, 2001) JUMAN MeCab *1 *2 h

(2008) JUMAN *1 (, 2000) google MeCab *2 KH coder TinyTextMiner KNP(, 2000) google cabocha(, 2001) JUMAN MeCab *1  *2 h The Society for Economic Studies The University of Kitakyushu Working Paper Series No. 2011-12 (accepted in March 30, 2012) () (2009b) 19 (2003) 1980 PC 1990 (, 2009) (2001) (2004) KH coder (2009) TinyTextMiner

More information

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2 自然言語処理プログラミング勉強会 12 係り受け解析 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2 構文解析の種類 係り受け解析 : 単語と単語のつながりを重視 I saw a girl with a telescope 句構造解析

More information

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 品詞推定 文 X が与えられた時の品詞列 Y を予測する Natural language processing ( NLP ) is a field of computer science JJ -LRB- -RRB- VBZ DT IN 予測をどうやって行うか

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

1 7.35% 74.0% linefeed point c 200 Information Processing Society of Japan

1 7.35% 74.0% linefeed point c 200 Information Processing Society of Japan 1 2 3 Incremental Linefeed Insertion into Lecture Transcription for Automatic Captioning Masaki Murata, 1 Tomohiro Ohno 2 and Shigeki Matsubara 3 The development of a captioning system that supports the

More information

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp 1. 1 1 1 2 treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corpus Management Tool: ChaKi Yuji Matsumoto, 1 Masayuki Asahara, 1 Masakazu Iwatate 1 and Toshio Morita 2 This paper

More information

プログラム・抄録集.indd

プログラム・抄録集.indd 20th Annual Meeting of the Japanese Society for Oral Mucous Membrane 21st Annual Meeting of the Japanese Society of Oral Pathology 2 3 4 5 6 7 8 9 10 11 12 14 15 16 17 18 19 20 21 22 23 24 25 28 29

More information

™…{,

™…{, 57 th Annual Meeting of The Japanese Society of Child Health The 57th Annual Meeting of the Japanese Society of Child Health 3 4 The 57th Annual Meeting of the Japanese Society of Child Health 5 6 The

More information

DEIM Forum 2015 F8-4 Twitter Twitter 1. SNS

DEIM Forum 2015 F8-4 Twitter Twitter 1. SNS DEIM Forum 2015 F8-4 Twitter 432 8011 3-5-1 432 8011 3-5-1 E-mail: cs11032@s.inf.shizuoka.ac.jp, {yokoyama,fyamada}@inf.shizuoka.ac.jp Twitter 1. SNS SNS SNS Twitter 1 Twitter SNS facebook 2 mixi 3 Twitter

More information

タイトルは14ポイント&ボールドMS明朝

タイトルは14ポイント&ボールドMS明朝 SVM を用いたインドネシア語連体従属接続詞の判定システム Wahyu Purnomo( 東京農工大学工学部情報工学科 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) SVM-based System for the Determination of Adnominal Subordinating Conjunction in

More information

6 68

6 68 1 2 3 1 2 4 67 6 68 1990 Y X X Y 1994 Y Y X X X 10 69 10 10 11 13 11 12 13 11 12 70 11 12Y 11 12 11 12 11 12 13 13 13 1994 14 15 1994 64 16 1994 67 17 71 17 17 17 16 Alfonso 1974 1973 1984 1991 1990 18

More information

i

i 2011 2012 3 26 ( : A8TB2114) i 1 1 2 3 2.1 Espresso................................. 3 2.2 CPL................................... 4 2.3.................................... 5 2.4.........................

More information

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor 独立行政法人情報通信研究機構 KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the information analysis system WISDOM as a research result of the second medium-term plan. WISDOM has functions that

More information

main.dvi

main.dvi 305 8550 1 2 CREST fujii@slis.tsukuba.ac.jp 1 7% 2 2 3 PRIME Multi-lingual Information Retrieval 2 2.1 Cross-Language Information Retrieval CLIR 1990 CD-ROM a. b. c. d. b CLIR b 70% CLIR CLIR 2.2 (b) 2

More information

先行研究 pp

先行研究 pp N N 1 BCCWJ 1 はじめに 2007 362 a a. b. a. b. a b 2007 363 A B A B A B A A B A B 1 2014 2 5 53 54 2007 363 2 先行研究 200719771989 1998 2001 1993 2004 1977 pp.122 130 N N 55 1989 2 pp.20 21 3 pp.34 35 2 3 56 1998

More information

(NICT) ( ) ( ) (NEC) ( )

(NICT) ( ) ( ) (NEC) ( ) (NICT) ( ) () (NEC) ( ) ! Paraphrase (Paraphrasing) l l ! l h"p://paraphrasing.org/bib- cat.html l 12 50 l 640 (2014 6)! l l l l l l ! [ ] 2! [ ] ( )! :............ 1 2 1 = 2 = ! [ ]! [ ]! :............

More information

Computational Semantics 1 category specificity Warrington (1975); Warrington & Shallice (1979, 1984) 2 basic level superiority 3 super-ordinate catego

Computational Semantics 1 category specificity Warrington (1975); Warrington & Shallice (1979, 1984) 2 basic level superiority 3 super-ordinate catego Computational Semantics 1 category specificity Warrington (1975); Warrington & Shallice (1979, 1984) 2 basic level superiority 3 super-ordinate category preservation 1 / 13 analogy by vector space Figure

More information

レビューテキストの書き の評価視点に対する評価点の推定 29 3

レビューテキストの書き の評価視点に対する評価点の推定 29 3 JAIST Reposi https://dspace.j Title レヒ ューテキストの書き手の評価視点に対する評価 点の推定 Author(s) 張, 博 Citation Issue Date 2017-03 Type Thesis or Dissertation Text version author URL http://hdl.handle.net/10119/14154 Rights

More information

main.dvi

main.dvi DEIM Forum 2017 D3-4 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0053 1-3-15 6F 101-8430 2-1-2 This paper presents techniques of retrieving know-how sites from the collection of Web pages. The proposed techniques

More information

[1], B0TB2053, 20014 3 31. i

[1], B0TB2053, 20014 3 31. i B0TB2053 20014 3 31 [1], B0TB2053, 20014 3 31. i 1 1 2 3 2.1........................ 3 2.2........................... 3 2.3............................. 4 2.3.1..................... 4 2.3.2....................

More information

gengo.dvi

gengo.dvi 4 97.52% tri-gram 92.76% 98.49% : Japanese word segmentation by Adaboost using the decision list as the weak learner Hiroyuki Shinnou In this paper, we propose the new method of Japanese word segmentation

More information

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成 Encoding Source Language with Convolu5onal Neural Network for Machine Transla5on Fandong Meng, Zhengdong Lu, Mingxuan Wang, Hang Li, Wenbin Jiang, Qun Liu, ACL- IJCNLP 2015 すずかけ読み会奥村 高村研究室博士二年上垣外英剛 概要

More information

一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGIN

一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGIN 一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 IEICE Technical Report SP2019-12(2019-08)

More information

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root 1,a) 2 2 1. 1 College of Information Science, School of Informatics, University of Tsukuba 2 Faculty of Engineering, Information and Systems, University of Tsukuba a) oharada@iplab.cs.tsukuba.ac.jp 2.

More information

ス言語学の影響でコロケーション分析がコーパスと統計指標 (raw frequency, t-score, log-likelihood ration, MI-score, など ) によって行われるようになった それにも関わらず現在でも統計的に採集されるデータは手作業で分析しなければならない 一般的

ス言語学の影響でコロケーション分析がコーパスと統計指標 (raw frequency, t-score, log-likelihood ration, MI-score, など ) によって行われるようになった それにも関わらず現在でも統計的に採集されるデータは手作業で分析しなければならない 一般的 日本語教育とコロケーション : 連語の形で用法を学ぶ重要性 STRAFELLA Elga Laura( 国立国語研究所日本語学術振興会特別研究員 ) 前川喜久雄 ( 国立国語研究所コーパス開発センター言語資源研究系 ) Japanese-language Education and Collocations: The Importance of Learning Word Co-occurrences

More information

( )

( ) B4IM2035 2017 2 10 ( ) (e.g., eat ) (e.g., arrest ),,, 10., B4IM2035, 2017 2 i 1 1 2 3 2.1................. 3 2.2........ 3 3 5 3.1.... 5 3.2 DCS Vector.............................. 6 3.3 DCS Vector.......

More information

Modal Phrase MP because but 2 IP Inflection Phrase IP as long as if IP 3 VP Verb Phrase VP while before [ MP MP [ IP IP [ VP VP ]]] [ MP [ IP [ VP ]]]

Modal Phrase MP because but 2 IP Inflection Phrase IP as long as if IP 3 VP Verb Phrase VP while before [ MP MP [ IP IP [ VP VP ]]] [ MP [ IP [ VP ]]] 30 4 2016 3 pp.195-209. 2014 N=23 (S)AdvOV (S)OAdvV 2 N=17 (S)OAdvV 2014 3, 2008 Koizumi 1993 3 MP IP VP 1 MP 2006 2002 195 Modal Phrase MP because but 2 IP Inflection Phrase IP as long as if IP 3 VP Verb

More information

Corrected Version NICT /11/15, 1 Thursday, May 7,

Corrected Version NICT /11/15, 1 Thursday, May 7, Corrected Version NICT 26 2008/11/15, 1 1 Word Sketch Engine (Kilgarriff & Tugwell 01; Srdanovic, et al. 08) 2 2 3 3 ( ) I-Language Grammar is Grammar and Usage is Usage (Newmeyer 03) 4 4 (is-a ) ( ) (

More information

3. データ本発表では 2011 年 12 月にリリースされた 現代日本語書き言葉均衡コーパス の DVD 版を使用した Disk1 の M-XML フォルダに含まれる xml ファイルが対象である この xml ファイルは可変長サンプルと固定長サンプルを統合したもので 短単位 長単位の形態論情報の

3. データ本発表では 2011 年 12 月にリリースされた 現代日本語書き言葉均衡コーパス の DVD 版を使用した Disk1 の M-XML フォルダに含まれる xml ファイルが対象である この xml ファイルは可変長サンプルと固定長サンプルを統合したもので 短単位 長単位の形態論情報の 共起語率の分布からみるテキストの語彙的特徴 山崎誠 ( 国立国語研究所言語資源研究系 ) Lexical Characteristics of Text as Seen in the Distribution of Co-occurrence Rate Makoto Yamazaki (Dept. Corpus Studies, NINJAL) 1. はじめに 現代日本語書き言葉均衡コーパス (Balanced

More information

20mm 63.92% ConstantZoom U 5

20mm 63.92% ConstantZoom U 5 29 30 2 13 16350926 20mm 63.92% ConstantZoom U 5 1 3 1.1...................................... 3 1.2................................. 4 2 8 2.1............... 8 2.2............................ 8 2.3..

More information

Vol. 9 No. 5 Oct. 2002 (?,?) 2000 6 5 6 2 3 6 4 5 2 A B C D 132

Vol. 9 No. 5 Oct. 2002 (?,?) 2000 6 5 6 2 3 6 4 5 2 A B C D 132 2000 6 5 6 :, Supporting Conference Program Production Using Natural Language Processing Technologies Hiromi itoh Ozaku Masao Utiyama Masaki Murata Kiyotaka Uchimoto and Hitoshi Isahara We applied natural

More information

IPSJ SIG Technical Report Vol.2017-SLP-115 No /2/18 1,a) 1 1,2 Sakriani Sakti [1][2] [3][4] [5][6][7] [8] [9] 1 Nara Institute of Scie

IPSJ SIG Technical Report Vol.2017-SLP-115 No /2/18 1,a) 1 1,2 Sakriani Sakti [1][2] [3][4] [5][6][7] [8] [9] 1 Nara Institute of Scie 1,a) 1 1,2 Sakriani Sakti 1 1 1 1. [1][2] [3][4] [5][6][7] [8] [9] 1 Nara Institute of Science and Technology 2 Japan Science and Technology Agency a) ishikawa.yoko.io5@is.naist.jp 2. 1 Belief-Desire theory

More information

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as 計量国語学 アーカイブ ID KK300601 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as a Source of Information for Etymological Studies 著者

More information

untitled

untitled The 23rd Annual Meeting of the Japanese Association of Cardiac Rehabilitation! The 23rd Annual Meeting of the Japanese Association of Cardiac Rehabilitation The 23rd Annual Meeting of the Japanese Association

More information

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201 BGM 1,4,a) 1 2 2 3,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 2015 1 100.. Web.. BGM.BGM [1]. BGM BGM 1 Waseda University, Shinjuku, Tokyo 169-8555, Japan 2 3 4 JST CREST a) ha-ru-ki@asagi.waseda.jp.

More information

els08ws-kuroda-slides.key

els08ws-kuroda-slides.key NICT 26 2008/11/15, Word Sketch Engine (Kilgarriff & Tugwell 01; Srdanovic, et al. 08) ( ) I-Language Grammar is Grammar and Usage is Usage (Newmeyer 03) (is-a ) ( )?? () // () ()???? ? ( )?? ( ) Web ??

More information

!

! The 22nd Annual Meeting of the Japanese Association of Cardiac Rehabilitation ! The 22nd Annual Meeting of the Japanese Association of Cardiac Rehabilitation The 22nd Annual Meeting of the Japanese Association

More information

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3) (MIRU2012) 2012 8 820-8502 680-4 E-mail: {d kouno,shimada,endo}@pluto.ai.kyutech.ac.jp (1) (2) (3) (4) 4 AdaBoost 1. Kanade [6] CLAFIC [12] EigenFace [10] 1 1 2 1 [7] 3 2 2 (1) (2) (3) (4) 4 4 AdaBoost

More information

corpus.indd

corpus.indd 22 JC-D-10-02 23 2 c 2011 21 1 I BCCWJ 3 1 BCCWJ 5 1.1 BCCWJ 3..................... 5 1.2 BCCWJ 2...................... 6 2 3 SC 7 2.1 SC SC............. 7 2.1.1 SC SC................... 7 2.1.2......................

More information

The Plasma Boundary of Magnetic Fusion Devices

The Plasma Boundary of Magnetic Fusion Devices ASAKURA Nobuyuki, Japan Atomic Energy Research Institute, Naka, Ibaraki 311-0193, Japan e-mail: asakuran@fusion.naka.jaeri.go.jp The Plasma Boundary of Magnetic Fusion Devices Naka Fusion Research Establishment,

More information

b n m, m m, b n 3

b n m, m m, b n 3 13th Annual Worlds of Flavor International Conference & Festival z x c v z x c v 2 b n m, m m, b n 3 . 0 1 2 3 4 5. 0 1 2 3 4 4 5 6 7 8 6 7 8 5 9 0 1 2 3 9 0 1 2 3 6 4 5 6 7 8 4 5 6 7 8 9 7 0 1 2 3 9 0

More information

Title マルチメディア コーパスの 構 築 と 活 用 : 表 現 行 動 の 計 量 的 研 究 のために Author(s) 孫, 栄 奭 Citation 阪 大 日 本 語 研 究. 22 P.65-P.90 Issue 2010-02 Date Text Version publisher URL http://hdl.handle.net/11094/10048 DOI Rights

More information

IPSJ SIG Technical Report Vol.2018-SE-200 No /12/ Proposal of test description support environment for request acquisition in web appli

IPSJ SIG Technical Report Vol.2018-SE-200 No /12/ Proposal of test description support environment for request acquisition in web appli 1 1 1 2 Proposal of test description support environment for request acquisition in web application development Nakaji Yoshitake 1 Choi Eunjong 1 Iida Hajimu 1 Yoshida Norihiro 2 1. 1 ( ) 1 Nara Institute

More information

_314I01BM浅谷2.indd

_314I01BM浅谷2.indd 587 ネットワークの表現学習 1 1 1 1 Deep Learning [1] Google [2] Deep Learning [3] [4] 2014 Deepwalk [5] 1 2 [6] [7] [8] 1 2 1 word2vec[9] word2vec 1 http://www.ai-gakkai.or.jp/my-bookmark_vol31-no4 588 31 4 2016

More information

0210研究会

0210研究会 複数のソーシャルメディアのレビューを 用いた商品比較基盤技術の提案 甲南大学大学院自然科学研究科服部祐基 甲南大学知能情報学部灘本明代 背景 ソーシャルメディアを用いて情報を取得する行為が多くなっている 商品の購入 商品認知の情報源 購入のきっかけとなった情報源 として 約 40% ものインターネットユーザがソーシャルメディアを活用している 1),2) ソーシャルメディアの書き込みを商品購入の際の参考にしているユーザが多く存在している

More information

Twitter Twitter [5] ANPI NLP 5 [6] Lee [7] Lee [8] Twitter Flickr FreeWiFi FreeWiFi Flickr FreeWiFi 2. 2 Mikolov [9] [10] word2vec word2vec word2vec k

Twitter Twitter [5] ANPI NLP 5 [6] Lee [7] Lee [8] Twitter Flickr FreeWiFi FreeWiFi Flickr FreeWiFi 2. 2 Mikolov [9] [10] word2vec word2vec word2vec k DEIM Forum 2018 H1-3 700-8530 3-1-1 E-mail: {nakagawa, niitsuma, ohta}@de.cs.okayama-u.ac.jp Twitter 3 Wikipedia Weblio Yahoo! Paragraph Vector NN NN 1. doc2vec SNS 9 [1] SNS [2] Twitter 1 4 4 Wikipedia

More information

385 安全 / 環境関連国際規格特集号 ISO の概要と日本人への適用の妥当性 ISO ISO ISO キーワード 1. はじめに ISO IEC Guide 51 ISO ISO ISO ISO

385 安全 / 環境関連国際規格特集号 ISO の概要と日本人への適用の妥当性 ISO ISO ISO キーワード 1. はじめに ISO IEC Guide 51 ISO ISO ISO ISO 385 安全 / 環境関連国際規格特集号 ISO 13857 の概要と日本人への適用の妥当性 ISO 13857 ISO 13857 ISO 13857 キーワード 1. はじめに ISO IEC Guide 51 ISO 13854 ISO 13855 ISO 13857 ISO 13857 1 図 1 2 ISO 13852 ISO 13853 2008 ISO 13852 13853 JIS

More information

CJL NEWS VOL.18 2005 JANUARY contents

CJL NEWS VOL.18 2005 JANUARY contents CJL NEWS VOL.18 2005 JANUARY contents 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Information http://bbs12.otd.co.jp/1223567/bbs_plain Information Information 16 CENTER FOR JAPANESE LANGUAGE WASEDA UNIVERSITY

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Izard 10 [1]Plutchik 8 [2] [3] Izard Neviarouskaya [4][5] 2.2 Hao [6] 1 Twitter[a] a) Shook Wikipedia

Izard 10 [1]Plutchik 8 [2] [3] Izard Neviarouskaya [4][5] 2.2 Hao [6] 1 Twitter[a] a)  Shook Wikipedia 1 2 2 2 Visualization for Spatiotemporal Distribution of People's Rich Emotions KIYOHISA TAGUCHI 1 KAZUO MISUE 2 JIRO TANAKA 2 To grasp spatiotemporal changes of rich emotions for a large number of people,

More information

3 4 26 1980 1 WWW 26! 3, ii 4 7!! 4 2010 8 1. 1.1... 1 1.2... 2 1.3... 3 1.4... 7 1.5... 9... 9 2. 2.1... 10 2.2... 13 2.3... 16 2.4... 18... 21 3. 3.1... 22 3.2... 24 3.3... 33... 38 iv 4. 4.1... 39 4.2...

More information

Microsoft Word - DEIM論文3.doc

Microsoft Word - DEIM論文3.doc DEIM Forum 2017 A2-1 ニュース記事を用いた時事問題自動作問システム 久田将史 前田亮 立命館大学情報理工学部 525-8577 滋賀県草津市野路東 1-1-1 E-mail: is0230kx@ed.ritsumei.ac.jp,amaeda@is.ritsumei.ac.jp あらまし コンピュータが問題を出題するシステムの多くが, あらかじめ用意しておいた問題文と解答を用いて出題してい

More information

13金子敬一.indd

13金子敬一.indd 1 1 Journal of Multimedia Aided Education Research, 2004, No. 1, 115122 ED21 1 2 2 WWW 158 34 Decker 3 ED21 ED21 1 ED21 1 CS 1 2 ED213 4 5 ED21 ED21 ED21 ED9900 9 EL21 EE21 EC21 ED9900 JavaApplet JavaApplet

More information

IPSJ SIG Technical Report Vol.2010-GN-75 No /3/19 1. Proposal and Evaluation of Laboratory Experiments for understanding Offshore Software Deve

IPSJ SIG Technical Report Vol.2010-GN-75 No /3/19 1. Proposal and Evaluation of Laboratory Experiments for understanding Offshore Software Deve 1. Proposal and Evaluation of Laboratory Experiments for understanding Offshore Software Development Lihua Xuan and Takaya Yuizono Issues of offshore software development are how to treat specification

More information

untitled

untitled DEIM Forum 2019 C1-2 305-8573 1-1-1 305-8573 1-1-1 () 151-0053 1-3-15 6F QA,,,, Detecting and Analysing Chinese Web Sites for Collecting Know-How Knowledge Wenbin NIU, Yohei OHKAWA,ShutoKAWABATA,ChenZHAO,TianNIE,

More information

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO DEIM Forum 2012 C8-5 WikiBOK 252 5258 5 10 1 E-mail: shunsuke.shibuya@gmail.com, {kaz,masunaga}@si.aoyama.ac.jp, {yabuki,sakuta}@it.aoyama.ac.jp Body Of Knowledge, BOK BOK BOK BOK BOK, BOK Abstract Extention

More information

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst 1,a) 1 1 1 deep neural netowrk(dnn) (HMM) () GMM-HMM 2 3 (CSJ) 1. DNN [6]. GPGPU HMM DNN HMM () [7]. [8] [1][2][3] GMM-HMM Gaussian mixture HMM(GMM- HMM) MAP MLLR [4] [3] DNN 1 1 triphone bigram [5]. 2

More information

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph 1 2 1 Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph Satoshi Shimada, 1 Tomohiro Fukuhara 2 and Tetsuji Satoh 1 We had proposed a navigation method that generates

More information

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟度別クラス編成を実施している 本稿では さらにの導入へ向けて 既存のプレイスメントテストを活用したクラス編成の可能性について検討した 3 教科に関するプレイスメントテストの偏差値を説明変数

More information

Mimehand II[1] [2] 1 Suzuki [3] [3] [4] (1) (2) 1 [5] (3) 50 (4) 指文字, 3% (25 個 ) 漢字手話 + 指文字, 10% (80 個 ) 漢字手話, 43% (357 個 ) 地名 漢字手話 + 指文字, 21

Mimehand II[1] [2] 1 Suzuki [3] [3] [4] (1) (2) 1 [5] (3) 50 (4) 指文字, 3% (25 個 ) 漢字手話 + 指文字, 10% (80 個 ) 漢字手話, 43% (357 個 ) 地名 漢字手話 + 指文字, 21 1 1 1 1 1 1 1 2 transliteration Machine translation of proper names from Japanese to Japanese Sign Language Taro Miyazaki 1 Naoto Kato 1 Hiroyuki Kaneko 1 Seiki Inoue 1 Shuichi Umeda 1 Toshihiro Shimizu

More information

24 Region-Based Image Retrieval using Fuzzy Clustering

24 Region-Based Image Retrieval using Fuzzy Clustering 24 Region-Based Image Retrieval using Fuzzy Clustering 1130323 2013 3 9 Visual-key Image Retrieval(VKIR) k-means Fuzzy C-means 2 200 2 2 20 VKIR 5 18% 54% 7 30 Fuzzy C-means i Abstract Region-Based Image

More information

5temp+.indd

5temp+.indd 特集不自然言語処理 枠に収まらない リアルな 言語処理 5 日本語学習児の初期語彙発達 基応専般 小林哲生 永田昌明 NTT コミュニケーション科学基礎研究所 幼児の言語発達 発話データ収集の問題点 1 1 2 3 理 理 1 1 理 comprehensionproduction 理 理 1 first word 1 2 3 1 cross-sectional data 図 -1 12, 18,

More information

298

298 Head Greenberg 297 298 Nakagawa 299 A B A B A A B 300 301 A B 302 y nmù f ncun A A 303 A A B 304 XY X Y Y [A] [B] 墙 墙 305 A B 墙 306 307 Vol. Nakagawa Masayuki Word Order in Modern Chinese A Cognitive Perspective

More information

Haiku Generation Based on Motif Images Using Deep Learning Koki Yoneda 1 Soichiro Yokoyama 2 Tomohisa Yamashita 2 Hidenori Kawamura Scho

Haiku Generation Based on Motif Images Using Deep Learning Koki Yoneda 1 Soichiro Yokoyama 2 Tomohisa Yamashita 2 Hidenori Kawamura Scho Haiku Generation Based on Motif Images Using Deep Learning 1 2 2 2 Koki Yoneda 1 Soichiro Yokoyama 2 Tomohisa Yamashita 2 Hidenori Kawamura 2 1 1 School of Engineering Hokkaido University 2 2 Graduate

More information

IPSJ SIG Technical Report Vol.2016-ICS-183 No /3/16 1,a) 2,b) 2,c) 1,d) e- Maeda Kaoru 1,a) Yoshida Naoto 2,b) Fujiwara Kunihiko 2,c) Yonezawa T

IPSJ SIG Technical Report Vol.2016-ICS-183 No /3/16 1,a) 2,b) 2,c) 1,d) e- Maeda Kaoru 1,a) Yoshida Naoto 2,b) Fujiwara Kunihiko 2,c) Yonezawa T 1,a) 2,b) 2,c) 1,d) e- Maeda Kaoru 1,a) Yoshida Naoto 2,b) Fujiwara Kunihiko 2,c) Yonezawa Tomoko 1,d) 1. e- [1] e- [2] e- e- 1 [4] [5] 1 Kansai University 2 Graduate School of Informatics Kansai University

More information

IPSJ SIG Technical Report Vol.2009-BIO-17 No /5/ (SVM) Boosting SVM Prediction of Drug Clearance Pathway by Boosting Algorithm Ka

IPSJ SIG Technical Report Vol.2009-BIO-17 No /5/ (SVM) Boosting SVM Prediction of Drug Clearance Pathway by Boosting Algorithm Ka 1 1 2 2 2 1 (SVM) Boosting SVM Prediction of Drug Clearance Pathway by Boosting Algorithm Kazushi Ikeda, 1 Kouta Toshimoto, 1 Makiko Kusama, 2 Kazuya Maeda, 2 Yuichi Sugiyama 2 and Yutaka Akiyama 1 It

More information

電子情報通信学会ワードテンプレート (タイトル)

電子情報通信学会ワードテンプレート (タイトル) DEIM Foru 212 A9-4 感性パラメータを用いた書誌情報からの図書推薦手法の提案 垣内将希 高岡幸一 灘本明代 甲南大学知能情報学部 658-72 兵庫県神戸市東灘区岡本 8 丁目 9 1 甲南大学大学院自然科学研究科 658-72 兵庫県神戸市東灘区岡本 8 丁目 9 1 E-ail: {si87138@center.,nadaoto@}konan-u.ac.jp, tk_kouichi@yahoo.co.jp

More information

2014年度の研究報告

2014年度の研究報告 2014 年度の研究報告 カラの主語性に関する研究 ーコーパス検索および文処理実験ー 1 D1としての一年 実験手法の勉強 EPR 行動実験 眼球運動 カラのコーパス検索 カラの構造的位置に関する文処理実験 ことばの科学 台湾での実験 報告内容 研究の構成 コーパス検索 ( カラの使用法の頻度パターン ) 文処理実験 今年の予定 研究の構成 カラ デ ニの主語性 に関して ( 三上 1970) コーパス検索の研究

More information

main.dvi

main.dvi DEIM Forum 2018 J7-3 305-8573 1-1-1 305-8573 1-1-1 305-8573 1-1-1 () 151-0053 1-3-15 6F URL SVM Identifying Know-How Sites basedonatopicmodelandclassifierlearning Jiaqi LI,ChenZHAO, Youchao LIN, Ding YI,ShutoKAWABATA,

More information

2 21,238 35 2 2 Twitter 3 4 5 6 2. 2.1 SNS 2.2 2. 1 [8] [5] [7] 2. 2 SNS SNS 2 2. 2. 1 Cheng [2] Twitter [6] 2. 2. 2 Backstrom [1] Facebook 3 Jurgens

2 21,238 35 2 2 Twitter 3 4 5 6 2. 2.1 SNS 2.2 2. 1 [8] [5] [7] 2. 2 SNS SNS 2 2. 2. 1 Cheng [2] Twitter [6] 2. 2. 2 Backstrom [1] Facebook 3 Jurgens DEIM Forum 2016 B4-3 地域ユーザに着目した口コミツイート収集手法の提案 長島 里奈 関 洋平 圭 猪 筑波大学 情報学群 知識情報 図書館学類 305 8550 茨城県つくば市春日 1 2 筑波大学 図書館情報メディア系 305 8550 茨城県つくば市春日 1 2 つくば市役所 305 8555 茨城県つくば市研究学園 1 1 1 E-mail: s1211530@u.tsukuba.ac.jp,

More information

IPSJ SIG Technical Report Vol.2013-CE-119 No /3/15 C 1 1 Web C MILES(Model-based Interactive Learning Support) MILES 1. C C MILES(Model-based In

IPSJ SIG Technical Report Vol.2013-CE-119 No /3/15 C 1 1 Web C MILES(Model-based Interactive Learning Support) MILES 1. C C MILES(Model-based In C 1 1 Web C MILES(Model-based Interactive Learning Support) MILES 1. C C MILES(Model-based Interactive Learning Support) ( 1 ) C ( 2 ) 1 Meiji University, Tama, Kanagawa 214 8571, Japan MILES 2 MILES 3

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

Vol. 22 No. 2 June 2015 and language expressions. Based on these backgrounds, in this study, we discuss the definition of a tag set for recipe terms a

Vol. 22 No. 2 June 2015 and language expressions. Based on these backgrounds, in this study, we discuss the definition of a tag set for recipe terms a ( ) 7 8,,,, Definition of Recipe Terms and Corpus Annotation for their Automatic Recognition Tetsuro Sasada, Shinsuke Mori, Yoko Yamakata, Hirokuni Maeta and Tatsuya Kawahara In natural language processing

More information

Title 中國宗教文獻研究國際シンポジウム報告書 ( 大規模佛教文獻群に對する確率統計的分析の試み / 師茂樹 ) Author(s) Citation (2004) Issue Date URL Right Typ

Title 中國宗教文獻研究國際シンポジウム報告書 ( 大規模佛教文獻群に對する確率統計的分析の試み / 師茂樹 ) Author(s) Citation (2004) Issue Date URL   Right Typ Title 中國宗教文獻研究國際シンポジウム報告書 ( 大規模佛教文獻群に對する確率統計的分析の試み / 師茂樹 ) Author(s) Citation (2004) Issue Date 2004-12 URL http://hdl.handle.net/2433/65875 Right Type Conference Paper Textversion publisher Kyoto University

More information