フレーズベース機械翻訳システムの構築 フレーズベース機械翻訳システムの構築 Graham Neubig & Kevin Duh 奈良先端科学技術大学院大学 (NAIST) 5/10/2012 1

Similar documents
2

IPSJ SIG Technical Report Vol.2014-NL-219 No /12/17 1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e) 1. [23] 1(a) 1(b) [19] n-best [1] 1 N

統計的機械翻訳モデルの構築 各モデルを対訳文から学習 対訳文 太郎が花子を訪問した Taro visited Hanako. 花子にプレセントを渡した He gave Hanako a present.... モデル翻訳モデル並べ替えモデル言語モデル 2

f ê ê = arg max Pr(e f) (1) e M = arg max λ m h m (e, f) (2) e m=1 h m (e, f) λ m λ m BLEU [11] [12] PBMT 2 [13][14] 2.2 PBMT Hiero[9] Chiang PBMT [X

( ) Kevin Duh

Vol. 23 No. 5 December (Rule-Based Machine Translation; RBMT (Nirenburg 1989)) 2 (Statistical Machine Translation; SMT (Brown, Pietra, Piet

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成

Vol. 23 No. 5 December (Rule-Based Machine Translation; RBMT (Nirenburg 1989)) 2 (Statistical Machine Translation; SMT (Brown, Pietra, Piet

2014/1 Vol. J97 D No. 1 2 [2] [3] 1 (a) paper (a) (b) (c) 1 Fig. 1 Issues in coordinating translation services. (b) feast feast feast (c) Kran

音声翻訳技術 音声翻訳技術 Graham Neubig 奈良先端科学技術大学院大学 NAIST 2015/5/11 共著者 中村哲 戸田智基 Sakriani Sakti 叶高朋 大串正矢 藤田朋希

自然言語処理22_289

taro.watanabe at nict.go.jp

21 Pitman-Yor Pitman- Yor [7] n -gram W w n-gram G Pitman-Yor P Y (d, θ, G 0 ) (1) G P Y (d, θ, G 0 ) (1) Pitman-Yor d, θ, G 0 d 0 d 1 θ Pitman-Yor G

アジア言語を中心とした機械翻訳の評価 第 1 回アジア翻訳ワークショップ概要 Evaluation of Machine Translation Focusing on Asian Languages Overview of the 1st Workshop on Asian Translation

How does machine translation work? Divide sentence into translatable patterns, reorder, combine Today I will give a lecture on machine translation. To

言語モデルの基礎 2

46 583/4 2012

NLP プログラミング勉強会 6 かな漢字変換 自然言語処理プログラミング勉強会 6 - かな漢字変換 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

89-95.indd

ニュラールネットに基づく機械翻訳 ニューラルネットに 基づく機械翻訳 Graham Neubig 奈良先端科学技術大学院大学 (NAIST)

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1

1. はじめに 2

Outline ACL 2017 ACL ACL 2017 Chairs/Presidents

jpaper : 2017/4/17(17:52),,.,,,.,.,.,, Improvement in Domain Specific Word Segmentation by Symbol Grounding suzushi tomori, hirotaka kameko, takashi n

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

自然言語処理23_175

A Japanese Word Dependency Corpus ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹

¥ì¥·¥Ô¤Î¸À¸ì½èÍý¤Î¸½¾õ

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

IPSJ-TOD

x i 2 x x i i 1 i xi+ 1xi+ 2x i+ 3 健康児に本剤を接種し ( 窓幅 3 n-gram 長の上限 3 の場合 ) 文字 ( 種 )1-gram: -3/ 児 (K) -2/ に (H) -1/ 本 (K) 1/ 剤 (K) 2/ を (H) 3/ 接 (K) 文字 (

BLEU Kishore Papineni, Salim Roukos, Todd Ward and Wei-Jing Zhu. (2002) BLEU: a method for Automatic Evaluation of Machine Translation. ACL. MT ( ) MT

_AAMT/Japio特許翻訳研究会.key

研究報告 2 自動評価法を用いた機械翻訳の定量的評価 越前谷博 ( 北海学園大学 ) 磯崎秀樹 ( 岡山県立大学 ) 目次 1. 自動評価法とは 2. 自動評価法における動向 Workshop on Statistical Machine Translationに参加して 3. 自動評価法 :APA

ズテーブルを 用 いて 対 訳 専 門 用 語 を 獲 得 する 手 法 を 提 案 する 具 体 的 には まず 専 門 用 語 対 訳 辞 書 獲 得 の 情 報 源 として 用 いる 日 中 対 訳 文 対 に 対 して 句 に 基 づく 統 計 的 機 械 翻 訳 モデルを 適 用 すること

1 7.35% 74.0% linefeed point c 200 Information Processing Society of Japan

[4], [5] [6] [7] [7], [8] [9] 70 [3] 85 40% [10] Snowdon 50 [5] Kemper [3] 2.2 [11], [12], [13] [14] [15] [16]

NLP プログラミング勉強会 4 単語分割 自然言語処理プログラミング勉強会 4 - 単語分割 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

: : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

(i) 1 (ii) ,, 第 5 回音声ドキュメント処理ワークショップ講演論文集 (2011 年 3 月 7 日 ) 1) 1 2) Lamel 2) Roy 3) 4) w 1 w 2 w n 2 2-g

[1] [2] [3] 1 GPS 1 Twitter *1 *1 GPS [4] [5] [6] 2 [7] 1 [8] Restricted Boltzmann Machine RBM RBM

Mimehand II[1] [2] 1 Suzuki [3] [3] [4] (1) (2) 1 [5] (3) 50 (4) 指文字, 3% (25 個 ) 漢字手話 + 指文字, 10% (80 個 ) 漢字手話, 43% (357 個 ) 地名 漢字手話 + 指文字, 21

[1], B0TB2053, i

1: NTT Yahoo! , , , , CIAIR CIAIR- ICSD CIAIR-ICSD 6 dlwz lg 3 30 dl wz 2 60 dl O D O:

名称未設定

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

自然言語処理24_705

_314I01BM浅谷2.indd

[1] B =b 1 b n P (S B) S S O = {o 1,2, o 1,3,, o 1,n, o 2,3,, o i,j,, o n 1,n } D = {d 1, d 2,, d n 1 } S = O, D o i,j 1 i

一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGIN

レビューテキストの書き の評価視点に対する評価点の推定 29 3

1 に対話文完成問題の例を示す. 全ての問題は,2 名の話者の間で交わされるおよそ 3~6 文の短い発話 ( 会話部 ) と, 会話部に挿入される可能性のある 4 つの発話 ( 選択肢 ) で構成される. 会話部の一部の発話が空白として隠されており ( [BLANK]), 被験者はこの空白に当てはま

2. Bilingual Pivoting Bilingual Pivoting [5] e 1 f f e 2 e 1 e 2 p(e 2 e 1 ) p(f e 1 ) p(e 2 f) p(e 2 e 1 ) = f p(e 2 f, e 1 ) p(f e 1 ) f p(e 2 f) p(

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

..,,,, , ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i

untitled

Haiku Generation Based on Motif Images Using Deep Learning Koki Yoneda 1 Soichiro Yokoyama 2 Tomohisa Yamashita 2 Hidenori Kawamura Scho

NAACL2018参加報告

10_08.dvi

N-gram Language Models for Speech Recognition

Computational Semantics 1 category specificity Warrington (1975); Warrington & Shallice (1979, 1984) 2 basic level superiority 3 super-ordinate catego

% 95% 2002, 2004, Dunkel 1986, p.100 1

24 SPAM Performance Comparison of Machine Learning Algorithms for SPAM Discrimination

Formal Model for Kana-Kanji Conversion (KKC) In Japanese input, users type in phonetic Hiragana, but proper Japanese is written in logographic Kanji K

[12] Qui [6][7] Google N-gram[11] Web ( 4travel 5, 6 ) ( 7 ) ( All About 8 ) (1) (2) (3) 3 3 (1) (2) (3) (a) ( (b) (c) (d) (e) (1

‰gficŒõ/’ÓŠ¹

gengo.dvi

Vol. 43 No. 7 July 2002 ATR-MATRIX,,, ATR ITL ATR-MATRIX ATR-MATRIX 90% ATR-MATRIX Development and Evaluation of ATR-MATRIX Speech Translation System

Vol. 51 No (Mar. 2010) Maximal Marginal Relevance MMR Support Vector Machine SVM feature-based feature-based feature-based Featur

02’ÓŠ¹/“Hfi¡

NTT 465 図 1.,,..,, 1980,.,, [Hori 12]..,, [Kinoshita 09]. REVERB Challange, 30,, [Delcorix 14].,,.,,,,.,.., [ 13]. 2 4 会話シーンを捉える リアルタイム会話分析 2,. 360,,,

Rapp BLEU[10] [9] BLEU OrthoBLEU Rapp OrthoBLEU [9] OrthoBLEU OrthoBLEU ) ) ) 1) NTT Natural Language Research

untitled

11_寄稿論文_李_再校.mcd

sequence to sequence, B3TB2006, i

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

IPSJ SIG Technical Report Vol.2009-CVIM-167 No /6/10 Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing

,4) 1 P% P%P=2.5 5%!%! (1) = (2) l l Figure 1 A compilation flow of the proposing sampling based architecture simulation

Modal Phrase MP because but 2 IP Inflection Phrase IP as long as if IP 3 VP Verb Phrase VP while before [ MP MP [ IP IP [ VP VP ]]] [ MP [ IP [ VP ]]]

main.dvi

( )

( : A9TB2096)

02tonoike.dvi

Vol. 42 No MUC-6 6) 90% 2) MUC-6 MET-1 7),8) 7 90% 1 MUC IREX-NE 9) 10),11) 1) MUCMET 12) IREX-NE 13) ARPA 1987 MUC 1992 TREC IREX-N

IPSJ SIG Technical Report Vol.2012-MUS-96 No /8/10 MIDI Modeling Performance Indeterminacies for Polyphonic Midi Score Following and

5temp+.indd

DEIM Forum 2010 A Web Abstract Classification Method for Revie

( )

PowerPoint プレゼンテーション

Powered by TCPDF ( Title 初級レベルの授業報告 : 基幹コース3 科目を担当して Sub Title Author 中村, 愛 (Nakamura, Ai) Publisher 慶應義塾大学日本語 日本文化教育センター Publication 20

[1] SBS [2] SBS Random Forests[3] Random Forests ii

( : A8TB2163)

(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i

A Study on Throw Simulation for Baseball Pitching Machine with Rollers and Its Optimization Shinobu SAKAI*5, Yuichiro KITAGAWA, Ryo KANAI and Juhachi

Is machine translation (MT) your friend or enemy? Challenges for English->Japanese translators

スライド 1

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta

Transcription:

Graham Neubig & Kevin Duh 奈良先端科学技術大学院大学 (NAIST) 5/10/2012 1

フレーズベース統計的機械翻訳 ( SMT ) 文を翻訳可能な小さい塊に分けて 並べ替える Today I will give a lecture on machine translation. Today 今日は I will give を行います a lecture on の講義 machine translation 機械翻訳. Today 今日は machine translation 機械翻訳 a lecture on の講義 I will give を行います. 今日は 機械翻訳の講義を行います 翻訳モデル 並べ替えモデル 言語モデルをテキストから統計的に学習 2

発表内容 1) フレーズベース統計的機械翻訳を構築する時に必要となる作業のステップ 2) オープンソース機械翻訳システム Moses* の中で各ステップを実装したツール 3) 各ステップにおける研究 未解決の問題 * http://www.statmt.org/moses 3

フレーズベース統計的機械翻訳システムの構築の流れ データ収集 トークン化 言語モデル アライメント フレーズ抽出 /Scoring Reordering Models 探索 ( デコーディング ) 評価 チューニング

データ収集

データ収集 文ごとの並列データ ( パラレルデータ ) 翻訳モデル 並べ替えモデルの学習に利用 これはペンです This is a pen. 昨日は友達と食べた I ate with my friend yesterday. 象は鼻が長い Elephants' trunks are long. 単言語データ ( 目的言語側 ) 言語モデルの学習に利用 This is a pen. I ate with my friend yesterday. Elephants' trunks are long.

翻訳に役立つデータは 大きい 翻訳精度 翻訳の質が高い 翻訳でない文を含まない テストデータと同一の分野 言語モデルデータ ( 100 万単語 )[Brants 2007]

データ収集 ワークショップ等では用意 指定されている 例 : IWSLT 2011 Name Type Words TED Lectures 1.76M News Commentary News 2.52M EuroParl Political 45.7M UN Political 301M Giga Web 576M 実用システムでは : 各国政府 自治体 新聞 Web データ 複数のデータ源の組み合わせ

研究 並列ページの発見 [Resnik 03] [ 画像 : 毎日新聞 ]

研究 並列ページの発見 [Resnik 03] 文アライメント [Moore 02]

研究 並列ページの発見 [Resnik 03] 文アライメント [Moore 02] データ作成のクラウドソーシング [Ambati 10] Mechanical Turk duolingo 等

トークン化

例 : 日本語の単語分割 トークン化 太郎が花子を訪問した 太郎が花子を訪問した 例 : 英語の小文字化 句読点の分割 Taro visited Hanako. taro visited hanako.

トークン化ツール ヨーロッパの言語 日本語 tokenize.perl en < input.en > output.en tokenize.perl fr < input.fr > output.fr MeCab: mecab O wakati < input.ja > output.ja KyTea: kytea notags < input.ja > output.ja JUMAN, etc. 中国語 Stanford Segmenter, LDC, KyTea, etc...

研究 機械翻訳の精度向上につながるトークン化 精度が重要か 一貫性が重要か [Chang 08] 他の言語に合わせた単語挿入 [Sudoh 11] 太郎が花子を訪問した Taro <ARG1> visited <ARG2> Hanako. 活用の処理 ( 韓国語 アラビア語等 ) [Niessen 01] 단어란도대체무엇일까요? 단어란도대체무엇일까요? 教師なし学習 [Chung 09, Neubig 12]

言語モデル

言語モデル 目的言語側の各文に確率を与える E1: Taro visited Hanako E2: the Taro visited the Hanako E3: Taro visited the bibliography LM P(E1) P(E2) P(E3) 良い言語モデル : 流暢性の高い文に高い確率を P(E1) > P(E2) P(E1) > P(E3)

n-gram モデル 以下の文の確率を求めるとする P(W = Taro visited Hanako ) n-gram モデル : 1 単語ずつ確率を計算 直前の n-1 単語を考慮した条件付き確率例 : 2-gram モデル P(w 1 = Taro ) * P(w 2 = visited w 1 = Taro ) * P(w 3 = Hanako w 2 = visited ) * P(w 4 = </s> w 3 = Hanako ) 注 : 文末記号 </s> 18

ツール SRILM: 学習 : ngram count order 5 interpolate kndiscount unk text input.txt lm lm.arpa テスト : ngram lm lm.arpa ppl test.txt ほかに : KenLM, RandLM, IRSTLM

研究 n-gram に勝てるものはあるのか? [Goodman 01] 計算がシンプルで高速 探索アルゴリズムと相性が良い シンプルな割に強力 その他の手法 統語情報を利用した言語モデル [Charniak 03] ニューラルネット言語モデル [Bengio 06] モデル M [Chen 09] などなど

アライメント

文内の単語対応を発見 アライメント 太郎が花子を訪問した taro visited hanako. 太郎が花子を訪問した taro visited hanako. 確率モデルによる自動学習 ( 教師なし ) が主流 日本語日本語日本語 English English English P( 花子 hanako) = 0.99 P( 太郎 taro) = 0.97 P(visited 訪問 ) = 0.46 P(visited した ) = 0.04 P( 花子 taro) = 0.0001 22

IBM/HMM モデル 1 対多アライメントモデル ホテルの受付 X the hotel front desk IBM Model 1: 語順を考慮しない the hotel front desk X ホテルの受付 IBM Models 2-5, HMM: 徐々に考慮する情報を導入 ( 精度 計算コスト ++ ) 23

1 対多アライメントの組み合わせ ホテルの受付 X the hotel front desk the hotel front desk X ホテルの受付 組み合わせ the hotel front desk ホテルの受付 様々なヒューリスティック手法 ( grow-diag-final ) 24

ツール mkcls: 2 言語で単語クラスを自動発見 ホテルの受付 35 49 12 the hotel front desk 23 35 12 19 GIZA++: IBM モデルによるアライメント ( クラスを用いて確率を平滑化 ) ホテルの受付 + 35 49 12 ホテルの受付 the hotel front desk 23 35 12 19 the hotel front desk symal: 両方向のアライメントを組み合わせる (Moses の train-model.perl の一部として実行される )

研究 アライメントは本当に重要なのか? [Aryan 06] 教師ありアライメント [Fraser 06, Haghighi 09] 統語情報を使ったアライメント [DeNero 07] フレーズベースアライメント [Marcu 02, DeNero 08]

フレーズ抽出

フレーズ抽出 アライメントに基づいてフレーズを列挙 the hotel front desk ホテ受ルの付 ホテルの hotel ホテルの the hotel 受付 front desk ホテルの受付 hotel front desk ホテルの受付 the hotel front desk

フレーズのスコア計算 5 つの標準的なスコアでフレーズの信頼性 使用頻度 フレーズ翻訳確率 P(f e) = c(f,e)/c(e) P(e f) = c(f,e)/c(f) 例 : c( ホテルの, the hotel) / c(the hotel) 語彙 (lexical) 翻訳確率 フレーズ内の単語の翻訳確率を利用 (IBM Model 1) 低頻度のフレーズ対の信頼度判定に役立つ P(f e) = Π f 1/ e e P(f e) 例 : (P( ホテル the)+p( ホテル hotel))/2 * (P( の the)+p( の hotel))/2 フレーズペナルティ : すべてのフレーズで 1

ツール extract: フレーズ抽出 phrase-extract/score: フレーズのスコア付け (Moses の train-model.perl の一部として実行される )

研究 翻訳モデルの分野適用 [Koehn 07, Matsoukas 09] 不要 信頼度の低いフレーズの削除 [Johnson 07] 一般化フレーズ抽出 ( ソフト : Geppetto) [Ling 10] フレーズ曖昧性解消 [Carpuat 07]

並べ替えモデル

順 逆順 不連続 語彙化並べ替えモデル the thin man visited Taro 細太訪しい男が郎を問た 順不連続逆順 細い the thin 太郎を Taro 順の確率が高い 逆順の確率が高い 入力 出力 右 左などで条件付けた確率

ツール extract: フレーズ抽出と同一 lexical-reordering/score: 並べ替えモデルを学習 (Moses の train-model.perl の一部として実行される )

研究 まだ未解決の問題が多い ( 特に日英 英日 ) 翻訳モデル自体の変更 階層的フレーズベース翻訳 [Chiang 07] 統語ベース翻訳 [Yamada 01, Galley 06] 前並べ替え [Xia 04, Isozaki 10] F 彼は パンを 食べた F' 彼は 食べた パンを E he ate rice

探索 ( デコーディング )

探索 モデルによる最適な解を探索 ( または n-best ) モデル 太郎が花子を訪問した 探索 Taro visited Hanako 4.5 the Taro visited the Hanako 3.2 Taro met Hanako 2.4 Hanako visited Taro -2.9 厳密な解を求めるのは NP 困難問題 [Knight 99] ビームサーチを用いて近似解を求める [Koehn 03]

ツール Moses! moses f moses.ini < input.txt > output.txt その他 : moses_chart, cdec ( 階層的フレーズ 統語モデル )

研究 レティス入力の探索 [Dyer 08] 統語ベース翻訳の探索 [Mi 08] 最小ベイズリスク [Kumar 04] 厳密な解の求め方 [Germann 01]

評価

人手評価 意味的妥当性 : 原言語文の意味が伝わるか 流暢性 : 目的言語文が自然か 比較評価 : X と Y どっちの方が良いか 太郎が花子を訪問した Taro visited Hanako the Taro visited the Hanako Hanako visited Taro 妥当? 流暢? X より良い B, C C

自動評価 システム出力は正解文に一致するか ( 翻訳の正解は単一ではないため 複数の正解も利用 ) BLEU: n-gram 適合率 + 短さペナルティ [Papineni 03] Reference: Taro visited Hanako System: the Taro visited the Hanako Brevity: min(1, System / Reference ) = min(1, 5/3) 1-gram: 3/5 2-gram: 1/4 brevity penalty = 1.0 BLEU-2 = (3/5*1/4) 1/2 * 1.0 = 0.387 METEOR ( 類義語の正規化 ), TER ( 正解文に直すための変更数 ), RIBES ( 並べ替え )

研究 焦点を絞った評価尺度 並べ替え [Isozaki 10] 意味解析を用いた尺度 [Lo 11] チューニングに良い評価尺度 [Cer 10] 複数の評価尺度の利用 [Albrecht 07] 評価のクラウドソーシング [Callison-Burch 11]

チューニング

チューニング 各モデルのスコアを組み合わせた解のスコア Taro visited Hanako the Taro visited the Hanako Hanako visited Taro LM TM RM -4-3 -1-8 -5-4 -1-10 -2-3 -2-7 最大 スコアを重み付けると良い結果が得られる Taro visited Hanako the Taro visited the Hanako Hanako visited Taro LM TM RM 最大 0.2* -4 0.3* -3 0.5* -1-2.2 0.2* -5 0.3* -4 0.5* -1-2.7 0.2* -2 0.3* -3 0.5* -2-2.3 チューニングは重みを発見 : w LM =0.2 w TM =0.3 w RM =0.5

チューニング法 誤り最小化学習 : MERT [Och 03] 入力 (dev) 太郎が花子を訪問した 解探索 n-best 出力 (dev) the Taro visited the Hanako Hanako visited Taro Taro visited Hanako... モデル 重み 良い重みの発見 正解文 (dev) Taro visited Hanako その他 : MIRA [Watanabe 07] ( オンライン学習 ), PRO ( ランク学習 ) [Hopkins 11]

研究 膨大な素性数でチューニング ( 例 : MIRA, PRO) ラティス出力のチューニング [Macherey 08] チューニングの高速化 [Suzuki 11] 複数の評価尺度の同時チューニング [Duh 12]

おわりに

おわりに 機械翻訳は楽しい! 一緒にやりましょう 年々精度が向上しているが 多くの問題が残る システムは大きいので 1 つの部分に焦点を絞る Thank You MT ありがとうございます Danke 謝謝 Gracias 감사합니다 Terima Kasih

参考文献

J. Albrecht and R. Hwa. A re-examination of machine learning approaches for sentence-level mt evaluation. In Proc. ACL, pages 880-887, 2007. V. Ambati, S. Vogel, and J. Carbonell. Active learning and crowdsourcing for machine translation. Proc. LREC, 7:2169-2174, 2010. N. Ayan and B. Dorr. Going beyond AER: an extensive analysis of word alignments and their impact on MT. In Proc. ACL, 2006. Y. Bengio, H. Schwenk, J.-S. Sencal, F. Morin, and J.-L. Gauvain. Neural probabilistic language models. In Innovations in Machine Learning, volume 194, pages 137-186. 2006. T. Brants, A. C. Popat, P. Xu, F. J. Och, and J. Dean. Large language models in machine translation. In Proc. EMNLP, pages 858-867, 2007. C. Callison-Burch, P. Koehn, C. Monz, and O. Zaidan. Findings of the 2011 workshop on statistical machine translation. In Proc. WMT, pages 22-64, 2011. M. Carpuat and D. Wu. How phrase sense disambiguation outperforms word sense disambiguation for statistical machine translation. In Proc. TMI, pages 43-52, 2007. D. Cer, C. Manning, and D. Jurafsky. The best lexical metric for phrasebased statistical MT system optimization. In NAACL HLT, 2010. P.-C. Chang, M. Galley, and C. D. Manning. Optimizing Chinese word segmentation for machine translation performance. In Proc. WMT, 2008. E. Charniak, K. Knight, and K. Yamada. Syntax-based language models for statistical machine translation. In MT Summit IX, pages 40-46, 2003. S. Chen. Shrinking exponential language models. In Proc. NAACL, pages 468-476, 2009. D. Chiang. Hierarchical phrase-based translation. Computational Linguistics, 33(2), 2007. T. Chung and D. Gildea. Unsupervised tokenization for machine translation. In Proc. EMNLP, 2009. J. DeNero, A. Bouchard-C^ote, and D. Klein. Sampling alignment structure under a Bayesian translation model. In Proc. EMNLP, 2008. J. DeNero and D. Klein. Tailoring word alignments to syntactic machine translation. In Proc. ACL, volume 45, 2007. K. Duh, K. Sudoh, X. Wu, H. Tsukada, and M. Nagata. Learning to translate with multiple objectives. In Proc. ACL, 2012. C. Dyer, S. Muresan, and P. Resnik. Generalizing word lattice translation. In Proc. ACL, 2008.

A. Fraser and D. Marcu. Semi-supervised training for statistical word alignment. In Proc. ACL, pages 769-776, 2006. M. Galley, J. Graehl, K. Knight, D. Marcu, S. DeNeefe, W. Wang, and I. Thayer. Scalable inference and training of context-rich syntactic translation models. In Proc. ACL, pages 961-968, 2006. U. Germann, M. Jahr, K. Knight, D. Marcu, and K. Yamada. Fast decoding and optimal decoding for machine translation. In Proc. ACL, pages 228-235, 2001. J. T. Goodman. A bit of progress in language modeling. Computer Speech & Language, 15(4), 2001. A. Haghighi, J. Blitzer, J. DeNero, and D. Klein. Better word alignments with supervised ITG models. In Proc. ACL, 2009. M. Hopkins and J. May. Tuning as ranking. In Proc. EMNLP, 2011. H. Isozaki, T. Hirao, K. Duh, K. Sudoh, and H. Tsukada. Automatic evaluation of translation quality for distant language pairs. In Proc. EMNLP, pages 944-952, 2010. H. Isozaki, K. Sudoh, H. Tsukada, and K. Duh. Head nalization: A simple reordering rule for sov languages. In Proc. WMT and MetricsMATR, 2010. J. H. Johnson, J. Martin, G. Foster, and R. Kuhn. Improving translation quality by discarding most of the phrasetable. In Proc. EMNLP, pages 967-975, 2007. K. Knight. Decoding complexity in word-replacement translation models. Computational Linguistics, 25(4), 1999. P. Koehn, F. J. Och, and D. Marcu. Statistical phrase-based translation. In Proc. HLT, pages 48-54, 2003. P. Koehn and J. Schroeder. Experiments in domain adaptation for statistical machine translation. In Proc. WMT, 2007. S. Kumar and W. Byrne. Minimum bayes-risk decoding for statistical machine translation. In Proc. HLT, 2004. W. Ling, T. Lus, J. Graca, L. Coheur, and I. Trancoso. Towards a General and Extensible Phrase-Extraction Algorithm. In M. Federico, I. Lane, M. Paul, and F. Yvon, editors, Proc. IWSLT, pages 313-320, 2010. C.-k. Lo and D. Wu. Meant: An inexpensive, high-accuracy, semiautomatic metric for evaluating translation utility based on semantic roles. In Proc. ACL, pages 220-229, 2011. W. Macherey, F. Och, I. Thayer, and J. Uszkoreit. Lattice-based minimum error rate training for statistical machine translation. In Proc. EMNLP, 2008. D. Marcu and W. Wong. A phrase-based, joint probability model for statistical machine translation. In Proc. EMNLP, 2002.

S. Matsoukas, A.-V. I. Rosti, and B. Zhang. Discriminative corpus weight estimation for machine translation. In Proc. EMNLP, pages 708717, 2009. H. Mi, L. Huang, and Q. Liu. Forest-based translation. In Proc. ACL, pages 192-199, 2008. R. Moore. Fast and accurate sentence alignment of bilingual corpora. Machine Translation: From Research to Real Users, pages 135-144, 2002. G. Neubig, T. Watanabe, S. Mori, and T. Kawahara. Machine translation without words through substring alignment. In Proc. ACL, Jeju, Korea, 2012. S. Niessen, H. Ney, et al. Morpho-syntactic analysis for reordering in statistical machine translation. In Proc. MT Summit, 2001. F. J. Och. Minimum error rate training in statistical machine translation. In Proc. ACL, 2003. K. Papineni, S. Roukos, T. Ward, and W.-J. Zhu. BLEU: a method for automatic evaluation of machine translation. In Proc. COLING, pages 311-318, 2002. P. Resnik and N. A. Smith. The web as a parallel corpus. Computational Linguistics, 29(3):349-380, 2003. J. Suzuki, K. Duh, and M. Nagata. Distributed minimum error rate training of smt using particle swarm optimization. In Proc. IJCNLP, pages 649-657, 2011. T. Watanabe, J. Suzuki, H. Tsukada, and H. Isozaki. Online largemargin training for statistical machine translation. In Proc. EMNLP, pages 764-773, 2007. F. Xia and M. McCord. Improving a statistical MT system with automatically learned rewrite patterns. In Proc. COLING, 2004. K. Yamada and K. Knight. A syntax-based statistical translation model. In Proc. ACL, 2001. O. F. Zaidan and C. Callison-Burch. Crowdsourcing translation: Professional quality from non-professionals. In Proc. ACL, pages 1220-1229, 2011.