vol24_3_003jp - PDF Free Download

機械翻訳話し言葉翻訳前処理技術多様な利用シーンに対応する話し言葉翻訳サービスの開発訪日外国人旅行者数は増加し続け 2020年には4,000万人になると言われており多くの外国人のお客様が快適にコミュニケーションを図れることが期待されているまた企業のグローバル化も進み多言語でのコミュニケーションが行われる機会も増えている本稿ではドコモが開発に取り組んでいる翻訳サービスのうち多様な利用シーンが想定される話し言葉を翻訳する会議翻訳 SNS翻訳接客翻訳について実現における課題と解決策を解説する 1. まえがき 2015年の訪日外国人旅行者数は過去最高であった2014年をさらに上サービスイノベーション部ションを実現するため音声認識 1 2 たけいちまさと武市真知ちぢわゆうき千々和祐貴おのたかや小野隆哉じゃんいーしん姜一欣 ②SNS翻訳とは SNSで主に使技術機械翻訳技術の開発とそれわれているフランクな表現の言を応用したサービス開発に取り組ん葉をテキスト翻訳するサービスでいるである SNSの投稿は一見す回り1,974万人に達した[1] 日本政図1は翻訳サービスを話し言ると書き言葉に思えるがや府から発表された2020年のその目葉書き言葉と文章表現のかたわらかい話し言葉の表現標数は4,000万人であり[2] 日本をいやわらかいを表す軸上に分類が多く含まれている訪れるすべての外国人旅行者がスし技術課題を明確化したものであ ③接客翻訳とは店舗などでのおトレスなくコミュニケーションを図るドコモは訪日外国人旅行者向客様と店員との間での接客会話れる環境の実現が期待されている[2] けに図1右上の話し言葉かつを音声翻訳するサービスである他方国内全法人の海外現地法人従やわらかい領域を直近のター簡単なコミュニケーションは音業員数は 2010年度には499万人でゲットとし音声認識と機械翻訳の声認識と機械翻訳によって気軽あったが 2014年度には575万人ま精度向上をめざしているまた現在に接客を行い複雑なコミュニで増え[3] 企業のグローバル化も進このターゲットに対して以下の3つケーションは遠隔の通訳者と通んでおり多言語でのコミュニケーのサービスを開発している話することで正確で安心なコションが行われる機会も増えてきているドコモは 2020年に向けて言語や文化の壁を越えたコミュニケー 2016 NTT DOCOMO, INC. 本誌掲載記事の無断転載を禁じます NTT DOCOMOテクニカルジャーナル Vol. 24 No. 3 ①会議翻訳とは異言語間の会議ミュニケーションが行える音声をリアルタイムに母国語に 2014年試作開発に着手して以翻訳読み上げテキスト表示降複数の企業と実証実験を行する翻訳サービスであるい UI 3 改善および音声認 1 音声認識人の発話による音声信号をテキストに変換する技術 2 機械翻訳ある言語の文章や単語を入力すると別の言語に機械的に変換し出力する技術主にルールベース機械翻訳と統計的機械翻訳の2つの手法がある 3 UI ユーザとコンピュータとの間で情報をやり取りする際の操作画面や操作方法 13

話し言葉 1 会議翻訳 3 接客翻訳 2SNS 翻訳講義会議接客会話 SNS 投稿リアルタイム性接客会話の翻訳精度フランクな表現の言葉かたいビジネスドキュメント翻訳金融, 医療法律, 特許ニュース IT 議事録 IR メール書き言葉口コミ : 利用シーン : 技術課題やわらかい 14

1 音声認識 2 機械翻訳 3 音声合成発話再生音声データマイク発話区間検知 / 雑音除去音声認識エンジン認識結果テキスト翻訳前処理機械翻訳エンジン翻訳後処理翻訳結果テキスト音声合成エンジン音声データスピーカー音響モデル機械学習言語モデル翻訳モデルコーパス機械学習言語モデルログ書籍 PDF 文書ファイル音響モデル機械学習 15

日本 ( 会議室 ) アメリカ ( 会議室 ) 会議を始めましょう 1 音声翻訳 2 キーボードによるテキスト翻訳会議を始めましょう音声認識機械翻訳 It s time to start the meeting. 16

音声波形無音区間 1 発話内容パラメータで設定した発話区切り時間このアプリは音声認識の結果をリアルタイムに表示します翻訳結果 1 の場合このアプリは音声認識の結果を This application is speech recognition results. リアルタイムに表示します Real-time display. 2 の場合このアプリは音声認識の結果をリアルタイムに表示します This application is displayed in real-time voice recognition results. 翻訳 2 おたんじょーびおめでとぉーヽ ( ) ノキャッ RT @mariko_dayo: どーするのかなぁ 1) 文分割 1. おたんじょーびおめでとぉー 2. ヽ ( ) ノキャッ 3. RT @mariko_dayo: 4. どーするのかなぁ? ヽ ( ) ノキャッ ) Happy birthday. ヽ ( ) ノ kya RT @mariko_dayo: What would you like to do? 翻訳前処理への追加機能 2) 崩れ文字列正規化 1. お誕生日おめでとう 4. どうするのかな? 1.Happy Birthday. 4. What would you like to do? 従来機能 3) 機械翻訳 4) 翻訳後処理 1.Happy Birthday. 2. ヽ ( ) ノ kya 3. RT @marikoi_dayo: 4. What would you like to do? 17

1 入力 : おたんじょーびおめでとぉー 2 解析 : 崩れ形態素解析表記品詞標準表記 3 探索 : 代表表記選択ラティス生成 + 最適解の探索表記ゆれ辞書と変換候補制御リストを用いて表記のラティスを作成. 言語モデルを用いて探索し, 最適な表記を決定する. たんじょーび / 冠詞 BOS お / 冠詞御 / 冠詞 4 出力 : お誕生日おめでとう BOS(Begin Of Sentence): 文境界の開始を表す文字列 EOS(End Of Sentence): 文境界の終了を表す文字列お冠名詞御たんじょーび名詞誕生日おめでとぉ独立詞おめでとう - 終助詞 - たんじょうび / 冠詞誕生日 / 冠詞言語モデル例 : 誕生日, たんじょうび, たんじょーびを含む形態素の並び方とその頻度情報おめでとぉ / 独立詞おめでとう / 独立詞一部品詞は削除, 赤枠は最適解表記ゆれ辞書例 : 誕生日 ( 標準表記 ) 誕生日たんじょうびたんじょーび EOS 変換候補制御リスト例 : おめでとお / 独立詞は採用されないよう抑止 18

SNS 翻訳精度点 250 200 150 100 50 0 223 58 165 SNS 翻訳エンジン 178 114 (3 点 ): 正しく訳されている. (2 点 ): 一部誤りが見受けれるが, 意味は通じる. (0 点 ): 意味が通じない. 64 他社エンジン 19

商用サービスログ収集整形はなして翻訳, メール翻訳などの日本語ログ外部の対訳コーパス新聞社翻訳会社 etc. 書起し対訳化データ購入対訳データ英センテンス : : 日センテンス : : 対訳コーパス整形不要な記号などの削除不完全な文章の削除センテンスごとの括り付け音声認識後の機械翻訳精度点 250 200 150 100 50 0 218.4 69.6 148.8 接客翻訳エンジン 191.8 112 79.8 エンジン A 対訳コーパス英センテンス 1: 日センテンス 1 英センテンス 2: 日センテンス 2 英センテンス 3: 日センテンス 3 英センテンス 4: 日センテンス 4 英センテンス 5: 日センテンス 5 : : : : : : 137.2 77.2 60 エンジン B (3 点 ): 正しく訳されている. (2 点 ): 一部誤りが見受けれるが, 意味は通じる. (0 点 ): 意味が通じない. 20