外国語教育において機械翻訳はどのように扱うべきか村上公一 早稲田大学日本中国語学会第 59 回全国大会予稿 (2009.10.25 北海道大学 ) 0. はじめに数年先に予想される実用的な自動翻訳システムや携帯自動翻訳機器の登場は 大きな衝撃を外国語教育の現場に与えるだろう 中国語教育の現場に携わる私達は機械翻訳と今後どのように付き合っていくべきだろうか 機械翻訳の時代における異言語間のコミュニケーションは 以下の 4 形態が並立する形をとることが予想される (1) 機械翻訳のみによるコミュニケーション (2) 機械翻訳の不備を外国語知識で補う形でのコミュニケーション (3) 外国語能力の不備を機械翻訳で補う形でのコミュニケーション (4) 外国語能力のみによるコミュニケーション (1)(2) は既に外国語によるコミュニケーションではなく機械翻訳を介した異言語間コミュニケーションととらえるべきであろう 発表者は (4) を目指す学習の一環としての機械翻訳の利用が (3) に結びつくのではないかとの考えにもとづき 中国語読解教育への機械翻訳の一部利用を試みている 本発表では中国語読解教育への機械翻訳利用の具体的な方法と それにより学習者の中国語読解にどのような変化が生じるのかについて報告する 1. 機械翻訳をとりまく環境 2007 年 6 月 1 日に閣議決定された イノベーション 25 は 2025 年の日本の姿について 自動翻訳機の普及等により 誰もがあらゆる国の人々とコミュニケーションを行うことができ 相互理解が深化している と記す そこに到る科学技術の実用化は インターネット上の自動言語翻訳機能の向上により インターネット上の多言語にわたる情報を特定言語で容易に検索可能になり 必要な情報を瞬時に世界中から引き出すことのできる知識の体系的保存システム が 2010 年 ~2015 年 音声入出力の身体装着型自動翻訳装置 が 2013 年 ~2020 年 言語の同時翻訳機能が付加された電話の一般化 が 2017 年 ~2025 年とされている ( イノベーション 25 中間とりまとめ ) 2025 年を待つまでもなく 2009 年 9 月時点でも 翻訳ソフトは既に市場にあふれ YAHOO! Google など主要なポータルサイトはことごとく機械翻訳サービスを提供しており 日本語以外の言語で書かれた Web ページの日本語による検索や日本語による閲覧が可能になっている もちろん 100% には程遠い翻訳精度ではあるが 機械翻訳の利用者は年々増加している 携帯電話においても すでに日 英 日 中 日 韓の携帯翻訳サービスが始まっている ポータルサイトでの機械翻訳サービスは徐々に人々に認知されはじめ 大学生の機械翻訳利用もここ数年で大きく進んでいる 発表者が早稲田大学の学生を対象に 2004 年 7 月に行なった調査では 74.8%(131 名中 98 名 ) が機械翻訳を利用したことがあり 13% は
いつも利用している と答えている 2009 年 4 月に同じく早稲田大学の学生を対象に行なった調査では 利用したことのある学生の比率はさらに増加し 86.7%(69 名中 60 名 ) にまで達している 現在の大学生にとって機械翻訳は私たちが想像する以上に身近な 日常的に利用するものになっているようである ただ 現時点での機械翻訳の精度については必ずしも満足していない 2009 年 4 月のアンケートでは機械翻訳を利用した際の感想を自由記述してもらったが 以下のような不満が多く記されていた 大意をつかむのには良いと思う( 情報をインプットする ) 個人的に使うぶんには問題ないけど 機械翻訳に 100% 頼って外へアウトプットするのは不安 便利ではあるが 質は微妙だという印象 ドイツ語やフランス語においては 機械翻訳に頼るしかない場合もあるが 英語のような既習言語においては 正確さを求めるのであれば 自分で辞書などを引きながら読んだ方が良いと思う 2. 機械翻訳時代の 4 形態のコミュニケーション 機械翻訳の時代における異言語間のコミュニケーションは 以下の 4 形態が並立する形 をとることが予想される (1) 機械翻訳のみによるコミュニケーション (2) 機械翻訳の不備を外国語知識で補う形でのコミュニケーション (3) 外国語能力の不備を機械翻訳で補う形でのコミュニケーション (4) 外国語能力のみによるコミュニケーション 発表者は 2004 年 7 月に機械翻訳を利用した中国語の読解について実験を行なった 同 一の読解問題について [ 原文のみ ] と [ 原文 + 機械翻訳 ] の2 種類の形式で出題したものを学 生に解かせ その結果を比較しものである (A) 全問 [ 原文 + 機械翻 問題 (A) 問題 (B)(C) 訳 ] (B) 奇数大問 [ 原文 + 機械翻訳 ] 偶数大問[ 原文のみ ] (C) 奇数大問 [ 原文のみ ] 偶数大問 [ 原文 + 機械 機械翻訳を全く参考にしなかった / あまり参考にしな 原文機械翻訳と原文を半々ぐらいに参考にした (19 名 ) 機械翻訳に完全に頼った / かなり頼った (38 名 ) 全体 (75 名 ) 中国語未習者 (10 名 ) 原文のみ (B:30 名 / C:26 名 ) *2 年次中国語科目履修者 翻訳つき (B:30 名 / C:26 名 ) *2 年次中国語科目履修者 翻訳 ] い (18 名 ) 平均正答率 (%) 65.0 68.6 67.1 66.1 65.5 38.8 69.5 *(A):2 年 ~4 年の学生 中国語のレベルは HSK7 級取得者から未習者まで混在 *(B)(C):2 年 ~4 年の学生 全員 2 年次の中国語科目を履修中 * 問題 :TECC 第 11 回 第 8 部 読解問題 翻訳ソフト :J 北京 V4( 高電社 ) この実験については村上 (2007) で詳細な分析を行なっている ここでは機械翻訳が中 国語読解の補助ツールとして極めて有用であるという点だけを再確認しておく さて この実験で行なわれた読解行為を上記 4 形態のコミュニケーションに当てはめる と 以下のようになる (A) 群の 機械翻訳に完全に頼った が (1) かなり頼った
が (2) あまり参考にしなかった が (3) 機械翻訳を全く参考にしなかった が (4) のコミュニケーションに相当し 機械翻訳と原文を半々ぐらいに参考にした は (2)(3) のいずれかということになる また (B)(C) 群の 原文のみ は (4) 翻訳つき は (2)(3) のいずれかであろう (A) 群の 中国語未習者 は外国語教育としての中国語は学んでいないが 中国語の文字 語彙 語法等についての基礎的な講義を数回にわたり受けているので (2) のカテゴリに入る (B)(C) 群の被験者 56 名が機械翻訳をどの程度参考にしたかについては 42 名が 機械翻訳に完全に頼った / かなり頼った と答え 14 名が 機械翻訳と原文を半々ぐらいに参考にした と答えている 機械翻訳を全く参考にしない / あまり参考にしなかった と答えた学生はいない つまり (B)(C) 群の被験者は中国語を 1 年以上学んでいるにもかかわらず ほとんどの学生が機械翻訳にたよって読解していることが分かる (A) 群の 機械翻訳を全く参考にしなかった/ あまり参考にしなかった 18 名の多くは 中国語を 2 年以上学んでいるか 専門科目として学んでいる学生であり 中国語能力 学習動機ともに他の学生とは異なっていた このことから容易に想像できるのは いわゆる第二外国語として必ずしも強い学習動機を持たずに中国語を1 2 年間学習した学生が 履修期間が終了した後 あるいは卒業後に中国語で書かれた文書を読もうとしたとき 間違いなく (3) ではなく (2) のコミュニケーションを選択するであろうということである 3. 外国語能力を中心としたコミュニケーションのための機械翻訳利用私たちが いわゆる第二外国語として1 2 年間のみ中国語を学習する学生に修得してほしい能力は ( 中国語知識で補いながら ) 機械翻訳でコミュニケーションする力 なのか それとも ( 機械翻訳で補いながら ) 中国語でコミュニケーションする力 なのか 前者であれば外国語教育とは全く別の理念 方法から新たな教育を組み立てなおさなければなるまい 後者であれば これまでの外国語教育の中に機械翻訳をどのように組み込んでいくのかという問題になる 発表者の本務校 ( 早稲田大学教育学部 ) の外国語カリキュラムは以下のようになっている いわゆる第二外国語としての履修 ( 必修 ) は 学科によって異なるが 最も多い学科で 外国語の基礎 (1 年次に履修 ) 中国語のコミュニケーションの基礎 (1 年次または 2 年次で履修 ) 中国語演習 I(1 または 2) (2 年次に履修 ) の 8 単位である 外国語修得にも力を入れている複合文化学科では ツールとしての中国語 V 以外の 26 単位が原則必修となっている 4 年前期 *( ) 内の数字は単位数ツールとしての中国語 V(2) 3 年後期中国語演習 IV(2) ツールとしての中国語 IV(2) 3 年前期中国語演習 III(2) ツールとしての中国語 III(2) 2 年後期中国語演習 II1(2) 中国語演習 II2(2) ツールとしての中国語 II(2) 2 年前期中国語演習 I1(2) 中国語演習 I2(2) ツールとしての中国語 I(2) 1 年通年中国語の基礎 ( 週 2 コマ )(4) 中国語のコミュニケーションの基礎 (2) 発表者が機械翻訳を組み込むことを試みた 中国語演習 I1 は第二外国語として履修し
ている学生にとっては履修しなければならない最後の科目である ここで ( 機械翻訳で補いながら ) 中国語でコミュニケーションする 側に履修者をとどまらせる何らかの対策がなければ 2004 年の (B)(C) 群の学生と同じように ( 中国語知識で補いながら ) 機械翻訳でコミュニケーションする 側に行ってしまうことになる 2009 年前期に 中国語演習 I1 を履修している学生が 1 年次で履修した 中国語の基礎 は使用テキスト 授業方法ともに 2004 年の (B)(C) 群の学生と同じである 中国語演習 I1 ( 半期 15 回 ) の授業はもともと大きく三段階に分けた学習を行っていた 分かち書きのない中国語の文章を 辞書の力を借りつつも自分自身の力で読み進めるための能力を身に付けること またこの授業で大学での中国語学習を全て終了する学生がいることを踏まえ その後も自分自身で中国語の文書から情報を得ていくことができる最低限の知識と方法を身につけることを目的としたプログラムである 第一段階(2 回程度 ) 授業 :[ 単語スラッシュ切り ] [ 意味の想像 ] [ 辞書引き ] [ 訳文完成 ] ( 読解学習の流れの確認と授業中での実践 ) 第二段階](10 回程度 ) 予習 :[ 単語スラッシュ切り ] [ 意味の想像 ] [ 辞書引き ] [ 訳文完成 ](Web サイトでの提出 ) 授業 : 学生の提出済み訳文をもとに 語彙 語法 背景知識を中心に課題文章の解説 第三段階](2 回程度 ) 授業 :[ 中国語 e-mail 受信 発信 ][ 中国語 Web ページ探索 ] 分かち書きのない中国語の文章を読むためには 単語あるいは語句といったまとまりが見えてこなければならない そのためのスラッシュ切りをまず行う はじめは辞書を使用せず これまでに獲得している知識や想像力をフル動員して一次読解を行う その後で不明個所については辞書等を参考にしながら二次読解を行う 最初の2 回の授業では授業中に指示をしながら一連の作業を行わせ その後は予習としてこれらを行わせる 授業は事前に Web サイトで提出された個々の学生の二次読解の結果に目を通した上で 学生と相互コミュニケーションをとりながら必要な解説を行うという形で進む 最後の2 回の授業は中国語 e-mail 受信 発信及び中国語 Web ページ探索にあてている 現在の学生が中国語で書かれた文書に出会う場はインターネット上が最も一般的であり それは卒業後においても同じであろう であるならば 中国語による e-mail 受信 発信の方法や中国語 Web ページを見るための方法の学習は不可欠であろう さて この学習プログラムの中に機械翻訳を組み込んだのが以下の形である 第一段階(2 回程度 ) 授業 :[ 単語スラッシュ切り ] [ 意味の想像 ] [ 辞書引き ] [ 訳文完成 ] ( 読解学習の流れの確認と授業中での実践 ) 第二段階](4 回程度 ) 予習 :[ 単語スラッシュ切り ] [ 意味の想像 ] [ 辞書引き ] [ 訳文完成 ](Web サイトでの提出 ) 授業 : 学生の提出済み訳文をもとに 語彙 語法 背景知識を中心に課題文章の解説 第三段階(2 回程度 ) 授業 :[ 機械翻訳の誤訳分析 ]( 原文と機械翻訳文を対照し 誤訳個所を探し その理由を考える )
第四段階(4 回程度 ) 予習 :[ 単語スラッシュ切り ] [ 意味の想像 ] [ 機械翻訳参照 ] [ 訳文完成 ](Web サイトでの提出 ) 授業 : 学生の提出済み訳文をもとに 語彙 語法 背景知識を中心に課題文章の解説 第五段階(2 回程度 ) 授業 :[ 中国語 e-mail 受信 発信 ][ 中国語 Web ページ探索 ] 第三段階 第四段階 に機械翻訳を利用した学習が組み込まれている 最初に原文と機械翻訳文を配布し 誤訳個所を探し その理由を考える作業を行う 機械翻訳の誤訳は基本的に 多義性を持つ語彙 フレーズ 文の解釈において何らかの理由で誤った解釈がなされていることによる 機械翻訳の誤訳の特性を理解することで機械翻訳利用の前提知識を得ると同時に 多義性の視点から中国語の語彙 語法について知識の再確認を行うことになる その後の学習は それまで第二段階として行ってきた学習の [ 辞書引き ] を [ 機械翻訳参照 ] に置き換えただけである この方法は実は辞書が機械翻訳に置き換わっただけで 従来の外国語読解力をつけるための学習となんら変わらない まず自分自身の持つ知識や想像力で解釈し 足りない部分を辞書引きで補うという読解学習を何度も繰り返すことによって ( 辞書引きで補いながら ) 中国語でコミュニケーションする力 を獲得していくことが可能であれば 同様にまず自分自身の持つ知識や想像力で解釈し 足りない部分を機械翻訳で補うという読解学習を何度も繰り返すことによって ( 機械翻訳で補いながら ) 中国語でコミュニケーションする力 を獲得していくのも可能であろう 4. おわりに機械翻訳の時代は 私達にとって未知の時代である それはインターネット時代以前の段階においてインターネットの時代が未知であったのと同様である しかし一旦機械翻訳の時代が到来すれば 瞬く間に外国語教育は時代の波に翻弄されることになる 本格的な機械翻訳の時代が来る前の段階において 機械翻訳の時代の外国語教育のあり方について様々な模索が行われることは決して無駄なことではあるまい 本発表はその模索の一つである [ 参考文献 ] 2009 茂木良治 村上公一 神尾達之 後藤雄介 福田育弘 丸川誠司 外国語教育におけるブレンディッドラーニングの実践報告 ( 早稲田教育評論 23-1) 2008 村上公一 神尾達之 丸川誠司 福田育弘 後藤雄介 英語以外の外国語教育の情報化 2 ( 早稲田教育評論 22-1) 2007 村上公一 中日機器翻訳与中文閲読教学 ( 第八届国際漢語教学討論会論文選, 高等教育出版社 ) 2006 村上公一 丸川誠司 後藤雄介 英語以外の外国語教育の情報化 ( 早稲田教育評論 20-1) 2004 村上公一 コンピュータ インターネット 機械翻訳 - 中国語 CALL の現状と展望 ( 平井勝利教授退官記念中国学 日本語学論文集, 白帝社 ) 2000 村上公一 Web ページ探索を中心とした中国語講読授業 - 自己学習能力の獲得を目指して- ( 学術研究 48- 外国語外国文学編 -) 2007 閣議決定 長期戦略指針 イノベーション 25 http://www.cao.go.jp/innovation/action/conference/minutes/minute_cabinet/kakugi1.pdf