日本語文章の課題と前編集手法 用語集形式 UTX と実務日本語の観点から Issues of Japanese writing and pre-edit approaches to address these issues - In view of UTX and Practical Japanes

Similar documents
実務日本語と UTX から特許明細書の改善を考える 秋桜舎代表山本ゆうじ PROFILE 筑波大学を経てシカゴ大学修士号 実務翻訳業務 大規模翻訳 文書管理 / 作成の講習やコンサルを行う 近著に IT 時代の実務日本語スタイルブック 書きやすく 読みやすい電子文書の作文技法

実務翻訳における 日本語スタイルガイドの活用

6回目

プロジェクトマネジメント知識体系ガイド (PMBOK ガイド ) 第 6 版 訂正表 - 第 3 刷り 注 : 次の正誤表は PMBOK ガイド第 6 版 の第 1 刷りと第 2 刷りに関するものです 本 ( または PDF) の印刷部数を確認するには 著作権ページ ( 通知ページおよび目次の前 )

Microsoft Word - MTransㇹㇿㅼㅋ㇬㇤ㅛ+丕苬ㅦㅼㇶㅼ咂ㆂ;_ver1.7_original.docx

読み手 と 目的 によって内容が異なる文章には 読み手 と 目的 が必ず存在します 読み手 と 目的 によって 文章の内容は異なります たとえば 同じソフトウェアの説明書でもソフトウェアに添付されている操作説明書と 出版社が制作した市販の操作本とでは 構成も書き方も異なります < ソフトウェアに添付

1. はじめに 2

第21章 表計算

IMI情報共有基盤 「表からデータモデル」 データ変換のみを行う方向け画面説明

PowerPoint プレゼンテーション

1 BCM BCM BCM BCM BCM BCMS

Microsoft PowerPoint - CheckAlignパーソナルセミナー.ppt

書式に示すように表示したい文字列をダブルクォーテーション (") の間に書けば良い ダブルクォーテーションで囲まれた文字列は 文字列リテラル と呼ばれる プログラム中では以下のように用いる プログラム例 1 printf(" 情報処理基礎 "); printf("c 言語の練習 "); printf

2/10 ページ 対象画像の選択 エルスプローラなどで対象の ( 縮小する ) 画像が入っているフォルダーを開きます 例えば 次の通りです 例では 下のフォルダーから反転しているファイル ( つまり 2006_ JPG ) を縮小するものとします 以下の説明では 対象画像 と呼びます

Shareresearchオンラインマニュアル

立ち読みページ

FTP とは? FTP とは File Transfer Protocol の略です 日本語訳すると ファイルを転送するときの決まり事という意味です 飛行機が世界中の空港で離陸 着陸できるのは 決められた手順 通信方式 が存在するからです パイロットでない私たちが聞いても よく分からないやり取りです

Microsoft Word - 資料5-1_資料掲載_ver docx

Microsoft Office Excel2007(NO4中級後編 エクセルを実務で活用)

(Microsoft Word - \207U\202P.doc)

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

スライド 1

PowerPoint プレゼンテーション

<4D F736F F F696E74202D A B837D836C CA48F435F >

各種パスワードについて マイナンバー管理票では 3 種のパスワードを使用します (1) 読み取りパスワード Excel 機能の読み取りパスワードです 任意に設定可能です (2) 管理者パスワード マイナンバー管理表 の管理者のパスワードです 管理者パスワード はパスワードの流出を防ぐ目的で この操作

どのような便益があり得るか? より重要な ( ハイリスクの ) プロセス及びそれらのアウトプットに焦点が当たる 相互に依存するプロセスについての理解 定義及び統合が改善される プロセス及びマネジメントシステム全体の計画策定 実施 確認及び改善の体系的なマネジメント 資源の有効利用及び説明責任の強化

Microsoft Word - CygwinでPython.docx

パラダイムシフトブック.indb

中綴じ3・4級.ren

UTXと 用語管理 翻訳品質 および標準 化の関連性 ISO/TC37 松江国際会議に参加して UTX and its relation with terminology management, translation quality, and standardization Report on t

クラス図とシーケンス図の整合性確保 マニュアル

第 2 回 (4/18) 実力診断の解説と表作成の復習

【第一稿】論文執筆のためのワード活用術 (1).docx.docx

Microsoft PowerPoint - mp11-06.pptx

PowerPoint プレゼンテーション

Microsoft Word - 【6.5.4】特許スコア情報の活用

��8��

大学院紀要 執筆要領 ( ) 紀要編集委員会執筆要領 1. 執筆者の資格は日本大学大学院総合社会情報研究科に所属する者 ( 修了生 退官者を含む ) とする 2. 1 つの紀要論文の執筆者は複数名でも可とする 但し その場合は筆頭著者 または紀要論文に第一義的に責任を有する立場の執筆者は

PowerPoint プレゼンテーション

nlp1-12.key

マルチエージェントシステムグループの研究計画

Microsoft PowerPoint _総合マニュアル.ppt [互換モード]

SDL Trados 2006 Introduction

nlp1-05.key

PowerPoint Presentation

教科 : 外国語科目 : コミュニケーション英語 Ⅰ 別紙 1 話すこと 学習指導要領ウ聞いたり読んだりしたこと 学んだことや経験したことに基づき 情報や考えなどについて 話し合ったり意見の交換をしたりする 都立工芸高校学力スタンダード 300~600 語程度の教科書の文章の内容を理解した後に 英語

習う ということで 教育を受ける側の 意味合いになると思います また 教育者とした場合 その構造は 義 ( 案 ) では この考え方に基づき 教える ことと学ぶことはダイナミックな相互作用 と捉えています 教育する 者 となると思います 看護学教育の定義を これに当てはめると 教授学習過程する者 と

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

第14回情報プロフェッショナルシンポジウム予稿集

Taro-小学校第5学年国語科「ゆる

スライド 1

PowerPoint プレゼンテーション

言語切替 KW 検討用 4 つの検索モードが用意されている 今回は 複数の検索項目を設定でき より目的に近い検索ができることから 構造化検索 モードを選択 した事例を紹介する 調査目的および調査対象 調査対象例として下記の調査目的および開発技術を設定した 調査目的 : 自社で以下の技術を開発した 中

2 Web ページの文字のサイズを変更するには 以下を実行します Alt + P キーを押して [ ページ ] メニューを選択します X キーを押して [ 文字のサイズ ] を選択します 方向キーを押して 文字のサイズを [ 最大 ] [ 大 ] [ 中 ] [ 小 ] [ 最小 ] から選択します

(Microsoft PowerPoint - \220V\213\214\225\266\217\221\224\344\212r\203\\\203t\203g\202o\202o\202s\216\221\227\277ADVIT1-30\224\305.ppt)

J-SOX 自己点検評価プロセスの構築

することができます通常は 開発現場ごとに 関数の説明として記述する内容や形式が決まっていること が多いです javadoc 内では コメントを記入する際にクラスやメソッドの役割を示す為のタグを使用します : : クラス

はじめに このスタートアップマニュアルは はじめて弊社サービスをご利用される方のためにご用意していますので ホームページ運営に必要な ごく基本的な使い方だけをご紹介しています 詳しい使い方の説明は オンラインマニュアルをご覧ください ホームページ運営にあたりどんなによい商品やすばらしい技術であっても

1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します 一般に OSS は営利企業ではない特定のグループが開発するソフトウェアで ソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが 大規模な

機能紹介:コンテキスト分析エンジン

分野 コース名 基礎的 IT セミナーコース一覧 内容 I T 理解 I T スキル活用 I T 倫理 新技術動向 業務の I T 化 ネットワーク 表計算 ベデーースタ プンレ / ゼ文ン書テ作ー成ショ ホームページ 情報発信コンンプスライア 情報テセィキュリ 1 第 4 次産業革命のインパクト新

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ

<4D F736F F D F8E FEE95F1836C F8EE88F878F F88979D8BC68ED2976C A2E646F63>


< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

Word2013基礎 基本操作

指定立替納付を使った場合の 国内提出書類の提出方法 1 出願書類や 納付書などを 指定立替納付で支払う場合の手順をご案内します ここでは ひな型を Word で編集する場合の手順を案内します 他を利用する場合は ユーザガイドをご覧ください (1) 指定立替納付を使うための事前準備 a. クレジットカ

フィルタとは

簡易版メタデータ

指導内容科目国語総合の具体的な指導目標評価の観点 方法 読むこと 書くこと 対象を的確に説明したり描写したりするなど 適切な表現の下かを考えて読む 常用漢字の大体を読み 書くことができ 文や文章の中で使うことができる 与えられた題材に即して 自分が体験したことや考えたこと 身の回りのことなどから 相

目次 1 Adobe PDF でチェック & コメントのススメ 2 チェック & コメントをはじめる前に 4 チェック & コメントでよく使うツール ( その 1) 6 チェック & コメントでよく使うツール ( その 2) 8 コメントの確認と返信 10 共有レビュー機能で効率をさらにアップ 12

言語切替 4 つの検索モードが用意されている 今回は 複数の検索項目を設定でき より目的に近い検索ができることから 構造化検索 モードを選択 した事例を紹介する pg. 2

グーグル検索マクロの使い方

2. オプション設定画面で, 必要事項を記入 選択します. 少なくとも, タイトル に課題の見出しとなる文章を入力する他, 種別 を アンケート( 無記名式 ) に設定する必要があります. また, アクセス制限はここでは コースメニューで非表示にする に設定します. その他設定は必要に応じて行って下

売れる! インターネット活用術 < 第 3 回 > SEO の基礎知識 株式会社スプラム 代表取締役竹内幸次 ( 中小企業診断士 ) SEO で新規顧客を導く 世界一の検索サイト Google で http とだけ入力して検索すると 252 億ページがヒットします ( 見つかります ) 日本語のペー

言語切替 KW 検討用 4 つの検索モードが用意されている 今回は 複数の検索項目を設定でき より目的に近い検索ができることから 構造化検索 モードを選択 した事例を紹介する 調査目的および調査対象 調査対象例として下記の調査目的および開発技術を設定した 調査目的 : 以下の技術を開発した 中国にお

Kazasu アンケート機能 操作マニュアル 1

10SS

PowerPoint プレゼンテーション

Microsoft PowerPoint - 簡易マニュアル_ver1.1.ppt [互換モード]

Microsoft PowerPoint - T4OOマニュアル_admin管理者_ pptx

リスクテンプレート仕様書

Microsoft Word - P doc

2 マンション管理業界の課題マンション管理業界の課題理事会理事会理事会理事会とのとのとのとのコミュニケーションコミュニケーションコミュニケーションコミュニケーション管理員管理員管理員管理員とのとのとのとのコミュニケーションコミュニケーションコミュニケーションコミュニケーション学習学習学習学習 研磨研

JACi400のご紹介~RPGとHTMLで簡単Web化~

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

ベースのソフトウェア情報と突合するかといった点が重要になるが 実際には資産管理ツールだけでは解決できず 最終的に専門的な知識を有した人の判断が必要とされる この点の解決策としては 2012 年 5 月にマイクロソフトも対応を表明した ISO/IEC のソフトウェアタグに期待が集まって

読取革命Ver.15 かんたん操作ガイド

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

Microsoft PowerPoint _OSC_Tokyo_JTFStyleGuide [互換モード]

このルールをそのまま正規表現として書くと 下記のようになります ^A[0-9]{2}00[0-9]{3}([0-9]{2})?$ ちょっと難しく見えるかもしれませんが 下記のような対応になっています 最初 固定 年度 固定 通番 ( 枝番 ) 最後 ルール "A" 数字 2 桁 0 を 2 桁 数字

目次 レポート 3. 概要 4. 主要なインサイト 5. 地域ごとの SEM 業界の支出増加率 6. 検索エンジンごとの SEM 業界の支出増加率 7. SEM 支出のシェア 8. Google の検索ビジネス売上予測 9. 世界全体での業界セクターごと SEM 支出増加 10. 世界全体でのディス

Microsoft Word - JSQC-Std 目次.doc

3.e-Tax や確定申告書等作成コーナーをどのようにして知りましたか < 複数回答 > ( 件 ) 4. 利用した ( 利用予定 ) 手続 < 複数回答 > ( 件 ) 贈与税については 平成 24 年分の申告から e-tax を利用して提出 ( 送信 ) できるようになりました 2

スライド 1

目次 更新履歴... 1 画面設計書の目的... 3 必要な内容... 3 画面一覧... 4 必要な内容... 4 画面遷移... 5 画面レイアウト... 6 入力パラメータ... 7 必要な内容... 7 項目定義... 8 必要な内容... 8 部品の種類... 9 ( 参考 ) 部品指定と

Ⅱ. 国立がんセンター研究センター用申請書の作成について Ⅱ-1. カット ドゥ スクエアにおける中央病院と東病院の表示区分 がん研究センターにおいては 中央病院と東病院が独立して治験を実施する一方 実施医療機関としては 独立行政法人がん研究センター となることから カット ドゥ スクエアにおいて

Moodleアンケートの質問一括変換ツール

IBM Cloud Social Visual Guidelines

Transcription:

日本語文章の課題と前編集手法 用語集形式 UTX と実務日本語の観点から Issues of Japanese writing and pre-edit approaches to address these issues - In view of UTX and Practical Japanese - PROFILE: 秋桜舎代表山本ゆうじ 筑波大学を経てシカゴ大学修士号 実務翻訳業務 大規模翻訳 文書管理 / 作成の講習やコンサルを行う 近著に IT 時代の実務日本語スタイルブック 書きやすく 読みやすい電子文書の作文技法 1 体系的翻訳手法の現状 本稿では 日本語文章 ( ビジネス文書や特許文書 ) のさまざまな課題の中から CAT( コンピューター翻訳支援 ) での 前編集 に関わる問題を 用語集形式 UTX( 後述 ) と実務日本語がどのように解決できるかを説明する 大企業 大規模組織では ICT を活用する体系的翻訳手法が必要になる 体系的翻訳手法とは 用語集 スタイルガイド 翻訳メモリー 翻訳ソフトのすべてを活用して 品質と効率を最大化する手法を指す これらす い もしするとしてもそのプロジェクト限りであろう Venice をヴェネツィア ベネチア ヴェニス ベニスのどれで表記するかを 研究科が強制することはない 良くも悪くも研究者個人の判断しだいであるし 文書の性質によって変えることもある このような大学での文書に対して 企業の文書は 個人名ではなく企業名で出されるため 多くの文書で用語や表記を統一することが重要になる 外部向けの文書ではもちろんだが 内部文書でも統一することが望ましい このような大学と企業の翻訳に関する状況の違いがあるため 大学の研究者に CAT の話をしても 用語集 スタイルガイド 翻訳メモリーの必要性が理解されないことも多い べてに ICT が関わるが CAT という呼称では 特に翻 訳メモリーや翻訳ソフトが中心となる 実際には 体系的翻訳手法が正しく機能している事例は少ない 体系的翻訳手法に対する理解度も企業や個人で大きな差があり 共通理解が関係者間で共有されているとは到底いえない 企業で 用語集が不完全や矛盾だらけという例や 翻訳メモリーの基本機能を勘違いしている例はまだいい 翻訳メモリーやスタイルガイドの存在すら知らない 用語集がまったく使われていないなど 重大な問題はいくらでもある また 体系的翻訳手法は 企業では活用されているが 大学ではあまり使われていない 研究者は原文を直接読めるので翻訳が不要 というのは理由の一部でしかない 日本では 翻訳という作業が独立した分野と見なされてこなかった 研究者が行う翻訳は 個人レベルが多い 研究グループや複数の著者が関係する論文でも 個人の著作の集合である 用語および表記統一が厳密に求められるとは限らな 2 概訳と翻訳支援の違い 翻訳関連技術には 概訳 と 翻訳支援 という 2 つの異なる方向性 ( または用途 ) がある 概訳とは 翻訳者でない人が外国語文章のだいたいの意味を知るときに必要とするレベルの翻訳である 一般的な流れは Google Translate などの翻訳サイトでボタンをクリックして 出力された訳文を確認するだけ というものである 機械翻訳の生の出力そのままであるため 処理速度は最も速い一方で 翻訳精度は低い 概訳が目的の場合 後編集 ( 機械翻訳処理後の手作業の修正作業 ) はほとんど またはまったく行わない なお 概訳は 抄訳 とは異なる点は注意が必要である 抄訳は 翻訳と要約を同時に行う 高度な作業である 概訳に対して 翻訳支援とは 通常 プロ翻訳者が高 316 YEAR BOOK 2013

317 YEAR BOOK 2O13 寄稿集産業日本語関連5 品質の訳文を完成させる過程を支援することである 翻訳支援では 翻訳メモリーが中心となるが 一部の翻訳ソフトも含まれる 翻訳関連技術の専門家同士が話をしていても 概訳と翻訳支援という前提の違いに気づかないと 話が食い違うことがよくある 概訳と翻訳支援は 同じ自然言語処理技術に基づくことはあるが 機械翻訳ユーザーの技能が大きく異なり ユーザーが作成する訳文の品質もまったく異なる 概訳で使われることも多い統計機械翻訳では イタリア語とスペイン語 韓国語と日本語など 類似言語間では一定の精度が得られる しかし 英語と日本語という言語構造と語順が大きく異なる言語の組み合わせでは 十分な精度は得られない だが 最近の傾向では 実際の精度を無視して 異種言語での統計機械翻訳をむりやりに適用して翻訳コストを浮かそうとする試みがあり 問題を生んでいる 概訳と翻訳支援のどちらであっても 体系的翻訳手法がうまく機能しない大きな原因の一つは 品質の低い文書 つまり 悪文 である これは 作文という分野が 企業 組織 教育機関で軽視されていることによるもので 文書作成者側の問題である 文章の問題は 数値化しにくく 発見しにくい 特に ある文章がどれだけ分かりやすいか という点は放置されていることが多い 専門家同士の文書のやり取りで 互いに意味不明の専門用語を乱発し 互いによく理解していないのに あえて放置していることがないだろうか 文章の問題による現実的な悪影響は 発見しにくくはあっても確かに存在する たとえば用語と表記の不統一により 読み手が混乱することや 翻訳工程で本来は不要な作業が発生し コストが増大することなどである 日本語能力は 基本的な能力であるため 根本的に改善するには日本の学校教育全体を変えるしかない たとえば 理系学生への作文教育を改革し 論文の論理を改善できれば 国際的な論文発表の場でも大きな効果を上げうると思われる 文章の訓練は少なくとも中学生から開始すべきだろう 開始する時期が遅ければ負担も増える 作文習慣がすでに定着した社会人が 作文訓練により成果を上げるには 一定の困難を克服する必要がある 作文改善では 文書作成者自身が自分の文章を自分で改善することが理想的である 機械翻訳の前処理としての作文改善をだれがするか という役割は 便宜的に 文書作成者 リライター 翻訳者に 3 分できる まず文書作成者自身が自分の文章を確認して改善できれば 不要な費用は抑えられ 効果も高い そのためには文書作成者の訓練が必要となる だが特許文書 法律文書 医療関連文書などの専門知識が必要になる文章では それらの専門知識のほうが重要視され 文章技能は軽視されがちである 文書作成者自身による作文改善や訓練が困難な場合は 作成者以外のリライト専門家 つまりリライターがその文書を書き直すことになる リライターは 表記や文書の改善のポイントを熟知しているため 費用が問題でなければ 作文改善としては確実な方法とは言える しかし 工程が増えることにより 追加の費用と作業時間が発生する 作文改善が必要な状況でも 実際にはリライターによる書き直しができるのは限定的かもしれない これらの役割を用途別に考えてみよう この機械翻訳を概訳用途で使用する場合は 機械翻訳の結果が悪ければ 機械翻訳ユーザー自身がリライトをする ということになる 機械翻訳を翻訳支援で使用する場合は 文書作成者に修正を依頼することは困難なことが多く リライターが入る予算的余裕もないので 翻訳者がリライトをせざるをえないこともある ただ 翻訳者にとっては機械翻訳の精度を上げるために役立たなければリライトをする意味がない このように考えれば 前処理 という段階に至る前に 文書作成者自身が自分の文書を自分で改善することが理想的である 3 悪文は体系的翻訳手法の足かせとなる 4 文書作成者 リライター 翻訳者

5 スタイルガイドの必要性 6 スタイルチェックツールの必要性 作文改善方法の一つとして 表記を記載したスタイルガイドは 機械翻訳など文章処理の精度を上げるのはもちろんだが 文章の外観を統一することで読み手にとっても利点がある 英語では表記を統一するのは常識だが 日本語では表記が多様なこともあり表記統一は後回しにされがちである ユーザー辞書に基づいて翻訳処理をするルールベース機械翻訳では 特に用語の表記統一がされれば翻訳精度が高まる 言語用語の表記にばらつきがあると それぞれの表記に訳語を登録する必要がある ( 前述の Venice/ ヴェネツィア Venice/ ベニス など ) 特許文書ではスタイルガイドを参照して作成することはまだ一般的ではないが 今後 表記に関する関心が高まることが望ましい スタイルガイドの例として 日本翻訳連盟 (JTF) が 2011 年に作成し 公開した翻訳用スタイルガイドがある 文章改善には スタイルガイドに加えて スタイルチェックツールとそれを組み込んだワークフローが必要である 前述したようにスタイルガイドは重要ではあるが それさえあれば適切な文章が書けるというわけではない スタイルガイドを隅々まで読み込んで遵守する書き手は少数派であろう また スタイルガイドの恩恵を直接得られるのは 読み手であり 書き手はそれを直接感じにくい また ルールというものは 実行する以上は厳密でなければ 無視されがちである 文章の問題を確実に確認して修正するには スタイルガイドに加えて スタイルチェックツールを必ず使用する必要がある ( 前掲書 p. 234 チェックリスト ( 置換リスト ) とチェックツール ) スタイルガイドの中で 文法的な面ではツールによるチェックが困難な項目もあるが 言い換え表現など 機械的にチェックし置換できる項目もまた多い 詳 細 :<http://www.jtf.jp/jp/style_guide/ 文書作成では 電子文書作成の基本ルールが守られて styleguide_top.html> 表記ルール以外にも 作文ルールとして 格助詞や連用節の扱い方など 文法に基づいて文章を読みやすくするルールもある このような文法的作文ルールは 論理的ではあるが 実践の場では十分に活用するには注意を要する 文書作成者が作文するときは 自分の文書の本題に集中しており 読み手にとっての読みやすさまでなかなか意識が及ばない さまざまな文法用語を考えながら文書作成者に書くように求めるには 文書作成者を徹底的に訓練する必要があり 文書作成者にも動機付けが必要になるだろう 別のアプローチとしては 文法的作文ルールよりも単純化した より実際的な基準を使うことができる 著者が提唱する 実務日本語 では 文法的な基準をあえて使わず 1 文が 100 字を超えたら分割する ( 百半ルール ) という 実際的なルールを採用している ( 山本ゆうじ IT 時代の実務日本語スタイルブック 書きやす いないことも多い たとえば 全角英数字の禁止 空白文字を使ってレイアウトしない 丸数字のような機種依存文字を使わない 箇条書きは記号を入力するのではなく書式設定で行う などである ( 前掲書 p. 80 内離ルール 内容とレイアウトを分離する )) これらは電子文書に特有の事項ではあるが スタイルガイドに含まれることもある これらもまた機械的にチェックできる このような 機械的にチェックできる項目をわざわざ人間にチェックさせるのは不確実であるうえに 効率が悪い 機械的にチェックできる項目はスタイルガイドで明確に区別し 人間は 人間にしかできないチェック項目に集中すべきである たとえば 前述の JTF スタイルガイドについては 現在 3 つのスタイルチェックツールが以下で公開されている <http://www.jtf.jp/jp/style_guide/ stylechecktool.html > く 読みやすい電子文書の作文技法 2012 年 ベレ 出版 p. 90) 318 YEAR BOOK 2013

7 用語集の必要性 用語レベルで日本語文章を改善するには スタイルガイドやスタイルチェックツール以外に 用語集が必要となる 用語集では どのような用語が分かりやすく 適切かという点が重要である 一般に 漢語の用語は意味が推測できることが多い 一方 一部のカタカナ語 頭字語は説明不足で読み手の理解を妨げる要因になる たとえば ベストプラクティス というカタカナ語の意味はよく伝わらないことも多いが 代わりに 最善慣行 という用語を使えばだいたいの意味は推測できる このように翻訳での 不適切な訳語 がそのまま不適切な用語となることも多い 読み手が該当分野の専門家でない限り TS WD NP TMX TBX などのアルファベットが説明抜きでぞろぞろ出てきたら だれしも面食らう しかも分野によって意味が異なる可能性もある だが これらの頭字語を日常的に使っている人にとっては 読み手が理解できるか など意識すらしていないかもしれない このような頭字語は 言い換える必要があるかもしれない また 難しい言い回しや専門用語を乱用することが 特許文書らしい 論文らしい などと誤解されていることも多い 読み手にしっかり伝わらない用語を乱用するのは 自らの作文能力の貧しさをさらけだすことである より確実に理解できる用語を常に探す姿勢が求められる 8 UTX 用語集と機械翻訳の改善 文書作成や翻訳で用語集を使う場合や 機械翻訳を活用する際は 用語集形式 UTXを活用できる ( 下図参照 ) UTX(Universal Terminology exchange) は AAMT( アジア太平洋機械翻訳協会 ) が策定した シンプルかつ汎用的で オープンな用語集形式である ( 筆者は UTX を策定するチームリーダーを務める ) 寄稿集産業日本語関連5 YEAR BOOK 2O13 319

UTX の詳細 : < http://www.aamt.info/japanese/utx/> 翻訳の現場では 複雑な用語集ではなく 今すぐ使えるシンプルな用語集が必要とされている UTX は その要望に応え ルールベース機械翻訳の基礎となる用語集データ ( ユーザー辞書 ) となるとともに 機械翻訳とは別個の 人間翻訳でも扱いやすい用語集としても優れた形式である UTX は 特許庁の機械翻訳調査での辞書作成に使われているほか 企業での翻訳工程改善に活用されている UTX には 4 つの用語ステータス ( 暫定 承認 非標準 禁止 ) による用語管理の機能があり 複数の用語のうち どれが正規の用語で どれが許容の用語を区別できる この情報に基づいて 用語のばらつきをなくすこともできる ( 下図参照 ) UTX は 本来は 翻訳用の対訳用語集形式だが 日本語のみ など単一言語用語集としても作成できる 翻訳ソフトの辞書編集機能には用語管理の観点がなく 用語の整理がしづらいことがある UTX は 分野を整理して必要な辞書のみを適切に組み合わせることで 最大限の効果を発揮する 各種の分野が混在した巨大な辞書では UTX の本来の効果は得られない UTX などの適切な用語データに基づくルールベース機械翻訳では 対訳翻訳エディターを使えば 翻訳者の 意図通りに翻訳を進めることができ 効率的な翻訳支援となる 用語データを管理する時点で 適切な用語適用がほぼ保証されるため 別途に用語をチェックする必要は少ない これに対して 統計機械翻訳では どれだけ精度が上がっても 最後の一歩 が必ず不足する 統計である以上 文レベルで人間訳に 非常に近い 結果は得られることはあっても なにかが違う そしてそのなにかは 予測不能である 用語レベルでも用語適用の保証がされないため 用語チェックは 統計機械翻訳とは独立した過程として別途 行う必要がある 統計機械翻訳を翻訳支援に使うことは 見方によれば ソフトが統計処理可能な部分のみを処理してしまい 処理不可能だった点を人間翻訳者に押し付けるしくみということもできる それで人間翻訳の単価が引き下げられては 翻訳者にとってはたまったものではない 統計機械翻訳は 前述の通り 類似言語間の概訳 には有効でも 日本語英語間のような異種言語のプロ翻訳者にとっては翻訳支援をするどころか 厄介ものでしかない 少なくとも日英 英日の場合 現状では 翻訳者が 主体的に活用でき また活用すべきなのは 統計機械翻訳よりもルールベース機械翻訳である 将来的には 統計機械翻訳でも UTX による用語適用が必要になってくるだろう 320 YEAR BOOK 2013

9 ルールベース機械翻訳のユーザー辞書に必要なのは 原語 訳語 品詞などの基本的な対訳情報のみであり 名詞の細かな概念属性などの付加情報は必要ない 名詞 が固有名詞か否か程度は役立つが それ以上の細かい特 性の記述は 管理上の負担を増加させる割には ルール ベース機械翻訳の翻訳精度を向上させない システム辞 書としては有用な情報であっても 翻訳者の立場 で 作るユーザー辞書では必要ないのである ここに 機械 翻訳開発者の発想と翻訳者の発想の大きなギャップがあ る 開発者がこのことを理解するには 自分で翻訳ソフ トを使って翻訳作業をしてみる必要がある そうすれば はじめて 本当に必要なのは高品質だがシンプルな用語 集ということが実感できる シンプルな UTX 用語集は 特許文書などに必ず添付 する用語データ形式として収集できれば 特許機械翻訳 の精度を大きく向上できる 用語集をゼロから作るのは 大変な作業である だが 断片的な ミニ用語集 であっ ても UTX のような統一された形式で集めることによ り 大きな力にすることができる UTX については以下の よくある質問と回答 も参 照されたい <http://www.aamt.info/japanese/utx/faq. htm> 必要なのは高品質のシンプルな対訳用語集 10 UTX 変換ツールで開ける世界 AAMT の UTX チームでは 現在 初心者ユーザー にも使いやすい UTX 変換ツールを開発中である ( 下図 参照 ソースコードを含め 無償で公開予定 ) このツー ルを使えば 翻訳ソフト各社の独自形式や 用語ツール 用の形式 (MultiTerm 用語ベースなど ) と UTX を相 互に変換できる UTX 用語集から 用語ステータスが 禁止 となっ ている用語を抽出すれば 使ってはいけない用語 の リストを作成することもできる さらに それらの禁止 語と 用語ステータスが 承認 の語をペアにした置換 リストを作ることもできる この置換リストを前述のス タイルチェックツールなどで使えば 手作業でスタイ ルガイドを参照するよりも確実かつ効率的に用語を修 正できる たとえば 褥瘡 などの難解な専門用語を より分かりやすい 床ずれ などの用語に置換できる また 不必要に回りくどい表記を 簡潔な表記に置換す ることもできる UTX はシンプルではあるが シンプルであればこそ の汎用性と可能性を秘めている UTX 変換ツールが完 成すれば UTX は 前処理の手順を単純化するとともに 機械翻訳の用語データとして また実用的な用語集形式 として 活躍の場を大きく広げることだろう 寄稿集産業日本語関連5 UTX 変換ツール完成予想図 YEAR BOOK 2O13 321