ズテーブルを 用 いて 対 訳 専 門 用 語 を 獲 得 する 手 法 を 提 案 する 具 体 的 には まず 専 門 用 語 対 訳 辞 書 獲 得 の 情 報 源 として 用 いる 日 中 対 訳 文 対 に 対 して 句 に 基 づく 統 計 的 機 械 翻 訳 モデルを 適 用 すること



Similar documents
本 論 文 の 構 成 は 以 下 のとおりである 2 節 では 特 許 デー タベースからの 上 位 下 位 概 念 の 抽 出 法 を 述 べ 3 節 では 日 英 の 用 語 間 の 対 応 付 け 方 法 について 説 明 する 4 節 では 本 研 究 で 行 った 実 験 について 述

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

様式(補助金)

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

2 出 願 資 格 審 査 前 記 1の 出 願 資 格 (5) 又 は(6) により 出 願 を 希 望 する 者 には, 出 願 に 先 立 ち 出 願 資 格 審 査 を 行 いますので, 次 の 書 類 を 以 下 の 期 間 に 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 等

<4D F736F F F696E74202D208E9197BF332E8EA98CC8955D89BF82CC95FB C982C282A282C BD90AC F944E93788EC08E7B95AA814191E C5816A2E707074>

平成15・16年度の建設工事入札参加資格の認定について

Microsoft Word - H29年度実施要領

( 教 育 職 員 免 許 状 の 取 得 ) 第 9 条 教 育 職 員 免 許 状 ( 幼 稚 園 教 諭 二 種 免 許 状 )を 取 得 しようとする 者 は 教 育 職 員 免 許 法 に 基 づき 別 表 2に 掲 げる を 修 得 しなければならない 2 教 育 職 員 免 許 状 の

別 紙

佐渡市都市計画区域の見直し

平成19年9月改定

参 考 様 式 再 就 者 から 依 頼 等 を 受 けた 場 合 の 届 出 公 平 委 員 会 委 員 長 様 年 月 日 地 方 公 務 員 法 ( 昭 和 25 年 法 律 第 261 号 ) 第 38 条 の2 第 7 項 規 定 に 基 づき 下 記 のとおり 届 出 を します この

<4D F736F F D2093CD8F6F82AA954B977682C88C9A95A882CC94BB926682CC DD5F48508C668DDA E646F63>

入 札 参 加 者 は 入 札 の 執 行 完 了 に 至 るまではいつでも 入 札 を 辞 退 することができ これを 理 由 として 以 降 の 指 名 等 において 不 利 益 な 取 扱 いを 受 けることはない 12 入 札 保 証 金 免 除 13 契 約 保 証 金 免 除 14 入

<8C9A90DD94AD90B696D88DDE939982CC8DC48E918CB989BB82C98AD682B782E98E9696B18EE688B CC FC90B3816A2E786477>

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や

ト ン ネ ル ご 施 工 計 画 施 工 設 備 及 び 積 算 建 設 環 境 上 水 道 及 び 工 業 用 水 道 技 術 部 門 上 下 水 道 部 門 に 該 当 する 下 水 道 資 農 業 土 木 技 術 部 門 農 業 部 門 に 該 当 する 資 と の RCCM の 資 森 林

岩手県立大学学則

容 積 率 制 限 の 概 要 1 容 積 率 制 限 の 目 的 地 域 で 行 われる 各 種 の 社 会 経 済 活 動 の 総 量 を 誘 導 することにより 建 築 物 と 道 路 等 の 公 共 施 設 とのバランスを 確 保 することを 目 的 として 行 われており 市 街 地 環

(2)大学・学部・研究科等の理念・目的が、大学構成員(教職員および学生)に周知され、社会に公表されているか

第 3 節 結 果 1. 調 査 票 の 回 収 324 か 所 から 回 答 を 得 た ( 回 収 率 29.5%) 一 般 診 療 所 総 数 回 答 数 回 収 率 (%) 大 津 湖 南 甲 賀 東 近 江

2. ど の 様 な 経 緯 で 発 覚 し た の か ま た 遡 っ た の を 昨 年 4 月 ま で と し た の は 何 故 か 明 ら か に す る こ と 回 答 3 月 17 日 に 実 施 し た ダ イ ヤ 改 正 で 静 岡 車 両 区 の 構 内 運 転 が 静 岡 運

総合評価点算定基準(簡易型建築・電気・管工事)

本 校 の 沿 革 昭 和 21 年 昭 和 49 年 昭 和 54 年 昭 和 60 年 平 成 9 年 平 成 11 年 平 成 18 年 北 海 道 庁 立 農 業 講 習 所 として 発 足 北 海 道 立 農 業 大 学 校 に 改 組 修 業 年 限 を1 年 制 から2 年 制 に 改

ず 第 1 段 階 目 の 選 抜 に 係 る 額 は4,000 円 とし 第 2 段 階 目 の 選 抜 に 係 る 額 は13,000 円 と する 4 第 1 項 に 規 定 する 幼 稚 園 小 学 校 及 び 中 学 校 並 びに 特 別 支 援 学 校 の 小 学 部 中 学 部 及 び

3. 選 任 固 定 資 産 評 価 員 は 固 定 資 産 の 評 価 に 関 する 知 識 及 び 経 験 を 有 する 者 のうちから 市 町 村 長 が 当 該 市 町 村 の 議 会 の 同 意 を 得 て 選 任 する 二 以 上 の 市 町 村 の 長 は 当 該 市 町 村 の 議

平成17年度高知県県産材利用推進事業費補助金交付要綱

第4回税制調査会 総4-1

為 が 行 われるおそれがある 場 合 に 都 道 府 県 公 安 委 員 会 がその 指 定 暴 力 団 等 を 特 定 抗 争 指 定 暴 力 団 等 として 指 定 し その 所 属 する 指 定 暴 力 団 員 が 警 戒 区 域 内 において 暴 力 団 の 事 務 所 を 新 たに 設

官 庁 営 繕 事 業 の 事 後 評 価 表 事 業 名 かいじょうほあんだいがっこう(そうごうじっしゅうとう) 海 上 保 安 大 学 校 ( 総 合 実 習 棟 ) 実 施 箇 所 呉 市 若 葉 町 5-1 該 当 基 準 事 業 完 了 後 3 年 間 が 経 過 した 事 業 事 業 諸

資料2-2 定時制課程・通信制課程高等学校の現状

原 則 として 事 業 主 は 従 業 員 から 扶 養 控 除 等 申 告 書 の 提 出 を 受 けた 後 に 給 与 の ( 事 業 主 )の 番 号 を 記 載 しなければならない ただし 事 業 主 が 人 の 場 合 には 人 番 号 は 一 般 に 公 表 されている 番 号 であるた

者 が 在 学 した 期 間 の 年 数 を 乗 じて 得 た 額 から 当 該 者 が 在 学 した 期 間 に 納 付 すべき 授 業 料 の 総 額 を 控 除 した 額 を 徴 収 するものとする 3 在 学 生 が 長 期 履 修 学 生 として 認 められた 場 合 の 授 業 料 の

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

奨学事業戦略部個人情報ファイル簿

 三郷市市街化調整区域の整備及び保全の方針(案)

<4D F736F F D C689D789B582B581698AAE90AC92CA926D816A2E646F63>

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定

Q IFRSの特徴について教えてください

目 次 利 用 に 際 しての 注 意 事 項... ユーザー 登 録... ログイン... 課 題 申 請... 5 装 置 予 約... 6 ライセンス 取 得 方 法... 7 利 用 料 金 の 確 認 ( 準 備 中 ) 外 部 発 表 登 録 の 方 法... 5 < 附

(1)1オールゼロ 記 録 ケース 厚 生 年 金 期 間 A B 及 びCに 係 る 旧 厚 生 年 金 保 険 法 の 老 齢 年 金 ( 以 下 旧 厚 老 という )の 受 給 者 に 時 効 特 例 法 施 行 後 厚 生 年 金 期 間 Dが 判 明 した Bは 事 業 所 記 号 が

document list A

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

<4D F736F F D B3817A8E9096E291E D86939A905C>

Microsoft Word - 文書 3

IAF ID x:2010 International Accreditation Forum, Inc. Page 2 of 8 国 際 認 定 機 関 フォーラム(IAF)は 適 合 性 評 価 サービスを 提 供 する 機 関 の 認 定 のためのプログラ ムを 運 営 している この 認 定

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について

ジョブ・カード様式

財団法人○○会における最初の評議員の選任方法(案)

私立大学等研究設備整備費等補助金(私立大学等

Taro-08国立大学法人宮崎大学授業


公文書非公開決定処分に関する諮問について(答申)

<4D F736F F F696E74202D208E518D6C E9697E18F F4390B3205B8CDD8AB B83685D>

< F2D EF68BC697BF939994EF977082C98AD682B782E98B4B>

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

鳥 取 国 民 年 金 事 案 177 第 1 委 員 会 の 結 論 申 立 人 の 昭 和 37 年 6 月 から 38 年 3 月 までの 国 民 年 金 保 険 料 については 納 付 していたものと 認 められることから 納 付 記 録 を 訂 正 することが 必 要 である 第 2 申

(2) 広 島 国 際 学 院 大 学 ( 以 下 大 学 という ) (3) 広 島 国 際 学 院 大 学 自 動 車 短 期 大 学 部 ( 以 下 短 大 という ) (4) 広 島 国 際 学 院 高 等 学 校 ( 以 下 高 校 という ) ( 学 納 金 の 種 類 ) 第 3 条

平成24年度開設予定大学院等一覧(判定を「不可」とするもの)

SNSとLMSの強みと弱み 統合環境を目指して (教育学部紀要投稿用)

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 23 年 4 月 1 日 現 在 ) 1 号 給 の 給 料 月 額 最 高 号 給 の 給 料 月 額 1 級 2 級 3 級 4 級 5 級 ( 単 位 : ) 6 級 7 級 8 級 135, , ,900 2

4 応 募 者 向 けメニュー 画 面 が 表 示 されます 応 募 者 向 けメニュー 画 面 で [ 交 付 内 定 時 の 手 続 を 行 う] [ 交 付 決 定 後 の 手 続 を 行 う]をクリックします 10

新 行 財 政 改 革 推 進 大 綱 実 施 計 画 個 票 取 組 施 策 国 や 研 究 機 関 への 派 遣 研 修 による 資 質 向 上 の 推 進 鳥 インフルエンザ 等 新 たな 感 染 症 等 に 対 する 検 査 技 術 の 習 得 など 職 員 の 専 門

スライド 1

2) 言 語 能 力 SPACE J では 以 下 の 日 本 語 の 能 力 が 求 められます 文 化 教 育 学 部 教 育 学 研 究 科 経 済 学 部 経 済 学 研 究 科 理 工 学 部 工 学 系 研 究 科 農 学 部 農 学 研 究 科 学 部 生 JLPT N2 以 上 SP

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている

( 様 式 2) 営 業 所 一 覧 表 番 号 営 業 所 名 称 測 量 土 木 関 係 コンサル 登 録 を 受 けている 業 務 電 話 番 号 ( 上 段 ) 地 質 調 査 環 境 調 査 所 在 地 FAX 番 号 ( 下 段 ) 建 築 関 係 コンサル 補 償 コンサル 各 法 令

平 成 27 年 11 月 ~ 平 成 28 年 4 月 に 公 開 の 対 象 となった 専 門 協 議 等 における 各 専 門 委 員 等 の 寄 附 金 契 約 金 等 の 受 取 状 況 審 査 ( 別 紙 ) 専 門 協 議 等 の 件 数 専 門 委 員 数 500 万 円 超 の 受

製 造 業 者 は 製 造 販 売 業 者 の 管 理 監 督 の 下 適 切 な 品 質 管 理 を 行 い 製 品 を 製 造 します なお 製 造 業 は 製 造 に 特 化 した 許 可 となっており 製 造 業 の 許 可 のみでは 製 品 を 市 場 に 出 荷 することはできま せん

有 料 老 ホーム ( ) ( 主 として 要 介 護 状 態 にある を 入 居 させるも のに 限 る ) 第 29 条 ( 届 出 等 ) 第 二 十 九 条 有 料 老 ホーム( 老 を 入 居 させ 入 浴 排 せつ 若 しくは 食 事 の 介 護 食 事 の 提 供 又 はその 他 の

Microsoft Word 役員選挙規程.doc

独立行政法人国立病院機構呉医療センター医療機器安全管理規程

Taro-02 調査概要(280705).jtd

住み慣れたこの町で最期まで 安心して暮らすために

第 1 条 適 用 範 囲 本 業 務 方 法 書 は 以 下 の 性 能 評 価 に 適 用 する (1) 建 築 基 準 法 施 行 令 ( 以 下 令 という ) 第 20 条 の7 第 1 項 第 二 号 表 及 び 令 第 20 条 の 8 第 2 項 の 認 定 に 係 る 性 能 評


<4D F736F F F696E74202D C90BF8F CC8DEC90AC97E181698A4F8D E8816A5F56322E707074>

別記

定款  変更

4 教 科 に 関 する 調 査 結 果 の 概 況 校 種 学 年 小 学 校 2 年 生 3 年 生 4 年 生 5 年 生 6 年 生 教 科 平 均 到 達 度 目 標 値 差 達 成 率 国 語 77.8% 68.9% 8.9% 79.3% 算 数 92.0% 76.7% 15.3% 94

2.JADA 検 査 対 象 者 登 録 リストへの 登 録 除 外 引 退 復 帰 2.1 JADA 検 査 対 象 者 登 録 リストへの 登 録 及 び 除 外 は 原 則 として 以 下 に 示 す 対 応 によりおこな うものとする 登 録 国 内 競 技 連 盟 からの 登 録 申 請

その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

学校教育法等の一部を改正する法律の施行に伴う文部科学省関係省令の整備に関する省令等について(通知)

Microsoft Word - H22.4.1市費産休・育休臨任要綱.doc

スライド 0

平成21年9月29日

2 立 候 補 するには 次 に 掲 げる 条 件 を 満 たしていることとする (1) 理 事 又 は 評 議 員 2 名 以 上 の 推 薦 があること (2) 連 続 5 年 以 上 本 学 会 の 正 会 員 で 会 費 を 完 納 していること (3) 選 考 が 行 われる 前 年 の1

資 料 -6 平 成 20 年 度 第 2 回 北 陸 地 方 整 備 局 事 業 評 価 監 視 委 員 会 特 定 構 造 物 改 築 事 業 事 後 評 価 説 明 資 料 平 成 20 年 11 月 北 陸 地 方 整 備 局 -0-

Microsoft Word - 通達(参考).doc

Microsoft Word - 答申第143号.doc

川崎市木造住宅耐震診断助成金交付要綱

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

平成27年度大学改革推進等補助金(大学改革推進事業)交付申請書等作成・提出要領

慶應義塾利益相反対処規程

Microsoft PowerPoint - 経営事項審査.ppt

<4D F736F F D208DE3905F8D8291AC8B5A8CA48A948EAE89EF8ED0208BC696B18BA492CA8E64976C8F BD90AC E378C8E89FC92F994C5816A>

m07 北見工業大学 様式①

(1) 社 会 保 険 等 未 加 入 建 設 業 者 の 確 認 方 法 等 受 注 者 から 提 出 される 施 工 体 制 台 帳 及 び 添 付 書 類 により 確 認 を 行 います (2) 違 反 した 受 注 者 へのペナルティー 違 反 した 受 注 者 に 対 しては 下 記 のペ

一 覧 表 ( 専 従 者 用 ) YES NOチャート( 専 従 月 額 単 価 用 ) (P.4)を 参 考 にしてください < 直 接 雇 用 者 > 一 覧 表 ( 専 従 者 用 )の 単 価 は 委 託 期 間 中 に 継 続 して 半 年 以 上 当 該 AMED 事 業

Transcription:

日 中 パテントファミリーを 利 用 した 専 門 用 語 訳 語 推 定 フレーズテーブルおよび 対 訳 文 対 を 利 用 する 方 式 Estimating Translation of Technical Terms utilizing Japanese-Chinese Patent Families : an Approach based on Phrase Translation Tables and Parallel Sentences 筑 波 大 学 システム 情 報 系 知 能 機 能 工 学 域 教 授 宇 津 呂 武 仁 199 年 京 都 大 学 大 学 院 工 学 研 究 科 電 気 工 学 第 二 専 攻 博 士 課 程 修 了 博 士 ( 工 学 ) 京 都 大 学 等 を 経 て 2012 年 より 筑 波 大 学 システム 情 報 系 知 能 機 能 工 学 域 教 授 自 然 言 語 処 理 機 械 翻 訳 ウェブマイニングの 研 究 に 従 事 筑 波 大 学 大 学 院 システム 情 報 工 学 研 究 科 知 能 機 能 システム 専 攻 董 麗 娟 2012 年 大 連 理 工 大 学 ソフトウェア 工 学 学 院 卒 業 現 在 筑 波 大 学 大 学 院 システム 情 報 工 学 研 究 科 博 士 前 期 課 程 在 学 中 機 械 翻 訳 の 研 究 に 従 事 筑 波 大 学 大 学 院 システム 情 報 工 学 研 究 科 知 能 機 能 システム 専 攻 龍 梓 2010 年 北 京 航 空 航 天 大 学 ソフトウェア 学 院 卒 業 2013 年 北 京 航 空 航 天 大 学 大 学 院 ソフトウェア 工 学 専 攻 修 了 現 在 筑 波 大 学 大 学 院 システム 情 報 工 学 研 究 科 博 士 前 期 課 程 在 学 中 機 械 翻 訳 の 研 究 に 従 事 筑 波 大 学 大 学 院 システム 情 報 工 学 研 究 科 コンピュータサイエンス 専 攻 教 授 山 本 幹 雄 1986 年 豊 橋 技 術 科 学 大 学 大 学 院 情 報 工 学 系 修 士 課 程 修 了 豊 橋 技 術 科 学 大 学 等 を 経 て 2008 年 より 筑 波 大 学 大 学 院 システ ム 情 報 工 学 研 究 科 コンピュータサイエンス 専 攻 教 授 博 士 ( 工 学 ) 自 然 言 語 処 理 機 械 翻 訳 の 研 究 に 従 事 1 はじめに 近 年 中 国 国 内 における 特 許 出 願 は 大 幅 な 伸 びを 見 せ ている それに 伴 い 中 国 語 特 許 文 書 の 言 語 横 断 検 索 等 のサービスの 必 要 性 が 高 まっている これらのことを 背 景 として 中 国 語 の 特 許 を 日 本 語 に 翻 訳 するサービスの 重 要 性 が 次 第 に 高 まっている ここで 機 械 翻 訳 あるい は 人 手 によって 翻 訳 を 行 う 場 合 高 い 質 を 保 つためには 大 規 模 で 正 確 な 対 訳 辞 書 が 不 可 欠 である しかし 各 国 では 年 々 新 しい 技 術 開 発 が 行 われ 新 しい 専 門 用 語 が 作 られ 特 許 が 申 請 されている 一 方 人 手 によって 対 訳 辞 書 を 作 成 するためには 膨 大 な 時 間 と 労 力 を 要 する ため 自 動 もしくは 半 自 動 的 に 日 中 専 門 用 語 対 訳 辞 書 を 構 築 する 手 法 が 必 要 である このような 背 景 のもとで これまでに 日 英 対 訳 特 許 文 を 情 報 源 として 専 門 用 語 対 訳 対 を 自 動 獲 得 す る 手 法 の 研 究 が 行 われてきた 例 えば 文 献 [] では NTCIR-7 特 許 翻 訳 タスク [1] において 配 布 された 日 英 180 万 件 の 対 訳 特 許 文 を 用 いて 対 訳 特 許 文 からの 専 門 用 語 対 訳 対 獲 得 を 行 った この 研 究 では 句 に 基 づく 統 計 的 機 械 翻 訳 モデル [2] に 基 づき 対 訳 特 許 文 から 学 習 されたフレーズテーブルを 用 いることによって 専 門 用 語 対 訳 対 獲 得 を 行 った ここで 上 述 の 日 英 180 万 件 の 対 訳 特 許 文 は 文 献 [8] の 手 法 により 日 米 パテン トファミリーの 対 応 特 許 文 書 中 において 背 景 およ び 実 施 例 の 部 分 の 日 英 対 訳 文 対 を 対 応 付 けたもので ある 以 上 の 背 景 をふまえて 本 稿 では 文 献 [8] の 手 法 を 適 用 することによって 日 中 パテントファミリーから 抽 出 した 360 万 件 の 日 中 対 訳 特 許 文 を 言 語 資 源 として 句 に 基 づく 統 計 的 機 械 翻 訳 モデルにより 学 習 されるフレー 236

ズテーブルを 用 いて 対 訳 専 門 用 語 を 獲 得 する 手 法 を 提 案 する 具 体 的 には まず 専 門 用 語 対 訳 辞 書 獲 得 の 情 報 源 として 用 いる 日 中 対 訳 文 対 に 対 して 句 に 基 づく 統 計 的 機 械 翻 訳 モデルを 適 用 することよりフレーズテーブ ルを 学 習 する 次 に このフレーズテーブル および 一 組 の 日 中 対 訳 文 を 用 いて 日 本 語 専 門 用 語 の 中 国 語 訳 語 推 定 を 行 う 本 稿 の 評 価 実 験 においては 形 態 素 単 位 の 日 本 語 文 一 文 に 対 して 形 態 素 単 位 の 中 国 語 文 および 文 字 単 位 [6] の 中 国 語 文 の2 種 類 を 用 意 した 対 訳 文 を 対 象 とした いずれの 場 合 も 97% 程 度 の 適 合 率 および F 値 を 達 成 することができた 2 日 中 対 訳 特 許 文 本 稿 では フレーズテーブルの 訓 練 用 データとして 約 360 万 件 の 日 中 対 訳 特 許 文 を 用 いた この 日 中 対 訳 特 許 文 は 200-2012 年 発 行 の 日 本 公 開 特 許 広 報 全 文 と 2005-2010 年 中 国 特 許 全 文 に 対 して 以 下 の 手 順 によって 得 られたものである 1. 文 献 [8] の 手 法 によって 日 中 間 で 文 対 応 を 付 ける 2.スコア 降 順 で 上 位 の 360 万 文 対 を 抽 出 する の 句 の 組 を 作 成 する (5) 文 対 応 データにおける 日 中 の 句 の 対 応 数 に 基 づ いて 各 句 の 対 応 に 翻 訳 確 率 等 のパラメータを 付 与 する 本 稿 では フレーズテーブルを 用 いて 得 られる 中 国 語 訳 語 候 補 のスコアとして 句 対 応 の 日 中 翻 訳 確 率 P(p C p J )(ただし p C を 中 国 語 句 p J を 日 本 語 句 とする)を 用 いた 更 に 日 本 語 句 の 見 出 し 語 ごとに 中 国 語 句 を スコアの 降 順 に 順 位 付 けした ここで 手 順 (1)の 対 訳 文 は 形 態 素 解 析 された 形 態 素 単 位 の 日 本 語 文 一 文 に 対 して Chinese Penn Treebank を 用 いた Stanford Word Segment [7] によって 形 態 1 素 解 析 された 形 態 素 単 位 の 中 国 語 文 および 文 字 単 位 の 中 国 語 文 の2 種 類 を 用 意 し 作 成 した この2 種 類 の 対 訳 文 に 対 して 独 立 に Moses を 適 用 することより 形 態 素 単 位 フレーズテーブルおよび 文 字 単 位 フレーズ テーブルをそれぞれ 作 成 した.1 手 順 対 訳 文 およびフレーズテーブルを 用 いた 訳 語 推 定 全 対 訳 文 360 万 件 から 無 作 為 に 抽 出 した 516 件 を 寄 稿 集 機 械 翻 訳 技 術 の 向 上 3 統 計 的 機 械 翻 訳 モデルのフレーズ テーブル 評 価 用 対 訳 文 とした 日 中 対 訳 文 から 辞 書 に 登 録 すべき 日 中 対 訳 専 門 用 語 を 獲 得 するために 用 いた 手 順 を 図 1に 示 す 句 に 基 づく 統 計 的 機 械 翻 訳 モデルのツールキットであ る Moses [2] を 用 いて 前 節 で 述 べた 文 対 応 データから 日 中 の 句 の 組 及 び 日 中 の 句 の 組 が 対 応 する 確 率 を 示 した フレーズテーブルを 作 成 する Moses がフレーズテー ブルを 作 成 する 過 程 を 以 下 に 示 す (1) 文 対 応 データに 対 する 前 処 理 として 単 語 の 数 値 化 単 語 のクラスタリング 共 起 単 語 表 の 作 成 な どを 行 う (2)IBM モデルにより 文 対 応 データから 単 語 対 応 を 生 成 するツールである GIZA++ [5] を 用 いて 中 日 日 中 の 両 方 向 で 最 尤 な 単 語 対 応 を 得 る (3) 中 日 日 中 両 方 向 の 単 語 対 応 から ヒューリスティ クスを 用 いて 対 称 な 単 語 対 応 を 得 る () 対 称 な 単 語 対 応 を 用 いて 可 能 なすべての 日 中 1. 全 対 訳 文 データ 360 万 件 中 516 件 の 日 本 語 文 を 形 態 素 解 析 し 日 中 対 訳 文 S J, S C 中 の 日 本 語 文 S J 中 の 日 本 語 名 詞 句 を 得 る さらに その 中 に 含 まれる 専 門 用 語 t J を 人 手 で 抽 出 する 2. 得 られた 日 本 語 専 門 用 語 t J に 対 し 統 計 的 機 械 翻 訳 モデルのフレーズテーブルを 用 いて 訳 語 推 定 を 行 い 中 国 訳 語 候 補 を 得 る 3. 得 られた 中 国 語 訳 語 候 補 のうち 対 訳 文 S J, S C 中 の 中 国 語 文 S C に 出 現 する 訳 語 候 補 を 抽 出 す る 抽 出 された 訳 語 候 補 のうち フレーズテーブル において 日 本 語 専 門 用 語 t J に 対 する 翻 訳 確 率 が 最 大 となる 訳 語 候 補 を 生 成 し 評 価 対 象 とした 1 連 続 する 数 字 とアルファベットは 一 個 のトークンとして 扱 う YEAR BOOK 2O1 237

図 1 対 訳 文 およびフレーズテーブルを 用 いた 対 訳 専 門 用 語 獲 得 の 流 れ.2 評 価 対 象 日 本 語 専 門 用 語 前 節 の 手 順 の 後 全 対 訳 文 データ 中 の 日 本 語 文 を 形 態 素 解 析 し 日 本 語 名 詞 句 を 選 択 する 際 以 下 に 該 当 する 日 本 語 名 詞 句 は 評 価 対 象 外 とした (a) 語 頭 または 語 尾 が 不 適 切 である 日 本 語 名 詞 句 具 体 的 には 上 記 下 記 当 該 該 各 が 語 頭 または 等 毎 が 語 尾 である 日 本 語 名 詞 句 (b) 訳 語 推 定 において 用 いる 日 中 対 訳 文 の 日 本 語 側 において 他 の 日 本 語 名 詞 句 の 部 分 文 字 列 となる 日 本 語 名 詞 句 例 えば 三 角 波 生 成 回 路 という 日 本 語 名 詞 句 の 部 分 文 字 列 である 生 成 回 路 の 部 分 が 抽 出 された 場 合 (c) 語 尾 が 記 号 である 日 本 語 名 詞 句 例 えば メタ ンガス 濃 縮 装 置 M1 のように 語 尾 が 記 号 M1 である 日 本 語 名 詞 句.3 評 価 結 果 表 1 評 価 結 果 を 示 す 中 国 語 側 が 形 態 素 単 位 のフレー ズテーブルを 用 いた 場 合 適 合 率 は 97.8% F 値 は 97.0% となった 一 方 中 国 語 側 が 文 字 単 位 のフレー ズテーブルを 用 いた 場 合 適 合 率 は 96.9% F 値 は 96.% となった 両 者 はほぼ 同 等 の 性 能 を 達 成 したが 誤 りの 傾 向 は 異 なっている 表 1 スコア 一 位 の 訳 語 候 補 の 再 現 率 適 合 率 F 値 (%) 中 国 語 側 の 区 切 り 単 位 形 態 素 文 字 再 現 率 96.3 (97/516) 95.9 (95/516) 適 合 率 97.8 (97/508) 96.9 (95/511) F 値 97.0 96. 表 2に これらの 両 方 の 場 合 を 対 象 として 中 国 語 訳 語 推 定 の 成 功 例 を 示 す 中 国 語 側 が 形 態 素 単 位 の 場 合 も 文 字 単 位 の 場 合 も 同 一 の 訳 語 候 補 が 出 力 され 参 照 用 中 国 語 訳 語 と 同 一 となった 表 3に 中 国 語 側 が 形 態 素 単 位 のフレーズテーブルを 用 いた 場 合 の 中 国 語 訳 語 推 定 の 誤 り 例 を 示 す 日 本 語 専 門 用 語 が 動 的 / 後 退 / 接 触 / 角 の 場 合 参 照 用 中 国 語 訳 語 / 后 退 / 接 触 / 角 は 中 国 語 側 が 形 態 素 単 位 の 場 合 のフレーズテーブルに 含 まれてはいるが 中 238

表 2 中 国 語 訳 語 推 定 の 成 功 例 寄 稿 集 表 3 中 国 語 側 が 形 態 素 単 位 のフレーズテーブルを 用 いた 場 合 の 誤 り 例 機 械 翻 訳 技 術 の 向 上 表 中 国 語 側 が 文 字 単 位 のフレーズテーブルを 用 いた 場 合 の 誤 り 例 国 語 文 の 形 態 素 解 析 結 果 在 / 浸 液 部 /12/ 的 / / 后 退 / 接 触 / 角 θ/ において 角 と θ が 分 翻 訳 確 率 が 高 くなり 順 位 1 位 の 訳 語 候 補 として 出 力 さ れた 例 えば 日 本 語 専 門 用 語 複 合 / 構 造 / 物 の 参 割 されなかったため 中 国 語 文 との 照 合 が 成 功 する 訳 語 照 用 中 国 語 訳 語 复 / 合 / 結 / / 物 およびその 部 分 候 補 を 抽 出 することができなかった 一 方 日 本 語 専 門 文 字 列 复 / 合 / 結 / が 中 国 語 文 に 出 現 する 訳 語 候 用 語 が 熱 / 圧 着 の 場 合 参 照 用 中 国 語 訳 語 圧 / 接 補 として 出 力 されたが 部 分 文 字 列 复 / 合 / 結 / は 中 国 語 側 が 形 態 素 単 位 の 場 合 のフレーズテーブルに の 方 が 复 / 合 / 結 / / 物 よりも 翻 訳 確 率 が 高 くな 含 まれていた しかし 中 国 語 文 の 形 態 素 解 析 結 果 り 順 位 1 位 の 訳 語 候 補 として 出 力 されてしまった / 圧 / 接 后 / において 接 と 后 が 分 割 され なかったため 中 国 語 文 との 照 合 が 成 功 する 訳 語 候 補 と しては 圧 を 出 力 してしまい 誤 りとなった 2 表 に 中 国 語 側 が 文 字 単 位 のフレーズテーブルを 用 いた 場 合 の 中 国 語 訳 語 推 定 の 誤 り 例 を 示 す これらの 例 においては 参 照 用 中 国 語 訳 語 はフレーズテーブルに 含 まれてはいるが 参 照 用 中 国 語 訳 語 の 部 分 文 字 列 の 方 が 2 中 国 語 専 門 用 語 の 形 態 素 解 析 結 果 圧 / 接 は 誤 りであり 正 しくは / 圧 接 と 分 割 するべきであるが フレーズ テーブルにおける 順 位 は 圧 / 接 の 方 が 上 位 であるため 本 稿 の 評 価 実 験 においては 圧 / 接 を 参 照 用 中 国 語 訳 語 とした 5 関 連 研 究 訳 語 対 の 自 動 獲 得 において 統 計 的 機 械 翻 訳 モデル により 学 習 されたフレーズテーブルを 用 いたものとし て 文 献 [][10] がある 文 献 [] においては 知 識 源 と して 句 に 基 づく 統 計 的 機 械 翻 訳 モデルのフレーズテー ブルおよび 既 存 の 対 訳 辞 書 を 併 用 して 日 英 間 の 訳 語 推 定 を 行 った 一 方 本 研 究 では 日 中 の 対 訳 特 許 文 を 対 象 として 句 に 基 づく 統 計 的 機 械 翻 訳 モデルのフレーズ YEAR BOOK 2O1 239

テーブルを 用 いて 日 中 間 の 訳 語 推 定 を 行 った また 文 献 [10] においては 日 本 語 漢 字 と 中 国 語 簡 体 字 への 文 字 対 象 情 報 と 既 存 の 統 計 的 機 械 翻 訳 モデルを 用 いて 日 中 特 許 対 訳 コーパスから 対 訳 辞 書 を 段 階 的 に 自 動 構 築 し た フレーズテーブルの 利 用 において 句 に 基 づくフレー ズテーブルおよび 階 層 的 句 に 基 づくフレーズテーブルの 2 種 類 のフレーズテーブルから 共 通 する 訳 語 候 補 を 抽 [10] 出 することより 訳 語 対 を 生 成 する 本 研 究 と 文 献 の 間 の 最 も 大 きな 相 違 点 として 本 研 究 において フレー ズテーブルから 得 られた 訳 語 候 補 のうち 日 中 対 訳 文 対 の 中 国 語 文 に 出 現 する 訳 語 候 補 を 抽 出 することより 訳 語 推 定 を 行 う 点 が 挙 げられる その 他 本 研 究 の 後 段 の 研 究 として 文 献 [3] においては 本 研 究 によって 獲 得 した 日 中 専 門 用 語 対 訳 対 を 利 用 することにより 日 中 対 訳 専 門 用 語 の 同 義 集 合 を 同 定 する 方 式 について 提 案 して and M. Yamamoto : Identifying 参 考 文 献 [1]A. Fujii, M. Utiyama, M. Yamamoto, and. T. Utsuro. Overview of the Patent translation task at the NTCIR-7 Workshop. In Proc. 7th NTCIR Workshop Meeting, pp. 389 00, 2008. [2]P. Koehn, H. Hoang, A. Birch, C. Callison- Burch, M. Federico, N. Bertoldi, B. Cowan, W. Shen, C. Moran, R. Zens, C. Dyer, O. Bojar, A. Constantin, and E. Herbst. Moses : Open source toolkit for statistical machine translation. In Proc. 5th ACL, Companion Volume, pp. 177 180, 2007. [3]Z. Long, L. Dong, T. Utsuro, T. Mitsuhashi, Japanese- いる Chinese bilingual synonymous technical terms from patent families, in Proc. 7th 6 おわりに 本 稿 では 日 中 対 訳 特 許 文 に 対 して 句 に 基 づく 統 計 的 機 械 翻 訳 モデルにより 学 習 されるフレーズテーブルを 用 いて 専 門 用 語 の 訳 語 推 定 する 手 法 について 述 べた この 手 法 においては 句 に 基 づく 統 計 的 機 械 翻 訳 モデ ルによって 対 訳 特 許 文 から 学 習 されたフレーズテーブ ルを 用 いることによって 専 門 用 語 対 訳 対 の 獲 得 を 行 っ た 評 価 実 験 においては 97% 程 度 の 適 合 率 および F 値 を 達 成 した 現 在 中 国 語 側 の 区 切 り 単 位 として 形 態 素 および 文 字 の2 種 類 の 単 位 を 併 用 するとともに Support Vector Machines (SVMs) [9] を 用 いること によって フレーズテーブルから 得 られた 訳 語 候 補 を 検 証 し 性 能 を 改 善 する 方 式 について 研 究 を 進 めており この 結 果 については 別 の 機 会 に 報 告 する 予 定 である 謝 辞 本 研 究 においては 日 本 特 許 情 報 機 構 (Japio)より 提 供 して 頂 いた 日 中 パテントファミリーのデータを 利 用 させて 頂 いた 関 係 各 位 に 感 謝 の 意 を 表 す Workshop on Building and Using Comparable Corpora-Resources for Machine Translation Research, pp. 9-5, 201. [] 森 下 洋 平, 梁 冰, 宇 津 呂 武 仁, 山 本 幹 雄.フレーズ テーブルおよび 既 存 対 訳 辞 書 を 用 いた 専 門 用 語 の 訳 語 推 定. 電 子 情 報 通 信 学 会 論 文 誌.Vol. J93 D, No. 11, pp. 2525 2537, 2010. [5]F. J. Och and H. Ney. A systematic comparison of various statistical alignment models. Computational Linguistics, Vol. 29, No. 1, pp. 19 51, 2003. [6]J. Sun and Y. Lepage. Statistical machine translation between unsegmented Japanese and Chinese texts. 言 語 処 理 学 会 第 19 回 年 次 大 会 発 表 論 文 集,pp. 122 125, 2013. [7]H. Tseng, P. Chang, G. Andrew, D. Jurafsky, and C. Manning. A conditional random field word segmenter for SIGHAN bakeoff 2005. In Proc. th SIGHAN Workshop on Chinese Language Processing, pp. 168 171, 2005. [8]M. Utiyama and H. Isahara. A Japanese- English patent parallel corpus. In Proc. MT Summit XI, pp. 75 82, 2007. 20

[9]V. N. Vapnik. Statistical Learning Theory. Wiley-Interscience, 1998. [10]K. Yasuda and E. Sumita. Building a bilingual dictionary from a Japanese-Chinese patent corpus. In Computational Linguistics and Intelligent Text Processing, Vol. 7817 of LNCS, pp. 276 28. Springer, 2013. 寄 稿 集 機 械 翻 訳 技 術 の 向 上 YEAR BOOK 2O1 21