本 論 文 の 構 成 は 以 下 のとおりである 2 節 では 特 許 デー タベースからの 上 位 下 位 概 念 の 抽 出 法 を 述 べ 3 節 では 日 英 の 用 語 間 の 対 応 付 け 方 法 について 説 明 する 4 節 では 本 研 究 で 行 った 実 験 について 述



Similar documents
2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

<4D F736F F D E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A C98AD682B782E993C195CA915B C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

m07 北見工業大学 様式①

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

<6D313588EF8FE991E58A778D9191E5834B C8EAE DC58F4992F18F6F816A F990B32E786C73>

耐 震 診 断 受 付 期 間 4 月 16 日 ( 月 )~1 月 31 日 ( 木 ) 予 定 戸 数 100 戸 1 補 助 の 条 件 次 のすべての 要 件 に 該 当 すること (1) 市 民 自 らが 所 有 し 居 住 していること (2) 昭 和 56 年 5 月 31 日 以 前

別 紙 第 号 高 知 県 立 学 校 授 業 料 等 徴 収 条 例 の 一 部 を 改 正 する 条 例 議 案 高 知 県 立 学 校 授 業 料 等 徴 収 条 例 の 一 部 を 改 正 する 条 例 を 次 のように 定 める 平 成 26 年 2 月 日 提 出 高 知 県 知 事 尾

3 圏 域 では 県 北 沿 岸 で2の 傾 向 を 強 く 見 てとることができます 4 近 年 は 分 配 及 び 人 口 が 減 少 している 市 町 村 が 多 くなっているため 所 得 の 増 加 要 因 を 考 える 場 合 は 人 口 減 少 による 影 響 についても 考 慮 する

18 国立高等専門学校機構

<819A955D89BF92B28F BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

< F2D A C5817A C495B6817A>

Microsoft Word - 表紙.doc

その 他 事 業 推 進 体 制 平 成 20 年 3 月 26 日 に 石 垣 島 国 営 土 地 改 良 事 業 推 進 協 議 会 を 設 立 し 事 業 を 推 進 ( 構 成 : 石 垣 市 石 垣 市 議 会 石 垣 島 土 地 改 良 区 石 垣 市 農 業 委 員 会 沖 縄 県 農

Microsoft Word - 佐野市生活排水処理構想(案).doc

川崎市木造住宅耐震診断助成金交付要綱

2 出 願 資 格 審 査 前 記 1の 出 願 資 格 (5) 又 は(6) により 出 願 を 希 望 する 者 には, 出 願 に 先 立 ち 出 願 資 格 審 査 を 行 いますので, 次 の 書 類 を 以 下 の 期 間 に 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 等

学校安全の推進に関する計画の取組事例

公表表紙

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 き 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

16 日本学生支援機構

様式(補助金)

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や

(1)1オールゼロ 記 録 ケース 厚 生 年 金 期 間 A B 及 びCに 係 る 旧 厚 生 年 金 保 険 法 の 老 齢 年 金 ( 以 下 旧 厚 老 という )の 受 給 者 に 時 効 特 例 法 施 行 後 厚 生 年 金 期 間 Dが 判 明 した Bは 事 業 所 記 号 が

ず 第 1 段 階 目 の 選 抜 に 係 る 額 は4,000 円 とし 第 2 段 階 目 の 選 抜 に 係 る 額 は13,000 円 と する 4 第 1 項 に 規 定 する 幼 稚 園 小 学 校 及 び 中 学 校 並 びに 特 別 支 援 学 校 の 小 学 部 中 学 部 及 び

Microsoft PowerPoint - MVE pptx

入 札 参 加 者 は 入 札 の 執 行 完 了 に 至 るまではいつでも 入 札 を 辞 退 することができ これを 理 由 として 以 降 の 指 名 等 において 不 利 益 な 取 扱 いを 受 けることはない 12 入 札 保 証 金 免 除 13 契 約 保 証 金 免 除 14 入

(5) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 概 要 国 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている 総 合 的

推 進 項 目 15 人 材 育 成 の 強 化 重 要 A 番 号 取 組 事 業 名 151 職 員 の 専 門 性 向 上 作 成 日 H 更 新 日 H 担 当 部 署 32 総 務 部 人 事 課 責 任 者 吉 田 克 夫 担 当 者 人 事 人 材 育 成 担

本 校 の 沿 革 昭 和 21 年 昭 和 49 年 昭 和 54 年 昭 和 60 年 平 成 9 年 平 成 11 年 平 成 18 年 北 海 道 庁 立 農 業 講 習 所 として 発 足 北 海 道 立 農 業 大 学 校 に 改 組 修 業 年 限 を1 年 制 から2 年 制 に 改

●電力自由化推進法案

平 成 19 年 度 東 北 地 区 国 立 大 学 法 人 等 技 術 職 員 研 修 日 程 表 ( 情 報 技 術 分 野 ) 時 間 日 8:00 9 月 18 日 ( 山 形 地 区 ) 9 月 19 日 ( 米 沢 地 区 ) 9 月 20 日 ( 米 沢 地 区 ) 9 月 21 日

経 常 収 支 差 引 額 等 の 状 況 平 成 26 年 度 予 算 早 期 集 計 平 成 25 年 度 予 算 対 前 年 度 比 較 経 常 収 支 差 引 額 3,689 億 円 4,597 億 円 908 億 円 減 少 赤 字 組 合 数 1,114 組 合 1,180 組 合 66

企 画 課 企 画 部 満 了 2 55 総 務 部 企 画 室 設 置 認 可 学 部 佐 賀 大 学 附 属 図 書 館 医 学 分 館 設 置 申 請 書 企 画 室 企 画 調 査 係 2004/4/1 30 年 2005/4/1 2035/3/31 ファイル 事 務 室 企 画 部 企 画

小 売 電 気 の 登 録 数 の 推 移 昨 年 8 月 の 前 登 録 申 請 の 受 付 開 始 以 降 小 売 電 気 の 登 録 申 請 は 着 実 に 増 加 しており これまでに310 件 を 登 録 (6 月 30 日 時 点 ) 本 年 4 月 の 全 面 自 由 化 以 降 申

3. 選 任 固 定 資 産 評 価 員 は 固 定 資 産 の 評 価 に 関 する 知 識 及 び 経 験 を 有 する 者 のうちから 市 町 村 長 が 当 該 市 町 村 の 議 会 の 同 意 を 得 て 選 任 する 二 以 上 の 市 町 村 の 長 は 当 該 市 町 村 の 議

定款  変更

Microsoft Word - 目次.doc

育休代替任期付職員制度について

(4) ラスパイレス 指 数 の 状 況 H H H5.4.1 ( 参 考 値 ) 97.1 H H H H5.4.1 H H5.4.1 ( 参 考

スライド 1

Microsoft Word [公表用資料]_様式1-1.doc

(Microsoft Word - \220\340\226\276\217\221.doc)

Microsoft Word - 文書 3

<6E32355F8D918DDB8BA697CD8BE28D C8EAE312E786C73>

(2)大学・学部・研究科等の理念・目的が、大学構成員(教職員および学生)に周知され、社会に公表されているか

わない (1) そう 思 う (2)のそれぞれ3 段 階 で 回 答 をしてもらった その 結 果 を 次 節 で 数 値 に 換 算 している 4. 調 査 の 結 果 と 考 察 4.1 学 習 上 の 困 難 点 全 体 的 な 傾 向 表 1 漢 字 の 学 習 困 難 点 (

大 阪 福 岡 鹿 児 島 前 頁 からの 続 き 35

資料2-2 定時制課程・通信制課程高等学校の現状

有 料 老 ホーム ( ) ( 主 として 要 介 護 状 態 にある を 入 居 させるも のに 限 る ) 第 29 条 ( 届 出 等 ) 第 二 十 九 条 有 料 老 ホーム( 老 を 入 居 させ 入 浴 排 せつ 若 しくは 食 事 の 介 護 食 事 の 提 供 又 はその 他 の

文化政策情報システムの運用等

第 3 節 結 果 1. 調 査 票 の 回 収 324 か 所 から 回 答 を 得 た ( 回 収 率 29.5%) 一 般 診 療 所 総 数 回 答 数 回 収 率 (%) 大 津 湖 南 甲 賀 東 近 江

<6D33335F976C8EAE CF6955C A2E786C73>

第 1 条 適 用 範 囲 本 業 務 方 法 書 は 以 下 の 性 能 評 価 に 適 用 する (1) 建 築 基 準 法 施 行 令 ( 以 下 令 という ) 第 20 条 の7 第 1 項 第 二 号 表 及 び 令 第 20 条 の 8 第 2 項 の 認 定 に 係 る 性 能 評

別 紙

1. 実 施 内 容 (1) 研 修 体 制 の 概 要 2 大 阪 府 教 育 庁 大 阪 府 教 育 センター 進 捗 管 理 研 修 の 委 託 進 捗 管 理 連 携 協 力 進 捗 報 告 民 間 業 者 ( 外 部 機 関 ) 市 町 村 教 育 委 員 会 府 立 高 等 学 校 研

入札公告 機動装備センター

平成17年度高知県県産材利用推進事業費補助金交付要綱

製 品 設 計 のための3 次 元 検 証 技 術 (ソリッド 編 ) ~ 製 品 設 計 の 考 え 方 に 基 づいた3 次 元 CADの 使 い 方 をマスターしよう!~ 受 講 料 11,500 円 /28,29.30 ( 金 土 日 ) 筆 記 製 品 設 計 業 務 において

<81696D373188A E58A77816A E93788D9191E5834B C8EAE82502E786C73>

セルフメディケーション推進のための一般用医薬品等に関する所得控除制度の創設(個別要望事項:HP掲載用)

<817993FA967B8E E A E815B817A B F976C8EAE82502D322E786C73>

総合評価点算定基準(簡易型建築・電気・管工事)

ト ン ネ ル ご 施 工 計 画 施 工 設 備 及 び 積 算 建 設 環 境 上 水 道 及 び 工 業 用 水 道 技 術 部 門 上 下 水 道 部 門 に 該 当 する 下 水 道 資 農 業 土 木 技 術 部 門 農 業 部 門 に 該 当 する 資 と の RCCM の 資 森 林

2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36

PowerPoint プレゼンテーション

(4) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 国 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている.

Microsoft Word - A04◆/P doc

私立大学等研究設備整備費等補助金(私立大学等

平成16年年金制度改正 ~年金の昔・今・未来を考える~

異 議 申 立 人 が 主 張 する 異 議 申 立 ての 理 由 は 異 議 申 立 書 の 記 載 によると おおむね 次 のとおりである 1 処 分 庁 の 名 称 の 非 公 開 について 本 件 審 査 請 求 書 等 について 処 分 庁 を 非 公 開 とする 処 分 は 秋 田 県

<4D F736F F D AC90D1955D92E CC82CC895E DD8C D2816A2E646F63>

国立研究開発法人土木研究所の役職員の報酬・給与等について

< DB8CAF97BF97A6955C2E786C73>

別記

2 一 般 行 政 職 給 料 表 の 状 況 (24 年 4 月 1 日 現 在 ) 1 号 級 の 給 料 月 額 最 高 号 級 の 給 料 月 額 1 級 ( 単 位 : ) 2 級 3 級 4 級 5 級 6 級 7 級 8 級 9 級 1 級 135,6 185,8 222,9 261,

Microsoft PowerPoint - 報告書(概要).ppt

( 教 育 職 員 免 許 状 の 取 得 ) 第 9 条 教 育 職 員 免 許 状 ( 幼 稚 園 教 諭 二 種 免 許 状 )を 取 得 しようとする 者 は 教 育 職 員 免 許 法 に 基 づき 別 表 2に 掲 げる を 修 得 しなければならない 2 教 育 職 員 免 許 状 の

( 別 紙 ) 以 下 法 とあるのは 改 正 法 第 5 条 の 規 定 による 改 正 後 の 健 康 保 険 法 を 指 す ( 施 行 期 日 は 平 成 28 年 4 月 1 日 ) 1. 標 準 報 酬 月 額 の 等 級 区 分 の 追 加 について 問 1 法 改 正 により 追 加

島根大学における学生等の授業料その他の費用に関する規則

Microsoft Word - ★HP版平成27年度検査の結果

(2) 支 状 況 保 育 所 ( 定 員 60 人 以 上 ) 支 状 況 は 次 とおりです 1 総 入 構 成 比 は 割 合 が88.1% 活 動 外 入 が2.1% 特 別 入 が9.8%でした 2 構 成 比 は 運 営 費 入 が80.1% 経 常 経 費 補 助 金 入 が17.8%

<4D F736F F F696E74202D B E E88E68C9A90DD8BC65F E DC58F4994C52E >

<4D F736F F F696E74202D208CE38AFA8D8297EE8ED288E397C390A CC8A AE98EBA8DEC90AC816A2E707074>

(2) 就 業 規 則 の 状 況 就 業 規 則 は 90.0%の 事 業 所 が 整 備 している このうち 就 業 規 則 を 周 知 している 事 業 所 は 84.0%で 周 知 の 方 法 ( 複 数 回 答 )については 常 時 掲 示 または 備 え 付 け が 最 も 多 く 64

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 23 年 4 月 1 日 現 在 ) 1 号 給 の 給 料 月 額 最 高 号 給 の 給 料 月 額 1 級 2 級 3 級 4 級 5 級 ( 単 位 : ) 6 級 7 級 8 級 135, , ,900 2

財政再計算結果_色変更.indd

財団法人○○会における最初の評議員の選任方法(案)


経 常 収 支 差 引 額 の 状 況 平 成 22 年 度 平 成 21 年 度 対 前 年 度 比 較 経 常 収 支 差 引 額 4,154 億 円 5,234 億 円 1,080 億 円 改 善 赤 字 組 合 の 赤 字 総 額 4,836 億 円 5,636 億 円 800 億 円 減

(3) 調 査 の 進 め 方 2 月 28 日 2 月 28 日 ~6 月 30 日 平 成 25 年 9 月 サウンディング 型 市 場 調 査 について 公 表 松 戸 市 から 基 本 的 な 土 地 情 報 サウンディングの 実 施 活 用 意 向 アイデアのある 民 間 事 業 者 と

再 生 可 能 エネルギー 等 導 入 推 進 基 金 事 業 計 画 書 ( 各 年 度 計 画 書 ) ( 事 業 計 画 の 概 要 ) 計 画 の 名 称 京 都 府 地 球 温 暖 化 対 策 等 推 進 基 金 計 画 の 期 間 交 付 対 象 京 都 府 府 内 市 町 村 民 間

70 愛媛大学

職 員 の 平 均 給 与 月 額 初 任 給 等 の 状 況 (1) 職 員 の 平 均 年 齢 平 均 給 料 月 額 及 び 平 均 給 与 月 額 の 状 況 ( 平 成 年 月 1 日 現 在 ) 1 一 般 行 政 職 福 岡 県 技 能 労 務 職 歳 1,19,98 9,9 歳 8,

も た ら そ う と す る 効 標 標 名 標 設 定 考 え 方 単 位 4 年 度 実 績 5 年 度 見 込 6 年 度 計 画 7 年 度 計 画 8 年 度 計 画 法 規 定 に 基 づく 選 挙 事 務 ため 標 というような は 困 難 である 事 業 実 施 妥 当 性 活 動

                         庁議案件No

< F2D95BD90AC E93788BB388E7835A E815B82BE82E6>

Transcription:

日 英 特 許 データベースから のシソーラスの 自 動 構 築 PROFILE PROFILE 広 島 市 立 大 学 大 学 院 情 報 科 学 研 究 科 准 教 授 難 波 英 嗣 1996 年 東 京 理 科 大 学 理 工 学 部 電 気 工 学 科 卒 業 2001 年 北 陸 先 端 科 学 技 術 大 学 院 大 学 情 報 科 学 研 究 科 博 士 後 期 課 程 修 了 同 年 日 本 学 術 振 興 会 特 別 研 究 員 2002 年 東 京 工 業 大 学 精 密 工 学 研 究 所 助 手 同 年 広 島 市 立 大 学 情 報 科 学 部 講 師 2010 年 4 月 広 島 市 立 大 学 大 学 院 情 報 科 学 研 究 科 准 教 授 現 在 に 至 る 博 士 ( 情 報 科 学 ) 言 語 処 理 学 会 情 報 処 理 学 会 人 工 知 能 学 会 ACL ACM 各 会 員 広 島 市 立 大 学 大 学 院 情 報 科 学 研 究 科 教 授 竹 澤 寿 幸 1984 年 早 稲 田 大 学 理 工 学 部 電 気 工 学 科 卒 業 1989 年 早 稲 田 大 学 大 学 院 博 士 後 期 課 程 修 了 同 年 ( 株 ) 国 際 電 気 通 信 基 礎 技 術 研 究 所 入 社 2007 年 広 島 市 立 大 学 大 学 院 情 報 科 学 研 究 科 教 授 現 在 に 至 る 工 学 博 士 音 声 対 話 翻 訳 の 研 究 開 発 に 従 事 平 成 18 年 度 電 子 情 報 通 信 学 会 ISS 論 文 賞 受 賞 電 子 情 報 通 信 学 会 人 工 知 能 学 会 日 本 音 響 学 会 言 語 処 理 学 会 各 会 員 PROFILE 2011 年 広 島 市 立 大 学 情 報 科 学 部 知 能 工 学 科 卒 業 広 島 市 立 大 学 情 報 科 学 部 間 弓 沙 織 082-830-1584 1 はじめに 本 研 究 では 日 英 特 許 データベースからシソーラスを 自 動 的 に 構 築 する 手 法 を 提 案 する シソーラスは 文 献 の 検 索 や 専 門 文 書 の 執 筆 の 際 の 情 報 源 として また 計 算 機 で 言 語 処 理 を 行 う 際 の 知 識 源 としてもしばしば 利 用 されている しかし シソーラスを 人 手 で 構 築 し 更 新 することは 非 常 にコストがかかるため テキストデータ ベースから シソーラスを 自 動 的 に 構 築 するという 研 究 が 近 年 活 発 に 行 われている また 専 門 用 語 の 翻 訳 の 際 には 正 確 な 対 訳 辞 書 が 必 要 不 可 欠 であるが 既 存 の 辞 書 に 登 録 されていない 用 語 が 増 加 し 続 けており 対 訳 辞 書 を 人 手 で 継 続 管 理 するには 非 常 にコストがかかる そのため 専 門 用 語 を 特 許 文 書 から 抽 出 し 正 しい 訳 語 を 自 動 推 定 して 翻 訳 辞 書 作 成 を 支 援 するシステムが 求 められている テキストデータベースからシソーラスを 構 築 する 代 表 的 な 手 法 は A や B などの C や A such as B, C などの 定 型 表 現 に 着 目 して 用 語 の 上 位 下 位 概 念 を 自 動 的 に 抽 出 するものである [Hearst 1992 安 藤 2003 相 澤 2006] また この 他 にも HTML の 構 造 を 利 用 した 抽 出 方 法 [ 新 里 2005] や 用 語 の 定 義 文 を 利 用 した 方 法 [ 大 石 2006] なども 提 案 されている また 専 門 用 語 の 訳 語 推 定 法 については 統 計 的 機 械 翻 訳 モデルを 用 いて 訳 語 推 定 を 行 う 手 法 及 び 既 存 の 対 訳 辞 書 を 利 用 した 要 素 合 成 法 を 併 用 して 専 門 用 語 の 訳 語 を 推 定 する 手 法 が 提 案 されている [ 森 下 2010] 本 研 究 では 定 型 表 現 に 基 づいて 上 位 下 位 概 念 を 獲 得 する 手 法 に 着 目 し 日 英 特 許 データベースからそれ ぞれ 上 位 下 位 概 念 を 獲 得 する 次 に 統 計 的 機 械 翻 訳 モデルを 用 いた 訳 語 推 定 法 に 着 目 し 引 用 分 析 手 法 [Kessler 1963 Small 1973] と 合 わせて 日 本 語 と 英 語 の 用 語 間 の 対 応 付 けを 行 うことにより 日 英 特 許 シソーラスを 自 動 的 に 構 築 する これにより 得 られたシ ソーラスを 用 いることで 文 献 の 検 索 や 専 門 文 書 の 執 筆 訳 語 推 定 など 幅 広 く 活 用 することが 可 能 になると 考 え られる 248 YEAR BOOK 2011

本 論 文 の 構 成 は 以 下 のとおりである 2 節 では 特 許 デー タベースからの 上 位 下 位 概 念 の 抽 出 法 を 述 べ 3 節 では 日 英 の 用 語 間 の 対 応 付 け 方 法 について 説 明 する 4 節 では 本 研 究 で 行 った 実 験 について 述 べ 5 節 で 実 験 結 果 からの 考 察 を 述 べる 最 後 に 6 節 で 本 稿 をまとめる 2 上 位 下 位 概 念 の 抽 出 日 本 文 では A や B などの C A や B 等 の C 英 文 では A, such as B and C といった 定 型 表 現 に 着 目 する 例 えば 染 料 や 顔 料 などの 着 色 剤 という 文 では 着 色 剤 という 上 位 概 念 に 対 して 染 料 顔 料 が 下 位 概 念 であることが 分 かる また pets, such as cats and dogs という 文 では pets という 位 概 念 に 対 して cats dogs が 下 位 概 念 であること が 分 かる 本 研 究 では このような 定 型 表 現 に 着 目 し 図 1 のような 日 本 文 特 許 データベースと 図 2 のよう な 英 文 特 許 データベースから 上 位 下 位 概 念 を 獲 得 する 1993-000024: 構 成 天 然 繊 維 紙 パルプな どの 天 然 素 材 の 繊 維 の 集 合 体 で 加 工 された 開 口 率 5 ~60%の 網 状 で 厚 み5~40mm の 芝 養 生 マット 図 1 日 本 文 特 許 データベースの 例 ルである GIZA++ を 使 用 し 翻 訳 モデル 用 に 日 英 特 許 から 抽 出 された 3,185,254 文 対 を 用 い 言 語 モデル 用 に 3,186,284 文 の 日 本 語 特 許 文 を 用 いて フレー ズテーブルの 作 成 を 行 った 以 下 に 作 成 したフレーズテーブルを 用 いた 用 語 の 対 応 付 け 方 法 について 説 明 する 図 3 はその 流 れを 示 したものである (1) 翻 訳 テキストデータベースから 獲 得 された 日 本 語 の 上 位 概 念 下 位 概 念 を 作 成 したフレーズテーブルを 用 い てそれぞれ 単 独 で 翻 訳 する (2) 上 位 下 位 の 候 補 を 作 成 得 られた 訳 語 から 全 ての 組 み 合 わせで 上 位 下 位 の 候 補 を 作 成 する (3) 対 応 付 け 得 られた 候 補 の 中 から テキストデータベースから 獲 得 された 英 語 の 上 位 下 位 概 念 に 当 てはまるものが あれば 日 英 の 用 語 を 対 応 付 けする 上 記 の (1) ~ (3) のように 日 英 の 用 語 間 の 対 応 付 けを 行 った 結 果 2,635 対 の 日 英 用 語 対 が 得 られた 図 3 フレーズテーブルを 用 いた 対 応 付 け 寄 稿 集 4 機 械 翻 訳 技 術 の 向 上 The grinding wheel 2 comprises a generally hourglass shape along its width and is made of a suitable abrasive material such as aluminum oxide or cubic boron nitride (CBN). 図 2 英 文 特 許 データベースの 例 3 日 英 の 用 語 間 の 対 応 付 け 3.1 フレーズテーブルを 用 いた 対 応 付 け 日 英 の 用 語 対 候 補 の 作 成 には 統 計 的 機 械 翻 訳 技 術 を 用 いる 統 計 的 機 械 翻 訳 では 対 象 とする 言 語 に 関 する 文 法 的 知 識 を 必 要 としないため 容 易 に 翻 訳 システムを 構 築 することができる 本 研 究 では 統 計 的 機 械 翻 訳 ツー 3.2 日 英 用 語 対 の 抽 出 3.1 節 のフレーズテーブルを 用 いた 対 応 付 けで 得 られ た 日 英 の 用 語 対 2,635 対 から 用 語 対 候 補 を 絞 り 込 む 用 いた 素 性 は 以 下 の 5 種 類 である YEAR BOOK 2O11 249

1 翻 訳 確 率 2 日 本 語 英 語 の 上 位 語 の 上 位 語 の 一 致 数 3 日 本 語 英 語 の 上 位 語 の 下 位 語 の 一 致 数 4 日 本 語 英 語 の 下 位 語 の 上 位 語 の 一 致 数 5 日 本 語 英 語 の 下 位 語 の 下 位 語 の 一 致 数 2~5については それぞれの 最 大 一 致 数 で 個 々の 一 致 数 を 割 った 値 を 素 性 値 とする また 日 英 の 用 語 が 一 致 しているかどうかの 判 断 は 3.1 節 で 述 べたフレーズテー ブルを 用 いて 日 本 語 の 用 語 を 翻 訳 し 英 語 の 用 語 と 比 較 す ることで 行 う 翻 訳 の 際 フレーズテーブルに 登 録 されて いる 訳 語 の 中 で 最 も 翻 訳 確 率 ( 日 英 の 翻 訳 確 率 と 英 日 の 翻 訳 確 率 の 積 )の 高 い 訳 語 のみを 使 用 する 2~5を 素 性 として 用 いたアイディアは 引 用 分 析 いて 実 線 で 結 ばれたものは 上 位 下 位 関 係 を 表 し 点 線 で 結 ばれたものは 日 英 対 応 関 係 を 表 す このような 関 係 が 成 り 立 っているとき 半 導 体 素 子 > トランジス タ と semiconductor device > transistor は 共 通 の 上 位 語 あるいは 下 位 語 を 持 ち 対 応 関 係 にあると 考 えられる 本 研 究 では 素 性 1と 2~5の 素 性 のいずれかを 用 いた 2 種 類 の 素 性 により 4 通 りの 組 み 合 わせを 使 用 する 以 下 1 2の 組 み 合 わせを (a) 1 3の 組 み 合 わせを (b) 1 4の 組 み 合 わせを (c) 1 5の 組 み 合 わせを (d) とする 用 語 対 の 抽 出 方 法 について 以 下 に (a) を 例 として 説 明 する 研 究 における 書 誌 結 合 [Kessler 1963] と 共 引 用 分 析 [Small 1973] に 基 づいたものである 引 用 分 析 とは 論 文 間 の 引 用 被 引 用 関 係 を 用 いて 論 文 間 の 関 係 を 分 析 する 方 法 である 書 誌 結 合 は 論 文 間 の 関 連 度 を 測 る 時 に 2 論 文 間 でどれだけ 同 じ 論 文 を 引 用 しているか という 基 準 に 基 づいている 一 方 共 引 用 分 析 は 2 論 文 がどれだけ 他 の 論 文 で 共 に 引 用 されているか という 基 準 に 基 づいた 手 法 である ここでは 用 語 間 の 上 位 下 位 関 係 を 論 文 間 の 引 用 関 係 と 見 なし 引 用 分 析 手 法 を 用 いて 日 英 対 応 関 係 を 抽 出 する 図 4 は 半 導 体 素 子 > トランジスタ という 日 本 語 の 上 位 下 位 概 念 と semiconductor device > transistor という 英 語 の 上 位 下 位 概 念 を 中 心 に これらと 上 位 下 位 関 係 にある 用 語 の 一 部 を 示 したものである 図 4 にお (1) 素 性 の 和 を 計 算 素 性 1 の 値 が a 素 性 2 の 値 が b で あ る と き a β + α b を 計 算 す る こ こ で β は 1/5 1/10 1/15 1/20 の 4 通 りで 計 算 する また α は 0.1 0.2 0.9 とする (2) 訓 練 (1) で 求 めた 和 が ある 閾 値 x 以 上 のときに 正 解 x 未 満 のときに 不 正 解 とし F 値 を 算 出 する このとき 訓 練 用 データを 用 いて x の 値 を 0 ~ 2 の 間 で 0.01 ず つ 変 化 させ F 値 が 最 大 となる x を 求 める (3) 評 価 (2) で 得 られた x を 用 い テスト 用 データで 評 価 を 行 う (b) (c) (d) についても 同 様 の 処 理 を 行 う 4 実 験 3 節 で 述 べた 手 法 の 有 効 性 を 調 べるため 実 験 を 行 った 4.1 実 験 方 法 実 験 に 用 いるデータ フレーズテーブルを 用 いた 対 応 付 けにより 得 られた 日 英 の 用 語 対 2,635 対 の 正 解 判 定 を 人 手 で 行 った 結 果 を 図 4 上 位 下 位 関 係 を 用 いた 対 応 関 係 の 検 出 使 用 する 人 手 による 判 定 結 果 を 表 1 に 示 す 250 YEAR BOOK 2011

比 較 実 験 表 1: 人 手 による 判 定 結 果 正 解 不 正 解 合 計 982 1,653 2,635 本 研 究 では 用 語 間 の 上 位 下 位 関 係 を 用 いた 引 用 分 析 手 法 の 有 効 性 を 確 認 するため 比 較 手 法 として 引 用 分 析 手 法 を 用 いた 素 性 を 与 えずに 実 験 を 行 う 比 較 手 法 で 用 いる 素 性 と 提 案 手 法 で 用 いる 素 性 を 表 2 にま とめる 提 案 手 法 (a) 表 2: 実 験 に 用 いる 素 性 素 性 1 素 性 2 素 性 3 素 性 4 素 性 5 提 案 手 法 (b) 提 案 手 法 (c) 提 案 手 法 (d) 比 較 手 法 評 価 尺 度 上 記 の 実 験 に 用 いるデータを 4 分 割 し そのうち 3 つを 訓 練 用 1 つを 評 価 用 として 4 分 割 交 差 検 定 を 行 うことで 評 価 を 行 う 人 手 判 定 によって 正 解 とした 用 語 対 数 を P m システ ム 判 定 によって 正 解 とされた 用 語 対 数 を P s とし さら に 人 手 判 定 とシステム 判 定 の 結 果 が 正 解 で 一 致 する 用 語 対 数 を P m-s とする 評 価 には 表 3 に 示 す 精 度 再 現 率 F 値 を 用 いた 表 3: 評 価 尺 度 精 度 再 現 率 F 値 P m-s Ps 4.2 実 験 結 果 P m-s Ps 2 再 現 率 精 度 再 現 率 + 精 度 提 案 手 法 (a) ~ (d) と 比 較 手 法 によって 得 られた 精 度 再 現 率 F 値 を 表 4 に 示 す 比 較 手 法 は (e) と する 表 に 示 した 値 は それぞれの 実 験 において F 値 が 最 大 のときの 結 果 である 表 4 実 験 結 果 α β 精 度 (%) 再 現 率 (%) F 値 (%) (a) 0.1 1/10 76.4 78.1 77.1 (b) 0.1 1/20 76.3 79.5 77.4 (c) 0.1 1/15 75.8 78.4 76.9 (d) 0.1 1/15 77.5 79.4 78.3 (e) 0 1/15 78.5 77.8 78.0 表 4 より 提 案 手 法 (d) において 比 較 手 法 より 高 い 再 現 率 F 値 が 得 られ 提 案 手 法 の 有 効 性 が 確 認 さ れた 5 考 察 5.1 日 英 用 語 対 の 抽 出 5.1.1 システムが 誤 って 正 解 と 判 定 したもの 以 下 に 人 手 では 不 正 解 と 判 定 したが システムでは 正 解 と 判 定 された 226 件 の 検 出 誤 りを 種 類 ごとに 分 析 し 主 要 な 原 因 をいくつか 示 す 226 件 の 検 出 誤 りは 大 きく 次 の 5 種 類 に 分 類 できる 1 類 似 した 用 語 (73.9%) 226 件 の う ち 167 件 (73.9%) が 亜 鉛 と aluminum-zinc のような 類 似 した 用 語 と 対 応 付 けさ れたものだった 類 似 の 用 語 は 上 位 下 位 概 念 に 同 じ 用 語 を 持 つ 可 能 性 が 高 いため 引 用 分 析 手 法 において 一 致 数 が 多 くなってしまったと 考 えられる 2 抽 出 個 所 の 不 十 分 な 用 語 (10.6%) 226 件 のうち 24 件 (10.6%)が 弾 性 体 と elastic のような 抽 出 個 所 の 不 十 分 だと 思 われる 用 語 と 対 応 付 けされたものだった 寄 稿 集 4 機 械 翻 訳 技 術 の 向 上 YEAR BOOK 2O11 251

3 余 分 な 単 語 が 含 まれている 用 語 (4.4%) 226 件 のうち 10 件 (4.4%)が 金 属 と to metal のような 余 分 な 単 語 が 含 まれている 用 語 と 対 応 付 けされたものだった 上 記 の1~3に 共 通 した 原 因 として フレーズテーブ ルを 用 いた 用 語 対 の 作 成 段 階 で 翻 訳 候 補 の 全 ての 組 み 合 わせで 上 位 下 位 概 念 の 候 補 を 作 成 したため 類 似 した 用 語 や 抽 出 個 所 の 不 十 分 な 用 語 余 分 な 単 語 が 含 まれている 用 語 と 対 応 付 けされたものが 多 かった と 考 えられる この 問 題 は 上 位 下 位 概 念 の 候 補 を 作 成 する 際 に 全 ての 組 み 合 わせを 候 補 とするのではなく 翻 訳 確 率 を 考 慮 して 候 補 を 作 成 することで 改 善 できると 思 われる 4 上 位 語 と 下 位 語 が 同 じ 用 語 (4.4%) 226 件 のうち 10 件 (4.4%)が 車 両 > 自 動 車 に 対 して vehicles > vehicle のような 上 位 語 と 下 位 語 が 同 じ 用 語 と 対 応 付 けされたものだった 原 因 とし ては フレーズテーブルを 用 いた 用 語 対 の 作 成 段 階 で 全 ての 組 み 合 わせで 上 位 下 位 の 候 補 を 作 成 したため 英 語 の 上 位 下 位 語 が 同 じになってしまったと 考 えられ る そのため 類 似 した 用 語 と 対 応 付 けされてしまい それぞれの 上 位 下 位 概 念 に 同 じ 用 語 を 持 つ 可 能 性 が 高 いため 引 用 分 析 手 法 において 一 致 数 が 多 くなってし まったと 考 えられる この 問 題 は 上 位 下 位 概 念 の 候 補 を 作 成 する 際 に 候 補 の 中 から 上 位 語 と 下 位 語 が 同 じ ものを 削 除 することで 改 善 できると 思 われる また 上 記 の1~4に 共 通 している 原 因 として 上 位 下 位 概 念 の 獲 得 の 際 の 問 題 が 考 えられる 実 際 に 本 研 究 で 抽 出 されたものには 上 位 下 位 概 念 ではないものや 余 分 な 語 を 含 んでいるものがあった 5.1.2 システムが 正 解 と 判 定 できなかったもの 以 下 に 人 手 では 正 解 と 判 定 したが システムでは 不 正 解 と 判 定 された 201 件 の 再 現 できなかった 用 語 対 を 原 因 の 種 類 ごとに 分 析 し 主 要 な 原 因 をいくつか 示 す 201 件 の 再 現 できなかった 用 語 対 は 大 きく 次 の 3 種 類 に 分 類 できる( 重 複 あり) 1 複 数 形 (33.3%) 201 件 のうち 67 件 (33.3%)が 金 属 と metals のような 複 数 形 の 用 語 と 対 応 付 けされたものだった 2 元 素 記 号 (22.9 %) 201 件 のうち 46 件 (22.9%)が 銅 と cu のような 元 素 記 号 と 元 素 の 名 称 で 書 かれた 用 語 が 対 応 付 けされたものだった 3 略 語 (21.4%) 201 件 の う ち 43 件 (21.4%) が C D と compact disk のような 略 語 である 用 語 と 対 応 付 け されたものだった 上 記 の1~3の 用 語 は 訳 語 としてはあまり 一 般 的 で はない 1~3に 当 てはまらない 用 語 対 も あまり 一 般 的 ではない 訳 語 と 対 応 付 けされたものが 多 かった よっ て フレーズテーブルにおいて 翻 訳 確 率 が 低 くなり 再 現 できなかったと 考 えられる この 問 題 は フレーズテー ブルを 作 成 する 際 の 学 習 データを 増 やすことで 改 善 でき ると 思 われる また 一 般 的 でない 表 現 は 抽 出 された 上 位 下 位 概 念 も 少 なく 引 用 分 析 手 法 において 一 致 数 が 少 なくなったと 考 えられる 5.2 比 較 実 験 5.2.1 精 度 について 提 案 手 法 を 用 いた 場 合 は 226 件 比 較 手 法 を 用 いた 場 合 は 208 件 の 検 出 誤 りがあった 検 出 誤 りの 中 で 提 案 手 法 では 不 正 解 と 判 定 したが 比 較 手 法 では 正 解 と 判 定 した 用 語 対 は 0 件 であった 逆 に 比 較 手 法 では 不 正 解 と 判 定 したが 提 案 手 法 では 正 解 と 判 定 した 用 語 対 は 18 件 であった 提 案 手 法 において vehicles > vehicle のように 上 位 語 と 下 位 語 が 同 じ 用 語 と 対 応 付 けされたものが 誤 っ て 検 出 された また アルミニウム に 対 して aluminum film のように 類 似 の 用 語 が 対 応 付 けされたものも 誤 っ て 検 出 された これらの 用 語 対 は 上 位 下 位 概 念 に 同 じ 用 語 を 持 つ 可 能 性 が 高 いため 引 用 分 析 手 法 において 一 致 数 が 多 くなってしまい 比 較 手 法 において 誤 って 検 出 してしまったと 考 えられる これらの 問 題 は 上 位 下 位 概 念 の 候 補 を 作 成 する 際 に 候 補 の 中 から 上 位 語 と 下 位 語 同 じものを 削 除 したり 上 位 下 位 概 念 の 候 補 を 作 成 する 際 に 翻 訳 確 率 を 考 慮 して 候 補 を 作 成 したりす 252 YEAR BOOK 2011

ることで ある 程 度 改 善 できると 思 われる よって こ のような 改 善 を 行 うことによって 提 案 手 法 が 正 しく 正 解 を 判 定 することにおいて 有 効 となると 考 えられる 5.2.2 再 現 率 について 提 案 手 法 を 用 いた 場 合 は 201 件 比 較 手 法 を 用 いた 場 合 は 216 件 の 再 現 できなかった 用 語 対 があった 再 現 できなかった 用 語 対 の 中 で 比 較 手 法 では 正 解 と 判 定 したが 提 案 手 法 では 不 正 解 と 判 定 した 用 語 対 は 0 件 であった 逆 に 提 案 手 法 では 正 解 と 判 定 したが 比 較 手 法 では 不 正 解 と 判 定 した 用 語 対 は 15 件 であった 比 較 手 法 において 記 憶 媒 体 に 対 して record medium や 車 両 に 対 して 複 数 形 の vehicles のように 一 般 的 でない 訳 語 と 対 応 付 けされたものが 再 現 できなかった これらの 用 語 対 は フレーズテーブル において 翻 訳 確 率 が 低 くなり 再 現 できなかったと 考 え られる 提 案 手 法 で 再 現 できなかった 用 語 対 も 一 般 的 でない 訳 語 と 対 応 付 けされたものであったが 引 用 分 析 手 法 を 用 いることにより ある 程 度 問 題 が 改 善 されるこ とが 確 認 できた よって 引 用 分 析 手 法 を 用 いた 日 英 用 語 対 の 抽 出 を 行 う 本 研 究 の 提 案 手 法 は より 多 くの 正 解 を 再 現 することにおいて 有 効 であると 考 えられる 6 おわりに 本 研 究 では 日 英 特 許 データベースから 上 位 下 位 概 念 を 獲 得 し 日 英 の 用 語 間 の 対 応 付 けを 行 うことにより シソーラスの 自 動 構 築 を 行 った 上 位 下 位 概 念 の 抽 出 の 際 定 型 表 現 に 着 目 し 日 英 特 許 データベースから 上 位 下 位 の 用 語 対 を 獲 得 した また 日 英 の 用 語 間 の 対 応 付 けにはフレーズテーブルを 用 い その 後 引 用 分 析 手 法 を 用 いて 日 英 用 語 対 の 絞 り 込 みを 行 った 実 験 の 結 果 提 案 手 法 において 精 度 77.5% 再 現 率 79.4% F 値 78.3% という 結 果 が 得 られた また 比 較 手 法 を 用 い 抽 出 した 用 語 対 の 精 度 と 再 現 率 を 比 較 することで 提 案 手 法 が 有 効 なものであることを 示 した 謝 辞 本 研 究 で 用 いた 米 国 特 許 データは 国 立 情 報 学 研 究 所 の 許 可 を 得 て NTCIR テストコレクションを 利 用 させ ていただいた 参 考 文 献 [Hearst 1992] Hearst, M.A., Automatic Acquisition of Hyponyms from Large Text Corpora, Proceedings of the 14th International Conference on Computational Linguistics, pp.539-545, 1992. [Kessler 1963] Kessler, M.M., Bibliographic Coupling between Scientific Papers, American Documentation, Vol.14, No.1, pp.10-25, 1963. [Small 1973] Small, H., Co-citation in the Scientific Literature: A New Measure of the Relationship between Two Documents, Journal of the American Society for Information Science, Vol.24, pp.265-269, 1973. [ 相 澤 2006] 相 澤 彰 子 類 語 関 係 抽 出 タスクにおける コーパス 規 模 拡 大 の 影 響 情 報 処 理 学 会 研 究 報 告 自 然 言 語 処 理 NL-175 pp.91-98 2006 [ 安 藤 2003] 安 藤 まや 関 根 聡 石 崎 俊 定 型 表 現 を 利 用 した 新 聞 記 事 からの 下 位 概 念 単 語 の 自 動 抽 出 情 報 処 理 学 会 研 究 報 告 自 然 言 語 処 理 NL-157 pp.77-82 2003 [ 大 石 2006] 大 石 康 智 伊 藤 克 亘 武 田 一 哉 藤 井 敦 単 語 の 共 起 関 係 と 構 文 情 報 を 利 用 した 単 語 階 層 関 係 の 統 計 的 自 動 識 別 情 報 処 理 学 会 研 究 報 告 SLP-61 pp.25-30 2006 [ 新 里 2005] 新 里 圭 司 鳥 澤 健 太 郎 HTML 文 書 から の 単 語 間 の 上 位 下 位 関 係 の 自 動 獲 得 自 然 言 語 処 理 Vol.12 No.1 pp.125-151 2005 [ 森 下 2010] 森 下 洋 平 梁 冰 宇 津 呂 武 仁 山 本 幹 雄 フレーズテーブル 及 び 既 存 対 訳 辞 書 を 用 いた 専 門 用 語 の 訳 語 推 定 電 子 情 報 通 信 学 会 論 文 誌 D Vol. J93-D No.11 pp.2525-2537 2010 寄 稿 集 4 機 械 翻 訳 技 術 の 向 上 YEAR BOOK 2O11 253