1. はじめに 2

Size: px
Start display at page:

Download "1. はじめに 2"

Transcription

1 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1

2 1. はじめに 2

3 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 / 法 / ほう / ほーを / 助詞 / を / を / お施行 / 動詞 / 施行 / しこう / しこーした / 動詞 / する / した / した 言語処理の中で特に高い精度が必要 3

4 単語分割 形態素解析の現状 ルールベース ( JUMAN 等 ) TODO 機械学習の系列ラベリング ( ChaSen MeCab 等 ) TODO 4

5 既存の手法の問題点 一般分野における利用を想定 それ以外の分野で利用すると精度が著しく下がる 5

6 本研究 目的 : 単語分割や形態素解析の分野適応に必要な労力の軽減 提案手法 : 部分的アノテーション : 文全体ではなく 必要な箇所だけをアノテーションする 点予測を利用することで学習を実現 能動学習 : アノテーションがもっとも有効な箇所を選択し 作業者に提示する 分野適応のためのツールをオープンソースで公開 評価実験 : 医療分野における分野適応 時間効率を評価基準とする 6

7 言語処理の応用に必要な情報 多くの応用では 形態素解析のほとんどの情報が不要 応用 分割 品詞 読み 発音 機械翻訳 質問応答 かな漢字変換 音声認識 これらの情報を利用するより 形態素解析の精度が上がった方が結果的に良いシステム出力となる 7

8 2. 言語資源とアノテーション法 8

9 単語分割に必要な言語資源 辞書 単語の表記のみ 一般分野 厳密な単語分割基準に沿った物は入手可 UniDic IPADIC JUMAN 適応分野 厳密な単語分割基準に沿っていない物 ( 複合語を含む物 ) は多くの場合入手可能 9

10 アノテーション法 : フルアノテーション 従来の学習法では文全体をアノテーション 分割される単語の間に空白を挿入 単語境界に関する 2 つタグ : = 単語境界あり = 単語境界なし 農産物価格安定法を施行 農産物価格安定法を施行 + 直感的で分かりやすい - 文全体のアノテーションを行う必要がある 10

11 アノテーション法 : 部分的アノテーション 文の中で重要な部分のみをアノテーション タグの種類を拡張 = 単語境界あり ー = 単語境界なし = 単語境界の有無が未知 農産物価格安定法を施行 農産物 価 - 格 安 - 定法を施行 + 重要な箇所だけをアノテーションすることが可能 - フルアノテーションより少し手間がかかる 11

12 3. 単語分割の推定法 12

13 従来の単語分割 従来の単語分割法は HMM や CRF など 文全体の解を求める解析法を利用することが多い 文全体がアノテーションされた学習データが必要 Tsuboi et al. 08 は部分的アノテーションで CRF を学習 スパースなアノテーションでは膨大な学習時間 本研究では各単語境界の有無を個別に判定する点推定を利用 13

14 点推定による単語分割 各文字間で分割を行うかどうかの 2 値分類問題 農産物価格安定法を施行 農産物価格安定法を施行 適当な素性を決め SVM やロジスティック回帰などを利用して解く 本研究では線形 SVM を利用 14

15 単語分割の素性 文字 n-gram と文字種 n-gram 素性 判定点 農産物価格安定法を施行 1-gram: 2-gram: 3-gram: 辞書単語素性 窓幅 = 2 文字 -2/ 定 -1/ 法 +1/ を +2/ 施 -2/ 定法 -1/ 法を +1/ を施 -2/ 定法を -1/ 法を施 文字種 -2/K -1/K +1/H +2/K -2/KK -1/KH +1/HK -2/KKH -1/KHK 判定点 農産物価格安定法を施行 辞書単語の範囲 L1( 定 ) R1( 法 ) L2( 安定 ) I2( 定法 ) 15

16 京都テキスト解析ツールキット ( KyTea ) 単語分割 読み推定の機能 部分的アノテーションから学習可能 点推定を利用 分類器として線形 SVM やロジスティック回帰 LIBLINEAR で実装 オープンソースで公開中 16

17 4. アノテーション戦略 17

18 アノテーション過程の概要 部分的アノテーションを最大限に活かすために有用な箇所をアノテーションする必要がある 以下の能動学習手順を用いて有用なタグを付与 C g D g モデル (1) D C a a 自動分割 コーパス 信頼度付きコーパス (3) 人手によるアノテーション 点選択 (2) アノテーションすべき点 18

19 ベースライン戦略 : フルアノテーション 一般分野の学習コーパス C g を利用して学習された分割器で適応コーパスを分割 C a 人手でこの分割結果を訂正 農産物価格安定法を施行 農産物価格安定法を施行 + 誤り箇所を修正するだけで 量的には効率的 - 学習に有用でないところもアノテーション 19

20 提案戦略 1: 点アノテーション 自動分割結果から信頼度の最も低い 100 点を選択 この点の単語境界にタグを付与 農産物? 価格安定法を施行 農産物 価格安定法を施行 + 有用箇所を積極的にアノテーションできる - 知らない単語が出た場合 インターネットや辞書で調べる必要があり 1 点に付き多くの作業時間 20

21 提案戦略 2: 単語アノテーション 自動分割結果から信頼度の最も低い 100 点を選択 その点だけでなくその点に隣接する ( または含む ) 単語全体をアノテーション 農産物? 価格安定法を施行 農産 物 価 - 格 安定法を施行 + アノテーションの有効性と速度の釣り合いが取れる 21

22 5. 評価 22

23 医療分野への適応実験 実験条件 一般分野コーパス C g : 現代日本語書き言葉コーパス ( モニター公開データ 1.29M 文字 ) 一般分野辞書 : UniDic ver (223k 単語 ) 適応分野コーパス C : 医療分野のコーパス (20.1M 文字 ) a 適応分野辞書 : ライフサイエンス辞書 (95.3k 単語 ) 1 人の作業者が交互に各戦略を順に繰り返す ( 点 単語 フル 点 単語 フル ) C a D g D a 実験開始時点では作業者は初心者 評価基準 : から取り除いた 1000 文に対する境界精度 23

24 実験結果 : アノテーション時間 各戦略のアノテーション時間を検証 戦略 100 点 100 タグ フルアノテーション - 16s 点アノテーション 9m15s 9m15s 単語アノテーション 10m35s 2m15s フルアノテーションは圧倒的に早い 点アノテーションは 1 点のアノテーションにかかる時間は単語アノテーションより早いが 1 タグは遅い 24

25 実験結果 : 時間効率 Accuracy vs. Annotation Time Segmentation Accuracy 99.50% 99.00% 98.50% 98.00% F ull (F ) Point (P) W ord (W ) 97.50% Annotation Time (Minutes) フルと点アノテーションはほぼ同等の精度 単語アノテーションは両方を上回る 25

26 むすび 能動学習と点推定に基づいた分野適応法を提案した 3 つのアノテーション戦略を比較し 単語アノテーションは時間効率でもっとも高い精度を実現 このような分野適応は他の解析タスクでも利用可能 読み推定 品詞推定 固有表現抽出 インタフェースの改善でさらに効率の良いアノテーションが期待できる 26

27 ご清聴ありがとうございました 27

28 量効率 Accuracy vs. Annotated Tags % F ull (F ) Point (P) W ord (W ) % Segmentation Accuracy % % % Number of Tags Annotated 28

x i 2 x x i i 1 i xi+ 1xi+ 2x i+ 3 健康児に本剤を接種し ( 窓幅 3 n-gram 長の上限 3 の場合 ) 文字 ( 種 )1-gram: -3/ 児 (K) -2/ に (H) -1/ 本 (K) 1/ 剤 (K) 2/ を (H) 3/ 接 (K) 文字 (

x i 2 x x i i 1 i xi+ 1xi+ 2x i+ 3 健康児に本剤を接種し ( 窓幅 3 n-gram 長の上限 3 の場合 ) 文字 ( 種 )1-gram: -3/ 児 (K) -2/ に (H) -1/ 本 (K) 1/ 剤 (K) 2/ を (H) 3/ 接 (K) 文字 ( 1. 2 1 NEUBIG Graham 1 1 1 Improving Part-of-Speech Tagging by Combining Pointwise and Sequence-based Predictors Yosuke NAKATA, 1 Graham NEUBIG, 1 Shinsuke MORI 1 and Tatsuya KAWAHARA 1 This paper proposes

More information

NLP プログラミング勉強会 6 かな漢字変換 自然言語処理プログラミング勉強会 6 - かな漢字変換 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

NLP プログラミング勉強会 6 かな漢字変換 自然言語処理プログラミング勉強会 6 - かな漢字変換 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語処理プログラミング勉強会 6 - かな漢字変換 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 かな漢字変換のモデル 日本語入力でひらがな列 X をかな漢字混じり文 Y へ変換 かなかんじへんかんはにほんごにゅうりょくのいちぶ かな漢字変換は日本語入力の一部 HMM や単語分割と同じく 構造化予測の一部 2 選択肢が膨大! かなかんじへんかんはにほんごにゅうりょくのいちぶ

More information

¥ì¥·¥Ô¤Î¸À¸ì½èÍý¤Î¸½¾õ

¥ì¥·¥Ô¤Î¸À¸ì½èÍý¤Î¸½¾õ 2013 8 18 Table of Contents = + 1. 2. 3. 4. 5. etc. 1. ( + + ( )) 2. :,,,,,, (MUC 1 ) 3. 4. (subj: person, i-obj: org. ) 1 Message Understanding Conference ( ) UGC 2 ( ) : : 2 User-Generated Content [

More information

演習 レシピテキストの係り受け解析

演習 レシピテキストの係り受け解析 実習 : レシピの言語処理の現状 京都大学 笹田鉄郎 前田浩邦 森信介 2013 年 8 月 18 日 1 公開に際しての注意 必要環境 Perl KyTea Eda Firefox (ver. 14.0.1 以前のバージョン ) 著作権の関係上 係り受け解析の実習で利用した学習コーパスを公開することはできません ご了承ください 目次 1. はじめに 2. 注意事項 3. アノテーション支援ツールPNAT

More information

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using Text Corpus Ziyu Dou(Graduate School of Engineering,

More information

多言語版「チュウ太のweb辞書」を用いた語彙学習

多言語版「チュウ太のweb辞書」を用いた語彙学習 < 日本語教育と AI: 研究実践例と今後の課題 > 読解支援システムへの AI 活用の可能性と留意点 東京国際大学 川村よし子 読解支援システムへの AI 活用の可能性と留意点 はじめに 1. 読解支援システムと自然言語処理技術 2. リーディング チュウ太 3. チュウ太のWeb 辞書 4. チュウ太のやさしくなーれ 5.AI 活用の可能性と留意点 はじめに はじめに AI( 人工知能 ) とは?

More information

MeCab 汎用日本語形態素解析エンジン

MeCab 汎用日本語形態素解析エンジン 日本語解析ツール MeCab, CaboCha の紹介 工藤拓 形態素解析とは 文を単語に区切り品詞を同定する処理 明示的な単語境界が無い言語では必須の処理 全文検索 Spam フィルタリング人工無能... 以下の 3 つの処理 単語への分かち書き (tokenization) 活用語処理 (stemming, lemmatization) 品詞同定 (part-of-speech tagging)

More information

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version Control System: VCS)?? 1 NNCT, 22 Yatatyou,Yamatokoriyamashi, Nara 639 1080, Japan

More information

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69>

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69> 短単位 長単位データマニュアル ver.1.0 (2004-03-24) 山口昌也, 小椋秀樹, 西川賢哉, 石塚京子, 木村睦子 ( 国立国語研究所 ) 内元清貴 ( 情報通信研究機構 ) 目次 1. はじめに 2. 収録内容 3. データ形式 3.1 ファイル形式とファイル名 3.2 短単位 長単位混合形式概要実例各フィールドの説明 3.3 長単位形式概要実例各フィールドの説明 4. 転記テキストとの関係

More information

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 品詞推定 文 X が与えられた時の品詞列 Y を予測する Natural language processing ( NLP ) is a field of computer science JJ -LRB- -RRB- VBZ DT IN 予測をどうやって行うか

More information

マルチエージェントシステムグループの研究計画

マルチエージェントシステムグループの研究計画 言語グリッド 言語グリッドは 機械翻訳サービスと ユーザが作成した辞書サービスや用例対訳サービスを連携させることができるため 利用現場に応じた 精度の高い翻訳結果が得られます 言語グリッドを実現しているソフトウェアは 独立行政法人情報通信研究機構 (NICT) 言語グリッドプロジェクトによって 2006 年 4 月から研究開発され オープンソースソフトウェアとして公開されています 大学 研究機関 企業

More information

アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2

アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2 講演 講義の音声認識と 字幕作成へのコーパスの活用 秋田祐哉 ( 京都大学 ) アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2 言語資源 本研究における関連の言語資源 日本語話し言葉コーパス (CSJ) 現代日本語書き言葉均衡コーパス (BCCWJ) Unidic 3 はじめに

More information

mecab-gree ppt

mecab-gree ppt MeCab 汎用日本語形態素解析エンジン 工藤拓 アジェンダ 形態素解析の技術 辞書引きのアルゴリズム データ構造曖昧性の解消 MeCab の開発裏話 歴史設計方針 汎用テキスト変換ツールとしての MeCab 恐ろしく汎用的! 意外な 使い方 これから 形態素解析 文を単語に区切り 品詞を同定する処理 全文検索 Spam フィルタリング人工無能... 以下の 3 つの処理 単語への分かち書き (tokenization)

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 前半第 2 回 ) 辻慶太 http://slis.sakura.ne.jp/cje3 1 情報検索システムの世界観 情報の生産者研究者, 作家, 記者など 情報の最終利用者 ( エンドユーザ ) 生産 情報の登録者 DB 登録者, 分類者, 索引作成者など 登録 検索 計算機上のシステム 検索エンジン,DB, インタフェースなど 支援 蓄積される情報図書, 雑誌, 画像, 音声など

More information

Microsoft PowerPoint LRW.pptx

Microsoft PowerPoint LRW.pptx Reading Time Balanced Corpus Corpus Annotation Data 文節 文 画面 A 470 66 19 B 455 67 21 C 355 44 16 D 363 41 15 Group 視線走査法自己ペース読文法 1 A 境界なし B 境界あり C 境界なし D 境界あり 2 A 境界あり B 境界なし C 境界あり D 境界なし 3 C 境界なし

More information

Microsoft PowerPoint - algo ppt [互換モード]

Microsoft PowerPoint - algo ppt [互換モード] ( 復習 ) アルゴリズムとは アルゴリズム概論 - 探索 () - アルゴリズム 問題を解くための曖昧さのない手順 与えられた問題を解くための機械的操作からなる有限の手続き 機械的操作 : 単純な演算, 代入, 比較など 安本慶一 yasumoto[at]is.naist.jp プログラムとの違い プログラムはアルゴリズムをプログラミング言語で表現したもの アルゴリズムは自然言語でも, プログラミング言語でも表現できる

More information

NLP プログラミング勉強会 4 単語分割 自然言語処理プログラミング勉強会 4 - 単語分割 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

NLP プログラミング勉強会 4 単語分割 自然言語処理プログラミング勉強会 4 - 単語分割 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語処理プログラミング勉強会 4 - 単語分割 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 単語分割とは 日本語や中国語 タイ語などは英語と違って単語の間に空白を使わない 単語分割を行う 単語分割は単語の間に明示的な区切りを入れる 単語分割を行う 2 必要なプログラミング技術 : 部分文字列 文字列の一部からなる部分文字列を作る方法 $./my-program.py

More information

不満をバネに社会を改善するデータ ~株式会社不満買取センター~

不満をバネに社会を改善するデータ ~株式会社不満買取センター~ 不満をバネに社会を改善するデータ ~ 株式会社不満買取センター ~ 2016/11/30 NII IDR ユーザーフォーラム 1 不満買取センターとは? ネガティブ意見収集と分析で世の中の改善をしている企業です 2 不満買取センターとは? ネガティブ意見収集と分析で世の中の改善をしている企業です 3 不満買取センターとは? ネガティブ意見収集と分析で世の中の改善をしている企業です 1. 一般消費者から意見を集める

More information

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2

自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2 自然言語処理プログラミング勉強会 12 係り受け解析 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語は曖昧性だらけ! I saw a girl with a telescope 構文解析 ( パージング ) は構造的な曖昧性を解消 2 構文解析の種類 係り受け解析 : 単語と単語のつながりを重視 I saw a girl with a telescope 句構造解析

More information

実テキストの情報分析のための頑健な言語処理基盤

実テキストの情報分析のための頑健な言語処理基盤 実テキストの情報分析のための頑健な言語処理基盤 河原大輔黒橋禎夫 * 林部祐太 *1 森田一 *2 Arseny Tolmachev 京都大学大学院情報学研究科 * 科学技術振興機構 CREST 1 現在の所属はフェアリーデバイセズ株式会社 2 現在の所属は株式会社富士通研究所 第 11 回テキストアナリティックス シンポジウム (2017/9/7) 実テキスト セブンの唐揚げ串美味しいし安いんですよね!!

More information

3-1-1 発音情報が未知の言語における テキスト音声合成システム構築法の検討 沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一名古屋工業大学 日本音響学会 2015 年秋季研究発表 2015 年 9 月 18 日

3-1-1 発音情報が未知の言語における テキスト音声合成システム構築法の検討 沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一名古屋工業大学 日本音響学会 2015 年秋季研究発表 2015 年 9 月 18 日 3-1-1 発音情報が未知の言語における テキスト音声合成システム構築法の検討 沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一名古屋工業大学 日本音響学会 2015 年秋季研究発表 2015 年 9 月 18 日 はじめに テキスト音声合成 (TTS) システム u 任意のテキストの音声を合成するシステム u 様々なアプリケーションで利用 u 高音質, 多言語, 発話スタイル等の需要が増加

More information

<4D F736F F D E382E32372E979B82D982A98C7697CA8D918CEA8A77975C8D658F575F93FC8D6594C52E646F6378>

<4D F736F F D E382E32372E979B82D982A98C7697CA8D918CEA8A77975C8D658F575F93FC8D6594C52E646F6378> 日本語学習者の発話量と言語テストの得点の関連性について 李在鎬 ( 筑波大学 ), 村田裕美子 ( ミュンヘン大学 ) 小林典子 ( 元筑波大学 ), 酒井たか子 ( 筑波大学 ) 1. 研究背景学習者コーパスとは, 言語学習者の産出データを格納したデータベースのことである 一般的には, 学習言語の熟達度 (proficiency) の差が言語使用にどのようなバイアスを与えるかを調査する目的で使用する

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

立ち読みページ

立ち読みページ Chapter 5 文章校正やコメント 変更履歴など 文書を校閲するときに役立つ機能を解説します 作成する文書を確認する 172 文章を校正する 173 文字の意味を調べる 178 コメントを挿入する 181 変更履歴を使って文書を校閲する 187 2つの文書を比較する 194 196 Chapter 5 学習前に習得すべきポイントを理解しておき 学習後には確実に習得できたかどうかを振り返りましょう

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 後半第 2 回 ) 辻慶太 http://tsujikeita.hp.infoseek.co.jp/cje3 1 情報検索システムの世界観 情報の生産者研究者, 作家, 記者など 情報の最終利用者 ( エンドユーザ ) 生産 情報の登録者 DB 登録者, 分類者, 索引作成者など 登録 検索 計算機上のシステム 検索エンジン,DB, インタフェースなど 支援 蓄積される情報図書,

More information

vol24_3_003jp

vol24_3_003jp 機械翻訳 話し言葉翻訳 前処理技術 多様な利用シーンに対応する話し言葉翻訳サービスの開発 訪日外国人旅行者数は増加し続け 2020年には4,000万 人になると言われており 多くの外国人のお客様が快適に コミュニケーションを図れることが期待されている ま た 企業のグローバル化も進み 多言語でのコミュニケー ションが行われる機会も増えている 本稿では ドコモが開発に取り組んでいる翻訳サービス のうち

More information

Title マルチメディア コーパスの 構 築 と 活 用 : 表 現 行 動 の 計 量 的 研 究 のために Author(s) 孫, 栄 奭 Citation 阪 大 日 本 語 研 究. 22 P.65-P.90 Issue 2010-02 Date Text Version publisher URL http://hdl.handle.net/11094/10048 DOI Rights

More information

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア 電気通信サービスにおける情報信憑性検証技術に関する研究開発 課題ア Webコンテンツ分析技術開発成果について 1. 施策の目標 ネットワーク上の文字 音声 画像 映像情報について 情報の信頼性を分析する技術を確立し 信頼できる情報を提供することで 誰でもが思いのまま 簡単に 信頼して コンテンツを取り扱い 高度に利活用できる環境を実現する 2. 研究開発の背景 画像 音声 映像情報がWebコンテンツの一部としてインターネット上に大量に流通しているが

More information

先行研究 pp

先行研究 pp N N 1 BCCWJ 1 はじめに 2007 362 a a. b. a. b. a b 2007 363 A B A B A B A A B A B 1 2014 2 5 53 54 2007 363 2 先行研究 200719771989 1998 2001 1993 2004 1977 pp.122 130 N N 55 1989 2 pp.20 21 3 pp.34 35 2 3 56 1998

More information

040402.ユニットテスト

040402.ユニットテスト 2. ユニットテスト ユニットテスト ( 単体テスト ) ユニットテストとはユニットテストはプログラムの最小単位であるモジュールの品質をテストすることであり その目的は結合テスト前にモジュール内のエラーを発見することである テストは機能テストと構造テストの2つの観点から行う モジュールはプログラムを構成する要素であるから 単体では動作しない ドライバとスタブというテスト支援ツールを使用してテストを行う

More information

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において

More information

< 本件に関する問い合わせ先 > 知識創成コミュニケーション研究センター言語基盤グループ村田真樹 Tel: Fax: < 広報問い合わせ先 > 総合企画部広報室報道担当 Tel: Fax: < 用語解説

< 本件に関する問い合わせ先 > 知識創成コミュニケーション研究センター言語基盤グループ村田真樹 Tel: Fax: < 広報問い合わせ先 > 総合企画部広報室報道担当 Tel: Fax: < 用語解説 報道発表 数値 固有名詞情報の抽出可視化を商用で業界初の実現 ~テキスト情報からマーケティング情報や社会動向を簡易に摘出 図式化が可能に! ~ 平成 20 年 9 月 30 日 独立行政法人情報通信研究機構 ( 以下 NICT という 理事長: 宮原秀夫 ) の言語基盤グループの村田主任研究員他は 株式会社数理システム ( 代表取締役社長 : 山下浩 ) と共同で Web 上のニュースサイトなどの膨大なテキスト情報から

More information

レビューテキストの書き の評価視点に対する評価点の推定 29 3

レビューテキストの書き の評価視点に対する評価点の推定 29 3 JAIST Reposi https://dspace.j Title レヒ ューテキストの書き手の評価視点に対する評価 点の推定 Author(s) 張, 博 Citation Issue Date 2017-03 Type Thesis or Dissertation Text version author URL http://hdl.handle.net/10119/14154 Rights

More information

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx シーケンスに基づく検索モデルの検索精度について 東京工芸大学工学部コンピュータ応用学科宇田川佳久 (1/3) (2/3) 要員数 情報システム開発のイメージソースコード検索機能 他人が作ったプログラムを保守する必要がある 実務面での応用 1 バグあるいは脆弱なコードを探す ( 品質の高いシステムを開発する ) 2 プログラム理解を支援する ( 第 3 者が書いたコードを保守する ) 要件定義外部設計内部設計

More information

テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが

テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが テキストマイニングの登場 テキストデータのような定性データは 大量のデータ を分析することで安定した傾向が見いだせますが 人 手で大量のテキストデータを分析することは現実的に はほとんど不可能でした テキストマイニングの登場によって 大量のデータを 統一的な視点 基準から少ない労力で分析することが 可能になりました テキストマイニングは 世の中で流行っている話題 や 人々のニーズや不満を定量的に把握する手段とし

More information

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074> RD_301 構成要素一覧と検索 から構成要素の編集辞書 ( 削除 ) を作る 作成 ( 編集 ) する削除辞書を開きます 構成要素を検索します ドラック & ドロップでも OK 範囲を選択して右クリック 右クリック 削除辞書に登録 ( 追加 ) したい構成要素を選択しコピーします 削除辞書に追加 ( 貼りつけ ) ます Step5. 削除辞書に構成要素が登録 ( 追加 ) されます 構成要素一覧と検索

More information

第14回情報プロフェッショナルシンポジウム予稿集

第14回情報プロフェッショナルシンポジウム予稿集 ニューラル翻訳を用いた中国特許機械翻訳精度の検証 : 中国特許の日本語及び英語への機械翻訳精度の検証 田畑文也 1) 富士フイルム ( 株 ) 1) 421-0396 静岡県榛原郡吉田町川尻 4000 E-mail: fumiya.tabata@fujifilm.com Study of Neural Machine Translation accuracy of Chinese Patents:

More information

Microsoft PowerPoint SIGAL.ppt

Microsoft PowerPoint SIGAL.ppt アメリカン アジアンオプションの 価格の近似に対する 計算幾何的アプローチ 渋谷彰信, 塩浦昭義, 徳山豪 ( 東北大学大学院情報科学研究科 ) 発表の概要 アメリカン アジアンオプション金融派生商品の一つ価格付け ( 価格の計算 ) は重要な問題 二項モデルにおける価格付けは計算困難な問題 目的 : 近似精度保証をもつ近似アルゴリズムの提案 アイディア : 区分線形関数を計算幾何手法により近似 問題の説明

More information

自己紹介 23 年 : NAIST 博士後期課程修了 統計的自然言語処理 機械学習 データマイニング 24 年 : NTT コミュニケーション科学基礎研究所入所リサーチアソシエイト グラフ構造に対する機械学習手法 25 年 ~ Google 株式会社ソフトウェアエンジニア Web 検索 ( サーチク

自己紹介 23 年 : NAIST 博士後期課程修了 統計的自然言語処理 機械学習 データマイニング 24 年 : NTT コミュニケーション科学基礎研究所入所リサーチアソシエイト グラフ構造に対する機械学習手法 25 年 ~ Google 株式会社ソフトウェアエンジニア Web 検索 ( サーチク 大規模テキスト処理を支える 形態素解析技術 Google 株式会社 工藤拓 第 8 回人工知能学会知識ベースシステム研究会 (SIG-KBS) 自己紹介 23 年 : NAIST 博士後期課程修了 統計的自然言語処理 機械学習 データマイニング 24 年 : NTT コミュニケーション科学基礎研究所入所リサーチアソシエイト グラフ構造に対する機械学習手法 25 年 ~ Google 株式会社ソフトウェアエンジニア

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

研究背景 センサなどによって観測される情報の多くは時系列列データ たくさんの時系列列データの中から有益な情報を取得し その内容を理理解する 手法の開発が重要 取得された情報をより抽象度度の 高いレベルで表現 時系列列データの振る舞いを 言語で説明する 手法の開発 HandRight_x HandRi

研究背景 センサなどによって観測される情報の多くは時系列列データ たくさんの時系列列データの中から有益な情報を取得し その内容を理理解する 手法の開発が重要 取得された情報をより抽象度度の 高いレベルで表現 時系列列データの振る舞いを 言語で説明する 手法の開発 HandRight_x HandRi 高次元の時系列列データの潜在意味 解析に基づく 言語化 手法の開発 小林林 一郎郎 お茶茶の 水 女女 子 大学 研究背景 センサなどによって観測される情報の多くは時系列列データ たくさんの時系列列データの中から有益な情報を取得し その内容を理理解する 手法の開発が重要 取得された情報をより抽象度度の 高いレベルで表現 時系列列データの振る舞いを 言語で説明する 手法の開発 HandRight_x

More information

スライド 1

スライド 1 NTT Information Sharing Platform Laboratories NTT 情報流通プラットフォーム研究所 セマンティック Web 技術を用いた社内情報の連携 森田大翼 飯塚京士 ( 日本電信電話株式会社 NTT 情報流通プラットフォーム研究所 ) セマンティック Web コンファレンス 2012 2012 年 3 月 8 日 ( 木 ) 2012 NTT Information

More information

Microsoft Word - pdf 論文1

Microsoft Word - pdf 論文1 キリルモンゴル語 ページの縦書きモンゴル語への自動変換システムの開発 高 紅霞 阪口 哲男 筑波大学図書館情報メディア研究科 茨城県つくば市春日 抄録 モンゴル語には主に縦書きモンゴル語とキリルモンゴル語の2 種類がある 縦書きモンゴル語は主に中国の内モンゴル自治区で使われ キリルモンゴル語は主にモンゴル国で使われている 縦書きモンゴル語の特殊性のため電子化が遅れ 縦書きモンゴル語で提供される ページが限られている

More information

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案 VocaListener ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案 中野倫靖, 後藤真孝 ( 産業技術総合研究所 ) 2008 年 5 月 28 日第 75 回音楽情報科学研究会 (SIGMUS) 第 128 回ヒューマンコンピュータインタラクション研究会 (SIGHCI) 現状の歌声合成の使い方 歌声合成システムを選択 [ ] Vocaloid [ ] Vocaloid2

More information

Microsoft Word - DEIM論文3.doc

Microsoft Word - DEIM論文3.doc DEIM Forum 2017 A2-1 ニュース記事を用いた時事問題自動作問システム 久田将史 前田亮 立命館大学情報理工学部 525-8577 滋賀県草津市野路東 1-1-1 E-mail: is0230kx@ed.ritsumei.ac.jp,amaeda@is.ritsumei.ac.jp あらまし コンピュータが問題を出題するシステムの多くが, あらかじめ用意しておいた問題文と解答を用いて出題してい

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

0210研究会

0210研究会 複数のソーシャルメディアのレビューを 用いた商品比較基盤技術の提案 甲南大学大学院自然科学研究科服部祐基 甲南大学知能情報学部灘本明代 背景 ソーシャルメディアを用いて情報を取得する行為が多くなっている 商品の購入 商品認知の情報源 購入のきっかけとなった情報源 として 約 40% ものインターネットユーザがソーシャルメディアを活用している 1),2) ソーシャルメディアの書き込みを商品購入の際の参考にしているユーザが多く存在している

More information

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst 1,a) 1 1 1 deep neural netowrk(dnn) (HMM) () GMM-HMM 2 3 (CSJ) 1. DNN [6]. GPGPU HMM DNN HMM () [7]. [8] [1][2][3] GMM-HMM Gaussian mixture HMM(GMM- HMM) MAP MLLR [4] [3] DNN 1 1 triphone bigram [5]. 2

More information

コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 数理システムユーザーコンファレンス 2007

コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 数理システムユーザーコンファレンス 2007 コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 1. 注目される CGM(1) CGM とは Consumer Generated Media インターネットなどを活用して生活者が内容を生成していくメディア 個人の情報発信をデータベース化

More information

ギター初心者のための 演奏練習支援システム 日本大学文理学部 情報科学科 B4 宇田川 真唯 1

ギター初心者のための 演奏練習支援システム 日本大学文理学部 情報科学科 B4 宇田川 真唯 1 ギター初心者のための 演奏練習支援システム 日本大学文理学部 情報科学科 B4 宇田川 真唯 1 研究概要 ギター初心者のための演奏練習支援システム 1)弦の押さえ方を手本画像にCGを用いて説明する 2)正しい音を出せているのかの自動判定する 3)正しい音を出せていない場合の典型的な原因を提示す る これらの機能を搭載したシステムを提案 2 研究背景 1/2 ギター演奏の練習方法はさまざまである 教本に沿った練習

More information

DEIM Forum 2019 C3-5 tweet

DEIM Forum 2019 C3-5 tweet DEIM Forum 2019 C3-5 tweet 163 8677 1 24 2 163 8677 1 24 2 163 8677 1 24 2 E-mail: c515029@ns.kogakuin.ac.jp, cm17051@ns.kogakuin.ac.jp, aki@cc.kogakuin.ac.jp Twitter tweet tweet tweet BoW Doc2vec SVM

More information

スライド 1

スライド 1 Monthly Research 静的情報に基づいたマルウェア判定指標の検討 Fourteenforty Research Institute, Inc. 株式会社 FFRI http://www.ffri.jp Ver2.00.01 Agenda 背景と目的 実験概要 実験結果 評価及び考察 まとめ 2 背景と目的 マルウェアの急増に伴い 従来のパターンマッチングによる検知が困難になっている そのため

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

スライド 1

スライド 1 CNN を用いた弱教師学習による画像領域分割 下田和, 柳井啓司 電気通信大学 大学院情報理工学 研究科 総合情報学専攻 c 2015 UEC Tokyo. Convolutional Neural Network CNN クラス分類タスクにおいてトップの精度 CNN の応用 ( 物体位置の認識 ) 物体検出 物体に BB を付与 領域分割 ピクセル単位の認識 CNN を用いた領域分割 CNN による完全教師ありのセグメンテーション

More information

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx)

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx) DEIM Forum 2009 C6-4 Web 上のレビュー情報からユーザが重要視する製品の特徴を抽出する手法の提案 小林大祐 井上潮 東京電機大学工学研究科 101-8457 東京都千代田区神田錦町 2-2 E-mail: 08gmc13@ed.cck.dendai.ac.jp, inoue@c.dendai.ac.jp あらまし製品のレビューを書くための Web サイトが存在し, 利用者も多い.

More information

nlp1-04a.key

nlp1-04a.key 自然言語処理論 I. 文法 ( 構文解析 ) その 構文解析 sytctic lysis, prsig 文の構文的な構造を決定すること句構造文法が使われることが多い文法による構文木は一般に複数ある 構文木の違い = 解釈の違い 構文解析の目的 句構造文法の規則を使って, 文を生成できる構文木を全て見つけだすこと 文法が入力文を生成できるかどうかを調べるだけではない pro I 構文解析とは 構文木の違い

More information

財団法人日本科学技術連盟 2021 年 2 月 24 日 SQiP 研究会特別講演 人工知能による欠陥分類の次の挑戦 バグの自動修復技術の実用化に向け (2016 年度 SQiP 研究会発表論文 ) 数理科学アプローチを用いた客観的欠陥弁別法 ~ 外因欠陥の弁別方法とその効果 意義 ~ 2/17

財団法人日本科学技術連盟 2021 年 2 月 24 日 SQiP 研究会特別講演 人工知能による欠陥分類の次の挑戦 バグの自動修復技術の実用化に向け (2016 年度 SQiP 研究会発表論文 ) 数理科学アプローチを用いた客観的欠陥弁別法 ~ 外因欠陥の弁別方法とその効果 意義 ~ 2/17 2017 年 2 月 24 日 財団法人日本科学技術連盟第 32 年度ソフトウェア品質管理研究会成果発表会 数理科学アプローチを用いた 客観的欠陥弁別法 外因欠陥の弁別方法とその効果 意義 第 7 分科会欠陥エンジニアリング Team TuKuLu 研究員 : 伊藤弘毅 ( 三菱電機株式会社 ) 大島修 ( エプソンアヴァシス株式会社 ) 角修二 ( 株式会社インテリジェンスビジネスソリューションズ

More information

PowerPoint Presentation

PowerPoint Presentation 今週のトピックス アルゴリズムとデータ構造 第 10 回講義 : 探索その 1 探索 (search) 逐次探索 (sequential search) 2 分探索 (binary search) 内挿探索 (interpolation search) Produced by Qiangfu Zhao (Since 2009), All rights reserved (c) 1 Produced

More information

目次 ペトリネットの概要 適用事例

目次 ペトリネットの概要 適用事例 ペトリネットを利用した状態遷移テスト 和田浩一 東京エレクトロン SDC FA グループ 目次 ペトリネットの概要 適用事例 ペトリネットの概要 - ペトリネットとは ペトリネット (Petri Net) とは カール アダム ペトリが 1962 年に発表した離散分散システムを数学的に表現する手法である 視覚的で 数学的な離散事象システムをモデル化するツールの一つである ペトリネットの概要 - ペトリネットの表記と挙動

More information

平塚信用金庫の現況 2015

平塚信用金庫の現況 2015 2015 1 2 3 1 2 3 4 5 6 7 1 2 3 4 5 8 9 @ A B C D E F G H I J K HK L M N O P Q R T R T S T U V W 1 2 3 4 5 6 E F C J I O M N K L H 8 7 G D 0 A 6 9 5

More information

共有辞書を用いた 効率の良い圧縮アルゴリズム

共有辞書を用いた 効率の良い圧縮アルゴリズム 大規模テキストに対する 共有辞書を用いた Re-Pair 圧縮法 Variable-to-Fixed-Length Encoding for Large Texts Using Re-Pair Algorithm with Efficient Shared Dictionaries 関根渓, 笹川裕人, 吉田諭史, 喜田拓也 北海道大学大学院情報科学研究科 1 背景 : 巨大なデータ 計算機上で扱うデータの巨大化.

More information

csj-report.pdf

csj-report.pdf 133 3 CSJ CSJ 3.1 3.2 3.3 1 CSJ 100 650 CSJ 3.1.5 CSJ 4 CSJ 3 4 CSJ 3 4 134 3 3.1 3.1.1 3.1.1.1 () *1 3.1 *2 3.1 (1) 1 1 *1 ( 1987:11) *2 (1982:582-583) (1998:171-172) 3.1 135 (2) () 1 1 1 1 1 1 (1) ()

More information

(NICT) ( ) ( ) (NEC) ( )

(NICT) ( ) ( ) (NEC) ( ) (NICT) ( ) () (NEC) ( ) ! Paraphrase (Paraphrasing) l l ! l h"p://paraphrasing.org/bib- cat.html l 12 50 l 640 (2014 6)! l l l l l l ! [ ] 2! [ ] ( )! :............ 1 2 1 = 2 = ! [ ]! [ ]! :............

More information

オートマトン 形式言語及び演習 3. 正規表現 酒井正彦 正規表現とは 正規表現 ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械正規表現 : 言語

オートマトン 形式言語及び演習 3. 正規表現 酒井正彦   正規表現とは 正規表現 ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械正規表現 : 言語 オートマトン 形式言語及び演習 3. 酒井正彦 www.trs.css.i.nagoya-u.ac.jp/~sakai/lecture/automata/ とは ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械 : 言語を記号列で定義 - 記述しやすい ( ユーザフレンドリ ) 例 :01 + 10 - UNIX の grep コマンド - UNIX の

More information

文字入力 ソフトウェアキーボードを切り替える...56 文字入力画面の見かた...56 文字を入力する...58 文字入力の便利な機能を利用する...60 iwnn IME の設定を行う

文字入力 ソフトウェアキーボードを切り替える...56 文字入力画面の見かた...56 文字を入力する...58 文字入力の便利な機能を利用する...60 iwnn IME の設定を行う 文字入力 ソフトウェアキーボードを切り替える...56 文字入力画面の見かた...56 文字を入力する...58 文字入力の便利な機能を利用する...60 iwnn IME の設定を行う...61 55 文字入力56 ソフトウェアキーボードを切り替える 文字入力欄をタップすると 画面上にソフトウェアキーボードが表示され 画面のキーをタップして文字を入力できます ISW11K では 次のソフトウェアキーボードを利用できます

More information

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成 Encoding Source Language with Convolu5onal Neural Network for Machine Transla5on Fandong Meng, Zhengdong Lu, Mingxuan Wang, Hang Li, Wenbin Jiang, Qun Liu, ACL- IJCNLP 2015 すずかけ読み会奥村 高村研究室博士二年上垣外英剛 概要

More information

<4D F736F F D2091B28BC68CA48B8695F18D908F912E646F63>

<4D F736F F D2091B28BC68CA48B8695F18D908F912E646F63> 卒業研究報告書 題目 並列処理によるデータベース 指導教員 石水隆助教 報告者 04-1-47-175 三宅健太 近畿大学理工学部情報学科 平成 21 年 1 月 31 日提出 概要 膨大な量のデータから成るテーブルに対し検索し 1 つの応答時間が非常に大きなものの場合がある その原因には SQL 文の文法が悪い あるいはインデックスの張り方が悪いなどデータがきちんとそれぞれのテーブルに割り振られていない場合や

More information

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手 BCCWJ における固有表現抽出のエラー分析 市原正陽 ( 茨城大学工学部情報工学科 ) 山崎舞子 ( 東京工業大学大学院総合理工学研究科 ) 古宮嘉那子 ( 茨城大学工学部情報工学科 ) Error Analysis of Named Entity Extraction in BCCWJ Masaaki Ichihara(Department of Computer and Information

More information

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し ユーザ編集 Wiki データによるセマンティック SNS の開発 行動を推薦する SNS 1. 背景現在 インターネットで必要な情報を得るためには 検索結果を人手で選択する あるいは検索ワードを色々試すなどの試行が必要であり これらは現在盛んに行われている統計的な手法による全文検索 データ解析では根本的に解決できない こういった現状を超え Web がさらに進化するには コンピュータが理解できる 構造化された知識ベースで

More information

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から 概要 コロケーションリストのもう一歩先へ : 英和辞書の執筆者と使用者の立場から 成城大学社会イノベーション学部石井康毅 コロケーションは学習者にとって重要だが 連語辞典は使いこなせないことが多い コーパスから簡単に連語リストが作れる これは執筆者から見て非常に有用だが これだけでは 学習者向け辞書における実際の記述や用例の作成には不十分 コンコーダンスラインを丁寧に見なくてはいけないが 限られた時間の中で

More information

電子情報通信学会ワードテンプレート (タイトル)

電子情報通信学会ワードテンプレート (タイトル) DEIM Forum 014 E3-4 入力ストローク数削減による高速手書き入力手法 王琛 鬼沢和也, 浅井洋樹 山名早人 早稲田大学基幹理工学部 169-8555 東京都新宿区大久保 3-4-1 早稲田大学大学院基幹理工学研究科 169-8555 東京都新宿区大久保 3-4-1 早稲田大学メディアネットワークセンター 169-8050 東京都新宿区戸塚町 1-104 早稲田大学理工学術院 169-8555

More information

help_ja

help_ja interviewscribe ユーザーズガイド ヤナセ 2012 1 1. 概要 interviewscribeは テープ起こし作業を効率的に行うためのツールです フレーズ分割 interviewscribeでは音声データを 発音している部分毎に分割し フレーズ として管理します フレーズに分割することで 数秒のフレーズ毎に聞き取り作業を進められ 再生 聞き取り テキス ト変換の一連の作業をスムーズに進めることが出来ます

More information

JA2008

JA2008 A1 1 10 vs 3 2 1 3 2 0 3 2 10 2 0 0 2 1 0 3 A2 3 11 vs 0 4 4 0 0 0 0 0 3 6 0 1 4 x 11 A3 5 4 vs 5 6 5 1 0 0 3 0 4 6 0 0 1 0 4 5 A4 7 11 vs 2 8 8 2 0 0 0 0 2 7 2 7 0 2 x 11 A5 9 5 vs 3 10 9 4 0 1 0 0 5

More information

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Using Unlabeled Examples of Each Genre Rie Yatabe (Ibaraki University) Minoru Sasaki

More information

株主通信:第18期 中間

株主通信:第18期 中間 19 01 02 03 04 290,826 342,459 1,250,678 276,387 601,695 2,128,760 31,096 114,946 193,064 45,455 18,478 10,590 199,810 22,785 2,494 3,400,763 284,979 319,372 1,197,774 422,502 513,081 2,133,357 25,023

More information

ワタベウェディング株式会社

ワタベウェディング株式会社 1 2 3 4 140,000 100,000 60,000 20,000 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 5 6 71 2 13 14 7 8 9 10 11 12 1 2 2 point 1 point 2 1 1 3 point 3 4 4 5 6 point 4 point 5 point 6 13 14 15 16 point 17

More information

株主通信 第16 期 報告書

株主通信 第16 期 報告書 10 15 01 02 1 2 3 03 04 4 05 06 5 153,476 232,822 6,962 19,799 133,362 276,221 344,360 440,112 412,477 846,445 164,935 422,265 1,433,645 26,694 336,206 935,497 352,675 451,321 1,739,493 30,593 48,894 153,612

More information

1003shinseihin.pdf

1003shinseihin.pdf 1 1 1 2 2 3 4 4 P.14 2 P.5 3 P.620 6 7 8 9 10 11 13 14 18 20 00 P.21 1 1 2 3 4 5 2 6 P7 P14 P13 P11 P14 P13 P11 3 P13 7 8 9 10 Point! Point! 11 12 13 14 Point! Point! 15 16 17 18 19 Point! Point! 20 21

More information

untitled

untitled 1 2 3 4 5 6 7 Point 60,000 50,000 40,000 30,000 20,000 10,000 0 29,979 41,972 31,726 45,468 35,837 37,251 24,000 20,000 16,000 12,000 8,000 4,000 0 16,795 22,071 20,378 14 13 12 11 10 0 12.19 12.43 12.40

More information