1(FST ) FST FST FST 2(FST ) FST FST 4 FST MMDAgent FST FST 5 MMDAgent FST FST FST MMDAgent FST FST FSTFST 状態番号, 遷移先状態番号, 遷移条件, 出 FST 例 / ε ε / ε / は 1

Similar documents
DEIM Forum 2012 E Web Extracting Modification of Objec

IPSJ SIG Technical Report Vol.2014-NL-216 No.6 Vol.2014-SLP-101 No /5/ MMDAgent 1. [1] Wikipedia[2] YouTube[3] [4] [5] [6] [7] 1 Graduate

C-œI‡Ä‡¢


Microsoft Word - takenaka_report.doc

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

AP_12_15_yonezawa.indd

IPSJ SIG Technical Report Vol.2018-SE-200 No /12/ Proposal of test description support environment for request acquisition in web appli

untitled

Ÿ_Ł¶-“sŒ{’¨−î

2 3, 4, [1] [2] [3]., [4], () [3], [5]. Mel Frequency Cepstral Coefficients (MFCC) [9] Logan [4] MFCC MFCC Flexer [10] Bogdanov2010 [3] [14],,,

DEIM Forum 2011 B4-4 Focus+Glue+Context Focus Focu

<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >

PHP 分科会 '12/01 OpenSource 協議会 System i 2012/01/26

,, WIX. 3. Web Index 3. 1 WIX WIX XML URL, 1., keyword, URL target., WIX, header,, WIX. 1 entry keyword 1 target 1 keyword target., entry, 1 1. WIX [2

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

はじめに - マニュアルエディター機能の概要 - Dojoの種類とマニュアルエディター機能解除について マニュアルレイアウトの生成 - マニュアルレイアウトの生成 基本編集 4 - 表紙の挿入 4 - 目次の挿入 5 - 一括変換 6 4 マニュアルビルド 9 4- MS Word 9

DEIM Forum 2017 H2-2 Android LAN Android 1 Android LAN

IPSJ SIG Technical Report Vol.2014-DBS-159 No.6 Vol.2014-IFAT-115 No /8/1 1,a) 1 1 1,, 1. ([1]) ([2], [3]) A B 1 ([4]) 1 Graduate School of Info

WagbySpec7

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

コンテンツセントリックネットワーク技術を用いた ストリームデータ配信システムの設計と実装

スライド 1

2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC

目次 ページ 1. 本マニュアルについて 3 2. 動作環境 4 3. ( 前準備 ) ライブラリの解凍と保存 5 4. モデルのインポート 6 5. インポートしたモデルのインピーダンス計算例 8 6. 補足 単シリーズ 単モデルのインポート お問い合わせ先 21 2

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

■デザイン

paper.pdf

untitled

ε

2007年08月号 022416/0812 会告

Bleutooth 2009 Bluetooth Ver.3.0 Bluetooth LAN Bluetooth Bluetooth Bluetooth 2. Bluetooth ( Bluetooth) Bluetooth ( Bluetooth) 2. 1 Bluetooth IEEE802.1

27 AR

Find Find WIX DB entry WIX Aho- Corasick 1 WIX 2. 2 ( ) WIX, FireFox add-on Chrome Extension [1]. 32 Chrome Extension., Web Find, HTML,.., WIX

Sharing the Development Database

intra-mart Accel Collaboration — アンケート 管理者操作ガイド   第2版  

1 EMMA Focus ( ) ( ) ( ) 2 Glue ( ) Context ( ) ( ) 2 EMMA 2 () Focus (Focus ) Focus Focus EMMA ( ) 2 Focus Focus 2 2 Focus+Glue+Context 2

1. ログイン 1-1 管理画面へのログイン 施設の作成 編集 削除や承認 公開には その操作権限を持つアカウントでログイン します アカウントについての詳細は 管理者にお問い合わせください (1) [ ユーザー ID またはメールアドレス ] と [ パスワード ] を入力後 [ ログイン ] を

2013_P02-P07.indd

福151_p1-p8_校4.ai

Web Social Networking Service Virtual Private Network 84

. 61 5,000 5, ,

4. WIX アタッチエンジン 4. 1 FSDR 処理 システムの Web 資源結合動作であるアタッチ処理について 述べる. アタッチ処理は以下の 4 フェーズに分けられる. この一連の 流れを FSDR 処理とする. Find 処理 Select 処理 Decide 処理 Rewrite 処理

ChoreonoidとOpenHRIを用いたシステム構築事例

各種パスワードについて マイナンバー管理票では 3 種のパスワードを使用します (1) 読み取りパスワード Excel 機能の読み取りパスワードです 任意に設定可能です (2) 管理者パスワード マイナンバー管理表 の管理者のパスワードです 管理者パスワード はパスワードの流出を防ぐ目的で この操作

Twitter Twitter [5] ANPI NLP 5 [6] Lee [7] Lee [8] Twitter Flickr FreeWiFi FreeWiFi Flickr FreeWiFi 2. 2 Mikolov [9] [10] word2vec word2vec word2vec k

1. 契約ごとに 1 つのファイルを作成する場合 作成する電子的控除証明書等の種類に応じてラジオボタンを選択してください 画面に入力して 1 件ずつ作成する を選択し 生命保険会社等の名称 生命保険会社等の法人番号及び証明日を入力してください 法人番号は任意項目です 1 メイン画面 ❸ ❹ ❸ 契約

mnal_HDR4ex_5ex.pdf

TopSE並行システム はじめに

1 トラック 右上の ストーリーボード と タイムライン ボタンでトラックの表示方法を変更できます また トラックのクリップやその他エフェクト対して 操作アイコン での操作も可能です /// ヒント /// キャプチャした動画の不要部分をカットしたい場合は キャプチャした動画をクリップへ追加後に 操

Microsoft PowerPoint ppt

ic3_cf_p1-70_1018.indd

ipad PC ( ) Moodle CindyJS ipad 1 2 CindyJS Moodle 1 web 1 web 35 II III CindyJS ( CindyJS ipad html path PC Moodle 2

c3_op-manual

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi

ACtive 010 2

XMLとXSLT

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :

1. ログイン 1-1 管理画面へのログイン 施設の作成 編集 削除や承認 公開には その操作権限を持つアカウントでログイン します アカウントについての詳細は 管理者にお問い合わせください (1) [ ユーザー ID またはメールアドレス ] と [ パスワード ] を入力後 [ ログイン ] を

Symbiotic System ト を 動物 る 人間 情報システム 応 ( ) 人間 共生 情報システム と 体の 長 体の と 体 覚 動 体 と とダイナミクスを持つ 人間と情報システムのインタ ース. コン ータに の動作をさ るために, のつ, するコ ン を, される.. イコン イン

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor

uCosminexus EUR 08-20新機能のご紹介

Issues on Interaction with Web The coming of heterogeneous devices and interaction manner access by : PC, Mobile phone, PDA, AutoPC, DTV, interaction

1. POP3S および SMTP 認証 1 メールアイコン ( ) をクリックしてメールを起動します 2 一度もメールアカウントを作成したことがない場合は 3 へ進んでください メールアカウントの追加を行う場合は メール メニューから アカウントを追 加 をクリックします 3 メールアカウントのプ

橡第19期Q1説明会プレゼン(2)事業(WebUp用

Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL WIX 1 entry wid eid keyword targe

はじめに本マニュアルは以下構成になっています Introduction はG-mai 操作方法のexplanation になります 次節はGmail のメールクライアント (Outlook Express 及びMozillaThunderbird) 設定方法となります OS はwindows XP

325 In this research, we created smartphone cases attaching a dimple or a wedge shaped object in order to improve eyes-free and single-handed touch ac

intra-mart Accel Collaboration — ファイルライブラリ ユーザ操作ガイド   第5版  

Micro Focus Enterprise Developer チュートリアル メインフレーム COBOL 開発 : MQ メッセージ連携 1. 目的 本チュートリアルでは CICS から入力したメッセージを MQ へ連携する方法の習得を目的としています 2. 前提 使用した OS : Red H

IPSJ SIG Technical Report Vol.2010-MPS-77 No /3/5 VR SIFT Virtual View Generation in Hallway of Cybercity Buildings from Video Sequen

2). 3) 4) 1.2 NICTNICT DCRA Dihedral Corner Reflector micro-arraysdcra DCRA DCRA DCRA 3D DCRA PC USB PC PC ON / OFF Velleman K8055 K8055 K8055

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

フローチャート自動生成ツール yflowgen の使い方 目次 1 はじめに 本ツールの機能 yflowgen.exe の使い方 yflowgen.exe の実行方法 制限事項 生成したファイル (gml ファイル形式 ) の開

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root

1.3期・井上健0.doc

01.12期・井須英次1.doc

Lyra X Y X Y ivis Designer Lyra ivisdesigner Lyra ivisdesigner 2 ( 1 ) ( 2 ) ( 3 ) ( 4 ) ( 5 ) (1) (2) (3) (4) (5) Iv Studio [8] 3 (5) (4) (1) (

QualysGuard(R) Release Notes

Shareresearchオンラインマニュアル

24 LED A visual programming environment for art work using a LED matrix

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

Code_Aster / Salome-Meca 中級者への道 2015年5月31日

26 Development of Learning Support System for Fixation of Basketball Shoot Form

IPSJ SIG Technical Report Vol.2016-ICS-183 No /3/16 1,a) 2,b) 2,c) 1,d) e- Maeda Kaoru 1,a) Yoshida Naoto 2,b) Fujiwara Kunihiko 2,c) Yonezawa T

・複数ユーザーによるコンテンツ作成、放送前の画面確認

rzamjpdf.ps

Rational Roseモデルの移行 マニュアル

01 02

KS_SSO_guide

IPSJ SIG Technical Report iphone iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Proc

DEIM Forum 2010 D Development of a La

ハザードマップ閲覧システム での 地図の使い方 ( 本内容は 画面上の 地図の使い方 ヘルプ画面に利用 ) 1. シナリオ型マップ ( 地図から位置を選択 ) シナリオ型マップを 地図から位置を選択 モードで起動した場合の初期画面を示す 1 市町村 縮尺表示エリア 4 現在のシナリオ表示 選択 5

25

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

Microsoft PowerPoint - A3② JaSST_MISRA2004ソースコード品質診断.ppt

一般ユーザに広く解放する必要があると考えられる このことは 図 1 に示す産業構造の変遷と符合させることができる 情報通信産業は 電子機器によって成り立っていたが まず ソフトウェア制作が分離され 更に コンテンツ制作が分離され それらが大きな産業分野を形成するに至っている 典型例として 携帯ゲーム

HMD VR VR HMD VR HMD VR Eye-Gaze Interface on HMD for Virtual Reality Hiromu MIYASHITA Masaki HAYASHI Kenichi OKADA Faculty of Science and Technology,

20mm 63.92% ConstantZoom U 5

Transcription:

DEIM Forum 2016 B8-5 排他制御機能を有する状態遷移機械に基づく 音声対話コンテンツ制御手法 石川 博規 堤 修平 山本 大介 高橋 直久 名古屋工業大学大学院工学研究科情報工学専攻 466 8555 愛知県名古屋市昭和区御器所町 E-mail: hiroki@moss.elcom.nitech.ac.jp, {tsutsumi.shuhei,yamamoto.daisuke,naohisa}@nitech.ac.jp あらまし 我々は音声インタラクションシステム構築ツールキット MMDAgent [1] を用いた研究を行ってきた MMDA- gent は FST(有限状態遷移機械) [12] に基づいた FST ファイルと呼ばれる対話スクリプトファイルを編集することで 自由に音声対話内容を編集することができる [2] 従来の MMDAgent においては 特定の目的と状況に合わせてその 都度1つの FST ファイルを作成することが一般的であった そこで 本研究では 対話シナリオを独立した対話内容 を持つ複数の FST ファイルを分割し 並行制御を行う手法を提案する 提案手法によって FST ファイルの保守性 や移植性が高まると考えている キーワード 音声対話システム, MMDAgent, FST, デジタルコンテンツ, コンテンツ管理, モジュール化, 排他制御 1. は じ め に プによる先行研究 [13] においても音声対話システムを容易にマ ルチタスクで使用できるようする必要性が述べられている ま 近年 モジュール化されたコンテンツを配信する GooglePlay た FST ファイルの保守性を向上させるため FST ファイル や AppStore 等のシステムやサービスが普及している これら を対話シナリオに応じて分割し 並列実行する方法も考えられ のシステムやサービスでは 独立したモジュール化されたコン ていた しかし 従来では後述する FST 競合といった問題か テンツをユーザが任意に切り替えることで 自分好みの機能を ら FST ファイルの並列実行を効果的に実現することが出来 容易に構築していくことが可能となっている 一方で我々は音 なかった そこで 本研究では 分割され独立した対話シナリ 声インタラクションシステム構築ツールキット MMDAgent [1] オを持つ FST ファイルを モジュール化した FST ファイルと を用いた研究を行ってきた MMDAgent は音声認識 音声合 定義し 複数のモジュール化した FST ファイルを並行制御す 成 3D モデル描写を高度に統合したマルチモーダルな音声対 る手法を実現することを目的とする これにより 個々の FST 話システムであり FST ファイルと呼ばれるテキスト形式の ファイルに記述される状態数が少なくなり保守性が向上した 対話スクリプトファイルを編集することで自由に音声対話内 また 目的に合わせて動作させる FST ファイルを動的に変更 容を編集することができる [2] MMDAgent の実行画面の例を することも可能になった例えば 図 3 のように 大学の南門と 図 1 に示す 音声対話を記述する言語としては XML ベースの 北門それぞれにおいて構内を案内する音声対話システムを考え VoiceXML [9] や XISL [10] 等がある また VoiceXML を用 ると 従来では構内の案内を1つの FST ファイルで網羅した いたマルチモーダル音声対話システムを構築する試み [11] もあ 結果 数千行という膨大なサイズとなっていたものが 個々の るが MMDAgent においてはテキストベースの FST ファイル 建物の案内に分割することで数十行単位までサイズが小さく を用いて音声対話を記述する FST ファイルは FST(有限状態 なり 保守性を高められると考えられる また 1号館や21 遷移機械) [12] に基づいており FST ファイルと FST は1対1 号館の案内のように両方の門で共通している FST ファイルを に対応し FST ファイルを読み込んだ数だけ FST が生成され それぞれの音声対話システムに容易に追加することができると る FST ファイルは図 2 のような形式で記述される 状態番 考えられる 号 遷移先状態番号 遷移条件 (入力イベント) 遷移時のコマ 提案手法を実現する上で 従来の MMDAgent において次の ンド (出力コマンド) の4つ組で表せられる FST は独立した 現在の状態番号を持ち 状態番号と遷移条件となっている入力 イベントが共に合致した時に状態遷移を実行する 実行中の各 FST は MMDAgent の対話管理部によって制御されている 従 来の MMDAgent においては 特定の目的と状況に合わせてそ の都度 FST ファイルを作成することが一般的であった しか し そのような利用法では状態数の増加によって 対話シナリ オの編集が煩雑となる傾向があり また FST ファイルの保守 性が低いといった問題があった MMDAgent とは異なる音声 対話システムではあるが 豊橋技術科学大学の小暮らのグルー 図 1 MMDAgent の実行画面

1(FST ) FST FST FST 2(FST ) FST FST 4 FST MMDAgent FST FST 5 MMDAgent FST FST FST MMDAgent FST FST FSTFST 状態番号, 遷移先状態番号, 遷移条件, 出 FST 例 / ε ε / ε / は 1 10 11 12 FST 2 SYNTH_EVENT_STOP / ε FST 独 した機能を持った FST 追加 変更 削除 / 変更 / が容易に える FST A 北門 FST B FST FST 1 FST MMDAgent FST 2 1 FST FST 1. 同じ認識キーワードで状態遷移する複数の FST が実 2. 同じ 声認識内容で作成者が状態遷移すると FSTFST FSTA 1 FSTB 99 1 2 声認識 A 99 100 認識 B FST FSTFST 4 FST FST 1 12 声認識 1 22 声認識 5 2. FST FST 1. MMDAgent 1 MMDAgent 6 FST FST FST FST FST FST 3 FST

2 MMDAgent FST FST 声認識部 POP イベント 処理フレーム終了後 6 出 3. FST A FST B FST C. MMDAgent 3. 1 FST MMDAgent FST FST MMDAgent MMDAgent FST FST FST FST FST FST FST FST Active Inactive FST MMDAgent Active/Inactive Active Inactive FST FST Active Active FST Active FST Active/Inactive FST Active FST FST Active Active FST Active FST Inactive 3. 2 MMDAgent FST 3. 1 FST FST FST FST FST Active FST FST pop pop pop Active FST

Active Active FST Inactive FST push Active FST Inactive 4. 4. 1 MMDAgent MMDAgent C++ C++MMDAgent 3D MMDAgent FST FST NoSyncModeQueueSyncModeSyncMode FST FST 4. 1 @ FST 3. 1 4. 1 FST FST 4. 1 # @ WAITSTATE 0 1 # @ TRANSITIONMODE QueueSync 0 31 RECOG_EVENT_STOP <eps>... 4. 2 NoSyncMode NoSyncMode MMDAgent Active/Inactive FST FST FST 1. FST FST QueueSyncMode 3. 1 FST 3. 2 FST FST Active FST Active FST Inactive FST push Active FST pop FST MMDAgent FST FST FST FST QueueSyncMode FST FST SyncMode 3. 1 FST Active FST Inactive FST 5. 5. 1 FST

MMDAgent FST 6 2goukan.fst 2 FST 51goukan.fst 51 FST FST 51 51 seiza.fst 12 FST uranai.fst 12 FST weatherforecast.fst FST countup.fst FST MMDAgent SYNTH EVENT START 6 FST 6 3 FST FST 6C 3 = 20 A 3 NoSync- Mode B 3 SyncMode C FST 1 20 3 = 60 C 2goukan.fst 51goukan.fstweatherforecast.fst QueueSyncMode FST 1 C FST 2goukan.fst QueueSyncMode 51goukan.fst QueueSyncMode seiza.fst SyncMode uranai.fst SyncMode weatherforecast.fst QueueSyncMode countup.fst NoSyncMode QueueSyncMode 51goukan.fst Active FST QueueSyncMode Active FST FST 2goukan.fst 51goukan.fst seiza.fst uranai.fst SyncMode FST seiza.fst MMDAgent uranai.fst MMDAgent FST QueueSyncMode MMDAgent FST SyncMode countup.fst NoSyncMode FST FST FST NoSyncMode FST 5. 2 FST 2 3 3 C MMDAgent FST

2 OK MMDAgent OKi FST FST NG i FST FST 3 OK OK NG A 0% 60% 40% B 20% 30% 50% C 80% 20% 0% A FST FST 3D FST B FST FST FST FST FST FST FST FST FST FST FST B FST (SyncMode) FST FST FST C FST FST FST FST C FST FST C OK 20% seiza.fst uranai.fst uranai.fst MMDAgent seiza.fst FST [1] Akinobu Lee, Keiichiro Oura, Keiichi Tokuda, MMDAgent - A fully open-source toolkit for voice interaction systems, Proceedings of the ICASSP 2013, pp. 8382-8385, 2013.5 [2],,. SP, 111(365)pp. 153-1572011 [3],,,, 2014 (2), pp. 200, 2014.3 [4],,,, 2014 2014, pp. 789-795, 2014.7 [5],,,, 2014 2014, pp. 781-788, 2014.7 [6] Wakabayashi Keitaro, Daisuke Yamamoto, Naohisa Takahashi, A Voice Dialog Editor Based on Finite State Transducer Using Composite State for Tablet Devices, Computer and Information Science 2015, Springer International Publishing, pp. 125-139, 2016 [7],,,, 2014 2014, pp. 294-300, 2014.7 [8] Yanagi Tomohiro, Daisuke Yamamoto, Naohisa Takahashi, Development of mobile voice navigation system using userbased mobile maps annotations, Computer and Information Science (ICIS), 2015 IEEE/ACIS 14th International Conference on. IEEE, pp. 373-378, 2015. [9] VoiceXMl Forum technical working group, Voice Extensible Markup Language (VoiceXML) version2.0, http://www.w3.org/tr/voicexml20/ [10],,,,, XISL,, pp. 43-48, 2001.7 [11],,,,, VoiceXML,, pp. 43-48, 2001.10 [12] Allauzen C., Riley M., Schalkwyk J., Skut, W., Mohri M., OpenFst: A general and efficient weighted finite-state transducer library, Implementation and Application of Automata Springer Berlin Heidelberg, pp. 11-23, 2007 [13],,,,, pp. 139-144, 2002.2 [14],..,,, D-II, No.5, pp. 608-615, 2003.5