人工知能学会研究会資料 SIG-SLUD-B ROS Development of Spoken Dialogue System which Integrates and Shares Information based on ROS Architecture Gra

Similar documents
IPSJ SIG Technical Report Vol.2015-MUS-107 No /5/23 HARK-Binaural Raspberry Pi 2 1,a) ( ) HARK 2 HARK-Binaural A/D Raspberry Pi 2 1.

IPSJ SIG Technical Report Vol.2010-GN-74 No /1/ , 3 Disaster Training Supporting System Based on Electronic Triage HIROAKI KOJIMA, 1 KU

Vol. 23 No. 4 Oct Kitchen of the Future 1 Kitchen of the Future 1 1 Kitchen of the Future LCD [7], [8] (Kitchen of the Future ) WWW [7], [3

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

,,,,., C Java,,.,,.,., ,,.,, i

258 5) GPS 1 GPS 6) GPS DP 7) 8) 10) GPS GPS ) GPS Global Positioning System

Vol. 48 No. 3 Mar PM PM PMBOK PM PM PM PM PM A Proposal and Its Demonstration of Developing System for Project Managers through University-Indus

1 Web [2] Web [3] [4] [5], [6] [7] [8] S.W. [9] 3. MeetingShelf Web MeetingShelf MeetingShelf (1) (2) (3) (4) (5) Web MeetingShelf

IPSJ SIG Technical Report Vol.2014-GN-90 No.16 Vol.2014-CDS-9 No.16 Vol.2014-DCC-6 No /1/24 1,a) 2,b) 2,c) 1,d) QUMARION QUMARION Kinect Kinect

28 Horizontal angle correction using straight line detection in an equirectangular image

fiš„v8.dvi

Fig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels).

Vol.54 No (July 2013) [9] [10] [11] [12], [13] 1 Fig. 1 Flowchart of the proposed system. c 2013 Information

3D UbiCode (Ubiquitous+Code) RFID ResBe (Remote entertainment space Behavior evaluation) 2 UbiCode Fig. 2 UbiCode 2. UbiCode 2. 1 UbiCode UbiCode 2. 2

IPSJ SIG Technical Report Vol.2014-HCI-158 No /5/22 1,a) 2 2 3,b) Development of visualization technique expressing rainfall changing conditions


1 4 4 [3] SNS 5 SNS , ,000 [2] c 2013 Information Processing Society of Japan

7,, i

2) TA Hercules CAA 5 [6], [7] CAA BOSS [8] 2. C II C. ( 1 ) C. ( 2 ). ( 3 ) 100. ( 4 ) () HTML NFS Hercules ( )

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

Vol. 42 No MUC-6 6) 90% 2) MUC-6 MET-1 7),8) 7 90% 1 MUC IREX-NE 9) 10),11) 1) MUCMET 12) IREX-NE 13) ARPA 1987 MUC 1992 TREC IREX-N

<95DB8C9288E397C389C88A E696E6462>

1(FST ) FST FST FST 2(FST ) FST FST 4 FST MMDAgent FST FST 5 MMDAgent FST FST FST MMDAgent FST FST FSTFST 状態番号, 遷移先状態番号, 遷移条件, 出 FST 例 / ε ε / ε / は 1

/ p p

1 Table 1: Identification by color of voxel Voxel Mode of expression Nothing Other 1 Orange 2 Blue 3 Yellow 4 SSL Humanoid SSL-Vision 3 3 [, 21] 8 325

FA

1 7.35% 74.0% linefeed point c 200 Information Processing Society of Japan

1 1 CodeDrummer CodeMusician CodeDrummer Fig. 1 Overview of proposal system c

論文9.indd

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

橡最終原稿.PDF

2). 3) 4) 1.2 NICTNICT DCRA Dihedral Corner Reflector micro-arraysdcra DCRA DCRA DCRA 3D DCRA PC USB PC PC ON / OFF Velleman K8055 K8055 K8055

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

1., 1 COOKPAD 2, Web.,,,,,,.,, [1]., 5.,, [2].,,.,.,, 5, [3].,,,.,, [4], 33,.,,.,,.. 2.,, 3.., 4., 5., ,. 1.,,., 2.,. 1,,

IPSJ SIG Technical Report Vol.2014-EIP-63 No /2/21 1,a) Wi-Fi Probe Request MAC MAC Probe Request MAC A dynamic ads control based on tra

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

WebRTC P2P,. Web,. WebRTC. WebRTC, P2P, i

9.プレゼン資料(小泉)R1

IT,, i

IPSJ SIG Technical Report Vol.2017-ARC-225 No.12 Vol.2017-SLDM-179 No.12 Vol.2017-EMB-44 No /3/9 1 1 RTOS DefensiveZone DefensiveZone MPU RTOS

( )

IPSJ SIG Technical Report * Wi-Fi Survey of the Internet connectivity using geolocation of smartphones Yoshiaki Kitaguchi * Kenichi Nagami and Yutaka

5) 2. Geminoid HI-1 6) Telenoid 7) Geminoid HI-1 Geminoid HI-1 Telenoid Robot- PHONE 8) RobotPHONE 11 InterRobot 9) InterRobot InterRobot irt( ) 10) 4

16_.....E...._.I.v2006

ÿþ

1 1 tf-idf tf-idf i

Journal of Geography 116 (6) Configuration of Rapid Digital Mapping System Using Tablet PC and its Application to Obtaining Ground Truth

HP cafe HP of A A B of C C Map on N th Floor coupon A cafe coupon B Poster A Poster A Poster B Poster B Case 1 Show HP of each company on a user scree

6 2. AUTOSAR 2.1 AUTOSAR AUTOSAR ECU OSEK/VDX 3) OSEK/VDX OS AUTOSAR AUTOSAR ECU AUTOSAR 1 AUTOSAR BSW (Basic Software) (Runtime Environment) Applicat

2017 (413812)

29 jjencode JavaScript

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

( ), ( ) Patrol Mobile Robot To Greet Passing People Takemi KIMURA(Univ. of Tsukuba), and Akihisa OHYA(Univ. of Tsukuba) Abstract This research aims a

知能と情報, Vol.30, No.5, pp

e-learning station 1) 2) 1) 3) 2) 2) 1) 4) e-learning Station 16 e-learning e-learning key words: e-learning LMS CMS A Trial and Prospect of Kumamoto


,,.,.,,.,.,.,.,,.,..,,,, i

3_23.dvi

20 Method for Recognizing Expression Considering Fuzzy Based on Optical Flow

DEIM Forum 2009 B4-6, Str

[2] , [3] 2. 2 [4] 2. 3 BABOK BABOK(Business Analysis Body of Knowledge) BABOK IIBA(International Institute of Business Analysis) BABOK 7

Virtual Window System Virtual Window System Virtual Window System Virtual Window System Virtual Window System Virtual Window System Social Networking

第62巻 第1号 平成24年4月/石こうを用いた木材ペレット

WikiWeb Wiki Web Wiki 2. Wiki 1 STAR WARS [3] Wiki Wiki Wiki 2 3 Wiki 5W1H Wiki Web 2.2 5W1H 5W1H 5W1H 5W1H 5W1H 5W1H 5W1H 2.3 Wiki 2015 Informa

人工知能学会研究会資料 SIG-KBS-B Analysis of Voting Behavior in One Night Werewolf 1 2 Ema Nishizaki 1 Tomonobu Ozaki Graduate School of Integrated B

Vol. 42 No. SIG 8(TOD 10) July HTML 100 Development of Authoring and Delivery System for Synchronized Contents and Experiment on High Spe

IPSJ SIG Technical Report Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for

MA3-1 30th Fuzzy System Symposium (Kochi, September 1-3, 2014) Analysis of Comfort Given to Human by Using Sound Generation System Based on Netowork o

2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC

1: A/B/C/D Fig. 1 Modeling Based on Difference in Agitation Method artisoc[7] A D 2017 Information Processing

2013 Future University Hakodate 2013 System Information Science Practice Group Report biblive : Project Name biblive : Recording and sharing experienc

( ) ATR

The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). The material has been made available on the website

IPSJ SIG Technical Report PIN(Personal Identification Number) An Examination of Icon-based User Authentication Method for Mobile Terminals Fum

log F0 意識 しゃべり 葉の log F0 Fig. 1 1 An example of classification of substyles of rap. ' & 2. 4) m.o.v.e 5) motsu motsu (1) (2) (3) (4) (1) (2) mot

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/7 1,a) 2,3 2,3 3 Development of the ethological recording application for the understanding of

Vol.53 No (Mar. 2012) 1, 1,a) 1, 2 1 1, , Musical Interaction System Based on Stage Metaphor Seiko Myojin 1, 1,a

光学

IPSJ SIG Technical Report Vol.2012-CG-148 No /8/29 3DCG 1,a) On rigid body animation taking into account the 3D computer graphics came

GPGPU

IT i

24 LED A visual programming environment for art work using a LED matrix

総研大文化科学研究第 11 号 (2015)

TF-IDF TDF-IDF TDF-IDF Extracting Impression of Sightseeing Spots from Blogs for Supporting Selection of Spots to Visit in Travel Sat

,,,, : - i -

Webサービス本格活用のための設計ポイント

Haiku Generation Based on Motif Images Using Deep Learning Koki Yoneda 1 Soichiro Yokoyama 2 Tomohisa Yamashita 2 Hidenori Kawamura Scho

IPSJ SIG Technical Report Vol.2009-DPS-141 No.20 Vol.2009-GN-73 No.20 Vol.2009-EIP-46 No /11/27 1. MIERUKEN 1 2 MIERUKEN MIERUKEN MIERUKEN: Spe

( ) [1] [4] ( ) 2. [5] [6] Piano Tutor[7] [1], [2], [8], [9] Radiobaton[10] Two Finger Piano[11] Coloring-in Piano[12] ism[13] MIDI MIDI 1 Fig. 1 Syst

1_26.dvi

. IDE JIVE[1][] Eclipse Java ( 1) Java Platform Debugger Architecture [5] 3. Eclipse GUI JIVE 3.1 Eclipse ( ) 1 JIVE Java [3] IDE c 016 Information Pr

(3.6 ) (4.6 ) 2. [3], [6], [12] [7] [2], [5], [11] [14] [9] [8] [10] (1) Voodoo 3 : 3 Voodoo[1] 3 ( 3D ) (2) : Voodoo 3D (3) : 3D (Welc

1 [1, 2, 3, 4, 5, 8, 9, 10, 12, 15] The Boston Public Schools system, BPS (Deferred Acceptance system, DA) (Top Trading Cycles system, TTC) cf. [13] [

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)


IPSJ SIG Technical Report Vol.2009-HCI-134 No /7/17 1. RDB Wiki Wiki RDB SQL Wiki Wiki RDB Wiki RDB Wiki A Wiki System Enhanced by Visibl

IPSJ SIG Technical Report Vol.2014-CG-155 No /6/28 1,a) 1,2,3 1 3,4 CG An Interpolation Method of Different Flow Fields using Polar Inter

untitled

Vol. 48 No. 4 Apr LAN TCP/IP LAN TCP/IP 1 PC TCP/IP 1 PC User-mode Linux 12 Development of a System to Visualize Computer Network Behavior for L

Transcription:

人工知能学会研究会資料 SIG-SLUD-B506-15 ROS Development of Spoken Dialogue System which Integrates and Shares Information based on ROS Architecture 1 2 3 1 1 Graduate School of Science and Technology, Keio University 2 2 Department of Computer and Information Science, Graduate School of Science and Technology, Seikei University 3 3 Department of Computer and Information Science, Faculty of Science and Technology, Seikei University Abstract: In recent years, research on spoken dialogue systems has been actively studied on systems using multimodal information such as images and interactive robot control information as well as spoken language information. At that time, it is necessary to integrate and process information obtained from various sensors and processing modules, however the integration will not be successful, if the format of each input / output data, communication method, etc. are disjointed. Therefore, in order to smoothly integrate various types of information, we introduced ROS (Robot Operating System) architecture for management and communication of each module of spoken dialogue system. We also introduced an information management module (IS : Information State) that centrally manages the information exchanged by each module. This module closely shares information with the main modules (speech recognition, language understanding, dialogue management, response generation, speech synthesis) of the spoken dialogue system, and can refer to information in the spoken dialogue system from other modules. In addition, information on other modules can be obtained from the spoken dialogue system, and a spoken dialogue system utilizing information obtained from modalities can be realized. 1 E-mail: nishimura@ae.keio.ac.jp ROS Robot Operating System PRINTEPS (PRactical INTElligent applications)[ 15, 16] 1 PRINTEPS 1 http://printeps.org/ - 79 -

1: Information State PRINTEPS PRINTEPS IS Information State 1 IS MMDAgent[Lee 13] 2 MMDAgent 3D MMDAgent DLL MMDAgent OpenDial[Lison 16] 3 Java MMDAgent dialogue state 2 http://www.mmdagent.jp/ 3 http://www.opendial-toolkit.net/ ROS rospeex[sugiura 15] 4 NICT ROS ROS Information State 2 ROS ROS(Robot Operating System)[Quigley 09] 5 6 ROS BSD ROS 3 PRINTEPS PRINTEPS PRINTEPS 4 http://rospeex.org/ 5 http://www.ros.org/ 6 http://www.osrfoundation.org/ - 80 -

8ch 8 4.2 2: PRINTEPS 3: PRINTEPS GUI 2 PRINTEPS Google Google Cloud Speech API 9 100ms 4.3 3 Num, 3 TFIDF 4 5 Information State ( 3) 4.1 PRINTEPS PRINTEPS Aldebaran SoftBank Pepper 7 7 http://www.softbank.jp/robot/ 4.4 Information State 4.5 8 http://www.sifi.co.jp/system/modules/pico/index. php?content_id=39 9 https://cloud.google.com/speech/ - 81 -

ConfOrder 4.6 PRINT- EPS Pepper Pepper 5 Information State Information State (IS) IS ROS IS IS IS IS IS IS MongoDB[Chodorow 10] 10 MongoDB RDBMS NoSQL JSON PRINTEPS PRINTEPS IS IS 10 https://www.mongodb.com/ { 4: ROS "_id": ObjectId("58a2d1a2c36a9409e0b7fcb6"), "id": 1, "position": 1, "num_of_customers": 3, "has_seats": [ { "id": 1, "position": 1, "has_customer": { 5: IS Table.msg IS 5.1 ROS Message Message.msg 4 Message int8 string Seat Customer IS mongodb Message JSON 5 5.2 IS 6-82 -

6 モジュール連携 PRINTEPS のような多様な知能を持つプラットフ ォーム上に Information State を導入し 音声対話シス テムが ROS の通信を使って他のモジュールとやり取り することで新たに実現可能となる例を以下に示す 6.1 図 6: IS 上でのモジュール間連携 図 7: 知識モジュールとの IS 連携 らの各モジュールから得られた情報を用いて 知識処 理によってオススメのメニューを推論し 提案するこ とが可能になる 5.3 ROS 上でのデータ授受 IS を介した連携を行う際には データの受け渡しや 他モジュールへのタスクの依頼は 図 7 のようにして 行われる 実線矢印は ROS の Service 同期通信 返 り値あり 破線矢印は ROS の Topic 非同期通信 返 り値なし を示す (1) にて音声対話で得られた情報を IS に格納する その返り値として id データ識別子 を得る IS は データの履歴を保持しているため 同 じデータ名であっても複数のデータが存在する そこ で 特定のデータを表すためにデータ識別子が用意さ れている (2) にて id を送信することで データの在 り処を伝える (3) にて知識処理モジュールが id を用 いてデータを読み出す そして 知識推論を行い 結 果をデータに追加する (4) にて推論結果を含んだデー タを IS に格納し 返り値として id を取得 (5) にて知 識処理モジュールから音声対話モジュールへ id を送信 し (6) にて音声対話モジュールが id を用いてデータ を取得する このようにして (1) (6) の流れで 知識 処理結果を受け取ることができる このように IS へのデータの書き込みを行った段階 で他モジュールに ID を知らせる手法を採ったのは 他 モジュールが IS を常時監視する負荷をなくすためで ある 知識処理モジュールとの連携 知識処理モジュールとの連携では IS に対しては 特定のメッセージの特定のフィールドに 他モジュー ルにて得られた情報を書き込むと 知識処理モジュー ルでは そのデータを元に必要とされる情報を知識推 論エンジンや RDF ストアから引き出すが その際に 必要となるクエリ文は知識処理モジュールによって自 動生成されている このことから 知識処理モジュー ル外のモジュールは IS を介することで 分野外の者 には馴染みのないクエリ文を考慮することなく 高度 な知識処理 推論処理を利用することができる PRINTEPS プロジェクトにて進められている喫茶店 実践においては 音声対話モジュールとの連携として メニューのカロリー提示 アレルギーのある方への対 応メニュー推薦などが行われている 画像処理モジュー ルとの連携は 来店検知 来客人数推定などで行われ ている 6.2 画像処理モジュールとの連携 画像処理モジュールからは 画像処理モジュールに よって画像が処理された結果が逐次 IS に書き込まれる 物理信号情報である画像が 記号情報 年齢や性別な どといったもの に変換されて共有されるため 記号 処理である知識処理や対話処理などとの相性がよくな る また 外部モジュールからは直接画像処理やそれ に必要なライブラリなどを利用せずに 高度な画像処 理を利用することができる 喫茶店実践において 6.1 節で紹介した来客人数推定 については 画像処理モジュール単体ではフレームご とに推定結果が揺れており 誤りのフレームも複数含 まれているが 知識処理モジュールとの連携 ストリー ム推論の利用 により 安定した人数検出が可能にな る また 席についたユーザの行動推定 飲食中 発 話中の推定 と音声対話モジュールを連携させること で より頑健に発話者を推定することが可能になる 6.3 ロボット動作 環境情報処理との連携 ロボット動作モジュールは 他のモジュールが IS に 書き込んだ情報を元に ロボットの制御を行う 喫茶店 83

IS 6.4 IS 6.5 6 6.1 IS IS 7 ROS 5 Information State ROS Information State (JST) (CREST) PRINTEPS [Chodorow 10] Chodorow, K. and Dirolf, M.: MongoDB: The Definitive Guide, O Reilly Media, Inc., 1st edition (2010) [Lee 13] Lee, A., Oura, K., and Tokuda, K.: MMDAgent - A fully open-source toolkit for voice interaction systems., in ICASSP, pp. 8382 8385, IEEE (2013) [Lison 16] Lison, P. and Kennington, C.: OpenDial: A Toolkit for Developing Spoken Dialogue Systems with Probabilistic Rules, in Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Demonstrations), pp. 67 72, Berlin, Germany (2016), Association for Computational Linguistics [Quigley 09] Quigley, M., Conley, K., Gerkey, B. P., Faust, J., Foote, T., Leibs, J., Wheeler, R., and Ng, A. Y.: ROS: an open-source Robot Operating System, in ICRA Workshop on Open Source Software, pp. 1 6 (2009) [Sugiura 15] Sugiura, K. and Zettsu, K.: Rospeex: A cloud robotics platform for human-robot spoken dialogues, 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 6155 6160 (2015) [ 15],,,,,, PRINTEPS, 29, 1I4-2 (2015) [ 16],, ROS PRINTEPS, 30, 4C4-1 (2016) - 84 -