IPSJ SIG Technical Report Vol.2012-MUS-94 No.3 Vol.2012-SLP-90 No /2/ DTM 200 GUIN-Resonator: A system synthesizing voice with the styl

Similar documents
log F0 意識 しゃべり 葉の log F0 Fig. 1 1 An example of classification of substyles of rap. ' & 2. 4) m.o.v.e 5) motsu motsu (1) (2) (3) (4) (1) (2) mot

27 5) STRAIGHT ) STRAIGHT 8) 3 STRAIGHT ),6),2) 7) 7),9) 5) STRAIGHT 5),7) 2.. spline ) ms ) STRAIGHT (db) ERB N(Effective Rectangul

7) 8) 9),10) 11) 18) 11),16) 18) 19) 20) Vocaloid 6) Vocaloid 1 VocaListener1 2 VocaListener1 3 VocaListener VocaListener1 VocaListener1 Voca

IPSJ SIG Technical Report Pitman-Yor 1 1 Pitman-Yor n-gram A proposal of the melody generation method using hierarchical pitman-yor language model Aki

IPSJ SIG Technical Report Vol.2017-MUS-115 No /6/17 1,a) 1 1 WORLD F0 Vocaloid F0 ipad 1. Vocaloid [1] UTAU *1 Vocaloid Vocaloid F0 VocaListene

The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). The material has been made available on the website

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

1., 1 COOKPAD 2, Web.,,,,,,.,, [1]., 5.,, [2].,,.,.,, 5, [3].,,,.,, [4], 33,.,,.,,.. 2.,, 3.., 4., 5., ,. 1.,,., 2.,. 1,,

知能と情報,Vol.27, No.5, pp

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

1: A/B/C/D Fig. 1 Modeling Based on Difference in Agitation Method artisoc[7] A D 2017 Information Processing

IPSJ SIG Technical Report Vol.2016-MUS-111 No /5/21 1, 1 2,a) HMM A study on an implementation of semiautomatic composition of music which matc

1 1 CodeDrummer CodeMusician CodeDrummer Fig. 1 Overview of proposal system c

COM COM 4) 5) COM COM 3 4) 5) COM COM 6) 7) 10) COM Bonanza 6) Bonanza Hearts COM 7) 10) Hearts 3 2,000 4,000

Input image Initialize variables Loop for period of oscillation Update height map Make shade image Change property of image Output image Change time L

IPSJ SIG Technical Report Vol.2010-GN-74 No /1/ , 3 Disaster Training Supporting System Based on Electronic Triage HIROAKI KOJIMA, 1 KU

( ) fnirs ( ) An analysis of the brain activity during playing video games: comparing master with not master Shingo Hattahara, 1 Nobuto Fuji

IPSJ SIG Technical Report 1, Instrument Separation in Reverberant Environments Using Crystal Microphone Arrays Nobutaka ITO, 1, 2 Yu KITANO, 1

1 Web [2] Web [3] [4] [5], [6] [7] [8] S.W. [9] 3. MeetingShelf Web MeetingShelf MeetingShelf (1) (2) (3) (4) (5) Web MeetingShelf

DPA,, ShareLog 3) 4) 2.2 Strino Strino STRain-based user Interface with tacticle of elastic Natural ObjectsStrino 1 Strino ) PC Log-Log (2007 6)

e-learning e e e e e-learning 2 Web e-leaning e 4 GP 4 e-learning e-learning e-learning e LMS LMS Internet Navigware

Vol.53 No (Mar. 2012) 1, 1,a) 1, 2 1 1, , Musical Interaction System Based on Stage Metaphor Seiko Myojin 1, 1,a

IPSJ SIG Technical Report Vol.2012-HCI-149 No /7/20 1 1,2 1 (HMD: Head Mounted Display) HMD HMD,,,, An Information Presentation Method for Weara

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案

未婚者の恋愛行動分析 : なぜ適当な相手にめぐり会わないのか

J-D Lounge

AP AP AP AP AP AP AP( AP) AP AP( AP) AP AP Air Patrol[1] Air Patrol Cirond AP AP Air Patrol Senser Air Patrol Senser AP AP Air Patrol Senser AP

Vol.11-HCI-15 No. 11//1 Xangle 5 Xangle 7. 5 Ubi-WA Finger-Mount 9 Digitrack 11 1 Fig. 1 Pointing operations with our method Xangle Xa

IPSJ SIG Technical Report Vol.2019-MUS-123 No.23 Vol.2019-SLP-127 No /6/22 Bidirectional Gated Recurrent Units Singing Voice Synthesi

Vol. 42 No. SIG 8(TOD 10) July HTML 100 Development of Authoring and Delivery System for Synchronized Contents and Experiment on High Spe

IPSJ SIG Technical Report Vol.2016-CE-137 No /12/ e β /α α β β / α A judgment method of difficulty of task for a learner using simple

IPSJ SIG Technical Report An Evaluation Method for the Degree of Strain of an Action Scene Mao Kuroda, 1 Takeshi Takai 1 and Takashi Matsuyama 1

IPSJ SIG Technical Report Vol.2011-MUS-91 No /7/ , 3 1 Design and Implementation on a System for Learning Songs by Presenting Musical St

MA3-1 30th Fuzzy System Symposium (Kochi, September 1-3, 2014) Analysis of Comfort Given to Human by Using Sound Generation System Based on Netowork o

3_23.dvi

The 15th Game Programming Workshop 2010 Magic Bitboard Magic Bitboard Bitboard Magic Bitboard Bitboard Magic Bitboard Magic Bitboard Magic Bitbo

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

JSIK_KUDO4

DEIM Forum 2009 E

大学論集第42号本文.indb

’ÓŠ¹/‰´„û

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.

IPSJ SIG Technical Report Vol.2014-CE-126 No /10/11 1,a) Kinect Support System for Romaji Learning through Exercise Abstract: Educatio


THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS IEICE Technical Report IN ( ),

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

2reA-A08.dvi

カイケン96号d.indd

Wikipedia YahooQA MAD 4)5) MAD Web 6) 3. YAMAHA 7) 8) Vocaloid PV YouTube 1 minato minato ussy 3D MAD F EDis ussy

IPSJ SIG Technical Report Vol.2009-DPS-141 No.20 Vol.2009-GN-73 No.20 Vol.2009-EIP-46 No /11/27 1. MIERUKEN 1 2 MIERUKEN MIERUKEN MIERUKEN: Spe

Windows7 OS Focus Follows Click, FFC FFC focus follows mouse, FFM Windows Macintosh FFC n n n n ms n n 4.2 2

Kyushu Communication Studies 第2号

IPSJ SIG Technical Report Vol.2009-DPS-141 No.23 Vol.2009-GN-73 No.23 Vol.2009-EIP-46 No /11/27 t-room t-room 2 Development of

chisq.test corresp plot

3D UbiCode (Ubiquitous+Code) RFID ResBe (Remote entertainment space Behavior evaluation) 2 UbiCode Fig. 2 UbiCode 2. UbiCode 2. 1 UbiCode UbiCode 2. 2

VocaListener2(ぼかりす2): ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システム


1911 F0 5) SingBySpeaking F0 F0 F0 4 F0 2. F0 4) 5) rate extent 6) rate 5.6 [Hz] extent 87 [cent] F0 5.2 [%] F0 SingBySpeaking 7) F0 Fig. 1 1 F0 F0 co

音楽とOR(片寄)

〈評論〉中国映画探訪--高考・成功・精神創傷(入試・出世・心的外傷)

る.1990 年 代 にヴィジュアル 系 バンド,MALICE MIZER のヴォーカリストとして 活 躍 し ていたが,1999 年 に 脱 退 し, 現 在 はソロで 活 動 している 5). 彼 の 歌 い 方 は 非 常 に 特 徴 的 で, 歌 い 上 げるときの 語 尾 の 残 し 方

昭和恐慌期における長野県下農業・農村と産業組合の展開過程

08-特集04.indd

Vol. 23 No. 4 Oct Kitchen of the Future 1 Kitchen of the Future 1 1 Kitchen of the Future LCD [7], [8] (Kitchen of the Future ) WWW [7], [3

(a) 1 (b) 3. Gilbert Pernicka[2] Treibitz Schechner[3] Narasimhan [4] Kim [5] Nayar [6] [7][8][9] 2. X X X [10] [11] L L t L s L = L t + L s

2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC

3_39.dvi

IPSJ SIG Technical Report Vol.2012-IS-119 No /3/ Web A Multi-story e-picture Book with the Degree-of-interest Extraction Function

1 7.35% 74.0% linefeed point c 200 Information Processing Society of Japan

1

Core1 FabScalar VerilogHDL Cache Cache FabScalar 1 CoreConnect[2] Wishbone[3] AMBA[4] AMBA 1 AMBA ARM L2 AMBA2.0 AMBA2.0 FabScalar AHB APB AHB AMBA2.0

経済論集 44‐1(よこ)/2.李

2). 3) 4) 1.2 NICTNICT DCRA Dihedral Corner Reflector micro-arraysdcra DCRA DCRA DCRA 3D DCRA PC USB PC PC ON / OFF Velleman K8055 K8055 K8055

IPSJ SIG Technical Report PIN(Personal Identification Number) An Examination of Icon-based User Authentication Method for Mobile Terminals Fum

IPSJ SIG Technical Report Vol.2009-HCI-134 No /7/17 1. RDB Wiki Wiki RDB SQL Wiki Wiki RDB Wiki RDB Wiki A Wiki System Enhanced by Visibl

06_学術_技師の現状および将来需要_武藤様1c.indd

12) NP 2 MCI MCI 1 START Simple Triage And Rapid Treatment 3) START MCI c 2010 Information Processing Society of Japan

Iteration 0 Iteration 1 1 Iteration 2 Iteration 3 N N N! N 1 MOPT(Merge Optimization) 3) MOPT MOP

Web Web [4] Web Web [5] Web 2 Web 3 4 Web Web 2.1 Web Web Web Web Web 2.2 Web Web Web *1 Web * 2*3 Web 3. [6] [7] [8] 4. Web 4.1 Web Web *1 Ama

DEIM Forum 2009 B4-6, Str

Core Ethics Vol. -

ODA NGO NGO JICA JICA NGO JICA JBIC SCP

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

Sport and the Media: The Close Relationship between Sport and Broadcasting SUDO, Haruo1) Abstract This report tries to demonstrate the relationship be

IPSJ SIG Technical Report Vol.2014-MUS-104 No /8/27 F0 1,a) 1,b) 1,c) 2,d) (F0) F0 F0 Graphical User Interface (GUI) F0 1. [1] CD MIDI [2] [3,

IPSJ SIG Technical Report Vol.2013-GN-87 No /3/ Research of a surround-sound field adjustmen system based on loudspeakers arrangement Ak

sigmusdemo.dvi

Microsoft Word - toyoshima-deim2011.doc

揃 Lag [hour] Lag [day] 35

28 Horizontal angle correction using straight line detection in an equirectangular image

第62巻 第1号 平成24年4月/石こうを用いた木材ペレット

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ Sweets Assemblance Support Application Considering Actual Food Features Yuki Susa

カイケン93号.indd

橡最終原稿.PDF

2006 [3] Scratch Squeak PEN [4] PenFlowchart 2 3 PenFlowchart 4 PenFlowchart PEN xdncl PEN [5] PEN xdncl DNCL 1 1 [6] 1 PEN Fig. 1 The PEN

<332D985F95B62D8FAC93638BA795DB90E690B62E706466>

大学における原価計算教育の現状と課題

自然言語処理16_2_45

2. Twitter Twitter 2.1 Twitter Twitter( ) Twitter Twitter ( 1 ) RT ReTweet RT ReTweet RT ( 2 ) URL Twitter Twitter 140 URL URL URL 140 URL URL

,,,,., C Java,,.,,.,., ,,.,, i

Transcription:

1 1 2 1 DTM 200 GUIN-Resonator: A system synthesizing voice with the style of Amami folk songs Daisuke Suguru, 1 Takashi Baba, 1 Masanori Morise 2 and Haruhiro Katayose 1 The recent spread of Karaoke and DTM has been promoting music production more generally, and more than 2 hundreds musicians make their debuts in Japan. This leads emergence of new singing styles. Among them, Okinawastyle or Amami-style is typical one that has been popular recently. We have been developing an assistance system for designing Okinawa-style or Amami-style vocal melodies. In this paper, we report acoustic analysis of Amami-style, especially singing style called guin and propose a Amamistyle singing generator, called Guin-Resonator. 1 Graduate School of Science and Technology Kwansei Gakuin University 2 1. Vocaloid 1) CGM(consumergenerated media Vocaloid Vocaloid 2) 2) 3)4) Vocaloid Vocaloid Vocalistener 5) Vocalistener Vocaloid Vocalistner College of Information Science and Engineering Ritsumeikan University 1 c 2012 Information Processing Society of Japan

2002 J-Pop 6) J-Pop F0 2.2 10) F0 1 STRAIGHT 11)12) 1 2 2 2. 2.1 ( ) 7)8) 9) F0 1 ( ) F0( ) F0 F0 F0 2 c 2012 Information Processing Society of Japan

F0 7)13) F0 (2kHz 4kHz ) 9) 1 S T( ) 2 2 F0 ( 1 ) F0 ( 2 ) ( 3 ) F0 (F0 ) 3. ) 3 2 ( ) F0( ) S T F0 14) 3 3 c 2012 Information Processing Society of Japan

GUI ( ) ( ) MIDI (STM) (txt) 3.1 4 4 3.1.1 MIDI 3.1.2 F0 ( P f0 P sp ) / F0 0 P f0 200 0 P sp 100 % 4 STRAIGHT. 4 ( ) 5 6 4. 4 15) 4 2 3 4 c 2012 Information Processing Society of Japan

情報処理学会研究報告 図 5 システムによる音響信号へのグイン特徴の付加を行った基本周波数の遷移 (上図は入力音声 下図は出力音声) 図 6 システムによる音響信号へのグイン特徴の付加を行ったスペクトル (上図は入力音声 下図は出力音声) 4.1 グインの付加位置の算出 る学習アルゴリズムを用いることが有用と考えられる 本稿では 学習アルゴリズムを構成 奄美大島出身歌手 (以下 奄美歌唱者と呼ぶ) の歌唱では 楽曲中のある音の並び (メロ する前段階として 奄美歌唱者の楽曲から筆者が設定したグインが出現しやすい場所を算出 ディ) においては毎度もグインは使われているが 他のメロディでは全くグインが使われな する条件 制約をグインの挿入位置を算出のルールとして以下で説明する グインの挿入位置を算出するルール (挿入ルールと呼ぶ) の設定 いことがある このことからグインには楽曲中のあらゆる場所で使われるのではなく 歌唱 者によってグインを表現しやすい場所が存在するといえる これにより グインの挿入にお 奄美歌唱者の楽曲中でのグインの入りやすさは 音の並び (メロディ) が要因というこ いてはグインの音響信号上での特徴表現とならびに適切な位置に付加されることが重要で とを上で述べた 一方 音の並びは音楽を階層的なまとまりとしてフレーズとして扱わ あると考える しかし 歌手毎にある程度の規則性を見いだすことができるものの必ずしも れることがあり 作曲や演奏などで重要な楽譜上に明記されていない音楽の切れ目の役 一意ではないことを奄美歌唱者の楽曲から確認している 割をする 歌においても歌詞や呼吸位置で楽曲のフレーズに分割され 楽曲を把握する そこで本研究では 奄美歌唱者が楽曲中でグインが出現しやすい箇所の音の並びを調べ ためなどに利用されるケースは少なくない 特に呼吸位置は歌唱技法の付加やブレスコ 奄美歌唱者の楽曲でなくてもグインが出現しやすいであろう音符とグインが入ることのな ントロールなど 歌唱表現を豊かにするための大切な楽曲のフレーズ分割の境界とさ い音符を算出できるような機構を設ける グインレゾネータでは グインの挿入位置の候補 れている 本研究では楽曲をブレス位置でフレーズ分割し グインの入りやすいメロ を提示しユーザが選ぶ方式を採用することで ユーザに選択の自由度を与えつつ 音楽的に ディをそのフレーズ毎に各音符に対し前後の音符の音高情報 音価 フレーズ内での相 あり得ない位置でのグインの挿入を抑制できる グインの挿入位置算出に関しては 歌手毎 対的位置 楽曲全体での相対的位置という情報をシステムに入力される楽譜情報から用 にグイン挿入位置が異なるという可能性を考慮し グインが出現する場所を歌手毎に決定す いて算出する 5 c 2012 Information Processing Society of Japan

2 3 ( ) ( ) 1 1 2 4 5 16) MIDI( ) (a) MIDI ( ). (b) (c) ( (A)) if (A) else if ( ) (A) (A ) else 7 (A) (d) (b) (c) ( ). ( : ) () 7 0 4.2 2 4.2.1 (MIDI) 6 c 2012 Information Processing Society of Japan

MIDI 4.2.2 2 F0 ( ) F0 3 5 STRAIGHT 4.2.3 2 F0 F0 F0 F0 F0 ( ) F0 ( ) 1/4 F0 N i F0 F i F t ( F t = 4 3 N/4 ) F i N i=n/2 F0 1 F0 F0 F0 F0( ) (1) 4.2.4 F0 F0 8 F0 ( ) ( ) 7 c 2012 Information Processing Society of Japan

17) 8 F0 F0 ( ) 3 P f0 P sp 5. (1)F0 (2) (1)(2) GUI GUI (1)(2) (4 ) (GMM). GMM GMM GMM GMM GMM ( ) GMM 1). Vocaloid, 2003 <www.vocaloid.com/jp/index.html> 2010 2 2),. <http://www.crypton.co.jp/mp/pages/prod/vocaloid/> 2010 2 3) NTT 2005 4) UTAU <http://utau2008.web.fc2.com/index.html> 2010 2 5), VocaListener: 2009 6) Hajime Chitose Official Website. <http://www.office-augusta.com/hajime/> 2010 2 7) ( (2003)) 8) - ( ) -, (1998) 9) Uta-Net INTERVIEW <http://blog.uta-net.com/kizuki/> 2010 2 10). <http://www.atarikousuke.jp/> 2010 2 11) Kawahara, H., Masuda-Katsuse, I. and de Cheveigné, A.: Restructuring speech representations using a pitch-adaptive time-frequency smoothing and an instantaneous-frequencybased F0 extraction, Speech Communication, Vol.27 No.3-4 pp.187 207 (1999). 12) 2007 13) (2001) 14), (2006) 15) ZLS-7 (1988) 16), J - - 17) Kawahara, H. and Matsui, H.: Auditory morphing based on an elastic perceptual distance metric in an interference-free time-frequency representation, Proc. ICASSP 2003, Vol. I, Hong Kong, pp.256-259 (2003). 8 c 2012 Information Processing Society of Japan