IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

Similar documents
動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S

IPSJ SIG Technical Report Vol.2017-MUS-116 No /8/24 MachineDancing: 1,a) 1,b) 3 MachineDancing MachineDancing MachineDancing 1 MachineDan

[2][3][4][5] 4 ( 1 ) ( 2 ) ( 3 ) ( 4 ) 2. Shiratori [2] Shiratori [3] [4] GP [5] [6] [7] [8][9] Kinect Choi [10] 3. 1 c 2016 Information Processing So

The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). The material has been made available on the website

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

2 3, 4, [1] [2] [3]., [4], () [3], [5]. Mel Frequency Cepstral Coefficients (MFCC) [9] Logan [4] MFCC MFCC Flexer [10] Bogdanov2010 [3] [14],,,

理工ジャーナル 23‐1☆/1.外村

IPSJ SIG Technical Report 1,a) 1,b) 1,c) 1,d) 2,e) 2,f) 2,g) 1. [1] [2] 2 [3] Osaka Prefecture University 1 1, Gakuencho, Naka, Sakai,

DEIM Forum 2012 E Web Extracting Modification of Objec

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root

Microsoft Word - toyoshima-deim2011.doc

IPSJ SIG Technical Report Vol.2018-SE-200 No /12/ Proposal of test description support environment for request acquisition in web appli

IPSJ-MUS

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

2011 : M Schell Interest curve Schell Chan FPS Schell Interest curve Chan FPS Chan Chan Chan Chan

1 1 CodeDrummer CodeMusician CodeDrummer Fig. 1 Overview of proposal system c

i

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +

DEIM Forum 2017 E Netflix (Video on Demand) IP 4K [1] Video on D

メディアプレイヤー 音楽も動画もメディアプレイヤー 音楽 / 動画のダウンロード 音楽再生 音楽再生画面の見かた..

DPA,, ShareLog 3) 4) 2.2 Strino Strino STRain-based user Interface with tacticle of elastic Natural ObjectsStrino 1 Strino ) PC Log-Log (2007 6)

Web UX Web Web Web 1.2 Web GIF Kevin Burg Jamie Beck GIF GIF [2] Flixel Cinemagraph pro *1 Adobe Photoshop *2 GIMP *3 Web *1 Flixel Photos Inc. *2 *3

IPSJ SIG Technical Report Vol.2017-GN-100 No.40 Vol.2017-CDS-18 No.40 Vol.2017-DCC-15 No /1/21 1,a) 1,b) ,c) % 60% *1 1 Wakayama

IPSJ SIG Technical Report Vol.2012-MUS-94 No.3 Vol.2012-SLP-90 No /2/ DTM 200 GUIN-Resonator: A system synthesizing voice with the styl

ホットスポット 1 音リアクションイベント BIC GMM 2 3 BIC GMM HMM 10) SVM 11) 12) 13) Bayesian Information Criterion BIC 14) BIC M = M 1, M 2,,

Wikipedia YahooQA MAD 4)5) MAD Web 6) 3. YAMAHA 7) 8) Vocaloid PV YouTube 1 minato minato ussy 3D MAD F EDis ussy


IPSJ SIG Technical Report Vol.2016-CLE-19 No /5/20 1,a) 2,b) 3,c) Proposal of self-reflection using the video-sharing site NISHIOKU Kazukiyo 1,a

IPSJ SIG Technical Report Vol.2013-CE-119 No /3/15 C 1 1 Web C MILES(Model-based Interactive Learning Support) MILES 1. C C MILES(Model-based In

福岡大学人文論叢47-3

,, WIX. 3. Web Index 3. 1 WIX WIX XML URL, 1., keyword, URL target., WIX, header,, WIX. 1 entry keyword 1 target 1 keyword target., entry, 1 1. WIX [2

Windows7 OS Focus Follows Click, FFC FFC focus follows mouse, FFM Windows Macintosh FFC n n n n ms n n 4.2 2

IPSJ SIG Technical Report Vol.2014-DPS-158 No.27 Vol.2014-CSEC-64 No /3/6 1,a) 2,b) 3,c) 1,d) 3 Cappelli Bazen Cappelli Bazen Cappelli 1.,,.,.,

Gaze Head Eye (a) deg (b) 45 deg (c) 9 deg 1: - 1(b) - [5], [6] [7] Stahl [8], [9] Fang [1], [11] Itti [12] Itti [13] [7] Fang [1],

Honda 3) Fujii 4) 5) Agrawala 6) Osaragi 7) Grabler 8) Web Web c 2010 Information Processing Society of Japan

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

メディアプレイヤー メディアプレイヤーについて 音楽 / 動画のダウンロード 音楽 / 動画をダウンロードする WMA/WMV 形式の音楽 / 動

ActionScript Flash Player 8 ActionScript3.0 ActionScript Flash Video ActionScript.swf swf FlashPlayer AVM(Actionscript Virtual Machine) Windows

OngaCREST [10] A 3. Latent Dirichlet Allocation: LDA [11] Songle [12] Pitman-Yor (VPYLM) [13] [14,15] n n n 3.1 [16 18] PreFEst [19] F

27 YouTube YouTube UGC User Generated Content CDN Content Delivery Networks LRU Least Recently Used UGC YouTube CGM Consumer Generated Media CGM CGM U

WISS BGM BGM N 1 1 N N 2 N N N 1 N YouTube N BGM 1

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

1 Web [2] Web [3] [4] [5], [6] [7] [8] S.W. [9] 3. MeetingShelf Web MeetingShelf MeetingShelf (1) (2) (3) (4) (5) Web MeetingShelf

1(a) (b),(c) - [5], [6] Itti [12] [13] gaze eyeball head 2: [time] [7] Stahl [8], [9] Fang [1], [11] 3 -

2 3

IPSJ SIG Technical Report Vol.2009-MUS-80 No /5/22 1 CGM Proposal and Discussion of a Nage-sen System for Collaboration of Musical Tracks in Vi

IPSJ SIG Technical Report Vol.2016-GN-99 No.24 Vol.2016-SPT-18 No /5/13 1,a) 1,b) 2,c) 3,d) Patient Information Sharing System among Multi-prof

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

1

IPSJ SIG Technical Report Vol.2015-MUS-107 No /5/23 HARK-Binaural Raspberry Pi 2 1,a) ( ) HARK 2 HARK-Binaural A/D Raspberry Pi 2 1.

Web Social Networking Service Virtual Private Network 84

1 4 4 [3] SNS 5 SNS , ,000 [2] c 2013 Information Processing Society of Japan

IPSJ SIG Technical Report GPS LAN GPS LAN GPS LAN Location Identification by sphere image and hybrid sensing Takayuki Katahira, 1 Yoshio Iwai 1

1 2 3 マルチメディア, 分散, 協調とモバイル (DICOMO2013) シンポジウム 平成 25 年 7 月.,.,,.,. Surrogate Diner,., Surrogate Diner,, 3,, Surrogate Diner. An Interface Agent for Ps

main.dvi

IPSJ SIG Technical Report Vol.2012-DCC-1 No /5/18 1,a) 2,b) 3,c) 4,d) ( ) Discussion Mining with Music Theory Being Applied to Analysis of Meet

(a) 1 (b) 3. Gilbert Pernicka[2] Treibitz Schechner[3] Narasimhan [4] Kim [5] Nayar [6] [7][8][9] 2. X X X [10] [11] L L t L s L = L t + L s

IPSJ SIG Technical Report Vol.2012-EC-23 No /3/ Video Retrieval System of Handwriting Sketch using Relevance Feedback Akihiro Aita 1 and M

2007/8 Vol. J90 D No. 8 Stauffer [7] 2 2 I 1 I 2 2 (I 1(x),I 2(x)) 2 [13] I 2 = CI 1 (C >0) (I 1,I 2) (I 1,I 2) Field Monitoring Server

[6] DoN DoN DDoN(Donuts DoN) DoN 4(2) DoN DDoN 3.2 RDoN(Ring DoN) 4(1) DoN 4(3) DoN RDoN 2 DoN 2.2 DoN PCA DoN DoN 2 DoN PCA 0 DoN 3. DoN

IPSJ SIG Technical Report Vol.2015-MUS-106 No.18 Vol.2015-EC-35 No /3/3 1,a) ch [1] 1 Kansai University Graduate School of Inf

1 トラック 右上の ストーリーボード と タイムライン ボタンでトラックの表示方法を変更できます また トラックのクリップやその他エフェクト対して 操作アイコン での操作も可能です /// ヒント /// キャプチャした動画の不要部分をカットしたい場合は キャプチャした動画をクリップへ追加後に 操



バイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu

IPSJ SIG Technical Report Vol.2014-NL-216 No.6 Vol.2014-SLP-101 No /5/ MMDAgent 1. [1] Wikipedia[2] YouTube[3] [4] [5] [6] [7] 1 Graduate

IPSJ SIG Technical Report Vol.2015-CVIM-196 No /3/6 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swi

IPSJ SIG Technical Report Vol.2017-HCI-173 No.5 Vol.2017-EC-44 No /6/1 1,a) 1,2,b) 3,c) 1,d) 3D * 1* Graduate School of Engineerin

IPSJ SIG Technical Report Vol.2014-MBL-70 No.49 Vol.2014-UBI-41 No /3/15 2,a) 2,b) 2,c) 2,d),e) WiFi WiFi WiFi 1. SNS GPS Twitter Facebook Twit

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

2). 3) 4) 1.2 NICTNICT DCRA Dihedral Corner Reflector micro-arraysdcra DCRA DCRA DCRA 3D DCRA PC USB PC PC ON / OFF Velleman K8055 K8055 K8055

IPSJ SIG Technical Report Vol.2010-MPS-77 No /3/5 VR SIFT Virtual View Generation in Hallway of Cybercity Buildings from Video Sequen

IPSJ SIG Technical Report Vol.2013-CE-122 No.16 Vol.2013-CLE-11 No /12/14 Android 1,a) 1 1 GPS LAN 2 LAN Android,,, Android, HTML5 LAN 1. ICT(I


2.2 6).,.,.,. Yang, 7).,,.,,. 2.3 SIFT SIFT (Scale-Invariant Feature Transform) 8).,. SIFT,,. SIFT, Mean-Shift 9)., SIFT,., SIFT,. 3.,.,,,,,.,,,., 1,

Fig. 2 Signal plane divided into cell of DWT Fig. 1 Schematic diagram for the monitoring system

IPSJ SIG Technical Report Vol.2014-CG-155 No /6/28 1,a) 1,2,3 1 3,4 CG An Interpolation Method of Different Flow Fields using Polar Inter

Input image Initialize variables Loop for period of oscillation Update height map Make shade image Change property of image Output image Change time L

untitled

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

main.dvi

IPSJ SIG Technical Report Vol.2016-ICS-183 No /3/16 1,a) 2,b) 2,c) 1,d) e- Maeda Kaoru 1,a) Yoshida Naoto 2,b) Fujiwara Kunihiko 2,c) Yonezawa T


. S T T [1][15] suffix tree BGM MIDI beat gather[10] Any 1 BANANA suffix tree[9] Fig. 1 Suffix tree of BANANA [9]. Beats[11

Run-Based Trieから構成される 決定木の枝刈り法

2. [2], [3], [4] [5] [6], [7], [8] Agnihotri [6] Xu [7] [8] [9] Nakamura [10] TRECVID (TREC Video Retrieval Evaluation) [11] TRECVID TRECVID Singing s


A Japanese Word Dependency Corpus ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹

23

TF-IDF TDF-IDF TDF-IDF Extracting Impression of Sightseeing Spots from Blogs for Supporting Selection of Spots to Visit in Travel Sat

20mm 63.92% ConstantZoom U 5

FIT2014( 第 13 回情報科学技術フォーラム ) RD-002 Web SNS Yuanyuan Wang Gouki Yasui Yuji Hosokawa Yukiko Kawai Toyokazu Akiyama Kazutoshi Sumiya 1. Twitter 1 Facebo

2. Eades 1) Kamada-Kawai 7) Fruchterman 2) 6) ACE 8) HDE 9) Kruskal MDS 13) 11) Kruskal AGI Active Graph Interface 3) Kruskal 5) Kruskal 4) 3. Kruskal

Microsoft Word - deim2011_new-ichinose doc

IPSJ SIG Technical Report Pitman-Yor 1 1 Pitman-Yor n-gram A proposal of the melody generation method using hierarchical pitman-yor language model Aki

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS IEICE Technical Report IN ( ),

別冊施設案内_297*210.indd

Transcription:

BGM 1,4,a) 1 2 2 3,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 2015 1 100.. Web.. BGM.BGM [1]. BGM BGM 1 Waseda University, Shinjuku, Tokyo 169-8555, Japan 2 3 4 JST CREST a) ha-ru-ki@asagi.waseda.jp. BGM BGM BGM. BGM. BGM BGM. BGM. BGM BGM. BGM. BGM. BGM c 2015 Information Processing Society of Japan 1

B C D E A 1 BGM. BGM.. 2. BGM. Yoon BGM [2]. BGM [3] BGM [4]. BGM [5], [6], [7]. BGM BGM BGM. [8][9].. 3. BGM BGM. 1. BGM.. 1, A.. 1, B.. BGM 1, C. BGM BGM 1, D. BGM BGM 1, E. 4. BGM 4.1. 2. c 2015 Information Processing Society of Japan 2

2..j k 1. C jk = α M + M + M E + M + M σ (1) { 0 if k = j + 1 α = (2) 1 else N M = k m t m j t 2 (3) t=1 N M = k m t m j t 2 (4) t=1 N ( ) 2 M E = k E t E j t (5) t=1 M = k m m j 2 (6) M σ = k σ σ j 2 (7) m MFCC 12 m MFCC 12 E RMS1. RMS n x z x 8. E = 1 n zx n 2 (8) x=1 mσ MFCC. j m,m j 3.N / α. BGM. 3 44.1kHz 10ms.. 4.2 BGM 4.1. (1) (9). C jk = C jk + S k S U (9) S k k RMS. S U. RMS.. 4.3 BGM 4 A. BGM 1/2 4 B. c 2015 Information Processing Society of Japan 3

A 1 ρ 1% 5% 3 8 0.6448 0.1278 0.8424 0.4545 B 2 BGM No.72 2 No.87 7 No.29 3 No.91 7 No.38 3 No.21 8 No.1 4 No.53 9 No.8 4 No.55 9 C. RWC (RWC-MDB)[11] (RWC- MDB-G-2001) 1 10. AIST Annotation 4 for RWC Music Database (Beat structure) [12]. 4 C BGM. BGM. BGM. BGM. 5. BGM. BGM.. BGM. 5.1 20 5 4 1 [11] 10 BGM. BGM BGM BGM 30. 30 5.2 5.2.1 10 = 5 C 2 1%5%.. Spearman [10]. a,b ρ (10). ρ = 1 6 N 3 N N (a i b i ) 2 (10) i=1 N a i, b i a,b i. 10 ρ 0.7333ρ 0.5636 1%5%. 1 1 5%. 10 8 5%.. 5.2.2 BGM 2. 2... c 2015 Information Processing Society of Japan 4

情報処理学会研究報告 図 5 こだわりを反映させた BGM の生成操作例 あったため 小節の繋ぎ目で生じる違和感が大きくなりや すかった. これらの問題については 音楽構造やテンポを A 考慮したコスト関数を設計することで 対応可能となると 考えている. また 現段階では歌声の有無を考慮していな いため 小節の繋ぎ目で歌声が出現 消失することがある. ポップス及びロックの楽曲には歌声が存在するが 今回実 験に用いた BGM 中では歌声区間と非歌声区間を繋いだ小 節が現れなかったため上位に評価されたと考えられる. 以 B D 上より 本手法は同じメロディが多いインストゥルメンタ E ルの楽曲を利用した場合 特に有効であると考えられる. F 6. BGM 付加支援インタフェース 本手法では 映像と楽曲の始端と終端を一致させながら G C 図 6 インタフェース画面 映像と楽曲の指定箇所を同期させた BGM を生成する. し かし 生成された BGM は必ずしもユーザ好みの楽曲の盛 り上がりが反映された BGM になるとは限らない. そこで C D. を生成することができる 図 5 一度生成された BGM に対して ユーザが楽曲に盛り上が 7. まとめと今後の課題 りを指定することでユーザの好みを反映した BGM を生成 できるようにするインタフェースを提案する. これにより ユーザは直感的な操作で 指定箇所を同期させながら楽曲 の盛り上がりを反映させた BGM を生成し映像へ付加する ことができるようにする. 本稿では 映像と楽曲の始端と終端を一致させながら 映像と楽曲の指定箇所が同期した BGM を映像へ付加させ る手法を提案した. こだわりを反映させた BGM を映像へ 付加するには技術や手間暇が必要である. しかし 本システ ムを用いることで 楽曲の編集経験が無いユーザでも容易 6.1 楽曲編集機能 本システムのインタフェースの画面を図 6 に示す. 基本 A 的な機能として 再生中の映像の表示 図 6 楽曲や 映像の読み込み BGM を付加した動画の書き出し 図 6 B C 映像の再生や停止 図 6 入力楽曲の RMS の表 D 示 図 6 入力映像のサムネイル画像の表示 図 6 E F がある. BGM 生成された BGM の表示 図 6 にこだわりを反映させた BGM を制作し映像へ付加可能と なった. しかし 歌声がある楽曲や 楽曲中でテンポや音 色の変化が大きい楽曲に本手法を適用した場合 生成した BGM の繋ぎ目に違和感が生じてしまう問題があった. 今 後 テンポの変動や歌声がある楽曲に本手法を適用可能に するようなコスト関数の設計を行いたい. さらに 生成され る BGM の自然さの向上に取り組みたい. また 生成され を生成する手順として 初めにユーザは入力楽曲の利用し た BGM に対してユーザが盛り上がりの流れを指定するこ たい箇所とそれを付加する映像の箇所をドラッグとドロッ とで 楽曲の盛り上がりを反映させ BGM を再編集するシ プによるマウス操作によって指定する. ユーザの指定に基 づき指定箇所以外の区間が自動補間された BGM が生成さ A B. さらに 生成された BGM がユーザの れる 図 6 G で描 好みに合わない場合 ユーザは黄色の線 図 6 画されている BGM の盛り上がりをドラッグによって調節 することで ユーザの盛り上がりの好みを反映した BGM ステムを提案した. しかし 今回は簡易的に盛り上がりの算 出を行ったので 今後は盛り上がりの算出で用いる手法や 音響特徴量の検討を行いたい. インタフェースによる直感 的な操作でこだわりや盛り上がりを反映させた BGM を生 成し映像への付加を支援するシステムを目指した. 生成さ せる BGM の評価は今後の課題であり 既存ソフトによる 編集結果と比較評価することで本システムの性能を評価し c 2015 Information Processing Society of Japan 5

. [13] BGM. BGM. JST CRESTOngaCREST. RWC [11]. [1] Vol.48No.9pp.31 39 (1992). [2] Yoon, J. C., Lee, I. K. and Byun, S.:Automated music video generation using multi-level feature-based segmentation, Handbook of Multimedia for Digital Entertainment and Arts, pp.385 401 (2009). [3] BGM Vol.9No.2pp.295 296 (2010). [4] Jiashi, F., Bingbing, N. and Shuicheng, Y.:Autogeneration of professional background music for homemade videos, Proceedings of the 2nd International Conference on Internet Multimedia Computing and Service, pp.15 18 (2010). [5] Chu, W. T., Tsai, and S.Y.:Rhythm of motion extraction and rhythm-based cross-media alignment for dance videos, IEEE Transactions on Multimedia, pp.129 141 (2012) [6] Zhang, W., Xing, L. and Huang, Q.:A System for Automatic Generation of Music Sports-Video, IEEE International Conference on Multimedia and Expo, pp.1286 1289 (2005) [7] Wang, J., Chng, E., Xu, C., Lu, H. and Tian, Q.:Generation of personalized music sports video using multimodal cues, IEEE Transactions on Multimedia, pp.576 588 (2007) [8] Lu, L. and Zhang, H, J.:Automated extraction of music snippets, Proceedings of the 7th International Conference on Music Information Retrieval, Proceedings of the eleventh ACM international conference on Multimedia, pp.140 147 (2003). [9] DVol.90 No.8pp.2242 2252 (2007). [10] Kendall, M. and Gibbons, J. D.:Rank Correlation methods, 5th edition, p.260, Oxford University (2006). [11] RWC Vol.45 No.3pp.728 738 (2004). [12] Masataka Goto.:AIST Annotation for the RWC Music Database, Proceedings of the 7th International Conference on Music Information Retrieval, pp.359 360 (2006). [13] Vol.54No.4pp.1254 1262 (2013). c 2015 Information Processing Society of Japan 6