トピックモデルを用いた歌声特徴量の分析

Similar documents
トピックモデルを用いた歌声特徴量の分析

歌声情報処理: 歌声を対象とした音楽情報処理

SAP11_03

OngaCRESTシンポジウム2014: 音楽情報処理研究が切り拓く未来を探る

PowerPoint プレゼンテーション

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌


Microsoft PowerPoint - H17-5時限(パターン認識).ppt

目次 ガウス過程 (Gaussian Process; GP) 序論 GPによる回帰 GPによる識別 GP 状態空間モデル 概括 GP 状態空間モデルによる音楽ムードの推定

Microsoft PowerPoint - pr_12_template-bs.pptx

画像類似度測定の初歩的な手法の検証

PowerPoint プレゼンテーション

パターン認識を用いた 特定のベーシストの特徴の分析 日本大学 文理学部 情報科学科 松浦 佳輝1

EBNと疫学

Missing Data NMF

スライド 1

PowerPoint プレゼンテーション

τ-→K-π-π+ν τ崩壊における CP対称性の破れの探索

Probit , Mixed logit

Presentation Title

Microsoft Word - lec_student-chp3_1-representative

研修コーナー

tnbp59-21_Web:P2/ky132379509610002944

パーキンソン病治療ガイドライン2002

日本内科学会雑誌第97巻第7号

画像処理工学

日本内科学会雑誌第98巻第4号

_0212_68<5A66><4EBA><79D1>_<6821><4E86><FF08><30C8><30F3><30DC><306A><3057><FF09>.pdf

音楽音響信号の音源分離と能動的音楽鑑賞への応用 Sound source separation for music audio signals and its application to active music listening 援にとどまらず 一種の創作支援と見ることもできる 例えば ドラム

PowerPoint プレゼンテーション

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株

遅延デジタルフィルタの分散型積和演算回路を用いたFPGA実装の検討

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

Microsoft PowerPoint 新道路研究会_公開用.pptx

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

PowerPoint Presentation

画面表示とタッチキーについて 画面表示とタッチキーについて 再生する (P.205) からの操作説明では 主にCDの画面を使って説明しています ソースによって表示内容が異なる画面もありますが 特に記載のない限り 操作方法は同じです CDの画面は オーディオ画面を例に説明しております ナビ画面での操作

memo

ベイズ統計入門

Microsoft Word - 補論3.2

Microsoft PowerPoint - 第3回2.ppt

snkp-14-2/ky347084220200019175

Microsoft PowerPoint - DigitalMedia2_3b.pptx

主成分分析 -因子分析との比較-

main.dvi

Presentation Title Arial 28pt Bold Agilent Blue

Kullback-Leibler 情報量を用いた亜種マルウェアの同定 電気通信大学 中村燎太 松宮遼 高橋一志 大山恵弘 1

Microsoft PowerPoint - H21生物計算化学2.ppt

情報処理学会研究報告 図 1 LYRICS RADAR の歌詞検索用インタフェースの表示例 実際にはポピュラー音楽 (J-POP) を用いて実装しているが 本図では歌詞の例示のために RWC 研究用音楽デー タベースの楽曲 (RWC-MDB-P-2001 No.30) を用いた る動作 というトピッ

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

自己紹介 : 村脇有吾 京都大学大学院情報学研究科知能情報学専攻助教工学部電気電子工学科兼担 専門 : 計算言語学と自然言語処理 表の仕事は普通のテキスト処理 単語分割 ゼロ照応解析 常識的知識の獲得ほか 今日お話も裏の仕事 言語の研究ですが テキストは直接扱いません 2

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社



株式会社日清製粉グループ本社 第158期中間事業報告書

AI AI Artificial Intelligence AI Strategy& Foresight AI AI AI AI 1 AI AI AI AI AI AI AI AI AI AI AI AI AI 2 AI 1 AI AI 3 AI 3 20 AI AI AI AI AI

Microsoft PowerPoint - aep_1.ppt [互換モード]

2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹

Microsoft PowerPoint - CSA_B3_EX2.pptx

国際会館ICC冊子2013.indd

13章 回帰分析

青焼 1章[15-52].indd

Microsoft PowerPoint - e-stat(OLS).pptx

Mr.Children 楽曲の千変万化 - 桜井和寿が作詞した楽曲のテキストマイニング分析 - 日本大学生産工学部マネジメント工学科 第 3 学年平野未来

JSP58-program

Transcription:

1 トピックモデルを用いた 歌声特徴量の分析 中野倫靖, 吉井和佳, 後藤真孝 ( 産業技術総合研究所 ) 2013 年 9 月 1 日情報処理学会音楽情報科学研究会第 100 回記念シンポジウム

研究の背景

処理歌の特性を定量的に説明 ( モデル化 ) したい 歌手毎の歌い方の違いや類似性とは何か 例 ) 違う楽曲でも同じ歌手なら歌い方が似ている同じ楽曲でも違う歌手だと歌い方が違う 歌声 歌い方モデル ( 定量的な説明 ) 歌い方の違い [ 鈴木他, 2011] [ 齋藤, 榊原, 2011] 他人の歌い方を真似ると音高 (F0) 変化 音量変化 着目 着目 声質 ( スペクトル包絡 ) 音韻継続長などが変化

MFCC の 1 次の係数の平均特徴抽出まとめる楽曲を定量的に説明する一つの方法 平均的な特徴ベクトルを抽出 周波数重心の平均や分散 MFCC の平均 等 例 ) 楽曲ジャンル識別やムード推定 周波数重心の平均 楽曲 時間 時間 特徴ベクトル 次元 問題点 周波数重心 MFCC の 1 次の係数 時系列特徴のまとめ方は十分か? 例 ) 平均? 分散? 特徴量 ( 次元 ) 間の関係が使われない有益な可能性 4

歌声をモデル化する一つの方法 歌声毎に特徴ベクトルから GMM を学習 周波数重心や MFCC 等の特徴ベクトルをモデル化 問題点 例 ) 歌手名同定 歌声 ( 伴奏付 ) 時間 得られた結果の意味が分かりにくい 他の歌声を考慮していない まとめる歌声特徴抽出次元 周波数重心 時間 混合ガウス分布 (GMM) MFCC の 1 次の係数

提案 : トピックモデルで歌声を説明する 複数の歌声から潜在意味 ( トピック ) を学習する 典型的な歌声 各歌声に内在する隠れた構造を抽出できる トピック分布 ( 複数トピックにおける割合 ) から歌声間の類似度も算出できる 複数の歌声の音響特徴量からそれらの潜在的な意味を解析する研究はなかった 潜在的ディリクレ配分法を利用 Latent Dirichlet Allocation (LDA)

LDA 概要 : トピックモデル = マルチトピック グループデータ に対する混合モデル 文書の場合 各文書はトピック分布に従って生成 単語系列からトピック分布 単語分布 潜在変数系列を推定 各単語はあるトピックの単語分布に従って生成 文書 トピック分布 1 2 3 1 2 3 1 2 3 トピックトピック 1 トピック 2 トピック 3 単語分布 ABCDEFG 語彙 ABCDEFG 語彙 ABCDEFG 語彙 各トピックにおける単語の出現しやすさ 各トピックの出現しやすさ 潜在変数? 1? 2? 2? 1? 3 ( トピック ) 観測データ ( 単語 ) A B C D E

歌声トピックモデル (LDA) 文書 歌声特徴量の時系列 ( 楽曲 フレーズ ) 単語 各時刻の特徴ベクトル ベクトル量子化 (VQ) して適切な語彙数にまとめる 特徴ベクトルの系列 ( 歌声 ) トピック分布 1 2 3 1 2 3 1 2 3 トピックトピック 1 トピック 2 トピック 3 特徴ベクトルの分布 各トピックにおける特徴ベクトルの出現しやすさ ABCDEFG 語彙 ABCDEFG 語彙 ABCDEFG 語彙 各トピックの出現しやすさ 潜在変数? 1? 2? 2? 1? 3 ( トピック ) 観測 データ ( 特徴ベクトル ) A B C D E

歌声トピックモデル (LDA) 文書 歌声特徴量の時系列 ( 楽曲 フレーズ ) 単語 各時刻の特徴ベクトル ベクトル量子化 (VQ) して適切な語彙数にまとめる 特徴ベクトルの系列 ( 歌声 ) トピック分布 1 2 3 1 2 3 1 2 3 トピックトピック 1 トピック 2 トピック 3 特徴ベクトルの分布 各トピックにおける特徴ベクトルの出現しやすさ ABCDEFG 語彙 ABCDEFG 語彙 ABCDEFG 語彙 各トピックの出現しやすさ 潜在変数? 1? 2? 2? 1? 3 ( トピック ) 観測 データ ( 特徴ベクトル ) A B C D E 歌声の特性 歌声間類似度

歌声トピックモデル (LDA) 文書 歌声特徴量の時系列 ( 楽曲 フレーズ ) 単語 各時刻の特徴ベクトル ベクトル量子化 (VQ) して適切な語彙数にまとめる 特徴ベクトルの系列 ( 歌声 ) トピック分布 1 2 3 1 2 3 1 2 3 トピックトピック 1 トピック 2 トピック 3 特徴ベクトルの分布 各トピックにおける特徴ベクトルの出現しやすさ ABCDEFG 語彙 ABCDEFG 語彙 ABCDEFG 語彙 各トピックの出現しやすさ 潜在変数? 1? 2? 2? 1? 3 ( トピック ) 観測 データ ( 特徴ベクトル ) A B C D E 歌声の特性 歌声間類似度

トピック分布の意味を可視化する トピック分布はトピック数 K 歌声数 D の行列 トピック ID(K 個 ) 歌声の特性 トピックの特性 歌声 ID(D 個 ) トピックを代表するような歌声 比率の強さに応じて歌手名を一覧表示する

歌手クラウドによるトピックの意味の可視化 比率の強さに応じた歌手名の一覧表示 タグクラウド表記を採用 楽曲毎にアーティスト名を表示 トピック ID(K 個 ) 歌声 ID(D 個 )

歌の特性を定量的に説明 ( モデル化 ) したい トピックモデルの導入による解決 問題 1: 時系列特徴をどうまとめるか 複数の歌声を用いて自動的に決定する 問題 2: 特徴量トピック分布の意味が分かりにくい 歌手名を活用して可視化する

拡張 音楽情報検索の 可能性を拡げる

検索対象を拡張する音楽情報検索 従来の音楽情報検索 既にあるもの から近いものを検索 検索対象を変形して探索空間を拡張する 音高シフト : ボーカル声質の変形 ( 周波数軸の伸縮 ) 性別を超えた歌声情報検索 よく知られた事例 一青窈 ( もらい泣き ) を 3 半音下げると平井堅に似ている を自動的に推定する 敬称略 一青窈 ( もらい泣き ) 音高シフト :-3 半音 テンポシフト : 時間変化に影響 ( 時間軸の伸縮 )

実験

(B さん ) 別の実験の目的 トピック分布 ( トピックの混合比 ) が 歌声の類似性評価に活用できるか調査 歌声 (A さん ) 歌声 (Aさん) 歌声 トピック分布 曲こちらが類似していると判断できるか? 1 2 3 1 2 3 1 2 3

実験条件 ( 対象楽曲 ) 歌声を含む音楽音響信号 サンプリング周波数 16kHz, 1ch 男女 6 人ずつ それぞれ3 曲 オリコンチャート上位 20 曲から選曲 2000 年 ~2008 年 ボーカルが一人である楽曲 36 曲 :12 人 3 曲 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳

実験条件 (LDA: モデル化 ) 特徴ベクトル F0, LPMCC( 線形予測メルケプストラム係数 ) F0:PreFEst( 混合音中で最も優勢な音高推定 ) ボーカルらしさが高いフレームのみを利用 特徴ベクトルの量子化 k-means 法 : クラスタ数 100 LDA の学習 トピック数 100 事前分布 ( ディリクレ分布のハイパーパラメータ ) α( トピック混合比 ): 全て1 β( クラスタのユニグラム確率 ): 全て 0.1 とし 経験ベイズ法で最適化

実験結果 : 楽曲毎のトピック分布間距離 対称カルバック ライブラ距離 (KL2) F M 音高シフト テンポシフトなし (12 人 3 曲 ) 6 4 3 2 1 6 4 3 2 1 1 2 3 4 6 M 1 2 3 4 6 F 0.24 0.22 0.2 0.18 0.16 0.14 0.12 0.1 (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 上位 3 曲を赤で塗りつぶした

実験

実験条件 : 性別を超えた類似歌声検索 歌声を含む音楽音響信号 サンプリング周波数 16kHz, 1ch 男女 6 人ずつ それぞれ3 曲 オリコンチャート上位 20 曲から選曲 2000 年 ~2008 年 ボーカルが一人である楽曲 1764 曲 :12 人 3 曲 7 7 音高シフト :7バージョン -3 半音 ~3 半音 (1 半音毎 ) テンポシフト :7バージョン 0.7~1.3 倍速 (0.1 倍速毎 ) 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳

実験結果 : 性別を超えた類似歌声検索 敬称略 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 1 2 3 4 6 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 M F

実験結果 : 性別を超えた類似歌声検索 敬称略 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 1 2 3 4 6 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 M F

実験結果 : 性別を超えた類似歌声検索 敬称略 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 1 2 3 4 6 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 M F

実験結果 : 性別を超えた類似歌声検索 敬称略 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 1 2 3 4 6 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 M F

実験結果 : 性別を超えた類似歌声検索 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 M 1 2 3 4 6 F 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 敬称略 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 この 12 人の間では最も類似 一青窈 ( もらい泣き ) 平井堅 ( 思いがかさなるその前に ) 音高シフト +3, テンポシフト 1.1 平井堅 ( 瞳をとじて ) 一青窈 ( ただいま ) 音高シフト -3, テンポシフト 1.2

実験結果 : 性別を超えた類似歌声検索 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 M 1 2 3 4 6 F 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 敬称略 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 この 12 人の間では最も類似 一青窈 ( もらい泣き ) 平井堅 ( 思いがかさなるその前に ) 音高シフト +3, テンポシフト 1.1 平井堅 ( 瞳をとじて ) 一青窈 ( ただいま ) 音高シフト -3, テンポシフト 1.2

実験結果 : 性別を超えた類似歌声検索 F M 6 4 3 2 1 6 4 3 2 1 自分以外で最も似ているとされた歌手の数 ( 赤茶色いほど多い ) 1 2 3 4 6 M 1 2 3 4 6 F 4 40 3 30 2 20 1 10 0 男性アーティスト (6 人 3 曲ずつ ) (M1) ASIAN KUNG-FU GENERATION (M2) BUMP OF CHICKEN (M3) 福山雅治 (M4) GLAY (M) 氷川きよし (M6) 平井堅 敬称略 女性アーティスト (6 人 3 曲ずつ ) (F1) aiko (F2) JUDY AND MARY (F3) 一青窈 (F4) 東京事変 (F) 宇多田ヒカル (F6) 矢井田瞳 一青窈( もらい泣き ) を 3 半音下げると平井堅に似ている この12 人の間では最も類似を自動推定できた 一青窈 ( もらい泣き ) 平井堅 ( 思いがかさなるその前に ) 音高シフト +3, テンポシフト 1.1 平井堅 ( 瞳をとじて ) 一青窈 ( ただいま ) 音高シフト -3, テンポシフト 1.2

実験結果 : 歌手クラウドによるトピック可視化 0. 0.4 0.3 0.2 0.1 一青窈 ( もらい泣き ) 0 の比率が強い 10 20 30 40 0 60 70 80 90 100 トピック 平井堅一青窈宇多田ヒカル トピック 28 の歌手クラウド 楽曲毎にアーティスト名を表示 0. 0.4 0.3 0.2 0.1 平井堅 ( 思いがかさなるその前に ) 音高シフト +3, テンポシフト 1.1 0 10 20 30 40 0 60 70 80 90 100 トピック

実験結果 : 歌手クラウドによるトピック可視化 0. 0.4 0.3 0.2 0.1 一青窈 ( もらい泣き ) 比較的平均的な特性 0 10 20 30 40 0 60 70 80 90 100 トピック トピック 32 の歌手クラウド 楽曲毎にアーティスト名を表示 0. 0.4 0.3 0.2 0.1 平井堅 ( 思いがかさなるその前に ) 音高シフト +3, テンポシフト 1.1 0 10 20 30 40 0 60 70 80 90 100 トピック

実験結果 : 歌手クラウドによるトピック可視化 0. 0.4 0.3 0.2 0.1 0 一青窈 ( もらい泣き ) 平井堅には ない特性 一青窈 10 20 30 40 0 60 70 80 90 100 トピック JUDY AND MARY トピック 23 の歌手クラウド 楽曲毎にアーティスト名を表示 0. 0.4 0.3 0.2 0.1 平井堅 ( 思いがかさなるその前に ) 音高シフト +3, テンポシフト 1.1 0 10 20 30 40 0 60 70 80 90 100 トピック

本研究の位置付け : 歌声の特性分析 歌手の特性 性別 ( 男女等 ) 声種 ( ソプラノやアルト等 ) 歌い方の特性 声区 ( 裏声等 ) 音高 (F0) 軌跡のモデル化 楽曲の特性 楽曲ジャンルや歌詞 聴取印象 感情 印象評価語 本研究の範囲 複数の歌声から個々の歌声の特性をモデル化する

まとめ 歌声の音響特徴量をトピックモデルで分析 複数の歌声から分かる潜在的な特性を分析 歌声 ( 伴奏付 ) トピックを推定 1 2 3 1 2 3 1 2 3 性別の違いを超えた類似歌手検索の提案 一青窈を 3 半音下げると平井堅 を実証 歌手クラウドによるトピックの可視化を提案

追加実験 アーティスト数を増やして実験 120 曲 オリコン 2000 年 ~2008 年で上位 20 曲に入った楽曲 男性 :9アーティスト 女性 :61アーティスト 音高シフトのみ 類似事例 access(edge) B z(juice) 音高シフト +1 一青窈 ( もらい泣き ) 森山直太朗 ( さくら ) 音高シフト +2 矢井田瞳 (B'coz I love you) スピッツ ( ホタル ) 音高シフト +3 宇多田ヒカル (Wait&See~ リスク ~) 音高シフト +1 mihimarugt ( ツヨクツヨク )

追加実験 アーティスト数を増やして実験 120 曲 オリコン 2000 年 ~2008 年で上位 20 曲に入った楽曲 男性 :9アーティスト 女性 :61アーティスト 音高シフトのみ 類似事例 access(edge) B z(juice) 音高シフト +1 一青窈 ( もらい泣き ) 森山直太朗 ( さくら ) 音高シフト +2 矢井田瞳 (B'coz I love you) スピッツ ( ホタル ) 音高シフト +3 宇多田ヒカル (Wait&See~ リスク ~) 音高シフト +1 mihimarugt ( ツヨクツヨク )

まとめ 歌声の音響特徴量をトピックモデルで分析 複数の歌声から分かる潜在的な特性を分析 歌声 ( 伴奏付 ) トピックを推定 1 2 3 1 2 3 1 2 3 性別の違いを超えた類似歌手検索の提案 一青窈を 3 半音下げると平井堅 を実証 歌手クラウドによるトピックの可視化を提案