ISMopen2014-langmusique.pptx

Similar documents

検討検討の進め方検討状況簡易収支の世帯からサンプリング世帯名作成事務の廃止 4 5 必要な世帯数の確保が可能か簡易収支を実施している民間事業者との連絡等に伴う事務の複雑

Taro-条文.jtd

質問票 ( 様式 3) 質問番号 62-1 質問内容鑑定評価依頼先は千葉県などは入札制度にしているが神奈川県は入札なのか?または随契なのか?その理由は? 地価調査業務は単にそれぞれの地点の鑑定

トピックモデルを用いた歌声特徴量の分析

Box-Jenkinsの方法

Microsoft PowerPoint - 報告書(概要).ppt

私立大学等研究設備整備費等補助金（私立大学等

<4D F736F F F696E74202D2082C882E982D982C DD8ED88EE688F882CC82B582AD82DD C668DDA9770>

Taro-08国立大学法人宮崎大学授業

Ⅰ 調査の概要 1 目的義務教育の機会均等その水準の維持向上の観点から的な児童生徒の学力や学習状況を把握分析し教育施策の成果課題を検証しその改善を図るもに学校におけ

Microsoft PowerPoint - MVE pptx

<4D F736F F D D3188C091538AC7979D8B4B92F F292B98CF092CA81698A94816A2E646F63>

Contents 第 1 章国土調査法 19 条 5 項指定とは? 国土調査法 19 条 5 項指定とは? 1 指定の意義メリット 1 指定の対象は? 2 対象となる事業 2 国土調査法 19 条 5 項指定までの流れ 3

PowerPoint Presentation

<4D F736F F D F8D828D5A939982CC8EF68BC697BF96B38F9E89BB82CC8A6791E52E646F63>

(5) 給与制度の総合的見直しの実施状況について概要の給与制度の総合的見直しにおいては俸給表の水準の平均 2の引き下げ及び地域手当の支給割合の見直し等に取り組むとされている

KINGSOFT Office 2016 動作環境対応日本語版版共通利用上記動作以上以上空容量以上他接続環境推奨必要 2

する ( 評定の時期 ) 第条成績評定の時期は第 3 次評定者にあっては完成検査及び部分引渡しに伴う検査の時とし第次評定者及び第次評定者にあっては工事の完成の時とする ( 成績評定

〔自　衛　隊〕

<6D33335F976C8EAE CF6955C A2E786C73>

( 別途調査様式 1) 減損損失を認識するに至った経緯等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列固定

Microsoft Word - A04◆／P doc

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

Microsoft Word - 第3章.doc

全設健発第　　　　　号

(4) 給与制度の総合的見直しの実施状況について概要国の給与制度の総合的見直しにおいては俸給表の水準の平均 2の引下げ及び地域手当の支給割合の見直し等に取り組むとされている.

1 書誌作成機能 (NACSIS-CAT)の軽量化合理化電子情報資源への適切な対応のための資源 ( 人的資源,システム資源, 経費を含む) の確保のために, 書誌作成と書誌管理作業の軽量化を図

国税クレジットカード納付の創設国税のクレジットカード納付についてはマイナンバー制度の活用による年金保険料税に係る利便性向上に関するアクションプログラム( 報告書 ) においてその導入の方向性が示されている

1 予算の姿 ( 平成 25 当初予算 ) 長野県財政の状況 H 現在長野県の予算を歳入面から見ると自主財源の根幹である県税が全体の5 分の1 程度しかなく地方交付税や国庫支

2 出願資格審査前記 1の出願資格 (5) 又は(6) により出願を希望する者には, 出願に先立ち出願資格審査を行いますので, 次の書類を以下の期間に岡山大学大学院自然科学研究科等

Taro-事務処理要綱250820

平成１9年9月改定

為が行われるおそれがある場合に都道府県公安委員会がその指定暴力団等を特定抗争指定暴力団等として指定しその所属する指定暴力団員が警戒区域内において暴力団の事務所を新たに設

4 教科に関する調査結果の概況校種学年小学校 2 年生 3 年生 4 年生 5 年生 6 年生教科平均到達度目標値差達成率国語 77.8% 68.9% 8.9% 79.3% 算数 92.0% 76.7% 15.3% 94

第1章　財務諸表

Ｑ　IFRSの特徴について教えてください

<4D F736F F D E598BC68A8897CD82CC8DC490B68B7982D18E598BC68A8893AE82CC8A C98AD682B782E993C195CA915B C98AEE82C382AD936F985E96C68B9690C582CC93C197E1915B927582CC898492B75F8E96914F955D89BF8F915F2E646F6

いう )は警告をしたときは速やかにその内容及び日時を当該警告を求める旨の申出をした者に通知しなければならないこととされまた警告をしなかったときは速やかにその旨及び理由を当該警告を求める旨の申

Microsoft Word - 奨学金相談Ｑ＆A.rtf

Microsoft Word - 全国エリアマネジメントネットワーク規約.docx

3 圏域では県北沿岸で2の傾向を強く見てとることができます 4 近年は分配及び人口が減少している市町村が多くなっているため所得の増加要因を考える場合は人口減少による影響についても考慮する

平成25年度　独立行政法人日本学生支援機構の役職員の報酬・給与等について

Taro-契約条項（全部）

1. 決算の概要法人全体として 2,459 億円の当期総利益を計上し末をもって繰越欠損金を解消しています ( : 当期総利益 2,092 億円 ) 中期計画における収支改善項目に関して ( : 繰越

2. データを検索するなごやコレクションのデータを検索するための方法としてキーワード検索詳細検索の二通りの検索方法があります 2.1. キーワードから探すキーワードを入力するトップページの入力ボックスに検索

職員の初任給等の状況 () 職員の平均年齢平均給料月額及びの状況 ( 年 4 月日現在 ) 一般行政職平均年齢平均給料月額 ( ベース) 44. 歳 6,4, 歳,44 4,7 7,6 4. 歳 7,

Microsoft Word - 答申第１４３号.doc

注記事項 (1) 当四半期連結累計期間における重要な子会社の異動 : 無 (2) 四半期連結財務諸表の作成に特有の会計処理の適用 : 有 ( 注 ) 詳細は添付資料 4ページ 2.サマリー情報 (

者が在学した期間の年数を乗じて得た額から当該者が在学した期間に納付すべき授業料の総額を控除した額を徴収するものとする 3 在学生が長期履修学生として認められた場合の授業料の

技能労務職公務員民間参考区分平均年齢職員数平均給与月額平均給与月額平均給料月額 (A) ( 国ベース) 平均年齢平均給与月額対応する民間の類似職種東庄町 51.3 歳 18 77

< F2D A C5817A C495B6817A>

2 平均病床数の平均病床数では療法人に対しそれ以外の開設主体自治体社会保険関係団体その他公的の規模が 2.5 倍程度大きく療法人に比べ公的病院の方が規模の大きいことが

6-1 第 6 章ストックオプション会計設例 1 基本的処理 Check! 1. 費用の計上 ( 1 年度 ) 2. 費用の計上 ( 2 年度 )- 権利不確定による失効見積数の変動 - 3. 費用の計上 ( 3 年度 )-

法人等に対する課税際課税原則の帰属主義への見直しのポイント総合主義から帰属主義への移行法人及び非居住者 ( 法人等 )に対する課税原則について従来のいわゆる総合主義を改め OECD

目次 1 個人基本情報個人基本情報入力画面の分散 4 申告区分および申告種類の選択方法 5 繰越損失入力年別の繰越損失額入力に対応 6 作成手順作成手順の流れを提供 7 所得

単回帰モデル

積載せずかつ燃料冷却水及び潤滑油の全量を搭載し自動車製作者が定める工具及び付属品 (スペアタイヤを含む )を全て装備した状態をいうこの場合において燃料の全量を搭載するとは燃料

別紙第号高知県立学校授業料等徴収条例の一部を改正する条例議案高知県立学校授業料等徴収条例の一部を改正する条例を次のように定める平成 26 年 2 月日提出高知県知事尾

学校教育法等の一部を改正する法律の施行に伴う文部科学省関係省令の整備に関する省令等について（通知）

答申第585号

市の人口密度は 5,000 人を超え図 4 人口密度 ( 単位 : 人 /k m2) に次いで高くなっている 0 5,000 10,000 15,000 首都圏に立地する政令指定都市では都内に通勤通学する人口が多

(4) ラスパイレス指数の状況 ( 各年 4 月 1 日現在 ) ( 例 ) ( 例 ) 15 (H2) (H2) (H24) (H24) (H25.4.1) (H25.4.1) (H24) (H24)

<4D F736F F F696E74202D E338C8E323793FA89EF8CA997708E9197BF5F B93C782DD8EE682E890EA97705D>

Microsoft Word - ★ＨＰ版平成２７年度検査の結果

所得税と住民税の税率表所得税と住民税の税率は以下の通りです退職所得の場合もこの税率表を使います 1. 平成 19 年 1 月 1 日以降 ( 所法 891) 課税所得所得税率控除額 ~195

文化政策情報システムの運用等

<4D F736F F D E91E6318E6C94BC8AFA925A904D D838A815B8BA693AF8E9497BF2E646F63>

目次機能概要ン/ チャ引新規注文 - WAY 新規注文 - WAY OCO 新規注文 - 成行新規注文 - 指値逆指値新規注文 - IFD 新規注文 - OCO 新規注文 - IFDOCO 新規注文 - 決済注文 -

国家公務員の年金払い退職給付の創設について検討を進めるものとする平成 19 年法案をベースに一元化の具体的内容について検討する関係省庁間で調整の上平成 24 年通常国会への法案提

資料2－2　定時制課程・通信制課程高等学校の現状

<4D F736F F D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A B E A2E646F63>

対象者株式 (1,287,000 株 ) 及び当社が所有する対象者株式 (1,412,000 株 )を控除した株式数 (3,851,673 株 )になります ( 注 3) 単元未満株式も本公開買付けの対象としておりますなお

<8C9A90DD94AD90B696D88DDE939982CC8DC48E918CB989BB82C98AD682B782E98E9696B18EE688B CC FC90B3816A2E786477>

容積率制限の概要 1 容積率制限の目的地域で行われる各種の社会経済活動の総量を誘導することにより建築物と道路等の公共施設とのバランスを確保することを目的として行われており市街地環

わない (1) そう思う (2)のそれぞれ3 段階で回答をしてもらったその結果を次節で数値に換算している 4. 調査の結果と考察 4.1 学習上の困難点全体的な傾向表 1 漢字の学習困難点 (

<6D313588EF8FE991E58A778D9191E5834B C8EAE DC58F4992F18F6F816A F990B32E786C73>

Ⅰ 校外における研修の留意点 1 校外における研修のコマ数の考えア) 午前午後の講座は 0.5 日 (0.5 コマ) イ) 全日の講座は 1.0 日 (1.0 コマ) 2 校外における研修として選択できない講座研修

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

<4D F736F F D F4390B3208A948C E7189BB8CE F F8C668DDA97702E646F63>

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63>

Microsoft Word - No.10　西村.doc

<4D F736F F D20819C B78AFA95DB91538C7689E68DEC90AC289

認証対象接合金物

連結株主資本等変動計算書 ( 平成 27 年 4 月 1 日から平成 28 年 3 月 31 日まで ) 項目株主資本 ( 単位 : 百万円 ) 資本金資本剰余金利益剰余金自己株式株主資本合計当連結会

連結株主資本等変動計算書 (2015 年 6 月 1 日から2016 年 5 月 31 日まで) 株主資本 ( 単位 : 千円 ) 資本金資本剰余金利益剰余金自己株式株主資本合計当期首残高 2,049,318

PowerPoint プレゼンテーション

0605調査用紙（公民）

Taro-2220（修正）.jtd

御利用規約 Excel でつくる配光曲線, 直射水平面照度 Version 2.0 小冊子を御利用頂くにあたり以下の内容をよく御読み頂き御同意の上御利用頂く様宜しく御願い致します 1. 著作物

(Microsoft Word - \220\340\226\276\217\221.doc)

Transcription:

音楽と言語へのベイズ統計的アプローチ持橋大地統計数理研究所数理推論研究系准教授 daichi@ism.ac.jp 統計数理研究所オープンハウス 2014 2014-6-13 (Fri)

統計的自然言語処理とは言語の統計的な取り扱い (= 計算言語学 ) 1990 年代後半以降 Webによる電子テキストの増大によって加速的に進歩 2014 年 : 大きく進歩したがまだ解けていない基本問題もある

統計的自然言語処理とは (2) 彼女は花を買った 0.92 0.85 0.61 文書 2 文書 1 構文解析 0.37 1.0 文書モデル代表的な応用 : 構文解析形態素解析文書モデル意味極性分類照応解析言語進化モデル

音楽との共通性音楽は楽譜をもちそれ自身の構造を持っている言語と同じ音響処理だけからはわからない!

例 :Mozart, ヴァイオリン協奏曲音楽情報処理のためのPythonパッケージである Music21 (http://web.mit.edu/music21/) 付属のコーパスの一部

例 :Mozart, ヴァイオリン協奏曲 (2) 記号列に直してみる (mozart-notes.py) <tune> note:5/4/1 note:5/4/0.25 note:5/2/0.25 note:5/1/0.25 note:5/2/0.25 note:5/4/0.25 note:5/6/0.25 note:5/8/0.25 note:5/9/0.25 note:5/4/0.25 note:5/9/0.25 note:5/9/2 note:5/8/0.5 note:5/2/0.25 note:5/2/0.25 note:5/2/2 note:5/1/0.5 note:4/11/0.25 note:5/11/0.25 隠れ状態がある? 言語と同じ!

教師なし品詞解析 When she arrived at the hotel, he realized that the era.. CONJ N V P DT N N V CONJ DT N 言語には品詞がありわれわれは品詞を認識している名詞動詞形容詞冠詞接続詞どうやって品詞がわかるのか? 隠れMarkovモデル (Merialdo 1994, van Gael+ 2009)

隠れMarkovモデル z z t 1 z t+1 z t w 観測データ: 単語列 w = w 1 w 2 w 3 w T 潜在変数 : 品詞列 z = z 1 z 2 z 3 z T データ全体の確率 : T p(w, z) = p(w t z t ) p(z t z t 1 ) t=1 w t had a little lamb

隠れMarkovモデルの学習 Baum-Welchともいう EMアルゴリズム: Forward-Backward ( 動的計画法 ) しかし学習された品詞間の状態遷移行列うまく学習できていない! モデルが悪いのか? No!

隠れMarkovモデルのベイズ学習 EMアルゴリズムは最尤推定 ˆθ =argmaxp(w θ) 実際のデータでは多数の局所解 θ

隠れMarkovモデルのベイズ学習 (2) MCMCで解けばよい! (Johnson, Goldwater 2007) p(z t z t 1 ) Dir(γ) p(w z) Dir(η) このとき p(z t w t,z t 1,z t+1, others) p(w t z t ) p(z t+1 z t ) p(z t z t 1 ) z t 1 z t z t+1 w t p(z t z t 1,z t+1,w t, others) ( ) ( n(wt,z t )+η n(zt,z t 1 )+γ w n(w, z t)+η n(z t 1 )+Kγ ) ( ) n(zt+1,z t )+I(z t+1 =z t =z t 1 )+γ n(z t )+I(z t =z t 1 )+Kγ

隠れMarkovモデルのベイズ学習 (3) 結果 : 劇的に改善ベイズ推定 +MCMC 最尤推定 +EM

隠れMarkovモデルのベイズ学習 (3) 問題 : 隠れクラス数 (= 品詞数 ) Kは? infinite HMM (Beal 2002; Teh+ 2006)

infinite HMM HMMのパラメータは p(w z) とp(z t+1 z t ) z を生成する p(z t+1 z t ) が無限次元のGEM 分布 p(z t+1 z t ) GEM(γ) に従うとする. GEM 分布からのサンプル:

infinite HMM (2) このままだと学習に個の次元を調べないといけないが (1) CRP ( 中国料理店過程, Aldous 1985) (2) Slice Sampling (Neal 2003, van Gael+ 2008) を使うと有限次元で計算できる注意 : データ数 N 以上のクラス数は必要ない自然数 Nの分割問題 ( 確率分割 )

infinite HMM (3) 不思議の国のアリス (26689 語,1431 行 )を学習データにしてiHMMを学習 K 10 9 8 7 6 5 4 3 2 隠れ品詞数の学習 0 100 200 300 400 500 600 700 800 900 1000 Gibbs iteration Log Likelihood -120000-122000 -124000-126000 -128000-130000 -132000-134000 -136000 データの対数尤度の変化 0 100 200 300 400 500 600 700 800 9001000 Gibbs iteration

Infinite HMM (2) 状態遷移行列 1 she 432 to 387 i 324 it 265 you 218 alice 166 and 147 they 76 there 61 he 55 that 39 who37 what 27 i'll 26 2 the 1026 a 473 her 116 very 84 its 50 my 46 no 44 his 44 this 39 $ 39 an 37 your 36 as 31 that 27 3 was 277 had 126 said 113 $ 87 be 77 is 73 went 58 were 56 see 52 could 52 know 50 thought 44 herself 42 began 40 5 way 45 mouse 41 thing 39 queen 37 head 36 cat 35 hatter 34 duchess 34 well 31 time 31 tone 28 rabbit 28 door 28 march 26 教師なしで品詞に相当するものが学習できている!

Infinite Mozart? フレーズのカテゴリがわかる! ( 実験はまだ不完全 )

Infinite Mozart? (2) 潜在クラス数 K MCMC 400 iteration 程度でほぼ収束 Joint Log Likelihood

音符のn-gramモデル慎重論がなお根強く音符や単語には直接状態遷移があるのでは? n-gramモデル w t 3 w t 2 } {{ } (n 1) 語 } {{ } n w t 1 語 w t (n-1) 語を見た後次に来る語の条件付き確率 p(w t w t 1,,w t (n 1) ) を計算する

n-gramモデルの問題 p(w t w t 1,w t 2,,w t (n 1) ) 組み合わせが指数的に増大! 語彙の数 V=10,000のとき 4-gramでは原理的に 10000 3 =10 12 =1000000000000 個のパラメータ

nグラムモデルのベイズ学習 nグラムモデル古典的だが音声認識や機械翻訳では未だ重要基本的 ( 言葉のMarkovモデル) nグラムモデルの問題 : スムージング現在のGoogle カウント頻度そのままでなく何か値を足したりする必要!

Pitman-Yor 過程 (Pitman and Yor 1997) ディリクレ過程とは自然言語の1 次元の場合無限次元の多項分布を生成する分布のこと横軸 : 可能な単語の種類元となる( 連続 ) 分布 G 0 に少し似た無限次元の離散分布 Gを生成と表記 ( : 集中度パラメータ) この2パラメータ拡張がPitman-Yor 過程

階層 Pitman-Yor 過程 nグラム分布が階層的に(n-1)グラム分布からの Pitman-Yor 過程によって生成されたと仮定最初はUniform, だんだん急峻になる

階層 CRP 表現測度を直接扱う代わりにカウントで離散表現する一人の客が1 単語分のカウントに対応下の青い客は文脈 she will の後に sing が1 回現れたことを意味する ( 全部で2 回 )

HPYLMの学習 HPYLM (hierarchical Pitman-Yor language model) の学習 = 潜在的な代理客の最適配置 Gibbs sampling: 客を一人削除して再追加を繰り返す For each w = randperm(all counts in the corpus), 客 w と関連する代理客をモデルから削除客 w をモデルに追加 = 代理客を再サンプル : 白い代理客の seating arrangements

HPYLM=nグラムモデルの問題常に客を深さn-1に配置していいのか? other than, the united states of america など必要なnグラムのオーダーは本来異なるはず HPYLMではどうすればいい?

VPYLM (Variable-order HPYLM) 客を木の根から確率的にたどって追加ノード i に,そこで止まる確率がある ( : 通過確率 ) はランダムにベータ事前分布から生成ゆえに深さnで止まる確率は

VPYLM, Variable-order HPYLM (2) 通過確率 (1-q i )が大きい深いノードに到達できる通過確率 (1-q i )が小さい短いMarkov 依存性を持つ

VPYLMの学習学習データの各単語に, それを生んだ隠れたMarkovオーダーが存在 Gibbs (MCMC)でを推定 n t グラム予測確率深さn t に到達するprior 2つの項のトレードオフ ( 深いn t にペナルティ) 第二項の事前確率はどう計算する?

VPYLMの学習結果 NAB (WSJ) コーパスの各単語が生成されたMarkov オーダーの推定結果情報量の多い語の後は短く連語の後は長いなどの傾向が学習されている

VPYLMの予測従来と異なり nグラムオーダーnを事前に知らないので nに関して積分消去は先の計算でから計算できる Suffix tree 上の Stick-breaking process になっている説明省略 NIPS 2011にほぼ同じアイデアがこの話を引かずに掲載

VPYLMの性能 SRILM: SRI 言語モデルツールキット (Kneser-Ney) 少ないノード数で高い性能パープレキシティ= 平均予測確率の逆数 (smaller is better) -gram が可能!! ( 今や nは不要 )

VPYLMからの生成不思議の国のアリスの -gram 文字モデルからのランダムウォーク生成生成では気をつけないと元データがそのまま再生されてしまう

-gramによるメロディ生成 ( 白井 & 谷口 2011) 旋律のトピック適応等様々な確率的技法が使われているようです

-gramに基づくコード進行認識 (Yoshii+2011) C7 F7 C7のようなコード進行は特定のMarkov オーダーでは記述できないコード進行のパープレキシティ: モデル PPL Good-Turing 38.3 Kneser-Ney 18.5 HPYLM 18.0 VPYLM 15.8 VF-VPYLM 14.6

音楽と歌詞 (Facebookより[6/10], 公開記事)

音楽と歌詞統計モデルにできるか? もちろん! 有名なモデル: トピックモデル

LDA: トピックモデル文書 wを話題 (トピック)の混合で表現 w 1 θ 1 =(0.1 0.2 0.4 0.3) w 2 混合比 θ θ 2 =(0.8 00.2 0) をディリクレ事前分布から生成 θ 1 θ 2 θ 3

トピックモデル (2) 話題とは? 単語の生起確率分布 β k = { p(w k) } (w =1 V ) β 1 政治法案点国会議院 β 2 スポーツバスケット点フォーム競泳

LDAの文書生成モデル θ Dir(α) 1. トピック混合比を生成. θ 2. For n = 1 N, z n Mult(θ) a. トピックを選択 w n p(w z) b. 単語を生成. w n z n 政治トピック法案点国会議院

LDAの学習 : Gibbs Sampler 導出や実装が簡単で高性能 Gibbs Samplerとはマルコフ連鎖モンテカルロ法 (MCMC)の最も簡単な場合潜在変数を分布ではなく条件つき分布から実際にサンプリング = 単語の潜在トピックを次々とサンプリング EMと違い原理的に無限回繰り返せば真の分布からのサンプル 42

LDAのGibbs Sampler LDAの潜在変数 : ( 文書のトピック分布 )と ( 各単語のトピック) 実はだけでよいからを次々とサンプルして更新. 43

LDAのGibbs Sampler (2) (Griffiths+ 2004) データ全体で単語 wがトピック kに割り当てられた回数 (w i 除く) 文書 d 中でトピックkに割り当てられた単語数 (w i 除く) のような意味 44

Last.fm データセット Million Song Dataset http://labrosa.ee.columbia.edu/ millionsong/ 中の Last.fm データセットのうちタグの付けられた1,611 曲の歌詞 Bag of Words 形式頻度順で上位 5000 語を使用

Last.fm in LDA Topic 1: german 0.064031 ich 0.041963 und 0.029936 die 0.025735 du 0.021566 der 0.020731 ist 0.019416 in 0.018470 das 0.017061 es 0.016384 nicht 0.016217 mich 0.015953 na 0.015548 demain 0.015046 auf Topic 3: love 0.050848 go 0.050427 love 0.047225 let 0.044963 babi 0.036644 me 0.035958 no 0.032467 one 0.029634 the 0.024699 more 0.023832 my 0.022584 time 0.018943 in 0.018062 and 0.014692 again Topic 17: young 0.107093 danc 0.060974 the 0.022725 kill 0.018697 cherri 0.018126 night 0.016975 lyric 0.015383 pop 0.015153 jag 0.013968 to 0.013483 no 0.013464 i 0.011929 som 0.010176 more 0.009995 kan

Last.fm in LDA Topic 3: stopwords 0.048826 the 0.037000 to 0.032441 and 0.020244 in 0.019731 it 0.019236 a 0.018974 way 0.016048 they 0.015976 no 0.014010 up 0.011777 have 0.011509 with 0.011457 them 0.011078 good Topic 9: french 0.031964 de 0.026116 la 0.023961 et 0.020578 le 0.019688 je 0.017437 pas 0.016745 a 0.016607 les 0.016585 que 0.014540 un 0.013672 tu 0.013404 qui 0.012692 ce 0.012599 e Topic 10: general 0.184127 i 0.074498 me 0.069192 you 0.050677 to 0.032629 my 0.022816 have 0.021597 know 0.021543 be 0.018998 and 0.016740 would 0.016288 for 0.016179 love 0.015297 want 0.015199 that

しかし LDAのGibbsサンプラーの更新式 : 各単語は1つのクラスタにしか属さない本当? 文書 = 人単語 = 商品と考えてみる ( 協調フィルタリング) さまざまな属性 : 小説 / 本 / 若者向け/ 挿絵あり /ラテン語 / 単なるクラスタリングでは表現できない!

Restricted Boltzmann Machines Deep Learning の最も基本的なモデル出力層 v と0/1の潜在層 h が重み W で結ばれたニューラルネット Hinton (2002) 混合モデルではなく積モデル (Product of Experts)

Restricted Boltzmann Machines (2) LDAと異なり意味を分散表現できる国際経済 = 国際経済海外サッカー= 国際サッカー自然言語処理 = 数学言語学しかし

RBMの最適化の難しさ LDAの性能 Replicated Softmax (Salakhut- dinov 2009) のNIPSコーパスでの実験結果 Better RBMには学習率ミニバッチサイズモーメント CD iterations などの多数のメタパラメータほとんどの場合非常に悪い性能しか出ない

何が問題か? RBMは生成モデルがなく 0/1の潜在変数とシグモイド関数で強引に正則化している RBM, LDAとも語彙の情報が非常に重要 RBM: ニューラルネットの重み LDA: 単語のトピック分布単語に潜在座標を明示的に与えるモデル. 実は統計学では Latent space models (Hoff 2002) として知られている ( 社会ネットワーク解析 )

CSTM: Continuous space topic models ( 持橋 2013) 単語 wはd 次元の潜在座標をもつこの上にガウス過程を生成

Gaussian process とはガウス過程 : への回帰関数を生成する確率分布実際には無限次元のガウス分布 1 次元の場合

Gaussian processとは (2) 2 次元の場合

Gaussian processとは (2) 2 次元の場合

Gaussian processとは (3) 2 次元の場合

CSTM: 最初のモデル単語の平均的な確率 ( 最尤推定 ) をガウス過程でモジュレートは 8000 倍から0.0001 倍くらいの値

Empirical Evidence Brownコーパス Cranfield コーパスを最尤推定で計算してプロット確率の比はほぼGaussianで分布している!

Polya 分布による拡張言語にはバースト性がある Polya (DCM) 分布 Draw For n=1..n, Draw を文書ごとに下で生成 Draw Set Draw

CSTMとLDAの単語確率分布 CSTM LDA CSTMは全単語 Simplexを網羅 ( 和が1の制約がない)

学習ガウス過程から生成した関数 fは文書ごとに無限次元学習不可能 DILN (Paisley+ 2012)と同様に補助変数 uを導入単語座標の行列をとするのときはuを積分消去してこれは線形カーネルを使ったGPと等価なことを意味するとしてとの学習問題!

学習 (2) 通常のMH MCMCで単語と文書の潜在座標を学習 For j = 1.. J, for i = randperm(1.. D), Draw u ~ N(u,σ 2 ) & MH-accept(u ); Update Z For w = randperm(1.. W), Draw φ (w) ~ N(φ(w),σ 2 ) & MH-accept(u ); Update Z 1..Z N z ~ N(0,σ 2 ); α 0 = α 0 exp(z) If MH-accept(α 0 ) then α 0 =α 0 実際は uとφ(w)の更新をランダムに混合単語間に強い相関があるため勾配法では局所解

実験結果 ( 予測パープレキシティ) CSTM RSM SDM LDA NIPS 1383.66 1290.74 1638.94 1648.3 KOS 1632.35 1396.61 1936.25 1730.7 毎日新聞 466.83 622.69 582.37 507.39

CSTMの次元選択毎日新聞データでの性能と潜在次元数 PPL 700 600 500 400 300 200 100 0 2 3 5 10 15 20 30 40 50 文書の潜在次元が連続なため小さい値で高性能次元選択を行う簡単な方法はない (Beta FA?)

毎日新聞テキスト (2000年度) 出現に偏りの大きい語ほど原点から遠くに位置する

潜在的回帰モデル W η θ y(w) φ(w) テキストの共変量 φ(w)と内容単語 y(w)を直接リンクさせるのは難しい潜在層 θに意味を集約まずφ(w)からの線形回帰 +ノイズでθが生成され θからさらに内容単語たち y(w)が確率的に生成される

Latent Linear topic model (lltm) 内容語 y(w) 機械ソニー映像鮮やか 1 0 2 1 0 0 0 0 0 0 0 0 0 1 0 exp() W 特徴ベクトルf θ Wf η(w) 共変量の特徴からの回帰 +ノイズで観測された語 y(w)が生成される

Latent Linear topic model (2) f θ y W 確率で表すと p(y f) = p(y θ) p(θ f)dθ ( e η(w)t θ G 0 (w) Z w G 0 (w) は単語 wのデフォルト確率で最尤推定する η ) c(w) exp yの中に単語 wが現れた頻度 ( β2 (Wf θ)2 )

Latent Linear Topic Model (3) f θ y 学習はMCMC(θおよびη)+ベイズ線形回帰 (W) θ,ηは普通のランダムウォークMH Wはθを目的変数とした回帰モデルのガウス事後分布からサンプル p(y f) = p(y θ) p(θ f)dθ ( w W η e η(w)t θ G 0 (w) Z ) c(w) β も確率変数 exp ( β2 ) (Wf θ)2

Last.fmデータ Last.fmの各曲についているタグ(Rock,80s,Electro pop, )を入力の特徴として使用上位 5,000 個の特徴 5000 次元の離散データ(タグ) 10000 次元の離散データ( 歌詞 )への回帰問題 MCMC 100 iterations, K=2,10

Last.fm regression タグ特徴の潜在層への回帰係数をプロット図示のため K=2 次元に圧縮して学習

Last.fm regression (2) 歌詞の単語の潜在座標 φ(w) をプロット (K=2)

Last.fm 歌詞予測タグから潜在的回帰を通じて歌詞を予測普通より確率の高くなる語の上位語タグ rock タグ love タグ female vocalists 2.096279 donc 2.069825 rum 2.298850 illumin 2.053631 mere 2.025971 dancin 2.189100 independ 2.008083 mississippi 2.024850 famous 2.185653 crawl 1.964316 toni 2.007292 anybodi 2.150131 comprehend 1.943512 modern 1.971674 cancer 2.131693 hustl 1.881520 brooklyn 1.937310 whoa 2.108225 carv 1.843006 losin 1.913502 wretch 2.101845 spite 1.838629 rewind 1.904969 glimps 2.099663 fade 1.828743 juli 1.904207 spell 2.096050 depress 1.825501 hug 1.880279 lane 2.090748 wrath 1.816417 sleepless 1.855865 kneel 2.085099 gypsi 1.761052 goodby 1.846672 dizzi 2.081990 shallow

まとめベイズ統計の手法を用いることで言語と同様に記号を用いる楽曲データが解析できる複雑な階層モデル音響信号だけからは分からない知識音響と言語をつなぐ手法が必要潜在的回帰モデル回帰モデルの目的変数自体が未知の潜在変数パラメータのベイズ事後分布からのサンプリング歌詞のより緻密なモデル化が課題

今後の研究課題歌詞を自動生成する統計モデル n-gram ( -gram)だけでなく文法に基づいた生成楽譜情報からの回帰 ( 離散時系列への回帰問題!) 音響信号の教師なし学習との接続

終わりご清聴ありがとうございました