統計的自然言語処理におけるMCMC法

Similar documents
ノンパラメトリックベイズ法による教師なし形態素解析

ベイズ階層言語モデルによる 教師なし形態素解析

! ( ),

- ل ك ن الس اع ة الا ن ال ثان ي ة ا لا خ م س د ق اي ق. ا ر يد ا ن ا ص ل ع ن د ف ت ح الب اب ل ك ي لا ي ك ون ك ث ير م ن الا ز د ح ام ا ن ا ن س ت ط

JNTO.indd

CCB-ARA-L ISBN All information in this document is subject to change without notice. This document is provided for inform

enb2708a.pdf

املجلس العاملي للطاقة احتل املجلس العاملي للطاقة الصدارة يف مناقشة حوارات جدل الطاقة خالل ما يقارب قرن من الزمان حيث قام بتوجيه األفكار وقيادة األعامل


動詞の派生形 ( 完了形 ) 動詞の語根をダブらせたり 別の字を付け加えたりして作られる 派生形 という形があります これまでに見た ك ت ب や د ر س のような形を第 1 形として 派生形は 第 2~10 形まであり 以下のようなパターンをとります 第 2 形 ف ع ل 第 5 形 ت

第 1 章アラビア文字の書き方と発音 第 1 節アラビア文字 1-1 独立体と発音 1) 次の文字の名称を正確に発音しましょう ここに書かれているのはすべて それぞれ の文字の独立体です 1 ك 2 ف 3 و 4 س 5 ج 6 ث 7 ش 8 ن 9 ا 10 ت 11 خ 12 ي 13 ب

no 15 املحتويات نيبونيكا niponica هي مجلة يتم نرشها باللغة اليابانية وست لغات أخرى )العربية والصينية واإلنجليزية والفرنسية والروسية واألسبانية( وتهدف

roye jeld..cdr

صورة الغالف: يمر سكة حديد موكا عرب نفق من أزهار الكرز وزهور بذور اللفت أثناء فصل الربيع. )الصورة: ناكاي سييا( نافذة عىل اليابان 2017 no. 20 نيبونيكا n

4002 / 07 / 06 Arabjapan 本書は日本で学んだり 住んだり 旅行したりする際に必用となる様々な情報を掲載しています 全 558 ページで 次の 26 章から成っています この本の対象者は 学生 日本在住者 旅行者としております 第 1 章日本について 日本の気候 祭日 通貨等

CCB-ARA-L ISBN ISBN All information in this document is subject to change without notice. This document is provided for i

جملة دراسات العامل اإلسالمي 1-4&2 )مارس 2011( ص Kyoto Bulletin of Islamic Area Studies, 4-1&2 (March 2011), pp جتديد الفكر اإلسالمي يف ال

صور الغالف: يتم تقديم الفعاليات التقليدية والسمات األخرى للفصول األربعة بدء ا من شهر يناير إىل شهر ديسمرب. )الصور: رشكة أمانا إميجز )PIXTA خصائص متميز

niponica18A_H1_G.indd

CCB-ARA-L ISBN All information in this document is subject to change without notice. This document is provided for inform

職業

Certified Public Accountants & Business Consultants License No. 502 PO. Box Jeddah21444 Tel.: / Fax: Jeddah - Kingdom of

خصائص متميزة صغرية جد ا ولكنها رائعة املنمنمات حدث كبري يف اليابان 2 نيبونيكا

IEICE-Robotics ppt

冠詞

untitled

第 1 節形容詞による名詞の修飾 1-1 非限定 / 限定の一致 第 10 章形容詞による修飾とイダーファ表現 1) 与えられた意味になるよう 最初に挙げられた形容詞を適切な形にしてカッコに入れましょう 最初に挙げられた形容詞は 非限定 男性 単数 主格 の名詞を修飾するときの形になっています ك

SIAMAK- SOTOODEH 2/ rozaneh

مالحظات االستخدام معلومات السالمة ي نبه رمز عالمة ضوء البرق برأس السهم داخل المثلث المستخدم إلى وجود جهد كهربائي خطير غير معزول داخل محتويات المنتج وا

جعبه - لوبیای سیاه: به نشانه کوشش در سال نو حفظ سالمتی و دفع بالیا از خود. مغز بامبو: افزایش فرزندان و نسل. جعبه - مخلوط املت و نوعی ماهی که بشکل حلزو

مالحظات االستخدام معلومات السالمة يهدف شكل صاعقة البرق التي تنتهي بسهم داخل مثلث متساوي األضالع إلى تنبيه المستخدم إلى وجود فولتية خطيرة غير معزولة دا

مالحظات االستخدام معلومات السالمة ي نبه رمز عالمة ضوء البرق برأس السهم داخل المثلث المستخدم إلى وجود جهد كهربائي خطير غير معزول داخل محتويات المنتج وا

格変化 名詞や形容詞に 主格 属格 対格の区別があります 男子学生 ( 非限定 ) 男子学生 ( 限定 ) 女子学生 ( 非限定 ) 女子学生 ( 限定 ) 主格 u ا لط ال ب ة ط ال ب ة ا لط ال ب ط ال ب 属格 i ا لط ال ب ة ط ال ب ة ا

03wael_ver5.indd

<4D F736F F D20CEE1C7D5E52090D2C7D1D420D3E3EDE4C7D120C8C720DDE6E4CA31352E646F63>

جدول المحتويات النظام إعدادات اللمبة...38 النظام صورة بدء التشغيل إعداد...40 مالحق...43 استكشاف األخطاء وإصالحها مشكالت الصورة مشكال

IPSJ SIG Technical Report Vol.2013-HPC-139 No /5/ فق ت فق ت بسج Preliminary Study on Real-time Anomaly Detection from Multiple Video St

مالحظات االستخدام معلومات السالمة يهدف شكل صاعقة البرق التي تنتهي بسهم داخل مثلث متساوي األضالع إلى تنبيه المستخدم إلى وجود فولتية خطيرة غير معزولة دا

مالحظات االستخدام معلومات السالمة يهدف شكل صاعقة البرق التي تنتهي بسهم داخل مثلث متساوي األضالع إلى تنبيه المستخدم إلى وجود فولتية خطيرة غير معزولة دا

مالحظات االستخدام معلومات السالمة يهدف شكل صاعقة البرق التي تنتهي بسهم داخل مثلث متساوي األضالع إلى تنبيه المستخدم إلى وجود فولتية خطيرة غير معزولة دا

إخطار االستخدام معلومات السالمة الهدف من فالش البرقي الذي يحتوي على رأس سهم في مثلث متساوي األضالع هو تنبيه المستخدم بوجود جهد كهربي خطير غير معزول في

مالحظات االستخدام معلومات حول السالمة تنبه عالمة الضوء سهمية الرأس الظاهرة في المثلث متساوي األضالع المستخدم إلى وجود جهد كهربائي خطير غير معزول داخل

不規則動詞 重子音動詞 (1)第2語根と第3語根がともに母音をもつとき、第2語根は母音を失っ て、第3語根と重複(ヌレ鏞褌)する

A. 1 A Abu Rayhon Beruni Institute of Oriental Studies, Tashkent, MS Topkapı Sarayı Müzesi Kütüphanesi, MS. Revān köşkü

هست. از این رو معنای اصلی"اشه" "درون نما=شفاف=صفا" است و این شفافیت است که به پاکی و مقدس بودن ترجمه میگردد. پاک آنچیزیست که نهانش آشکار است. با نگاه


1- غشای دهلیزی یا reissners =جداسازی membrane نردبان فوقانی از نردبان میانی 2 -غشای پایه یا basilar =جداسازی membrane نردبان صماخی از نردبان میانی غشا

咳が出ます ا نا مصاب بالسعال. Meedelen dat je moet hoesten いつも疲れています Meedelen dat je recentelijk veel moe bent めまいがします Meedelen dat je duizelig bent 食欲がありま

JOCV 54 3 OB 1) 2) JOCV JICA 1) 2)

Microsoft Word - Ar.5 cohen final by takao to 2.20.doc

Meiklejohn Philips

فهرس 3 تعر يف بالمعداد استبدال معداد ما بمعداد آخر كيفية تكوين جملة باستخدام المعداد قراءة المعداد أثناء العد الأعداد الترتيبي

2 1 Introduction (1.1.2) Logistic ث Malthus (1.1.3) (( ) ث)( ) α = ( ) ( + ) [Verhulst 1845] 0 ( ) ( + ) lim ( ) = 0 t (1.1.4) (( ) ث)( ) α = ( ) Logi

性の区別 名詞に 男性名詞と女性名詞の区別があります まず どのような名詞が女性名詞なのか 見ていきます これ以外の名詞が男性名詞です 1) ター マルブータで終わる名詞 ) 町 都市 (madīnatun م د ين ة ) 大学 jāmiˁatun )ج ام ع ة ター マルブータの直前の

ٱ 形容詞で修飾する場合 名詞を形容詞で修飾する場合 形容詞もに変える すなわち 限定 / 非限定 性 格 数の 4 つをお揃いにする 空欄を埋めましょう ط ال ب ي اب ان ي 日本人の男子学生 ( 単数 主格 ) ( 双数 主格 ) ( 双数 属格 & 対格 ) ( 双数 主格 ) (

ا نا مصاب بالسعال. 咳が出ます Öksürüğünün olduğunu haber verme いつも疲れています Son zamanlarda yorgun olduğunu haber verme めまいがします Başdönmesi olduğunu haber verme

                

Kyoto Bulletin of Islamic Area Studies, 10 (March 2017), pp * *

سازمان رهایی بخش

سازمان رهایی بخش

奈良市の平城宮跡から出土した8 世紀中頃の木簡に ペルシャ ( 現代のイラン付近 ) を意味する 破斯( はし ) という名字を持つ役人人の名前が書かれていたことが 奈良文化財研研究所の調査でわかった نقل از يک سايت شخصی که همراه با نظرات خوانندگان ا

اسم اللون بالعربي بالياباني اللون اسم اللون あんこくいろ 暗 黒 色 أس و د قات م けんぽうくろちゃ 憲 法 黒 茶 م سم ر أس و د こくたん 黒 壇 ぬればいろ 濡 羽 色 てつぐろ 鉄 黒 أسو د خشبي ن فطي أس

Microsoft Word - Al-quranul karim mulai juz pertama 600 kata dan 60 ayat

Microsoft Word - 佑é⁄‚ㅻ葖é⁄”;㇤ㅩㅳ#㇤ㅩ㇯地éœ⁄ㆮ慖倱+挰报钵

Cain & Abel

فهرست فهرست...2 اطالعيه استفاده...4 اطالعات ایمنی...4 اقدامات احتیاطی... 5 هشدارهای ایمنی چشم... 7 مقدمه... 8 نمای کلی بسته... 8 نمای کلی دستگاه...9 و

冠詞

冠詞

C. S2 X D. E.. (1) X S1 10 S2 X+S1 3 X+S S1S2 X+S1+S2 X S1 X+S S X+S2 X A. S1 2 a. b. c. d. e. 2

職業

<874782C982D982F182B282F082DC82C882DA82A B95B B CEA96F3816A2E786C73>

2 3 ENGLISH 13 繁體中文 23 日本語 33 ةيبرعلا

Poker unblocked weebly

アラビア語のノート古典アラビア語の授業ノート Ⅲ 目次 1. ムラッキシュ アムル ブン クルスーム アムル ブン クルスーム サーリフの雌ラクダ ムタラッミスとタラファ ダーラト ジュルジュルの日...

Microsoft PowerPoint - 4_現職教員特別研修(H )(服部).ppt

2 3 ENGLISH 12 繁體中文 21 日本語 30 ةيبرعلا

2 千一夜物語( アラビアンナイト ) の中から 海のアブドゥッラーと陸のアブドゥッラーの話 をとりあげ アラビア語のテキストに母音符号を付し 対訳とアラビア語の語彙と文法の説明をつけたものです アラビア語の文法を一通り学習した人を対象にしています * アラビア語のテキストは 平凡社 東洋文庫 版

-2-


高2SL高1HL 文法後期後半_テキスト-0108.indd

p _08森.qxd

アッラーの美名

< D8291BA2E706466>


鹿大広報149号

NO


吉本ばなな『キッチン』英語版の研究

アラビア語のノート古典アラビア語の授業ノート Ⅴ 目次 1. さまざまな詩句 ( アッバース朝以降のもの ) 海人の真珠 から 海人の真珠 から 海人の真珠 から シーバワイヒの文法書から シーバワイ



elemmay09.pub

Answers Practice 08 JFD1

jyoku.indd

はじめに

CONTENTS Public relations brochure of Higashikawa May No.751 2

3 2


03Ÿ_-“L’£

S1Šû‘KŒâ‚è

Transcription:

MCMC NTT daichi@cslab.kecl.ntt.co.jp 2010-2-21( ), The Gods may throw a dice.. --- ABBA `The winner takes it all

NTT (PD, RS= ) 35 15 NTT NTT 2

(, ) etc, etc 0.92 0.85 0.61 2 1 0.37 1.0

1990 Web : x

( ) MCMC ( ) ( ) 100

MCMC 20 15 10 5 Gibbs MCMC All 0 2002 2003 2004 2005 2006 2007 2008 2009 ACL: Association of Computational Linguistics /

Why MCMC lately? EM ( ) EM MCMC (SMC, EP+ not yet explored) MCMC

MCMC Goldwater+ (2007), Johnson+ (2007), Gao+(2008) Johnson+ (2007) (2007) Latent Dirichlet Allocation Blei (2001), Griffiths+(2006) Goldwater+ (2006), (2009) Deschacht+ (2009) (DeNero 08)(Cohn+09)etc..

,, After procrastination, it is the time for prime-ministerial leadership. PREP N PN V DT N PREP ADJ N, ( ) :?,?

(2) : HMM ( ) ( ) PN V ADJ N PREP it is high time for : EM (Baum-Welch) or Gibbs 1 Markov, y

(3) V : HMM (Gibbs), : EM EM, ( EM : EMNLP08)

(1)???

(2) Latent Dirichlet Allocation (Blei+ 2001) Probabilistic LSI (Hofmann 1999) Pritchard(2000) 1: 2:, Admixture d K: n

(3) LDA Gibbs Pritchard (2000), Collapsed Gibbs, Rao-Blackwellized Gibbs VB( ), Collapsed VB, Gibbs

(4)

(1) ( ) Most of the confidences were unsought frequently I have feigned sleep, preoccupation, or a hostile levity when I realized by some unmistakable sign that an intimate revelation was quivering on.. (from The Great Gatsby )? Michael thought he ought to be a cosmonaut. Andrew, Bob, Susan should, have to astronaut, aeronaut (paradigme)!

(2) The Latent Words Language Model (Deschacht+ 09) Michael s dream for astronaut Mike s aspiration for cosmonaut Markov ( ) p(w w ),

(3) ( ) +Dirichlet prior n ( 3 )

C++ for (j = 0; j < iter; j++) { // repeat for many sweeps random_shuffle (words.begin(), words.end(), irand); // visit randomly } for (it = words.begin(); it!= words.end(); it++) { for (n = order; n >= 0; n--) lm->remove_customer (hidden + n); // remove from LM if (j > 0) table->sub_count (*hidden, *observed); // remove from table *hidden = draw_gibbs (hidden, observed, table); // sample latent word table->add_count (*hidden, *observed); // add to table for (n = 0; n <= order; n++) // add to LM lm->add_customer (hidden + n); }

( ) Original: Sampled Latent Words:

Austen Novel ( Emma ) Original: emma woodhouse handsome clever and rich with a comfortable home and happy disposition seemed to unite some of the best blessings of existence and had lived nearly twenty one years in the world with very little to distress or vex her she was the youngest of the two daughters of a most affectionate indulgent father and had in consequence of her sister's marriage been mistress of his house from a very early period Sampled Latent Words: emma remained in love and their for a hereabouts home and artifice ours were to persuade some of the best exciting of him she had already moves but one draper in the least and how little to her or handle her he was the children of the two daughters of a most delightful stronger myself and and in scruples of his father's having been lateness of his wife and a very great difference

Austen latent word translations would manners 0.003 1 would might 0.075 25 would must 0.087 29 would need 0.030 10 would never 0.006 2 would often 0.015 5 would or 0.003 1 would possibly 0.009 3 would should 0.249 83 would spirits 0.006 2 would triumph 0.003 1 would would 0.477 159 opportunity arrangement 0.0566 2 opportunity attachment 0.0849 3 opportunity evening 0.1698 6 opportunity inducement 0.0566 2 opportunity interval 0.0566 2 opportunity opportunity 0.1132 4 father daughter 0.0670 9 father friends 0.0372 5 father grandmama 0.0298 4 father having 0.0149 2 father head 0.0447 6 father inferior 0.0149 2 father master 0.0298 4 father memory 0.0298 4 father mother 0.2680 36 randalls dinner 0.0489 3 randalls home 0.538 33 randalls least 0.1957 12 randalls various 0.0489 3 abbey abbey 0.7240 14

LWLM PPL 102.8 (K-N 4-gram) 93.65 (LWLM 4-gram)

LWLM: Why? EM ( ) MCMC? Beam sampling

% echo, mecab -O wakati, (, ) Chasen, MeCab (NAIST) (supervised learning)

(2) # S-ID:950117245-006 KNP:99/12/27 * 0 5D * * * * * * * * 1 5D * * * * * * * 2 3D * * * * * * * 3 4D * * * 1995 38,400 ( ) ( )??

: : p( ) > p( ) 50 2^50=1,125,899,906,842,624 ( )

: n p( ) = p( ^) p( ) p( ) p( ) (Shannon 1948) : Pitman-Yor (HPYLM) (Teh 2006; Goldwater+ 2005) Pitman-Yor : ( )

: HPYLM n-gram Pitman-Yor (PY) : PY: 0 Markov?

HPYLM: PY : V PY n-gram= HPYLM ( )

NPYLM: - HPYLM HPYLM-HPYLM Markov HPYLM, 1 ( 1/6879)

NPYLM : : : MCMC.

Blocked Gibbs Sampling p(x,z) (Blocked Gibbs sampler)

Blocked Gibbs Sampler for NPYLM.... : 0. For s=s_1 s_x do parse_trivial(s, ). 1. For j = 1..M do For s=randperm(s_1 s_x) do words(s) words(s) p(w s, ) words(s) done.

Gibbs Sampling 1 2 10 50 100 200

words(s) p(w s, ) : s Forward-Backward (Viterbi ) Forward : t k t-k Y t-k+1 X t Y k Y : j

= k EOS k

( ) t-k-1-j-1-i t-k-1-j-1 t-k-1 t Forward : t k j ;_; ( )

: SIGHAN Bakeoff 2005 4 : 37,400 : 1000 ( ) : : MSR, : CITYU : 50,000 : 2

(F ) NPY(2),NPY(3) NPYLM or + NPY( ) NPY(3) 2 : ZK08 (Zhao&Kit 2008) ZK08

: 1 5, F =76.20 : 11 13, F =64.81 HDP(Goldwater+ ACL 2006): 1 ( 2 ) NPYLM: 3 -

( ) NPYLM

NPYLM

Arabic Gigawords 40,000 (Arabic AFP news) الفلسطينيبسببتظاهرةلانصارحرآةالمقاومةالاسلاميةحماس واذاتحققذلكفانكيسلوفسكييكونقدحازثلاثجواي زآبرىفيابرزثلاثة المحليةوالدوليةللحصولعلىلوازمهمالصحية Google translate: لايتمتعبلقب+ري يس+بلهو+قاي د Filstinebsbptazahrplansarhrkpalmquaompalaslam مايسمىب+السلطةالفلسطينية اعلنتشرطةجنوبافريقيااليومالاثنينانمالايقل iphamas. وقالتدانييلتومسونالتيكتبتالسيناريو وقداستغرقاعدادهخمسةاعوام تاريخي NPYLM الفلسطيني بسبب تظاهرة ل انصار حرآة المقاومة الاسلامية حماس و اذا تحقق ذلك ف ان آيسلوفسكي يكون قد حاز ثلاث جواي ز آبرىفيابرز ثلاثة المحليةو الدولية translate: للحصولعلى لوازم Google هم الصحية لايتمتعof ب لقب + because ري يس + event ب ل the هو + of قاي د + supporters مايسمى ب + السلطة Palestinian الفلسطينية Hamas. اعلن ت Movement, شرطة Resistance جنوبافريقي ا اليوم the Islamic الاثنين انمالايقل وقد استغرق اعداد ه خمسةاعوام. و قال ت دان ييل تومسون التي " تاريخي

Alice in Wonderland first,shedreamedoflittlealiceherself,andonceagainthetinyhandswereclaspedup onherknee,andthebrighteagereyeswerelookingupintohersshecouldhearthevery tonesofhervoice,andseethatqueerlittletossofherheadtokeepbackthewanderingh airthatwouldalwaysgetintohereyesandstillasshelistened,orseemedtolisten,thew holeplacearoundherbecamealivethestrangecreaturesofherlittlesister'sdream.the longgrassrustledatherfeetasthewhiterabbithurriedbythefrightenedmousesplashe dhiswaythroughtheneighbouringpoolshecouldheartherattleoftheteacupsasthema rchhareandhisfriendssharedtheirneverendingmeal,andtheshrillvoiceofthequeen first, she dream ed of little alice herself,and once again the tiny hand s were clasped upon her knee,and the bright eager eyes were looking up into hers -- shecould hearthe very tone s of her voice, and see that queer little toss of herhead to keep back the wandering hair that would always get into hereyes -- and still as she listened, or seemed to listen, thewhole place a round her became alive the strange creatures of her little sister 'sdream. thelong grass rustled ather feet as thewhitera bbit hurried by -- the frightened mouse splashed his way through the neighbour ing pool -- shecould hearthe rattle ofthe tea cups as the marchhare and his friends shared their never -endingme a l,and the

MCMC EM or, C++ MCMC

EM/MCMC EM MCMC?! (Carbonetto+, NIPS 2009) SMC, MCMC, /