条件付確率場とベイズ階層言語モデルの統合による半教師あり形態素解析

Similar documents
(TokyoCL2016semiseg.pptx)

459

2

第1節 災害体制の確立

久留米市地域防災計画

第1節 災害体制の確立



南山会報88入稿.indd

「住宅に関する防犯上の指針」案

紀要No.9_006王_CS.indd

ノンパラメトリックベイズ法による教師なし形態素解析

H8.6 P

吉永式Twitter marketing club添削後

STARTプログラム.indd

cat A

80

110527BR機能カ?イト?_110527BR機能カ?イト?



IPSJ SIG Technical Report Pitman-Yor 1 1 Pitman-Yor n-gram A proposal of the melody generation method using hierarchical pitman-yor language model Aki

‘¬”R.qx

サービス付き高齢者向け住宅賠償責任保険.indd


人間石川馨と品質管理



£Ã¥×¥í¥°¥é¥ß¥ó¥°ÆþÌç (2018) - Â裵²ó ¨¡ À©¸æ¹½Â¤¡§¾ò·ïʬ´ô ¨¡

橡会議録(第5回).doc

講演「母乳育児のうそほんと」

シンポジウム 15年後の「こだいら」の未来を考える

( ) ( ) ( )

untitled

untitled

1926

平成17年度事業実績(事業報告書用).PDF


1.4操作マニュアル+ユニット解説

0.3% 10% 4% 0.8% 5% 5% 23% 53%


1


untitled

クレイによる、主婦湿疹のケア

(3)(4) (3)(4)(2) (1) (2) 20 (3)

... 6

untitled

群馬県野球連盟


<82B582DC82CB8E7188E782C48A47967B41342E696E6464>

untitled


裁定審議会における裁定の概要 (平成23年度)


<91E F1938C966B95FA8ECB90FC88E397C38B5A8F708A778F7091E589EF8EC08D7388CF88F5837D836A B E696E6464>

Microsoft Word - 入居のしおり.doc

untitled

和県監査H15港湾.PDF

( )

ESPEC Technical Report 12

syogaku

-26-

untitled

日本経大論集 第45巻 第1号


河川砂防技術基準・基本計画編.PDF

4 100g


Taro12-希少樹種.jtd

! ( ),

ベイズ階層言語モデルによる 教師なし形態素解析

研究紀要 第5号

1

21 Pitman-Yor Pitman- Yor [7] n -gram W w n-gram G Pitman-Yor P Y (d, θ, G 0 ) (1) G P Y (d, θ, G 0 ) (1) Pitman-Yor d, θ, G 0 d 0 d 1 θ Pitman-Yor G


Microsoft PowerPoint - 代理店向け資料.ppt

01広報誌表10月.pdf

C¥×¥í¥°¥é¥ß¥ó¥° ÆþÌç

q w e q w e r

プログラミング基礎

/* do-while */ #include <stdio.h> #include <math.h> int main(void) double val1, val2, arith_mean, geo_mean; printf( \n ); do printf( ); scanf( %lf, &v

アベノミクス2年目を迎える2014年の日本経済

:30 12:00 I. I VI II. III. IV. a d V. VI

csj-report.pdf

平成17年度後期

untitled

93, , , , , , , , , , , ,0 7.7, , ,6 5

Dirichlet process mixture Dirichlet process mixture 2 /40 MIRU2008 :

indb

, Shannon (1948) A mathematical theory of communication : 3. THE SERIES OF APPROXIMATIONS TO ENGLISH To give a visual idea of how this series of proce


PowerPoint Presentation

Java Java Java Java Java 4 p * *** ***** *** * Unix p a,b,c,d 100,200,250,500 a*b = a*b+c = a*b+c*d = (a+b)*(c+d) = 225

A/B (2010/10/08) Ver kurino/2010/soft/soft.html A/B

,000m 7 CAT

PC Windows 95, Windows 98, Windows NT, Windows 2000, MS-DOS, UNIX CPU

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),

J I S KOTONOHA KOTONOHA KOTONOHA CSJ Corpus of Spontaneous JapaneseWWW J I S

: : : TSTank 2

離散数理工学 第 2回 数え上げの基礎:漸化式の立て方

Transcription:

* NTT daichi@cslab.kecl.ntt.co.jp 2011 2011-3-10(Fri),

PDF : http://chasen.org/~daiti-m/paper/nlp2011semiseg.pdf,

(,,,...) Twitter Blog... (Brain damaged!)

CSJ... (,,...)

( +, ACL2009), : NPYLM (Nested Pitman-Yor LM) 1 2 10 50 100 200

NPYLM as a Semi-Markov model BOS EOS Semi-Markov HMM (Murphy 02, Ostendorf 96) +MCMC (n )

,,, : JESS-CM joint probability model embedding style semisupervised conditional model ( + ACL08/09) CRF/HMM, CRF/Naive Bayes

JESS-CM on CRF/HMM ( +, ACL2008) ^ she has a cat $ CRF + HMM, CRF HMM ( ) NPYLM? (Semi-Markov)

NPYLM as a Semi-Markov model BOS EOS Semi-Markov HMM (Murphy 02, Ostendorf 96) +MCMC (n )

Semi-Markov CRF (NIPS 2004)? ^ Semi-Markov CRF ( : NE) (1GB 20GB) ( ) : 95%

Markov CRF Semi-Markov LM ^ CRF NPYLM 2?

CRF NPYLM Andrew+(EMNLP 2006) CRF semi-markov CRF p( ) 1 1=, 0= 0 start mid end (start, mid, end) := (start, mid)+ (mid, end)

NPYLM CRF (1)!! 1 0 4 : 0 0, 0 1, 1 0, 1 1 Markov(=HMM), Semi-Markov

NPYLM CRF (2) Case 1 1 : 1 0 1 1,,,

NPYLM CRF (3) 1 Case 1 0 : 1 0,,,,,,,, 0

NPY CRF: Code example 0 0 C++ double sentence::ccz (int t, HPYLM *lm) { wstring w, h; int i, j, k, L = src.size(); double z = 0; } for (k = 0; k < MAX_LENGTH - 2; k++) { if (!(t + 1 + k < L)) break; for (j = 2 + k; j < index[t + 1 + k]; j++) { w = src.substr(t + 1 + k -j, j + 1); if (t + k - j < 0) { /* (t + 1 + k - j) - 1 */ h = EOS; z += lm->ngram_probability (w, h); } else { for (i = 0; i < index[t + k - j]; i++) { h = src.substr(t + k -j -i, i + 1); z += lm->ngram_probability (w, h); } } } } return z;

What are we doing? (1) 1 1

What are we doing? (1) 0 1

What are we doing? (1) 1 0

What are we doing? (1) 0 0

What are we doing? (1) 0 0

What are we doing? (1) 0 0

What are we doing? (1) DAG, 4 :

What are we doing? (2),, 1 0,

Experiments (still ongoing) (Sina Microblog) Tremendous! Twitter, 95000000 blog CSJ ( ) SIGHAN Bakeoff 2005

( ^ ^ ) ( ^ ^ ) ( ^ ^ ) ( ) ( ^ ^ ) ( ^ ^ ) : 37,400 : 40,000

2 あるるるる 2 ますえ 2 そびれちゃった 2 メリクリスマース3 シクシク 3 チーム 45 ロック 11 キムタク 12 うなぁ 2 したろう 3 去った 4 死兆星 4 スッキリ 6 ドバァア 2 開催 47 おく 17 スワロフスキー 3 わたる 11 コマ送り 3 おおっお 7 にじむ 4 簿 12 ギギ 2 呼んで 29 席 31 100 55 グラビア 85 田尻 3 より焼き 2 ヒャダルコ 3 永久 34 ヤマト 2 早いし 2 信じろ 6 似てる 26 居る 10 よる 85 LaQua 7 ただただ 7 ストロベリメロディ21 スターーーートゥハッッッ 2 ひろがって 3 しろま 3 カワユスピンク 2 海馬 3 除外 3 けえ 6 なんとゆう 2

(Sina microblog) (Twitter) 今天一大早就被电话吵醒了, 折磨死我了, 昨天太晚睡了, 早上被这电话搞的晕忽忽! 头疼, 发热 貌似感冒了, 晚上睡觉不能裸睡了 要穿睡衣了 咿 ~? 半个钟前发的围脖咋不见了咧 ~~ 只是感慨了一下今天的归途特顺嘛 ~~~ ( ) b 下雨了, 不知道广州那边有没有下雨, 明天的同学聚会我去不了了,[ 伤心 ] 大哭學校付近一隻很可愛的狗狗, 做了點特效 [ 心 ] [ 心 ] [ 心 ] 我們學校學生超愛牠的!!![ 哈哈 ] 明儿我要把中山陵搞定 ~~~~~ 玛丽隔壁的 ~~~ ( _ ) 好饿啊.... 走! 妈妈带你出去吃饭去 ~..... ( ( ( ( ( ヾ ( o = ^ ェ ) o 喵 ~ o ( = ω = ) m 梦 混乱的梦 清晰的梦 : MSR 87000 ( ) : Sina API, 98700

SIGHAN Bakeoff 2005,... : MSR Asia 87k+ Chinese Gigaword 200k, ( 2004 ) 97.4%

[ : ]

: 2ch 874-883 10 (10000 ), 26474 NPYCRF/K=12, : : 2004 2005 A s 2007 StrikerS? No

+ 26474 2004 2005 A s 2007 StrikerS SS...

http://www.nhk.or.jp/namara03-blog/ NHK, 6,000 : ( ) : ( )

? (JESS-CM): 2 Jelinek-Mercer Bayes (Dirichlet) (MacKay 1994) HMM!

CRF JESS-CM Semi-Markov( )<->Markov( ) [ ]