untitled

Similar documents
untitled

main.dvi

main.dvi

main.dvi

main.dvi

main.dvi

untitled

Twitter Twitter [5] ANPI NLP 5 [6] Lee [7] Lee [8] Twitter Flickr FreeWiFi FreeWiFi Flickr FreeWiFi 2. 2 Mikolov [9] [10] word2vec word2vec word2vec k

main.dvi

main.dvi

Computational Semantics 1 category specificity Warrington (1975); Warrington & Shallice (1979, 1984) 2 basic level superiority 3 super-ordinate catego

provider_020524_2.PDF

熊谷市報10月号

main.dvi


44 4 I (1) ( ) (10 15 ) ( 17 ) ( 3 1 ) (2)

生活設計レジメ

I II III 28 29

_314I01BM浅谷2.indd

. Yahoo! 1!goo 2 QA..... QA Web Web [1]Web Web Yin [2] Web Web Web. [3] Web Wikipedia 1 2


Web [1] [2] [3] [4] [5] SupportVectorMachine SVM [6] [7] Google [11] Web

自然言語処理24_705



IPSJ SIG Technical Report Vol.2015-SE-187 No /3/12 1,a) 1,b) Mozilla Firefox Eclipse Platform GNU Gcc % 43% 1. [1] Eclipse Mozilla 4 [3

29 jjencode JavaScript

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

i


Wide Scanner TWAIN Source ユーザーズガイド

3.5 検索で上位に表示させるタイトル付けの奥義

DEIM Forum 2019 C3-5 tweet

広報東京都6月号

広報東京都2016年5月号


広報東京都3月号

第1部 一般的コメント

Indirect Tweet Indirect Tweet 2. 2 Tweet Simple Tweet Reply Mention Indirect Tweet Tweet Tweet Indirect Tweet Tweet Tweet Indirect Tweet Tweet Tweet 2

untitled

表1票4.qx4

福祉行財政と福祉計画[第3版]

第1章 国民年金における無年金

DEIM Forum 2014 P3-3 A Foreseeing System of Search Results based on Query Operations on the Graph Interface

2reB-MDF02.dvi

1

橡ミュラー列伝Ⅰ.PDF

JAPAN MARKETING JOURNAL 111 Vol.28 No.32008

JAPAN MARKETING JOURNAL 113 Vol.29 No.12009

JAPAN MARKETING JOURNAL 110 Vol.28 No.22008

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

o 2o 3o 3 1. I o 3. 1o 2o 31. I 3o PDF Adobe Reader 4o 2 1o I 2o 3o 4o 5o 6o 7o 2197/ o 1o 1 1o

2 3

II III I ~ 2 ~

中堅中小企業向け秘密保持マニュアル


PR映画-1

- 2 -



1 (1) (2)

卒論タイトル

ALAGIN (SVM)

一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGIN

1 AND TFIDF Web DFIWF Wikipedia Web Web AND 5. Wikipedia AND 6. Wikipedia Web Ma [4] Ma URL AND Tian [8] Tian Tian Web Cimiano [3] [

Microsoft Word - deim2011_new-ichinose doc

「産業上利用することができる発明」の審査の運用指針(案)

DEIM Forum 2012 E Web Extracting Modification of Objec



DEIM Forum 2014 D3-5 DSMS DSMS DSMS 2.13% RTOS Realtime-Aware Efficient Query Processing for Automotiv

13 RoboCup The Interface System for Learning By Observation Applied to RoboCup Agents Ruck Thawonmas

01 Campus News Topics 1

DEIM Forum 2019 F {niitsuma, Twitter 1 SNS Twitter 1 450

DEIM Forum 2016 E3-6 : SERVA

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root


2,

東京国立博物館ニュース2014年4-5月号

ii

Microsoft Word - toyoshima-deim2011.doc

DEIM Forum 2009 B4-6, Str

178 5 I 1 ( ) ( ) ( ) ( ) (1) ( 2 )

2reN-A14.dvi

JAPAN MARKETING JOURNAL 123 Vol.31 No.32012

JAPAN MARKETING JOURNAL 115 Vol.29 No.32010

JAPAN MARKETING JOURNAL 110 Vol.28 No.22008

Publish/Subscribe KiZUNA P2P 2 Publish/Subscribe KiZUNA 2. KiZUNA 1 Skip Graph BF Skip Graph BF Skip Graph Skip Graph Skip Graph DDLL 2.1 Skip Graph S

kouhou_honbun_20_35_ pdf

! Topics ,250 2, ,000 2, % 6 7 2

IPSJ SIG Technical Report Vol.2014-HCI-157 No.26 Vol.2014-GN-91 No.26 Vol.2014-EC-31 No /3/15 1,a) 2 3 Web (SERP) ( ) Web (VP) SERP VP VP SERP

10/17CII/CIIIJ

Autumn

Q A Q Q Q Q 50

untitled

WII-D 2017 (1) (2) (1) (2) [Tanaka 07] [ 04] [ 10] [ 13, 13], [ 08] [ 13] (1) (2) 2 2 e.g., Wikipedia [ 14] Wikipedia [ 14] Linked Open

DEIM Forum 2019 D3-5 Web Yahoo! JAPAN Q&A Web Web

四校_目次~巻頭言.indd

GREE GREE SNS ) SNS 2.1 SNS SNS Facebook Facebook Facebook.Inc SNS ) Facebook Facebook GREE GREE SNS ) Twitter


Transcription:

DEIM Forum 2019 B3-3 305 8573 1-1-1 305 8573 1-1-1 ( ) 151-0053 1-3-15 6F word2vec, An Interface for Browsing Topics of Know-How Sites Shuto KAWABATA, Ohkawa YOUHEI,WenbinNIU,ChenZHAO, Takehito UTSURO,and Yasuhide KAWADA Grad. Sch. of Systems and Information Engineering, University of Tsukuba, Tsukuba 305-8573 Japan Faculty of Engineering, Information and Systems, University of Tsukuba, Tsukuba 305-8573 Japan Logworks Co., Ltd. Tokyo 151-0053, Japan 1. Yahoo! OKWAVE [8] ( ) [9] SVM (Support Vector Machine) [9] 2.

D(z n) { } D(z n)= d D z n = argmax P (z u d) z u (u=1,...,k) 1 ( ) ( 1) 4 Google 100 () 10 1,000 AND AND Google Custom Search API 1 20 1 2 3. 2 3. 1 (LDA; Latent Dirichlet Allocation) [1] LDA w K LDA z n(n =1,...,K) w P (w z n)(w V ),, d z n P (z n d) (n =1,...,K) d z n P (z n d) (n =1,...,K) P (z n d) d z n 1 https://developers.google.com/custom-search/ AND d S(d) (d D(z n)) z n S(z n) z n D(z n) d ( D(z n)) S(z n) S(z n)= d D(z n) S(d) z n S(z n) s ( S(z n)) s d ( D(z n)) D(s, z n) z n f(s, z n) { } D(s, z n)= d D(z n) s S(d) f(s, z n)= D(s, z n) z n f(s, z n) 3 3. 2 [2] Wikipedia word2vec [7] 2 3 d S(d) z n f(s, z n) s(d) d s(d) = argmax f(s, z n) s S(d) ( z n = argmax P (z u d)) z u (u=1,...,k) d d s(d) s(d ) sim(v(d),v(d )) = v(s(d)) v(s(d )) v(s(d)) v(s(d )) d d 2 5 3 1

2 ( ) 1 923 627 11,840 50 81 50 978 841 12,880 50 55 39 855 694 6,947 50 53 29 849 707 6,997 50 44 25 θ lbd { D i(z n)= d D(z n) d D i(z n), } sim(v(d),v(d )) > = θ lbd z n D(z n) ( 4 ) [2] 4. [5] [5] 30 ( 3) 4 θ lbd 0.7 3 5 [5] dm x z i z j (i = j) d d URL u(d) u(d ) dm(u(d)) dm(u(d )) dm x ( ) i, j, i = j, d D(z i), d D(z j) dm(u(d)) = dm(u(d )) = dm x dm x 6 i) ii) iii) iv) 5 S 2 A B C R 6 u(d) =http://xxx.com/yyy u(d )=http://xxx.com/zzz dm(u(d)) = dm(u(d )) = http://xxx.com/

仮説 複数トピックにまたがって出現するドメイン ノウハウサイトのドメインとみなす 図 3 ノウハウサイト候補の選定 ノウハウ記事へのリンク 図 4 ノウハウサイト例 (クエリ フォーカス 就活 の例) 履歴書 Do (https://www.rirekisyodo.com/) のノウハウの一覧が参照できる可能性が低いと仮定し 複数の トピックにまたがるドメインが上記 i) iv) のいずれかに該当 する場合には そのドメインを除外する そして 以上の一連 の条件を満たすドメインの集合をノウハウサイト候補の集合 S とする クエリ フォーカス 就活 および 結婚 における参照用 ノウハウサイトの例を 図 4 および 図 5 にそれぞれ示す 5. ノウハウサイト候補群閲覧インタフェース 5. 1 概 要 前節の手順によって選定されたノウハウサイト候補群を閲覧 するためのインタフェースを作成する. インタフェースの画面 例を図 6 に示す トップページでは 各ノウハウサイト候補におこえるノウハ ウの話題の分布を俯瞰するため 各サイトにおけるトピックの 有無を表形式で表示する (図 6 におけるマス目の色の有無が 各トピックにおけるウェブページの有無を示す) 各ドメイン

ノウハウ記事へのリンク 図 5 ノウハウサイト例 (クエリ フォーカス 結婚 の例) 結婚レシピ (http://www.wedding-recipe.com/) (ノウハウサイト候補群) ④ 図 6 ノウハウサイト候補群閲覧インタフェース(クエリ フォーカス 就活 の例) dmx のウェブページ集合を D(dmx ) とすると 各ドメインに 含まれるトピックの集合 Z(dmx ) は次式で定義される Z(dmx ) = zn d D(dmx ), zn = argmax zu (u=1,...,k) P (zu d) 本インタフェースでは 文献 [9] において SVM(Support Vec-

2 A B C D E tor Machine) SVM 7 5. 2 6 ( 1) ( 2) ( 3) ( 4) 6 Do ( 1) 8 ( 2) 6. S 7 Google Custom Search API 8 3 SVM r θ Sr θ ( S) R Sr θ R () 7 7 S 81 R 50 SVM R 7 ( ) 7. 7. 1 [1] API

3 ( ) Jobweb Jobrass Do 17 11 55 18 40 16 193 29 34 14 4,401 38 1,218 35 1,378 34 279 33 6,002 31 d P (z n d) z n P (z n d) ( 0.3 ) 7. 2 5 5 3 8. 8. 1 11 [6,10] 10 9 10 1 URL 9 10 10 10 K 50 20 30 8. 2 8 1,640 1,731 1,891 333 407 374 1,189 1,272 1,387 344 417 413 11 1,733 1,266 364 382 11 t ( 1%) 1 ( 1%) 10 9. [3] [8] [3] Yahoo LDA

[4] [3,8,9] [4] (a) (b) (c) (d) 1 8 [9] 10. 4 [1] D. M. Blei, A. Y. Ng, and M. I. Jordan. Latent Dirichlet allocation. Journal of Machine Learning Research, Vol.3, pp. 993 1022, 2003. [2],,,,.. 10 DEIM, 2018. [3],,,,,.. 8 DEIM, 2016. [4],,,.. 32, 2018. [5],,,,,,.. 9 DEIM, 2017. [6],,,,.. 33, 2019. [7] T. Mikolov, I. Sutskever, K. Chen, G. Corrado, and J. Dean. Distributed representations of words and phrases and their compositionality. In Proc. 26th NIPS, pp. 3111 3119, 2013. [8],,,,,,.. 7 DEIM, 2015. [9] Y. Ohkawa, S. Kawabata, C. Zhao, W. Niu, Y. Lin, T. Utsuro, and Y. Kawada. Identifying tips Web sites of a specific query based on search engine suggests and the topic distribution. In Proc. 3rd ABCSS, pp. 4347 4353, 2018. [10],,,,,,.. 25, 2019.