DEIM Forum 211 F6-3 Web 35 855 1 2 35 855 1 2 11 843 2 1 2 E-mail: s913153@klis.tsukuba.ac.jp, {yohei,satoh}@slis.tsukuba.ac.jp, kando@nii.ac.jp QA Web Web Web QA Diversified-query Generating System Using Community QA Resources to Abstract Verbalize Latent Information Needs Atsushi OTSUKA, Yohei SEKI, Noriko KANDO, and Tetsuji SATOH College of Knowledge and Library Sciences, School of Informatics University of Tsukuba 1 2,Kasuga,Tsukuba,Ibaraki,35 855 Japan Graduate School of Library and Information Science and Media Studies,University of Tsukuba 1 2,Kasuga,Tsukuba,Ibaraki,35 855 Japan National Institute of Informatics 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo, 11 843, Japan E-mail: s913153@klis.tsukuba.ac.jp, {yohei,satoh}@slis.tsukuba.ac.jp, kando@nii.ac.jp Question articles posted to the QA community are expressed question in natural language. In This paper, we make query expansion system to support Web search users to generate web query by using QA community resources. This system suggests search keywords and question articles from QA community s category. Users can find their information needs as verbalizing query by browsing question articles. And, we extract diversified question articles from query with latent semantic indexing. Key words Web Search Query Expantion Commmunity QA Information Needs Latent Semantic Indexing 1. Web Web Web.. Web. Web
. Yahoo! 1!goo 2 QA..... QA Web Web 2 3 4 5 6 7 8 2. [1]Web Web Yin [2] Web Web Web. [3] Web Wikipedia 1 http://chiebukuro.yahoo.co.jp/ 2 http://oshiete.goo.ne.jp/ Web Wikipedia Web. [4]. blog Web. Web QA [5] [6] QA Web Web QA Web [7] Yoon [8] URL 2 Yoon QA QA Web Web. 3. 1 2 2
. 3. 1 QA QA 3. 2, 1 1 PC Web Web 4. 2 QA 第 一 段 階 拡 張 カテゴリ キーワード 組 ( 入 力 + 1 語 ) 第 二 段 階 拡 張 質 問 記 事 キーワード 組 ( 入 力 + 2 語 ) 入 力 と 関 連 の 高 い カテゴリ 順 にランキング Web ページ 拡 張 1 旅 行 カテゴリ 海 外 旅 行 パスポート 海 外 旅 行 パスポートがない 状 態 で 旅 行 ツアーに 申 し 込 めますか? 海 外 旅 行 パスポート 旅 行 ツアー 海 外 旅 行 でパスポートは 持 ち 歩 きますか? 海 外 旅 行 パスポート 持 ち 歩 く 旅 行 カテゴリ 海 外 旅 行 食 べ 物 日 本 人 が 海 外 旅 行 して 食 べ 物 がおいしいと 思 う 国 はどこですか? 海 外 旅 行 食 べ 物 おいしい 海 外 旅 行 に 食 べ 物 って 持 っていくこと 出 来 ますか? 海 外 旅 行 食 べ 物 持 っていく PCカテゴリ 海 外 旅 行 インターネット 海 外 旅 行 に 行 くつもりなのですが 海 外 でインター ネットをやるには 何 かに 申 し 込 まなければならない でしょうか? 海 外 旅 行 インターネット 申 し 込 み 語 学 カテゴリ 海 外 旅 行 英 会 話 海 外 旅 行 に 行 くのに 英 会 話 を 習 おうと 思 っています お 勧 めの 英 会 話 教 室 はありますか? 海 外 旅 行 英 会 話 教 室 お 勧 め カテゴリ 相 関 単 語 -カテゴリ 出 現 確 率 DB Web 検 索 エンジンAPI 結 果 の 統 合 2 関 連 語 検 索 第 一 段 拡 張 質 問 記 事 検 索 拡 張 作 成 第 二 段 拡 張 単 語 - 概 念 空 間 DB 単 語 - 質 問 記 事 転 置 インデックス API Web 1 2 3 4. 1 Yahoo! 3 1 2, 3 http://research.nii.ac.jp/tdc/chiebukuro.html/
1 (seiji) 9,781 (renai) 7,626 (pc) 6,54 Yahoo! (auction) 6,521 Yahoo! (bukuro) 7,35 (health) 7,65 (travel) 7,263 (tv) 8,56 (baseball) 7,33 (kotoba) 8,257 MeCab 4 MySQL 5 3 Yahoo! 1 4. 2 Yahoo! C t P C,t ( t ) P C,t = (1) 4. 3 LSI:Latent Semantic Indexting LSI 2, 2, tf.idf tf D j t i d i,j 4 http://mecab.sourceforge.net/ 5 http://dev.mysql.com/doc/refman/5.1/ja/fulltext-stopwords.html d i,j = log 2 (f i,j + 1) log 2 ( j ) (log n 2 + 1) (2) n i LSI 2, 1 SVD:Singular Value Decomposition) m n D D m n = U m r Σ r r V T n r (3) AND AND tf.idf 3 5. Yahoo!. 4 4 Web Web Web
海 外 旅 行 にノートパソコンを 持 っていくことになりましたが おすすめのパソコンはないですか? 携 帯 性 を 重 視 してます 海 外 (1.32) おすすめ (3.43) 形 態 素 解 析 海 外 旅 行 旅 行 (6.78) 重 視 (9.22) キーワードの 追 加 第 一 段 階 拡 張 : 旅 行 ノート (3.41) 持 つ (1.48) パソコン (1.89) ノートパソコン 行 く (1.51) 海 外 旅 行 にノートパソコンを 持 っていくことになりましたが おすすめのパソコンはないですか? 携 帯 性 を 重 視 してます 海 外 旅 行 ノートパソコン 重 視 パソコン 携 帯 (2.56) 名 詞 海 外 旅 行 性 (2.34) 複 合 名 詞 スコア 2 ( ) 1 travel(.12) pc(.252) 2 renai(.865) health(.24) 3 seiji(.45) auction(.18) 4 health(.41) bukuro(.15) 5 kotoba(.35) 6 bukuro(.27) 7 tv(.25) 8 auction(.) 9 pc(.8) 1 baseball(.35) 3.. 3 PC, 6. 4 Web Web Web Web 5. 1 Yahoo!. 2. PC PC 5. 2 5. 1 QA Web Web 6. 1 Web Web Web (1) Web API 6 Web (2) Web (3) API 7 (4) (5) Web 1 (6) 2
3 pc health auction ID yahoo! API 1 5 2 Web 1 3 1 3 1 4 1 3 category 3 total 3 1 3 base(yahoo) Yahoo! API 8 3 4 seiji health renai travel pc tv auction baseball bukuro kotoba 5 category(pc) total base(yahoo) DS wii os PSP PS3 5 category total AND base(yahoo) Web 1 6 http://developer.yahoo.co.jp/webapi/search/ 7 http://developer.yahoo.co.jp/webapi/jlp/keyphrase/v1/extract. html 8 http://developer.yahoo.co.jp/webapi/search/assistsearch/v1/ webunitsearch.html 6. 2 total base(yahoo) 3 5 3 total total base(yahoo) 1 total base(yahoo) base(yahoo) total category 6 7 total base(yahoo)
7 total 6 6 base(yahoo) 5 5 1 1 total base(yahoo) "ソフト" "メール" " 質 問 " " 友 達 " " 検 査 " " 東 京 " " 日 本 語 " " 中 国 " " 番 組 " " 選 手 " 5 1 15 2 25 5 total( base(yahoo) 8 6 5 " 日 本 語 " 35 25 15 1 カテゴリ 1 5 total base(yahoo) 5 1 15 2 25 6 9 (3 ) 6 5 "ソフト" 7 6 1 5 1 total base(yahoo) 5 1 15 2 25 3 35 4 45 カテゴリ 7 1 (5 ) base(yahoo) base(yahoo) total 8 9 8 9 29 total base(yahoo) 15 total base(yahoo) 1 base(yahoo) total 5 1 3 base(yahoo) total 7. LSI health auction
Yahoo!API 28 99 5 Yahoo! DS 99 8. Web QA QA 21591 Yahoo! [1] Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schuetze. Introduction to Information Retrieval. 8. [2] Zhijun Yin, Milad Shokouhi, and Nick Craswell. Query Expansion Using External Evidence. 31th European Conference on IR Research(ECIR9), Vol. LNCS 5478/9, pp. 362 374, 9. [3],,,,. Wikipedia Web., No. SIG-SWO-A83, pp. 13-1 13-7, 8. [4],,.. 9, 9. [5],,. QA. Web 21, No. 2A-2, 21. [6],,. Web QA. Web 21, No. 2A-3, 21. [7],,,,,. Web. DBSJ Journal, Vol. 9, No. 1, pp. 1 6, 21. [8] Sounwood Yoon, Adam Jatowt, and Katsumi Tanaka. Intent-Based Categorization of Search Results Using Questions from Web Q&A Corpus. Proceedings of the 1th international conference on Web Information Systems Engineering (WISE9), Vol. LNCS 582/9, pp. 145 158, 9.