DEIM Forum 2012 C3-1 QA 305 8550 1 2 101 8430 2 1 2 E-mail: {kagawa,sat,satoh}@ce.slis.tsukuba.ac.jp, kando@nii.ac.jp QA 1 2 2 QA Dependence relationships among Question and Answers in Community QA Yuichi KAGAWA, Satoshi SHIMADA, Noriko KANDO, and Tetsuji SATOH Graduate School of Library and Information Science and Media Studies,University of Tsukuba 1 2,Kasuga,Tsukuba,Ibaraki,305 8550 Japan National Institute of Informatics 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo, 101 8430, Japan E-mail: {kagawa,sat,satoh}@ce.slis.tsukuba.ac.jp, kando@nii.ac.jp Abstract In Community QA, several answers are usually posted in each question. Therefore, it is supposed that answerers post their own answers after seeing not only the question but also answers posted before. In this paper we express dependence relationships among question and answers with network structure and try to evaluate the dependence relationships. We make the rule of making network charts indicating dependence relationships and experiment making network charts. We analyze network charts made by two people. We report on the result of evaluation about whether extracting dependence relationships among question and answers can be done or not independent of who makes. Key words Community QA, Discourse Structure Analysis 1. QA QA, [1] Yahoo! 1!goo 2 1 http://chiebukuro.yahoo.co.jp/ 2 http://oshiete.goo.ne.jp/ QA 1 2,
QA 2 3 4 5 6 2. QA, [2] [3] QA QA 2 [4] FABA 2 [5] 1, 3. [6] [6] 1 (1), (2) (3) (4) URL, URL URL
1 NTCIR-8 CQA 704 Yahoo! 636 211 184, 1 4. 4. 1 Yahoo! NTCIR-8 CQA QA 3 2004 4 2005 10 1500 14 1 Yahoo! 4 10 10 14 2 68 4. 2 2 4. 3 2 2 3 2 3 2 2 2 68 2 52 Jaccard 16 1 2 Jaccard X Y A B Jaccard = X Y X Y 2 4 5 2 0.941 0.587 0.371 0.628 4. 4 2 3 2 2 0.587 2 0.371 0.628 3 http://research.nii.ac.jp/ntcir/permission/ntcir-8/perm-ja-cqa. html#cqa_task
(a) 実験者 A が作成 (b) 実験者 B が作成 図 2 ノード一致度が高かったネットワーク図の例 (a) 実験者 A が作成 (b) 実験者 B が作成 図 3 ノード一致度が低かったネットワーク図の例 図 4 相関が見られた回答のノード一致度とリンクの一致度 5. 本実験概要 次に 前章の予備実験をから得られた知見を元に得られた作 図 5 相関が見られなかった回答のノード一致度とリンクの一致度 成規則を用いて 再び複数人によって手動でネットワーク図を 作成する実験を行なった
6 5. 1 NTCIR-8 CQA QA,, Yahoo! 2 QID 108, 2 5. 2 (1), (2) ( ) 1 (1) (2) A B A 1 6 5. 3 2, 6 3 108 2 81, Jaccard 3 27 1 2 3,, 0.597 0.551 0.292 0.627
(a) 実験者 A が作成 (b) 実験者 B が作成 図 7 ノード一致度が高くなったネットワーク図の例 6. 考 できるかを評価するために ネットワーク図の作成規則に基づ 察 いて 2 名の実験者によって手動でネットワーク図を作成する 表 3 より 質問のノードに関しては, 予備実験時と比較して一 実験を行った その結果 質問のノードに関しては 一致度が 致度が大きく下がっている. これは 例えば ベストアンサー 大きく 実験者に依らず安定して質問の聞きたいこと 知りた の選択に迷ったとき何を基準に選んでますか という質問が いことを抜き出すことができることが分かった 回答のノード あったときに 基準 何を に関しては 一致度は質問のノードよりは低く 質問のノード 選んでますか というように 実験者に依って 質問の内容の部分を抽出する人と直接問いか より実験者によって, 各回答ごとに応えていること 応えよう ける部分を抽出する人に分かれてしまうからだと考えられる としていることの読み取り方のちがいが大きいことが分かった 回答のノードに関しては 一致度の平均値は 0.551 で 予備実 リンクの一致度に関しては 全てのリンクを対象とすると低い 験時と比較して大きな差異はなかった 予備実験と本実験では が 一致したノード内のリンクを対象にすると大きく向上する 利用した質問記事が異なるので直接は比較できないが 本実験 ことが明らかとなった では回答数の多い質問記事を中心に利用したので 予備実験時 今後の課題として ネットワーク図の作成規則を改良するこ と比較して精度は良くなった考えられる 図 6 のように 観点 とが挙げられる また ネットワーク図を用いて 質問タイプ を単語単位でできるだけ多くの抽出させることで一致度が高く の類型化や ベストアンサーとなるための要件と良質な回答の なったと考えられる リンクの一致度に関しては 表 3 より 特徴の推定など様々な側面から評価を行うことが挙げられる 全てのリンクを対象とすると 0.292 であるが一致したノード 内のリンクを対象にすると 0.627 にまで向上しており 予備実 験時とほぼ同じ値であるので 全てのリンクを対象としたとき 謝 のリンクの一致度が低いのは質問のノードの一致度が低いこと 本研究の一部は科研費 21500091 の助成を受けたものであ 辞 が原因であったと考えられる 今後の課題として ネットワー る 本研究の実装 評価に際し 大学共同利用機関法人国立情 ク図の作成規則を改良することが挙げられる 具体的には 質 報学研究所から提供を受けた Yahoo!知恵袋のデータを利用し 問のノードを抽出する際には 質問の内容の部分と直接問いか ている ここに記して謝意を示す ける部分を抽出する さらに 回答のノードを抽出する際も同 様に 回答の大まかな内容の部分と直接回答している部分を抽 出する 7. お わ り に 本研究では 質問に連なる回答間の依存関係をネットワーク 構造で表現し 質問 回答間の依存関係を定量的に評価すると いう新しいアプローチを試みた まず 質問 回答間の依存関 係を表すネットワーク図作成のための規則を手動で作り出した 次に 実験者に依らず安定して質問 回答間の依存関係を抽出 文 献 [1] 三浦麻子, 川浦康至, 地福節子, 大瀧直子, 岡本真. 知識共有コ ミュニティを創り出す人たち. 人工知能学会全国大会大会論文 集, pp. 1 4, Jun.2006. [2] 島田諭, 福原知宏, 佐藤哲司. 質問回答サイトにおける利用者行 動に基づく記事の関連付け手法の検討. 電子情報通信学会 第 19 回データ工学ワークショップ DEWS2008, No. B6-5, 2008. [3] 甲谷優, 川島晴美, 藤村考. QA コミュニティの成長パターンに 基づく回答者への質問推薦. 日本データベース学会論文誌 8(1), pp. 89 94, Jun.2009. [4] 佐藤弘樹, 島田諭, 伏見卓恭, 福原知宏, 斉藤和巳, 佐藤哲司. 知
. 2 DEIM2010, No. B1-1, 2010. [5],.. 71, pp. 2 71 2 72, 2009. [6],,. Support vector machine. 2003(23), pp. 193 200, 2003.