言語間比較に基づくWikipediaの補完情報抽出手法の提案

Size: px
Start display at page:

Download "言語間比較に基づくWikipediaの補完情報抽出手法の提案"

Transcription

1 2012 年度修士論文発表 2013 年 2 月 15 日 言語間比較に基づく Wikipedia の 補完情報抽出手法の提案 甲南大学大学院自然科学研究科 情報システム工学専攻灘本研究室 藤原裕也

2 背景 Wikipedia 特徴 285 以上の多言語版が存在 誰でも記事を編集することが可能 問題 ある話題に対しての情報が不足している記事が多く存在情報補完 他の Web から情報補完する 他の言語版から情報補完する etc 言語版によって書いてある内容が異なる

3 例 : 日本の文化 検索 Query: たこ焼き 英語版 日本語版 外国人ユーザ 理由 編集者が少ない 十分な知識を持っていない Contents 1 Takoyaki pan 2 See also 3 References 補完 目次 1 概要 2 材料 2.1 生地 2.2 具 2.3 味付け 3 食べ方 4 歴史 5 大阪のたこ焼き 6 器具 6.1 業務用 6.2 家庭用 7 日本国外におけるたこ焼き 7.1 朝鮮文化圏 7.2 中国文化圏 7.3 東南アジア 8 関連事項

4 目的 閲覧している Wikipedia に不足している情報を他言語 Wikipedia から補完する 英語版 日本語版 外国人ユーザ 理由 編集者が少ない 十分な知識を持っていない Contents 1 Takoyaki pan 2 See also 3 References 補完 比較 目次 1 概要 2 材料 2.1 生地 2.2 具 2.3 味付け 3 食べ方 4 歴史 5 大阪のたこ焼き 6 器具 6.1 業務用 6.2 家庭用 7 日本国外におけるたこ焼き 7.1 朝鮮文化圏 7.2 中国文化圏 7.3 東南アジア 8 関連事項 補完情報を抽出 補完情報を抽出

5 全体の流れ 1 比較対象記事の決定 閲覧記事 同じタイトルを持つ他言語の記事 関連する記事 1 関連する記事 2 ユーザ 比較 関連する記事 n 補完 補完情報抽出 比較対象記事 2 比較対象領域の決定

6 1 比較対象記事の決定 言語や文化の違いから情報の粒度が異なる 対応する記事が複数にまたがる場合がある 例 : 剣道 英語版 : 二刀流や剣道家の説明が含まれている 日本語版 : 二刀流, 剣道家一覧の記事が各々存在する Kendo Kendoka Nitoryu 剣道 二刀流 剣道家一覧 二刀流 剣道家一覧 比較対象記事の決定 リンク構造解析 中間発表 関連度

7 2 比較対象領域の決定 以前, 関連度を用いて抽出した比較対象記事に対し補完情報の抽出を行った 閲覧記事に関係ない情報が抽出される場合が存在した 例 : 剣道と二刀流の場合 剣道の情報は一部分のみ 西洋剣術の二刀流など 関係のない情報 比較対象領域を決定する必要がある

8 2 比較対象領域の決定 得られた比較対象記事に対し記事の分類を行う 比較基準記事 閲覧記事と同じタイトルを持つ他言語の記事例 : Kendo に対する 剣道 包含関係記事 比較基準記事と包含関係にある記事例 : 剣道 と 剣道家一覧 の関係 部分一致記事 記事の一部分が比較基準記事と関係する記事例 : 剣道 と 二刀流 の関係 剣道 剣道 剣道 剣道家一覧 Kendo 二刀流

9 2 比較対象領域の決定 得られた比較対象記事に対し記事の分類を行う 比較基準記事 閲覧記事と同じタイトルを持つ他言語の記事例 : Kendo に対する 剣道 包含関係記事 比較基準記事と包含関係にある記事例 : 剣道 と 剣道家一覧の関係 部分一致記事 記事の一部分が比較基準記事と関係する記事例 : 剣道 と 二刀流 の関係 剣道 剣道 剣道 剣道家一覧 Kendo 二刀流

10 比較基準記事 閲覧記事と同じタイトルを持つ他言語の記事 例 : Kendo に対する 剣道 分類方法 閲覧記事に存在する言語間リンクを用いて分類 他言語へのリンク 剣道 Kendo 英語版 :Kendo

11 2 比較対象領域の決定 得られた比較対象記事に対し記事の分類を行う 比較基準記事 閲覧記事と同じタイトルを持つ他言語の記事例 : Kendo に対する 剣道 包含関係記事 比較基準記事と包含関係にある記事例 : 剣道 と 剣道家一覧 の関係 部分一致記事 記事の一部分が比較基準記事と関係する記事例 : 剣道 と 二刀流 の関係 剣道 剣道 剣道 剣道家一覧 Kendo 二刀流

12 包含関係記事 比較基準記事と包含関係になっている記事 -> 比較基準記事と is-a 関係になっている記事 分類方法 例 : 剣道 と 剣道家一覧 の関係 中山らの提案する LSP 法を用いて分類 剣道 剣道家一覧 記事の冒頭文を重要文とし, その文に比較基準記事のアンカー文字列が存在する場合に包含関係記事として分類比較基準記事へのアンカー文字列 例 : 剣道家一覧 剣道家一覧は 剣道で活躍した人の一覧 参考文献 :Nakayama,K.: Wikipedia Mining for Triple Extraction Enhanced by Co-reference Resolution Proceedings of the 1 St International Workshop on Social Data on the Web (SDoW 08)

13 2 比較対象領域の決定 得られた比較対象記事に対し記事の分類を行う 比較基準記事 閲覧記事と同じタイトルを持つ他言語の記事例 : Kendo に対する 剣道 包含関係記事 比較基準記事と包含関係にある記事例 : 剣道 と 剣道家一覧 の関係 部分一致記事 記事の一部分が比較基準記事と関係する記事例 : 剣道 と 二刀流 の関係 剣道 剣道 剣道 剣道家一覧 Kendo 二刀流

14 部分一致記事 記事の一部分が比較基準記事と関係する記事 例 : 剣道 と 二刀流 との関係 分類方法 比較対象記事から比較基準記事と包含関係記事を除いたすべての記事 比較対象記事 包含関係記事 剣道 二刀流 部分一致記事 比較基準記事 包含関係記事

15 2 比較対象領域の決定 分類 比較基準記事 包含関係記事 部分一致記事 比較領域の決定 比較基準記事 包含関係記事 記事全体を比較 部分一致記事 セクションのタイトルに比較基準記事のアンカー文字列を含む場合 サブセクションのタイトルに比較基準記事のアンカー文字列を含む場合 記事本文中に比較基準記事のアンカー文字列を含む場合

16 2 比較対象領域の決定 分類ごとに補完情報を抽出するために, 閲覧記事と比較対象となる領域を決定し補完情報を抽出 比較基準記事 包含関係記事 閲覧記事との関係が強いと考え記事全体を比較対象とする セグメントセグメント セグメント 比較 セグメント セグメント 補完情報 閲覧記事のすべてのセグメント閲覧記事 (Kendo) に対し類似度がある閾値以下比較基準記事 ( 剣道 )

17 部分一致記事 2 比較対象領域の決定 セクションのタイトルに比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 タイトル セクション サブセクション サブセクションのタイトルに比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 セクション タイトル サブセクション セグメント n サブセクション セグメント n サブセクション 閲覧記事 部分一致記事 閲覧記事 部分一致記事 記事本文中に比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 セクション セグメント n 閲覧記事 セクション 部分一致記事

18 2 比較対象領域の決定 セクションのタイトルに比較基準記事のタイトルを含む場合 サブセクションを含めそのセクション全体を比較対象とする 比較基準記事のタイトル セグメント 1 セグメント 2 比較 1 剣道における 1.1 歴史 比較領域 セグメント n 1.2 試合 Kendo( 閲覧記事 ) 2 西洋剣術 鍔迫り合い ( 部分一致記事 )

19 部分一致記事 2 比較対象領域の決定 セクションのタイトルに比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 タイトル セクション サブセクション サブセクションのタイトルに比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 セクション タイトル サブセクション セグメント n サブセクション セグメント n サブセクション 閲覧記事 部分一致記事 閲覧記事 部分一致記事 記事本文中に比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 セクション セグメント n 閲覧記事 セクション 部分一致記事

20 2 比較対象領域の決定 サブセクションのタイトルに比較基準記事のタイトルを含む場合 親セクションとそのサブセクションを比較対象とする セグメント 1 比較 1 日本 親セクション セグメント 剣術 セグメント n 1.2 剣道 比較基準記事のタイトル Kendo( 閲覧記事 ) 比較領域 1.3 スポーツ 兄弟セクションは比較基準記事と関係が弱いと考え, 比較対象領域としない 二刀流 ( 部分一致記事 )

21 部分一致記事 2 比較対象領域の決定 セクションのタイトルに比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 タイトル セクション サブセクション サブセクションのタイトルに比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 セクション タイトル サブセクション セグメント n サブセクション セグメント n サブセクション 閲覧記事 部分一致記事 閲覧記事 部分一致記事 記事本文中に比較基準記事のタイトルを含む場合 セグメント 1 セグメント 2 比較 セクション セグメント n 閲覧記事 セクション 部分一致記事

22 2 比較対象領域の決定 記事本文中に比較基準記事のタイトルを含む場合 比較基準記事のタイトルが含まれている段落のみを比較対象とする セグメント 1 比較 比較基準記事のタイトル 比較領域 セグメント 2 セグメント n Kendo( 閲覧記事 ) 道場 ( 部分一致記事 )

23 補完情報抽出の実験 補完情報抽出手法の有用性を示す実験を行った 実験内容 提案手法と Baseline の比較 Baseline: 比較対象領域の決定を行わない場合 適合率, 再現率,F 値の比較 比較言語版 閲覧言語 : 英語版 比較対象言語 : 日本語版 設定 ( 前実験より ) 関連度の式の α:3.0 関連度の閾値 β:0.2 補完情報抽出の閾値 γ:0.2 R i { ( TF S ) ( TF S sum i sum i n k 1 ik ik )}/ max( R im )

24 実験条件 正解データ : 閲覧記事に対し補完情報となる比較対象記事のセクションまたは段落

25 適合率 結果 再現率 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) クエリ F 値 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) クエリ 0.00 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) クエリ Number クエリ (1) My Neighbor Totoro( となりのトトロ ) (2) Doraemon( ドラえもん ) (3) Iaido( 居合道 ) (4) Manzai( 漫才 ) (5) Yukata( 浴衣 ) (6) Urashima Taro( 浦島太郎 ) (7) Pikachu( ピカチュウ ) (8) Kinkaku-ji( 鹿苑寺 ) (9) Hello_Kitty( ハローキティ ) (10) Kyudo( 弓道 ) 平均 ( 適合率 :0.60->0.86, 再現率 :0.68->0.62,F 値 :0.62->0.71)

26 結果の良い例 居合道 Baseline 部分一致記事である武道の称号の範士が抽出, しかし柔道や弓道の範士のように居合道に関係のない情報が抽出された 提案手法 範士, その中でも居合道の情報のみが抽出できた となりのトトロ Baseline 部分一致記事である狭山丘陵, 地理情報などとなりのトトロと関係のない情報が抽出された 提案手法 狭山丘陵, となりのトトロの舞台となったという情報が抽出できた

27 結果の悪い例 部分一致記事において補完情報と成り得ない情報が抽出される場合が存在した 例 : ドラえもん 部分一致記事として作者の藤子 F 不二雄が抽出 藤子 F 不二雄の記事では多くのセクションでドラえもんのアンカー文字列が出現 ドラえもん以外に多くの漫画を描いており, ドラえもんの補完情報とならない情報が抽出された 比較対象となる領域が正しく決定できない場合が存在

28 まとめと今後の課題 まとめ Wikipedia の多言語性に着目し, 内容の充実していない記事に対し他言語の Wikipedia を用いて, 情報の補完を行う手法を提案した 提案手法 比較対象記事の決定 比較対象領域の決定 比較対象記事の分類 領域ごとの補完情報抽出手法 今後の課題 補完情報の提示手法 他言語との比較 補完情報の分類

29 国際会議 ( 査読あり ):4 本 研究成果 (1) Yuya Fujiwara, Yu Suzuki, Yukio Konishi, Akiyo Nadamoto, Extracting Difference Information from Multilingual Wikipedia, The 14 th Asia-Pacific International Conference on Web Technologies and Applications (APWeb 12), April 11-13, 2012,Kunming, China Yuya Fujiwara, Yu Suzuki, Yukio Konishi, Akiyo Nadamoto, Extracting Lack of Information on Wikipedia by Comparing Multilingual Articles, The 14 th International Conference on Information Integration and Web-based Applications & Services(iiWAS 12), December 3-5, 2012, Bali, Indonesia. Yu Suzuki, Yuya Fujiwara, Yukio Konishi, Akiyo Nadamoto, Good Quality Complementary Information for Multilingual Wikipedia, The 13 th International Conference on Web Information System Engineering (WISE 12), November 28-30, 2012, Paphos, Cyprus. Yuya Fujiwara, Yu Suzuki, Yukio Konishi, Akiyo Nadamoto, Complementary Information for Wikipedia by Comparing Multilingual Articles, The 15 th Asia- Pacific International Conference on Web Technologies and Applications (APWeb 13), April 4-6, 2013, Sydney, Australia. (to appear)

30 研究成果 (2) Journal:1 本 Akiyo Nadamoto, Yuya Fujiwara, Yukio Konishi, Yu Suzuki, Extracting Complementary Information of Wikipedia from Different Language Articles, International Journal of Business Intelligence and Data Mining (IJBIDM) (to submitted)

31 研究成果 (3) 国内会議 ( 査読あり ):4 本 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 情報の質を考慮した多言語 Wikipedia 記事の差異情報抽出手法の提案, 第 4 回データ工学と情報マネジメントに関するフォーラム,(DEIM2012),2012 年 3 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 多言語 Wikipedia を用いた Wikipedia の高品質な情報補完手法の提案, 第 3 回ソーシャルコンピューティングシンポジウム,(SoC2012),2012 年 6 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 言語間比較による Wikipedia の補完情報抽出手法の提案, 第 5 回 Web とデータベースに関するフォーラム, (WebDB Forum2012),2012 年 11 月 ( 学生奨励賞 ) 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 異言語 Wikipedia を用いた補完情報の提示手法の提案, 第 5 回データ工学と情報マネジメントに関するフォーラム,(DEIM2013),2013 年 3 月 (to appear)

32 研究成果 (4) 研究会発表 :3 本 藤原裕也, 灘本明代, Wikipedia の言語間比較による差異情報抽出手法の提案, 第 152 回データベースシステム研究会,(DBS152),2011 年 8 月 藤原裕也, 鈴木優, 灘本明代, 多言語 Wikipedia の差異情報抽出手法の提案, 第 153 回データベースシステム研究会,(DBS153),2011 年 11 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, コンテンツの質を考慮した多言語 Wikipedia 記事の差異情報抽出手法の提案, 人工知能学会第 26 回全国大会, (JSAI2012),2012 年 6 月

33 研究成果 (5) ポスター発表 :6 本 藤原裕也, 鈴木優, 灘本明代, 多言語 Wikipedia の差異情報抽出手法の提案, 第 153 回データベースシステム研究会,(DBS153),2011 年 11 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 情報の質を考慮した多言語 Wikipedia 記事の差異情報抽出手法の提案, 第 4 回データ工学と情報マネジメントに関するフォーラム,(DEIM2012), 2012 年 3 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, コンテンツの質を考慮した多言語 Wikipedia 記事の差異情報抽出手法の提案, 人工知能学会第 26 回全国大会,(JSAI2012),2012 年 6 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 多言語 Wikipedia を用いた Wikipedia の高品質な情報補完手法の提案, 第 3 回ソーシャルコンピューティングシンポジウム,(SoC2012),2012 年 6 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 言語間比較による Wikipedia の補完情報抽出手法の提案, 第 5 回 Web とデータベースに関するフォーラム,(WebDB Forum2012),2012 年 11 月 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 異言語 Wikipedia を用いた補完情報の提示手法の提案, 第 5 回データ工学と情報マネジメントに関するフォーラム,(DEIM2013),2013 年 3 月 (to appear)

34 賞 学生奨励賞 藤原裕也, 鈴木優, 小西幸男, 灘本明代, 言語間比較による Wikipedia の補完情報抽出手法の提案, 第 5 回 Web とデータベースに関するフォーラム,(WebDB Forum2012), 2012 年 11 月 ( 学生奨励賞 )

35 まとめと今後の課題 まとめ Wikipedia の多言語性に着目し, 内容の充実していない記事に対し他言語の Wikipedia を用いて, 情報の補完を行う手法を提案した 提案手法 比較対象記事の決定 比較対象領域の決定 比較対象記事の分類 領域ごとの補完情報抽出手法 補完情報提示手法 今後の課題 補完情報の提示手法 他言語との比較 補完情報の分類

36

37

38 英語の翻訳 GENE95 辞書 Microsoft api Google Ajax api Wikipedia 他言語へのリンク 単語の多義性を考慮していない

39 全体の流れ 1 比較対象記事の決定 閲覧記事 同じタイトルを持つ他言語の記事 関連する記事 1 関連する記事 2 ユーザ 比較 関連する記事 n 4 補完 3 補完情報提示手法 補完情報抽出 比較対象記事群 2 比較対象領域の決定

40 1 比較対象記事の決定 リンク構造解析 関連している記事同士はリンク関係にある リンクグラフの生成 剣道家一覧双 0.23 剣道 双 0.3 二刀流 双 0.05 平成 比較 関連度が低い Kendo 強連結 : 関連性が強い 関連度計算 閾値以下を取り除く 片 企業 双方向リンクでない 補完情報抽出 比較対象ページの取得

41 1 比較対象記事の決定 過去の手法 リンクグラフのノード間を Cos 類似度で計算 適合率 :35%, 再現率 :49%,F 値 :41 精度が低かった 関連度 アンカー文字列の出現位置 Batting Cricket 双方向リンク注目した記事と記事との関連する度合い サマリにリンクを張っている記事は関連性が高い アンカー文字列の出現回数 コンテンツの類似性 記事に何度も出現するアンカー文字列は関連性が高い 関連する記事はある程度内容が似ている

42 関連度 1 比較対象記事の決定 一番初めの説明部分 サマリ セグメント セグメント 記事をサマリとセグメントに分割 セグメント

43 1 比較対象 Wikipedia の記事の決定 関連度 アンカー文字列の出現位置 サマリエリア クエリがタイトルのページ ( 例 :Cricket) タイトル : サマリ セグメント A セクション 1 セグメント B セクション 2 アンカー文字列アンカー文字列 双方向リンクの記事 ( 例 :Batting) セグメント n セクション n 基準記事 比較対象記事のアンカー文字列が基準記事のサマリ, どのセグメントに出現するかを求める

44 関連度 1 比較対象記事の決定 アンカー文字列の出現回数 サマリエリア クエリがタイトルのページ ( 例 :Cricket) タイトル : サマリ セグメント A セクション 1 セグメント B セクション 2 出現回数計算出現回数計算 双方向リンクの記事 ( 例 :Batting) セグメント n セクション n 基準記事 比較対象記事のアンカー文字列が出現するサマリ, セグメントに対し比較対象記事のアンカー文字列の出現回数を求める

45 関連度 1 比較対象記事の決定 コンテンツの類似性 クエリがタイトルのページ ( 例 :Cricket) サマリエリア タイトル : サマリ セグメント A セクション 1 セグメント B セクション 2 比較 比較 双方向リンクの記事 ( 例 :Batting) セグメント n セクション n 基準記事 比較対象記事のアンカー文字列が出現するサマリ, セグメントに対し比較対象記事との類似度を計算

46 関連度 サマリエリア セグメント A 1 比較対象記事の決定 クエリがタイトルのページ ( 例 :Cricket) タイトル : サマリ セクション 1 セグメント B セクション 2 アンカー文字列 比較 アンカー文字列 比較 双方向リンクの記事 ( 例 :Batting) R i セグメント n セクション n 基準記事 { ( TF S ) ( TF S sum i sum i n k 1 ik ik )}/ max( R im ) i: 比較対象ノード TFsumi のサマリのアンカー文字列の出現回数 Ssumi のサマリと比較対象記事との類似度 TFik のあるセグメントのアンカー文字列の出現回数 Sik のあるセグメントと比較対象記事との類似度 n: ある l のリンクを張っているセグメントの数 max(rim): 比較対象記事群の Ri の最大値

47 2 コンテンツの比較 Wikipedia の記事は構造に基づいて段落に分かれている 意味的に分かれている可能性が高い 各々の段落におけるコンテンツ同士の類似度を求める 全てのコンテンツに対しある閾値以下である段落を補完情報として抽出 セグメント 1 セグメント 2 比較 セグメント 1 セグメント 2 セグメント n 閲覧記事 セグメント n 比較対象記事

48 2 コンテンツの比較 例 : フィッシュ アンド チップス 記事をセグメントという単位に分ける セグメントセグメントセグメント 閲覧記事 セグメント セグメント 比較対象記事

49 2 コンテンツの比較 例 : フィッシュ アンド チップス 各々の段落におけるコンテンツ同士の類似度を求める 全てのコンテンツに対しある閾値以下である段落を補完情報として抽出 名詞の出現頻度を抽出 名詞の出現頻度を抽出 名詞の出現頻度を抽出 セグメント セグメント セグメント 閲覧記事 セグメント 閲覧記事の全てのセグメントに対し補完情報類似度が閾値以下 セグメント 比較対象記事 名詞の出現頻度を抽出 名詞の出現頻度を抽出 Cos( x, y) x x 2 i i y j y 2 j xi: 日本語版記事の名詞の出現頻度 yi: 英語版記事の名詞の出現頻度

50 4 補完情報の提示 補完情報抽出手法により得られた補完情報の提示 補完情報の提示 補完情報と閲覧記事との関連性に基づき閲覧記事の適した場所に補完情報へのリンクを張りユーザに提示 関連性 目次のタイトル ページ構造 類似性

51 4 補完情報の提示 目次のタイトル 1: 補完情報の目次のタイトルに注目 補完情報の目次のタイトルに注目し, タイトルの名詞を含む閲覧記事の目次に補完を行う 1 History 1 歴史 閲覧言語に翻訳 2 Practitioners マッチング 1.1 江戸時代 服装 equipment 用具 clothing 4 Equipment and clothing 補完 4 服装 用具 名詞抽出 補完情報 Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

52 4 補完情報の提示 ページ構造 2: 1 で補完できないかつ補完情報がサブセクションの場合 サブセクションは親セクションを詳細に記載していると考え, その親セクションに注目し, 親セクションのタイトルの名詞を含んでいる閲覧記事の目次に補完を行う 1 History 補完マッチング 1 歴史 名詞抽出 閲覧言語に翻訳 歴史 History 2 Practitioners 1.1 江戸時代 4 Equipment and clothing 1.5 年表 補完情報 Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

53 4 補完情報の提示 類似性 3: 1 と 2 で補完できない場合 関連している情報はある程度類似していると考え類似度を計算 閾値 δ 以上の場合 : その中で最も高い値の場所へ補完 1 History 1 歴史 2 Practitioners 類似度計算 2 組織統括 7 Rules of Competition 補完 6.6 審判員 補完情報 類似度 ( 高 ) Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

54 4 補完情報の提示 類似性 3: 1 と 2 で補完できない場合 関連している情報はある程度類似していると考え類似度を計算 閾値 δ 未満の場合 : 新しい情報として関連項目の手前に補完 1 History 1 歴史 閾値 δ 未満 2 Practitioners 類似度計算 2 組織統括 閾値 δ 未満 13 See also 6.6 審判員 補完情報 閾値 δ 未満 Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

55 プロトタイプシステム

56 プロトタイプシステム

57 プロトタイプシステム

58 実験 1: 比較対象記事の決定 比較対象記事の決定 補完情報抽出 比較対象記事決定の閾値の設定とその精度を測った R i 実験内容 関連度と Baseline Baseline:Cos 類似度 再現率, 適合率,F 値を比較 比較言語版 条件 閲覧言語 : 日本語版 比較対象言語 : 英語版 α=1 10 を 1 刻み 閾値 0 1 を 0.05 刻み { ( TF S ) ( TF S sum i sum i n k 1 ik ik )}/ max( R im ) Cricket Hockey Batting Laws of cricket 双方向リンクでない

59 実験 1: 比較対象記事の決定 比較対象記事の決定 補完情報抽出 クエリ 正解データ数 Bannock(food) 2 正解データ : 比較対象記事に成り得る記事 Warwick Castle 2 Black dog (ghost) 7 Fish and chips 4 Goodwood Festival of Speed 2 Bowls 2 適合率 抽出した比較対象記事 正解データ抽出した比較対象記事 Burleque 3 Flag of Scotland 6 Gaelic handball 4 抽出した比較対象記事 正解データ再現率 正解データ Kipper 3 Natinal Gallery of Scotland 12 Lipton 1

60 実験 1: 比較対象記事の決定 比較対象記事の決定 補完情報抽出 F 値 0.6 実験 1: 各閾値と α における F 値の平均 α=1 α=2 α=3 α=4 α=5 α=6 α=7 α=8 α=9 α= 閾値 グラフより α=3 で閾値が 0.2 の時に最も高い F 値を得ることができたよって α=3 閾値を 0.2 と設定する

61 実験 1: 比較対象記事の決定 適合率再現率 1 1 比較対象記事の決定 補完情報抽出 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) クエリ F 値 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) クエリ (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) クエリ Number クエリ 正解データ (1) Bannock (food) 2 (2) Warwick Castle 2 (3) Black dog (ghost) 7 (4) Fish and chips 4 (5) Goodwood Festival of Speed 2 (6) Bowls 2 (7) Burlesque 3 (8) Flag of Scotland 6 (9) Gaelic handball 4 (10) Kipper 3 (11) National Gallery of Scotland 12 (12) Lipton 1 平均 ( 適合率 :0.37->0.59, 再現率 :0.45->0.64,F 値 :0.36->0.52)

62 実験 1: 比較対象記事の決定 比較対象記事の決定 補完情報抽出 結果の良い例 (Gaelic handball) Baseline 関連する記事である GAA Handball という Gaelic handball の理事会の記事が抽出できなかった Gaelic handball と Gaelic handball の理事会の場合は理事会は Gaelic handball の競技の説明をしているわけではない. 値が低くなり抽出できなかった 比較 Gaelic handball GAA handball

63 実験 1: 比較対象記事の決定 比較対象記事の決定 補完情報抽出 結果の良い例 (Gaelic handball) 提案手法 関連する記事である GAA Handball が抽出 Gaelic handball の記事の中にある Gaelic handball の理事会を説明している部分と Gaelic handball の理事会の記事を比較. 関連度が高くなり抽出できた GAA Handball の説明 比較 Gaelic handball GAA handball

64 実験 1: 比較対象記事の決定 比較対象記事の決定 補完情報抽出 比較対象記事であるにも関わらず比較対象記事として抽出されない記事が存在した 例 :Bowls 比較対象記事である World Bowls Events が抽出できなかった アンカー文字列が See also( 関連項目 ) に出現 コンテンツ量が豊富ではない World Bowls Events について情報がほとんどない World Bowls Events のアンカー文字列が一回しか出現しない 関連度であると Bowls の See also の部分と World Bowls Events の記事の内容全てとの比較し計算する See also( 関連項目 ) 関連度が低くなり抽出できなかった

65 評価実験 2: 補完情報抽出 比較対象記事の決定 補完情報抽出 得られた比較対象記事と閲覧記事を用いて補完情報抽出を行い最適な閾値を求めた 内容 コンテンツの比較の際の閾値 条件 閾値 0 1 を 0.05 刻み 補完情報の適合率 再現率 F 値 比較言語 閲覧言語 : 日本語版 比較対象言語 : 英語版 実験対象記事 : 評価実験 1 と同じ セグメント 1 セグメント 2 セグメント n 閲覧記事 比較 セグメント 1 セグメント 2 セグメント n 比較対象記事

66 評価実験 2: 補完情報抽出 比較対象記事の決定 補完情報抽出 図より閾値が 0.2 の時に適合率, 再現率が交わり共に高い値となったこれにより, 本研究では閾値を 0.2 と設定し補完情報の抽出を行う

67 評価実験 3: 提案手法の精度 比較対象記事の決定 補完情報抽出 提案手法の有用性を示すための評価実験を行った 内容 提案手法で得られた補完情報の適合率 再現率 F 値 比較言語 閲覧言語 : 日本語版 比較対象言語 : 英語版 実験対象記事 : 評価実験 1 と同じ 設定 関連度の式の α:3.0( 評価実験 1 より ) 関連度の閾値 β:0.2( 評価実験 1 より ) コンテンツの比較の閾値 γ:0.2( 評価実験 2 より )

68 評価実験 3: 提案手法の精度 比較対象記事の決定 補完情報抽出 クエリ 正解データ数 Bannock(food) 2 Warwick Castle 12 Black dog (ghost) 32 Fish and chips 11 Goodwood Festival of Speed 10 正解データ : 補完情報となるセグメント抽出した補完情報 正解データ適合率 抽出した補完情報 Bowls 9 Burleque 22 Flag of Scotland 56 Gaelic handball 16 Kipper 16 Natinal Gallery of Scotland 4 再現率 抽出した補完情報 正解データ正解データ Lipton 8

69 評価実験 3: 提案手法の精度 比較対象記事の決定 補完情報抽出 クエリ 提案手法適合率再現率 F 値 Bannock (food) Warwick Castle Black dog (ghost) Fish and chips Goodwood Festival of Speed Bowls Burlesque Flag of Scotland Gaelic handball Kipper National Gallery of Scotland Lipton 平均 適合率の平均 :0.67, 再現率の平均 :0.79,F 値の平均 :0.71 高い結果を得ることができ提案手法の有用性を示すことができた

70 評価実験 3: 提案手法の精度 比較対象記事の決定 補完情報抽出 結果の良い例 Lipton 日本語版にはティーパックの説明しかない 英語版にはトーマスリプトンがイエローラベルを考えたなど情報が存在, そのイエローラベルの情報が補完情報として抽出された Fish and Chips 比較対象記事としてマッシピーの記事が抽出 地域によるマッシピーの種類について情報が抽出

71 評価実験 3: 提案手法の精度 比較対象記事の決定 補完情報抽出 閲覧記事と関係のない情報が補完情報として抽出される場合が存在した 例 :Black dog (ghost) 関連する記事として Hanging Hills というアメリカに存在する丘の記事が抽出された この丘はブラック ドッグが伝承されている Hanging Hills の記事にはブラック ドッグの情報は一部分 この丘の地理情報や地質などはブラック ドッグの補完情報に成り得ない 今後は関係のない情報の削除を考える必要がある

72 実験 1 実際に LSP 法により包含関係記事が抽出できるか実験を行った 条件 判定 対象 比較基準記事と包含関係であるかどうか 適合率, 再現率,F 値 比較基準記事に双方向リンクされている全ての記事 クエリ 双方向リンクの記事数 包含関係記事の数 漫才 24 8 マナー 4 3 居合道 7 4 忍者 正岡子規 23 7 下駄 10 2 扇子 6 3 寿司 花札 9 5 剣道 58 32

73 実験 1 結果 考察 クエリ 包含関係記事の例 漫才浪曲漫才ツッコミ マナーレディーファースト日本の食事作法 寿司稲荷寿司ちらし寿司 適合率 :0.73, 再現率 :0.86,F 値 :0.77 リード部分に比較基準記事のアンカー文字列が存在しないにも関わらず包含関係になっている記事が存在. 例 :-> 寿司と大村寿司 リード部分に比較基準記事のアンカー文字列が存在するにも関わらず包含関係ではない記事が存在例 :-> 正岡子規と夏目漱石

74 実験 2 部分一致記事が抽出の精度とその比較領域の精度を測った 条件 判定 対象 比較基準記事と部分一致記事であるかどうか 適合率, 再現率,F 値 比較基準記事に双方向リンクされている全ての記事 クエリ 双方向リンクの記事数 部分一致記事の数 となりのトトロ 28 1 ドラえもん 34 2 居合道 7 2 漫才 29 2 浴衣 6 4 結果 適合率 :0.99, 再現率 :0.96,F 値 :0.97 浦島太郎 10 5 ピカチュウ 12 3 鹿苑寺 18 4 ハローキティ 30 8 弓道 24 4

75 実験 3 部分一致記事の比較領域の精度の測った 条件 判定 対象 比較領域が閲覧記事と関係があるか 適合率, 再現率,F 値 比較基準記事に双方向リンクされている全ての記事 データセット 実験 2 と同じ

76 実験 3 結果 適合率 :0.73, 再現率 :0.81,F 値 :0.74 考察 アンカー文字列が存在する段落にも関わらず比較領域にならないものが存在 ( 例 : ドラえもん ) 比較対象記事として作者の藤子 F 不二雄が抽出. 彼は他にも多くの漫画を描いており, ドラえもんと関係のない情報も抽出された セクション全体が比較領域になるはずが段落のみになる場合が存在 ( 例 : 浦島太郎 ) 本来, 丹後国風土記のセクションである浦島伝説が比較領域であるがアンカー文字列を含んでない 浦島太郎の類義語が浦島伝説

77 考察 比較対象となる領域が正しく決定できない場合が存在 例 : 浦島太郎 部分一致記事として荘内半島が抽出 浦島伝説は浦島太郎の同義語 比較対象 荘内半島

78 補完情報提示の実験 補完情報提示手法の有用性を示す実験を行った 実験内容 補完情報抽出手法により抽出できた補完情報を用いて最適な閾値 δ と補完情報提示の適合率を測った 比較言語版 閲覧言語 : 英語版 比較対象言語 : 日本語版 実験条件 閾値 δ:0~0.2 の範囲を 0.05 刻み

79 補完情報提示の実験 結果補完情報提示の適合率平均適合率 平均適合率 適合率 閾値 δ 閾値 0.07 の時に最も高い適合率を得ることができた. よって本研究では閾値 δ を 0.07 とし補完情報の補完を行う.

80 補完情報提示の実験 結果 1 0 考察 適合率 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) # クエリ 適合率 (1) My Neighbor Totoro( となりのトトロ ) 0.53 (2) Ninja( 忍者 ) 0.67 (3) Urashima Taro( 浦島太郎 ) 0.71 (4) Yukata( 浴衣 ) 0.5 (5) Doraemon( ドラえもん ) 0.65 (6) Hello Kitty( ハローキティ ) 0.65 (7) Iaido( 居合道 ) 0.71 (8) Kendo( 剣道 ) 0.83 (9) Kyudo( 弓道 ) 0.75 (10) Manzai( 漫才 ) 0.67 (11) Tempura( 天ぷら ) 0.61 (12) Onigiri( おにぎり ) 0.5 平均 結果の良かった例として Kyudo( 弓道 ) が挙げられる. Kyudo の補完情報として 弓道場 が Kyudo の道場について説明している場所に補完することができた さらに Kyudo に記載されていない 礼法 の情報が新しい情報として See also の手前に補完することができた

81 補完情報提示の実験 結果適合率 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) 考察 # クエリ 適合率 (1) My Neighbor Totoro( となりのトトロ ) 0.53 (2) Ninja( 忍者 ) 0.67 (3) Urashima Taro( 浦島太郎 ) 0.71 (4) Yukata( 浴衣 ) 0.5 (5) Doraemon( ドラえもん ) 0.65 (6) Hello Kitty( ハローキティ ) 0.65 (7) Iaido( 居合道 ) 0.71 (8) Kendo( 剣道 ) 0.83 (9) Kyudo( 弓道 ) 0.75 (10) Manzai( 漫才 ) 0.67 (11) Tempura( 天ぷら ) 0.61 (12) Onigiri( おにぎり ) 0.5 平均 結果の悪かったものとしてある補完情報が本来複数の場所に補完されるべきである場合が存在した 関連する記事として抽出した比較対象記事の補完情報に対しては正しく補完されない場合が存在した

82

83 補完情報の提示 パターン 1 補完情報と閲覧記事との関連性に基づき閲覧記事の適した場所に補完情報へのリンクを張りユーザに提示 1. 補完情報の目次のタイトルから名詞を抽出 2. 名詞を閲覧言語に翻訳 3. 翻訳した名詞と閲覧記事の目次全てとマッチング 4. 翻訳した名詞を含んでいる閲覧記事の目次に補完情報へのリンク挿入 1 History 1 歴史 閲覧言語に翻訳 2 Practitioners 1.1 江戸時代 服装 equipment 用具 clothing 4 Equipment and clothing 補完 4 服装 用具 名詞抽出 補完情報 Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

84 補完情報の提示 パターン 1 で補完できないかつ補完情報がサブセクションの場合 サブセクションは親セクションを詳細に記載していると考え, その親セクションに注目 1. そのサブセクションの親セクションの目次のタイトルから名詞を抽出 2. その名詞を閲覧言語に翻訳 3. 翻訳した名詞と閲覧記事の目次全てとマッチング 4. 翻訳した名詞を含んでいる閲覧記事の目次に補完情報を挿入 補完 名詞抽出 1 History 1 歴史 閲覧言語に翻訳 歴史 History 2 Practitioners 1.1 江戸時代 4 Equipment and clothing 1.5 年表 補完情報 Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

85 補完情報の提示 パターン 1 とパターン 2 で補完できない場合 関連している情報はある程度類似していると考え類似度が最も高い場所に補完 1. 閲覧記事をセグメントに分割 2. 閲覧記事の各セグメントと補完情報との類似度を計算 3. 類似度がある閾値 δ 以上の場合はその中で最も高い値の場所へ補完類似度がある閾値 δ 未満の場合は新しい情報として関連項目の手前に補完閾値 δ 以上の場合 1 History 1 歴史 2 Practitioners 類似度計算 2 組織統括 7 Rules of Competition 補完 6.6 審判員 補完情報 類似度 ( 高 ) Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

86 補完情報の提示 パターン 1 とパターン 2 で補完できない場合 関連している情報はある程度類似していると考え類似度が最も高い場所に補完 1. 閲覧記事をセグメントに分割 2. 閲覧記事の各セグメントと補完情報との類似度を計算 3. 類似度がある閾値 δ 以上の場合はその中で最も高い値の場所へ補完類似度がある閾値 δ 未満の場合は新しい情報として関連項目の手前に補完閾値 δ 未満の場合 1 History 1 歴史 2 Practitioners 類似度計算 2 組織統括 13 See also 6.6 審判員 補完情報 Kendo( 閲覧記事 ) 剣道 ( 比較対象記事 )

言語間比較によるWikipediaの補完情報抽出手法の提案

言語間比較によるWikipediaの補完情報抽出手法の提案 言語間比較による Wikipedia の 補完情報抽出手法の提案 藤原裕也 ( 甲南大学 ) 鈴木優 ( 名古屋大学 ) 小西幸男 ( 甲南大学 ) 灘本明代 ( 甲南大学 ) 背景 Wikipedia 特徴 284 以上の多言語版が存在 誰でも記事を編集することが可能 問題 ある話題に対しての情報が不足している記事が多く存在情報補完 他のWebから情報補完する 他の言語版から情報補完する etc

More information

言語間比較に基づくWikipediaの補完情報抽出手法の提案

言語間比較に基づくWikipediaの補完情報抽出手法の提案 異言語 Wikipedia を用いた 補完情報の提示手法の提案 藤原裕也 ( 甲南大学 ) 鈴木優 ( 名古屋大学 ) 小西幸男 ( 甲南大学 ) 灘本明代 ( 甲南大学 ) 背景 Wikipedia 特徴 285 以上の多言語版が存在 誰でも記事を編集することが可能 問題 ある話題に対しての情報が不足している記事が多く存在情報補完 他の Web から情報補完する 他の言語版から情報補完する etc

More information

IPSJ SIG Technical Report Vol.2011-DBS-153 No /11/3 Wikipedia Wikipedia Wikipedia Extracting Difference Information from Multilingual Wiki

IPSJ SIG Technical Report Vol.2011-DBS-153 No /11/3 Wikipedia Wikipedia Wikipedia Extracting Difference Information from Multilingual Wiki Wikipedia 1 2 3 Wikipedia Wikipedia Extracting Difference Information from Multilingual Wikipedia Yuya Fujiwara, 1 Yu Suzuki 2 and Akiyo Nadamoto 3 There are multilingual articles on the Wikipedia. The

More information

DEIM Forum 2012 E8-4 Wikipedia y

DEIM Forum 2012 E8-4 Wikipedia y DEIM Forum 2012 E8-4 Wikipedia 658-8501 8-9-1 464-8601 658-8501 8-9-1 658-8501 8-9-1 E-mail: life.of.151a@gmail.co.jp, suzuki@db.itc.nagoya-u.ac.jp, ykonishi@center.konan-u.ac.jp, nadamoto@konan-u.ac.jp

More information

研究テーマ考案 ブログ記事を知識源とした 雑談メタファに基づく情報推薦

研究テーマ考案  ブログ記事を知識源とした 雑談メタファに基づく情報推薦 Twitter における見落とし情報の 話題構造抽出手法 自然科学研究科知能情報学専攻 21424003 灘本研究室大原啓詳 背景 Twitter におけるユーザ同士の繋がり フォロワー Follow 共通の趣味 興味のある事柄について詳しいユーザ フォロイー 多くフォロイーをフォローする 詳細な情報 多様な情報を取得できる 背景 一方で 多くのユーザをフォロー タイムライン上には大量のツイートが流れる

More information

話題と感情の可視化に基づくフォロイー推薦

話題と感情の可視化に基づくフォロイー推薦 2015 年度修士論文発表 2016 年 2 月 13 日 Twitter の感情抽出に基づく フォロイー推薦 甲南大学大学院自然科学研究科 知能情報学専攻灘本研究室 21424010 山本湧輝 2 は じめに Twitter の基本的な使い方 気になるユーザをフォローする そのユーザのツイートを見ることが出来る フォロー ツイート フォロイー 3 ユ ーザをフォローする理由 趣味嗜好が似ているユーザ

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

DEIM Forum 2014 P3-3 A Foreseeing System of Search Results based on Query Operations on the Graph Interface

DEIM Forum 2014 P3-3 A Foreseeing System of Search Results based on Query Operations on the Graph Interface DEIM Forum 2014 P3-3 A Foreseeing System of Search Results based on Query Operations on the Graph Interface 163-8677 1-24-2 E-mail: j110015@ns.kogakuin.ac.jp, kitayama@cc.kogakuin.ac.jp Web web 1. Web

More information

0210研究会

0210研究会 複数のソーシャルメディアのレビューを 用いた商品比較基盤技術の提案 甲南大学大学院自然科学研究科服部祐基 甲南大学知能情報学部灘本明代 背景 ソーシャルメディアを用いて情報を取得する行為が多くなっている 商品の購入 商品認知の情報源 購入のきっかけとなった情報源 として 約 40% ものインターネットユーザがソーシャルメディアを活用している 1),2) ソーシャルメディアの書き込みを商品購入の際の参考にしているユーザが多く存在している

More information

DEIM Forum 2010 A Web Abstract Classification Method for Revie

DEIM Forum 2010 A Web Abstract Classification Method for Revie DEIM Forum 2010 A2-2 305 8550 1 2 305 8550 1 2 E-mail: s0813158@u.tsukuba.ac.jp, satoh@slis.tsukuba.ac.jp Web Abstract Classification Method for Reviews using Degree of Mentioning each Viewpoint Tomoya

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 49 概要 50 は まとめ記事 などの長い文章の方が向いています 本文は 500 文字以上がおすすめです 画像を使って見やすいページを作成しましょう ブログ記事タイトル の特徴 SEO ブログ記事作成の流れ 写真 使い分け 長い文章に最適 ブログ記事タイトル記入 まとめ記事や閲覧者の役に立つ情報など リード文 を書く 目次 使用する機能 通常ブログ機能 アイキャッチ画像文字色変更 リンク追加 自由な画像追加

More information

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I Development of Digital Archive System of Comics Satoshi Tsutsui Kojima Kazuya The comic published in Japan is liked to read from of old by a lot of people, and builds our life and implications now. The

More information

書籍の感情情報に注目した作者の印象分析

書籍の感情情報に注目した作者の印象分析 甲南大学知能情報学部知能情報学科 灘本研究室 9734 片山稜麻 はじめに () 書籍を選ぶ時に ランキング 読後感 作者 話題性 はじめに () 書籍を選ぶ上で 作者の印象 作者の印象を決定する物が丌明瞭新しい作者を見つけにくい 目的作者の作品の感情情報を抽出可視化し 分析を行う新しい本を購入する際の判断要因に主人公である 自分 は 人間失格妹の婚礼を終えると 走れメロス可視化斜陽戦争が終わった昭和

More information

1. [5] Wikipedia 4. ( ) Wikipedia 5. 3 ( ) ( ) ( ) Wikipedia ( ) ( ) 2.2 Global Database of Events, Language and Tone (GDELT) Global Datab

1. [5] Wikipedia 4. ( ) Wikipedia 5. 3 ( ) ( ) ( ) Wikipedia ( ) ( ) 2.2 Global Database of Events, Language and Tone (GDELT) Global Datab GDELT Multifacet comparative analysis of newspaper articles from different conutries - Analysis based on Global Database of Events, Language and Tone (GDELT) - 1 2 Masaharu Yoshioka 1 Noriko Kando 2 1

More information

DEIM Forum 2015 F8-4 Twitter Twitter 1. SNS

DEIM Forum 2015 F8-4 Twitter Twitter 1. SNS DEIM Forum 2015 F8-4 Twitter 432 8011 3-5-1 432 8011 3-5-1 E-mail: cs11032@s.inf.shizuoka.ac.jp, {yokoyama,fyamada}@inf.shizuoka.ac.jp Twitter 1. SNS SNS SNS Twitter 1 Twitter SNS facebook 2 mixi 3 Twitter

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

DEIM Forum 2014 P Web Web,,, 1. Web Web 1 Web Web Web. 2 3 Web

DEIM Forum 2014 P Web Web,,, 1. Web Web 1 Web Web Web. 2 3 Web DEIM Forum 204 P4-3 63-8677 -24-2 E-mail: j07@ns.kogakuin.ac.jp, kitayama@cc.kogakuin.ac.jp Web Web,,,. Web Web Web Web Web. 2 3 Web 4 5 2. 2. Web 2 Web Web Web Web 2. 2 [] A B R C R D 手法も異なる 3. Web 操作パターン抽出

More information

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO DEIM Forum 2012 C8-5 WikiBOK 252 5258 5 10 1 E-mail: shunsuke.shibuya@gmail.com, {kaz,masunaga}@si.aoyama.ac.jp, {yabuki,sakuta}@it.aoyama.ac.jp Body Of Knowledge, BOK BOK BOK BOK BOK, BOK Abstract Extention

More information

untitled

untitled DEIM Forum 2019 C1-2 305-8573 1-1-1 305-8573 1-1-1 () 151-0053 1-3-15 6F QA,,,, Detecting and Analysing Chinese Web Sites for Collecting Know-How Knowledge Wenbin NIU, Yohei OHKAWA,ShutoKAWABATA,ChenZHAO,TianNIE,

More information

untitled

untitled DEIM Forum 2019 B3-3 305 8573 1-1-1 305 8573 1-1-1 ( ) 151-0053 1-3-15 6F word2vec, An Interface for Browsing Topics of Know-How Sites Shuto KAWABATA, Ohkawa YOUHEI,WenbinNIU,ChenZHAO, Takehito UTSURO,and

More information

Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL. 3. 2 WIX 1 entry wid eid keyword targe

Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL. 3. 2 WIX 1 entry wid eid keyword targe DEIM Forum 2016 H6-5 Web Index 223 8522 3-14-1 E-mail: nanadama@db.ics.keio.ac.jp, toyama@ics.keio.ac.jp Web Index(WIX) (keyword) Web URL(target) (WIX ) Web ( ) Web URL Web WIX RSS WIX Web Index, Web,

More information

スライド 1

スライド 1 INIS International Nuclear Information System Repository Search クイックマニュアル (2017 年 6 月 ) 1 2 INIS は 130 ヶ国 24 国際機関の協力により作成している原子力分野の文献情報データベースです 論文 書籍の他 テクニカルレポート 会議論文集 (Proceedings) 等の文献情報を収録しており 個々の掲載論文単位で検索できます

More information

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエンジンは質の高いウェブページをどれだけ上位に並べられるかということが重要です 従来の検索エンジンでは検索された単語とそのページの関連性を元に評価をしていましたが ここに どれだけ注目されているか という指標を盛り込んだことが特筆すべきポイントです 具体的には 質の良い ( ページランクの高い

More information

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version Control System: VCS)?? 1 NNCT, 22 Yatatyou,Yamatokoriyamashi, Nara 639 1080, Japan

More information

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph 1 2 1 Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph Satoshi Shimada, 1 Tomohiro Fukuhara 2 and Tetsuji Satoh 1 We had proposed a navigation method that generates

More information

2 21,238 35 2 2 Twitter 3 4 5 6 2. 2.1 SNS 2.2 2. 1 [8] [5] [7] 2. 2 SNS SNS 2 2. 2. 1 Cheng [2] Twitter [6] 2. 2. 2 Backstrom [1] Facebook 3 Jurgens

2 21,238 35 2 2 Twitter 3 4 5 6 2. 2.1 SNS 2.2 2. 1 [8] [5] [7] 2. 2 SNS SNS 2 2. 2. 1 Cheng [2] Twitter [6] 2. 2. 2 Backstrom [1] Facebook 3 Jurgens DEIM Forum 2016 B4-3 地域ユーザに着目した口コミツイート収集手法の提案 長島 里奈 関 洋平 圭 猪 筑波大学 情報学群 知識情報 図書館学類 305 8550 茨城県つくば市春日 1 2 筑波大学 図書館情報メディア系 305 8550 茨城県つくば市春日 1 2 つくば市役所 305 8555 茨城県つくば市研究学園 1 1 1 E-mail: s1211530@u.tsukuba.ac.jp,

More information

スライド 1

スライド 1 2009 年度 VMStudio & TMStudio 学生研究奨励賞 テキストマイニングツールを 利用した視線データの分析 東京大学大学院工学系研究科 白山研究室 江川陽 樋渡哲郎 1 目次 背景 目的 手法 実験 結果 考察 結論 2 背景 : 視線分析とは 視線分析とは 人間の視線の移動軌跡や分布 ( 視線データ ) を計測 分析することにより 人の認知処理を観察 解明するための手法 近年,

More information

FIT2014( 第 13 回情報科学技術フォーラム ) RD-002 Web SNS Yuanyuan Wang Gouki Yasui Yuji Hosokawa Yukiko Kawai Toyokazu Akiyama Kazutoshi Sumiya 1. Twitter 1 Facebo

FIT2014( 第 13 回情報科学技術フォーラム ) RD-002 Web SNS Yuanyuan Wang Gouki Yasui Yuji Hosokawa Yukiko Kawai Toyokazu Akiyama Kazutoshi Sumiya 1. Twitter 1 Facebo RD-002 Web SNS Yuanyuan Wang Gouki Yasui Yuji Hosokawa Yukiko Kawai Toyokazu Akiyama Kazutoshi Sumiya 1. Twitter 1 Facebook 2 SNS SNS SNS Twitter SNS [1] SNS [2] Twitter Web Web Web Web SNS Web Web 2 Web

More information

SERPWatcher SERPWatcher SERP Watcher SERP Watcher,

SERPWatcher SERPWatcher SERP Watcher SERP Watcher, SERPWatcher 112-8610 2-1-1 112-8610 2-1-1 229-8558 5-10-1 E-mail: nakabe@db.is.ocha.ac.jp, chiemi@is.ocha.ac.jp SERPWatcher SERP Watcher SERP Watcher, SERP Analysis of transition of ranking in SERP Watcher

More information

内容 Visual Studio サーバーエクスプローラで学ぶ SQL とデータベース操作... 1 サーバーエクスプローラ... 4 データ接続... 4 データベース操作のサブメニューコンテキスト... 5 データベースのプロパティ... 6 SQL Server... 6 Microsoft

内容 Visual Studio サーバーエクスプローラで学ぶ SQL とデータベース操作... 1 サーバーエクスプローラ... 4 データ接続... 4 データベース操作のサブメニューコンテキスト... 5 データベースのプロパティ... 6 SQL Server... 6 Microsoft Visual Studio サーバーエクスプローラで学ぶ SQL とデータベース操作 Access 2007 と SQL Server Express を使用 SQL 文は SQL Server 主体で解説 Access 版ノースウィンドウデータベースを使用 DBMS プログラム サーバーエクスプローラ SQL 文 実行結果 データベース エンジン データベース SQL 文とは 1 度のコマンドで必要なデータを効率よく取得するための技術といえます

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

main.dvi

main.dvi DEIM Forum 2015 A1-4 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0051 5-13-18 101-8430 2-1-2,,,, A Complementary Framework for Collecting Know-How Knowledge based on Question-Answer Examples and Search Engine

More information

1 AND TFIDF Web DFIWF Wikipedia Web Web 2. 3. 4. AND 5. Wikipedia AND 6. Wikipedia Web 7. 8. 2. Ma [4] Ma URL AND Tian [8] Tian Tian Web Cimiano [3] [

1 AND TFIDF Web DFIWF Wikipedia Web Web 2. 3. 4. AND 5. Wikipedia AND 6. Wikipedia Web 7. 8. 2. Ma [4] Ma URL AND Tian [8] Tian Tian Web Cimiano [3] [ DEIM Forum 2015 B1-5 606 8501 606 8501 E-mail: komurasaki@dl.kuis.kyoto-u.ac.jp, tajima@i.kyoto-u.ac.jp Web Web AND AND Web 1. Twitter Facebook SNS Web Web Web Web [5] Bollegala [2] Web Web 1 Google Microsoft

More information

main.dvi

main.dvi DEIM Forum 2012 E2-4 1 2 2 2 3 4 5 6 7 1 305-8573 1-1-1 2 305-8573 1-1-1 3 305-8573 1-1-1 4 ( ) 141-0031 8-3-6 5 060-0808 8 5 6 101-8430 2-1-2 7 135-0064. 2-3-26 113-0033 7-3-1 305-8550 1-2 Analyzing Correlation

More information

美味しさモデルと栄養状態を考慮した料理レシピ推薦システム

美味しさモデルと栄養状態を考慮した料理レシピ推薦システム 観光地のレビューからの 耳より情報抽出手法 阪井奎伍甲南大学灘本明代甲南大学 背景 旅行行こう! 景色 テーマパーク 温泉 郷土料理 背景 旅行行こう! 慣れていない土地や観光地 快適 もっと調べておけば 実は だった 後悔 観光地の情報 背景 公式サイト 最寄り駅 営業時間 基本的な情報 背景 レビューサイト 東京スカイツリー 9 時 10 時ころには人が増えるので 8 時の営業開始と同時にチケット売り場に行った方がいい

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

1 911 9001030 9:00 A B C D E F G H I J K L M 1A0900 1B0900 1C0900 1D0900 1E0900 1F0900 1G0900 1H0900 1I0900 1J0900 1K0900 1L0900 1M0900 9:15 1A0915 1B0915 1C0915 1D0915 1E0915 1F0915 1G0915 1H0915 1I0915

More information

迷惑メールフィルタリングサービス コントロールパネル利用者マニュアル

迷惑メールフィルタリングサービス コントロールパネル利用者マニュアル 迷惑メールフィルタリングサービス コントロールパネル利用者マニュアル ( 一般ユーザ向け ) 第 2.0.0 版 2017/5/16 この度は 迷惑メールフィルタリングサービス をご契約いただき ありがとうございます 本書は迷惑メールフィルタリングサービスをご契約の利用者さまが 迷惑メールフィルタリングサービスコントロールパネル ( 以下 コントロールパネル ) をご利用いただくための基本的な設定手順を説明しています

More information

Detecting Suspicious Following Behavior in Multimillion-Node Social Networks

Detecting Suspicious Following Behavior in Multimillion-Node Social Networks 主食材と主調味料を考慮した 類似レシピクラスタリング 花井俊介 ( 甲南大学 ) 難波英嗣 ( 広島市立大学 ) 灘本明代 ( 甲南大学 ) 背景 情報源 コピー & ペーストが容易 インターネット 剽窃が大きな問題に! 2 背景 剽窃問題 ユーザ投稿型レシピサイトにも存在 料理番組の投稿 投稿 他人のレシピのコピペ 閲覧 3 背景 料理レシピにおける著作権 作品の著作権は, 作品の作り方には及ばない

More information

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア 電気通信サービスにおける情報信憑性検証技術に関する研究開発 課題ア Webコンテンツ分析技術開発成果について 1. 施策の目標 ネットワーク上の文字 音声 画像 映像情報について 情報の信頼性を分析する技術を確立し 信頼できる情報を提供することで 誰でもが思いのまま 簡単に 信頼して コンテンツを取り扱い 高度に利活用できる環境を実現する 2. 研究開発の背景 画像 音声 映像情報がWebコンテンツの一部としてインターネット上に大量に流通しているが

More information

顔文字に着目した TwitterのP/N値に基づく映画の見どころ検索

顔文字に着目した TwitterのP/N値に基づく映画の見どころ検索 顔文字に着目した映画に対する tweet の感情抽出 甲南大学知能情報学部知能情報学科 灘本研究室 10971077 田中美羽 はじめに リアルタイムにツイートが表示される 140 字以内で自由に発信できる ハッシュタグで HOT ワードが表示される 近年 twitter などのマイクロブログの普及に伴い テレビを見ながらツイートしている人が増えている その番組に対して自分の感想などのコメントが多く見られる

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース1] データ収集 1-5:API によるデータ収集と利活用 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学本講座の学習内容 (1-5:API によるデータ収集と利活用 ) 講座概要 API の意味とイメージを 主に利用しているファイル形式と合わせて紹介します

More information

DEIM Forum 2019 C3-5 tweet

DEIM Forum 2019 C3-5 tweet DEIM Forum 2019 C3-5 tweet 163 8677 1 24 2 163 8677 1 24 2 163 8677 1 24 2 E-mail: c515029@ns.kogakuin.ac.jp, cm17051@ns.kogakuin.ac.jp, aki@cc.kogakuin.ac.jp Twitter tweet tweet tweet BoW Doc2vec SVM

More information

迷惑メールフィルタリングコントロールパネル利用者マニュアル

迷惑メールフィルタリングコントロールパネル利用者マニュアル 迷惑メールフィルタリングサービス コントロールパネル 利用者マニュアル ( 一般ユーザ向け ) 第 1.6 版 目次 1. 本マニュアルについて... 1 2. はじめに... 1 3. 使用方法... 2 3.1. ご使用の前に... 2 3.2. ログイン / ログアウト操作... 2 3.2.1. ログイン操作... 2 3.2.2. ログアウト操作... 3 3.2.3. セッションタイムアウト

More information

untitled

untitled http://number.bunshun.jp/ pages contents Number Web http://number.bunshun.jp/ 0 5,000,000 10,000,000 15,000,000 20,000,000 25,000,000 30,000,000 35,000,000 40,000,000 45,000,000 200904 200905 200906

More information

b n m, m m, b n 3

b n m, m m, b n 3 13th Annual Worlds of Flavor International Conference & Festival z x c v z x c v 2 b n m, m m, b n 3 . 0 1 2 3 4 5. 0 1 2 3 4 4 5 6 7 8 6 7 8 5 9 0 1 2 3 9 0 1 2 3 6 4 5 6 7 8 4 5 6 7 8 9 7 0 1 2 3 9 0

More information

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6 O1-1 O1-2 O1-3 O1-4 O1-5 O1-6 O1-7 O1-8 O1-9 O1-10 O1-11 O1-12 O1-13 O1-14 O1-15 O1-16 O1-17 O1-18 O1-19 O1-20 O1-21 O1-22 O1-23 O1-24 O1-25 O1-26 O1-27 O1-28 O1-29 O1-30 O1-31 O1-32 O1-33 O1-34 O1-35

More information

untitled

untitled 2010 58 1 39 59 c 2010 20 2009 11 30 2010 6 24 6 25 1 1953 12 2008 III 1. 5, 1961, 1970, 1975, 1982, 1992 12 2008 2008 226 0015 32 40 58 1 2010 III 2., 2009 3 #3.xx #3.1 #3.2 1 1953 2 1958 12 2008 1 2

More information

zsj2017 (Toyama) program.pdf

zsj2017 (Toyama) program.pdf 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88

More information

88 th Annual Meeting of the Zoological Society of Japan Abstracts 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88

More information

_170825_<52D5><7269><5B66><4F1A>_<6821><4E86><5F8C><4FEE><6B63>_<518A><5B50><4F53><FF08><5168><9801><FF09>.pdf

_170825_<52D5><7269><5B66><4F1A>_<6821><4E86><5F8C><4FEE><6B63>_<518A><5B50><4F53><FF08><5168><9801><FF09>.pdf 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88 th Annual Meeting of the Zoological Society of Japan Abstracts 88

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション J-GLOBAL knowledge 概要 & 使い方 平成 28 年 12 月 19 日 JST 情報企画部情報分析室知識インフラ担当 渡邊 JST の情報事業 提供中の主なサービス 文献 電子ジャーナル 研究者 求人情報 競争的資金情報 ライフサイエンス 2 J-GLBAL knowledge とは http://jglobal.jst.go.jp/ http://stirdf.jglobal.jst.go.jp/

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション M0 鈴木宏彰 1 IDN( 国際化ドメイン名 ) とは 通常のドメイン名はアルファベット 数字 ハイフンなどの ASCII 文字の集合からなり 単一の言語でしか表現できない ( 例 :waseda.jp) Unicode を使用することにより多言語にも対応したドメイン名が IDN( 例 : 早稲田.jp) IDN はブラウザ側で Punycode と呼ばれる Unicode から ASCII 文字への変換アルゴリズムを適応してから名前解決が行われる

More information

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx)

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx) DEIM Forum 2009 C6-4 Web 上のレビュー情報からユーザが重要視する製品の特徴を抽出する手法の提案 小林大祐 井上潮 東京電機大学工学研究科 101-8457 東京都千代田区神田錦町 2-2 E-mail: 08gmc13@ed.cck.dendai.ac.jp, inoue@c.dendai.ac.jp あらまし製品のレビューを書くための Web サイトが存在し, 利用者も多い.

More information

スライド 1

スライド 1 NTT Information Sharing Platform Laboratories NTT 情報流通プラットフォーム研究所 セマンティック Web 技術を用いた社内情報の連携 森田大翼 飯塚京士 ( 日本電信電話株式会社 NTT 情報流通プラットフォーム研究所 ) セマンティック Web コンファレンス 2012 2012 年 3 月 8 日 ( 木 ) 2012 NTT Information

More information

Automatic Collection of Web Video Shots Corresponding to Specific Actions using Web Images

Automatic Collection of Web Video Shots Corresponding to Specific Actions  using Web Images 視覚特徴およびタグ共起を用いた 大規模 Web ビデオショットランキング 電気通信大学大学院情報理工学研究科 総合情報学専攻 Do Hang Nga 柳井啓司 背景 Web 動画 : 無限に存在 無料で取得可能 - YouTube, Daily Motion etc. Web 動画による動作データ収集 ただし Web 上の動画はノイズが多い 関連動画 Play trumpet 非関連動画 非対応ショット

More information

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074> RD_301 構成要素一覧と検索 から構成要素の編集辞書 ( 削除 ) を作る 作成 ( 編集 ) する削除辞書を開きます 構成要素を検索します ドラック & ドロップでも OK 範囲を選択して右クリック 右クリック 削除辞書に登録 ( 追加 ) したい構成要素を選択しコピーします 削除辞書に追加 ( 貼りつけ ) ます Step5. 削除辞書に構成要素が登録 ( 追加 ) されます 構成要素一覧と検索

More information

Microsoft Word - Informaworld_manual.doc

Microsoft Word - Informaworld_manual.doc Informaworld 利用ガイド 1. アクセス URL: http://www.informaworld.com 記事および雑誌タイトルの検索はここからできます この部分は常にどのページにも表示されます 個人機能を利用する場合にここから SIGN IN します 図書館管理者向けリンク 管理者用 の Username と Password で Sign in して利用します Informaworld

More information

Wisers操作 クイック・リファレンス

Wisers操作 クイック・リファレンス WiseSearch クイック リファレンス 2012/11/13 日経テレコン 1 利用開始 日経テレコンの専門情報メニューから WiseSearch を選択します 利用規約や料金説明の画面が開きますので よろしければ 利用規約に合意の上利用する をクリックしてください 2 初期設定 ( 表示言語選択 ) 初めてログインした際は 表示言語を選択する画面が表示されます 英語 ( 中国語繁体字 ) 英語

More information

電子情報通信学会ワードテンプレート (タイトル)

電子情報通信学会ワードテンプレート (タイトル) DEIM Forum 2014 F8-2 同一料理に対する多様なレシピ集合からの 効率的な選別を目的とした可視化手法 村瀬秀牛尼剛聡 九州大学芸術工学部 815-8540 福岡市南区塩原 4-9-1 九州大学大学院芸術工学研究院 815-8540 福岡市南区塩原 4-9-1 E-mail: fonewmjp@gmail.com, ushiama@design.kyushu-u.ac.jp あらまし近年,

More information

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1]  PLUM [2] LifelogViewer 3 1 Apple iphoto,   2 Goo DEIM Forum 2012 D9-4 606 8501 E-mail: {sasage,tsukuda,nakamura,tanaka}@dl.kuis.kyoto-u.ac.jp,,,, 1. 2000 1 20 10 GPS A A A A A A A 2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] Email PLUM

More information

知能と情報, Vol.29, No.6, pp

知能と情報, Vol.29, No.6, pp 36 知能と情報知能と情報 ( 日本知能情報ファジィ学会誌 ( ))Vol.29, No.6, pp.226-230(2017) 会告 Zadeh( ザデー ) 先生を偲ぶ会 のご案内 Zadeh( ) とと と 日 2018 1 20 日 ( ) 15:00 17:30(14:30 18:00 ) 2F ( ) 530-8310 1-1-35 TEL: 06-6372-5101 https://www.hankyu-hotel.com/hotel/osakashh/index.html

More information

ProQuest PPT Styles

ProQuest PPT Styles 筑波大学様向け RefWorks 講習会 2015 年 10 月 17 日 本日のセッションの内容 RefWorks のご紹介 1. RefWorks とは 2. RefWorks のコンセプト 3. ログイン方法 4. アカウントの作成 5. データを取り込む ProQuestから CiNiiから WorldCatから 6. 取り込んだデータを編集する 7. フォルダに分類する 8. フォルダを共有する

More information

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp Query-by-Dancing: WISS 2018. Query-by-Dancing Query-by-Dancing 1 OpenPose [1] Copyright is held by the author(s). DJ DJ DJ WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias

More information

<4D F736F F D B838B8A7597A3424F DEC837D836A B5F E315F E646F63>

<4D F736F F D B838B8A7597A3424F DEC837D836A B5F E315F E646F63> ユーザーズガイド _ スパムメール隔離通知 スパムメール隔離 BOX 操作マニュアル 第 1.1 版 2010 年 4 月 2 日 NTT コミュニケーションズ株式会社 改版履歴 版数発行年月日変更内容 1.0 版 2010/03/30 初版発行 1.1 版 2010/04/02 文言修正 目次 1. 隔離されたスパムメールの確認方法について... 4 1.1. はじめに... 4 1.2. スパム隔離通知の受信...

More information

1. はじめに 2

1. はじめに 2 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1 1. はじめに 2 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 /

More information

wki_shuronn.pdf

wki_shuronn.pdf No. 161 Sentiment Extraction from Live Tweets 2014 3 Twitter Twitter Summary Recently, microblogs such as Twitter become popular, and we can tweet about our own daily life easily. The user who tweets during

More information

Microsoft PowerPoint - Cambridge Books Online ユーザーマニュアル

Microsoft PowerPoint - Cambridge Books Online ユーザーマニュアル Cambridge Books Online ユーザーマニュアル http://ebooks.cambridge.org/ Cambridge University Press Japan CBO マニュアル目次 1. Cambridge Books Onlineとは 2. CBO トップページ12 1,2 3. 検索機能 : 2ステップ検索 Advanced 検索検索結果 4. Books: 書籍の情報と内容目次とPDF

More information

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi DEIM Forum 2019 H2-2 SuperSQL 223 8522 3 14 1 E-mail: {terui,goto}@db.ics.keio.ac.jp, toyama@ics.keio.ac.jp SuperSQL SQL SuperSQL Web SuperSQL DBMS PipelineDB SuperSQL Web Web 1 SQL SuperSQL HTML SuperSQL

More information

電子情報通信学会ワードテンプレート (タイトル)

電子情報通信学会ワードテンプレート (タイトル) DEIM Foru 212 A9-4 感性パラメータを用いた書誌情報からの図書推薦手法の提案 垣内将希 高岡幸一 灘本明代 甲南大学知能情報学部 658-72 兵庫県神戸市東灘区岡本 8 丁目 9 1 甲南大学大学院自然科学研究科 658-72 兵庫県神戸市東灘区岡本 8 丁目 9 1 E-ail: {si87138@center.,nadaoto@}konan-u.ac.jp, tk_kouichi@yahoo.co.jp

More information

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出 Web 動画 画像を用いた 特定動作ショットの自動収集 DO HANG NGA 樋爪和也柳井啓司 電気通信大学情報工学科 背景 既存の動画学習手法制限のある動画像 (e.g. KTH, Caltech) 教師なし学習手法 Web 上の動画 教師信号あり 動画量が少ない 研究の目的 特定動作についての Web データを使用して その動作の対応ショットを自動抽出 大量の Web 動画 ランキング 学習の必要なし

More information

[3] [4] Google [5] [6] [7] [8] [9] [10] [11] [12] Cookpad [1] Cookpad A B C

[3] [4] Google [5] [6] [7] [8] [9] [10] [11] [12] Cookpad [1] Cookpad A B C DEIM Forum 2013 D3-5 606 8501 606 8501 E-mail: {ysugiyama,yamakata,tanaka}@dl.kuis.kyoto-u.ac.jp Web 1. Cookpad [1] [2] Web i 1 ii 2 肉じゃがの検索結果 じゃがいも 切る さらす 玉ねぎ サラダ油 醤油 砂糖 落とし蓋をする 1! 春雨を使用 じゃがいもを下茹で醤油を最後に加える

More information

DEIM Forum 2014 B Twitter Twitter Twitter 2006 Twitter 201

DEIM Forum 2014 B Twitter Twitter Twitter 2006 Twitter 201 DEIM Forum 2014 B2-4 305 8550 1 2 305 8550 1 2 E-mail: {yamaguchi,yamahei,satoh}@ce.slis.tsukuba.ac.jp Twitter Twitter 2 1 1. Twitter 2006 Twitter 2012 5 [1]Twitter RT RT Twitter Twitter RT Twitter 2 1

More information

SNS Flickr Flickr Flickr SNS 2. SNS Twitter [2] Flickr [3] [4] Twitter Twitter Flickr Flickr Flickr Flickr Flickr Twitter 1 document 3. Flickr API Fli

SNS Flickr Flickr Flickr SNS 2. SNS Twitter [2] Flickr [3] [4] Twitter Twitter Flickr Flickr Flickr Flickr Flickr Twitter 1 document 3. Flickr API Fli SNS 1 2 2 2 2 2 2 SNS Detection of posted convergences with a photo post type SNS as a target and application to the tourism potential map Shusaku Yano 1 Masahiro Migita 2 Masashi Toda 2 Takayuki Nagai

More information

顔文字を考慮したニュースに対するツイートの感情抽出手法の提案

顔文字を考慮したニュースに対するツイートの感情抽出手法の提案 平成 25 年度修士論文発表会 2014 年 2 月 15 日 実況ツイートからの感情抽出手法の 提案 甲南大学大学院自然科学研究科 知能情報学専攻 灘本研究室若井祐樹 背景 近年,Twitter や Facebook といったソーシャルメディアが発展している 気軽に発信できることが利点 Twitter で自分が思っていることや感じていることをその場で発しているのでは 背景 テレビ番組を視聴しながらの実況ツイート

More information

Microsoft Word - CiNiiの使い方.doc

Microsoft Word - CiNiiの使い方.doc CiNii の使い方 CiNii とは 国立情報学研究所 (NII) では 各種サービスごとに提供しているコンテンツを統合するとともに 国内外の有用な学術情報資源との連携を可能とすることを目標としたプラットフォーム GeNii ( ジーニイ ) の構築を進めています GeNii の機能の一つとして NII 論文情報ナビゲータ CiNii ( サイニイ ) を提供します CiNii では 学協会で発行された学術雑誌と大学等で発行された研究紀要の両方を検索し

More information

WBT [6] [7] [8] [9] Web [1] WBT [2] [3] ipad PC ipad ipad ipad [4] QR QR [5] IC IC PDA IC PDA US-ASCII 4,296 QR IC IC IC QR QR QR 3. 3. 1 A BB A A CC

WBT [6] [7] [8] [9] Web [1] WBT [2] [3] ipad PC ipad ipad ipad [4] QR QR [5] IC IC PDA IC PDA US-ASCII 4,296 QR IC IC IC QR QR QR 3. 3. 1 A BB A A CC DEIM Forum 2015 D7-3 432 8011 3-5-1 / PD 191 0065 6-6 191 0065 6-6 432 8011 3-5-1 E-mail: cs11077@s.inf.shizuoka.ac.jp, hirota-masaharu@tmu.ac.jp, ishikawa-hiroshi@tmu.ac.jp, yokoyama@inf.shizuoka.ac.jp,

More information

DEIM Forum 2012 E Web Extracting Modification of Objec

DEIM Forum 2012 E Web Extracting Modification of Objec DEIM Forum 2012 E4-2 670 0092 1 1 12 E-mail: nd11g028@stshse.u-hyogo.ac.jp, {dkitayama,sumiya}@shse.u-hyogo.ac.jp Web Extracting Modification of Objects for Supporting Map Browsing Junki MATSUO, Daisuke

More information

"-./0%. "-%!"#$#% $%&'(%)*+,%.!"#+$,$% &'()*% $%&'-(.(/%+,% $%&'0%12*+,'% 1 RMX.. grade gradetype= integer grade[

-./0%. -%!#$#% $%&'(%)*+,%.!#+$,$% &'()*% $%&'-(.(/%+,% $%&'0%12*+,'% 1 RMX.. grade gradetype= integer grade[ DEIM Forum 2014 C8-5 RMX 223 8522 3 14 1 E-mail: {yohei,kita}@db.ics.keio.ac.jp, toyama@ics.keio.ac.jp RMX,,, RMX., RMX, RMX,., RMX,., RMX,.,,., RMX 1. RMX (Rule-based e-mail exchange System).,,., RMX,

More information

6回目

6回目 ir05b.web 情報検索課題提出項目の確認 1. 検索課題の設定 2.Googleによる日本語キーワード検索 3. Google 以外の日本語キーワード検索 4. 英語検索エンジンによるキーワード検索 5. Web 情報検索のまとめ 6. 情報収集結果のまとめかた : サイトの信頼度 重点項目 (Web 情報検索のねらい ) 1 目的 目標の設定 4,5,6,7(kw11,12,13 ) 2 蓋然的信頼性

More information

untitled

untitled pr. 2006 No. 010 CONTENTS s s s s s s Business Plan 1 2 Forum 3 4 Forum 5 Patent consultation case 6 Forum 7 8 For production public study 9 10 Equipment 11 12 Collabo 13 Facility 14 Service Scheme 15

More information

main.dvi

main.dvi DEIM Forum 2017 D3-4 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0053 1-3-15 6F 101-8430 2-1-2 This paper presents techniques of retrieving know-how sites from the collection of Web pages. The proposed techniques

More information

IPSJ SIG Technical Report Vol.2014-HCI-157 No.26 Vol.2014-GN-91 No.26 Vol.2014-EC-31 No /3/15 1,a) 2 3 Web (SERP) ( ) Web (VP) SERP VP VP SERP

IPSJ SIG Technical Report Vol.2014-HCI-157 No.26 Vol.2014-GN-91 No.26 Vol.2014-EC-31 No /3/15 1,a) 2 3 Web (SERP) ( ) Web (VP) SERP VP VP SERP 1,a) 2 3 Web (SERP) ( ) Web (VP) SERP VP VP SERP VP Web 1. Web Web Web Web Google SERP SERP 1 1 2-1-1, Hodokubo, Hino, Tokyo 191 8506, Japan 2 4-12-3, Higash-Shinagawa, Shinagawa, Tokyo 140 0002, Japan

More information

Microsoft PowerPoint - NC12-2.pptx

Microsoft PowerPoint - NC12-2.pptx 演習問題の解答 ネットワークコンピューティング (2) 情報推薦 関西学院大学理工学部情報科学科北村泰彦 ベクトル空間モデルの例において,d 3 の文書を得ようとして, Genes and Genomes を検索質問文として検索を行った. 1. 類似度 0.85 以上の文書を検索結果とするときの, 再現率と適合率を求めよ. 再現率 =0/1=0%, 適合率 =0/1=0% 2. 類似度 0.8 以上の文書を検索結果とするときの,

More information