0210研究会

Similar documents
0210研究会

美味しさモデルと栄養状態を考慮した料理レシピ推薦システム

研究テーマ考案 ブログ記事を知識源とした 雑談メタファに基づく情報推薦

電子情報通信学会ワードテンプレート (タイトル)

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2017-DBS-164 No /1/17 書籍レビューテキストから生成した評価軸とトピックモデルを用いたハイブリッド推薦手法の有効性 北原將平 ジェプカラファウ 荒木健治 概要 : 近年, 消費者生成メデ

コンピュータ応用・演習 情報処理システム

nlp1-12.key

1. はじめに 2

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

PowerPoint プレゼンテーション

untitled

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

書籍の感情情報に注目した作者の印象分析

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

untitled

顔文字に着目した TwitterのP/N値に基づく映画の見どころ検索

DEIM Forum 2014 P3-3 A Foreseeing System of Search Results based on Query Operations on the Graph Interface

言語間比較によるWikipediaの補完情報抽出手法の提案

< 用語解説 > *1 ソーシャルネットワーキングサービス (SNS) インターネット上の交流を通して社会的ネットワークを構築するサービス全般を指す 代表的な SNS として Twitter mixi GREE Mobage Ameba Facebook Google+ Myspace Linked

図1 ネイルレシピ検索システム概要 ントを取得することによって ユーザの持っている服に似合う コーディネートを検索するシステムを構築することを目的とし ている [7] 本研究では ネイルレシピを対象としており 場 所に対応しているかだけでなく ユーザの好みや腕も考慮して いる 津田らは 爪の反射率の

電子情報通信学会ワードテンプレート (タイトル)

メタデータ管理システム

Microsoft PowerPoint - ディスプレイ_Yahoo_金融業界向け広告提案書.ppt [互換モード]

PowerPoint プレゼンテーション

DEIM Forum 2014 P Web Web,,, 1. Web Web 1 Web Web Web. 2 3 Web

話題と感情の可視化に基づくフォロイー推薦

Microsoft PowerPoint - 04_01_text_UML_03-Sequence-Com.ppt

Microsoft PowerPoint - 簡易マニュアル_ver1.1.ppt [互換モード]

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx)

スライド 1

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ

6回目

PowerPoint プレゼンテーション

リスク分析・シミュレーション

特別企画コンファレンス

スライド 1

電子情報通信学会ワードテンプレート (タイトル)

トピックモデルを用いた歌声特徴量の分析

和歌山大学災害科学教育研究センター研究報告, 第 1 巻, 第 1 号,2017 年 2 月 災害記事データベースの構築および応用 記事収集, 全文検索, およびテキスト分析 CONSTRUCTION AND APPLICATON OF DISASTER ARTICLE DATABASE: ARTI

トピックモデルの応用: 関係データ、ネットワークデータ

2 116

スライド 1


ログインのしかた 1. 区公式ホームページ内の図書館コンテンツトップにある ( スマートフォン版蔵書検索 予約システム をタップします 2. 画面右上の利用者用メニューのアイ

Microsoft PowerPoint ppt

Microsoft PowerPoint _3a-SEO.pptx

しているイベント名 鑑賞しているテレビ番組名などが考えられる () システムはそのクエリに対して適切なレポータを返すために レポータ候補者を収集する (3) レポータ候補者のツイートから それぞれの候補者がレポータとしてふさわしいかを評価する () 適切なレポータとして評価された Twitter ユ

main.dvi

Microsoft Word _Gmail利用マニュアル.doc

Microsoft Word - DEIM論文3.doc

Microsoft Word - H1369 インターネット1(IE版)(T)


いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

電子情報通信学会ワードテンプレート (タイトル)

<4D F736F F D E FD8936F8B4C8F8A82CC936F8B4C8AAF82CC93648E718FD896BE8F9182CC936F985E8EE88F872E646F63>

226125_多摩大経営情報研究_no.20_表紙-3校.indd

(Microsoft PowerPoint - \216\251\223]\216\324\224F\216\257\202\314\223\256\214\374.pptx)

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

(Microsoft Word - \216\251\223]\216\324\224F\216\257\213Z\217p\223\256\214\ F.doc)

1. 基本操作 (1) 見る (2) 書き込む P3 P7 2. その他 (1) 招待を受ける (2) 招待をする (3) 1 対 1 のコミュニケーション (4) 全検索 (5) 患者検索 (6) 個人設定 (7) メッセージを削除する 戻す (8) よくある Q&A P10 P12 P18 P1

IPSJ SIG Technical Report Vol.2014-NL-216 No.6 Vol.2014-SLP-101 No /5/ MMDAgent 1. [1] Wikipedia[2] YouTube[3] [4] [5] [6] [7] 1 Graduate

main.dvi

Microsoft Word - MTransㇹㇿㅼㅋ㇬㇤ㅛ+丕苬ㅦㅼㇶㅼ咂ㆂ;_ver1.7_original.docx

Microsoft Word - apstattext04.docx

目次 1. ログイン 最初に設定しましょう メールの受信 メールの削除 振り分け ( ラベル付け ) メールの作成 メールの返信 転送 メールの自動転送 ログアウト

目 次 1.SNS の概要 1.1 SNS の概要 地域 SNS の起動 地域 SNS の画面構成 自己紹介の設定 2.1 自己紹介の設定 ブログ 3.1 ブログを書く コメントを書く コミュニティ 4.1 コミュニティに

スライド 1

( 目次 ) 1. PukiWiki インストールガイド はじめに 制限事項 サイト初期設定 PukiWiki のインストール はじめに データベースの作成 PukiWiki

記 1. 適用対象本通知は 製造販売業者等が GPSP 省令第 2 条第 3 項に規定する DB 事業者が提供する同条第 2 項に規定する医療情報データベースを用いて同条第 1 項第 2 号に規定する製造販売後データベース調査を実施し 医薬品の再審査等の申請資料を作成する場合に適用する GPSP 省

電子情報通信学会ワードテンプレート (タイトル)

1307migitaDicomo.pptx

Progress report

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献


キリしていて メニューのボタンも大きくなっているので マウス操作はもちろん タッチ操作でも使いやすくなっているのが特長です アドレスバー画面上部にあるアドレスバーは インターネット検索も兼ねています ここにキーワードを直接入力して検索を実行できます 現在表示されているタブの右横にある + をクリック

携帯電話を登録する 3 携帯電話で教員からのお知らせおよびレポート課題の情 報が得られます. 従来型携帯電話を利用するための情報登 録はパソコンを使って行います. スマートフォンユーザは スマートフォンユ ーザ向けガイド を参照してください. 携帯メールアドレスの登録 授業選択領域にて My Wor

untitled

NOR概要

スライド 1

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

民間事業者等によるサービス実証成果報告(日本電信電話・ジェイアール東日本コンサルタンツ)

DataWare-NETご利用ガイド

Wi-Fi テザリングで使う MapFan の会員登録をする Wi-Fi テザリングで使用するためには KENWOOD MapFan Club へ入会し MapFan Web で会員登録が必要です 連携するスマートフォンはテザリング契約が必要です 1 KENWOOD MapFan Club にスマー

Microsoft Word - 4. 画面説明_ver docx

ご使用の前に カーナビと接続するケーブルについて iphone で接続する場合 : 別売の KCA-iP102 または KCA-iP212 をご使用ください [ 商品購入 ] にタッチします 画面にしたがって操作してください iphone の場合 Android スマートフォンの場合 Android

分野 コース名 基礎的 IT セミナーコース一覧 内容 I T 理解 I T スキル活用 I T 倫理 新技術動向 業務の I T 化 ネットワーク 表計算 ベデーースタ プンレ / ゼ文ン書テ作ー成ショ ホームページ 情報発信コンンプスライア 情報テセィキュリ 1 第 4 次産業革命のインパクト新


2

2


2

資料 ( 本 雑誌など ) の検索のしかた ( 詳細検索 ) パソコンを使って蔵書の検索 予約をするには かんたん検索 と 詳細検索 の二つの方法があります ここでは詳細検索の手順を説明いたします かんたん検索の手順は かんたん検索の各部の説明 をご覧ください 1 図書館コンテンツトップのパソコン版

Medical3

8.平成25年度神戸市ユーザー評価「神戸市:六甲散歩」報告書

[3] [4] Google [5] [6] [7] [8] [9] [10] [11] [12] Cookpad [1] Cookpad A B C

Cybozu SP ディスカッション 管理者マニュアル

Microsoft PowerPoint - NC12-2.pptx

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2015-GN-96 No /10/2 ソーシャルコメントからの音楽動画印象推定に関する検討 1, 2 土屋駿貴 1, 2 中村聡史 3, 2 山本岳洋 本稿では印象に基づく音楽動画検索実現に向け, 音楽動

スライド 1

Transcription:

トピック推定に基づくソーシャルメディアからの 耳より情報抽出手法の提案 甲南大学 服部祐基灘本明代

背景 1 SNS ソーシャルメディアを用いて情報を取得する行為が増えている マイクロブログ レビューサイト コミュニティ 個人の経験談や体験談ユーザ同士での情報交換 公式サイトや一般の Web ページに掲載されていない耳よりな情報が含まれている.

例えば 諏訪湖花火大会 コミュニティ 神奈川方面からなら諏訪インターの一つ前の諏訪南インターから下道が良いかと やはり自動車よりも電車で行かれることをお勧めします. 京都の紅葉 コミュニティ 紅葉を見上げて見るなら洛西の 光明寺 囲まれたいのなら 嵐山の 常寂光寺 紅葉を見下ろすなら 東福寺 紅葉の絨毯を見たいのであれば 永観堂. 公式サイトや一般の Web ページに掲載されていない耳よりな情報 ソーシャルメディアから耳よりな情報を取得することが求められている.

背景 2 SNS はコミュニティ内にスレッド ( トピック ) が作成されている. 京都の紅葉 紅葉 コミュニティ スレッド 清水寺嵐山近場の食事 清水寺 近場の食事 嵐山 交通 交通 見頃 問題点 様々な話題が混在. 穴場スポット 清水寺 嵐山 見頃 ユーザが求める耳よりな情報を取得することは困難.

目的 ソーシャルメディアから トピック毎に耳より情報を抽出 トピックの抽出とクラスタリング 経験に基づいた有益な情報 ユーザは効率的に有益な情報を取得することが可能となり, 新たな知識の獲得が期待できる

トピック抽出とクラスタリング 様々なトピックが混在しているため, コメントを 1 文書とし, そのコメント群からトピック推定を行うことにより, トピックの抽出, クラスタリングを行う. 京都の紅葉 紅葉 清水寺 コミュニティスレッド 清水寺嵐山近場の食事 京都の紅葉 清水寺 清水寺 近場の食事 近場の食事 近場の食事 嵐山 交通 嵐山 嵐山 交通 見頃 見頃 穴場スポット 清水寺 嵐山 見頃 交通 交通 見頃 潜在的ディリクレ配分法 (Latent Dirichlet Allocation, LDA)

潜在的ディリクレ配分法 (Latent Dirichlet Allocation, LDA) トピック推定手法 文書集合からトピックを推定する際, データが疎な場合に有効 単語 w の集まりにより表現された文書 d の集合, 分類するトピック数 K 各トピック zk (k = 1,...,K) の単語 w の確率分布 P(w zk), 各文書 d のトピック zk の確率分布 P(zk d) (d = 1,...,D) を推定.

トピック抽出とクラスタリング 京都の紅葉 紅葉 コミュニティ 文書集合 D 1 コメントを 1 文書 d 清水寺嵐山近場の食事 清水寺 近場の食事 嵐山 交通 交通 見頃 : : 分類するトピック数 K トピック数 K の決定 ( 予備実験より ) 5 つのコミュニティに対して LDA による推定 K=3, 7, 10, 15, 20, 25,, 50. 適していた K=10 を採用 文書 d トピック 各文書 d のトピック zk の確率分布 P(zk d) (d = 1,...,D) が 0.3 以上の値

耳より情報 耳より情報経験情報 経験マイニング 有益な情報 耳よりキーワード 実際に経験したことに基づいたコメントは, より信頼できる. 多くの閲覧者が有益と感じた情報の中には共通のキーワードが含まれている.

経験情報の取得 経験マイニング Web 上に大量にあるテキストから個人の経験情報を 構造化情報として抽出することを目的 乾健太郎, 原一夫 : 経験マイニング :Web テキストからの個人の経験の抽出と分類, 言語処理学会第 14 回年次大会論文集,pp. 1077 1080 (2008). 個人の経験情報 トピック 経験主 事態タイプ事実性事態表現 評価 感情 出来事 日本語評価極性辞書 経験情報 行為 評価 感情 出来事 行為 新たに提案

経験情報の取得 経験情報 評価 感情 出来事 行為 日本語評価極性辞書 動詞 形容詞 名詞に対してポジティブとネガティブの評価極性を付与している辞書 単語 タイプ 1 番 状態 あいまい 評価 感情 あく抜け 出来事 いさかい 存在 性質 いたずら 行為 うってつけ 評価 感情 うだうだ 出来事 単語 タイプ

経験情報の取得 経験情報 評価 感情 出来事 行為 経験マイニングでの行為 我々の提案する行為 一般的な行為 ドメイン依存の行為 行為を表す単語の取得 イベント関連のコミュニティ 30000 コメント 行為を表す名詞と動詞各出現頻度上位 50 単語を取得 ドメインをイベント関連 行為の例 動詞 名詞 行く 買う 参戦 利用 見る 並ぶ 参加 入場 できる 探す 乾杯 移動 経験情報を取得

取得した経験情報の例 私も京都初一人旅へ行ってきました 2 日間宿で自転車を借りて ( ここは 500 円でした ) とても効率よく回れました 盆地なので坂がきついところもありますのでなかなかいい運動になります 私は個人的に嵐山の大河原山荘が一番良かったです 庭園が美しかった 紅葉には早かったですが 満喫できましたよ あとは左京区の曼殊院門跡もオススメです もしそちらに行くなら詩仙堂も立ち寄るといいと思います こちらもお庭が絶景です 高台寺 清水寺に行ってきました 綺麗な紅葉を見させていただきました 移動はやっぱレンタサイクルがオススメですよ. 電車やバスだと時間を気にしながら行動しなくちゃならないけど レンタサイクルなら自由 乗り捨て OK だったりするので 好きなところで借りて 好きなところで返せるっていうのも嬉しい 秋に苔寺を見に行った時に グリーンの芝生に赤い紅葉があってとてもきれいでしたよ 青 : 行為緑 : 評価 感情, 出来事

耳よりキーワードの抽出 実際の耳より情報から耳より情報の要因となる耳よりキーワードを抽出. 予備実験被験者 :5 名データセット :mixi のイベント関連 5 つのコミュニティ 2000 コメント 5 人中 4 人が耳より情報であると感じたコメントを収集 人手により耳より情報の要因となる耳よりキーワードを抽出 耳よりキーワードの例 おすすめ の方がよい いかが してみて 望ましい すべき 是非どうぞ できます チャンス イチオシ 狙い目 穴場 便利 お得 無難 ガラガラ 渋滞 混雑 絶景 最適 92 種類 耳よりキーワードが含まれている情報を耳より情報とし抽出

耳より情報の例 私も京都初一人旅へ行ってきました 2 日間宿で自転車を借りて ( ここは 500 円でした ) とても効率よく回れました 盆地なので坂がきついところもありますのでなかなかいい運動になります 私は個人的に嵐山の大河原山荘が一番良かったです 庭園が美しかった 紅葉には早かったですが 満喫できましたよ あとは左京区の曼殊院門跡もオススメです もしそちらに行くなら詩仙堂も立ち寄るといいと思います こちらもお庭が絶景です 移動はやっぱレンタサイクルがオススメですよ. 電車やバスだと時間を気にしながら行動しなくちゃならないけど レンタサイクルなら自由 乗り捨て OK だったりするので 好きなところで借りて 好きなところで返せるっていうのも嬉しい 赤 : 耳よりキーワード青 : 行為緑 : 評価 感情, 出来事

プロトタイプシステムの流れ ソーシャルメディア :Mixi クエリ コミュニティ一覧 コミュニティ選択 コミュニティの抽出 最新上位 20 件のスレッドの全コメントを文書集合として取得 ユーザ 日本語評価極性辞書 トピック推定によるコメントのクラスタリング クラスタ毎に経験情報の抽出 トピック毎に耳より情報の提示 耳よりキーワード 耳より情報の抽出 システム

プロトタイプシステム 入力画面 コミュニティのリスト画面 コミュニティ名トピック 耳より情報のリスト 出力画面

実験 目的 : 実験 1: SNS のコメント群のクラスタリングに LDA が有効かどうか 実験 2: システムの有効性を測る 提案手法とベースライン手法との比較 クラスタリングを行なっていない 複数の被験者による精度の差異

実験 1 目的 :SNS のコメント群のクラスタリングに LDA が有効かどうか一般 Web 文書に比べデータが疎であり, かつ文構造がきれいでない SNS のコメントに対する LDA の精度 実験条件 : データセット : mixi のイベント関連の 5 つのコミュニティ PL 花火芸術 なばなの里 関西周辺海水浴遊び 京都紅葉巡り 潮干狩り クラスタリングされたコメントとトピックを表すキーワードから, コメントがトピックに関するものであるか 評価指標 : 適合率

実験 1 結果 コミュニティ名 全コメント数 正しくクラスタリングされたコメント数 精度 (%) PL 花火芸術 569 459 81 なばなの里 125 96 77 関西周辺海水浴 171 125 73 京都の紅葉巡り 162 124 77 潮干狩り 227 175 77 平均精度 -- -- 77 一般 Web 文書に比べデータが疎であり, かつ文構造がきれいでない SNS のコメントに対して, 良い結果が得られている 明らかに情報量が少ない場合では, 正確に分類することができていない

実験 2 目的 : システムの有効性を測る 提案手法とベースライン手法との比較 複数の被験者による精度の差異 実験条件 : 被験者 :5 名 データセット :mixi のイベント関連の 8 コミュニティ PL 花火芸術 なばなの里 関西周辺海水浴遊び 京都紅葉巡り 潮干狩り 神戸ルミナリエ 京都祗園祭 諏訪湖花火大会 システムが抽出した耳より情報のうち正しく抽出されたコメントの割合 評価指標 : 適合率

結果 適合率 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 実験 2: ベースライン手法との比較 平均適合率 :69% LDAによる分類あり 本提案手法ベースライン LDAによる分類なし平均適合率 :51% 1 つのコメントに対して耳より情報かどうかを判定している LDA による分類を行わない場合, そのコメントが何についての話題か判断できないため, 適合率が低い. LDA による分類を行う事で, そのコメントにトピックが与えられ, 話題を判断することができ, 適合率が高くなった.

実験 2: 複数の被験者による精度の差異 結果 PL 花火芸術 なばなの里 関西周辺海水浴 京都祗園祭 京都紅葉巡り 神戸ルミナリエ 諏訪湖花火潮干狩り平均適合率 全コメント数 909 262 318 441 329 396 1313 415 - 取得されたコメント数 122 29 30 28 32 18 137 27 - 被験者 A 80% 90% 83% 93% 88% 72% 87% 93% 86% B 78% 69% 70% 68% 75% 44% 58% 70% 67% C 73% 72% 37% 64% 88% 33% 58% 81% 63% D 56% 55% 60% 39% 69% 17% 47% 48% 49% E 80% 90% 87% 79% 100% 44% 76% 93% 81% 平均 73% 75% 67% 69% 84% 42% 65% 77% 69% 適合率 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 被験者 A B C D E 平均

京都の紅葉 耳より情報の例 お勧めは高台寺 池に逆さに映る風景は息をのむ美しさでした! 東福寺は 凄い人ですが 紅葉も見頃を迎えると 通天橋から見下ろす景色は 順番に人ごみの中ならんでも価値ありの本当に凄く綺麗な景色です 諏訪湖花火大会 諏訪市内に駐車してフィナーレまで見るなら諏訪インターまでは数時間の覚悟が必要です 岡谷駅周辺に駐車して電車で移動し帰りは岡谷インターから入る または茅野駅周辺に駐車して諏訪南インターから入るという手段が最近流行っています 有料自由席では必ず花火を間近で観ることは出来ますしかし より観やすい場所にシートを広げて座りたいと思うのなら開場前から並ばなくてはなりません速い人は何日も前から泊まり込んでいます早朝から並んだとしても既に数百人の後ろです

まとめと今後の課題 ソーシャルメディアを用いて, トピック毎に耳より情報を抽出. 耳より情報 経験情報 有益な情報 経験マイニング 耳よりキーワード LDA を用いてトピック毎に分類することで, ベースライン手法より 18% 精度が向上 今後の課題 個々のユーザにあった耳より情報を提示 複数のソーシャルメディアから耳より情報の取得