話題と感情の可視化に基づくフォロイー推薦

Similar documents
顔文字を考慮したニュースに対するツイートの感情抽出手法の提案

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

顔文字に着目した TwitterのP/N値に基づく映画の見どころ検索

電子情報通信学会ワードテンプレート (タイトル)

Microsoft Word - 博士論文概要.docx

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2

wki_shuronn.pdf

電子情報通信学会ワードテンプレート (タイトル)

電子情報通信学会ワードテンプレート (タイトル)

IPSJ SIG Technical Report Vol.2014-DBS-160 No.21 Vol.2014-OS-131 No.2 Vol.2014-EMB-35 No /11/18 1,2,a) 2,b) 2,c) 1,d) 2,e) Web Web Twitter Web

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

Microsoft PowerPoint - pr_12_template-bs.pptx

1 1 (3.1 ) 2 (3.2 ) (3.3 ) 4 Google Place API (3.4 ) 5 2 TripAdvisor (3.5 ) Pat [7] [8] km

SEM44-西堀ゆり.indd

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

吉永式Twitter marketing club添削後

1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means

電子情報通信学会ワードテンプレート (タイトル)

画像類似度測定の初歩的な手法の検証

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

DEIM Forum 2012 E Web Extracting Modification of Objec

97-00

サーモモジュール_出力

DEIM Forum 2019 H Web 1 Tripadvisor

表1-表4宅建98.indd

01.12期・井須英次1.doc

1.3期・井上健0.doc

19 December 2013


Microsoft PowerPoint _ビッグデータWS.pptx

<4D F736F F F696E74202D20938A F8C888E5A90E096BE89EF8E9197BF F8DC58F492E B8CDD8AB B83685D>

C-œI‡Ä‡¢

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

Transcription:

2015 年度修士論文発表 2016 年 2 月 13 日 Twitter の感情抽出に基づく フォロイー推薦 甲南大学大学院自然科学研究科 知能情報学専攻灘本研究室 21424010 山本湧輝

2 は じめに Twitter の基本的な使い方 気になるユーザをフォローする そのユーザのツイートを見ることが出来る フォロー ツイート フォロイー

3 ユ ーザをフォローする理由 趣味嗜好が似ているユーザ 阪神ファン 現実世界での知人 友人 大学の友達 好きな有名人 SMAP のファン 様々な理由が存在する

フ ォローしたいユーザの発見 Twitter には数多くのユーザが存在する ツイートをすべて見るのは大変 わろたwwwwでも今調べたら今日は学校しんどい ポケモンの新作楽しい! 就活ホンマ辛い 阪神負けたやん! めっちゃムカつく 自分に合ったフォロイーを見つけるのは困難 フォロイー推薦 4

5 従 来のフォロイー推薦 阪神 阪神 阪神 推薦ユーザ 1 阪神 阪神 阪神 閲覧ユーザ 推薦ユーザ 2 阪神 阪神 従来のフォロイー推薦は 話題が同じ人を推薦する 阪神

6 従 来のフォロイー推薦の問題点 阪神いいね! 阪神ファイト 阪神勝って! 推薦ユーザ 1 阪神頑張れ 阪神大好き 阪神いいね! 阪神に対して好意的なツイートをしている 閲覧ユーザ 推薦ユーザ 2 阪神負けろ 阪神むかつく 阪神に勝ちたい 阪神に対して否定的なツイートをしている

7 目 的 話題 感情 推薦ユーザ 1 フォロイー推薦 阪神いいね! 阪神ファイト 阪神勝って! 阪神頑張れ 阪神大好き 阪神いいね! 阪神に対して好意的なツイートをしている 閲覧ユーザ 推薦ユーザ 2 阪神負けろ 阪神むかつく 阪神に勝ちたい 阪神に対して否定的なツイートをしている

8 提 案手法 話題 感情 フォロイー推薦 共通の話題の抽出 共通の話題に対する感情値算出

提 案手法 話題 感情 フォロイー推薦 共通の話題の抽出 共通の話題に対する感情値算出 ツイートの感情抽出 話題における感情の類似度計算 9

提 案手法 話題 感情 フォロイー推薦 共通の話題の抽出 中間発表 共通の話題に対する感情値算出 ツイートの感情抽出 話題における感情の類似度計算 10

11 提 案手法 話題 感情 フォロイー推薦 共通の話題の抽出 共通の話題に対する感情値算出

12 共 通の話題の抽出 目的 : 閲覧ユーザと推薦候補ユーザの共通の話題を抽出 1. 閲覧ユーザと推薦候補ユーザのツイートを取得 2. 二人のユーザのツイートを混ぜてクラスタリング 3. クラスタの中から共通の話題を抽出

13 共 通の話題の抽出 目的 : 閲覧ユーザと推薦候補ユーザの共通の話題を抽出 1. 閲覧ユーザと推薦候補ユーザのツイートを取得 2. 二人のユーザのツイートを混ぜてクラスタリング 3. クラスタの中から共通の話題を抽出 閲覧ユーザ 推薦候補ユーザ 200 ツイート 200 ツイート 400 ツイート

14 共 通の話題の抽出 目的 : 閲覧ユーザと推薦候補ユーザの共通の話題を抽出 1. 閲覧ユーザと推薦候補ユーザのツイートを取得 2. 二人のユーザのツイートを混ぜてクラスタリング 3. クラスタの中から共通の話題を抽出

15 二 人のユーザのツイートを混ぜてクラスタリング 閲覧ユーザ :200 ツイート推薦候補ユーザ :200 ツイート 合計 400 ツイートを混ぜる 混ぜ合わせた 400 ツイート クラスタリング Repeated Bisection 法 Repeated Bisection 法 短文のクラスタリングに向いている クラスタの話題 : 中心ベクトルに最も近いトピック クラスタ 1 ヒット大和阪神藤浪 クラスタの話題 : 阪神

16 共 通の話題の抽出 目的 : 閲覧ユーザと推薦候補ユーザの共通の話題を抽出 1. 閲覧ユーザと推薦候補ユーザのツイートを取得 2. 二人のユーザのツイートを混ぜてクラスタリング 3. クラスタの中から共通の話題を抽出

17 ク ラスタの中から共通の話題を抽出 クラスタ1 クラスタ2 クラスタ3 閲覧ユーザ 推薦候補ユーザ クラスタリングによって生成されたクラスタの全てが共通の興味であるとは言えない

18 ク ラスタの中から共通の話題を抽出 クラスタ1 クラスタ2 クラスタ3 閲覧ユーザ 推薦候補ユーザ ツイート数の比率 : 2 ユーザ共通の話題かどうか ツイートの凝集性 : クラスタの話題がまとまっているか

19 ツ イート数の比率 クラスタ 1 2 ユーザのツイート数に偏りがあると共通の話題とは言えない ツイート数が偏っているため共通な話題として相応しくない ツイート数の比率が均等 クラスタ 2 ツイート数が均等なので共通な話題として相応しい R i = X i Y i X i + Y i R i : ツイート数の比率 X i : ユーザ X のツイート数 Y i : ユーザ Y のツイート数 閲覧ユーザ 推薦候補ユーザ

ツ イートの凝集性 クラスタ 3 Repeated Bisection 法はハードクラスタリングであるガベージクラスタが生成される ガベージクラスタとは相互に関連性のないツイートが集まったクラスタ ガベージクラスタの除外 クラスタ 2 ツイート同士の関係性が薄い為共通な話題として相応しくない ツイート同士の関係性が濃い為共通な話題として相応しい A i = x C i ( x c i x c i ) A i : ツイートの凝集性 c i : クラスタのセントロイド x: クラスタに含まれるツイート 閲覧ユーザ 推薦候補ユーザ 20

21 ク ラスタの中から共通の話題を抽出 クラスタ1 クラスタ2 クラスタ3 閲覧ユーザ 推薦候補ユーザ ツイート数の比率 R i = X i Y i X i + Y i ツイートの凝集性 A i = x C i ( x c i x c i ) 閾値以上のクラスタを抽出する R i : T R = 0.25 A i : T A = 0.60 共通話題クラスタ

22 提 案手法 話題 感情 フォロイー推薦 共通の話題の抽出 共通の話題に対する感情値算出

23 共 通の話題に対する感情値算出 共通話題クラスタ 閲覧ユーザのツイート 推薦候補ユーザのツイート 感情値算出感情値算出感情値算出感情値算出感情値算出感情値算出 ツイートそれぞれの感情値を算出 感情語辞書 顔文字の役割多次元の感情軸を用いる 喜 好安昂哀怖怒 厭驚恥

24 共 通の話題に対する感情値算出 共通話題クラスタ 感情値算出 感情値算出 感情値算出 感情値算出 感情値算出 感情値算出 閲覧ユーザのツイート 推薦候補ユーザのツイート 中間発表 ツイートそれぞれの感情値を算出 感情語辞書 顔文字の役割多次元の感情軸を用いる 喜 好安昂哀怖怒 厭驚恥

25 感 情に基づく類似度算出 k S = i=1 AS i BS i AS i BS i 共通話題クラスタ 閲覧ユーザのツイート 推薦候補ユーザのツイート S: 感情に基づく類似度 感情値算出 AS i : 閲覧ユーザの i 番目のクラスタの感情ベクトル 感情値算出感情値算出 AS i BS i : 推薦候補ユーザの i 番目のクラスタの感情ベクトル 感情値算出感情値算出感情値算出 BS i

26 類 似度算出の例 話題 : 阪神 喜 好安昂哀怖怒 厭驚恥 閲覧ユーザ 20 3 12 3 4 3 3 5 推薦候補ユーザ 1 20 4 11 4 3 3 5 3 阪神という話題に対して両ユーザとも 喜 好 のような好意的な感情を持っている 話題 : 阪神 S i = 0.99 S i = 0.36 喜 好安昂哀怖怒 厭驚恥 閲覧ユーザ 20 3 12 3 4 3 3 5 推薦候補ユーザ 2 3 5 5 12 3 18 5 3 阪神という話題に対して閲覧ユーザとは異なり推薦候補ユーザは 怒 厭 のような反感を抱いている 阪神頑張れ阪神大好き阪神いいね! 阪神負けろ阪神むかつく阪神に勝ちたい

27 推 薦ユーザの可視化 推薦ユーザ 1 昂 喜 好 安 哀 恥 驚 怖 レーダーチャート形式で話題とその話題に対する感情を可視化 怒 厭 話題に対する感情の違いを直感的に比較できる

28 可 視化の例 赤 : 閲覧ユーザ青 : 推薦候補ユーザ 話題と感情が似ている 話題と感情が異なる

29 評 価実験 目的 実験 1: 提案クラスタリング手法の有用性 実験 2: 感情を考慮したフォロイー推薦手法の有用性 閲覧ユーザ : 趣味の異なる 5 ユーザ User1: 阪神ファン, アンチ巨人 User2: 政治 User3: 巨人ファン User4: アニメ User5: サッカー

30 実 験の前準備 推薦候補ユーザ 推薦候補となるユーザの決定 Twitter 上には多くのユーザが存在 その全てを推薦候補ユーザとするのは現実的ではない 閲覧ユーザ フォロイー フォローしているユーザのフォローしている人は共通の趣味を持っている フォロイーのフォロイーを推薦候補ユーザ ランダムに 100 ユーザに対して実験

31 実 験 1 クラスタリングの有用性 比率と凝集性を考慮した共通話題クラスタの決定手法の有用性を示す ベースライン手法クラスタリングされたそのままの結果 実験方法閲覧ユーザと推薦ユーザのツイートしている話題とクラスタが一致しているかを評価

実 験 1 クラスタリングの有用性 実験 1の精度 ( 適合率 ) ベースライン手法 提案手法 User1 0.25 0.72 User2 0.20 0.79 User3 0.19 0.55 User4 0.20 0.45 User5 0.19 0.47 理由 1: 両ユーザ共通の話題となっていた ツイート数の比率を考慮したため 理由 2:Repeated Bisection 法はハードクラスタリングであるため生成される不要なクラスタを削除できた クラスタの凝集性を考慮したため 格段に精度が上がっている 32

33 実 験 2 感情を考慮したフォロイー推薦手法の有用性 共通の話題と感情を考慮したフォロイー推薦の有用性を示す ベースライン手法話題のみのフォロイー推薦 実験方法実際に推薦されたユーザをフォローしたいかしたくないかを評価

34 実 験 2 感情を考慮したフォロイー推薦手法の有用性 実験 1の精度 ( 適合率 ) 手法 適合率 再現率 F 値 User1 ベースライン手法 0.70 0.54 0.61 提案手法 0.90 0.77 0.83 User2 ベースライン手法 0.81 0.65 0.72 提案手法 0.87 0.65 0.74 User3 ベースライン手法 0.76 0.60 0.68 提案手法 0.77 0.73 0.75 User4 ベースライン手法 0.86 0.80 0.83 提案手法 0.92 0.73 0.81 User5 ベースライン手法 0.82 0.60 0.70 提案手法 0.67 0.52 0.59

35 実 験 2 感情を考慮したフォロイー推薦手法の有用性 実験 1の精度 ( 適合率 ) 手法 適合率 再現率 F 値 User1 ベースライン手法 0.70 0.54 0.61 提案手法 0.90 0.77 0.83 User2 ベースライン手法 0.81 0.65 0.72 提案手法 0.87 0.65 0.74 User3 ベースライン手法 0.76 0.60 0.68 提案手法 0.77 0.73 0.75 User4 ベースライン手法 0.86 0.80 0.83 提案手法 0.92 0.73 0.81 User5 ベースライン手法 0.82 0.60 0.70 提案手法 0.67 0.52 0.59 User1: 阪神ファン, アンチ巨人 適合率, 再現率,F 値全ての値でベースラインを上回った 阪神 巨人 に対して感情的なツイートを多くしていた

36 実 験 2 感情を考慮したフォロイー推薦手法の有用性 実験 1の精度 ( 適合率 ) 手法 適合率 再現率 F 値 User1 ベースライン手法 0.70 0.54 0.61 提案手法 0.90 0.77 0.83 User2 ベースライン手法 0.81 0.65 0.72 提案手法 0.87 0.65 0.74 User3 ベースライン手法 0.76 0.60 0.68 提案手法 0.77 0.73 0.75 User4 ベースライン手法 0.86 0.80 0.83 提案手法 0.92 0.73 0.81 User5 ベースライン手法 0.82 0.60 0.70 提案手法 0.67 0.52 0.59 User2: 政治 ベースラインと提案手法との差が見られなかった 閲覧ユーザと推薦候補ユーザがあまり感情的なツイートをしていなかった

37 実 験 2 感情を考慮したフォロイー推薦手法の有用性 実験 1の精度 ( 適合率 ) 手法 適合率 再現率 F 値 User1 ベースライン手法 0.70 0.54 0.61 提案手法 0.90 0.77 0.83 User2 ベースライン手法 0.81 0.65 0.72 提案手法 0.87 0.65 0.74 User3 ベースライン手法 0.76 0.60 0.68 提案手法 0.77 0.73 0.75 User4 ベースライン手法 0.86 0.80 0.83 提案手法 0.92 0.73 0.81 User5 ベースライン手法 0.82 0.60 0.70 提案手法 0.67 0.52 0.59 User3: 巨人ファン ベースラインより提案手法の方が良い結果となったが,User1 と比べるとあまり精度は向上しなかった 巨人の選手に対してのツイートを多く投稿していたため評価が分散した

38 実 験 2 感情を考慮したフォロイー推薦手法の有用性 実験 1の精度 ( 適合率 ) 手法 適合率 再現率 F 値 User1 ベースライン手法 0.70 0.54 0.61 提案手法 0.90 0.77 0.83 User2 ベースライン手法 0.81 0.65 0.72 提案手法 0.87 0.65 0.74 User3 ベースライン手法 0.76 0.60 0.68 提案手法 0.77 0.73 0.75 User4 ベースライン手法 0.86 0.80 0.83 提案手法 0.92 0.73 0.81 User5 ベースライン手法 0.82 0.60 0.70 提案手法 0.67 0.52 0.59 User4: アニメ ベースラインと提案手法との差が見られなかった アニメのキャラクターに対してのツイートを多く投稿していたため評価が分散した

39 実 験 2 感情を考慮したフォロイー推薦手法の有用性 実験 1の精度 ( 適合率 ) 手法 適合率 再現率 F 値 User1 ベースライン手法 0.70 0.54 0.61 提案手法 0.90 0.77 0.83 User2 ベースライン手法 0.81 0.65 0.72 提案手法 0.87 0.65 0.74 User3 ベースライン手法 0.76 0.60 0.68 提案手法 0.77 0.73 0.75 User4 ベースライン手法 0.86 0.80 0.83 提案手法 0.92 0.73 0.81 User5 ベースライン手法 0.82 0.60 0.70 提案手法 0.67 0.52 0.59 User5: サッカー 提案手法がベースラインを下回った 推薦候補ユーザは感情的なツイートを多く投稿しているが User5 は感情的なツイートをあまりしていなかった

考 察 閲覧ユーザ 感情があるツイートをしているかどうか 感情あり 感情なし 推薦候補ユーザ 感情あり 感情なし 両ユーザ共に感情があるツイートをしている場合 : 感情を用いた類似度計算の結果が良いため推薦の精度が向上 どちらかのユーザが感情がないツイートをしてる場合 : 閲覧ユーザと推薦候補ユーザの感情に差がある場合ため推薦の精度が減少 両ユーザとも感情がないツイートをしている場合 : 感情を用いた類似度計算があまり反映されず精度に変化がない 40

41 ま とめと今後の課題 まとめ 話題とその話題に対しての感情を考慮したフォロイー推薦手法を提案 クラスタリングを用いて共通の話題の抽出手法 共通な話題の感情値算出手法 共通な話題の感情値から類似度を算出して推薦ユーザを決定 今後の課題 レーダーチャートによるユーザ実験 対象ユーザが実際にフォローしているユーザからフォロー傾向の分析

研 究成果 (1) 論文誌 ( 査読あり ):1 本 Yuki Yamamoto, Tadahiko Kumamoto and Akiyo Nadamoto Multidimensional sentiment calculation method for Twitter based on emoticons International Journal of Pervasive Computing and Communications, Vol. 11 Iss: 2, pp.212 232, 2015. 国際会議 ( 査読あり ):2 本 Yuki Yamamoto, Tadahiko Kumamoto, Akiyo Naadmoto, Role of Emoticons for Multidimensional Sentiment Analysis of Twitter, The 16 th International Conference on Information Integration and Web-based Applications & Services(iiWAS 14), December 4-6, 2014, Hanoi, Vietnam (acceptance rate: 31%) Yuki Yamamoto, Tadahiko Kumamoto, Akiyo Naadmoto, Followee Recommendation Based on Topic Extraction and Sentiment Analysis from Tweets, The 17 th International Conference on Information Integration and Web-based Applications & Services(iiWAS 15), December 11-13, 2015, Brussels, Belgium (acceptance rate: 30%) 42

研究成果 (2) 国内会議 ( 査読あり ): 1 本 山本湧輝, 熊本忠彦, 灘本明代, 話題と感情の可視化に基づくフォロイー推薦, 第 8 回 Web とデータベースに関するフォーラム, (WebDB Forum2015),2015 年 11 月 ( 採択率 : 65.9%) 研究会発表 :3 本 山本湧輝, 熊本忠彦, 灘本明代, 顔文字の役割に着目したツイートの多次元感情抽出手法の提案,ARG 第 4 回 Web インテリジェンスとインタラクション研究会,2014 年 5 月 山本湧輝, 熊本忠彦, 灘本明代, Twitter 特有表現を考慮したツイートの多次元感情抽出手法の提案, 情報処理学会第 77 回関西支部支部大会,2014 年 9 月 山本湧輝, 熊本忠彦, 灘本明代, ツイートの感情の関係に基づく Twitter 感情軸の決定, 第 7 回データ工学と情報マネジメントに関するフォーラム,(DEIM2015),2015 年 3 月 43

研究成果 (3) ポスター発表 :2 本 山本湧輝, 熊本忠彦, 灘本明代, ツイートの感情の関係に基づく Twitter 感情軸の決定, 第 7 回データ工学と情報マネジメントに関するフォーラム,(DEIM2015),2015 年 3 月 山本湧輝, 熊本忠彦, 灘本明代, 話題と感情の可視化に基づくフォロイー推薦, 第 8 回 Web とデータベースに関するフォーラム,(WebDB Forum2015),2015 年 11 月 44

受賞歴 研究会発表 :1 回 山本湧輝, 熊本忠彦, 灘本明代, Twitter 特有表現を考慮したツイートの多次元感情抽出手法の提案, 情報処理学会第 77 回関西支部支部大会,2014 年 9 月 ( 学生奨励賞 ) 45