DEIM Forum 2019 H Web 1 Tripadvisor

Similar documents
IPSJ SIG Technical Report Vol.2009-DPS-141 No.20 Vol.2009-GN-73 No.20 Vol.2009-EIP-46 No /11/27 1. MIERUKEN 1 2 MIERUKEN MIERUKEN MIERUKEN: Spe

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

21 Pitman-Yor Pitman- Yor [7] n -gram W w n-gram G Pitman-Yor P Y (d, θ, G 0 ) (1) G P Y (d, θ, G 0 ) (1) Pitman-Yor d, θ, G 0 d 0 d 1 θ Pitman-Yor G

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni

DEIM Forum 2012 E Web Extracting Modification of Objec

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

nlp1-12.key

main.dvi

. Yahoo! 1!goo 2 QA..... QA Web Web [1]Web Web Yin [2] Web Web Web. [3] Web Wikipedia 1 2


BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

A Japanese Word Dependency Corpus ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

C-œI‡Ä‡¢

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +

e-learning e e e e e-learning 2 Web e-leaning e 4 GP 4 e-learning e-learning e-learning e LMS LMS Internet Navigware

untitled

レビューテキストの書き の評価視点に対する評価点の推定 29 3

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

Vol.54 No (July 2013) [9] [10] [11] [12], [13] 1 Fig. 1 Flowchart of the proposed system. c 2013 Information

Gaze Head Eye (a) deg (b) 45 deg (c) 9 deg 1: - 1(b) - [5], [6] [7] Stahl [8], [9] Fang [1], [11] Itti [12] Itti [13] [7] Fang [1],


自然言語処理24_705

2 3, 4, [1] [2] [3]., [4], () [3], [5]. Mel Frequency Cepstral Coefficients (MFCC) [9] Logan [4] MFCC MFCC Flexer [10] Bogdanov2010 [3] [14],,,

JVRSJ Vol.18 No.3 September, NPC RTS Real-time Simulation NPC NPC NPC AI NPC 4 AI 2 AI 図 1 ゲームとユーザエクスペリエンス reality a

1(a) (b),(c) - [5], [6] Itti [12] [13] gaze eyeball head 2: [time] [7] Stahl [8], [9] Fang [1], [11] 3 -

Wikipedia YahooQA MAD 4)5) MAD Web 6) 3. YAMAHA 7) 8) Vocaloid PV YouTube 1 minato minato ussy 3D MAD F EDis ussy

,, WIX. 3. Web Index 3. 1 WIX WIX XML URL, 1., keyword, URL target., WIX, header,, WIX. 1 entry keyword 1 target 1 keyword target., entry, 1 1. WIX [2

¥ì¥·¥Ô¤Î¸À¸ì½èÍý¤Î¸½¾õ

28 Horizontal angle correction using straight line detection in an equirectangular image

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

Vol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),

Ÿ_ٶ-“sŒ{’¨−î

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root

(2008) JUMAN *1 (, 2000) google MeCab *2 KH coder TinyTextMiner KNP(, 2000) google cabocha(, 2001) JUMAN MeCab *1 *2 h

DEIM Forum 2010 A3-3 Web Web Web Web Web. Web Abstract Web-page R

main.dvi

Transcription:

DEIM Forum 2019 H7-2 163 8677 1 24 2 E-mail: em18011@ns.kogakuin.ac.jp, kitayama@cc.kogakuin.ac.jp Web 1 Tripadvisor 1 2 1 1https://www.tripadvisor.com/ 2https://www.jalan.net/kankou/ 1 2 3 4 5 6 7 2 2. 1 [1] Flickr [2] Cheng [3]

1 2 2. 2 [4] () () [5] [6] Gick [7] [8]. 3 [5][9] 3 3. 1 2016 9 [10] 1 Python gensim 3 Distributed Bag-of-Words 300 MeCab [11] mecab-ipadic-neologd 4 () 3. 2 3https://radimrehurek.com/gensim/models/doc2vec.html 4https://github.com/neologd/mecab-ipadic-neologd/

表 1 形態素解析の例 リ 場所になる傾向がある 他の例として 京都の寺院の中に 金閣寺 と 清水寺 が レビュー文書 どよい きれいに清掃などもされていて 気分がよ 存在する場合を考える このとき 金閣寺 の相対的特徴は 金色 金箔 輝きなどである 一方 清水寺 の相対的特徴 は 舞台や一望などである どちらも京都にある寺院であるた 園内も広く 気分転換に散歩したりするのにちょう いです 形態素解析 園内 広い 気分転換 散歩 ちょうど よい きれい 清 掃 気分 よい め 京都や寺院に関連する特徴は相対的特徴にならない その 代わりに より詳細な特徴が相対的特徴として得られる rstate,i = si average(sstate si ) (1) 相対的特徴ベクトル rstate,i は 式 1 として定義される 相 対的特徴ベクトルは そのスポット自体の特徴ベクトルから他 のスポットの特徴ベクトルの平均を引いた値によって得られ る Sstate = {s1, s2,..., sn } は 既訪問スポット集合や未訪問 スポット集合となっている state は f のとき 既訪問スポッ ト集合として定義する state は u のとき 未訪問スポット集 合として定義する si は集合 Sstate 内の観光スポットの特徴ベ 図 3 プロトタイプシステムのユーザインターフェース クトルを示している 3. 3 説明スポットの決定 TFIDF 値を求める 次に 2 つのスポットの共通する特徴語 未訪問エリア内のスポットは既訪問スポットを使って説明す る したがって 未訪問スポットと既訪問スポットを 既訪問 スポット rf,i と未訪問スポット ru,j の相対的特徴ベクトルに のスコアとして TFIDF 値の調和平均を計算する 最後に ス コアが高い特徴語を説明可能な単語として抽出する スポット内のキーワード特徴量は 式 3 で定義する ( よって計算された類似度に基づいて関連付けを行う 図 2 類 T F IDF (t, d, state) = T F (t, d) log 似度計算には コサイン尺度 (式 2) を用いる cos(rf,i, ru,j ) = rf,i ru,j rf,i ru,j (2) 関連付け手順について説明する まず 特定のスポットに最 も類似度が高いスポットと関連付ける このとき 類似度が閾 値 (本研究では 0.125) 以下である場合は関連付けを行わない Sstate DF (t, state) ) (3) T F (t, d) は 文書 d においてのキーワード t の数である d は スポットのすべてのレビューを 1 つにまとめた文書である DF (t, state) は キーワード t を含む文書の数である Sstate はスポットの総数である state が f の場合 ユーザが入力し また 未訪問スポットと類似度が最も高い既訪問スポットと関 た既訪問スポット集合を使用して TFIDF 値を計算する state 連付けられているか 既訪問スポットと類似度が最も高い未訪 が u の場合 ユーザが入力したエリアに含まれている未訪問ス 問スポットと関連付けられているかによって結果が異なる ポット集合を使用して TFIDF 値を計算する 前者の方法では すべての類似度が閾値を超えると すべて の既訪問スポットに対応するスポットがあるが すべての未訪 問スポットに対応するスポットがあるわけではない 一方 後 者の方法では すべての類似度が閾値を超えると すべての未 2 つのスポットに共通する特徴語の TFIDF 値の調和平均 を用いて 関連付けした既訪問スポットと未訪問スポットの 説明可能なキーワードを抽出する まず 既訪問スポットと 未訪問スポットのレビュー文書でよく出現する単語を抽出す 訪問スポットに対応するスポットがある 本手法では 未訪問 る 次に 抽出した単語のスコアは式 4 によって定義する スポットを説明するために後者の方法を採用する T F IDF (t, d, f ) と T F IDF (t, d, u) は同じ単語がそれぞれ既訪 問スポットの TFIDF 値と未訪問スポットの TFIDF 値を示し 3. 4 説明スポットの役割語の抽出 未訪問スポットと既訪問スポットの関係性を表すキーワード ている 単語スコアの値が大きいのとき その単語は各スポッ トにおいて重要度が高いことを示している よって 単語スコ をユーザに提示する しかし 相対的特徴ベクトルから単語の アの上位 N 個の単語が説明情報としてユーザに提示する (図 特徴を得ることはできないので 他の方法を使って単語を抽出 3) する 前提として すべてのレビューは日本語の形態素解析器 MeCab score(t, d) = 2 T F IDF (t, d, f ) T F IDF (t, d, u) (4) T F IDF (t, d, f ) + T F IDF (t, d, u) によって単語を分割する 3. 1 節の mecab-ipadic-neologd 辞書を利用する しかし 助詞 助動詞 連体詞 記号 ストッ プワードを削除する (表 1) 3. 5 未訪問スポットの説明情報の例 表 2 は ユーザ既訪問スポット集合と未訪問スポットの集合 キーワード抽出手順について説明する まず TFIDF 法を の例を示している 未訪問スポットは東京都内からランダムに 使って対象となる既訪問スポットと未訪問スポットの特徴語と 選んだ 5 つのスポットである 表 3 は 3 節で提案した方法を

2 (R) 2 2 4 4. 1 3 A B C () A B 3. 1 3. 4 TFIDF A 2 5 score(t, d) = T F IDF (t, d, f) + T F IDF (t, d, u) 2 (5) B 2 6 score(t, d) = T F IDF (t, d, f) T F IDF (t, d, u) (6) 5 6 T F IDF (t, d, f) T F IDF (t, d, u) TFIDF TFIDF N 4. 2 CrowdWorks 5 23 4 10 A C (N < = 5) 5 5 1 1 2 2 3 2 4 2 5 2 4. 3 4 A C 1 5 B 2 B A C 2 3 A C A 5 C 2 3 C 5 5. 1 3 D () E () 5https://crowdworks.jp/

3 4 A B C 1 0.00% 0.00% 0.00% 2 28.28% 31.31% 29.29% 3 35.35% 31.31% 35.35% 4 10.10% 14.14% 12.12% 5 26.26% 23.23% 23.23% 6 D E C 1 0.00% 0.00% 0.00% 2 41.30% 33.85% 29.36% 3 43.48% 47.69% 48.62% 4 2.17% 2.31% 2.75% 5 13.04% 16.15% 19.27% 5 D E C 1 0 0 0 0 2 19 44 32 95 3 20 62 53 135 4 1 3 3 7 5 6 21 21 48 46 130 109 285 C () D 3 1 1 2 1 12 D 3. 4 E 3. 1 3. 4 CrowdWorks 24 4. 2 5. 2 5 DE C 285 D E 6 1 5 D 2 D 7 E& 2 56.82% 43.18% C& 2 71.87% 28.13% E& 3 51.61% 48.39% C& 3 52.83% 47.17% C() 2 3 C 5 2 3 D D 2 3 2 3 2 3 E 3 5 E C 7 2 3 C E

8 a 9 b 6 6. 1 a b () 4 10 2 a b. 2 1 2 6. 2 a b 12 38 8( a) 9( b) a b 10 40 2 b a 2 80% b b 7 3 3 30 (C)( 18K11551) [1] T. Kurashima, T. Iwata, G. Irie and K. Fujimura., Travel route recommendation using geotags in photo sharing sites, CIKM 10 Proceedings of the 19th ACM international conference on Information and knowledge management, pp.579-588, 2010 [2] R. Kitamura and T. Itoh, Tourist Spot Recommmendation Applying Generic Object Recognition with Travel Photos, ITE Tech. Rep., Vol.42, No.12, AIT2018-94, pp.185-188, 2018 [3] A. J. Cheng, Y. Y. Chen, Y. T. Huang and Winston H.

Hsu, Personalized Travel Recommendation by Mining People Attributes from Community-Contributed Photos, MM 11 Proceedings of the 19th ACM international conference on Multimedia, pp.83-92, 2011 [4] K. J. Holyoak and P. Thagard, Mental Leaps: Analogy in Creative Thought, MIT Press, Journal of Japanese Society for Artificial Intelligence, Vol.11, No.3, pp.489, 1996 [5] D. Gentner, Structure-Mapping: A Theoretical Framework for Analogy, Cognitive Science, Vol.7, pp.155170, 1983 [6] M. L. Gick and K. J. Holyoak, Analogical Problem Solving, Cognitive Psychology, Vol.12, pp.306355, 1980 [7] M. L. Gick and K. J. Holyoak, Scheme Induction and Similarity in Analogical Transfer, Cognitive Psychology, Vol.15, pp.138, 1983 [8] Z. Chen and M. W. Daehler, Positive and Negative Transfer in Analogical Problem-solving by 6-years-old Children, Cognitive Development, Vol.4, No.4, pp.327344, 1989 [9] K. J. Holyoak and P. Thagard, Analogical Mapping by Constraint Satisfaction, Cognitive Science, Vol.13, pp.295355, 1989 [10] Quoc V. Le and Tomas Mikolov, Distributed representations of sentences and documents, In Proceedings of the 31th International Conference on Machine Learning, ICML 2014, pp. 11881196, 2014 [11] T. Kudo, K. Yamamoto and Y. Matsumoto, Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp.230-237, 2004