226125_多摩大経営情報研究_no.20_表紙-3校.indd

Similar documents
情報ビジネス NO10 1. 旅行業界の e ビジネス 旅行業界の e ビジネス 2012 年 12 月 11 日 後保範 目的 : 一般的な e ビジネスを学んできた 一つの業界 ( 旅行 ) を詳しく見てみる 旅行業界の e ビジネスの全体像を示す 業界の中での戦略 連携を体系的に学ぶ 旅行業界

武蔵工業大学環境情報学部情報メディアセンタージャーナル 第 9 号 2 国内観光業界の現状と本研究への展開 本章では, 準備として, 本論文で対象とする観光業界の現状と本研究の位置づけについて述べる. 2.1 観光業界の現状従来の観光サービスでは, 地域資源をただ一方的に消費者にアピー

スライド 1

口コミデータの解析による 調味料メーカーのウェブマーケティング

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株


untitled

コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 数理システムユーザーコンファレンス 2007

PowerPoint プレゼンテーション

スライド 1

中国携帯電話市場に関するアンケート調査

Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL WIX 1 entry wid eid keyword targe

博士論文 考え続ける義務感と反復思考の役割に注目した 診断横断的なメタ認知モデルの構築 ( 要約 ) 平成 30 年 3 月 広島大学大学院総合科学研究科 向井秀文

30 代 ~50 代を中心とするビジネスマンは出張で年間平均 40 泊前後宿泊しています 1 人で年間 40 泊する出張ビジネスマンは 40 名様で 1 泊の団体のお客様に匹敵し 依然として A カード会員である出張ビジネスマンは優良なリピーター顧客となり得ることを示唆しています 2[ 予算と実額

目的ブログでの書き込みによる実際の LGBT 当事者における恋愛についての考えを分析する LGBT は病気でもなく 当事者のアイデンティティや社会的立場など複雑に他の領域にも関係しており 自認をしていても他者からの認定などが基本的には難しく 自身が本当に LGBT であるという確証を得難いため ポジ

e e e e e 2,000 JCB JCB

本組/根間弘海

表紙.indd

論文題目 大学生のお金に対する信念が家計管理と社会参加に果たす役割 氏名 渡辺伸子 論文概要本論文では, お金に対する態度の中でも認知的な面での個人差を お金に対する信念 と呼び, お金に対する信念が家計管理および社会参加の領域でどのような役割を果たしているか明らかにすることを目指した つまり, お

スライド 1

「情報検索演習」のためのインターネットの活用

Mr.Children 楽曲の千変万化 - 桜井和寿が作詞した楽曲のテキストマイニング分析 - 日本大学生産工学部マネジメント工学科 第 3 学年平野未来

zenken15_7th_L

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

菊地 : テキストマイニングを用いた在宅看護研究の動向山陽論叢第 24 巻 (2017) 掲載巻号などの基本情報に加え キーワード 抄録 論文種別 論文分野など多様な情報を集録している. 医中誌においてテキストマイニングを実施するにあたり 検索ヒットした文献 1ページずつ すべてのチェック表示にチェ

コレスポンデンス分Ⅵコレスポンデンス分析とは コレスポンデンス分析は, 多変量解析の 数量化 Ⅲ 類 と同様の手法です 行の要素と列の要素を使って数量化するとするという点で, 数量化 Ⅲ 類と基本的に同じなのですが, 数量化理論の場合は集計前のオリジナルデータから処理していくのに対し, コレスポンデ

coding

四国大学紀要 Ser.A No.42,Ser.B No.39.pdf

0210研究会

Microsoft PowerPoint - inbound_manu2.ppt [äº™æ‘łã…¢ã…¼ã…›]





統合失調症の病名変更が新聞報道に与えた影響過去約 30 年の網羅的な調査 1. 発表者 : 小池進介 ( 東京大学学生相談ネットワーク本部 / 保健 健康推進本部講師 ) 2. 発表のポイント : 過去約 30 年間の新聞記事 2,200 万件の調査から 病名を 精神分裂病 から 統合失調症 に変更

PowerPoint プレゼンテーション


名大_医学部保健学科年報第8巻/巻頭


Powered by TCPDF ( Title Sub Title Author Publisher SNS における発言のしやすさと態度形成 : ソーシャルメディアにおける炎上から 加藤, 晋輔 (Kato, Shinsuke) 坂下, 玄哲 (Sakashita,

熊谷市報10月号

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

これらのご要望などを踏まえ 本技術を開発しました 本技術により渋滞予知の精度は大幅に向上し 渋滞があると予測した時間帯において 所要時間の誤差が30 分以上となる時間帯の割合が 従来の渋滞予報カレンダー 7 の8.2% に対して0.8% 20 分以上となる割合が26% に対して6.7% となり また

スライド 1


本システムでは Web アプリケーションベー スでシステムを構築することにより PC でも携 帯機器でも場所を問わず利用できるようにする ユーザはブラウザのフォーム上で連絡先情報等 の交換を行う 将来的には携帯電話の Felica な どを使って相互の名刺情報交換が無線で短時間 に簡単にできるように

DEIM Forum 2010 A Web Abstract Classification Method for Revie

2

News Release 2017 年秋 紅葉 に関する検索動向調査 検索者数は前年比減 検索流入者数 1 位は 紅葉名所 ウォーカープラス 前年と比べて紅葉に関する検索者数は減少 特に女性の減少幅が大きかった 地名では 箱根 関西 東海 を掛け合わせて検索した人数が増加 首都圏近郊の

12P新雛型.indd

<4D F736F F D A834182CC49548FEE95F1925B969682C98AD682B782E B836792B28DB88C8B89CA F E646F63>


橡会議録(第5回).doc

講演「母乳育児のうそほんと」

題目

2019 年上期 ステイ石垣島 設定ホテル一覧 & ホテル差額料金表 設定ホテル ホテル名 喫煙ルーム 禁煙ルーム 食事条件 宿泊ポイント アパホテル石垣 - 洋室 /1~4 名 1 室 朝 駐車場滞在中無料 ホテル花と緑のみずほ石垣島 ( 1) - 洋室 /1~5 名 1 室 なし ( 2) 朝摘

出張に伴う年間平均宿泊数 ( 過去 9 年間の推移 / 有効回答者数 :12,866 人 ) 調査実施時期 2009 年 1 月 2010 年 1 月 2011 年 1 月 2012 年 1 月 2013 年 1 月 2014 年 1 月 2015 年 1 月 2016 年 1 月 2017 年 1

untitled



テーマ :Twitter の現状と展望 酒井健吾 1. 調査の目的本稿は 新たなコミュニケーションツールとして台頭する Twitter の現状と展望に関する動向の概要を調査した上で Twitter が現在抱えている課題とその対策について検討する 2. 調査の概要 Twit

多摩のかけはしNo98 表1表4色

Microsoft Word - 07_技報16号宮内.doc

資料

04_™|fià”†

URL :


新築_PDF用

untitled

表紙a


表紙.PDF

untitled

AFASパンフ表.ai

.....w...j...[.X55..

cover_jinzai_21

fukushi-yotsukaido113

untitled




電力技術研究所

untitled

農林金融2015年5月号


表 5-1 機器 設備 説明変数のカテゴリースコア, 偏相関係数, 判別的中率 属性 カテゴリー カテゴリースコア レンジ 偏相関係数 性別 女性 男性 ~20 歳台 歳台 年齢 40 歳台

.T.C.Y._.E..

日経テレコン料金表(2016年4月)

73 p p.152


Microsoft Word - 田中亮太郎.doc

_Print

122011pp

2

A p A p. 224, p B pp p. 3.

p

スラヴ_00A巻頭部分

Microsoft Word - 映画『東京裁判』を観て.doc

9

Transcription:

研究ノート 旅行情報サイトにおけるホテル口コミデータの テキストマイニング Text Mining of Review s Data of Hotel in Internet Travel Advisory Service 久保田 貴 文* Takafumi KUBOTA キーワード 口コミデータ テキストマイニング 対応分析. はじめに 近年のインターネットの普及により ホテルの予約形態が変わりつつある 従来までの旅行 代理店経由や電話による予約に比べて インターネットから予約する機会が増加している 加えて 国内旅行の宿泊予約 についてアンケート調査 DIMSDRIVE 8 によると ホテルを予約する際には 価格やアクセスのような量的変数の他にも いわゆる口コミといわ れる お客様の声 すなわち質的変数を重視することも示されている さらに 予約をする 際には ホテルの HP などで直接予約をするよりも 旅行情報サイトを利用する方が多い割合 を占めている DIMSDRIVE 8 旅行情報サイトのデータを用いたデータ解析の先行研究として 高野 他 9 では 楽 天トラベル 楽天 5 のサイト上の口コミデータを用いてテキストマイニングにより因果関 係に着目して評価表現を抽出しており また 石橋 では 伊豆地域のホテル 旅館を 対象として じゃらん net リクルート 5 のサイト上の口コミデータを用いてテキストマ イニングによりブランド 評判の改善等に貢献することを目的としている これらの研究では 旅行情報サイトの口コミデータを実際の利用者のホテルを選ぶ観点からは解析されていない そこで 本論文では楽天トラベルの口コミデータを用いて 第一にテキストマイニングを行 い 日本におけるホテルの口コミの傾向を掴んだ 第二に頻出する単語についてデータを再構 成し 対応分析により単語間 ホテルグループ間の対応関係を調べ クラスター分析によりホ テルグループをいくつかの集団にわけて考察した 最後に その解析結果から代表的な 3 つの ホテルをピックアップしさらにテキストマイニングを進めた まず 節にて本論文で利用したデータの形式について述べる さらに 3 節にてテキストマ イニングおよび多変量解析の結果を示す 最後に 4 節で まとめと今後の展望について述べる * 多摩大学経営情報学部 School of Management and Information Sciences, Tama University 49 49 :59:33

旅行情報サイトにおけるホテル口コミデータのテキストマイニング. データについて データ 国内旅行の宿泊予約 についてアンケート調査 DIMSDRIVE 8 より 最もよく使 われている楽天トラベル 楽天 5 の口コミデータについて 掲載されている全てのホテ ルグループに対して おすすめ順が高い順 5 年 7 月 9 日時点 に上位 3 軒のホテルにつ いて 最新 同時点 の口コミを抽出した 図 このうち 口コミのテキストデータを対 象にして 解析を行った 図 楽天トラベルから収集した口コミデータの一部 データ データ を用いてテキストマイニングで解析した結果のうち 頻度が高い の単語を含む かどうかを それぞれのホテルグループで集計し ホテルグループ 単語行列として再編成し た 図 良い 部屋 利用 朝食 美味しい 対応 立地 宿泊 アークホテル row.names アートホテル 3 3 3 R B 4 ノボテル 5 イピススタイルズ 6 ザ 7 ホテル アゴーラ 8 古湯温泉 サイプレス 図 ホテルグループ 単語行列の一部 データ 3 データ の解析結果から判断し ドーミーイン アパホテル および 東横イン のホ テルグループに対して おすすめ順が高い順 5 年 9 月 8 日時点 に上位 軒のホテル について 最新 同時点 の 件の口コミを抽出した 図 3 5 5 :59:33

多摩大学研究紀要 経営情報研究 No. 6 3. 解析結果 本論文では テキストマイニングによる解析のために データ およびデータ 3 について は Text Mining Studio NTT データ数理システム 5 を使い データ についは R MeCab および RMeCab を使った はじめに データ を用いて 頻度分析 クラスター分析 およびネットワーク分析を行った 図 4 に頻度分析の結果を示す 図3 楽天トラベルから収集した ドーミーイン アパホテル および 東横イン の口コミデータの一部 図4 データ の頻度分析の結果 これより 良い 部屋 ホテル 利用 朝食などが頻繁に口コミで述べられていることがわ かった 図 5 にクラスター分析の結果を円グラフでクラスター毎の割合を示す これより こ こでも同じように 朝食 部屋 利用 ホテルなどのグループの他に 対応というグループも あることが分かった また ネットワーク図 図 6 より 良い 部屋 ホテルは様々な言葉 と繋がっている一方で 利用は繋がりが薄いことも分かった 次に データ を用いて対応分析を行った 図 7 に対応分析の結果をバイプロットにて描く この結果から 横軸は 右に行くほどフロント 対応 立地などビジネス利用 左に行くほど 過ごす 美味しい 快適などプライベート利用と解釈し ビジネス プライベートの軸と判断 できる また 縦軸は 上に行くほど 便利 立地 駅など立地の項目 下に行くほど 満足 5 5 :59:33

旅行情報サイトにおけるホテル口コミデータのテキストマイニング フロント 対応などサービスの項目であると解釈し 立地 サービス軸と判断できる この中 から いわゆるビジネスホテルとされるホテルグループのうち 横軸の右に大きい 東横イン 縦軸の下に大きい ドーミーイン およびどちらも中心にちかい アパホテル のグループ についてさらに掘り下げて詳しく解析する 以降 図中には順に TY DU および AP と略す その他 7.4 No.5 対応 4.37 No.4 ホテル No. 利用 したい 朝食 34 5.9 8 3.33 3 3.7 7. No. 部屋 No.3 利用 図5 図6 データ のクラスター分析の結果 データ のネットワーク分析の結果 5 5 :59:34

多摩大学研究紀要 経営情報研究 No. 6 図7 データ の対応分析の結果 バイプロット 図 8 にデータ を用いたクラスター分析の結果のうちデンドログラムを示す 上側がプライ ベートで利用が想定されるような温泉などのホテルのグループ 下側がビジネスホテルと判断 できるようなグループに分かれている 詳しく解析する 3 つのホテルは 前者から ドーミー イン 後者から 東横イン と アパホテル である 最後にデータ 3 を用いて テキストマイニングで詳しく解析を行う 3 つのホテルグループ を対象にしているため それぞれのグループ毎の頻度分析の結果 図 9 評判分析の結果 図 を描く また ネットワーク分析の結果を図 に示す 図 9 より データ の結果 図 4 と大きく変わらないが 東横インには 大浴場やお風呂の口コミがほとんどないことがわかる また 図 より アパホテルには部屋に対するネガティブな口コミが ドーミーインには食 事やお風呂に対するポジティブな口コミが さらに東横インには立地や駅のポジティブな口コ ミが多いことが分かる 最後に図 よりそれぞれのグループ関連する口コミのワードについ て確認された 53 53 :59:34

旅行情報サイトにおけるホテル口コミデータのテキストマイニング Height 図8 データ のクラスター分析の結果 デンドログラム 54 54 :59:34

多摩大学研究紀要 経営情報研究 No. 6 図9 図 データ 3 のホテルグループ毎の頻度分析の結果 データ 3 のホテルグループ毎の評判分析の結果 55 55 :59:35

旅行情報サイトにおけるホテル口コミデータのテキストマイニング 図 データ 3 のネットワーク分析の結果 4. まとめと今後の展望 本研究では旅行情報サイトにおける口コミデータを用いてテキストマイニングおよび対応分 析により特長を抽出した 旅行情報サイトには 口コミの他に 星の数などのアンケート形式の量的データや ホテル の属性 金額 立地など の情報も取得できるので これらのデータを用いた教師有りデータ をもとにさらなる解析を今後進めていく予定である 参考文献 石橋 太郎 e- 口コミのテキスト マイニング分析に向けて その : 伊豆地域におけるホテル 旅館を対象として 静岡大学経済研究 7, pp. -. NTT データ数理システム 5 テキストマイニングツール Text Mining Studio URL https://www.msi.co.jp/tmstudio/ 高野 敦子 池奥 渉太 北村 泰彦 9 因果関係に着目した口コミ Web サイトからの評価表現抽出 人工知能学会論文誌 4 巻 3 号 C pp. 3-33. DIMSDRIVE 8 旅の予約に関する調査 ネットリサーチ DIMSDRIVE の公開アンケート調査結果 URL http://www.dims.ne.jp/timelyresearch/8/898/ 楽天 5 楽天トラベル 宿 ホテル予約 国内旅行 海外旅行 予約サイト URL http://travel.rakuten.co.jp リクルート 5 宿 ホテル予約 旅行ならじゃらん net URL http://www.jalan.net 56 56 :59:36