226125_多摩大経営情報研究_no.20_表紙-3校.indd
|
|
|
- ちとら ふじつぐ
- 6 years ago
- Views:
Transcription
1 研究ノート 旅行情報サイトにおけるホテル口コミデータの テキストマイニング Text Mining of Review s Data of Hotel in Internet Travel Advisory Service 久保田 貴 文* Takafumi KUBOTA キーワード 口コミデータ テキストマイニング 対応分析. はじめに 近年のインターネットの普及により ホテルの予約形態が変わりつつある 従来までの旅行 代理店経由や電話による予約に比べて インターネットから予約する機会が増加している 加えて 国内旅行の宿泊予約 についてアンケート調査 DIMSDRIVE 8 によると ホテルを予約する際には 価格やアクセスのような量的変数の他にも いわゆる口コミといわ れる お客様の声 すなわち質的変数を重視することも示されている さらに 予約をする 際には ホテルの HP などで直接予約をするよりも 旅行情報サイトを利用する方が多い割合 を占めている DIMSDRIVE 8 旅行情報サイトのデータを用いたデータ解析の先行研究として 高野 他 9 では 楽 天トラベル 楽天 5 のサイト上の口コミデータを用いてテキストマイニングにより因果関 係に着目して評価表現を抽出しており また 石橋 では 伊豆地域のホテル 旅館を 対象として じゃらん net リクルート 5 のサイト上の口コミデータを用いてテキストマ イニングによりブランド 評判の改善等に貢献することを目的としている これらの研究では 旅行情報サイトの口コミデータを実際の利用者のホテルを選ぶ観点からは解析されていない そこで 本論文では楽天トラベルの口コミデータを用いて 第一にテキストマイニングを行 い 日本におけるホテルの口コミの傾向を掴んだ 第二に頻出する単語についてデータを再構 成し 対応分析により単語間 ホテルグループ間の対応関係を調べ クラスター分析によりホ テルグループをいくつかの集団にわけて考察した 最後に その解析結果から代表的な 3 つの ホテルをピックアップしさらにテキストマイニングを進めた まず 節にて本論文で利用したデータの形式について述べる さらに 3 節にてテキストマ イニングおよび多変量解析の結果を示す 最後に 4 節で まとめと今後の展望について述べる * 多摩大学経営情報学部 School of Management and Information Sciences, Tama University :59:33
2 旅行情報サイトにおけるホテル口コミデータのテキストマイニング. データについて データ 国内旅行の宿泊予約 についてアンケート調査 DIMSDRIVE 8 より 最もよく使 われている楽天トラベル 楽天 5 の口コミデータについて 掲載されている全てのホテ ルグループに対して おすすめ順が高い順 5 年 7 月 9 日時点 に上位 3 軒のホテルにつ いて 最新 同時点 の口コミを抽出した 図 このうち 口コミのテキストデータを対 象にして 解析を行った 図 楽天トラベルから収集した口コミデータの一部 データ データ を用いてテキストマイニングで解析した結果のうち 頻度が高い の単語を含む かどうかを それぞれのホテルグループで集計し ホテルグループ 単語行列として再編成し た 図 良い 部屋 利用 朝食 美味しい 対応 立地 宿泊 アークホテル row.names アートホテル R B 4 ノボテル 5 イピススタイルズ 6 ザ 7 ホテル アゴーラ 8 古湯温泉 サイプレス 図 ホテルグループ 単語行列の一部 データ 3 データ の解析結果から判断し ドーミーイン アパホテル および 東横イン のホ テルグループに対して おすすめ順が高い順 5 年 9 月 8 日時点 に上位 軒のホテル について 最新 同時点 の 件の口コミを抽出した 図 :59:33
3 多摩大学研究紀要 経営情報研究 No 解析結果 本論文では テキストマイニングによる解析のために データ およびデータ 3 について は Text Mining Studio NTT データ数理システム 5 を使い データ についは R MeCab および RMeCab を使った はじめに データ を用いて 頻度分析 クラスター分析 およびネットワーク分析を行った 図 4 に頻度分析の結果を示す 図3 楽天トラベルから収集した ドーミーイン アパホテル および 東横イン の口コミデータの一部 図4 データ の頻度分析の結果 これより 良い 部屋 ホテル 利用 朝食などが頻繁に口コミで述べられていることがわ かった 図 5 にクラスター分析の結果を円グラフでクラスター毎の割合を示す これより こ こでも同じように 朝食 部屋 利用 ホテルなどのグループの他に 対応というグループも あることが分かった また ネットワーク図 図 6 より 良い 部屋 ホテルは様々な言葉 と繋がっている一方で 利用は繋がりが薄いことも分かった 次に データ を用いて対応分析を行った 図 7 に対応分析の結果をバイプロットにて描く この結果から 横軸は 右に行くほどフロント 対応 立地などビジネス利用 左に行くほど 過ごす 美味しい 快適などプライベート利用と解釈し ビジネス プライベートの軸と判断 できる また 縦軸は 上に行くほど 便利 立地 駅など立地の項目 下に行くほど 満足 5 5 :59:33
4 旅行情報サイトにおけるホテル口コミデータのテキストマイニング フロント 対応などサービスの項目であると解釈し 立地 サービス軸と判断できる この中 から いわゆるビジネスホテルとされるホテルグループのうち 横軸の右に大きい 東横イン 縦軸の下に大きい ドーミーイン およびどちらも中心にちかい アパホテル のグループ についてさらに掘り下げて詳しく解析する 以降 図中には順に TY DU および AP と略す その他 7.4 No.5 対応 4.37 No.4 ホテル No. 利用 したい 朝食 No. 部屋 No.3 利用 図5 図6 データ のクラスター分析の結果 データ のネットワーク分析の結果 5 5 :59:34
5 多摩大学研究紀要 経営情報研究 No. 6 図7 データ の対応分析の結果 バイプロット 図 8 にデータ を用いたクラスター分析の結果のうちデンドログラムを示す 上側がプライ ベートで利用が想定されるような温泉などのホテルのグループ 下側がビジネスホテルと判断 できるようなグループに分かれている 詳しく解析する 3 つのホテルは 前者から ドーミー イン 後者から 東横イン と アパホテル である 最後にデータ 3 を用いて テキストマイニングで詳しく解析を行う 3 つのホテルグループ を対象にしているため それぞれのグループ毎の頻度分析の結果 図 9 評判分析の結果 図 を描く また ネットワーク分析の結果を図 に示す 図 9 より データ の結果 図 4 と大きく変わらないが 東横インには 大浴場やお風呂の口コミがほとんどないことがわかる また 図 より アパホテルには部屋に対するネガティブな口コミが ドーミーインには食 事やお風呂に対するポジティブな口コミが さらに東横インには立地や駅のポジティブな口コ ミが多いことが分かる 最後に図 よりそれぞれのグループ関連する口コミのワードについ て確認された :59:34
6 旅行情報サイトにおけるホテル口コミデータのテキストマイニング Height 図8 データ のクラスター分析の結果 デンドログラム :59:34
7 多摩大学研究紀要 経営情報研究 No. 6 図9 図 データ 3 のホテルグループ毎の頻度分析の結果 データ 3 のホテルグループ毎の評判分析の結果 :59:35
8 旅行情報サイトにおけるホテル口コミデータのテキストマイニング 図 データ 3 のネットワーク分析の結果 4. まとめと今後の展望 本研究では旅行情報サイトにおける口コミデータを用いてテキストマイニングおよび対応分 析により特長を抽出した 旅行情報サイトには 口コミの他に 星の数などのアンケート形式の量的データや ホテル の属性 金額 立地など の情報も取得できるので これらのデータを用いた教師有りデータ をもとにさらなる解析を今後進めていく予定である 参考文献 石橋 太郎 e- 口コミのテキスト マイニング分析に向けて その : 伊豆地域におけるホテル 旅館を対象として 静岡大学経済研究 7, pp. -. NTT データ数理システム 5 テキストマイニングツール Text Mining Studio URL 高野 敦子 池奥 渉太 北村 泰彦 9 因果関係に着目した口コミ Web サイトからの評価表現抽出 人工知能学会論文誌 4 巻 3 号 C pp DIMSDRIVE 8 旅の予約に関する調査 ネットリサーチ DIMSDRIVE の公開アンケート調査結果 URL 楽天 5 楽天トラベル 宿 ホテル予約 国内旅行 海外旅行 予約サイト URL リクルート 5 宿 ホテル予約 旅行ならじゃらん net URL :59:36
情報ビジネス NO10 1. 旅行業界の e ビジネス 旅行業界の e ビジネス 2012 年 12 月 11 日 後保範 目的 : 一般的な e ビジネスを学んできた 一つの業界 ( 旅行 ) を詳しく見てみる 旅行業界の e ビジネスの全体像を示す 業界の中での戦略 連携を体系的に学ぶ 旅行業界
情報ビジネス NO10 1. 旅行業界の e ビジネス 旅行業界の e ビジネス 2012 年 12 月 11 日 後保範 目的 : 一般的な e ビジネスを学んできた 一つの業界 ( 旅行 ) を詳しく見てみる 旅行業界の e ビジネスの全体像を示す 業界の中での戦略 連携を体系的に学ぶ 旅行業界で B to C と B to B 既存企業とネット企業がどのように関係し合っているか 全体の e ビジネス
スライド 1
2009 年度 VMStudio & TMStudio 学生研究奨励賞 テキストマイニングツールを 利用した視線データの分析 東京大学大学院工学系研究科 白山研究室 江川陽 樋渡哲郎 1 目次 背景 目的 手法 実験 結果 考察 結論 2 背景 : 視線分析とは 視線分析とは 人間の視線の移動軌跡や分布 ( 視線データ ) を計測 分析することにより 人の認知処理を観察 解明するための手法 近年,
二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株
二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株式会社 NTT データ数理システム Copyright 2013 NTT DATA Mathematical
PowerPoint プレゼンテーション
成人看護学周手術期実習に関する 研究動向の分析 学生 指導者 教員を対象とした研究に焦点を当てて 昭和大学大学院保健医療学研究科水谷郷美 はじめに 現在 時代や国民のニーズの変化に伴い 医療の質の一層の向上が求められており チーム医療の一翼を担う看護師を養成する看護基礎教育の充実は看護の質を高めるために重要である 看護基礎教育の中でも実習は 知識を臨床能力に結び付けるためにあり 基礎看護学 成人看護学
スライド 1
Version 4.0 2011/7/25 改定 1 RepChecker ご利用マニュアル Version 4.0 2011/7/25 改定 注意 : このマニュアルの閲覧者は RepChecker ご契約者に限ります 株式会社パラダイムシフト http://psinc.jp/ 103-0004 東京都中央区東日本橋 1-3-6 TEL:03-5825-9970/ FAX:03-5825-9971
Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL. 3. 2 WIX 1 entry wid eid keyword targe
DEIM Forum 2016 H6-5 Web Index 223 8522 3-14-1 E-mail: [email protected], [email protected] Web Index(WIX) (keyword) Web URL(target) (WIX ) Web ( ) Web URL Web WIX RSS WIX Web Index, Web,
博士論文 考え続ける義務感と反復思考の役割に注目した 診断横断的なメタ認知モデルの構築 ( 要約 ) 平成 30 年 3 月 広島大学大学院総合科学研究科 向井秀文
博士論文 考え続ける義務感と反復思考の役割に注目した 診断横断的なメタ認知モデルの構築 ( 要約 ) 平成 30 年 3 月 広島大学大学院総合科学研究科 向井秀文 目次 はじめに第一章診断横断的なメタ認知モデルに関する研究動向 1. 診断横断的な観点から心理的症状のメカニズムを検討する重要性 2 2. 反復思考 (RNT) 研究の歴史的経緯 4 3. RNT の高まりを予測することが期待されるメタ認知モデル
表紙.indd
教育実践学研究 23,2018 1 Studies of Educational Psychology for Children (Adults) with Intellectual Disabilities * 鳥海順子 TORIUMI Junko 要約 : 本研究では, の動向を把握するために, 日本特殊教育学会における過去 25 年間の学会発表論文について分析を行った 具体的には, 日本特殊教育学会の1982
論文題目 大学生のお金に対する信念が家計管理と社会参加に果たす役割 氏名 渡辺伸子 論文概要本論文では, お金に対する態度の中でも認知的な面での個人差を お金に対する信念 と呼び, お金に対する信念が家計管理および社会参加の領域でどのような役割を果たしているか明らかにすることを目指した つまり, お
論文題目 大学生のお金に対する信念が家計管理と社会参加に果たす役割 氏名 渡辺伸子 論文概要本論文では, お金に対する態度の中でも認知的な面での個人差を お金に対する信念 と呼び, お金に対する信念が家計管理および社会参加の領域でどのような役割を果たしているか明らかにすることを目指した つまり, お金に対する信念の構造の把握と関連領域の整理を試みた 第 Ⅰ 部の理論的検討は第 1 章から第 5 章までであった
Mr.Children 楽曲の千変万化 - 桜井和寿が作詞した楽曲のテキストマイニング分析 - 日本大学生産工学部マネジメント工学科 第 3 学年平野未来
Mr.Children 楽曲の千変万化 - 桜井和寿が作詞した楽曲のテキストマイニング分析 - 日本大学生産工学部マネジメント工学科 第 3 学年平野未来 Ⅰ. はじめに Mr.Children Mr.Children はメンバー桜井和寿 (Vo) 田原健一 (G) 中川敬輔 (B) 鈴木英哉 (Dr) により 1989 年に結成された日本のロックバンド 1992 年 5 月 10 日 ミニ アルバム
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め
コレスポンデンス分Ⅵコレスポンデンス分析とは コレスポンデンス分析は, 多変量解析の 数量化 Ⅲ 類 と同様の手法です 行の要素と列の要素を使って数量化するとするという点で, 数量化 Ⅲ 類と基本的に同じなのですが, 数量化理論の場合は集計前のオリジナルデータから処理していくのに対し, コレスポンデ
コレスポンデンス分析Ⅵ コレスポンデンス分析 ブランドイメージや商品評価を問う調査では, マトリクス設問 ( 例えば表頭に評価項目, 表側にブランド名 ) がよく利用されます その集計データを基に, ブランドと質問項目との相関関係をビジュアルに表現できる手法が コレスポンデンス分析 です Q あなたは, 次の4 種類の商品について, どのようなイメージをお持ちですか 下の中から, あてはまるも全ての
四国大学紀要 Ser.A No.42,Ser.B No.39.pdf
四国大学紀要! B4 2 3 3 82 4 B4 2 3 3 82 4 Bull. Shikoku Univ.! 看護師のユニフォームの汚染や管理に関する研究内容の分析 3 22年に発表された文献をとおして 松尾恭子 Analysis of researches on nursing uniform about contamination and management Articles Published
統合失調症の病名変更が新聞報道に与えた影響過去約 30 年の網羅的な調査 1. 発表者 : 小池進介 ( 東京大学学生相談ネットワーク本部 / 保健 健康推進本部講師 ) 2. 発表のポイント : 過去約 30 年間の新聞記事 2,200 万件の調査から 病名を 精神分裂病 から 統合失調症 に変更
統合失調症の病名変更が新聞報道に与えた影響過去約 30 年の網羅的な調査 1. 発表者 : 小池進介 ( 東京大学学生相談ネットワーク本部 / 保健 健康推進本部講師 ) 2. 発表のポイント : 過去約 30 年間の新聞記事 2,200 万件の調査から 病名を 精神分裂病 から 統合失調症 に変更後 精神分裂病 を使用する記事がほとんどなくなったことを明らかにしました このマスメディア報道の変化は
PowerPoint プレゼンテーション
2014/01/09 楽天トラベル法人団体営業グループ ( ご利用システム名 ) ユーザ様専用です _1 ログインが完了すると ホテル検索ページに遷移します ( ご利用システム名 ) ユーザ様専用です キーワードから探すで検索 色々なキーワードを入力すると 該当するホテルが表示されます 日付から検索 1. チェックイン チェックアウト日入力 2.1 部屋あたりのご利用人数入力 3. ご利用部屋数入力
コンテンツSEO / クラウドツール パスカル About Pascal パスカルについて 競合サイトの分析をわずか1分に短縮 コンテンツマーケティングやSEOを行う際は まず最初に競合サイトのリサーチが必 要です パスカルは わずか1分で検索上位30位までの競合サイトの状況をリアルタ イムに分析 コンテンツSEOで重要な項目を比較分析します また キーワード分析は 検索ボリューム 予測値 競合サイト流入キーワード分
Powered by TCPDF ( Title Sub Title Author Publisher SNS における発言のしやすさと態度形成 : ソーシャルメディアにおける炎上から 加藤, 晋輔 (Kato, Shinsuke) 坂下, 玄哲 (Sakashita,
Powered by TCPDF (www.tcpdf.org) Title Sub Title Author Publisher SNS における発言のしやすさと態度形成 : ソーシャルメディアにおける炎上から 加藤, 晋輔 (Kato, Shinsuke) 坂下, 玄哲 (Sakashita, Mototaka) 慶應義塾大学大学院経営管理研究科 Publication year 2011 Jtitle
Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt
重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?
Title 今 熊 野 猿 楽 の 実 現 : 義 満 台 覧 の 背 景 をめぐって Author(s) 天 野, 文 雄 Citation 待 兼 山 論 叢. 美 学 篇. 22 P.1-P.20 Issue 1988 Date Text Version publisher URL http://hdl.handle.net/11094/48149 DOI Rights Osaka University
2
2 485 1300 1 6 17 18 3 18 18 3 17 () 6 1 2 3 4 1 18 11 27 10001200 705 2 18 12 27 10001230 705 3 19 2 5 10001140 302 5 () 6 280 2 7 ACCESS WEB 8 9 10 11 12 13 14 3 A B C D E 1 Data 13 12 Data 15 9 18 2
<4D F736F F D A834182CC49548FEE95F1925B969682C98AD682B782E B836792B28DB88C8B89CA F E646F63>
シニアの IT 情報端末に関するアンケート調査結果 2012 - 来年チャレンジしたいことは 旅行 運動 スポーツ スマートフォン タブレット端末などの最新 IT ツール - 調査要綱 矢野経済研究所では 次の調査要綱にて主に 60 代を中心としたシニア層に対してアンケート調査を実施した 1. 調査期間 :2012 年 12 月 2. 調査対象 : 全国の 60 代を中心とした男女 1,000 名
Title 問題解決行動における内的認知変数 Author(s) 中島, 義明 ; 太田, 耕平 Citation 大阪大学人間科学部紀要. 20 P.49-P.70 Issue 1994-03 Date Text Version publisher URL http://doi.org/10.18910/11129 DOI 10.18910/11129 Rights Osaka University
untitled
V http://ac-intelligence.jp/mystery/index.html HPhttp://ac-intelligence.jp/ http://blog.mag2.com/m/log/0000153671/ 2 ...4 155 800...10 155...10... 11...13...15 800...17...19 V 1,100...22...22...23...25...28...32...34...36...38...41...43...46...47...47...47...48
資料
2 操作マニュアル vol.4 多変量解析 5th Edit. 本マニュアルは Cross Finder が随時更新されるため 記載内容と実際の画面が異なる場合があります 目次 8. 多変量解析... 2 8.0 分析メニュー... 3 8.1 コレスポンデンス分析... 4 8.2 ポートフォリオ分析... 7 8.3 BSA 分析... 11 8.4 PSM 分析... 15 8.5 因子分析...
.T.C.Y._.E..
25 No.33 C O N T E N T S REVIEW 1 2 5 4 3 6 7 8 9 1 11 1, 1, 7,5 75 916,95 (121) 756,67 (15) 718,89 (13) 91,496 (169) 54,2 (179) 3,243 (75) 727,333 (129) 564,47 (112) 55,458 (11) 6,68,953 (18) 5,624,957
日経テレコン料金表(2016年4月)
1 2 3 4 8,000 15,000 22,000 29,000 5 6 7 8 36,000 42,000 48,000 54,000 9 10 20 30 60,000 66,000 126,000 166,000 50 100 246,000 396,000 1 25 8,000 7,000 620 2150 6,000 4,000 51100 101200 3,000 1,000 201
73 p.1 22 16 2004p.152
1987 p.80 72 73 p.1 22 16 2004p.152 281895 1930 1931 12 28 1930 10 27 12 134 74 75 10 27 47.6 1910 1925 10 10 76 10 11 12 139 p.287 p.10 11 pp.3-4 1917 p.284 77 78 10 13 10 p.6 1936 79 15 15 30 80 pp.499-501
122011pp.139174 18501933
122011pp.139174 18501933 122011 1850 3 187912 3 1850 8 1933 84 4 1871 12 1879 5 2 1 9 15 1 1 5 3 3 3 6 19 9 9 6 28 7 7 4 1140 9 4 3 5750 58 4 3 1 57 2 122011 3 4 134,500,000 4,020,000 11,600,000 5 2 678.00m
2 2 3 4 5 5 2 7 3 4 6 1 3 4 7 4 2 2 2 4 2 3 3 4 5 1932 A p. 40. 1893 A p. 224, p. 226. 1893 B pp. 1 2. p. 3.
1 73 72 1 1844 11 9 1844 12 18 5 1916 1 11 72 1 73 2 1862 3 1870 2 1862 6 1873 1 3 4 3 4 7 2 3 4 5 3 5 4 2007 p. 117. 2 2 3 4 5 5 2 7 3 4 6 1 3 4 7 4 2 2 2 4 2 3 3 4 5 1932 A p. 40. 1893 A p. 224, p. 226.
29 2011 3 4 1 19 5 2 21 6 21 2 21 7 2 23 21 8 21 1 20 21 1 22 20 p.61 21 1 21 21 1 23
29 2011 3 pp.55 86 19 1886 2 13 1 1 21 1888 1 13 2 3,500 3 5 5 50 4 1959 6 p.241 21 1 13 2 p.14 1988 p.2 21 1 15 29 2011 3 4 1 19 5 2 21 6 21 2 21 7 2 23 21 8 21 1 20 21 1 22 20 p.61 21 1 21 21 1 23 1
Microsoft Word - 映画『東京裁判』を観て.doc
1 2 3 4 5 6 7 1 2008. 2 2010, 3 2010. p.1 4 2008 p.202 5 2008. p.228 6 2011. 7 / 2008. pp.3-4 1 8 1 9 10 11 8 2008, p.7 9 2011. p.41 10.51 11 2009. p. 2 12 13 14 12 2008. p.4 13 2008, p.7-8 14 2008. p.126
