オンラインテキストマイニング



Similar documents
<4D F736F F D2095CA8E A90DA91B18C9F93A289F1939A8F D8288B3816A5F E646F63>

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

4 調 査 の 対 話 内 容 (1) 調 査 対 象 財 産 の 土 地 建 物 等 を 活 用 して 展 開 できる 事 業 のアイディアをお 聞 かせく ださい 事 業 アイディアには, 次 の 可 能 性 も 含 めて 提 案 をお 願 いします ア 地 域 の 活 性 化 と 様 々な 世

<4D F736F F F696E74202D20838C837C815B B F A2E B93C782DD8EE682E890EA97705D>

一般競争入札について

<819A955D89BF92B28F BC690ED97AA8EBA81418FA48BC682CC8A8890AB89BB816A32322E786C7378>

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

(2)大学・学部・研究科等の理念・目的が、大学構成員(教職員および学生)に周知され、社会に公表されているか

Microsoft Word - 目次.doc

質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定

佐渡市都市計画区域の見直し


新 生産管理システム ご提案書 2002年10月15日 ムラテック情報システム株式会社

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

1 総 合 設 計 一 定 規 模 以 上 の 敷 地 面 積 及 び 一 定 割 合 以 上 の 空 地 を 有 する 建 築 計 画 について 特 定 行 政 庁 の 許 可 により 容 積 率 斜 線 制 限 などの 制 限 を 緩 和 する 制 度 である 建 築 敷 地 の 共 同 化 や

東京都立産業技術高等専門学校

平成16年年金制度改正 ~年金の昔・今・未来を考える~

<4D F736F F F696E74202D208CC2906C938A8E9189C690E096BE89EF8E9197BF E358C8E313993FA816A>

事 業 概 要 利 用 時 間 休 館 日 使 用 方 法 使 用 料 施 設 を 取 り 巻 く 状 況 や 課 題 < 松 山 駅 前 駐 輪 場 > JR 松 山 駅 を 利 用 する 人 の 自 転 車 原 付 を 収 容 する 施 設 として 設 置 され 有 料 駐 輪 場 の 利 用

(Microsoft Word - \203A \225\345\217W\227v\227\314 .doc)

< C815B D836A B2E786C73>

は 固 定 流 動 及 び 繰 延 に 区 分 することとし 減 価 償 却 を 行 うべき 固 定 の 取 得 又 は 改 良 に 充 てるための 補 助 金 等 の 交 付 を 受 けた 場 合 にお いては その 交 付 を 受 けた 金 額 に 相 当 する 額 を 長 期 前 受 金 とし

預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可

Transcription:

オンライン テキストマイニング ツール TextVoice 20150828 2015.09

~ 特 徴 ~ TextVoice(テキストボイス)は 意 味 論 を 用 いて 独 自 のアルゴリズムで 作 られた 全 く 新 しいテキストマイニング ツールです 簡 単 操 作 で 一 定 の 基 準 のもとに 分 析 結 果 を 提 供 します テキストを 効 率 的 に 活 用 することに 特 化 した 誰 でもその 日 から 使 えるASPツールです 特 徴 1 意 味 を 持 たせた 内 蔵 辞 書 により 事 前 の 辞 書 整 備 なしで 分 析 が 可 能 特 徴 2 操 作 が 容 易 で CSVファイルをアップし 実 行 ボタンを 押 すだけで 分 析 ができる 特 徴 3 特 徴 4 特 徴 5 最 大 6 語 の 結 びつきで 表 現 するので 意 味 が 見 えてくる 少 ない 意 見 ではあるが 強 い 意 見 を 結 束 度 により 把 握 が 可 能 属 性 ごとの 特 徴 が 簡 単 に 確 認 できる TextVoiceが テキストデータの 価 値 を 最 大 限 に 高 めます 1

TextVoiceでは 以 下 の4つの 結 果 を 提 供 します すべての 結 果 はCSVでも 落 とせます サマライズ フォーカス どんな 内 容 があるのか 最 大 6つのピースの 組 合 せで 分 類 パースペクティブ 少 なくても 注 目 すべき 意 見 を 発 見 セグメント 隠 れた 大 きなパターンを 読 み 解 くためのマッピング 性 別 や 年 齢 ブランドなど 属 性 と 強 くつながる 内 容 を 抽 出 2

4つの 分 析 機 能 ~2 語 では 見 えなかったものが 見 えてくる~ サマライズ どんな 内 容 があるのか 最 大 6つのピースの 組 合 せで 分 類 出 現 量 は 組 合 せに 該 当 すると 判 断 した 文 の 件 数 結 束 度 の 説 明 は 後 述 分 析 データは 英 語 力 の 必 要 性 の 理 由 原 文 も 見 られます 3

4つの 分 析 機 能 ~ 少 数 でも 要 注 意 の 意 見 が 見 えてくる~ フォーカス 結 束 度 の 高 い 要 注 目 の 意 見 を 抽 出 する 結 束 度 とは:ピースのつながり( 結 束 )の 強 さを 測 ったもの 値 の 範 囲 は1~ 無 限 大 結 束 度 の 高 い 意 見 は しっかりとまとまった 強 い 主 張 であると 解 釈 する 縦 軸 : 結 束 度 出 現 量 が 多 く 結 束 度 も 高 い 右 上 の 意 見 は 無 視 できない 重 要 な 意 見 出 現 量 は 少 ないが 結 束 度 は 高 い 左 上 の 意 見 は 要 注 目 すべき 意 見 として 解 釈 する 横 軸 : 出 現 量 4

4つの 分 析 機 能 フォーカス 補 足 結 束 度 とは 結 束 度 とは: ピースの 共 起 関 係 を 分 析 した ピースのつながりの 強 さ の 合 計 値 です 下 記 の 図 の 赤 い 矢 印 線 が 短 い ほど つながりが 強 い ことを 模 式 的 に 示 しています 赤 い 点 線 の 一 定 の 範 囲 に 収 まる つながりの 強 いピースを 集 めて 6 語 のグループ を 作 ります 6ピースのグループ 牛 乳 飲 む コーヒー 発 言 グループ1 混 ぜて 紅 茶 入 れて グループ1のほうが グループ2よりもよく まとまっている 結 束 度 が 強 い 主 張 が 強 い おやつ 餃 子 洋 食 発 言 グループ2 クッキー パサパサ 5

4つの 分 析 機 能 ~ 発 言 の 関 係 性 が 見 えてくる~ パースペクティブ テキストに 潜 在 する 大 きなパターンを 読 み 解 くためのマッピング 数 値 の 大 きさ 符 号 には 意 味 がなく 配 置 の 位 置 関 係 から 解 釈 近 くに 配 置 された 内 容 は 背 景 に 共 通 の 動 機 意 味 があると 解 釈 し どのような 共 通 要 因 があるのか 考 察 する 遠 くに 配 置 された 内 容 は 対 立 する 軸 意 味 が 隠 れていると 解 釈 する 6

4つの 分 析 機 能 ~ 属 性 の 特 徴 が 見 えてくる~ セグメント 属 性 と 強 くつながる 内 容 を 抽 出 上 にある 数 値 の 大 きい 内 容 ほど 該 当 する 属 性 と 関 係 が 強 い 逆 に 下 にある 数 値 の 小 さい(マイナスになることもあり) 内 容 ほど 関 係 は 弱 い 資 料 の 都 合 上 中 間 は 省 略 しております 7

3つのチューニング 機 能 最 初 の 分 析 結 果 が 分 かり 難 い 時 チューニングを 行 うことでよりよ い 結 果 が 得 られることがあります 作 業 はCSVファイルで 行 います ピース 追 加 : 分 析 に 使 うピースを 追 加 します ディクショナリ:TextVoiceが 最 初 から 持 つ 辞 書 に 追 記 していきます コレクション: 分 析 に 最 終 的 に 使 われる 小 さな 辞 書 です これを 修 正 します その 他 の 使 用 方 法 につきましては マニュアルにて 記 載 しております 8

対 象 となるデータ 説 明 左 端 にid カテゴリ 型 属 性 数 値 型 属 性 カテゴリ 型 属 性 数 値 型 属 性 右 端 にテキストをひとつだけ 一 行 目 に 変 数 名 id 性 別 年 齢 年 代 満 足 度 テキスト 1 女 性 23 20 代 90 大 変 香 りがよくおいしいと 思 いました 2 女 性 34 30 代 75 もう 少 し 味 付 けが 薄 いほうが 好 みです その 他 は 3 男 性 26 20 代 50 ボリューム 的 にさびしい 気 がしますが 価 格 に 見 合 っていると 思 います 999 男 性 54 50 代 50 特 になし ユニークIDのついたCSVファイルが 対 象 で 一 番 右 にあるテキストデータを 分 析 属 性 はあってもなくても 良 い 属 性 のカテゴリーは100までとし 100を 超 えたカテゴリーは 分 析 を 行 わない テキストは! で 区 切 り 区 切 られた 前 後 は 同 一 IDが2 文 書 いたとして 分 析 所 要 時 間 の 目 安 件 数 所 要 時 間 テキストデータCSV 目 安 量 分 析 後 ファイル 目 安 量 3,000 件 3 分 5,000 件 6 分 8,000 件 11 分 1 万 件 15 分 600KB 2 万 件 30 分 1.2MB 11 万 件 20 時 間 14MB 350MB 1 件 当 たりの 分 の 長 さ 量 属 性 の 数 によっても 変 動 します 1 万 件 程 度 まで 分 析 することをお 勧 めします 9

お 客 様 の 声 課 題 発 見 に 期 待 できそう( 調 査 会 社 様 ) アウトプットに 納 得 感 がある( 調 査 会 社 様 ) 肌 感 にあったものが 出 てくる( 飲 料 メーカー 様 ) 手 間 の 軽 減 にもなるし 深 い 結 果 を 引 き 出 せていると 思 う( 調 味 料 メーカー 様 ) 最 大 6 語 のつながりがとても 分 かりやすい( 調 味 料 メーカー 様 ) アウトプットが 分 かりやすいので そのまま 報 告 書 に 使 えそう( 調 味 料 メーカー 様 ) チューニングなしでも 素 早 く ざっと 傾 向 が 把 握 できて 納 得 感 もある( 情 報 関 連 会 社 様 ) 操 作 が 簡 単 で 分 かりやすい(コンサルティング 会 社 様 ) セグメントでの 傾 向 確 認 が 分 かりやすい( 広 告 代 理 店 様 ) このようなアウトプットが 出 るのであれば テキストを 分 析 するのも 有 効 だと 思 う( 製 造 業 様 ) テキストをきれいに 表 現 できるのがいい(IT 関 連 企 業 様 ) 目 視 を 軽 減 できる(IT 関 連 企 業 様 ) などのお 声 をいただいております 10

分 析 事 例 生 活 者 向 けアンケート 商 品 調 査 アルコール 飲 料 : ブランドごとの 試 飲 の 感 想 各 商 品 の 味 の 特 徴 だけでなく カテゴリ 共 通 で 重 視 するべきポイントが 見 えた 加 工 食 品 : その 商 品 カテゴリ 全 体 への 不 満 を 抽 出 情 報 機 器 : 機 器 を 選 択 する 基 準 を 分 析 住 宅 購 入 : 注 文 住 宅 を 検 討 する 際 に 気 にしていることを 購 入 の 検 討 ステップごとに 特 徴 抽 出 注 文 用 紙 の 評 価 : 通 販 注 文 用 記 入 用 紙 についてのユーザー 不 満 を 把 握 ライフスタイル 把 握 商 品 を 使 うシーン: 商 品 を 使 うシーンを 書 いてもらい 生 活 の 中 での 位 置 づけを 理 解 音 楽 ワイン 等 食 事 メニューの 決 め 方 : 食 事 のメニューの 決 め 方 を 書 いてもらい パターンを 探 した 最 近 気 になること: ある 地 方 の 女 性 を 対 象 に 最 近 気 になることを 調 査 定 期 出 版 物 企 画 への 展 開 広 告 プロモーション 評 価 イベント 参 加 者 へのアンケート: 参 加 した 理 由 を 解 析 し 次 回 企 画 への 参 考 とした CM 評 価 : CMを 見 た 感 想 を 分 析 11

分 析 事 例 社 内 向 けアンケート 社 員 満 足 度 調 査 : 社 員 満 足 度 調 査 の 自 由 記 述 を 解 析 課 題 の 全 体 像 と 構 造 を 理 解 社 内 データ 小 売 り 量 販 店 の 販 売 員 の 日 報 : 日 報 を 解 析 し 全 体 像 をマッピングで 示 した 顧 客 からの 問 い 合 わせ: 顧 客 からの 問 い 合 わせデータを 分 析 営 業 日 報 : 営 業 日 報 の 記 述 を 分 析 なんとなく 思 っていた 課 題 が 明 確 になった ソーシャルデータ クチコミサイト: ブログデータ: Twitterデータ: 特 定 の 商 品 についての 使 用 前 後 の 感 想 認 知 接 触 ポイント 情 報 入 手 経 路 の 特 徴 が 浮 き 彫 りとなった 特 定 の 商 品 名 で 検 索 取 得 したテキストデータ データ 取 得 期 間 中 の 話 題 注 目 されているポイントの 抽 出 プレミアムブランド タイアップ 企 画 が 要 注 目 の 話 題 であることがわかった イベント 名 で 検 索 取 得 したテキストデータ 話 題 とその 背 景 構 造 注 目 されているポイントの 抽 出 出 来 事 に 対 しての 評 価 が 時 系 列 的 に 変 化 していることが 推 察 できた 12

主 要 スペック 一 回 の 分 析 で 最 大 15MB 未 満 のデータ( 概 ね10 万 件 程 度 の 文 )まで 対 応 できます 1アカウントあたり 分 析 で 利 用 できるデータ 容 量 は3GBまで データ 容 量 には 入 力 されるテキストデータだけでなく TextVoiceが 分 析 に 際 して 保 持 する 必 要 があるデータ 全 てを 含 みます サービス 内 容 TextVoice ASP 分 析 ツール 利 用 権 のご 提 供 ご 提 供 料 金 初 期 費 用 20 万 円 月 々 費 用 10 万 円 (1 人 利 用 ) 12 万 円 ( 同 一 事 業 所 の5 人 利 用 ) 契 約 期 間 6カ 月 単 位 でのご 契 約 13

関 連 サービス ~ソーシャルデータ 取 得 ツール クチコミ@ 係 長 Lite ~ 弊 社 は( 株 )ホットリンクの 提 供 する クチコミ@ 係 長 Lite の 販 売 代 理 店 です クチコミ@ 係 長 Liteの 特 徴 日 本 最 大 級 のソーシャルメディアデータベースです 使 った 分 だけの 課 金 方 法 のツール 分 析 機 能 はなく 本 文 を 見 て 頂 くためのツール( 本 文 のダウンロードも 可 能 です) スペック 一 部 抜 粋 対 象 媒 体 :ブログ 掲 示 板 2ちゃんねる,Twitter(GNIP 社 提 供 :1/10サンプリング) フィルター 機 能 (ブログ Twitter): 弱 中 強 強 + 広 告 スパムTweet 排 除 提 供 価 格 ( 税 別 ) 初 期 費 用 :0 円 / 月 額 費 用 :0 円 1 表 示 当 たり1 日 につき:2,000 円 / 1 表 示 当 たり10,000 件 毎 :2,000 円 例 ) 閲 覧 対 象 期 間 :1 週 間 閲 覧 表 示 件 数 :4,000 件 対 象 媒 体 :ブログ 16,000 円 ( 税 別 )/ 回 従 量 型 の 料 金 体 系 ですので 利 用 しなければ 費 用 は 一 切 かかりません 詳 しくは 弊 社 営 業 までお 問 い 合 わせください 14

TextVoice(テキストボイス) が 皆 様 の テキストデータ からの 価 値 創 出 や お 客 様 理 解 のお 役 に 立 てれば 幸 甚 です また インターネット 調 査 での 純 粋 想 起 のテキストデータ( 自 由 記 述 ) 取 得 と TextVoiceの セット 販 売 も 提 供 しています 会 社 名 : マイボイスコム 株 式 会 社 (My VoiceCommunications,Inc.) 所 在 地 : 東 京 都 千 代 田 区 神 田 錦 町 3-17-11 榮 葉 ビル 設 立 : 1999 年 7 月 1 日 ( 伊 藤 忠 系 シンクタンクの 社 内 ベンチャーで 設 立 ) 代 表 者 : 代 表 取 締 役 社 長 高 井 和 久 事 業 内 容 : インターネット 調 査 行 動 付 随 型 調 査 従 来 型 調 査 ( 郵 送 調 査 ク ルーフ インタヒ ュー 等 ) アンケートデータベース(MyEL) テキストマイニング サービス(TextVoice) 資 本 金 : 1 億 7800 万 円 従 業 員 数 : 45 名 URL : http://www.myvoice.co.jp/ ご 質 問 やご 相 談 は 下 記 担 当 者 までお 気 軽 にご 連 絡 下 さい Tel : 03-5217-1911 E-mail : otoiawase@textvoice.jp 新 事 業 推 進 室 栗 田 森 15