Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL. 3. 2 WIX 1 entry wid eid keyword targe



Similar documents
4. WIX アタッチエンジン 4. 1 FSDR 処理 システムの Web 資源結合動作であるアタッチ処理について 述べる. アタッチ処理は以下の 4 フェーズに分けられる. この一連の 流れを FSDR 処理とする. Find 処理 Select 処理 Decide 処理 Rewrite 処理

Find Find WIX DB entry WIX Aho- Corasick 1 WIX 2. 2 ( ) WIX, FireFox add-on Chrome Extension [1]. 32 Chrome Extension., Web Find, HTML,.., WIX

Find Find WIX DB entry WIX Aho- Corasick 1 WIX 2. 2 WIX WIX WIX WIX DBFind () WIX, FireFox add-on Chrome Extension [1]. 32 Chrome

WIX. URL, WIX. URL,, WIX., Web. id (eid), keyword target. 1 entry wid eid keyword target

/var/lib/sharelatex/data/compiles/5a535643d11f6ba07fbbfa d68ddec3e /output.dvi

,, WIX. 3. Web Index 3. 1 WIX WIX XML URL, 1., keyword, URL target., WIX, header,, WIX. 1 entry keyword 1 target 1 keyword target., entry, 1 1. WIX [2

WBT [6] [7] [8] [9] Web [1] WBT [2] [3] ipad PC ipad ipad ipad [4] QR QR [5] IC IC PDA IC PDA US-ASCII 4,296 QR IC IC IC QR QR QR A BB A A CC

DEIM Forum 2014 P3-3 A Foreseeing System of Search Results based on Query Operations on the Graph Interface

SMILE-BS_人事給与

■サイトを定義する

([ ]!) name1 name2 : [Name]! name SuperSQL,,,,,,, (@) < >@{ < > } =,,., 200,., TFE,, 1 2.,, 4, 3.,,,, Web EGG [5] SSVisual [6], Java SSedit( ss

, [! [, ]! ]!,,., ([ ],). : [Name], name1 name2 name10 ([ ]!). name1 name2 : [Name]! name SuperSQL,,,,,,, < < > } =.,

目 次 1. 本文書の目的と対象 EXTENSION 機能一覧 HELLO.JSP( ( 標準 ) BREADCRUMBS.JSP ( 標準 ) CALCULATE.JSP( ( 標準 ) CALEN

勉強会の流れ Google API の概要 デモ curl で実際に体験 Copyright 2010 SRA OSS, Inc. Japan All rights reserved. 2

■デザイン

Exfront4.1.0リリースノート

extension機能概要マニュアル

1.WebClass( ウェブクラス ) とは WebClass を利用される前に 学生の立場で WebClass を利用してみましょう... 4 開始方法... 4 資料を閲覧する 先生の立場で WebClass を利用してみましょう... 8 資料を

Microsoft PowerPoint - Cambridge Books Online ユーザーマニュアル

untitled

([ ],), : [Name], name1 name2 name10 4, 2 SuperSQL, ([ ]!), name1 name2 : [Name]! name SuperSQL,,,,,,, < < > } =,

V.ブラウザの使い方

Ⅴ ブラウザーの使い方 V. ブラウザーの使い方 起動 終了 画面説明 ホームページ移動 リンクを使って移動 アドレスバーからの移動 ボタンでの移動

■デザイン

Webプログラミング演習

PowerPoint プレゼンテーション

クイックマニュアル(利用者編)



Web

1.WebClass( ウェブクラス ) とは WebClass を利用される前に 学生の立場で WebClass を利用してみましょう... 4 レポートを提出する 先生の立場で WebClass を利用してみましょう... 9 提出状況を確認する..

Bluemix いつでもWebinarシリーズ 第15回 「Bluemix概説(改訂版)」

卒論タイトル

. ([ ],) : [Name] name1 name2 name10 ([ ]!). name1 name2 : [Name]! name (@) < >@{ < > } = [employee.name@{width=200 color=red}]! l

Webプログラミング演習

目次 3 14P Wordpressテンプレートの設定方法 15P 17P livedoorテンプレートの設定方法 18P 21P FC2テンプレートの設定方法

, HTML HTML PHP, 3. SuperSQL SuperSQL [1] [2], SQL, SQL SELECT GENERATE <media> <TFE> GENERATE <media>, HTML XML, PDF <TFE> Target Form Expression,, 3

スライド 1

Microsoft PowerPoint - (和)SpringerLink Quick Reference(1st ed revised).ppt

売れる! インターネット活用術 < 第 3 回 > SEO の基礎知識 株式会社スプラム 代表取締役竹内幸次 ( 中小企業診断士 ) SEO で新規顧客を導く 世界一の検索サイト Google で http とだけ入力して検索すると 252 億ページがヒットします ( 見つかります ) 日本語のペー

2004 2

SILAND.JP テンプレート集

Webサイト解析 ログ分析レポート

WEBシステムのセキュリティ技術

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献

H indd

PowerPoint プレゼンテーション

目次

スライド 1

Ajax-ch00

CONTENTS ~ Google 32~33 16 Yahoo! Site Explorer 34~35 17 Live Search Webmaster Center 36~37 18 SEO 38

Webプログラミング演習

ホームページにパスワード認証を設定します 会員限定のページなどに利用できます 設定の手順 を設定するには 以下の手順で行います ユーザ登録 を設定したページにアクセスするためのユーザを登録します の設定 を設定するページ アクセスを許可するユーザを選択し 設定します 設定完了 を設定したページにアク

1. ログイン 1-1 管理画面へのログイン 施設の作成 編集 削除や承認 公開には その操作権限を持つアカウントでログイン します アカウントについての詳細は 管理者にお問い合わせください (1) [ ユーザー ID またはメールアドレス ] と [ パスワード ] を入力後 [ ログイン ] を

Ⅰ 介護を要する高齢者のための住宅改修相談の概要

PowerPoint プレゼンテーション

/27 (13 8/24) (9/27) (9/27) / / / /16 12

3.5 検索で上位に表示させるタイトル付けの奥義

PowerPoint プレゼンテーション

第 1 章 システムの概要 シラバスシステムとは 利用環境 留意事項 シラバスシステムの概念 役割 システムの利用イメージ... 4 第 2 章 基本操作

Web のしくみと応用 ('15) 回テーマ 1 身近なWeb 2 Webの基礎 3 ハイパーメディアとHTML 4 HTMLとCSS 5 HTTP (1) 6 HTTP (2) 7 動的なWebサイト 8 クライアントサイドの技術 回 テーマ 9 リレーショナルデータベース 10 SQL とデータ

progate-team

管理サイト操作マニュアル Version.1.1. デジアナコミュニケーションズ株式会社

投影片 1


条件指定をした Yahoo 検索 1 / 8 条件指定をして Yahoo 検索 ウェブでキーワード検索することを ググル といい ウェブでキーワード検索をする のは Google を使うのが当然とされていますが Yahoo!Japan も検索ができます Yahoo!Japan をホームページに設定さ

Microsoft Word - toyoshima-deim2011.doc

DB STREET 設置マニュアル

1 フリーページを表示する 1-1 フリーページのカテゴリを作成します フリーページのカテゴリの情報を入力します 1 複数のフリーページを記事のジャンルや種類で分け その見出しを入力します お店ページの左サイドバーに表示します 2 消費者が 検索エンジンで検索するであろう 記事の特長や内容をあらわす

数のディジタル化

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

01.12期・井須英次1.doc

1.3期・井上健0.doc

RSS配信の設定方法 第2版(平成30年2月)

スライド 1

Wiki


スーパー英語アカデミック版Ver.2

Flash Player ローカル設定マネージャー

[1] [3]. SQL SELECT GENERATE< media >< T F E > GENERATE. < media > HTML PDF < T F E > Target Form Expression ( ), 3.. (,). : Name, Tel name tel

スライド 1

1. ログイン 1-1 管理画面へのログイン 施設の作成 編集 削除や承認 公開には その操作権限を持つアカウントでログイン します アカウントについての詳細は 管理者にお問い合わせください (1) [ ユーザー ID またはメールアドレス ] と [ パスワード ] を入力後 [ ログイン ] を

掲示板ガイド1

: Name, Tel name tel (! ) name : Name! Tel tel ( % ) 3. HTML. : Name % Tel name tel 2. 2,., [ ]!, [ ]!, [ ]!,. [! [, ]! ]!,,. ( [ ], ),. : [Name], nam

Movable Type CMS Movable Type Movable Type 5.2 CMS

SciFinder エラーへの対処法

リンクされたイメージを表示できません ファイルが移動または削除されたか 名前が変更された可能性があります リンクに正しいファイル名と場所が指定されていることを確認してください 9 2

PukiWiki XOOPS CMS Wiki

投影片 1

PowerPoint プレゼンテーション

SoftBank 202SH 取扱説明書


独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

ミーティング記録の管理

ご 利 用 の 前 に 手 順 初 回 ご 利 用 時 に 必 ずご 確 認 ください ご 利 用 の 前 に (ご 利 用 環 境 の 確 認 ) P アクセス 方 法 (IMAGE WORKSサイトへアクセス) P 初 期 設 定 (JREのインストール) P

Microsoft Word MT操作マニュアル(ユーザ編).doc

HOME PAGE RENEWAL PLAN 有限会社マインドアクセス

●コンテンツ「FAQ」

目次 1. はじめに 更新履歴 ログイン ログアウト ログイン時の URL とユーザー名 ログイン ログアウト トップ画面 活動一覧画面 活動情報の

Transcription:

DEIM Forum 2016 H6-5 Web Index 223 8522 3-14-1 E-mail: nanadama@db.ics.keio.ac.jp, toyama@ics.keio.ac.jp Web Index(WIX) (keyword) Web URL(target) (WIX ) Web ( ) Web URL Web WIX RSS WIX Web Index, Web, RSS, XML 1. Web. Web Web Web, Web, Web Web IndeX( WIX ) [1, 2] URL XML WIX WIX WIX Web ( ) Web URL Web Web Web Web Web Web WIX Web Web URL WIX Web Web Web RSS WIX WIX WIX 2 3 WIX 4 5 6 2. WIX URL URL Wikipedia Wikipedia URL Wikipedia WIX Web URL WIX Web URL Ameba Web Web WIX [3 5] Web

Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL. 3. 2 WIX 1 entry wid eid keyword target 1 1 http://ja.wikipedia.org/wiki/ 1 2 http//ja.wikipedia.org/wiki/ 2 3 http://ameblo.jp/tanaka-masahiro 3 6 http://www.carp.co.jp/team14/member/p18.html, WIX, WIX. 3. 3. 2 WIX WIX, WIX,. WIX, entry,. entry, WIX id (wid), id (eid), keyword URL target. entry 1. 3. 3. 3 Find Find, WIX entry. WIX Aho-Corasick [6] 3. 4 2 WIX (Google Chrome Extension) 1 WIX WIX Web, Web.. WIX, FireFox add-on Google Chrome Extension. 2 Chrome WIX XML URL, WIX 1. 1., keyword, URL target. header, WIX,,. 3. 3 3. 3. 1 WIX 3 Web WIX, WIX,., WIX Extension. 3 Web WIX

WIX target URL 4. 4 Web 4. WIX 4. 1 WIX WIX WIX WIX URL WIX Web RSS RSS XML [7] RSS 2.0 Web 2 2 RSS <title> <link> URL <pubdate> RSS Web Web Web Web CSS RSS Web Web Web PHP HTML Web RSS 2 3 WIX (1) (2) RSS RSS (3) RSS 5 5 4. 2 Wikipedia 200 4. 3 RSS RSS RSS URL RSS RSS RSS RSS RSS RSS RSS RSS RSS RSS

3 entry wid eid keyword target title 4 1 http://www.nikkei.com/article/xxxxxx... 4 2 http://news.tennis365.net/news/xxxxxx 4 3 http://www.nikkansports.com/xxxxxx... 4 4 http://headlines.yahoo.co.jp/xxxxxx... RSS RSS 4. 4 WIX RSS RSS WIX RSS RSS RSS Web URL RSS RSS WIX RSS RSS WIX URL Web 1 WIX URL 3 WIX WIX 6 WIX 3 WIX WIX DB Find 6 5. 5. 1 Yahoo!JAPAN RSS 443 RSS 2015 12 28 20 30 20 48 9,879 RSS 2 RSS RSS Web Web HTML Java Jsoup Yahoo!JAPAN Web CSS div#main Web Web rssitem text content RSS HTTP RSS RSS 5. 2 4 7 Linux

表 4 探索範囲別のキーワードごとのエントリ数 キーワード タイトルのみ 本文全体 朝日新聞デジタル 118 124 5. 3 全体的なキーワードについての結果と考察 探索範囲を Web ページのタイトルのみとした時と Web 野球 28 233 ページの本文全体とした時の エントリの生成数を比較した結 総理 31 206 果を 5 に示す ソフトバンク 15 114 ヤクルト 6 48 フェデラー 3 22 Linux 0 17 川端慎吾 0 2 表 5 探索範囲 キーワード数とエントリ数の関係 探索範囲 エントリ キーワー 平均エン 最大エン 数 ド数 トリ数 トリ数 10,888 4.16 45 54.70 238 タイトルのみ 45,266 本文全体 3,276,577 59,903 *1 *2 *1 エントリ数 / キーワード数 一つの単語あたりの平均エントリ 数 *2 一つの単語に対し生成された最大エントリ数 ハイパーリンクの数がおよそ 20 個以下であるようなキーワー 図 7 探索範囲がタイトルのみの場合の ヤクルト でのアタッチ結果 ドに対しては WIX による結合が行われたことで ユーザが 興味のある Web ページに容易にアクセスすることができるよ る ヤクルト の場合のアタッチ結果を図 8 に示す このよ うな場合は ユーザが多くのリンクの中からユーザ自身の興味 のあるページを選択するのはやや負担となると考えられる 一 方 Linux 川端慎吾 のような 限られた記事ページでし か取り上げられないようなキーワードについても 図 9 に示す ようにエントリが 2 つ得られた うになると考えられる ただし 探索範囲がタイトルのみであ ろうと 本文全体を含んでいようと 生成されたエントリ数が 大きくなっている要因として 野球 総理 など ユーザが あまり注目しないほど一般的なキーワードを含むエントリを生 成しているという点があげられる これらのキーワードに関し てはユーザの注目の対象になることが少ないため エントリが いくら生成されても ユーザが WIX システムを利用する上で あまり妨げになるような要素はないと考えられる 一つのキー ワードに対し 多数のエントリが生成されうる場合には エン トリの生成上限数を指定し 更新日時の新しいコンテンツへの リンクを含むエントリのみを生成することや あらかじめ2つ の探索範囲でエントリ生成を行い キーワードごとに生成され たエントリ数に応じて 最終的な WIX ファイルに記述するエ ントリを変更することによって このような問題を解消するこ とが可能であると考えられる 6. お わ り に 6. 1 結 論 本研究では ニュースサイトやブログの記事 企業や団体の 図8 探索範囲が本文全体の場合の ヤクルト でのアタッチ結果 公式サイトで配信されるプレスリリースなどのような 時系列 で比較的頻繁に情報が記録 更新されていくコンテンツにアク セスすることを可能にするための WIX ファイルの自動生成 自動更新及び管理システムを提案し 実装した 実装にあたっ ては Web ページの更新情報の配信に幅広く使われている RSS 図9 探索範囲が本文全体の場合の 川端慎吾 でのアタッチ結果 を利用するシステムを構築し Web ページの構造を解析して情 報抽出するよりも簡単な更新情報の取得を可能にした 本研究 RSS アイテムのタイトルには その RSS を提供している で提案するシステムの利用により WIX ファイルのライブラ Web サイトの名前が含まれているものも多い 朝日新聞デジ リの運用者の WIX ファイルの作成の負担を軽減することが タル というキーワードはその一例で Web ページの内容その 可能となる ものとは関連のない Web ページまで対応付けられてしまう場 合が多い 6. 2 今後の課題 タイトルのみの探索範囲で十分に関連するコンテンツへのリ マッチングに用いるキーワードを あらかじめ抽出しておい ンクが得られる場合と 本文全体まで探索してようやく関連す た単語群に限定するのではなく タイトルや本文などの入力か るコンテンツへのリンクが得られる場合とがあると考えられる ら抽出する方法がある MeCab [8] のような形態素解析エンジ ンを利用して 新しい単語をキーワードとして抽出する方法が

Web Web HTML [9] [1]. KeioWIX (1). DEIM2011. 2011. [2]. Keio WIX (2). DEIM2011. 2011. [3] WIX DEIM 2012 2012 [4] Keio WIX (3) DEIM2011 2011 [5] WIX Deep Web DEIM2014 2014 [6]. Aho-Corasick. DEIM2012. 2012. [7] RSS Advisory Board, RSS 2.0 Specification, http://www. rssboard.org/rss-specification, 2016 1 15 [8] MeCab http://mecab.googlecode.com/svn/trunk/mecab/ doc/index.html?sess=3f6a4f9896295ef2480fa2482de521f6 [9] XML Web DEIM Forum 2014, 2014. [10] XML DEIM Forum 2014, 2014. [11] XML DEIM Forum 2015, 2015. [12] Y. Xu, Y. Papakonstantinou. Efficient Keyword Search for Smallest LCAs in XML Database, Proc. of SIGMOD, pp.537-538, 2005.