研究成果報告書

Similar documents
SERPWatcher SERPWatcher SERP Watcher SERP Watcher,

Microsoft Word - DEIM2009 D7-5

Powered by TCPDF ( Title 組織のスラック探索に関する包括的モデルの構築と実証研究 Sub Title On the comprehensive model of organizational slack search Author 三橋, 平 (M

日本感性工学会論文誌

6回目

様式F-19 記入例・作成上の注意

データベース 【1:データベースシステムとは】

Web Web Web Web Web, i

10st_jp_p43_44.indd

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

10_細川直史.indd

IP ( ) IP ( ) IP DNS Web Web DNS Web DNS DNS 利用者 1 利用者 2 東京都調布市の天気情報を応答 東京都調布市の天気を問い合わせ 北海道旭川市の天気を問い合わせ 北海道旭川市の天気情報を応答 Fig. 1 1 DNS サーバ 東京都調布市の天気情報 We

Web WIX WIX WIX Web Web Web WIX WIX WIX Web 3. Web Index 3. 1 Web Index (WIX), Web. Web, WIX, Web ( WIX ), URL WIX 1 entry wid eid keyword targe

‰gficŒõ/’ÓŠ¹

Microsoft Word - DEWS2006 1B-i7.doc

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

DEIM Forum 2009 B4-6, Str

昭和恐慌期における長野県下農業・農村と産業組合の展開過程

1 5 1) 2 5 Web CMS 3. CMS CMS CMS ( 1 ) ( 2 ) ( 3 ) CMS IT CMS CMS CMS CMS Web Web Web CMS TIFF JPEG MB GB

OpenRulesモジュール

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

Microsoft Word - deim2011_new-ichinose doc

Microsoft Word - 目次.doc

1 Web Web 1,,,, Web, Web : - i -

1 1 tf-idf tf-idf i


( ) [1] [4] ( ) 2. [5] [6] Piano Tutor[7] [1], [2], [8], [9] Radiobaton[10] Two Finger Piano[11] Coloring-in Piano[12] ism[13] MIDI MIDI 1 Fig. 1 Syst

IPSJ SIG Technical Report Vol.2014-HCI-157 No.26 Vol.2014-GN-91 No.26 Vol.2014-EC-31 No /3/15 1,a) 2 3 Web (SERP) ( ) Web (VP) SERP VP VP SERP

OpenRulesモジュール

Ł×

<4D F736F F D2091B28BC68CA48B8695F18D908F912E646F63>

main.dvi

untitled

IPSJ SIG Technical Report Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for

Sharing the Development Database

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

IT,, i

TF-IDF TDF-IDF TDF-IDF Extracting Impression of Sightseeing Spots from Blogs for Supporting Selection of Spots to Visit in Travel Sat

HIS-CCBASEver2

Microsoft Word - CiNiiの使い方.doc

<95DB8C9288E397C389C88A E696E6462>


& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro


わが国における女性管理職研究の展望 Research on Women in Management Positions in Japan Kieko HORII 5 Abstract Japanese society is struggling with a low percentage of wo

国際社会文化研究所紀要 14号☆/目次

目 次 1. 本文書の目的と対象 EXTENSION 機能一覧 HELLO.JSP( ( 標準 ) BREADCRUMBS.JSP ( 標準 ) CALCULATE.JSP( ( 標準 ) CALEN

A Study of Effective Application of CG Multimedia Contents for Help of Understandings of the Working Principles of the Internal Combustion Engine (The

3.5 検索で上位に表示させるタイトル付けの奥義

日本機械学会 生産システム部門研究発表講演会 2015 資料

ICTのメガトレンドに向けたハイパーコネクテッド・クラウドへの取組み

売れる! インターネット活用術 < 第 3 回 > SEO の基礎知識 株式会社スプラム 代表取締役竹内幸次 ( 中小企業診断士 ) SEO で新規顧客を導く 世界一の検索サイト Google で http とだけ入力して検索すると 252 億ページがヒットします ( 見つかります ) 日本語のペー

fiš„v8.dvi

月刊SEOレポート 2019年7月版 Vol.111

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

技術研究報告第26号


DEIM Forum 2010 A Web Abstract Classification Method for Revie

評論・社会科学 123号(P)☆/1.福田

自然言語処理16_2_45

fiš„v3.dvi


企業内システムにおけるA j a x 技術の利用

FA

Microsoft PowerPoint _3a-SEO.pptx

Microsoft Word - 06.doc

PowerPoint Presentation

農研機構 食品総合研究所 研究報告 77号

1. 緒言 p 問題の所在 ) p

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献

Microsoft Word - hozon-fujimura-HP-伊勢工業高校における造船教育の歴史から学ぶ

28 Docker Design and Implementation of Program Evaluation System Using Docker Virtualized Environment

1 AND TFIDF Web DFIWF Wikipedia Web Web AND 5. Wikipedia AND 6. Wikipedia Web Ma [4] Ma URL AND Tian [8] Tian Tian Web Cimiano [3] [

PowerPoint プレゼンテーション

補助事業者 研究代表者及び研究分担者所属研究機関氏名 部局 職名 同一機関に所属する補助事業者の間接経費譲渡額は 合計額のみを記入してください 間接経費の交付申請書に記譲渡額載の補助金額 13,000,000 13,000,621 5,500,000 大学 学部 准教授 20234

PDCA

in000.ai

FUJITSU Software Systemwalker for Oracle V15 (15.1) 紹介資料

リレーショナルデータベース入門 SRA OSS, Inc. 日本支社 Copyright 2008 SRA OSS, Inc. Japan All rights reserved. 1

Microsoft Word - 01.docx


WebRTC P2P Web Proxy P2P Web Proxy WebRTC WebRTC Web, HTTP, WebRTC, P2P i

研究開発評価システムの在り方に関する検討 WG 資料 5 海外における追跡評価の事例 2012 年 3 月 23 日 ( 金 ) 田原敬一郎 Copyright IFENG All Rights Reserved

Powered by TCPDF ( Title 地理情報科学を用いた外国人観光客向け観光防災地図と政策提案 : 鎌倉市をケーススタディーとして Sub Title Geographical Information Science in tourism/evacuatio


,,,,., C Java,,.,,.,., ,,.,, i

Microsoft Word - nvsi_050090jp_oracle10g_vlm.doc

21 A contents organization method for information sharing systems

untitled

[2] , [3] 2. 2 [4] 2. 3 BABOK BABOK(Business Analysis Body of Knowledge) BABOK IIBA(International Institute of Business Analysis) BABOK 7

論文題目 大学生のお金に対する信念が家計管理と社会参加に果たす役割 氏名 渡辺伸子 論文概要本論文では, お金に対する態度の中でも認知的な面での個人差を お金に対する信念 と呼び, お金に対する信念が家計管理および社会参加の領域でどのような役割を果たしているか明らかにすることを目指した つまり, お

IPSJ SIG Technical Report Vol.2014-EIP-63 No /2/21 1,a) Wi-Fi Probe Request MAC MAC Probe Request MAC A dynamic ads control based on tra

評論・社会科学 84号(よこ)(P)/3.金子

Microsoft Word - 博士論文概要.docx

2016.

第121回関東連合産科婦人科学会総会・学術集会 プログラム・抄録

09明大後期3すぐやる×認められるセミナー.ppt

ネットワーク化するデジタル情報家電の動向

博士論文 考え続ける義務感と反復思考の役割に注目した 診断横断的なメタ認知モデルの構築 ( 要約 ) 平成 30 年 3 月 広島大学大学院総合科学研究科 向井秀文

Transcription:

様式 C-19 科学研究費補助金研究成果報告書 平成 22 年 5 月 25 日現在 研究種目 : 基盤研究 (B) 研究期間 :2007~2009 課題番号 :19300025 研究課題名 ( 和文 ) 社会科学の新しい研究方法論としての総合型ウェブマイニング環境の開発研究 研究課題名 ( 英文 ) Research on Developing an Integrated Web Mining Environment as a Novel Research Methodology of Social Sciences 研究代表者増永良文 (MASUNAGA YOSHIFUMI) 青山学院大学 社会情報学部 教授研究者番号 :70006261 研究成果の概要 ( 和文 ): 検索エンジン結果ページ (SERP,Search Engine Results Page) に現れるウェブページやその表示順位は実世界の事象や動きを表しているとの考え方から, SERPWatcher と名付けた統合型ウェブマイニング環境を設計 開発した. SERPWatcher は社会変革を発見したい社会科学の研究者に対して, これまでのアンケート調査やインタビュー調査に代わる全く新しい研究方法論となるであろう. プロトタイプが稼働しており有効性を確認している. 研究成果の概要 ( 英文 ):This research investigates the design and implementation of an integrated web mining environment named SERPWatcher based on the observation that the search engine results page (SERP) itself and the ranking order change with time reflecting the changes in society. It could be a novel social survey method in that it totally differs from the traditional methods such as questionnaires and interviews. A research prototype of SERPWatcher is currently under operation, and its validation test shows that it is working as intended. 交付決定額 ( 金額単位 : 円 ) 直接経費 間接経費 合計 2007 年度 5,400,000 1,620,000 7,020,000 2008 年度 4,900,000 1,470,000 6,370,000 2009 年度 3,900,000 1,170,000 5,070,000 年度年度総計 14,200,000 4,260,000 18,460,000 研究分野 : 総合領域科研費の分科 細目 : メディア情報学 データベースキーワード : ウェブマイニング, ジェンダー, 社会科学, 研究方法論,SERPWatcher 1. 研究開始当初の背景ウェブ (World Wide Web) には様々な主体が情報を発信し実世界での出来事や営為 が写し込まれている. ウェブ 2.0 が提唱され, ウェブが有する潜在的可能性がますます顕在化されつつあるなか, 我々は, ウェブコミ

ュニティの分析研究を通してウェブマイニングが社会科学の新しい研究方法論になりうる可能性を明らかにしてきた. また, その研究過程で, 検索サイト Google の SERP ( search engine results page, 検索エンジン結果ページ ) には, その表示順位に Google が公表している順位付けストラテジでは解明しがたい不可解さがあることを発見して, 検索サイトの信用性 (trustworthiness) に関する研究も発表してきた. この一連の研究で, 我々が次に行わなければならないとは ウェブマイニングは社会科学の新しい研究方法論 という, これまでの研究を通して得た発見を確たるものとすることである. 我々は, このような研究を進めるには, 単にデータベースエンジニアがウェブマイニングツールを構築して何かを検証しようとしても, ドメイン知識の欠落ゆえに, その真価を問えないことによりそれ以上研究が進捗しないことを認知し, 特に社会学で活発に研究が行われているジェンダー分野に焦点を当てて, ジェンダーに関するドメイン知識を豊富に有する者を研究チームの主要メンバーとして擁して研究を遂行することにより, 理工学の域を超えた研究成果を得ることに成功してきた. 換言すれば, 文理融合した研究体制を整えることにより, 初めてウェブマイニングの分析結果や SERP Ranking の信頼性を的確に判断することが可能となり, 研究が進展する一方, そこで得られた知見をエンジニアにフィードバックすることにより, 真に有用な工学的進展が達成されたのである. 2. 研究の目的ウェブには実世界のさまざまな出来事が写し込まれている. 実世界は時間の経過と共に時々刻々と変化しているので, その変化をウェブをマイニングすることにより摑まえることができるならば, それを手がかりとして, 実世界で一体何が起こっているのかをタイムリーに知ることができるのではないかと考えられる. そこで我々は, 実世界の出来事はそれに関連する検索キーワードによる検索エンジン結果ページ (search engine results page, SERP) のランキングに変動を与えるという知見に基づき, 利用者 ( 社会科学分野の研究者 ) が指定する検索キーワードに対して, さまざまな検索エンジンの SERP を定期的に収集し,SERP 順位の変動を分析し, その変容により警告を発して, 利用者に調査を促すシステムを開発することとした. それが SERPWatcher である. これまで, 社会科学分野ではアンケート調査, インタビュー調査, あるいは実地調査が主たる社会調査法として知られているが, SERPWatcher はこれらとはまったく異なる新しい社会調査法, つまり社会科学の新しい研究方法論と なるであろう. 3. 研究の方法 (1) SERPWatcher の設計 SERP Watcher は次の機能を有しないといけない. 1 SERP 収集 2 SERP データクリーニング 3 多次元データベースとしての SERP Archive 構築 4 SERP Archive の多次元分析と表示 5 ニュースなどの関連情報収集 6 アラートとマイニング 7 検索キーワード登録 8 ユーザ登録我々は, 上記機能を有する SERPWatcher を設計 開発し, 特にジェンダー学際分野の研究者により,SERPWatcher プロトタイプの社会学分野における新しい研究方法論としての有用性を検証する. 図 1 に開発した SERPWatcher のシステム概念図を示す. 図 1 SERPWatcher のシステム概念図 (2) SERP 収集とデータクリーニングユーザが指定する検索キーワードについて,7 種類の検索エンジン (Google, Yahoo! 検索,Live Search, goo, Infoseek 楽天,excite, Baidu) からそれらが提供するウェブサービスを使い,1 週間に一度の割合で, 上位 500 位までのウェブページに関するさまざまなデータを収集し, データクリーニングを行い, リレーショナル DBMS である MySQL に格納して,SQL による検索とアプリケーションプログラムからのアクセスを可能とした. 現在, ジェンダー学際分野に関連する約 35 程度のキーワードが登録されており, 古く登録された検索キーワードのついては,2007 年夏頃からアーカイブデータが収集され研究に供されている. (3)SERP Archive の多次元データベース構成 SERP Watcher が取り扱うデータを一元的に管理するためのデータベースは, 検索キーワード, 検索エンジン,(SERP の ) 収集日, ( 収集された ) ウェブページデータであり, そ

れは図 2 に示すように多次元データとなる. プロトタイプシステムはクライアント サーバ方式で実装されている. サーバには Red Hat Enterprise Linux 5.1 (x86/x86_64) が使われ, 開発用のプログラミング言語として Ruby 1.8.5 (2006-08-25) [i386-linux] と Ruby on Rails 2.1 が使われた. データベース管理システムは MySQL 5.0.45 である. 前章で述べた 3 つのビューは図 4, 図 5 のようである. 図 2 SERP Archive の 4 次元 DB 構成 (4) SERP Archive の多次元分析と表示 SERPWatcher の利用法を社会学を専門とする我々の研究分担者とともに分析をすると, 分析は 3 つのタイプの観点から主として分析を行うことを突き止めた. それらは次のとおりである : 1 {web page URL, collection date} 2 {web page URL, search engine} 3 {search engine, collection date} その結果,SERPWatcher の分析のための Archive 表示法は, 上記 1,2,3 に対応して, 次の 3 つであることが明らかになった : 1 検索エンジン固定ビュー 2 収集日固定ビュー 3 ウェブページ固定ビュー図 3 にそれらを示す. 図 4 検索エンジン固定ビューの画面例 図 5 収集日固定ビューとウェブページ固定ビューの画面例 なお, ウェブページの順位変動を順位変動の大きさに比例して着色して示すために, 図 6 に示す色付け関数を定義し, 実装している. 図 3 SERP Archive の多次元分析 4. 研究成果 SERPWatcher の実装と社会学者によるそのプロトタイプの評価について述べる. (1) SERPWatcher の主機能の実装 図 6 SERPWatcher の 8 ビットカラーシェイディングアルゴリズム

(2) SERPWatcher のアラート機能の実装指定された検索キーワードで定期的に SERP を収集していくとき,SERP 順位の時系列的変化にあらかじめ決めていた以上の変化が生じたときにユーザに変化が起きたことを知らせる機能を アラート機能 と呼んでいる. 図 7 にユーザへのアラート e-mail の一例を示す. 図 7 アラート e-mail の一例 (3) SERPWatcher 機能の検証本研究で開発した SERPWatcher のプロトタイプを使用して, システムの有用性を検証した. まず, さまざまな分析を行った結果として, 検索エンジン固定ビュー, 収集日固定ビュー, ウェブページ固定ビューという 3 種類のビューを定義 実装し, それら 3 つのビューの間を分析の視点に応じて自由に行き来できるように実装した. 約 1 年半にわたり 37 個のジェンダー学際関連の検索キーワードでその機能の有用性を検証した結果, 当初の目的通り,SERPWatcher は社会科学の分野で, これまでのアンケート調査やインタビュー調査に代わる全く新しい研究方法論となるであろうという確信を得ることができた. 5. 主な発表論文等 ( 研究代表者 研究分担者及び連携研究者には下線 ) 雑誌論文 ( 計 3 件 ) 1 Yoshifumi Masunaga, Naoko Oyama, Chiemi Watanabe, Kazunari Ito, Kaoru Tachi, and Yoichi Miyama, SERPWatcher: A SERP Mining Tool as a Novel Social Survey Method in Sociology, Database Systems for Advanced Applications, 査読有, DASFAA2010 Proceedings, Part II, Springer LNCS 5982,2010,412-415 2 増永良文, ウェブテクノロジーがもたらす社会科学の新しい研究方法論, 青山社 会情報研究, 査読有,1 巻,2009,1-18 3 Naoko Oyama, Yoshifumi Masunaga,On the Trustworthiness and Transparency of a Web Search Site examined using Gender-equal as a Search Keyword, Progress in WWW Research and Development, 査読有,Proceedings of APWeb2008, Springer LNCS 4976, 2008, 625-630 学会発表 ( 計 4 件 ) 1 中部文子, 渡辺知恵美, 小山直子, 舘かおる, 増永良文, 社会調査支援の為の SERPWatcher からのランク変動特徴抽出, DEIM2010 論文集, 査読無, 2010,A2-5 2 Yoshifumi Masunaga, Naoko Oyama, Chiemi Watanabe, Kazunari Ito, Kaoru Tachi, and Yoichi Miyama,SERPWatcher: A SERP Mining Tool as a Novel Social Survey Method in Sociology -- Demonstration --, 第 15 回先進応用のためのデータベースシステムに関する国際会議 (DASFAA2010) デモストレーション, 査読有,April 2, 2010, 筑波大学 3 増永良文, 渡辺知恵美, 伊藤一成, 小山直子, 竹内純人, 深山鷹一, 舘かおる, 新しい社会調査法としての検索エンジン結果ページ群の自動収集 分析装置の開発 -SERP Watcher β 版の開発 -, DEIM2009 論文集, 査読無, 2009,D7-5 4 石川沙織, 渡辺知恵美, 小山直子, 舘かおる, 増永良文, 検索エンジン技術を用いた社会科学の多角的調査支援システムの開発,DEWS2008 論文集, 査読有,2008, A1-5 図書 ( 計 1 件 ) 1 増永良文, サイエンス社, コンピュータサイエンス入門 コンピュータ ウェブ 社会 ( 本 ), 第 14 章ウェブと社会, 2008,245 ページ その他 学会発表 2 は第 15 回先進応用のためのデータベースシステムに関する国際会議 (DASFAA2010) のデモストレーション部門で Excellent Demonstration Award を受賞した. 22 件のデモンストレーションから 1 件の Best Demonstration Award と 2 件の Excellent Demonstration Award が表彰された. 受賞は, 本研究で開発してきた SERPWatcher のシステムの完成度やそれが社会科学の新しい研究方法論となるであろうという先進性がとても高く評価された結果である. より詳細な記述が青山学院大学のホームページに掲載されている ( http://www.aoyama.ac.jp/news/439.html ).

6. 研究組織 (1) 研究代表者増永良文 (MASUNAGA YOSHIFUMI) 青山学院大学 社会情報学部 教授研究者番号 :70006261 (2) 研究分担者舘かおる (TACHI KAORU) お茶の水女子大学 大学院人間文化創成科学研究科 教授研究者番号 :50155082 小山直子 (OYAMA NAOKO) お茶の水女子大学 ジェンダー研究センター 客員研究員研究者番号 :00194639 渡辺知恵美 (WATANABE CHIEMI) お茶の水女子大学 大学院人間文化創成科学研究科 講師研究者番号 :20362832 伊藤一成 (ITO KAZUNARI) 青山学院大学 社会情報学部 助教研究者番号 :20406812 喜連川優 (KITSUREGAWA MASARU) 東京大学 生産技術研究所 教授研究者番号 :40161509 (H20 H21 連携研究者 ) (3) 連携研究者竹内純人 (TAKEUCHI SUMITO) 青山学院大学 情報科学研究センター 助手研究者番号 :60464799