1. [5] Wikipedia 4. ( ) Wikipedia 5. 3 ( ) ( ) ( ) Wikipedia ( ) ( ) 2.2 Global Database of Events, Language and Tone (GDELT) Global Datab

Similar documents
main.dvi

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

. Yahoo! 1!goo 2 QA..... QA Web Web [1]Web Web Yin [2] Web Web Web. [3] Web Wikipedia 1 2

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

( )

The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). The material has been made available on the website

untitled


外国語学部 紀要30号(横書)/03_菊地俊一

1 1 tf-idf tf-idf i

<> <name> </name> <body> <></> <> <title> </title> <item> </item> <item> 11 </item> </>... </body> </> 1 XML Web XML HTML 1 name item 2 item item HTML

5

Vol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m

dews2004-final.dvi

kut-paper-template.dvi

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

Web Web [4] Web Web [5] Web 2 Web 3 4 Web Web 2.1 Web Web Web Web Web 2.2 Web Web Web *1 Web * 2*3 Web 3. [6] [7] [8] 4. Web 4.1 Web Web *1 Ama

(a) (b) 1 JavaScript Web Web Web CGI Web Web JavaScript Web mixi facebook SNS Web URL ID Web 1 JavaScript Web 1(a) 1(b) JavaScript & Web Web Web Webji

NINJAL Project Review Vol.3 No.3

農研機構 食品総合研究所 研究報告 77号

main.dvi

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

’ÓŠ¹/‰´„û

Input image Initialize variables Loop for period of oscillation Update height map Make shade image Change property of image Output image Change time L

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

IPSJ SIG Technical Report Vol.2017-CLE-21 No /3/21 e 1,2 1,2 1 1,2 1 Sakai e e e Sakai e Current Status and Challenges on e-learning T

Vol.54 No (July 2013) [9] [10] [11] [12], [13] 1 Fig. 1 Flowchart of the proposed system. c 2013 Information

untitled

DEIM Forum 2012 E Web Extracting Modification of Objec

,,,,., C Java,,.,,.,., ,,.,, i

IPSJ SIG Technical Report Vol.2016-CE-137 No /12/ e β /α α β β / α A judgment method of difficulty of task for a learner using simple

<95DB8C9288E397C389C88A E696E6462>

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root

大学論集第42号本文.indb


IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

10_細川直史.indd

Web Hashtag Hashtag Twitter Hashtag Twitter Hashtag Hashtag Hashtag Twitter Hashtag Twitter Hashtag contexthashtag contexthashtag Hashtag contexthasht

HASC2012corpus HASC Challenge 2010,2011 HASC2011corpus( 116, 4898), HASC2012corpus( 136, 7668) HASC2012corpus HASC2012corpus

fiš„v5.dvi

Modal Phrase MP because but 2 IP Inflection Phrase IP as long as if IP 3 VP Verb Phrase VP while before [ MP MP [ IP IP [ VP VP ]]] [ MP [ IP [ VP ]]]

IPSJ SIG Technical Report Vol.2010-GN-74 No /1/ , 3 Disaster Training Supporting System Based on Electronic Triage HIROAKI KOJIMA, 1 KU


Vol. 23 No. 4 Oct Kitchen of the Future 1 Kitchen of the Future 1 1 Kitchen of the Future LCD [7], [8] (Kitchen of the Future ) WWW [7], [3

_念3)医療2009_夏.indd


Izard 10 [1]Plutchik 8 [2] [3] Izard Neviarouskaya [4][5] 2.2 Hao [6] 1 Twitter[a] a) Shook Wikipedia

DEIM Forum 2010 A3-3 Web Web Web Web Web. Web Abstract Web-page R

Transcription:

GDELT Multifacet comparative analysis of newspaper articles from different conutries - Analysis based on Global Database of Events, Language and Tone (GDELT) - 1 2 Masaharu Yoshioka 1 Noriko Kando 2 1 1 Graduate School of Information Sciecne and Technology, Hokkaido University 2 2 National Institute of Informatics Abstract: The News Site Contrast (NSContrast) system analyzes multiple news sites based on the concept of contrast set mining and it can extract terms that characterize different topics of interest for specific countries. In this study, we used the NSContrast system to analyze Global Database of Events, Language and Tone (GDELT) data by comparing news articles from different regions (e.g., USA, Asia, and the Middle East). We also present examples of analyses performed using this system. 1 NSContrast [1, 2] Global Database of Events, Language and Tone (GDELT) [3] 1 2013 Google News ( ) 064-0806 14 9 E-mail: yoshioka@ist.hokudai.ac.jp 1 http://gdeltproject.org/ NSContrast GDELT NSContrast GDELT 2 NSContrast GDELT 2.1 NSContrast NSContrast[1] ( ) ChaSen CaboCha Wikipedia Wikipedia [4] NSContrast - 24 -

1. [5] 2. 3. Wikipedia 4. ( ) Wikipedia 5. 3 ( ) 6. 7. ( ) ( ) Wikipedia ( ) ( ) 2.2 Global Database of Events, Language and Tone (GDELT) Global Database of Events, Language and Tone (GDELT) [3] Google News BBC Newswire 2 GDELT Event Database GDELT ID URL Conflict and Mediation Event Observation (CAMEO) 2 2 http://eventdata.parusanalytics.com/data.dir/cameo.html - 25 -

( ) ( ) ( ) ( ) ( ) 2013 3 1 1 2013 4 1 1 GDELT Global Knowledge Graph (GKG) GDELT Event Database ID ( ) ( ) URL 2013 4 1 1 GDELT Google BigQuery 2.3 GDELT NSContrast GDELT GDELT Global Knowledge Graph (GKG) GDELT GKG GDELT GKG NSContrast 3 GKG ( ) -100( ) 100( ) 3-1 -1 1 1 URL NSContrast GDELT.com.net 1. world-newspapers.com 3 BBC Newswire 2. (.jp,.uk ) 3. ( ) 8 URL GDELT GKG URL CGI URL URL URL URL 3 http://www.world-newspapers.com/ - 26 -

NSContrast 3 3.1 GDELT GKG 2013 4 1 2013 12 25 2.3 11,177,775 38%(4,280,168) 1: 2,933,282 1,295,274 1,258,470 343,595 392,768 384,462 254,204 35,552 4,280,168 nawaz sharif(mr. Nawaz Sharif: ) 10 nawaz sharif nawaz sharif ( 2) 10 6 10 nawaz sharif ( 3) 3.2 NSContrast 1 2013 9 29 ( ) 1 1 2 ronald bechtold (Mr. Ronald Bechtold: ) 3: Results of the term collocation analysis imran khan(mr. Imran Khan: ) nawaz sharif nawaz sharif 4 nawaz sharif 2013 4 1 Graph1( ) Graph2( ) Graph3( ) Graph4( ) nawaz sharif - 27 -

1: 2: Nawaz Sharif - 28 -

人工知能学会 インタラクティブ 情報アクセスと可視化マイニング研究会(第8回) $ 図 4: Nawaz Sharif を対象とした多観点分析 #!" $ # 図 5: Nawaz Sharif と Imran Khan を対象とした多観点分析 - 29 -

人工知能学会 インタラクティブ 情報アクセスと可視化マイニング研究会(第8回) $ 図 6: Nawaz Sharif の賛否に関する比較 この分析ウィンドーにおいて 検索式を修正すると 条件を満たした対象記事に対して グラフが更新され る 図 5 は 検索式に 先ほどの分析で得た人物 imran khan を追加した場合を示す このグラフから 6 月 の段階では imran khan は アジアとヨーロッパで は それなりに注目されていたが アメリカでは あま り注目されていないことが分かる しかし 11 月にな ると この imran khan は アメリカの無人攻撃機 を利用したタリバンへの攻撃 に反対することで ア メリカでも注目されることになる この様に アメリ カのニュースサイトを見ていただけでは 突然 注目 された人物という事になるが NSContrast のように 世界のニュースサイトを比較分析していくシステムを 用いることにより この様な自体に対しても より多 角的な分析ができるようになると考えている また この多観点分析システムは 様々な観点に関す る情報を並べて提示するだけでなく 異なる条件の検索 結果の比較を行うことも可能である 図 6 は nawaz sharif を含む記事における賛否に対する様々な国の比 較を行った結果である Graph1(左上) が全てのニュー スサイト (追加検索条件なし) Graph2(右上) がインド (サイト国 インド) Graph3(左下) がパキスタン (サ イト国 パキスタン) Graph4(右下) がアメリカ (サイ ト国 アメリカ) の賛否の時間遷移を表示したグラフと なる この比較から アメリカとパキスタンにおける 賛否の違いなどを読み取ることが可能となる 3.3 考察 この分析の結果 NSContrast が提供する比較分析機 能は 世界中では注目されてるとはいえないが 特定 の地域では注目されているような ローカルな情報を 見つけ出すのに有用であると考えている しかし より精緻な分析を行うためには 以下の点に おいて データを充実させる必要があると考えている サイトの所属する国の判定 現時点では 38%の記事について サイトの所属 する国が正しく判定されていない これについて は より適切な情報となるように 更新すること が望ましい ニュース記事のタイトル GDELT の GKG データは 記事を単位として作 られているが 記事から抽出された情報をリスト としてみるだけでは 閲覧性が高くない 少なく とも 記事のタイトルを 別のデータとして作成 した上で 表示させることが出来ると 閲覧性の 向上につながると考えている 4 まとめ 本論文では ニュース記事の多観点分析を支援する NSContrast と ニュース記事を基盤とした大規模なイ - 30 -

GDELT NSContrast (B) 25280035 [1],,. nscontrast., 2011-IFAT-103, 2011. IFAT-103-2. [2] Masaharu Yoshioka and Noriko Kando. Multifaceted analysis of news articles by using semantic annotated information. In Proceedings of the fifth workshop on Exploiting semantic annotations in information retrieval, ESAIR 12, pp. 19 20, New York, NY, USA, 2012. ACM. [3] Kalev Leetaru and Philip A. Schrodt. Gdelt:global data on events, location, and tone, 1979-2012. In ISA Annual Convention 2013, Vol. 2, p. 4, 2013. [4] Yohei Seki, Noriko Kando, and Masaki Aono. Multilingual opinion holder identification using author and authority viewpoints. Information Processing & Management, Vol. 45, No. 2, pp. 189 199, 2009. [5] Jon Kleinberg. Bursty and hierarchical structure in streams. In Proceedings of the 8th ACM SIGKDD Intl. Conf. on Knowledge Discovery and Data Mining, pp. 91 101, New York, NY, USA, 2002. ACM Press. - 31 -