1. [5] Wikipedia 4. ( ) Wikipedia 5. 3 ( ) ( ) ( ) Wikipedia ( ) ( ) 2.2 Global Database of Events, Language and Tone (GDELT) Global Datab

Similar documents
2. Twitter Twitter 2.1 Twitter Twitter( ) Twitter Twitter ( 1 ) RT ReTweet RT ReTweet RT ( 2 ) URL Twitter Twitter 140 URL URL URL 140 URL URL

SERPWatcher SERPWatcher SERP Watcher SERP Watcher,

main.dvi

Microsoft Word - toyoshima-deim2011.doc

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor

IPSJ SIG Technical Report Vol.2011-DBS-153 No /11/3 Wikipedia Wikipedia Wikipedia Extracting Difference Information from Multilingual Wiki

DEIM Forum 2010 A Web Abstract Classification Method for Revie

. Yahoo! 1!goo 2 QA..... QA Web Web [1]Web Web Yin [2] Web Web Web. [3] Web Wikipedia 1 2

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

‰gficŒõ/’ÓŠ¹

TF-IDF TDF-IDF TDF-IDF Extracting Impression of Sightseeing Spots from Blogs for Supporting Selection of Spots to Visit in Travel Sat

( )

The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). The material has been made available on the website

JSIK_KUDO4

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as

untitled

熊谷市報10月号

untitled


外国語学部 紀要30号(横書)/03_菊地俊一

1 1 tf-idf tf-idf i

Web [1] [2] [3] [4] [5] SupportVectorMachine SVM [6] [7] Google [11] Web

<> <name> </name> <body> <></> <> <title> </title> <item> </item> <item> 11 </item> </>... </body> </> 1 XML Web XML HTML 1 name item 2 item item HTML

DEIM Forum 2009 E

5

Vol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m

: ( 1) () 1. ( 1) 2. ( 1) 3. ( 2)

dews2004-final.dvi

kut-paper-template.dvi

pp DC 2,

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

IPSJ SIG Technical Report Vol.2011-MUS-91 No /7/ , 3 1 Design and Implementation on a System for Learning Songs by Presenting Musical St

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

Web Web [4] Web Web [5] Web 2 Web 3 4 Web Web 2.1 Web Web Web Web Web 2.2 Web Web Web *1 Web * 2*3 Web 3. [6] [7] [8] 4. Web 4.1 Web Web *1 Ama

知能と情報, Vol.30, No.5, pp

HP cafe HP of A A B of C C Map on N th Floor coupon A cafe coupon B Poster A Poster A Poster B Poster B Case 1 Show HP of each company on a user scree

Q [4] 2. [3] [5] ϵ- Q Q CO CO [4] Q Q [1] i = X ln n i + C (1) n i i n n i i i n i = n X i i C exploration exploitation [4] Q Q Q ϵ 1 ϵ 3. [3] [5] [4]

(a) (b) 1 JavaScript Web Web Web CGI Web Web JavaScript Web mixi facebook SNS Web URL ID Web 1 JavaScript Web 1(a) 1(b) JavaScript & Web Web Web Webji

NINJAL Project Review Vol.3 No.3

農研機構 食品総合研究所 研究報告 77号

01 Campus News Topics 1

main.dvi

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

’ÓŠ¹/‰´„û

Input image Initialize variables Loop for period of oscillation Update height map Make shade image Change property of image Output image Change time L

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.

Vol. 9 No. 5 Oct (?,?) A B C D 132

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

IPSJ SIG Technical Report Vol.2017-CLE-21 No /3/21 e 1,2 1,2 1 1,2 1 Sakai e e e Sakai e Current Status and Challenges on e-learning T

Vol.54 No (July 2013) [9] [10] [11] [12], [13] 1 Fig. 1 Flowchart of the proposed system. c 2013 Information

人工知能学会研究会資料 SIG-KBS-B Analysis of Voting Behavior in One Night Werewolf 1 2 Ema Nishizaki 1 Tomonobu Ozaki Graduate School of Integrated B

封面要旨目录打印版2

vol56-H

2006 [3] Scratch Squeak PEN [4] PenFlowchart 2 3 PenFlowchart 4 PenFlowchart PEN xdncl PEN [5] PEN xdncl DNCL 1 1 [6] 1 PEN Fig. 1 The PEN

IPSJ SIG Technical Report Vol.2014-CE-126 No /10/11 1,a) Kinect Support System for Romaji Learning through Exercise Abstract: Educatio

Publish/Subscribe KiZUNA P2P 2 Publish/Subscribe KiZUNA 2. KiZUNA 1 Skip Graph BF Skip Graph BF Skip Graph Skip Graph Skip Graph DDLL 2.1 Skip Graph S

untitled

DEIM Forum 2012 E Web Extracting Modification of Objec

johnny-paper2nd.dvi

DEIM Forum 2009 B4-6, Str

インターネットと運用技術シンポジウム 2016 Internet and Operation Technology Symposium 2016 IOTS /12/1 syslog 1,2,a) 3,b) syslog syslog syslog Interop Tokyo Show

,,,,., C Java,,.,,.,., ,,.,, i

IPSJ SIG Technical Report Vol.2016-CE-137 No /12/ e β /α α β β / α A judgment method of difficulty of task for a learner using simple

和文タイトル

IP ( ) IP ( ) IP DNS Web Web DNS Web DNS DNS 利用者 1 利用者 2 東京都調布市の天気情報を応答 東京都調布市の天気を問い合わせ 北海道旭川市の天気を問い合わせ 北海道旭川市の天気情報を応答 Fig. 1 1 DNS サーバ 東京都調布市の天気情報 We

<95DB8C9288E397C389C88A E696E6462>

3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root

16

大学論集第42号本文.indb

IPSJ SIG Technical Report Vol.2012-MPS-88 No /5/17 1,a) 1 Network Immunization via Community Structure based Node Representation Tetsuya Yoshida

IT,, i





AP AP AP AP AP AP AP( AP) AP AP( AP) AP AP Air Patrol[1] Air Patrol Cirond AP AP Air Patrol Senser Air Patrol Senser AP AP Air Patrol Senser AP

_314I01BM浅谷2.indd


1_26.dvi

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

10_細川直史.indd

IPSJ SIG Technical Report Vol.2014-HCI-158 No /5/22 1,a) 2 2 3,b) Development of visualization technique expressing rainfall changing conditions

IPSJ SIG Technical Report Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for

Web Hashtag Hashtag Twitter Hashtag Twitter Hashtag Hashtag Hashtag Twitter Hashtag Twitter Hashtag contexthashtag contexthashtag Hashtag contexthasht

HASC2012corpus HASC Challenge 2010,2011 HASC2011corpus( 116, 4898), HASC2012corpus( 136, 7668) HASC2012corpus HASC2012corpus

e-learning station 1) 2) 1) 3) 2) 2) 1) 4) e-learning Station 16 e-learning e-learning key words: e-learning LMS CMS A Trial and Prospect of Kumamoto

fiš„v5.dvi

Modal Phrase MP because but 2 IP Inflection Phrase IP as long as if IP 3 VP Verb Phrase VP while before [ MP MP [ IP IP [ VP VP ]]] [ MP [ IP [ VP ]]]

IPSJ SIG Technical Report Vol.2010-GN-74 No /1/ , 3 Disaster Training Supporting System Based on Electronic Triage HIROAKI KOJIMA, 1 KU


IPSJ SIG Technical Report Vol.2009-HCI-134 No /7/17 1. RDB Wiki Wiki RDB SQL Wiki Wiki RDB Wiki RDB Wiki A Wiki System Enhanced by Visibl

Vol. 23 No. 4 Oct Kitchen of the Future 1 Kitchen of the Future 1 1 Kitchen of the Future LCD [7], [8] (Kitchen of the Future ) WWW [7], [3

pp a p p. 6 45

_念3)医療2009_夏.indd


東京国立博物館ニュース2014年4-5月号

Izard 10 [1]Plutchik 8 [2] [3] Izard Neviarouskaya [4][5] 2.2 Hao [6] 1 Twitter[a] a) Shook Wikipedia

DEIM Forum 2010 A3-3 Web Web Web Web Web. Web Abstract Web-page R

Transcription:

GDELT Multifacet comparative analysis of newspaper articles from different conutries - Analysis based on Global Database of Events, Language and Tone (GDELT) - 1 2 Masaharu Yoshioka 1 Noriko Kando 2 1 1 Graduate School of Information Sciecne and Technology, Hokkaido University 2 2 National Institute of Informatics Abstract: The News Site Contrast (NSContrast) system analyzes multiple news sites based on the concept of contrast set mining and it can extract terms that characterize different topics of interest for specific countries. In this study, we used the NSContrast system to analyze Global Database of Events, Language and Tone (GDELT) data by comparing news articles from different regions (e.g., USA, Asia, and the Middle East). We also present examples of analyses performed using this system. 1 NSContrast [1, 2] Global Database of Events, Language and Tone (GDELT) [3] 1 2013 Google News ( ) 064-0806 14 9 E-mail: yoshioka@ist.hokudai.ac.jp 1 http://gdeltproject.org/ NSContrast GDELT NSContrast GDELT 2 NSContrast GDELT 2.1 NSContrast NSContrast[1] ( ) ChaSen CaboCha Wikipedia Wikipedia [4] NSContrast - 24 -

1. [5] 2. 3. Wikipedia 4. ( ) Wikipedia 5. 3 ( ) 6. 7. ( ) ( ) Wikipedia ( ) ( ) 2.2 Global Database of Events, Language and Tone (GDELT) Global Database of Events, Language and Tone (GDELT) [3] Google News BBC Newswire 2 GDELT Event Database GDELT ID URL Conflict and Mediation Event Observation (CAMEO) 2 2 http://eventdata.parusanalytics.com/data.dir/cameo.html - 25 -

( ) ( ) ( ) ( ) ( ) 2013 3 1 1 2013 4 1 1 GDELT Global Knowledge Graph (GKG) GDELT Event Database ID ( ) ( ) URL 2013 4 1 1 GDELT Google BigQuery 2.3 GDELT NSContrast GDELT GDELT Global Knowledge Graph (GKG) GDELT GKG GDELT GKG NSContrast 3 GKG ( ) -100( ) 100( ) 3-1 -1 1 1 URL NSContrast GDELT.com.net 1. world-newspapers.com 3 BBC Newswire 2. (.jp,.uk ) 3. ( ) 8 URL GDELT GKG URL CGI URL URL URL URL 3 http://www.world-newspapers.com/ - 26 -

NSContrast 3 3.1 GDELT GKG 2013 4 1 2013 12 25 2.3 11,177,775 38%(4,280,168) 1: 2,933,282 1,295,274 1,258,470 343,595 392,768 384,462 254,204 35,552 4,280,168 nawaz sharif(mr. Nawaz Sharif: ) 10 nawaz sharif nawaz sharif ( 2) 10 6 10 nawaz sharif ( 3) 3.2 NSContrast 1 2013 9 29 ( ) 1 1 2 ronald bechtold (Mr. Ronald Bechtold: ) 3: Results of the term collocation analysis imran khan(mr. Imran Khan: ) nawaz sharif nawaz sharif 4 nawaz sharif 2013 4 1 Graph1( ) Graph2( ) Graph3( ) Graph4( ) nawaz sharif - 27 -

1: 2: Nawaz Sharif - 28 -

人工知能学会 インタラクティブ 情報アクセスと可視化マイニング研究会(第8回) $ 図 4: Nawaz Sharif を対象とした多観点分析 #!" $ # 図 5: Nawaz Sharif と Imran Khan を対象とした多観点分析 - 29 -

人工知能学会 インタラクティブ 情報アクセスと可視化マイニング研究会(第8回) $ 図 6: Nawaz Sharif の賛否に関する比較 この分析ウィンドーにおいて 検索式を修正すると 条件を満たした対象記事に対して グラフが更新され る 図 5 は 検索式に 先ほどの分析で得た人物 imran khan を追加した場合を示す このグラフから 6 月 の段階では imran khan は アジアとヨーロッパで は それなりに注目されていたが アメリカでは あま り注目されていないことが分かる しかし 11 月にな ると この imran khan は アメリカの無人攻撃機 を利用したタリバンへの攻撃 に反対することで ア メリカでも注目されることになる この様に アメリ カのニュースサイトを見ていただけでは 突然 注目 された人物という事になるが NSContrast のように 世界のニュースサイトを比較分析していくシステムを 用いることにより この様な自体に対しても より多 角的な分析ができるようになると考えている また この多観点分析システムは 様々な観点に関す る情報を並べて提示するだけでなく 異なる条件の検索 結果の比較を行うことも可能である 図 6 は nawaz sharif を含む記事における賛否に対する様々な国の比 較を行った結果である Graph1(左上) が全てのニュー スサイト (追加検索条件なし) Graph2(右上) がインド (サイト国 インド) Graph3(左下) がパキスタン (サ イト国 パキスタン) Graph4(右下) がアメリカ (サイ ト国 アメリカ) の賛否の時間遷移を表示したグラフと なる この比較から アメリカとパキスタンにおける 賛否の違いなどを読み取ることが可能となる 3.3 考察 この分析の結果 NSContrast が提供する比較分析機 能は 世界中では注目されてるとはいえないが 特定 の地域では注目されているような ローカルな情報を 見つけ出すのに有用であると考えている しかし より精緻な分析を行うためには 以下の点に おいて データを充実させる必要があると考えている サイトの所属する国の判定 現時点では 38%の記事について サイトの所属 する国が正しく判定されていない これについて は より適切な情報となるように 更新すること が望ましい ニュース記事のタイトル GDELT の GKG データは 記事を単位として作 られているが 記事から抽出された情報をリスト としてみるだけでは 閲覧性が高くない 少なく とも 記事のタイトルを 別のデータとして作成 した上で 表示させることが出来ると 閲覧性の 向上につながると考えている 4 まとめ 本論文では ニュース記事の多観点分析を支援する NSContrast と ニュース記事を基盤とした大規模なイ - 30 -

GDELT NSContrast (B) 25280035 [1],,. nscontrast., 2011-IFAT-103, 2011. IFAT-103-2. [2] Masaharu Yoshioka and Noriko Kando. Multifaceted analysis of news articles by using semantic annotated information. In Proceedings of the fifth workshop on Exploiting semantic annotations in information retrieval, ESAIR 12, pp. 19 20, New York, NY, USA, 2012. ACM. [3] Kalev Leetaru and Philip A. Schrodt. Gdelt:global data on events, location, and tone, 1979-2012. In ISA Annual Convention 2013, Vol. 2, p. 4, 2013. [4] Yohei Seki, Noriko Kando, and Masaki Aono. Multilingual opinion holder identification using author and authority viewpoints. Information Processing & Management, Vol. 45, No. 2, pp. 189 199, 2009. [5] Jon Kleinberg. Bursty and hierarchical structure in streams. In Proceedings of the 8th ACM SIGKDD Intl. Conf. on Knowledge Discovery and Data Mining, pp. 91 101, New York, NY, USA, 2002. ACM Press. - 31 -