2 1 Liang [2] Liang Zhai [3] Zhai [4] MPEG 1 [5] [6] Goromi-TV Goromi-TV [1] Kelm [7] Kelm Wikipedia GeoNames Crandall [8] Quack [9] Quack Qua

Similar documents
DEIM Forum 2012 E Web Extracting Modification of Objec

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means

Automatic Collection of Web Video Shots Corresponding to Specific Actions using Web Images

FIT2014( 第 13 回情報科学技術フォーラム ) RD-002 Web SNS Yuanyuan Wang Gouki Yasui Yuji Hosokawa Yukiko Kawai Toyokazu Akiyama Kazutoshi Sumiya 1. Twitter 1 Facebo

Microsoft Word - toyoshima-deim2011.doc

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2 21, Twitter SNS [8] [5] [7] 2. 2 SNS SNS Cheng [2] Twitter [6] Backstrom [1] Facebook 3 Jurgens

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出

DEIM Forum 2010 A Web Abstract Classification Method for Revie

Vol. 23 No. 4 Oct Kitchen of the Future 1 Kitchen of the Future 1 1 Kitchen of the Future LCD [7], [8] (Kitchen of the Future ) WWW [7], [3

DEIM Forum 2017 E Netflix (Video on Demand) IP 4K [1] Video on D

A Survey on Image Recognition Using Geo-tag Information

bag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i

(a) (b) 2 2 (Bosch, IR Illuminator 850 nm, UFLED30-8BD) ( 7[m] 6[m]) 3 (PointGrey Research Inc.Grasshopper2 M/C) Hz (a) (b

IPSJ SIG Technical Report Vol.2014-DBS-159 No.6 Vol.2014-IFAT-115 No /8/1 1,a) 1 1 1,, 1. ([1]) ([2], [3]) A B 1 ([4]) 1 Graduate School of Info

DEIM Forum 2015 F8-4 Twitter Twitter 1. SNS

,, WIX. 3. Web Index 3. 1 WIX WIX XML URL, 1., keyword, URL target., WIX, header,, WIX. 1 entry keyword 1 target 1 keyword target., entry, 1 1. WIX [2

特別寄稿.indd

,,, Twitter,,, ( ), 2. [1],,, ( ),,.,, Sungho Jeon [2], Twitter 4 URL, SVM,, , , URL F., SVM,, 4 SVM, F,.,,,,, [3], 1 [2] Step Entered

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

IPSJ SIG Technical Report Vol.2009-DBS-149 No /11/ Bow-tie SCC Inter Keyword Navigation based on Degree-constrained Co-Occurrence Graph

27 YouTube YouTube UGC User Generated Content CDN Content Delivery Networks LRU Least Recently Used UGC YouTube CGM Consumer Generated Media CGM CGM U

理工ジャーナル 23‐1☆/1.外村

main.dvi

“nice to meet you”

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +


IPSJ SIG Technical Report Vol.2013-HCI-152 No /3/13 1,a) 1,b) 2,c) / GPS Bluetooth(BT) WiFi BT WiFi 1. Bluetooth WiFi 1 / 1 2 a)

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta

untitled

バイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu

12_39.dvi

IPSJ SIG Technical Report 1,a) 1,b) 1,c) 1,d) 2,e) 2,f) 2,g) 1. [1] [2] 2 [3] Osaka Prefecture University 1 1, Gakuencho, Naka, Sakai,

1 Web DTN DTN 2. 2 DTN DTN Epidemic [5] Spray and Wait [6] DTN Android Twitter [7] 2 2 DTN 10km 50m % %Epidemic 99% 13.4% 10km DTN [8] 2

Microsoft Word - deim論文2.docx

2.2 6).,.,.,. Yang, 7).,,.,,. 2.3 SIFT SIFT (Scale-Invariant Feature Transform) 8).,. SIFT,,. SIFT, Mean-Shift 9)., SIFT,., SIFT,. 3.,.,,,,,.,,,., 1,

ActionScript Flash Player 8 ActionScript3.0 ActionScript Flash Video ActionScript.swf swf FlashPlayer AVM(Actionscript Virtual Machine) Windows

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

GIS Theory and Applications of GIS, 2018, Vol. 26, No.2, pp 地理教育における利活用を考慮した時空間情報システム 牧野隆平 * ** 山本佳世子 Spatio-Temporal Information System for Use

IPSJ SIG Technical Report Vol.2014-HCI-157 No.26 Vol.2014-GN-91 No.26 Vol.2014-EC-31 No /3/15 1,a) 2 3 Web (SERP) ( ) Web (VP) SERP VP VP SERP

(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te

(a) 1 (b) 3. Gilbert Pernicka[2] Treibitz Schechner[3] Narasimhan [4] Kim [5] Nayar [6] [7][8][9] 2. X X X [10] [11] L L t L s L = L t + L s

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

DEIM Forum 2019 H2-2 SuperSQL SuperSQL SQL SuperSQL Web SuperSQL DBMS Pi

Optical Flow t t + δt 1 Motion Field 3 3 1) 2) 3) Lucas-Kanade 4) 1 t (x, y) I(x, y, t)

光学

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

DEIM Forum 2019 H Web 1 Tripadvisor

TF-IDF TDF-IDF TDF-IDF Extracting Impression of Sightseeing Spots from Blogs for Supporting Selection of Spots to Visit in Travel Sat

IPSJ SIG Technical Report iphone iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Proc

LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R

卒論タイトル

図 2: 高周波成分を用いた超解像 解像度度画像とそれらを低解像度化して得られる 低解像度画像との差により低解像度の高周波成分 を得る 高解像度と低解像度の高周波成分から位 置関係を保ったままパッチ領域をそれぞれ切り出 し 高解像度パッチ画像と低解像度パッチ画像の ペアとしてデータベースに登録する

1 1 CodeDrummer CodeMusician CodeDrummer Fig. 1 Overview of proposal system c

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii

1 AND TFIDF Web DFIWF Wikipedia Web Web AND 5. Wikipedia AND 6. Wikipedia Web Ma [4] Ma URL AND Tian [8] Tian Tian Web Cimiano [3] [

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4

IPSJ SIG Technical Report Vol.2009-DPS-141 No.20 Vol.2009-GN-73 No.20 Vol.2009-EIP-46 No /11/27 1. MIERUKEN 1 2 MIERUKEN MIERUKEN MIERUKEN: Spe

3 Venue Venue Venue Venue Venue Venue SNS [2] Venue Venue [3] Venue Venue Venue [4] / Venue [5] Venue Venue Foursquare Venue Foursquare

(3.6 ) (4.6 ) 2. [3], [6], [12] [7] [2], [5], [11] [14] [9] [8] [10] (1) Voodoo 3 : 3 Voodoo[1] 3 ( 3D ) (2) : Voodoo 3D (3) : 3D (Welc

DEIM Forum 2010 A3-3 Web Web Web Web Web. Web Abstract Web-page R


shono_DIA06.ppt

手書きストロークを用いた動画上における非同期コミュニケーション


DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

FoodLog [3] TADAproject [4] Google Goggles 1 Kumar [5] () Leaf snap Maruyama [6] 3 Lee [7] Yu [8] Gist SVM Active Query Sensing(AQS)

[1] SBS [2] SBS Random Forests[3] Random Forests ii

IT,, i

xx/xx Vol. Jxx A No. xx 1 Fig. 1 PAL(Panoramic Annular Lens) PAL(Panoramic Annular Lens) PAL (2) PAL PAL 2 PAL 3 2 PAL 1 PAL 3 PAL PAL 2. 1 PAL

80 Sep CBIR 6),7) WWW WWW Image Collector Image Collector (1) (2) 1 WWW 2 CBIR WWW WWW WWW CBIR example-based generic object recognition 8),9) W

WISS 2008 [2] PowerPoint[7] KeyNote[8] ZUI(Zooming User Interface) ZUI 1. : Pad[9] CounterPoint[10] KidPad[11] ( ); ( ). [12] 3 4 [12] 5 3 TabletPC 2

27 AR

HASC2012corpus HASC Challenge 2010,2011 HASC2011corpus( 116, 4898), HASC2012corpus( 136, 7668) HASC2012corpus HASC2012corpus

. Yahoo! 1!goo 2 QA..... QA Web Web [1]Web Web Yin [2] Web Web Web. [3] Web Wikipedia 1 2

BOK body of knowledge, BOK BOK BOK 1 CC2001 computing curricula 2001 [1] BOK IT BOK 2008 ITBOK [2] social infomatics SI BOK BOK BOK WikiBOK BO

YouTube [7] A B [8] [8] YouTube () ( ) YouTube YouTube YouTube YouTube Data API [6] ( 1) ( ) YouTube ( 1 YouTube ) 2011

DVL-BR9取扱説明書<操作編(4/7)>

IPSJ SIG Technical Report Vol.2015-GN-93 No.29 Vol.2015-CDS-12 No.29 Vol.2015-DCC-9 No /1/27 1,a) 1 1 LAN IP 1), 2), 3), 4), 5) [

IPSJ SIG Technical Report Vol.2017-MUS-116 No /8/24 MachineDancing: 1,a) 1,b) 3 MachineDancing MachineDancing MachineDancing 1 MachineDan

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak

2 3, 4, [1] [2] [3]., [4], () [3], [5]. Mel Frequency Cepstral Coefficients (MFCC) [9] Logan [4] MFCC MFCC Flexer [10] Bogdanov2010 [3] [14],,,

IPSJ SIG Technical Report Vol.2013-CE-122 No.16 Vol.2013-CLE-11 No /12/14 Android 1,a) 1 1 GPS LAN 2 LAN Android,,, Android, HTML5 LAN 1. ICT(I

GUI(Graphical User Interface) GUI CLI(Command Line Interface) GUI

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-CVIM-186 No /3/15 EMD 1,a) SIFT. SIFT Bag-of-keypoints. SIFT SIFT.. Earth Mover s Distance

2007/8 Vol. J90 D No. 8 Stauffer [7] 2 2 I 1 I 2 2 (I 1(x),I 2(x)) 2 [13] I 2 = CI 1 (C >0) (I 1,I 2) (I 1,I 2) Field Monitoring Server

Web Hashtag Hashtag Twitter Hashtag Twitter Hashtag Hashtag Hashtag Twitter Hashtag Twitter Hashtag contexthashtag contexthashtag Hashtag contexthasht

す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(

main.dvi

S: E: O: C: V : 5

DEIM Forum 2017 H2-2 Android LAN Android 1 Android LAN

Transcription:

DEIM Forum 2012 B5-1 テレビ番組からの位置情報付き旅行映像データベースの自動構築 向井 康貴 柳井 啓司 電気通信大学 電気通信学部 情報工学科 182 8585 東京都調布市調布ヶ丘 1-5-1 E-mail: mukai-y@mmcsuecacjp, yanai@csuecacjp あらまし 本研究では 録画したテレビ番組の内容に関連した場所を推定し 地図上に配置することにより録画した 番組を検索可能とするシステムを提案する 具体的には 主に旅行番組を対象として 録画したテレビ番組の字幕か ら地名を抽出し 地名の出現時間を解析し その番組で紹介している場所を推定し 地図上に配置することにより位 置と対応付いた旅行映像をデータベース化する なお 単一の番組で複数の場所を扱っている場合は 場所毎に番組 を分割する これにより 例えば 神戸に旅行に行きたい場合に 過去に放送された旅行番組で神戸周辺を扱ってい るシーンを簡単に検索することが可能となる キーワード テレビ番組 位置情報 映像データベース Yasuki MUKAI and Keiji YANAI Department of Information, The University of Electro-Communications 1-5-1 Chofugaoka, Chofu, Tokyo 182 8585 Japan E-mail: mukai-y@mmcsuecacjp, yanai@csuecacjp 1 は じ め に 1 1 背 景 きれない 本研究では 番組の内容に応じた数の地名を利用し て 幅広い番組に対応できることを目指す また 宮部のシス テムでは番組全体を 1 カ所にマッピングしていたが これでは 2011 年 7 月 24 日には東日本大震災の影響を受けた東北 3 県 番組のどのあたりで 該当の場所を紹介しているのか探す必要 を除く地域でアナログ放送が終了した このことにより 日本 があった 本システムでは 番組を紹介場所毎に分割すること は本格的にデジタル放送の時代になっている 世界各国でもデ により この問題を解決する ジタル放送への移行が進んでいる デジタル放送の特徴として システムのインターフェースとしては 図 1 のように字幕よ は 高画質 高音質である等の他に 番組情報 字幕情報など り得られた地名を位置情報に変換し地図上に配置する これに のメタデータを取り入れていることがある さらに HDD の より ユーザはローカルな地名を知らなくても地図上より視覚 大容量化 低価格化により メタデータ付き動画の大量録画が 的に目的の場所を紹介している番組を探し出すことができる 容易なものとなってきている テレビ放送の多チャンネル化により 毎日多くの旅行番組が 放送されている しかし 見ることのできる番組はそのうちの ごくわずかである また 旅行番組を録画しておいたとしても 実際に旅行に行こうと思う場所を紹介している番組を見つける ことは容易ではない 1 2 目 的 本研究では 字幕情報付きの旅行番組を大量に録画し その 字幕を利用して 紹介場所毎に番組の分割 地図上への配置を 図1 字幕より得られた地名をマッピング 行うことにより 目的の番組を探し出せるシステムを提案する 本研究は宮部 [1] の地図と対応付けられた旅行番組データベー 2 関 連 研 究 スの構築を発展させる形で進めていく 宮部の研究は 字幕よ り地名を抽出して 出現回数の多かったもの 3 つだけを利用し ていた これでは最大で 3 カ所を紹介している番組しか対応し 本研究ではテレビ番組の位置情報推定を行うので テレビ番 組と位置情報推定の 2 つの観点から関連研究を紹介する

2 1 Liang [2] Liang Zhai [3] Zhai [4] MPEG 1 [5] [6] Goromi-TV Goromi-TV [1] 3 3 2 2 Kelm [7] Kelm Wikipedia GeoNames Crandall [8] Quack [9] Quack Quack Wikipedia Ulges [10] YouTube 3 2 1 2 3 4 5 6 7 2 4 4 1 1685Mbps 1440x1080i 16:9 BS 24Mbps 1920x1080i MPEG-2 TS TS

4 1 1 MPEG-2 TS MPEG-2 TS ISO/IEC 13818-1 ITU-T H2200 MPEG-2 1 MPEG-2 TS /BS MPEG-2 TS Packetized Elementary Stream, PES 188 Transport Stream, TS PID PID TS PES 4 2 Caption2Ass 1 Caption2Ass ASS SRT ASS ASS SRT SRT 280 00:19:34,069 --> 00:19:37,669 281 00:21:21,409 --> 00:21:24,078 282 00:21:24,078 --> 00:21:28,750 4 3 MPEG-2 TS 654kbps 96kbps 640x360 Flash Video FLV FFmpeg Flash Video 1 66GB 1 BS 96GB 1http://2sendipjp/dtv/ 330MB Flash Video route 4 3 1 Flash Video Flash Video Flash Player YouTube 4 4 ChaSen 2 --- 2 --- -- - - - 2 2 - -- - 4 5 Google Geocoding API Google Geocoding API 3 Google Geocoding API 1 country 1 Google Geocoding API administrative area level 1 locality 2http://chasen-legacysourceforgejp/ 3http://codegooglecom/intl/ja/apis/maps/documentation /geocoding/

1 4, ( ) 377607226 1404733561, ( ) 354179377 1394887222, ( ) 357187670 1394195590, ( ) 383263751 1408816288, ( ) 377785370 1404456250, ( ) 369554850 1408541450, ( ) 356386920 1397400200, ( ) 332053910 1297270030 4 2 5, ( ) 377785370 1404456250 4 6 3 5 6 6 3 4 7 FFmpeg [11]

4 7 1 カラーヒストグラム カラーヒストグラムは 画像の各ピクセルの色情報を調べ 出現頻度をヒストグラムで表現したものである 色を定量的に 表現するための体型はいくつかあり RGB 色空間 HSV 色空 間 Lu v 色空間などがある 本研究では色ピクセルを Red Green Blue の 3 チャンネルの濃度で表す RGB 色空間を利用 する 各チャンネルは通常 256 段階で表現されるが 今回は各 チャンネルを 4 分割した 64 次元の RGB カラーヒストグラム を利用する また 各ヒストグラムの要素の合計が 1 になるよ うに正規化を行う 4 7 2 ヒストグラムインターセクション ヒストグラムインターセクションとは それぞれのヒストグ ラムの同じビンを比較し 小さいものを集めていき最後に和を 求めたものである ヒストグラム h1 と h2 のヒストグラムイン 図 8 ブラウザからアクセスできる ターセクションを求める式は S= N X min(h1i, h2i ) (1) i=1 となる この値は正規化している場合 0 から 1 の値をとる 似 ている画像であれば この値が 1 に近くなる Google Map を利用しているため 地図の拡大縮小 移動も 自由に行え 地図上のマーカーをクリックすることにより 対 応する場所の番組を見ることができる 図 9 また 動画が小 さいと感じたらフルスクリーン表示に切り替えることもできる テレビ映像ではカメラの切り替わりや CM との境界でヒスト グラムインターセクションが低くなる 本研究では 各フレー ム間の Red Green Blue のそれぞれについて ヒストグラム インターセクションを計算して 1 つでも 06 を下回ったとき をシーンの境界と判断する 4 8 番組の地図上への配置 Google Maps API 注 4 を使用して 動画と位置情報を対応付 けて Google Map 上に配置する 図 7 のように地図上に配置す ることにより 視覚的に目的の場所の番組を探し出せる 図9 6 実 マーカーをクリックして動画を再生 験 実験として 字幕情報付き旅行番組を録画し その中から 10 本を選び 動画の分割 位置情報推定の実験を行った 6 1 データセット 今回 実験に使用した番組は表 2 の 10 本である また 各 図 7 Google Map 上に配置 番組の詳細として 放送日 番組の長さ 実際に紹介している 都道府県を示したのが表 3 である 5 システムの動作例 6 2 実験の設定 市区町村ベースの分割については 2 回以上連続して出現し システムはウェブブラウザを使用してインターネット上から アクセスすることができる 図 8 注 4 http://codegooglecom/intl/ja/apis/maps/documentation /javascript/ ている地名を用いて実験を行った また 市区町村ベースで分 割を行っているが 都道府県レベルでの評価も行った 都道府 県ベースの分割については 市区町村名を全く利用しないで 5 回以上連続して出現している都道府県名を用いて実験を行った

2 A B C D E F G H I J 3 A 2010 12 10 2 B 2011 1 5 2 48 C 2011 1 8 3 18 D 2011 1 30 1 15 E 2011 9 28 2 48 F 2011 11 11 55 G 2011 11 23 2 46 H 2011 11 25 55 I 2011 11 29 55 J 2011 12 12 55 3 5 6 4 A 12 7(2) 13 0583(0750) 0538(0692) B 11 3(1) 13 0273(0364) 0230(0308) C 38 23(6) 38 0605(0763) 0605(0763) D 7 2 6 0286 0333 E 13 6(2) 15 0462(0615) 0400(0533) F 3 2 4 0667 0500 G 9 3(1) 14 0333(0444) 0214(0286) H 3 1(1) 3 0333(0667) 0333(0667) I 9 1(1) 2 0111(0222) 0500(1000) J 4 3 3 0750 1000 109 51(14) 111 0468(0596) 0460(0586) 5 A 6 5(1) 7 0833(1000) 0714(0857) B 5 2(2) 5 0400(0800) 0400(0800) C 17 13(2) 16 0765(0882) 0813(0938) D 4 2 3 0500 0667 E 6 2(2) 4 0333(0667) 0500(1000) F 2 1(1) 2 0500(1000) 0500(1000) G 6 2(1) 3 0333(0500) 0667(1000) H 3 1(1) 2 0333(0667) 0500(1000) I 9 1(1) 2 0111(0222) 0500(1000) J 3 2 2 0667 1000 61 31(11) 46 0508(0689) 0674(0913) 6 3 precisionrecall A B C = C = C (2) B A 3 10 13 19 54 5% 30 1 6 4 4 6 A 8 4(3) 7 0500(0875) 0571(1000) B 7 4(1) 5 0571(0714) 0800(1000) C 17 13(2) 16 0765(0882) 0813(0938) D 3 3 3 1000 1000 E 5 4 4 0800 1000 F 2 1(1) 2 0500(1000) 0500(1000) G 4 3 3 0750 1000 H 2 1(1) 2 0500(1000) 0500(1000) I 6 1(1) 2 0167(0333) 0500(1000) J 2 1(1) 2 0500(1000) 0500(1000) 56 35(10) 46 0625(0804) 0761(0978) 468% 460% 625% 761%

7 4 5 J J J 1 2 1 I 3 D D A C 2 1 1 1 8 8 1 Google Map 5% 468% 460% 625% 761% 8 2 Google Geocoding [1], 2011 [2] C Liang, C Xu, J Cheng, and H Lu Tvparser: An automatic tv video parsing method In Proc of IEEE Computer Vision and Pattern Recognition, pp 3377 3384, 2011 [3] Y Zhai, A Yilmaz, and M Shah Story Segmentation in News Videos Using Visual and Text Cues In Proc of ACM International Conference on Image and Video Retrieval, 2005 [4] N Katayama, H Mo, I Ide, and S Satoh Mining largescale broadcast video archives towards inter-video structuring Proc of PacificRim Conference on Multimedia, pp 489 496, 2004 [5], 2009 [6] Goromi-TV WISS2006, pp 47 52, 2006 [7] P Kelm, S Schmiedeke, and T Sikora Multi-modal, Multiresource Methods for Placing Flickr Videos on the Map In Proc of ACM International Conference on Multimedia Retrieval, 2011 [8] DJ Crandall, L Backstrom, D Huttenlocher, and J Kleinberg Mapping the world s photos In Proceedings of the 18th international conference on World wide web, pp 761 770 ACM, 2009 [9] T Quack, B Leibe, and L V Gool World-scale Mining of Objects and Events from Community Photo Collections In Proc of ACM International Conference on Image and Video Retrieval, pp 47 56, 2008 [10] A Ulges, C Schulze, D Keysers, and T M Breuel A System That Learns to Tag Videos by Watching Youtube In Proc of International Conference on Vision Systems, pp 415 424, 2008 [11] MJ Swain and DH Ballard Color indexing International Journal of Computer Vision, Vol 7, No 1, pp 11 32, 1991