一般画像認識のための単語概念の視覚性の分析

Size: px
Start display at page:

Download "一般画像認識のための単語概念の視覚性の分析"

Transcription

1 Bag-of-keypoints による カテゴリー認識 第 14 回画像センシングシンポジウム (SSII2008) 2008 年 6 月 13 日 電気通信大学 柳井啓司 情報工学科

2 2 アウトライン 1. イントロダクション 2. Bag-of-keypoints アプローチ その具体的な方法の詳細 3. Bag-of-keypoints アプローチの拡張 位置情報, 色情報の利用 4. 確率的言語モデルの画像への適用 5. 今後の方向 1. シーンの階層的理解, コンテキストの利用 2. 言語階層との対応

3 1. イントロダクション 参考文献 柳井啓司. 一般物体認識の現状と今後. 情報処理学会論文誌 : コンピュータビジョン イメージメディア, Vol.48, No. SIG16 (CVIM19), pp. 1-24, 2007.

4 6 一般物体認識とは? 一般的な 実世界画像の認識 デジカメや Web の画像を自動認識. 画像内容を言語 ( 記号 ) で記述. 意味理解. クマ ( 草の上の ) トラ ( 草を食べる ) ゾウ 静止画像に対して, その中に含まれる物体もしくはシーンの一般名称 ( カテゴリー ) を認識 究極的には人間以上にあらゆる画像を認識

5 物体の認識 空 7 建物 / ビル 木 / 桜 木 / 桜 信号機 木 / 桜外灯 建物バス 自転車 道路 自動車 / バン

6 シーン ( コンテキスト ) 認識 場所について 屋外 街 以下は 固有名詞 日本 東京都多摩市 聖蹟桜ヶ丘 京王百貨店 緯度 :N 経度 :E 時間について 春 4 月 日中 晴天... 8

7 9 一般物体認識の困難性 認識対象が多様 ( カテゴリー内変化が大 ) 同一種類 ( カテゴリー ) の物体でも形は様々. 変形も. 撮影時の条件が多様 ( 視点位置, 向き, 変形, スケール, 照明 ( 天候 ), 背景, オクルージョン ) 認識対象が多い.( カテゴリー数が多い.) 辞書に出ている名詞の数だけある! 数万? 何を認識するべきか? レベルは? 動物 or ライオン? 様々な ライオン

8 カテゴリー内変化 (1): 10 いろいろな 椅子

9 カテゴリー内変化 (1): 11 いろいろな 椅子 どんな 椅子 が認識できればいい? (1) 世の中の 椅子 すべて? (2) 典型的なもののみ? (3) 座る 機能を提供する物体すべて?

10 カテゴリー内変化 (2): 12 いろいろな視点からの見え方 [P.Yan, S. M. Khan and M. Shah: 3D Model The University based of Object Electro-Communications Class Detection in An Arbitrary View, Tokyo, CVPR JAPAN 2007] (UEC) より

11 カテゴリー内変化 (2): 13 いろいろな視点からの見え方 どこからみた バイク が認識できればいい? (1) すべての方向? 360 度. 下からも上からも? (2) 典型的な見え方のみ? 真横, 斜め前方. canonical view (3) 状況によって異なる. 地上からみた場合. 高層ビルや飛行機から. [P.Yan, S. M. Khan and M. Shah: 3D Model The University based of Object Electro-Communications Class Detection in An Arbitrary View, Tokyo, CVPR JAPAN 2007] (UEC) より

12 カテゴリー数が多い : 14 多様なカテゴリー

13 カテゴリー数が多い : 15 多様なカテゴリー 一体, 何種類認識できればいい? (1) 世の中の物体すべて! シーン, イベントも製品やランドマークなどの固有名詞も! basic-level/entry-level category (2) 典型的なもの 1000 種類! 典型的 って? (3) 用途に応じて. 花だけ. 食べ物だけ.

14 2 種類の認識 :Identification と 16 classification( カテゴリー分類 ) Identification : DB 中の特定物体の検出. モデル物体は点で表現. クラス内変動はなし. 特定の 椅子 DB 中のもっとも近い画像を探す. Classification : 物体の分類 ( カテゴリ / クラス ) を区別. 分類名 ( 一般名称 ) で認識. クラス内変動大. すべての 椅子 認識カテゴリーの定義が難しい. 椅子 とは何か? 厳密な定義がない!! 人間は classification が得意. 椅子 という概念に対応した物体の認識 計算機は identification の方が得意. 一般物体認識では, classification が目的. The chairs 特定の 椅子 の認識 A chair

15 17 厳密な定義がない認識カテゴリー : どのような 認識 をするべきか? 多くの人間が行う認識 みんなが机だと思うものは机と認識して欲しい. 日本の家 と アフリカの家. 文化による認識対象の違い. 基本認識レベル (E.Rosch,1976) で物体を認識 ぱっと見た時に最初に思い付く ( 一般 ) 名称. 机 ライオン 犬 自動車 アザラシ 形状の類似性 人工物 動物 家具 乗り物 ぽち タマちゃん 人間のような認識 を行うには? 概念 机 机モデル 画像 モデル化照合 一般的な 事例から, モデルを学習により構築. 特定物体認識 一般物体認識においては学習データ構築も重要.

16 19 一般画像認識の歴史 研究者の知識がすべて! 70 年代線画解釈.( 画像処理が中心.) 80 年代前半知識ベース型システム. 人手によるルール記述に一般性がない. 知識爆発. 80 年代後半 3 次元の復元. モデルベースト. Identification のみ. 形状既知. 実世界でうまくいかない. 90 年代学習による認識. 顔画像や identification 中心. 顔画像認識 (Eigenface) の成功. 固有空間法. 画像 DBにおける画像の意味的分類. 00 年代局所特徴 + 機械学習により大きく進歩 90 年代までは, 画像認識においてはマイナーな研究分野.

17 年以降の発展突然ブレイク! 2000 年 Constellation model ( 確率モデル ) 2001 年確率手法による単語と画像の対応付け 2002 年 Word-image translation model 2003 年 Video Google (image search by visual words) 2004 年 Bag-of-keypoints(BoK)+SVM 2004 年 Caltech101 (101 カテゴリーのデータセット ) 登場 2005 年 ~ BoK + probabilistic graphical model (PLSA, LDA, HDP, their modifications) BoK + SVM with modified kernel BoK + MRF for semantic region segmentation 2007 年 Caltech256 (256 カテゴリーのデータセット ) 登場

18 2.Bag-of-keypoints アプローチ 参考文献 [Low99] Lowe, D.G.: Object recognition from local scale invariant features, Proc. of IEEE International Conference on Computer Vision, pp (1999). [Siv03] Sivic, J. and Zisserman, A.: Video Google: A Text Retrieval Approach to Object Matching in Videos, Proc. of IEEE International Conference on Computer Vision, pp (2003). [Csu04] Csurka, G., Bray, C., Dance, C. and Fan, L. Visual categorization with bags of keypoints, in Proc. of ECCV Workshop on Statistical Learning in Computer Vision, pp (2004).

19 frequency 22 全体特徴から局所特徴へ 従来の認識 : 認識対象の全体を利用 固有空間法, 領域分割を用いた方法 オクルージョンや変形に弱い. Part-based 手法の登場 : 複数の部分の組み合わせで認識 局所パターンの分布に基づく認識 (bag-of-keypoints) visual words

20 局所特徴量による 23 identification SIFT [Low99] 回転およびスケール変化に丌変な局所特徴量ただし,D.Lowe が想定したのは identification Video Google [Siv03] SIFT 特徴ベクトルをベクトル量子化し, 画像を visual words の集合とみなす. テキスト検索の手法 (Google) を応用し, 高速画像検索を実現. ( 同一部分の検索 )

21 Bag-of-keypoints [Csu04]: 24 visual word の classification への適用 Visual words の集合として画像を表現 Visual words のヒストグラムを画像特徴とする 単語出現頻度によりテキストを表現する方法の bag-of-words の考え方を画像に応用. 語順を無視するのと同様に, 位置を無視. Bag-of-keypoints によって表現された特徴ベクトルを Naive Bayes, SVM などの機械学習手法で分類. テキスト分類と同じ! Bag-of-visual-words (BoVW), Bag-of-features (BoF) とも言うことがある.

22 frequency Bag-of-keypoints のアルゴリズム : bag-of-keypoints 表現への変換 画像を visual word の出現頻度ヒストグラムで表現 1. 各画像について, 数千個の特徴点を抽出. 2. SIFT 記述子により特徴点周辺パターンを SIFT 特徴ベクトルとして抽出. 3. 予め求められた visual words (codebook) に基づいて SIFT 特徴ベクトルをベクトル量子化. 4. 画像毎にヒストグラムを作成. SIFT 法 ( 特徴点抽出 + 記述 ) visual words

23 特徴点のサンプリングの方法 主な 3 つの方法 SIFT 法の方法 Difference of Gaussian(DoG) sparse sampling と呼ぶ Random sampling Grid sampling dense sampling と呼ぶ DoG (sparse) random(dense) grid(dense) カテゴリー分類 (classification) においては, パターンのない部分の情報も重要.

24 Visual words の求め方 学習画像 ( 正例, 負例 ) を用意し,SIFT 特徴ベクトルを全画像から抽出 ( 枚数が多い場合は, ランダムサンプリング ) k-means クラスタリングを実行 各クラスタの中心が visual words v v i i v i v i v i v i v i v i v i v i SIFT vectors Visual words は, 代表的な局所パターンに相当する.

25 frequency Bag-of-keypoints 表現 28 Visual words の出現頻度 ( ヒストグラム ) によって画像を表現... Visual words ( 数百 ~ 数千個 ) 次元は, 数百 ~ 数千次元. スパースなベクトルになる.

26 Bag-of-keypoints 表現を用いた 30 画像認識 あとは, 多次元ベクトルの分類問題 最初の論文 [Csu04] では, 以下の 2 つの手法で実験 SVM (support vector machine) Naive Bayes 従来手法の結果を大きく改善 例 :Web 画像の分類 10 種類のキーワードについて, 平均適合率 従来手法 ( 領域分割 +GMM): 73.5% BoK + SVM : 82.4%

27 3.Bag-of-keypoints の改良 参考文献 [Laz06] Lazebnik, S., Schmid, C. and Ponce, J.: Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories, Proc. of IEEE Computer Vision and Pattern Recognition, pp (2006). [Var07] M. Varma and D. Ray. Learning the discriminative powerinvariance trade-off. In Proc. of IEEE International Conference on Computer Vision, pp (2007). [Rab07] A. Rabinovich, A.Vedaldi, C. Galleguillos, E. Wiewora and S. Belongie: Objects in context, In Proc. of IEEE International Conference on Computer Vision, pp (2007).

28 Bag-of-keypoints の問題点と 32 提案された解決法 ヒストグラムのため位置情報を利用しない ブロック分割して, サブヒストグラムを作成 Spatial pyramid kernel SIFT を利用するので, 色情報を利用しない RGB や HSV, Lab など,3 つの色成分ごとに SIFT で特徴抽出 (128 次元 3) Color SIFT 色情報や形状情報, テクスチャ情報を統合 重み付き線形和カーネルによる統合 どこに物体があるか分からない. 物体検出.

29 位置情報の導入 Spatial pyramid kernel [Laz06] BoK をグリッド分割して階層的に local BoK を作成 各レベルごとにヒストグラムインターセクションを求め, レベルごとに異なる重みで統合.SVM のカーネル関数とする. l I I I I Y X I Y X I Y X k l l L l l L L : Histogram intersetion in level 2) L (in case of ), ( 2 1 ), ( 2 1 ), ( ), ( 2 Y X I ), ( 1 Y X I ), ( 0 Y X I

30 34 色情報の利用 :Color SIFT 各特徴点について RGB(HSV, Lab) の 3 つの SIFT ベクトルを計算し,1 つに結合. R v R G B v G v B v RGB Color SIFT ベクトル (128*3 次元 )

31 他の種類の特徴との統合 35 [Var07] (linear combination of kernels) 多種類特徴を統合する SVM のカーネル関数 重み付き線形和カーネル関数による, Bag-of-keypoints, 色, 形の統合. + 重みの自動推定. 各特徴のカーネルをとすると, 統合カーネルは, ただし, d i 1,.., N ) は最適化問題を解いて求める. i( k カーネルの重みを求めるのは, 機械学習の研究では近年よく研究されている. 認識精度を上げるには,BoKのみでなく, 様々な特徴量を カテゴリーに応じて選択的に利用することが重要 Tokyo, JAPAN.(UEC) Caltech-101, 256 の分類で, 最高の約 90%, 約 60% を達成

32 [Var07] 特徴重みの推定結果 36 (1-vs-1 の場合 ) [Var07] より図を引用 両方とも黄色 色の記述子はいらないしかし形状は有効重み形状 :3.94 色 :0 テクスチャ :0 クロッカスは形状のクラス内の変化が大きい 形状に識別力がない色は比較的識別力がある重み形状 :0.42 色 :2.46 テクスチャ :0 2 つを分ける主な特徴がない 3つの特徴をバランス良く組み合わせる必要がある重み形状 :1.48 色 :2.00 テクスチャ :1.36

33 対象の検出への BoK の利用 : 37 領域分割との組み合わせ [Rab07] 領域分割し, 領域毎に BoK ベクトルを作成, 領域毎に分類. 最後に共起関係より修正. [Rab07] より図を引用 領域分割は, Normalized Cuts. を利用. 共起関係は確率モデル (MRF) によって表現.

34 4. 確率的テキスト 解析手法の導入 参考文献 [Hof99 ] T. Hofmann, Probabilistic Latent Semantic Indexing, Proc. of ACM SIGIR (1999). [Ble03] D. Blei, A. Ng, and M. Jordan. Latent Dirichlet allocation. Journal of Machine Learning Research, No.3, pp , (2003). [Teh06] Y. Teh, M. Jordan, M. Beal, and D. Blei. Hierarchical Dirichlet Processes. Journal of the American Statistical Association, Vol.101, No.476, pp (2006).

35 39 テキスト解析手法の導入 文書 : 単語の集合 bag-of-words 画像 :VW の集合 bag-of-visual-words Video Google [Siv03] キーワード検索手法 ( 転置インデックス ) の画像検索への応用 確率トピックモデルの画像への応用 : 元々はテキスト解析用 bag-of-words を前提とする PLSA (Probabilistic Latent Analysis) LDA (Latent Dirichlet Allocation) HDP (Hierarchical Dirichlet Process)

36 高次元でスパースな BoK 向けの確率的 クラスタリング : PLSA と LDA テキスト解析向けの確率トピックモデル Bag-of-words 表現された文書を確率的にトピック分類する トピック数は, 事前に指定する.K-means と同じ. トピックを z, 文書 ( 画像 ) を d とすると, 各文書について P(z d) が求まる Probabilistic Latent Semantic Analysis ( ヒストグラムは離散なので ) 混合多項分布によるモデル P ( w, d) P( d) p( w z) P( z d) を EM でパラメータ推定 z Latent Dirichlet Allocation ( 判別分析ではありません!) PLSAを改良. 多項分布の代わりに混合ディリクレ分布. オーバーフィッティングを解消.

37 例 : Mountain 10 topics 正例 負例 GMM による認識と同じことができる P(Mountain topic) P(pos topic)

38 5. 今後の方向 1. シーンの階層的理解, コンテキストの利用 2. 言語階層との対応

39 コンテキストの利用 : 47 人間は 常識 として持っている知識 共起関係 : 共起の強さを確率で表現 机 ライオン 階層的認識 : シーン認識 + 物体認識 (+ 領域分割 ) 風景 part-of 関係 ディスプレイキーボード本棚床 草原 空 自動車 道路 机 本棚 室内 キーボード サバンナ ディスプレイ 床 ライオン 屋外 草原 空 路上 自動車 道路

40 言語の階層的分類 ( タクソノミー ) との関係 物体 member-of 関係 動物 植物 無生物.. ほ乳類 脊椎動物 鳥類 自然物 人工物 どのレベルで認識するか? バク イノシシ ライチョウ カメラ

41 49 解決すべき課題 多種類化と認識クラス ( カテゴリー ) の決め方 1000 種類分類はもうすぐ実現.1 万種類も数年先? どうやって, 有用な 1000 種類選ぶか? Caltech-101 は, かなり偏っている. 認識し易い. クラス内変化への対応. 例えば, バイクは, 横や斜め前方から見た場合に対応. 真上, 真下は? 壊れたバイクは? どこまで対応すべきか? 椅子 は難しい. 細分化したサブクラスで認識? どこまでできれば, 実用化できるか? 機械翻訳の例 : 翻訳を前提に文章を書けば使える 認識し易いように撮影すれば, 現時点でも実用化可能?

42 おわり

43 パネル (1): 51 高精度化にむけて何をすべきか 101, 256 種類分類 : 約 90%, 約 60% を達成 画像全体を分類する場合は, 既にかなりできている. 画像の部分認識 ( 対象物体の検出 ) はまだまだこれから. 良質な知識 ( 学習画像 + コンテキスト ) を大量に用意 自動 テキスト情報を手がかりに Web から収集. Flickr, Youtube などのタグを利用 手動 一般ユーザにフィードバックしてもらう. Game であつめる (Human computation by CMU Prof. L.Ahn). 複数種類の特徴量の組み合わせ もちろん, 分類アルゴリズムの改良

44 パネル (2): 52 未解決問題 (1) 多種類化と認識カテゴリーの決め方 何種類認識できればいいのか? 1000 種類? 応用次第?? 応用を想定しない一般物体認識システムも実現したい! 人間の高次視覚機能の計算機による実現のためには何種類? 有用な一般認識システムを実現するには, どのように 1000 種類選ぶべきか? クラス内変化への対応. 例えば, バイクは, 横や斜め前方から見た場合に対応. 真上, 真下は? 壊れたバイクは? どこまで対応すべきか? どこまでできれば, 実用化できるか? 機械翻訳の例 : 翻訳を前提に文章を書けば使える. 認識を前提に撮影すれば, そこそこ使えるのでは?

45 パネル (2): 53 未解決問題 コンテキストの利用 共起関係 相対位置関係, 相対スケール,( 重力に対する ) 支持関係 背景と前景の関係 一般動作 イベント認識 動画像 / 静止画像からの動詞の認識 シーン認識, 物体認識との組み合わせ. コンテキストの利用. ライオンが草を食べている. 人間が草を食べている. 草を刈っている.

46 パネル (3): 54 一般物体認識のアプリケーション 画像をテキストへ変換する技術と考えると.. すでにある画像を認識する場合 写真へのキーワード付け, 自動整理アルバム Web 画像検索の精度向上, 言葉による画像検索 認識を前提に撮影する場合 撮影条件がよければ, かなり認識可能なので, 現時点の技術で, アイデア次第で実用化可能!? カメラ付き携帯による画像による情報入力 画像で調べる Web 検索, 百科事典 /wikipedia 検索 自動ブログ / 日記生成,

47 パネル おわり

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta 1 1 1 1 2 1. Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Takayuki Okatani 1 and Koichiro Deguchi 1 This paper presents a method for recognizing the pose of a wire harness

More information

bag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84

bag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84 Bag-of-Keypoints Web G.Csurka bag-of-keypoints Web Bag-of-keypoints SVM 5.% Web Image Classification with Bag-of-Keypoints Taichi joutou and Keiji yanai Recently, need for generic image recognition is

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] : THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.,, 182-8585 1-5-1 E-mail: {maruya-t,akiyama-m}@mm.inf.uec.ac.jp, yanai@cs.uec.ac.jp SURF Bag-of-Features

More information

(b) BoF codeword codeword BoF (c) BoF Fergus Weber [11] Weber [12] Weber Fergus BoF (b) Fergus [13] Fergus 2. Fergus 2. 1 Fergus [3]

(b) BoF codeword codeword BoF (c) BoF Fergus Weber [11] Weber [12] Weber Fergus BoF (b) Fergus [13] Fergus 2. Fergus 2. 1 Fergus [3] * A Multimodal Constellation Model for Generic Object Recognition Yasunori KAMIYA, Tomokazu TAKAHASHI,IchiroIDE, and Hiroshi MURASE Bag of Features (BoF) BoF EM 1. [1] Part-based Graduate School of Information

More information

Microsoft PowerPoint - SSII_harada pptx

Microsoft PowerPoint - SSII_harada pptx The state of the world The gathered data The processed data w d r I( W; D) I( W; R) The data processing theorem states that data processing can only destroy information. David J.C. MacKay. Information

More information

Mining Regional Representative Photos from a Large-scale Geotagged Image Database

Mining Regional Representative Photos from a Large-scale Geotagged Image Database Web 上のジオタグ画像を用いた 世界各地の文化的差異の発見 2009 年度人工知能学会全国大会 2009 年 6 月高松 柳井啓司 電気通信大学情報工学科 研究の背景 Web には, ラーメンがいっぱい やっぱり, どこのラーメンか知りたい! アウトライン 研究の背景 目的 関連研究 方法 実験結果 まとめと今後の課題 背景 : 大量のジオタグ画像の登場 近年, 位置情報付き画像 (geo-tagged

More information

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa 3,a) 3 3 ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransac. DB [] [2] 3 DB Web Web DB Web NTT NTT Media Intelligence Laboratories, - Hikarinooka Yokosuka-Shi, Kanagawa 239-0847 Japan a) yabushita.hiroko@lab.ntt.co.jp

More information

(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te

(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te (MIRU2009) 2009 7 182 8585 1 5 1 E-mail: noguchi-a@mm.cs.uec.ac.jp, yanai@cs.uec.ac.jp cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-temporal Local Features Considering Consecutiveness of

More information

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

(MIRU2008) HOG Histograms of Oriented Gradients (HOG) (MIRU2008) 2008 7 HOG - - E-mail: katsu0920@me.cs.scitec.kobe-u.ac.jp, {takigu,ariki}@kobe-u.ac.jp Histograms of Oriented Gradients (HOG) HOG Shape Contexts HOG 5.5 Histograms of Oriented Gradients D Human

More information

LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R

LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R DEIM Forum 24 F5-4 Local Binary Pattern 6 84 E-mail: {tera,kida}@ist.hokudai.ac.jp Local Binary Pattern (LBP) LBP 3 3 LBP 5 5 5 LBP improved LBP uniform LBP.. Local Binary Pattern, Gradient Local Auto-Correlations,,,,

More information

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A 1 1 TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM Analysis of video data recognition using multi-frame Kazuya Hidume 1 and Keiji Yanai 1 In this study, we aim to

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

untitled

untitled DEIM Forum 2019 B3-3 305 8573 1-1-1 305 8573 1-1-1 ( ) 151-0053 1-3-15 6F word2vec, An Interface for Browsing Topics of Know-How Sites Shuto KAWABATA, Ohkawa YOUHEI,WenbinNIU,ChenZHAO, Takehito UTSURO,and

More information

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3) (MIRU2012) 2012 8 820-8502 680-4 E-mail: {d kouno,shimada,endo}@pluto.ai.kyutech.ac.jp (1) (2) (3) (4) 4 AdaBoost 1. Kanade [6] CLAFIC [12] EigenFace [10] 1 1 2 1 [7] 3 2 2 (1) (2) (3) (4) 4 4 AdaBoost

More information

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出 Web 動画 画像を用いた 特定動作ショットの自動収集 DO HANG NGA 樋爪和也柳井啓司 電気通信大学情報工学科 背景 既存の動画学習手法制限のある動画像 (e.g. KTH, Caltech) 教師なし学習手法 Web 上の動画 教師信号あり 動画量が少ない 研究の目的 特定動作についての Web データを使用して その動作の対応ショットを自動抽出 大量の Web 動画 ランキング 学習の必要なし

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

main.dvi

main.dvi DEIM Forum 2012 E2-4 1 2 2 2 3 4 5 6 7 1 305-8573 1-1-1 2 305-8573 1-1-1 3 305-8573 1-1-1 4 ( ) 141-0031 8-3-6 5 060-0808 8 5 6 101-8430 2-1-2 7 135-0064. 2-3-26 113-0033 7-3-1 305-8550 1-2 Analyzing Correlation

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search 599 8531 1 1 E-mail: {sakata,matozaki}@m.cs.osakafu-u.ac.jp, {kise,masa}@cs.osakafu-u.ac.jp

More information

(MIRU2010) Geometric Context Randomized Trees Geometric Context Rand

(MIRU2010) Geometric Context Randomized Trees Geometric Context Rand (MIRU2010) 2010 7 Geometric Context Randomized Trees 487-8501 1200 E-mail: {fukuta,ky}@vision.cs.chubu.ac.jp, hf@cs.chubu.ac.jp Geometric Context Randomized Trees 10 3, Geometric Context, Abstract Image

More information

A Survey on Image Recognition Using Geo-tag Information

A Survey on Image Recognition Using Geo-tag Information Geo A Survey on Image Recognition Using Geo-tag Information 1 48106417 Abstract Geo-tag is a type of metadata of various media such as photographs, videos, websites and more other media. In the case of

More information

Automatic Collection of Web Video Shots Corresponding to Specific Actions using Web Images

Automatic Collection of Web Video Shots Corresponding to Specific Actions  using Web Images 視覚特徴およびタグ共起を用いた 大規模 Web ビデオショットランキング 電気通信大学大学院情報理工学研究科 総合情報学専攻 Do Hang Nga 柳井啓司 背景 Web 動画 : 無限に存在 無料で取得可能 - YouTube, Daily Motion etc. Web 動画による動作データ収集 ただし Web 上の動画はノイズが多い 関連動画 Play trumpet 非関連動画 非対応ショット

More information

Microsoft PowerPoint - cvim_harada pptx

Microsoft PowerPoint - cvim_harada pptx 1 2 Flickr reaches 6 billion photos on 1 Aug, 2011. http://www.flickr.com/photos/eon60/6000000000/ 3 4 http://www.dpchallenge.com/image.php?image_id=997702 5 6 http://www.image-net.org/challenges/lsvrc/2011/pascal_ilsvrc_2011.pptx

More information

1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means

1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means Web, Web k-means 62% Associating Faces and Names in Web Photo News Akio Kitahara and Keiji Yanai We propose a system which extracts faces and person names from news articles with photographs on the Web

More information

IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 2 Hough Forest Hough Forest[6] Random Forest( [5]) Random Forest Hough Forest Hough Forest 2.1 Hough Forest 1 2.2

IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 2 Hough Forest Hough Forest[6] Random Forest( [5]) Random Forest Hough Forest Hough Forest 2.1 Hough Forest 1 2.2 IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 MI-Hough Forest () E-mail: ym@vision.cs.chubu.ac.jphf@cs.chubu.ac.jp Abstract Hough Forest Random Forest MI-Hough Forest Multiple Instance Learning Bag Hough Forest

More information

[1] SBS [2] SBS Random Forests[3] Random Forests ii

[1] SBS [2] SBS Random Forests[3] Random Forests ii Random Forests 2013 3 A Graduation Thesis of College of Engineering, Chubu University Proposal of an efficient feature selection using the contribution rate of Random Forests Katsuya Shimazaki [1] SBS

More information

本文6(599) (Page 601)

本文6(599) (Page 601) (MIRU2008) 2008 7 525 8577 1 1 1 E-mail: matsuzaki@i.ci.ritsumei.ac.jp, shimada@ci.ritsumei.ac.jp Object Recognition by Observing Grasping Scene from Image Sequence Hironori KASAHARA, Jun MATSUZAKI, Nobutaka

More information

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-CVIM-186 No /3/15 EMD 1,a) SIFT. SIFT Bag-of-keypoints. SIFT SIFT.. Earth Mover s Distance

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-CVIM-186 No /3/15 EMD 1,a) SIFT. SIFT Bag-of-keypoints. SIFT SIFT.. Earth Mover s Distance EMD 1,a) 1 1 1 SIFT. SIFT Bag-of-keypoints. SIFT SIFT.. Earth Mover s Distance (EMD), Bag-of-keypoints,. Bag-of-keypoints, SIFT, EMD, A method of similar image retrieval system using EMD and SIFT Hoshiga

More information

Microsoft Word - deim論文2.docx

Microsoft Word - deim論文2.docx DEIM Forum 2012 B11-4 静止画内オブジェクトへの指示による動画検索手法の提案 川手裕太,* 岡部誠 尾内理紀夫 平野廣美 三條正裕 電気通信大学 182-8585 東京都調布市調布ヶ丘 1-5-1 楽天株式会社楽天技術研究所 140-0002 東京都品川区東品川 4-13-9 * 科学技術振興機構さきがけ E-mail: kawate@onailab.com, m.o@acm.org,

More information

untitled

untitled DEIM Forum 2019 C1-2 305-8573 1-1-1 305-8573 1-1-1 () 151-0053 1-3-15 6F QA,,,, Detecting and Analysing Chinese Web Sites for Collecting Know-How Knowledge Wenbin NIU, Yohei OHKAWA,ShutoKAWABATA,ChenZHAO,TianNIE,

More information

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii 2012 3 A Graduation Thesis of College of Engineering, Chubu University High Accurate Semantic Segmentation Using Re-labeling Besed on Color Self Similarity Yuko KAKIMI 2400 90% 2 3 [1] Semantic Texton

More information

トピックモデルの応用: 関係データ、ネットワークデータ

トピックモデルの応用: 関係データ、ネットワークデータ NTT コミュニケーション科学基礎研究所 石黒勝彦 2013/01/15-16 統計数理研究所会議室 1 1 画像認識系から尐し遅れますが 最近では音声 音響データに対してもトピックモデルが利用されるようになっています 2 1. どの特徴量を利用するか? 2. 時系列性をどう扱うか? 3 どの特徴量を利用して どうやって BoW 形式に変換するかを検討する必要があります MFCC: 音声認識などで広い範囲で利用される

More information

IPSJ SIG Technical Report Vol.2012-CVIM-180 No /1/20 RGB-D 1 1, 2 1 RGB-D Interactive Object Recognition for Service Robot using an RGB-D Camer

IPSJ SIG Technical Report Vol.2012-CVIM-180 No /1/20 RGB-D 1 1, 2 1 RGB-D Interactive Object Recognition for Service Robot using an RGB-D Camer RGB-D 1 1, 2 1 RGB-D Interactive Object Recognition for Service Robot using an RGB-D Camera Hisato Fukuda, 1 Yoshinori Kobayashi 1, 2 and Yoshinori Kuno 1 Service robots need to be able to recognize objects

More information

Duplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF

Duplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF Partial Copy Detection of Line Drawings from a Large-Scale Database Weihan Sun, Koichi Kise Graduate School of Engineering, Osaka Prefecture University E-mail: sunweihan@m.cs.osakafu-u.ac.jp, kise@cs.osakafu-u.ac.jp

More information

(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i

(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i 24 Region-Based Image Retrieval using Color Histogram Feature 1130340 2013 3 1 (VKIR) VKIR VKIR DCT (R) (G) (B) 64 64 Ward 20 1 20 1 20. 5 10 2 DCT i Abstract Region-Based Image Retrieval using Color Histogram

More information

2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni

2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni DEIM Forum 2012 B5-3 606 8510 E-mail: {zhao,ohshima,tanaka}@dl.kuis.kyoto-u.ac.jp Web, 1. Web Web TinEye 1 Google 1 http://www.tineye.com/ 1 2. 3. 4. 5. 6. 2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient

More information

main.dvi

main.dvi DEIM Forum 2018 J7-3 305-8573 1-1-1 305-8573 1-1-1 305-8573 1-1-1 () 151-0053 1-3-15 6F URL SVM Identifying Know-How Sites basedonatopicmodelandclassifierlearning Jiaqi LI,ChenZHAO, Youchao LIN, Ding YI,ShutoKAWABATA,

More information

yoo_graduation_thesis.dvi

yoo_graduation_thesis.dvi 200 3 A Graduation Thesis of College of Engineering, Chubu University Keypoint Matching of Range Data from Features of Shape and Appearance Yohsuke Murai 1 1 2 2.5D 3 2.1 : : : : : : : : : : : : : : :

More information

IPSJ SIG Technical Report Vol.2013-CVIM-187 No /5/30 1,a) 1,b), 1,,,,,,, (DNN),,,, 2 (CNN),, 1.,,,,,,,,,,,,,,,,,, [1], [6], [7], [12], [13]., [

IPSJ SIG Technical Report Vol.2013-CVIM-187 No /5/30 1,a) 1,b), 1,,,,,,, (DNN),,,, 2 (CNN),, 1.,,,,,,,,,,,,,,,,,, [1], [6], [7], [12], [13]., [ ,a),b),,,,,,,, (DNN),,,, (CNN),,.,,,,,,,,,,,,,,,,,, [], [6], [7], [], [3]., [8], [0], [7],,,, Tohoku University a) omokawa@vision.is.tohoku.ac.jp b) okatani@vision.is.tohoku.ac.jp, [3],, (DNN), DNN, [3],

More information

色の類似性に基づいた形状特徴量CS-HOGの提案

色の類似性に基づいた形状特徴量CS-HOGの提案 IS3-04 第 18 回 画 像 センシングシンポジウム, 横 浜, 2012 年 6 月 CS-HOG CS-HOG : Color Similarity-based HOG feature Yuhi Goto, Yuji Yamauchi, Hironobu Fujiyoshi Chubu University E-mail: yuhi@vision.cs.chubu.ac.jp Abstract

More information

DEIM Forum 2012 E Web Extracting Modification of Objec

DEIM Forum 2012 E Web Extracting Modification of Objec DEIM Forum 2012 E4-2 670 0092 1 1 12 E-mail: nd11g028@stshse.u-hyogo.ac.jp, {dkitayama,sumiya}@shse.u-hyogo.ac.jp Web Extracting Modification of Objects for Supporting Map Browsing Junki MATSUO, Daisuke

More information

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において

More information

画像認識性能を改善する高精度な特徴量抽出手法の検討 A Study on Feature-Extraction Methods for Improvement of Image-Recognition Performance 井上俊明 Toshiaki Inoue 要旨 各種のカメラ搭載機器の急速な

画像認識性能を改善する高精度な特徴量抽出手法の検討 A Study on Feature-Extraction Methods for Improvement of Image-Recognition Performance 井上俊明 Toshiaki Inoue 要旨 各種のカメラ搭載機器の急速な 画像認識性能を改善する高精度な特徴量抽出手法の検討 A Study on Feature-Extraction Methods for Improvement of Image-Recognition Performance 井上俊明 Toshiaki Inoue 要旨 各種のカメラ搭載機器の急速な普及に伴い, 撮影 蓄積された画像を有効に活用する 画像認識技術への期待が高まっている 特に近年, 画像中のさまざまな物体を認識する,

More information

12_39.dvi

12_39.dvi Vol. 52 No. 12 3588 3592 (Dec. 2011) Web 1, 1 1 2 1 1 1 Web GPS Creation of a Sight-seeing Map with Visual Classification of Photos on the Web Jiani Wang, 1, 1 Masafumi Noda, 1 Tomokazu Takahashi, 2 Daisuke

More information

1. はじめに 2

1. はじめに 2 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1 1. はじめに 2 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 /

More information

SICE東北支部研究集会資料(2013年)

SICE東北支部研究集会資料(2013年) 280 (2013.5.29) 280-4 SURF A Study of SURF Algorithm using Edge Image and Color Information Yoshihiro Sasaki, Syunichi Konno, Yoshitaka Tsunekawa * *Iwate University : SURF (Speeded Up Robust Features)

More information

スライド 1

スライド 1 本資料について 本資料は下記論文を基にして作成されたものです. 文書の内容の正確さは保障できないため, 正確な知識を求める方は原文を参照してください. 著者 : 伊藤誠吾吉田廣志河口信夫 論文名 : 無線 LANを用いた広域位置情報システム構築に関する検討 出展 : 情報処理学会論文誌 Vol.47 No.42 発表日 :2005 年 12 月 著者 : 伊藤誠悟河口信夫 論文名 : アクセスポイントの選択を考慮したベイズ推定による無線

More information

(a) (b) 2 2 (Bosch, IR Illuminator 850 nm, UFLED30-8BD) ( 7[m] 6[m]) 3 (PointGrey Research Inc.Grasshopper2 M/C) Hz (a) (b

(a) (b) 2 2 (Bosch, IR Illuminator 850 nm, UFLED30-8BD) ( 7[m] 6[m]) 3 (PointGrey Research Inc.Grasshopper2 M/C) Hz (a) (b (MIRU202) 202 8 AdrianStoica 89 0395 744 89 0395 744 Jet Propulsion Laboratory 4800 Oak Grove Drive, Pasadena, CA 909, USA E-mail: uchino@irvs.ait.kyushu-u.ac.jp, {yumi,kurazume}@ait.kyushu-u.ac.jp 2 nearest

More information

IPSJ SIG Technical Report Vol.2015-SE-187 No /3/12 1,a) 1,b) Mozilla Firefox Eclipse Platform GNU Gcc % 43% 1. [1] Eclipse Mozilla 4 [3

IPSJ SIG Technical Report Vol.2015-SE-187 No /3/12 1,a) 1,b) Mozilla Firefox Eclipse Platform GNU Gcc % 43% 1. [1] Eclipse Mozilla 4 [3 1,a) 1,b) Mozilla Firefox Eclipse Platform GNU Gcc 2. 12 36% 43% 1. [1] Eclipse Mozilla 4 [3] [1, 3, 7] 1 Wakayama Uniersity a) s141015@sys.wakayama-u.ac.jp b) masao@sys.wakayama-u.ac.jp [6] 2. OSS [1,3,7]

More information

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3. 2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3. プロジェクト管理組織 株式会社オープンテクノロジーズ 4. 委託金支払額 3,000,000 円 5.

More information

スライド 1

スライド 1 NTT Information Sharing Platform Laboratories NTT 情報流通プラットフォーム研究所 セマンティック Web 技術を用いた社内情報の連携 森田大翼 飯塚京士 ( 日本電信電話株式会社 NTT 情報流通プラットフォーム研究所 ) セマンティック Web コンファレンス 2012 2012 年 3 月 8 日 ( 木 ) 2012 NTT Information

More information

IPSJ SIG Technical Report Vol.2010-CVIM-171 No /3/19 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) % MKL 68.8% Extractin

IPSJ SIG Technical Report Vol.2010-CVIM-171 No /3/19 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) % MKL 68.8% Extractin 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) 200 57.2% MKL 68.8% Extracting Spatio-Temporal Local Features for Classifying Web Video Shots Akitsugu Noguchi 1 and Keiji Yanai 1 Nowadays,

More information

IT,, i

IT,, i 22 Retrieval support system using bookmarks that are shared in an organization 1110250 2011 3 17 IT,, i Abstract Retrieval support system using bookmarks that are shared in an organization Yoshihiko Komaki

More information

35_3_9.dvi

35_3_9.dvi 180 Vol. 35 No. 3, pp.180 185, 2017 Image Recognition by Deep Learning Hironobu Fujiyoshi and Takayoshi Yamashita Chubu University 1. 1990 2000 Scale-Invariant Feature Transform SIFT Histogram of Oriented

More information

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx シーケンスに基づく検索モデルの検索精度について 東京工芸大学工学部コンピュータ応用学科宇田川佳久 (1/3) (2/3) 要員数 情報システム開発のイメージソースコード検索機能 他人が作ったプログラムを保守する必要がある 実務面での応用 1 バグあるいは脆弱なコードを探す ( 品質の高いシステムを開発する ) 2 プログラム理解を支援する ( 第 3 者が書いたコードを保守する ) 要件定義外部設計内部設計

More information

Coding theorems for correlated sources with cooperative information

Coding theorems for correlated sources with cooperative information グラフコストの逐次更新を用いた映像顕著領域の自動抽出 2009 年 5 月 28 日 福地賢宮里洸司 (2) 木村昭悟 (1) 高木茂 (2) 大和淳司 (1) (1) 日本電信電話 ( 株 )NTT) コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ (2) 国立沖縄工業高等専門学校情報通信システム工学科 背景 ヒトはどのようにして もの を認識する能力を獲得するのか?

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. Wang Jiani {jwang,mnod

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. Wang Jiani {jwang,mnod THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. Wang Jiani 464 8601 500 8288 1 38 E-mail: {jwang,mnoda}@murase.m.is.nagoya-u.ac.jp, {ddeguchi,ide,murase}@is.nagoya-u.ac.jp

More information

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生 0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生まれ, コンピューテーショナルフォトグラフィ ( 計算フォトグラフィ ) と呼ばれている.3 次元画像認識技術の計算フォトグラフィへの応用として,

More information

untitled

untitled DEIM Forum 2019 I2-4 305-8573 1-1-1 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0053 1-3-15 6F 101-8430 2-1-2 CNN LSTM,,,, Measuring Beginner Friendliness / Visiual Intelligibility of Web Pages explaining Academic

More information

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1 ACL2013 TACL 1 ACL2013 Grounded Language Learning from Video Described with Sentences (Yu and Siskind 2013) TACL Transactions of the Association for Computational Linguistics What Makes Writing Great?

More information

main.dvi

main.dvi DEIM Forum 2017 D3-4 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0053 1-3-15 6F 101-8430 2-1-2 This paper presents techniques of retrieving know-how sites from the collection of Web pages. The proposed techniques

More information

Microsoft PowerPoint - presen

Microsoft PowerPoint - presen 解析支援ネット OKAYAMA 画像解析に関する技術講演会 2008.03.28 車上からの道路標識の認識 岡山県立大学情報工学部スポーツシステム工学科山内仁 はじめに 高度道路交通システム (ITS) VICS ETC etc. 走行支援道路システム (AHS) 車載カメラによる環境認識 (AHS-i) 道路標識の認識 認知に関わる事故の防止 2 車両運行に関わる標識 標識情報の取得手段 : 車載カメラ

More information

Microsoft PowerPoint - sm13_lect03_ all.pptx

Microsoft PowerPoint - sm13_lect03_ all.pptx SIFT 特徴 : 顕著点による局所特徴量 意味的マルチメディア処理第 A2 回 (2013 年 10 月 15 日 ) ー視覚メディアの分析, 分類, 比較, 検索 ( 第 1 回 ) ー 教員 : 大渕竜太郎 2013/10/28 意味的マルチメディア処理特論 ( 視覚メディア ) 1 Scale Invariant Feature Transform (SIFT) David Loweによる

More information

コンピュータ応用・演習 情報処理システム

コンピュータ応用・演習 情報処理システム 2010 年 12 月 15 日 データエンジニアリング 演習 情報処理システム データマイニング ~ データからの自動知識獲得手法 ~ 1. 演習の目的 (1) 多種多様な膨大な量のデータを解析し, 企業の経営活動などに活用することが望まれている. 大規模データベースを有効に活用する, データマイニング技術の研究が脚光を浴びている 1 1. 演習の目的 (2) POS データを用いて顧客の購買パターンを分析する.

More information

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable), .... Deeping and Expansion of Large-Scale Random Fields and Probabilistic Image Processing Kazuyuki Tanaka The mathematical frameworks of probabilistic image processing are formulated by means of Markov

More information

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1]  PLUM [2] LifelogViewer 3 1 Apple iphoto,   2 Goo DEIM Forum 2012 D9-4 606 8501 E-mail: {sasage,tsukuda,nakamura,tanaka}@dl.kuis.kyoto-u.ac.jp,,,, 1. 2000 1 20 10 GPS A A A A A A A 2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] Email PLUM

More information

2 1 Liang [2] Liang Zhai [3] Zhai [4] MPEG 1 [5] [6] Goromi-TV Goromi-TV [1] Kelm [7] Kelm Wikipedia GeoNames Crandall [8] Quack [9] Quack Qua

2 1 Liang [2] Liang Zhai [3] Zhai [4] MPEG 1 [5] [6] Goromi-TV Goromi-TV [1] Kelm [7] Kelm Wikipedia GeoNames Crandall [8] Quack [9] Quack Qua DEIM Forum 2012 B5-1 テレビ番組からの位置情報付き旅行映像データベースの自動構築 向井 康貴 柳井 啓司 電気通信大学 電気通信学部 情報工学科 182 8585 東京都調布市調布ヶ丘 1-5-1 E-mail: mukai-y@mmcsuecacjp, yanai@csuecacjp あらまし 本研究では 録画したテレビ番組の内容に関連した場所を推定し 地図上に配置することにより録画した

More information

ビジュアル情報処理

ビジュアル情報処理 コンピュータビジョン特論 Advanced Computer Vision 第 5 回 最適なエッジ検出器 良いエッジ検出器とは Good Detection: ノイズに強い Good Localization: 真のエッジの所を検出 ingle Response: 各点に一本のエッジを検出 Cann Edge Detection Tutorial http://www.pages.dreel.edu/~weg/can_tut.html

More information

円筒面で利用可能なARマーカ

円筒面で利用可能なARマーカ 円筒面で利用可能な AR マーカ AR Marker for Cylindrical Surface 2014 年 11 月 14 日 ( 金 ) 眞鍋佳嗣千葉大学大学院融合科学研究科 マーカベース AR 二次元マーカはカメラ姿勢の推定, 拡張現実等広い研究分野で利用されている 現実の風景 表示される画像 デジタル情報を付加 カメラで撮影し, ディスプレイに表示 使用方法の単純性, 認識の安定性からマーカベース

More information

IPSJ SIG Technical Report Vol.2016-CSEC-75 No /12/1 3DCG CAPTCHA 1,a) (3D) 3DCG CAPTCHA CAPTCHA 3 3D CAPTCHA CAPTCHA 1 CAPTCHA 3 1. Web CA

IPSJ SIG Technical Report Vol.2016-CSEC-75 No /12/1 3DCG CAPTCHA 1,a) (3D) 3DCG CAPTCHA CAPTCHA 3 3D CAPTCHA CAPTCHA 1 CAPTCHA 3 1. Web CA 3DCG CAPTCHA,a) 2 2 3 (3D) 3DCG CAPTCHA CAPTCHA 3 3D CAPTCHA CAPTCHA CAPTCHA 3. Web CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart) CAPTCHA OCR(Optical Character Recognition)

More information

Microsoft PowerPoint - LD1_iwata.ppt

Microsoft PowerPoint - LD1_iwata.ppt 潜在トピックモデルに基づく データマイニング NTT コミュニケーション科学基礎研究所 岩田具治 1 トピックモデルとは 文書が生成される過程を確率的に表現したモデル 様々な離散データで有効性が確認 文書 購買 ネットワーク 画像 音楽 幅広い応用範囲 情報検索 可視化 画像認識 推薦システム 音声認識 拡張が容易 実装が簡単 2 トピック抽出 入力 : 文書集合 D. Blei, A. Ng, M.

More information

WII-D 2017 (1) (2) (1) (2) [Tanaka 07] [ 04] [ 10] [ 13, 13], [ 08] [ 13] (1) (2) 2 2 e.g., Wikipedia [ 14] Wikipedia [ 14] Linked Open

WII-D 2017 (1) (2) (1) (2) [Tanaka 07] [ 04] [ 10] [ 13, 13], [ 08] [ 13] (1) (2) 2 2 e.g., Wikipedia [ 14] Wikipedia [ 14] Linked Open Web 2017 Original Paper Supporting Exploratory Information Access Based on Comic Content Information 1 Ryo Yamashita Byeongseon Park Mitsunori Matsushita Nomura Research Institute, LTD. r-yamashita@nri.co.jp

More information

main.dvi

main.dvi DEIM Forum 2015 A1-4 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0051 5-13-18 101-8430 2-1-2,,,, A Complementary Framework for Collecting Know-How Knowledge based on Question-Answer Examples and Search Engine

More information

thesis.dvi

thesis.dvi 2007 Graph Cuts Graph Cuts Graph Cuts Graph Cuts t-link Interactive Graph Cuts 4.7% Mean Shift Segmentation 1 1 2 3 2.1.................... 3 2.1.1............................. 3 2.2...........................

More information

スライド 1

スライド 1 CNN を用いた弱教師学習による画像領域分割 下田和, 柳井啓司 電気通信大学 大学院情報理工学 研究科 総合情報学専攻 c 2015 UEC Tokyo. Convolutional Neural Network CNN クラス分類タスクにおいてトップの精度 CNN の応用 ( 物体位置の認識 ) 物体検出 物体に BB を付与 領域分割 ピクセル単位の認識 CNN を用いた領域分割 CNN による完全教師ありのセグメンテーション

More information

48_16_1.dvi

48_16_1.dvi Vol. 48 No. SIG 16(CVIM 19) Nov. 2007 1 1 101 6 The Current State and Future Directions on Generic Object Recognition Keiji Yanai Generic object recognition aims at enabling a computer to recognize objects

More information

IPSJ SIG Technical Report Vol.2012-EC-23 No /3/ Video Retrieval System of Handwriting Sketch using Relevance Feedback Akihiro Aita 1 and M

IPSJ SIG Technical Report Vol.2012-EC-23 No /3/ Video Retrieval System of Handwriting Sketch using Relevance Feedback Akihiro Aita 1 and M 1 2 Video Retrieval System of Handwriting Sketch using Relevance Feedback Akihiro Aita 1 and Masashi Toda 2 It is difficult to represent video scenes using keywords. Therefore, in video retrieval, it is

More information

平成 28 年 6 月 3 日 報道機関各位 東京工業大学広報センター長 岡田 清 カラー画像と近赤外線画像を同時に撮影可能なイメージングシステムを開発 - 次世代画像センシングに向けオリンパスと共同開発 - 要点 可視光と近赤外光を同時に撮像可能な撮像素子の開発 撮像データをリアルタイムで処理する

平成 28 年 6 月 3 日 報道機関各位 東京工業大学広報センター長 岡田 清 カラー画像と近赤外線画像を同時に撮影可能なイメージングシステムを開発 - 次世代画像センシングに向けオリンパスと共同開発 - 要点 可視光と近赤外光を同時に撮像可能な撮像素子の開発 撮像データをリアルタイムで処理する 平成 28 年 6 月 3 日 報道機関各位 東京工業大学広報センター長 岡田 清 カラー画像と近赤外線画像を同時に撮影可能なイメージングシステムを開発 - 次世代画像センシングに向けオリンパスと共同開発 - 要点 可視光と近赤外光を同時に撮像可能な撮像素子の開発 撮像データをリアルタイムで処理する画像処理システムの開発 カラー画像と近赤外線画像を同時に撮影可能なプロトタイプシステムの開発 概要 国立大学法人東京工業大学工学院システム制御系の奥富正敏教授らと

More information

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q x-means 1 2 2 x-means, x-means k-means Bayesian Information Criterion BIC Watershed x-means Moving Object Extraction Using the Number of Clusters Determined by X-means Clustering Naoki Kubo, 1 Kousuke

More information

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. fnirs Kai Kunze 599 8531 1 1 223 8526 4 1 1 E-mail: yoshimura@m.cs.osakafu-u.ac.jp, kai@kmd.keio.ac.jp,

More information

画像処理工学

画像処理工学 画像処理工学 画像の空間周波数解析とテクスチャ特徴 フーリエ変換の基本概念 信号波形のフーリエ変換 信号波形を周波数の異なる三角関数 ( 正弦波など ) に分解する 逆に, 周波数の異なる三角関数を重ねあわせることにより, 任意の信号波形を合成できる 正弦波の重ね合わせによる矩形波の表現 フーリエ変換の基本概念 フーリエ変換 次元信号 f (t) のフーリエ変換 変換 ( ω) ( ) ωt F f

More information

IPSJ SIG Technical Report Vol.2017-CVIM-205 No /1/ Content-based Image Retrieval(CBIR) CBIR RANSAC (Local feature hashing) 1000 A geo

IPSJ SIG Technical Report Vol.2017-CVIM-205 No /1/ Content-based Image Retrieval(CBIR) CBIR RANSAC (Local feature hashing) 1000 A geo - - Content-based Image Retrieval(CBIR) CBIR RANSAC (Local feature hashing) A geometric consistency checking method for keypoint matching -Application to image retrieval- Okura Yuto Wada Toshikazu Abstract:

More information

2 4 2 3 4 3 [12] 2 3 4 5 1 1 [5, 6, 7] [5, 6] [7] 1 [8] 1 1 [9] 1 [10, 11] [10] [11] 1 [13, 14] [13] [14] [13, 14] [10, 11, 13, 14] 1 [12]

2 4 2 3 4 3 [12] 2 3 4 5 1 1 [5, 6, 7] [5, 6] [7] 1 [8] 1 1 [9] 1 [10, 11] [10] [11] 1 [13, 14] [13] [14] [13, 14] [10, 11, 13, 14] 1 [12] Walking Person Recognition by Matching Video Fragments Masashi Nishiyama, Mayumi Yuasa, Tomokazu Wakasugi, Tomoyuki Shibata, Osamu Yamaguchi ( ), Corporate Research and Development Center, TOSHIBA Corporation

More information

特別寄稿.indd

特別寄稿.indd 特別寄稿 ソフトインフラとしてのデジタル地図を活用した自動運転システム Autonomous vehicle using digital map as a soft infrastructure 菅沼直樹 Naoki SUGANUMA 1. はじめに 1) 2008 2012 ITS 2) CO 2 3) 4) Door to door Door to door Door to door DARPA(

More information

main.dvi

main.dvi DEIM Forum 2015 D3-1 305-8573 1-1-1 305-8573 1-1-1 ( ) 151-0051 5-13-18 101-8430 2-1-2.com,,,, Market Share Estimation based on Statistics of Search Engine Suggests Takakazu IMADA,IchiroMORIYA, Yusuke

More information

_314I01BM浅谷2.indd

_314I01BM浅谷2.indd 587 ネットワークの表現学習 1 1 1 1 Deep Learning [1] Google [2] Deep Learning [3] [4] 2014 Deepwalk [5] 1 2 [6] [7] [8] 1 2 1 word2vec[9] word2vec 1 http://www.ai-gakkai.or.jp/my-bookmark_vol31-no4 588 31 4 2016

More information

和文タイトル

和文タイトル Twitter A Proposal of a Topic Transition Analysis System for Tweets 1 1 1 Center for Information and Communication Technology, Hitotsubashi University Abstract: In this paper, we propose an interactive

More information

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4 Image-based Modeling 1 1 Object Extraction Method for Image-based Modeling using Projection Transformation of Multi-viewpoint Images Masanori Ibaraki 1 and Yuji Sakamoto 1 The volume intersection method

More information

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu 集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed multinomial probit models, Transportation Research Part

More information

Convolutional Neural Network A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolution

Convolutional Neural Network A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolution Convolutional Neural Network 2014 3 A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolutional Neural Network Fukui Hiroshi 1940 1980 [1] 90 3

More information

IPSJ SIG Technical Report iphone iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Proc

IPSJ SIG Technical Report iphone iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Proc iphone 1 1 1 iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Processing Unit)., AR Realtime Natural Feature Tracking Library for iphone Makoto

More information

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株 二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株式会社 NTT データ数理システム Copyright 2013 NTT DATA Mathematical

More information

Microsoft Word - toyoshima-deim2011.doc

Microsoft Word - toyoshima-deim2011.doc DEIM Forum 2011 E9-4 252-0882 5322 252-0882 5322 E-mail: t09651yt, sashiori, kiyoki @sfc.keio.ac.jp CBIR A Meaning Recognition System for Sign-Logo by Color-Shape-Based Similarity Computations for Images

More information

Twitter Twitter [5] ANPI NLP 5 [6] Lee [7] Lee [8] Twitter Flickr FreeWiFi FreeWiFi Flickr FreeWiFi 2. 2 Mikolov [9] [10] word2vec word2vec word2vec k

Twitter Twitter [5] ANPI NLP 5 [6] Lee [7] Lee [8] Twitter Flickr FreeWiFi FreeWiFi Flickr FreeWiFi 2. 2 Mikolov [9] [10] word2vec word2vec word2vec k DEIM Forum 2018 H1-3 700-8530 3-1-1 E-mail: {nakagawa, niitsuma, ohta}@de.cs.okayama-u.ac.jp Twitter 3 Wikipedia Weblio Yahoo! Paragraph Vector NN NN 1. doc2vec SNS 9 [1] SNS [2] Twitter 1 4 4 Wikipedia

More information

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor 独立行政法人情報通信研究機構 KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the information analysis system WISDOM as a research result of the second medium-term plan. WISDOM has functions that

More information

スライド 1

スライド 1 知能制御システム学 画像追跡 (1) 特徴点の検出と追跡 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2008.07.07 今日の内容 前回までの基本的な画像処理の例を踏まえて, ビジュアルサーボシステムの構成要素となる画像追跡の代表的手法を概説する 画像上の ある点 の追跡 オプティカルフローの拘束式 追跡しやすい点 (Harris オペレータ ) Lucas-Kanade

More information

untitled

untitled c ILSVRC LeNet 1. 1 convolutional neural network 1980 Fukushima [1] [2] 80 LeCun (back propagation) LeNet [3, 4] LeNet 2. 2.1 980 8579 6 6 01 okatani@vision.is.tohoku.ac.jp (simple cell) (complex cell)

More information