IS3-04 第 18 回 画 像 センシングシンポジウム, 横 浜, 2012 年 6 月 CS-HOG CS-HOG : Color Similarity-based HOG feature Yuhi Goto, Yuji Yamauchi, Hironobu Fujiyoshi Chubu University E-mail: yuhi@vision.cs.chubu.ac.jp Abstract HOG Color Self-Similarity(CSS) CSS CSS HOG CS-HOG CS-HOG HOG CS-HOG HOG CSS 22.5 27.2% HOG CSS 4.2% 1 Intelligent Transport System(ITS: ) Histograms of Oriented Gradients(HOG) [1] Edge Orientation Histograms(EOH) [2] Edgelet [3] HOG 3 Color Self-Similarity(CSS) [4] CSS Color Similarity-based HOG(CS- HOG) CS-HOG CS-HOG HOG CS-HOG HOG CS-HOG IS3-04-1
1 HOG 2 CSS CS-HOG 2 Dalal HOG HOG Walk CSS CSS CS-HOG HOG CSS 2.1 HOG Histograms of Oriented Gradients(HOG) [1] 1 L(x, y) m θ (1) (3) m(x, y) = L x (x, y) 2 + L y (x, y) 2 (1) { θ(x, y) = tan 1 L y(x, y) L x (x, y) L x (x, y) = L(x + 1, y) L(x 1, y) L y (x, y) = L(x, y + 1) L(x, y 1) (2) (3) θ 0 360 180 180 0 180 m θ (4) c (M M ) v c ={v c (1), v c (2),...v c (N hog )} v c (f(θ)) = m(x, y)δ[θ, f(θ)] (4) x y f(θ) θ N hog δ[ ] 1 0 c (5) c v c (K K ) v c (n) v c (n) = (ϵ = 1) (5) b v c (k) 2 + ϵ k=1 b (K K N hog ) ϵ 0 1 v c v c ={v c (1), v c (2),...v c (b)} 64 128 {(64/M) (K 1)} {(128/M) (K 1)} HOG M = 8 K = 2 N hog = 9 105 2 2 9 105 = 3, 780 2.2 CSS Color Self-Similarity(CSS) [4] 2 IS3-04-2
4 HOG CSS 3 CSS c (M M ) p c ={p c (H, 1), p c (H, 2),..., p c (H, N css ),..., p c (V, N css )} (6) p c HSV {H S V } I c (x, y, H) I c (x, y, S) I c (x, y, V ) p c (r, n) = x=1 y=1 δ[f(i c (x, y, r)), n] (6) r HSV (r=h, S, V ) n (n=1, 2,..., N css ) f(i c (x, y, r)) I c (x, y, r) c i c j p ci,p cj s(c i, c j ) (7) s(c i, c j ) = N css r {H,S,V } n=1 (p ci (r, n) p cj (r, n)) 2 (7) Bhattacharyya [4] 64 128 c (64/M) (128/M) CSS M = 8 128 128C 2 = 8, 128 CSS 3 ( ) CSS CSS 3 CSS ( ) ( ) CSS 2.3 HOG CSS HOG CSS HOG CSS 4 HOG 4 HOG CSS HOG IS3-04-3
5 CS-HOG 6 7 4 CSS CSS HOG CSS CS-HOG 3 : CS-HOG Color Similarity-based HOG(CS-HOG) CS-HOG HOG CS-HOG 5 CS-HOG 3.1 CS-HOG ( ) 6 c (M M ) RGB {R G B } I c (x, y, R) I c (x, y, G) I c (x, y, B) c I (c, r) (8) I (c, r) = 1 M M x y I c (x, y, r) (8) r RGB (r=r, G, B) c I (c, r) I(x, y, r) CSS (9) s (x, y, c ) s (x, y, c ) = (I (c, r) I(x, y, r)) 2 (9) r {R,G,B} s (x, y, c ) c 64 128 c (64/M) (128/M) M = 8 128 ( c IS3-04-4
8 HSV 9 CS-HOG ) 7(a) 1 7(a) CSS c ( 45) c ( 89) 7(b) 2,416 7(b) CS-HOG HSV [4] HSV CSS HSV CS-HOG HSV HSV 8 H( ) S( ) V ( ) RGB HSV HSV {H, S, V } (10) {u, r, V } u = S cos H r = S sin H V = V (10) RGB HSV CS-HOG HSV {u, r, V } 3.2 CS-HOG 9 c HOG c c s (x, y, c ) m θ (11) (13) m (x, y, c ) = s x(x, y, c ) 2 + s y(x, y, c ) 2 (11) { θ (x, y, c ) = tan 1 s x(x, y, c ) s y(x, y, c ) s x(x, y, c ) = s (x + 1, y, c ) s (x 1, y, c ) s y(x, y, c ) = s (x, y + 1, c ) s (x, y, 1, c ) (12) (13) HOG θ 180 θ 180 CS- HOG c 0 360 θ c m θ (14) c (M M ) V c (c )={v c(1, c ), v c(2, c ),...v c(n cshog, c )} v c(f(θ ), c ) = x y m (x, y, c )δ[θ, f(θ )] (14) f(θ ) θ N cshog CS-HOG V c (c ) c 64 128 M = 8 1 c 128 V c (c ) (15) IS3-04-5
11 INRIA Person Dataset 10 HOG CS-HOG c HOG V c (c ) (K K ) v c(n, c v ) = c(n, c ) b v c(k, c ) 2 + ϵ k=1 (ϵ = 1) (15) b (K K N cshog ) V c (c ) V c (c )={v c(1, c ), v c(2, c ),...v c (b, c )} CS- HOG ( (11) (15)) c V c (c ) CS-HOG 64 128 M = 8 K = 2 N cshog = 18 128 c 105 128 2 2 18 105 = 967, 680 HOG HOG CS-HOG HOG CS-HOG HOG CS-HOG 10 10 2 HOG 0 180 ( ) CS-HOG HOG 10 HOG CS-HOG CS-HOG 4 CS-HOG 4.1 INRIA Person Dataset[1] 11 INRIA Person Dataset ( ) ( ) 2,416 13,161 1,126 453 IS3-04-6
第18回画像センシングシンポジウム, 横浜, 2012年6月 図 12 DET カーブ サンプル 評価サンプルは 64 128 ピクセルの大きさ に正規化して使用する 4.2 実験概要 CS-HOG 特徴量の有効性を示すために 以下の局所 特徴量を用いて識別精度を比較する HOG 特徴量 (HOG) CSS 特徴量 (CSS) HOG 特徴量と CSS 特徴量の併用 (HOG+CSS) CS-HOG 特徴量 : RGB 表色系 (CS-HOG : RGB) CS-HOG 特徴量 : HSV 表色系 (CS-HOG : HSV) CS-HOG 特徴量は 色の類似度に RGB 表色系を利用し たものと HSV 表色系を利用したものを用いる HOG 図 13 特徴量と CSS 特徴量の併用は 二つの特徴次元を同 時に使用して識別器を学習したものを示している 各 特徴量のパラメータは セルサイズ M = 8 ピクセル ブロックサイズ K = 2 セル 量子化数は N hog = 9 N css = 3 N cshog = 18 とした CS-HOG 特徴量と比 較手法は Real AdaBoost[5] を利用して識別器を学習す る また Real AdaBoost により学習する弱識別器は 識別器の出力値 る CS-HOG : HSV は HOG CSS と比較して約 22.5 27.2% 識別精度が向上しており CS-HOG : RGB と比 較して約 16.8% 識別精度が向上している これにより CS-HOG 特徴量は HSV 表色系を利用して類似度計算 をすることで 有効な特徴表現を可能にしたことが確 500 個で統一して評価実験を行う 評価には Detection Error Trade-off(DET) カーブを用いる DET カーブは 認できる また CS-HOG : HSV は HOG+CSS と比 横軸に誤検出率 縦軸に未検出率を表しており 原点 とから 単一の特徴量で色の類似性と形状特徴を効果 に近いほど高精度であることを表す 的に表現できたと考えられる 4.3 較したとき 約 4.2% 識別精度が向上している このこ CS-HOG 特徴量と HOG 特徴量 CSS 特徴量で識別 実験結果 器の出力値にどのような変化があるかを確認する 図 13 実験結果の DET カーブを図 12 に示す DET カーブ に評価サンプルにおける識別器の出力値の分布を示す より 誤検出率 0.05% のとき CS-HOG : RGB は HOG 図 13 は 横軸に CS-HOG 特徴量の識別器の出力値 縦 CSS と比較して約 5.7 8.1% 識別精度が向上してい 軸に HOG 特徴量及び CSS 特徴量の識別器の出力値を IS3-04-7
第18回画像センシングシンポジウム, 横浜, 2012年6月 図 14 示し 対角線上にサンプルが分布すると同一の出力値 人検出例 参考文献 であることを表す 識別器の出力値の分布からわかる ように CS-HOG 特徴量は HOG 特徴量及び CSS 特徴 量と比較して ポジティブサンプルの約 86.7 88.1% [1] N. Dalal, and B. Triggs, Histograms of Oriented Gradients for Human Detection, Computer Vision and Pattern Recognition, vol.1, pp.886-893, 2005. が出力値が高い値となっている また ネガティブサン プルの約 67.2 86.7% が出力値が低い値となっている これにより CS-HOG 特徴量は HOG 特徴量 CSS 特 徴量と比較して 各サンプルがより正解クラスらしい 出力となることが確認できた よって 図 14 に示す人 検出例からもわかるように CS-HOG 特徴量は色の類 似度に基づいて形状を観測し 物体の特徴を効果的に [2] K. Levi, and Y. Weiss, Learning Object Detection from a Small Number of Examples: the Importance of Good Features, Computer Vision and Pattern Recognition, vol.2, pp.53-60, 2004. [3] B. Wu, and R. Nevatia, Detection of Multiple, Partially Occluded Humans in a Single Image by Bayesian Combination of Edgelet Part Detectors, International Conferenceon Computer Vi- 捉えることで高精度な物体検出を実現した 5 おわりに 本研究では色の類似性に基づいて形状を観測する CS- sion, vol.1, pp.90-97, 2005. [4] S. Walk, and N. Majer, New Features and HOG 特徴量を提案した CS-HOG 特徴量は カラー画 像の色の類似性に基づいて形状を算出することで HOG Insights for Pedestrian Detection, Computer Vision and Pattern Recognition, pp.1030-1037, 2010. 特徴量に比べて柔軟に物体形状を捉えることを可能に した 人検出における評価実験により CS-HOG 特徴 量は従来の局所特徴量と比較して 物体の特徴を効果 [5] R. E. Schapire, and Y. Singer, Improved Boosting Algorithms Using Confidence-rated Predic- 的に表現し高精度な検出を実現した 今後は 自動車 などの人以外の検出対象への CS-HOG 特徴量の有効性 を調査する予定である IS3-04-8 tions, Machine Learning, vol.37, no.3, pp.297336, 1999.