LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R

Similar documents
2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni

SICE東北支部研究集会資料(2013年)

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

Vol.8 No (Mar. 2015) 1,a) , Anomaly Detection Based on Density Estimation of Normal Data in Cone-restr

画像認識性能を改善する高精度な特徴量抽出手法の検討 A Study on Feature-Extraction Methods for Improvement of Image-Recognition Performance 井上俊明 Toshiaki Inoue 要旨 各種のカメラ搭載機器の急速な

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

Microsoft PowerPoint - pr_12_template-bs.pptx

HOG HOG LBP LBP 4) LBP LBP Wang LBP HOG LBP 5) LBP LBP 1 r n 1 n, 1

Convolutional Neural Network A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolution

[1] SBS [2] SBS Random Forests[3] Random Forests ii

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

IPSJ SIG Technical Report Vol.2013-CVIM-187 No /5/30 1,a) 1,b), 1,,,,,,, (DNN),,,, 2 (CNN),, 1.,,,,,,,,,,,,,,,,,, [1], [6], [7], [12], [13]., [

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +

A Survey on Image Recognition Using Geo-tag Information

(b) BoF codeword codeword BoF (c) BoF Fergus Weber [11] Weber [12] Weber Fergus BoF (b) Fergus [13] Fergus 2. Fergus 2. 1 Fergus [3]

色の類似性に基づいた形状特徴量CS-HOGの提案

1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means

DEIM Forum 2012 E Web Extracting Modification of Objec

28 Horizontal angle correction using straight line detection in an equirectangular image

Microsoft PowerPoint - descriptor.ppt [互換モード]

IPSJ-CVIM

Gaze Head Eye (a) deg (b) 45 deg (c) 9 deg 1: - 1(b) - [5], [6] [7] Stahl [8], [9] Fang [1], [11] Itti [12] Itti [13] [7] Fang [1],

28 TCG SURF Card recognition using SURF in TCG play video

す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

1(a) (b),(c) - [5], [6] Itti [12] [13] gaze eyeball head 2: [time] [7] Stahl [8], [9] Fang [1], [11] 3 -

BDH Cao BDH BDH Cao Cao Cao BDH ()*$ +,-+.)*$!%&'$!"#$ 2. 1 Weng [4] Metric Learning Weng DB DB Yang [5] John [6] Sparse Coding sparse coding DB [7] K

Microsoft PowerPoint - SSII_harada pptx

3 Abstract CAD 3-D ( ) 4 Spin Image Correspondence Grouping 46.1% 17.4% 97.6% ICP [0.6mm/point] 1 CAD [1][2]

(4) ω t(x) = 1 ω min Ω ( (I C (y))) min 0 < ω < C A C = 1 (5) ω (5) t transmission map tmap 1 4(a) t 4(a) t tmap RGB 2 (a) RGB (A), (B), (C)

(a) 1 (b) 3. Gilbert Pernicka[2] Treibitz Schechner[3] Narasimhan [4] Kim [5] Nayar [6] [7][8][9] 2. X X X [10] [11] L L t L s L = L t + L s

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii

IPSJ SIG Technical Report Vol.2014-MBL-70 No.46 Vol.2014-UBI-41 No /3/15 1,a) 1,b) 1,c) 6 Assist of Sharing the Experiences in Library using Mu

ビジュアル情報処理

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2007/8 Vol. J90 D No. 8 Stauffer [7] 2 2 I 1 I 2 2 (I 1(x),I 2(x)) 2 [13] I 2 = CI 1 (C >0) (I 1,I 2) (I 1,I 2) Field Monitoring Server

SURF,,., 55%,.,., SURF(Speeded Up Robust Features), 4 (,,, ), SURF.,, 84%, 96%, 28%, 32%.,,,. SURF, i

(3.6 ) (4.6 ) 2. [3], [6], [12] [7] [2], [5], [11] [14] [9] [8] [10] (1) Voodoo 3 : 3 Voodoo[1] 3 ( 3D ) (2) : Voodoo 3D (3) : 3D (Welc

100326_セミナー資料_物体認識.pptx

,,.,.,,.,.,.,.,,.,..,,,, i

画像解析論(7) 講義内容

kut-paper-template.dvi

[3] M.C. Escher Escher 1 Escher Escherization Problem [5] Escherization Problem S ( 1 ) T S ( 2 ) T T [5] Escherization Problem isohedral isohe

Transcription:

DEIM Forum 24 F5-4 Local Binary Pattern 6 84 E-mail: {tera,kida}@ist.hokudai.ac.jp Local Binary Pattern (LBP) LBP 3 3 LBP 5 5 5 LBP improved LBP uniform LBP.. Local Binary Pattern, Gradient Local Auto-Correlations,,,, [] [2] Shift Invariant Feature Transform (SIFT) [3] Speeded-up Robust Feature (SURF) [4] SIFT SURF visual word Bag-of-Keypoints [5] Local Binary Pattern (LBP) [6] Higher Order Local Auto-Correlations (HLAC) [7] HLAC Gradient Local Auto-Correlations (GLAC) [8] Normal Local Auto-Correlations (NLAC) [8] LBP LBP [9] [] [9]SIFT SURF GLAC NLAC LBP GLAC 5 LBP LBP improved LBP [] uniform LBP []. 2 LBP rotated LBP [3] LBP LBP OpenCV 2 OpenCV Haar-like [4] LBP 2. 2. http://opencv.org/

25 2 2 8 6 4 5 8 6 5 2 2 2 4 2 4 35 3 25 2 5 5 2 2 2 2 2 2 2 8 6 4 8 6 4 2 2 2 2 3 LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R P P LBP P,R = s(g p g c)2 p s(x) = p= { (x > = ) (x < ) g c g p R = 3 3 P 8 R = 2 5 5 P 6 LBP g c g p LBP P,R 2 P LBP LBP P R R = P = 8 LBP R = P = 8 LBP 2 3 3 LBP 8, 2 8 = 2 LBP P,R LBP LBP LBP 3 LBP improved LBP [] uniform uniform LBP [] LBP P,R rotated LBP [3] 2. 3 Gradient Local Auto-Correlations Gradient Local Auto-Correlations (GLAC) [8] HLAC [7]

(a) (b) 6 LBP 4 gradient orientation vector 7 D + 4 D 2 3. 5 (, δx δy )t n = ( δx )2 + ( δy )2 θ = arctan(, ) δx δy GLAC 4 D 2 4 f( R D ) gradient orientation vector (G-O ) N GLAC R(d,..., d N, a,..., a N ) = min[n(r), n(r + a ),..., n(r + a N )] I f d (r)f d (r + a )...f dn (r + a N )dr f d G-O f d a i 5 N N = N = GLAC GLAC : R(d ) = r I n(r)f d (r) : R(d, d, a ) = min[n(r), n(r + a )]f d (r)f d (r + a ) r I GLAC 5 D GLAC 5 GLAC R = 2P = 6 LBP P,R GLAC 3 3 LBP 5 5 GLAC G-O D = 8 64 8 = 5 dglac GLAC 3 3 dglac G-O D = 8 GLAC 8 3 3 R = P = 8 LBP 2 I I(x, y) n θ 2 n = + 2 δx δy θ = arctan( δx, δy ) = I(x +, y) I(x, y) δx = I(x, y + ) I(x, y ) δy GLAC GLAC LBP dglac R = 2P = 6 LBP P,R LBP 2 6 6(a) 6 [9] 6 6(b)

表 顔画像分類の性能 図 8 AT&T データセット AT&T MIT CBCL Proposed 9.77% 99.655% LBP 88.76% 99.58% improved LBP 87.5% 99.594% uniform LBP 85.% 99.53% けているもの かけていないもの等 様々な顔画像が含まれて いる MIT CBCL データセットは図 9 のような顔画像のデータ セットであり 人のグレースケール画像が各 2 枚ずつ 計 2 枚の画像からなる 画像はクラスごとにサイズが正規化 されておらず 様々な角度から撮影されている これらのデータセットを用いて以下のような条件で画像分類 の実験を行った 各クラスからランダムに半分の画像を選択し それを 図 9 MIT CBCL データセット 学習画像とする うな場合も考えられる 本論文では 予備調査の結果 精度に 2 残りの半分の画像を分類画像とする 大きな差が確認されなかったため図 6(a) に統一した これによ 3 学習画像 及び分類画像から特徴量を抽出する り通常 R = 2 P = 6 としたときの LBP では 2 6 = 65536 次元になるのに対し 5 5 の範囲の情報を 26 = 64 次元で表 4 学習画像の特徴量を多クラス分類が可能な線形 SVM により学習する 5 生成された分類器に分類画像の特徴量を入力する すことができる 最後に 次の GLAC を LBP による 64 個のパターンで分割 6 出力された結果が正しいクラスに属しているか否かを することで特徴量の記述を行う 次の GLAC は 8 方向 (8 次 調べ 正しいクラスであれば正解とする 元) で特徴づけられているので dglac は 5 個のパターン AT&T データセットでは学習画像 分類画像はそれぞれ 5 枚 で表現される 特徴量は 次の GLAC の特徴量を基準として MIT CBCL データセットでは学習画像 分類画像はそれぞれ いるので LBP のようなパターンベースの特徴量ではなく注目 枚となる このような実験を 回行い その平均を求め 画素の画素値の重みによって算出されるパワースペクトルベー ることで 精度を求めた 提案手法は予備調査の結果 特徴量 スの特徴量となる 最終的に dglac の参照点は図 7 のよう を正規化しないほうが良い結果が得られていたため 正規化は になる 算出される特徴量 D は 次の GLAC 特徴量 R(d) と 行っていない 提案手法に対する比較手法としては LBP の他 LBP6,2 を用いて以下のように表せる に improved LBP と uniform LBP を用いた uniform LBP では注目画素の周囲の範囲を 3 3 から 7 7 まで変化させ DLBP6,2,d = R(d) たうえで 最良の結果を用いており AT&T データセットでは 以上により 注目画素の周囲 5 5 の範囲から疎に参照点を 選択し勾配情報を用いて特徴量を算出することで 5 次元の 555 次元を MIT CBCL データセットでは 次元の特徴量 を使用している 実 験 結 果 は 表 の よ う に なった AT&T デ ー タ セット 特徴量として記述される では 提案手法が 9.77%であるのに対し 既存手法では 4. 分 類 実 験 LBP が 88.76% improved LBP が 87.5% unform LBP 提案手法の有効性を調べるために顔画像を用いた画像分類の 注 2 実験を行う 実験には AT&T データセット と MIT CBCL データセット 注 3 を使用した AT&T データセットは図 8 のような顔画像のデータセット であり 4 人のグレースケール画像が各 枚ずつ 計 4 枚 の画像からなる 全ての画像は 92 ピクセルで固定され ている また データセットには目が開いているもの 目が閉 じているもの 笑っているもの 笑っていないもの 眼鏡をか が 85.%という結果となり 提案手法が既存手法より優れ ていることが確認できる MIT CBCL データセットにおい ても提案手法が 99.655%であるのに対し LBP が 99.58% improved LBP が 99.594% uniform LBP が 99.53%となり いずれにおいても提案手法が優れている結果となった これは 提案手法が既存手法に対し より多くに情報を特徴量に含んで いる点 そして勾配情報を用いていることからそれぞれの人間 における固有の顔の情報を取得できているからであると考えら れる 注 2 http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase. html 注 3 http://cbcl.mit.edu/software-datasets/heisele/ facerecognition-database.html 5. お わ り に 本稿において LBP の参照する範囲を広げることで特徴量

LBP GLAC []. (SIFT HOG). PCSJ/IMPS28, 28. [2].. :, Vol. 48, pp. 24, 27. [3] David G Lowe. Distinctive image features from scaleinvariant keypoints. International Journal of Computer Vision, Vol. 6, No. 2, pp. 9, 24. [4] Herbert Bay, Tinne Tuytelaars, and Luc Van Gool. Surf: Speeded up robust features. In Proceedings of European Conference on Computer Vision, ECCV 26, pp. 44 47. Springer, 26. [5] Gabriella Csurka, Christopher Dance, Lixin Fan, Jutta Willamowski, and Cédric Bray. Visual categorization with bags of keypoints. In Proceedings of European Conference on Computer Vision, ECCV 24, Vol., p. 22, 24. [6] Timo Ojala, Matti Pietikäinen, and David Harwood. A comparative study of texture measures with classification based on featured distributions. Pattern Recognition, Vol. 29, No., pp. 5 59, 6. [7] Nobuyuki Otsu and Takio Kurita. A new scheme for practical flexible and intelligent vision systems. In Proceedings of IAPR Workshop on Computer Vision, pp. 43 435, 988. [8] Takumi Kobayashi and Nobuyuki Otsu. Image feature extraction using gradient local auto-correlations. In Proceedings of European Conference on Computer Vision, ECCV 28, pp. 6 358. Springer, 28. [9],.. PRMU, PRMU24-63, pp. 77 84, 24. [],.., Vol., No. 4, pp. 39 397, 25. [] Hongliang Jin, Qingshan Liu, Hanqing Lu, and Xiaofeng Tong. Face detection using improved lbp under bayesian framework. In Proceedings of Third International Conference on Image and Graphics, pp. 36 39. IEEE, 24. [] Timo Ojala, Matti Pietikainen, and Topi Maenpaa. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 24, No. 7, pp. 97 987, 22. [3] Matti Pietikäinen, Timo Ojala, and Zelin Xu. Rotationinvariant texture classification using feature distributions. Pattern Recognition, Vol. 33, No., pp. 43 52, 2. [4] Constantine P. Papageorgiou, Michael Oren, and Tomaso Poggio. A general framework for object detection. In Proceedings of Sixth International Conference on Computer Vision, 8, pp. 555 2. IEEE, 8.