LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R

Similar documents
IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta

2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni

SICE東北支部研究集会資料(2013年)

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

Vol.8 No (Mar. 2015) 1,a) , Anomaly Detection Based on Density Estimation of Normal Data in Cone-restr

(MIRU2010) Geometric Context Randomized Trees Geometric Context Rand

(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te

bag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84

IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 2 Hough Forest Hough Forest[6] Random Forest( [5]) Random Forest Hough Forest Hough Forest 2.1 Hough Forest 1 2.2

画像認識性能を改善する高精度な特徴量抽出手法の検討 A Study on Feature-Extraction Methods for Improvement of Image-Recognition Performance 井上俊明 Toshiaki Inoue 要旨 各種のカメラ搭載機器の急速な

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

yoo_graduation_thesis.dvi

IPSJ SIG Technical Report Vol.2009-CVIM-167 No /6/10 Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing

Duplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF

Microsoft PowerPoint - pr_12_template-bs.pptx

2.2 6).,.,.,. Yang, 7).,,.,,. 2.3 SIFT SIFT (Scale-Invariant Feature Transform) 8).,. SIFT,,. SIFT, Mean-Shift 9)., SIFT,., SIFT,. 3.,.,,,,,.,,,., 1,

HOG HOG LBP LBP 4) LBP LBP Wang LBP HOG LBP 5) LBP LBP 1 r n 1 n, 1

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-CVIM-186 No /3/15 EMD 1,a) SIFT. SIFT Bag-of-keypoints. SIFT SIFT.. Earth Mover s Distance

本文6(599) (Page 601)

Convolutional Neural Network A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolution

[1] SBS [2] SBS Random Forests[3] Random Forests ii

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGIN

光学

情報処理学会研究報告 い認識率を示す事が出来なかったと報告している 視覚特徴量としては SIFT や SURF のような局所的な 領域から特徴量を抽出する方法がある [4] [5] これらの 特徴量とフローベクトルを使いダイナミックなシーンの分 類を行う手法が提案されている しかし これらの画像特

IPSJ SIG Technical Report Vol.2013-CVIM-187 No /5/30 1,a) 1,b), 1,,,,,,, (DNN),,,, 2 (CNN),, 1.,,,,,,,,,,,,,,,,,, [1], [6], [7], [12], [13]., [

IPSJ SIG Technical Report iphone iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Proc

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4

35_3_9.dvi

A Survey on Image Recognition Using Geo-tag Information

(b) BoF codeword codeword BoF (c) BoF Fergus Weber [11] Weber [12] Weber Fergus BoF (b) Fergus [13] Fergus 2. Fergus 2. 1 Fergus [3]

IPSJ SIG Technical Report Vol.2010-CVIM-171 No /3/19 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) % MKL 68.8% Extractin

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A

色の類似性に基づいた形状特徴量CS-HOGの提案

IPSJ SIG Technical Report Vol.2010-MPS-77 No /3/5 VR SIFT Virtual View Generation in Hallway of Cybercity Buildings from Video Sequen


untitled

1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means

めた ID の総てを bin 数 256 のヒストグラム化し その画 像の特徴とする ここで 演算式からも容易に推測される ように LBP は画像全体の濃淡値の変化に対して頑健であ ることに注意されたい ることが考えられる 図 4 の例では bin 数が 256 のヒス トグラムを 3 つ合成してい

DEIM Forum 2019 A7-1 Flexible Distance-based Hashing mori

DEIM Forum 2012 E Web Extracting Modification of Objec

(a) (b) 2 2 (Bosch, IR Illuminator 850 nm, UFLED30-8BD) ( 7[m] 6[m]) 3 (PointGrey Research Inc.Grasshopper2 M/C) Hz (a) (b

28 Horizontal angle correction using straight line detection in an equirectangular image

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

,,,,,,,,,,,,,,,,,,, 976%, i

WISS Woodman Labs GoPro 1 [5, 3, 2] Copyright is held by the author(s). 1 GoPro GoPro 2 6 GoPro RICOH THETA 3 Kodak P

Microsoft PowerPoint - descriptor.ppt [互換モード]

IPSJ-CVIM

paper.dvi

Gaze Head Eye (a) deg (b) 45 deg (c) 9 deg 1: - 1(b) - [5], [6] [7] Stahl [8], [9] Fang [1], [11] Itti [12] Itti [13] [7] Fang [1],

28 TCG SURF Card recognition using SURF in TCG play video

す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

1(a) (b),(c) - [5], [6] Itti [12] [13] gaze eyeball head 2: [time] [7] Stahl [8], [9] Fang [1], [11] 3 -

BDH Cao BDH BDH Cao Cao Cao BDH ()*$ +,-+.)*$!%&'$!"#$ 2. 1 Weng [4] Metric Learning Weng DB DB Yang [5] John [6] Sparse Coding sparse coding DB [7] K

Microsoft PowerPoint - SSII_harada pptx

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.,,

3 Abstract CAD 3-D ( ) 4 Spin Image Correspondence Grouping 46.1% 17.4% 97.6% ICP [0.6mm/point] 1 CAD [1][2]

(4) ω t(x) = 1 ω min Ω ( (I C (y))) min 0 < ω < C A C = 1 (5) ω (5) t transmission map tmap 1 4(a) t 4(a) t tmap RGB 2 (a) RGB (A), (B), (C)

12_39.dvi

Microsoft Word - deim論文2.docx

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1

(a) 1 (b) 3. Gilbert Pernicka[2] Treibitz Schechner[3] Narasimhan [4] Kim [5] Nayar [6] [7][8][9] 2. X X X [10] [11] L L t L s L = L t + L s

SICE東北支部研究集会資料(2017年)

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. Wang Jiani {jwang,mnod

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),

図 2: 高周波成分を用いた超解像 解像度度画像とそれらを低解像度化して得られる 低解像度画像との差により低解像度の高周波成分 を得る 高解像度と低解像度の高周波成分から位 置関係を保ったままパッチ領域をそれぞれ切り出 し 高解像度パッチ画像と低解像度パッチ画像の ペアとしてデータベースに登録する

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii

untitled

IPSJ SIG Technical Report Vol.2014-MBL-70 No.46 Vol.2014-UBI-41 No /3/15 1,a) 1,b) 1,c) 6 Assist of Sharing the Experiences in Library using Mu

Optical Flow t t + δt 1 Motion Field 3 3 1) 2) 3) Lucas-Kanade 4) 1 t (x, y) I(x, y, t)

ビジュアル情報処理

Sobel Canny i

IPSJ SIG Technical Report Vol.2017-MUS-116 No /8/24 MachineDancing: 1,a) 1,b) 3 MachineDancing MachineDancing MachineDancing 1 MachineDan

IPSJ SIG Technical Report 1,a) 1,b) 1,c) 1,d) 2,e) 2,f) 2,g) 1. [1] [2] 2 [3] Osaka Prefecture University 1 1, Gakuencho, Naka, Sakai,

( 1) 3. Hilliges 1 Fig. 1 Overview image of the system 3) PhotoTOC 5) 1993 DigitalDesk 7) DigitalDesk Koike 2) Microsoft J.Kim 4). 2 c 2010

paper.dvi

DEIM Forum 2010 A Web Abstract Classification Method for Revie

RANSAC RANSAC Amerini [8] RANSAC LO-RANSAC(Locally Optimized RANSAC)[9] LO-RANSAC 2.2 SIFT SIFT SIFT 128 SIFT SIFT SIFT SIFT p i p j d ij SIF

Computer Security Symposium October ,a) 1,b) Microsoft Kinect Kinect, Takafumi Mori 1,a) Hiroaki Kikuchi 1,b) [1] 1 Meiji U

FoodLog [3] TADAproject [4] Google Goggles 1 Kumar [5] () Leaf snap Maruyama [6] 3 Lee [7] Yu [8] Gist SVM Active Query Sensing(AQS)

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

2007/8 Vol. J90 D No. 8 Stauffer [7] 2 2 I 1 I 2 2 (I 1(x),I 2(x)) 2 [13] I 2 = CI 1 (C >0) (I 1,I 2) (I 1,I 2) Field Monitoring Server

27 (2015)

SURF,,., 55%,.,., SURF(Speeded Up Robust Features), 4 (,,, ), SURF.,, 84%, 96%, 28%, 32%.,,,. SURF, i

(3.6 ) (4.6 ) 2. [3], [6], [12] [7] [2], [5], [11] [14] [9] [8] [10] (1) Voodoo 3 : 3 Voodoo[1] 3 ( 3D ) (2) : Voodoo 3D (3) : 3D (Welc

IPSJ SIG Technical Report GPS LAN GPS LAN GPS LAN Location Identification by sphere image and hybrid sensing Takayuki Katahira, 1 Yoshio Iwai 1

VRSJ-SIG-MR_okada_79dce8c8.pdf

100326_セミナー資料_物体認識.pptx

,,.,.,,.,.,.,.,,.,..,,,, i

画像解析論(7) 講義内容

thesis.dvi

kut-paper-template.dvi

Vol1-CVIM-172 No.7 21/5/ Shan 1) 2 2)3) Yuan 4) Ancuti 5) Agrawal 6) 2.4 Ben-Ezra 7)8) Raskar 9) Image domain Blur image l PSF b / = F(

IPSJ SIG Technical Report Vol.2014-HCI-158 No /5/22 1,a) 2 2 3,b) Development of visualization technique expressing rainfall changing conditions

[3] M.C. Escher Escher 1 Escher Escherization Problem [5] Escherization Problem S ( 1 ) T S ( 2 ) T T [5] Escherization Problem isohedral isohe

Transcription:

DEIM Forum 24 F5-4 Local Binary Pattern 6 84 E-mail: {tera,kida}@ist.hokudai.ac.jp Local Binary Pattern (LBP) LBP 3 3 LBP 5 5 5 LBP improved LBP uniform LBP.. Local Binary Pattern, Gradient Local Auto-Correlations,,,, [] [2] Shift Invariant Feature Transform (SIFT) [3] Speeded-up Robust Feature (SURF) [4] SIFT SURF visual word Bag-of-Keypoints [5] Local Binary Pattern (LBP) [6] Higher Order Local Auto-Correlations (HLAC) [7] HLAC Gradient Local Auto-Correlations (GLAC) [8] Normal Local Auto-Correlations (NLAC) [8] LBP LBP [9] [] [9]SIFT SURF GLAC NLAC LBP GLAC 5 LBP LBP improved LBP [] uniform LBP []. 2 LBP rotated LBP [3] LBP LBP OpenCV 2 OpenCV Haar-like [4] LBP 2. 2. http://opencv.org/

25 2 2 8 6 4 5 8 6 5 2 2 2 4 2 4 35 3 25 2 5 5 2 2 2 2 2 2 2 8 6 4 8 6 4 2 2 2 2 3 LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R P P LBP P,R = s(g p g c)2 p s(x) = p= { (x > = ) (x < ) g c g p R = 3 3 P 8 R = 2 5 5 P 6 LBP g c g p LBP P,R 2 P LBP LBP P R R = P = 8 LBP R = P = 8 LBP 2 3 3 LBP 8, 2 8 = 2 LBP P,R LBP LBP LBP 3 LBP improved LBP [] uniform uniform LBP [] LBP P,R rotated LBP [3] 2. 3 Gradient Local Auto-Correlations Gradient Local Auto-Correlations (GLAC) [8] HLAC [7]

(a) (b) 6 LBP 4 gradient orientation vector 7 D + 4 D 2 3. 5 (, δx δy )t n = ( δx )2 + ( δy )2 θ = arctan(, ) δx δy GLAC 4 D 2 4 f( R D ) gradient orientation vector (G-O ) N GLAC R(d,..., d N, a,..., a N ) = min[n(r), n(r + a ),..., n(r + a N )] I f d (r)f d (r + a )...f dn (r + a N )dr f d G-O f d a i 5 N N = N = GLAC GLAC : R(d ) = r I n(r)f d (r) : R(d, d, a ) = min[n(r), n(r + a )]f d (r)f d (r + a ) r I GLAC 5 D GLAC 5 GLAC R = 2P = 6 LBP P,R GLAC 3 3 LBP 5 5 GLAC G-O D = 8 64 8 = 5 dglac GLAC 3 3 dglac G-O D = 8 GLAC 8 3 3 R = P = 8 LBP 2 I I(x, y) n θ 2 n = + 2 δx δy θ = arctan( δx, δy ) = I(x +, y) I(x, y) δx = I(x, y + ) I(x, y ) δy GLAC GLAC LBP dglac R = 2P = 6 LBP P,R LBP 2 6 6(a) 6 [9] 6 6(b)

表 顔画像分類の性能 図 8 AT&T データセット AT&T MIT CBCL Proposed 9.77% 99.655% LBP 88.76% 99.58% improved LBP 87.5% 99.594% uniform LBP 85.% 99.53% けているもの かけていないもの等 様々な顔画像が含まれて いる MIT CBCL データセットは図 9 のような顔画像のデータ セットであり 人のグレースケール画像が各 2 枚ずつ 計 2 枚の画像からなる 画像はクラスごとにサイズが正規化 されておらず 様々な角度から撮影されている これらのデータセットを用いて以下のような条件で画像分類 の実験を行った 各クラスからランダムに半分の画像を選択し それを 図 9 MIT CBCL データセット 学習画像とする うな場合も考えられる 本論文では 予備調査の結果 精度に 2 残りの半分の画像を分類画像とする 大きな差が確認されなかったため図 6(a) に統一した これによ 3 学習画像 及び分類画像から特徴量を抽出する り通常 R = 2 P = 6 としたときの LBP では 2 6 = 65536 次元になるのに対し 5 5 の範囲の情報を 26 = 64 次元で表 4 学習画像の特徴量を多クラス分類が可能な線形 SVM により学習する 5 生成された分類器に分類画像の特徴量を入力する すことができる 最後に 次の GLAC を LBP による 64 個のパターンで分割 6 出力された結果が正しいクラスに属しているか否かを することで特徴量の記述を行う 次の GLAC は 8 方向 (8 次 調べ 正しいクラスであれば正解とする 元) で特徴づけられているので dglac は 5 個のパターン AT&T データセットでは学習画像 分類画像はそれぞれ 5 枚 で表現される 特徴量は 次の GLAC の特徴量を基準として MIT CBCL データセットでは学習画像 分類画像はそれぞれ いるので LBP のようなパターンベースの特徴量ではなく注目 枚となる このような実験を 回行い その平均を求め 画素の画素値の重みによって算出されるパワースペクトルベー ることで 精度を求めた 提案手法は予備調査の結果 特徴量 スの特徴量となる 最終的に dglac の参照点は図 7 のよう を正規化しないほうが良い結果が得られていたため 正規化は になる 算出される特徴量 D は 次の GLAC 特徴量 R(d) と 行っていない 提案手法に対する比較手法としては LBP の他 LBP6,2 を用いて以下のように表せる に improved LBP と uniform LBP を用いた uniform LBP では注目画素の周囲の範囲を 3 3 から 7 7 まで変化させ DLBP6,2,d = R(d) たうえで 最良の結果を用いており AT&T データセットでは 以上により 注目画素の周囲 5 5 の範囲から疎に参照点を 選択し勾配情報を用いて特徴量を算出することで 5 次元の 555 次元を MIT CBCL データセットでは 次元の特徴量 を使用している 実 験 結 果 は 表 の よ う に なった AT&T デ ー タ セット 特徴量として記述される では 提案手法が 9.77%であるのに対し 既存手法では 4. 分 類 実 験 LBP が 88.76% improved LBP が 87.5% unform LBP 提案手法の有効性を調べるために顔画像を用いた画像分類の 注 2 実験を行う 実験には AT&T データセット と MIT CBCL データセット 注 3 を使用した AT&T データセットは図 8 のような顔画像のデータセット であり 4 人のグレースケール画像が各 枚ずつ 計 4 枚 の画像からなる 全ての画像は 92 ピクセルで固定され ている また データセットには目が開いているもの 目が閉 じているもの 笑っているもの 笑っていないもの 眼鏡をか が 85.%という結果となり 提案手法が既存手法より優れ ていることが確認できる MIT CBCL データセットにおい ても提案手法が 99.655%であるのに対し LBP が 99.58% improved LBP が 99.594% uniform LBP が 99.53%となり いずれにおいても提案手法が優れている結果となった これは 提案手法が既存手法に対し より多くに情報を特徴量に含んで いる点 そして勾配情報を用いていることからそれぞれの人間 における固有の顔の情報を取得できているからであると考えら れる 注 2 http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase. html 注 3 http://cbcl.mit.edu/software-datasets/heisele/ facerecognition-database.html 5. お わ り に 本稿において LBP の参照する範囲を広げることで特徴量

LBP GLAC []. (SIFT HOG). PCSJ/IMPS28, 28. [2].. :, Vol. 48, pp. 24, 27. [3] David G Lowe. Distinctive image features from scaleinvariant keypoints. International Journal of Computer Vision, Vol. 6, No. 2, pp. 9, 24. [4] Herbert Bay, Tinne Tuytelaars, and Luc Van Gool. Surf: Speeded up robust features. In Proceedings of European Conference on Computer Vision, ECCV 26, pp. 44 47. Springer, 26. [5] Gabriella Csurka, Christopher Dance, Lixin Fan, Jutta Willamowski, and Cédric Bray. Visual categorization with bags of keypoints. In Proceedings of European Conference on Computer Vision, ECCV 24, Vol., p. 22, 24. [6] Timo Ojala, Matti Pietikäinen, and David Harwood. A comparative study of texture measures with classification based on featured distributions. Pattern Recognition, Vol. 29, No., pp. 5 59, 6. [7] Nobuyuki Otsu and Takio Kurita. A new scheme for practical flexible and intelligent vision systems. In Proceedings of IAPR Workshop on Computer Vision, pp. 43 435, 988. [8] Takumi Kobayashi and Nobuyuki Otsu. Image feature extraction using gradient local auto-correlations. In Proceedings of European Conference on Computer Vision, ECCV 28, pp. 6 358. Springer, 28. [9],.. PRMU, PRMU24-63, pp. 77 84, 24. [],.., Vol., No. 4, pp. 39 397, 25. [] Hongliang Jin, Qingshan Liu, Hanqing Lu, and Xiaofeng Tong. Face detection using improved lbp under bayesian framework. In Proceedings of Third International Conference on Image and Graphics, pp. 36 39. IEEE, 24. [] Timo Ojala, Matti Pietikainen, and Topi Maenpaa. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 24, No. 7, pp. 97 987, 22. [3] Matti Pietikäinen, Timo Ojala, and Zelin Xu. Rotationinvariant texture classification using feature distributions. Pattern Recognition, Vol. 33, No., pp. 43 52, 2. [4] Constantine P. Papageorgiou, Michael Oren, and Tomaso Poggio. A general framework for object detection. In Proceedings of Sixth International Conference on Computer Vision, 8, pp. 555 2. IEEE, 8.