IPSJ SIG Technical Report Vol.2015-CVIM-195 No /1/23 RGB-D RGB 3 1,a) RGB-D RGB-D 3. RGB CG RGB DTAM[1] MonoFusi

Similar documents
IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +

IPSJ SIG Technical Report iphone iphone,,., OpenGl ES 2.0 GLSL(OpenGL Shading Language), iphone GPGPU(General-Purpose Computing on Graphics Proc

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2015-CVIM-195 No /1/22 AR マーカ除去のための実時間背景画像変形 *1 1 1 Abstract 本稿では, 拡張現実感で用いられる AR マーカの違和感のない視覚的除去を実現するた

す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(

(a) (b) 2 2 (Bosch, IR Illuminator 850 nm, UFLED30-8BD) ( 7[m] 6[m]) 3 (PointGrey Research Inc.Grasshopper2 M/C) Hz (a) (b

光学

NAIST-IS-MT

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

IPSJ SIG Technical Report Vol.2015-CVIM-196 No /3/6 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swi

(a) (b) (c) Canny (d) 1 ( x α, y α ) 3 (x α, y α ) (a) A 2 + B 2 + C 2 + D 2 + E 2 + F 2 = 1 (3) u ξ α u (A, B, C, D, E, F ) (4) ξ α (x 2 α, 2x α y α,

Spin Image [3] 3D Shape Context [4] Spin Image 2 3D Shape Context Shape Index[5] Local Surface Patch[6] DAI [7], [8] [9], [10] Reference Frame SHO[11]

Optical Flow t t + δt 1 Motion Field 3 3 1) 2) 3) Lucas-Kanade 4) 1 t (x, y) I(x, y, t)

3 Abstract CAD 3-D ( ) 4 Spin Image Correspondence Grouping 46.1% 17.4% 97.6% ICP [0.6mm/point] 1 CAD [1][2]

2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni

(MIRU2010) Geometric Context Randomized Trees Geometric Context Rand

(a) 1 (b) 3. Gilbert Pernicka[2] Treibitz Schechner[3] Narasimhan [4] Kim [5] Nayar [6] [7][8][9] 2. X X X [10] [11] L L t L s L = L t + L s

IPSJ SIG Technical Report Vol.2012-ICS-167 No /3/ ,,., 3, 3., 3, 3. Automatic 3D Map Generation by Using a Small Unmanned Vehicle

258 5) GPS 1 GPS 6) GPS DP 7) 8) 10) GPS GPS ) GPS Global Positioning System

1. 概要この文書は Raposo, C., Barreto, J. P., & Nunes, U. (2013). Fast and Accurate Calibration of a Kinect Sensor. International Conference on 3D Vision. につ

3 3 3 Knecht (2-3fps) AR [3] 2. 2 Debevec High Dynamic Range( HDR) [4] HDR Derek [5] 2. 3 [6] 3. [6] x E(x) E(x) = 2π π 2 V (x, θ i, ϕ i )L(θ

(3.6 ) (4.6 ) 2. [3], [6], [12] [7] [2], [5], [11] [14] [9] [8] [10] (1) Voodoo 3 : 3 Voodoo[1] 3 ( 3D ) (2) : Voodoo 3D (3) : 3D (Welc

直樹卒業論文

Duplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF

IPSJ SIG Technical Report Vol.2013-CVIM-188 No /9/2 1,a) D. Marr D. Marr 1. (feature-based) (area-based) (Dense Stereo Vision) van der Ma

カメラレディ原稿

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta

[1] SBS [2] SBS Random Forests[3] Random Forests ii

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4

プログラム

放射線専門医認定試験(2009・20回)/HOHS‐05(基礎二次)

,,.,.,,.,.,.,.,,.,..,,,, i

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

(a) (b) (c) Fig. 2 2 (a) ; (b) ; (c) (a)configuration of the proposed system; (b)processing flow of the system; (c)the system in use 1 GPGPU (


1 P2 P P3P4 P5P8 P9P10 P11 P12

日歯雑誌(H19・5月号)済/P6‐16 クリニカル  柿木 5

光学

xx/xx Vol. Jxx A No. xx 1 Fig. 1 PAL(Panoramic Annular Lens) PAL(Panoramic Annular Lens) PAL (2) PAL PAL 2 PAL 3 2 PAL 1 PAL 3 PAL PAL 2. 1 PAL

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2014-GN-90 No.6 Vol.2014-CDS-9 No.6 Vol.2014-DCC-6 No /1/23 Bullet Time 1,a) 1 Bullet Time Bullet Time

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

PR映画-1

- 2 -


II III I ~ 2 ~

中堅中小企業向け秘密保持マニュアル



1 (1) (2)

IPSJ SIG Technical Report Vol.2017-HCI-173 No.5 Vol.2017-EC-44 No /6/1 1,a) 1,2,b) 3,c) 1,d) 3D * 1* Graduate School of Engineerin

Microsoft PowerPoint - ロボットの運動学forUpload'C5Q [互換モード]

IPSJ SIG Technical Report Vol.2009-CVIM-168 No /9/ Latest Algorithm for 3-D Reconstruction from Two Views Kento Yamada, 1 Yasu

スライド 1

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :

2

WISS Woodman Labs GoPro 1 [5, 3, 2] Copyright is held by the author(s). 1 GoPro GoPro 2 6 GoPro RICOH THETA 3 Kodak P

VRSJ-SIG-MR_okada_79dce8c8.pdf

IS2-06 第21回画像センシングシンポジウム 横浜 2015年6月 画像をスーパーピクセルに変換する手法として SLIC[5] を用いる Achanta らによって提案された SLIC 2.2 グラフマッチング は K-means をベースにした手法で 単純な K-means に いる SPIN

1 2 Web Work Supporting with Virtual Display using Augmented Reality Masahiro KANEKO 1 and Jiro TANAKA 2 With the spread of online storage services an

2

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

IPSJ SIG Technical Report 1,a) 1,b) 1,c) 1,d) 2,e) 2,f) 2,g) 1. [1] [2] 2 [3] Osaka Prefecture University 1 1, Gakuencho, Naka, Sakai,

KinecV2 2.2 Kinec Kinec [8] Kinec Kinec [9] KinecV1 3D [10] Kisikidis [11] Kinec Kinec Kinec 3 KinecV2 PC 1 KinecV2 Kinec PC Kinec KinecV2 PC KinecV2

14 2 5

IPSJ SIG Technical Report Vol.2012-CG-148 No /8/29 3DCG 1,a) On rigid body animation taking into account the 3D computer graphics came

JAPAN MARKETING JOURNAL 111 Vol.28 No.32008

JAPAN MARKETING JOURNAL 113 Vol.29 No.12009

JAPAN MARKETING JOURNAL 110 Vol.28 No.22008

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. UWB UWB

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

IPSJ SIG Technical Report Vol.2017-MUS-116 No /8/24 MachineDancing: 1,a) 1,b) 3 MachineDancing MachineDancing MachineDancing 1 MachineDan

(4) ω t(x) = 1 ω min Ω ( (I C (y))) min 0 < ω < C A C = 1 (5) ω (5) t transmission map tmap 1 4(a) t 4(a) t tmap RGB 2 (a) RGB (A), (B), (C)

2007/8 Vol. J90 D No. 8 Stauffer [7] 2 2 I 1 I 2 2 (I 1(x),I 2(x)) 2 [13] I 2 = CI 1 (C >0) (I 1,I 2) (I 1,I 2) Field Monitoring Server

IPSJ SIG Technical Report Vol.2009-CVIM-169 No /11/ Stereo by the horizontal rotary movement of the upswing fisheye camera Sat

一般社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGIN

IPSJ SIG Technical Report Vol.2009-DPS-141 No.20 Vol.2009-GN-73 No.20 Vol.2009-EIP-46 No /11/27 1. MIERUKEN 1 2 MIERUKEN MIERUKEN MIERUKEN: Spe

(bundle adjustment) 8),9) ),6),7) GPS 8),9) GPS GPS 8) GPS GPS GPS GPS Anai 9) GPS GPS GPS GPS GPS GPS GPS Maier ) GPS GPS Anai 9) GPS GPS M GPS M inf

IPSJ-CVIM

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2



THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A

[12] [5, 6, 7] [5, 6] [7] 1 [8] 1 1 [9] 1 [10, 11] [10] [11] 1 [13, 14] [13] [14] [13, 14] [10, 11, 13, 14] 1 [12]

本文6(599) (Page 601)

DEIM Forum 2012 E Web Extracting Modification of Objec


Microsoft PowerPoint - presen

yoo_graduation_thesis.dvi

社団法人人工知能学会 Japanese Society for Artificial Intelligence 人工知能学会研究会資料 JSAI Technical Report SIG-Challenge-B30 (5/5) A Method to Estimate Ball s State of

PowerPoint プレゼンテーション

28 Horizontal angle correction using straight line detection in an equirectangular image

IPSJ SIG Technical Report Vol.2012-CVIM-182 No /5/ RGB [1], [2], [3], [4], [5] [6], [7], [8], [9] 1 (MSFA: Multi-Spectrum Filt

main

図 2: 高周波成分を用いた超解像 解像度度画像とそれらを低解像度化して得られる 低解像度画像との差により低解像度の高周波成分 を得る 高解像度と低解像度の高周波成分から位 置関係を保ったままパッチ領域をそれぞれ切り出 し 高解像度パッチ画像と低解像度パッチ画像の ペアとしてデータベースに登録する

BDH Cao BDH BDH Cao Cao Cao BDH ()*$ +,-+.)*$!%&'$!"#$ 2. 1 Weng [4] Metric Learning Weng DB DB Yang [5] John [6] Sparse Coding sparse coding DB [7] K

IPSJ SIG Technical Report Vol.2013-CVIM-187 No /5/30 1,a) 1,b), 1,,,,,,, (DNN),,,, 2 (CNN),, 1.,,,,,,,,,,,,,,,,,, [1], [6], [7], [12], [13]., [

PowerPoint Presentation

Transcription:

RGB-D RGB 3 1,a) 1 1 1 1 RGB-D 3. 3. RGB-D 3. RGB 3 3 1. 3 CG 3 3 3 3 RGB DTAM[1] MonoFusion[2] KinectFusion[3] 3 3 3 1 NAIST, Ikoma, Nara 630 0192, Japan a) takehara.hikari.tz9@is.naist.jp 3 3 3 3 [4], [5] 3 3 3 3 ICP [6], [7] 3 ICP [6], [7] ICP 2 3 3 3 3 ICP ICP [8] c 2015 Inormation Processin Society o Japan 1

RGB-D カメラ フレーム フレーム フレーム+1 RGB 画像列 ( 赤点 : 点軌跡上の点, 青点 :SIFT 対応点 ) フレーム フレーム+1 フレーム デプス画像列 フレーム 15 フレーム 30 フレーム の 3 次元座標系 フレーム +1 の 3 次元座標系 フレーム の 3 次元座標系 y j x i x i +1 y j y j A i x i + b i p i y j テンプレート座標系 1 A i +1 x i +1 + b i +1 x i : 点軌跡上の3 次元点 A i, b i : アフィン変換 A i x i + b i : 変換後の x i y j :SIFT 対応の3 次元点 y j : 変換後の y j p i : テンプレート点 2 フレーム 45 フレーム 60 ( ) 3 RGB-D RGB-D 3 3 ( ) RGB 2 2. RGB 3 2.1 1 RGB-D RGB-D RGB-D RGB RGB 3 3 ICP RGB [9] ( 2 ) RGB RGB 3 X i = {x i = 1,..., F } x i i 3 F 3 SIFT[10] ( 3 ) 3 y i y j j SIFT 3 3 SIFT 3 c 2015 Inormation Processin Society o Japan 2

対応点数 3 3 3 X i 3 p i 3 p i RGB-D 3 3 x i p i (p i = A i x i + b i ) I P = {p i i = 1,..., I} p i x i ( A = {A i i = 1,..., I, = 1,..., F } B = {b i i = 1,..., I, = 1,..., F }) 3 2.2 RGB [9] 1 3 [9] RGB RGB RGB RGB 3 X i SIFT[10] 3 RGB T C SIFT (, ) 3 400 1500 1200 900 600 300 代表フレーム 閾値 T C 0 0 100 200 300 400 500 600 700 フレーム番号 3 (a) フレーム 1 とフレーム 394 の SIFT 対応点 (a) (b) (b) フレーム 1 とフレーム 656 の SIFT 対応点 1 T C T W 3 (a) 394 (b) 656 1 SIFT SIFT G G SIFT (, ) RGB 3 (y j y j ) 2.3 3 3 E F E R E S SIFT 3 E C P ( A B) E (P, A, B) = α F E F + α R E R + α S E S + α C E C (1) α F, α R, α S, α C 2.3.1 3 E F x i p i (p i = A i x i + b i ) 3 E F (P, A, B) = p i (A i x i + b i ) 2 2 (2) i V() E F c 2015 Inormation Processin Society o Japan 3

フレーム 座標系 フレーム 座標系 2.3.2 E R E S Li [4] A i x i E R (A) = (A i )T A i I 2 F (3) i V() E S (A, B) = x 3 4 y j x 2 x 1 p 13 y j p 2 p 3 p 1 p 11 y j p 12 テンプレート座標系 x 13 x 12 x 11 SIFT y j i V() j N (,i) A i x i + b i (A j x i + b j ) 2 2 (4) E R A i E S A i x i + b i A j x i + b j V() N (, i) i x i n F 2.3.3 SIFT 3 E C 2.2 SIFT (, ) j SIFT y j y j y j y j ( 4) SIFT y j y j m x i (i = 1... n) p i y j = w ji p i (5) i M(,j) M(, j) SIFT y j m w ji SIFT y j x i Li [4] w ji w ji = (1 y j x i 2 2/γ 2 ) 3 k M(,j) (1 y j x k 2 2 /γ2 ) 3 (6) γ SIFT y j m + 1 SIFT E C (P) = y j y j 2 2 = (,) j (,) G j k M(,j) w jk p k l M(,j) w jl p l 2 2 (7) E C G 2.2 SIFT j (, ) SIFT 2.4 (1) E R A i 4 (1) 3 ( i ) ( ii ) (1) ( iii ) c 2015 Inormation Processin Society o Japan 4

情報処理学会研究報告 よる変形を考慮した式 (1) の最適化 ステップ (i) では 対象物の剛体運動を仮定し 初期フ レームの点群を基準として連続するフレーム間の点軌跡 から逐次的に剛体位置合わせを行い 剛体変換パラメー タ 回転行列および並進ベクトル を特異値分解に基づく 手法 [11] により求める これらの剛体変換パラメータか ら 初期フレームを基準とした剛体運動パラメータを漸化 的に求める ここでは フレーム における回転行列を R 並進ベクトルを t とする (ただし 初期フレームで は R1 = I t1 = 0) ステップ (ii) では ステップ (i) で得られた剛体運動パ ラメータ (R, t ) を初期値として 式 (1) の最小化により テンプレート点 pi の初期値を得る ここで 同一フレー ム内の点が単一のアフィン変換にしたがって運動するもの と仮定して 式 (1) に対して下記の制約を課す i, Ai = A, bi = b (8) この制約の下で ES は常に 0 となることに注意して 式 (1) は次式に変形できる E (P, A, B) = αf EF + αr ER + αc EC データセット (A) (9) ただし EF = ER = pi (A xi + b ) 22 (10) i V( ) (A )T A I 2F (11) ここで αf, αr, αc は重みパラメータを表す 提案手法 では 最急降下法を用いて式 (9) を最小化する ステップ (iii) の最適化では (ii) で得られたテンプレー ト点および各フレームの単一のアフィン変換を初期値とし て 式 (1) を最小化するテンプレート点 pi および局所ア フィン変換 (Ai bi ) を推定する ここでは ステップ (ii) と同様に最急降下法を用いて式 (1) を最小化する 3. 実験 本稿では RGB-D カメラで移動 変形中の非剛体物体 を全周撮影した RGB-D 画像列から 提案手法によってテ ンプレートが生成可能であるかを確認する実験を行った データセット (B) 3.1 実験環境とデータセット 図 5 RGB 画像 およびデプス画像の例 実験では RGB-D カメラ (Microsot Kinect v2) を用い て (A) 上体と頭を動かしている人物 および (B) 腕を動 像の領域に基づいて RGB 画像についても人物領域のみ かしている人物を 2 周撮影して得られた RGB-D 画像列 を抽出した データセット (A) および (B) の RGB 画像お からなるデータセットに対して 3 次元テンプレートを生 よびデプス画像の一部を図 5 に示す 成する実験を行った デプス画像は背景領域を含むことか ら 人物の含まれ得るデプスの範囲を設定し 人物に対応 する 3 次元点群のみを抽出した また 抽出したデプス画 c 2015 Inormation Processin Society o Japan 3.2 実験結果 実験では オプティカルフローに基づく点追跡 [9] およ 5

(A) (A) (B) 7 (ii) (B) 6 ( ) ( ) 3 SIFT[10] RGB RGB SIFT SIFT RGB 3 6 3 (ii) α F = 1.0 α R = 100.0 α C = 1.0 (iii) α F = 0.1 α R = 1.0 α S = 1.0 α C = 1.0 (ii) 7 (ii) (A) (B) 8 (ii) (i) (A = I b = 0) ( (9)) (ii) (1) 9. (A) (ii) c 2015 Inormation Processin Society o Japan 6

目的関数 E' 目的関数 E' 1000000 100000 恒等変換 剛体変換 10000 1000 100 10 1 0 1000 2000 3000 パラメータの更新回数 (A) 1000000 100000 10000 恒等変換 剛体変換 (A) 1000 100 10 1 0 1000 2000 3000 パラメータの更新回数 (B) 8 ( (9)) (a) SIFT (iii) E C (b) (ii) (B) (ii) ( 7 (B)) 2 (iii) 3 4. 3 RGB-D RGB-D 3 (B) 9 (iii) RGB-D RGB SIFT RGB-D 3 3 ( A No.23240024) c 2015 Inormation Processin Society o Japan 7

[1] Newcombe, R. A., Loverove, S. J. and Davison, A. J.: DTAM: Dense trackin and mappin in real-time, Proc. IEEE Int l Con. Computer Vision (ICCV), pp. 2320 2327 (2011). [2] Pradeep, V., Rhemann, C., Izadi, S., Zach, C., Bleyer, M. and Bathiche, S.: MonoFusion: Real-time 3D reconstruction o small scenes with a sinle web camera, Proc. IEEE Int l Symp. Mixed and Aumented Reality (IS- MAR), pp. 83 88 (2013). [3] Newcombe, R. A., Davison, A. J., Izadi, S., Kohli, P., Hillies, O., Shotton, J., Molyneaux, D., Hodes, S., Kim, D. and Fitzibbon, A.: KinectFusion: Real-time dense surace mappin and trackin, Proc. IEEE Int l Symp. Mixed and Aumented Reality (ISMAR), pp. 127 136 (2011). [4] Li, H., Adams, B., Guibas, L. J. and Pauly, M.: Robust sinle-view eometry and motion reconstruction, ACM Trans. Graphics (TOG), Vol. 28, No. 5, p. 175 (2009). [5] Zollhöer, M., Nießner, M., Izadi, S., Rehmann, C., Zach, C., Fisher, M., Wu, C., Fitzibbon, A., Loop, C., Theobalt, C. and Stamminer, M.: Real-time non-riid reconstruction usin an RGB-D camera, ACM Trans. Graphics (TOG), Vol. 33, No. 4 (2014). [6] Li, H., Sumner, R. W. and Pauly, M.: Global correspondence optimization or non-riid reistration o depth scans, Proc. Symp. Geometry Processin (SGP), pp. 1421 1430 (2008). [7] Amber, B., Romdhani, S. and Vetter, T.: Optimal step nonriid ICP alorithms or surace reistration, Proc. IEEE Con. Computer Vision and Pattern Reconition (CVPR), 8 paes (2007). [8] Besl, P. J. and McKay, N. D.: Method or reistration o 3-D shapes, Robotics-DL tentative, pp. 586 606 (1992). [9] Sundaram, N., Brox, T. and Keutzer, K.: Dense point trajectories by GPU-accelerated lare displacement optical low, Proc. European Conerence on Computer Vision (ECCV), pp. 438 451 (2010). [10] Lowe, D. G.: Distinctive imae eatures rom scaleinvariant keypoints, Int l Journal o Computer Vision, Vol. 60, No. 2, pp. 91 110 (2004). [11] Arun, K. S., Huan, T. S. and Blostein, S. D.: Leastsquares ittin o two 3-D point sets, IEEE Trans. Pattern Analysis and Machine Intellience (TPAMI), No. 5, pp. 698 700 (1987). c 2015 Inormation Processin Society o Japan 8