2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Ni
|
|
|
- ありさ くだら
- 7 years ago
- Views:
Transcription
1 DEIM Forum 2012 B Web, 1. Web Web TinEye 1 Google
2 2. 30 Visual Words TF-IDF Lowe [4] Scale-Invarient Feature Transform (SIFT) Bay [1] Speeded Up Robust Features (SURF) SIFT 128 SURF 64 Visual Words Nister [2] SIFT SURF K-means K-means 7 K-means 1,111,111 K-means L1 L2 Visual Words Brown SIFT kd k m m = 6 RANSAC 3. : 1 : 10 (a) (b) (c) ( ) 1 1 2
3 3. 1 画像の類似性 画像の類似性とは ある画像全体の特徴と 別のある画像 全体の特徴が類似しているということである ある画像集合 In ={img1, img2,..., imgi,..., imgn } があるとする ここで n は画像集合の画像の数である そのうちの 1 つの画像 imgi が入力として与えられたとき 出力として その画像と類似す る他の画像集合が得られるとする この機能は 2 つの画像の (a) Image1 (b) Image2 (c) Image3 (d) Image4 (e) Image5 (f) Image6 類似性を計算する以下のような関数があれば実現される Sim(imgi, imgj ) 1< j =i< = n 1 < =j< = n かつ i = この関数は 実数を返し imgj と imgi の類似性が高いほど 大きな値を返すものとする 3. 2 画像の隣接性 本節では 画像検索における 画像の隣接性について説明 する 例を示しながら説明を行う 図 1 は金閣寺の画像である キー ワードクエリとして 金閣寺 が与えられると 画像検索シス テムからは 図 1 に示したような画像と類似する画像を数多く 検索結果が返される 実際に 金閣寺においてこの写真に写る 湖を周ると 図 1(b) のような光景も見ることができる さら に歩くと 図 1(c) のような光景も目にすることになる 図 1(c) には まだ 少しではあるが 金閣が見えている これは確か に金閣寺の光景であるのだが 人によっては分からないかもし れない さらに 図 1(d) や図 1(e) まで行くと ここがどこか 分かる人はあまりいないと考えられる これらは全て金閣寺に おいて撮影された写真であるのだが これらのどれも 1 枚では 金閣寺の実際の情景や環境を表現できておらず これらを総体 としたときによりよく金閣寺の実情が表現できると考えられる また 昼と夜 季節の変化などによって 情景は変化すること が考えられる 金閣寺の場合 図 1(f) や図 1(g) のような変化 (g) Image7 図 1 (a) 典型的な金閣寺の画像 (b)-(e) あまり典型的ではない金閣 の画像 (f) 秋の紅葉の金閣寺の画像 (g) 冬の雪の金閣寺の画 を見せる これにより 金閣寺の実際の情景といえば 季節や 像 (a) の画像だけ見ても金閣寺の実際の情景が分かるわけでは 時間による変化も含めて考慮する必要があると考えている ない そのため 我々の仮定の基では (b)-(e) の画像も (a) の 画像の隣接性とは ある画像と 別のある画像が部分的に 画像とまとめて扱うべきであるとしている さらに (f) や (g) 一致しており 実世界で隣接することを指す ある画像集合 のように金閣寺が珍しい情景を見せていることもあり これらも In ={img1, img2,..., imgi,..., imgn } があるとする ここで 含めて 金閣寺の実際の情景を表していると考えるべきである n は画像集合の画像の数である そのうちの 1 つの画像 imgi が入力として与えられたとき 出力として その画像と隣接す を用いれば 図中の画像 i1 がクエリとして与えられたときに る他の画像集合が得られるとする この機能は 2 つの画像の それとパノラマ合成可能であるような画像 i2 が存在したとす 隣接性を計算する以下のような関数があれば実現される ると 画像の隣接性を考慮して 画像 i2 を発見することは可能 である さらに 画像 i2 と画像 i3 の隣接性が高いことを考慮 Adj(imgi, imgj ) して 画像 i3 まで発見することも可能である 一方 類似性に 1< j =i< = n 1 < =j< = n かつ i = この関数は 実数を返し imgj と imgi の隣接性が高いほど ついては この場合 残念ながら画像 i1 と類似する画像がな 大きな値を返すものとする 発見することはできない ここまでが 画像の隣接性と類似性 3. 3 画像の類似性と隣接性の同時利用 本節では 画像の類似性と隣接性を同時に利用した場合にど のようなことが可能になるかについて説明する かった つまり クエリが画像 i1 の場合 いかなる類似画像も を別個に利用した場合である 画像の類似性と隣接性を同時に考慮した場合には クエリが 画像 i1 の場合 まず 隣接性を考慮して 画像 i2 が発見され 図 2 は それら 2 つの関係性を考慮することによって どの さらに 画像 i3 も発見することができる ここで 画像 i2 に ようなことが可能になるかを表している 既存の画像検索技術 は類似する画像 j2 と画像 j3 がある 我々の仮定が正しいとす
4 L1 L2 L1 Nister NisterScore(img i, img j ) = s(q, d) = img i img i img j img j 2 i 1 i 2 i 2 j 2 j 3 i 1 j 2 j 3 i 1 j 2 j 3 4. TextRank TextRank 4. 1 TextRank Nister [2] Nister 1 i w i q i d i q i = n iw i d i = m i w i n i i m i 2 Nister Nister Color Coherence Vectors (CCV) Pass [5] CCV CCV CCV < (α 1, β 1 ),..., (α n, β n ) > CCV α j β j 2 CCV n CCV Score(img i, img j ) = G = (α j α j) + (β j β j) j=1 2 img i img j Sim(img i, img j ) = w 1 NisterScore(img i, img j ) + w 2 CCV Score(img i, img j ) w 1 w 2 w 1 + w 2 = [3] 2 2 SURF 2 RANSAC 2 2 img i img j
5 N cp Adj(img i, img j ) = Min(N imgi, N imgj ) N cp N imgi img i SURF TextRank [6] S(V i ) = (1 d) v i + d V j In(V i ) w ji V k Out(V j ) w S(V j ) jk d In(V i ) V i Out(V j ) V j img i V i v i V i v i = { 1, imgi SI SI 0, img i / SI SI w jk w jk = λ 1 Sim(img j, img k ) + λ 2 Adj(img j, img k ) λ 1 λ 2 λ 1 + λ 2 = Web Web Flickr 2 Flickr Flickr TextRank N m m = N TextRank N img 1 img 3... img n 1 3 k v imgi =(w 1 v 1, w 2 v 2,..., w j v j,..., w m v m ) v imgi img i w j v j m 1 < = i < = m v j = { 1, when it tagged to imgi 0, otherwise v j v seedi co(v j, v seedi ) = Iv j Iv seed i I vj + I vseedi v seedi 1 I vj v j I vseedi v seedi v j w j = N co(v j, v seedi ) i=1 N T Sim(img i, img j ) = v i v j v i v j
6 T Sim(img i, img j) w ij 4. 1 TextRank N Flickr 14,366 Mean Average Precision: MAP ,,,,,,,,,,,,, g b d d e e g e g h 6. 2
7 TextRank Flickr 7. COE. [1] Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van Gool SURF: Speeded Up Robust Features, Computer Vision and Image Understanding (CVIU), Vol. 110, No. 3, pp , 2008 [2] D. Nister and H. Stewenius, Scalable Recognition with a Vocabulary Tree, Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp , 2006 [3] M. Brown and D. G. Lowe, Recognising panoramas, Proceedings of Ninth IEEE International Conference on Computer Vision, Vol. 2, pp , 2003 [4] David G. Lowe, Distinctive image features from scaleinvariant keypoints, International Journal of Computer Vision, Vol. 60, No. 2, pp , 2004 [5] Greg Pass, Ramin Zabih, Justin Miler, Comparing images using color coherence vectors, Proceedings of the Fourth ACM international conference on Multimedia, pp , 1996 [6] Rada Mihalcea and Paul Tarau, TextRank: Bringing Order into Texts, Proceedings of EMNLP, pp , 2004
SICE東北支部研究集会資料(2013年)
280 (2013.5.29) 280-4 SURF A Study of SURF Algorithm using Edge Image and Color Information Yoshihiro Sasaki, Syunichi Konno, Yoshitaka Tsunekawa * *Iwate University : SURF (Speeded Up Robust Features)
LBP 2 LBP 2. 2 Local Binary Pattern Local Binary pattern(lbp) [6] R
DEIM Forum 24 F5-4 Local Binary Pattern 6 84 E-mail: {tera,kida}@ist.hokudai.ac.jp Local Binary Pattern (LBP) LBP 3 3 LBP 5 5 5 LBP improved LBP uniform LBP.. Local Binary Pattern, Gradient Local Auto-Correlations,,,,
(MIRU2008) HOG Histograms of Oriented Gradients (HOG)
(MIRU2008) 2008 7 HOG - - E-mail: [email protected], {takigu,ariki}@kobe-u.ac.jp Histograms of Oriented Gradients (HOG) HOG Shape Contexts HOG 5.5 Histograms of Oriented Gradients D Human
28 TCG SURF Card recognition using SURF in TCG play video
28 TCG SURF Card recognition using SURF in TCG play video 1170374 2017 3 2 TCG SURF TCG TCG OCG SURF Bof 20 20 30 10 1 SURF Bag of features i Abstract Card recognition using SURF in TCG play video Haruka
28 Horizontal angle correction using straight line detection in an equirectangular image
28 Horizontal angle correction using straight line detection in an equirectangular image 1170283 2017 3 1 2 i Abstract Horizontal angle correction using straight line detection in an equirectangular image
A Survey on Image Recognition Using Geo-tag Information
Geo A Survey on Image Recognition Using Geo-tag Information 1 48106417 Abstract Geo-tag is a type of metadata of various media such as photographs, videos, websites and more other media. In the case of
SURF,,., 55%,.,., SURF(Speeded Up Robust Features), 4 (,,, ), SURF.,, 84%, 96%, 28%, 32%.,,,. SURF, i
24 SURF Recognition of Facial Expression Based on SURF 1130402 2013 3 1 SURF,,., 55%,.,., SURF(Speeded Up Robust Features), 4 (,,, ), SURF.,, 84%, 96%, 28%, 32%.,,,. SURF, i Abstract Recognition of Facial
IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa
3,a) 3 3 ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransac. DB [] [2] 3 DB Web Web DB Web NTT NTT Media Intelligence Laboratories, - Hikarinooka Yokosuka-Shi, Kanagawa 239-0847 Japan a) [email protected]
(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i
24 Region-Based Image Retrieval using Color Histogram Feature 1130340 2013 3 1 (VKIR) VKIR VKIR DCT (R) (G) (B) 64 64 Ward 20 1 20 1 20. 5 10 2 DCT i Abstract Region-Based Image Retrieval using Color Histogram
Convolutional Neural Network A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolution
Convolutional Neural Network 2014 3 A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolutional Neural Network Fukui Hiroshi 1940 1980 [1] 90 3
3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)
(MIRU2012) 2012 8 820-8502 680-4 E-mail: {d kouno,shimada,endo}@pluto.ai.kyutech.ac.jp (1) (2) (3) (4) 4 AdaBoost 1. Kanade [6] CLAFIC [12] EigenFace [10] 1 1 2 1 [7] 3 2 2 (1) (2) (3) (4) 4 4 AdaBoost
2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo
DEIM Forum 2012 D9-4 606 8501 E-mail: {sasage,tsukuda,nakamura,tanaka}@dl.kuis.kyoto-u.ac.jp,,,, 1. 2000 1 20 10 GPS A A A A A A A 2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] Email PLUM
IPSJ SIG Technical Report Vol.2014-MBL-70 No.46 Vol.2014-UBI-41 No /3/15 1,a) 1,b) 1,c) 6 Assist of Sharing the Experiences in Library using Mu
1,a) 1,b) 1,c) 6 Assist of Sharing the Experiences in Library using Multiple Person s Vision Abstract: In this paper, I propose the system that assists of sharing the experiences in library using multiple
,,.,.,,.,.,.,.,,.,..,,,, i
22 A person recognition using color information 1110372 2011 2 13 ,,.,.,,.,.,.,.,,.,..,,,, i Abstract A person recognition using color information Tatsumo HOJI Recently, for the purpose of collection of
1 911 9001030 9:00 A B C D E F G H I J K L M 1A0900 1B0900 1C0900 1D0900 1E0900 1F0900 1G0900 1H0900 1I0900 1J0900 1K0900 1L0900 1M0900 9:15 1A0915 1B0915 1C0915 1D0915 1E0915 1F0915 1G0915 1H0915 1I0915
IPSJ SIG Technical Report Vol.2013-CVIM-187 No /5/30 1,a) 1,b), 1,,,,,,, (DNN),,,, 2 (CNN),, 1.,,,,,,,,,,,,,,,,,, [1], [6], [7], [12], [13]., [
,a),b),,,,,,,, (DNN),,,, (CNN),,.,,,,,,,,,,,,,,,,,, [], [6], [7], [], [3]., [8], [0], [7],,,, Tohoku University a) [email protected] b) [email protected], [3],, (DNN), DNN, [3],
AHPを用いた大相撲の新しい番付編成
5304050 2008/2/15 1 2008/2/15 2 42 2008/2/15 3 2008/2/15 4 195 2008/2/15 5 2008/2/15 6 i j ij >1 ij ij1/>1 i j i 1 ji 1/ j ij 2008/2/15 7 1 =2.01/=0.5 =1.51/=0.67 2008/2/15 8 1 2008/2/15 9 () u ) i i i
DEIM Forum 2012 E Web Extracting Modification of Objec
DEIM Forum 2012 E4-2 670 0092 1 1 12 E-mail: [email protected], {dkitayama,sumiya}@shse.u-hyogo.ac.jp Web Extracting Modification of Objects for Supporting Map Browsing Junki MATSUO, Daisuke
(4) ω t(x) = 1 ω min Ω ( (I C (y))) min 0 < ω < C A C = 1 (5) ω (5) t transmission map tmap 1 4(a) 2. 3 2. 2 t 4(a) t tmap RGB 2 (a) RGB (A), (B), (C)
(MIRU2011) 2011 7 890 0065 1 21 40 105-6691 1 1 1 731 3194 3 4 1 338 8570 255 346 8524 1836 1 E-mail: {fukumoto,kawasaki}@ibe.kagoshima-u.ac.jp, [email protected], [email protected],
[1] SBS [2] SBS Random Forests[3] Random Forests ii
Random Forests 2013 3 A Graduation Thesis of College of Engineering, Chubu University Proposal of an efficient feature selection using the contribution rate of Random Forests Katsuya Shimazaki [1] SBS
WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp
Query-by-Dancing: WISS 2018. Query-by-Dancing Query-by-Dancing 1 OpenPose [1] Copyright is held by the author(s). DJ DJ DJ WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias
DEIM Forum 2019 H Web 1 Tripadvisor
DEIM Forum 2019 H7-2 163 8677 1 24 2 E-mail: [email protected], [email protected] Web 1 Tripadvisor 1 2 1 1https://www.tripadvisor.com/ 2https://www.jalan.net/kankou/ 1 2 3 4 5 6 7 2 2.
,255 7, ,355 4,452 3,420 3,736 8,206 4, , ,992 6, ,646 4,
30 8 IT 28 1,260 3 1 11. 1101. 1102. 1103. 1 3 1,368.3 3 1,109.8 p.5,p.7 2 9,646 4,291 14.5% 10,p.11 3 3,521 8 p.13 45-49 40-44 50-54 019 5 3 1 2,891 3 6 1 3 95 1 1101 1102 1103 1101 1102 1103 1 6,255
& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),
.... Deeping and Expansion of Large-Scale Random Fields and Probabilistic Image Processing Kazuyuki Tanaka The mathematical frameworks of probabilistic image processing are formulated by means of Markov
1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means
Web, Web k-means 62% Associating Faces and Names in Web Photo News Akio Kitahara and Keiji Yanai We propose a system which extracts faces and person names from news articles with photographs on the Web
1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +
3 3D 1,a) 1 1 Kinect (X, Y) 3D 3D 1. 2010 Microsoft Kinect for Windows SDK( (Kinect) SDK ) 3D [1], [2] [3] [4] [5] [10] 30fps [10] 3 Kinect 3 Kinect Kinect for Windows SDK 3 Microsoft 3 Kinect for Windows
% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii
2012 3 A Graduation Thesis of College of Engineering, Chubu University High Accurate Semantic Segmentation Using Re-labeling Besed on Color Self Similarity Yuko KAKIMI 2400 90% 2 3 [1] Semantic Texton
す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(
IR E-mail: [email protected] Abstract IR RGB ( ) IR IR IR RGB RGB PSNR 1 Time-Of- Flight(TOF)[1] Kinect [2] TOF LED TOF [3] [6] [4][5] 2 [6] RGB ( ) Infrared(IR) IR 2 2.1 1 す 局所領域 ωk において 線形変換に用いる係数 (ak
2 3, 4, 5 6 2. [1] [2] [3]., [4], () [3], [5]. Mel Frequency Cepstral Coefficients (MFCC) [9] Logan [4] MFCC MFCC Flexer [10] Bogdanov2010 [3] [14],,,
DEIM Forum 2016 E1-4 525-8577 1 1-1 E-mail: [email protected], [email protected], [email protected] 373 1.,, itunes Store 1, Web,., 4,300., [1], [2] [3],,, [4], ( ) [3], [5].,,.,,,,
Gaze Head Eye (a) deg (b) 45 deg (c) 9 deg 1: - 1(b) - [5], [6] [7] Stahl [8], [9] Fang [1], [11] Itti [12] Itti [13] [7] Fang [1],
1 1 1 Structure from Motion - 1 Ville [1] NAC EMR-9 [2] 1 Osaka University [3], [4] 1 1(a) 1(c) 9 9 9 c 216 Information Processing Society of Japan 1 Gaze Head Eye (a) deg (b) 45 deg (c) 9 deg 1: - 1(b)
JFE.dvi
,, Department of Civil Engineering, Chuo University Kasuga 1-13-27, Bunkyo-ku, Tokyo 112 8551, JAPAN E-mail : [email protected] E-mail : [email protected] SATO KOGYO CO., LTD. 12-20, Nihonbashi-Honcho
Microsoft PowerPoint - pr_12_template-bs.pptx
12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算
BDH Cao BDH BDH Cao Cao Cao BDH ()*$ +,-+.)*$!%&'$!"#$ 2. 1 Weng [4] Metric Learning Weng DB DB Yang [5] John [6] Sparse Coding sparse coding DB [7] K
Bucket Distance Hashing Metric Learning 1,a) 1,b) 1,c) 1,d) (DB) [1] DB Cao [2] Cao Metric Learning Cao Cao Cao Cao Cao 100 DB 10% 1. m DB DB DB 1 599 8531 1 1 Graduate School of Engineering, Osaka Prefecture
3 Abstract CAD 3-D ( ) 4 Spin Image Correspondence Grouping 46.1% 17.4% 97.6% ICP [0.6mm/point] 1 CAD [1][2]
3 E-mail: {akizuki}@isl.sist.chukyo-u.ac.jp Abstract CAD 3-D ( ) 4 Spin Image Correspondence Grouping 46.1% 17.4% 97.6% ICP [0.6mm/point] 1 CAD [1][2] Shape Index [3] [4][5] 3 SHOT [6] [7] Point Pair Feature
IS2-06 第21回画像センシングシンポジウム 横浜 2015年6月 画像をスーパーピクセルに変換する手法として SLIC[5] を用いる Achanta らによって提案された SLIC 2.2 グラフマッチング は K-means をベースにした手法で 単純な K-means に いる SPIN
Cosegmentation E-mail: {tamanaha, nakayama}@nlab.ci.i.u-tokyo.ac.jp Abstract Cosegmentation Cosegmentation Cosegmentation 1 Never Ending Image Learner[1] Google Cosegmentation Cosegmentation Rother [2]
研修コーナー
l l l l l l l l l l l α α β l µ l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l
. 2015 2013 2014 2015 2 3 4 1 33 2. 1 2-1 2010 3,018 399 0.7 0.8 2005 2010 2-2 2010 4,944 1,112 3.9 8.9 2005 2010 9,400 2-1 2-2 2 2-1 NITAS ver2.2 [ 2 ] 30 30 10 5m 20 30 10km 2-3 30 10 2 34 35 36 (2)
1(a) (b),(c) - [5], [6] Itti [12] [13] gaze eyeball head 2: [time] [7] Stahl [8], [9] Fang [1], [11] 3 -
Vol216-CVIM-22 No18 216/5/12 1 1 1 Structure from Motion - 1 8% Tobii Pro TX3 NAC EMR ACTUS Eye Tribe Tobii Pro Glass NAC EMR-9 Pupil Headset Ville [1] EMR-9 [2] 1 Osaka University Gaze Head Eye (a) deg
3.1 Thalmic Lab Myo * Bluetooth PC Myo 8 RMS RMS t RMS(t) i (i = 1, 2,, 8) 8 SVM libsvm *2 ν-svm 1 Myo 2 8 RMS 3.2 Myo (Root
1,a) 2 2 1. 1 College of Information Science, School of Informatics, University of Tsukuba 2 Faculty of Engineering, Information and Systems, University of Tsukuba a) [email protected] 2.
