Microsoft PowerPoint - IBIS-shinoda-print.pptx

Size: px
Start display at page:

Download "Microsoft PowerPoint - IBIS-shinoda-print.pptx"

Transcription

1 第 15 回情報理論的学習理論ワークショップ (IBIS2012) コミュニケーションとしての 映像とその検索 篠 浩 ( 東京 業 学 )

2 講演の内容 1. 声と映像 2. TRECVID Semantic Indexing (SIN) 3. SIN のための 声技術 4. TRECVID Multimedia Event Detection (MED) 5. まとめ 2

3 EB/Month インターネット映像の急増 Youtube (2011): Increase 48 hours / min 3,000,000,000 views / day VIDEO OTHER IP Traffic (Cisco Visual Networking Index ) 3

4 No Meta data Low quality Large Variety Mostly Useless

5 課題 インターネット映像からの Content-Based Video Retrieval (CBVR) これまでの研究対象 TV ドラマ, 映画, ニュース, スポーツなど ジャンルが特定 品質 プロによる編集 メタデータが豊富 インターネット映像とは明らかに異なる どのような 法論をとるべきか? 5

6 Babble Gartner Hype Cycle for 2011 Image Recognition Video Analysis for Consumer Service Gesture Recognition Biometric Authentication Method Speech Recognition Crash! 6

7 声研究から学べないか? 映像研究はこれから Babble 声研究は Babble Crash から き延びた Babble Video Analysis for Consumer Service Speech Recognition Crash! 7

8 声 萌芽開発実 画像 萌芽開発実 映像 萌芽開発実 year 8

9 国国防省 (DARPA) 声認識ベンチマーク WORD ERROR RATE 100% 10% 1k Spontaneous Speech ATIS Resource Management Read Speech WSJ 20k 5k Switchboard Conversational Speech Varied Microphone Noisy foreign Broadcast Speech NAB foreign 段階的にタスクを設定 着実に技術を蓄積 1% Courtesy NIST 1999 DARPA HUB-4 Report, Pallett et al

10 声と映像は違う? 声は1 次元 映像は3 次元 声には Semantic Gap がない (? ) 声はコミュニケーションの道具であるが映像は違う (? ) 映像は 声のような明確な構造がない (?) ( 素 形態素 単語 法 ) 10

11 声と映像は同じ 送り 受け Audio Channel メッセージ メッセージ Video Channel 映像はコミュニケーションの 段 ( 明 的な ) 語彙や 法をもつ 声にも Semantic Gap は存在する 11

12 映像検索のための 声技術 1. 送り をモデル化するための 成モデル 2. 低品質 多様性 データ不 に頑健な確率的フレームワーク 3. 速計算 法 12

13 機械学習によるアプローチ ( 共通 ) 声 画像 映像 + = データ量計算量 Semantic gap 特定の応 に集中 他機関との協働 13

14 TRECVID Semantic Indexing 14

15 TRECVID (TREC Video Retrieval Evaluation) 2001 年に Text REtrieval Conference (TREC) から独 NIST(National Institute of Standard and Technology) が主催 的 : 映像コンテンツ分析 検索研究の促進クローズドな国際競争型ワークショップホームページ : 規模データが使える ( 著作権等の問題をクリア ) 法の 較が容易 そのため進歩が速い ラベル付け作業を分担 勝ち負けがはっきりする 15

16 TRECVID タスクの歴史 Known item search Semantic indexing Shot boundary detection Story segmentation Low-level feature extraction Rushes summarization Content-based copy detection Surveillance event detection Instance search Multimedia event detection

17 TRECVID データセット TV news TV shows Internet video Data (hours) 17

18 2011 年 TRECVID 66 チームが参加 ( 本からは 12 チーム ) 5 tasks: Semantic indexing (SIN) Multimedia event detection (MED) Known item search (KIS) Instance search (INS) Surveillance event detection (SED) 18

19 的 Semantic Indexing (SIN) ビデオショットからの Concept を検出 Concepts: objects, scenes,... TRECVID の中核的タスク 静 画の 般物体認識に対応 19

20 Multimedia Event Detection (MED) 的ビデオクリップからのイベント検出 e.g. Batting a run in Making a cake SIN より 次の対象 スポーツ番組からのハイライト検出 をインターネット映像まで延 20

21 的 Instance Search (INS) 特定の 物 場所 ロゴを検出 対象は明確 学習データは少ない データベース :BBC rushes 21

22 Known Item Search (KIS) 的 詳細なテキスト記述に合致する映像シーンを検出 例 : いシャツの男が にりんごをあげている 学習データなし SIN タスクで得られた コンセプトを利 22

23 Surveillance Event Detection (SED) 的監視カメラからのイベント検出 イベント : PeopleRuns, Pointing, PeopleMeet, など 混雑状況 固定カメラ データベース イギリス ガトウィック空港における 5 台の監視カメラ映像 (145 時間 ) 23

24 Semantic Indexing (SIN) 24

25 タスク設定 データベース :IACC (Internet Archive videos with Creative Commons licenses) : 600 h コンセプト数 : 346 Run: 各々のコンセプトについて上位 2000 個のショットのリストを提出 各々のチームは最 4 つの Run を提出できる 評価基準 : Average Precision (AP) 1 : Rank :Number of true shots from 1st to k-th 25

26 コンセプトの出現頻度 Number of positive samples in 264,673 training video shots Outdoor (29,997 shots) more than 10,000 5% # positive shots Singing (3875 shots) 1% of development data Airplane (371 shots) 346 semantic concepts 26

27 Bag of Words (BoW) 静 画における 般物体認識で主流 ショット局所特徴ヒストグラム SVM キーフレームを利 計算量が 較的少ない 量 化誤差が きい 27

28 新たな動き (1) : 頑健性 低品質 多様性 データ不 に対応 More features SIFT, Color SIFT, SURF, HOG, GIST, Dense features Multi-modal 声の利 : Singing, Dance, Car, etc. Multi-frame キーフレーム以外を利 Soft clustering 量 化誤差の低減 28

29 新たな動き (2) : 速化 参加 58チーム中 28チーム ( 半分 ) しか結果を提出できなかった 近似アルゴリズム 分散処理 Graphical Processing Unit (GPU) の利 29

30 期待したが効果のなかったもの 局特徴 ( ヒストグラムなど ) 局所特徴だけで 分 ( 相補的な関係にない ) 声認識, OCR それら 体の性能が低い 物体の位置検出 位置検出性能が低い 位置のない Concept も Concept 間のコンテキスト データ量が少なすぎる 30

31 Semantic Indexing のための 声技術 31

32 3 つの 声技術 1. 多様性 低品質 Gaussian Mixture Models (GMM) 2. データ不 MAP 適応 3. 速化 構造サーチ 32

33 フレームワーク video (shot) Tree-structured GMM 1) SIFT-Har GMMs supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 33

34 特徴抽出 video (shot) Tree-structured GMMs 1) SIFT-Har GMM supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 34

35 低次特徴 6 つの画像特徴 SIFT-Har, SIFT-Hes, SIFTH-Dense, HOG-Dense, HOG-Sub Multi-modal 響特徴 : Mel-Frequency Cepstral Coefficient (MFCC) Multi-frame 毎フレーム 1 フレームおき 2 秒に 1 フレームなど 35

36 1) SIFT-Har - Harris-affine detector - Multi-frame (every two frame) 2) SIFT-Hes - Hessian-affine detector - Multi-frame (every two frame) 3) SIFTH-Dense - SIFT + Hue histogram - 30,000 samples in a key frame 4) HOG-Dense - 32 dim HOG feature - 10,000 samples in a key frame 5) HOG-Sub - Temporal differential of HOG - Detect movement 画像特徴 Reduce dim to 32 by PCA 36

37 響特徴 :MFCC Mel-frequency cepstral coefficients 声認識 響イベント認識でよく いられる MFCC(12) MFCC(12) MFCC(12) Log-power(1) Log-power(1) 37

38 コンセプトのモデル video (shot) Tree-structured GMMs 1) SIFT-Har GMM supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 38

39 声技術その 1 Gaussian Mixture Model (GMM) ガウス分布の重み付け和 : 特徴 : 混合成分 k の重み 1), Σ : 混合成分 k の平均と分散 各々のショットを GMM でモデル化 39

40 GMM は BoW の拡張 BoW GMM Code vector Gaussian mean Histogram Weight distribution Red Color: ショットごとに推定 40

41 声技術その 2 Maximum A Posteriori (MAP) 適応 転移学習の 法 GMMの平均ベクトルに対し その事前分布を仮定 1. すべての学習データを いて Universal background model (UBM) を推定 2. UBM を初期モデルとして MAP 適応により GMM の平均ベクトルを推定する 事前分布 :UBM における 対応する分布 UBM MAP adaptation より少ないデータ量で 精度な推定 32

42 MAP 適応 :,,,Σ : UBMにおける混合成分 の平均と分散 : 混合成分 の平均のMAP 推定量 : 制御パラメータ where に対する混合成分の負担率 漸近的な性質をもつ データが少なくなると データが多くなると は最尤推定量に近づく 42

43 識別器 video (shot) Tree-sturuc 1) SIFT-Hartured GMMs GMM supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 43

44 GMM Supervector + SVM 1. GMM の平均ベクトルを連結 GMM supervector where normalized mean 2. Support Vector Machine (SVM) with RBF kernel GMM に対する Fisher Kernel の近似

45 Score fusion SVM スコアの重み付け和 where 重みは Concept ごとに cross validation で決定 45

46 計算量 HOG-Dense 特徴を いたときの計算時間 (sec) Feature PCA GMM Estimation SVM GMM の推定が 部分 46

47 負担率の計算の高速化 where High cost! に対する混合成分の負担率 47

48 声技術その 3 構造 GMM を いた 速計算 がどの混合成分に属するか? (BoW: をどのコードに割り当てるか?) Gaussian components 48

49 負担率 : 局所特徴に対する混合成分の負担率 Gaussian components 49

50 特徴量空間の 部でのみ計算 Gaussian components 50

51 構造 GMM (1) Leaf layer 混合成分間の距離 : Symmetric KL divergence Gaussian components 51

52 構造 GMM (2) Non-leaf layers ノードのガウス分布は リーフのガウス分布集合を近似 Gaussian components 52

53 構造 GMM (3) Non-leaf layers ノードのガウス分布は リーフのガウス分布集合を近似 Gaussian components 53

54 構造 GMM (4) Non-leaf layers ノードのガウス分布は リーフのガウス分布集合を近似 Gaussian components 54

55 速サーチ (1) : Active nodes 55

56 速サーチ (2) : Active nodes 56

57 速サーチ (3) : Active nodes 57

58 TRECVID2011 SIN の結果 Mean InfAP: Inferred AP averaged over all concepts 58

59 コンセプト毎の Average Precision 59

60 効果的な低次特徴は? 60

61 GMM 推定の計算時間 検出性能の劣化なしに 4.2 倍の 速化 61

62 Multimedia Event Detection (MED) 62

63 Multimedia Event Detection (MED) 的ビデオクリップからのイベント検出 e.g. Batting a run in Making a cake SIN より 次の対象 スポーツ番組からのハイライト検出をインターネット映像まで延 データベース HAVIC : 2000 時間のホームビデオ Linguistic data consortium (LDC) が提供 63

64 MED (2) 2010に開始された新しいタスク 2011 年は18チーム ( 本からは5チーム ) 国情報省 (IARPA) のAutomated Low-Level Analysis and Description of Diverse Intelligence Video (ALADDIN) プロジェクトが援助 64

65 HAVIC データベース ビデオクリップ (2 分程度 ): 3488 個 サンプル : 各々のイベントに付き100 個 ( 半分が開発 半分がテスト ) 2010 (3 events) 2011 (10 events) Assembling a shelter Birthday party Making a sandwich Batting a run in Changing a vehicle tire Parade Making a cake Flash mob gathering Parkour Getting a vehicle unstuck Grooming an animal Repairing an appliance Working on a sewing project 65

66 評価基準 : Missed Detection Probability P miss 1 Recall False Alarm Probability P FA False Alarm / Clips with no events Normalized Detection Cost (NDC) 上記 2つを適当な重みで混合したもの 1 1 Cost Miss = 80 Cost FA = 1 P target =

67 SIN の 法を応 多くの特徴 +BoW+SVM トレンド 時空間特徴 STIP (Space-time interest point), etc. コンテキストのモデル化 (Semantic model) 効果があまりない データが少ない? 声認識 OCR 効果なし SIN と同じ理由 67

68 TRECVID2011 Mean Minimum NDC TRECVID 2011 MED runs Mean MNDC Mean ANDC 1 st Team nd Team rd Our team

69 69

70 70

71 頑健かつ 速な映像検索 おわりに 声分野で開発された技術が性能向上に寄与 GMM, MAP 適応, 構造サーチ 単語レベル (SIN) から レベル (MED) へ 映像のコミュニケーションモデル コンテキストの活 No data like more data データ量にスケールする技術が重要 計算の 速化がますます重要に 他に使える 声技術は? 語モデル 識別学習 Deep Learning, etc. 71

TRECVID Semantic Indexing TaskとMultimedia Event Detection Taskへの取り組み

TRECVID Semantic Indexing TaskとMultimedia Event Detection Taskへの取り組み OS5-O2 TRECVID Semantic Indexing Taskと Multimedia Event Detection Taskへの取り組み 樋爪和也, 柳井啓司 ( 電気通信大学 ) 背景 コンテンツベースの映像検索手法が盛んに TRECVID: 国際的な評価ワークショップ 膨大なデータ処理の必要性 4000 時間の大規模データ 本発表について TRECVID の概要 SIN タスク

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search 599 8531 1 1 E-mail: {sakata,matozaki}@m.cs.osakafu-u.ac.jp, {kise,masa}@cs.osakafu-u.ac.jp

More information

Microsoft PowerPoint - SSII_harada pptx

Microsoft PowerPoint - SSII_harada pptx The state of the world The gathered data The processed data w d r I( W; D) I( W; R) The data processing theorem states that data processing can only destroy information. David J.C. MacKay. Information

More information

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A

IPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A 1 1 TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM Analysis of video data recognition using multi-frame Kazuya Hidume 1 and Keiji Yanai 1 In this study, we aim to

More information

Automatic Collection of Web Video Shots Corresponding to Specific Actions using Web Images

Automatic Collection of Web Video Shots Corresponding to Specific Actions  using Web Images 視覚特徴およびタグ共起を用いた 大規模 Web ビデオショットランキング 電気通信大学大学院情報理工学研究科 総合情報学専攻 Do Hang Nga 柳井啓司 背景 Web 動画 : 無限に存在 無料で取得可能 - YouTube, Daily Motion etc. Web 動画による動作データ収集 ただし Web 上の動画はノイズが多い 関連動画 Play trumpet 非関連動画 非対応ショット

More information

,,, Twitter,,, ( ), 2. [1],,, ( ),,.,, Sungho Jeon [2], Twitter 4 URL, SVM,, , , URL F., SVM,, 4 SVM, F,.,,,,, [3], 1 [2] Step Entered

,,, Twitter,,, ( ), 2. [1],,, ( ),,.,, Sungho Jeon [2], Twitter 4 URL, SVM,, , , URL F., SVM,, 4 SVM, F,.,,,,, [3], 1 [2] Step Entered DEIM Forum 2016 C5-1 182-8585 1-5-1 E-mail: saitoh-ryoh@uec.ac.jp, terada.minoru@uec.ac.jp Twitter,, Twitter,,, Bag of Words, Latent Semantic Indexing,.,,,, Twitter,, Twitter,, 1. SNS, SNS Twitter 1,,,

More information

(MIRU2008) HOG Histograms of Oriented Gradients (HOG)

(MIRU2008) HOG Histograms of Oriented Gradients (HOG) (MIRU2008) 2008 7 HOG - - E-mail: katsu0920@me.cs.scitec.kobe-u.ac.jp, {takigu,ariki}@kobe-u.ac.jp Histograms of Oriented Gradients (HOG) HOG Shape Contexts HOG 5.5 Histograms of Oriented Gradients D Human

More information

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出

時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出 Web 動画 画像を用いた 特定動作ショットの自動収集 DO HANG NGA 樋爪和也柳井啓司 電気通信大学情報工学科 背景 既存の動画学習手法制限のある動画像 (e.g. KTH, Caltech) 教師なし学習手法 Web 上の動画 教師信号あり 動画量が少ない 研究の目的 特定動作についての Web データを使用して その動作の対応ショットを自動抽出 大量の Web 動画 ランキング 学習の必要なし

More information

bag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84

bag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84 Bag-of-Keypoints Web G.Csurka bag-of-keypoints Web Bag-of-keypoints SVM 5.% Web Image Classification with Bag-of-Keypoints Taichi joutou and Keiji yanai Recently, need for generic image recognition is

More information

動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S

動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S 1 2 2 1 Web An Automatic Music Video Creation System by Reusing Dance Video Content Sora Murofushi, 1 Tomoyasu Nakano, 2 Masataka Goto 2 and Shigeo Morishima 1 This paper presents a system that automatically

More information

Twitter‡Ì”À‰µ…c…C†[…g‡ðŠŸŠp‡µ‡½…^…C…•…›…C…fi‘ã‡Ì…l…^…o…„‘îŁñ„�™m

Twitter‡Ì”À‰µ…c…C†[…g‡ðŠŸŠp‡µ‡½…^…C…•…›…C…fi‘ã‡Ì…l…^…o…„‘îŁñ„�™m 27 Twitter 1431050 2016 3 14 1 Twitter,,.,.,., Twitter,.,,.,,. URL,,,. BoW(Bag of Words), LSI(Latent Semantic Indexing)., URL,,,,., Accuracy, AUC(Area Under the Curve), Precision, Recall, F,. URL,,,.,

More information

(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i

(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i 24 Region-Based Image Retrieval using Color Histogram Feature 1130340 2013 3 1 (VKIR) VKIR VKIR DCT (R) (G) (B) 64 64 Ward 20 1 20 1 20. 5 10 2 DCT i Abstract Region-Based Image Retrieval using Color Histogram

More information

24 Region-Based Image Retrieval using Fuzzy Clustering

24 Region-Based Image Retrieval using Fuzzy Clustering 24 Region-Based Image Retrieval using Fuzzy Clustering 1130323 2013 3 9 Visual-key Image Retrieval(VKIR) k-means Fuzzy C-means 2 200 2 2 20 VKIR 5 18% 54% 7 30 Fuzzy C-means i Abstract Region-Based Image

More information

(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te

(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te (MIRU2009) 2009 7 182 8585 1 5 1 E-mail: noguchi-a@mm.cs.uec.ac.jp, yanai@cs.uec.ac.jp cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-temporal Local Features Considering Consecutiveness of

More information

untitled

untitled (Robot Vision) Vision ( (computer) Machine VisionComputer Vision ( ) ( ) ( ) ( ) ( ) 1 DTV 2 DTV D 3 ( ( ( ( ( DTV D 4 () 5 A B C D E F G H I A B C D E F G H I I = A + D + G - C - F - I J = A + B + C -

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst 1,a) 1 1 1 deep neural netowrk(dnn) (HMM) () GMM-HMM 2 3 (CSJ) 1. DNN [6]. GPGPU HMM DNN HMM () [7]. [8] [1][2][3] GMM-HMM Gaussian mixture HMM(GMM- HMM) MAP MLLR [4] [3] DNN 1 1 triphone bigram [5]. 2

More information

Duplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF

Duplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF Partial Copy Detection of Line Drawings from a Large-Scale Database Weihan Sun, Koichi Kise Graduate School of Engineering, Osaka Prefecture University E-mail: sunweihan@m.cs.osakafu-u.ac.jp, kise@cs.osakafu-u.ac.jp

More information

2017 (413812)

2017 (413812) 2017 (413812) Deep Learning ( NN) 2012 Google ASIC(Application Specific Integrated Circuit: IC) 10 ASIC Deep Learning TPU(Tensor Processing Unit) NN 12 20 30 Abstract Multi-layered neural network(nn) has

More information

2 Fig D human model. 1 Fig. 1 The flow of proposed method )9)10) 2.2 3)4)7) 5)11)12)13)14) TOF 1 3 TOF 3 2 c 2011 Information

2 Fig D human model. 1 Fig. 1 The flow of proposed method )9)10) 2.2 3)4)7) 5)11)12)13)14) TOF 1 3 TOF 3 2 c 2011 Information 1 1 2 TOF 2 (D-HOG HOG) Recall D-HOG 0.07 HOG 0.16 Pose Estimation by Regression Analysis with Depth Information Yoshiki Agata 1 and Hironobu Fujiyoshi 1 A method for estimating the pose of a human from

More information

28 TCG SURF Card recognition using SURF in TCG play video

28 TCG SURF Card recognition using SURF in TCG play video 28 TCG SURF Card recognition using SURF in TCG play video 1170374 2017 3 2 TCG SURF TCG TCG OCG SURF Bof 20 20 30 10 1 SURF Bag of features i Abstract Card recognition using SURF in TCG play video Haruka

More information

IPSJ SIG Technical Report Vol.2010-CVIM-171 No /3/19 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) % MKL 68.8% Extractin

IPSJ SIG Technical Report Vol.2010-CVIM-171 No /3/19 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) % MKL 68.8% Extractin 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) 200 57.2% MKL 68.8% Extracting Spatio-Temporal Local Features for Classifying Web Video Shots Akitsugu Noguchi 1 and Keiji Yanai 1 Nowadays,

More information

スライド 1

スライド 1 A SURF-based Spatio-Temporal Feature for Feature-fusion-based Action Recognition 1. Background & Objective action recognition object/scene recognition Bag-of-features (BoF) of spatiotemporal features [Dollar

More information

第122号.indd

第122号.indd -1- -2- -3- 0852-36-5150 0852-36-5163-4- -5- -6- -7- 1st 1-1 1-2 1-3 1-4 1-5 -8- 2nd M2 E2 D2 J2 C2-9- 3rd M3 E3 D3 J3 C3-10- 4th M4 E4 D4 J4 C4-11- -12- M5 E5 J5 D5 C5 5th -13- -14- NEWS NEWS -15- NEWS

More information

shono_DIA06.ppt

shono_DIA06.ppt 8.6. 研究背景 大容量記憶メディアの普及 動画圧縮 転送技術の発達 放送方式のシフト シーン自動検出と投球動作分析を用いた 野球中継映像のインデキシング手法の提 案Detection and Automatic Scene マルチメディアコンテンツの氾濫 芝浦工業大学大学院 工学研究科 電気電子情報工学専攻 メディア工学研究室 庄野 雄紀 青木 義満 効率よい検索 管理技術への要求 6/3/ 研究背景

More information

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :

Google Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] : THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.,, 182-8585 1-5-1 E-mail: {maruya-t,akiyama-m}@mm.inf.uec.ac.jp, yanai@cs.uec.ac.jp SURF Bag-of-Features

More information

ホットスポット 1 音リアクションイベント BIC GMM 2 3 BIC GMM HMM 10) SVM 11) 12) 13) Bayesian Information Criterion BIC 14) BIC M = M 1, M 2,,

ホットスポット 1 音リアクションイベント BIC GMM 2 3 BIC GMM HMM 10) SVM 11) 12) 13) Bayesian Information Criterion BIC 14) BIC M = M 1, M 2,, 1 1 2 2 BIC GMM Acoustic Event Detection for Finding Hot Spots in Podcasts Kouhei Sumi, 1 Tatsuya Kawahara, 1 Jun Ogata 2 and Masataka Goto 2 This paper presents a method to detect acoustic events that

More information

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. fnirs Kai Kunze 599 8531 1 1 223 8526 4 1 1 E-mail: yoshimura@m.cs.osakafu-u.ac.jp, kai@kmd.keio.ac.jp,

More information

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta

IPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta 1 1 1 1 2 1. Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Takayuki Okatani 1 and Koichiro Deguchi 1 This paper presents a method for recognizing the pose of a wire harness

More information

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q

4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q x-means 1 2 2 x-means, x-means k-means Bayesian Information Criterion BIC Watershed x-means Moving Object Extraction Using the Number of Clusters Determined by X-means Clustering Naoki Kubo, 1 Kousuke

More information

[1] SBS [2] SBS Random Forests[3] Random Forests ii

[1] SBS [2] SBS Random Forests[3] Random Forests ii Random Forests 2013 3 A Graduation Thesis of College of Engineering, Chubu University Proposal of an efficient feature selection using the contribution rate of Random Forests Katsuya Shimazaki [1] SBS

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

本文6(599) (Page 601)

本文6(599) (Page 601) (MIRU2008) 2008 7 525 8577 1 1 1 E-mail: matsuzaki@i.ci.ritsumei.ac.jp, shimada@ci.ritsumei.ac.jp Object Recognition by Observing Grasping Scene from Image Sequence Hironori KASAHARA, Jun MATSUZAKI, Nobutaka

More information

10_08.dvi

10_08.dvi 476 67 10 2011 pp. 476 481 * 43.72.+q 1. MOS Mean Opinion Score ITU-T P.835 [1] [2] [3] Subjective and objective quality evaluation of noisereduced speech. Takeshi Yamada, Shoji Makino and Nobuhiko Kitawaki

More information

塗装深み感の要因解析

塗装深み感の要因解析 17 Analysis of Factors for Paint Depth Feeling Takashi Wada, Mikiko Kawasumi, Taka-aki Suzuki ( ) ( ) ( ) The appearance and quality of objects are controlled by paint coatings on the surfaces of the objects.

More information

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201 BGM 1,4,a) 1 2 2 3,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 2015 1 100.. Web.. BGM.BGM [1]. BGM BGM 1 Waseda University, Shinjuku, Tokyo 169-8555, Japan 2 3 4 JST CREST a) ha-ru-ki@asagi.waseda.jp.

More information

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro TV 1,2,a) 1 2 2015 1 26, 2015 5 21 Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Rotation Using Mobile Device Hiroyuki Kawakita 1,2,a) Toshio Nakagawa 1 Makoto Sato

More information

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp Query-by-Dancing: WISS 2018. Query-by-Dancing Query-by-Dancing 1 OpenPose [1] Copyright is held by the author(s). DJ DJ DJ WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias

More information

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa

IPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa 3,a) 3 3 ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransac. DB [] [2] 3 DB Web Web DB Web NTT NTT Media Intelligence Laboratories, - Hikarinooka Yokosuka-Shi, Kanagawa 239-0847 Japan a) yabushita.hiroko@lab.ntt.co.jp

More information

main.dvi

main.dvi DEIM Forum 2016 C5-4 305-8573 1-1-1 305-8573 1-1-1 Wikipedia Wikipedia () ( ),,, A Method of Assisting Movie Summarization by Aligning Plot Sentences and Shots ueshan LI, Kentaro DOMOTO, and Takehito UTSURO

More information

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1

No. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1 ACL2013 TACL 1 ACL2013 Grounded Language Learning from Video Described with Sentences (Yu and Siskind 2013) TACL Transactions of the Association for Computational Linguistics What Makes Writing Great?

More information

P2P Web Proxy P2P Web Proxy P2P P2P Web Proxy P2P Web Proxy Web P2P WebProxy i

P2P Web Proxy P2P Web Proxy P2P P2P Web Proxy P2P Web Proxy Web P2P WebProxy i 27 Verification of the usefulness of the data distribution method by browser cache sharing 1160285 2016 2 26 P2P Web Proxy P2P Web Proxy P2P P2P Web Proxy P2P Web Proxy Web P2P WebProxy i Abstract Verification

More information

A comparative study of the team strengths calculated by mathematical and statistical methods and points and winning rate of the Tokyo Big6 Baseball Le

A comparative study of the team strengths calculated by mathematical and statistical methods and points and winning rate of the Tokyo Big6 Baseball Le Powered by TCPDF (www.tcpdf.org) Title 東京六大学野球リーグ戦において勝敗結果から計算する優勝チームと勝点 勝率との比較研究 Sub Title A comparative study of the team strengths calculated by mathematical and statistical methods and points and winning

More information

Microsoft PowerPoint PresentationPRMU2008Nov.ppt [互換モード]

Microsoft PowerPoint PresentationPRMU2008Nov.ppt [互換モード] Dynamic Markov random fields for stochastic modeling of visual attention 2008 年 11 月 27 日 木村昭悟 (1) Derek Pang (1,2) 竹内龍人 (1) 大和淳司 (1) 柏野邦夫 (1) (1) 日本電信電話 ( 株 )NTT コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. E-mail: {ytamura,takai,tkato,tm}@vision.kuee.kyoto-u.ac.jp Abstract Current Wave Pattern Analysis for Anomaly

More information

..,,,, , ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i

..,,,, , ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i 25 Feature Selection for Prediction of Stock Price Time Series 1140357 2014 2 28 ..,,,,. 2013 1 1 12 31, ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i Abstract Feature Selection for Prediction of Stock Price Time

More information

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-

IPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi- 1 3 5 4 1 2 1,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-View Video Contents Kosuke Niwa, 1 Shogo Tokai, 3 Tetsuya Kawamoto, 5 Toshiaki Fujii, 4 Marutani Takafumi,

More information

スライド 1

スライド 1 CNN を用いた弱教師学習による画像領域分割 下田和, 柳井啓司 電気通信大学 大学院情報理工学 研究科 総合情報学専攻 c 2015 UEC Tokyo. Convolutional Neural Network CNN クラス分類タスクにおいてトップの精度 CNN の応用 ( 物体位置の認識 ) 物体検出 物体に BB を付与 領域分割 ピクセル単位の認識 CNN を用いた領域分割 CNN による完全教師ありのセグメンテーション

More information

Microsoft PowerPoint - cvim_harada pptx

Microsoft PowerPoint - cvim_harada pptx 1 2 Flickr reaches 6 billion photos on 1 Aug, 2011. http://www.flickr.com/photos/eon60/6000000000/ 3 4 http://www.dpchallenge.com/image.php?image_id=997702 5 6 http://www.image-net.org/challenges/lsvrc/2011/pascal_ilsvrc_2011.pptx

More information

Vol. 42 No MUC-6 6) 90% 2) MUC-6 MET-1 7),8) 7 90% 1 MUC IREX-NE 9) 10),11) 1) MUCMET 12) IREX-NE 13) ARPA 1987 MUC 1992 TREC IREX-N

Vol. 42 No MUC-6 6) 90% 2) MUC-6 MET-1 7),8) 7 90% 1 MUC IREX-NE 9) 10),11) 1) MUCMET 12) IREX-NE 13) ARPA 1987 MUC 1992 TREC IREX-N Vol. 42 No. 6 June 2001 IREX-NE F 83.86 A Japanese Named Entity Extraction System Based on Building a Large-scale and High-quality Dictionary and Pattern-matching Rules Yoshikazu Takemoto, Toshikazu Fukushima

More information

THE INSTITUTE OF ELECTRONICS, TECHNICAL REPORT OF IEICE. INFORMATION AND COMMUNICATION ENGINEERS

THE INSTITUTE OF ELECTRONICS, TECHNICAL REPORT OF IEICE. INFORMATION AND COMMUNICATION ENGINEERS Title とメルケプストラムを用いた音響モデルに基づく騒音環境下叫び声検出の性能評価 Author(s) 福森, 隆寛 ; 中山, 雅人 ; 西浦, 敬信 ; 南條, 浩輝 Citation 電子情報通信学会技術研究報告 = IEICE technical re 信学技報 (217), 116(477): 283-286 Issue Date 217-3 URL http://hdl.handle.net/2433/228957

More information

paper.dvi

paper.dvi 59 6 2003 pp. 1 11 1 43.72.Kb * 1 2 3 1. 2 2 1 1 1 [1] Person Recognition for News Videos through Multimodal Interaction, by Masakiyo Fujimoto, Yasuo Ariki and Shuji Doshita. 1 ATR 2 3 masakiyo.fujimoto@atr.jp

More information

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)

3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3) (MIRU2012) 2012 8 820-8502 680-4 E-mail: {d kouno,shimada,endo}@pluto.ai.kyutech.ac.jp (1) (2) (3) (4) 4 AdaBoost 1. Kanade [6] CLAFIC [12] EigenFace [10] 1 1 2 1 [7] 3 2 2 (1) (2) (3) (4) 4 4 AdaBoost

More information

特別寄稿.indd

特別寄稿.indd 特別寄稿 ソフトインフラとしてのデジタル地図を活用した自動運転システム Autonomous vehicle using digital map as a soft infrastructure 菅沼直樹 Naoki SUGANUMA 1. はじめに 1) 2008 2012 ITS 2) CO 2 3) 4) Door to door Door to door Door to door DARPA(

More information

Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth

Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth and Foot Breadth Akiko Yamamoto Fukuoka Women's University,

More information

21 e-learning Development of Real-time Learner Detection System for e-learning

21 e-learning Development of Real-time Learner Detection System for e-learning 21 e-learning Development of Real-time Learner Detection System for e-learning 1100349 2010 3 1 e-learning WBT (Web Based training) e-learning LMS (Learning Management System) LMS WBT e-learning e-learning

More information

Coding theorems for correlated sources with cooperative information

Coding theorems for correlated sources with cooperative information グラフコストの逐次更新を用いた映像顕著領域の自動抽出 2009 年 5 月 28 日 福地賢宮里洸司 (2) 木村昭悟 (1) 高木茂 (2) 大和淳司 (1) (1) 日本電信電話 ( 株 )NTT) コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ (2) 国立沖縄工業高等専門学校情報通信システム工学科 背景 ヒトはどのようにして もの を認識する能力を獲得するのか?

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE {s-kasihr, wakamiya,

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE {s-kasihr, wakamiya, THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. 565-0871 1 5 E-mail: {s-kasihr, wakamiya, murata}@ist.osaka-u.ac.jp PC 70% Design, implementation, and evaluation

More information

ビジュアル情報処理

ビジュアル情報処理 コンピュータビジョン特論 Advanced Computer Vision 第 5 回 最適なエッジ検出器 良いエッジ検出器とは Good Detection: ノイズに強い Good Localization: 真のエッジの所を検出 ingle Response: 各点に一本のエッジを検出 Cann Edge Detection Tutorial http://www.pages.dreel.edu/~weg/can_tut.html

More information

Microsoft PowerPoint CRCフォーラム「動的背景差分(中島)」Web公開用.ppt

Microsoft PowerPoint CRCフォーラム「動的背景差分(中島)」Web公開用.ppt 第 5 回 ( 平成 26 年度第 2 回 )CRCフォーラム( 平成 26 年 9 月 19 日 ( 金 ) 開催 ) 安全 安心のための画像 映像技術 動的背景差分による移動物体の検出 中島克人教授未来科学部情報メディア学科 平成 26 年度東京電機大学第 2 回 CRC フォーラム 安全 安心のための画像 映像技術 動的背景差分法による 移動物体の検出 2014.9.19 東京電機大学未来科学部情報メディア学科中島克人

More information

Real AdaBoost HOG 2009 3 A Graduation Thesis of College of Engineering, Chubu University Efficient Reducing Method of HOG Features for Human Detection based on Real AdaBoost Chika Matsushima ITS Graphics

More information

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +

1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z + 3 3D 1,a) 1 1 Kinect (X, Y) 3D 3D 1. 2010 Microsoft Kinect for Windows SDK( (Kinect) SDK ) 3D [1], [2] [3] [4] [5] [10] 30fps [10] 3 Kinect 3 Kinect Kinect for Windows SDK 3 Microsoft 3 Kinect for Windows

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

IEEE e

IEEE e 2007 IEEE 802.11e LAN VoIP 2008 2 4 3606U075-2 1 5 1.1...................................... 5 1.2...................................... 5 1.3..................................... 6 2 IEEE 802.11e LAN

More information

HOG HOG LBP LBP 4) LBP LBP Wang LBP HOG LBP 5) LBP LBP 1 r n 1 n, 1

HOG HOG LBP LBP 4) LBP LBP Wang LBP HOG LBP 5) LBP LBP 1 r n 1 n, 1 1 1 1 Shwartz Histgrams of Oriented Gradients HOG PLS PLS KPLS INRIA PLS KPLS KPLS PLS Pedestrian Detection Using Kernel Partial Least Squares Analysis Takashi Abe, 1 Takayuki Okatani 1 and Kouichiro Deguchi

More information

¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó

¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó 2 212 4 13 1 (4/6) : ruby 2 / 35 ( ) : gnuplot 3 / 35 ( ) 4 / 35 (summary statistics) : (mean) (median) (mode) : (range) (variance) (standard deviation) 5 / 35 (mean): x = 1 n (median): { xr+1 m, m = 2r

More information

2015 9

2015 9 JAIST Reposi https://dspace.j Title ウェブページからのサイト情報 作成者情報の抽出 Author(s) 堀, 達也 Citation Issue Date 2015-09 Type Thesis or Dissertation Text version author URL http://hdl.handle.net/10119/12932 Rights Description

More information

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2 CHLAC 1 2 3 3,. (CHLAC), 1).,.,, CHLAC,.,. Suspicious Behavior Detection based on CHLAC Method Hideaki Imanishi, 1 Toyohiro Hayashi, 2 Shuichi Enokida 3 and Toshiaki Ejima 3 We have proposed a method for

More information

PowerPoint Presentation

PowerPoint Presentation age 1 1 2 3 4 5 Applications (Phone,Browser,JAVA,PIM ) Mobile Middleware Carrier Specification Modules (FOMA,Vodafone, i-mode for overseas MP-Domain-Specific Middleware Carrier Common Spec. Modules

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション パーティクルフィルタ 理論と特性 11.1 パーティクルフィルタの理論的導出 状態遷移とマルコフ性 p x k x 1:k 1, y 1:k 1 = f x k x k 1 p y k x 1:k, y 1:k 1 k = 0,1, = h y k x k x 1:k x 1, x 2,, x k y 1:k y 1, y 2,, y k 確率分布で表現される現時刻の状態が, 前時刻までの状態と観測の条件付き確率によって定まる.

More information

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I Development of Digital Archive System of Comics Satoshi Tsutsui Kojima Kazuya The comic published in Japan is liked to read from of old by a lot of people, and builds our life and implications now. The

More information

2.2 6).,.,.,. Yang, 7).,,.,,. 2.3 SIFT SIFT (Scale-Invariant Feature Transform) 8).,. SIFT,,. SIFT, Mean-Shift 9)., SIFT,., SIFT,. 3.,.,,,,,.,,,., 1,

2.2 6).,.,.,. Yang, 7).,,.,,. 2.3 SIFT SIFT (Scale-Invariant Feature Transform) 8).,. SIFT,,. SIFT, Mean-Shift 9)., SIFT,., SIFT,. 3.,.,,,,,.,,,., 1, 1 1 2,,.,.,,, SIFT.,,. Pitching Motion Analysis Using Image Processing Shinya Kasahara, 1 Issei Fujishiro 1 and Yoshio Ohno 2 At present, analysis of pitching motion from baseball videos is timeconsuming

More information

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii

% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii 2012 3 A Graduation Thesis of College of Engineering, Chubu University High Accurate Semantic Segmentation Using Re-labeling Besed on Color Self Similarity Yuko KAKIMI 2400 90% 2 3 [1] Semantic Texton

More information

WebRTC P2P Web Proxy P2P Web Proxy WebRTC WebRTC Web, HTTP, WebRTC, P2P i

WebRTC P2P Web Proxy P2P Web Proxy WebRTC WebRTC Web, HTTP, WebRTC, P2P i 26 WebRTC The data distribution system using browser cache sharing and WebRTC 1150361 2015/02/27 WebRTC P2P Web Proxy P2P Web Proxy WebRTC WebRTC Web, HTTP, WebRTC, P2P i Abstract The data distribution

More information

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : : kubostat2017c p.1 2017 (c), a generalized linear model (GLM) : kubo@ees.hokudai.ac.jp http://goo.gl/76c4i 2017 11 14 : 2017 11 07 15:43 kubostat2017c (http://goo.gl/76c4i) 2017 (c) 2017 11 14 1 / 47 agenda

More information

PowerPoint Presentation

PowerPoint Presentation Sgr A* の赤外線観測 西山正吾 ( 京都大学 ) NIR obserbvations of the Galactic center 2/46 NIR obserbvations of the Galactic center 3/46 NIR obserbvations of the Galactic center 4/46 Dereddened flux density [mjy] 40 20

More information

Step 1 Feature Extraction Featuer Extraction Feature Extraction Featuer Extraction Image Analysis Start>Programs>Agilent-Life Sciences>Feature Extract

Step 1 Feature Extraction Featuer Extraction Feature Extraction Featuer Extraction Image Analysis Start>Programs>Agilent-Life Sciences>Feature Extract Agilent G2565AA Feature Extraction Step 1 Feature Extraction Step 2 Step 3 Step 4 ( ) Step 5 ( ) Step 6 Step 7 Step 8 Feature Extraction Step 9 Step 10 Feature Extraction Step 11 Feature Extraction Step

More information

11 22 33 12 23 1 2 3, 1 2, U2 3 U 1 U b 1 (o t ) b 2 (o t ) b 3 (o t ), 3 b (o t ) MULTI-SPEAKER SPEECH DATABASE Training Speech Analysis Mel-Cepstrum, logf0 /context1/ /context2/... Context Dependent

More information

Isogai, T., Building a dynamic correlation network for fat-tailed financial asset returns, Applied Network Science (7):-24, 206,

Isogai, T., Building a dynamic correlation network for fat-tailed financial asset returns, Applied Network Science (7):-24, 206, H28. (TMU) 206 8 29 / 34 2 3 4 5 6 Isogai, T., Building a dynamic correlation network for fat-tailed financial asset returns, Applied Network Science (7):-24, 206, http://link.springer.com/article/0.007/s409-06-0008-x

More information

画像工学入門

画像工学入門 セグメンテーション 講義内容 閾値法,k-mean 法 領域拡張法 SNAK 法 P タイル法 モード法 P タイル法 画像内で対象物の占める面積 (P パーセント ) があらかじめわかっているとき, 濃度ヒストグラムを作成し, 濃度値の累積分布が全体の P パーセントとなる濃度値を見つけ, この値を閾値とする. モード法 画像の輝度ヒストグラムを調べ その分布のモード ( 頻値輝度 ) 間の谷をしきい値とする

More information

GID Haar-like Mean-Shift Multi-Viewpoint Human Tracking Based on Face Detection Using Haar-like Features and Mean-Shift Yu Ito (Shizuoka Univers

GID Haar-like Mean-Shift Multi-Viewpoint Human Tracking Based on Face Detection Using Haar-like Features and Mean-Shift Yu Ito (Shizuoka Univers GID-08-6 Haar-like Mean-Shift Multi-Viewpoint Human Tracking Based on Face Detection Using Haar-like Features and Mean-Shift Yu Ito (Shizuoka University), Atsushi Yamashita, Toru Kaneko (Shizuoka University)

More information

Fig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels).

Fig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels). Fig. 1 The scheme of glottal area as a function of time Fig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels). Fig, 4 Parametric representation

More information

スライド 1

スライド 1 知能制御システム学 画像追跡 (1) 特徴点の検出と追跡 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2008.07.07 今日の内容 前回までの基本的な画像処理の例を踏まえて, ビジュアルサーボシステムの構成要素となる画像追跡の代表的手法を概説する 画像上の ある点 の追跡 オプティカルフローの拘束式 追跡しやすい点 (Harris オペレータ ) Lucas-Kanade

More information

IPSJ SIG Technical Report Vol.2009-CVIM-167 No /6/10 Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing

IPSJ SIG Technical Report Vol.2009-CVIM-167 No /6/10 Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing number of HOG Features based on Real AdaBoost Chika Matsushima, 1 Yuji Yamauchi, 1 Takayoshi Yamashita 1, 2 and

More information

GPGPU

GPGPU GPGPU 2013 1008 2015 1 23 Abstract In recent years, with the advance of microscope technology, the alive cells have been able to observe. On the other hand, from the standpoint of image processing, the

More information

* Meso- -scale Features of the Tokai Heavy Rainfall in September 2000 Shin-ichi SUZUKI Disaster Prevention Research Group, National R

* Meso- -scale Features of the Tokai Heavy Rainfall in September 2000 Shin-ichi SUZUKI Disaster Prevention Research Group, National R 38 2002 7 2000 9 * Meso- -scale Features of the Tokai Heavy Rainfall in September 2000 Shin-ichi SUZUKI Disaster Prevention Research Group, National Research Institute for Earth Science and Disaster Prevention,

More information

Coding theorems for correlated sources with cooperative information

Coding theorems for correlated sources with cooperative information MCMC-based particle filter を用いた人間の映像注視行動の実時間推定 2009 年 7 月 21 日 宮里洸司 (2) 木村昭悟 (1) 高木茂 (2) 大和淳司 (1) 柏野邦夫 (1) (1) 日本電信電話 ( 株 )NTT コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ (2) 国立沖縄工業高等専門学校情報通信システム工学科 背景 ヒトはどのようにして

More information

スライド 1

スライド 1 Bag-of-Frames と時空間特徴量を用いた Semantic Indexing Task への取り組み アウトライン はじめに 関連研究 手法 時空間特徴抽出手法 Bag of Framesによる全フレーム認識 キーフレームの利用 実行環境 結果 反省点 おわりに はじめに 国際映像処理ワークショップ TRECVID 膨大な動画データを利用 課題の提示 結果の公表 Semantic Indexing

More information

Fig. 2 Signal plane divided into cell of DWT Fig. 1 Schematic diagram for the monitoring system

Fig. 2 Signal plane divided into cell of DWT Fig. 1 Schematic diagram for the monitoring system Study of Health Monitoring of Vehicle Structure by Using Feature Extraction based on Discrete Wavelet Transform Akihisa TABATA *4, Yoshio AOKI, Kazutaka ANDO and Masataka KATO Department of Precision Machinery

More information

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4

Silhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4 Image-based Modeling 1 1 Object Extraction Method for Image-based Modeling using Projection Transformation of Multi-viewpoint Images Masanori Ibaraki 1 and Yuji Sakamoto 1 The volume intersection method

More information

A Japanese Word Dependency Corpus ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹

A Japanese Word Dependency Corpus   ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹ A Japanese Word Dependency Corpus 2015 3 18 Special thanks to NTT CS, 1 /27 Bunsetsu? What is it? ( ) Cf. CoNLL Multilingual Dependency Parsing [Buchholz+ 2006] (, Penn Treebank [Marcus 93]) 2 /27 1. 2.

More information

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成 Encoding Source Language with Convolu5onal Neural Network for Machine Transla5on Fandong Meng, Zhengdong Lu, Mingxuan Wang, Hang Li, Wenbin Jiang, Qun Liu, ACL- IJCNLP 2015 すずかけ読み会奥村 高村研究室博士二年上垣外英剛 概要

More information

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing 1,a) 1,b) 1,c) 2012 11 8 2012 12 18, 2013 1 27 WEB Ruby Removal Filters Using Genetic Programming for Early-modern Japanese Printed Books Taeka Awazu 1,a) Masami Takata 1,b) Kazuki Joe 1,c) Received: November

More information

IEEE HDD RAID MPI MPU/CPU GPGPU GPU cm I m cm /g I I n/ cm 2 s X n/ cm s cm g/cm

IEEE HDD RAID MPI MPU/CPU GPGPU GPU cm I m cm /g I I n/ cm 2 s X n/ cm s cm g/cm Neutron Visual Sensing Techniques Making Good Use of Computer Science J-PARC CT CT-PET TB IEEE HDD RAID MPI MPU/CPU GPGPU GPU cm I m cm /g I I n/ cm 2 s X n/ cm s cm g/cm cm cm barn cm thn/ cm s n/ cm

More information

¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó

¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó 2 2015 4 20 1 (4/13) : ruby 2 / 49 2 ( ) : gnuplot 3 / 49 1 1 2014 6 IIJ / 4 / 49 1 ( ) / 5 / 49 ( ) 6 / 49 (summary statistics) : (mean) (median) (mode) : (range) (variance) (standard deviation) 7 / 49

More information

IPSJ SIG Technical Report Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for

IPSJ SIG Technical Report Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for 1 2 3 3 1 Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for Mobile Terminals Kaoru Wasai 1 Fumio Sugai 2 Yosihiro Kita 3 Mi RangPark 3 Naonobu

More information

DEIM Forum 2010 A Web Abstract Classification Method for Revie

DEIM Forum 2010 A Web Abstract Classification Method for Revie DEIM Forum 2010 A2-2 305 8550 1 2 305 8550 1 2 E-mail: s0813158@u.tsukuba.ac.jp, satoh@slis.tsukuba.ac.jp Web Abstract Classification Method for Reviews using Degree of Mentioning each Viewpoint Tomoya

More information

IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 2 Hough Forest Hough Forest[6] Random Forest( [5]) Random Forest Hough Forest Hough Forest 2.1 Hough Forest 1 2.2

IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 2 Hough Forest Hough Forest[6] Random Forest( [5]) Random Forest Hough Forest Hough Forest 2.1 Hough Forest 1 2.2 IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 MI-Hough Forest () E-mail: ym@vision.cs.chubu.ac.jphf@cs.chubu.ac.jp Abstract Hough Forest Random Forest MI-Hough Forest Multiple Instance Learning Bag Hough Forest

More information

理工ジャーナル 23‐1☆/1.外村

理工ジャーナル 23‐1☆/1.外村 Yoshinobu TONOMURA Professor, Department of Media Informatics 1 10 YouTube 2 1900 100 1 3 2 3 3 3 1 2 3 4 90 1 90 MIT Project Athena 1983 1991 2 3 4 5 6 7 8 9 10 2 90 11 12 7 13 14 15 16 17 18 19 390 5

More information