Microsoft PowerPoint - IBIS-shinoda-print.pptx
|
|
- ただきよ たけすえ
- 5 years ago
- Views:
Transcription
1 第 15 回情報理論的学習理論ワークショップ (IBIS2012) コミュニケーションとしての 映像とその検索 篠 浩 ( 東京 業 学 )
2 講演の内容 1. 声と映像 2. TRECVID Semantic Indexing (SIN) 3. SIN のための 声技術 4. TRECVID Multimedia Event Detection (MED) 5. まとめ 2
3 EB/Month インターネット映像の急増 Youtube (2011): Increase 48 hours / min 3,000,000,000 views / day VIDEO OTHER IP Traffic (Cisco Visual Networking Index ) 3
4 No Meta data Low quality Large Variety Mostly Useless
5 課題 インターネット映像からの Content-Based Video Retrieval (CBVR) これまでの研究対象 TV ドラマ, 映画, ニュース, スポーツなど ジャンルが特定 品質 プロによる編集 メタデータが豊富 インターネット映像とは明らかに異なる どのような 法論をとるべきか? 5
6 Babble Gartner Hype Cycle for 2011 Image Recognition Video Analysis for Consumer Service Gesture Recognition Biometric Authentication Method Speech Recognition Crash! 6
7 声研究から学べないか? 映像研究はこれから Babble 声研究は Babble Crash から き延びた Babble Video Analysis for Consumer Service Speech Recognition Crash! 7
8 声 萌芽開発実 画像 萌芽開発実 映像 萌芽開発実 year 8
9 国国防省 (DARPA) 声認識ベンチマーク WORD ERROR RATE 100% 10% 1k Spontaneous Speech ATIS Resource Management Read Speech WSJ 20k 5k Switchboard Conversational Speech Varied Microphone Noisy foreign Broadcast Speech NAB foreign 段階的にタスクを設定 着実に技術を蓄積 1% Courtesy NIST 1999 DARPA HUB-4 Report, Pallett et al
10 声と映像は違う? 声は1 次元 映像は3 次元 声には Semantic Gap がない (? ) 声はコミュニケーションの道具であるが映像は違う (? ) 映像は 声のような明確な構造がない (?) ( 素 形態素 単語 法 ) 10
11 声と映像は同じ 送り 受け Audio Channel メッセージ メッセージ Video Channel 映像はコミュニケーションの 段 ( 明 的な ) 語彙や 法をもつ 声にも Semantic Gap は存在する 11
12 映像検索のための 声技術 1. 送り をモデル化するための 成モデル 2. 低品質 多様性 データ不 に頑健な確率的フレームワーク 3. 速計算 法 12
13 機械学習によるアプローチ ( 共通 ) 声 画像 映像 + = データ量計算量 Semantic gap 特定の応 に集中 他機関との協働 13
14 TRECVID Semantic Indexing 14
15 TRECVID (TREC Video Retrieval Evaluation) 2001 年に Text REtrieval Conference (TREC) から独 NIST(National Institute of Standard and Technology) が主催 的 : 映像コンテンツ分析 検索研究の促進クローズドな国際競争型ワークショップホームページ : 規模データが使える ( 著作権等の問題をクリア ) 法の 較が容易 そのため進歩が速い ラベル付け作業を分担 勝ち負けがはっきりする 15
16 TRECVID タスクの歴史 Known item search Semantic indexing Shot boundary detection Story segmentation Low-level feature extraction Rushes summarization Content-based copy detection Surveillance event detection Instance search Multimedia event detection
17 TRECVID データセット TV news TV shows Internet video Data (hours) 17
18 2011 年 TRECVID 66 チームが参加 ( 本からは 12 チーム ) 5 tasks: Semantic indexing (SIN) Multimedia event detection (MED) Known item search (KIS) Instance search (INS) Surveillance event detection (SED) 18
19 的 Semantic Indexing (SIN) ビデオショットからの Concept を検出 Concepts: objects, scenes,... TRECVID の中核的タスク 静 画の 般物体認識に対応 19
20 Multimedia Event Detection (MED) 的ビデオクリップからのイベント検出 e.g. Batting a run in Making a cake SIN より 次の対象 スポーツ番組からのハイライト検出 をインターネット映像まで延 20
21 的 Instance Search (INS) 特定の 物 場所 ロゴを検出 対象は明確 学習データは少ない データベース :BBC rushes 21
22 Known Item Search (KIS) 的 詳細なテキスト記述に合致する映像シーンを検出 例 : いシャツの男が にりんごをあげている 学習データなし SIN タスクで得られた コンセプトを利 22
23 Surveillance Event Detection (SED) 的監視カメラからのイベント検出 イベント : PeopleRuns, Pointing, PeopleMeet, など 混雑状況 固定カメラ データベース イギリス ガトウィック空港における 5 台の監視カメラ映像 (145 時間 ) 23
24 Semantic Indexing (SIN) 24
25 タスク設定 データベース :IACC (Internet Archive videos with Creative Commons licenses) : 600 h コンセプト数 : 346 Run: 各々のコンセプトについて上位 2000 個のショットのリストを提出 各々のチームは最 4 つの Run を提出できる 評価基準 : Average Precision (AP) 1 : Rank :Number of true shots from 1st to k-th 25
26 コンセプトの出現頻度 Number of positive samples in 264,673 training video shots Outdoor (29,997 shots) more than 10,000 5% # positive shots Singing (3875 shots) 1% of development data Airplane (371 shots) 346 semantic concepts 26
27 Bag of Words (BoW) 静 画における 般物体認識で主流 ショット局所特徴ヒストグラム SVM キーフレームを利 計算量が 較的少ない 量 化誤差が きい 27
28 新たな動き (1) : 頑健性 低品質 多様性 データ不 に対応 More features SIFT, Color SIFT, SURF, HOG, GIST, Dense features Multi-modal 声の利 : Singing, Dance, Car, etc. Multi-frame キーフレーム以外を利 Soft clustering 量 化誤差の低減 28
29 新たな動き (2) : 速化 参加 58チーム中 28チーム ( 半分 ) しか結果を提出できなかった 近似アルゴリズム 分散処理 Graphical Processing Unit (GPU) の利 29
30 期待したが効果のなかったもの 局特徴 ( ヒストグラムなど ) 局所特徴だけで 分 ( 相補的な関係にない ) 声認識, OCR それら 体の性能が低い 物体の位置検出 位置検出性能が低い 位置のない Concept も Concept 間のコンテキスト データ量が少なすぎる 30
31 Semantic Indexing のための 声技術 31
32 3 つの 声技術 1. 多様性 低品質 Gaussian Mixture Models (GMM) 2. データ不 MAP 適応 3. 速化 構造サーチ 32
33 フレームワーク video (shot) Tree-structured GMM 1) SIFT-Har GMMs supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 33
34 特徴抽出 video (shot) Tree-structured GMMs 1) SIFT-Har GMM supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 34
35 低次特徴 6 つの画像特徴 SIFT-Har, SIFT-Hes, SIFTH-Dense, HOG-Dense, HOG-Sub Multi-modal 響特徴 : Mel-Frequency Cepstral Coefficient (MFCC) Multi-frame 毎フレーム 1 フレームおき 2 秒に 1 フレームなど 35
36 1) SIFT-Har - Harris-affine detector - Multi-frame (every two frame) 2) SIFT-Hes - Hessian-affine detector - Multi-frame (every two frame) 3) SIFTH-Dense - SIFT + Hue histogram - 30,000 samples in a key frame 4) HOG-Dense - 32 dim HOG feature - 10,000 samples in a key frame 5) HOG-Sub - Temporal differential of HOG - Detect movement 画像特徴 Reduce dim to 32 by PCA 36
37 響特徴 :MFCC Mel-frequency cepstral coefficients 声認識 響イベント認識でよく いられる MFCC(12) MFCC(12) MFCC(12) Log-power(1) Log-power(1) 37
38 コンセプトのモデル video (shot) Tree-structured GMMs 1) SIFT-Har GMM supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 38
39 声技術その 1 Gaussian Mixture Model (GMM) ガウス分布の重み付け和 : 特徴 : 混合成分 k の重み 1), Σ : 混合成分 k の平均と分散 各々のショットを GMM でモデル化 39
40 GMM は BoW の拡張 BoW GMM Code vector Gaussian mean Histogram Weight distribution Red Color: ショットごとに推定 40
41 声技術その 2 Maximum A Posteriori (MAP) 適応 転移学習の 法 GMMの平均ベクトルに対し その事前分布を仮定 1. すべての学習データを いて Universal background model (UBM) を推定 2. UBM を初期モデルとして MAP 適応により GMM の平均ベクトルを推定する 事前分布 :UBM における 対応する分布 UBM MAP adaptation より少ないデータ量で 精度な推定 32
42 MAP 適応 :,,,Σ : UBMにおける混合成分 の平均と分散 : 混合成分 の平均のMAP 推定量 : 制御パラメータ where に対する混合成分の負担率 漸近的な性質をもつ データが少なくなると データが多くなると は最尤推定量に近づく 42
43 識別器 video (shot) Tree-sturuc 1) SIFT-Hartured GMMs GMM supervectors 2) SIFT-Hes 3) SIFTH-Dense 4) HOG-Dense 5) HOG-Sub 6) MFCC SVM score SVM score Score fusion 43
44 GMM Supervector + SVM 1. GMM の平均ベクトルを連結 GMM supervector where normalized mean 2. Support Vector Machine (SVM) with RBF kernel GMM に対する Fisher Kernel の近似
45 Score fusion SVM スコアの重み付け和 where 重みは Concept ごとに cross validation で決定 45
46 計算量 HOG-Dense 特徴を いたときの計算時間 (sec) Feature PCA GMM Estimation SVM GMM の推定が 部分 46
47 負担率の計算の高速化 where High cost! に対する混合成分の負担率 47
48 声技術その 3 構造 GMM を いた 速計算 がどの混合成分に属するか? (BoW: をどのコードに割り当てるか?) Gaussian components 48
49 負担率 : 局所特徴に対する混合成分の負担率 Gaussian components 49
50 特徴量空間の 部でのみ計算 Gaussian components 50
51 構造 GMM (1) Leaf layer 混合成分間の距離 : Symmetric KL divergence Gaussian components 51
52 構造 GMM (2) Non-leaf layers ノードのガウス分布は リーフのガウス分布集合を近似 Gaussian components 52
53 構造 GMM (3) Non-leaf layers ノードのガウス分布は リーフのガウス分布集合を近似 Gaussian components 53
54 構造 GMM (4) Non-leaf layers ノードのガウス分布は リーフのガウス分布集合を近似 Gaussian components 54
55 速サーチ (1) : Active nodes 55
56 速サーチ (2) : Active nodes 56
57 速サーチ (3) : Active nodes 57
58 TRECVID2011 SIN の結果 Mean InfAP: Inferred AP averaged over all concepts 58
59 コンセプト毎の Average Precision 59
60 効果的な低次特徴は? 60
61 GMM 推定の計算時間 検出性能の劣化なしに 4.2 倍の 速化 61
62 Multimedia Event Detection (MED) 62
63 Multimedia Event Detection (MED) 的ビデオクリップからのイベント検出 e.g. Batting a run in Making a cake SIN より 次の対象 スポーツ番組からのハイライト検出をインターネット映像まで延 データベース HAVIC : 2000 時間のホームビデオ Linguistic data consortium (LDC) が提供 63
64 MED (2) 2010に開始された新しいタスク 2011 年は18チーム ( 本からは5チーム ) 国情報省 (IARPA) のAutomated Low-Level Analysis and Description of Diverse Intelligence Video (ALADDIN) プロジェクトが援助 64
65 HAVIC データベース ビデオクリップ (2 分程度 ): 3488 個 サンプル : 各々のイベントに付き100 個 ( 半分が開発 半分がテスト ) 2010 (3 events) 2011 (10 events) Assembling a shelter Birthday party Making a sandwich Batting a run in Changing a vehicle tire Parade Making a cake Flash mob gathering Parkour Getting a vehicle unstuck Grooming an animal Repairing an appliance Working on a sewing project 65
66 評価基準 : Missed Detection Probability P miss 1 Recall False Alarm Probability P FA False Alarm / Clips with no events Normalized Detection Cost (NDC) 上記 2つを適当な重みで混合したもの 1 1 Cost Miss = 80 Cost FA = 1 P target =
67 SIN の 法を応 多くの特徴 +BoW+SVM トレンド 時空間特徴 STIP (Space-time interest point), etc. コンテキストのモデル化 (Semantic model) 効果があまりない データが少ない? 声認識 OCR 効果なし SIN と同じ理由 67
68 TRECVID2011 Mean Minimum NDC TRECVID 2011 MED runs Mean MNDC Mean ANDC 1 st Team nd Team rd Our team
69 69
70 70
71 頑健かつ 速な映像検索 おわりに 声分野で開発された技術が性能向上に寄与 GMM, MAP 適応, 構造サーチ 単語レベル (SIN) から レベル (MED) へ 映像のコミュニケーションモデル コンテキストの活 No data like more data データ量にスケールする技術が重要 計算の 速化がますます重要に 他に使える 声技術は? 語モデル 識別学習 Deep Learning, etc. 71
TRECVID Semantic Indexing TaskとMultimedia Event Detection Taskへの取り組み
OS5-O2 TRECVID Semantic Indexing Taskと Multimedia Event Detection Taskへの取り組み 樋爪和也, 柳井啓司 ( 電気通信大学 ) 背景 コンテンツベースの映像検索手法が盛んに TRECVID: 国際的な評価ワークショップ 膨大なデータ処理の必要性 4000 時間の大規模データ 本発表について TRECVID の概要 SIN タスク
More informationTHE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search {sak
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. TRECVID2012 Instance Search 599 8531 1 1 E-mail: {sakata,matozaki}@m.cs.osakafu-u.ac.jp, {kise,masa}@cs.osakafu-u.ac.jp
More informationMicrosoft PowerPoint - SSII_harada pptx
The state of the world The gathered data The processed data w d r I( W; D) I( W; R) The data processing theorem states that data processing can only destroy information. David J.C. MacKay. Information
More informationIPSJ SIG Technical Report Vol.2011-CVIM-177 No /5/ TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM A
1 1 TRECVID2010 SURF Bag-of-Features 1 TRECVID SVM 700% MKL-SVM 883% TRECVID2010 MKL-SVM Analysis of video data recognition using multi-frame Kazuya Hidume 1 and Keiji Yanai 1 In this study, we aim to
More informationAutomatic Collection of Web Video Shots Corresponding to Specific Actions using Web Images
視覚特徴およびタグ共起を用いた 大規模 Web ビデオショットランキング 電気通信大学大学院情報理工学研究科 総合情報学専攻 Do Hang Nga 柳井啓司 背景 Web 動画 : 無限に存在 無料で取得可能 - YouTube, Daily Motion etc. Web 動画による動作データ収集 ただし Web 上の動画はノイズが多い 関連動画 Play trumpet 非関連動画 非対応ショット
More information,,, Twitter,,, ( ), 2. [1],,, ( ),,.,, Sungho Jeon [2], Twitter 4 URL, SVM,, , , URL F., SVM,, 4 SVM, F,.,,,,, [3], 1 [2] Step Entered
DEIM Forum 2016 C5-1 182-8585 1-5-1 E-mail: saitoh-ryoh@uec.ac.jp, terada.minoru@uec.ac.jp Twitter,, Twitter,,, Bag of Words, Latent Semantic Indexing,.,,,, Twitter,, Twitter,, 1. SNS, SNS Twitter 1,,,
More information(MIRU2008) HOG Histograms of Oriented Gradients (HOG)
(MIRU2008) 2008 7 HOG - - E-mail: katsu0920@me.cs.scitec.kobe-u.ac.jp, {takigu,ariki}@kobe-u.ac.jp Histograms of Oriented Gradients (HOG) HOG Shape Contexts HOG 5.5 Histograms of Oriented Gradients D Human
More information時空間特徴を用いた Web動画からの特定動作対応ショットの 自動抽出
Web 動画 画像を用いた 特定動作ショットの自動収集 DO HANG NGA 樋爪和也柳井啓司 電気通信大学情報工学科 背景 既存の動画学習手法制限のある動画像 (e.g. KTH, Caltech) 教師なし学習手法 Web 上の動画 教師信号あり 動画量が少ない 研究の目的 特定動作についての Web データを使用して その動作の対応ショットを自動抽出 大量の Web 動画 ランキング 学習の必要なし
More informationbag-of-words bag-of-keypoints Web bagof-keypoints Nearest Neighbor SVM Nearest Neighbor SIFT Nearest Neighbor bag-of-keypoints Nearest Neighbor SVM 84
Bag-of-Keypoints Web G.Csurka bag-of-keypoints Web Bag-of-keypoints SVM 5.% Web Image Classification with Bag-of-Keypoints Taichi joutou and Keiji yanai Recently, need for generic image recognition is
More information動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S
1 2 2 1 Web An Automatic Music Video Creation System by Reusing Dance Video Content Sora Murofushi, 1 Tomoyasu Nakano, 2 Masataka Goto 2 and Shigeo Morishima 1 This paper presents a system that automatically
More informationTwitter‡Ì”À‰µ…c…C†[…g‡ðŠŸŠp‡µ‡½…^…C…•…›…C…fi‘ã‡Ì…l…^…o…„‘îŁñ„�™m
27 Twitter 1431050 2016 3 14 1 Twitter,,.,.,., Twitter,.,,.,,. URL,,,. BoW(Bag of Words), LSI(Latent Semantic Indexing)., URL,,,,., Accuracy, AUC(Area Under the Curve), Precision, Recall, F,. URL,,,.,
More information(VKIR) VKIR VKIR DCT (R) (G) (B) Ward DCT i
24 Region-Based Image Retrieval using Color Histogram Feature 1130340 2013 3 1 (VKIR) VKIR VKIR DCT (R) (G) (B) 64 64 Ward 20 1 20 1 20. 5 10 2 DCT i Abstract Region-Based Image Retrieval using Color Histogram
More information24 Region-Based Image Retrieval using Fuzzy Clustering
24 Region-Based Image Retrieval using Fuzzy Clustering 1130323 2013 3 9 Visual-key Image Retrieval(VKIR) k-means Fuzzy C-means 2 200 2 2 20 VKIR 5 18% 54% 7 30 Fuzzy C-means i Abstract Region-Based Image
More information(MIRU2009) cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-te
(MIRU2009) 2009 7 182 8585 1 5 1 E-mail: noguchi-a@mm.cs.uec.ac.jp, yanai@cs.uec.ac.jp cuboid cuboid SURF 6 85% Web. Web Abstract Extracting Spatio-temporal Local Features Considering Consecutiveness of
More informationuntitled
(Robot Vision) Vision ( (computer) Machine VisionComputer Vision ( ) ( ) ( ) ( ) ( ) 1 DTV 2 DTV D 3 ( ( ( ( ( DTV D 4 () 5 A B C D E F G H I A B C D E F G H I I = A + D + G - C - F - I J = A + B + C -
More informationMicrosoft PowerPoint - pr_12_template-bs.pptx
12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算
More information音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst
1,a) 1 1 1 deep neural netowrk(dnn) (HMM) () GMM-HMM 2 3 (CSJ) 1. DNN [6]. GPGPU HMM DNN HMM () [7]. [8] [1][2][3] GMM-HMM Gaussian mixture HMM(GMM- HMM) MAP MLLR [4] [3] DNN 1 1 triphone bigram [5]. 2
More informationDuplicate Near Duplicate Intact Partial Copy Original Image Near Partial Copy Near Partial Copy with a background (a) (b) 2 1 [6] SIFT SIFT SIF
Partial Copy Detection of Line Drawings from a Large-Scale Database Weihan Sun, Koichi Kise Graduate School of Engineering, Osaka Prefecture University E-mail: sunweihan@m.cs.osakafu-u.ac.jp, kise@cs.osakafu-u.ac.jp
More information2017 (413812)
2017 (413812) Deep Learning ( NN) 2012 Google ASIC(Application Specific Integrated Circuit: IC) 10 ASIC Deep Learning TPU(Tensor Processing Unit) NN 12 20 30 Abstract Multi-layered neural network(nn) has
More information2 Fig D human model. 1 Fig. 1 The flow of proposed method )9)10) 2.2 3)4)7) 5)11)12)13)14) TOF 1 3 TOF 3 2 c 2011 Information
1 1 2 TOF 2 (D-HOG HOG) Recall D-HOG 0.07 HOG 0.16 Pose Estimation by Regression Analysis with Depth Information Yoshiki Agata 1 and Hironobu Fujiyoshi 1 A method for estimating the pose of a human from
More information28 TCG SURF Card recognition using SURF in TCG play video
28 TCG SURF Card recognition using SURF in TCG play video 1170374 2017 3 2 TCG SURF TCG TCG OCG SURF Bof 20 20 30 10 1 SURF Bag of features i Abstract Card recognition using SURF in TCG play video Haruka
More informationIPSJ SIG Technical Report Vol.2010-CVIM-171 No /3/19 1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) % MKL 68.8% Extractin
1. Web 1 1 Web Web Web Multiple Kernel Learning(MKL) Web ( ) 200 57.2% MKL 68.8% Extracting Spatio-Temporal Local Features for Classifying Web Video Shots Akitsugu Noguchi 1 and Keiji Yanai 1 Nowadays,
More informationスライド 1
A SURF-based Spatio-Temporal Feature for Feature-fusion-based Action Recognition 1. Background & Objective action recognition object/scene recognition Bag-of-features (BoF) of spatiotemporal features [Dollar
More information第122号.indd
-1- -2- -3- 0852-36-5150 0852-36-5163-4- -5- -6- -7- 1st 1-1 1-2 1-3 1-4 1-5 -8- 2nd M2 E2 D2 J2 C2-9- 3rd M3 E3 D3 J3 C3-10- 4th M4 E4 D4 J4 C4-11- -12- M5 E5 J5 D5 C5 5th -13- -14- NEWS NEWS -15- NEWS
More informationshono_DIA06.ppt
8.6. 研究背景 大容量記憶メディアの普及 動画圧縮 転送技術の発達 放送方式のシフト シーン自動検出と投球動作分析を用いた 野球中継映像のインデキシング手法の提 案Detection and Automatic Scene マルチメディアコンテンツの氾濫 芝浦工業大学大学院 工学研究科 電気電子情報工学専攻 メディア工学研究室 庄野 雄紀 青木 義満 効率よい検索 管理技術への要求 6/3/ 研究背景
More informationGoogle Goggles [1] Google Goggles Android iphone web Google Goggles Lee [2] Lee iphone () [3] [4] [5] [6] [7] [8] [9] [10] :
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.,, 182-8585 1-5-1 E-mail: {maruya-t,akiyama-m}@mm.inf.uec.ac.jp, yanai@cs.uec.ac.jp SURF Bag-of-Features
More informationホットスポット 1 音リアクションイベント BIC GMM 2 3 BIC GMM HMM 10) SVM 11) 12) 13) Bayesian Information Criterion BIC 14) BIC M = M 1, M 2,,
1 1 2 2 BIC GMM Acoustic Event Detection for Finding Hot Spots in Podcasts Kouhei Sumi, 1 Tatsuya Kawahara, 1 Jun Ogata 2 and Masataka Goto 2 This paper presents a method to detect acoustic events that
More information(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. fnirs Kai Kunze 599 8531 1 1 223 8526 4 1 1 E-mail: yoshimura@m.cs.osakafu-u.ac.jp, kai@kmd.keio.ac.jp,
More informationIPSJ SIG Technical Report Vol.2010-CVIM-170 No /1/ Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Ta
1 1 1 1 2 1. Visual Recognition of Wire Harnesses for Automated Wiring Masaki Yoneda, 1 Takayuki Okatani 1 and Koichiro Deguchi 1 This paper presents a method for recognizing the pose of a wire harness
More information4. C i k = 2 k-means C 1 i, C 2 i 5. C i x i p [ f(θ i ; x) = (2π) p 2 Vi 1 2 exp (x µ ] i) t V 1 i (x µ i ) 2 BIC BIC = 2 log L( ˆθ i ; x i C i ) + q
x-means 1 2 2 x-means, x-means k-means Bayesian Information Criterion BIC Watershed x-means Moving Object Extraction Using the Number of Clusters Determined by X-means Clustering Naoki Kubo, 1 Kousuke
More information[1] SBS [2] SBS Random Forests[3] Random Forests ii
Random Forests 2013 3 A Graduation Thesis of College of Engineering, Chubu University Proposal of an efficient feature selection using the contribution rate of Random Forests Katsuya Shimazaki [1] SBS
More informationnlp1-12.key
自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)
More information本文6(599) (Page 601)
(MIRU2008) 2008 7 525 8577 1 1 1 E-mail: matsuzaki@i.ci.ritsumei.ac.jp, shimada@ci.ritsumei.ac.jp Object Recognition by Observing Grasping Scene from Image Sequence Hironori KASAHARA, Jun MATSUZAKI, Nobutaka
More information10_08.dvi
476 67 10 2011 pp. 476 481 * 43.72.+q 1. MOS Mean Opinion Score ITU-T P.835 [1] [2] [3] Subjective and objective quality evaluation of noisereduced speech. Takeshi Yamada, Shoji Makino and Nobuhiko Kitawaki
More information塗装深み感の要因解析
17 Analysis of Factors for Paint Depth Feeling Takashi Wada, Mikiko Kawasumi, Taka-aki Suzuki ( ) ( ) ( ) The appearance and quality of objects are controlled by paint coatings on the surfaces of the objects.
More informationIPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201
BGM 1,4,a) 1 2 2 3,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 2015 1 100.. Web.. BGM.BGM [1]. BGM BGM 1 Waseda University, Shinjuku, Tokyo 169-8555, Japan 2 3 4 JST CREST a) ha-ru-ki@asagi.waseda.jp.
More information& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro
TV 1,2,a) 1 2 2015 1 26, 2015 5 21 Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Rotation Using Mobile Device Hiroyuki Kawakita 1,2,a) Toshio Nakagawa 1 Makoto Sato
More informationWISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp
Query-by-Dancing: WISS 2018. Query-by-Dancing Query-by-Dancing 1 OpenPose [1] Copyright is held by the author(s). DJ DJ DJ WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias
More informationIPSJ SIG Technical Report Vol.2012-CG-149 No.13 Vol.2012-CVIM-184 No /12/4 3 1,a) ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransa
3,a) 3 3 ( ) DB 3D DB 2D,,,, PnP(Perspective n-point), Ransac. DB [] [2] 3 DB Web Web DB Web NTT NTT Media Intelligence Laboratories, - Hikarinooka Yokosuka-Shi, Kanagawa 239-0847 Japan a) yabushita.hiroko@lab.ntt.co.jp
More informationmain.dvi
DEIM Forum 2016 C5-4 305-8573 1-1-1 305-8573 1-1-1 Wikipedia Wikipedia () ( ),,, A Method of Assisting Movie Summarization by Aligning Plot Sentences and Shots ueshan LI, Kentaro DOMOTO, and Takehito UTSURO
More informationNo. 3 Oct The person to the left of the stool carried the traffic-cone towards the trash-can. α α β α α β α α β α Track2 Track3 Track1 Track0 1
ACL2013 TACL 1 ACL2013 Grounded Language Learning from Video Described with Sentences (Yu and Siskind 2013) TACL Transactions of the Association for Computational Linguistics What Makes Writing Great?
More informationP2P Web Proxy P2P Web Proxy P2P P2P Web Proxy P2P Web Proxy Web P2P WebProxy i
27 Verification of the usefulness of the data distribution method by browser cache sharing 1160285 2016 2 26 P2P Web Proxy P2P Web Proxy P2P P2P Web Proxy P2P Web Proxy Web P2P WebProxy i Abstract Verification
More informationA comparative study of the team strengths calculated by mathematical and statistical methods and points and winning rate of the Tokyo Big6 Baseball Le
Powered by TCPDF (www.tcpdf.org) Title 東京六大学野球リーグ戦において勝敗結果から計算する優勝チームと勝点 勝率との比較研究 Sub Title A comparative study of the team strengths calculated by mathematical and statistical methods and points and winning
More informationMicrosoft PowerPoint PresentationPRMU2008Nov.ppt [互換モード]
Dynamic Markov random fields for stochastic modeling of visual attention 2008 年 11 月 27 日 木村昭悟 (1) Derek Pang (1,2) 竹内龍人 (1) 大和淳司 (1) 柏野邦夫 (1) (1) 日本電信電話 ( 株 )NTT コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ
More informationTHE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. E-mail: {ytamura,takai,tkato,tm}@vision.kuee.kyoto-u.ac.jp Abstract Current Wave Pattern Analysis for Anomaly
More information..,,,, , ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i
25 Feature Selection for Prediction of Stock Price Time Series 1140357 2014 2 28 ..,,,,. 2013 1 1 12 31, ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i Abstract Feature Selection for Prediction of Stock Price Time
More informationIPSJ SIG Technical Report Vol.2011-EC-19 No /3/ ,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-
1 3 5 4 1 2 1,.,., Peg-Scope Viewer,,.,,,,. Utilization of Watching Logs for Support of Multi-View Video Contents Kosuke Niwa, 1 Shogo Tokai, 3 Tetsuya Kawamoto, 5 Toshiaki Fujii, 4 Marutani Takafumi,
More informationスライド 1
CNN を用いた弱教師学習による画像領域分割 下田和, 柳井啓司 電気通信大学 大学院情報理工学 研究科 総合情報学専攻 c 2015 UEC Tokyo. Convolutional Neural Network CNN クラス分類タスクにおいてトップの精度 CNN の応用 ( 物体位置の認識 ) 物体検出 物体に BB を付与 領域分割 ピクセル単位の認識 CNN を用いた領域分割 CNN による完全教師ありのセグメンテーション
More informationMicrosoft PowerPoint - cvim_harada pptx
1 2 Flickr reaches 6 billion photos on 1 Aug, 2011. http://www.flickr.com/photos/eon60/6000000000/ 3 4 http://www.dpchallenge.com/image.php?image_id=997702 5 6 http://www.image-net.org/challenges/lsvrc/2011/pascal_ilsvrc_2011.pptx
More informationVol. 42 No MUC-6 6) 90% 2) MUC-6 MET-1 7),8) 7 90% 1 MUC IREX-NE 9) 10),11) 1) MUCMET 12) IREX-NE 13) ARPA 1987 MUC 1992 TREC IREX-N
Vol. 42 No. 6 June 2001 IREX-NE F 83.86 A Japanese Named Entity Extraction System Based on Building a Large-scale and High-quality Dictionary and Pattern-matching Rules Yoshikazu Takemoto, Toshikazu Fukushima
More informationTHE INSTITUTE OF ELECTRONICS, TECHNICAL REPORT OF IEICE. INFORMATION AND COMMUNICATION ENGINEERS
Title とメルケプストラムを用いた音響モデルに基づく騒音環境下叫び声検出の性能評価 Author(s) 福森, 隆寛 ; 中山, 雅人 ; 西浦, 敬信 ; 南條, 浩輝 Citation 電子情報通信学会技術研究報告 = IEICE technical re 信学技報 (217), 116(477): 283-286 Issue Date 217-3 URL http://hdl.handle.net/2433/228957
More informationpaper.dvi
59 6 2003 pp. 1 11 1 43.72.Kb * 1 2 3 1. 2 2 1 1 1 [1] Person Recognition for News Videos through Multimodal Interaction, by Masakiyo Fujimoto, Yasuo Ariki and Shuji Doshita. 1 ATR 2 3 masakiyo.fujimoto@atr.jp
More information3 2 2 (1) (2) (3) (4) 4 4 AdaBoost 2. [11] Onishi&Yoda [8] Iwashita&Stoica [5] 4 [3] 3. 3 (1) (2) (3)
(MIRU2012) 2012 8 820-8502 680-4 E-mail: {d kouno,shimada,endo}@pluto.ai.kyutech.ac.jp (1) (2) (3) (4) 4 AdaBoost 1. Kanade [6] CLAFIC [12] EigenFace [10] 1 1 2 1 [7] 3 2 2 (1) (2) (3) (4) 4 4 AdaBoost
More information特別寄稿.indd
特別寄稿 ソフトインフラとしてのデジタル地図を活用した自動運転システム Autonomous vehicle using digital map as a soft infrastructure 菅沼直樹 Naoki SUGANUMA 1. はじめに 1) 2008 2012 ITS 2) CO 2 3) 4) Door to door Door to door Door to door DARPA(
More informationStudies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth
Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth and Foot Breadth Akiko Yamamoto Fukuoka Women's University,
More information21 e-learning Development of Real-time Learner Detection System for e-learning
21 e-learning Development of Real-time Learner Detection System for e-learning 1100349 2010 3 1 e-learning WBT (Web Based training) e-learning LMS (Learning Management System) LMS WBT e-learning e-learning
More informationCoding theorems for correlated sources with cooperative information
グラフコストの逐次更新を用いた映像顕著領域の自動抽出 2009 年 5 月 28 日 福地賢宮里洸司 (2) 木村昭悟 (1) 高木茂 (2) 大和淳司 (1) (1) 日本電信電話 ( 株 )NTT) コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ (2) 国立沖縄工業高等専門学校情報通信システム工学科 背景 ヒトはどのようにして もの を認識する能力を獲得するのか?
More informationTHE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE {s-kasihr, wakamiya,
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. 565-0871 1 5 E-mail: {s-kasihr, wakamiya, murata}@ist.osaka-u.ac.jp PC 70% Design, implementation, and evaluation
More informationビジュアル情報処理
コンピュータビジョン特論 Advanced Computer Vision 第 5 回 最適なエッジ検出器 良いエッジ検出器とは Good Detection: ノイズに強い Good Localization: 真のエッジの所を検出 ingle Response: 各点に一本のエッジを検出 Cann Edge Detection Tutorial http://www.pages.dreel.edu/~weg/can_tut.html
More informationMicrosoft PowerPoint CRCフォーラム「動的背景差分(中島)」Web公開用.ppt
第 5 回 ( 平成 26 年度第 2 回 )CRCフォーラム( 平成 26 年 9 月 19 日 ( 金 ) 開催 ) 安全 安心のための画像 映像技術 動的背景差分による移動物体の検出 中島克人教授未来科学部情報メディア学科 平成 26 年度東京電機大学第 2 回 CRC フォーラム 安全 安心のための画像 映像技術 動的背景差分法による 移動物体の検出 2014.9.19 東京電機大学未来科学部情報メディア学科中島克人
More informationReal AdaBoost HOG 2009 3 A Graduation Thesis of College of Engineering, Chubu University Efficient Reducing Method of HOG Features for Human Detection based on Real AdaBoost Chika Matsushima ITS Graphics
More information1 Kinect for Windows M = [X Y Z] T M = [X Y Z ] T f (u,v) w 3.2 [11] [7] u = f X +u Z 0 δ u (X,Y,Z ) (5) v = f Y Z +v 0 δ v (X,Y,Z ) (6) w = Z +
3 3D 1,a) 1 1 Kinect (X, Y) 3D 3D 1. 2010 Microsoft Kinect for Windows SDK( (Kinect) SDK ) 3D [1], [2] [3] [4] [5] [10] 30fps [10] 3 Kinect 3 Kinect Kinect for Windows SDK 3 Microsoft 3 Kinect for Windows
More information(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)
Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている
More informationIEEE e
2007 IEEE 802.11e LAN VoIP 2008 2 4 3606U075-2 1 5 1.1...................................... 5 1.2...................................... 5 1.3..................................... 6 2 IEEE 802.11e LAN
More informationHOG HOG LBP LBP 4) LBP LBP Wang LBP HOG LBP 5) LBP LBP 1 r n 1 n, 1
1 1 1 Shwartz Histgrams of Oriented Gradients HOG PLS PLS KPLS INRIA PLS KPLS KPLS PLS Pedestrian Detection Using Kernel Partial Least Squares Analysis Takashi Abe, 1 Takayuki Okatani 1 and Kouichiro Deguchi
More information¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó
2 212 4 13 1 (4/6) : ruby 2 / 35 ( ) : gnuplot 3 / 35 ( ) 4 / 35 (summary statistics) : (mean) (median) (mode) : (range) (variance) (standard deviation) 5 / 35 (mean): x = 1 n (median): { xr+1 m, m = 2r
More information2015 9
JAIST Reposi https://dspace.j Title ウェブページからのサイト情報 作成者情報の抽出 Author(s) 堀, 達也 Citation Issue Date 2015-09 Type Thesis or Dissertation Text version author URL http://hdl.handle.net/10119/12932 Rights Description
More information1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2
CHLAC 1 2 3 3,. (CHLAC), 1).,.,, CHLAC,.,. Suspicious Behavior Detection based on CHLAC Method Hideaki Imanishi, 1 Toyohiro Hayashi, 2 Shuichi Enokida 3 and Toshiaki Ejima 3 We have proposed a method for
More informationPowerPoint Presentation
age 1 1 2 3 4 5 Applications (Phone,Browser,JAVA,PIM ) Mobile Middleware Carrier Specification Modules (FOMA,Vodafone, i-mode for overseas MP-Domain-Specific Middleware Carrier Common Spec. Modules
More informationPowerPoint プレゼンテーション
パーティクルフィルタ 理論と特性 11.1 パーティクルフィルタの理論的導出 状態遷移とマルコフ性 p x k x 1:k 1, y 1:k 1 = f x k x k 1 p y k x 1:k, y 1:k 1 k = 0,1, = h y k x k x 1:k x 1, x 2,, x k y 1:k y 1, y 2,, y k 確率分布で表現される現時刻の状態が, 前時刻までの状態と観測の条件付き確率によって定まる.
More information1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I
Development of Digital Archive System of Comics Satoshi Tsutsui Kojima Kazuya The comic published in Japan is liked to read from of old by a lot of people, and builds our life and implications now. The
More information2.2 6).,.,.,. Yang, 7).,,.,,. 2.3 SIFT SIFT (Scale-Invariant Feature Transform) 8).,. SIFT,,. SIFT, Mean-Shift 9)., SIFT,., SIFT,. 3.,.,,,,,.,,,., 1,
1 1 2,,.,.,,, SIFT.,,. Pitching Motion Analysis Using Image Processing Shinya Kasahara, 1 Issei Fujishiro 1 and Yoshio Ohno 2 At present, analysis of pitching motion from baseball videos is timeconsuming
More information% 2 3 [1] Semantic Texton Forests STFs [1] ( ) STFs STFs ColorSelf-Simlarity CSS [2] ii
2012 3 A Graduation Thesis of College of Engineering, Chubu University High Accurate Semantic Segmentation Using Re-labeling Besed on Color Self Similarity Yuko KAKIMI 2400 90% 2 3 [1] Semantic Texton
More informationWebRTC P2P Web Proxy P2P Web Proxy WebRTC WebRTC Web, HTTP, WebRTC, P2P i
26 WebRTC The data distribution system using browser cache sharing and WebRTC 1150361 2015/02/27 WebRTC P2P Web Proxy P2P Web Proxy WebRTC WebRTC Web, HTTP, WebRTC, P2P i Abstract The data distribution
More informationkubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :
kubostat2017c p.1 2017 (c), a generalized linear model (GLM) : kubo@ees.hokudai.ac.jp http://goo.gl/76c4i 2017 11 14 : 2017 11 07 15:43 kubostat2017c (http://goo.gl/76c4i) 2017 (c) 2017 11 14 1 / 47 agenda
More informationPowerPoint Presentation
Sgr A* の赤外線観測 西山正吾 ( 京都大学 ) NIR obserbvations of the Galactic center 2/46 NIR obserbvations of the Galactic center 3/46 NIR obserbvations of the Galactic center 4/46 Dereddened flux density [mjy] 40 20
More informationStep 1 Feature Extraction Featuer Extraction Feature Extraction Featuer Extraction Image Analysis Start>Programs>Agilent-Life Sciences>Feature Extract
Agilent G2565AA Feature Extraction Step 1 Feature Extraction Step 2 Step 3 Step 4 ( ) Step 5 ( ) Step 6 Step 7 Step 8 Feature Extraction Step 9 Step 10 Feature Extraction Step 11 Feature Extraction Step
More information11 22 33 12 23 1 2 3, 1 2, U2 3 U 1 U b 1 (o t ) b 2 (o t ) b 3 (o t ), 3 b (o t ) MULTI-SPEAKER SPEECH DATABASE Training Speech Analysis Mel-Cepstrum, logf0 /context1/ /context2/... Context Dependent
More informationIsogai, T., Building a dynamic correlation network for fat-tailed financial asset returns, Applied Network Science (7):-24, 206,
H28. (TMU) 206 8 29 / 34 2 3 4 5 6 Isogai, T., Building a dynamic correlation network for fat-tailed financial asset returns, Applied Network Science (7):-24, 206, http://link.springer.com/article/0.007/s409-06-0008-x
More information画像工学入門
セグメンテーション 講義内容 閾値法,k-mean 法 領域拡張法 SNAK 法 P タイル法 モード法 P タイル法 画像内で対象物の占める面積 (P パーセント ) があらかじめわかっているとき, 濃度ヒストグラムを作成し, 濃度値の累積分布が全体の P パーセントとなる濃度値を見つけ, この値を閾値とする. モード法 画像の輝度ヒストグラムを調べ その分布のモード ( 頻値輝度 ) 間の谷をしきい値とする
More informationGID Haar-like Mean-Shift Multi-Viewpoint Human Tracking Based on Face Detection Using Haar-like Features and Mean-Shift Yu Ito (Shizuoka Univers
GID-08-6 Haar-like Mean-Shift Multi-Viewpoint Human Tracking Based on Face Detection Using Haar-like Features and Mean-Shift Yu Ito (Shizuoka University), Atsushi Yamashita, Toru Kaneko (Shizuoka University)
More informationFig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels).
Fig. 1 The scheme of glottal area as a function of time Fig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels). Fig, 4 Parametric representation
More informationスライド 1
知能制御システム学 画像追跡 (1) 特徴点の検出と追跡 東北大学大学院情報科学研究科鏡慎吾 swk(at)ic.is.tohoku.ac.jp 2008.07.07 今日の内容 前回までの基本的な画像処理の例を踏まえて, ビジュアルサーボシステムの構成要素となる画像追跡の代表的手法を概説する 画像上の ある点 の追跡 オプティカルフローの拘束式 追跡しやすい点 (Harris オペレータ ) Lucas-Kanade
More informationIPSJ SIG Technical Report Vol.2009-CVIM-167 No /6/10 Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing
Real AdaBoost HOG 1 1 1, 2 1 Real AdaBoost HOG HOG Real AdaBoost HOG A Method for Reducing number of HOG Features based on Real AdaBoost Chika Matsushima, 1 Yuji Yamauchi, 1 Takayoshi Yamashita 1, 2 and
More informationGPGPU
GPGPU 2013 1008 2015 1 23 Abstract In recent years, with the advance of microscope technology, the alive cells have been able to observe. On the other hand, from the standpoint of image processing, the
More information* Meso- -scale Features of the Tokai Heavy Rainfall in September 2000 Shin-ichi SUZUKI Disaster Prevention Research Group, National R
38 2002 7 2000 9 * Meso- -scale Features of the Tokai Heavy Rainfall in September 2000 Shin-ichi SUZUKI Disaster Prevention Research Group, National Research Institute for Earth Science and Disaster Prevention,
More informationCoding theorems for correlated sources with cooperative information
MCMC-based particle filter を用いた人間の映像注視行動の実時間推定 2009 年 7 月 21 日 宮里洸司 (2) 木村昭悟 (1) 高木茂 (2) 大和淳司 (1) 柏野邦夫 (1) (1) 日本電信電話 ( 株 )NTT コミュニケーション科学基礎研究所メディア情報研究部メディア認識研究グループ (2) 国立沖縄工業高等専門学校情報通信システム工学科 背景 ヒトはどのようにして
More informationスライド 1
Bag-of-Frames と時空間特徴量を用いた Semantic Indexing Task への取り組み アウトライン はじめに 関連研究 手法 時空間特徴抽出手法 Bag of Framesによる全フレーム認識 キーフレームの利用 実行環境 結果 反省点 おわりに はじめに 国際映像処理ワークショップ TRECVID 膨大な動画データを利用 課題の提示 結果の公表 Semantic Indexing
More informationFig. 2 Signal plane divided into cell of DWT Fig. 1 Schematic diagram for the monitoring system
Study of Health Monitoring of Vehicle Structure by Using Feature Extraction based on Discrete Wavelet Transform Akihisa TABATA *4, Yoshio AOKI, Kazutaka ANDO and Masataka KATO Department of Precision Machinery
More informationSilhouette on Image Object Silhouette on Images Object 1 Fig. 1 Visual cone Fig. 2 2 Volume intersection method Fig. 3 3 Background subtraction Fig. 4
Image-based Modeling 1 1 Object Extraction Method for Image-based Modeling using Projection Transformation of Multi-viewpoint Images Masanori Ibaraki 1 and Yuji Sakamoto 1 The volume intersection method
More informationA Japanese Word Dependency Corpus ÆüËܸì¤Îñ¸ì·¸¤ê¼õ¤±¥³¡¼¥Ñ¥¹
A Japanese Word Dependency Corpus 2015 3 18 Special thanks to NTT CS, 1 /27 Bunsetsu? What is it? ( ) Cf. CoNLL Multilingual Dependency Parsing [Buchholz+ 2006] (, Penn Treebank [Marcus 93]) 2 /27 1. 2.
More information概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成
Encoding Source Language with Convolu5onal Neural Network for Machine Transla5on Fandong Meng, Zhengdong Lu, Mingxuan Wang, Hang Li, Wenbin Jiang, Qun Liu, ACL- IJCNLP 2015 すずかけ読み会奥村 高村研究室博士二年上垣外英剛 概要
More information[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing
1,a) 1,b) 1,c) 2012 11 8 2012 12 18, 2013 1 27 WEB Ruby Removal Filters Using Genetic Programming for Early-modern Japanese Printed Books Taeka Awazu 1,a) Masami Takata 1,b) Kazuki Joe 1,c) Received: November
More informationIEEE HDD RAID MPI MPU/CPU GPGPU GPU cm I m cm /g I I n/ cm 2 s X n/ cm s cm g/cm
Neutron Visual Sensing Techniques Making Good Use of Computer Science J-PARC CT CT-PET TB IEEE HDD RAID MPI MPU/CPU GPGPU GPU cm I m cm /g I I n/ cm 2 s X n/ cm s cm g/cm cm cm barn cm thn/ cm s n/ cm
More information¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó
2 2015 4 20 1 (4/13) : ruby 2 / 49 2 ( ) : gnuplot 3 / 49 1 1 2014 6 IIJ / 4 / 49 1 ( ) / 5 / 49 ( ) 6 / 49 (summary statistics) : (mean) (median) (mode) : (range) (variance) (standard deviation) 7 / 49
More informationIPSJ SIG Technical Report Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for
1 2 3 3 1 Secret Tap Secret Tap Secret Flick 1 An Examination of Icon-based User Authentication Method Using Flick Input for Mobile Terminals Kaoru Wasai 1 Fumio Sugai 2 Yosihiro Kita 3 Mi RangPark 3 Naonobu
More informationDEIM Forum 2010 A Web Abstract Classification Method for Revie
DEIM Forum 2010 A2-2 305 8550 1 2 305 8550 1 2 E-mail: s0813158@u.tsukuba.ac.jp, satoh@slis.tsukuba.ac.jp Web Abstract Classification Method for Reviews using Degree of Mentioning each Viewpoint Tomoya
More informationIS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 2 Hough Forest Hough Forest[6] Random Forest( [5]) Random Forest Hough Forest Hough Forest 2.1 Hough Forest 1 2.2
IS1-09 第 回画像センシングシンポジウム, 横浜,14 年 6 月 MI-Hough Forest () E-mail: ym@vision.cs.chubu.ac.jphf@cs.chubu.ac.jp Abstract Hough Forest Random Forest MI-Hough Forest Multiple Instance Learning Bag Hough Forest
More information理工ジャーナル 23‐1☆/1.外村
Yoshinobu TONOMURA Professor, Department of Media Informatics 1 10 YouTube 2 1900 100 1 3 2 3 3 3 1 2 3 4 90 1 90 MIT Project Athena 1983 1991 2 3 4 5 6 7 8 9 10 2 90 11 12 7 13 14 15 16 17 18 19 390 5
More information