Microsoft PowerPoint - Lec23 [互換モード] - PDF 無料ダウンロード

情報デザイン専攻画像情報処理論及び演習 II - 計算 Photography3- Video Stylization 今日の授業内容 www.riken.jp/brict/yoshizawa/lectures/index.html www.riken.jp/brict/yoshizawa/lectures/lec3.pdf 1. 動画像の基礎. Video Stylization 第 11 回講義水曜日 1 限教室 618 吉澤信 shin@riken.jp, 非常勤講師大妻女子大学社会情報学部動画像の基礎動画像の基礎動画像フォーマット : - ASF(wmv 等 ), AVI, MPEG (mpg,mp4 等 ), DVD, RealVideo, DviX, Flash(flv), QuickTime, MP4, - Animated Gif, multipage TIFF, 理論 / 数学的には 1 次元増えただけ 3D 画像. D: 横幅高さ 3D: 横幅高さ時間講義では複数の D 画像の組で 3D 画像を扱う. - 画素 : ピクセル (D) ボクセル (3D). - サイズ :(ss (sss. - 輝度値 : 次元配列 3 次元配列. - ループ : 重 3 重. - フレームレート : 単位時間のフレーム (D 画像 ) 数 30 frame/sec. 等. D 画像 3D 画像動画像の基礎 3 複数 D 画像ファイル動画フォーマットの変換 : - 符号化方式 ( ファイルフォーマット ) を用いてデータの encode/decodeを行うコーデックが必要. - フリーのソフトを使うのが簡単で良い. - 例えばWinでは AVIMaker(bmp avi) やAviUtl(bmp avi): http://www.vector.co.jp/soft/dl/win95/art/se1164.html http://spring-fragrance.mints.ne.jp/aviutl - http://www.vector.co.jpに色々な動画画像ソフトがあるのでみんな独自のビデオを連番 bmp 画像にしてみましょう! - Linuxでは機能が多彩で難しい! 画像動画動画 : ffmpeg - 簡単! 複数 bmp gifアニメ (Linux): convert - 動画へ convert *.bmp 出力.gif - 画像へ convert.gif 出力.bmp 番号を揃えたい場合はCのprintfの表記と同じに convert.gif 出力 %0 桁数 d.bmp とする. 例えば3 桁なら convert.gif 出力 %03d.bmp 演習 : gif anime www.riken.jp/brict/yoshizawa/lectures/index.html 1. 上記 URL から LV3_1.zip 及び LV3_5.zip をダウンロード.. 右クリックで展開を選び ( 例えばデスクトップに ) 圧縮ファイルを展開. 3. 端末を開き cd で展開したフォルダーへ移動. 4. 端末にて convert *.bmp output.gif で gif anime へ変換. 5. Web ブラウザ (IE) に output.gif をドラッグ & ドロップ. 1

(0,0,0) j ( 0, sy 1,0) 動画像の配列表現 k ( sx 1, sy 1,0) ( sx 1,0,0) int double 3D 画像の配列表現動画像の数式表現 i 0; i st; i ){ j 0; j sy; j ){ k 0; k sx; k ){... i ( 0,0, st 1) ( 0, sy 1, st 1) ( sx 1,0, st 1) ( sx 1, sy 1, st 1) 輝度値の数式表現 : 高次元の高さ関数 z I( 又は z I( x), x ( カラー画像 : z I( ( R(, G(, B( ) 又は z I( x) ( R( x), G( x), B( x)), x ( 例えば Image3D クラス使い方は今まで使ってきた SimpleImage.h の Image クラスとほぼ同じで一次元増えただけ. Image3D* 変数名 = new Image3D(); 又は Image3D* 変数名 = new Image3D( サイズ ); 例えば横 500 縦 56 の画像が 10 枚あった場合に 3D 画像を Image3D *AAA = new Image3D(500,56,10); とし int i=0;i<aaa->st;i++) int j=0;j<aaa->sy;j++) int k=0;k<aaa->sx;k++)aaa->img[ で輝度値を参照する. カラーの場合は三つの Image3D を使う. C++ クラスの基礎 class クラス名 { /* 設計図の様なものでクラス = 新しい型 */ public: /* パブリックの場合はクラスの外から参照可能 */ メンバー変数 /* クラスが持っている変数構造体クラス内クラス */ クラス名 (){ /* コンストラクター :new されたときに呼ばれる. */ クラス名 ( 引数 ){ /* コンストラクターは複数あってよい */ ; ~ クラス名 (){ /* デストラクター :delete されたときに呼ばれる. */ 戻り値メソッド名 ( 引数 ){ /* メソッドを作れる = */ private: /* プライベートの場合はクラスの外から参照不可 */ 多重ポインターから多次元配列を作る方法 1 重ポインターから 1 次元配列を作る方法 : double *A = new double[n]; これで A[0], A[1], A[N-1] まで配列として使える. - 使い終わったらメモリの開放が必要 :delete [] AAA; 重ポインターから次元配列を作る方法 : double **A = new double *[N]; int i=0;i<n;i++)a[i] = new double[m]; これで A[0][0], A[0][1], A[0][M-1], A[1][0], A[1][1], A[N-1][M-1] まで配列として使える. - 使い終わったらメモリの開放が必要 : int i=0;i<n;i++) delete [] A[i]; delete [] A; 多重ポインターから多次元配列を作る方法 3 重ポインターから 3 次元配列を作る方法 : double ***A = new double **[st]; int i=0;i<st;i++){ A[i] = new double *[sy]; int j=0;j<sy;j++)a[j] = new double[ これで A[0][0][0], A[0][0][1], A[0][0][sx-1], A[0][1][0], A[0][1][1], A[0][sy-1][sx-1], A[1][0][0], A[1][0][1], A[st-1][sy-1][sx-1] まで配列として使える. 同様にメモリの開放は以下 : int i=0;i<st;i++){ int j=0;j<sy;j++) delete [] A[j]; delete [] A[i]; delete [] A;

動画のパターン認識動画のパターン認識２基本は静止画のパターン認識法を高次元として適用する: - 背景差分オプティカルフローパーティクルフィルタ確率論等. 背景フレーム間差分時間微分の差分近似. オプティカルフロー: 移動物体の運動解析. - ブロックマッチング法テンプレートマッチング. - 勾配法 I I I u v 0, x y t 近傍からも式を立てて最小二乗解. CG-ARTS協会 CG-ARTS協会 natori.sendai-nct.ac.jp www.ultimategraphics.co.jp www.media.imit.chiba-u.jp/~kameda 応用例コンピュータビジョン動画のパターン認識３注目領域の自動提示脳科学に基いた顕著度(Salienc 動画編集への応用: USC, ilab C++ Neuromorphic Vision Toolkit Overview 応用例パターン認識教師を用いた識別(類似度): 注目赤応用例パターン認識非注目青 Google等の画像検索リトリーバル OpenCV opencv.jp 吉澤横田, Biomedical Interface, 011. 物体追跡顔認識 Object Tracking, Face Recognition K. Hotta, ICPR 006. 3

応用例 : パターン認識機械学習 (Machine Learning) による異常検出 : 応用例 :Content-Aware Resizing Seam Carving: ビデオへも拡張 & マスクと組み合わせてオブジェクトの削除も. S. Avidan & A. Shamir, SIGGRAPH, 007 産総研. M. Rubinstein, SIGGRAPH, 008 Artistic Video Stylization D の基本フレームワークを 3D 化してみよう! エッジ保存平滑化ポスター化 ( 多値化量子化 ) 合成. D の基本フレームワークスタイル化平滑化画像色相 H の多値化 & 明度 V の強調ポスター化エッジ画像動画像へ拡張 HSV 量子化画像 RGB の多値化 RGB 量子化画像出力 Stylized 画像スタイル化ビデオ平滑化動画ポスター化色相 H の多値化 & 明度 V の強調エッジ動画の 3D 拡張そのままの拡張は時空間エッジになるので Artistic Stylizationでは工夫が必要 : - 注意点 : 時間方向のパラメータhは空間と分けなければダメ時間方向の畳み込み半径も同様. 1 1 x y g, h exp( h g ( g t ) h ( ) (, K, h(, h K, Kh t HSV 量子化動画 RGB の多値化 RGB 量子化動画出力 Stylized 動画 4

の 3D 拡張の 3D 拡張 3 ストーリー展開の描写は OK だが単純に重ねるとあまり良くない. の 3D 拡張 4 の 3D 拡張 5 D 空間を時間方向に平滑化し残像効果 : - 注意点 : 講義で紹介した時間方向の拡張の仕方以外でもデザインして OK. 1 x y exp( ) ( g ( 1 t exp h h, K, h( gh( ( g ( gk ( ) g h の 3D 拡張 6 の3D 拡張 7 時間方向拡張の仕方をデザインしてもOK. パラメータの調節が必要. 5

スタイル化ビデオ平滑化動画ポスター化色相 H の多値化 & 明度 V の強調エッジ動画 I 単純に時間方向のガウス関数を追加するだけで OK. new ( x) Z( I( dy g ( r) e a r a. 時空間フィルタ / Z( d Input Filter Z( gh( I( x) I( ) g ( x y ) g ( ) Intensity Kernel Spatial Kernel Temporal Kernel HSV 量子化動画 RGB の多値化 RGB 量子化動画出力 Stylized 動画復習 : 動画像の配列表現 (0,0,0) j ( 0, sy 1,0) i 0; i st; i ){ k ( sx 1, sy 1,0) j 0; j sy; j ){ k 0; k sx; k ){... ( sx 1,0,0) i ( 0,0, st 1) ( 0, sy 1, st 1) int double 3D 画像の配列表現 ( sx 1,0, st 1) ( sx 1, sy 1, st 1) 量子化の 3D 拡張そのままの拡張は時間変化に弱いので時間方向の半径を考えてその半径内 ( 部分画像毎 ) に量 i 0; i st; i ){ 子化を実行する : t i rt ; t i rt ; t ){ 例えばHSV 量子化では j 0; j sy; j ){ i 0; i st; i ){ j 0; j sy; j ){ k 0; k sx; k ){ 単純な 3D 化... j 0; j sy; j ){ k 0; k sx; k ){ k 0; k sx; k ){ t][... RGB HSV H の多値化 +V の強調... HSV RGB 量子化の 3D 拡張量子化の 3D 拡張 3 :56 3 色 :56 3 色色相 H は 16 段階明度 V 強調 0.5 時間半径 16 色相 H は 16 段階明度 V 強調 0.5 RGB 各 4 段階時間半径 16 6

量子化の 3D 拡張 4 量子化の 3D 拡張 5 :56 3 色時間方向の半径 4 色相 H1 色色相 H4 色 V 強調 0. 色相 H4 色 V 強調 0.RGB 各 4 段階色相 H は 16 段階明度 V 強調 0.5 RGB 各 4 段階時間半径 16 フィルタ 3 回適用後を復習 : スタイル化ビデオ HSV 量子化動画 RGB の多値化平滑化動画ポスター化色相 H の多値化 & 明度 V の強調 RGB 量子化動画エッジ動画出力 Stylized 動画演習 : 量子化ビデオスタイルビデオ www.riken.jp/brict/yoshizawa/lectures/index.html www.riken.jp/brict/yoshizawa/lectures/lec3.pdf www.riken.jp/brict/yoshizawa/lectures/ex15.zip 1. VideoStyle.cxx は完成しているので Ex15.zip をダウンロードし圧縮ファイルを展開.. 端末にて make でコンパイル. 3. 出力用フォルダーを作成し英語 ( 半角英数のみ ) で名前を付ける. 例えば Ex15 の中に Test という名前のフォルダーを作成. 4. 引数 14 で実行. 引数の意味は次のスライド. 実行例 : 注意 :LV3_5 が Ex15 と階層構造で同じ場所にあるとき. Ex15 の中にある場合はは./LV3_5../VideoStyle../LV3_5./Test output 10 0.5 3.0 5.0 0.1 3 1 1.0 16 0.4 4 演習 : VideoStyle の 14 の引数 1. フォルダー名. 出力フォルダー名 3. 出力ファイル名 (.bmp なし ) 4. 畳み込みの半径 (in 5. の半径 (double) 6. のバンド幅 (double) 7. フィルタの空間標準偏差 (double) 8. フィルタの輝度値標準偏差 (double) 9. 回数 (in 10. 時間方向畳み込み半径 (in 11. & の時間標準偏差 (double) 1. HSV の H を多値化する数 (in 13. HSV 量子化の V 強調パラメータ (double) 14. RGB を多値化する数 (in おわりにみなさん良く頑張りましたd(>_ ) 今日で本講義は終わりです. みんな最後まで来てくれてありがとー o( )o またいつかお会いしましょう! ヾ ( ^-^) ゞ 7