Microsoft PowerPoint - Lec23 [互換モード]

情報デザイン専攻画像情報処理論及び演習 II - 動画像処理 - 基礎 Video Stylization 今日の授業内容 www.riken.jp/brict/yoshizawa/lectures/index.html www.riken.jp/brict/yoshizawa/lectures/lec3.pdf 1. 連番画像とビデオ.. Artistic Stylization Video Stylization 3. 演習 :DoG 画像 DoGビデオ Artistic Stylization 第 10 回講義水曜日 1 限教室 618 吉澤信 shin@riken.jp, 非常勤講師大妻女子大学社会情報学部レポート 05 は今日〆切です! 重要 : は次回レポートの内容なので頑張って p(^ ^)q + 今日作るプログラム ( クラス ) を次回以降の演習で使うので必ず来週までに作成してください! レポート 04 の結果を取りに来てください! 動画像の基礎動画像の基礎動画像フォーマット : - ASF(wmv 等 ), AVI, MPEG (mpg,mp4 等 ), DVD, RealVideo, DviX, Flash(flv), QuickTime, MP4, - Animated Gif, multipage TIFF, 理論 / 数学的には 1 次元増えただけ 3D 画像. D: 横幅高さ 3D: 横幅高さ時間講義では複数の D 画像の組で 3D 画像を扱う. - 画素 : ピクセル (D) ボクセル (3D). - サイズ :(ss (sss. - 輝度値 : 次元配列 3 次元配列. - ループ : 重 3 重. - フレームレート : 単位時間のフレーム (D 画像 ) 数 30 frame/sec. 等. D 画像 3D 画像動画像の基礎 3 複数 D 画像ファイル動画フォーマットの変換 : - 符号化方式 ( ファイルフォーマット ) を用いてデータの encode/decodeを行うコーデックが必要. - フリーのソフトを使うのが簡単で良い. - 例えばWinでは AVIMaker(bmp avi) やAviUtl(bmp avi): http://www.vector.co.jp/soft/dl/win95/art/se1164.html http://spring-fragrance.mints.ne.jp/aviutl - http://www.vector.co.jpに色々な動画画像ソフトがあるのでみんな独自のビデオを連番 bmp 画像にしてみましょう! - Linuxでは機能が多彩で難しい! 画像動画動画 : ffmpeg - 簡単! 複数 bmp gifアニメ (Linux): convert - 動画へ convert *.bmp 出力.gif - 画像へ convert 入力.gif 出力.bmp 番号を揃えたい場合はCのprintfの表記と同じに convert 入力.gif 出力 %0 桁数 d.bmp とする. 例えば3 桁なら convert 入力.gif 出力 %03d.bmp (0,0,0) j ( 0, sy 1,0) for( i 0; i st; i ){ 動画像の配列表現 k ( sx 1, sy 1,0) for( j 0; j sy; j ){ for( k 0; k sx; k ){ I[ i][ j][ k]... ( sx 1,0,0) i ( 0,0, st 1) ( 0, sy 1, st 1) int I[ st][ sy][ sx]; double I[ st][ sy][ sx]; 3D 画像の配列表現 ( sx 1,0, st 1) ( sx 1, sy 1, st 1) 1

動画像の数式表現輝度値の数式表現 : 高次元の高さ関数 z I( 又は z I( x), x ( カラー画像 : z I( ( R(, G(, B( ) 又は z I( x) ( R( x), G( x), B( x)), x ( Image3D クラスの使い方使い方は今まで使ってきたSimpleImage.hのImage クラスとほぼ同じで一次元増えただけ. Image3D* 変数名 = new Image3D(); か Image3D* 変数名 = new Image3D( サイズ ); 例えば横 500 縦 56の画像が10 枚あった場合に 3D 画像を Image3D *AAA = new Image3D(500,56,10); とし for(int i=0;i<aaa->st;i++) 使い終わったらdelete AAA; を忘れずに! for(int j=0;j<aaa->sy;j++) for(int k=0;k<aaa->sx;k++)aaa->img[i][j][k] で輝度値を参照する. カラーの場合は三つのImage3D 復習 :Artistic Stylization アーティストの様式を疑似的に再現して実画像を生成編集する事 : NPR/ 計算 Photography の分野. Artistic Video Stylization D の基本フレームワークを 3D 化してみよう! エッジ保存平滑化エッジ抽出ポスター化 ( 多値化量子化 ) 合成. スタイル化動画像へ拡張 J.Collomosse1 and J. Kyprianidis, EG 11. D の基本フレームワーク入力 Bilateral フィルタの繰り返し平滑化画像色相 H の多値化 & 明度 V の強調ポスター化エッジ抽出 DoG エッジ画像復習 :DoG DoG: Difference of Gaussian. g 1 x y exp( ( DoG, K ( g ( gk ( wikipedia ) HSV 量子化画像 RGB の多値化 RGB 量子化画像出力 Stylized 画像

DoG DoG と入力画像の畳み込みが負の領域 = エッジ : 復習 :Bilateral フィルタとは? 0.5, K K 3 K 4 K 5 1.0, K K 3 K 4 K 5 Gaussian Filter Z( g ( x y ) Spatial-Tonal Normalized Convolution: I new ( x) g ( r) e a r a Z( I( dy / Input Bilateral Filter Z( g ( I ( x) I ( ) g ( x y ). Z( d h Intensity (Tonal) Kernel Spatial Kernel エッジ特徴を保存する! Bilateralフィルタの繰り返し適用エッジ保存平滑フィルタを繰り返し適用するとエッジに沿った領域が断片化される ( 領域抽出効果 ): I new ( x) Z( I( dy / Z( d Z ( g ( I ( x) I ( ) g ( x y ) h a g ( r) e. a r DoG+Bilateral フィルタ Bilateral フィルタを繰り返し適用後に DoG を適用 : 上 : 入力画像に DoG: 下 :Bilateral フィルタ 3 回適用後に DoG: 入力 1 回回 3 回 5.0, h 0.1 輝度値の標準偏差 0.5, K K 3 K 4 K 5 DoG+Bilateral フィルタ Bilateral フィルタ後の画像と合成すると上 : 入力画像に DoG: ポスター化多値化で量子化する事でポスター化 : - RGB 毎に多値化すると色が混ざる. - HSV 空間の色相 (H) で多値化し明度 (V) を強調. 下 :Bilateral フィルタ 3 回適用後に DoG: 0.5, K K 3 K 4 K 5 Bilateral フィルタ 3 回適用後 BGB 毎に 4 段階の値へ量子化 3

ポスター化 HSV 空間の色相 (H) で多値化し明度 (V) を強調. ポスター化 3 HSV 空間の色相 (H) で多値化し明度 (V) を強調. RGB 毎の混色で鏡面的効果を演出. 色相を 16 段階の値へ量子化 + 明度を強調. 色相を 16 段階の値へ量子化 + 明度を強調 +RGB 毎に 4 段階に多値化. 入力今週は Video への DoG 拡張 Bilateral フィルタの繰り返し来週平滑化画像色相 H の多値化 & 明度 V の強調ポスター化エッジ抽出 DoG 今日エッジ画像 DoG の 3D 拡張そのままの拡張は時空間エッジになるので Artistic Stylizationでは工夫が必要 : - 注意点 : 時間方向のパラメータhは空間と分けなければダメ時間方向の畳み込み半径も同様. 1 1 x y g, h exp( h DoG g ( g t ) h ( ) (, K, h(, h K, Kh t HSV 量子化画像 RGB の多値化 RGB 量子化画像最終的に Ex15.zip の Style.cxx のビデオへの拡張を作成. 出力 Stylized 画像 DoG の 3D 拡張 DoG の 3D 拡張 3 ストーリー展開の描写は OK だが単純に重ねるとあまり良くない. 4

DoG の 3D 拡張 4 DoG の 3D 拡張 5 D 空間 DoG を時間方向に平滑化し残像効果 : - 注意点 : レポートでは講義で紹介した時間方向の拡張の仕方以外でもデザインして OK. g 1 x y exp( ) ( ( 1 t exp h h DoG, K, h( gh( ( g ( gk ( ) g h DoG の 3D 拡張 6 DoG の 3D 拡張 7 レポートでは時間方向拡張の仕方をデザインして OK. ただし狙ったデザインの目的と使った数式を明記する事. パラメータの調節が必要. 演習 :DoG 画像 DoG ビデオ www.riken.jp/brict/yoshizawa/lectures/index.html www.riken.jp/brict/yoshizawa/lectures/lec3.pdf www.riken.jp/brict/yoshizawa/lectures/ex15.zip 1. Ex15 内のプログラムを動かしてみる.. DoG ビデオプログラムの作成. 演習 :Ex3-1 Ex15.zip 内で make でコンパイルし testvideoio.cxx DoGEdge.cxx DoGEdge.cxx Style.cxx を動かしてみる. 連番画像の入出力 : VideoIO.h void OpenVideo(char * 入力フォルダー名, Image3D *R, Image3D *G, Image3D *B, int *s int *s int *s; void SaveVideo(char * 出力フォルダー名, char * 出力ファイル名, Image3D *R, Image3D *G, Image3D *B); DoGEdge.cxx: DoG によるエッジ画像の作成 : 引数 3../DoGEdge 畳み込み半径 (in DoG 標準偏差 (double) DoG バンド幅 (double)./dogedge lena.bmp ex_1_1.bmp 10 0.5./DoGEdge lena.bmp ex_1_.bmp 10 0.5 3./DoGEdge lena.bmp ex_1_3.bmp 10 0.5 4./DoGEdge lena.bmp ex_1_4.bmp 10 0.5 5 を実行して! 5

演習 :Ex3-1 DoGEdge.cxx: DoG エッジと元画像の合成 ( 引数 3, DoGEdge と同じ ): DoGEdge と同じパラメータで出力ファイル名を変えて実行してみましょう! Style.cxx: Artistic Stylization 画像の作成 ( 引数 11)../Style 畳み込み半径 (in DoG 標準偏差 (double) DoG バンド幅 (double) Bilateral フィルタ空間標準偏差 (double) Bilateral フィルタ輝度標準偏差 (double) Bilateral フィルタ繰り返し回数 (in HSV 量子化数 (in HSV 量子化 V 強調パラメータ (double) RGB 量子化数 (in./style lena.bmp ex_st_1.bmp 0 0.5 3.0 5.0 0.1 3 16 0.7 4 と./Style lena.bmp ex_st_1.bmp 10 0.5 5.0 5.0 0.1 3 16 0.7 4 で実行してみましょう! 自分の画像で DoGEdge.cxx と Style.cxx をパラメータを調節してスタイリッシュな画像にしてみてください. 演習 :Ex3- DoGVideoEdge.cxxとDoGVideoEdge.cxxを編集し連番画像のDoGエッジ動画を作成するプログラムを完成せよ. ヒント : ファイル内のコメントとDoGEdge.cxxをよく見てみてください. DoG 1 x y g ( exp( ) 1 t ( exp h h, K, h( gh( ( g ( gk ( y と同じでも OK 自分独自の拡張でも OK ただし単純拡張はダメ. はの様に残像だけなので評価時刻での DoG エッジも出るようにデザインすると高得点! g h )) 来週の予定動画像処理その (1/19). 参考資料 : Image3D クラス 3D 画像クラスの作成 3D 画像クラス : Image3DクラスをSimpleImage3D.h というヘッダーファイル名で作ってみる. www.riken.jp/brict/yoshizawa/lectures/ex14.zip 必要なクラスのメンバー / メソッド : - 画像サイズ (in で三つssst. - 輝度値を格納するためのdoubleの3 重ポインター. - コンストラクター二つ : - 引数無 : サイズにゼロ輝度値のポインターに NULLを代入する. - 引数画像サイズ : 輝度値の3 重ポインターのメモリを確保して3 次元配列にする. - デストラクター : クラスがdeleteしたとき輝度値の3 次元配列をdeleteする. C++ クラスの基礎 class クラス名 { /* 設計図の様なものでクラス = 新しい型 */ public: /* パブリックの場合はクラスの外から参照可能 */ メンバー変数 /* クラスが持っている変数構造体クラス内クラス */ クラス名 (){ /* コンストラクター :new されたときに呼ばれる. */ クラス名 ( 引数 ){ /* コンストラクターは複数あってよい */ ; ~ クラス名 (){ /* デストラクター :delete されたときに呼ばれる. */ 戻り値メソッド名 ( 引数 ){ /* メソッドを作れる = */ private: /* プライベートの場合はクラスの外から参照不可 */ 6

多重ポインターから多次元配列を作る方法 1 重ポインターから 1 次元配列を作る方法 : double *A = new double[n]; これで A[0], A[1], A[N-1] まで配列として使える. - 使い終わったらメモリの開放が必要 :delete [] AAA; 重ポインターから次元配列を作る方法 : double **A = new double *[N]; for(int i=0;i<n;i++)a[i] = new double[m]; これで A[0][0], A[0][1], A[0][M-1], A[1][0], A[1][1], A[N-1][M-1] まで配列として使える. - 使い終わったらメモリの開放が必要 : for(int i=0;i<n;i++) delete [] A[i]; delete [] A; 多重ポインターから多次元配列を作る方法 3 重ポインターから 3 次元配列を作る方法 : double ***A = new double **[st]; for(int i=0;i<st;i++){ A[i] = new double *[sy]; for(int j=0;j<sy;j++)a[i][j] = new double[sx]; これで A[0][0][0], A[0][0][1], A[0][0][sx-1], A[0][1][0], A[0][1][1], A[0][sy-1][sx-1], A[1][0][0], A[1][0][1], A[st-1][sy-1][sx-1] まで配列として使える. 同様にメモリの開放は以下 : for(int i=0;i<st;i++){ for(int j=0;j<sy;j++) delete [] A[i][j]; delete [] A[i]; delete [] A; 連番画像の入出力へ向けて (0,0,0) j ( 0, sy 1,0) k ( sx 1, sy 1,0) for( i 0; i st; i ){ 1. BMPIO で一枚づつテンポラリーの D 画像を開く.. 3D 画像の i 番目にコピー. ( sx 1,0,0) i ( 0,0, st 1) ( 0, sy 1, st 1) int I[ st][ sy][ sx]; double I[ st][ sy][ sx]; 3D 画像の配列表現 ( sx 1,0, st 1) ( sx 1, sy 1, st 1) 連番画像名の取得方法 Ex14.zip 内の ImageSetIO.cxx を開いてください. 入力としてフォルダー名を与えてその中の BMP ファイルをファイル名順にソートしたファイル名のリストを得るプログラムです. 今回の演習でやる方法はステップ 1:Linux/Unix コマンドの ls と grep を C/C++ からシステムコール関数 system() を使って与えられたフォルダー名内の BMP 画像ファイル名 ( 複数 ) をテンポラリーのファイル (tmp_img_file_names.tx に書き出す. - system() は stdlib.h が必要. - system(char*) で引数に書いた Linux コマンドを実行出来る. 例 :system( ls ); 連番画像名の取得方法今回は以下のコマンドを用いる : ls 入力フォルダー名 grep.bmp > 出力ファイル名ここでと > はそれぞれパイプとリダイレクトと呼ばれてコマンドの結合とファイルへの出力を行える : - ls AAA AAA 内のファイル名フォルダー名を出力する. - grep AAA BBB BBB の中から AAA がある行を抜き出す. - AAA BBB AAA の結果を BBB に渡す. - AAA > BBB AAA の結果を BBB に書き出す. - sprintf( 格納先,printf の表記, 変数 ) でコマンド内にメインの引数やテンポラリーファイル名をプリント. 与えられたフォルダー名内の ls の結果から.bmp が付いているファイル名だけ抽出して出力ファイルに書き出すコマンド. 連番画像名の取得方法 3 ステップ: テンポラリーのファイル (tmp_img_file_names.tx を開いて一行づつfscanf() で呼び込み vector<char *> へ格納する : - FILE *fp = fopen( ファイル名, r ); で開いたファイルポインター fpを使ってfscanf(fp, %s, 格納先 ) の戻り値がEOFでない間繰り返しスキャンする. - vectorを使うには #include<vector> が必要. - vector<char *> へ代入するためにchar * をnewして fscanf() の結果をコピーする. -.push_back() メソッドを使ってvectorへ格納する. 格納後はvectorなので配列の様に使える. 例えば vector <char *> AAA; ならAAA[0] に最初のファイル名がchar * で入っており以下 AAA[1], AAA[] と使える. サイズ (push_back した回数 =ファイル名の数 ) は AAA.size() で得られる. 7

連番画像名の取得方法 4 ステップ 3:std::sort を使って vector<char *> に格納したファイル名をソートする. 例えば vector <char *> AAA; なら std::sort(aaa.begin(),aaa.end()); でソートされる. - std::sort は #include<algorithm> が必要. ステップ 4: ソート後は vector<char *> を配列の様に使いファイル名の操作を行い実際の処理をする. - ImageSetIO.cxx は連番名の取得だけなので実際の処理は無いが演習では VideoIO.cxx でソート後のファイル名を順番に開いて 3D 画像クラスに格納する. BMPIO.h を使って D 毎に入出力をファイル名の数だけ行う. ステップ 5:new した char * のメモリを解放する. 例えば for(i=0;i<aaa.size();i++)delete [] AAA[i]; 演習 : 連番画像の入出力 www.riken.jp/brict/yoshizawa/lectures/index.html www.riken.jp/brict/yoshizawa/lectures/lec3.pdf www.riken.jp/brict/yoshizawa/lectures/ex14.zip 1. Lec3-1: 3D 画像クラスを SimpleImage3D.h として作成せよ.. Lec3-: 連番画像の入出力を行うプログラム VideoIO.cxx をコメントを読みながら作成せよ. LV3_1.zip と LV3_5.zip を展開して入力フォルダーとして実行してみよ. Lec3-3: の 1, を使って連番の各画像に Bilateral フィルタ (Lec0-) を計算して結果を保存するプログラムを作成してみましょう. 8