認識行動システム論 - PDF Free Download

05/5/ レポートメールエラーインタラクティブシステム論第 7 回梶本裕之 Twitter ID kajimoto ハッシュタグ #ninshiki 第 5 回分のレポートメールがエラーになった可能性があります.( メールボックスのサイズオーバー ) 再度送信してください. 日程 4/9 イントロダクション 4/6 Scilab の紹介 ( 西 6 号館 3 階 PC ルーム ) 4/3 出張により休講 4/30 フーリエ変換 5/7 フーリエ変換と線形システム 5/4 信号処理の基礎 5/ 信号処理応用 ( 相関 ) 5/8 信号処理応用 ( 画像処理 ) 6/4 研究室見学 ( 大学院オープンラボ ) 6/ 中間確認テスト 6/8 ラプラス変換 6/5 出張により休講 7/ 古典制御の基礎 7/9 行列 7/6 行列と最小二乗法 7/3 ロボティクス 8/5~ 期末テスト中間確認テスト中間テスト用の問題集を配布します一度式の導出を覚えることを意図しています画像処理とは元の画像から人間が理解しやすいように加工する何らかの情報を抽出する信号処理の一種. 初歩的な画像処理特徴次元データである ( 動画なら 3 次元 ) 時間信号のような因果関係がない ( 動画ならある )

05/5/ 初歩的な画像処理 () 拡大縮小 ( 例 )3 倍に拡大一番簡単な方法 :Nearest Neighbor ( 最近傍 ) 法 Y i,j = X i/3,j/3 ( ただし i/3 は整数の割り算./3=0, /3=0, 3/3=...) Nearest Neighbor 法の問題 5 倍 /5 倍. 荒さが目立つ. 縮小時には偽の周波数 ( モワレ ) を生じる ( サンプリング間隔の変化によるエリアシング ) もっとなだらかに結べばよい直線補間. Bi-Linear 法次元画像なので 4 点間を線形補間 Bi : 線形補間を回することを表す 5 倍初歩的な画像処理 () 回転 () 新画像のあるピクセル座標 X new, Y new が, 元画像でどこに位置していたか計算.( 順番に注意 ) X Y old old cos( ) sin( ) sin( ) X cos( ) Y new new Nearest Neighbor 法 (X new, Y new ) (X old, Y old ) Bi-Linear 法他に Bi-Cubic 法など ()X old, Y old は小数整数にして, そのピクセルの色を使う (Nearest Neighbor 法 ) 周辺の 4 ピクセルから補間する (Bi-Linear 法 ) 初歩的な画像処理 (3) グレースケール化網膜 = 光センサ誰でも考える方法 :R,G,B の平均 : K ij =(R ij +G ij +B ij )/3 悪くはないが, 最良でもない. インタラクティブ技術特論中心窩盲点中心窩 : 最も解像度が高い. 画像の中心盲点 : 神経束が出て行く場所のため視細胞が無い

05/5/ 種類の光感受性細胞桿体細胞 (Rod) 明暗センサ錐体細胞 (Cone) 青錐体細胞 (S 細胞 ) 435nm 近辺緑錐体細胞 (M 細胞 ) 546nm 近辺赤錐体細胞 (L 細胞 ) 600nm 近辺初歩的な画像処理 (4) 濃度調整メリハリのある画像にしたい : 画像の明るさ分布に注目 () ヒストグラムを作成 () ヒストグラムを均等にする () 同じ輝度の R, G, B を, 人は同じ明るさに感じない補正心理的に正しいグレースケール変換 : K ij = 0.99R ij + 0.587G ij + 0.4B ij () イコライゼーション (3) さらにヒストグラムの累積度数のグラフの傾きが一定になるようにする.( 色に関しても同様 ) 初歩的な画像処理 (5) 重心計算 () M L M L (3) x f ( x) dx c f ( x) dx 重心計算 cx m c y m x f ( x, y) dxdy y f ( x, y) dxdy m: 全体の合計重さ () 閾値処理で望んだモノ以外は真っ黒 (0) にする () 画像をx,y 軸に投影する ( 軸にそって平均 ) f x ( x) f ( x, y) dy f y ( y) f ( x, y) dx (3) それぞれの結果の重心を求める c m x f x dx x x( ) c m y f y dy y y ( ) 素直な重心計算よりも乗算回数が減り, 高速になる画像のフィルタリング 3

05/5/ ( 復習 ) 平均化 = ローパスフィルタ画像の平滑化次元信号の平滑化と同様に, 次元的に平均すればよい. 3x3 領域を平均化する場合 : Y i,j = X i-,j- + X i-,j + X i-,j+ + X i,j- + X i,j + X i,j+ + X i+,j- + X i+,j + X i+,j+ ノイズをならして大域的な特徴をつかむオペレータ 3x3 領域を使った演算を一般化 : Y i,j = ax i-,j- + bx i-,j + cx i-,j+ + dx i,j- + ex i,j + fx i,j+ + gx i+,j- + hx i+,j + ix i+,j+ この係数行列をオペレータという. FIR フィルタの係数と同じ役割. 先ほどの平滑化 : すべての係数が等しい a d g b e h c / 9 f i オペレータの演算例元画像オペレータ結果 3 4 3 3 3 4 5 3 4 5 4 8 4 6 端の処理が問題となる場合はとりあえず考えない Photoshop によるデモ : 平滑化 Scilab レポート課題準備 : サンプル画像作成 for x=:8, for y=:8, deg = atan(y-64,x-64)/%pi*80; if(pmodulo(deg,30)<5) img(x,y)=55; else img(x,y)=0; 8 8 の行列を用意中心から放射状に伸びる縞 (64,64) x-64 (x,y) y-64 f = scf(); f.color_map = graycolormap(56); Matplot(img); // 行列を square(0,0,9,9); 56 階調グレースケール表示 4

05/5/ Scilab による 3x3 の平均化元画像生成部は省略 img=zeros(6,6); //3x3のオペレータによる平均化 8でないことに注意! for x=:6, for y=:6, 次の行に続く印 img(x,y)=... (img(x,y) +img(x+,y) +img(x+,y)+... img(x,y+)+img(x+,y+)+img(x+,y+)+... img(x,y+)+img(x+,y+)+img(x+,y+))/9; 平均画像表示部は省略 3x3 の平均化元画像フィルタ画像 5x5 の平均化元画像生成部分は省略 Img=zeros(4,4); for x=:4, for y=:4, img(x,y)=... (img(x,y) +img(x+,y) +img(x+,y) +img(x+3,y) +img(x+4,y)+... img(x,y+)+img(x+,y+)+img(x+,y+)+img(x+3,y+)+img(x+4,y+)+... img(x,y+)+img(x+,y+)+img(x+,y+)+img(x+3,y+)+img(x+4,y+)+... img(x,y+3)+img(x+,y+3)+img(x+,y+3)+img(x+3,y+3)+img(x+4,y+3)+... img(x,y+4)+img(x+,y+4)+img(x+,y+4)+img(x+3,y+4)+img(x+4,y+4))/5; 画像表示部分は省略 5x5 の平均化元画像フィルタ画像中心付近を拡大してみる元画像フィルタ画像 ( 復習 ) オペレータとフーリエ変換入力 :f(t) f(x) x オペレータ h(x) 出力 :x(t) X(x) x ある直径の円周上が灰色その内側では, 黒白, 白黒の反転偽解像現象と呼ぶ X ( x) f ( x) h( x x') dx' X ( ) F( ) H ( ) オペレータ h(x) のフーリエ変換が H(ω) であるとする. 空間領域でのオペレータの畳込み積分 ( コンボリューション ) は, 周波数領域でオペレータをフーリエ変換したフィルタ H(ω) をかけることと等価オペレータ = フィルタ 5

05/5/ オペレータのフーリエ変換例 a d g b e h c / 9 f i フィルタの形が矩形の場合フーリエ変換するとSinc 関数 f(x) 偽解像現象はなぜ生じるか平均化 =Low Pass Filter というのは, 近似にすぎない. 単なる Low Pass Filter ではない特定の周波数のゲインは 0( 画像では灰色になる ) 周波数によっては位相が反転 ( 画像では白黒反転偽解像 ) 平均化 =Low Pass Filter というのは, 近似にすぎない. 単なる Low Pass Filter ではない. 特定の周波数のゲインは 0( 画像では灰色になる ) 周波数によっては位相が反転 ( 画像では白黒反転偽解像 ) 画像平滑化の実際 : ガウシアンフィルタ 3x3 ガウシアンオペレータ 5 3 フィルタの形がガウシアンフーリエ変換してもガウシアン h( x) exp ax H ( ) exp a 4a 事前処理としてのガウシアンフィルタ多くの画像処理で, 事前にガウシアンをかけてノイズを除去する. 先ほどの問題点が解決され, 素直な LPF となる. 実用的なオペレータサイズ :3x3, または 5x5 5x5 ガウシアンオペレータ 4 4 0 7 33 33 4 0 4 7 4 33 55 0 33 4 7 33 0 4 7 4 レポート課題 () もう一つのノイズ除去 : メディアンフィルタノイズが強力かつ小さい時元画像に 5x5 のガウシアンフィルタをかけ, ぼかしてみる元画像と比較し, ぼけていることを確認せよ ( ヒント )5x5 の単純平均化のソースコードを改変 ()LPF ではノイズが薄く広がるだけ. () 中間値 ( メディアン ) を用いる. 3x3 領域を使う場合 : Y i,j = 中間値 (X i-,j-, X i-,j, X i-,j+, X i,j-, X i,j, X i,j+, X i+,j-, X i+,j, X i+,j+ ) 9 個の値をソート 5 番目を採用 6

05/5/ ( 参考 ) モルフォロジー ( 形態 ) 処理特に値画像で用いられる. 範囲内の最大値を取る :Dilation( 膨張 ) 範囲内の最小値を取る : Erosion ( 収縮 ) ( 参考 ) モルフォロジー ( 形態 ) 処理範囲の形状を定義すれば筆の効果も得られる元画像 dilation 範囲 Dilation( 膨張 ) Erosion ( 収縮 ) ( 復習 ) 逆に高い周波数成分だけ取り出すには? ローパスフィルタ : 低い周波数成分だけを取り出した元信号と低周波信号の差をとれば, 高周波数成分だけ取り出せる? 入力 f(t) ローパス x(t) 高周波成分 y(t) 画像のエッジ抽出アイデア : 低い周波数成分を取り除く具体的には? 変化だけを取り出せば良い. 空間的な微分を行っていることに等しい対応 : 微分 = エッジ抽出 = ハイパスフィルタ積分 = 平滑化 = ローパスフィルタ微分 : Sobel フィルタ Sobel フィルタ () X y ディジタルの世界 : 微分差分 dx( t) y( t) dt x( n ) x( n ) y( n) ()X 方向微分と,Y 方向平滑化 X x a d g b c e f h i 0 0 0 ()Y 方向微分と,X 方向平滑化 X x X y a d g b e h c f 0 i 0 0 次元の微分 :x 方向,y 方向がある. X x u i,j = X i+,j - X i-,j X y v i,j = X i,j+ - X i,j- (3)()() の結果をベクトルとみなした時の大きさ = 変化の強さ (4) 閾値により値化 X X x y 7

05/5/ Sobel フィルタの使用例元画像処理画像レポート課題 () 元画像に 3x3 の Sobel フィルタをかけ, エッジを抽出してみよヒント EdgeX=zeros(6,6); for x=:6, for y=:6, EdgeX (x,y)= 略 EdgeY=zeros(6,6); for x=:6, for y=:6, EdgeY(x,y)= 略 img = sqrt(edgex.*edgex + EdgeY.*EdgeY); 階微分 :Laplacian フィルタエッジ抽出 = 空間的な微分さらに微分すれば? 二階微分 d x( t) y( t) dt 次元では? X X x y X x( n ) x( n) x( n) x( n ) y( n) x( n ) x( n) x( n ) 階微分 :Laplacian フィルタ ( 続 ) X X x y X X X x y u i,j = X i+,j -X i,j + X i-,j v i,j = X i,j+ - X i,j + X i,j- 0 4 0 通常は 8 0 0 という形を用いることが多い Photoshop によるデモ : エッジ抽出 ( 参考 )LoG フィルタ LoG=Laplacian of Gaussian Gaussian で平滑化後,Laplacian でエッジ抽出人間の網膜上の情報処理そのもの人間はなだらかな輝度変化に鈍感 8

05/5/ ( 参考 ) エッジ抽出の実際 :Canny フィルタエッジ抽出は通常, 最後に値化して終了, 次の処理へ. Sobel フィルタ : 閾値の設定が難しい. 必要なエッジが消えてしまう or エッジが出過ぎる相関と画像処理 Canny フィルタ : 最も標準的なエッジ抽出手法微分計算自体は Sobel の方法を使う戦略 : 弱いエッジも, 長く繋がりそうなら救う ( 二つの閾値使用 ) 計算量はやや多い. テンプレートマッチング例 : 画像中から特定の人の顔を認識したい ( 復習 ) 波形 f に波形 g はどれだけ含まれるか波形 f 中の, 波形 gの成分 = T f ( t) g( t) dt T 0 ( 連続関数 ) = N f ( i) g( i) N ( 離散化して考えた場合 ) i これは二つの波をベクトルと考えた時の内積に他ならない内積を連続関数に対して定義 ( 復習 ) 相互相関 f(t) g(t) ( 復習 ) 相互相関 f(t) g(t) < 問題 > 二つの信号が, 時間的にどれだけずれているのか時間のずれを無視したらどれだけ似ているのかを測定したい. 内積を思い出せば, 次の手順で測定すればよいことがわかる g(t) をτだけずらしてみる g( t ) f(t) との内積を取ってみる f ( t) g( t ) dt τを変化させていく. R fg (τ): 二つの関数 f(t),g(t) の, 相互相関関数 R fg ( ) f ( t) g( t ) dt R fg (τ) が最大の値をとる τ= 元の関数 f(t) と g(t) のズレ ( ただし直流成分を取り除いた後 ) τ 9

05/5/ ( 復習 ) 相互相関の応用 : 速度計測管内の流速を正確に測定したいただし, 管の中に接触してはいけない ( 液漏れ厳禁 ) ( 復習 ) 相互相関の応用 : 速度計測光学式マウスの中身 =6x6 pixel の CMOS カメラ f(t) g(t) 上流に熱源を置き,f(t) でランダムに変動させる. 下流で温度を測定する.g(t) f(t) と g(t) の相互相関関数が最大となる時間差 τ が, 水流によって熱が移動するのに要する時間である. 二つの画像 (= 次元関数 ) 同士の相互相関を取ることで移動量を計測する. 自動車の速度計測等にも利用. テンプレートマッチング ( 再 ) 次元に拡張. g(t) g(x,y) として, 顔の標準的な画像を用意して相互相関をとれば, 顔の部分でピークを生じるテンプレートマッチング ( 例 ) 標準顔をテンプレートとして顔を沢山認識テンプレート g(x,y) ( 参考 ) ステレオビジョンによる立体計測二つ以上のカメラを使う三角測量の原理. 視差を利用ブレ (Motion Blur) についてブレ (Motion Blur): カメラを使ってイメージを捕らえる過程中での移動または長い露光時間を使う場合の被写体の移動左目映像右目映像 0

05/5/ ( 復習 ) エコーエコー = 時間遅れ信号の重畳. これは FIR フィルタで実装できる. ( 復習 ) ゴースト現象 Scilab コード例 wave = loadwave('aiueo.wav'); out=zeros(wave); // エコー (000 ステップ前の信号を重畳 ) for n=000:length(wave), out(n)=wave(n)+0.9*wave(n-999); playsnd(out,000); //khzサンプリングで再生 savewave('wave.wav',out,[000]); 原音 000 ステップ前の信号を重畳 000 ステップ前 + 000 ステップ前の信号を重畳沢山重畳 ( 復習 ) 自己相関二つの関数 f(t),g(t) の代わりに, ひとつの関数 f(t) の相関を取る. R ff ( ) f ( t) f ( t ) dt R ff (τ) f(t) τ ブレの検出と除去基本原理 () 次元の自己相関計算によってブレの方向と量を推定 () ブレの方向に微分フィルタを適用する実際はもうすこし複雑自己相関関数は, どれだけずれたら自分自身に近い形になるかを表す. すなわち, エコーを発見していることに他ならない. 画像処理に関する情報源画像処理を使うために新編画像解析ハンドブック C 言語で学ぶ実践ディジタル映像処理 Matlab の Image Processing Toolbox のヘルプ ( これが一番分りやすい?) http://dl.cybernet.co.jp/matlab/support/manual/r4/toolbox/imag es/?/matlab/support/manual/r4/toolbox/images/getting.shtml 画像処理は歴史の長い分野です. 車輪の再発明をせず, 過去の実績ある方法を検討しましょう.

05/5/ Scilab での画像処理 SIP=Scilab Image Processing toolbox http://siptoolbox.sourceforge.net/ 画像処理ライブラリ OpenCV 世界で最も広く使われている画像処理ライブラリ (C 言語 ) これにより画像処理研究はソフト開発から解放された. 画像の読み出しと保存が可能. 普通に知られているアルゴリズムは大体ある. 日本語の情報源 Web ページ ( 奈良先端大 ) http://opencv.jp/ OpenCV プログラミングブック画像処理プログラミングは配列を扱うため, 自力でプログラミングするとバグに苦しみます. ライブラリを使いましょう. レポートメールエラー中間確認テスト第 5 回分のレポートメールがエラーになった可能性があります.( メールボックスのサイズオーバー ) 再度送信してください. 中間テスト用の問題集から出します一度式の導出を覚えることを意図しています