俯瞰カメラと人物視点カメラの連携によるシーンの四次元構造化成果報告大阪大学産業科学研究所満上育久 1

背景今や世界は多種多様なカメラで溢れている! 膨大な数の固定カメラ防犯犯罪捜査での有効性の認知デジタルサイネージ等, マーケティング解析への利用可能性ウェアラブルカメラの出現普及新たな映像コンテンツ (GoPro, SONY アクションカム等 ) 日常生活をサポートする新たな情報デバイス (Google Glass) Google Glass GoPro SONY アクションカム 2

俯瞰人間視点映像の処理俯瞰 ( 客観視点 ) 映像人物検出追跡ジェスチャー認識人間関係の推定人物視点 ( 主観視点 ) 映像周囲の三次元形状復元手元物体認識行動認識注意対象の推定映像の特性が大きく異なるため, これら映像処理は別々の研究として実施されている 3

目的研究目的 : 俯瞰映像 (Global) と人物視点映像 (Local) を密に連携させたシーン理解共同研究者 : 西野恒 ( ドレクセル大学教授 ) 大阪大学国際共同研究促進プログラム (2015-2017) 八木康史 ( 大阪大学理事副学長 ) JST-CREST (2010-2016) 4

研究項目 1. 複数台の Kinect を用いたシーンの四次元構造復元 2. 俯瞰映像と人物視点映像を用いたシーンの三次元復元精度の向上 3. 俯瞰映像に対する人物位置アノテーションツールの開発 4. 注視ヒートマップ可視化による購買客と万引き犯の注視行動の違いに関する解析 5. 人物視点映像によるアイトラッカーレス注視推定 5

複数台の Kinect を用いたシーンの四次元構造復元 6

俯瞰センサ群によるシーンの四次元構造化複数のセンシングデータ 3D 形状 + 時間変化 Microsoft Kinect カラー画像 + 奥行き画像手頃な価格 Color image Depth map Integrated image Microsoft http://www.xbox.com/en-us/xbox360/ 7

複数台 Kinect によるシーンの四次元構造化 Kinect 7200 12670 8

複数台 Kinect データを統合する際の難しさ Kinect B Kinect A Kinect の非同期撮影によって動的シーンで形状にずれが発生 9

非同期 Kinect 群の擬似同期 Kinect1 Time Kinect2 10

非同期 Kinect 群の擬似同期 Kinect1 Time Kinect2 Point Cloud Transport i-th frame i+1-th frame Point cloud Clustering Earth mover s distance flow Interpolated Point cloud 11

実験結果動的シーンの復元結果 ( 足踏み ) カラー画像従来手法提案手法 12

実環境に設置した俯瞰カメラ人物視点カメラ群による人物行動解析注視ヒートマップ可視化による購買客と万引き犯の注視行動の違いに関する解析人物視点映像によるアイトラッカーレス注視推定 13

目は口ほどにものを言う購買客万引き犯注視行動は人の意図の表出である 14

実環境での映像データ収集データ収集実験の実施場所 : 大阪大学吹田キャンパス工学部生協ショップ内日時 : 平成 26 年 9 月 20 日 ( 土 ) 9:30~16:30( 撮影 ) 実施内容 : 被撮影者は八木研メンバーおよびアルバイト ( 計 140 人 ) すべての被撮影者からデータ公開に関する同意書を収集各被撮影者には通常の購買行動 or 万引きの指示を与える各シーンでは, 購買客役と万引き犯役 ( 合計 4~5 名 ) が同時に行動 15

実環境での映像データ収集環境側のカメラレジレジ出入口 ( 使用しない ) 出入口 ( 使用しない ) 出入口 ( 屋根付き通路 ) 16

実環境での映像データ収集被験者側のカメラ頭部カメラ (GoPro) 眼球計測装置 (EMR-9) 胸部カメラ (GoPro) 17

注視ヒートマップ可視化による購買客と万引き犯の注視行動の違いに関する解析 18

注視ヒートマップ 1. 三次元環境モデルの構築 2. 環境モデル表面への注視の投票 19

三次元環境モデルの構築 Manhattan-World 仮説 1 st axis: normal vector of a plane which fits to chest camera s trajectory 2 nd axis: manually selected 3 rd axis: 1 st 2 nd 局所平面仮説 Make inlier histogram along each axis 1 peak => 1 plane Add some hypotheses manually Floor, ceiling, texture-less surface 2 nd 3 rd 2 nd 3 rd 20

三次元環境モデルの構築 Extract Piecewise-Planar Model [Chauve+, CVPR2010] Input: bounding box, plane hypotheses, visibility rays 21

三次元環境モデルの構築復元された環境モデル 22

環境モデル表面への注視の投票 Gaze model Gaussian centered at point of gaze σ = 20 pixel 23

注視ヒートマップの可視化と万引き犯検出の可能性棚の裏側 ( ボールペン棚 ) ボールペン阪大グッズ防犯ミラー防犯ミラー購買客への指示 : 阪大グッズを買ってきてください遠くの壁万引き犯への指示 : ボールペンを万引きしてきてください指定された商品に加えて指定された商品のみ注視ミラーや防犯カメラを注視注視の可視化による行動認識への展開 24

人物視点映像によるアイトラッカーレス注視推定 25

アイトラッカーを使わない注視情報獲得頭部の見えによる注視方向推定歩容を用いた注視方向推定? 視線方向 = 頭部方向視線頭部 [Kojima et al. 2015] 0 度 45 度 90 度 3 方向のみの推定 [Nakazawa et al. 2014] 26

頭部運動と眼球運動注視点の固定時 R 水平方向注視点の遷移時 L U 垂直方向 D 視線方向 [ 度 ] 非歩行時歩行時頭部視線眼球 [Yu Fang et al. 2015] [Okada et al. 2013] 頭部方向 [ 度 ] [ 前迫 et al. 1993] 27

推定手法胸部頭部視線方向の取得頭部方向と視線方向の関係のモデル化既知視線方向頭部方向胸部方向視線推定モデル既知未知推定視線方向 28

Structure from Motion (SfM) による方向情報の算出 http://www.cs.cornell.edu/~snavely/bundler / 胸部方向頭部方向視線方向 29

視線推定モデル HHHHHHHH GGGGGGGG GGGGGGGG: 視線角度 HHHHHHHH: 頭部角度 GGGGGGGG HHHHHHHH 粘性抵抗 : λxxx(tt) 頭部視線 30 眼球 HHHHHHHH GGGGGGGG HHHHHHHH GGGGGGGG ll ll + Δx FF = mmm tt = kk{gg tt h tt ll} λh (tt) FF gg tt = aaa tt + bbh tt + cch tt + dd 30

推定結果水平方向実測値推定視線方向頭部方向 31

モデルの妥当性評価実際の視線方向との誤差ヒストグラム (4 シーン ) 頻度 600 頭部方向との差頻度 600 推定視線方向との差 500 500 400 400 300 300 200 200 100 100 0-40 -35-30 -25-20 -15-10 -5 0 5 10 15 20 25 30 35 40 0 [ 度 ] -40-35 -30-25 -20-15 -10-5 0 5 10 15 20 25 30 35 40 [ 度 ] 頭部方向推定視線方向誤差平均 [ 度 ] 11.6 7.9 32

注視推定性能評価被験者学習テスト頭部方向との差推定視線方向との差 A シーン1 シーン2 9.2 7.7 シーン2 シーン1 9.7 8.2 B シーン3 シーン4 22.2 16.8 シーン4 シーン3 14.9 9.9 C シーン5 シーン6 15.6 10.9 シーン6 シーン5 12.9 9.5 すべての被験者において推定精度が向上 33

まとめまとめ 1. 複数台の Kinect を用いたシーンの四次元構造復元 2. 注視ヒートマップ可視化による購買客と万引き犯の注視行動の違いに関する解析 3. 人物視点映像によるアイトラッカーレス注視推定今後の展開俯瞰カメラ映像からの注視興味の推定注視活動を中心とした人物行動解析 mitsugami@am.sanken.osaka-u.ac.jp 満上 mitsugami 34

俯瞰カメラと人物視点カメラの連携 によるシーンの四次元構造化 成果報告 大阪大学産業科学研究所 満上育久 1

俯瞰カメラと人物視点カメラの連携によるシーンの四次元構造化成果報告大阪大学産業科学研究所満上育久 1