An Effective Approach of University-Industry Research Collaboration on Computer Vision 143
. 2002 Viola 2005. 144
画像認識分野における効果的な産学連携 米国カーネギーメロン大学では 1997年からビデオ監視システムに関する研究である VSAM Video Surveillance and Monitoring プロジェクトが取り組まれ 動体検知 物 体識別 追跡等の動画像理解技術を横断的に開発し ネットワーク化された10数台の カメラが協調して動作するシステムを構築した3 一台のカメラでは許容できない広範 囲における侵入物体の行動軌跡を知ることが可能となり 図2に示すように広域な範囲 における人や車の流れを地図上にリアルタイムで可視化することが可能となった VSAMシステムは その後 多くの企業における画像認識技術を用いたビデオ監視シス テムの研究開発に大きな影響を与えた これらの技術は 2002年頃からエレベータなどの限られた空間において徐々に製品化 され始めた4 が 一般に認知されるほどは実利用化されていない 要求される認識性能 が高く実環境下における認識性能が不十分であるため 誤報 失報につながり人件費 コストを抑えることができない等の問題があるからである 監視セキュリティなどの安 心 安全という分野では失敗が許されない状況下が多く 画像認識技術は一部の監視 カメラに組み込まれているのみであり デジタルカメラほど普及には至っていないのが 現状である 図2 動画像理解技術を用いた自動ビデオ監視システム VSAM 2.3 映像監視分野におけるダーウィンの海 基礎研究から事業成功に至るまでには 魔の川 死の谷 ダーウィンの海の三つの難 関があると例えられている 魔の川はアイディアシーズが応用研究に至るまでの難関 145
藤 吉 弘 亘 鈴 木 正 慶 障壁を 死の谷は研究成果が製品化に至るまでの難関 障壁を表している 死の谷を 乗り越えると製品化という形にはなるが 事業として成功するためには最後の難関 障 壁であるダーウィンの海を泳ぎきらなければならない 図3は 2.2で述べた映像監 視分野における動向とネットワークカメラの出荷台数を 魔の川 死の谷 ダーウィン の海に重ねて表示したグラフである 90年代後半に始まった映像監視分野における画像 認識技術の基礎研究は魔の川 死の谷を越え 企業により一部製品化された 現在は 事業として成功する手前であるダーウィンの海を泳いでいる状況である このダーウィ ンの海を泳ぎきるためには 2.3で述べた実環境下の高精度化という問題を解決する だけでなく マーケットの大きさである市場性も重要である 2009年時におけるネット ワークカメラの出荷台数は成長率149 と市場性が見込まれ5 ダーウィンの海を泳ぎ きるためにはこれらネットワークカメラと連動した高精度な画像認識技術の実現が鍵と なっており 各企業で激しい技術開発が展開されている 現在では 画像認識技術の高 精度化と高速化の研究が急速に発展しており また防犯意識の高まりによりカメラの需 要も急速に高まっている状況にある 3 藤吉研究室の画像認識技術とその製品化 藤吉研究室では 2000年より画像認識技術の基礎研究に取り組み企業との共同研究 を行ってきた 本章では 研究室における画像認識技術と共同研究事例 製品化につ いて紹介する 図3 映像監視分野における魔の川 死の谷 ダーウィンの海 146
画像認識分野における効果的な産学連携 3.1 人を観る技術 藤吉研究室では 人間の生活をサポートする環境ロボット インビジブルロボット 6 における視覚機能の実現を目標に 画像認識技術の基礎研究と応用研究に取り組んで いる 特に 人を観る技術7 については 人 胴体 顔の検出 人の軌跡 動き 姿 勢 視線の解析 ジェスチャ認識 異常行動検知等 重点的に幅広く研究に取り組ん でいる 図4 この人を観る技術は映像監視セキュリティ等の安心安全社会の実現に また一方では 画像の画質改善や映像自動編集再生等の楽しい生活のアシストとして 応用が可能である 次節では 人を観る技術の基礎研究について述べる 図4 人を観る技術 3.1.1 人検出 物体検出は画像中より予め定義した検出対象を探索する技術である 物体検出の中 でも 人は姿勢変化に伴う形状変化が大きいため 画像から人を検出する事は非常に 難しい問題である 藤吉研究室では人検出法の一つとして 人が歩く際の動きに着目 した方法を提案した8 人が歩行している場合には 軸足である片方の足が静止してお り もう一方の足は前に出す動きが観測できる この様な人の独特な動きと人の形状の 特徴を同時に観測する事により 高精度な人検出を実現した 図5参照 高精度な人 検出技術は ドライバーのサポートを目的としたITS 高度交通システム や不審者 の検出等のセキュリティ分野での利用が期待されている 147
藤 吉 弘 亘 鈴 木 正 慶 図5 人検出例 3.1.2 特定物体認識 特定物体認識として 交通道路標識の自動認識手法の開発に取り組んでいる 我々 の手法9 では 予め用意したイラストパターンの道路標識と実画像のマッチングによ り 交通道路標識を認識する 図6参照 本技術は 標識以外にも ロゴやマーカー の認識にそのまま利用できるため汎用性が高く 他分野での利用が期待されている 図6 標識認識の例 3.1.3 異常行動検知 異常行動検知とは入力映像内で起きている定常行動から逸脱した行動を検出する技 術である エスカレータシーンにおける異常行動検知では 常に背景が動いていると対 象物の認識が困難であったが 動きと形状を同時に捉える特徴から定常状態をモデル化 することにより モデルから逸脱した転倒等の動作を検出可能にした 図7 10 この ような行動検知技術は 原子力発電所等の入退出管理を必要とする重要施設から空港 などの公共施設での利用が期待されている 148
画像認識分野における効果的な産学連携 図7 異常行動検知の例 3.2 共同研究の推移 藤吉研究室では 研究成果をより多くの人や企業等にアピールするために 学会だけ でなく多くの展示会等で研究発表を精力的に行ってきた 図8に年度毎における共同 研究企業数と研究費の推移を示す 2007年度以降に企業数が増加しているのは 3.1 で述べた技術を発表したのが2005 2006年度であり その結果 企業からの依頼が増 えたものと推測できる 図3で示したネットワークカメラの出荷台数のカーブと図8の 企業数の増加が似ていることからも この時期にネットワークカメラなど市場が急速に 拡大し 企業間における製品の差別化を図るため 画像認識技術に多くの企業が注目 し始めたと推測される 図8 共同研究企業数と研究費の推移 149
藤 吉 弘 亘 鈴 木 正 慶 3.3 研究成果の事業化 これまで藤吉研究室の画像認識技術は 眼球回旋計測装置 講師追尾型講義映像編 集ソフトウェア 人検出評価モジュールの三つの製品化に貢献した 本節では 製品化 例として講師追尾型講義映像編集ソフトウェアと製品化までの流れについて述べる 3.3.1 講師追尾型講義映像編集ソフトウェア 藤吉研究室の画像認識技術を利用した講師追尾型講義映像編集ソフトウェア i Collabo AutoRec が日本電気 株 より製品化されている 家庭用ハイビジョンカメ ラで黒板全体が映るように撮影し ソフトウェアに取り込み 開始ボタンを押すと画像 認識技術により配信に適した講義映像が自動生成される 講義映像から講師や板書等 の注目領域に対してトリミングを自動的に行い 不用な映像区間をカットすることで 配信に適したファイルサイズの講義映像を自動生成することが可能となる さらに ト リミングを行う際に 放送カメラマンのカメラワーク特徴を模倣することにより 学習 者が見やすくかつ臨場感あふれる映像を生成することが可能となる 公開者は生成した 講義映像をwebサーバ上にアップロードし 学習者はポッドキャスティングにより最新 の講義映像を自動でダウンロートすることが可能となる 図9参照 図9 講師追尾型講義映像編集ソフトウェア i-collabo. AutoRec 3.3.2製品化までの流れ 講義映像の自動編集は 教員業務の負担軽減の必要性から 画像認識の研究成果を 講義映像の自動編集に利用できないかと考えたのをきっかけとして 2004年から研究を 開始した 筆者が教員であったことから問題設定とニーズが明確であったため 応用を 想定した研究を進めることができた 発表 展示会を通じ e-learningシステムを開発 販売している企業の目に留まり 共同開発が始まった 問題意識とニーズが共有されて おり研究成果の応用が明確であるため 製品化発売まで連携が円滑に進み 多くの大 150
10 10. 151
.. 100 11 152
..... 12. 153
15 P. Viola and M. Jones, : Robust Real-time Object Detection, International Journal of Computer Vision, Vol. 57, No. 2, pp. 137-154, 2001. 2002 15 OS 02 2009 R. Collins, A. Lipton, H. Fujiyoshi and T. Kanade, : Algorithms for Cooperative Multisensor Surveillance, Proc. of IEEE Special Issue on Video Communications, Processing and Understanding for Third Generation Surveillance Systems, Vol. 89, No. 1, pp. 1456-1477, 2001. PIA:People Image Analysis Vol. 60 No. 10 pp.1542 1546 2006 pp. 49 65 2004 10 2004 Joint CVIM pp. 43 54 2009 SIFT Vol. 129- C No. 5 pp. 824 831 2009 10, PRMU pp. 247 254 2008 11, 15 OS 04 2009 154
12 15 OS 02 2009 155