ヒューマノイドロボット技術　研究の流れ

1 遠赤外線画像への GAN の適用と自律移動ロボットの制御 MATLAB EXPO Japan 2020 令和 2 年 9 月 29 日防衛装備庁先進技術推進センター防衛技官丹羽雄一郎

2 目次遠赤外線画像の利点と活用 GANを用いた遠赤外線画像処理可視 ( カラー ) 画像の生成生成手順及び結果遠赤外線画像の温度変化に対する汎化手法応用カラー画像から遠赤外画像の生成領域分割画像の生成自律移動ロボットの制御まとめロボットへの適用遠赤外線画像のみを用いた人の検知障害物回避制御

遠赤外線画像の利点と活用 ( 遠赤外線とは ) 電磁波波長短い波長長い可視光画像 ( 波長約 0.4~0.7μm) 反射光により物体を視認 ( 陰影により物体の形状把握反射率の違いにより文字の視認可能 ) 可視光 NIR MWIR 中 LWIR 近赤外線画像 ( 波長約 0.7~2.7μm) 反射光により物体を視認 ( 陰影により物体の形状把握 LIDAR 等も視認可能 ) http://fogmag.jp/project/fordselfdrivingcardark/ 遠赤外線画像 ( 波長約 8~12μm) 主に赤外線 ( 熱赤外 ) 放射により物体を視認 ( 熱源の探知に有効物体の形状把握等には向かない ) https://www.daiichi-kagaku.co.jp/blog/labo/?p=264 http://erg-ventures.co.jp/2014/10/09/0046/ 3

4 遠赤外線画像の利点と活用 ( 遠赤外線画像の利点 ) 可視光画像の欠点照度変化に弱い暗所では均一な照明が必要センサとして継続的で安定的な運用が難 https://jp.123rf.com/photo_10093377_%e9%9b%a8%e3%81%a8%e3%83%95%e3%82%a3%e3%83%bc%e3%83%ab%e3%83%89%e3%81%ab%e6%b2%88%e3%82 %80%E5%A4%95%E6%97%A5%E3%81%AE%E5%BE%8C%E6%BF%A1%E3%82%8C%E3%81%9F%E9%81%93%E8%B7%AF.html http://qa.jaf.or.jp/drive/careful?page=2&sort=question.count&direction=desc 遠赤外線画像の利点外光 ( 日照や照明 ) の変化に影響なし放射のため照明を必要としないセンサとして継続的で安定的な環境認識が可能可視遠赤外 FLIR

遠赤外線画像の利点と活用 ( 防衛用途での利用 ) 防衛用途で多用される遠赤外線センサ一般的な環境認識に使用されるセンサ RGB カメラ近赤外線カメラ屋内や暗所ではライトが必要でその存在が暴露してしまう問題照明環境の変化に脆弱対向するライトによるハレーション LIDAR Depth センサ近赤外光レーザーパターン投光を使用通常のカメラや暗視ゴーグルを利用すればその所在が暴露してしまう隠密行動秘匿行動が出来ない完全な受動 ( パッシブ ) センサが必要 = 遠赤外線画像の活用日本航空宇宙工業会会報航空と宇宙 2016 年 7 月号 2 波長赤外線センサの研究及び衛星搭載型 2 波長赤外線センサの研究の紹介, 防衛装備庁小山技官 5

遠赤外線画像の利点と活用 ( 問題点とその解決策 ) 1. 視認性が低い熱赤外放射をセンサで捉えているため可視光画像に比べ分解能が悪くボケた画像となる物体の温度分布が色調と異なるため可視光画像と同一の物体として認識が難しい 2. 環境温度が変化する季節変化や空調設備により環境温度が変化するため遠赤外線画像の物体温度のシフトまたは物体間の温度序列が反転する https://arxiv.org/pdf/1801.05944.pdf 路上の人 https://shanxiliuxiaofei.github.io/# 道路上の車両 ( 真上から撮影 ) 冬季に暖房をつけた室内冬季に暖房をつける前の室内 DNN を用いて遠赤外画像をカラー化 ( 生成 ) DNN を用いて物体認識 ( セマンティックセグメンテーション ) DNN のファインチューニングにより対象物の温度変化に対応 6

GAN を用いた遠赤外線画像処理 7

遠赤外画像からカラー画像の生成 ( 手法 ) 敵対的生成ネットワーク (Generative Adversarial Networks;GAN) を利用した白黒画像からのカラー画像生成の研究を応用 GAN は生成ネットワーク (generator) と識別ネットワーク (discriminator) の 2 つのネットワークから構成生成側は識別側を欺こうと学習し識別側はより正確に識別しようと学習学習により生成ネットワークが学習データと類似した画像を生成可能となる学習データ識別ネットワーク https://www.youtube.com/watch?v=z-hjyqh6naa 白黒画像からカラー画像を生成する GAN の例 GAN について詳しい説明は以下参照画像の認識理解シンポジウム 2019 (MIRU2019) チュートリアル Generative Adversarial Networks の基礎発展応用金子卓弘 (NTT コミュニケーション科学基礎研究所 ) http://www.kecl.ntt.co.jp/people/kaneko.takuhiro/slides/miru2019/kaneko_ga N_Tutorial_MIRU2019.pdf 生成ネットワーク代表的な GAN の深層ネットワークアーキテクチャ図 https://skymind.ai/wiki/generative-adversarial-network-gan 8

9 遠赤外画像からカラー画像の生成 ( 手順 ) pix2pix Philip Isola,Jun-Yan Zhu, Tinghui Zhou,Alexei A.Efros, Image-to-Image Translation with Conditional Adversarial Networks,CVPR2017, arxiv 1611.07004(21 Nov 2016) 通称 pix2pix 学習時, データセット G U-Net D D 同時に撮影した遠赤外線画像とカラー画像のペア画像群 fake real 生成時新たに入力された遠赤外線画像 G U-Net 生成されたカラー画像 Pix2pix は他にも様々なドメイン適応が可能

キャリブレーション手法とデータ取得 Reshet Graf 社の製品 Passive Thermal Targets に用いられている遠赤外線反射塗料及び印刷技術を用いた熱源を利用しない遠赤外可視カメラ用チェッカーボードを作成使用 OpenCV に実装されているチェッカーボードを用いた歪曲収差の除去手法遠赤外線カメラ可視カメラ補正前 USB USB 補正後キャプチャソフトで同時に撮影 ( ビデオを撮影する程の工数で作成ほぼ同時刻のフレームを切り出すことでデータセットを作成可能 ) 10

11 遠赤外画像からカラー画像の生成 ( 結果 ) 入力画像 (IR 画像 ) 出力画像 ( 生成された可視画像 ) 真値入力画像 (IR 画像 ) 出力画像 ( 生成された可視画像 ) 真値 (1) (6) (2) (7) (3) (8) (4) (9) (5) (10)

遠赤外画像からカラー画像の生成 ( 興味深い結果 ) (1) (2) 入力画像 (IR 画像 ) 出力画像 ( 生成された可視画像 ) 真値遠赤外線はガラスを透過できない窓ガラス ( 赤枠 ) の遠赤外線画像部分には窓の外にある建物の情報は入っていない (3) (4) (5) しかしながら生成されたカラー画像は真値と僅かに異なるが建物が生成されている! 分析の結果ガラス面に付近の電灯や撮影者の熱赤外の反射像が映り込んでおりその情報により窓の外の画像を生成できたものと考えられる ( 過学習ではない ) 撮影に使用した遠赤外線カメラビジョンセンシング VIM-384 ULIS 社 ( 現 LYNRED 社 )PICO384 イメージセンサ使用 384x288 画素画素熱分可能 (NETD) 0.055 度温度分解能が高いため人の認識できない温度差も計測可能 CNN は物体表面の温度のムラ ( テクスチャ ) を特徴量として活用可能 12

遠赤外線画像の温度変化に対する汎化手法 LWIR IR 画像真値 1 同じ温度のテストデータでは生成画像は良好学習データと同じ温度のときのテストデータ LWIR IR 画像真値学習データと違う温度のときのテストデータ暖かいときの学習データ暖かいときの学習データ暖かいときのデータで学習した GAN 3 寒いときの学習データを追加して再学習する ( ファインチューニング ) 暖寒のデータで学習した GAN 2 学習データと異なる温度のテストデータでは生成画像は不良 4 再学習により異なる温度のテストデータでも良好寒いときの学習データ改善 13

14 応用 : カラー画像から遠赤外画像の生成 ( 手法及び用途 ) カラー画像から生成ネットワークが生成した遠赤外線画像と真の遠赤外線画像が一致するように学習させた GAN 生成ネットワークはカラー画像から遠赤外線画像を生成するネットワークとして機能応用事例としてはロボットのシミュレータにおいて従来不可能であった遠赤外線画像シミュレーションが可能となる入力画像 ( 可視画像 ) 出力画像 ( 生成された赤外画像 ) 真値入力画像 ( 可視画像 ) 出力画像 ( 生成された赤外画像 ) 真値 (1) (3) (2) (4)

応用 : 遠赤外画像からの可視画像生成手法の用途遠赤外線画像から可視 ( カラー ) 画像を生成することで従来研究開発された可視画像用の処理を流用することができるこれにより新たに学習用の教示データを作成すること無く遠赤外線画像の領域分割物体認識識別ステレオ視 SLAM 等を構築することができる又判読しづらかった遠赤外線画像をカラー画像化することにより画像読解者のワークロードを低減することが可能となる可視画像用の処理が流用可能既存のコンピュータビジョン処理領域分割領域分割遠赤外線画像 GAN 深層生成モデル可視画像物体認識識別距離画像推定物体識別 SLAM( ) etc. GAN による遠赤外線画像の可視画像化 Simultaneous Localization and Mapping ( 自己位置推定と環境地図作成 ) 距離画像 15

応用 : 遠赤外画像からの領域分割 ( セマンティックセグメンテーション ) ( クロスドメイン蒸留法による学習手法 ) 可視画像生成用学習データセット領域分割生成用学習データセット遠赤外線画像可視画像可視画像領域分割遠赤外線画像遠赤外線画像学習 GAN 深層生成モデル遠赤外線画像領域分割生成用学習データセット床領域分割画像生成された可視画像学習 or ファインチューニング遠赤外線画像学習済み深層学習モデル 1 GAN 深層生成モデル深層学習モデル 2 学習 or ファインチューニング or 学習済み深層学習モデル 1 床床生成された領域分割画像人 or 生成された領域分割画像親のニューラルネットワーク深層学習モデル 1 知識蒸留 ( 親の知を子へ伝播 ) 子のニューラルネットワーク 16

応用 : 遠赤外画像からの領域分割画像の生成 ( 結果 ) 1. 既存の学習済みの領域分割ネットワーク (Segnet) を利用し KAIST 学習用データセットの可視画像から領域分割画像を生成 2. 生成された領域分割画像と上記可視画像と同時に撮影された遠赤外線画像をペアにし領域分割の学習データとする 3. 上記の学習データを使用し遠赤外線画像から領域分割画像を生成するネットワークを学習する 4. 3 項で学習させたネットワークへ KAIST テスト用遠赤外線画像を入力することでその画像に対応した領域分割画像が生成されることを確認したカラー画像から領域分割する学習済みネットワークを利用可視から領域分割をするネットワーク作成 1 カラー画像学習用データ ( カラーと赤外同時撮影 ) 参考 : 下赤外と同時に撮影したカラー画像 3 学習遠赤外線画像学習用データ入力 ( ( 遠赤外 ) 赤外から領域分割をするネットワーク作成今回は GAN を使用出力 ( 領域分割 2 領域分割画像用の学習データの作成 ( 領域分割と赤外画像セット ) 人 ( ロボットに対する移動障害物 ) 道路 ( ロボットに対する移動可能領域 ) 4 遠赤外線画像から直接生成された領域分割画像 17

自律移動ロボットの制御 18

問題設定 : 偵察監視ロボットの環境認識目的主に市街地環境における巡回偵察監視等を行う自律移動ロボット http://fogmag.jp/project/fordselfdrivingcardark/ LIDAR による環境認識遠赤外線カメラよる環境認識一般的なロボットの環境認識に使用される外界センサ (RGBカメラ近赤外線カメラ LIDAR Depth センサ ) は照明投光近赤外光レーザーパターン投光をするため通常のカメラや暗視ゴーグルを利用すればその所在が暴露してしまうイメージ図 = 隠密行動秘匿行動が出来ない問題点完全パッシブな外界センサを利用した環境認識が必要 = 遠赤外線カメラを用いた環境認識技術 19

本自律移動ロボットのタスクの定義とアーキテクチャ設計本自律偵察用ロボットの基本タスク (1) 移動可能な領域を認識し移動する (2) 壁などの障害物を検知し回避する (3) 人を検知し人の方向から離れる基本タスク実現の方法 1 赤外画像の領域分割による物体検知及び認識 2 床領域が移動可能領域として進行至近の壁領域は障害物として回避人領域が検知された場合検知された反対方向へ移動 Door Wall Floor Human 1 環境認識 2 遮蔽部への移動計画環境との相互関係把握他ロボットとの関係把握 3 移動選択ミッション実行計画タスク選択リスク見積他ロボットとの協調計画環境認識及び障害物回避制御の機能の他のロボットでの活用を鑑み ROS にてパッケージング遠距離経路生成物体把持移動障害物除去ドア開閉壁人床 1 赤外画像からの領域分割技術壁人床壁人床 2 画像処理のみにおける高速行動生成右に示す自律移動ロボットアーキテクチャの第 3 層までを実装 MATLAB を活用し開発した自律ロボットの高速障害物回避制御 (IROS2004) の手法を利用 2D マップ生成 ( グローバル ) 3D マップ生成 ( グローバル ) 特定物体認識 ( セグメンテーション ) SLAM エッジ検出特徴点抽出移動可能領域 ( セグメンテーション ) 2D マップ生成 ( ローカル ) 3D マップ生成 ( ローカル ) ビジュアルオドメトリカメラ画像とレーザスキャナー情報の融合慣性航法三角測量カルマンフィルタベイジアンフィルタ衛星ナビゲーションジャイロ加速度計速度センサ GPS エンコーダトルクセンサ触覚センサ超音波センサ可視カメラ近赤外線カメラ遠赤外線カメラ Lidar Depth センサレーダー認知グローバルな処理ローカルな処理状態推定内界センサ外界センサタスク間状態遷移全体最適化第 5 層全体最適化制御タスク内状態遷移安定化第 4 層タスク制御基本機能状態安定化第 3 層基本機能制御要素機能状態安定化第 2 層要素機能制御ミッションセンサタスク間調整タスク内プランニング及び制御基本機能実現のための制御指示要素機能実現のための制御指示アクチュエータ第 1 層ハードウェアプラットフォームサブサンプションアーキテクチャ近距離経路生成障害物回避サーチアルゴリズム凹凸 / 軟弱路面歩行計画マニュピレーション計画転倒判断転倒制御 / 転倒回避不整地歩行計画順運動学逆運動学速度運動学姿勢制御速度制御オートバランサ摩擦制御機構制御サーボモータ油圧アクチュエータ電動モータ関節機構雲台機構投光機構シミュレーション技術 (2.3.6) 第 1 層ハードウェアプラットフォームを模擬するもの 20

21 自律移動ロボット ( ハードウエア構成 ) 8 ポータブルバッテリ AC100V 7 移動プラットフォーム制御用 PC 7 1 赤外センサ (ULIS PICO384E 384 288 波長 8~ 14um NETD 95mK 熱時定数 6.4ms) USB 6 直流安定化電源 DC12V 2 演算補助装置 (Jeston TX2) irobot Ethernet Wifi 3 移動プラットフォーム ( 演算装置 ) (Raspberry Pi 3B) 5 モバイルバッテリ 4 移動プラットフォーム (Roomba) DC5V RS232C irobot Open Interface 1 2 5 8 4 3 6

可視領域分割用 DNN の作成赤外領域分割用 DNN の作成演算補助装置への実装可視画像赤外画像赤外画像赤外領域分割画像を基にする移動方向算出処理移動プラットフォームへの搭載自律移動ロボット ( ソフトウエア構成 ) 学習用計算サーバ学習サーバ (Docker) 移動ロボット赤外画像キャプチャ ROS ノード演算補助装置 (Jetson TX2) 移動プラットフォーム (Raspberry Pi) 移動プラットフォーム (Roomba) 可視領域分割用 DNN 赤外領域分割用 DNN 変換 (Nvidia TensorRT) 赤外領域分割 ROS ノード演算補助装置用赤外領域分割用 DNN 移動方向生成 ROS ノード移動プラットフォーム制御 ROS ノード移動プラットフォーム赤外領域分割用 DNNの学習データとして利用可視領域分割画像赤外領域分割画像赤外領域分割画像移動方向 ( 矢印 ) 領域分割用 DNN として当時 (2018 ) 高精度高速推論かつ省ネットワークサイズな ERFNet を選択した (E.Romera,J.Alvarez,L.Bergasa, R.Arroyo, ERFNet: Efficient Residual Factorized ConvNet for Real-Time Semantic Segmentation,IEEE Trans.on Intelligent Transportation Systems, Vol.19,Iss.1,Jan.2018) ただし Jetson TX2 へ実装した DNN は nvidia TensorRT により推論演算に関して縮小最適化されている 22

データセットの構築遠赤外可視画像データセット可視領域分割用 DNN 学習用 SUN データセット実験環境データセット遠赤外線画像可視画像可視画像領域分割データセット作成工数遠赤外可視カメラを用いた同時撮影 ( ビデオ撮影程度の作業 ) 本件 65,616 ペアをスクリプト処理により切り出しデータセットの可視画像遠赤外線画像本件 624 ペア遠赤外線画像学習可視領域分割用 DNN 赤外領域分割用 DNN 学習用データセット学習赤外領域分割用 DNN 床領域分割画像床生成された可視領域分割画像可視画像生成された赤外領域分割画像領域分割画像データセット作成工数可視カメラの撮影領域分割画像作成 ( アノテーション作業 ) 本件 217 ペア 23

赤外領域分割画像の評価赤外領域分割の評価評価値 IoU(Intersection over Union) は物体認識の分野で領域の一致具合を評価する指標元画像のあるラベル付けされたクラスの面積を集合 A 領域分割後の面積を集合 Bとしたとき次式で定義される Average IoU: 各クラスの平均 IoU IoU = A B A B Mean Iou: Average IoU の平均値 class 学習サーバ (AverageIoU) 演算補助装置 (AverageIoU) 0: Person( 人 ) 0.15782 0.20735 1: Wall( 壁 ) 0.75657 0.81972 2: Floor( 床 ) 0.75019 0.8432 計算リソースの評価 (nvidia Jetson TX2) Process CPU [%] Memory [%] GPU(%) Time(msec) segmentation node 32.6 12.7 233 image capture node 2.6 0.3 main controller node 99.9 34 roscore 0.3 0.2 0.3 0.7 24

自律移動ロボットへの適用実験結果ロボット制御装置演算装置遠赤外線カメラ遠赤外線画像深層ネットワーク領域分割画像移動ベクトル生成とロボット制御テスト環境 ( 照明無し ) 供試体 ( 小型ロボット ) 壁を検知して回避処理フロー人を検知して回避成果暗所室内において無照明無投光下での移動ロボットの障害物検知及び回避の実現外界センサに遠赤外線カメラのみを利用した障害物検知及び回避の実現人を検知して回避暗中の人障害物の検知並びに回避テスト結果 ( 不可視な近赤外線ライトを照射し近赤外線カメラで撮影 ) 遠赤外画像の領域分割処理 4.3Hz ロボット制御周期 3Hz 25

26 まとめ遠赤外線画像の利点と活用 GAN を用いた遠赤外線画像処理可視 ( カラー ) 画像の生成領域分割画像の生成ロボットへの適用現状推論速度の高速化を目指し領域分割ネットワークの FPGA 実装を実施 100fps 以上の遠赤外線画像の領域分割を達成

27 発表文献遠赤外線画像等データセットの作成方法学習方法丹羽雄一郎, GAN による遠赤外線画像による可視画像生成の実用化への検討, 第 25 回画像センシングシンポジウム (SSII2019) 本自律移動ロボットに関する内容丹羽雄一郎, 移動ロボットの遠赤外線画像による物体検知識別と回避, 第 37 回日本ロボット学会学術講演会丹羽雄一郎, 木村正成, 佐藤利鷹理 ( 株式会社 Ridge-i) 深層学習を用いた遠赤外線画像の意味論的領域分割, 第 37 回日本ロボット学会学術講演会深層学習のロボットビジョンへの適用に関する考察丹羽雄一郎, 自律移動ロボット環境認識に必要な深層学習に関する一考察実環境に適応可能な環境認識技術をめざして, 第 22 回画像の認識理解シンポジウム (MIRU2019) 移動可能領域から移動経路算出 Y.Niwa,S.Yukita,H.Hanaizumi, Depthmap-based Obstacle Avoidance on Rough Terrain,Proc.IROS,2004

ヒューマノイドロボット技術 研究の流れ

ヒューマノイドロボット技術　研究の流れ