要 旨 題目深層学習による人物検出学籍番号 T 氏名海住嘉希指導教員白井英俊近年 深層学習による画像認識が高い精度で成果を挙げていることで注目されている 本研究では 深層学習によって物体認識を行う三つの手法を用いて実装を行った そして 三つの手法の実装結果から人物検出に焦点をあて これら
|
|
|
- たつぞう すずがみね
- 7 years ago
- Views:
Transcription
1 2016 年度 卒業論文 深層学習による人物検出 指導教員白井英俊教授 中京大学工学部電気電子工学科 学籍番号 T 氏名 海住嘉希 (2017 年 1 月 )
2 要 旨 題目深層学習による人物検出学籍番号 T 氏名海住嘉希指導教員白井英俊近年 深層学習による画像認識が高い精度で成果を挙げていることで注目されている 本研究では 深層学習によって物体認識を行う三つの手法を用いて実装を行った そして 三つの手法の実装結果から人物検出に焦点をあて これらの検出精度と実行時間の比較を行ったものである 人物検出に焦点をあてた理由は 安全面や防犯面でこのような機器が使われ始めており 人を検出する技術がますます重要になっているためである 本研究では Faster R-CNN (Faster Region-with Convolution Neural Network), YOLO (You Only Look Once), SSD (Single Shot MultiBox Object Detector) という 三つの深層学習による物体検出手法 ( いずれも 2016 年 11 月時点で最先端の技術 ) を実装し 同じデータに適用してこれらの手法の精度と実行時間を比較した なおこれには人も含めた 20 種類の物体 (PASCAL VOC2007 データ, PASCAL VOC2012 データ ) の検出をするよう学習されたモデルを用いたが 対象としたデータは人物だけを検出するものとした また人物検出に適し 深層学習以前に最先端とされていた HOG 特徴量を比較材料に用いた Faster R-CNN は 畳み込み層 (CNN) の上に 2 層の畳み込み層を追加して領域提案ネットワーク (RPN) と呼ばれるネットワークを構築し 物体検出を行うシステムである YOLO は物体の領域とその物体の種類の予測を同時に行って物体検出を行うシステムである また SSD は YOLO と同様に領域の予測と物体の種類の予測を単一のネットワークで実現するシステムで 前処理として CNN を行って得られた特徴地図を利用している HOG 特徴量は 画像の局所領域 ( セル ) から 輝度の勾配方向と強度という特徴量を得て物体検出を行うシステムである 初めにこれら 4 つの手法を同じプラットフォームの上で実装した 次に人物画像のデータベース INRIA Person Dataset から 100 枚の画像データをランダムに取得し 評価に使用した 4 つの手法それぞれの画像 1 枚あたりの平均実行時間と 人物の検出精度 ( 検出した人数の割合 ) とを比較した その結果 平均実行時間は HOG 特徴量が 0.21s SSD が 11.19s YOLO が 12.34s Faster R-CNN が 25.28s であった 検出精度は YOLO が 92.24% Faster R-CNN が 86.78% SSD が 63.98% HOG 特徴量が 54.33% であった HOG は速いが検出精度が低いことが明らかになった 3 種の深層学習手法では Faster R-CNN は複数のネットワークを使用して物体検出するため 単一のネットワークで検出する YOLO と SSD よりかなり遅いという結果が得られたのは妥当であろう また検出精度が低くなったのは 評価データとして多様な人の姿勢や向きのある画像データセット INRIA Person Dataset を使用したためであると考える 特に SSD が 3 種の深層学習の中で低いのはそのせいであろう
3 展望として 検出物を人物と人物以外の 2 種に限定した学習モデルを作成すれば 速度を維持しつつ検出精度を高めることができるのではないだろうか 特に YOLO をベースとして GPU を使用すれば 実時間で人物検出が加納なシステムが実現できると考える
4 目 次 第 1 章はじめに 第 2 章本研究の構成 深層学習について Faster R-CNN (Faster Region-with Convolution Neural Network) YOLO(You Only Look Once) SSD(Single Shot MultiBox Detector) HOG(Histograms of Oriented Gradients) 特徴量... 8 第 3 章研究計画 開発環境 研究の計画 第 4 章 Faster R-CNN, YOLO, SSD, HOG 特徴量システムの実装 Faster R-CNN の実装 YOLO の実装 SSD の実装 HOG 特徴量による人物検出の実装 第 5 章検証 第 6 章考察とまとめ 参考文献 謝辞 付録. HOG 特徴量のプログラム... 20
5 第 1 章はじめに 近年 深層学習による画像認識が高い精度で成果を挙げていることで注目されている 本研究では 深層学習によって物体認識を行う三つの手法を用いて実装を行った そして 三つの手法の実装結果から人物検出に焦点をあて これらの検出精度と実行時間の比較を行ったものである 人物検出に焦点をあてた理由は 安全面や防犯面でこのような機器が使われ始めており 人を検出する技術がますます重要になっているためである 本研究では Faster R-CNN(Faster Region-with Convolution Neural Network), YOLO(You Only Look Once), SSD(Single Shot MultiBox Object Detector) という 三つの深層学習による物体検出手法 ( いずれも 2016 年 11 月時点で最先端の技術 ) を実装し 同じデータを適用することにより 精度と実行時間の比較をした ここでは 人も含めた 20 種類の物体 (PASCAL VOC2007 データ, PASCAL VOC2012 データ ) の検出をするよう学習されたモデルを用いたが 対象としたデータは人物だけを検出するものとした また人物検出に適し 深層学習以前に最先端とされていた HOG 特徴量を比較材料に用いた Faster R-CNN は 畳み込み層 (CNN) の上に 2 層の畳み込み層を追加して領域提案ネットワーク (RPN) と呼ばれるネットワークを構築し 物体検出を行うシステムである YOLO は物体の領域とその物体の種類の予測を同時に行って物体検出を行うシステムである また SSD は YOLO と同様に領域の予測と物体の種類の予測を単一のネットワークで実現するシステムで 前処理として CNN を行って得られた特徴地図を利用している HOG 特徴量は 画像の局所領域 ( セル ) から 輝度の勾配方向と強度という特徴量を得て物体検出を行うシステムである 初めにこれら 4 つの手法を同じプラットフォームの上で実装した 次に人物画像のデータベース INRIA Person Dataset から 100 枚の画像データをランダムに取得し 評価に使用した 4 つの手法それぞれの画像 1 枚あたりの平均実行時間と 人物の検出精度 ( 検出した人数の割合 ) とを比較した その結果 平均実行時間は HOG 特徴量が 0.21s SSD が 11.19s YOLO が 12.34s Faster R-CNN が 25.28s であった 検出精度は YOLO が 92.24% Faster R-CNN が 86.78% SSD が 63.98% HOG 特徴量が 54.33% であった HOG 特徴量は速いが検出精度が低いことが明らかになった 3 種の深層学習手法では Faster R-CNN は複数のネットワークを使用して物体検出するため 単一のネットワークで検出する YOLO と SSD よりかなり遅いという結果が得られたのは妥当であろう また検出精度が低くなったのは 評価にデータとして多様な人の姿勢や向きのある画像データセット INRIA Person Dataset を使用したためであるとかんがえる 特に SSD が 3 種の中で低いのはそのせいではないであろう 展望として 検出物を人物と人物以外の 2 種に限定した学習モデルを作成すれば 速度を維持しつつ検出精度を高めることができるのではないだろうか 特に YOLO をベースとして GPU を使用すれば 実時間で人物検出が可能なシステムが実現できると考える 1
6 本書の構成は以下の通りである 第 2 章では前提知識として 本研究に用いた深層学習 そしてこれを用いた物体検出手法である Faster R-CNN YOLO SSD の紹介と HOG 特徴量の説明を行う 第 3 章では本研究をするための開発環境と研究の計画について述べる 第 4 章では 第 2 章で紹介した物体検出手法の実装方法について説明する 第 5 章では この実装を用いて 実行時間と検出精度の比較について述べる 第 6 章では 第 5 章で得られた結果について考察し 本論文をまとめる 2
7 第 2 章 本研究の構成 本研究では 深層学習の三つの手法 Faster R-CNN YOLO SSD による物体検出の実装を行い 検出精度と実行時間の比較を行った また 深層学習でない手法で 人物検出をすることができる代表的な手法として HOG 特徴量を用いた人物検出とも比較を行った 人物に着目した理由としては 深層学習手法は 安全や防犯対策にも使われ始めている中 人を検出する技術が必要とされていることから人物に着目した 本章では 初めに深層学習と その検出手法を学ぶために 深層学習は 浅川 (2016) と麻生ほか (2015) Faster R-CNN は Ren et al (2015) と浅川 (2016) YOLO は Redmon, et al (2016) と藤田 高原 (2016) SSD は Liu et al. (2015) HOG 特徴量は Dalal & Triggs (2005) と藤吉 (2009) を参考にして説明する 2.1 深層学習について深層学習 (Deep learning) は 人間や生物の脳神経系の強力な学習能力を持ったメカニズムをヒントとした機械学習手法のひとつであり 高い性能が挙げられていることで注目されている 深層学習は入力層 複数の中間層 出力層からなるニューラルネットワークを用いて行われる ニューラルネットワークのそれぞれの層は複数のユニットからなり このユニットは次の層のユニットと繋がるという構造をしている ただしこのニューラルネットワークは ただ層の数が多い ( 層が深い という ) だけではなく 一つの層のユニット数が多い ( 層の幅も広い という ) ため ユニットとユニット間の重みと呼ばれるパラメータ数が多い それにより 多数の特徴量を扱うことができるという特徴を持つ 深層学習の学習は一般的に 入力からニューラルネットワークによって計算された出力と教師データ ( 正解に相当する ) との差 ( すなわち誤差 ) を用いた重みを更新によって行われる ( 誤差逆伝播法 ) このとき 損失関数と呼ばれる関数が使用され この損失関数の値を小さくするように学習が行われる 深層学習は 2010 年代から産業界でも利用され Google や Microsoft, Facebook などの画像認識や音声認識 自然言語処理 創薬ゲノミクスなど多くの領域で研究開発が進められている 画像認識では 深層学習のうち畳み込みニューラルネットワーク (Convolutional Neural Network 以後 CNN と呼ぶ ) が多く利用されている CNN の特徴は 畳み込み層とプーリング層と呼ばれる特殊な層を交互に積み重ねた構造を持つことである 2.2 Faster R-CNN (Faster Region-with Convolution Neural Network) Ren et al (2015) らによる Faster R-CNN(Faster Region-with Convolution Neural Network) は 深層学習を用いた物体検出手法についての一連の研究 R-CNN Fast R-CNN Faster 3
8 R-CNN のうちで もっとも高速で高精度な成果を得ている研究である Faster R-CNN では 畳み込み層 (CNN) の上に 2 層の畳み込み層を追加して領域提案ネットワーク ( 以後 RPN と呼ぶ ) と呼ばれるネットワークを構築する RPN は 任意の大きさの画像を入力とし 物体が存在する候補領域と その領域に物体が存在する可能性を表す数値 ( 物体らしさ ) とを出力する なお候補領域としては 物体検出手法としては一般的であるが矩形領域だけを考えている 図 2.1 は物体が存在する候補領域を求めるべく CNN の出力である特徴地図において n n の物体検出用のウィンドウ ( 図 2.1 では n=3) による走査 ( スライディングウィンドウと呼ぶ ) を表したものである これにより物体の有無をそれぞれの領域ごとに判定し 物体があると判定された領域に対して物体認識を行う ここで縦横比が一定のウィンドウをずらしているだけでは いろいろな形や大きさの領域候補を調べられない そのため RPN ではウィンドウごとにアンカーと呼ばれる 大きさや縦横比の異なる複数個の領域を設定し それぞれの物体らしさを求める 図 2.1 に即して言えば ウィンドウごとに k 個 (Saito 2016) による実装では k=9) のアンカーを設定し それぞれについて 256 次元のベクトルに変換した後に 物体か背景かを分類する問題 (2k 個のクラス分類 ) と その領域の座標を求める問題 (4k 個の回帰問題 ) とを ( またもや )CNN を用いて解いているのである 図 2.1. 畳み込み特徴地図 (Ren 2015) Faster R-CNN の学習は 次の 4 段階の手順で学習を行う ( 図 2.2) 1. 事前訓練が済んだ CNN を用いて 物体が存在する領域を提案するネットワークである RPN の学習を行う 2. 学習した RPN が出力した候補領域から ファインチューニングした CNN を用いて物体認識を学習する (Fast R-CNN 流に ) 3. 上のステップで作成した物体検出ネットワークを用いて 物体認識ネットワークと共有する 特徴地図を用いて RPN を再学習する 4
9 4. さらに 物体認識ネットワークと共有する 特徴地図を用いて物体認識レイヤーを ファインチューニングする 図 2.2.Faster R-CNN の構成 ( 麻生ら 2015) かくして 入力データから CNN によって得られる同じ特徴地図を用いて 物体領域提案と物体認識とが学習され それにより物体検出が行われる この方式は 物体領域提案と物体認識とを別々の CNN で行っているため 後で紹介する二つの方式と比べ 計算コストが高くなっている それでもこの方式が提案された時点では最速であり PASCAL VOC2007 (Everingham 2007) データに対して 1 秒あたり 5 フレームの処理速度 73.2% map (mean Average Precision) と報告されている 2.3 YOLO(You Only Look Once) Redmon, et al (2016) による YOLO(You Only Look Once) は C 言語で作成されたフレームワークの darknet の機能の一つとして提供されている YOLO は 深層学習による物体検出手法であり検出精度が高い また 動画に対してリアルタイムに物体検出を行う機能もあり 処理時間が速い手法である 物体の領域とその物体の種類の予測を同時に行うという特徴がある 図 2.3 に YOLO の学習の概要図を示す 初めに CNN に にリサイズされた入力画像を入力し 画像全体は S S の固定サイズの領域 ( グリッド ) に分割される 本研究は 20 種類の物体が含まれている PASCAL VOC データを学習データとして用いている この場合は S=7 であり 7 7 のグリッド数に分割される 次に 図 2.3 の YOLO の学習概要図から 以下の項目を行って物体の予測をしている 5
10 各グリッドの物体らしさの 矩形とその信頼度を求める 各グリッドの信頼度が高い 物体の種類を求める 図 2.3.YOLO の学習概要図 (Redmon, J. 2016) 各グリッドの物体らしさの矩形とその信頼度を求める CNN に入力し 7 7 グリッドに分割された画像から 物体らしさの矩形を求める 方法は 物体らしい中心がグリッドセルに入ったとき その物体を検出して矩形を求める このとき 物体らしい矩形は 個生成され それぞれの矩形のデータは x 座標 y 座標 w 座標 h 座標と信頼度の計 5 種類を持っている セル内に物体が存在しない場合 信頼度は 0 となる 物体の信頼度をPr Object と定義すると 物体の信頼度は (2.1) 式であり 候補領域 b に対して セル g がどれだけ含まれているか割合を評価する Pr Object b g Pr Object 2.1 b g また それぞれの矩形領域から条件付きクラス確率 C も推測する Pr Class Object 2.2 各グリッドの信頼度が高い物体の種類を求める CNN に入力し 7 7 グリッドに分割された画像から 緑の領域は犬 ピンクの領域は自転車 オレンジの領域は車 青の領域は背景というように 物体ごとの確率が各グリッドセルに設定される YOLO は 24 層の畳み込み層と 2 層の全結合層からなる 26 層のニューラルネットワークで学習を行う また Faster R-CNN のように物体領域提案と物体認識とを別々で行うのではなく 1 回の推測から物体の領域予測と物体の種類の予測を同時に得ることができるため 高速な処理が可能である しかし 一つのグリッドで検出できる物体が最大 2 つという制約があるため グリッド内に大量の物体が映っている場合に検出が弱い 6
11 2.4 SSD(Single Shot MultiBox Detector) Liu, et al (2016) による SSD(Single Shot MultiBox Detector) は 2016 年 11 月時点で最新の深層学習による物体検出法である ある程度の検出精度を保ち 処理速度が速い 領域の予測と物体の種類の予測を単一のネットワークで実現している 前処理として CNN を行って得られた特徴地図を利用する 図 2.4 のように 深さの異なる特徴地図を用い 浅い層は小さい物体 深い層になるに連れ大きい物体の検出を可能としている 図 2.4.SSD の構造 (Liu et al. 2016) 領域の予測と物体の種類の予測はそれぞれの特徴地図で行われる 図 2.5 にその様子 を示す 図 2.5. 特徴地図における領域予測と物体予測 (Liu et al. 2016) 図 2.5 は CNN を前処理として得られた特徴地図を 8 8 と 4 4 に分割した二つの領域地図を示している このように領域地図をいろいろなサイズに分割することで 色々なサイズの物体を検出する ( 例えば図 2.5 の犬は 8 8 ではなく 4 4 の領域で検出される ) それぞれの領域には 3 3 のフィルタをかけ 物体の種類の信頼度とその物体の位置の座標 (x,y,w,h) を得る 損失関数は 物体の位置のずれとなる loc (localization loss) と物体のクラスである conf(confidence loss) を組み合わせたものである また特徴地図の各領域では 異なるアスペクト比の領域異種を生成し いろいろな形状の物体を検出できる工夫をしている ここで m 個の特徴地図を使う場合 k 番目の特徴地図は式 (2.3) のス 7
12 ケールを持つ大きさの物体を検出する役割を持つこととなる = + 1, 1, (2.3) 1 は 0.9 は 0.2 というスケールである また アスペクト比は 1,2,3, 1 2, 1 (2.4) 3 として 式 (2.5) と式 (2.6) から領域異種のサイズが決まる また アスペクト比が 1 の場 合は 式 (2.7) によりやや小さめの領域異種を生成している = (2.5) h = (2.6) = (2.7) この方式は 以上に説明した YOLO と同様に物体領域予測とその物体の種類を単一 のネットワークで実現しているため Faster R-CNN より速く検出することができる SSD の問題としては 大量なバウンディングボックスが生成されることが考えられるた め 学習時に予測とは正しくないデータ (negative data) が発生する このために 最後の 出力は conf(confidence loss) を降順に並べ 最も高い信頼度を拾い上げて検出結果として いる 2.5 HOG(Histograms of Oriented Gradients) 特徴量 Dalal &Triggs (2005) による HOG(Histograms of Oriented Gradients) 特徴量は 画像の局所領域 ( セル ) から 輝度の勾配方向と強度により得られる特徴量である 一般的には歩行者や物体検出に使用されている 以下に方法を示す 1. 画像をブロックに分割をし そのブロック内で複数のセルに分割をする 2. それぞれのブロック内のセルの中における輝度の勾配方向 強度から勾配ヒストグラムを計算する ヒストグラムの作成は 0 から 180 までを 20 ずつ 9 方向に分割する 輝度の勾配方向と強度は以下で求める 勾配方向 θ x, y = tan (, ) (2.8) (, ) 勾配強度 m x, y = (, ) + (, ) (2.9), = + 1, ( 1, ) (2.10), =, + 1 (, 1) 3. ブロックごとに正規化して ヒストグラムの形状を整える 8
13 正規化は以下で求める = + (2.11) s s はセル = 1 N は勾配方向数である 4. 得られたヒストグラムを連結し 特徴量を得る 以上より 輝度の勾配方向と強度の特徴量を得て検出することができる 本章では 三つの深層学習手法と HOG 特徴量を説明した 第 3 章では 上記の手法を実装して比較研究を行うために研究計画について説明する 9
14 第 3 章研究計画 深層学習は 画像認識の分野において高い性能を上げている また 画像認識は安全や防犯対策にも使われ始めている中 人を検出する技術が必要とされていることから人物に着目した 以上より 実行時間がより高速で 検出精度が良い手法が優位であると考えた そして 本章では 三つの深層学習手法 Faster R-CNN YOLO SSD を実装し 実行時間と検出精度を比較する概要について説明する 3.1 開発環境本研究をするために 開発環境について説明する 使用機器は HP 社 Z640 OS は Linux4.2(Ubuntu15.04) GPU は NVIDIA 社 Quadro M5000 で CUDA7.5 使用言語は python2.7 と python3.4 C 言語を使用した 3.2 研究の計画以下の計画で本研究を行った 1. 三つの深層学習手法について実装を行う 1.1 Faster R-CNN の実装を行う 本研究では chainer-faster-rcnn-master(saito 2015) を用いた これは PASCAL VOC 2007 データで訓練した学習モデルを用いており 20 種類の物体を検出できるものである 1.2 YOLO の実装を行う 本研究では darknet (Redmon 2016) で提供されているコードを用いた これも PASCAL VOC 2007 データで訓練した学習モデルを用いており 20 種類の物体を検出できるものである 1.3 SSD の実装を行う 本研究では mxnet-ssd (Zhang 2016) で提供されているコードを用いた これも PASCAL VOC 2007 データで訓練した学習モデルを用いており 20 種類の物体を検出できるシステムである 2. 以上の三つの深層学習手法と HOG 特徴量に対して人物検出問題のため 人を題材とした画像データベースを用いて人物の検出精度と実行時間を求めて比較を行う 本章では 本研究を行うための開発環境と研究計画の概要について説明した 第 4 章で は Faster R-CNN, YOLO, SSD, HOG 特徴量による検出システムの実装について説明す る 10
15 第 4 章 Faster R-CNN, YOLO, SSD, HOG 特徴量システムシステムの実装 本研究では 深層学習による物体検出手法と検出精度と HOG 特徴量の実行時間の比較を行うためにシステムを実装する必要がある 本章では 本研究に使用した深層学習による物体検出手法の Faster R-CNN YOLO SSD の三手法と OpenCV( 桑井博之他. 2014) を用いた HOG 特徴量による検出の実装方法について説明する OpenCV については本章で説明する 4.1 Faster R-CNN の実装本節では Faster R-CNN を実装するための方法を説明する 以下の手順で Faster R-CNN の実装を行った 1. Github にある chainer-faster-rcnn (Saito 2016) を ZIP 形式でダウンロードした後に展開する 2. chainer-faster-rcnn の lib のディレクトリに移動をし extension をビルドする 以下にコマンドを示す cd chainer-faster-rcnn cd lib python setup.py build_ext i cd.. 3. トレーニング済モデルのダウンロードを行う 以下にコマンドを示す wget VGG16_faster_rcnn_final.model cd.. 4. 以上の手順が完了したら プログラムの実行を行う python3 forward.py --img_fn [ 入力画像データ ] --out_fn result.jpg 以上より Faster R-CNN の実装を行うことができる プログラムの実行において --img_fn は入力画像( 物体検出させたい画像 ) の指定 --out_fn は出力画像 ( 物体検出結果 ) の指定である それぞれ ディレクトリを指定することもできる また --gpu 0 を付け加えることで GPU が使用できる 4.2 YOLO の実装本節では YOLO を実装するための方法を説明する 以下の手順で YOLO の実装を行った 1. Github にある darknet (Redmond 2016) を ZIP 形式でダウンロードした後 展開して 11
16 make する 2. トレーニング済モデルのダウンロードを行う 以下にコマンドを示す wget 3. 以上の手順が完了したら プログラムの実行を行う 以下のコマンドによりプログラムの実行を行う./darknet detector test cfg/voc.data cfg/yolo.cfg yolo.weights [ 入力画像データ ] 以上より YOLO の実装を行うことができる 4.3 SSD の実装本節では SSD を実装するためのダウンロードから実装するための方法を説明する 以下の手順で SSD の実装を行った 1. Github にある mxnet-ssd (Zhang 2016) を ZIP 形式でダウンロードした後 展開する 2. プログラムを実行する 以下のコマンドにより実行できる python demo.py --cpu --images [ 入力画像データ ] 4.4 HOG 特徴量によるによる人物人物検出の実装 OpenCV を使用することにより HOG 特徴量を用いた人物検出の実装を行う プログラムは付録 1 に示す ここで OpenCV とは 画像や動画の処理を容易にすることができる無償のオープンソースである 本章では Faster R-CNN, YOLO, SSD, HOG 特徴量による検出システムの実装につい て説明をした 第 5 章では 実装し検証を行った 12
17 第 5 章検証 本章では 4 章で説明した深層学習手法の 3 つに対して INRIA Person dataset を評価データとすることで 実行時間と検出精度の比較を行う INRIA Person dataset とは 多様な人の姿勢, 向き, 視点や背景画像が含まれている 汎用性の高いデータセットである この INRIA Person dataset から 100 枚の画像データをランダムに取得して評価に使用した なお 閾値の値は 0.6 とした 0.6 が人物であると判断できる最低限の信頼度と考えた 比較方法と結果は以下である 実行時間それぞれの検出手法により 100 枚の画像を検出し 1 枚あたりの画像の実行時間 ( 平均実行速度 ) を求めた ( 表 5.1) 検出精度それぞれの検出手法により 100 枚の画像を検出し 画像中に現れている人数と検出した人数から精度を算出した ( 表 5.2) 表 5.1. 平均の実行速度 Faster R-CNN YOLO SSD HOG 特徴量 平均実行速度 (s) 表 5.2. 検出精度 Faster R-CNN YOLO SSD HOG 特徴量 検出精度 (%) 以上の結果より 平均実行速度は深層学習手法ではない HOG 特徴量が最も速いこと また深層学習手法の中では SSD が最も速く Faster R-CNN が遅いことがわかった つまり以下の順である HOG 特徴量 > SSD > YOLO > Faster R-CNN 検出精度は 深層学習手法ではない HOG 特徴量が最も低いこと また深層学習手法の中では YOLO が最も高く SSD が低いことがわかった つまり以下の順である YOLO > Faster R-CNN > SSD > HOG 特徴量 処理前の画像と実装後の画像の例を示す なお図 5.1 の画像には 6 人いると判断した 13
18 図 5.1. 処理前の画像 処理後の画像を示す なお検出された人は枠で示されている 図 5.2. YOLO 実装画像 14
19 図 5.3. Faster R-CNN 実装画像 図 5.4. SSD 実装画像 以上の結果より SSD の精度が低いことから閾値の変更を行ってみた 15
20 図 5.5 の画像は 閾値が 0.6 としたとき 図 5.6 の画像は閾値を 0.1 のときであり 低い 信頼度でようやく検出され 精度は高くないのではないかと考えられた 図 5.5. 閾値 0.6 で SSD 実装 図 5.6. 閾値 0.1 で SSD 実装 16
21 第 6 章考察とまとめ HOG 特徴量は速いが検出精度が低いことが明らかになった 3 種の深層学習手法では 実行速度は SSD が最も速く Faster R-CNN が遅いことがわかった 考察としては Faster R-CNN は複数のネットワークを使用して物体検出するため 単一のネットワークで検出する YOLO と SSD よりかなり遅いという結果が得られたのは妥当であろう また検出精度は YOLO が最も高く SSD が低いことがわかった 検出精度が低くなった考察は 評価にデータとして多様な人の姿勢や向きのある画像データセット INRIA Person Dataset を使用したためであると考える 特に SSD が 3 種の中で低いのはそのせいであろう 展望として 検出物を人物と人物以外の 2 種に限定した学習モデルを作成すれば 速度を維持しつつ検出精度を高めることができるのではないだろうか また 本研究は画像に対して人物検出を行ったが 最も検出精度が良かった YOLO に対して GPU を使用すれば 実時間で人物検出が可能なシステムが実現し 安全面や防犯面など生活の場で活躍できるのではないか 17
22 参考文献 浅川伸一 (2016). Python で体験する深層学習. コロナ社麻生英樹他 (2015). 深層学習. 近代科学社. 桑井博之他. (2014). 実践 OpenCV 2.4 for Python 映像処理 & 解析. カットシステム藤田一弥 高原歩 (2016) 実装ディープラーニング. オーム社藤吉弘亘 (2009). 局所特徴量の関連性に着目した Joint 特徴による物体検出. 情報処理学会研究報告 CVIM 166 Dalal N. (2005). INRIA Person Dataset (2016 年 9 月参照 ) Dalal N. & Triggs, B. (2005).Histograms of Oriented Gradients for Human Detection. In CVPR 05. pp Liu, W., Anguelov, D., Erhan, C. Szegedym, C. & Reed, S. E. (2016). SSD: Single Shot MultiBox Detector. CoRR.abs/ M. Everingham, L. Van Gool, C. K. I. Williams, J. Winn,& A. Zisserman. (2007). The PASCAL Visual Object Classes Challenge (2016 年 10 月参照 ) Redmon, J. (2016). Convolutional Neural Networks (2016 年 11 月参照 ) Redmon, J.(2016). YOLO: Real-Time Object Detection (2016 年 11 月参照 ) Redmon, J. Girshick, R., Divvala, S. & Farhadi, A. (2016). You Only Look Once:Unified, Real-Time Object Detection. In CVPR. Ren, S., He, K., Girshick, R. & Sun, J. (2015).Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. arxiv: Saito, S. (2016) Object Detection with Faster R-CNN in Chainer (2016 年 9 月参照 ) Zhang, J. Z. (2016). MXNet port of SSD: Single Shot MultiBox Object Detector. Reimplementation of (2016 年 11 月参照 ) 18
23 謝辞 本研究においてご指導して頂いた白井英俊教授に心から感謝致します また 様々な 意見を頂いた白井研究室の皆様に感謝致します 19
24 付録 1. [HOG 特徴量のプログラム ] hog.py # Python 2/3 compatibility from future import print_function import numpy as np import cv2 def inside(r, q): rx, ry, rw, rh = r qx, qy, qw, qh = q return rx > qx and ry > qy and rx + rw < qx + qw and ry + rh < qy + qh def draw_detections(img, rects, thickness = 1): for x, y, w, h in rects: # the HOG detector returns slightly larger rectangles than the real objects. # so we slightly shrink the rectangles to get a nicer output. pad_w, pad_h = int(0.15*w), int(0.05*h) cv2.rectangle(img, (x+pad_w, y+pad_h), (x+w-pad_w, y+h-pad_h), (0, 255, 0), thickness) if name == ' main ': import sys from glob import glob import itertools as it print( doc ) hog = cv2.hogdescriptor() hog.setsvmdetector( cv2.hogdescriptor_getdefaultpeopledetector() ) for fn in it.chain(*map(glob, default + sys.argv[1:])): 20
25 print(fn, ' - ',) try: img = cv2.imread(fn) if img is None: print('failed to load image file:', fn) continue except: print('loading error') continue found, w = hog.detectmultiscale(img, winstride=(8,8), padding=(32,32), scale=1.05) found_filtered = [] for ri, r in enumerate(found): for qi, q in enumerate(found): if ri!= qi and inside(r, q): break else: found_filtered.append(r) draw_detections(img, found) draw_detections(img, found_filtered, 3) print('%d (%d) found' % (len(found_filtered), len(found))) cv2.imshow('img', img) ch = 0xFF & cv2.waitkey() if ch == 27: break cv2.destroyallwindows() 21
Slide 1
ハンズオン受講の為の準備講座 これから始める人の為の ディープラーニング基礎講座 村上真奈 NVIDIA CUDA & Deep Learning Solution Architect NVIDIA Corporation 1 機械学習とディープラーニングの関係 AGENDA ディープラーニングとは? ニューラルネットワークの構造 ディープラーニングの学習とは 畳み込みニューラルネットワーク 午後に予定しているハンズオンの為の基礎講座ディープラーニングをこれから始める方を対象に基礎概念や用語の解説を行います
2015 年度 卒業論文 表情認識システム 指導教員白井英俊教授 中京大学情報理工学部機械情報工学科 学籍番号 氏名 H 中川将成 (2016 年 1 月 )
2015 年度 卒業論文 表情認識システム 指導教員白井英俊教授 中京大学情報理工学部機械情報工学科 学籍番号 氏名 H412074 中川将成 (2016 年 1 月 ) 卒業論文要旨 題目 表情認識システム 学籍番号 H412074 氏名中川将成指導教員白井英俊 近年 笑顔を認識して自動的にシャッターをきる機能を搭載したデジタルカメラが発売されており 機械が笑顔を認識する機能が実用化されるようになった
色の類似性に基づいた形状特徴量CS-HOGの提案
IS3-04 第 18 回 画 像 センシングシンポジウム, 横 浜, 2012 年 6 月 CS-HOG CS-HOG : Color Similarity-based HOG feature Yuhi Goto, Yuji Yamauchi, Hironobu Fujiyoshi Chubu University E-mail: [email protected] Abstract
スライド 1
CNN を用いた弱教師学習による画像領域分割 下田和, 柳井啓司 電気通信大学 大学院情報理工学 研究科 総合情報学専攻 c 2015 UEC Tokyo. Convolutional Neural Network CNN クラス分類タスクにおいてトップの精度 CNN の応用 ( 物体位置の認識 ) 物体検出 物体に BB を付与 領域分割 ピクセル単位の認識 CNN を用いた領域分割 CNN による完全教師ありのセグメンテーション
100326_セミナー資料_物体認識.pptx
!! "#! "#"! "#$! "#%! $#! $#"! $#$! $#%! $#&! % 物体認識 検出 について '()*++,-./#,0121#3)+,04.50+6789+":; '()*++)010;216,#3)+9,+0;.?>65.6#'@4A 物体検出は簡単か 多様な変動要素が存在して難しい 変動要素に対応する特徴量 学習手法がキー カメラの角度 姿勢
機械学習 ハンズオン-チュートリアル
機械学習 ハンズオン - チュートリアル 初めてのペアモニター研究 はじめに このチュートリアルは機械学習の環境を構築し ニューラルネットワークが実行できるようになるところまで行います チュートリアルの流れ 1. 環境構築 2. 機械学習用プログラム実装 & 実行 3. プログラムの改良 ( 精度向上のため ) 4. 機械学習についてより深く理解するために 2 y[mm] y[mm] 機械学習 ヒット分布
GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer
GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer Chainer のミッション Deep Learning とその応用の研究開発を加速させる 環境セットアップが速い すぐ習熟 素早いコーディング 実験の高速化 結果をさっと公開 論文化
Microsoft PowerPoint - pr_12_template-bs.pptx
12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算
VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12
VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 アジェンダ Tensorコアとトレーニングの概要 混合精度 (Tensorコア) で FP32と同等の精度を得る方法 ウェイトをFP16とFP32を併用して更新する ロス スケーリング DLフレームワーク対応状況 ウェイトをFP16で更新する
untitled
IS2-26 第 19 回 画 像 センシングシンポジウム, 横 浜,2013 年 6 月 SVM E-mail: [email protected] Abstract SVM SVM SVM SVM HOG B-HOG HOG SVM 6.1% 17 1 Intelligent Transport System(ITS: ) 2005 Dalal HOG SVM[1] [2] HOG
Slide 1
GPU コンピューティング研究会ディープラーニング ハンズオン講習 エヌビディア合同会社 ディープラーニングソリューションアーキテクト兼 CUDA エンジニア村上真奈 追記 ハンズオンのおさらいを後日行いたい方へ MNIST データセットは以下からダウンロードする事が可能です (gz 形式 ) http://yann.lecun.com/exdb/mnist/ 下記スクリプトでも簡単にデータをダウンロード可能です
自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2
リカレントニューラルネットワークの概要と動作原理 竹田卓也 後援 : ドワンゴ 1 自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2 アウトライン Feed forward neural network Recurrent neural
画像類似度測定の初歩的な手法の検証
画像類似度測定の初歩的な手法の検証 島根大学総合理工学部数理 情報システム学科 計算機科学講座田中研究室 S539 森瀧昌志 1 目次 第 1 章序論第 章画像間類似度測定の初歩的な手法について.1 A. 画素値の平均を用いる手法.. 画素値のヒストグラムを用いる手法.3 C. 相関係数を用いる手法.4 D. 解像度を合わせる手法.5 E. 振れ幅のヒストグラムを用いる手法.6 F. 周波数ごとの振れ幅を比較する手法第
(MIRU2008) HOG Histograms of Oriented Gradients (HOG)
(MIRU2008) 2008 7 HOG - - E-mail: [email protected], {takigu,ariki}@kobe-u.ac.jp Histograms of Oriented Gradients (HOG) HOG Shape Contexts HOG 5.5 Histograms of Oriented Gradients D Human
PowerPoint Presentation
ディープラーニングの 実践的な適用ワークフロー MathWorks Japan テクニカルコンサルティング部縣亮 2015 The MathWorks, Inc. 1 アジェンダ ディープラーニングとは?( おさらい ) ディープラーニングの適用ワークフロー ワークフローの全体像 MATLAB によるニューラルネットワークの構築 学習 検証 配布 MATLAB ではじめるメリット 試行錯誤のやりやすさ
Deep Learningでの地図タイル活用の検討
第 7 回地理院地図パートナーネットワーク会議 2017/6/8 Deep Learning での 地図タイル活用の検討 OSGeo 財団日本支部 岩崎亘典 和山亮介 1 はじめに 発表内容 2 /36 汎用的フォーマットとしての地図タイル 地図タイルと Deep Learning CNN を用いた旧版地形図の分類 地形図から土地利用分類 Conditional GAN を用いたタイル画像変換 空中写真
概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成
Encoding Source Language with Convolu5onal Neural Network for Machine Transla5on Fandong Meng, Zhengdong Lu, Mingxuan Wang, Hang Li, Wenbin Jiang, Qun Liu, ACL- IJCNLP 2015 すずかけ読み会奥村 高村研究室博士二年上垣外英剛 概要
PYTHON 資料 電脳梁山泊烏賊塾 PYTHON 入門 ゲームプログラミング スプライトの衝突判定 スプライトの衝突判定 スプライトの衝突判定の例として インベーダーゲームのコードを 下記に示す PYTHON3 #coding: utf-8 import pygame from pygame.lo
PYTHON 入門 ゲームプログラミング スプライトの衝突判定 スプライトの衝突判定 スプライトの衝突判定の例として インベーダーゲームのコードを 下記に示す #coding: utf-8 import pygame from pygame.locals import * import os import sys SCR_RECT = Rect(0, 0, 640, 480) def main():
図 5 一次微分 図 6 コントラスト変化に伴う微分プロファイルの変化 価し, 合否判定を行う. 3. エッジ検出の原理ここでは, 一般的なエッジ検出の処理内容と, それぞれの処理におけるパラメータについて述べる. 3.1 濃度投影検出線と直交する方向に各画素をスキャンし, その濃度平均値を検出線上
The Principles of Edge Detection, and Its Application to Image Measurement/ Junichi SUGANO ヴィスコ テクノロジーズ株式会社開発本部研究部菅野純一 1. はじめに画像処理におけるエッジとは, 対象物と背景の境界点を指しており, この境界点が連なることで対象物の輪郭を形成する. 対象物の輪郭を拡大してみると, レンズボケにより明から暗または暗から明へ濃度値が連続的に変化していることがわかる.
dlshogiアピール文章
第 28 回世界コンピュータ将棋選手権 dlshogi アピール文章 山岡忠夫 2018 年 5 月 1 日更新 下線部分は 第 5 回将棋電王トーナメントからの差分を示す 1 特徴 ディープラーニングを使用 指し手を予測する Policy Network 局面の勝率を予測する Value Network 入力特徴にドメイン知識を活用 モンテカルロ木探索 並列化 自己対局による強化学習 既存将棋プログラムの自己対局データを使った事前学習
Microsoft Word - 卒論レジュメ_最終_.doc
指紋認証のマニューシャ抽出について 澤見研究室 I02I036 兼信雄一 I02I093 柳楽和信 I02I142 吉田寛孝 1. はじめに近年, キャッシュカードや暗証番号が盗用され, 現金が引き出されるような事件が相次いでいる. これらの対向策として人間の体の一部を認証の鍵として利用する生体認証に注目が集まっている. そこで我々は, 生体認証で最も歴史がある指紋認証技術に着目した. 指紋認証方式は,2
MATLAB EXPO 2019 Japan プレゼン資料の検討
自動運転向けソフトウェア Autoware と MATLAB /Simulink の連携 ~ 事例紹介 ~ 2019 年 5 月 28 日株式会社ネクスティエレクトロニクス SW 開発部技術開発グループ太田徳幸 Copyright TOMEN Electronics Corp. 目次 2/31 1. 会社概要 2. Autoware Toolbox 紹介 1. 取り組み背景 2. Autoware
Mastering the Game of Go without Human Knowledge ( ) AI 3 1 AI 1 rev.1 (2017/11/26) 1 6 2
6 2 6.1........................................... 3 6.2....................... 5 6.2.1........................... 5 6.2.2........................... 9 6.2.3................. 11 6.3.......................
AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン
ハンズオンラボ2 DIGITS による物体検出入門 村上真奈 NVIDIA CUDA & Deep Learning Solution Architect NVIDIA Corporation 1 AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン ディープラーニングとは 機械学習とディープラーニングの関係
b4-deeplearning-embedded-c-mw
ディープラーニングアプリケーション の組み込み GPU/CPU 実装 アプリケーションエンジニアリング部町田和也 2015 The MathWorks, Inc. 1 アジェンダ MATLAB Coder/GPU Coder の概要 ディープニューラルネットワークの組み込み実装ワークフロー パフォーマンスに関して まとめ 2 ディープラーニングワークフローのおさらい Application logic
画像分野におけるディープラーニングの新展開
画像分野におけるディープラーニングの新展開 MathWorks Japan アプリケーションエンジニアリング部テクニカルコンピューティング 太田英司 2017 The MathWorks, Inc. 1 画像分野におけるディープラーニングの新展開 物体認識 ( 画像全体 ) 物体の検出と認識物体認識 ( ピクセル単位 ) CNN (Convolutional Neural Network) R-CNN
Microsoft PowerPoint - comprog11.pptx
Outline プログラミング演習第 回エッジを検出する on 3..4 電気通信大学情報理工学部知能機械工学科長井隆行 画像の本質 輝度の境目に情報あり! 画像の微分と 階微分 エッジ検出 画像をぼかす 本日の課題 画像の本質 エッジ抽出 画像の情報は境目にあり! エッジ 輝度が大きく変化しているところ ( 境界 ) 画像の情報はエッジにあり 輝度 人間の視覚系でも特定のエッジの方向に発火するニューロンが見つかっている
0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生
0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生まれ, コンピューテーショナルフォトグラフィ ( 計算フォトグラフィ ) と呼ばれている.3 次元画像認識技術の計算フォトグラフィへの応用として,
す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(
IR E-mail: [email protected] Abstract IR RGB ( ) IR IR IR RGB RGB PSNR 1 Time-Of- Flight(TOF)[1] Kinect [2] TOF LED TOF [3] [6] [4][5] 2 [6] RGB ( ) Infrared(IR) IR 2 2.1 1 す 局所領域 ωk において 線形変換に用いる係数 (ak
2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.
2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3. プロジェクト管理組織 株式会社オープンテクノロジーズ 4. 委託金支払額 3,000,000 円 5.
ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン
ハンズオンラボ DIGITS による物体検出入門 山崎和博 ディープラーニング ソリューションアーキテクト エヌビディア ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン ディープラーニングとは 様々な分野でディープラーニングを応用 インターネットとクラウド 医学と生物学 メディアとエンターテイメント セキュリティと防衛 機械の自動化
Microsoft PowerPoint - mp11-06.pptx
数理計画法第 6 回 塩浦昭義情報科学研究科准教授 [email protected] http://www.dais.is.tohoku.ac.jp/~shioura/teaching 第 5 章組合せ計画 5.2 分枝限定法 組合せ計画問題 組合せ計画問題とは : 有限個の もの の組合せの中から, 目的関数を最小または最大にする組合せを見つける問題 例 1: 整数計画問題全般
Convolutional Neural Network A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolution
Convolutional Neural Network 2014 3 A Graduation Thesis of College of Engineering, Chubu University Investigation of feature extraction by Convolutional Neural Network Fukui Hiroshi 1940 1980 [1] 90 3
ご利用のコンピュータを設定する方法 このラボの作業を行うには 事前設定された dcloud ラボを使用するか 自身のコンピュータをセットアップします 詳細については イベントの事前準備 [ 英語 ] とラボの設定 [ 英語 ] の両方のモジュールを参照してください Python を使用した Spar
ご利用のコンピュータを設定する方法 このラボの作業を行うには 事前設定された dcloud ラボを使用するか 自身のコンピュータをセットアップします 詳細については イベントの事前準備 [ 英語 ] とラボの設定 [ 英語 ] の両方のモジュールを参照してください Python を使用した Spark API との通信 このラーニングモジュールでは Python を使用した Spark API とのインターフェイスを扱います
コンピュータグラフィックス第8回
コンピュータグラフィックス 第 8 回 レンダリング技法 1 ~ 基礎と概要, 隠面消去 ~ 理工学部 兼任講師藤堂英樹 レポート提出状況 課題 1 の選択が多い (STAND BY ME ドラえもん ) 体験演習型 ( 課題 3, 課題 4) の選択も多い 内訳 課題 1 課題 2 課題 3 課題 4 課題 5 2014/11/24 コンピュータグラフィックス 2 次回レポートの体験演習型 メタセコイア,
Research on Multi-view Face Detection of Comic Characters A Thesis Submitted to the Department of Computer Science and Communications Engineering, the
2015 年度 早稲田大学大学院基幹理工学研究科情報理工 情報通信専攻修士論文 マンガキャラクターを対象とした多視点顔 検出の研究 2016.2.1 柳澤秀彰 (5114F089-4) 所属オーディオビジュアル情報処理研究室 ( 渡辺裕教授 ) Research on Multi-view Face Detection of Comic Characters A Thesis Submitted to
WHITE PAPER RNN
WHITE PAPER RNN ii 1... 1 2 RNN?... 1 2.1 ARIMA... 1 2.2... 2 2.3 RNN Recurrent Neural Network... 3 3 RNN... 5 3.1 RNN... 6 3.2 RNN... 6 3.3 RNN... 7 4 SAS Viya RNN... 8 4.1... 9 4.2... 11 4.3... 15 5...
Microsoft Word - 卒業論文.doc
006 年度卒業研究 画像補間法を用いた拡大画像の比較 岡山理科大学総合情報学部情報科学科 澤見研究室 I03I04 兼安俊治 I03I050 境永 目次 はじめに ラスタ画像 3 画像補間法 3. ニアレストネイバー法 3. バイリニア法 3.3 バイキュービック法 4 DCT を用いた拡大画像手法 5 FIR 法 6 評価 6. SNR 6. PSNR 7 実験 7. 主観評価 7. 客観評価
連続講座 断層映像法の基礎第 32 回 : 篠原広行 他 断層映像法の基礎 第 32 回 ML-EM 法と OS-EM 法 篠原広行 1) 桑山潤 1) 小川亙 1) 2) 橋本雄幸 1) 首都大学東京人間健康科学研究科放射線科学域 2) 横浜創英短期大学情報学科 はじめに第 31 回では繰り返しを
断層映像法の基礎 第 32 回 ML-EM 法と OS-EM 法 篠原広行 1) 桑山潤 1) 小川亙 1) 2) 橋本雄幸 1) 首都大学東京人間健康科学研究科放射線科学域 2) 横浜創英短期大学情報学科 はじめに第 31 回では繰り返しを利用して徐々に解に近づけていく方法を紹介した 本稿ではその繰り返しを使った方法で最も多く使われている ML-EM 法と OS-EM 法について解説する また その方法を利用した数値シミュレーションの結果についても紹介する
C#の基本
C# の基本 ~ 開発環境の使い方 ~ C# とは プログラミング言語のひとつであり C C++ Java 等に並ぶ代表的な言語の一つである 容易に GUI( グラフィックやボタンとの連携ができる ) プログラミングが可能である メモリ管理等の煩雑な操作が必要なく 比較的初心者向きの言語である C# の利点 C C++ に比べて メモリ管理が必要ない GUIが作りやすい Javaに比べて コードの制限が少ない
東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子
東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子 2014 年度東邦大学理学部情報科学科卒業研究 コラッツ予想の変形について 学籍番号 5511104 氏名山中陽子 要旨 コラッツ予想というのは 任意の 0 でない自然数 n をとり n が偶数の場合 n を 2 で割り n が奇数の場合
1 (PCA) 3 2 P.Viola 2) Viola AdaBoost 1 Viola OpenCV 3) Web OpenCV T.L.Berg PCA kpca LDA k-means 4) Berg 95% Berg Web k-means k-means
Web, Web k-means 62% Associating Faces and Names in Web Photo News Akio Kitahara and Keiji Yanai We propose a system which extracts faces and person names from news articles with photographs on the Web
Presentation Title
ディープラーニングによる画像認識の基礎と実践ワークフロー MathWorks Japan アプリケーションエンジニアリング部アプリケーションエンジニア福本拓司 2018 The MathWorks, Inc. 1 一般的におこなわれる目視による評価 製造ライン 医用データ 作業現場 インフラ 研究データ 現場での目視 大量画像の収集 専門家によるチェック 2 スマートフォンで撮影した映像をその場で評価
統計的データ解析
統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c
2017 (413812)
2017 (413812) Deep Learning ( NN) 2012 Google ASIC(Application Specific Integrated Circuit: IC) 10 ASIC Deep Learning TPU(Tensor Processing Unit) NN 12 20 30 Abstract Multi-layered neural network(nn) has
ARToolKit プログラムの仕組み 1: ヘッダファイルのインクルード 2: Main 関数 3: Main Loop 関数 4: マウス入力処理関数 5: キーボード入力処理関数 6: 終了処理関数 3: Main Loop 関数 1カメラ画像の取得 2カメラ画像の描画 3マーカの検出と認識
ARToolKit プログラムの仕組み 1: ヘッダファイルのインクルード 2: Main 関数 3: Main Loop 関数 4: マウス入力処理関数 5: キーボード入力処理関数 6: 終了処理関数 3: Main Loop 関数 1カメラ画像の取得 2カメラ画像の描画 3マーカの検出と認識 4 次の画像のキャプチャ指示 5マーカの信頼度の比較 6マーカの位置 姿勢の計算 7バッファの内容を画面に表示
IPSJ SIG Technical Report Vol.2017-CVIM-207 No /5/10 GAN 1,a) 2,b) Generative Adversarial Networks GAN GAN CIFAR-10 10% GAN GAN Stacked GAN Sta
1,a) 2,b) Generative Adversarial Networks CIFAR-10 10% Stacked Stacked 8.9% CNN 1. ILSVRC 1000 50000 5000 Convolutional Neural Network(CNN) [3] Stacked [4] 1 2 a) [email protected] b) [email protected]
カイ二乗フィット検定、パラメータの誤差
統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,
PowerPoint Presentation
付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像
この演習について Autoware 演習 1: データの記録 再生 Autoware 演習 2: センサーキャリブレーション Autoware 演習 3:3 次元地図の作成 Autoware 演習 4: 自己位置推定 Autoware 演習 5: パラメータ調整 Autoware 演習 6: 物体検
version 1.0 TIER IV ACADEMY 自動運転システム構築塾 Day4 Autoware 演習 2 Autoware 演習 6: 物体検出とトラッキング この演習について Autoware 演習 1: データの記録 再生 Autoware 演習 2: センサーキャリブレーション Autoware 演習 3:3 次元地図の作成 Autoware 演習 4: 自己位置推定 Autoware
IS2-06 第21回画像センシングシンポジウム 横浜 2015年6月 画像をスーパーピクセルに変換する手法として SLIC[5] を用いる Achanta らによって提案された SLIC 2.2 グラフマッチング は K-means をベースにした手法で 単純な K-means に いる SPIN
Cosegmentation E-mail: {tamanaha, nakayama}@nlab.ci.i.u-tokyo.ac.jp Abstract Cosegmentation Cosegmentation Cosegmentation 1 Never Ending Image Learner[1] Google Cosegmentation Cosegmentation Rother [2]
Microsoft Word - thesis.doc
剛体の基礎理論 -. 剛体の基礎理論初めに本論文で大域的に使用する記号を定義する. 使用する記号トルク撃力力角運動量角速度姿勢対角化された慣性テンソル慣性テンソル運動量速度位置質量時間 J W f F P p .. 質点の並進運動 質点は位置 と速度 P を用いる. ニュートンの運動方程式 という状態を持つ. 但し ここでは速度ではなく運動量 F P F.... より質点の運動は既に明らかであり 質点の状態ベクトル
様々なミクロ計量モデル†
担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル
基幹理工学部情報理工学科 Bachelor s Thesis 卒業論文 Title 論文題目 Deformable Part Model を用いたコミック画像からの顔検出 Face Detection for Comic Images with Deformable Part Model Stude
提出日 2014 年 2 月 6 日 Summary of Bachelor s Thesis 2014 年 3 月修了卒業論文概要書 Name 氏名柳澤秀彰 題目 Title ( 日本語の場合は英文題目も記入 ) 日本語 Japanese ID number 学籍番号 1W100499-7 Supervisor 指導教員渡辺祐 印 Deformable Part Model を用いたコミック画像からの顔検出
Deep Learning によるビッグデータ解析 ~ 手法や CUDA による高速化 2014 年 9 月 5 日 G-DEP ソリューションパートナー株式会社システム計画研究所奥村義和
Deep Learning によるビッグデータ解析 ~ 手法や CUDA による高速化 2014 年 9 月 5 日 G-DEP ソリューションパートナー株式会社システム計画研究所奥村義和 目次 DeepLearning と GPU G-DEP テストドライブ ビッグデータ GPU DeepLearning の接点 目次 DeepLearningとGPU DeepLearningとは 仕組みと計算
コンピュータ工学講義プリント (7 月 17 日 ) 今回の講義では フローチャートについて学ぶ フローチャートとはフローチャートは コンピュータプログラムの処理の流れを視覚的に表し 処理の全体像を把握しやすくするために書く図である 日本語では流れ図という 図 1 は ユーザーに 0 以上の整数 n
コンピュータ工学講義プリント (7 月 17 日 ) 今回の講義では フローチャートについて学ぶ フローチャートとはフローチャートは コンピュータプログラムの処理の流れを視覚的に表し 処理の全体像を把握しやすくするために書く図である 日本語では流れ図という 図 1 は ユーザーに 0 以上の整数 n を入力してもらい その後 1 から n までの全ての整数の合計 sum を計算し 最後にその sum
インテル(R) Visual Fortran コンパイラ 10.0
インテル (R) Visual Fortran コンパイラー 10.0 日本語版スペシャル エディション 入門ガイド 目次 概要インテル (R) Visual Fortran コンパイラーの設定はじめに検証用ソースファイル適切なインストールの確認コンパイラーの起動 ( コマンドライン ) コンパイル ( 最適化オプションなし ) 実行 / プログラムの検証コンパイル ( 最適化オプションあり ) 実行
Apache Arrow 須藤功平株式会社クリアコード RubyData Tokyo Meetup Apache Arrow Powered by Rabbit 2.2.2
Apache Arrow 須藤功平株式会社クリアコード RubyData Tokyo Meetup 2018-11-17 Apache Arrow 各種言語で使えるインメモリーデータ処理プラットフォーム 提供するもの 高速なデータフォーマット 高速なデータ処理ロジック 各プロダクトで個別に実装するより一緒にいいものを実装して共有しよう! 効率的なデータ交換処理... 利用例 Apache Arrow
計算機シミュレーション
. 運動方程式の数値解法.. ニュートン方程式の近似速度は, 位置座標 の時間微分で, d と定義されます. これを成分で書くと, d d li li とかけます. 本来は が の極限をとらなければいけませんが, 有限の小さな値とすると 秒後の位置座標は速度を用いて, と近似できます. 同様にして, 加速度は, 速度 の時間微分で, d と定義されます. これを成分で書くと, d d li li とかけます.
Microsoft PowerPoint - DigitalMedia2_2.pptx
デジタルメディア処理 担当 : 井尻敬 デジタルメディア処理 7( 前期 ) /3 デジタル画像とは : イントロダクション / フィルタ処理 : 画素ごとの濃淡変換 線形フィルタ, 線形フィルタ /7 フィルタ処理 : フーリエ変換, ローパスフィルタ, ハイパスフィルタ 5/ 画像の幾何変換 : アファイン変換 5/8 画像の幾何変換 : 画像の補間, イメージモザイキング 5/5 画像領域分割
IPSJ SIG Technical Report Vol.2014-HCI-160 No.8 Vol.2014-UBI-44 No /10/14 1,a) 1,b) 1,c) 1,d) 1. [1] HMD 1 Kyoto Institute of Technology a) kyok
1,a) 1,b) 1,c) 1,d) 1. [1] HMD 1 Kyoto Institute of Technology a) [email protected] b) [email protected] c) [email protected] d) [email protected] [2] [2][3][4][5][6][7][8] [3][4][5][6][7][8]
WiFiの現状
V1.0 2019/10/23 はじめての AI 用パソコン Tensorflow 学習編 (ubuntu 版 ) 抜粋版 スペクトラム テクノロジー株式会社 https://spectrum-tech.co.jp [email protected] all rights reserved 2019 spectrum technology co. 1 目次 ubuntu 運用マニュアル
ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社
ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において
Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt
重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?
ボルツマンマシンの高速化
1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,
Using VectorCAST/C++ with Test Driven Development
ホワイトペーパー V2.0 2018-01 目次 1 はじめに...3 2 従来型のソフトウェア開発...3 3 テスト主導型開発...4 4...5 5 TDD を可能にするテストオートメーションツールの主要機能...5 5.1 テストケースとソースコード間のトレーサビリティー...5 5.2 テストケースと要件間のトレーサビリティー...6 6 テスト主導型開発の例...7 2 1 はじめに 本書では
TFTP serverの実装
TFTP サーバーの実装 デジタルビジョンソリューション 佐藤史明 1 1 プレゼンのテーマ組み込みソフトのファイル転送を容易に 2 3 4 5 基礎知識 TFTP とは 実践 1 実際に作ってみよう 実践 2 組み込みソフトでの実装案 最後におさらい 2 プレゼンのテーマ 組み込みソフトのファイル転送を容易に テーマ選択の理由 現在従事しているプロジェクトで お客様からファームウェアなどのファイル転送を独自方式からTFTPに変更したいと要望があった
NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1
自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 品詞推定 文 X が与えられた時の品詞列 Y を予測する Natural language processing ( NLP ) is a field of computer science JJ -LRB- -RRB- VBZ DT IN 予測をどうやって行うか
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
田向研究室PPTテンプレート
Hibikino-Musashi@Home: ホームサービスロボット開発学生プロジェクトの紹介 18/09/14 ROSCon JP 2018 Hibikino-Musashi@Home 九州工業大学田向研究室 石田裕太郎 [email protected] 今日紹介するロボット RoboCup@Home に参戦するホームサービスロボット Eix@ HW: 九工大 SW: 九工大 2018
Microsoft Word - NumericalComputation.docx
数値計算入門 武尾英哉. 離散数学と数値計算 数学的解法の中には理論計算では求められないものもある. 例えば, 定積分は, まずは積分 ( 被積分関数の原始関数をみつけること できなければ値を得ることはできない. また, ある関数の所定の値における微分値を得るには, まずその関数の微分ができなければならない. さらに代数方程式の解を得るためには, 解析的に代数方程式を解く必要がある. ところが, これらは必ずしも解析的に導けるとは限らない.
8-7th
画像認識 人物検出を例に 特徴抽出 人らしさ を取り出す写像 特 徴 抽 出 画像認識 人物検出を例に 特徴抽出 人らしさ を取り出す写像 特 徴 抽 出 cifar10 一般物体認識のデータセット 物体カテゴリ10 各カテゴリ1000枚 画像サイズ32x32 http://www.cs.toronto.edu/ kriz/cifar.html 同ページからcifar10 python version
早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月
早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月 本研究は ネパール人日本語学習者 ( 以下 NPLS) のリズム生成の特徴を明らかにし NPLS に対する発音学習支援 リズム習得研究に示唆を与えるものである 以下 本論文 の流れに沿って 概要を記述する 第一章序論 第一章では 本研究の問題意識 意義 目的 本論文の構成を記した
第 1 回ディープラーニング分散学習ハッカソン <ChainerMN 紹介 + スパコンでの実 法 > チューター福 圭祐 (PFN) 鈴 脩司 (PFN)
第 1 回ディープラーニング分散学習ハッカソン チューター福 圭祐 (PFN) 鈴 脩司 (PFN) https://chainer.org/ 2 Chainer: A Flexible Deep Learning Framework Define-and-Run Define-by-Run Define Define by Run Model
ホログラフィ ビームスプリッタ レーザ光 ミラー レーザ光 記録物体 ミラー 再生像 写真乾版 ホログラム 物体光 物体光 参照光 ミラー 再生光 ミラー ホログラムへの記録 ホログラムの再生 光の干渉を利用 光の回折を利用 2
電子ホログラフィ技術を用いた 立体映像システムに関する研究開発 下馬場 朋禄 千葉大学大学院工学研究科 1 ホログラフィ ビームスプリッタ レーザ光 ミラー レーザ光 記録物体 ミラー 再生像 写真乾版 ホログラム 物体光 物体光 参照光 ミラー 再生光 ミラー ホログラムへの記録 ホログラムの再生 光の干渉を利用 光の回折を利用 2 電子ホログラフィ コンピュータ CGHを表示 LCD Controller
Microsoft PowerPoint - dm1_3.pptx
スケジュール 9/6 イントロダクション : デジタル画像とは, 量 化と標本化,Dynamic Range /3 イントロダクション : デジタルカメラ, 間の視覚, 表 系 / フィルタ処理 : トーンカーブ, 線形フィルタ デジタルメディア処理 担当 : 井尻敬 /7 フィルタ処理 : 線形フィルタ, ハーフトーニング / フィルタ処理 3 : 離散フーリエ変換と周波数フィルタリング /7 前半のまとめと中間試験
PowerPoint Presentation
Embedded CFD 1D-3D 連成によるエンジンコンパートメント熱収支解析手法の提案 June 9, 2017 . アジェンダ Embedded CFD 概要 エンコパ内風流れデモモデル 他用途への適用可能性, まとめ V サイクルにおける,1D-3D シミュレーションの使い分け ( 現状 ) 1D 機能的表現 企画 & 初期設計 詳細 3D 形状情報の無い段階 1D 1D 空気流れ計算精度に限度
