i 2017 年度卒業論文 OpenPose を用いた複数ダンサーの動作同期評価 Evaluation of Action Synchronization for Multiple Dancers Using OpenPose 指導教員渡辺裕教授 早稲田大学基幹理工学部情報通信学科 1w142044

Similar documents
画像類似度測定の初歩的な手法の検証

姿勢分析 姿勢分析 お名前 北原有希様 体重 45.0 kg 運動レベル 中 生年月日 1977 年 9 月 18 日 身長 cm オレンジ色の項目は 優先度の高い項目です 最適な状態にするための姿勢矯正プログラムが提供されます 頭が前に 18.3 出ています / 前に 2.9 cm 傾

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Gatlin(8) 図 1 ガトリン選手のランニングフォーム Gatlin(7) 解析の特殊な事情このビデオ画像からフレームごとの静止画像を取り出して保存してあるハードディスクから 今回解析するための小画像を切り出し ランニングフォーム解析ソフト runa.exe に取り込んで 座標を読み込み この

D Dominant Region Determination Using Voronoi Diagram 1W

斉藤雅記_藤田かおり.indd

目次 研究題目 研究の背景 目的 先行研究 課題と解決策 システムの構成 評価実験と考察 まとめ

第五節展翅飛翔 ( ザンチーフェイシン ) - 翼を広げて飛ぶ - 準備姿勢両腕は自然に体の両側に垂らす 1 両腕の肘を曲げて体の後へ引き 側面を経て引き上げ 羽を広げる状態にする 両掌は下に垂らし 手の甲を相対させる 目は左肘を見る 2 両肘をおろし 両手を顔の前で向かい合わせゆっくりおろす 準備

コンピュータグラフィックス第8回

1307migitaDicomo.pptx

補足 中学で学習したフレミング左手の法則 ( 電 磁 力 ) と関連付けると覚えやすい 電磁力は電流と磁界の外積で表される 力 F 磁 電磁力 F li 右ねじの回転の向き電 li ( l は導線の長さ ) 補足 有向線分とベクトル有向線分 : 矢印の位

スライド 1

論文誌用MS-Wordテンプレートファイル

PowerPoint プレゼンテーション

図 5 一次微分 図 6 コントラスト変化に伴う微分プロファイルの変化 価し, 合否判定を行う. 3. エッジ検出の原理ここでは, 一般的なエッジ検出の処理内容と, それぞれの処理におけるパラメータについて述べる. 3.1 濃度投影検出線と直交する方向に各画素をスキャンし, その濃度平均値を検出線上

データ解析

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

スライド 1

θ T [N] φ T os φ mg T sin φ mg tn φ T sin φ mg tn φ θ 0 sin θ tn θ θ sin φ tn φ φ θ φ mg θ f J mg f π J mg π J J 4π f mg 4π f () () /8

円筒面で利用可能なARマーカ

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

スライド 1

Microsoft Word - thesis.doc

isai indd

ギター初心者のための 演奏練習支援システム 日本大学文理学部 情報科学科 B4 宇田川 真唯 1

Microsoft Word - 卒業論文.doc

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと


<4D F736F F F696E74202D20836F CC8A C58B858B4F93B982A882E682D1978E89BA814091B28BC68CA48B E >

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

研究背景 センサなどによって観測される情報の多くは時系列列データ たくさんの時系列列データの中から有益な情報を取得し その内容を理理解する 手法の開発が重要 取得された情報をより抽象度度の 高いレベルで表現 時系列列データの振る舞いを 言語で説明する 手法の開発 HandRight_x HandRi

アンカー TRX サスペンショントレーナーの設置箇所 フットクレードル ハンドルの下のわっかの部分 かかとやつま先をいれるときなどに使う 5 TRXフロントスクワット 45 7 TRXクロスバランスランジ アンカー に向かって立ち 肘を肩の真下に位 置して 腕を曲げ る ストラップを ぴんと張る 左

Microsoft PowerPoint - 9.pptx

計算機シミュレーション

体組成計BC-108/BC-118E用 RS-232C出力説明書

vecrot

Microsoft PowerPoint - 9.pptx

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Visual班

Microsoft Word - 断面諸量

PowerPoint Presentation

Microsoft PowerPoint - pr_12_template-bs.pptx

コンピュータグラフィックス第6回

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2015-UBI-47 No.13 Vol.2015-ASD-2 No /7/28 ノード間通信とノード間相対距離情報を用いたノード位置推定手法 角間共訓 秋田純一 金沢大学自然科学研究科電子情報科学専攻

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - ip02_01.ppt [互換モード]

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

目次.Edu Track のログイン.Edu Track のポータル画面説明 3. 学修を始める ( 講義室に入る ) 4 4. テキスト履修科目 スクーリング ( ブレンディッド含む ) で使用する機能 5 学習する 5 お知らせ 6 掲示板 ( 公開 ) 6 課題 8 ディスカッション ( 公開

スライド 1

<4D F736F F D208D5C91A297CD8A7793FC96E591E631308FCD2E646F63>

学術情報基盤オープンフォーラム 2019 クラウド活用最新事例 クラウドと Jupyter Notebook を使ったプログラミング教育 2019 年 5 月 29 日 室蘭工業大学桑田喜隆


測量試補 重要事項

Microsoft Word - 微分入門.doc

粒子画像流速測定法を用いた室内流速測定法に関する研究

Microsoft Word - 博士論文概要.docx

DVIOUT-17syoze

テレコンバージョンレンズの原理 ( リアコンバーター ) レンズの焦点距離を伸ばす方法として テレコンバージョンレンズ ( テレコンバーター ; 略して テレコン ) を入れる方法があります これには二つのタイプがあって 一つはレンズとカメラ本体の間に入れるタイプ ( リアコンバーター ) もう一つ

京都大学博士 ( 工学 ) 氏名宮口克一 論文題目 塩素固定化材を用いた断面修復材と犠牲陽極材を併用した断面修復工法の鉄筋防食性能に関する研究 ( 論文内容の要旨 ) 本論文は, 塩害を受けたコンクリート構造物の対策として一般的な対策のひとつである, 断面修復工法を検討の対象とし, その耐久性をより

社員証型センサを いた 健康増進システムへの STAMP/STPA の適 検討 林良輔 * 伊藤信 梶克彦 内藤克浩 水野忠則 中條直也 * 愛知工業大学大学院 三菱電機エンジニアリング 愛知工業大学 1

Autodesk Inventor Skill Builders Autodesk Inventor 2010 構造解析の精度改良 メッシュリファインメントによる収束計算 予想作業時間:15 分 対象のバージョン:Inventor 2010 もしくはそれ以降のバージョン シミュレーションを設定する際

平成 27 年度 ICT とくしま創造戦略 重点戦略の推進に向けた調査 研究事業 アクティブラーニングを支援する ユーザインターフェースシステムの開発 ( 報告書 ) 平成 28 年 1 月 国立高等専門学校機構阿南工業高等専門学校

第 4 週コンボリューションその 2, 正弦波による分解 教科書 p. 16~ 目標コンボリューションの演習. 正弦波による信号の分解の考え方の理解. 正弦波の複素表現を学ぶ. 演習問題 問 1. 以下の図にならって,1 と 2 の δ 関数を図示せよ δ (t) 2

Chap2.key

Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students A Dissertation Submitted t

目次 1 画像 図表番号 画像を挿入する 挿入した画像を動かす 画像の不要な部分をカット ( トリミング ) する Excel で作成したグラフを挿入する 図表番号を挿入する 引用文献... 9

連続講座 断層映像法の基礎第 34 回 : 篠原 広行 他 放射状に 線を照射し 対面に検出器の列を置いておき 一度に 1 つの角度データを取得する 後は全体を 1 回転しながら次々と角度データを取得することで計測を終了する この計測で得られる投影はとなる ここで l はファンビームのファンに沿った

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

ユーザーの習熟度に合わせた 初心者向けダンス学習支援システム Dance Training Support System for Beginners that Adapts to User s Dance Skill 北原研究室 西脇絵里子 小野澤理紗

ÿþŸb8bn0irt

布に従う しかし サイコロが均質でなく偏っていて の出る確率がひとつひとつ異なっているならば 二項分布でなくなる そこで このような場合に の出る確率が同じであるサイコロをもっている対象者をひとつのグループにまとめてしまえば このグループの中では回数分布は二項分布になる 全グループの合計の分布を求め

Microsoft PowerPoint - 口頭発表_折り畳み自転車

断面の諸量

コンピュータグラフィックス演習 I 2012 年 5 月 21 日 ( 月 )5 限 担当 : 桐村喬 第 7 回モデリングの仕上げ 1 カメラワークとアニメーション 今日の内容 1. カメラワーク 2. シーンの設定 3. アニメーション 前回のテクスチャの紹介 1 / 10

加振装置の性能に関する検証方法 Verification Method of Vibratory Apparatus DC-X デジタルカメラの手ぶれ補正効果に関する測定方法および表記方法 ( 光学式 ) 発行 一般社団法人カメラ映像機器工業会 Camera & Imaging Pr

IPSJ SIG Technical Report Vol.2015-CVIM-196 No /3/6 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swi

pp2018-pp9base

Microsoft Word - 卒論レジュメ_最終_.doc

航空機の運動方程式

コンピュータグラフィックス基礎              No

数値計算法

研究計画書

自主演習履修の手引き 自主演習とは 履修手引きには 個々の演習の内容は, 学生自らがその目標, 計画を設定する. とあります. 学生自身が学習内容を決める科目です. 自主演習の履修手順 1. 演習内容の企画 どのような演習を行いたいのか企画してください. 演習のテーマを決定してください. 必要に応じ

(a) (b) 2 2 (Bosch, IR Illuminator 850 nm, UFLED30-8BD) ( 7[m] 6[m]) 3 (PointGrey Research Inc.Grasshopper2 M/C) Hz (a) (b

i

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

WISS PowerPoint [3] [16] Mehrabian [10] 7% 93% [10] [19][18] Hindus [7] Lyons [9] [8] [14] TalkMan [4] [5] [6] 3 [19][18] [19] [19] 1 F0 [11] 7

Microsoft Word - 頻度解析プログラム概要

Microsoft PowerPoint - 構造力学Ⅰ第03回.pptx

Copyrig ht 著作権所有 2015 Colasoft LLC. すべての権利を留保する 本書の内容は 予告なしに変更されることがあります 本書の全ての内容は Colasoft の書面による明確な許可無しに いずれの目的のためにも 複写を含む電子または機械によるいかなる形式または手段によっても

Microsoft PowerPoint - statistics pptx

目 次 タイトルの作成... 1 新しいスライドを作成... 1 画像の挿入... 2 テキストボックスの挿入... 4 練習問題 表の挿入... 7 グラフの挿入... 8 図形の挿入... 9 テーマの設定 アニメーションの設定 グラフの系列別のアニメーショ

eラーニング講習マニュアル

3 数値解の特性 3.1 CFL 条件 を 前の章では 波動方程式 f x= x0 = f x= x0 t f c x f =0 [1] c f 0 x= x 0 x 0 f x= x0 x 2 x 2 t [2] のように差分化して数値解を求めた ここでは このようにして得られた数値解の性質を 考

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

測量士補 重要事項「標準偏差」

Transcription:

学科名 Department 研究指導 Research guidance 研究題目 Title 情報通信 オーディオビジュアル情報処理研究 卒業論文概要書 Summary of Bachelor s Thesis (2018/1/30) 氏名 Name 学籍番号 Student ID number 稲田健太郎 1w142044-6 CD 指導教員 Advisor 渡辺裕 OpenPose を用いた複数人のダンスの一致度評価 Coincidence evaluation of multiple people's dance using OpenPose 1. まえがきモーションキャプチャやセンサを用いた動作解析では, 複数台のカメラやマーカ センサの準備が必要になる. 複数台のカメラやセンサの前でしか動作解析ができない欠点がある. しかし,OpenPose はすでに撮影された動画で解析が行えるため, 多人数の同時動作解析に適用できる. また,2012 年度からそれまで選択であった中学校での体育授業のダンス科目が必修化された [1]. ダンスがより身近なものとなり, 複数人で踊る様子を撮影し公開する人も少なくない. そこで, 特別な機具を持たない人が練習で利用できるダンスの評価指標が望まれている. 本研究では,OpenPose の入力として複数人が同様のダンスをしている定点カメラ動画を利用する. ダンス動作のタイミングの一致度の評価をする手法を提案する. 2.OpenPose OpenPose は, 単一画像から複数の人間の体や顔のキーポイントをリアルタイムに検出することができる機械学習型動作解析処理である.Convolution Neural Network を用いて, 画像に映る人物の肩 肘 目など 18 点の位置推定を行う [2]. 動画を入力すると, 全フレームに対して人物の姿勢推定を行う. 各キーポイントにマークを付け, マーク間を線で結び人体モデルを表示する. また, フレームごとに映るすべての人物の各点座標のデータセットを同一ファイルで取得できる. 3. 評価手法 OpenPose から得られた各キーポイントの座標のフレームに対する座標の変化の極値を求める. 各人物の座標のピークから動作の一致度を評価する 2 つの手法を提案する. 動作のタイミングのずれの許容フレームを KK フレームとする. 動画内の人物の過半数が KK フレーム間にピークを持つときを正解の動作とする. 手法 1 は,KK フレーム間に過半数の人物がピークを持つ場合に動作の一致度の評価を行う.KK フレーム間にピークを持つ場合を正解とし, ピークを持たない場合を不正解とする. これにより, 各人物の各キーポイントでの正解数と不正解数を求める. 動画内の各人物の正解数と不正解数にばらつきがある場合, 全員の動作の一致度が低いと考えられる. 手法 2 は, 手法 1 の評価に加えて,KK フレーム間にピークを持つ人物が過半数に満たない場合も評価を行う. このときの過半数に満たない人物がピークを持つ回数は, 評価対象者のダンスの習熟度に依存する. 4. 実験結果 5 人のアイドルグループがダンスする動画のうち,5 人は移動せず同じ順番で並び同じダンスをする一部分を使用した. タイミングのずれの許容フレーム数である KK を 3 と設定した.5 人の各キーポイントでの正解数と不正解数から, 正解率を求めた. その結果から, 各人物の動作の一致度を数値に評価できた. また, 各人物の正解率が高くないため, 全員のダンス熟練度は高くないと考えられる. また,3 フレーム間にピークを持つ人物が過半数に満たない回数を求めた. この回数から, 各人物の見直すべき回数がわかる. 5. まとめ本研究では, 複数人が同様のダンスを行う動画内の各人物の動作のタイミングの一致度を OpenPose により数値で評価する研究を行った. 動画内の人物の過半数が KK フレーム間にピークを持つときを正解の動作とすることで, 各人物が正解の動作をした回数と正解の動作をしなかった回数から, 正解率を求めた. 各人物の一致度を数値で評価できることを示した. また, 各人物の正解数 不正解数と KK フレーム間に動画内の過半数に満たない人物がピークを持つ回数から, 評価対象者のダンスの習熟度の評価も行った. しかし, 実際に動画を見た人による主観評価と数値の関係が不透明なため, 動画の主観評価を実験する必要がある. また, 習熟度と各人物の正解率を評価する方法を検討する必要がある. 参考文献 [1] 文部科学省, 新学習指導要領に基づく中学校向け ダンス リーフレット, http://www.mext.go.jp/a_menu/sports/jyujitsu/1306098.htm, May,2011 [2] Z.Cao,T.Simon,S-E Wei,Y.Sheikh, Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields, https://arxiv.org/abs/1611.08050,2016 印 Seal

i 2017 年度卒業論文 OpenPose を用いた複数ダンサーの動作同期評価 Evaluation of Action Synchronization for Multiple Dancers Using OpenPose 指導教員渡辺裕教授 早稲田大学基幹理工学部情報通信学科 1w142044-6 稲田健太郎 i

ii 目次 第 1 章 序論... 1 1.1 研究の背景... 1 1.2 関連研究... 1 1.3 研究の目的... 1 1.4 論文の構成... 2 第 2 章 OpenPose について... 3 2.1 まえがき... 3 2.2 OpenPose の概要... 3 2.3 利点と課題... 4 第 3 章 提案手法... 6 3.1 まえがき... 6 3.2 データ整形... 6 3.3 角度による評価... 6 3.4 座標による評価... 7 3.4.1 ピーク検出... 7 3.4.2 採点手法... 8 第 4 章 実験結果と考察... 10 4.1 複数人数のダンス映像... 10 4.2 実験結果... 10 4.2.1 手法 1... 12 4.2.2 手法 2... 13 4.3 考察... 15 第 5 章 結論... 17 5.1 まとめ... 17 5.2 課題... 17 謝辞... 18 参考文献... 19 図一覧... 20 表一覧... 20 研究業績... 22 ii

1 第 1 章 序論 1.1 研究の背景 前期中等教育の体育授業では, それまで選択性だったダンス科目が 2012 年度から必修化された [1]. また, 身近なコンテンツであるアイドルグループやアーティストが簡単なダンスを踊りながら歌うことが多くなっている. そのダンスが流行となり, 複数人数で踊る様子をスマートフォンなどで動画に撮り 踊ってみた動画 と名付けて YouTube などの動画サイトにアップロードする人が増加している. それらの動画の視聴者は, 動きのキレやかわいらしさなどといった様々な尺度でダンスの評価する. 以上のことから, 若い世代にとってダンスとは, テレビ等で見るものから実際に自分たちが踊るものおよび他人に評価されるものに変化している. 複数人数のダンスを動画に撮り, それを元に各人物の採点をすることができれば, ダンスの練習時に一つの指標となり得る. 1.2 関連研究 複数人動画像からの異常検出の関連研究として, 南里ら [2] は動画像から立体高次局所自己相関特徴を用いた異常動作検出の手法を提案している. この手法では, 背景と検出対象者を分離するために二値化した時間差分画像を用いる. まず, 歩く を通常の動作として, 特徴ベクトルを学習させる. もし 転ぶ 走る という動作をする人物がいる場合, 学習したベクトルとは異なるベクトルが加わることを利用して, 異常を検出している. しかし, 複数人数が同一画像に映っている場合に異常者がいるかどうかのみを判断しており, その人物の検出までは行っていない. また, 歩く と 転ぶ という大きく動作に差がある場合のみであり, ダンスなど細かい動作には対応していない. 1.3 研究の目的 動画から複数人数の動作を採点することができれば, 客観的に動作を見直しダンスの練習に利用できる. つまり, 指導者がいない素人のみの集団でも, 複数人数でダンスを揃えることが容易になる. そこで, 本研究では各人物の動作のタイミングが周りの人物とどれだけ揃っているかを数値で評価することを目的とする.

2 1.4 論文の構成 以下に本章以降の構成を示す. 第 1 章は本章であり, 本論文の研究の背景および目的について述べている. また, 関連研究について述べている. 第 2 章では,OpenPose の概要および本研究における OpenPose の利点と課題について説明する. 第 3 章では, 動画内に映る人物の採点方法を提案する. 第 4 章では, 第 3 章で述べた提案手法における実験および結果について示す. 第 5 章では, 本研究のまとめと今後の課題を示す.

3 第 2 章 OpenPose について 2.1 まえがき 本章では, 本論文で用いる OpenPose について述べる.OpenPose は Zhe ら [3] により提案された機械学習ベースの画像内の人物の身体のパーツ位置推定の手法であり,GitHub から無償公開されている人物の姿勢推定解析処理である. 2.2 OpenPose の概要 OpenPose とは, 単一画像から複数の人間の身体や顔のキーポイントをリアルタイムに検出することができる機械学習型動作解析処理である [3].Convolution Neural Network を用いて, 画像に映る人物の肩や肘など 18 点の位置推定を行う. 画像を入力すると, 画像から検出した各点にマークとマーク間を線で結び人体モデルを表示した出力画像を得られる. また, 各点の座標データを JSON,XML,YML 形式の出力ファイルとして得られる. なお, 検出できないキーポイントの座標データは,xx 座標とyy 座標ともに 0 となる. 図 2.1 を入力画像とした場合, 図 2.2 のような出力画像になる. 図 2. 1 入力画像 [4]

4 図 2. 2 出力画像 [4] また,OpenPose は画像だけでなく動画に対しても利用可能である. 動画を入力した場合, 動画の各フレームに対して人物の姿勢推定を行い, 座標データをフレームごとに別ファイルで出力される. 2.3 利点と課題 人物の動作解析では OpenPose 以外にモーションキャプチャやレーザーセンサを用いた手法がある. モーションキャプチャとは, マーカを取り付けた計測対象を複数台のカメラで撮影し, 人物の動作を計測するアプローチである. スポーツ分野での人物の動作データの収集だけでなく, 映画やゲームにおける CG で作成されたキャラクターの動作の再現にも使用されている. レーザーセンサを用いた動作解析は, 対象物に向けて当てたレーザーが反射して戻るまでの時間から距離を測定し, 人物の動作を 3D で捕らえることができる. モーションキャプチャとは違いマーカを付ける必要がないため, 人物の動作を制限しない. これらの方法では複数台のカメラ マーカまたはレーザーセンサが必要となる. また, 解析が撮影時にカメラやセンサの前でしか行えない. 一方で,OpenPose はウェブカメラで撮影された動画や録画されている動画に対してキーポイントの位置推定が行える.

5 このため, 特別な機器が必要ない上に撮影場所が自由である. よって, 他の動作解析方法より多くの人物の解析に利用できる OpenPose による動作解析が, 本研究に適している. しかし, 画像内で人物同士や人物と物が重なると誤検出が多くなる. すべてのキーポイントを検出できない場合や, ある検出人物と重なる人物の身体の一部を検出人物の身体の一部だと誤って検出してしまう場合がある. 人物と物が重なりすべてのキーポイントを検出できない例を図 2.3 に示す. 図 2. 3 誤検出の例 [4]

6 第 3 章 提案手法 3.1 まえがき 本章では,OpenPose を用いて, 複数人が同様のダンスをしている定点カメラ動画における動作のタイミング一致度の評価をする手法を提案する.3.2-3.4 において, 処理の詳細について述べる. 本研究では,OpenPose により得られた 18 点の座標データのうち, 首 両肩 両肘 両手首 両腰 両膝 両足首の 13 点を処理対象とする. 3.2 データ整形 得られた複数人の座標データから人物を推定する. 動画内で人物の立ち位置が変わらない場合, 各人物の首のxx 座標に大きな変化がない. これにより, 首のxx 座標を 1 フレーム前の各人物の首のxx 座標と比較することで人物を推定できる.1 フレーム前の各人物の首のxx 座標との差が最も小さい座標データをその人物になる. また, 座標データが欠損している場合は, 前後フレームの座標データを参照する. 欠損フレームの直前フレームの座標から直後フレームの座標まで一定に変化するものとして, 欠損フレームの座標データを決定する. 3.3 角度による評価 ある動作をしているときの腕や脚の角度は, 人物の身長や腕の長さに関わらず一定となることが多いと考えられる. したがって, 時系列における角度の増減量により, 動作の速さが確認できる. また, 時系列における角度変化の極値によりある動作から次の動作に変わるタイミングが確認できる. 動作の速さとタイミングから複数人の一致度が評価できる. そこで,3.2 で示したデータ整形で得られた座標から左右の首と肩と肘, 肩と肘と手首, 腰と膝と足首が成す 6 角を求め, その推移から一致度を評価する. 点 A,B,C の座標が与えられたとき, ABC を θ とする.BA から BC に回転する方向が左回りのならば,θ > 0と定義する. このとき,θ の大きさは式 (3.1) で与えられ, 回転方向は外積 BBBB BBBBの符号と等しくなる. θ = cos 1 BBBB BBBB (0 < θ < 180) (3.1) BBBB BBBB この手法では身体の向きの見え方が動画内の立ち位置により大きく変わる. 評価対象全

7 員がカメラに対して正面を向いている時は, 動画内での身体の向きの見え方が等しい. しかし, カメラに対して少しでも左右に向くと腕や脚の角度に影響を及ぼすため, 角度の極値が正確ではなく評価ができない. 身体の向きを変える動作はダンスでは一般的であるため, 本研究では角度による評価手法は有効ではないため, 使用しなかった. 3.4 座標による評価 角度とは違い, 身長や腕の長さは人物によって座標の増減量が異なる. そのため, 座標の増減量から動作の評価はできない. しかし, 複数人がある同じ動作をするとき, 身長や腕の長さに関わらず同時に時系列における座標変化の極値が生じる. その極値はある動作から次の動作に変わる瞬間であるため, そのタイミングで動作の評価が可能となる. 座標変化の極値のタイミングは, 動画内の立ち位置と身体の向きによる影響がない. そこで本研究では, 身体の向きが変わる動作にも有効である座標変化の極値による評価手法を採用する. 3.4.1 ピーク検出 座標の増減から動作の開始と終了のタイミングを判断するためピークを求める. フレームに対する座標の変化の波形の中で, 極大値と極小値を求める.13 点のキーポイントのxx 座標とyy 座標の合計 26 個の要素に対して行う. あるピークに対して, 直前のピークのフレームをピーク開始点とする. 動画内の任意の人物とキーポイントに対して,nnフレーム目の座標をXX nn (nn = 1,2,3,, NN) と,mm 個目のピークのフレームをPPPP mm (mm = 1,2,3,, MM) とする. 式 (3.3) を満たすときPPPP mm = nnとなる. また, フレームに対する座標変化のグラフの例を図 3.1 に示す. 図 3.1 のプロットされた点はピークを示し, そのフレームをPPPP mm となる. (XX nn XX nn 1 )(XX nn+1 XX nn ) < 0 (3.3) ここで,mm 個目とmm 1 個目のピークの座標の差をPPPP mm とした時, 式 (3.4) のようになる. XX PPPPmm XX 1 mm = 1 PPPP mm = XX PPPPmm XX PPPPmm 1 mm 1 (3.4) ピーク間の座標の差が小さいものは, 意図された動作ではないと仮定する. それらを解析対象から除去するために, ピーク間の座標差にしきい値を設定する. 動作が大きい肘と手首には, しきい値 TT 1 を設定し, その他のキーポイントにはTT 1 より小さいしきい値 TT 2 を設定した.

8 400 350 PF4 y 座標 [Pix] 300 250 200 150 PF1 PF2 PF3 PF5 100 50 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 フレーム 図 3. 1 座標変化の例 3.4.2 採点手法 各人物の座標のピークから動作の一致度を評価する二つの手法を提案する. ここで, 動作のタイミングのずれの許容フレーム数をKKフレームとする. 本研究では, 動画内の人物の過半数がKKフレーム間にピークを持つときを正解の動作とし, 動画内の人物に対して相対的な評価した. 各キーポイントのxx 座標とyy 座標で評価するだけでなく, 肩 肘 手首の合計を腕部分, 腰 膝 足首の合計を脚部分とし, それらでも評価する. 動画内での人物の過半数が一致している動作を正解とすることにより, ダンスごとの動作の正解モデルの準備は不要である. 3.4.2.1 手法 1 動画内の各人物の各キーポイントについて,KK フレーム間に過半数の人物がピークを持つ場合に動作の一致度を評価する. このとき, KKフレーム間にピークを持つ場合を正解とし, ピークを持たない場合を不正解とする. これにより, 各人物の各キーポイントでの正解数と不正解数を求め, 正解率を計算する. 結果より, 正解率が大きいほど, その人物が決められた動作をしていると考えられる. 一方で, 正解率が小さいほど, その人物が決められた動作をしていないと考えられる. また, 各人物の正解率の大きさにより, 評価対象者のダンス習熟度を評価する. ダンス熟練者の集団の場合, 全員が正確に決められた動作をしていると考えられる. つまり, 全員の不正解数が少ないため, 各人物の正解率が大きいと考えられる. しかし, ダンス初心者の集

9 団の場合, 決められた動作をしていない人物や周りとのタイミングが一致しない人物がい ると考えられる. このため, 各人物の正解率が小さいと考えられる. 3.4.2.2 手法 2 KKフレーム間にピークを持つ人物が過半数に満たない場合を評価する. このときの過半数に満たない人物がピークを持つ回数は, 評価対象者のダンスの習熟度に依存する. ダンス熟練者の集団の場合は, 全員が正確に踊れているため, この回数は小さいと考えられる. 一方, ダンス初心者の集団の場合は, 誤った動作をしていると考えられるため, この回数は大きいと考えられる.

10 第 4 章 実験結果と考察 4.1 複数人数のダンス映像 本研究では,5 人のアイドルグループがダンスする動画のうち,5 人は移動せず同じ順番で並び同じダンスをする一部分を使用した. この動画は 23fps の約 9 秒間で, 全フレーム数は 228 である. 人物を左から A,B,C,D,E とする. この動画の第 1 フレームの人体モデルを図 4.1 に示す. 図 4. 1 使用動画の第 1 フレーム 4.2 実験結果 実験では, 実験条件として表 4.1 に示すパラメータの値を使用した. 表 4. 1 実験条件 パラメータ 値 TT 1 10 TT 2 5 KK 3

11 3.4.2 の二つの手法でそれぞれ評価した. 動画全体での評価だけでは, 一つの振り付けに対しての動作の一致度がわからない. そのため, 第 115 フレームから第 150 フレームまでの手を大きく振る振り付けに対しても評価した. 得られた座標データのうち,5 人の右手首の y 座標の時系列における変化の様子を図 4.1 に示す. また, 第 115 フレームから第 150 フレームまでの 5 人の右手首の y 座標の時系列における変化の様子を図 4.2 に示す. 400 350 右手首 y 座標 [Pix] 300 250 200 150 100 50 0 人物 A 人物 B 人物 C 人物 D 人物 E 1 26 51 76 101 126 151 176 201 226 フレーム 図 4. 2 動画全体の 5 人の右手首 y 座標の変化 右手首 y 座標 [Pix] 380 360 340 320 300 280 260 240 220 人物 A 人物 B 人物 C 人物 D 人物 E 200 115 120 125 130 135 140 145 150 フレーム 図 4. 3 動画一部分の 5 人の右手首 y 座標の変化

12 4.2.1 手法 1 3.4.2.1 で述べた手法 1 による実験結果を示す. 動画全体での各キーポイントのxx 座標とyy 座標の合計の正解率を表 4.2 に, 左右の腕部分と脚部分と全身の正解率を表 4.3 に示す. また, 第 115 フレームから第 150 フレームまでの各キーポイントの合計の正解率を表 4.4 に, 左右の腕部分と脚部分と全身の合計の正解率を表 4.5 に示す. 表 4. 2 動画全体の各キーポイントの正解率 人物 A 人物 B 人物 C 人物 D 人物 E 首 53.2% 83.0% 72.3% 59.6% 66.0% 右肩 70.9% 65.5% 65.5% 58.2% 61.8% 右肘 72.1% 58.8% 60.3% 60.3% 60.3% 右手首 59.0% 60.7% 60.7% 54.1% 62.3% 左肩 45.8% 77.1% 66.7% 54.2% 75.0% 左肘 69.6% 62.5% 39.3% 60.7% 48.2% 左手首 71.6% 64.2% 47.8% 50.7% 56.7% 右腰 51.0% 71.4% 69.4% 59.2% 59.2% 右膝 78.9% 75.4% 47.4% 52.6% 45.6% 右足首 83.3% 71.4% 31.0% 61.9% 47.6% 左腰 65.9% 68.2% 70.5% 65.9% 52.3% 左膝 53.7% 66.7% 59.3% 51.9% 61.1% 左足首 66.7% 69.2% 38.5% 66.7% 56.4% 表 4. 3 動画全体の腕 脚部分と全身の正解率 人物 A 人物 B 人物 C 人物 D 人物 E 右腕 67.4% 61.4% 62.0% 57.6% 61.4% 左腕 63.7% 67.3% 50.3% 55.0% 59.1% 右脚 70.9% 73.0% 50.0% 57.4% 50.7% 左脚 61.3% 67.9% 56.9% 60.6% 56.9% 全身 65.1% 68.1% 56.2% 57.6% 57.9%

13 表 4. 4 動画一部分の各キーポイントの正解率 人物 A 人物 B 人物 C 人物 D 人物 E 首 40.0% 90.0% 50.0% 70.0% 30.0% 右肩 88.9% 88.9% 66.7% 77.8% 22.2% 右肘 57.1% 64.3% 57.1% 64.3% 64.3% 右手首 46.2% 53.8% 53.8% 53.8% 76.9% 左肩 22.2% 88.9% 55.6% 55.6% 77.8% 左肘 33.3% 77.8% 33.3% 100.0% 66.7% 左手首 70.0% 50.0% 60.0% 80.0% 50.0% 右腰 44.4% 44.4% 55.6% 77.8% 77.8% 右膝 90.9% 81.8% 45.5% 36.4% 27.3% 右足首 66.7% 83.3% 16.7% 50.0% 33.3% 左腰 60.0% 70.0% 40.0% 70.0% 70.0% 左膝 70.0% 60.0% 60.0% 60.0% 50.0% 左足首 50.0% 66.7% 66.7% 66.7% 50.0% 表 4. 5 動画一部分の腕 脚部分と全身の正解数と不正解数 人物 A 人物 B 人物 C 人物 D 人物 E 右腕 61.1% 66.7% 58.3% 63.9% 58.3% 左腕 42.9% 71.4% 50.0% 78.6% 64.3% 右脚 69.2% 69.2% 42.3% 53.8% 46.2% 左脚 61.5% 65.4% 53.8% 65.4% 57.7% 全身 57.1% 69.8% 51.6% 65.9% 54.8% 4.2.2 手法 2 3.4.2.2 で述べた手法 2 による実験結果を示す.3 フレーム間に 2 人がピークを持つ回数と 1 人しかピークを持たない回数を求めた. 動画全体の各キーポイントのそれぞれの回数を表 4.6 に, 左右の腕部分と脚部分と全身のそれぞれの回数を表 4.7 に示す. また, 第 115 フレームから第 150 フレームまでの各キーポイントのそれぞれの回数を表 4.8 に, 左右の腕部分と脚部分と全身のそれぞれの回数を表 4.9 に示す.

14 表 4. 6 動画全体の各キーポイントのピークの人数ごとの回数 人物 A 人物 B 人物 C 人物 D 人物 E 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 首 20 8 5 5 13 9 8 9 8 5 右肩 24 17 7 6 10 5 5 9 12 7 右肘 20 18 8 9 11 2 11 8 16 7 右手首 18 10 8 6 10 15 17 7 9 10 左肩 15 17 6 9 7 11 16 14 11 7 左肘 13 13 9 8 10 13 19 15 13 7 左手首 13 10 16 4 11 10 21 10 6 8 右腰 17 13 11 12 7 5 14 11 13 7 右膝 13 11 8 12 12 9 10 11 10 14 右足首 15 13 11 5 6 5 13 12 20 9 左腰 16 12 11 5 9 8 11 10 12 7 左膝 15 11 18 7 7 3 10 9 7 14 左足首 18 16 15 6 5 7 11 12 18 13 表 4. 7 動画全体の腕 脚部分のピークの人数ごとの回数 人物 A 人物 B 人物 C 人物 D 人物 E 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 右腕 62 45 23 21 31 22 33 24 37 24 左腕 41 40 31 21 28 34 56 39 30 22 右脚 45 37 30 29 25 19 37 34 43 30 左脚 49 39 44 18 21 18 32 31 37 34 全身 197 161 128 89 105 93 158 128 147 110

15 表 4. 8 動画一部分の各キーポイントのピークの人数ごとの回数 人物 A 人物 B 人物 C 人物 D 人物 E 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 首 6 1 2 0 2 2 0 0 1 1 右肩 9 1 1 0 1 0 1 1 3 2 右肘 3 4 1 3 0 1 0 0 1 2 右手首 3 3 0 0 0 2 1 0 1 1 左肩 1 4 1 3 1 1 1 1 0 1 左肘 3 3 0 0 4 2 3 2 2 3 左手首 3 3 0 1 1 3 1 1 2 2 右腰 2 2 1 2 1 2 2 1 1 1 右膝 4 1 1 1 1 2 1 3 1 3 右足首 4 6 0 3 0 0 2 2 4 3 左腰 3 2 1 0 1 2 1 1 4 1 左膝 2 0 2 0 0 0 3 0 3 0 左足首 3 3 1 1 0 1 2 1 3 2 表 4. 9 動画一部分の腕 脚部分のピークの人数ごとの回数 人物 A 人物 B 人物 C 人物 D 人物 E 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 1 人 2 人 右腕 15 8 2 3 1 3 2 1 5 5 左腕 7 10 1 4 6 6 5 4 4 6 右脚 10 9 2 6 2 4 5 6 6 7 左脚 8 5 4 1 1 3 6 2 10 3 全身 46 33 11 14 12 18 18 13 26 22 4.3 考察 表 4.2 から表 4.5 より, 動画全体と動画一部分における各人物の動作の正解率がわかる. 動画全体と動画一部分では, 正解率に違いがある. これは, ダンスの一つの振り付けの合計が動画全体の正解率となるからである. 動画一部分での正解率が大きい場合, その部分の動作は周りの人物と一致していることがわかる. 一方で, 動画一部分での正解率が

16 小さい場合, その部分の動作は周りの人物と一致していないため, 練習が必要であることがわかる. よって, 一つひとつの振り付けに注目して評価することで, 各人物の練習が必要な部分がわかる. また, 各人物の正解率が 60% 程度であるため,5 人はダンスが上手い集団ではないことが考えられる. 表 4.6 から表 4.9 より, 動画全体と動画一部分における許容フレームに 1 人と 2 人がピークを持つときの回数がわかる. この回数が多いとき, 周りの人物と違うタイミングで動作をしている場合と決められた動作をしていない場合が考えられる.

17 第 5 章 結論 5.1 まとめ 本研究では, 複数人が同様のダンスを行う動画を対象として, 各人物の動作のタイミングの一致度を評価した. まず,OpenPose から得られた各キーポイントの座標データからピークを求めた. 動画内の人物の過半数がKKフレーム間にピークを持つときを正解の動作とする. このとき, 各人物が正解の動作をした回数と正解の動作をしなかった回数を求め, 各人物の動作の正解率を示した. これにより, 各人物が決められた動作をしているかを評価した. また, 各人物の正解率の大きさにより, 評価対象者のダンス習熟度を評価した. 次に,KKフレーム間に動画内の過半数に満たない人物がピークを持つ回数を求めた. 5.2 課題 本研究では数値での評価はできたが, 実際に動画を見た人による主観評価と数値の関係が不透明なため, 動画の主観評価を含めた追加実験を行う必要がある. また, 各人物の手法 1 の結果により動画内の人物の習熟度を評価した. しかし, 習熟度と正解率の関係を評価する方法を検討する必要がある.

18 謝辞 本研究の実験環境を与えてくださり, 研究の方向性等の丁寧かつ熱心なご指導を頂いた渡辺教授に心から感謝いたします. 本研究のきっかけを与えてくださり, 様々なご提案を頂きました早稲田大学国際情報通信センターの石川孝明様に心から感謝いたします. 日頃から御意見やアドバイスをくださった研究室の皆様に御礼申し上げます. 最後に, 私をここまで育ててくださった家族に感謝いたします.

19 参考文献 [1] 文部科学省, 新学習指導要領に基づく中学校向け ダンス リーフレット, http://www.mext.go.jp/a_menu/sports/jyujitsu/1306098.htm,may,2011 [2] 南里卓也, 大津展之 : 複数人動画像からの異常動作検出, http://css.risk.tsukuba.ac.jp/kashin/papers/2-1/prmu04-nanri.pdf, [3] Z.Cao,T.Simon,S-E Wei,Y.Sheikh, Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields,https://arxiv.org/abs/1611.08050,2016. [4] GitHub, inc. CMU-Perceptual-Computing-Lab/openpose, https://github.com/cmu-perceptual-computing- Lab/openpose/blob/master/examples/media, 24,April,2017

20 図一覧 図 2. 1 入力画像 [4]... 3 図 2. 2 出力画像 [4]... 4 図 2. 3 誤検出の例 [4]... 5 図 4. 1 使用動画の第 1 フレーム... 10 図 4. 2 動画全体の 5 人の右手首 y 座標の変化... 11 図 4. 3 動画一部分の 5 人の右手首 y 座標の変化... 11

21 表一覧 表 4. 1 実験条件... 10 表 4. 2 動画全体の各キーポイントの正解率... 12 表 4. 3 動画全体の腕 脚部分と全身の正解率... 12 表 4. 4 動画一部分の各キーポイントの正解率... 13 表 4. 5 動画一部分の腕 脚部分と全身の正解数と不正解数... 13 表 4. 6 動画全体の各キーポイントのピークの人数ごとの回数... 14 表 4. 7 動画全体の腕 脚部分のピークの人数ごとの回数... 14 表 4. 8 動画一部分の各キーポイントのピークの人数ごとの回数... 15 表 4. 9 動画一部分の腕 脚部分のピークの人数ごとの回数... 15

22 研究業績 [1] 稲田, 石川, 渡辺, OpenPose を用いた複数人のダンスの一致度評価, 情報処理学会第 80 回全国大会,March,13.2018( 発表予定 )