61. 参考文献
60
• [1] Khurram Soomro and Amir Roshan Zamir. Action Recognition in Realistic Sports Videos, 2015
https://cs.stanford.edu/~amirz/index_files/Springer2015_action_chapter.pdf
• [2] Christian Ledig, et al. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network, 2016
https://arxiv.org/abs/1609.04802
• [3] Tero Karras (Tero Karras FI). Progressive Growing of GANs for Improved Quality, Stability, and Variation. 2017.
https://arxiv.org/pdf/1710.10196.pdf
• [4] Kunihiko Fukushima, Neocognitron: A Self-organizing Neural Network Model for a Mechanism of Pattern
Recognition Unaffected by Shift in Position, 1980
http://www.cs.princeton.edu/courses/archive/spr08/cos598B/Readings/Fukushima1980.pdf
• [5] Zhe Cao, et al. Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields, 2016
https://arxiv.org/pdf/1611.08050.pdf
• [6] Ching-Hang Chen et al. 3D Human Pose Estimation = 2D Pose Estimation + Matching. In CVPR, 2017.
http://openaccess.thecvf.com/content_cvpr_2017/papers/Chen_3D_Human_Pose_CVPR_2017_paper.pdf
• [7] Julieta Martinez et al. A simple yet effective baseline for 3d human pose estimation. In ICCV, 2017.
http://openaccess.thecvf.com/content_ICCV_2017/papers/Martinez_A_Simple_yet_ICCV_2017_paper.pdf
姿勢推定技術が話題になりはじめたのは、今からやく1年前で、
CVPR2017という国際的なカンファレンス、カーネギメロン大学が発表して、Realtime Multi Person Pose Estimationという論文が元になっています。
こちらの論文では、画像や映像に複数の人物が映っている状況においても、その各々のポーズ情報を、リアルタイムで、かつ高精度に検出する事ができる
というのを提唱しています。
また、正確な検出器を前提として考えた場合には、ある時刻tで検出された人と、次のフレーム時刻t+1で検出された人で対応付けを行う事で、同一人物判定ができます。
例えば、その場合、簡易に対応付けを実現する方法として、Intersection over Union (IoU) の結果を利用するというものが考えられます。
これは、各フレームで検出された人の矩形同士、各々の組みでIoUを求め、その値が大きいもの同士を同一の人物とします。
上の写真の例の場合は、aとcでIOUを求め、aとdでIOUを求め、大きい方が同一の人物であるとします。