More Related Content Similar to End-to-end Recovery of Human Shape and Pose (14) End-to-end Recovery of Human Shape and Pose2. 書誌情報
• https://arxiv.org/abs/1712.06584
• 著者:Angjoo Kanazawa, Michael J. Black, David W. Jacobs, Jitendra
Malik
– University of California Berkeley, MPI for Intelligent Systems Tubingen Germany,
University of Maryland College Park
• 公開⽇:18 Dec 2017
• プロジェクトページ:https://akanazawa.github.io/hmr/
• デモビデオ:https://www.youtube.com/watch?v=bmMV9aJKa-c
2
3. アジェンダ
• Human Mesh Recovery(HMR)タスクとは
• ⽣成された3Dの真偽の識別器を導⼊した, end2endアーキテクチャ
– 論⽂の主張・ポイント
– 従来⼿法の問題点
– 提案⼿法
– 実験結果
3
4. Human Mesh Recovery (HMR) タスクとは
• 今回取り組むタスク
• (⼊⼒)単⼀のRGB画像 → (出⼒)⼈体の完全な3Dメッシュ
– こんな感じ
• 難しさ
– ⾃然な(in-the-wildな)画像の3D教師データ⽤意が⼤変(3D測定できるようにした特
殊な環境下で撮影されたものばかりで実⽤性△)
– 単視点だと、同じ⾒え⽅でも3Dのあり⽅は異なるものなどある.
– ⼈がどれくらいのスケールで写っているかわからない.
4
8. 提案⼿法:3D Body Representation
• ⼈体:Skinned Multi-Person Linear (SMPL) で表現
– Shape β ∈ R10 :主成分空間の10次元で表現. (height, weight, body proportions等)
– Pose θ ∈ R3K: K=23関節の3D回転度で表現. (各関節の変形度等)
• カメラ:
– 回転 R∈R3x3, 平⾏移動 t∈R2、スケール s∈R
• ⇛ 全て合わせて
• Θが与えられた時, ⼈ X(θ, β) は で投影され
る.
8
9. 提案⼿法:Iterative 3D Regression with Feedback
• Θを直接回帰で求めるのは難しいので, 残差計算し, Θを繰り返し更新する.
– 3D回帰モジュールの⼊⼒に, 画像特徴量Φと現在のパラメータΘtを受取り, 残差ΔΘtを
出⼒する
• 誤差
– 2Dの関節reprojection誤差
– 3Dのground truthデータがある時は, 以下の誤差関数を最⼩化
– Adversarial Loss(後述)により, 学習が⼈体3Dのマニフォールド上で進むように.
9
10. 提案⼿法:Factorized Adversarial Prior
• SMPLパラメータの真偽を判定する識別器.
• Shape, Poseそれぞれに対して独⽴に識別器を⽤意.
– Poseはさらに分解:
• 各関節回転毎に識別器を⽤意. ⇛ 各関節の⾓度の制約を学習できる.
• 全ての関節を⼊⼒にした, 全体観をチェックするような識別器も学習. ⇛ 全ての関節の回転⾓
を組み合わせた分布も学習
– ⇛ 識別器の⼊⼒が低次元になるため, 学習が安定する.
• 関節の制約に関する事前知識は⼊れない(先⾏研究とは異なる)
– 本⼿法では, 識別器によりデータドリブンに制約を学習.
• エンコーダ E に関する⽬的関数:
• 各識別器 Di の⽬的関数:
10
12. 実験結果:3D 関節位置推定
• データセット
– Human3.6M:研究環境で撮られた系の画像
– MPI-INF-3DHP:より多様なポーズ, ⼈の画像(in-the-wildにはまだ遠い)
• 評価指標
– Mean Per Joint Position Error (MPJPE)
– Reconstruction Error: 厳格なアライメントの後のMPJPE. グローバルミスアラインメ
ントを除いて, 再構成された3Dスケルトンの質を評価. (⼈体的にありえないけど、誤差
最⼩化するようなトリッキーな推定を排除したもの(と理解))
• Human 3.6M
12
13. 実験結果:3D 関節位置推定
• データセット:Human3.6M
13
Protocol2: 同じsubjectの訓練/テスト
セットを使⽤し, テストは前からのカメ
ラに限定
今回同様3Djoints+SMPLまで出⼒する既存⼿
法. 2Dkeypointsを⼊⼒にもつのは異なる.
本⼿法が⼤差で勝った.
Protocol1: 5subjects上で訓練して, 異
なる2subjects上でテスト.
今回同様関節位置のみならずキネマティックツ
リーにおける関節⾓も出⼒する既存⼿法. ただ
し, 事前知識として各関節の全27⾃由度しか与
えていない(本⼿法はshape含む85⾃由度)
また, 既存⼿法ではスケールと⾻の⻑さの仮定
を与えている.
3Djoints+αで出⼒している⼿法には勝ってい
て, 3Djointsのみのモデルとも良い勝負.
参考: http://vision.imar.ro/human3.6m/description.php
15. 実験結果:3D 関節位置推定
• データセット:MPI-INF-3DHP
– 室内、屋外で撮影されたもの. マーカを⽤いずにground truthを作成するので、
ground truthに⽐較的ノイズが含まれがち.
– 指標
• MPJPE
• Percentage of Correct Keypoints (PCK): threshold 150mm
• Area Under the Curve (AUC): PCKの閾値の範囲でのAUC
15
3Djoints専⽤の既存⼿法といい勝負.
After Rigid Alignmentでは上回る.
⇛ 既存⼿法では⼈体的な制約を無視し体歪ませて評価
値上げられるのに対して, 本⼿法のshape/poseの⽅が
より意味的に正しいということでは
17. 実験結果:Without paired 3D Supervision
• 関節位置推定, 3D再構築を⾏う既存⼿法では、3Dの教師データを必要とし
た.
• 本⼿法では、2D-to-3Dの対の教師データ無くとも、Adversarial Priorがあ
れば既存のタスク設定においても、精度が出ることを⽰した。
17
⾚が対データ無し
Adversarial priorが無いとぐちゃぐちゃに.(ただしそれでも2D誤差は低い)