SlideShare a Scribd company logo
1 of 29
CodeSLAM : Learning a Compact, Optimisable
Representation for Dense Visual SLAM
2018論文読み会
2018/07/12
相澤研究室 M1 金子 真也
1
Introduction
• Visual SLAM (Simultaneous Localization and Mapping)
– 映像からリアルタイムにカメラの軌跡を推定
(三次元地図作成:軌跡推定の手がかり)
LSD-SLAM [Engel+,2014]
2
Introduction
• vSLAMにおける地図の表現方法
Sparseな表現
(Feature-based)
Dense/Semi-Denseな表現
(Direct-based)
計算コスト 低
地図の密度 低
計算コスト 高
地図の密度 高
→三次元復元には使えず,
あくまで軌跡の推定がメイン
→三次元復元も
軌跡の推定もできる
3
Introduction
• vSLAMにおける地図の表現方法
計算コスト 低
地図の密度 低
→三次元復元には使えず,
あくまで軌跡の推定がメイン
→三次元復元も
軌跡の推定もできる
計算コストさえ抑える
ことができれば最高!
Sparseな表現
(Feature-based)
Dense/Semi-Denseな表現
(Direct-based)
計算コスト 高
地図の密度 高
4
Method
• DenseなSLAMにおいて計算コストをどう抑えるか?
– 三次元点群の特徴量化:点群それぞれを独立に三次元
復元するよりも計算コストが抑えられそう
<<<
最適化パラメータ数
コンパクトな特徴量 密な三次元点群
𝒄
𝑫(𝒄)
𝑫
1,440,000 次元
(600x800x3)
128 次元
5
Method
• Naïveな手法
– Variational Auto-Encoderで中間特徴量を抽出
[参考 : Variational Auto-Encoder]
𝑧~𝒩(0,1)
input output
中間特徴量
(ガウス分布のパラメータ)
特徴量空間をいじれば出力も変化
6
Method
• Naïveな手法
– Variational Auto-Encoderで中間特徴量を抽出
中間特徴量
(ガウス分布のパラメータ)
案外うまく復元できない
𝐷 𝐷
Code 𝒄
7
Method
• 提案手法
– 輝度画像𝐼をヒントに, 奥行き画像𝐷の復元
特徴量
𝐷 𝐷
𝐼
Code 𝒄
U-Net
8
Method
• Training
– 輝度画像𝐼と奥行き画像𝐷から再構成するように学習
特徴量
𝐷 𝐷
𝐼
Code 𝒄
train
U-Net
9
Method
• Training
– 輝度画像𝐼と奥行き画像𝐷から再構成するように学習
特徴量
𝐷 𝐷
𝐼 Uncertainty
輝度画像𝑰の特徴量は奥行き画像の
不確実な境界部分を表現
Code 𝒄
train
U-Net
10
Method
• Inference
– 輝度画像𝐼とcode 𝑐(未知)から 𝐷を予測する
特徴量
𝐷
𝐼 Uncertainty
inference
Code 𝒄
U-Net
11
Code Optimization
• code 𝑐を最適化することで奥行き 𝐷を最適化できる
• ステレオマッチングによる最適化
𝐷 = 𝐷(𝐼, 𝑐)
12
Code Optimization
• code 𝑐を最適化することで奥行き 𝐷を最適化できる
• ステレオマッチングによる最適化
1. 奥行き画像によって三次元点群を復元
𝐷 = 𝐷(𝐼, 𝑐)
画像 𝐼𝐴
逆投影 𝜋−1
𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
13
Code Optimization
• code 𝑐を最適化することで奥行き 𝐷を最適化できる
• ステレオマッチングによる最適化
2. 次の画像に三次元点群を投影
𝐷 = 𝐷(𝐼, 𝑐)
相対姿勢 T 𝐵
𝐴
= (𝑅 𝐵
𝐴
, 𝑡 𝐵
𝐴
)
画像 𝐼𝐴
画像 𝐼 𝐵
投影 𝜋−1
𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
14
Code Optimization
• code 𝑐を最適化することで奥行き 𝐷を最適化できる
• ステレオマッチングによる最適化
2. 投影誤差を最小化する奥行きと相対姿勢を求める
𝐷 = 𝐷(𝐼, 𝑐)
相対姿勢 T 𝐵
𝐴
= (𝑅 𝐵
𝐴
, 𝑡 𝐵
𝐴
)
投影誤差の最小化
画像 𝐼𝐴
画像 𝐼 𝐵
𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
15
Code Optimization
• 再投影誤差の最小化
– 画像Aから画像Bへの投影
– 再投影誤差
画像 𝐼𝐴
画像 𝐼 𝐵
投影誤差の最小化
逆投影 𝜋−1
投影 𝜋−1
𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
相対姿勢 T 𝐵
𝐴
= (𝑅 𝐵
𝐴
, 𝑡 𝐵
𝐴
)
16
Code Optimization
• 再投影誤差の最小化
– 画像Aから画像Bへの投影
– 再投影誤差
– 誤差の最小化
• ヤコビアンを計算, Gauss-Newton法で最小化
17
N-frame SfM
• N枚のSfMへの拡張
– 連続する2枚の画像で逐次的に最適化
𝑐 𝐴, 𝑐 𝐵, 𝑇𝐴, 𝑇𝐵 に依存
𝑐 𝐴, 𝑐 𝐵, 𝑇𝐴, 𝑇𝐵 に依存
18
Dataset
• SceneNet RGB-D [J.McCormac+, ICCV17]
– 屋内のCGデータセット
Image Depth Instance seg Semantic seg Optical Flow
19
Reconstruction result
• 復元結果
– かなりGTに近いDepth推定を行うことができている
GTReconstr.
20
Code size
• Code sizeを変化させた結果
ImageGTReconstr.
Size 2
21
Code size
• Code sizeを変化させた結果
Size 8
ImageGTReconstr.
22
Code size
• Code sizeを変化させた結果
Size 64
ImageGTReconstr.
23
Code size
• Code sizeを変化させた結果
Size 128
ImageGTReconstr.
24
Code size
• 128以上に増やしても性能の向上は見られなかった
25
5-frame SfM result
• SceneNet RGB-Dデータセットの結果
26
Real dataset result
• EuRoC [Burri+, IJRR16] データセット
– SceneNet RGB-Dデータセットで学習したのに復元
ができている
27
Video
28
まとめ
• 単眼画像群から密な三次元復元を効率的に行いたい
• 密な奥行き画像のコンパクトな特徴量表現を抽出し,
特徴量空間で最適化する面白い手法を提案
– 既存手法との比較は全くない…(勝てなかったか?)
• Feature-based vs Direct-basedだったvSLAMの新しい
形を提案することができた
– (現段階では5fps程度, 今後がんばる)

More Related Content

What's hot

SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向SSII
 
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAMSLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAMIwami Kazuya
 
オープンソース SLAM の分類
オープンソース SLAM の分類オープンソース SLAM の分類
オープンソース SLAM の分類Yoshitaka HARA
 
Visual-SLAM技術を利用した 果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した 果樹園の3次元圃場地図の作成Masahiro Tsukano
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII
 
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...Kazuyuki Miyazawa
 
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM邦洋 長谷川
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎yohei okawa
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code ReadingTakuya Minagawa
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話Yusuke Uchida
 
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会nonane
 
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)Tomohiro Motoda
 
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成MobileRoboticsResear
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイNaoya Chiba
 
Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由tancoro
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたTakuya Minagawa
 

What's hot (20)

Visual slam
Visual slamVisual slam
Visual slam
 
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
 
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAMSLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAM
 
オープンソース SLAM の分類
オープンソース SLAM の分類オープンソース SLAM の分類
オープンソース SLAM の分類
 
Visual-SLAM技術を利用した 果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した 果樹園の3次元圃場地図の作成
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
 
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
 
Structure from Motion
Structure from MotionStructure from Motion
Structure from Motion
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
 
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会
 
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
 
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由
 
G2o
G2oG2o
G2o
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
 

More from Masaya Kaneko

Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...Masaya Kaneko
 
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説Masaya Kaneko
 
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])Masaya Kaneko
 
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)Masaya Kaneko
 
Dynamic Routing Between Capsules
Dynamic Routing Between CapsulesDynamic Routing Between Capsules
Dynamic Routing Between CapsulesMasaya Kaneko
 
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)Masaya Kaneko
 
コンピュータ先端ガイド2巻3章勉強会(SVM)
コンピュータ先端ガイド2巻3章勉強会(SVM)コンピュータ先端ガイド2巻3章勉強会(SVM)
コンピュータ先端ガイド2巻3章勉強会(SVM)Masaya Kaneko
 

More from Masaya Kaneko (7)

Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
 
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
 
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
 
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
 
Dynamic Routing Between Capsules
Dynamic Routing Between CapsulesDynamic Routing Between Capsules
Dynamic Routing Between Capsules
 
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)
 
コンピュータ先端ガイド2巻3章勉強会(SVM)
コンピュータ先端ガイド2巻3章勉強会(SVM)コンピュータ先端ガイド2巻3章勉強会(SVM)
コンピュータ先端ガイド2巻3章勉強会(SVM)
 

論文読み会2018 (CodeSLAM)