Submit Search
Upload
論文読み会2018 (CodeSLAM)
•
Download as PPTX, PDF
•
6 likes
•
3,663 views
M
Masaya Kaneko
Follow
研究室内の論文読み会でCodeSLAM (CVPR2018; Honorable Mention) を発表した際の資料です
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 29
Download now
Recommended
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Masaya Kaneko
SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)
Masaya Kaneko
Direct Sparse Odometryの解説
Direct Sparse Odometryの解説
Masaya Kaneko
20190307 visualslam summary
20190307 visualslam summary
Takuya Minagawa
CNN-SLAMざっくり
CNN-SLAMざっくり
EndoYuuki
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
SLAM勉強会(PTAM)
SLAM勉強会(PTAM)
Masaya Kaneko
ORB-SLAMの手法解説
ORB-SLAMの手法解説
Masaya Kaneko
Recommended
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Masaya Kaneko
SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)
Masaya Kaneko
Direct Sparse Odometryの解説
Direct Sparse Odometryの解説
Masaya Kaneko
20190307 visualslam summary
20190307 visualslam summary
Takuya Minagawa
CNN-SLAMざっくり
CNN-SLAMざっくり
EndoYuuki
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
SLAM勉強会(PTAM)
SLAM勉強会(PTAM)
Masaya Kaneko
ORB-SLAMの手法解説
ORB-SLAMの手法解説
Masaya Kaneko
Visual slam
Visual slam
Takuya Minagawa
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAM
Iwami Kazuya
オープンソース SLAM の分類
オープンソース SLAM の分類
Yoshitaka HARA
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Masahiro Tsukano
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Kazuyuki Miyazawa
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM
邦洋 長谷川
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
yohei okawa
Structure from Motion
Structure from Motion
Ryutaro Yamauchi
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
Takuya Minagawa
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会
nonane
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
Tomohiro Motoda
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
MobileRoboticsResear
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由
tancoro
G2o
G2o
Fujimoto Keisuke
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
Takuya Minagawa
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Masaya Kaneko
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
Masaya Kaneko
More Related Content
What's hot
Visual slam
Visual slam
Takuya Minagawa
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAM
Iwami Kazuya
オープンソース SLAM の分類
オープンソース SLAM の分類
Yoshitaka HARA
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Masahiro Tsukano
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Kazuyuki Miyazawa
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM
邦洋 長谷川
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
yohei okawa
Structure from Motion
Structure from Motion
Ryutaro Yamauchi
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
Takuya Minagawa
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会
nonane
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
Tomohiro Motoda
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
MobileRoboticsResear
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由
tancoro
G2o
G2o
Fujimoto Keisuke
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
Takuya Minagawa
What's hot
(20)
Visual slam
Visual slam
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SSII2019企画: 画像および LiDAR を用いた自動走行に関する動向
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAM
オープンソース SLAM の分類
オープンソース SLAM の分類
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
Visual-SLAM技術を利用した果樹園の3次元圃場地図の作成
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
Structure from Motion
Structure from Motion
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由
G2o
G2o
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
More from Masaya Kaneko
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Masaya Kaneko
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
Masaya Kaneko
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
Masaya Kaneko
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Masaya Kaneko
Dynamic Routing Between Capsules
Dynamic Routing Between Capsules
Masaya Kaneko
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)
Masaya Kaneko
コンピュータ先端ガイド2巻3章勉強会(SVM)
コンピュータ先端ガイド2巻3章勉強会(SVM)
Masaya Kaneko
More from Masaya Kaneko
(7)
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry...
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
論文読み会@AIST (Deep Virtual Stereo Odometry [ECCV2018])
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Dynamic Routing Between Capsules
Dynamic Routing Between Capsules
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)
コンピュータ先端ガイド2巻3章勉強会(SVM)
コンピュータ先端ガイド2巻3章勉強会(SVM)
論文読み会2018 (CodeSLAM)
1.
CodeSLAM : Learning
a Compact, Optimisable Representation for Dense Visual SLAM 2018論文読み会 2018/07/12 相澤研究室 M1 金子 真也
2.
1 Introduction • Visual SLAM
(Simultaneous Localization and Mapping) – 映像からリアルタイムにカメラの軌跡を推定 (三次元地図作成:軌跡推定の手がかり) LSD-SLAM [Engel+,2014]
3.
2 Introduction • vSLAMにおける地図の表現方法 Sparseな表現 (Feature-based) Dense/Semi-Denseな表現 (Direct-based) 計算コスト 低 地図の密度
低 計算コスト 高 地図の密度 高 →三次元復元には使えず, あくまで軌跡の推定がメイン →三次元復元も 軌跡の推定もできる
4.
3 Introduction • vSLAMにおける地図の表現方法 計算コスト 低 地図の密度
低 →三次元復元には使えず, あくまで軌跡の推定がメイン →三次元復元も 軌跡の推定もできる 計算コストさえ抑える ことができれば最高! Sparseな表現 (Feature-based) Dense/Semi-Denseな表現 (Direct-based) 計算コスト 高 地図の密度 高
5.
4 Method • DenseなSLAMにおいて計算コストをどう抑えるか? – 三次元点群の特徴量化:点群それぞれを独立に三次元 復元するよりも計算コストが抑えられそう <<< 最適化パラメータ数 コンパクトな特徴量
密な三次元点群 𝒄 𝑫(𝒄) 𝑫 1,440,000 次元 (600x800x3) 128 次元
6.
5 Method • Naïveな手法 – Variational
Auto-Encoderで中間特徴量を抽出 [参考 : Variational Auto-Encoder] 𝑧~𝒩(0,1) input output 中間特徴量 (ガウス分布のパラメータ) 特徴量空間をいじれば出力も変化
7.
6 Method • Naïveな手法 – Variational
Auto-Encoderで中間特徴量を抽出 中間特徴量 (ガウス分布のパラメータ) 案外うまく復元できない 𝐷 𝐷 Code 𝒄
8.
7 Method • 提案手法 – 輝度画像𝐼をヒントに,
奥行き画像𝐷の復元 特徴量 𝐷 𝐷 𝐼 Code 𝒄 U-Net
9.
8 Method • Training – 輝度画像𝐼と奥行き画像𝐷から再構成するように学習 特徴量 𝐷
𝐷 𝐼 Code 𝒄 train U-Net
10.
9 Method • Training – 輝度画像𝐼と奥行き画像𝐷から再構成するように学習 特徴量 𝐷
𝐷 𝐼 Uncertainty 輝度画像𝑰の特徴量は奥行き画像の 不確実な境界部分を表現 Code 𝒄 train U-Net
11.
10 Method • Inference – 輝度画像𝐼とcode
𝑐(未知)から 𝐷を予測する 特徴量 𝐷 𝐼 Uncertainty inference Code 𝒄 U-Net
12.
11 Code Optimization • code
𝑐を最適化することで奥行き 𝐷を最適化できる • ステレオマッチングによる最適化 𝐷 = 𝐷(𝐼, 𝑐)
13.
12 Code Optimization • code
𝑐を最適化することで奥行き 𝐷を最適化できる • ステレオマッチングによる最適化 1. 奥行き画像によって三次元点群を復元 𝐷 = 𝐷(𝐼, 𝑐) 画像 𝐼𝐴 逆投影 𝜋−1 𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
14.
13 Code Optimization • code
𝑐を最適化することで奥行き 𝐷を最適化できる • ステレオマッチングによる最適化 2. 次の画像に三次元点群を投影 𝐷 = 𝐷(𝐼, 𝑐) 相対姿勢 T 𝐵 𝐴 = (𝑅 𝐵 𝐴 , 𝑡 𝐵 𝐴 ) 画像 𝐼𝐴 画像 𝐼 𝐵 投影 𝜋−1 𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
15.
14 Code Optimization • code
𝑐を最適化することで奥行き 𝐷を最適化できる • ステレオマッチングによる最適化 2. 投影誤差を最小化する奥行きと相対姿勢を求める 𝐷 = 𝐷(𝐼, 𝑐) 相対姿勢 T 𝐵 𝐴 = (𝑅 𝐵 𝐴 , 𝑡 𝐵 𝐴 ) 投影誤差の最小化 画像 𝐼𝐴 画像 𝐼 𝐵 𝐷𝐴(𝐼𝐴, 𝒄 𝑨)
16.
15 Code Optimization • 再投影誤差の最小化 –
画像Aから画像Bへの投影 – 再投影誤差 画像 𝐼𝐴 画像 𝐼 𝐵 投影誤差の最小化 逆投影 𝜋−1 投影 𝜋−1 𝐷𝐴(𝐼𝐴, 𝒄 𝑨) 相対姿勢 T 𝐵 𝐴 = (𝑅 𝐵 𝐴 , 𝑡 𝐵 𝐴 )
17.
16 Code Optimization • 再投影誤差の最小化 –
画像Aから画像Bへの投影 – 再投影誤差 – 誤差の最小化 • ヤコビアンを計算, Gauss-Newton法で最小化
18.
17 N-frame SfM • N枚のSfMへの拡張 –
連続する2枚の画像で逐次的に最適化 𝑐 𝐴, 𝑐 𝐵, 𝑇𝐴, 𝑇𝐵 に依存 𝑐 𝐴, 𝑐 𝐵, 𝑇𝐴, 𝑇𝐵 に依存
19.
18 Dataset • SceneNet RGB-D
[J.McCormac+, ICCV17] – 屋内のCGデータセット Image Depth Instance seg Semantic seg Optical Flow
20.
19 Reconstruction result • 復元結果 –
かなりGTに近いDepth推定を行うことができている GTReconstr.
21.
20 Code size • Code
sizeを変化させた結果 ImageGTReconstr. Size 2
22.
21 Code size • Code
sizeを変化させた結果 Size 8 ImageGTReconstr.
23.
22 Code size • Code
sizeを変化させた結果 Size 64 ImageGTReconstr.
24.
23 Code size • Code
sizeを変化させた結果 Size 128 ImageGTReconstr.
25.
24 Code size • 128以上に増やしても性能の向上は見られなかった
26.
25 5-frame SfM result •
SceneNet RGB-Dデータセットの結果
27.
26 Real dataset result •
EuRoC [Burri+, IJRR16] データセット – SceneNet RGB-Dデータセットで学習したのに復元 ができている
28.
27 Video
29.
28 まとめ • 単眼画像群から密な三次元復元を効率的に行いたい • 密な奥行き画像のコンパクトな特徴量表現を抽出し, 特徴量空間で最適化する面白い手法を提案 –
既存手法との比較は全くない…(勝てなかったか?) • Feature-based vs Direct-basedだったvSLAMの新しい 形を提案することができた – (現段階では5fps程度, 今後がんばる)
Download now