5. Jun Xie, Martin Kiefel, Ming-Ting Sun, Andreas Geiger, “Semantic Instance Annotation of Street Scenes by 3D
to 2D Label Transfer”, in CVPR, 2016.
【4】
Keywords: Semantic Annotation, Segmentation
新規性・差分
手法
結果
概要
3次元環境のレーザーデータを入力として,2次元のシーンに対
してセマンティックなラベル付けを実行する.
・移動する自動車から撮影されたKITTIデータセットに対して,
地形的なアノテーションを施した.400kの画像や100kのレーザ
スキャンデータを用いて3次元アノテーションを実行する.
・3次元から2次元への転移を行い,Semantic Instance
Annotationを実行.ベースラインとの比較により,提案手法の
有効性を示した.
下図は提案手法のフレームワークを示す.レーザによりスキャンされた3次元環境
に対してのアノテーションが手に入っている状態(a)で,2次元空間への転移手法を
提案(b).その結果,3D=>2Dの転移を実現(c).ここでは3次元の疎なアノテーション
から2次元の正確なラベル付けを実現するためにNon-local Multi-field CRFを提案
する.
提案のCRFモデルのポテンシャルは下式で示される.Unary項であるφ^p(s_i)はピ
クセルごとのラベルs,φ^L(s_l)は3次元点群のラベルs,φ^F(s_i)はGeometricなポ
テンシャルを示す.Pairwise項であるΨ^P,P_ij(s_i,s_j)はGaussian edge kernelsを用
いたピクセル間の結合,Ψ^L,L_lk(s_l,s_k)は3次元位置や表面法線,Ψ^P,L(s_i,s_l)
は2D-3D間のポテンシャルを示す.
データはKITTIデータセットに存在するVelodyneセンサやGPSデータを用いる.点群
データに対してGPSからデータを付加する.3次元点群に対する意味付けは14種類
-- road, parking, sidewalk, terrain, building, vegetation, car, trailer, caravan, gate,
wall, fance, box and sky-- とした.下の表が最終的な結果であり,3次元点群から
の2次元ラベル推定の問題は非常に高精度なラベル付けが実行できることが判明
した.Full-Connect CRF [Krahenbuhl+, NIPS2011]と比較しても高い精度を実現.
Links
論文
http://arxiv.org/pdf/1511.03240v1.pdf
Full-Connect CRF
http://graphics.stanford.edu/projects/
densecrf/densecrf.pdf
6. Marius Cordts, Mohamed Omran, Sebastian Ramos, Timo Scharwachter, Markus Enzweiler, Rodrigo Benenson,
Uwe Franke, Stefan Roth, Bernt Schiele, “The Cityscapes Dataset”, in CVPRW, 2016.
【5】
Keywords: Dataset, Traffic, Semantic Segmentation
データセットの構成 概要
大規模かつ多様な都市の交通シーンにおいてセマンティックセ
グメンテーションや物体検出などのデータセットを提供する.
データは主にヨーロッパの50の都市においてアノテーションされ
た5,000枚(pixel-level),20,000枚(weakly-annotated)の画像で
構成される.
データセット中のアノテーションには,Ground (road, sidewalk), Human (person,
rider), Vehicle (car, truck, bus, on rails, motorcycle, bicycle, license plate),
Infrastructure (building, wall, fence, traffic sign, traffic light, pole, bridge, tunnel),
Nature (tree, terrain), Sky (sky), Void (ground, dynamic, static)が含まれる.
Links
論文
http://www.visinf.tu-darmstadt.de/media/
visinf/vi_papers/2015/cordts-cvprws.pdf
プロジェクト
https://www.cityscapes-dataset.com/
7. F. Perazzi, J. Pont-Tuset, B. McWilliams, L. Van Gool, M. Gross, A. Sorkine-Hornung, “A Benchmark Dataset
and Evaluation Methodology for Video Object Segmentation”, in CVPR, 2016.
【6】
Keywords: Segmentation
新規性・差分
概要
前景と背景を高精度に分離するセグメンテーション問題のため
の密なラベル付けデータセットであるDAVIS (Densely
Annotated VIdeo Segmentation)を提供する.
・問題は従来のセグメンテーションにのっとっているが,とにかく
密に(Dense)することで現在までの手法がどの程度できている
かを再度認識した.
・従来手法としては教師なし学習による手法 (NLC, FST, SAL,
TRC, MSG, CVOS),半教師あり学習による手法 (SEA, JMP,
TSP, HVS)をDAVISデータセットに対して実装し,表のような精
度を得た.
Links
論文
https://graphics.ethz.ch/~perazzif/davis/
files/davis.pdf
プロジェクト
https://graphics.ethz.ch/~perazzif/davis/
index.html
8. Qifeng Chen, Vladlen Koltun, “Full Flow: Optical Flow Estimation By Global Optimization over Regular Grids”, in
CVPR, 2016.
【7】
Keywords: Optical Flow Estimation, Full Flow, Markov Random Fields
新規性・差分
手法
結果
概要
Optical Flow Estimation における離散グリッド間マッピングス
ペースの計算処理を大幅に削減した最適化手法の提案
・変化の大きいシーンにおいて記述子を定義することなく実効
可
・計算処理が簡略化されており,少ないコードで実行可
本稿の手法の概要を述べる
(1)右図上に示すように,対象とする画素から近傍4画素分のオプティカルフローを
抽出するモデルを構築する.
(2)(1)は2次元のマルコフ確率場な
ので,メッセージパッシングアル
ゴリズムを構築し,計算処理の
簡略化,さらに処理を速くするた
めの改良を行う.
下図にMPI Sintelデータセットでの比較実験結果を示す.
提案手法は先行研究であるEpicFlow, TF+OFM, NNF-Local, PH-Flow, and Classic+NLよりも誤
差率が低く,十分な精度が出ている.
右図に定性的比較実験の結果を示す.
Links
論文
http://vladlen.info/
publications/full-flow-
optical-flow-estimation-
by-global-optimization-
over-regular-grids/