SlideShare a Scribd company logo
1 of 43
Download to read offline
Semantic Segmentationについて
ビジョン&ITラボ 皆川 卓也
自己紹介
2
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事
http://visitlab.jp
本資料について
 本資料は主に以下の2つのサーベイ論文を元に内容
をまとめました。
 Matin Thoma, “A Suvey of Semantic Segmentation”,
arXiv:1602.06541v2
 Hongyuan Zhu, Fanman Meng, Jianfei Cai, Shijian Lu, “Beyond
pixels: A comprehensive survey from bottom-up to semantic
image segmentation and cosegmentation”
 上記サーベイで紹介されている論文に対し、畳み込み
ニューラルネットワークを用いた手法を追記しました。
 本資料作成にあたり慶應義塾大学小篠裕子先生にご助
言いただきました。
Semantic Segmentationとは
 各画素がどの物体に属するのかを推定する技術
タスクの分類
A.クラス数
 大半が決まったクラス数によるもの。
 二値(前景/背景、street/それ以外)
 unsuperpisedな方法(クラス数可変)
 それ以外をvoid型として分類できるもの
B. 画素のクラス数
 ほとんどが1つの画素が1つのクラス
 1つの画素が複数のクラスに紐づくものもある
マルチレイヤ―の領域分割
タスクの分類
C. 入力データ
 色の有無
 デプス情報の有無
 1枚、ステレオ、Co-segmentation
 2D(画像) vs 3D(ボクセル)
D:オペレーション
 active (ロボット等)
 passive
interactive
automatic
データセット
 Semantic Segmentation用データセット
医療系
Cityscapes 30
5000(fine)
20000(coarse)
3(2040-2048) x (1016-1024)
LabelMe + SUN
SIFT-flow dataset
Stanford background dataset
NYU dataset
PASCAL Context dataset
Cityscapes
 概要
主にドイツの50の都市で取得したステレオカメラの画像シーケンス
に画素単位で30クラスのラベル付けを行った
 URL
https://www.cityscapes-dataset.com/
 ライセンス
アカデミックまたは非商用利用のみ
https://www.cityscapes-dataset.com/license/
 例:
Fine Coarse
KITTI Road
 概要
自動運転に関するビジョン用データセット/ベンチマークKITTIのうち道路、白線、お
よび走行レーン領域検出用データセット
 URL
http://www.cvlibs.net/datasets/kitti/eval_road.php
 ライセンス
Creative Commons Attribution-NonCommercial-ShareAlike 3.0
http://creativecommons.org/licenses/by-nc-sa/3.0/
非商用利用のみ。当データセットを用いた成果は同じラインセンスで提供する必
要
 例:
Lane Road
MSRC v2
 概要
Mircosoft Researchが提供している、鳥、車、体、顔、空、木、羊、犬、境
界付近、void等、23クラスをラベル付けしたデータセット
 URL
https://www.microsoft.com/en-us/research/project/image-
understanding/
 ライセンス
Microsoft Research Digital Image License Agreement
非商用利用のみ。
 例:
Pascal VOC
 概要
画像認識のコンペで使用されたデータセット。flickrの画像に対し人、車、犬、猫、
椅子、など20クラスのラベル付けがされている
 URL
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
 ライセンス
flickr term of useに従う
https://policies.yahoo.com/us/en/yahoo/terms/utos/index.htm
元々の権利は画像をflickrへアップロードした人にある。(どの写真を誰がアップ
ロードしたかのリストは入手可能)
 例:
object class
その他のデータセット
 LabelMe + SUN dataset
MITが公開しているLabelMeというアノテーション/ラベル付き画像
データのうち、SUNが515個のオブジェクトに対して付けた45,676枚の
Semantic Segmentation用サブセットデータ
21,182枚の屋内、24,494枚の屋外
画像枚数はオブジェクト毎に偏りがある
 SIFT-flow dataset
シーン解析用の2488枚の訓練画像、および200枚のテスト画像
33クラス
 Stanford background dataset
LabelMeやMSRC、PASCAL VOCからサンプリングした720枚の画像
農村、都市、港湾シーンに対して、8つのsemanticラベル(sky, tree,
road, grass, water, building, mountain, foreground)と幾何学的特性ラ
ベル(sky, vertical, horizontal)を付与
その他のデータセット
 NYU dataset
屋内をRGBカメラとデプスカメラ(Kinect)で撮影したビデオ動画に対し、
1449個の密なRGBとデプス間のラベルペアを作成
3都市で撮影した464個のシーンに対し、407,024枚のラベルなしフ
レーム
それぞれのオブジェクトにはクラス名とID(cup1, cup2, cup3, etc)
 Microsoft COCO
328K画像に対し91種類の物体クラス
 PASCAL Context dataset
PASCAL VOC2010データセットに対し、さらに520のクラスを追加し、全
部で540クラスのSemantic Segmentation用データセットを作成
10,103枚のtraining/validation用画像
評価指標
 Confusion Matrix
kクラスの識別問題で、クラス𝑖に属する画素が𝑗とラベル付けさ
れた数𝑛𝑖𝑗を求める。
 Pixel Wise Accuracy
正解画素の比率

1
𝑁
σ𝑖=0
𝑘
𝑛𝑖𝑖
 𝑁 = σ𝑖=0
𝑘
σ 𝑗=0
𝑘
𝑛𝑖𝑗
全画素数
Confusion matrixの例
評価指標
 Mean Accuracy
例えば空や地面のように大きな領域が画像中に存在した場合、
Pixel-Wise Accuracyはこれらの領域を大きく受ける。
クラスごとに個別に精度を求めて平均する。

1
𝑘
∙ σ𝑖=0
𝑘 𝑛 𝑖𝑖
𝑡 𝑖
 𝑡𝑖 = σ 𝑗=0
𝑘
𝑛𝑖𝑗
クラスiの正解画素数
 Mean Intersection over Union
クラスiに属する画素およびクラスiと判定された画素の総和
(Confusion Matrixの𝑛𝑖𝑖が属する行と列の和)と、クラスiに属して正し
くiと判定された画素の和の比

1
𝑘
∙ σ𝑖=0
𝑘 𝑛 𝑖𝑖
σ 𝑗=0
𝑘
𝑛 𝑖𝑗+𝑛 𝑗𝑖 −𝑛𝑖𝑖
評価指標
 Frequency Weighted Intersection over Union
Mean Intersection over Unionに対しクラスごとの正解画素数
で重みをつけたもの

1
𝑁
∙ σ𝑖=0
𝑘
𝑡𝑖 ∙
𝑛 𝑖𝑖
σ 𝑗=0
𝑘
𝑛 𝑖𝑗+𝑛 𝑗𝑖 −𝑛 𝑖𝑖
 F-measure
KITTIのような二値分類問題の場合の指標。
RecallとPrecisionの調和平均で、どちらの重みを置くかを
𝛽で決定する(ほとんどの場合𝛽 = 1)
 𝐹𝛽 = (1 + 𝛽)2 𝑡𝑝
1+𝛽2 ∙𝑡𝑝+𝛽2∙𝑓𝑛+𝑓𝑝
tp: true positive, fn: false negative, fp: false positive
Segmentationの流れ
Sliding Windowを用いた識別
Sliding Windowを用いた識別
 スライディングウィンドウで画像をスキャン
 ウィンドウ内の画像から特徴量を抽出
 特徴量を入力として、機械学習によりウィンドウ中心画素のラベルを学習/分類
×
特徴量
• Color
• HOG
• SIFT
• BoVW
• Neural Network
• etc
機械学習
• SVM
• Random Forest
• Neural Network
確率場によるPost-Processing
確率場によるPost-Processing
 画像の各画素をノードとし、隣接画素間にリンクを張ったグラフとみなす。
 真の画素のラベルを潜在変数y
 画像から取得した特徴量を観測変数x
 以下の2つの条件を元に潜在変数yを推定
各画素のラベルは観測変数x「だけ」を基にした推定と一致する確率が高い
隣り合う画素は同じような潜在変数を持つ確率が高い
潜在変数
観測変数
Markov Random Fields (MRF)
xとyの組み合わせ毎の確率分布を求める
𝑝 𝐱, 𝐲 ∝ exp −E 𝐱, 𝐲
E 𝐱, 𝐲 = ෍
𝑖=0
𝑛
𝜓 𝑢
𝑥𝑖, 𝑦𝑖 + ෍
𝑦 𝑖,𝑦 𝑗∈𝑁
𝜓𝑖𝑗
𝑑
𝑦𝑖, 𝑦𝑗
データ項
(画素ごとに独立して識別)
平滑化項
(隣り合うラベルが同じ)
Conditional Random Fields (CRF)
直接、観測xが与えられたときのyの条件付き確率を求める
𝑝 𝐲|𝐱 ∝ exp −E 𝐲; 𝐱
E 𝐲; 𝐱 = ෍
𝑖=0
𝑛
𝜓 𝑢
𝑦𝑖; 𝐱 + ෍
𝑦 𝑖,𝑦 𝑗∈𝑁
𝜓𝑖𝑗
𝑑
𝑦𝑖, 𝑦𝑗; 𝐱
データ項
(画素ごとに独立して識別)
平滑化項
(隣り合うラベルが同じ)
全画素の特徴量を基に推定
CRFを用いた例
CRFは認識対象クラスに関する知識をモデルの中に入れ込むこ
とが可能なため、 Semantic SegmentationではCRFを用いた手法
が性能的に良い。一方、SemanticでないSegmentationではMRF
が用いられることが多い。
 X.He, R. S. Zemel, M. A. Carreira-Perpinan, “Multiscale
Conditional Random Fields for Image Labeling”, CVPR2004
 J. Shotton, J. Winn, C. Rother, A. Criminisi, “TextonBoost for
Image Understanding: Multi-Class Object Recognition and
Segmentation by Jointly Modeling Texture, Layout, and
Context”, IJCV2009
 P. Krahenbuhl, V. Koltun, “Efficient Inference in Fully Connected
CRFs with Gaussian Edge Potentials”, NIPS2011
 P. Arbelaez, B. Hariharan, C. Gu, S. Gupta, L. D. Bourdev, J. Malik,
“Semantic Segmentation using Regions and Parts”, CVPR2012
(非CRF)
CRF for Image Labeling (He, et al., 2004)
 CRFをSemantic Segmentationへ適用した最初の論文
 ローカル特徴、全体特徴、ラベル間の位置関係を考慮し
たモデルを構築して最適化
TextonBoost (Shotton, et al., 2009)
 ソースコード
http://jamie.shotton.org/work/code.html (C#)
 各画素の周囲のテクスチャ(Texton)を元に画素のラベルを学
習(Joint Boost)することで物体のコンテクストを学習
 CRFを用いてテクスチャ、色、位置、エッジを考慮した学習
Fully Connected CRFs (Krahenbuhl and
Koltun, 2011)
 隣接画素だけでなく、全画素同士のペアを考慮したFully
Connected CRFsに対し効率的に学習させる方法を提案
 ソースコード
http://www.philkr.net/ (C++)
Semantic Segmentation using Regions and
Parts (Arbelaez, et al., 2012)
 一度ざっくりとした領域分割をして、各領域において多ク
ラスに対するスコアを算出し、それらを特徴として用いて,
ラベリングをしていく。
 CRFを用いず、各領域のスコアを統合して画素ごとのスコ
アを算出する。
SVM
Part Compatibility
Global Appearance
Semantic Contours
Geometrical properties
Multi Class
ニューラルネットワークによる手法
畳み込みニューラルネットワーク
 畳み込み層とプーリング層が交互に現れる
 畳み込み層: 各位置で学習した特徴との類似度を計算
 プーリング層: 位置ずれなどのわずかな違いを無視
・・・
・・・・・
入力画像 出力
畳み込み層 プーリング層 畳み込み層 プーリング層 全結合層
畳み込みニューラルネットワーク
 畳み込み層
 各特徴毎の各場所での類似度を出力する
 層が上がるほど複雑な特徴になる
入力
画像
実際はRGBの3チャネルが使われる
出力A
特徴A 特徴B
出力B
・・・
畳み込みニューラルネットワーク
 プーリング層
 近傍の情報を統合して、情報に不変性を加える
 Max Pooling、Lp Pooling、Average Poolingなどがある
Max Poolingの例: 近傍領域のうち最大値を出力することで不変性を与える
畳み込み層
の出力A
・・・
・・・
Max Max
畳み込み層
の出力B
畳み込みニューラルネットワークの学習
 誤差逆伝播法
1. ネットワークに画像を入力し出力を得る
2. 出力と教師信号を比較し、誤差が小さくなる方向へ特徴を出
力層に近い方から順に更新していく
・・・
・・・・・
入力画像 出力
畳み込み層 プーリング層 畳み込み層 プーリング層 全結合層
教師
Recurrent Neural Networks (RNN)
 時系列データなどの「連続したデータ」を扱うための
ニューラルネットワーク
 音声認識、機械翻訳、動画像認識
 予測先の次元数が可変
 時刻tの隠れ層の出力が時刻t+1の隠れ層の入力になる
・・
・
・・
・
・・
・
入力
出力
隠れ層
Recurrent Neural Networks (RNN)
 展開すると、静的なネットワークで表せる
 通常の誤差逆伝播法でパラメータを学習できる
・・
・
・・
・
・・・
入力
出力
隠れ層
・・・
・・
・
・・
・
・・・
・・・
・・・
t-1 t t+1
教師データ 教師データ 教師データ
ニューラルネットワークによる手法の例
 P. H. Pinheiro, R. Collobert, “Recurrent Convolutional Neural
Networks for Scene Labeling”, ICML2014
 J. Long, E. Shelhamer, T. Darrel, “Fully Convolutional Networks
for Semantic Segmentation”, CVPR2015
 S. Zheng, S. Jayasumana, B. Romera-Paredes, V. Vineet, Z. Su, D.
Du, C. Huang, P. H. S. Torr, “Conditional Random Fields as
Recurrent Neural Networks”, ICCV2015
 H. Noh, S. Hong, B. Han, “Learning Deconvolution Network for
Semantic Segmentation”, ICCV2015
 G. Lin, C. Shen, A. Hengel, I. Reid, “Efficient Piecewise Training
of Deep Structured Models for Semantic Segmentation”,
CVPR2016
 P. Isola, J. Y. Zhu, T. Zhou, A. A. Efros, “Image to Image
Translation with Conditional Adversarial Networks”,
arXiv:1611.67004v1, 2016
RCNN for Scene Labeling (Pinheiro and
Collobert, 2014)
 ネットワークfで各画素のラ
ベルを予測し、その結果を
入力に加えて繰り返しfで
予測を行うことで、段階的
にラベルの予測精度を上
げていく
 CRFの平滑化項にあたるよ
うな、コンテクスト(ラベル間
の位置関係)を評価してお
らず、各画素ごとに特徴か
らラベルを判別しているに
等しい
Fully Convolutional Networks (Long, et al.,
2015)
 ピクセルごとにラベル付けされた教師信号を与える
 最終の全結合層をアップサンプリングした畳み込み層に置き換え
 ソースコード
https://github.com/shelhamer/fcn.berkeleyvision.org (Caffe)
他の人が実装したChainer版やTensorFlow版もあり
CRF as RNN (Zheng, et al., 2015)
 Fully Connected CRFの平均場近似による学習と等価なRNNを構築
 特徴抽出部分にFCN(Fully Convolutional Networks)を用いることで、
end to endで誤差逆伝播法による学習が行えるネットワークを構築
平均場近似の一回のIterationを表すCNN
ネットワークの全体像
 ソースコード
https://github.com/torrvis
ion/crfasrnn (Caffe)
Deconvolution Network for Semantic
Segmentation (Noh, et al., 2015)
 Deconvolution Networkを学習させることで、FCNよりも詳
細にラベルごとの尤度を推定し、それを元にFully
Connected CRFでPost-Processing
 ソースコード
https://github.com/HyeonwooNoh/DeconvNet (Caffe + Matlab)
Deep Structured Models for Semantic
Segmentation (Lin, et al., 2016)
 CRFのデータ項および平滑化項のエネルギー関数をそれぞれ
CNNで表現
CRFへの入力はFeatMap-NetというCNNの特徴マップ
CRFの学習を通してエネルギー関数のCNNを学習
平滑化項が、よりsemanticな性質を帯びる
pix2pix (Isola, et al., 2016)
 2つの画像の対応関係を学習する汎用的なConditional Adversarial
Networks
入力から出力を生成するネットワークと、その入出力ペアが本物かを判定する
ネットワークを互いに競わせて学習
Semantic Segmentationの他にエッジ抽出やグレースケール画像の色付けなどに
も応用可能
 ソースコード
https://github.com/phillipi/pix2pix (Torch)
他の人が実装したChainer版もあり
まとめ
 CRFを用いた手法がほぼデファクトだったが、最近はCNN
を用いた手法がデファクトになっている
CNNが良い性能を上げるのは、単純に識別性能が高いためと
思われる
CNN単体の手法だと境界部分や小さい領域などに弱い
 CNN+CRFの組み合わせによってさらに精度を上げるアプ
ローチも多い
 複数の特徴を簡単に入れ込みたいときはRegion and
Partsを使った非CRFの手法は検討の価値がある
 Generative Adversarial Network (GAN)はここ数年急激に
研究が進んだ分野なので、今後も注視する必要

More Related Content

What's hot

【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised LearningまとめDeep Learning JP
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Modelscvpaper. challenge
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)RyuichiKanoh
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情Yuta Kikuchi
 
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向SSII
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some PreliminaryDeep Learning JP
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State SpacesDeep Learning JP
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?Deep Learning JP
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)Deep Learning JP
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法Deep Learning JP
 
【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者cvpaper. challenge
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理Taiji Suzuki
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep LearningSeiya Tokui
 
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜SSII
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイDeep Learning JP
 

What's hot (20)

【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
 
【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
 
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
 

Viewers also liked

20160525はじめてのコンピュータビジョン
20160525はじめてのコンピュータビジョン20160525はじめてのコンピュータビジョン
20160525はじめてのコンピュータビジョンTakuya Minagawa
 
20170211クレジットカード認識
20170211クレジットカード認識20170211クレジットカード認識
20170211クレジットカード認識Takuya Minagawa
 
冴えないデータセットの育て方
冴えないデータセットの育て方冴えないデータセットの育て方
冴えないデータセットの育て方Kazuhiro Sasao
 
4 Ways to Communicate Compensation That Drive Strategic Outcomes
4 Ways to Communicate Compensation That Drive Strategic Outcomes4 Ways to Communicate Compensation That Drive Strategic Outcomes
4 Ways to Communicate Compensation That Drive Strategic OutcomesBambooHR
 
How to use scikit-image for data augmentation
How to use scikit-image for data augmentationHow to use scikit-image for data augmentation
How to use scikit-image for data augmentationHiroki Yamamoto
 
Deep Learningの基礎と応用
Deep Learningの基礎と応用Deep Learningの基礎と応用
Deep Learningの基礎と応用Seiya Tokui
 
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験からディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験からPreferred Networks
 
【DLL3】20170904_AIガイドライン_PFN丸山宏
【DLL3】20170904_AIガイドライン_PFN丸山宏【DLL3】20170904_AIガイドライン_PFN丸山宏
【DLL3】20170904_AIガイドライン_PFN丸山宏Preferred Networks
 
Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別
Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別
Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別knjcode
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative OptimizationTakuya Minagawa
 
20171024 DLLab#04_PFN_Hiroshi Maruyama
20171024 DLLab#04_PFN_Hiroshi Maruyama20171024 DLLab#04_PFN_Hiroshi Maruyama
20171024 DLLab#04_PFN_Hiroshi MaruyamaPreferred Networks
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピTakahiro Kubo
 

Viewers also liked (16)

20160525はじめてのコンピュータビジョン
20160525はじめてのコンピュータビジョン20160525はじめてのコンピュータビジョン
20160525はじめてのコンピュータビジョン
 
20170211クレジットカード認識
20170211クレジットカード認識20170211クレジットカード認識
20170211クレジットカード認識
 
冴えないデータセットの育て方
冴えないデータセットの育て方冴えないデータセットの育て方
冴えないデータセットの育て方
 
4 Ways to Communicate Compensation That Drive Strategic Outcomes
4 Ways to Communicate Compensation That Drive Strategic Outcomes4 Ways to Communicate Compensation That Drive Strategic Outcomes
4 Ways to Communicate Compensation That Drive Strategic Outcomes
 
ECCV 2016 まとめ
ECCV 2016 まとめECCV 2016 まとめ
ECCV 2016 まとめ
 
How to use scikit-image for data augmentation
How to use scikit-image for data augmentationHow to use scikit-image for data augmentation
How to use scikit-image for data augmentation
 
Deep Learningの基礎と応用
Deep Learningの基礎と応用Deep Learningの基礎と応用
Deep Learningの基礎と応用
 
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験からディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
ディープラーニングアプリの可能性 -自動着色アプリPaintsChainer開発の経験から
 
【DLL3】20170904_AIガイドライン_PFN丸山宏
【DLL3】20170904_AIガイドライン_PFN丸山宏【DLL3】20170904_AIガイドライン_PFN丸山宏
【DLL3】20170904_AIガイドライン_PFN丸山宏
 
Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別
Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別
Large Scale Jirou Classification - ディープラーニングによるラーメン二郎全店舗識別
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 
Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
 
20171024 DLLab#04_PFN_Hiroshi Maruyama
20171024 DLLab#04_PFN_Hiroshi Maruyama20171024 DLLab#04_PFN_Hiroshi Maruyama
20171024 DLLab#04_PFN_Hiroshi Maruyama
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
 

Similar to Semantic segmentation

ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfTakuya Minagawa
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetTakuya Minagawa
 
深層生成モデルによるメディア生成
深層生成モデルによるメディア生成深層生成モデルによるメディア生成
深層生成モデルによるメディア生成kame_hirokazu
 
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Yasutomo Kawanishi
 
令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -Yutaka KATAYAMA
 
画像処理AIを用いた異常検知
画像処理AIを用いた異常検知画像処理AIを用いた異常検知
画像処理AIを用いた異常検知Hideo Terada
 
リクルートにおける画像解析事例紹介
リクルートにおける画像解析事例紹介リクルートにおける画像解析事例紹介
リクルートにおける画像解析事例紹介Recruit Technologies
 
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開Seiya Tokui
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyTakuya Minagawa
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTURE Project
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement LearningTakuya Minagawa
 
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定Morpho, Inc.
 
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないことNorishige Fukushima
 
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Shohei Hido
 
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介画像処理分野における研究事例紹介
画像処理分野における研究事例紹介nlab_utokyo
 
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔Preferred Networks
 
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔Preferred Networks
 

Similar to Semantic segmentation (20)

ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 
深層生成モデルによるメディア生成
深層生成モデルによるメディア生成深層生成モデルによるメディア生成
深層生成モデルによるメディア生成
 
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
 
令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -
 
画像処理AIを用いた異常検知
画像処理AIを用いた異常検知画像処理AIを用いた異常検知
画像処理AIを用いた異常検知
 
リクルートにおける画像解析事例紹介
リクルートにおける画像解析事例紹介リクルートにおける画像解析事例紹介
リクルートにおける画像解析事例紹介
 
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 
3DFeat-Net
3DFeat-Net3DFeat-Net
3DFeat-Net
 
MIRU2014 tutorial deeplearning
MIRU2014 tutorial deeplearningMIRU2014 tutorial deeplearning
MIRU2014 tutorial deeplearning
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
 
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
 
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
 
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
 
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介画像処理分野における研究事例紹介
画像処理分野における研究事例紹介
 
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
 
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
 

More from Takuya Minagawa

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureTakuya Minagawa
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイTakuya Minagawa
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsTakuya Minagawa
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事Takuya Minagawa
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)Takuya Minagawa
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)Takuya Minagawa
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representationTakuya Minagawa
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summaryTakuya Minagawa
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation surveyTakuya Minagawa
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentationTakuya Minagawa
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencvTakuya Minagawa
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection surveyTakuya Minagawa
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)Takuya Minagawa
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code ReadingTakuya Minagawa
 

More from Takuya Minagawa (20)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 

Semantic segmentation