SlideShare a Scribd company logo
1 of 24
Download to read offline
CVPR2017事前読み会
2017/07/08 皆川卓也(@takmin)
本資料について
 CVPR2017 paper on the web上のタイトルを眺めて、面白
そうなやつを適当にピックアップ
 http://www.cvpapers.com/cvpr2017.html
 選んだ論文に共有のテーマとか一貫性とかは特にない。
 今回は1本を深く読むよりも、広く浅く
 と思ったら広くない。
 最初は10本くらいやるつもりが、結局5本。。。
 単純に読んだ順番で並べただけ
自己紹介
3
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事
http://visitlab.jp
Network Dissection
Network Dissection: Quantifying
Interpretability of DeepVisual Representations
 David Bau, Bolei Zhou,Aditya Khosla,Aude
Oliva, and AntonioTorralba
 概要
 画像解析を行うCNNの隠れ層がどのような
「意味」と関連付けられているかを解析するた
めのフレームワークを提案
Network Dissection
 手法
 Broden (Broadly and Densely Labbeled Dataset)という様々なコンセ
プトをラベル付けしたデータセットと学習済みCNNモデルの各隠れ
層ユニットの反応との関係を見ることで、ユニットが持つ「意味」を解
析
Network Dissection
 結果
 AlexNet, GoogLeNet,VGG, ResNetを、ImageNetおよびPlaces205で学習
 学習済みモデルに対して、Brodenで隠れユニットのコンセプトを検出
AlexNetの各層で最も強く反応したBroden画像
Network Dissection
 結果
 AlexNet, GoogLeNet,VGG, ResNetを、ImageNetおよびPlaces205で学習
 学習済みモデルに対して、Brodenで隠れユニットのコンセプトを検出
Places205を学習させたVGG, GoogLeNet, ResNetの各ネットワークで、あるコンセプトに最も強く反応した2つのユニット
における検出結果例
Semantic Scene Completion
Semantic Scene Completion from a Single Depth Image
 Shuran Song, FisherYu,Andy Zeng,Angel X. Chang, Manolis
Savva,Thomas Funkhouser
 概要
 1枚の深度画像から、ボクセ
ル空間を生成するScene
Completionと、各ボクセル
にラベル付けを行う
Semantic Segmentationを「同
時に」行うSemantic Scene
Completion Network
(SSCNet)を提案
Semantic Scene Completion
 手法
 入力は1つの深度画像から生成したボクセル空間
 各ボクセルには最寄りのSurfaceの手前を正、奥を負とし、
Surfaceまでの距離が近いほど絶対値が大きくなるような値を
配置 (flippedTSDF)
 Dilated filterでコンテクスト情報を取得
 SUNCGデータセットから学習データを生成
Semantic Scene Completion
 実験
 Scene CompletionとSemantic Segmentationを同時に行う方が
個別に行うよりうまくいく
Context-Aware Correlation Filter Tracking
Context-Aware Correlation Filter Tracking
 Matthias Mueller, Neil Smith, Bernard Ghanem
 概要
 追跡対象の周辺の情報をNegative Sampleとして加えることで、
Contextも考慮したCorrelation Filterを作成するフレームワー
クを提案
 従来のCorrelation Filterに関する関連研究は、より強力な特
徴量を使用するものがほとんど
Context-Aware Correlation Filter Tracking
 従来手法
 Correlation Filter
 目的関数
 目的関数の解は周波数ドメインで以下のように求まる
目的画像𝒂0を
巡回させた行列
求める
フィルタ
物体の
場所
正則化項
入力画像𝒂0の複
素共役𝒂0
∗
を離散
フーリエ変換
要素ごとの積
Context-Aware Correlation Filter Tracking
 手法
 Context-Aware Correlation Filter
 目的関数
 目的関数の解は周波数ドメインで以下のように求まる
背景パッチ
画像の巡回
行列
論文ではこの手法をカーネルを使用した場合や、Multi Channel (HOG等の特徴を使用する場合など)に拡張して
いるが、ここでは割愛。
Context-Aware Correlation Filter Tracking
 結果
 4つの従来法にContext-Awareを追加してOTB-100データセットで比
較
Context-Aware Correlation Filter Tracking
 結果動画
 https://www.youtube.com/watch?v=-mEkFAAag2Q
 (1:24くらいから)
Feature Pyramid Networks
Feature Pyramid Networks for Object Detection
 Tsung-Yi Lin, Piotr Dollar, Ross Girshick
 概要
 Deep CNNに対しわず
かな追加コストでFeature
Pyramidを生成する手法
を提案
 Hand-crafted特徴の物体
検出では一般的
 CNNによる物体検出で
は、計算コストとメモリの
点からFeature Pyramid生
成は避けられてきた
Feature Pyramid Networks
 手法
 Bottom-up pathway (左)
 通常のCNN
 Top-down pathway (右)
 トップの最も表現力の高い
層を単純にアップサンプルし
て、解像度を上げる
 対応するBottom-up pathway
の層のfeature mapに1x1の
畳み込みでfeature mapの数
を合わせてから、足す。
 マージされた各層に3x3の畳
み込みをして最終的な
Feature mapを算出
Feature Pyramid Networks
 実験
 Bottom-upはResNets
 各スケールのFeature Map上でFaster R-CNNで検出
 COCO (single model)でstate-of-the-artを達成
Real-time tracking from depth-colour
imagery
Real-time tracking of single and multiple objects from depth-
colour imagery using 3D signed distance functions
 C.Y. Ren,V.A.Prisacariu, O.Kahler, I.D.Reid, D.W.Murray
 概要
 RGB-Dカメラを用いて物体を3Dでリアルタイム追跡
Real-time tracking from depth-colour
imagery
 手法
 ベイズモデルで物体の位置/姿勢をMAP推定
 追跡対象周辺のボクセルを表面からの距離関数φでモデル化
Real-time tracking from depth-colour
imagery
 手法(続き)
 ベイズモデルで物体の位置/姿勢をMAP推定
 オブジェクトモデルと背景モデルをフレームごとに更新しながら
Real-time tracking from depth-colour
imagery
 手法(続き)
 ベイズモデルで物体の位置/姿勢をMAP推定
 Levenberg-Marquart法
前景モデル
(色ヒストグラム)
背景モデル
(色ヒストグラム)
モデルΩ上の点を姿勢pに
基づいて投影した位置に
反応するデルタ関数
モデルΩ上の周辺の点を姿
勢pに基づいて投影した位
置に反応するデルタ関数
Real-time tracking from depth-colour
imagery
 結果
Real-time tracking from depth-colour
imagery
 結果(処理時間)

More Related Content

What's hot

How to feed myself with computer vision
How to feed myself with computer visionHow to feed myself with computer vision
How to feed myself with computer visionTakuya Minagawa
 
LiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピングLiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピングTakuya Minagawa
 
20160417dlibによる顔器官検出
20160417dlibによる顔器官検出20160417dlibによる顔器官検出
20160417dlibによる顔器官検出Takuya Minagawa
 
Curiosity driven exploration
Curiosity driven explorationCuriosity driven exploration
Curiosity driven explorationTakuya Minagawa
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencvTakuya Minagawa
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative OptimizationTakuya Minagawa
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement LearningTakuya Minagawa
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)Takuya Minagawa
 
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈	BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈 順也 山口
 
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phraseTatsuya Shirakawa
 
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyNeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyTatsuya Shirakawa
 
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝Preferred Networks
 
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployするDeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployするtomohiro kato
 
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジDeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジYusuke Uchida
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太Preferred Networks
 
視覚と対話の融合研究
視覚と対話の融合研究視覚と対話の融合研究
視覚と対話の融合研究Yoshitaka Ushiku
 
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]DeNA
 

What's hot (20)

How to feed myself with computer vision
How to feed myself with computer visionHow to feed myself with computer vision
How to feed myself with computer vision
 
LiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピングLiDAR点群と画像とのマッピング
LiDAR点群と画像とのマッピング
 
20160417dlibによる顔器官検出
20160417dlibによる顔器官検出20160417dlibによる顔器官検出
20160417dlibによる顔器官検出
 
Curiosity driven exploration
Curiosity driven explorationCuriosity driven exploration
Curiosity driven exploration
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 
Show and tell takmin
Show and tell takminShow and tell takmin
Show and tell takmin
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈	BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
 
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
 
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under UncertaintyNeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
 
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployするDeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
 
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジDeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
 
視覚と対話の融合研究
視覚と対話の融合研究視覚と対話の融合研究
視覚と対話の融合研究
 
ロボットアームをPythonで動かす
ロボットアームをPythonで動かすロボットアームをPythonで動かす
ロボットアームをPythonで動かす
 
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
 

Viewers also liked

CVPR2017 参加報告 速報版 本会議 1日目
CVPR2017 参加報告 速報版 本会議 1日目CVPR2017 参加報告 速報版 本会議 1日目
CVPR2017 参加報告 速報版 本会議 1日目Atsushi Hashimoto
 
CVPR2017 参加報告 速報版 本会議3日目
CVPR2017 参加報告 速報版 本会議3日目CVPR2017 参加報告 速報版 本会議3日目
CVPR2017 参加報告 速報版 本会議3日目Atsushi Hashimoto
 
こまった時のOpenJump(デジタイジング編)
こまった時のOpenJump(デジタイジング編)こまった時のOpenJump(デジタイジング編)
こまった時のOpenJump(デジタイジング編)IWASAKI NOBUSUKE
 
FOSS4Gで地理院タイルを使ってみよう!
FOSS4Gで地理院タイルを使ってみよう!FOSS4Gで地理院タイルを使ってみよう!
FOSS4Gで地理院タイルを使ってみよう!IWASAKI NOBUSUKE
 
Building GUI App with Electron and Lisp
Building GUI App with Electron and LispBuilding GUI App with Electron and Lisp
Building GUI App with Electron and Lispfukamachi
 
ドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyoto
ドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyotoドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyoto
ドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyotoNetwalker lab kapper
 
Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17
 Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17 Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17
Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17Netwalker lab kapper
 

Viewers also liked (12)

CVPR2017 参加報告 速報版 本会議 1日目
CVPR2017 参加報告 速報版 本会議 1日目CVPR2017 参加報告 速報版 本会議 1日目
CVPR2017 参加報告 速報版 本会議 1日目
 
ICCV2017一人読み会
ICCV2017一人読み会ICCV2017一人読み会
ICCV2017一人読み会
 
CVPR2017 参加報告 速報版 本会議3日目
CVPR2017 参加報告 速報版 本会議3日目CVPR2017 参加報告 速報版 本会議3日目
CVPR2017 参加報告 速報版 本会議3日目
 
こまった時のOpenJump(デジタイジング編)
こまった時のOpenJump(デジタイジング編)こまった時のOpenJump(デジタイジング編)
こまった時のOpenJump(デジタイジング編)
 
FOSS4Gで地理院タイルを使ってみよう!
FOSS4Gで地理院タイルを使ってみよう!FOSS4Gで地理院タイルを使ってみよう!
FOSS4Gで地理院タイルを使ってみよう!
 
Building GUI App with Electron and Lisp
Building GUI App with Electron and LispBuilding GUI App with Electron and Lisp
Building GUI App with Electron and Lisp
 
Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
ドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyoto
ドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyotoドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyoto
ドライバハッキング。UMPC、Windowsタブレット にLinux、*BSDを入れて遊ぼう  2017年度京都版 #osckyoto
 
Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17
 Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17 Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17
Hacking with x86 Windows Tablet and mobile devices on openSUSE #opensuseasia17
 
ECCV 2016 速報
ECCV 2016 速報ECCV 2016 速報
ECCV 2016 速報
 
ICCV 2017 速報
ICCV 2017 速報 ICCV 2017 速報
ICCV 2017 速報
 

Similar to Cvpr2017事前読み会

チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017
チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017
チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017Koichi Yoshida
 
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例Atsushi Hara
 
グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜
グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜
グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜Hiroki Tanioka
 
内職がいらないくらいわかりやすいディープラーニング
内職がいらないくらいわかりやすいディープラーニング内職がいらないくらいわかりやすいディープラーニング
内職がいらないくらいわかりやすいディープラーニングKo Kikuta
 
Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」
 Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」 Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」
Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」Kazuhiko Nakamura
 
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディプロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ力也 伊原
 
インフラエンジニア必見!勉強会の歩き方
インフラエンジニア必見!勉強会の歩き方インフラエンジニア必見!勉強会の歩き方
インフラエンジニア必見!勉強会の歩き方真俊 横田
 
2018 programing
2018 programing2018 programing
2018 programingm_miyamoto
 
機械学習と Azure ML Studio の基本
機械学習と Azure ML Studio の基本機械学習と Azure ML Studio の基本
機械学習と Azure ML Studio の基本Yoshitaka Seo
 
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-Takahiro Kubo
 
初音玲の流儀 - なんでプログラミングしているの?
初音玲の流儀 - なんでプログラミングしているの?初音玲の流儀 - なんでプログラミングしているの?
初音玲の流儀 - なんでプログラミングしているの?Akira Hatsune
 
エンジニアのトリセツをつくろう
エンジニアのトリセツをつくろうエンジニアのトリセツをつくろう
エンジニアのトリセツをつくろう大輔 浅井
 
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」Noriaki Takahashi
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料Takuya Minagawa
 
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...Yoshitaka Ushiku
 
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~Yoshitaka Kawashima
 
見やすいアウトプットのつくりかた
見やすいアウトプットのつくりかた見やすいアウトプットのつくりかた
見やすいアウトプットのつくりかたjujubkitakd
 
Machine Learning Bootstrap
Machine Learning BootstrapMachine Learning Bootstrap
Machine Learning BootstrapTakahiro Kubo
 
利根川講演 In 香川201708
利根川講演 In 香川201708利根川講演 In 香川201708
利根川講演 In 香川201708Yuta Tonegawa
 

Similar to Cvpr2017事前読み会 (20)

チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017
チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017
チームをワークさせるために 最も大事なコミュニケーション 意識していますか? - XP祭り2017
 
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例
 
グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜
グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜
グループ学習で学ぶプログラミング 〜さあ、いっしょに考えよう!〜
 
内職がいらないくらいわかりやすいディープラーニング
内職がいらないくらいわかりやすいディープラーニング内職がいらないくらいわかりやすいディープラーニング
内職がいらないくらいわかりやすいディープラーニング
 
Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」
 Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」 Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」
Office 365 勉強会「いまさらきけない? SharePoint の基礎のキソ」
 
プロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディプロトタイピングツール投入のケーススタディ
プロトタイピングツール投入のケーススタディ
 
インフラエンジニア必見!勉強会の歩き方
インフラエンジニア必見!勉強会の歩き方インフラエンジニア必見!勉強会の歩き方
インフラエンジニア必見!勉強会の歩き方
 
2018 programing
2018 programing2018 programing
2018 programing
 
機械学習と Azure ML Studio の基本
機械学習と Azure ML Studio の基本機械学習と Azure ML Studio の基本
機械学習と Azure ML Studio の基本
 
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
 
Multi paradigm design
Multi paradigm designMulti paradigm design
Multi paradigm design
 
初音玲の流儀 - なんでプログラミングしているの?
初音玲の流儀 - なんでプログラミングしているの?初音玲の流儀 - なんでプログラミングしているの?
初音玲の流儀 - なんでプログラミングしているの?
 
エンジニアのトリセツをつくろう
エンジニアのトリセツをつくろうエンジニアのトリセツをつくろう
エンジニアのトリセツをつくろう
 
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
 
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
 
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
 
見やすいアウトプットのつくりかた
見やすいアウトプットのつくりかた見やすいアウトプットのつくりかた
見やすいアウトプットのつくりかた
 
Machine Learning Bootstrap
Machine Learning BootstrapMachine Learning Bootstrap
Machine Learning Bootstrap
 
利根川講演 In 香川201708
利根川講演 In 香川201708利根川講演 In 香川201708
利根川講演 In 香川201708
 

More from Takuya Minagawa

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureTakuya Minagawa
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイTakuya Minagawa
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsTakuya Minagawa
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事Takuya Minagawa
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)Takuya Minagawa
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representationTakuya Minagawa
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summaryTakuya Minagawa
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation surveyTakuya Minagawa
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentationTakuya Minagawa
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection surveyTakuya Minagawa
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)Takuya Minagawa
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyTakuya Minagawa
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetTakuya Minagawa
 

More from Takuya Minagawa (20)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
 
3DFeat-Net
3DFeat-Net3DFeat-Net
3DFeat-Net
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 

Recently uploaded

The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))yoshidakids7
 
00001_test_automation_portfolio_20240313
00001_test_automation_portfolio_2024031300001_test_automation_portfolio_20240313
00001_test_automation_portfolio_20240313ssuserf8ea02
 
これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024Hideki Saito
 
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdfIGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdfIGDA Japan SIG-Audio
 
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~honeshabri
 
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜Naomi Yamasaki
 
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。iPride Co., Ltd.
 
チームで開発するための環境を整える
チームで開発するための環境を整えるチームで開発するための環境を整える
チームで開発するための環境を整えるonozaty
 
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版Takayuki Nakayama
 
バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析sugiuralab
 
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」IGDA Japan SIG-Audio
 
AWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作りAWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作りiPride Co., Ltd.
 

Recently uploaded (12)

The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))
 
00001_test_automation_portfolio_20240313
00001_test_automation_portfolio_2024031300001_test_automation_portfolio_20240313
00001_test_automation_portfolio_20240313
 
これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024
 
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdfIGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
 
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
 
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
 
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
 
チームで開発するための環境を整える
チームで開発するための環境を整えるチームで開発するための環境を整える
チームで開発するための環境を整える
 
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
 
バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析
 
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
 
AWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作りAWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作り
 

Cvpr2017事前読み会

  • 2. 本資料について  CVPR2017 paper on the web上のタイトルを眺めて、面白 そうなやつを適当にピックアップ  http://www.cvpapers.com/cvpr2017.html  選んだ論文に共有のテーマとか一貫性とかは特にない。  今回は1本を深く読むよりも、広く浅く  と思ったら広くない。  最初は10本くらいやるつもりが、結局5本。。。  単純に読んだ順番で並べただけ
  • 3. 自己紹介 3 テクニカル・ソリューション・アーキテクト 皆川 卓也(みながわ たくや) フリーエンジニア(ビジョン&ITラボ) 「コンピュータビジョン勉強会@関東」主催 博士(工学) 略歴: 1999-2003年 日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ セールス、プロジェクトマネジメント、サポート等の業務に従事 2004-2009年 コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事 2007-2010年 慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻 単位取得退学後、博士号取得(2014年) 2009年-現在 フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事 http://visitlab.jp
  • 4. Network Dissection Network Dissection: Quantifying Interpretability of DeepVisual Representations  David Bau, Bolei Zhou,Aditya Khosla,Aude Oliva, and AntonioTorralba  概要  画像解析を行うCNNの隠れ層がどのような 「意味」と関連付けられているかを解析するた めのフレームワークを提案
  • 5. Network Dissection  手法  Broden (Broadly and Densely Labbeled Dataset)という様々なコンセ プトをラベル付けしたデータセットと学習済みCNNモデルの各隠れ 層ユニットの反応との関係を見ることで、ユニットが持つ「意味」を解 析
  • 6. Network Dissection  結果  AlexNet, GoogLeNet,VGG, ResNetを、ImageNetおよびPlaces205で学習  学習済みモデルに対して、Brodenで隠れユニットのコンセプトを検出 AlexNetの各層で最も強く反応したBroden画像
  • 7. Network Dissection  結果  AlexNet, GoogLeNet,VGG, ResNetを、ImageNetおよびPlaces205で学習  学習済みモデルに対して、Brodenで隠れユニットのコンセプトを検出 Places205を学習させたVGG, GoogLeNet, ResNetの各ネットワークで、あるコンセプトに最も強く反応した2つのユニット における検出結果例
  • 8. Semantic Scene Completion Semantic Scene Completion from a Single Depth Image  Shuran Song, FisherYu,Andy Zeng,Angel X. Chang, Manolis Savva,Thomas Funkhouser  概要  1枚の深度画像から、ボクセ ル空間を生成するScene Completionと、各ボクセル にラベル付けを行う Semantic Segmentationを「同 時に」行うSemantic Scene Completion Network (SSCNet)を提案
  • 9. Semantic Scene Completion  手法  入力は1つの深度画像から生成したボクセル空間  各ボクセルには最寄りのSurfaceの手前を正、奥を負とし、 Surfaceまでの距離が近いほど絶対値が大きくなるような値を 配置 (flippedTSDF)  Dilated filterでコンテクスト情報を取得  SUNCGデータセットから学習データを生成
  • 10. Semantic Scene Completion  実験  Scene CompletionとSemantic Segmentationを同時に行う方が 個別に行うよりうまくいく
  • 11. Context-Aware Correlation Filter Tracking Context-Aware Correlation Filter Tracking  Matthias Mueller, Neil Smith, Bernard Ghanem  概要  追跡対象の周辺の情報をNegative Sampleとして加えることで、 Contextも考慮したCorrelation Filterを作成するフレームワー クを提案  従来のCorrelation Filterに関する関連研究は、より強力な特 徴量を使用するものがほとんど
  • 12. Context-Aware Correlation Filter Tracking  従来手法  Correlation Filter  目的関数  目的関数の解は周波数ドメインで以下のように求まる 目的画像𝒂0を 巡回させた行列 求める フィルタ 物体の 場所 正則化項 入力画像𝒂0の複 素共役𝒂0 ∗ を離散 フーリエ変換 要素ごとの積
  • 13. Context-Aware Correlation Filter Tracking  手法  Context-Aware Correlation Filter  目的関数  目的関数の解は周波数ドメインで以下のように求まる 背景パッチ 画像の巡回 行列 論文ではこの手法をカーネルを使用した場合や、Multi Channel (HOG等の特徴を使用する場合など)に拡張して いるが、ここでは割愛。
  • 14. Context-Aware Correlation Filter Tracking  結果  4つの従来法にContext-Awareを追加してOTB-100データセットで比 較
  • 15. Context-Aware Correlation Filter Tracking  結果動画  https://www.youtube.com/watch?v=-mEkFAAag2Q  (1:24くらいから)
  • 16. Feature Pyramid Networks Feature Pyramid Networks for Object Detection  Tsung-Yi Lin, Piotr Dollar, Ross Girshick  概要  Deep CNNに対しわず かな追加コストでFeature Pyramidを生成する手法 を提案  Hand-crafted特徴の物体 検出では一般的  CNNによる物体検出で は、計算コストとメモリの 点からFeature Pyramid生 成は避けられてきた
  • 17. Feature Pyramid Networks  手法  Bottom-up pathway (左)  通常のCNN  Top-down pathway (右)  トップの最も表現力の高い 層を単純にアップサンプルし て、解像度を上げる  対応するBottom-up pathway の層のfeature mapに1x1の 畳み込みでfeature mapの数 を合わせてから、足す。  マージされた各層に3x3の畳 み込みをして最終的な Feature mapを算出
  • 18. Feature Pyramid Networks  実験  Bottom-upはResNets  各スケールのFeature Map上でFaster R-CNNで検出  COCO (single model)でstate-of-the-artを達成
  • 19. Real-time tracking from depth-colour imagery Real-time tracking of single and multiple objects from depth- colour imagery using 3D signed distance functions  C.Y. Ren,V.A.Prisacariu, O.Kahler, I.D.Reid, D.W.Murray  概要  RGB-Dカメラを用いて物体を3Dでリアルタイム追跡
  • 20. Real-time tracking from depth-colour imagery  手法  ベイズモデルで物体の位置/姿勢をMAP推定  追跡対象周辺のボクセルを表面からの距離関数φでモデル化
  • 21. Real-time tracking from depth-colour imagery  手法(続き)  ベイズモデルで物体の位置/姿勢をMAP推定  オブジェクトモデルと背景モデルをフレームごとに更新しながら
  • 22. Real-time tracking from depth-colour imagery  手法(続き)  ベイズモデルで物体の位置/姿勢をMAP推定  Levenberg-Marquart法 前景モデル (色ヒストグラム) 背景モデル (色ヒストグラム) モデルΩ上の点を姿勢pに 基づいて投影した位置に 反応するデルタ関数 モデルΩ上の周辺の点を姿 勢pに基づいて投影した位 置に反応するデルタ関数
  • 23. Real-time tracking from depth-colour imagery  結果
  • 24. Real-time tracking from depth-colour imagery  結果(処理時間)