Submit Search
Upload
Unsupervised learning of object landmarks by factorized spatial embeddings
•
4 likes
•
1,209 views
Takanori Ogata
Follow
第43回 コンピュータビジョン勉強会@関東 ICCV2017読み会
Read less
Read more
Technology
Report
Share
Report
Share
1 of 37
Recommended
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
Takanori Ogata
Invariant Information Clustering for Unsupervised Image Classification and Se...
Invariant Information Clustering for Unsupervised Image Classification and Se...
harmonylab
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
Tatsuya Shirakawa
【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用
Hirono Jumpei
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
Tatsuya Shirakawa
Recommended
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
Takanori Ogata
Invariant Information Clustering for Unsupervised Image Classification and Se...
Invariant Information Clustering for Unsupervised Image Classification and Se...
harmonylab
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
Tatsuya Shirakawa
【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用
Hirono Jumpei
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
Tatsuya Shirakawa
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
順也 山口
ICCV2019 report
ICCV2019 report
Tatsuya Shirakawa
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
BrainPad Inc.
pytech
pytech
Kanta Kato
G Suite勉強会資料(20200326)
G Suite勉強会資料(20200326)
Keiichi Hirose
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
Tatsuya Shirakawa
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Koji Yoshida
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
Preferred Networks
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
Hirono Jumpei
DLL Community Update 10月版
DLL Community Update 10月版
Hirono Jumpei
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
Takahiro Kubo
【CVPR 2020 メタサーベイ】Neural Generative Models
【CVPR 2020 メタサーベイ】Neural Generative Models
cvpaper. challenge
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
tomohiro kato
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-X
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-X
cvpaper. challenge
いまさら学ぶオブジェクト指向
いまさら学ぶオブジェクト指向
Daisuke Hirayama
CVPR 2020報告
CVPR 2020報告
日本ディープラーニング協会(JDLA)
DIMoの操作実演とSCSKが提供する研修プログラム
DIMoの操作実演とSCSKが提供する研修プログラム
Hirono Jumpei
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Preferred Networks
記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理
圭輔 大曽根
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
Takuya Minagawa
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
Takashi Kaneda
More Related Content
What's hot
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
順也 山口
ICCV2019 report
ICCV2019 report
Tatsuya Shirakawa
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
BrainPad Inc.
pytech
pytech
Kanta Kato
G Suite勉強会資料(20200326)
G Suite勉強会資料(20200326)
Keiichi Hirose
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
Tatsuya Shirakawa
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Koji Yoshida
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
Preferred Networks
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
Hirono Jumpei
DLL Community Update 10月版
DLL Community Update 10月版
Hirono Jumpei
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
Takahiro Kubo
【CVPR 2020 メタサーベイ】Neural Generative Models
【CVPR 2020 メタサーベイ】Neural Generative Models
cvpaper. challenge
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
tomohiro kato
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-X
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-X
cvpaper. challenge
いまさら学ぶオブジェクト指向
いまさら学ぶオブジェクト指向
Daisuke Hirayama
CVPR 2020報告
CVPR 2020報告
日本ディープラーニング協会(JDLA)
DIMoの操作実演とSCSKが提供する研修プログラム
DIMoの操作実演とSCSKが提供する研修プログラム
Hirono Jumpei
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Preferred Networks
記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理
圭輔 大曽根
What's hot
(20)
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
ICCV2019 report
ICCV2019 report
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
pytech
pytech
G Suite勉強会資料(20200326)
G Suite勉強会資料(20200326)
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
DLL Community Update 10月版
DLL Community Update 10月版
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
【CVPR 2020 メタサーベイ】Neural Generative Models
【CVPR 2020 メタサーベイ】Neural Generative Models
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
DeepLearningフレームワークChainerの学習済みモデルをスマートフォンにDeployする
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-X
【CVPR 2020 メタサーベイ】3D From a Single Image and Shape-From-X
いまさら学ぶオブジェクト指向
いまさら学ぶオブジェクト指向
CVPR 2020報告
CVPR 2020報告
DIMoの操作実演とSCSKが提供する研修プログラム
DIMoの操作実演とSCSKが提供する研修プログラム
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
Playgram開発秘話_2022年1月プログラミングシンポジウム招待講演_西澤勇輝、岡本雄太
記事分類における教師データおよびモデルの管理
記事分類における教師データおよびモデルの管理
Similar to Unsupervised learning of object landmarks by factorized spatial embeddings
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
Takuya Minagawa
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
Takashi Kaneda
EfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object Detection
harmonylab
Ptengineトレーニング資料20211103
Ptengineトレーニング資料20211103
Takashi Ando
20201010 personreid
20201010 personreid
Takuya Minagawa
大規模並列解析用可視化モジュール ADVENTURE_POSTtool
大規模並列解析用可視化モジュール ADVENTURE_POSTtool
ADVENTURE Project
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Takuya Azumi
データプロダクト開発を成功に導くには
データプロダクト開発を成功に導くには
Recruit Lifestyle Co., Ltd.
アジャイルソフトウェア開発の道具箱
アジャイルソフトウェア開発の道具箱
Koichi ITO
Googleにおける機械学習の活用とクラウドサービス
Googleにおける機械学習の活用とクラウドサービス
Google Cloud Platform - Japan
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
Deep Learning JP
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
[OCPJ PoCWG Engineering Workshop] Zabbixを用いたOCPベアメタル監視環境の自動構築
[OCPJ PoCWG Engineering Workshop] Zabbixを用いたOCPベアメタル監視環境の自動構築
cloudconductor
CV勉強会CVPR2019読み会: Video Action Transformer Network
CV勉強会CVPR2019読み会: Video Action Transformer Network
Toshiki Sakai
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
Takanori Ogata
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ
Digital Nature Group
Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
Kazuyuki Miyazawa
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
Rakuten Group, Inc.
ユーザーストーリー・マッピング
ユーザーストーリー・マッピング
Tarumoto Tetsuya
Similar to Unsupervised learning of object landmarks by factorized spatial embeddings
(20)
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
EfficientDet: Scalable and Efficient Object Detection
EfficientDet: Scalable and Efficient Object Detection
Ptengineトレーニング資料20211103
Ptengineトレーニング資料20211103
20201010 personreid
20201010 personreid
大規模並列解析用可視化モジュール ADVENTURE_POSTtool
大規模並列解析用可視化モジュール ADVENTURE_POSTtool
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
データプロダクト開発を成功に導くには
データプロダクト開発を成功に導くには
アジャイルソフトウェア開発の道具箱
アジャイルソフトウェア開発の道具箱
Googleにおける機械学習の活用とクラウドサービス
Googleにおける機械学習の活用とクラウドサービス
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
【DL輪読会】AuthenticAuthentic Volumetric Avatars from a Phone Scan
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
[OCPJ PoCWG Engineering Workshop] Zabbixを用いたOCPベアメタル監視環境の自動構築
[OCPJ PoCWG Engineering Workshop] Zabbixを用いたOCPベアメタル監視環境の自動構築
CV勉強会CVPR2019読み会: Video Action Transformer Network
CV勉強会CVPR2019読み会: Video Action Transformer Network
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ
Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
ユーザーストーリー・マッピング
ユーザーストーリー・マッピング
More from Takanori Ogata
20210108 Tread: Circuits
20210108 Tread: Circuits
Takanori Ogata
20200704 Deep Snake for Real-Time Instance Segmentation
20200704 Deep Snake for Real-Time Instance Segmentation
Takanori Ogata
CVPR2019読み会@関東CV
CVPR2019読み会@関東CV
Takanori Ogata
190412 Annotation Survey@関東CV勉強会
190412 Annotation Survey@関東CV勉強会
Takanori Ogata
190410 ML@LOFT
190410 ML@LOFT
Takanori Ogata
Training object class detectors with click supervision
Training object class detectors with click supervision
Takanori Ogata
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Takanori Ogata
Convolutional Pose Machines
Convolutional Pose Machines
Takanori Ogata
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
Takanori Ogata
Cv20160205
Cv20160205
Takanori Ogata
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
Takanori Ogata
DeepAKB
DeepAKB
Takanori Ogata
More from Takanori Ogata
(13)
20210108 Tread: Circuits
20210108 Tread: Circuits
20200704 Deep Snake for Real-Time Instance Segmentation
20200704 Deep Snake for Real-Time Instance Segmentation
CVPR2019読み会@関東CV
CVPR2019読み会@関東CV
190412 Annotation Survey@関東CV勉強会
190412 Annotation Survey@関東CV勉強会
190410 ML@LOFT
190410 ML@LOFT
Training object class detectors with click supervision
Training object class detectors with click supervision
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Convolutional Pose Machines
Convolutional Pose Machines
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
Cv20160205
Cv20160205
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
DeepAKB
DeepAKB
Recently uploaded
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
Recently uploaded
(9)
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
Unsupervised learning of object landmarks by factorized spatial embeddings
1.
Unsupervised learning of
object landmarks by factorized spatial embeddings Takanori Ogata (@conta_)
2.
緒方 貴紀 (@conta_) Co-Founder
/ Chief Research Officer @ABEJA, Inc. 基礎研究から、プロダクト開発、クラウドからGPUマシンの組み立てまで なんでもやります。 Self Introduction
3.
画像の意味理解において、物体の変形や見え方を考慮するのは大事 Ex) 物体のPartsと全体像の関係性を利用したり、物体の大きさの変化に対応し た検出枠を予め準備したりすることで物体検出の精度向上に寄与することが知 られている Intro 3 SSD[Liu+, ECCV
2016]DPM[Felzenszwalb+, CVPR 2008]
4.
Landmarkを検出するためのアルゴリズムを作るには、アノテーション データが必要 Landmark detection 4 https://ibug.doc.ic.ac.uk/resources/facial-point-annotations/ http://cocodataset.org/#keypoints-challenge2017
5.
=> アノテーション無しに、Keyとなる特徴を得ることができないか??? Landmarkのアノテーション辛い問題 5 landmarkのアノテーションはすごく時間かかって辛い。。。
6.
• 同一物体が移った画像群から、Unsupervisedに その物体の特徴を表すようなLandmarkを学習、 検出できるようなアルゴリズムの提案 • 対象物の見え方や変形が、共通の空間から射影 されると仮定して、CNNでimplicitにそういった landmarkを抽出できた •
学習で得られたLandmarkと、アノテーションされ たlandmarkを線形回帰することで、ベンチマーク ごとに一から学習させること無く、landmark detectionができた 概要 6
7.
この論文は理論を気持ちで感じ取って、NNで解きます 7
8.
特定の物体(猫、鳥、犬 etc.)の特徴点は、ある共通の球面にマップされて て、そこから射影して画像上に現れていると考える Structure from
viewpoint factorization 8
9.
𝑆上にある物体の表面がマップされてると考える 特定物体に共通する座標から画像上の点𝑞に対する射影である、 𝑞 = Φ%(𝑝;
𝑋)を考えたい Structure from viewpoint factorization 9 X: image Λ ⊂ ℝ6 𝑆 ⊂ ℝ7 𝑝, 𝑟 ∈ 𝑆 𝑞 ∈ Λ
10.
𝑞を𝑞′に移す変換𝑔はΦを使って次のように表せる Structure from viewpoint
factorization 10 X: image Λ ⊂ ℝ6 𝑆 ⊂ ℝ7 𝑝, 𝑟 ∈ 𝑆 𝑞 ∈ Λ すると、下記の関係式が得られる 𝑔はこんな感じで表せる これを満たすΦを求めたい!
11.
Q: どうやって求めるのか? Landmark detection
networks 11 A: やっぱNNっしょ!
12.
Φ(−; 𝑥)から、K個の離散点をsampleしてそれらの射影集合Φ(𝑥)を考える Landmark detection
networks 12 簡略化 これによって、ある物体の画像からK個のimplicitな点を得ることができる
13.
このΦをNNで表す際に、出力がscore mapになるようにする Landmark detection
networks 13 𝑠𝑐𝑜𝑟𝑒 𝑚𝑎𝑝𝑠 Ψ(𝑥) ∈ 𝑅G×I×J Ψ(𝑥) Deep learning
14.
このscore mapをprobability mapに変換するために、 softmaxオペレーター𝜎を各Ψの出力に対してかける Landmark
detection networks 14 Ψ(𝑥) Deep learning σを各pixelごとに適用
15.
Probability mapから最終的なlandmark座標𝑢M ∗ を求めるには、 各mapに対しての最大値を取って決める Landmark detection
networks 15 重み付き平均的なやつ (x, y)
16.
gによる変換後の画像xをΦに入れたときの出力と、変換前の画像をΦに入 れたときの出力をgで変換したものが等しくなるようにすれば、同じ画像か ら共通のlandmarkを手に入れることができる、という気持ち => siamese networkのような形で計算する Learning
formulation 16 Loss functionをどう設計するか?
17.
前式(5)は直接landmarkの差を取っていたが、landmarkの誤差を取るの ではなく、直接probability mapsから計算できるように(6)式を代わりに lossとして利用する Probability maps
loss 17 *実装では(6)式を展開して計算を簡略化
18.
先程の関数Ψ(𝑥) = (Ψ(𝑟_1; 𝑥), Ψ(𝑟_2;
𝑥), … , Ψ(𝑟_𝐾; 𝑥))の数は適当にKで決めて いる Þ K個すべての出力結果が同じになってしまう可能性がある 局所解を避けるために、 Diversity lossを導入 =>Score mapが重複しないようなLossを入れる Diversity loss 18 Ψ(r_1; x) Ψ(r_2; x) Ψ(r_K; x) : 局所解!!!!
19.
Score mapが重複しない =
各Score mapの相関がなくなるようなlossを 考える Diversity loss 19
20.
(7)は計算コストが、Kに対して爆発的に増加してしまうので、代わりに(8)を使う Score mapが重複しない =
各score mapの各点においてscoreが高くなるとこ ろがばらつくようになるのと同義と考えて、次のように置き換える Diversity loss 20
21.
実際はScore mapはDown samplingされるので、座標は下記のようにな る Diversity
loss 21
22.
正則項 Score map画像変換による誤差 各Score
mapの分散度合い Lossを統合すると 9 式になる Learning objective 22 Ψ(𝑥) なるべく分散するようにΨ(𝑥′) 𝒈 対応点が近くなるように 𝒙′ 𝒙
23.
詳細は省略 23 Implementation Detail gはThin Plate
Spline(TPS)という 変換を利用
24.
UT Zappos50k: 49525
shoes Cat dataset: 8609 images CelebA dataset: 200k celebrity images with 5 annotated landmarks 定性評価をVisualizeにて行った Experiments 24
25.
UT Zappos50k Qualitative results 25
26.
Cat Dataset Qualitative results 26
27.
CelebA Dataset Qualitative results 27
28.
UnsupervisedなLandmarkが実際に有用なものかをチェックするために 定性評価(Unsupervisedに出力したlandmarkをSupervisedにRegression)を 行った Facial Landmark Detectionに関して、
AFLW /MAFL/300-W Datasetにて実験 Quantitative results 28
29.
CelebAでUnsupervisedな学習させて、 学習させるときにLandmarkのK の数を増やしていったときの実験結果 Kは増やせば増やすほど良くなる Quantitative results(Increasing
K) 29
30.
Supervised landmarkを増やしていったときの実験結果 UnsupervisedなlandmarkからSupervisedなLandmarkへ応用できるこ とがわかる Quantitative results(Increasing
supervised label) 30
31.
Networkはグローバルなので、各Datasetに対して、回帰することでそこそ こ高精度なに近い結果を得ることが可能 Quantitative results 31
32.
左は成功例、右は失敗例 Quantitative results 32
33.
Demo 33
34.
• 同一物体が移った画像群から、Unsupervisedにその物体の特徴を表 すようなLandmarkを学習、検出できるようなアルゴリズムの提案 • 対象物の見え方や変形が、共通の空間から射影されると仮定して、 CNNでimplicitにそういったlandmarkを抽出できた •
学習で得られたLandmarkと、アノテーションされたlandmarkを線形 回帰することで、ベンチマークごとに一から学習させること無く、 landmark detectionができた Conclusion 34
35.
考察 35
36.
実装したくなった? 36
37.
Join Us! https://www.wantedly.com/companies/abeja 37