Submit Search
Upload
チンパンジーの姿勢推定:教師データがないときの工夫
•
3 likes
•
1,616 views
N
NgocGiang14
Follow
2019_zenkei_ai_forum_#04 チンパンジーの姿勢推定:教師データがないときの工夫
Read less
Read more
Education
Report
Share
Report
Share
1 of 40
Download now
Download to read offline
Recommended
2020/07/31 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]Whole-Body Human Pose Estimation in the Wild
[DL輪読会]Whole-Body Human Pose Estimation in the Wild
Deep Learning JP
サーベイ方法やアイディアの発想法についてまとめました.
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
Hirokatsu Kataoka
PointNet
Point net
Point net
Fujimoto Keisuke
https://datatech-jp.connpass.com/event/252062/ の登壇資料です
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
株式会社MonotaRO Tech Team
2023年7月25日に開催された日本ディープラーニング協会主催「CVPR2023技術報告会」にて、今年のCVPRで発表された技術論文の中から、モルフォの技術者が注目した分野や論文について紹介しました。 資料を見たいという声を多数いただいたので発表資料を共有させていただきます。 詳細はMorpho Tech Blogをご覧ください。 https://techblog.morphoinc.com/entry/2023/08/10/100030 ※CVPR:Conference on Computer Vision and Pattern Recognition。コンピュータビジョンに関する世界トップレベルの学会
JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料
Morpho, Inc.
言語処理学会第22回年次大会ワークショップ「論文に書かない(書けない)自然言語処理」
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有
Naoaki Okazaki
2021年度の松尾研究室サマースクール画像認識コース第三回の姿勢推定(Human Pose Estimation)部分で用いた講義資料を公開する。 本資料は深層学習を用いたHuman Pose Estimation (HPE) の基礎的な内容を理解する助けとなる事を期待して作成し、HPEに関するタスクの種類 (2D, 3D, Single-person, Multi-person)、及びそれらに関する手法について学び、それぞれに対する利点・欠点・評価指標について説明する。
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
PFI 全体セミナーで発表した、専門家向けではなく一般向けのDeep Learning(深層学習)の解説です。どのような場面で活躍しているのか、今までの学習手法と何が違うのかを解説しています。
一般向けのDeep Learning
一般向けのDeep Learning
Preferred Networks
Recommended
2020/07/31 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]Whole-Body Human Pose Estimation in the Wild
[DL輪読会]Whole-Body Human Pose Estimation in the Wild
Deep Learning JP
サーベイ方法やアイディアの発想法についてまとめました.
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
Hirokatsu Kataoka
PointNet
Point net
Point net
Fujimoto Keisuke
https://datatech-jp.connpass.com/event/252062/ の登壇資料です
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
株式会社MonotaRO Tech Team
2023年7月25日に開催された日本ディープラーニング協会主催「CVPR2023技術報告会」にて、今年のCVPRで発表された技術論文の中から、モルフォの技術者が注目した分野や論文について紹介しました。 資料を見たいという声を多数いただいたので発表資料を共有させていただきます。 詳細はMorpho Tech Blogをご覧ください。 https://techblog.morphoinc.com/entry/2023/08/10/100030 ※CVPR:Conference on Computer Vision and Pattern Recognition。コンピュータビジョンに関する世界トップレベルの学会
JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料
Morpho, Inc.
言語処理学会第22回年次大会ワークショップ「論文に書かない(書けない)自然言語処理」
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有
Naoaki Okazaki
2021年度の松尾研究室サマースクール画像認識コース第三回の姿勢推定(Human Pose Estimation)部分で用いた講義資料を公開する。 本資料は深層学習を用いたHuman Pose Estimation (HPE) の基礎的な内容を理解する助けとなる事を期待して作成し、HPEに関するタスクの種類 (2D, 3D, Single-person, Multi-person)、及びそれらに関する手法について学び、それぞれに対する利点・欠点・評価指標について説明する。
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
PFI 全体セミナーで発表した、専門家向けではなく一般向けのDeep Learning(深層学習)の解説です。どのような場面で活躍しているのか、今までの学習手法と何が違うのかを解説しています。
一般向けのDeep Learning
一般向けのDeep Learning
Preferred Networks
JSAI2019 チュートリアル講演 2019年度 人工知能学会全国大会(第33回) 2019年6月5日
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
Kouji Kozaki
cvpaper.challenge はコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文読破・まとめ・アイディア考案・議論・実装・論文投稿に取り組み、あらゆる知識を共有しています。 http://xpaperchallenge.org/cv/ 本資料は、CVPR 2019 網羅的サーベイの成果の一部で、1論文を精読してプレゼンテーション形式でまとめております。論文サマリは下記からご確認頂けます。 http://xpaperchallenge.org/cv/survey/cvpr2019_summaries/listall/
【CVPR 2019】Do Better ImageNet Models Transfer Better?
【CVPR 2019】Do Better ImageNet Models Transfer Better?
cvpaper. challenge
オリジナルはこちら https://www.microsoft.com/en-us/research/academic-program/write-great-research-paper/ http://research.microsoft.com/en-us/um/people/simonpj/papers/giving-a-talk/Writing%20a%20paper%20(seven%20suggestions).pptx 新しいバージョンはこちら https://www.slideshare.net/kdmsnr/how-to-write-a-great-research-paper-226669082
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案
Masanori Kado
論文紹介です。
顕著性マップの推定手法
顕著性マップの推定手法
Takao Yamanaka
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
cvpaper. challenge
研究室に入ったB4向け論文の読み方探し方講座のスライド. 本スライドは前所属の立命館大学 田村・木村・柴田研究室OBの一刈さんに始まり,大槻,石黒君,現D3の森君,他によるBrushupによって現行の形になりました.ここにお礼を申し上げます. シンポジウムとジャーナル,国際会議の論文の評価や価値については分野によって異なる可能性があります.あくまで大槻の研究分野での話であることはご承知おきください. また,内容は個人の見解によるところも大きいです.よろしくお願いいたします.
論文に関する基礎知識2015
論文に関する基礎知識2015
Mai Otsuki
2017/8/28 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Deep Learning JP
ChatGPTの誕生経緯・特徴、それによるインパクトを予測
ChatGPTがもたらす未来予測
ChatGPTがもたらす未来予測
Koji Fukuoka
第8回 全日本コンピュータビジョン勉強会でのトーク内容です。 https://kantocv.connpass.com/event/221786/
2021/10/9 深くは話せないPFNでのお仕事
2021/10/9 深くは話せないPFNでのお仕事
belltailjp
GPU2020講演資料 https://www.gdep-sol.co.jp/gpu2020-day2.html 「DRIVE CHARTを支えるAI技術」 DRIVE CHARTを支えるAI技術およびAIを支える技術のご紹介 - コンピュータビジョン - データサイエンス - エッジAI - MLOps
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
Yusuke Uchida
SSII2019 オーガナイズドセッション3「深層学習の高速化 ~高速チップ、分散学習、軽量モデル~」 6月14日(金) 10:35〜12:05 (メインホール)
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII
2021/7/8 立命館大学情報理工学部 キャリア形成支援講演会
大学院進学が切り拓く情報系学生のキャリア
大学院進学が切り拓く情報系学生のキャリア
Takayuki Itoh
Ver. 2を公開しました: https://speakerdeck.com/nnchiba/point-cloud-deep-learning-survey-ver-2 PointNet前後~ECCV2018の点群深層学習関連の論文についてまとめました. 間違いなどあればご指摘頂けるとありがたいです.
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
【第40回AIセミナー】 「説明できるAI 〜AIはブラックボックスなのか?〜」 https://www.airc.aist.go.jp/seminar_detail/seminar_040.html 【講演タイトル】 機械学習モデルの判断根拠の説明 【講演概要】 本講演では、機械学習モデルの判断根拠を提示するための説明法について紹介する。高精度な認識・識別が可能な機械学習モデルは一般に非常に複雑な構造をしており、どのような基準で判断が下されているかを人間が窺い知ることは困難である。このようなモデルのブラックボックス性を解消するために、近年様々なモデルの説明法が研究・提案されてきている。本講演ではこれら近年の代表的な説明法について紹介する。
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
Satoshi Hara
Stable Diffusion (SD)の最初のバージョンが発表されてから1年弱が経つ今も、SDを用いたアプリケーションや論文は多くあります。特に、高性能で汎用的なSDを、さらに自分が望む画像にチューニングする「追加学習」手法は、幅広いカスタマイズが可能になりました。本講演では、SDにおける追加学習について、最新の手法を交えてご紹介します。
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
Akira Shibata
cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有しています。 http://xpaperchallenge.org/cv/
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
cvpaper. challenge
東京工業大学 日本学術振興会特別研究員 公募に係る学内説明会 にて用いた資料です. 本資料は以下からもダウンロードできます. http://www.rpd.titech.ac.jp/jsps_tokken/adoption/a-1.html
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
Masahito Ohue
SegFormerはTransformerとMLPデコーダを統合した、シンプルだが強力なセマンティックセグメンテーションフレームワークです。そのモデル構造として,エンコーダ部分は,固定サイズの位置埋め込みではなく動的位置埋め込みを用いた階層型Transformerの構造となっており,デコーダ部分は複雑性や計算コストを抑えるAll-MLP構造です。SegFormerは計算コストが低いにも関わらずSoTAを記録しました。
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
harmonylab
2017年1月21日開催の第8回ステアラボ人工知能セミナーにて講演する内容です。 https://stair.connpass.com/event/47714/ 【概要】スマートフォン/ウェブカメラの普及や動画共有サイトの登場により動画像を利用する機会は増加しているが、コンピュータビジョン分野において動画認識が活発に議論されるようになったのは2000年代になってからである。本講演では動画認識の現在に至るまでの一連の流れを紹介するとともに、将来展望においても議論する。 【キーワード】コンピュータビジョン、動画認識、行動認識、モーション表現、時系列モデル、STIP、DT/IDT、Two-Stream CNN、TDD、TSN、ST-ResNet、行動予測、行動検出
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
2020/6/11 画像センシングシンポジウム オーガナイズドセッション2 「限られたデータからの深層学習」 https://confit.atlas.jp/guide/event/ssii2020/static/organized#OS2 での招待講演資料です。 コンピュータビジョン分野を中心とした転移学習についての講演です。 パブリックなデータセットも増えていて、物体検出や領域分割などの研究も盛んですが、実際に社会実装しようとするときのデータは学習データと異なる性質(異なるドメイン)のデータである場合も非常に多いです。 本講演では、そのような場合に有効なドメイン適応の原理となるアプローチ2つと応用としての物体検出と領域分割の事例を紹介しています。
ドメイン適応の原理と応用
ドメイン適応の原理と応用
Yoshitaka Ushiku
More Related Content
What's hot
JSAI2019 チュートリアル講演 2019年度 人工知能学会全国大会(第33回) 2019年6月5日
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
Kouji Kozaki
cvpaper.challenge はコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文読破・まとめ・アイディア考案・議論・実装・論文投稿に取り組み、あらゆる知識を共有しています。 http://xpaperchallenge.org/cv/ 本資料は、CVPR 2019 網羅的サーベイの成果の一部で、1論文を精読してプレゼンテーション形式でまとめております。論文サマリは下記からご確認頂けます。 http://xpaperchallenge.org/cv/survey/cvpr2019_summaries/listall/
【CVPR 2019】Do Better ImageNet Models Transfer Better?
【CVPR 2019】Do Better ImageNet Models Transfer Better?
cvpaper. challenge
オリジナルはこちら https://www.microsoft.com/en-us/research/academic-program/write-great-research-paper/ http://research.microsoft.com/en-us/um/people/simonpj/papers/giving-a-talk/Writing%20a%20paper%20(seven%20suggestions).pptx 新しいバージョンはこちら https://www.slideshare.net/kdmsnr/how-to-write-a-great-research-paper-226669082
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案
Masanori Kado
論文紹介です。
顕著性マップの推定手法
顕著性マップの推定手法
Takao Yamanaka
cvpaper.challenge の メタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
cvpaper. challenge
研究室に入ったB4向け論文の読み方探し方講座のスライド. 本スライドは前所属の立命館大学 田村・木村・柴田研究室OBの一刈さんに始まり,大槻,石黒君,現D3の森君,他によるBrushupによって現行の形になりました.ここにお礼を申し上げます. シンポジウムとジャーナル,国際会議の論文の評価や価値については分野によって異なる可能性があります.あくまで大槻の研究分野での話であることはご承知おきください. また,内容は個人の見解によるところも大きいです.よろしくお願いいたします.
論文に関する基礎知識2015
論文に関する基礎知識2015
Mai Otsuki
2017/8/28 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Deep Learning JP
ChatGPTの誕生経緯・特徴、それによるインパクトを予測
ChatGPTがもたらす未来予測
ChatGPTがもたらす未来予測
Koji Fukuoka
第8回 全日本コンピュータビジョン勉強会でのトーク内容です。 https://kantocv.connpass.com/event/221786/
2021/10/9 深くは話せないPFNでのお仕事
2021/10/9 深くは話せないPFNでのお仕事
belltailjp
GPU2020講演資料 https://www.gdep-sol.co.jp/gpu2020-day2.html 「DRIVE CHARTを支えるAI技術」 DRIVE CHARTを支えるAI技術およびAIを支える技術のご紹介 - コンピュータビジョン - データサイエンス - エッジAI - MLOps
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
Yusuke Uchida
SSII2019 オーガナイズドセッション3「深層学習の高速化 ~高速チップ、分散学習、軽量モデル~」 6月14日(金) 10:35〜12:05 (メインホール)
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII
2021/7/8 立命館大学情報理工学部 キャリア形成支援講演会
大学院進学が切り拓く情報系学生のキャリア
大学院進学が切り拓く情報系学生のキャリア
Takayuki Itoh
Ver. 2を公開しました: https://speakerdeck.com/nnchiba/point-cloud-deep-learning-survey-ver-2 PointNet前後~ECCV2018の点群深層学習関連の論文についてまとめました. 間違いなどあればご指摘頂けるとありがたいです.
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
【第40回AIセミナー】 「説明できるAI 〜AIはブラックボックスなのか?〜」 https://www.airc.aist.go.jp/seminar_detail/seminar_040.html 【講演タイトル】 機械学習モデルの判断根拠の説明 【講演概要】 本講演では、機械学習モデルの判断根拠を提示するための説明法について紹介する。高精度な認識・識別が可能な機械学習モデルは一般に非常に複雑な構造をしており、どのような基準で判断が下されているかを人間が窺い知ることは困難である。このようなモデルのブラックボックス性を解消するために、近年様々なモデルの説明法が研究・提案されてきている。本講演ではこれら近年の代表的な説明法について紹介する。
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
Satoshi Hara
Stable Diffusion (SD)の最初のバージョンが発表されてから1年弱が経つ今も、SDを用いたアプリケーションや論文は多くあります。特に、高性能で汎用的なSDを、さらに自分が望む画像にチューニングする「追加学習」手法は、幅広いカスタマイズが可能になりました。本講演では、SDにおける追加学習について、最新の手法を交えてご紹介します。
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
Akira Shibata
cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有しています。 http://xpaperchallenge.org/cv/
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
cvpaper. challenge
東京工業大学 日本学術振興会特別研究員 公募に係る学内説明会 にて用いた資料です. 本資料は以下からもダウンロードできます. http://www.rpd.titech.ac.jp/jsps_tokken/adoption/a-1.html
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
Masahito Ohue
SegFormerはTransformerとMLPデコーダを統合した、シンプルだが強力なセマンティックセグメンテーションフレームワークです。そのモデル構造として,エンコーダ部分は,固定サイズの位置埋め込みではなく動的位置埋め込みを用いた階層型Transformerの構造となっており,デコーダ部分は複雑性や計算コストを抑えるAll-MLP構造です。SegFormerは計算コストが低いにも関わらずSoTAを記録しました。
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
harmonylab
2017年1月21日開催の第8回ステアラボ人工知能セミナーにて講演する内容です。 https://stair.connpass.com/event/47714/ 【概要】スマートフォン/ウェブカメラの普及や動画共有サイトの登場により動画像を利用する機会は増加しているが、コンピュータビジョン分野において動画認識が活発に議論されるようになったのは2000年代になってからである。本講演では動画認識の現在に至るまでの一連の流れを紹介するとともに、将来展望においても議論する。 【キーワード】コンピュータビジョン、動画認識、行動認識、モーション表現、時系列モデル、STIP、DT/IDT、Two-Stream CNN、TDD、TSN、ST-ResNet、行動予測、行動検出
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
2020/6/11 画像センシングシンポジウム オーガナイズドセッション2 「限られたデータからの深層学習」 https://confit.atlas.jp/guide/event/ssii2020/static/organized#OS2 での招待講演資料です。 コンピュータビジョン分野を中心とした転移学習についての講演です。 パブリックなデータセットも増えていて、物体検出や領域分割などの研究も盛んですが、実際に社会実装しようとするときのデータは学習データと異なる性質(異なるドメイン)のデータである場合も非常に多いです。 本講演では、そのような場合に有効なドメイン適応の原理となるアプローチ2つと応用としての物体検出と領域分割の事例を紹介しています。
ドメイン適応の原理と応用
ドメイン適応の原理と応用
Yoshitaka Ushiku
What's hot
(20)
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
【CVPR 2019】Do Better ImageNet Models Transfer Better?
【CVPR 2019】Do Better ImageNet Models Transfer Better?
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案
顕著性マップの推定手法
顕著性マップの推定手法
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
論文に関する基礎知識2015
論文に関する基礎知識2015
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
[DL輪読会] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
ChatGPTがもたらす未来予測
ChatGPTがもたらす未来予測
2021/10/9 深くは話せないPFNでのお仕事
2021/10/9 深くは話せないPFNでのお仕事
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
大学院進学が切り拓く情報系学生のキャリア
大学院進学が切り拓く情報系学生のキャリア
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識
ドメイン適応の原理と応用
ドメイン適応の原理と応用
チンパンジーの姿勢推定:教師データがないときの工夫
1.
チンパンジーの姿勢推 定:教師データがない ときの工夫 全景株式会社 NGUYEN NGOC
GIANG
2.
自己紹介 名前: グエン ゴク
ジャン ( Nguyen Ngoc Giang ) 国籍: ベトナム 2013年6月 - ハノイ工科大学 卒業 2013年10月 - 日本へ来て、 金沢大学 バイオインフォマティクス研究室 - 研究生 2014年4月~2016年3月 - 金沢大学 博士前期課程 2016年4月~2019年3月 - 金沢大学 博士後期課程 2019年4月~ - 全景株式会社
3.
チンパンジーの姿勢推定したい けど、 教師データがない
4.
姿勢推定 姿 勢 推 定 モ デ ル
5.
OpenPoseモデル 2017年 - OpenPose:人間姿勢推定モデル https://github.com/CMU-Perceptual-Computing-Lab/openpose
6.
OpenPoseをチンパンジーに適用 どうしてチンパンジー? 人に似ている
7.
OpenPoseをチンパンジーに適用 OpenPose
8.
OpenPoseをチンパンジーに適用 OpenPose
9.
OpenPoseをチンパンジーに適用 OpenPose
10.
OpenPoseをチンパンジーに適用 OpenPose
11.
OpenPoseをチンパンジーに適用 OpenPose
12.
OpenPoseをチンパンジーに適用 OpenPose
13.
OpenPoseをチンパンジーに適用 OpenPose
14.
OpenPoseをチンパンジーに適用 OpenPose
15.
OpenPoseをチンパンジーに適用 OpenPose
16.
転移学習手法 元ドメイン データ モデル 目標ドメイン データ モデル (1)訓練 (2)訓練済みモデル (3)再訓練 4万の人間姿勢例 数千のチンパンジー姿勢例 OpenPose OpenPose
17.
チンパンジーの姿勢データ作成 インターネット ツール Python: icrawler.GoogleImageCrawler キーワード: chimpanzee 結果: ~400
写真 姿勢をアノテーションする 右目 左目 左耳 左肘 左手首 左肩 左膝 左手首 右足首 右手首 右肘
18.
OpenPoseモデルの構造 特徴抽出部分 姿勢推定部分 姿勢情報利用なし 姿勢情報利用する
19.
畳み込み
20.
特徴抽出の畳み込み -1 -1 -1 2
2 2 -1 -1 -1 -1 2 -1 -1 2 -1 -1 2 -1
21.
特徴抽出の畳み込み -1 -1 2 -1
2 -1 2 -1 -1 -1 -1 -1 -1 8 -1 -1 -1 -1
22.
OpenPoseモデル 人間の特徴
23.
OpenPoseモデル 人間の特徴 出ない
24.
OpenPoseモデル 人間の特徴 出ない これも人間ですよ! 似ている
25.
実現 学習済みOpenPoseモデルの特徴抽出部分を取り出す
26.
実現:ステップ1 特徴抽出部分の最後に全結合層をつける 全結合層 人がいる 人がいない 凍結(ウェイトを変更しない) 訓練
27.
実現:ステップ1のデータ 人がいない人がいる
28.
実現:ステップ2 人がいない人がいる
29.
実現:ステップ2 特徴抽出部分を再訓練する 再訓練 凍結 全結合層 人がいる 人がいない
30.
最後ステップ 再訓練した特徴抽出部分を元のOpenPoseモデルに戻す
31.
結果 前 後
32.
結果 前 後
33.
結果 前 後
34.
結果 前 後
35.
結果 前 後
36.
結果 前 後
37.
結果 前 後
38.
結果 前 後
39.
まとめ ディープラーニングモデルは大量の正しい訓練データがな いなら素晴らしい結果が出ない ほんとです! 訓練データがなくても、トリックを利用し、OpenPoseモデル の特徴抽出部分を再訓練して、面白い結果が出ました。
40.
ご清聴ありがとうございました!
Download now