SlideShare a Scribd company logo
1 of 33
Download to read offline
全脳アーキテクチャ若⼿の会 カジュアルトーク#3 (2016.6.4)
Adversarial Networks による画像⽣成に迫る
全脳アーキテクチャ若⼿の会
法政⼤学⼤学院 理⼯学研究科 修⼠課程
島⽥ ⼤樹
⾃⼰紹介
島⽥ ⼤樹 (SHIMADA Daiki)
@sheema_sheema (Twitter)
• 法政⼤学⼤学院 理⼯学研究科 M2
• 画像解析による授業受講者の態度推定
• 深層学習関連⼿法の提案
• 全脳アーキテクチャ若⼿の会 副代表
• 会全体の運営 (運営メンバー⼤募集中!!)
• 2014年第2回勉強会 発表者
1
前回のあらすじ
l カジュアルにCNN系⽂献64本ノック!
http://www.slideshare.net/sheemap/convolutional-neural-networks-wbafl2
Convolutional Neural Networks (CNN) の研究動向
2
l 今⽇はこの中の画像⽣成を
ちょっとだけ追ってみます!
⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3
Adversarial Networks による
画像⽣成に迫る
1. Why 画像⽣成?
2. Generative Adversarial Nets (GAN)
3. GANとならできること
4. まとめ
3
Why 画像⽣成?
l 普通に⾒ていて⾯⽩い
l (絵が下⼿な⼈もクリエイティブになれる…?)
絵を描く機械って⾯⽩くないですか?
Why 画像⽣成?
l 機械に物体のパーツの構成を理解させたい
視覚情報の特徴を学習するための⼿段
5
Why 画像⽣成?
l 機械に物体のパーツの構成を理解させたい
視覚情報の特徴を学習するための⼿段
6
⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3
Adversarial Networks による
画像⽣成に迫る
1. Why 画像⽣成?
2. Generative Adversarial Nets (GAN)
3. GANとならできること
4. まとめ
7
Generative Adversarial Nets (GAN)
l Generator (⽣成部) と Discriminator (判別部) で構成
Generative Adversarial Nets [1]
8[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014.
Generator
Network (G)
Discriminator
Network (D)
…
…
?
⽣成画像
Z
G(Z)
⼊⼒画像が
本物の確率
Generative Adversarial Nets (GAN)
l ⽬標1: Dは⼊⼒が本物の画像がどうか⾒分ける
Generative Adversarial Nets の学習 [1]
9[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014.
Discriminator
Network (D)
…?
⽣成画像
G(Z)
⼊⼒画像が
本物の確率
[0, 1]
本物画像 x
X か G(Z)
どちらかが
⼊⼒される
Generative Adversarial Nets (GAN)
l ⽬標2: GはDを騙すような画像を⽣成する
Generative Adversarial Nets の学習 [1]
10[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014.
Generator
Network (G)
Discriminator
Network (D)
…
…
?
⽣成画像
Z
G(Z)
⼊⼒画像が
本物の確率
D(G(Z)) の
フィードバック
D(G(Z))
Generative Adversarial Nets (GAN)
Generative Adversarial Nets の学習 [1]
11[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014.
…
…
?
⽣成画像
Z
G(Z)
⼊⼒画像が
本物の確率
本物画像 x
D(x)
Generative Adversarial Nets (GAN)
Generative Adversarial Nets の学習 [1]
12[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014.
…
…
?
⽣成画像
Z
G(Z)
⼊⼒画像が
本物の確率
本物画像 x
D(G(Z))
Generative Adversarial Nets (GAN)
Laplacian Pyramid of Generative Adversarial Nets [2]
13
[2] E. Denton, S. Chintala et al. Deep Generative Image Models using a Laplacian Pyramid of Adversarial
Networks. arXiv:1506.05751, 2015.
l 画像処理のテクニックと組み合わせて画像⽣成へ
周波数帯ごとに画像を⽣成していく
Generative Adversarial Nets (GAN)
Laplacian Pyramid of Generative Adversarial Nets [2]
14
[2] E. Denton, S. Chintala et al. Deep Generative Image Models using a Laplacian Pyramid of Adversarial
Networks. arXiv:1506.05751, 2015.
l 画像処理のテクニックと組み合わせて画像⽣成へ
周波数帯ごとに画像を⽣成していく
Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
15
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l ネットワークを Convolutional Neural Net にすることで
より複雑な,よりリアルな画像が⽣成出来るように
Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
16
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l ネットワークを Convolutional Neural Net にすることで
より複雑な,よりリアルな画像が⽣成出来るように
Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
17
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l Zの値を変えていくと,部屋の家具や背景が徐々に変化する
Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
18
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l ある属性の画像を⽣成するZ の平均ベクトルの演算で
⽣成される画像の操作が可能
⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3
Adversarial Networks による
画像⽣成に迫る
1. Why 画像⽣成?
2. Generative Adversarial Nets (GAN)
3. GANとならできること
4. まとめ
19
Generative Adversarial Nets (GAN) とならできること
Style Extraction [4]
20
l Autoencoder の中間層表現がある分布っぽいかどうかを
Dが判断する構造
l データ表現を任意の分布に落とし込める
[4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
Ex.) ここの表現を
正規分布にしたい!
Generative Adversarial Nets (GAN) とならできること
Style Extraction [4]
l 途中でカテゴリ情報を⼊れてやると,
Autoencoderはカテゴリに関係しない特徴 (Style)を獲得
[4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
途中でどのカテゴリか
教えてやる
スタイル情報を
好きな分布に落としこむ
(イメージ)
Generative Adversarial Nets (GAN) とならできること
Style Extraction [4]
22
l ⽣成したいカテゴリ情報 + 好きなスタイル特徴から
任意のスタイルの数字画像が⽣成できる
[4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
23
l Character-level convolutional-recurrent network で
コードされたテキストをGとDへ付与
l G はテキスト情報と乱数から画像を⽣成,
D は画像とテキストのマッチングも含めて判断
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
24
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l CUB(bird), Oxford-102(flower), MS-COCO で実験
Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
25
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l CUB(bird), Oxford-102(flower), MS-COCO で実験
Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
26
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l CUB(bird), Oxford-102(flower), MS-COCO で実験
Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
27
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l テキストとスタイル画像から所望の画像を⽣成する
Gと逆向きの (Zを推定する)
⽅向の学習器を作る
Generative Adversarial Nets (GAN) とならできること
Inpainting [6]
28[6] D. Pathak et al. Context Encoders: Feature Learning by Inpainting. arXiv: 1604.07379, 2016.
l G が⼀部がマスクされた画像を⽳埋めするように学習
à “真の画像との誤差(L2)”と”Dを騙したかの誤差”を最⼩化
l L2だけではボケた画像が⽣成されるが,
Adversarial Nets を使うことでシャープな inpainting
Generator
Network (G)
Encoder
Network
Discriminator
Network (D)
L2 loss
real/fake
Generative Adversarial Nets (GAN) とならできること
Inpainting [6]
29
[6] D. Pathak et al. Context Encoders: Feature Learning by Inpainting. arXiv: 1604.07379, 2016.
⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3
Adversarial Networks による
画像⽣成に迫る
1. Why 画像⽣成?
2. Generative Adversarial Nets (GAN)
3. GANとならできること
4. まとめ
30
まとめ
GAN の学習の概要と最近の研究事例
l “敵対的な” 2つの学習器を戦わせるという発想
l データの投げ⽅次第で⾊々なことができる
GAN で機械は芸術家の夢をGANGANみれるか?
l まだまだ低解像 (64x64程度) の画像までしか上⼿くいかない
l 最適化にすさまじい⼈智 (=テクニック) が必要
l しかし,〜っぽさという定量化が難しい問題に対しての
アプローチの選択肢になりつつあるのでは?
Fin.
32

More Related Content

What's hot

深層学習とTensorFlow入門
深層学習とTensorFlow入門深層学習とTensorFlow入門
深層学習とTensorFlow入門tak9029
 
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料tm_2648
 
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Hirokatsu Kataoka
 
深層学習 第4章 大規模深層学習の実現技術
深層学習 第4章 大規模深層学習の実現技術深層学習 第4章 大規模深層学習の実現技術
深層学習 第4章 大規模深層学習の実現技術孝昌 田中
 
Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷Taiga Nomi
 
Learning to forget continual prediction with lstm
Learning to forget continual prediction with lstmLearning to forget continual prediction with lstm
Learning to forget continual prediction with lstmFujimoto Keisuke
 
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイyohei okawa
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化Yusuke Uchida
 
[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence Learning[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence LearningDeep Learning JP
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...cvpaper. challenge
 
優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)cvpaper. challenge
 
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)Yoshitaka Ushiku
 
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会S_aiueo32
 
[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係について[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係についてDeep Learning JP
 

What's hot (20)

深層学習とTensorFlow入門
深層学習とTensorFlow入門深層学習とTensorFlow入門
深層学習とTensorFlow入門
 
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
 
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)
 
深層学習 第4章 大規模深層学習の実現技術
深層学習 第4章 大規模深層学習の実現技術深層学習 第4章 大規模深層学習の実現技術
深層学習 第4章 大規模深層学習の実現技術
 
Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷Deep learningの概要とドメインモデルの変遷
Deep learningの概要とドメインモデルの変遷
 
Learning to forget continual prediction with lstm
Learning to forget continual prediction with lstmLearning to forget continual prediction with lstm
Learning to forget continual prediction with lstm
 
MIRU2014 tutorial deeplearning
MIRU2014 tutorial deeplearningMIRU2014 tutorial deeplearning
MIRU2014 tutorial deeplearning
 
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
 
20150930
2015093020150930
20150930
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイ
 
深層学習入門
深層学習入門深層学習入門
深層学習入門
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
 
[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence Learning[DL輪読会]Convolutional Sequence to Sequence Learning
[DL輪読会]Convolutional Sequence to Sequence Learning
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
Deep learning入門
Deep learning入門Deep learning入門
Deep learning入門
 
優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)
 
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
 
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
 
[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係について[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係について
 

Viewers also liked

現在のDNNにおける未解決問題
現在のDNNにおける未解決問題現在のDNNにおける未解決問題
現在のDNNにおける未解決問題Daisuke Okanohara
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep LearningSeiya Tokui
 
Improving neural networks by preventing co adaptation of feature detectors
Improving neural networks by preventing co adaptation of feature detectorsImproving neural networks by preventing co adaptation of feature detectors
Improving neural networks by preventing co adaptation of feature detectorsJunya Saito
 
Distance Metric Learning
Distance Metric LearningDistance Metric Learning
Distance Metric LearningSanghyuk Chun
 
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...mmisono
 
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...Koichi Hamada
 
Metric learning ICML2010 tutorial
Metric learning  ICML2010 tutorialMetric learning  ICML2010 tutorial
Metric learning ICML2010 tutorialzukun
 
Information-Theoretic Metric Learning
Information-Theoretic Metric LearningInformation-Theoretic Metric Learning
Information-Theoretic Metric LearningKoji Matsuda
 

Viewers also liked (9)

現在のDNNにおける未解決問題
現在のDNNにおける未解決問題現在のDNNにおける未解決問題
現在のDNNにおける未解決問題
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
 
An Introduction to Metric Learning for Clustering
An Introduction to Metric Learning for ClusteringAn Introduction to Metric Learning for Clustering
An Introduction to Metric Learning for Clustering
 
Improving neural networks by preventing co adaptation of feature detectors
Improving neural networks by preventing co adaptation of feature detectorsImproving neural networks by preventing co adaptation of feature detectors
Improving neural networks by preventing co adaptation of feature detectors
 
Distance Metric Learning
Distance Metric LearningDistance Metric Learning
Distance Metric Learning
 
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
 
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
 
Metric learning ICML2010 tutorial
Metric learning  ICML2010 tutorialMetric learning  ICML2010 tutorial
Metric learning ICML2010 tutorial
 
Information-Theoretic Metric Learning
Information-Theoretic Metric LearningInformation-Theoretic Metric Learning
Information-Theoretic Metric Learning
 

Similar to Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3

Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2Daiki Shimada
 
DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用Kazuki Fujikawa
 
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめDigital Nature Group
 
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade ConvolutionsPredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutionsharmonylab
 
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...Deep Learning JP
 
20160601画像電子学会
20160601画像電子学会20160601画像電子学会
20160601画像電子学会nlab_utokyo
 
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...Deep Learning JP
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺n_hidekey
 
勉強会用スライド
勉強会用スライド勉強会用スライド
勉強会用スライドharmonylab
 
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況cvpaper. challenge
 
[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation
[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation
[DL輪読会]Adversarial Learning for Zero-shot Domain AdaptationDeep Learning JP
 
Rethinking and Beyond ImageNet
Rethinking and Beyond ImageNetRethinking and Beyond ImageNet
Rethinking and Beyond ImageNetcvpaper. challenge
 
【2016.07】cvpaper.challenge2016
【2016.07】cvpaper.challenge2016【2016.07】cvpaper.challenge2016
【2016.07】cvpaper.challenge2016cvpaper. challenge
 
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Preferred Networks
 
Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017Koichi Hamada
 
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介画像処理分野における研究事例紹介
画像処理分野における研究事例紹介nlab_utokyo
 
"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)
"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)
"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)Shoki Miyagawa
 
NIPS2015概要資料
NIPS2015概要資料NIPS2015概要資料
NIPS2015概要資料Shohei Hido
 
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)cvpaper. challenge
 
GANの簡単な理解から正しい理解まで
GANの簡単な理解から正しい理解までGANの簡単な理解から正しい理解まで
GANの簡単な理解から正しい理解までKazuma Komiya
 

Similar to Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3 (20)

Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
 
DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用
 
先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ先端技術とメディア表現 第4回レポートまとめ
先端技術とメディア表現 第4回レポートまとめ
 
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade ConvolutionsPredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
 
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
 
20160601画像電子学会
20160601画像電子学会20160601画像電子学会
20160601画像電子学会
 
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 
勉強会用スライド
勉強会用スライド勉強会用スライド
勉強会用スライド
 
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
 
[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation
[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation
[DL輪読会]Adversarial Learning for Zero-shot Domain Adaptation
 
Rethinking and Beyond ImageNet
Rethinking and Beyond ImageNetRethinking and Beyond ImageNet
Rethinking and Beyond ImageNet
 
【2016.07】cvpaper.challenge2016
【2016.07】cvpaper.challenge2016【2016.07】cvpaper.challenge2016
【2016.07】cvpaper.challenge2016
 
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
 
Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017
 
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介画像処理分野における研究事例紹介
画像処理分野における研究事例紹介
 
"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)
"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)
"There and Back Again: Revisiting Backpropagation Saliency Methods" (CVPR2020)
 
NIPS2015概要資料
NIPS2015概要資料NIPS2015概要資料
NIPS2015概要資料
 
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
 
GANの簡単な理解から正しい理解まで
GANの簡単な理解から正しい理解までGANの簡単な理解から正しい理解まで
GANの簡単な理解から正しい理解まで
 

Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3

  • 1. 全脳アーキテクチャ若⼿の会 カジュアルトーク#3 (2016.6.4) Adversarial Networks による画像⽣成に迫る 全脳アーキテクチャ若⼿の会 法政⼤学⼤学院 理⼯学研究科 修⼠課程 島⽥ ⼤樹
  • 2. ⾃⼰紹介 島⽥ ⼤樹 (SHIMADA Daiki) @sheema_sheema (Twitter) • 法政⼤学⼤学院 理⼯学研究科 M2 • 画像解析による授業受講者の態度推定 • 深層学習関連⼿法の提案 • 全脳アーキテクチャ若⼿の会 副代表 • 会全体の運営 (運営メンバー⼤募集中!!) • 2014年第2回勉強会 発表者 1
  • 3. 前回のあらすじ l カジュアルにCNN系⽂献64本ノック! http://www.slideshare.net/sheemap/convolutional-neural-networks-wbafl2 Convolutional Neural Networks (CNN) の研究動向 2 l 今⽇はこの中の画像⽣成を ちょっとだけ追ってみます!
  • 4. ⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3 Adversarial Networks による 画像⽣成に迫る 1. Why 画像⽣成? 2. Generative Adversarial Nets (GAN) 3. GANとならできること 4. まとめ 3
  • 5. Why 画像⽣成? l 普通に⾒ていて⾯⽩い l (絵が下⼿な⼈もクリエイティブになれる…?) 絵を描く機械って⾯⽩くないですか?
  • 8. ⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3 Adversarial Networks による 画像⽣成に迫る 1. Why 画像⽣成? 2. Generative Adversarial Nets (GAN) 3. GANとならできること 4. まとめ 7
  • 9. Generative Adversarial Nets (GAN) l Generator (⽣成部) と Discriminator (判別部) で構成 Generative Adversarial Nets [1] 8[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014. Generator Network (G) Discriminator Network (D) … … ? ⽣成画像 Z G(Z) ⼊⼒画像が 本物の確率
  • 10. Generative Adversarial Nets (GAN) l ⽬標1: Dは⼊⼒が本物の画像がどうか⾒分ける Generative Adversarial Nets の学習 [1] 9[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014. Discriminator Network (D) …? ⽣成画像 G(Z) ⼊⼒画像が 本物の確率 [0, 1] 本物画像 x X か G(Z) どちらかが ⼊⼒される
  • 11. Generative Adversarial Nets (GAN) l ⽬標2: GはDを騙すような画像を⽣成する Generative Adversarial Nets の学習 [1] 10[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014. Generator Network (G) Discriminator Network (D) … … ? ⽣成画像 Z G(Z) ⼊⼒画像が 本物の確率 D(G(Z)) の フィードバック D(G(Z))
  • 12. Generative Adversarial Nets (GAN) Generative Adversarial Nets の学習 [1] 11[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014. … … ? ⽣成画像 Z G(Z) ⼊⼒画像が 本物の確率 本物画像 x D(x)
  • 13. Generative Adversarial Nets (GAN) Generative Adversarial Nets の学習 [1] 12[1] I.J. Goodfellow et al. Generative Adversarial Nets. arXiv:1406.2661, 2014. … … ? ⽣成画像 Z G(Z) ⼊⼒画像が 本物の確率 本物画像 x D(G(Z))
  • 14. Generative Adversarial Nets (GAN) Laplacian Pyramid of Generative Adversarial Nets [2] 13 [2] E. Denton, S. Chintala et al. Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks. arXiv:1506.05751, 2015. l 画像処理のテクニックと組み合わせて画像⽣成へ 周波数帯ごとに画像を⽣成していく
  • 15. Generative Adversarial Nets (GAN) Laplacian Pyramid of Generative Adversarial Nets [2] 14 [2] E. Denton, S. Chintala et al. Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks. arXiv:1506.05751, 2015. l 画像処理のテクニックと組み合わせて画像⽣成へ 周波数帯ごとに画像を⽣成していく
  • 16. Generative Adversarial Nets (GAN) Deep Convolutional Generative Adversarial Nets [3] 15 [3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Netwroks. arXiv: 1511.06434, 2015. l ネットワークを Convolutional Neural Net にすることで より複雑な,よりリアルな画像が⽣成出来るように
  • 17. Generative Adversarial Nets (GAN) Deep Convolutional Generative Adversarial Nets [3] 16 [3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Netwroks. arXiv: 1511.06434, 2015. l ネットワークを Convolutional Neural Net にすることで より複雑な,よりリアルな画像が⽣成出来るように
  • 18. Generative Adversarial Nets (GAN) Deep Convolutional Generative Adversarial Nets [3] 17 [3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Netwroks. arXiv: 1511.06434, 2015. l Zの値を変えていくと,部屋の家具や背景が徐々に変化する
  • 19. Generative Adversarial Nets (GAN) Deep Convolutional Generative Adversarial Nets [3] 18 [3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Netwroks. arXiv: 1511.06434, 2015. l ある属性の画像を⽣成するZ の平均ベクトルの演算で ⽣成される画像の操作が可能
  • 20. ⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3 Adversarial Networks による 画像⽣成に迫る 1. Why 画像⽣成? 2. Generative Adversarial Nets (GAN) 3. GANとならできること 4. まとめ 19
  • 21. Generative Adversarial Nets (GAN) とならできること Style Extraction [4] 20 l Autoencoder の中間層表現がある分布っぽいかどうかを Dが判断する構造 l データ表現を任意の分布に落とし込める [4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015. Ex.) ここの表現を 正規分布にしたい!
  • 22. Generative Adversarial Nets (GAN) とならできること Style Extraction [4] l 途中でカテゴリ情報を⼊れてやると, Autoencoderはカテゴリに関係しない特徴 (Style)を獲得 [4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015. 途中でどのカテゴリか 教えてやる スタイル情報を 好きな分布に落としこむ (イメージ)
  • 23. Generative Adversarial Nets (GAN) とならできること Style Extraction [4] 22 l ⽣成したいカテゴリ情報 + 好きなスタイル特徴から 任意のスタイルの数字画像が⽣成できる [4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
  • 24. Generative Adversarial Nets (GAN) とならできること Text to Image [5] 23 l Character-level convolutional-recurrent network で コードされたテキストをGとDへ付与 l G はテキスト情報と乱数から画像を⽣成, D は画像とテキストのマッチングも含めて判断 [5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
  • 25. Generative Adversarial Nets (GAN) とならできること Text to Image [5] 24 [5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016. l CUB(bird), Oxford-102(flower), MS-COCO で実験
  • 26. Generative Adversarial Nets (GAN) とならできること Text to Image [5] 25 [5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016. l CUB(bird), Oxford-102(flower), MS-COCO で実験
  • 27. Generative Adversarial Nets (GAN) とならできること Text to Image [5] 26 [5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016. l CUB(bird), Oxford-102(flower), MS-COCO で実験
  • 28. Generative Adversarial Nets (GAN) とならできること Text to Image [5] 27 [5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016. l テキストとスタイル画像から所望の画像を⽣成する Gと逆向きの (Zを推定する) ⽅向の学習器を作る
  • 29. Generative Adversarial Nets (GAN) とならできること Inpainting [6] 28[6] D. Pathak et al. Context Encoders: Feature Learning by Inpainting. arXiv: 1604.07379, 2016. l G が⼀部がマスクされた画像を⽳埋めするように学習 à “真の画像との誤差(L2)”と”Dを騙したかの誤差”を最⼩化 l L2だけではボケた画像が⽣成されるが, Adversarial Nets を使うことでシャープな inpainting Generator Network (G) Encoder Network Discriminator Network (D) L2 loss real/fake
  • 30. Generative Adversarial Nets (GAN) とならできること Inpainting [6] 29 [6] D. Pathak et al. Context Encoders: Feature Learning by Inpainting. arXiv: 1604.07379, 2016.
  • 31. ⽬次 全脳アーキテクチャ若⼿の会 カジュアルトーク#3 Adversarial Networks による 画像⽣成に迫る 1. Why 画像⽣成? 2. Generative Adversarial Nets (GAN) 3. GANとならできること 4. まとめ 30
  • 32. まとめ GAN の学習の概要と最近の研究事例 l “敵対的な” 2つの学習器を戦わせるという発想 l データの投げ⽅次第で⾊々なことができる GAN で機械は芸術家の夢をGANGANみれるか? l まだまだ低解像 (64x64程度) の画像までしか上⼿くいかない l 最適化にすさまじい⼈智 (=テクニック) が必要 l しかし,〜っぽさという定量化が難しい問題に対しての アプローチの選択肢になりつつあるのでは?