SlideShare a Scribd company logo
1 of 30
1	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Generative Adversarial Networksの
学習方法進展・画像生成・教師なし画像変換
濱田晃一
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
AI研究開発グループ 週次セミナー
2017/04/20
@hamadakoichi
2	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
AGENDA
◆GANの教師なし画像変換
◆Generative Adversarial Networks(GAN)
◆GANの学習方法進展・画像生成
3	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
AGENDA
◆GANの教師なし画像変換
◆Generative Adversarial Networks(GAN)
◆GANの学習方法進展・画像生成
4	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Generative Adversarial Nets(GAN) (Goodfellow+2014)
Generative Adversarial Nets.
Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu,
David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio.
arXiv:1406.2661. In NIPS 2014.
5	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Generative Adversarial Nets(GAN) (Goodfellow+2014)
Generator(生成器)と Discriminator(識別器)を戦わせ
生成精度を向上させる
識別器: “本物データ”と “生成器が作った生成データ”を識別する
生成器: 生成データを識別器に“本物データ”と誤識別させようとする
(Goodfellow+, NIPS2014, Deep Learning Workshop, Presentation)
6	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Generative Adversarial Nets(GAN) (Goodfellow+2014)
Minimax Objective function
Discriminator が
「本物データ」を「本物」と識別
(Goodfellow+, NIPS2014, Deep Learning Workshop, Presentation)
Discriminator が
「生成データ」を「偽物」と識別する
Discriminatorは
正しく識別しようとする
(最大化)
Generatorは Discriminator に誤識別させようとする(最小化)
Generator(生成器)と Discriminator(識別器)を戦わせ
生成精度を向上させる
7	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Generative Adversarial Nets(GAN) (Goodfellow+2014)
SGDで Discriminator k回、Generator 1回と交互に学習
MCMC等のSampling必要なく、Back Propagation で解ける
Discriminatorでの
最大化(k 回)
Generator での
最小化(1回)
8	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
AGENDA
◆GANの教師なし画像変換
◆Generative Adversarial Networks(GAN)
◆GANの学習方法進展・画像生成
9	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
学習が難しいGAN。Batch Normalization、LeakyReLU、Adam、等、
学習の安定化のための各種工夫。クリアな画像生成を実現。
DCGAN (Radford+2015)
自然画像のクリアな画像生成 画像演算
Unsupervised Representation Learning with Deep
Convolutional Generative Adversarial Networks.
Alec Radford, Luke Metz, Soumith Chintala.
arXiv:1511.06434. In ICLR 2016.
10	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Improved Techniques for Training GAN (Salimans+2016)
Improved Techniques for Training GANs.
Tim Salimans, Ian Goodfellow, Wojciech
Zaremba, Vicki Cheung, Alec Radford, Xi Chen.
arXiv:1606.03498. In NIPS 2016.
GANの学習安定化のための各種技術
DCGANとこれらの技術で、2016年以降GAN研究が活発に
1. Feature Matching
2. Minibatch discrimination
3. Historical averaging
4. One-sided label smoothing
5. Virtual batch normalization
Techniques Semi-supervised learning
MNIST
Semi-supervised training
with feature matching
Semi-supervised training
with feature matching and
minibatch discrimination
CIFAR-10
Generated samples
11	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Extended Architectures for GAN (2016)
幅広い・クリアな画像生成のための各種GAN拡張
Figure by Chris Olah (2016) :https://twitter.com/ch402/status/793535193835417601
Ex)
Conditional Image Synthesis
With Auxiliary Classifier GANs.
Augustus Odena, Christopher
Olah, Jonathon Shlens.
arXiv: 1610.09585.
12	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
InfoGAN (Chen+2016)
InfoGAN: Interpretable Representation
Learning by Information Maximizing
Generative Adversarial Nets.
Xi Chen, Yan Duan, Rein Houthooft, John
Schulman, Ilya Sutskever, Pieter Abbeel.
arXiv:1606.03657. In NIPS 2016
Latent code c、Generator 出力との Mutual Information を加え
GANで狙って表現ベクトル空間を学習
13	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
StackGAN (Zhang+2016)
1段目で文章から低解像度画像を生成
2段目で低解像度画像から高解像度画像を生成
StackGAN: Text to Photo-realistic Image
Synthesis with Stacked Generative Adversarial
Networks.
Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang,
Xiaolei Huang, Xiaogang Wang, Dimitris Metaxas.
arXiv:1612.03242.
256 x 256 Image
14	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Plug & Play Generative Networks (Nguyen+2016)
ImageNet1000カテゴリの幅広い対象で
高解像度の画像生成
Plug & Play Generative Networks: Conditional
Iterative Generation of Images in Latent Space.
Anh Nguyen, Jason Yosinski, Yoshua Bengio,
Alexey Dosovitskiy, Jeff Clune.
arXiv:1612.00005.
227 x 227 Image
15	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
f-GAN (Nowozin+2016)
GAN目的関数を Symmetric JS-divergence から
f-divergence に一般化。各Divergence を用い学習・評価
f-GAN: Training Generative
Neural samplers using
variational Divergence
Minimization.
Sebastian Nowozin, Botond
Cseke, Ryota Tomioka.
arXiv:1606.00709.
In NIPS 2016.
Kernel Density Estimation on the MNIST
f-divergence
LSUN
16	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
WGAN (Arjovsky+2017)
Wasserstein計量を用いたGenerator勾配損失の解消、学習の安定化
CriticがWasserstein計量を算出、Generatorが最小化
Wasserstein GAN.
Martin Arjovsky, Soumith Chintala, Léon Bottou.
arXiv:1701.07875.
LSUN
Wasserstein-1 metric
17	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
LSGAN(Mao+2017)
Sigmoidに替え二乗誤差を用いた学習安定化
生成データ・実データをマージンありで識別
Least Squares Generative Adversarial Networks.
Xudong Mao, Qing Li, Haoran Xie, Raymond Y.K. Lau, Zhen
Wang, Stephen Paul Smolley.
arXiv:1611.04076. (v2 update: 2017/2/24)
Least square loss functionSigmoid cross entropy loss function
18	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
BEGAN(Berthelot+2017)
AutoEncoderのDiscriminatorが生成・実画像の識別、実データ復元
生成画像の多様性・クリアさを指定した生成制御
BEGAN: Boundary Equilibrium Generative Adversarial
Networks.
David Berthelot, Thomas Schumm, Luke Metz.
arXiv:1703.10717.
128 x 128 image
Objective Function
Diversity/Sharpness Ratio
19	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
WGAN with Gradient Penalty (Gulrajani+2017)
WGANで Lipschitz制約(勾配上限制約)を、Weight Clipping のかわ
りに、Gradient Penaltyを用い記述。高次の分布特徴を捉えられる
…
Improved Training of Wasserstein GANs.
Ishaan Gulrajani, Faruk Ahmed, Martin Arjovsky, Vincent Dumoulin,
Aaron Courville.
arXiv:1704.00028.
Original critic loss Gradient penalty
20	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
AGENDA
◆GANの教師なし画像変換
◆Generative Adversarial Networks(GAN)
◆GANの学習方法進展・画像生成
21	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
画像ドメイン間の画像変換
対応関係の教師なしの、各画像集合のみを用いた変換学習
Unsupervised Image to Image translation
(Figures: Zhu+ 2017)
22	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
同一の表現ベクトル z から2つのGeneratorで各ドメイン画像を生成
Discriminator が生成画像と、ドメインの実画像を識別
CoGAN (Liu+ 2016)
Coupled Generative Adversarial Networks.
Ming-Yu Liu, Oncel Tuzel.
arXiv:1606.07536. In NIPS 2016.
RGB and Depth Images
23	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
VAE+CoGAN. 各ドメイン画像からEncoderで表現ベクトルzを作り
同一&別ドメインそれぞれのGenerator画像生成・Discriminator識別
UNIT (Liu+2017)
Unsupervised Image-to-Image Translation
Networks.
Ming-Yu Liu, Thomas Breuel, Jan Kautz.
arXiv:1703.00848
24	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
2方向のDomain変換のGenerator。変換画像と実画像で各Domain
Discriminatorで識別。2回Domain変換し戻した画像復元、による学習
DiscoGAN (Kim+2017)
Learning to Discover Cross-Domain Relations with Generative
Adversarial Networks.
Taeksoo Kim, Moonsu Cha, Hyunsoo Kim, Jungkwon Lee, Jiwon Kim.
arXiv:1703.05192.
25	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
2方向のDomain変換のGenerator。変換画像と実画像で各Domain
Discriminatorで識別。2回Domain変換し戻した画像復元、による学習
Unpaired Image-to-Image Translation using Cycle-
Consistent Adversarial Networks.
Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros
arXiv:1703.10593.
CycleGAN (Zhu+2017)
26	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
2方向のDomain変換のGenerator。変換画像と実画像で各Domain
Discriminatorで識別。2回Domain変換し戻した画像復元、による学習
Adversarial Loss
Cyclic consistency Loss
Least Square Loss (LSGAN)
Objective Function
Unpaired Image-to-Image Translation using Cycle-
Consistent Adversarial Networks.
Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros
arXiv:1703.10593.
CycleGAN (Zhu+2017)
27	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Photographs to Paintings
CycleGAN (Zhu+2017)
28	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
Monet paintings to Photographs
CycleGAN (Zhu+2017)
29	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
AGENDA
◆GANの教師なし画像変換
◆Generative Adversarial Networks(GAN)
◆GANの学習方法進展・画像生成
30	
Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved.
まとめ
・GANの学習方法進展、画像生成、教師なし画像変換、を紹介。
・GAN学習方法に関する研究が活発に行われ、生成のクオリティ向
上、多様性の向上、生成制御、学習安定化、等、進んでいる。
・教師なし画像変換も、GANを用いた新たな学習方法が試され、質
向上している。

More Related Content

What's hot

What's hot (20)

[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
 
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 
IIBMP2016 深層生成モデルによる表現学習
IIBMP2016 深層生成モデルによる表現学習IIBMP2016 深層生成モデルによる表現学習
IIBMP2016 深層生成モデルによる表現学習
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
 
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
 
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
 
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)
 
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models
 
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
 
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 

Viewers also liked

Viewers also liked (12)

Node-RED x Lazurite 3分で作るIoTシステム
Node-RED x Lazurite 3分で作るIoTシステムNode-RED x Lazurite 3分で作るIoTシステム
Node-RED x Lazurite 3分で作るIoTシステム
 
DeNAのAI活用したサービス開発
DeNAのAI活用したサービス開発DeNAのAI活用したサービス開発
DeNAのAI活用したサービス開発
 
[DL輪読会]Generative Models of Visually Grounded Imagination
[DL輪読会]Generative Models of Visually Grounded Imagination[DL輪読会]Generative Models of Visually Grounded Imagination
[DL輪読会]Generative Models of Visually Grounded Imagination
 
Language as a Latent Variable: Discrete Generative Models for Sentence Compre...
Language as a Latent Variable: Discrete Generative Models for Sentence Compre...Language as a Latent Variable: Discrete Generative Models for Sentence Compre...
Language as a Latent Variable: Discrete Generative Models for Sentence Compre...
 
[DL輪読会]Image-to-Image Translation with Conditional Adversarial Networks
[DL輪読会]Image-to-Image Translation with Conditional Adversarial Networks[DL輪読会]Image-to-Image Translation with Conditional Adversarial Networks
[DL輪読会]Image-to-Image Translation with Conditional Adversarial Networks
 
[DL輪読会]StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generat...
[DL輪読会]StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generat...[DL輪読会]StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generat...
[DL輪読会]StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generat...
 
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
 
NIPS 2016 Overview and Deep Learning Topics
NIPS 2016 Overview and Deep Learning Topics  NIPS 2016 Overview and Deep Learning Topics
NIPS 2016 Overview and Deep Learning Topics
 
現在のDNNにおける未解決問題
現在のDNNにおける未解決問題現在のDNNにおける未解決問題
現在のDNNにおける未解決問題
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
 
機械学習の理論と実践
機械学習の理論と実践機械学習の理論と実践
機械学習の理論と実践
 
Deep Learning - The Past, Present and Future of Artificial Intelligence
Deep Learning - The Past, Present and Future of Artificial IntelligenceDeep Learning - The Past, Present and Future of Artificial Intelligence
Deep Learning - The Past, Present and Future of Artificial Intelligence
 

Similar to Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換

【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation” 【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
yoshitaka373
 
Mobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechcon
Mobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechconMobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechcon
Mobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechcon
DeNA
 

Similar to Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換 (19)

Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017Generative Adversarial Networks (GAN) @ NIPS2017
Generative Adversarial Networks (GAN) @ NIPS2017
 
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
 
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
 
Icml2018読み会_overview&GANs
Icml2018読み会_overview&GANsIcml2018読み会_overview&GANs
Icml2018読み会_overview&GANs
 
CycleGANについて
CycleGANについてCycleGANについて
CycleGANについて
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
強化学習技術とゲーム AI 〜 今できる事と今後できて欲しい事 〜
強化学習技術とゲーム AI  〜 今できる事と今後できて欲しい事 〜強化学習技術とゲーム AI  〜 今できる事と今後できて欲しい事 〜
強化学習技術とゲーム AI 〜 今できる事と今後できて欲しい事 〜
 
Large Scale GAN Training for High Fidelity Natural Image Synthesis
Large Scale GAN Training for High Fidelity Natural Image SynthesisLarge Scale GAN Training for High Fidelity Natural Image Synthesis
Large Scale GAN Training for High Fidelity Natural Image Synthesis
 
Bridging between Vision and Language
Bridging between Vision and LanguageBridging between Vision and Language
Bridging between Vision and Language
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
 
ディープラーニングの車載応用に向けて
ディープラーニングの車載応用に向けてディープラーニングの車載応用に向けて
ディープラーニングの車載応用に向けて
 
DeNAの大規模データマイニング活用したサービス開発
DeNAの大規模データマイニング活用したサービス開発DeNAの大規模データマイニング活用したサービス開発
DeNAの大規模データマイニング活用したサービス開発
 
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation” 【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
 
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learningドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
ドライブレコーダーの Scene Text Recognitionにおける Multi-task Learning
 
[CVPR2020読み会@CV勉強会] 3D Packing for Self-Supervised Monocular Depth Estimation
[CVPR2020読み会@CV勉強会] 3D Packing for Self-Supervised Monocular Depth Estimation[CVPR2020読み会@CV勉強会] 3D Packing for Self-Supervised Monocular Depth Estimation
[CVPR2020読み会@CV勉強会] 3D Packing for Self-Supervised Monocular Depth Estimation
 
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
 
DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用
 
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
 
Mobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechcon
Mobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechconMobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechcon
Mobage/AndAppのSDK開発事例とSDKを作る際に知っておくべきこと #denatechcon
 

More from Koichi Hamada

Mahout JP - #TokyoWebmining 11th #MahoutJP
Mahout JP -  #TokyoWebmining 11th #MahoutJP Mahout JP -  #TokyoWebmining 11th #MahoutJP
Mahout JP - #TokyoWebmining 11th #MahoutJP
Koichi Hamada
 

More from Koichi Hamada (20)

Anime Generation with AI
Anime Generation with AIAnime Generation with AI
Anime Generation with AI
 
Generative Adversarial Networks @ ICML 2019
Generative Adversarial Networks @ ICML 2019Generative Adversarial Networks @ ICML 2019
Generative Adversarial Networks @ ICML 2019
 
AIによるアニメ生成の挑戦
AIによるアニメ生成の挑戦AIによるアニメ生成の挑戦
AIによるアニメ生成の挑戦
 
Generative Adversarial Networks (GANs) and Disentangled Representations @ N...
Generative Adversarial Networks (GANs) and Disentangled Representations @ N...Generative Adversarial Networks (GANs) and Disentangled Representations @ N...
Generative Adversarial Networks (GANs) and Disentangled Representations @ N...
 
対話返答生成における個性の追加反映
対話返答生成における個性の追加反映対話返答生成における個性の追加反映
対話返答生成における個性の追加反映
 
DeNAの機械学習・深層学習活用した 体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した 体験提供の挑戦
 
『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014
『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014
『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014
 
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- 『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
 
複雑ネットワーク上の伝搬法則の数理
複雑ネットワーク上の伝搬法則の数理複雑ネットワーク上の伝搬法則の数理
複雑ネットワーク上の伝搬法則の数理
 
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
 
データマイニングCROSS 第2部-機械学習・大規模分散処理
データマイニングCROSS 第2部-機械学習・大規模分散処理データマイニングCROSS 第2部-機械学習・大規模分散処理
データマイニングCROSS 第2部-機械学習・大規模分散処理
 
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #HadoopLarge Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
 
"Mahout Recommendation" - #TokyoWebmining 14th
"Mahout Recommendation" -  #TokyoWebmining 14th"Mahout Recommendation" -  #TokyoWebmining 14th
"Mahout Recommendation" - #TokyoWebmining 14th
 
Mahout JP - #TokyoWebmining 11th #MahoutJP
Mahout JP -  #TokyoWebmining 11th #MahoutJP Mahout JP -  #TokyoWebmining 11th #MahoutJP
Mahout JP - #TokyoWebmining 11th #MahoutJP
 
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
 
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011 『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
 
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR  #11「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR  #11
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
 
Mahout Canopy Clustering - #TokyoWebmining 9
Mahout Canopy Clustering - #TokyoWebmining 9Mahout Canopy Clustering - #TokyoWebmining 9
Mahout Canopy Clustering - #TokyoWebmining 9
 
Apache Mahout - Random Forests - #TokyoWebmining #8
Apache Mahout - Random Forests - #TokyoWebmining #8 Apache Mahout - Random Forests - #TokyoWebmining #8
Apache Mahout - Random Forests - #TokyoWebmining #8
 
「樹木モデルとランダムフォレスト-機械学習による分類・予測-」-データマイニングセミナー
「樹木モデルとランダムフォレスト-機械学習による分類・予測-」-データマイニングセミナー「樹木モデルとランダムフォレスト-機械学習による分類・予測-」-データマイニングセミナー
「樹木モデルとランダムフォレスト-機械学習による分類・予測-」-データマイニングセミナー
 

Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換

  • 1. 1 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Generative Adversarial Networksの 学習方法進展・画像生成・教師なし画像変換 濱田晃一 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. AI研究開発グループ 週次セミナー 2017/04/20 @hamadakoichi
  • 2. 2 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. AGENDA ◆GANの教師なし画像変換 ◆Generative Adversarial Networks(GAN) ◆GANの学習方法進展・画像生成
  • 3. 3 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. AGENDA ◆GANの教師なし画像変換 ◆Generative Adversarial Networks(GAN) ◆GANの学習方法進展・画像生成
  • 4. 4 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Generative Adversarial Nets(GAN) (Goodfellow+2014) Generative Adversarial Nets. Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio. arXiv:1406.2661. In NIPS 2014.
  • 5. 5 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Generative Adversarial Nets(GAN) (Goodfellow+2014) Generator(生成器)と Discriminator(識別器)を戦わせ 生成精度を向上させる 識別器: “本物データ”と “生成器が作った生成データ”を識別する 生成器: 生成データを識別器に“本物データ”と誤識別させようとする (Goodfellow+, NIPS2014, Deep Learning Workshop, Presentation)
  • 6. 6 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Generative Adversarial Nets(GAN) (Goodfellow+2014) Minimax Objective function Discriminator が 「本物データ」を「本物」と識別 (Goodfellow+, NIPS2014, Deep Learning Workshop, Presentation) Discriminator が 「生成データ」を「偽物」と識別する Discriminatorは 正しく識別しようとする (最大化) Generatorは Discriminator に誤識別させようとする(最小化) Generator(生成器)と Discriminator(識別器)を戦わせ 生成精度を向上させる
  • 7. 7 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Generative Adversarial Nets(GAN) (Goodfellow+2014) SGDで Discriminator k回、Generator 1回と交互に学習 MCMC等のSampling必要なく、Back Propagation で解ける Discriminatorでの 最大化(k 回) Generator での 最小化(1回)
  • 8. 8 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. AGENDA ◆GANの教師なし画像変換 ◆Generative Adversarial Networks(GAN) ◆GANの学習方法進展・画像生成
  • 9. 9 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. 学習が難しいGAN。Batch Normalization、LeakyReLU、Adam、等、 学習の安定化のための各種工夫。クリアな画像生成を実現。 DCGAN (Radford+2015) 自然画像のクリアな画像生成 画像演算 Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. Alec Radford, Luke Metz, Soumith Chintala. arXiv:1511.06434. In ICLR 2016.
  • 10. 10 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Improved Techniques for Training GAN (Salimans+2016) Improved Techniques for Training GANs. Tim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chen. arXiv:1606.03498. In NIPS 2016. GANの学習安定化のための各種技術 DCGANとこれらの技術で、2016年以降GAN研究が活発に 1. Feature Matching 2. Minibatch discrimination 3. Historical averaging 4. One-sided label smoothing 5. Virtual batch normalization Techniques Semi-supervised learning MNIST Semi-supervised training with feature matching Semi-supervised training with feature matching and minibatch discrimination CIFAR-10 Generated samples
  • 11. 11 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Extended Architectures for GAN (2016) 幅広い・クリアな画像生成のための各種GAN拡張 Figure by Chris Olah (2016) :https://twitter.com/ch402/status/793535193835417601 Ex) Conditional Image Synthesis With Auxiliary Classifier GANs. Augustus Odena, Christopher Olah, Jonathon Shlens. arXiv: 1610.09585.
  • 12. 12 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. InfoGAN (Chen+2016) InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets. Xi Chen, Yan Duan, Rein Houthooft, John Schulman, Ilya Sutskever, Pieter Abbeel. arXiv:1606.03657. In NIPS 2016 Latent code c、Generator 出力との Mutual Information を加え GANで狙って表現ベクトル空間を学習
  • 13. 13 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. StackGAN (Zhang+2016) 1段目で文章から低解像度画像を生成 2段目で低解像度画像から高解像度画像を生成 StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks. Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, Xiaolei Huang, Xiaogang Wang, Dimitris Metaxas. arXiv:1612.03242. 256 x 256 Image
  • 14. 14 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Plug & Play Generative Networks (Nguyen+2016) ImageNet1000カテゴリの幅広い対象で 高解像度の画像生成 Plug & Play Generative Networks: Conditional Iterative Generation of Images in Latent Space. Anh Nguyen, Jason Yosinski, Yoshua Bengio, Alexey Dosovitskiy, Jeff Clune. arXiv:1612.00005. 227 x 227 Image
  • 15. 15 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. f-GAN (Nowozin+2016) GAN目的関数を Symmetric JS-divergence から f-divergence に一般化。各Divergence を用い学習・評価 f-GAN: Training Generative Neural samplers using variational Divergence Minimization. Sebastian Nowozin, Botond Cseke, Ryota Tomioka. arXiv:1606.00709. In NIPS 2016. Kernel Density Estimation on the MNIST f-divergence LSUN
  • 16. 16 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. WGAN (Arjovsky+2017) Wasserstein計量を用いたGenerator勾配損失の解消、学習の安定化 CriticがWasserstein計量を算出、Generatorが最小化 Wasserstein GAN. Martin Arjovsky, Soumith Chintala, Léon Bottou. arXiv:1701.07875. LSUN Wasserstein-1 metric
  • 17. 17 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. LSGAN(Mao+2017) Sigmoidに替え二乗誤差を用いた学習安定化 生成データ・実データをマージンありで識別 Least Squares Generative Adversarial Networks. Xudong Mao, Qing Li, Haoran Xie, Raymond Y.K. Lau, Zhen Wang, Stephen Paul Smolley. arXiv:1611.04076. (v2 update: 2017/2/24) Least square loss functionSigmoid cross entropy loss function
  • 18. 18 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. BEGAN(Berthelot+2017) AutoEncoderのDiscriminatorが生成・実画像の識別、実データ復元 生成画像の多様性・クリアさを指定した生成制御 BEGAN: Boundary Equilibrium Generative Adversarial Networks. David Berthelot, Thomas Schumm, Luke Metz. arXiv:1703.10717. 128 x 128 image Objective Function Diversity/Sharpness Ratio
  • 19. 19 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. WGAN with Gradient Penalty (Gulrajani+2017) WGANで Lipschitz制約(勾配上限制約)を、Weight Clipping のかわ りに、Gradient Penaltyを用い記述。高次の分布特徴を捉えられる … Improved Training of Wasserstein GANs. Ishaan Gulrajani, Faruk Ahmed, Martin Arjovsky, Vincent Dumoulin, Aaron Courville. arXiv:1704.00028. Original critic loss Gradient penalty
  • 20. 20 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. AGENDA ◆GANの教師なし画像変換 ◆Generative Adversarial Networks(GAN) ◆GANの学習方法進展・画像生成
  • 21. 21 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. 画像ドメイン間の画像変換 対応関係の教師なしの、各画像集合のみを用いた変換学習 Unsupervised Image to Image translation (Figures: Zhu+ 2017)
  • 22. 22 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. 同一の表現ベクトル z から2つのGeneratorで各ドメイン画像を生成 Discriminator が生成画像と、ドメインの実画像を識別 CoGAN (Liu+ 2016) Coupled Generative Adversarial Networks. Ming-Yu Liu, Oncel Tuzel. arXiv:1606.07536. In NIPS 2016. RGB and Depth Images
  • 23. 23 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. VAE+CoGAN. 各ドメイン画像からEncoderで表現ベクトルzを作り 同一&別ドメインそれぞれのGenerator画像生成・Discriminator識別 UNIT (Liu+2017) Unsupervised Image-to-Image Translation Networks. Ming-Yu Liu, Thomas Breuel, Jan Kautz. arXiv:1703.00848
  • 24. 24 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. 2方向のDomain変換のGenerator。変換画像と実画像で各Domain Discriminatorで識別。2回Domain変換し戻した画像復元、による学習 DiscoGAN (Kim+2017) Learning to Discover Cross-Domain Relations with Generative Adversarial Networks. Taeksoo Kim, Moonsu Cha, Hyunsoo Kim, Jungkwon Lee, Jiwon Kim. arXiv:1703.05192.
  • 25. 25 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. 2方向のDomain変換のGenerator。変換画像と実画像で各Domain Discriminatorで識別。2回Domain変換し戻した画像復元、による学習 Unpaired Image-to-Image Translation using Cycle- Consistent Adversarial Networks. Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros arXiv:1703.10593. CycleGAN (Zhu+2017)
  • 26. 26 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. 2方向のDomain変換のGenerator。変換画像と実画像で各Domain Discriminatorで識別。2回Domain変換し戻した画像復元、による学習 Adversarial Loss Cyclic consistency Loss Least Square Loss (LSGAN) Objective Function Unpaired Image-to-Image Translation using Cycle- Consistent Adversarial Networks. Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros arXiv:1703.10593. CycleGAN (Zhu+2017)
  • 27. 27 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Photographs to Paintings CycleGAN (Zhu+2017)
  • 28. 28 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. Monet paintings to Photographs CycleGAN (Zhu+2017)
  • 29. 29 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. AGENDA ◆GANの教師なし画像変換 ◆Generative Adversarial Networks(GAN) ◆GANの学習方法進展・画像生成
  • 30. 30 Copyright (C) 2014 DeNA Co.,Ltd. All Rights Reserved. まとめ ・GANの学習方法進展、画像生成、教師なし画像変換、を紹介。 ・GAN学習方法に関する研究が活発に行われ、生成のクオリティ向 上、多様性の向上、生成制御、学習安定化、等、進んでいる。 ・教師なし画像変換も、GANを用いた新たな学習方法が試され、質 向上している。