텐서플로우 2.0 튜토리얼 - RNN

TensorFlow 2.0 Tutorial
RNN
김환희
2019.05.25

목차
• RNN 소개
• Tensorflow 2.0 - RNN
• Tensorflow 2.0 Sample code - RNN

RNN
• Recurrent Neural Network
• Recurrent : 반복적인, 순환하는
입력
X
출력
Y
출력
Y
입력
X
DNN RNN
일반적인 딥러닝 구조 RNN 의 되먹임 구조

RNN
• Recurrent Neural Network
• 같은 네트워크로 변화하는 입력에 대한 출력을 얻어냄
• 모든 시간대에 동일한 매개변수를 사용
출력
Y
입력
X
RNN
출력
입력
RNN
출력
입력
RNN
출력
입력
RNN
X1 X2 X3
Y1 Y2 Y3
Y1 Y2

RNN
• 주로 순차적인 정보(Sequence)를 입력으로 받음
• 언어, 날씨, 주가 등
https://seanwes.com/book/
https://md2biz.tistory.com/148

RNN
• RNN 의 발전된 형태인 LSTM 으로 애플 주식 가격을 예측하는 사례
https://github.com/NourozR/Stock-Price-Prediction-LSTM

RNN
• 길이에 관계없이 입력과 출력을 받아들일 수 있는 유연한 네트워
크
http://cs231n.stanford.edu/slides/2019/cs231n_2019_lecture10.pdf
Image
Captioning
Sentiment
Classification
Machine
Translation
Video
Classification
(Frame level)

Image Captioning
• 이미지를 CNN 으로 분석 후 RNN 으로 caption 생성
https://www.analyticsvidhya.com/blog/2018/04/solving-an-image-captioning-task-using-deep-learning/

Sentiment Classification
• 문장의 긍정/부정 분류
https://openai.com/blog/unsupervised-sentiment-neuron/

Machine Translation
• Encoder 에 원본 문장을 넣고 Decoder 에서 번역
• 한계점 : Decoder 의 시작부터 끝까지 사용할 수 있는 정보량이 적음
• 현재는 Attention, Transformer, BERT 등 여러 개선기법이 개발됨
https://medium.com/@gautam.karmakar/attention-for-neural-connectionist-machine-translation-b833d1e085a3

Video Classification
• 비디오의 각 정지화상에서 무엇을 하고 있는지 판단
https://arxiv.org/abs/1411.4389

RNN의 구조
• 기본(Vanilla) RNN 은 비교적 단순한 구조
• 3개의 가중치(weights) 필요
https://aikorea.org/blog/rnn-tutorial-1/
https://ratsgo.github.io/natural%20language%20processing/2017/03/09/rnnlstm/

RNN의 구조
• 유닛 개수가 1개인 RNN은 파라미터 수가 3개인 것을 확인할 수 있
음

RNN의 구조
• 유닛 개수가 2개일 때, 3개일 때 파라미터의 개수 확인

RNN의 구조
• 기본적으로 Fully connected 구조
• 실선 화살표 개수 = 파라미터 개수
RNN units = 2
Param # = 8
RNN units = 3
Param # = 15
RNN units = 1
Param # = 3
bias bias bias

SimpleRNN
• tf.keras.layers 에서 import 할 수 있음

return_sequences
• RNN 계산 과정에 있는 hidden state 를 출력할 것인지에 대한 인수
• 다층 RNN 이나 one-to-many, many-to-many 출력을 위해 사용
출력
Y1
입력
X1
RNN
출력
Y2
입력
X2
RNN
출력
Y3
입력
X3
RNN
출력
Y1
입력
X1
RNN
출력
Y2
입력
X2
RNN
출력
Y3
입력
X3
RNN
return_sequences = False
(기본 설정값)
return_sequences = True
Y1 Y2 Y1 Y2

return_state
• RNN 의 발전된 형태인 LSTM 의 경우는 출력과 cell_state 가 다름
• 여기서 cell_state 를 출력할 것인지의 여부 결정
• 오늘은 신경쓰지 않으셔도 됩니다
https://excelsior-cjh.tistory.com/185
SimpleRNN LSTM

Embedding
• 단어나 문자(character)를 수치화
• 정수 인덱스를 길이 n의 실수 벡터로 맵핑
[[4], [20]] -> [[0.25, 0.1], [0.6, -0.2]]

Embedding
• tf.keras.layers 에서 import 할 수 있음
• input_dim : 단어 수
• output_dim : embedding 벡터 길이

Embedding
my
cat
is
smart
0
1
2
3
[0.76, -0.11, 0.36, …, -0.93]
[0.7, 0.42, -0.1, …, -0.34]
[0.83, 0.75, 0.64, …, -0.4]
[-0.33, 0.56, 0.82, …, 0.71]
단어 정수 인덱스 Embedding 실수 벡터
output_dim=64
input_dim
=1000

Dense(softmax)
• RNN 레이어의 출력을 받아서 softmax 로 확률 계산
https://www.dlology.com/blog/how-to-generate-realistic-yelp-restaurant-reviews-with-keras/

Tensorflow 2.0 sample code - RNN

Text generation
• RNN 을 사용한 Text generation 의 대표적인 예는 Andrej Karpathy 의
<The Unreasonable Effectiveness of Recurrent Neural Networks>
• 단어가 아닌 문자 기반 RNN 으로도 셰익스피어 희곡, 위키피디아
문서, LaTeX, 소스 코드 등의 문서 형식을 재현 성공

RNN with KoreanHiphop Dataset
• 한글 자소 단위 RNN – Google Colab 코드 링크
• 한글 단어 단위 RNN – Google Colab 코드 링크

텐서플로우 2.0 튜토리얼 - RNN

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

More from Hwanhee Kim

More from Hwanhee Kim (6)

텐서플로우 2.0 튜토리얼 - RNN

Editor's Notes