SlideShare a Scribd company logo
1 of 36
Download to read offline
Swell Prediction using RSCNN
선박 하역부두 너울성 파도 발생시점 예측
2018. 9. 19.
제 로 콜 라
대표 : 조용우
팀원 : 한규수
I. 개요
II. 개발 내용
III. 결과 및 기대효과
Ⅰ. 개요
✓ 참여 동기
✓ 문제 분석
I. 개요 - 참여 동기
처음 접해보는 도메인
다른 사람들은 어떻게 문제를 푸는지
내 방법이 좋은 방법인지
Ⅰ. 개요
✓ 참여 동기
✓ 문제 분석
I. 개요 – 문제
시간 단위로 너울성 파도 예측
I. 개요 – 문제 해결
But 주어진 데이터는 일 단위
 시간 단위의 데이터 수집
I. 개요 – 문제 해결
이전 8시간 동안의 예측인자로 너울성 파도 유무 예측
• Many Feature
• RSCNN Ensemble Model
Ⅱ. 개발 내용
✓ 학습 데이터
✓ 데이터 전처리
✓ 알고리즘
Ⅱ. 개발 내용 – 학습 데이터
• 2014 ~ 2017
• 7개 관측소
• 총 47개의 예측인자 사용
초기 데이터
Ⅱ. 개발 내용 – 학습 데이터
• 2014 ~ 2017
• 33개 관측소
• 총 248개의 예측인자 사용
최종 데이터
Ⅱ. 개발 내용 – 학습 데이터
연관성이 낮은 예측 인자 제거  예측 성능 감소
데이터 연관성 분석
모든 예측인자 사용
Ⅱ. 개발 내용 – 학습 데이터
사용한 예측인자(Feature)
Ⅱ. 개발 내용
✓ 학습 데이터
✓ 데이터 전처리
✓ 알고리즘
결측 데이터 처리
• 2014~2015 관측소 미운영으로 인한 데이터 결측
 가까이 있는 관측소의 데이터를 넣어 줌
• 강수량 데이터 결측
 0 mm 인 경우이므로 0 으로 처리
• 그 외 데이터 결측
 선형 보간(Linear Interpolation)을 이용하여 처리
Ⅱ. 개발 내용 – 데이터 전처리
SWELL 데이터 Encoding
Ⅱ. 개발 내용 – 데이터 전처리
Ⅱ. 개발 내용 – 데이터 전처리
방향 데이터 (풍향, 파향) Encoding
데이터 정규화
예측 인자 사이의 Scale을 맞춤
𝑺𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒊𝒛𝒆𝒅 𝑥𝑖𝑗 =
𝑥𝑖𝑗 − ҧ𝑥𝑖
𝑠𝑖
Ⅱ. 개발 내용 – 데이터 전처리
Under Sampling
Ⅱ. 개발 내용 – 데이터 전처리
• 2014 ~ 2017 기간동안 “기상 불량 없음” 이 대다수
 하루 종일 “기상 불량 없음” 인 날은 학습에서 제외
Over Sampling
Ⅱ. 개발 내용 – 데이터 전처리
• Swell 데이터 값이 변하는
시점에 예측 정확도 낮음
• 데이터 추가
Ⅱ. 개발 내용
✓ 학습 데이터
✓ 데이터 전처리
✓ 알고리즘
Ⅱ. 개발 내용 – 알고리즘
예측 모델의 전체 구조
Ⅱ. 개발 내용 – 알고리즘
예측 모델의 전체 구조
𝐷 𝑆, 𝐿 = − ෍
𝑖
𝐿𝑖 𝑙𝑜𝑔(𝑆𝑖)
Softmax Cross Entropy
Loss
Ⅱ. 개발 내용 – 알고리즘
예측 모델의 전체 구조
이 부분을 중점적으로 변경해가며
성능 개선 진행
Ⅱ. 개발 내용 – 알고리즘
Dense Net
Ⅱ. 개발 내용 – 알고리즘
RSCNN
Ⅱ. 개발 내용 – 알고리즘
RSCNN
모델마다 서로 다른 Feature 묶음 생성
Ⅱ. 개발 내용 – 알고리즘
RSCNN
Feature간의 관계를
다양한 연산(kernel)으로 반영
Ⅱ. 개발 내용 – 알고리즘
RSCNN
시계열 연관성 반영
Ⅱ. 개발 내용 – 알고리즘
그 외 모델들
• Bidirectional RNN(Vanilla, LSTM, GRU, NAS)
• Region based CNN (관측소 별 Convolution)
• CNN + RNN
Ⅱ. 개발 내용 – 알고리즘
Ensemble
모델의 Randomness에 기인한 Variance를 낮춤
Ⅲ. 결과 및 기대효과 - 결과
𝑆𝑐𝑜𝑟𝑒 =
𝑇𝑁 + 2𝑇𝑃 − 𝐹𝑃 − 2𝐹𝑁
# 𝑜𝑓 𝑑𝑎𝑡𝑎
Score
 너울성 파도가 발생한 시점을 맞춘 경우 = TP
 너울성 파도가 발생하지 않은 시점을 맞춘 경우 = TN
 너울성 파도가 발생한 시점을 틀린 경우 = FN
 너울성 파도가 발생하지 않은 시점을 틀린 경우 = FP
Ⅲ. 결과 및 기대효과 - 결과
Train Stats
Train : Validation : Test = 70% : 15% : 15%
Ⅲ. 결과 및 기대효과 - 결과
모델 별 성능
Ⅲ. 결과 및 기대효과 - 결과
Ⅲ. 결과 및 기대효과 - 기대효과
✓ 너울성 파도 발생 시점을 높은 정확도 예측
 작업 효율 증대
✓ 범용성 높은 모델
 연관관계가 복잡한 임의의 데이터에 효과적
Q & A

More Related Content

Similar to Posco ai challenge with RSCNN

Dynamic Word Cloud Using Word2Vec - 1st Presentation
Dynamic Word Cloud Using Word2Vec - 1st PresentationDynamic Word Cloud Using Word2Vec - 1st Presentation
Dynamic Word Cloud Using Word2Vec - 1st PresentationMinwook Chang
 
Deep Learning for AI (1)
Deep Learning for AI (1)Deep Learning for AI (1)
Deep Learning for AI (1)Dongheon Lee
 
순환신경망(Recurrent neural networks) 개요
순환신경망(Recurrent neural networks) 개요순환신경망(Recurrent neural networks) 개요
순환신경망(Recurrent neural networks) 개요Byoung-Hee Kim
 
Sensor web
Sensor webSensor web
Sensor webH K Yoon
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection창기 문
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection창기 문
 
Workshop 210417 dhlee
Workshop 210417 dhleeWorkshop 210417 dhlee
Workshop 210417 dhleeDongheon Lee
 
권기훈_개인포트폴리오
권기훈_개인포트폴리오권기훈_개인포트폴리오
권기훈_개인포트폴리오Kihoon4
 
작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx
작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx
작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptxssuser0e717a
 
2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx승형 이
 
20170928 session basedrec_hyu_dake
20170928 session basedrec_hyu_dake20170928 session basedrec_hyu_dake
20170928 session basedrec_hyu_dakeDongGyun Hong
 
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)SANG WON PARK
 
스마트폰 위의 딥러닝
스마트폰 위의 딥러닝스마트폰 위의 딥러닝
스마트폰 위의 딥러닝NAVER Engineering
 
CNN Architecture A to Z
CNN Architecture A to ZCNN Architecture A to Z
CNN Architecture A to ZLEE HOSEONG
 
데이터분석의 길 5: “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
데이터분석의 길 5:  “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)데이터분석의 길 5:  “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
데이터분석의 길 5: “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)Jaimie Kwon (권재명)
 
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축Juhong Park
 
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020 AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020 AWSKRUG - AWS한국사용자모임
 
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020Jinwoong Kim
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyDataya Nolja
 

Similar to Posco ai challenge with RSCNN (20)

Dynamic Word Cloud Using Word2Vec - 1st Presentation
Dynamic Word Cloud Using Word2Vec - 1st PresentationDynamic Word Cloud Using Word2Vec - 1st Presentation
Dynamic Word Cloud Using Word2Vec - 1st Presentation
 
Deep Learning for AI (1)
Deep Learning for AI (1)Deep Learning for AI (1)
Deep Learning for AI (1)
 
순환신경망(Recurrent neural networks) 개요
순환신경망(Recurrent neural networks) 개요순환신경망(Recurrent neural networks) 개요
순환신경망(Recurrent neural networks) 개요
 
Sensor web
Sensor webSensor web
Sensor web
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection
 
Summary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detectionSummary in recent advances in deep learning for object detection
Summary in recent advances in deep learning for object detection
 
Workshop 210417 dhlee
Workshop 210417 dhleeWorkshop 210417 dhlee
Workshop 210417 dhlee
 
권기훈_개인포트폴리오
권기훈_개인포트폴리오권기훈_개인포트폴리오
권기훈_개인포트폴리오
 
작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx
작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx
작업준비시간과_납기지연시간을_최소화하기_위한_딥러닝_기반의_일정계획수립_모델_사사수정 (1).pptx
 
2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx
 
20170928 session basedrec_hyu_dake
20170928 session basedrec_hyu_dake20170928 session basedrec_hyu_dake
20170928 session basedrec_hyu_dake
 
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
OLAP for Big Data (Druid vs Apache Kylin vs Apache Lens)
 
스마트폰 위의 딥러닝
스마트폰 위의 딥러닝스마트폰 위의 딥러닝
스마트폰 위의 딥러닝
 
bsk_3_1_2
bsk_3_1_2bsk_3_1_2
bsk_3_1_2
 
CNN Architecture A to Z
CNN Architecture A to ZCNN Architecture A to Z
CNN Architecture A to Z
 
데이터분석의 길 5: “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
데이터분석의 길 5:  “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)데이터분석의 길 5:  “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
데이터분석의 길 5: “고수는 큰자료를 두려워하지 않는다” (클릭확률예측 상편)
 
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
 
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020 AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
 
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
 

Posco ai challenge with RSCNN

  • 1. Swell Prediction using RSCNN 선박 하역부두 너울성 파도 발생시점 예측 2018. 9. 19. 제 로 콜 라 대표 : 조용우 팀원 : 한규수 I. 개요 II. 개발 내용 III. 결과 및 기대효과
  • 2. Ⅰ. 개요 ✓ 참여 동기 ✓ 문제 분석
  • 3. I. 개요 - 참여 동기 처음 접해보는 도메인 다른 사람들은 어떻게 문제를 푸는지 내 방법이 좋은 방법인지
  • 4. Ⅰ. 개요 ✓ 참여 동기 ✓ 문제 분석
  • 5. I. 개요 – 문제 시간 단위로 너울성 파도 예측
  • 6. I. 개요 – 문제 해결 But 주어진 데이터는 일 단위  시간 단위의 데이터 수집
  • 7. I. 개요 – 문제 해결 이전 8시간 동안의 예측인자로 너울성 파도 유무 예측 • Many Feature • RSCNN Ensemble Model
  • 8. Ⅱ. 개발 내용 ✓ 학습 데이터 ✓ 데이터 전처리 ✓ 알고리즘
  • 9. Ⅱ. 개발 내용 – 학습 데이터 • 2014 ~ 2017 • 7개 관측소 • 총 47개의 예측인자 사용 초기 데이터
  • 10. Ⅱ. 개발 내용 – 학습 데이터 • 2014 ~ 2017 • 33개 관측소 • 총 248개의 예측인자 사용 최종 데이터
  • 11. Ⅱ. 개발 내용 – 학습 데이터 연관성이 낮은 예측 인자 제거  예측 성능 감소 데이터 연관성 분석 모든 예측인자 사용
  • 12. Ⅱ. 개발 내용 – 학습 데이터 사용한 예측인자(Feature)
  • 13. Ⅱ. 개발 내용 ✓ 학습 데이터 ✓ 데이터 전처리 ✓ 알고리즘
  • 14. 결측 데이터 처리 • 2014~2015 관측소 미운영으로 인한 데이터 결측  가까이 있는 관측소의 데이터를 넣어 줌 • 강수량 데이터 결측  0 mm 인 경우이므로 0 으로 처리 • 그 외 데이터 결측  선형 보간(Linear Interpolation)을 이용하여 처리 Ⅱ. 개발 내용 – 데이터 전처리
  • 15. SWELL 데이터 Encoding Ⅱ. 개발 내용 – 데이터 전처리
  • 16. Ⅱ. 개발 내용 – 데이터 전처리 방향 데이터 (풍향, 파향) Encoding
  • 17. 데이터 정규화 예측 인자 사이의 Scale을 맞춤 𝑺𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒊𝒛𝒆𝒅 𝑥𝑖𝑗 = 𝑥𝑖𝑗 − ҧ𝑥𝑖 𝑠𝑖 Ⅱ. 개발 내용 – 데이터 전처리
  • 18. Under Sampling Ⅱ. 개발 내용 – 데이터 전처리 • 2014 ~ 2017 기간동안 “기상 불량 없음” 이 대다수  하루 종일 “기상 불량 없음” 인 날은 학습에서 제외
  • 19. Over Sampling Ⅱ. 개발 내용 – 데이터 전처리 • Swell 데이터 값이 변하는 시점에 예측 정확도 낮음 • 데이터 추가
  • 20. Ⅱ. 개발 내용 ✓ 학습 데이터 ✓ 데이터 전처리 ✓ 알고리즘
  • 21. Ⅱ. 개발 내용 – 알고리즘 예측 모델의 전체 구조
  • 22. Ⅱ. 개발 내용 – 알고리즘 예측 모델의 전체 구조 𝐷 𝑆, 𝐿 = − ෍ 𝑖 𝐿𝑖 𝑙𝑜𝑔(𝑆𝑖) Softmax Cross Entropy Loss
  • 23. Ⅱ. 개발 내용 – 알고리즘 예측 모델의 전체 구조 이 부분을 중점적으로 변경해가며 성능 개선 진행
  • 24. Ⅱ. 개발 내용 – 알고리즘 Dense Net
  • 25. Ⅱ. 개발 내용 – 알고리즘 RSCNN
  • 26. Ⅱ. 개발 내용 – 알고리즘 RSCNN 모델마다 서로 다른 Feature 묶음 생성
  • 27. Ⅱ. 개발 내용 – 알고리즘 RSCNN Feature간의 관계를 다양한 연산(kernel)으로 반영
  • 28. Ⅱ. 개발 내용 – 알고리즘 RSCNN 시계열 연관성 반영
  • 29. Ⅱ. 개발 내용 – 알고리즘 그 외 모델들 • Bidirectional RNN(Vanilla, LSTM, GRU, NAS) • Region based CNN (관측소 별 Convolution) • CNN + RNN
  • 30. Ⅱ. 개발 내용 – 알고리즘 Ensemble 모델의 Randomness에 기인한 Variance를 낮춤
  • 31. Ⅲ. 결과 및 기대효과 - 결과 𝑆𝑐𝑜𝑟𝑒 = 𝑇𝑁 + 2𝑇𝑃 − 𝐹𝑃 − 2𝐹𝑁 # 𝑜𝑓 𝑑𝑎𝑡𝑎 Score  너울성 파도가 발생한 시점을 맞춘 경우 = TP  너울성 파도가 발생하지 않은 시점을 맞춘 경우 = TN  너울성 파도가 발생한 시점을 틀린 경우 = FN  너울성 파도가 발생하지 않은 시점을 틀린 경우 = FP
  • 32. Ⅲ. 결과 및 기대효과 - 결과 Train Stats Train : Validation : Test = 70% : 15% : 15%
  • 33. Ⅲ. 결과 및 기대효과 - 결과 모델 별 성능
  • 34. Ⅲ. 결과 및 기대효과 - 결과
  • 35. Ⅲ. 결과 및 기대효과 - 기대효과 ✓ 너울성 파도 발생 시점을 높은 정확도 예측  작업 효율 증대 ✓ 범용성 높은 모델  연관관계가 복잡한 임의의 데이터에 효과적
  • 36. Q & A