SlideShare a Scribd company logo
1 of 52
Download to read offline
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Builders Online Series
스타트업에서 데이터 분석 시작하기
박진우
AWS 솔루션즈 아키텍트
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
개요
• 스타트업에서 데이터분석의 필요성
• 실제로 데이터분석 시작 시 부딪히는 어려움
• 어떻게 관리를 줄일 수 있을까? (제약 사항과 해결 방안)
• 서버리스 분석 서비스들
• 분석용 데이터를 어떻게 저장하면 좋을까?
• 초기에는 어떻게 분석을 하면 좋을까? (아키텍처)
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
스타트업은 빠른 혁신이 필요합니다.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
데이터로 판단 가능한 것?
비즈니스 의사 결정
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
데이터로 판단 가능한 것?
신규 사업 분석
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
데이터로 판단 가능한 것?
보안 분석 – Elasticsearch Kibana로 WAF로그 분석 사례
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
데이터로 판단 가능한 것?
서비스 분석 - Pageview, Visit, 전환율, 광고 효과
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
데이터로 판단 가능한 것?
서비스 품질 개선
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
시작하면 생기는 마음의 벽
스타트업에서 분석이 어려운 이유
제약사항
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
시작하면 생기는 마음의 벽
스타트업에서 분석이 어려운 구체적인 이유 (고객의 피드백)
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
이런 제약사항을 극복해야함.
빠르고 민첩하게 혁신을 해야한다면 불필요한 비용,운영을 최소화 해야함.
1. 비용 효율적
AWS의 온 디맨드 인프라를 통해
Startup은 서버에 사전 투자하는 대신
사용하는 리소스에 대해서만 비용을
지불 할 수 있습니다
3. 핵심 비즈니스 가치에 집중
스타트 업은 인프라보다는 비즈니스
성장에 집중할 수 있습니다
2. 더 빠르게 시작
Startup은 단 몇 번의 클릭만으로
새로운 IT 리소스를 사용할 수있어
민첩성이 향상됩니다
4. 낮은 위험에서 더 자주 실험
필요에 따라 서버를 프로비저닝 해제 할 수
있으므로 스타트 업이 자주 실험하고 빠르게
실패 하여 아이디어가 제대로 동작하는지
확인할 수 있습니다.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
완전 관리형 분석 서비스를 활용
대부분의 설치, 운영, 성능에 대해 알아서 관리해 주면 좋겠다.
• 데이터 엔지니어, 데이터 사이언티스트가 없다.
• 비용 - 학습, 설치, PoC, 운영 모두가 비용
• 대규모 적용 시 성능 문제
AWS Managed
Services
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
완전 관리형 서비스 분석 서비스들
직접 서버에 설치해서 운영하지 않아도 되는 완전 관리형 분석 서비스들
Amazon Managed
Streaming for Kafka
AWS Managed
Services
 변경 요청
 모니터링
 패치 관리
 보안
 백업 서비스
Amazon Elasticsearch
Service
Amazon Redshift Amazon EMR
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
서버리스 분석 서비스를 활용
관리 자동화를 넘어서 SQL이나 분석 스크립트만 돌렸으면 좋겠다.
• 데이터 엔지니어, 데이터 사이언티스트가 없다.
• 비용 - 학습, 설치, PoC, 운영 모두가 비용
• 대규모 적용 시 성능 문제
Serverless
Analytics Services
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
서버리스 서비스 분석 서비스들
분석에만 집중할 수 있는 서버리스 분석 서비스들을 활용
 운영이 없음
 분석에 집중
 자동 확장
 사용한만큼 지불
Serverless
Analytics Services
Amazon Athena AWS Glue
Amazon QuickSight
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2020, Amazon Web Services, Inc. or Its Affiliates. All rights reserved.
빠르게 가성비 최고의 분석 솔루션 구축 가능, 작게 시작
S3
Data lake
AWS Glue
(ETL & Data
Catalog)
Athena
Amazon
QuickSight
서버리스
인프라 구축 X
인프라 운영 X
작업이 없는
시간에는
비용이 0
$
시스템 장애에
대한 걱정 X
사용 워크로드에
맞춰 자동적으로
리소스 확장
Kinesis
Devices Web Sensors Social
WHY Serverless
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Athena
Amazon
Athena
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
DDL을 사용한 Create External Table
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
새로운 Flights Parquet Table을 생성하고 바로 Query
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Athena Federated query
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Athena UDF 기능
• Simple to write, deploy,
and invoke
• Scalar functions
• Powered by AWS Lambda
Athena Query
UDF Lambda Code
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Athena - 비용 최적화
비용 절감을 위해 Compress/Parquet 등 Columnar format 으로 변경/파티셔닝 고려
Dataset Size on Amazon S3 Query Run time Data Scanned Cost
Logs stored as
Text files
1 TB 237 seconds 1.15TB $5.75
Logs stored in
Apache Parquet
format*
130 GB 5.13 seconds 2.69 GB $0.013
Savings
87% less with
Parquet
34x faster
99% less data
scanned
99.7% cheaper
Amazon Athena – 10가지 성능 향상 팁
https://aws.amazon.com/ko/blogs/korea/top-10-performance-tuning-tips-for-amazon-athena/
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Glue
AWS Glue
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
서버리스로 데이터 View관리 및 ETL Job 실행
데이터에 대한 하나의 단일 뷰 – 데이터 카탈로그
데이터의 이동과 변환 작업(ETL), Job 스케줄링
AWS Glue
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Glue Workflow Overview
1. 크롤러를 사용하여 데이터 스키마를
분석
2. 식별자를 통하여 테이블 정의를 Glue
데이터 카탈로그에 작성
3. 크롤러가 실제 데이터 저장소에 연결
4. 스키마 추론
5. 소스-대상 간 데이터 변환 및 로딩
작업 생성
6. 작업을 실행하여 데이터 변환/전송
처리
7. 모니터링
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Glue 활용 패턴 - 다양한 방식으로 동일 데이터 분석
AMAZON
QUICKSIGHT
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Glue ETL - Job 스크립트 작성과 실행
서버리스 데이터 변환작업
Apache Spark 기반
클릭 몇 번으로 생성되는 ETL code
수정 / 추가가 가능한 PySpark과 Scala 코드
반복 일정과 이벤트에 따른 Job 스케줄링
Zeppelin, PyCharm 등 익숙한 환경에서 수정,
디버그, 테스트가 가능하도록 Dev Endpoint 제공
Sample ETL Codes : https://github.com/awslabs/aws-glue-samples
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Glue Studio
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Glue DataBrew
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Glue DataBrew
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
데이터의 통합적인 관리
데이터가 쉽게 저장되고 안전하며 통합되어 관리되었으면 좋겠다.
• 데이터 엔지니어, 데이터 사이언티스트가 없다.
• 비용 - 학습, 설치, PoC, 운영 모두가 비용
• 적절한 서비스 선택과 아키텍처
• 대규모 적용시 성능 문제
• 데이터를 하나로 모으는게 어렵다 Amazon Simple Storage
Service
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
고객 사례
Amazon RDS
Amazon DynamoDB
Amazon EC2 Amazon Simple Storage
Service
AWS Lambda
Amazon Athena
Amazon QuickSight
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
이렇게 바꾸시면 좋습니다.
Amazon RDS
Amazon DynamoDB
Amazon EC2
Amazon Simple Storage
Service
Amazon Athena Amazon QuickSight
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
S3... S3… S3
Amazon Simple Storage
Service
오브젝트 기반 스토리지
오브젝트 당 5TB 까지 지원
무한 확장 가능
높은 내구성 (99.999999999%)
정적 자산에 최적화
전송 중 / 저장 시 암호화 지원
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS의 모든 서비스가 S3를 중심으로 결합
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
S3를 기반으로한 데이터레이크 분석
Extends or evolves DW architectures
Store any data in any format
Durable, available, and exabyte scale
Secure, compliant, auditable
Run any type of analytics from DW to Predictive
Data
Warehousing
Analytics Machine
Learning
Data lake
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
작은 데이터 부터 시작
프로토 타입용 데이터로 분석을 시작해 봅니다.
Amazon Simple Storage
Service
Amazon Athena Amazon Simple Storage
Service
Amazon QuickSight
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
기본적인 아키텍처
Amazon Simple Storage
Service
Amazon Athena Amazon QuickSight
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
변환 – 필터링, 조인 및 집계
Amazon Simple Storage
Service
Amazon Athena Amazon QuickSight
Amazon Simple Storage
Service
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
변환 – 필터링, 조인 및 집계
Amazon Simple Storage
Service
Amazon Athena Amazon QuickSight
AWS Glue Amazon Simple Storage
Service
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
이후 더 다양한 아키텍처로 발전
S3Amazon Kinesis
Data Firehose
Amazon Elasticsearch
Service
Amazon Redshift
Amazon Athena
Amazon QuickSight
실시간
배치
Amazon ElastiCache
Cache
Mobile
client
Traditional
server
loT sensor
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
마무리
• 완전 관리형 혹은 서버리스 분석서비스를 적극 활용.
• 서버리스 분석 서비스들 소개 (Athena, Glue, Quicksight)
• S3에 저장해서 데이터를 통합관리
• 작게 시작해서 진화하는 분석 아키텍처
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS 디지털 교육
aws.amazon.com/training
주요 교육
• AWS Cloud Practitioner Essentials (Second Edition)
AWS 클라우드 기초에 대해 학습하고, 기초 자격증인 AWS Certified Cloud
Practitioner 시험을 준비할 수 있습니다.
• AWS Security Fundamentals
AWS 액세스 제어 및 관리, 거버넌스, 로깅, 그리고 암호화 방법을 포함한
기본적인 클라우드 컴퓨팅 및 AWS 보안 개념에 대해 알아봅니다.
• AWS Database Offerings
데이터베이스 기술 및 아키텍처에 대한 기본 개요를 제공하며,
다양한 AWS 데이터베이스 서비스를 소개합니다.
• Data Analytics Fundamentals
다양한 데이터 분석 프로세스에 대해 학습하며, 데이터 분석 솔루션을
구축하고 개선하는 데 도움이 되는 AWS 서비스 및 솔루션을 소개합니다.
550개 이상의
무료 디지털 교육 및
심층적 강의실 교육을 통해
클라우드 기술 역량을
업그레이드 하세요!
AWS Builders Online Series에
참석해주셔서 대단히 감사합니다.
aws-korea-marketing@amazon.com
twitter.com/AWSKorea
facebook.com/amazonwebservices.ko
youtube.com/user/AWSKorea
slideshare.net/awskorea
twitch.tv/aws
저희가 준비한 내용, 어떻게 보셨나요?
더 나은 세미나를 위하여 설문을 꼭 작성해 주시기 바랍니다.
Thank you
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Builders Online Series

More Related Content

What's hot

Twiggy - let's get our widget on!
Twiggy - let's get our widget on!Twiggy - let's get our widget on!
Twiggy - let's get our widget on!
Elliott Kember
 

What's hot (7)

Better Performance === Greater Accessibility [Inclusive Design 24 2018]
Better Performance === Greater Accessibility [Inclusive Design 24 2018]Better Performance === Greater Accessibility [Inclusive Design 24 2018]
Better Performance === Greater Accessibility [Inclusive Design 24 2018]
 
Rendering SEO (explained by Google's Martin Splitt)
Rendering SEO (explained by Google's Martin Splitt)Rendering SEO (explained by Google's Martin Splitt)
Rendering SEO (explained by Google's Martin Splitt)
 
Twiggy - let's get our widget on!
Twiggy - let's get our widget on!Twiggy - let's get our widget on!
Twiggy - let's get our widget on!
 
我和阿九(Azure)有約 17 Azure Sql Database 基本介紹
我和阿九(Azure)有約 17 Azure Sql Database 基本介紹我和阿九(Azure)有約 17 Azure Sql Database 基本介紹
我和阿九(Azure)有約 17 Azure Sql Database 基本介紹
 
#2 Html [know-how]
#2 Html [know-how]#2 Html [know-how]
#2 Html [know-how]
 
Lots of ways to speed up your site
Lots of ways to speed up your siteLots of ways to speed up your site
Lots of ways to speed up your site
 
Accessible JavaScript applications
Accessible JavaScript applicationsAccessible JavaScript applications
Accessible JavaScript applications
 

Similar to 스타트업에서 데이터 분석 시작하기 – 박진우, AWS 솔루션즈 아키텍트:: AWS Builders Online Series

微软客户端技术纵览
微软客户端技术纵览微软客户端技术纵览
微软客户端技术纵览
ntoskrnl
 
Windows 7兼容性系列课程(1):Windows 7兼容性概述
Windows 7兼容性系列课程(1):Windows 7兼容性概述Windows 7兼容性系列课程(1):Windows 7兼容性概述
Windows 7兼容性系列课程(1):Windows 7兼容性概述
Chui-Wen Chiu
 
Inside Picnik: How We Built Picnik (and What We Learned Along the Way)
Inside Picnik: How We Built Picnik (and What We Learned Along the Way)Inside Picnik: How We Built Picnik (and What We Learned Along the Way)
Inside Picnik: How We Built Picnik (and What We Learned Along the Way)
jjhuff
 
Understanding Web Services
Understanding Web ServicesUnderstanding Web Services
Understanding Web Services
aru85
 
Understanding Web Services
Understanding Web ServicesUnderstanding Web Services
Understanding Web Services
aru85
 

Similar to 스타트업에서 데이터 분석 시작하기 – 박진우, AWS 솔루션즈 아키텍트:: AWS Builders Online Series (20)

Fleet Hub for AWS IoT Device Management のご紹介
Fleet Hub for AWS IoT Device Management のご紹介Fleet Hub for AWS IoT Device Management のご紹介
Fleet Hub for AWS IoT Device Management のご紹介
 
AWS IoT Greengrass V2 の紹介
AWS IoT Greengrass V2 の紹介AWS IoT Greengrass V2 の紹介
AWS IoT Greengrass V2 の紹介
 
웹사이트 벤치마킹의 9가지 패턴Pptx
웹사이트 벤치마킹의 9가지 패턴Pptx웹사이트 벤치마킹의 9가지 패턴Pptx
웹사이트 벤치마킹의 9가지 패턴Pptx
 
Gpl 과 Ccl
Gpl 과  CclGpl 과  Ccl
Gpl 과 Ccl
 
웹사이트 벤치마킹의 9가지 패턴
웹사이트 벤치마킹의 9가지 패턴웹사이트 벤치마킹의 9가지 패턴
웹사이트 벤치마킹의 9가지 패턴
 
웹사이트 벤치마킹의 9가지 패턴
웹사이트 벤치마킹의 9가지 패턴웹사이트 벤치마킹의 9가지 패턴
웹사이트 벤치마킹의 9가지 패턴
 
Web-based IPTV Service (Beyond IPTV)
Web-based IPTV Service (Beyond IPTV)Web-based IPTV Service (Beyond IPTV)
Web-based IPTV Service (Beyond IPTV)
 
微软客户端技术纵览
微软客户端技术纵览微软客户端技术纵览
微软客户端技术纵览
 
Act! Technical Training
Act! Technical TrainingAct! Technical Training
Act! Technical Training
 
Windows 7兼容性系列课程(1):Windows 7兼容性概述
Windows 7兼容性系列课程(1):Windows 7兼容性概述Windows 7兼容性系列课程(1):Windows 7兼容性概述
Windows 7兼容性系列课程(1):Windows 7兼容性概述
 
Inside Picnik: How We Built Picnik (and What We Learned Along the Way)
Inside Picnik: How We Built Picnik (and What We Learned Along the Way)Inside Picnik: How We Built Picnik (and What We Learned Along the Way)
Inside Picnik: How We Built Picnik (and What We Learned Along the Way)
 
Understanding Web Services
Understanding Web ServicesUnderstanding Web Services
Understanding Web Services
 
Mobile IPTV on the Web
Mobile IPTV on the WebMobile IPTV on the Web
Mobile IPTV on the Web
 
090309seminar talk about Cloud Computing
090309seminar talk about Cloud Computing090309seminar talk about Cloud Computing
090309seminar talk about Cloud Computing
 
P2P Bug Tracking with SD
P2P Bug Tracking with SDP2P Bug Tracking with SD
P2P Bug Tracking with SD
 
Revolutions Side C
Revolutions Side CRevolutions Side C
Revolutions Side C
 
SEO Packages
SEO PackagesSEO Packages
SEO Packages
 
Understanding Web Services
Understanding Web ServicesUnderstanding Web Services
Understanding Web Services
 
S30
S30S30
S30
 
Developer Summit 2009 Salesforce.com
Developer Summit 2009 Salesforce.comDeveloper Summit 2009 Salesforce.com
Developer Summit 2009 Salesforce.com
 

More from Amazon Web Services Korea

More from Amazon Web Services Korea (20)

AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2
 
AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1
 
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
 
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
 
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
 
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
 
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
 
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
 
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
 
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
 
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
 
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
 
From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...
 
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...
 
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
 
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...
 
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
 
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
 
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
 
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
 

Recently uploaded

+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
?#DUbAI#??##{{(☎️+971_581248768%)**%*]'#abortion pills for sale in dubai@
 
Why Teams call analytics are critical to your entire business
Why Teams call analytics are critical to your entire businessWhy Teams call analytics are critical to your entire business
Why Teams call analytics are critical to your entire business
panagenda
 

Recently uploaded (20)

Artificial Intelligence Chap.5 : Uncertainty
Artificial Intelligence Chap.5 : UncertaintyArtificial Intelligence Chap.5 : Uncertainty
Artificial Intelligence Chap.5 : Uncertainty
 
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
 
2024: Domino Containers - The Next Step. News from the Domino Container commu...
2024: Domino Containers - The Next Step. News from the Domino Container commu...2024: Domino Containers - The Next Step. News from the Domino Container commu...
2024: Domino Containers - The Next Step. News from the Domino Container commu...
 
GenAI Risks & Security Meetup 01052024.pdf
GenAI Risks & Security Meetup 01052024.pdfGenAI Risks & Security Meetup 01052024.pdf
GenAI Risks & Security Meetup 01052024.pdf
 
Top 10 Most Downloaded Games on Play Store in 2024
Top 10 Most Downloaded Games on Play Store in 2024Top 10 Most Downloaded Games on Play Store in 2024
Top 10 Most Downloaded Games on Play Store in 2024
 
Deploy with confidence: VMware Cloud Foundation 5.1 on next gen Dell PowerEdg...
Deploy with confidence: VMware Cloud Foundation 5.1 on next gen Dell PowerEdg...Deploy with confidence: VMware Cloud Foundation 5.1 on next gen Dell PowerEdg...
Deploy with confidence: VMware Cloud Foundation 5.1 on next gen Dell PowerEdg...
 
Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024
Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024
Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024
 
Strategies for Unlocking Knowledge Management in Microsoft 365 in the Copilot...
Strategies for Unlocking Knowledge Management in Microsoft 365 in the Copilot...Strategies for Unlocking Knowledge Management in Microsoft 365 in the Copilot...
Strategies for Unlocking Knowledge Management in Microsoft 365 in the Copilot...
 
Manulife - Insurer Innovation Award 2024
Manulife - Insurer Innovation Award 2024Manulife - Insurer Innovation Award 2024
Manulife - Insurer Innovation Award 2024
 
AWS Community Day CPH - Three problems of Terraform
AWS Community Day CPH - Three problems of TerraformAWS Community Day CPH - Three problems of Terraform
AWS Community Day CPH - Three problems of Terraform
 
Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024
Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024
Bajaj Allianz Life Insurance Company - Insurer Innovation Award 2024
 
Powerful Google developer tools for immediate impact! (2023-24 C)
Powerful Google developer tools for immediate impact! (2023-24 C)Powerful Google developer tools for immediate impact! (2023-24 C)
Powerful Google developer tools for immediate impact! (2023-24 C)
 
How to Troubleshoot Apps for the Modern Connected Worker
How to Troubleshoot Apps for the Modern Connected WorkerHow to Troubleshoot Apps for the Modern Connected Worker
How to Troubleshoot Apps for the Modern Connected Worker
 
Partners Life - Insurer Innovation Award 2024
Partners Life - Insurer Innovation Award 2024Partners Life - Insurer Innovation Award 2024
Partners Life - Insurer Innovation Award 2024
 
Data Cloud, More than a CDP by Matt Robison
Data Cloud, More than a CDP by Matt RobisonData Cloud, More than a CDP by Matt Robison
Data Cloud, More than a CDP by Matt Robison
 
Why Teams call analytics are critical to your entire business
Why Teams call analytics are critical to your entire businessWhy Teams call analytics are critical to your entire business
Why Teams call analytics are critical to your entire business
 
Apidays New York 2024 - The Good, the Bad and the Governed by David O'Neill, ...
Apidays New York 2024 - The Good, the Bad and the Governed by David O'Neill, ...Apidays New York 2024 - The Good, the Bad and the Governed by David O'Neill, ...
Apidays New York 2024 - The Good, the Bad and the Governed by David O'Neill, ...
 
Boost Fertility New Invention Ups Success Rates.pdf
Boost Fertility New Invention Ups Success Rates.pdfBoost Fertility New Invention Ups Success Rates.pdf
Boost Fertility New Invention Ups Success Rates.pdf
 
Apidays New York 2024 - The value of a flexible API Management solution for O...
Apidays New York 2024 - The value of a flexible API Management solution for O...Apidays New York 2024 - The value of a flexible API Management solution for O...
Apidays New York 2024 - The value of a flexible API Management solution for O...
 
Real Time Object Detection Using Open CV
Real Time Object Detection Using Open CVReal Time Object Detection Using Open CV
Real Time Object Detection Using Open CV
 

스타트업에서 데이터 분석 시작하기 – 박진우, AWS 솔루션즈 아키텍트:: AWS Builders Online Series

  • 1. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Builders Online Series 스타트업에서 데이터 분석 시작하기 박진우 AWS 솔루션즈 아키텍트
  • 2. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 개요 • 스타트업에서 데이터분석의 필요성 • 실제로 데이터분석 시작 시 부딪히는 어려움 • 어떻게 관리를 줄일 수 있을까? (제약 사항과 해결 방안) • 서버리스 분석 서비스들 • 분석용 데이터를 어떻게 저장하면 좋을까? • 초기에는 어떻게 분석을 하면 좋을까? (아키텍처)
  • 3. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 4. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 스타트업은 빠른 혁신이 필요합니다.
  • 5. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 데이터로 판단 가능한 것? 비즈니스 의사 결정
  • 6. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 데이터로 판단 가능한 것? 신규 사업 분석
  • 7. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 데이터로 판단 가능한 것? 보안 분석 – Elasticsearch Kibana로 WAF로그 분석 사례
  • 8. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 데이터로 판단 가능한 것? 서비스 분석 - Pageview, Visit, 전환율, 광고 효과
  • 9. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 데이터로 판단 가능한 것? 서비스 품질 개선
  • 10. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 11. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 시작하면 생기는 마음의 벽 스타트업에서 분석이 어려운 이유 제약사항
  • 12. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 시작하면 생기는 마음의 벽 스타트업에서 분석이 어려운 구체적인 이유 (고객의 피드백)
  • 13. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 이런 제약사항을 극복해야함. 빠르고 민첩하게 혁신을 해야한다면 불필요한 비용,운영을 최소화 해야함. 1. 비용 효율적 AWS의 온 디맨드 인프라를 통해 Startup은 서버에 사전 투자하는 대신 사용하는 리소스에 대해서만 비용을 지불 할 수 있습니다 3. 핵심 비즈니스 가치에 집중 스타트 업은 인프라보다는 비즈니스 성장에 집중할 수 있습니다 2. 더 빠르게 시작 Startup은 단 몇 번의 클릭만으로 새로운 IT 리소스를 사용할 수있어 민첩성이 향상됩니다 4. 낮은 위험에서 더 자주 실험 필요에 따라 서버를 프로비저닝 해제 할 수 있으므로 스타트 업이 자주 실험하고 빠르게 실패 하여 아이디어가 제대로 동작하는지 확인할 수 있습니다.
  • 14. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 15. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 완전 관리형 분석 서비스를 활용 대부분의 설치, 운영, 성능에 대해 알아서 관리해 주면 좋겠다. • 데이터 엔지니어, 데이터 사이언티스트가 없다. • 비용 - 학습, 설치, PoC, 운영 모두가 비용 • 대규모 적용 시 성능 문제 AWS Managed Services
  • 16. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 완전 관리형 서비스 분석 서비스들 직접 서버에 설치해서 운영하지 않아도 되는 완전 관리형 분석 서비스들 Amazon Managed Streaming for Kafka AWS Managed Services  변경 요청  모니터링  패치 관리  보안  백업 서비스 Amazon Elasticsearch Service Amazon Redshift Amazon EMR
  • 17. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 서버리스 분석 서비스를 활용 관리 자동화를 넘어서 SQL이나 분석 스크립트만 돌렸으면 좋겠다. • 데이터 엔지니어, 데이터 사이언티스트가 없다. • 비용 - 학습, 설치, PoC, 운영 모두가 비용 • 대규모 적용 시 성능 문제 Serverless Analytics Services
  • 18. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 19. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 서버리스 서비스 분석 서비스들 분석에만 집중할 수 있는 서버리스 분석 서비스들을 활용  운영이 없음  분석에 집중  자동 확장  사용한만큼 지불 Serverless Analytics Services Amazon Athena AWS Glue Amazon QuickSight
  • 20. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2020, Amazon Web Services, Inc. or Its Affiliates. All rights reserved. 빠르게 가성비 최고의 분석 솔루션 구축 가능, 작게 시작 S3 Data lake AWS Glue (ETL & Data Catalog) Athena Amazon QuickSight 서버리스 인프라 구축 X 인프라 운영 X 작업이 없는 시간에는 비용이 0 $ 시스템 장애에 대한 걱정 X 사용 워크로드에 맞춰 자동적으로 리소스 확장 Kinesis Devices Web Sensors Social WHY Serverless
  • 21. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Athena Amazon Athena
  • 22. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. DDL을 사용한 Create External Table
  • 23. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 새로운 Flights Parquet Table을 생성하고 바로 Query
  • 24. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Athena Federated query
  • 25. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Athena UDF 기능 • Simple to write, deploy, and invoke • Scalar functions • Powered by AWS Lambda Athena Query UDF Lambda Code
  • 26. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Athena - 비용 최적화 비용 절감을 위해 Compress/Parquet 등 Columnar format 으로 변경/파티셔닝 고려 Dataset Size on Amazon S3 Query Run time Data Scanned Cost Logs stored as Text files 1 TB 237 seconds 1.15TB $5.75 Logs stored in Apache Parquet format* 130 GB 5.13 seconds 2.69 GB $0.013 Savings 87% less with Parquet 34x faster 99% less data scanned 99.7% cheaper Amazon Athena – 10가지 성능 향상 팁 https://aws.amazon.com/ko/blogs/korea/top-10-performance-tuning-tips-for-amazon-athena/
  • 27. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Glue AWS Glue
  • 28. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 서버리스로 데이터 View관리 및 ETL Job 실행 데이터에 대한 하나의 단일 뷰 – 데이터 카탈로그 데이터의 이동과 변환 작업(ETL), Job 스케줄링 AWS Glue
  • 29. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Glue Workflow Overview 1. 크롤러를 사용하여 데이터 스키마를 분석 2. 식별자를 통하여 테이블 정의를 Glue 데이터 카탈로그에 작성 3. 크롤러가 실제 데이터 저장소에 연결 4. 스키마 추론 5. 소스-대상 간 데이터 변환 및 로딩 작업 생성 6. 작업을 실행하여 데이터 변환/전송 처리 7. 모니터링
  • 30. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Glue 활용 패턴 - 다양한 방식으로 동일 데이터 분석 AMAZON QUICKSIGHT
  • 31. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Glue ETL - Job 스크립트 작성과 실행 서버리스 데이터 변환작업 Apache Spark 기반 클릭 몇 번으로 생성되는 ETL code 수정 / 추가가 가능한 PySpark과 Scala 코드 반복 일정과 이벤트에 따른 Job 스케줄링 Zeppelin, PyCharm 등 익숙한 환경에서 수정, 디버그, 테스트가 가능하도록 Dev Endpoint 제공 Sample ETL Codes : https://github.com/awslabs/aws-glue-samples
  • 32. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Glue Studio
  • 33. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Glue DataBrew
  • 34. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS Glue DataBrew
  • 35. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 36. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 데이터의 통합적인 관리 데이터가 쉽게 저장되고 안전하며 통합되어 관리되었으면 좋겠다. • 데이터 엔지니어, 데이터 사이언티스트가 없다. • 비용 - 학습, 설치, PoC, 운영 모두가 비용 • 적절한 서비스 선택과 아키텍처 • 대규모 적용시 성능 문제 • 데이터를 하나로 모으는게 어렵다 Amazon Simple Storage Service
  • 37. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 고객 사례 Amazon RDS Amazon DynamoDB Amazon EC2 Amazon Simple Storage Service AWS Lambda Amazon Athena Amazon QuickSight
  • 38. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 이렇게 바꾸시면 좋습니다. Amazon RDS Amazon DynamoDB Amazon EC2 Amazon Simple Storage Service Amazon Athena Amazon QuickSight
  • 39. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. S3... S3… S3 Amazon Simple Storage Service 오브젝트 기반 스토리지 오브젝트 당 5TB 까지 지원 무한 확장 가능 높은 내구성 (99.999999999%) 정적 자산에 최적화 전송 중 / 저장 시 암호화 지원
  • 40. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS의 모든 서비스가 S3를 중심으로 결합
  • 41. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. S3를 기반으로한 데이터레이크 분석 Extends or evolves DW architectures Store any data in any format Durable, available, and exabyte scale Secure, compliant, auditable Run any type of analytics from DW to Predictive Data Warehousing Analytics Machine Learning Data lake
  • 42. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 43. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 작은 데이터 부터 시작 프로토 타입용 데이터로 분석을 시작해 봅니다. Amazon Simple Storage Service Amazon Athena Amazon Simple Storage Service Amazon QuickSight
  • 44. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 기본적인 아키텍처 Amazon Simple Storage Service Amazon Athena Amazon QuickSight
  • 45. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 변환 – 필터링, 조인 및 집계 Amazon Simple Storage Service Amazon Athena Amazon QuickSight Amazon Simple Storage Service
  • 46. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 변환 – 필터링, 조인 및 집계 Amazon Simple Storage Service Amazon Athena Amazon QuickSight AWS Glue Amazon Simple Storage Service
  • 47. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 이후 더 다양한 아키텍처로 발전 S3Amazon Kinesis Data Firehose Amazon Elasticsearch Service Amazon Redshift Amazon Athena Amazon QuickSight 실시간 배치 Amazon ElastiCache Cache Mobile client Traditional server loT sensor
  • 48. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 49. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. 마무리 • 완전 관리형 혹은 서버리스 분석서비스를 적극 활용. • 서버리스 분석 서비스들 소개 (Athena, Glue, Quicksight) • S3에 저장해서 데이터를 통합관리 • 작게 시작해서 진화하는 분석 아키텍처
  • 50. © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. AWS 디지털 교육 aws.amazon.com/training 주요 교육 • AWS Cloud Practitioner Essentials (Second Edition) AWS 클라우드 기초에 대해 학습하고, 기초 자격증인 AWS Certified Cloud Practitioner 시험을 준비할 수 있습니다. • AWS Security Fundamentals AWS 액세스 제어 및 관리, 거버넌스, 로깅, 그리고 암호화 방법을 포함한 기본적인 클라우드 컴퓨팅 및 AWS 보안 개념에 대해 알아봅니다. • AWS Database Offerings 데이터베이스 기술 및 아키텍처에 대한 기본 개요를 제공하며, 다양한 AWS 데이터베이스 서비스를 소개합니다. • Data Analytics Fundamentals 다양한 데이터 분석 프로세스에 대해 학습하며, 데이터 분석 솔루션을 구축하고 개선하는 데 도움이 되는 AWS 서비스 및 솔루션을 소개합니다. 550개 이상의 무료 디지털 교육 및 심층적 강의실 교육을 통해 클라우드 기술 역량을 업그레이드 하세요!
  • 51. AWS Builders Online Series에 참석해주셔서 대단히 감사합니다. aws-korea-marketing@amazon.com twitter.com/AWSKorea facebook.com/amazonwebservices.ko youtube.com/user/AWSKorea slideshare.net/awskorea twitch.tv/aws 저희가 준비한 내용, 어떻게 보셨나요? 더 나은 세미나를 위하여 설문을 꼭 작성해 주시기 바랍니다.
  • 52. Thank you © 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved. Builders Online Series