SlideShare a Scribd company logo
1 of 18
NAVER Cloud Platform Webinar
Run up!
Jupyter를 이용한 데이터 분석 환경 구축
클라우드 솔루션 아키텍트 허창현
분석 환경을 구축하기 위한 요소
Data Infrastructure
Framework / Library
Tools
게임내 사용자 패턴
기업공시 데이터
교통 흐름
통신 데이터
의료기록
재무정보
금융분야 마이데이터
Python
R
TensorFlow
Scala
Hadoop
Julia
SAS
Jupyter Lab
JupyterHub
R Studio
Hive
Zeppline
Pycharm
GPU
Hi-memory, CPU
Hadoop Cluster
Tensorflow Cluster
HPC
Kubernetes Cluster
Storage
Jupyter Project
IPython Project 에서 시작
다수의 커널을 지원하면서 Jupyter로 명칭 변경
오픈소스 프로젝트(BSD)
데이터 과학을 쉽게 접근할 수 있는 통로 제공
변형, 수치 시뮬레이션, 통계 모델링, 머신러닝에서 사용
대화형 분석 환경 제공
Jupyter Project
Jupyter Notebook
JupyterLab
JupyterHub
Jupyter Notebook / JupyterLab
수십 개 언어의 실행 환경을 지원
웹 페이지 내에서 코드 실행
시각화 기능 지원
데이터 분석을 위한 코드 및 데이터 공유
Front-end, Server, Kernel 로 구성
코드와 실시간 상호작용
Jupyter Notebook / JupyterLab
User
Jupyter
Notebook
Server
Kernel
Python2.7
Python3.x
R
Julia
Other kernels
…
Browser
Notebook file
Notebook file
JupyterHub
다중 사용자를 위한 분석 환경 제공
다양한 인증 방식 제공(OAuth, PAM..)
컨테이너 친화적 환경 제공
Kubernetes를 통한 Scalable 환경 제공
다양한 인프라에서 실행가능
A multi-user version of the notebook designed for companies, classrooms and research labs
JupyterHub & Multi-user
Python 2.7 / 3.x
Python 2.7 / 3.x
Jupyterhub Jupyterlab
Jupyterhub Jupyterlab
NAS
Group1
User1
User2
User3
….
Python 2.7 / 3.x
Jupyterhub Jupyterlab
Group2
User1
User2
User3
….
GPU
GPU
GPU
NAVER CLOUD PLATFORM
JupyterHub for Kubernetes
Kubernetes Service (Standard/CPU Intensive)
POD POD POD POD
NODE1 NODE2
NODE 1
Proxy for
launching
Notebook
LoadBalancer
NAS
Block Storage
Prometheus
Grafana
Python
R
NAVER CLOUD PLATFORM
Package Install
Numpy, SciPy, Pandas, Sympy...
Tensorflow, PyTorch, Keras..
Matplotlib, Seabon, bokeh, Ploty…
Data Science Library
TensorFlow Server
TensorFlow 외 PyTorch, Keras, Pandas, Numpy, Scikit-Learn, Gensim 등 다양한 패키지 제공
conda를 이용해 필요한 라이브러리 추가 설치 가능
Jupyter Notebook과 여러 분석에 필요한 라이브러리를 별도 설치 없이 손쉽게 사용
TensorFlow Server
JupyterNotebook
User
CPU Intensive
GPU(v100, p40)
High Memory
Standard
수분 안에 다양한 라이브러리가 설치된 환경 구축 가능
Cloud Hadoop을 이용한 분석 환경 구축
Jupyter
Notebook
Zepplin
Notebook
Ambari
Spark
Master Node
Master Node
Worker
Node
(yarn)
Worker
Node
(yarn)
Worker
Node
(yarn)
Object Storage
…
Cloud Hadoop - Spark Cluster
NAVER CLOUD PLATFORM
DEMO
Demo1
TensorFlow Server를 이용한 분석 환경 구축
TensorFlow Server 생성
Jupyter Notebook
인증키 설정
Jupyter Notebook 접속
R 설치 및 실행 Python 실행
Demo2
JupyterHub와 Kubernetes Service를 이용한 분석 환경 구축
Kubernetes Service
Cluster 생성
Helm을 이용한
JupyterHub 설치
JupyterHub 접속
계정 별 Pod 생성 확인 Kubernetes 대시보드 접속
분석을 위한 네이버클라우드플랫폼 상품
Kubernetes Service Archive storage Object Storage TensorFlow Cluster TensorFlow Server
Cloud Hadoop Cloud Search Elasticsearch
Service
Real User AnalyticsCPU Intensive GPU Server
The End of Document
Thank You

More Related Content

What's hot

GCP for Apache Kafka® Users: Stream Ingestion and Processing
GCP for Apache Kafka® Users: Stream Ingestion and ProcessingGCP for Apache Kafka® Users: Stream Ingestion and Processing
GCP for Apache Kafka® Users: Stream Ingestion and Processingconfluent
 
Tdc2013 선배들에게 배우는 server scalability
Tdc2013 선배들에게 배우는 server scalabilityTdc2013 선배들에게 배우는 server scalability
Tdc2013 선배들에게 배우는 server scalability흥배 최
 
High Availability PostgreSQL on OpenShift...and more!
High Availability PostgreSQL on OpenShift...and more!High Availability PostgreSQL on OpenShift...and more!
High Availability PostgreSQL on OpenShift...and more!Jonathan Katz
 
Airbyte @ Airflow Summit - The new modern data stack
Airbyte @ Airflow Summit - The new modern data stackAirbyte @ Airflow Summit - The new modern data stack
Airbyte @ Airflow Summit - The new modern data stackMichel Tricot
 
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdfマーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf合同会社 DMM.com
 
Big Data Redis Mongodb Dynamodb Sharding
Big Data Redis Mongodb Dynamodb ShardingBig Data Redis Mongodb Dynamodb Sharding
Big Data Redis Mongodb Dynamodb ShardingAraf Karsh Hamid
 
04 spark-pair rdd-rdd-persistence
04 spark-pair rdd-rdd-persistence04 spark-pair rdd-rdd-persistence
04 spark-pair rdd-rdd-persistenceVenkat Datla
 
YOW2018 Cloud Performance Root Cause Analysis at Netflix
YOW2018 Cloud Performance Root Cause Analysis at NetflixYOW2018 Cloud Performance Root Cause Analysis at Netflix
YOW2018 Cloud Performance Root Cause Analysis at NetflixBrendan Gregg
 
ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方Yoshiyasu SAEKI
 
[PyConKR][2020]이 선 넘으면 침범이야, BEEP!
[PyConKR][2020]이 선 넘으면 침범이야, BEEP![PyConKR][2020]이 선 넘으면 침범이야, BEEP!
[PyConKR][2020]이 선 넘으면 침범이야, BEEP!Ji Hyung Moon
 
Developing with the Go client for Apache Kafka
Developing with the Go client for Apache KafkaDeveloping with the Go client for Apache Kafka
Developing with the Go client for Apache KafkaJoe Stein
 
Let's read code: the python-requests library
Let's read code: the python-requests libraryLet's read code: the python-requests library
Let's read code: the python-requests librarySusan Tan
 
Cloud Native PostgreSQL
Cloud Native PostgreSQLCloud Native PostgreSQL
Cloud Native PostgreSQLEDB
 
Facebook Presto presentation
Facebook Presto presentationFacebook Presto presentation
Facebook Presto presentationCyanny LIANG
 
Apache kafka 관리와 모니터링
Apache kafka 관리와 모니터링Apache kafka 관리와 모니터링
Apache kafka 관리와 모니터링JANGWONSEO4
 
Build and Deploy Cloud Native Camel Quarkus routes with Tekton and Knative
Build and Deploy Cloud Native Camel Quarkus routes with Tekton and KnativeBuild and Deploy Cloud Native Camel Quarkus routes with Tekton and Knative
Build and Deploy Cloud Native Camel Quarkus routes with Tekton and KnativeOmar Al-Safi
 
クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...
クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...
クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...Yahoo!デベロッパーネットワーク
 

What's hot (20)

オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
شبکه های اجتماعی علمی
شبکه های اجتماعی علمیشبکه های اجتماعی علمی
شبکه های اجتماعی علمی
 
GCP for Apache Kafka® Users: Stream Ingestion and Processing
GCP for Apache Kafka® Users: Stream Ingestion and ProcessingGCP for Apache Kafka® Users: Stream Ingestion and Processing
GCP for Apache Kafka® Users: Stream Ingestion and Processing
 
Tdc2013 선배들에게 배우는 server scalability
Tdc2013 선배들에게 배우는 server scalabilityTdc2013 선배들에게 배우는 server scalability
Tdc2013 선배들에게 배우는 server scalability
 
High Availability PostgreSQL on OpenShift...and more!
High Availability PostgreSQL on OpenShift...and more!High Availability PostgreSQL on OpenShift...and more!
High Availability PostgreSQL on OpenShift...and more!
 
Airbyte @ Airflow Summit - The new modern data stack
Airbyte @ Airflow Summit - The new modern data stackAirbyte @ Airflow Summit - The new modern data stack
Airbyte @ Airflow Summit - The new modern data stack
 
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdfマーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
 
Big Data Redis Mongodb Dynamodb Sharding
Big Data Redis Mongodb Dynamodb ShardingBig Data Redis Mongodb Dynamodb Sharding
Big Data Redis Mongodb Dynamodb Sharding
 
04 spark-pair rdd-rdd-persistence
04 spark-pair rdd-rdd-persistence04 spark-pair rdd-rdd-persistence
04 spark-pair rdd-rdd-persistence
 
YOW2018 Cloud Performance Root Cause Analysis at Netflix
YOW2018 Cloud Performance Root Cause Analysis at NetflixYOW2018 Cloud Performance Root Cause Analysis at Netflix
YOW2018 Cloud Performance Root Cause Analysis at Netflix
 
ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方
 
[PyConKR][2020]이 선 넘으면 침범이야, BEEP!
[PyConKR][2020]이 선 넘으면 침범이야, BEEP![PyConKR][2020]이 선 넘으면 침범이야, BEEP!
[PyConKR][2020]이 선 넘으면 침범이야, BEEP!
 
FLiP Into Trino
FLiP Into TrinoFLiP Into Trino
FLiP Into Trino
 
Developing with the Go client for Apache Kafka
Developing with the Go client for Apache KafkaDeveloping with the Go client for Apache Kafka
Developing with the Go client for Apache Kafka
 
Let's read code: the python-requests library
Let's read code: the python-requests libraryLet's read code: the python-requests library
Let's read code: the python-requests library
 
Cloud Native PostgreSQL
Cloud Native PostgreSQLCloud Native PostgreSQL
Cloud Native PostgreSQL
 
Facebook Presto presentation
Facebook Presto presentationFacebook Presto presentation
Facebook Presto presentation
 
Apache kafka 관리와 모니터링
Apache kafka 관리와 모니터링Apache kafka 관리와 모니터링
Apache kafka 관리와 모니터링
 
Build and Deploy Cloud Native Camel Quarkus routes with Tekton and Knative
Build and Deploy Cloud Native Camel Quarkus routes with Tekton and KnativeBuild and Deploy Cloud Native Camel Quarkus routes with Tekton and Knative
Build and Deploy Cloud Native Camel Quarkus routes with Tekton and Knative
 
クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...
クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...
クロスユースプラットフォーム~ 秒間10万リクエスト・レスポンスタイム100ms以下を実現するシステム について ~ / YJTC19 in Shibuy...
 

Similar to [온라인교육시리즈] Jupyter를 이용한 분석 환경 구축하기 - 허창현 클라우드 솔루션 아키텍트

머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발
머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발
머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발Jeongkyu Shin
 
Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
Backend.AI: 오픈소스 머신러닝 인프라 프레임워크Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
Backend.AI: 오픈소스 머신러닝 인프라 프레임워크Jeongkyu Shin
 
SOSCON 2017 - Backend.AI
SOSCON 2017 - Backend.AISOSCON 2017 - Backend.AI
SOSCON 2017 - Backend.AIJoongi Kim
 
Lablupconf session8 "Paving the road to AI-powered world"
Lablupconf session8 "Paving the road to AI-powered world"Lablupconf session8 "Paving the road to AI-powered world"
Lablupconf session8 "Paving the road to AI-powered world"Lablup Inc.
 
Machine Learning Model Serving with Backend.AI
Machine Learning Model Serving with Backend.AIMachine Learning Model Serving with Backend.AI
Machine Learning Model Serving with Backend.AIJeongkyu Shin
 
2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안
2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안
2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안NAVER D2
 
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)Sang Don Kim
 
NetApp AI Control Plane
NetApp AI Control PlaneNetApp AI Control Plane
NetApp AI Control PlaneSeungYong Baek
 
Open standard open cloud engine for digital business process
Open standard open cloud engine for digital business process Open standard open cloud engine for digital business process
Open standard open cloud engine for digital business process uEngine Solutions
 
파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)
파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)
파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)Tae Young Lee
 
Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5
Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5
Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5Won Young Choi
 
2017 red hat open stack(rhosp) function overview (samuel,2017-0516)
2017 red hat open stack(rhosp) function overview (samuel,2017-0516)2017 red hat open stack(rhosp) function overview (samuel,2017-0516)
2017 red hat open stack(rhosp) function overview (samuel,2017-0516)SAMUEL SJ Cheon
 
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...hoondong kim
 
Real-time Big Data Analytics Practice with Unstructured Data
Real-time Big Data Analytics Practice with Unstructured DataReal-time Big Data Analytics Practice with Unstructured Data
Real-time Big Data Analytics Practice with Unstructured DataTed Won
 
Nexclipper_1905_summary_kor
Nexclipper_1905_summary_korNexclipper_1905_summary_kor
Nexclipper_1905_summary_korJinyong Kim
 
(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)
(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)
(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)SAMUEL SJ Cheon
 
맨땅에서 AI학습플랫폼을 만들기까지
맨땅에서 AI학습플랫폼을 만들기까지맨땅에서 AI학습플랫폼을 만들기까지
맨땅에서 AI학습플랫폼을 만들기까지Sunwoo Park
 
[경북] I'mcloud information
[경북] I'mcloud information[경북] I'mcloud information
[경북] I'mcloud informationstartupkorea
 
Big data application architecture 요약2
Big data application architecture 요약2Big data application architecture 요약2
Big data application architecture 요약2Seong-Bok Lee
 
서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료Teddy Choi
 

Similar to [온라인교육시리즈] Jupyter를 이용한 분석 환경 구축하기 - 허창현 클라우드 솔루션 아키텍트 (20)

머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발
머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발
머신러닝 및 데이터 과학 연구자를 위한 python 기반 컨테이너 분산처리 플랫폼 설계 및 개발
 
Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
Backend.AI: 오픈소스 머신러닝 인프라 프레임워크Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
 
SOSCON 2017 - Backend.AI
SOSCON 2017 - Backend.AISOSCON 2017 - Backend.AI
SOSCON 2017 - Backend.AI
 
Lablupconf session8 "Paving the road to AI-powered world"
Lablupconf session8 "Paving the road to AI-powered world"Lablupconf session8 "Paving the road to AI-powered world"
Lablupconf session8 "Paving the road to AI-powered world"
 
Machine Learning Model Serving with Backend.AI
Machine Learning Model Serving with Backend.AIMachine Learning Model Serving with Backend.AI
Machine Learning Model Serving with Backend.AI
 
2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안
2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안
2.[d2 오픈세미나]네이버클라우드 시스템 아키텍처 및 활용 방안
 
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
[Td 2015]microsoft 개발자들을 위한 달콤한 hadoop, hd insight(최종욱)
 
NetApp AI Control Plane
NetApp AI Control PlaneNetApp AI Control Plane
NetApp AI Control Plane
 
Open standard open cloud engine for digital business process
Open standard open cloud engine for digital business process Open standard open cloud engine for digital business process
Open standard open cloud engine for digital business process
 
파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)
파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)
파이썬 데이터과학 1일차 - 초보자를 위한 데이터분석, 데이터시각화 (이태영)
 
Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5
Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5
Red Hat Enterprise Linux OpenStack Platform Overview - RHELOSP5
 
2017 red hat open stack(rhosp) function overview (samuel,2017-0516)
2017 red hat open stack(rhosp) function overview (samuel,2017-0516)2017 red hat open stack(rhosp) function overview (samuel,2017-0516)
2017 red hat open stack(rhosp) function overview (samuel,2017-0516)
 
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
 
Real-time Big Data Analytics Practice with Unstructured Data
Real-time Big Data Analytics Practice with Unstructured DataReal-time Big Data Analytics Practice with Unstructured Data
Real-time Big Data Analytics Practice with Unstructured Data
 
Nexclipper_1905_summary_kor
Nexclipper_1905_summary_korNexclipper_1905_summary_kor
Nexclipper_1905_summary_kor
 
(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)
(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)
(Red hat]private cloud-osp-introduction(samuel)2017-0530(printed)
 
맨땅에서 AI학습플랫폼을 만들기까지
맨땅에서 AI학습플랫폼을 만들기까지맨땅에서 AI학습플랫폼을 만들기까지
맨땅에서 AI학습플랫폼을 만들기까지
 
[경북] I'mcloud information
[경북] I'mcloud information[경북] I'mcloud information
[경북] I'mcloud information
 
Big data application architecture 요약2
Big data application architecture 요약2Big data application architecture 요약2
Big data application architecture 요약2
 
서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료
 

More from NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼

사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트
사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트
사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트
초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트
초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트)
온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트) 온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트)
온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트) NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저
[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저
[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트
[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트
[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트
클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트
클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트
[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트
[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나
포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나
포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 
[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트
[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트
[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼
 

More from NAVER CLOUD PLATFORMㅣ네이버 클라우드 플랫폼 (20)

사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트
사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트
사물 인터넷을 넘어 지능형 사물 인터넷 시대로!_강지나 클라우드 솔루션 아키텍트
 
1시간으로 끝내는 클라우드 개념_김민형 클라우드 솔루션 아키텍트
1시간으로 끝내는 클라우드 개념_김민형 클라우드 솔루션 아키텍트1시간으로 끝내는 클라우드 개념_김민형 클라우드 솔루션 아키텍트
1시간으로 끝내는 클라우드 개념_김민형 클라우드 솔루션 아키텍트
 
초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트
초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트
초개인화된 비즈니스 시대, 마이데이터 사업에 탑승하라! - 김민형 클라우드 솔루션 아키텍트
 
[9월 런치 세미나] 도커와 쿠버네티스 기술에 스며들다
[9월 런치 세미나] 도커와 쿠버네티스 기술에 스며들다[9월 런치 세미나] 도커와 쿠버네티스 기술에 스며들다
[9월 런치 세미나] 도커와 쿠버네티스 기술에 스며들다
 
[Solutions Showcase] 클라우드 기반의 강력한 자금세탁방지시스템 AMLXpress
[Solutions Showcase] 클라우드 기반의 강력한 자금세탁방지시스템 AMLXpress[Solutions Showcase] 클라우드 기반의 강력한 자금세탁방지시스템 AMLXpress
[Solutions Showcase] 클라우드 기반의 강력한 자금세탁방지시스템 AMLXpress
 
API Economy 시대가 온다 - 강지나 클라우드 솔루션 아키텍트
API Economy 시대가 온다 - 강지나 클라우드 솔루션 아키텍트API Economy 시대가 온다 - 강지나 클라우드 솔루션 아키텍트
API Economy 시대가 온다 - 강지나 클라우드 솔루션 아키텍트
 
[웨비나] Follow me! 클라우드 인프라 구축 기본편 - 강지나 테크 에반젤리스트
[웨비나] Follow me! 클라우드 인프라 구축 기본편 - 강지나 테크 에반젤리스트[웨비나] Follow me! 클라우드 인프라 구축 기본편 - 강지나 테크 에반젤리스트
[웨비나] Follow me! 클라우드 인프라 구축 기본편 - 강지나 테크 에반젤리스트
 
온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트)
온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트) 온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트)
온라인 교육 시리즈 - 클라우드 기반의 마이데이터사업 혁신(김민형 클라우드 솔루션 아키텍트)
 
[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저
[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저
[온라인교육시리즈] 클라우드 환경에서 발생하는 위협 탐지대응 방안 - 김동운 매니저
 
2021년 기술 트렌드 - 강지나 클라우드 솔루션 아키텍트
2021년 기술 트렌드 - 강지나 클라우드 솔루션 아키텍트2021년 기술 트렌드 - 강지나 클라우드 솔루션 아키텍트
2021년 기술 트렌드 - 강지나 클라우드 솔루션 아키텍트
 
[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트
[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트
[온라인교육시리즈] 네이버클라우드플랫폼 주요 업데이트 - 윤진규 클라우드 솔루션 아키텍트
 
클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트
클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트
클라우드 상에서의 효율적인 데이터 보관 방법 - 김민형 클라우드 솔루션 아키텍트
 
[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트
[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트
[온라인 교육시리즈] Pinpoint Cloud로 시작하는 어플리케이션 성능 모니터링 - 김민형 클라우드 솔루션 아키텍트
 
포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나
포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나
포스트코로나시대에 주목받는 AI 서비스 - 네이버클라우드플랫폼 솔루션 아키텍트 강지나
 
의료계에부는 언택트 바람 - 강지나 클라우드 솔루션 아키텍트
의료계에부는 언택트 바람 - 강지나 클라우드 솔루션 아키텍트의료계에부는 언택트 바람 - 강지나 클라우드 솔루션 아키텍트
의료계에부는 언택트 바람 - 강지나 클라우드 솔루션 아키텍트
 
[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트
[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트
[온라인교육시리즈] 베어메탈서비스 소개 및 활용 - 현영환 클라우드 솔루션 아키텍트
 
멀티·하이브리드 클라우드 구축 전략 - 네이버비즈니스플랫폼 박기은 CTO
멀티·하이브리드 클라우드 구축 전략 - 네이버비즈니스플랫폼 박기은 CTO멀티·하이브리드 클라우드 구축 전략 - 네이버비즈니스플랫폼 박기은 CTO
멀티·하이브리드 클라우드 구축 전략 - 네이버비즈니스플랫폼 박기은 CTO
 
[온라인교육시리즈] 네이버 클라우드 플랫폼 Clova Premium Voice 소개
[온라인교육시리즈] 네이버 클라우드 플랫폼 Clova Premium Voice 소개[온라인교육시리즈] 네이버 클라우드 플랫폼 Clova Premium Voice 소개
[온라인교육시리즈] 네이버 클라우드 플랫폼 Clova Premium Voice 소개
 
DB innovation conference 2020
DB innovation conference 2020DB innovation conference 2020
DB innovation conference 2020
 
[네이버클라우드플랫폼 온라인 교육 시리즈] 네이버 클라우드 플래폼 OCR 소개
[네이버클라우드플랫폼 온라인 교육 시리즈] 네이버 클라우드 플래폼 OCR 소개[네이버클라우드플랫폼 온라인 교육 시리즈] 네이버 클라우드 플래폼 OCR 소개
[네이버클라우드플랫폼 온라인 교육 시리즈] 네이버 클라우드 플래폼 OCR 소개
 

[온라인교육시리즈] Jupyter를 이용한 분석 환경 구축하기 - 허창현 클라우드 솔루션 아키텍트

  • 1. NAVER Cloud Platform Webinar Run up! Jupyter를 이용한 데이터 분석 환경 구축 클라우드 솔루션 아키텍트 허창현
  • 2. 분석 환경을 구축하기 위한 요소 Data Infrastructure Framework / Library Tools 게임내 사용자 패턴 기업공시 데이터 교통 흐름 통신 데이터 의료기록 재무정보 금융분야 마이데이터 Python R TensorFlow Scala Hadoop Julia SAS Jupyter Lab JupyterHub R Studio Hive Zeppline Pycharm GPU Hi-memory, CPU Hadoop Cluster Tensorflow Cluster HPC Kubernetes Cluster Storage
  • 3. Jupyter Project IPython Project 에서 시작 다수의 커널을 지원하면서 Jupyter로 명칭 변경 오픈소스 프로젝트(BSD) 데이터 과학을 쉽게 접근할 수 있는 통로 제공 변형, 수치 시뮬레이션, 통계 모델링, 머신러닝에서 사용 대화형 분석 환경 제공
  • 5. Jupyter Notebook / JupyterLab 수십 개 언어의 실행 환경을 지원 웹 페이지 내에서 코드 실행 시각화 기능 지원 데이터 분석을 위한 코드 및 데이터 공유 Front-end, Server, Kernel 로 구성 코드와 실시간 상호작용
  • 6. Jupyter Notebook / JupyterLab User Jupyter Notebook Server Kernel Python2.7 Python3.x R Julia Other kernels … Browser Notebook file Notebook file
  • 7. JupyterHub 다중 사용자를 위한 분석 환경 제공 다양한 인증 방식 제공(OAuth, PAM..) 컨테이너 친화적 환경 제공 Kubernetes를 통한 Scalable 환경 제공 다양한 인프라에서 실행가능 A multi-user version of the notebook designed for companies, classrooms and research labs
  • 8. JupyterHub & Multi-user Python 2.7 / 3.x Python 2.7 / 3.x Jupyterhub Jupyterlab Jupyterhub Jupyterlab NAS Group1 User1 User2 User3 …. Python 2.7 / 3.x Jupyterhub Jupyterlab Group2 User1 User2 User3 …. GPU GPU GPU NAVER CLOUD PLATFORM
  • 9. JupyterHub for Kubernetes Kubernetes Service (Standard/CPU Intensive) POD POD POD POD NODE1 NODE2 NODE 1 Proxy for launching Notebook LoadBalancer NAS Block Storage Prometheus Grafana Python R NAVER CLOUD PLATFORM
  • 10. Package Install Numpy, SciPy, Pandas, Sympy... Tensorflow, PyTorch, Keras.. Matplotlib, Seabon, bokeh, Ploty… Data Science Library
  • 11. TensorFlow Server TensorFlow 외 PyTorch, Keras, Pandas, Numpy, Scikit-Learn, Gensim 등 다양한 패키지 제공 conda를 이용해 필요한 라이브러리 추가 설치 가능 Jupyter Notebook과 여러 분석에 필요한 라이브러리를 별도 설치 없이 손쉽게 사용
  • 12. TensorFlow Server JupyterNotebook User CPU Intensive GPU(v100, p40) High Memory Standard 수분 안에 다양한 라이브러리가 설치된 환경 구축 가능
  • 13. Cloud Hadoop을 이용한 분석 환경 구축 Jupyter Notebook Zepplin Notebook Ambari Spark Master Node Master Node Worker Node (yarn) Worker Node (yarn) Worker Node (yarn) Object Storage … Cloud Hadoop - Spark Cluster
  • 15. Demo1 TensorFlow Server를 이용한 분석 환경 구축 TensorFlow Server 생성 Jupyter Notebook 인증키 설정 Jupyter Notebook 접속 R 설치 및 실행 Python 실행
  • 16. Demo2 JupyterHub와 Kubernetes Service를 이용한 분석 환경 구축 Kubernetes Service Cluster 생성 Helm을 이용한 JupyterHub 설치 JupyterHub 접속 계정 별 Pod 생성 확인 Kubernetes 대시보드 접속
  • 17. 분석을 위한 네이버클라우드플랫폼 상품 Kubernetes Service Archive storage Object Storage TensorFlow Cluster TensorFlow Server Cloud Hadoop Cloud Search Elasticsearch Service Real User AnalyticsCPU Intensive GPU Server
  • 18. The End of Document Thank You