1. 장바구니를 든 데이터 사이언티스트
이커머스 회사에서 그들은 무엇을 할까?
이진형(samjin0@gmail.com)
2. 데이터 사이언티스트는?
● 수학 & 통계
○ 머신러닝
○ 통계
○ 최적화
● 프로그래밍 & 데이터베이스
○ Python or R
○ SQL
○ Hadoop
● 도메인 지식 & 소프트 스킬
○ 비즈니스에 대한 열정
○ 데이터에 대한 호기심
○ 문제 해결 능력
● 커뮤니케이션 & 시각화
○ 임원 대상 보고 스킬
○ 데이터 기반 의사결정
○ 시각화 툴 이용(MSTR, Tableau 등)
이런 것들을 다 할 줄 알아야 한데요….
14. 탐색적분석 Exploratory Data Analysis (EDA)
● 고객은 장바구니에 상품은 평균 몇 개를 담는가
● 장바구니에 물건을 담고 얼마만에 사는가?
● 그 외에 원인을 찾기 위한 다양한 분석을…..
15. 선행연구 조사 및 데이터 분석의 결론
상품 비교
찜하기
구매
가격 부담
재고 없음
깜빡함
유사 상품
구매
구매 의사 포기 원인
장바구니를 이용하는 목적과 구매 포기하는 다양한 이유가 있다.
16. 상품 비교
찜하기
구매
가격 부담
재고 없음
깜빡함
유사 상품 구매
구매 의사 포기 원인
과제를 위한 목표 선정
이 중에 구매 의지가 있지만, 아직 못산 고객에 집중해보자.
17. 가설 정의
구매 의사가 있는데 깜빡한 사람에게 푸시 메시지로 다시 알려주면 구매 할꺼야?!
18. 실험 설계
● 누구에게 보낼까?
● 몇 시에 보낼까?
● 얼마나 자주 보낼까?
● 어떤 메시지로 보낼까?
● 어떤 상품을 보낼까?
● 실험군과 대조군을 어떻게 나눌 것인가?
실험을 하기 위해서 필요한 준비사항을 파악해야 합니다.
19. 필요 데이터 정의
● 누구에게 보낼까?
○ x일 내 장바구니에 상품을 담고 미구매한 고객
● 몇 시에 보낼까?
○ 고객별 활성화 시간 파악 후 그 시간에
● 얼마나 자주 보낼까?
○ 고객의 푸시 알림 해지 현황 파악
● 어떤 메시지로 보낼까?
○ 상품의 특성에 따라
● 어떤 상품을 보낼까?
○ 고객이 구매할만한 상품
● 실험군과 대조군을 어떻게 나눌 것인가?(A/B Test)
○ 2:8, 5:5, ….
고객
장바구니
상품
주문
DATA
실험에 필요한 준비 사항에 대해서 정의하고, 데이터를 추출합니다.
37. 이번 프로젝트에서 이용한 스킬
● 수학 & 통계
○ 머신러닝
○ 통계
○ 최적화
● 프로그래밍& 데이터베이스
○ Python or R
○ SQL
○ Hadoop
● 도메인지식 & 소프트스킬
○ 비즈니스에대한 열정
○ 데이터에대한 호기심
○ 문제 해결 능력
● 커뮤니케이션& 시각화
○ 임원 대상 보고 스킬
○ 데이터기반 의사결정
○ 시각화툴 이용(MSTR, Tableau 등)
그렇습니다… 결국 모든 스킬들이 다 필요하네요….