SlideShare a Scribd company logo
1 of 13
Download to read offline
Boosted Decision Tree를 사용한
Lending Club의 채무자 원리금 상환
/ 상환실패 예측
Data Science School 2기
이성진
발표 개요
• 주제 선정 이유
• 의사결정 나무
• Ada Boost
• 모델 적용
• 결과
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
현실에서의 2가지 분류 문제들
주가의 상승 / 주가의 하락
스팸 / 비-스팸
마케팅 메일 응답 / 마케팅 메일 비응답
원리금 완납 / 완리금 완납 실패
주제 선정 이유
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
현실 세계에서의 2가지 Classification 사례들
주가의 상승 / 주가의 하락 ?
파산 / 상환
스팸 / 비-스팸
마케팅 메일 응답 / 마케팅 메일 비응답
원리금 완납 / 완리금 완납 실패
랜딩클럽 2016년 1분기 데이터
주제 선정 이유
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
데이터 전처리
데이터 전처리(재료손질)
-> 모델(요리법) 적용
(42538, 111)
데이터 전처리
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
(42538, 111)
(42506, 26)
데이터 전처리
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
(42538, 111)
(42506, 26)
(42506, 55)
데이터 전처리
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
의사결정나무
연소득
(>$30K)
취업 기갂(년)
(>3)
주택 보유 여부
파
산
y n
상
환
과거 파산 여부
y n
파
산
상
환
y n
파
산
y n
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
에이다부스트(Adaboost)
Step1:
각 분류모델의 성능에 따라
가중치 w 부여
Step2:
각 모델들을 가중치에 따라
결합하여 새로운 모델 4 생성
W1*Model1 +
W2*Model2 +
W3*Model3
= > New model 4
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
Performance and Result
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
감사합니다.
데이터사이언스스쿨 이성진 (github.com/lsjhome007)

More Related Content

More from FAST CAMPUS

데이터 사이언스 익스텐션 스쿨 강의자료 3
데이터 사이언스 익스텐션 스쿨 강의자료 3데이터 사이언스 익스텐션 스쿨 강의자료 3
데이터 사이언스 익스텐션 스쿨 강의자료 3FAST CAMPUS
 
데이터 사이언스 익스텐션 스쿨 강의자료 2
데이터 사이언스 익스텐션 스쿨 강의자료 2데이터 사이언스 익스텐션 스쿨 강의자료 2
데이터 사이언스 익스텐션 스쿨 강의자료 2FAST CAMPUS
 
데이터 사이언스 익스텐션 스쿨 강의자료 1
데이터 사이언스 익스텐션 스쿨 강의자료 1데이터 사이언스 익스텐션 스쿨 강의자료 1
데이터 사이언스 익스텐션 스쿨 강의자료 1FAST CAMPUS
 
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오FAST CAMPUS
 
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오FAST CAMPUS
 
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오FAST CAMPUS
 
[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실FAST CAMPUS
 
[패스트캠퍼스] 애자일,누굴 위한 것인가
[패스트캠퍼스] 애자일,누굴 위한 것인가[패스트캠퍼스] 애자일,누굴 위한 것인가
[패스트캠퍼스] 애자일,누굴 위한 것인가FAST CAMPUS
 
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템FAST CAMPUS
 
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프FAST CAMPUS
 
[ 유니티게임제작캠프 ] 취업준비는피씨방에서
[ 유니티게임제작캠프 ] 취업준비는피씨방에서[ 유니티게임제작캠프 ] 취업준비는피씨방에서
[ 유니티게임제작캠프 ] 취업준비는피씨방에서FAST CAMPUS
 
UI/UX 디자인 기본부터 알아봅시다.
UI/UX 디자인 기본부터 알아봅시다.UI/UX 디자인 기본부터 알아봅시다.
UI/UX 디자인 기본부터 알아봅시다.FAST CAMPUS
 
[패스트캠퍼스] 업무자동화 자기계발
[패스트캠퍼스] 업무자동화 자기계발[패스트캠퍼스] 업무자동화 자기계발
[패스트캠퍼스] 업무자동화 자기계발FAST CAMPUS
 
[패스트캠퍼스] 업무자동화 알파고
[패스트캠퍼스] 업무자동화 알파고[패스트캠퍼스] 업무자동화 알파고
[패스트캠퍼스] 업무자동화 알파고FAST CAMPUS
 
나도 코딩 공부 시작하고 싶다! (웹/파이썬)
나도 코딩 공부 시작하고 싶다! (웹/파이썬)나도 코딩 공부 시작하고 싶다! (웹/파이썬)
나도 코딩 공부 시작하고 싶다! (웹/파이썬)FAST CAMPUS
 
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?FAST CAMPUS
 
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측FAST CAMPUS
 
영화 최종 관객 수 회귀모형 및 예측
영화 최종 관객 수 회귀모형 및 예측영화 최종 관객 수 회귀모형 및 예측
영화 최종 관객 수 회귀모형 및 예측FAST CAMPUS
 
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)FAST CAMPUS
 
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측FAST CAMPUS
 

More from FAST CAMPUS (20)

데이터 사이언스 익스텐션 스쿨 강의자료 3
데이터 사이언스 익스텐션 스쿨 강의자료 3데이터 사이언스 익스텐션 스쿨 강의자료 3
데이터 사이언스 익스텐션 스쿨 강의자료 3
 
데이터 사이언스 익스텐션 스쿨 강의자료 2
데이터 사이언스 익스텐션 스쿨 강의자료 2데이터 사이언스 익스텐션 스쿨 강의자료 2
데이터 사이언스 익스텐션 스쿨 강의자료 2
 
데이터 사이언스 익스텐션 스쿨 강의자료 1
데이터 사이언스 익스텐션 스쿨 강의자료 1데이터 사이언스 익스텐션 스쿨 강의자료 1
데이터 사이언스 익스텐션 스쿨 강의자료 1
 
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
 
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
 
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
 
[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실
 
[패스트캠퍼스] 애자일,누굴 위한 것인가
[패스트캠퍼스] 애자일,누굴 위한 것인가[패스트캠퍼스] 애자일,누굴 위한 것인가
[패스트캠퍼스] 애자일,누굴 위한 것인가
 
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
 
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
 
[ 유니티게임제작캠프 ] 취업준비는피씨방에서
[ 유니티게임제작캠프 ] 취업준비는피씨방에서[ 유니티게임제작캠프 ] 취업준비는피씨방에서
[ 유니티게임제작캠프 ] 취업준비는피씨방에서
 
UI/UX 디자인 기본부터 알아봅시다.
UI/UX 디자인 기본부터 알아봅시다.UI/UX 디자인 기본부터 알아봅시다.
UI/UX 디자인 기본부터 알아봅시다.
 
[패스트캠퍼스] 업무자동화 자기계발
[패스트캠퍼스] 업무자동화 자기계발[패스트캠퍼스] 업무자동화 자기계발
[패스트캠퍼스] 업무자동화 자기계발
 
[패스트캠퍼스] 업무자동화 알파고
[패스트캠퍼스] 업무자동화 알파고[패스트캠퍼스] 업무자동화 알파고
[패스트캠퍼스] 업무자동화 알파고
 
나도 코딩 공부 시작하고 싶다! (웹/파이썬)
나도 코딩 공부 시작하고 싶다! (웹/파이썬)나도 코딩 공부 시작하고 싶다! (웹/파이썬)
나도 코딩 공부 시작하고 싶다! (웹/파이썬)
 
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
 
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
 
영화 최종 관객 수 회귀모형 및 예측
영화 최종 관객 수 회귀모형 및 예측영화 최종 관객 수 회귀모형 및 예측
영화 최종 관객 수 회귀모형 및 예측
 
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
 
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
 

Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측