TOROS N2 - lightweight
Approximate k-Nearest Neighbor
kakao corp.(추천팀)
유사한 아이템
( Nearest Neighbor )
이 글을 읽은 유저에게 어떤 글을 추천할 수 있을까?
여러 가지 방법으로 추천할 수 있겠지만,
1. 이 글과 유사한 글을 추천한다.
2. 이 글을 읽은 사람들이 읽은 글을 추천한다.
이번 발표에서는 1번 케이스에 집중
1. 이 글과 유사한 글을 추천한다.
2. 이 글을 읽은 사람들이 읽은 글을 추천한다.
유사한 글
출처 (왼쪽부터)
유사하지 않은 글
유사한 아이템 찾기
( Nearest Neighbor Search )
벡터 모델
• 각 아이템을 f-차원의 벡터로 표현
• 벡터로 표현하면, 각 아이템 간의 거리를 계산할 수 있음
• 거리 계산이 가능해지면, 거리가 가장 가까운 아이템을 찾으면 됨
벡터로 표현?
• 텍스트
• Word embedding (word2vec, )
• 이미지
• 학습된 네트웤에서 특정 레이어 가져오기
앞의 예시 글들을 2차원 벡터로 표현했다고 하면
[0.2, 0.8] [0.15, 0.7] [0.1, 0.9] [0.7, 0.3]
벡터로 표현된 글들은 2차원 평면에 점으로 그릴 수 있겠죠
각 글 간의 거리를 계산할 수도 있겠죠
거리가 가까우면 유사한 것
거리가 멀면 유사하지 않은 것
k개의 유사한 아이템 찾기
( k-Nearest Neighbor Search )
kNN 활용 예시
• 글 A 와 유사한 것 10개 찾아줘
• 유저 B 와 서비스 이용패턴이 비슷한 사람 1000명 찾아줘
=> 유사 아이템(글, 사진, 유저) 찾아야 하는 것을
벡터로 표현 한 뒤, 인접한 이웃을 찾아주면 끝
주어진 임의의 벡터에 대해
k개의 가장 인접한 벡터를 찾는 것
실제로 구하려면 (Brute force version)
모든 아이템과의 거리를 계산한 뒤
가장 거리가 가까운 k개 선택
Brute Force kNN
100차원 벡터 100만개가 있을때
여기까지 수행하는데
AWS c5.4xlarge 기준
> 0.1초 * 100만 = 27.7시간
> 0.1초 * 100만 = 27.7시간
> 현실적으로 사용 불가능
Brute force보다 빠른 속도로 찾는 방법은 없을까?
최근접 이웃 중 일부는 못 찾아도 괜찮으니,
Brute force보다 훨씬 빠른 속도로 찾는 방법은 없을까?
근사해서 k개의 유사한 아이템 찾기
( Approximate k-Nearest Neighbor Search )
k=5 라면, 이게 정답이지만
이렇게 찾더라도, 100배 빠르면 괜찮다!
이 경우, 정확도는 80% (= 4/5)
근사해서 찾기 때문에,
이 접근 방법을
Approximate k-Nearest Neighbor (AkNN)
라고 부릅니다.
Brute Force > 0.1초 * 100만 = 27.7시간
AkNN > 0.001초 * 100만 = 16.6분
Queries per second ( 1 / s )
> 초당 수행한 쿼리 수
쿼리 1건: 벡터 하나의 최근접 이웃을 찾는 것
여기까지 수행하는게
쿼리 1건
> 맞춘 개수 / 정답 개수
정답 개수: 5개
맞춘 개수: 4개
정답 개수: 5개
맞춘 개수: 4개
> Recall = 4/5 = 0.8
Brute Force
HNSW (Approximate kNN 알고리즘 중 하나)
Recall 7%를 잃는 대신
Recall 7%를 잃는 대신
속도는 100배 이상 빨라집니다
정리: Approximate k-Nearest Neighbor Search
• 아이템을 벡터로 표현하면 아이템 간 거리를 계산할 수 있음
• 아이템 간 거리 계산을 통해 가장 가까운 이웃을 찾을 수 있음
• 거리를 계산해야 할 대상이 너무 많으면 근사해서 빠르게 찾을 수 있음
• 대략 90%의 정확도로 100배 빠르게 찾을 수 있음
AkNN 패키지들
(Approximate k-Nearest Neighbor Search)
Annoy nmslib
• MMAP 지원
• 쓰기 쉬움
• HNSW 알고리즘 지원
단점 • 성능이 아쉬움
• MMAP 미지원
• 불편한 interface
• 복잡한 설치과정
• Random projection + Tree
• 장점
• 적은 수의 hyper parameter
• Read-only MMaped data structure 지원
• 다수의 프로세스가 모델 파일을 공유할 수 있음
• 사용하기 쉬움
• 단점
• 최신 라이브러리들에 비해 떨어지는 성능(속도, 정확도)
MMap이 지원되지 않는 경우
MMap이 지원되지 않는 경우
Process1 Process2
MMap이 지원되지 않는 경우
Process1 Process2
MMap이 지원되지 않는 경우
MMap이 지원되는 경우
MMap이 지원되는 경우
MMap이 지원되는 경우
Process1 Process2
MMap이 지원되는 경우
Process1 Process2
• 장점
• 속도, 정확도 우수한 HNSW 알고리즘 지원
• 단점
• MMap 미지원
• 초기 버전은 설치 복잡했음 (Boost, GSL, )
• 현재는 개선됨
속도, 정확도에서는 Annoy < HNSW
Annoy nmslib
• MMAP 지원
• 쓰기 쉬움
• HNSW 알고리즘 지원
단점 • 성능이 아쉬움
• MMAP 미지원
• 불편한 interface
• 복잡한 설치과정
Annoy nmslib
• MMAP 지원
• 쓰기 쉬움
• HNSW 알고리즘 지원
단점 • 성능이 아쉬움
• MMAP 미지원
• 불편한 interface
• 복잡한 설치과정
장점만 가져올 수는 없을까?
> 만들어 보자!
• 장점
• HNSW 알고리즘 지원
• MMAP 지원
• 빠른 Index Build 속도 (nmslib 대비 55% 빠름)
• 설치 & 사용 간편
• Python, Go binding
• 단점
• Search 속도는 nmslib이 빠름 (빌드 속도와 trade-off 가능)
Why N2? - N이 2개라서…
Approximate k-Nearest Neighbor
annoy (2013)
HNSW 페이퍼 (2016)
HNSW (nmslib) (2016.04)
n2 개발 (2016.12)
n2 오픈소스화 (2017.09)
nmslib (2017) nmslib(2018) n2(2017)
장점 • HNSW 알고리즘 지원
• HNSW 구현체 중 가
장 빠른 Search 속도
• HNSW 알고리즘 지원
• 빠른 Build 속도
• MMAP 지원
• 설치/인터페이스 간편
• MMAP 미지원
• 불편한 interface
• 복잡한 설치과정
• MMAP 미지원
그 사이에 nmslib도 많이 좋아졌어요
HNSW 구현체들
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. 2016.
Yu. A. Malkov, A. Ponomarenko, V. Krylov. Approximate nearest neighbor algorithm based on navigable small world graphs. 2014
HNSW (Hierarchical Navigable Small World graphs)
Navigable Small World graph (NSW)
Hierarchical NSW (HNSW)
SW-graph, HNSW
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
• 노드 밀집도 증가
• 노드간 거리 감소
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
• 각 노드에 연결되는 엣지
최대 개수가 제한됨
> 로그 스케일 복잡도를 보장해줌
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
• 각 노드의 레벨은 Index build
타이밍에 랜덤으로 결정됨
• Layer=0에는 모든 노드가 존재
• 그 중 일부가 상위 레벨에도 존재
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
Level = 2 인 노드
Level = 1, 0 에도 노드가 존재함
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
Level = 1 인 노드
Level = 0 에도 노드가 존재함
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
Enter point
• Graph Traverse는
최상위 레이어에 있는
Enter point부터 시작
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
Query Vector
여기서부터 Traverse 시작
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
현재 Layer에서
Query vector와 가장 인접한
노드까지 이동
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
아래 Layer로 이동
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
현재 Layer에서
Query vector와 가장 인접한
노드까지 이동
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
아래 Layer로 이동
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
현재 Layer에서
Query vector와 가장 인접한
노드까지 이동
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
자갈치 시장
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
자갈치 시장
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
자갈치 시장
Yu. A. Malkov, D. A. Yashunin. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small
World graphs. 2016.
Layer = 0
Layer = 1
Layer = 2
자갈치 시장
Benchmark - Build time
• glove 100D data, 8 thread 기준, n2가 55% 빠름
Index building parameter setting
M32,post0 M48,post0 M32,post2 M48,post2
hnsw(n2) hnsw(nmslib)
Index Build Time 최적화
• 코드 리펙토링
• Memory Prefetch
데이터 개수
0 300,000 600,000 900,000 1,200,000
nmslib N2 (프로토 타입) N2 (최적화)
위 차트는 glove 100D 데이터(120만건)로 측정한 결과
Data source:
Memory Prefetch
• CPU에서 사용할 데이터를 메인 메모리에서 캐시 메모리로 미리 올려놓는 방식
Memory Prefetch (software prefetching)
Prefetching 을 하지 않은 경우
Prefetching 을 한 경우
Benchmark - Search speed
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
hnsw(n2) hnsw(nmslib) annoy
성능 요약
• Index build time은 n2 우세
• Search time 은 nmslib 우세
• trade-off 가능한 수준
프로세스 1개 띄웠을 때
프로세스 21개 띄웠을 때
간편한 설치 & 사용 (python)
Go binding
정리: TOROS N2
• 장점
• HNSW 알고리즘 지원
• 빠른 Index Build 속도 (nmslib 대비 55% 빠름)
• MMAP 지원
• 설치 & 사용 간편
• Python, Go binding
• Future work
• Search 속도 개선
• Build 할 때 메모리 더블링 이슈 해결
• 항상 k개 결과 보장하도록 개선

TOROS N2 - lightweight approximate Nearest Neighbor library