4. 3
다층 인공신경망을 활용한 상품이미지 검색
다층 인공신경망을 활용한 11번가 의류상품 검색
박지민M 전혁준M
5. 4
11번가 의류상품 검색을 위한 중복영상 제거
나상일M
입력영상 라돈변환(sinogram) 이진화 중복 군집화
중복 영상 검출결과
필요성:
- 불필요한 이미지의 색인, 저장, 검색을 줄이기 위해
- 검색결과의 다양성 재고
6. 5
다층 인공신경망을 활용한 상품이미지 검색
다층 인공신경망을 활용한 11번가 의류상품 검색
박지민M 전혁준M
7. 6
다층 인공신경망을 활용한 상품이미지 검출
다층 인공신경망을 활용한 11번가 의류상품 검색
http://175.126.56.112:15002
http://175.126.56.112:15002
김문기M 박준영M
12개의 카테고리에 대한 의류 위치를 검출하기
- 대략 100만장을 학습 데이터로 사용
- 한대의 컴퓨터(gpu)에서 10일 소요
- 5 convolution + 2 fully-connected hidden
검출이란
이미지내에 어떤 물체(what)가
어느 위치(where)에 있는지 찾는
것
8. 7
다층 인공신경망을 활용한 상품이미지 검출
– 카테고리 분류를 위한 네트워크와
물체의 위치를 찾기 위한 네트워크가
CNN 네트워크를 공유하면서 동시에 학습을 수행
(a.k.a Multi-task learning)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
카테고리분류
네트워크
위치검출
네트워크
Cross-entropy loss Regression loss
Gradient flow
Data flow
9. 8
다층 인공신경망을 활용한 상품이미지 검색
다층 인공신경망을 활용한 11번가 의류상품 검색
박지민M 전혁준M
10. 9
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
11. 10
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
12. 11
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
13. 12
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
Gradient 전송
14. 13
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
Parameter 전송
15. 14
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
NVIDIA NCCL
Universal Virtual Addressing(UVA)
NVIDIA GPUDirectTM
PCIe
NVIDIA, NVIDIA GPUDirect Technology
NCCL: Acdelerated Multi-GPU collective communication
16. 15
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 대략 100만건의 학습 데이터
– 2 gpu를 사용하여 병렬처리하여 대략 6일 소요
– 45 convolutions
추출된 특징추출 벡터에 대한 해싱 수행
– CNN 모델에서 학습한 bias vector를 활용하여 이진화를 수행
– 하나의 쿼리 벡터(9216 차원)에 대해
100만 샘플을 검색하는데 걸리는 시간: 160ms
다층 인공신경망을 활용한 11번가 의류상품 검색