SlideShare a Scribd company logo
1 of 73
Download to read offline
Анализ изображений и видео
Наталья Васильева
nvassilieva@hp.com
HP Labs Russia
26 октября 2012, Computer Science Center
Лекция 6: Поиск по подобию. Поиск нечетких
дубликатов.
2 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск по визуальному подобию: описание
Задача: найти картинки, похожие на запрос
визуально и семантически
Похожи Отдаленно Не похожи
3 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск нечетких дубликатов: описание
Задача: найти группы нечетких дублей в коллекции
Дубли Не дубли
4 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Традиционная архитектура систем CBIR
Поиск по содержанию, по визуальному подобию
Content Based Image Retrieval (CBIR)
5 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Индексирование изображений
Fig. credit: http://www.vlfeat.org/
Построение
векторов
признаков
Помещение векторов
в хранилище,
построение индекса
6 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск изображений
• Данные высокой размерности
− Среднее значение для каждого цветового
канала: dim(x) = 3
− Гистограмма по одному каналу: dim(x) = 256
− ICA-based texture: dim(x) = 21*30
− SIFT: dim(x) = 128 * N
• Поиск по подобию, поиск ближайших
соседей
Необходим способ так организовать хранение,
чтобы можно было по запросу быстро и эффективно
находить в хранилище наиболее похожие объекты
7 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Каждый вектор – точка в пространстве высокой размерности
(например, dim=128 для дескрипторов SIFT)
Slide credit: K. Grauman, B. Leibe
Индексирование
8 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Соседние точки в пространстве признаков соответствуют близким векторам,
которые соответствуют подобию изображений
Fig. credit: A. Zisserman
Индексирование
9 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск ближайших соседей
ε-Nearest Neighbor Search (ε - NNS)
Для запроса q найти подмножество всех точек p ∈ P (P – метрическое
пространство), таких что:
Можно обобщить до k–nearest neighbor search ( K >1) (Top-K)
),(min)1(),( rqdistpqdist
Pr∈
+≤ ε
10 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск ближайших соседей
k–Nearest Neighbor Search (Top-k search)
Для запроса q найти подмножество (P – метрическое пространство):PA ⊆
),(),(:,|| 2121 pqdistpqdistAPpApkA ≤∈∀∈∀=
q
11 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Для запроса q
Вычислить dist(q,p) для всех точек p ∈ P
Наивный подход
O(N) для каждого запроса!
(|P|=N)
12 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Некоторые индексные структуры
Деревья
–R-tree – подходит только для небольших размерностей (2D), пересечение узлов
–k-D tree – неэффективны в случае ассиметричных данных высокой размерности
–Vantage-Point tree (VP tree) (один из вариантов метрических деревьев)
Обратный индекс
–Vocabulary tree
Хэширование
–LSH
13 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
Pt X Y
1 0.00 0.00
2 1.00 4.31
3 0.13 2.85
… … …
We start with a list of n-dimensional points.
Slide credit: Brigham Anderson
14 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
Pt X Y
1
0.0
0
0.0
0
3
0.1
3
2.8
5
… … …
We can split the points into 2 groups by choosing a
dimension X and value V and separating the points into
X > V and X <= V.
X>.5
Pt X Y
2 1.00 4.31
… … …
YESNO
Slide credit: Brigham Anderson
15 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
Pt X Y
1
0.0
0
0.0
0
3
0.1
3
2.8
5
… … …
We can then consider each group separately and
possibly split again (along same/different dimension).
X>.5
Pt X Y
2 1.00 4.31
… … …
YESNO
Slide credit: Brigham Anderson
16 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
Pt X Y
3
0.1
3
2.8
5
… … …
We can then consider each group separately and
possibly split again (along same/different dimension).
X>.5
Pt X Y
2 1.00 4.31
… … …
YESNO
Pt X Y
1
0.0
0
0.0
0
… … …
Y>.1
NO
YES
Slide credit: Brigham Anderson
17 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
We can keep splitting the points in each set to create a
tree structure. Each node with no children (leaf node)
contains a list of points.
Slide credit: Brigham Anderson
18 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
We will keep around one additional piece of
information at each node. The (tight) bounds of the
points at or below this node.
Slide credit: Brigham Anderson
19 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
KD-Tree Construction
Use heuristics to make splitting decisions:
Which dimension do we split along? Widest
Which value do we split at? Median of value of that split dimension for the points.
When do we stop? When there are fewer then m points left OR the box has hit some
minimum width.
Slide credit: Brigham Anderson
20 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
We traverse the tree looking for the nearest
neighbor of the query point.
Slide credit: Brigham Anderson
21 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Examine nearby points first: Explore the branch of
the tree that is closest to the query point first.
Slide credit: Brigham Anderson
22 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Examine nearby points first: Explore the branch of
the tree that is closest to the query point first.
Slide credit: Brigham Anderson
23 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
When we reach a leaf node: compute the distance
to each point in the node.
Slide credit: Brigham Anderson
24 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
When we reach a leaf node: compute the distance
to each point in the node.
Slide credit: Brigham Anderson
25 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Then we can backtrack and try the other branch at
each node visited.
Slide credit: Brigham Anderson
26 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Each time a new closest node is found, we can
update the distance bounds.
Slide credit: Brigham Anderson
27 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Using the distance bounds and the bounds of the
data below each node, we can prune parts of the
tree that could NOT include the nearest neighbor.
Slide credit: Brigham Anderson
28 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Using the distance bounds and the bounds of the
data below each node, we can prune parts of the
tree that could NOT include the nearest neighbor.
Slide credit: Brigham Anderson
29 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Nearest Neighbor with KD Trees
Using the distance bounds and the bounds of the
data below each node, we can prune parts of the
tree that could NOT include the nearest neighbor.
Slide credit: Brigham Anderson
30 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Spheres vs. Rectangles
• ↑↑⇒ ratiolitydimensiona1
e)Volume(Cub
ere)Volume(Sph
ratio ≤= •
• relative distances
31 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Метрические деревья
32 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Vantage point method
σµ −≤),( qvd
σµ +>),( qvd
σσµµ =−−>−≥ |)(||),(),(|),( qvdpvdpqd
σµσµ =−+>−≥ |))(||),(),(|),( pvdqvdpqd
>∈ Sp
≤∈ Sp
33 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Как выбрать опорные точки?
• Минимальная длина
разделяющей дуги
• “Угловые” точки
пространства
• Чтобы дерево было
сбалансированным
• Максимум
среднеквадратичного
отклонения
34 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Построение VP-tree
35 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Обратный индекс
Для текстов: структура для
эффективного поиска страниц,
на которых упомянуто слово…
Наша цель: найти изображения,
которым соответствуют заданные
вектора признаков.
Чтобы использовать эту идею,
нам надо построить из признаков
словарь “визуальных слов”.
36 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
«Визуальные слова»: основная идея
Извлечем локальные признаки из нескольких изображений…
Пространство локальных признаков
(например, SIFT-дескрипторов)
Slide credit: D. Nister
37 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
«Визуальные слова»: основная идея
Slide credit: D. Nister
Извлечем локальные признаки из нескольких изображений…
Пространство локальных признаков
(например, SIFT-дескрипторов)
38 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Slide credit: D. Nister
«Визуальные слова»: основная идея
Извлечем локальные признаки из нескольких изображений…
Пространство локальных признаков
(например, SIFT-дескрипторов)
39 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
«Визуальные слова»: основная идея
Извлечем локальные признаки из нескольких изображений…
Slide credit: D. Nister
Пространство локальных признаков
(например, SIFT-дескрипторов)
40 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
«Визуальные слова»: основная идея
Извлечем локальные признаки из нескольких изображений…
Slide credit: D. Nister
Пространство локальных признаков
(например, SIFT-дескрипторов)
41 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Slide credit: D. Nister
42 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Slide credit: D. Nister
43 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Отобразим дескрипторы в токены/слова путем квантования
пространства признаков
Квантование при помощи
кластеризации пространства
Центры кластеров – «леммы»
«визуальных слов»
Пространство
признаков
«Визуальные слова»: основная идея
Slide credit: K. Grauman, B. Leibe
44 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Отобразим дескрипторы в токены/слова путем квантования
пространства признаков
Каждый вектор признаков
отображаем в «слово» – находим
ближайший центр кластера
Описваем изображение через
набор «визуальных слов»
Пространство
признаков
«Визуальные слова»: основная идея
Slide credit: K. Grauman, B. Leibe
45 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Фрагментам из одной группы
соответствует одно и то же
визуальное слово
Fig. credit: Sivic & Zisserman
Визуальные слова
46 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Номер
слова
Список номеров
изображений
Изображение №5 Изображение №10
Slide credit: K. Grauman, B. Leibe
Обратный индекс изображений по визуальным
словам
47 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Bag of visual words
«Мешок визуальных слов»
Fig. credit: Fei-Fei Li
48 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Bag of visual words
«Мешок визуальных слов»
Fig. credit: Fei-Fei Li
Словарь визуальных слов
49 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Основные вопросы:
• Как выбрать фрагменты изображений?
• Какой алгоритм квантования/кластеризации использовать?
• С учителем / без учителя
• Как выбрать множество изображений, чтобы получить универсальный словарь?
• Размер словаря, число слов?
Как построить словарь?
Slide credit: K. Grauman, B. Leibe
50 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Dense, uniformlySparse, at interest
points
Randomly
Multiple interest
operators
• To find specific, textured objects, sparse sampling
from interest points often more reliable.
• Multiple complementary interest operators offer
more image coverage.
• For object categorization, dense sampling offers
better coverage.
[See Nowak, Jurie & Triggs, ECCV 2006]
Выбор фрагментов
Slide credit: K. Grauman, B. Leibe
51 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Методы квантования/кластеризации
Традиционные решения:
• k-means, agglomerative clustering, mean-shift,…
Использование иерархической кластеризации,
организация словаря в виде дерева:
• Vocabulary tree [Nister & Stewenius, CVPR 2006]
Более быстрая индексация и поиск при большем размере словаря!
52 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Построение дерева
Slide credit: David Nister
Slide credit: D. Nister
53 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Индексирование
Slide credit: D. Nister
54 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Индексирование
Slide credit: D. Nister
55 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Индексирование
Img1, 1Img2, 1
Img1, 2
Slide credit: T. Tommasi
• Каждый узел дерева –
обратный индекс
• Каждый узел дерева
хранит идентификаторы
изображений и частоту
соответствующего слова в
изображении (или tf-idf)
56 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск
Slide credit: D. Nister
57 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Vocabulary Tree: Performance
Evaluated on large databases
• Indexing with up to 1M images
Online recognition for database
of 50,000 CD covers
• Retrieval in ~1s
Find experimentally that large vocabularies can be
beneficial for recognition
[Nister & Stewenius, CVPR’06]
Slide credit: K. Grauman, B. Leibe
58 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Locality Sensitive Hashing (LSH): motivation
• Similarity Search over High-Dimensional Data
− Image databases, document collections etc
• Curse of Dimensionality
− All space partitioning techniques degrade to linear search for
high dimensions
• Exact vs. Approximate Answer
− Approximate might be good-enough and much-faster
− Time-quality trade-off
Need sub-linear dependence on the data-size for high-dimensional data!
59 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
LSH: Key idea
Hash the data-point using several LSH functions so that probability of
collision is higher for closer objects
Indyk & Motwani, 1998
Fig. credit: P. Indyk, K. Grauman, B. Leibe
60 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Slide credit: P. Indyk
61 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
LSH (альтернативное определение)
Пусть P множество объектов (точек в пространстве выскокой размерности),
sim – функция подобия объектов:
Тогда схема LSH – это семейство хэш-функций H, имеющих распределение D,
таких что при выборе функции h ∈ H согласно распределению D:
]1,0[: →× PPsim
PpqpqsimphqhHh ∈∀==∈ ,),()]()([Pr
62 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
LSH: индексирование
Вход:
• Set of N points { p1 , …….. pn }
• L – длина хэша
• M – число хэш-таблиц
Выход:
• Хэш-таблицы Ti , i = 1 , 2, …. M
Алгоритм:
Foreach i = 1 , 2, …. M
Initialize Ti with a random hash function gi(p)=<h1(p), h2(p),…hk(p)>
Foreach i = 1 , 2, …. M
Foreach j = 1 , 2, …. N
Store point pj on bucket gi(pj) of hash table Ti
63 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
LSH: индексирование
g1(pi) g2(pi) gM(pi)
TMT2T1
pi
P
64 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
LSH: поиск билижайшего соседа
Вход:
• Запрос q
Выход:
• Приблизительный ближайший сосед p для q
Алгоритм:
Foreach i = 1 , 2, …. M
Foreach { p: точа из ячейки gi(q) хэш-таблицы Ti }
IF THEN return pcrpq ≤− ||||
65 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Использование LSH для поиска нечетких дубликатов
Шаг 1: Для каждого изображения коллекции вычислить набор локальных
дескрипторов (например, набор SIFT-дескрипторов)
Шаг 2: Вычислить хэш-значение для каждого дескриптора
Шаг 3: Для каждой пары изображений вычислить колчиество совпадающих хэшей
Шаг 4: Дубликаты: пары изображений с числом совпадений > threshold
66 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Оценка методов поиска
Быстродействие (efficiency)
• Важно в связи с большими объемами данных
Качество (effectiveness)
• Как померять?
Что оценивать?
67 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Проблемы оценки
Необходимость наличия общей тестовой коллекции
• Corel Photo CDs
• Brodatz texture collection: http://www.ux.uis.no/~tranden/brodatz.html
• CoPhIR: http://cophir.isti.cnr.it/whatis.html
• Участие в ImageCLEF, TRECVID, imageEVAL, ROMIP
Как получить оценку релевантности?
• Использование коллекций с выделенными группами (Corel collection)
• Оценка пользователями
–Метод общего котла (Pooling)
–Различные виды оценки (relevant – not relevant, ranking, …)
68 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
“You can see, that our results are better”
Оценка качества
69 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Численная оценка качестве
Точность (precision), полнота (recall)
–Average recall/precision
–Recall at N, Precision at N
–F-measure
70 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Численная оценка
• Error rate
• Retrieval efficiency
71 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Картиночные дорожки на
 Поиск по визуальному подобию (с 2008)
− Коллекция Flickr (20000 изображений)
− 750 tasks labeled
 Поиск нечетких дубликатов (с 2008)
− Коллекция: набор кадров из видео потока (37800 изображений)
− ~1500 clusters
 Построение текстовых меток (с 2010)
− Коллекция Flickr (20000 изображений)
− ~ 1000 labeled images
http://romip.ru
72 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск по визуальному подобию: наблюдения
Слабая согласованность оценок асессоров
• Число слаборелевантных 377 (AND), 1086 (VOTE) и 3052 (OR)
Низкое качество результатов у всех участников
AND-weak
0
0,002
0,004
0,006
0,008
0,01
0,012
0,014
0,016
0,018
0,02
P(10) R-precision
Value
OR-weak
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
P(10) R-precision
VOTE-weak
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
P(10) R-precision
Value
73 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Заключение
Поиск изображений: необходимость индексировать данные высокой
размерности
• Использование классических методов многомерного
индексирования (k-мерные деревья, метрические деревья)
• Обратный индекс
• «Мешок визуальных слов», vocabulary tree
• Locality Sensitive Hashing
Оценка методов поиска
• Единые тестовые коллекции, единые метрики оценки
• Качество поиска пока все еще далеко от идеала
• РОМИП – требуются добровольцы!

More Related Content

Viewers also liked

Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...
		Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...		Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...
Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...Yandex
 
Поиск нечетких дубликатов видео, НКП-2013, МГППУ
Поиск нечетких дубликатов видео, НКП-2013, МГППУПоиск нечетких дубликатов видео, НКП-2013, МГППУ
Поиск нечетких дубликатов видео, НКП-2013, МГППУIlya w-495 Nikitin (official)
 
дипломная презентация по вкладам физических лиц
дипломная презентация по вкладам физических лицдипломная презентация по вкладам физических лиц
дипломная презентация по вкладам физических лицIvan Simanov
 
Реабилитация, абилитация и социализация : виртуальный обзор
Реабилитация, абилитация и социализация : виртуальный обзорРеабилитация, абилитация и социализация : виртуальный обзор
Реабилитация, абилитация и социализация : виртуальный обзорАгния Книгина
 
дипломная презентация по пластиковым картам для физических лиц
дипломная презентация по пластиковым картам для физических лицдипломная презентация по пластиковым картам для физических лиц
дипломная презентация по пластиковым картам для физических лицIvan Simanov
 
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)Ontico
 

Viewers also liked (6)

Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...
		Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...		Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...
Поиск похожих видео-роликов на основе анализа содержимого видео-файлов — Ан...
 
Поиск нечетких дубликатов видео, НКП-2013, МГППУ
Поиск нечетких дубликатов видео, НКП-2013, МГППУПоиск нечетких дубликатов видео, НКП-2013, МГППУ
Поиск нечетких дубликатов видео, НКП-2013, МГППУ
 
дипломная презентация по вкладам физических лиц
дипломная презентация по вкладам физических лицдипломная презентация по вкладам физических лиц
дипломная презентация по вкладам физических лиц
 
Реабилитация, абилитация и социализация : виртуальный обзор
Реабилитация, абилитация и социализация : виртуальный обзорРеабилитация, абилитация и социализация : виртуальный обзор
Реабилитация, абилитация и социализация : виртуальный обзор
 
дипломная презентация по пластиковым картам для физических лиц
дипломная презентация по пластиковым картам для физических лицдипломная презентация по пластиковым картам для физических лиц
дипломная презентация по пластиковым картам для физических лиц
 
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
 

More from Yandex

Предсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of TanksПредсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of TanksYandex
 
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...Yandex
 
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров ЯндексаСтруктурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров ЯндексаYandex
 
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров ЯндексаПредставление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров ЯндексаYandex
 
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Yandex
 
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...Yandex
 
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Yandex
 
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...Yandex
 
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...Yandex
 
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...Yandex
 
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...Yandex
 
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...Yandex
 
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеровКак защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеровYandex
 
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...Yandex
 
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...Yandex
 
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...Yandex
 
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...Yandex
 
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Yandex
 
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...Yandex
 
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...Yandex
 

More from Yandex (20)

Предсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of TanksПредсказание оттока игроков из World of Tanks
Предсказание оттока игроков из World of Tanks
 
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
 
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров ЯндексаСтруктурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
 
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров ЯндексаПредставление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
 
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
 
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
 
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
 
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
 
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
 
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
 
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
 
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
 
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеровКак защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
 
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
 
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
 
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
 
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
 
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
 
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
 
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
 

Анализ изображений и видео. Поиск по подобию, поиск нечетких дубликатов.

  • 1. Анализ изображений и видео Наталья Васильева nvassilieva@hp.com HP Labs Russia 26 октября 2012, Computer Science Center Лекция 6: Поиск по подобию. Поиск нечетких дубликатов.
  • 2. 2 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск по визуальному подобию: описание Задача: найти картинки, похожие на запрос визуально и семантически Похожи Отдаленно Не похожи
  • 3. 3 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск нечетких дубликатов: описание Задача: найти группы нечетких дублей в коллекции Дубли Не дубли
  • 4. 4 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Традиционная архитектура систем CBIR Поиск по содержанию, по визуальному подобию Content Based Image Retrieval (CBIR)
  • 5. 5 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Индексирование изображений Fig. credit: http://www.vlfeat.org/ Построение векторов признаков Помещение векторов в хранилище, построение индекса
  • 6. 6 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск изображений • Данные высокой размерности − Среднее значение для каждого цветового канала: dim(x) = 3 − Гистограмма по одному каналу: dim(x) = 256 − ICA-based texture: dim(x) = 21*30 − SIFT: dim(x) = 128 * N • Поиск по подобию, поиск ближайших соседей Необходим способ так организовать хранение, чтобы можно было по запросу быстро и эффективно находить в хранилище наиболее похожие объекты
  • 7. 7 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Каждый вектор – точка в пространстве высокой размерности (например, dim=128 для дескрипторов SIFT) Slide credit: K. Grauman, B. Leibe Индексирование
  • 8. 8 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Соседние точки в пространстве признаков соответствуют близким векторам, которые соответствуют подобию изображений Fig. credit: A. Zisserman Индексирование
  • 9. 9 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск ближайших соседей ε-Nearest Neighbor Search (ε - NNS) Для запроса q найти подмножество всех точек p ∈ P (P – метрическое пространство), таких что: Можно обобщить до k–nearest neighbor search ( K >1) (Top-K) ),(min)1(),( rqdistpqdist Pr∈ +≤ ε
  • 10. 10 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск ближайших соседей k–Nearest Neighbor Search (Top-k search) Для запроса q найти подмножество (P – метрическое пространство):PA ⊆ ),(),(:,|| 2121 pqdistpqdistAPpApkA ≤∈∀∈∀= q
  • 11. 11 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Для запроса q Вычислить dist(q,p) для всех точек p ∈ P Наивный подход O(N) для каждого запроса! (|P|=N)
  • 12. 12 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Некоторые индексные структуры Деревья –R-tree – подходит только для небольших размерностей (2D), пересечение узлов –k-D tree – неэффективны в случае ассиметричных данных высокой размерности –Vantage-Point tree (VP tree) (один из вариантов метрических деревьев) Обратный индекс –Vocabulary tree Хэширование –LSH
  • 13. 13 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction Pt X Y 1 0.00 0.00 2 1.00 4.31 3 0.13 2.85 … … … We start with a list of n-dimensional points. Slide credit: Brigham Anderson
  • 14. 14 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction Pt X Y 1 0.0 0 0.0 0 3 0.1 3 2.8 5 … … … We can split the points into 2 groups by choosing a dimension X and value V and separating the points into X > V and X <= V. X>.5 Pt X Y 2 1.00 4.31 … … … YESNO Slide credit: Brigham Anderson
  • 15. 15 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction Pt X Y 1 0.0 0 0.0 0 3 0.1 3 2.8 5 … … … We can then consider each group separately and possibly split again (along same/different dimension). X>.5 Pt X Y 2 1.00 4.31 … … … YESNO Slide credit: Brigham Anderson
  • 16. 16 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction Pt X Y 3 0.1 3 2.8 5 … … … We can then consider each group separately and possibly split again (along same/different dimension). X>.5 Pt X Y 2 1.00 4.31 … … … YESNO Pt X Y 1 0.0 0 0.0 0 … … … Y>.1 NO YES Slide credit: Brigham Anderson
  • 17. 17 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction We can keep splitting the points in each set to create a tree structure. Each node with no children (leaf node) contains a list of points. Slide credit: Brigham Anderson
  • 18. 18 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction We will keep around one additional piece of information at each node. The (tight) bounds of the points at or below this node. Slide credit: Brigham Anderson
  • 19. 19 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. KD-Tree Construction Use heuristics to make splitting decisions: Which dimension do we split along? Widest Which value do we split at? Median of value of that split dimension for the points. When do we stop? When there are fewer then m points left OR the box has hit some minimum width. Slide credit: Brigham Anderson
  • 20. 20 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees We traverse the tree looking for the nearest neighbor of the query point. Slide credit: Brigham Anderson
  • 21. 21 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Examine nearby points first: Explore the branch of the tree that is closest to the query point first. Slide credit: Brigham Anderson
  • 22. 22 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Examine nearby points first: Explore the branch of the tree that is closest to the query point first. Slide credit: Brigham Anderson
  • 23. 23 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees When we reach a leaf node: compute the distance to each point in the node. Slide credit: Brigham Anderson
  • 24. 24 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees When we reach a leaf node: compute the distance to each point in the node. Slide credit: Brigham Anderson
  • 25. 25 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Then we can backtrack and try the other branch at each node visited. Slide credit: Brigham Anderson
  • 26. 26 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Each time a new closest node is found, we can update the distance bounds. Slide credit: Brigham Anderson
  • 27. 27 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Using the distance bounds and the bounds of the data below each node, we can prune parts of the tree that could NOT include the nearest neighbor. Slide credit: Brigham Anderson
  • 28. 28 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Using the distance bounds and the bounds of the data below each node, we can prune parts of the tree that could NOT include the nearest neighbor. Slide credit: Brigham Anderson
  • 29. 29 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Nearest Neighbor with KD Trees Using the distance bounds and the bounds of the data below each node, we can prune parts of the tree that could NOT include the nearest neighbor. Slide credit: Brigham Anderson
  • 30. 30 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Spheres vs. Rectangles • ↑↑⇒ ratiolitydimensiona1 e)Volume(Cub ere)Volume(Sph ratio ≤= • • relative distances
  • 31. 31 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Метрические деревья
  • 32. 32 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Vantage point method σµ −≤),( qvd σµ +>),( qvd σσµµ =−−>−≥ |)(||),(),(|),( qvdpvdpqd σµσµ =−+>−≥ |))(||),(),(|),( pvdqvdpqd >∈ Sp ≤∈ Sp
  • 33. 33 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Как выбрать опорные точки? • Минимальная длина разделяющей дуги • “Угловые” точки пространства • Чтобы дерево было сбалансированным • Максимум среднеквадратичного отклонения
  • 34. 34 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Построение VP-tree
  • 35. 35 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Обратный индекс Для текстов: структура для эффективного поиска страниц, на которых упомянуто слово… Наша цель: найти изображения, которым соответствуют заданные вектора признаков. Чтобы использовать эту идею, нам надо построить из признаков словарь “визуальных слов”.
  • 36. 36 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. «Визуальные слова»: основная идея Извлечем локальные признаки из нескольких изображений… Пространство локальных признаков (например, SIFT-дескрипторов) Slide credit: D. Nister
  • 37. 37 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. «Визуальные слова»: основная идея Slide credit: D. Nister Извлечем локальные признаки из нескольких изображений… Пространство локальных признаков (например, SIFT-дескрипторов)
  • 38. 38 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Slide credit: D. Nister «Визуальные слова»: основная идея Извлечем локальные признаки из нескольких изображений… Пространство локальных признаков (например, SIFT-дескрипторов)
  • 39. 39 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. «Визуальные слова»: основная идея Извлечем локальные признаки из нескольких изображений… Slide credit: D. Nister Пространство локальных признаков (например, SIFT-дескрипторов)
  • 40. 40 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. «Визуальные слова»: основная идея Извлечем локальные признаки из нескольких изображений… Slide credit: D. Nister Пространство локальных признаков (например, SIFT-дескрипторов)
  • 41. 41 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Slide credit: D. Nister
  • 42. 42 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Slide credit: D. Nister
  • 43. 43 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Отобразим дескрипторы в токены/слова путем квантования пространства признаков Квантование при помощи кластеризации пространства Центры кластеров – «леммы» «визуальных слов» Пространство признаков «Визуальные слова»: основная идея Slide credit: K. Grauman, B. Leibe
  • 44. 44 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Отобразим дескрипторы в токены/слова путем квантования пространства признаков Каждый вектор признаков отображаем в «слово» – находим ближайший центр кластера Описваем изображение через набор «визуальных слов» Пространство признаков «Визуальные слова»: основная идея Slide credit: K. Grauman, B. Leibe
  • 45. 45 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Фрагментам из одной группы соответствует одно и то же визуальное слово Fig. credit: Sivic & Zisserman Визуальные слова
  • 46. 46 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Номер слова Список номеров изображений Изображение №5 Изображение №10 Slide credit: K. Grauman, B. Leibe Обратный индекс изображений по визуальным словам
  • 47. 47 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Bag of visual words «Мешок визуальных слов» Fig. credit: Fei-Fei Li
  • 48. 48 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Bag of visual words «Мешок визуальных слов» Fig. credit: Fei-Fei Li Словарь визуальных слов
  • 49. 49 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Основные вопросы: • Как выбрать фрагменты изображений? • Какой алгоритм квантования/кластеризации использовать? • С учителем / без учителя • Как выбрать множество изображений, чтобы получить универсальный словарь? • Размер словаря, число слов? Как построить словарь? Slide credit: K. Grauman, B. Leibe
  • 50. 50 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Dense, uniformlySparse, at interest points Randomly Multiple interest operators • To find specific, textured objects, sparse sampling from interest points often more reliable. • Multiple complementary interest operators offer more image coverage. • For object categorization, dense sampling offers better coverage. [See Nowak, Jurie & Triggs, ECCV 2006] Выбор фрагментов Slide credit: K. Grauman, B. Leibe
  • 51. 51 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Методы квантования/кластеризации Традиционные решения: • k-means, agglomerative clustering, mean-shift,… Использование иерархической кластеризации, организация словаря в виде дерева: • Vocabulary tree [Nister & Stewenius, CVPR 2006] Более быстрая индексация и поиск при большем размере словаря!
  • 52. 52 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Построение дерева Slide credit: David Nister Slide credit: D. Nister
  • 53. 53 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Индексирование Slide credit: D. Nister
  • 54. 54 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Индексирование Slide credit: D. Nister
  • 55. 55 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Индексирование Img1, 1Img2, 1 Img1, 2 Slide credit: T. Tommasi • Каждый узел дерева – обратный индекс • Каждый узел дерева хранит идентификаторы изображений и частоту соответствующего слова в изображении (или tf-idf)
  • 56. 56 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск Slide credit: D. Nister
  • 57. 57 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Vocabulary Tree: Performance Evaluated on large databases • Indexing with up to 1M images Online recognition for database of 50,000 CD covers • Retrieval in ~1s Find experimentally that large vocabularies can be beneficial for recognition [Nister & Stewenius, CVPR’06] Slide credit: K. Grauman, B. Leibe
  • 58. 58 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Locality Sensitive Hashing (LSH): motivation • Similarity Search over High-Dimensional Data − Image databases, document collections etc • Curse of Dimensionality − All space partitioning techniques degrade to linear search for high dimensions • Exact vs. Approximate Answer − Approximate might be good-enough and much-faster − Time-quality trade-off Need sub-linear dependence on the data-size for high-dimensional data!
  • 59. 59 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. LSH: Key idea Hash the data-point using several LSH functions so that probability of collision is higher for closer objects Indyk & Motwani, 1998 Fig. credit: P. Indyk, K. Grauman, B. Leibe
  • 60. 60 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Slide credit: P. Indyk
  • 61. 61 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. LSH (альтернативное определение) Пусть P множество объектов (точек в пространстве выскокой размерности), sim – функция подобия объектов: Тогда схема LSH – это семейство хэш-функций H, имеющих распределение D, таких что при выборе функции h ∈ H согласно распределению D: ]1,0[: →× PPsim PpqpqsimphqhHh ∈∀==∈ ,),()]()([Pr
  • 62. 62 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. LSH: индексирование Вход: • Set of N points { p1 , …….. pn } • L – длина хэша • M – число хэш-таблиц Выход: • Хэш-таблицы Ti , i = 1 , 2, …. M Алгоритм: Foreach i = 1 , 2, …. M Initialize Ti with a random hash function gi(p)=<h1(p), h2(p),…hk(p)> Foreach i = 1 , 2, …. M Foreach j = 1 , 2, …. N Store point pj on bucket gi(pj) of hash table Ti
  • 63. 63 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. LSH: индексирование g1(pi) g2(pi) gM(pi) TMT2T1 pi P
  • 64. 64 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. LSH: поиск билижайшего соседа Вход: • Запрос q Выход: • Приблизительный ближайший сосед p для q Алгоритм: Foreach i = 1 , 2, …. M Foreach { p: точа из ячейки gi(q) хэш-таблицы Ti } IF THEN return pcrpq ≤− ||||
  • 65. 65 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Использование LSH для поиска нечетких дубликатов Шаг 1: Для каждого изображения коллекции вычислить набор локальных дескрипторов (например, набор SIFT-дескрипторов) Шаг 2: Вычислить хэш-значение для каждого дескриптора Шаг 3: Для каждой пары изображений вычислить колчиество совпадающих хэшей Шаг 4: Дубликаты: пары изображений с числом совпадений > threshold
  • 66. 66 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Оценка методов поиска Быстродействие (efficiency) • Важно в связи с большими объемами данных Качество (effectiveness) • Как померять? Что оценивать?
  • 67. 67 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Проблемы оценки Необходимость наличия общей тестовой коллекции • Corel Photo CDs • Brodatz texture collection: http://www.ux.uis.no/~tranden/brodatz.html • CoPhIR: http://cophir.isti.cnr.it/whatis.html • Участие в ImageCLEF, TRECVID, imageEVAL, ROMIP Как получить оценку релевантности? • Использование коллекций с выделенными группами (Corel collection) • Оценка пользователями –Метод общего котла (Pooling) –Различные виды оценки (relevant – not relevant, ranking, …)
  • 68. 68 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. “You can see, that our results are better” Оценка качества
  • 69. 69 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Численная оценка качестве Точность (precision), полнота (recall) –Average recall/precision –Recall at N, Precision at N –F-measure
  • 70. 70 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Численная оценка • Error rate • Retrieval efficiency
  • 71. 71 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Картиночные дорожки на  Поиск по визуальному подобию (с 2008) − Коллекция Flickr (20000 изображений) − 750 tasks labeled  Поиск нечетких дубликатов (с 2008) − Коллекция: набор кадров из видео потока (37800 изображений) − ~1500 clusters  Построение текстовых меток (с 2010) − Коллекция Flickr (20000 изображений) − ~ 1000 labeled images http://romip.ru
  • 72. 72 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск по визуальному подобию: наблюдения Слабая согласованность оценок асессоров • Число слаборелевантных 377 (AND), 1086 (VOTE) и 3052 (OR) Низкое качество результатов у всех участников AND-weak 0 0,002 0,004 0,006 0,008 0,01 0,012 0,014 0,016 0,018 0,02 P(10) R-precision Value OR-weak 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 P(10) R-precision VOTE-weak 0 0,005 0,01 0,015 0,02 0,025 0,03 0,035 P(10) R-precision Value
  • 73. 73 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Заключение Поиск изображений: необходимость индексировать данные высокой размерности • Использование классических методов многомерного индексирования (k-мерные деревья, метрические деревья) • Обратный индекс • «Мешок визуальных слов», vocabulary tree • Locality Sensitive Hashing Оценка методов поиска • Единые тестовые коллекции, единые метрики оценки • Качество поиска пока все еще далеко от идеала • РОМИП – требуются добровольцы!