SlideShare a Scribd company logo
1 of 33
Тонкости фильтрации и
группировки запросов
26 февраля 2015
Онлайн-марафон «SEO 24/7»
Игорь Бакалов
• В клиентском SEO с 2010 года
• Опыт продвижения: более 60 проектов
• Автор блога http://bakalov.info/
План доклада:
1) Фильтрация навигационных запросов
2) Автоматическая классификация запросов на
«информационные» и «коммерческие»
3) Быстрая группировка семантического ядра для
существующего сайта
Небольшое отступление…
Сперва нужно собрать СЯ:
1) Yandex Wordstat, Rambler AdStat, Google KeywordPlanner
2) Подсказки Яндекс, Google, Mail.ru
3) Счетчики Яндекс.Метрики, Google Analytics
4) Базы ключевых слов: Amazing, Пастухов, UP-base, …
5) Анализаторы: SpyWords, SEMrush, Prodvigator, ADVSE, …
Затем выполнить первичную чистку:
1) Чистка дубликатов
2) Чистка по спискам стоп-слов
3) Чистка от запросов с ошибками
4) Чистка от запросов-пустышек
Фильтрация навигационных запросов
Навигационный запрос – это запрос, по которому
пользователь ищет конкретную фирму или сайт.
Очень актуально в тематиках:
• кафе, рестораны
• базы отдыха, турбазы
• медицинские клиники
• банки и кредитные брокеры
• гостиницы, отели, хостелы
Частично уже рассматривал данный вопрос:
http://www.youtube.com/watch?v=4KQTlNe9HDw
Фильтрация навигационных запросов
Определяем витальный сайт по запросу в Yandex.XML.
Например, по запросу «русский дом база отдыха»
сайт russ-dom.ru:
Фильтрация навигационных запросов
Общая схема:
1) Собрать топ-10 по всему СЯ через Yandex.XML. Разделить запросы на 2
группы: в первой – по XML есть витальные сайты, во второй – нет.
2) Для первой группы – по каждому запросу из топ-10 исключается
витальный сайт, затем подсчитывается сколько раз оставшиеся сайты
встречаются в группе. Задается минимальный порог «встречаемости».
Формируется «итоговый список» доменов, которые встречаются в
первой группе с количеством раз не менее заданного порога.
3) Для второй группы – по каждому запросу оценивается топ-10, если
сайт встречается в «итоговом списке», то он получает «1», если не
встречается, то «0». На выходе получаем оценку для каждого запроса,
которая характеризует на сколько топ-10 по конкретному запросу из
второй группы «похож» на выдачу по запросу, где есть витальный
сайты.
Фильтрация навигационных запросов
Выгрузка топ-10 по запросам, где есть витальный
сайт (из KeyCollector):
Фильтрация навигационных запросов
Используя функционал Excel «текст по столбцам» и
удалением лишних строк, приводится к виду:
Фильтрация навигационных запросов
Подсчитывается сколько раз каждый домен (кроме
витальных) встречается в выдаче, выбираются где домены,
которые встречаются 3 и более раз:
Фильтрация навигационных запросов
Для СЯ, которое необходимо проверить выполняется поиск в
топ-10 доменов, которые встречаются по витальным запросам:
Фильтрация навигационных запросов
Пример в тематике «турбазы»
Запросов всего: 3256
Запросов, где по Yandex.XML есть витальный сайт: 222
Порог «встречаемости»: 3
Порог для определения навигационных запросов: 0.3
Запросов прошедших порог: 1444 из 3034 (47.6%)
Ошибочно определенных запросов: 129
Точность: 91%
Фильтрация навигационных запросов
Примеры правильно определенных запросов («турбазы»):
база отдыха ландыш, база отдыха речка, сокол турбаза, турбаза остров, база
отдыха барсучок, база отдыха голд фиш, база отдыха городок, база отдыха
дельфин, база отдыха дубровский, база отдыха остров, база отдыха электрон,
база отдыха янисъярви, базы отдыха бурная ладога, турбаза барсучок, турбаза
заря, турбаза здоровяк, турбаза зоря, турбаза маяк, турбаза полет
Примеры НЕ правильно определенных запросов («турбазы»):
турбазы амурской области, турбазы в тверской области недорого, базы отдыха
в карманово, базы отдыха городецкого района, базы отдыха кстовский район,
базы отдыха на ветлуге, базы отдыха на селигере, базы отдыха на черном море,
воротынский район базы отдыха, нижегородские базы отдыха, турбазы
нижегородской области, турбазы тверской области, тюменские базы отдыха,
база отдыха тверская область, базы отдыха семеновский район
Фильтрация навигационных запросов
Пример в тематике «доставка суши»
Запросов всего: 5786
Запросов, где по Yandex.XML есть витальный сайт: 933
Порог «встречаемости»: 5
Порог для определения навигационных запросов: 0.4
Запросов прошедших порог: 1837 из 4853 (37.9%)
Ошибочно определенных запросов: 270
Точность: 85%
Фильтрация навигационных запросов
Примеры правильно определенных запросов («суши»):
суши ласты меню, окинава суши щукинская, суши маг на пионерской, бенто суши
москва, евразия суши бар цены, империя суши москва, море суши москва, планета
суши меню доставки, ресторан суши таун, суши бар лотос, суши бар япона мама,
суши вок ладожская, суши маг гашека, суши сан москва сходненская, суши сити
бар, суши шоп время, ямамото суши бар
Примеры НЕ правильно определенных запросов («суши»):
суши метро лесная, суши бар коломенская, суши бар на арбате, суши метро
большевиков, суши фрунзенская, доставка суши метро алексеевская, доставка
суши профсоюзная, доставка суши щелковский район, метро молодежная суши,
проспект мира суши бар, суши бары москвы, суши бар на гагарина, суши бар на
ленина, суши бар на щукинской, суши метро автозаводская, суши метро
алексеевская, суши метро арбатская, суши метро баррикадная
Фильтрация навигационных запросов
Пример в тематике «доставка суши»
Из 270 ошибочно определенных запросов:
• 117 по станциями метро
• 25 по районам
• 14 по улицам
• 11 по округам
Как снизить вероятность ошибки?
На начальном этапе выделить все запросы с целевыми
топонимами в отдельную группу для ручной фильтрации.
“Информационность” и “Коммерческость” запросов
Задача: есть 100500 запросов, необходимо
определить по каким Яндекс предпочитает
показывать информационные сайты, а по каким
коммерческие.
Коммерческий сайт – продает товары и/или услуги
Информационный сайт – ничего напрямую не
продает, но может размещать рекламу.
“Информационность” и “Коммерческость” запросов
Для коммерческого сайта характерно:
Наличие контактной информации (телефон,
физический адрес), обратная связь, возможность
онлайн-заказа, онлайн-консультант и т.д.
Для информационного сайта характерно:
Очень часто отсутствие выше приведенной
информации, наличие рекламы (контекстной, тизеры
и т.д.), возможность прямой рекламы на сайте.
“Информационность” и “Коммерческость” запросов
Общий алгоритм:
1. Собираем СЯ из 100500 запросов;
2. Получаем по каждому запросу топ-10;
3. Все URL объединяются в один список, удаляются дубли;
4. Каждый URL проверяется на наличие тех, или иных признаков;
5. На основе полученных признаков определяется является ли
данный URL коммерческим, или информационным;
6. В зависимости от того, сколько и каких URL в топ-10, получаем
итоговую оценку по конкретному запросу.
О том, как всё это сделать на практике, смотрим:
http://www.youtube.com/watch?v=9QKMdcU8yYY
“Информационность” и “Коммерческость” запросов
Наличие того, или иного фактора определяется при помощи регулярных
выражений.
Примеры эвристик:
• Если на странице есть контекстная реклама – это информационный
документ;
• Если на странице есть кнопка «Купить» и «Корзина» - это коммерческий
документ;
• Если на страницы есть форма «Добавить комментарий» и информация
«Реклама на сайте» - это информационный документ;
• Если на странице есть ссылка на «Наши услуги», «Прайс», городской
телефон, онлайн-консультант – это коммерческий документ;
• Если на странице нет «факторов» коммерческого документа – это
информационный документ.
“Информационность” и “Коммерческость” запросов
Тематика «эпиляция», коммерческие ГНЗ запросы:
ЗАПРОС КОММ ГЕО
восковая эпиляция купить материал 1 0
воск для депиляции фирмы 1 0
воск для эпиляции бьюти имидж 1 0
воск для эпиляции в картриджах 1 0
воск для эпиляции где продается 1 0
воск для эпиляции теплый в картридже 1 0
воск для эпиляции beauty image 1 0
все для депиляции заказать 1 0
все для депиляции интернет магазин 1 0
все для депиляции магазин 1 0
эпиляция бедер 0.9 0
эпиляция ног полностью 0.9 0
эпиляция онлайн запись 0.9 0
эпиляция сопрано 0.9 0
эпиляция soprano xl 0.9 0
“Информационность” и “Коммерческость” запросов
Тематика «эпиляция», информационные ГЗ запросы:
ЗАПРОС КОММ ГЕО
безболезненная эпиляция зоны бикини эпилятором 0 1
депиляция кремом для беременных 0 1
депиляция усов у девушек 0 1
крем для депиляции беременным 0 1
крем после эпиляции от раздражения 0 1
правильная эпиляция ног эпилятором 0 1
правильная эпиляция эпилятором 0 1
удаление волос навсегда над губой 0 1
эпиляция эпилятором подмышки 0 1
восковая эпиляция беременным 0.1 1
депиляция при беременности воском 0.1 1
крем для эпиляции в зоне бикини 0.1 1
правильная эпиляция воском 0.1 1
сделать эпиляцию сахаром 0.1 1
спрей для обезболивания при эпиляции 0.1 1
“Информационность” и “Коммерческость” запросов
Тематика «планшеты», коммерческие ГНЗ запросы:
ЗАПРОС КОММ ГЕО
заказать планшет через интернет недорого 1 0
купить планшет онлайн 1 0
планшет купить онлайн магазин 1 0
планшет купить онлайн недорого 1 0
планшет сони xperia tablet z цена 1 0
заказать бесплатно планшет 0.9 0
купить планшет онлайн в кредит 0.9 0
купить планшет iru p8901g 0.9 0
планшет леново 8000 отзывы цена 0.9 0
планшет 7 дюймов недорого 0.9 0
планшет apple ipad mini цена 0.9 0
планшет apple mini цена 0.9 0
планшет microsoft surface купить 0.9 0
samsung galaxy tab3 планшет цена 0.9 0
“Информационность” и “Коммерческость” запросов
Тематика «планшеты», информационные ГЗ запросы :
ЗАПРОС КОММ ГЕО
детский планшет рейтинг 2014 0 1
лучшие планшеты samsung 2014 года 0 1
планшеты рейтинг популярности 0 1
планшет рейтинг 2014 цена качество 0 1
рейтинг дешевых планшетов 0 1
рейтинг планшетов 2015 0 1
купить лучший планшет 2014 года 0.1 1
лучшие планшеты леново топ 10 0.1 1
лучшие планшеты цена качество 0.1 1
лучшие 7 дюймовые планшеты 0.1 1
лучший планшет для дома 0.1 1
планшеты по дешевке 0.1 1
планшет по параметрам 0.1 1
подбор планшета по параметрам 0.1 1
самый дешевый планшет 0.1 1
Группировка СЯ для существующего сайта
Способы группировки семантики:
1) Ручная группировка:
• В Excel
• В KeyCollector
2) Автоматические группировщики по SERP:
• seo-case.com
• engine.seointellect.ru
• coolakov.ru
• just-magic.org
• rush-analytics.ru
• semparser.ru
• stoolz.ru
Группировка СЯ для существующего сайта
Минусы ручной группировки:
• Долго
• Много ошибок
Минусы автоматической группировки по SERP:
• Получаем группы запросов без привязки к сайту
• Не понятно, под какие группы уже есть
посадочные страницы, а под какие необходимо их
создать.
Группировка СЯ для существующего сайта
Альтернативный подход:
1) Собрать семантическое ядро для сайта, получить
по каждому запросу топ-10 выдачи ПС.
2) Для каждой страницы на сайте выбрать 1 запрос,
который ее максимально точно описывает. Для
всех этих запросов также получить топ-10 выдачи.
3) Сравнить SERP’ы по «привязанным» запросам с
SERP’ами по подобранному семантическому ядру.
На основе схожести выдачи привязать запросы из
СЯ к страницам сайта.
Группировка СЯ для существующего сайта
Общий алгоритм:
1) Строится таблица соответствия, в которой указано сколько каждый
запрос (из привязанных к сайту) имеет пересечений по URL’ам с
каждым запросом из подобранного семантического ядра.
2) Например, если ключ N из СЯ имеет 10 пересекающихся URL с ключом
M привязанному к сайту, то ключ N привязывается к ключу M и
удаляется из таблицы.
3) В начале группируются ключи, которые имеют 10 пересекающихся URL,
затем 9, 8 и т.д.
На выходе получается таблица, где для каждой группы запросов известно
основное ключевое слово, привязанное к конкретной странице на сайте, а
также дополнительные ключевые слова с указанием значения близости,
которое зависит от количество пересечений в топ-10.
Группировка СЯ для существующего сайта
Пример реализации: небольшая десктопная
программа, на вход которой подается 2 файла с
выгрузками из KeyCollector:
Что получается на выходе?
Группировка СЯ для существующего сайта
Пример группировки в тематике «Айфоны»:
Группировка СЯ для существующего сайта
Пример группировки в тематике «Духи»:
Группировка СЯ для существующего сайта
Пример группировки в тематике «Насосы»:
Спасибо за внимание!
Игорь Бакалов
Подписывайтесь на мой блог:
http://bakalov.info/
И добавляйтесь в социальных сетях:
https://www.facebook.com/bakalov.igor
https://twitter.com/Bakalov_Igor
https://www.youtube.com/user/b7186rft

More Related Content

What's hot

10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)Стас Поломарь
 
Исследование нового фильтра АГС-- Яндекса 2015
Исследование нового фильтра АГС-- Яндекса 2015Исследование нового фильтра АГС-- Яндекса 2015
Исследование нового фильтра АГС-- Яндекса 2015Александр Алаев
 
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...Дмитрий Севальнев
 
Продвижение в Google: нюансы и фишки
Продвижение в Google: нюансы и фишкиПродвижение в Google: нюансы и фишки
Продвижение в Google: нюансы и фишкиИгорь Бакалов
 
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)Стас Поломарь
 
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...Стас Поломарь
 
Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)Стас Поломарь
 
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]Дмитрий Севальнев
 
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016Дмитрий Севальнев
 
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов
 
Автоматизация SEO-задач в 2017 — CyberMarketing — Севальнев
Автоматизация SEO-задач в 2017 — CyberMarketing — СевальневАвтоматизация SEO-задач в 2017 — CyberMarketing — Севальнев
Автоматизация SEO-задач в 2017 — CyberMarketing — СевальневДмитрий Севальнев
 
Виктор Карпенко - Seo Conference 2016, Казань
Виктор Карпенко - Seo Conference 2016, КазаньВиктор Карпенко - Seo Conference 2016, Казань
Виктор Карпенко - Seo Conference 2016, КазаньSeoProfy Presentations
 
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?Siteclinic
 
Как почистить сайт от переоптимизации?
Как почистить сайт от переоптимизации?Как почистить сайт от переоптимизации?
Как почистить сайт от переоптимизации?Siteclinic
 
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 годуАналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 годуДмитрий Севальнев
 
Анализ просадки трафика в Google - Аралов Евгений на IBCRussia
Анализ просадки трафика в Google - Аралов Евгений на IBCRussiaАнализ просадки трафика в Google - Аралов Евгений на IBCRussia
Анализ просадки трафика в Google - Аралов Евгений на IBCRussiaЕвгений Аралов
 
рабочие внешние ссылки после минусинска
рабочие внешние ссылки после минусинскарабочие внешние ссылки после минусинска
рабочие внешние ссылки после минусинскаИрина Шамина
 
Как повысить позиции сайта в поисковых системах?
Как повысить позиции сайта в поисковых системах?Как повысить позиции сайта в поисковых системах?
Как повысить позиции сайта в поисковых системах?Дмитрий Севальнев
 

What's hot (20)

10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)
 
Исследование нового фильтра АГС-- Яндекса 2015
Исследование нового фильтра АГС-- Яндекса 2015Исследование нового фильтра АГС-- Яндекса 2015
Исследование нового фильтра АГС-- Яндекса 2015
 
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
 
Продвижение в Google: нюансы и фишки
Продвижение в Google: нюансы и фишкиПродвижение в Google: нюансы и фишки
Продвижение в Google: нюансы и фишки
 
Продвижение в ТОП-10
Продвижение в ТОП-10Продвижение в ТОП-10
Продвижение в ТОП-10
 
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
 
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
 
Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)
 
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
СПИК-2014. Исследование АГС-40. [Севальнев Дмитрий]
 
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
 
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
 
Автоматизация SEO-задач в 2017 — CyberMarketing — Севальнев
Автоматизация SEO-задач в 2017 — CyberMarketing — СевальневАвтоматизация SEO-задач в 2017 — CyberMarketing — Севальнев
Автоматизация SEO-задач в 2017 — CyberMarketing — Севальнев
 
Вводная в SEO ТопЭксперт
Вводная в SEO ТопЭксперт Вводная в SEO ТопЭксперт
Вводная в SEO ТопЭксперт
 
Виктор Карпенко - Seo Conference 2016, Казань
Виктор Карпенко - Seo Conference 2016, КазаньВиктор Карпенко - Seo Conference 2016, Казань
Виктор Карпенко - Seo Conference 2016, Казань
 
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
Фильтр за накрутку ПФ. Как подготовить сайт к пересмотру?
 
Как почистить сайт от переоптимизации?
Как почистить сайт от переоптимизации?Как почистить сайт от переоптимизации?
Как почистить сайт от переоптимизации?
 
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 годуАналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
Аналитика SEO: выпуск 5. Коммерческое ранжирование в Яндексе в 2014 году
 
Анализ просадки трафика в Google - Аралов Евгений на IBCRussia
Анализ просадки трафика в Google - Аралов Евгений на IBCRussiaАнализ просадки трафика в Google - Аралов Евгений на IBCRussia
Анализ просадки трафика в Google - Аралов Евгений на IBCRussia
 
рабочие внешние ссылки после минусинска
рабочие внешние ссылки после минусинскарабочие внешние ссылки после минусинска
рабочие внешние ссылки после минусинска
 
Как повысить позиции сайта в поисковых системах?
Как повысить позиции сайта в поисковых системах?Как повысить позиции сайта в поисковых системах?
Как повысить позиции сайта в поисковых системах?
 

Similar to Тонкости фильтрации и группировки запросов

Все что нужно знать о SEO
Все что нужно знать о SEOВсе что нужно знать о SEO
Все что нужно знать о SEODimaslennikov
 
Контекстная реклама, презентация
Контекстная реклама, презентацияКонтекстная реклама, презентация
Контекстная реклама, презентацияAraminta08
 
imu2010 - Особенности продвижения низкочастотных, распределенных по множеств...
imu2010 -  Особенности продвижения низкочастотных, распределенных по множеств...imu2010 -  Особенности продвижения низкочастотных, распределенных по множеств...
imu2010 - Особенности продвижения низкочастотных, распределенных по множеств...UAMASTER Digital Agency
 
Интернет-маркетинг для салонов красоты
Интернет-маркетинг для салонов красотыИнтернет-маркетинг для салонов красоты
Интернет-маркетинг для салонов красотыFert
 
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантикаIvan Pronko
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядроSiteclinic
 
Буко - SEO_Полный привод
Буко - SEO_Полный приводБуко - SEO_Полный привод
Буко - SEO_Полный приводAMDG
 
Азбука SEO. Что сделать, чтобы о вашем сайте узнали?
Азбука SEO. Что сделать, чтобы о вашем сайте узнали?Азбука SEO. Что сделать, чтобы о вашем сайте узнали?
Азбука SEO. Что сделать, чтобы о вашем сайте узнали?web2win
 
2011 110808003457-phpapp02
2011 110808003457-phpapp022011 110808003457-phpapp02
2011 110808003457-phpapp02edma2
 
иннопром 2011 лавров
иннопром 2011  лавровиннопром 2011  лавров
иннопром 2011 лавровAnton Lavr-off
 
Avdey chto i-kak-poljzovateli-pokupayut-v-internete
Avdey chto i-kak-poljzovateli-pokupayut-v-interneteAvdey chto i-kak-poljzovateli-pokupayut-v-internete
Avdey chto i-kak-poljzovateli-pokupayut-v-interneteAlexander Feoktistov
 
Вебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системамВебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системамSEO-Интеллект
 
Мониторинг "поискового здоровья" интернет-бизнеса
Мониторинг "поискового здоровья" интернет-бизнесаМониторинг "поискового здоровья" интернет-бизнеса
Мониторинг "поискового здоровья" интернет-бизнесаWebit
 
Мониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнесаМониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнесаСтас Поломарь
 
Повышение конверсии в e-Commerce с FAST Search for Internet Sites
Повышение конверсии в e-Commerce с FAST Search for Internet SitesПовышение конверсии в e-Commerce с FAST Search for Internet Sites
Повышение конверсии в e-Commerce с FAST Search for Internet SitesMichael Kozloff
 
Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов"
 Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов" Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов"
Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов"IngateDigitalAgency
 

Similar to Тонкости фильтрации и группировки запросов (20)

Все что нужно знать о SEO
Все что нужно знать о SEOВсе что нужно знать о SEO
Все что нужно знать о SEO
 
Контекстная реклама, презентация
Контекстная реклама, презентацияКонтекстная реклама, презентация
Контекстная реклама, презентация
 
imu2010 - Особенности продвижения низкочастотных, распределенных по множеств...
imu2010 -  Особенности продвижения низкочастотных, распределенных по множеств...imu2010 -  Особенности продвижения низкочастотных, распределенных по множеств...
imu2010 - Особенности продвижения низкочастотных, распределенных по множеств...
 
Интернет-маркетинг для салонов красоты
Интернет-маркетинг для салонов красотыИнтернет-маркетинг для салонов красоты
Интернет-маркетинг для салонов красоты
 
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантика
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядро
 
Буко - SEO_Полный привод
Буко - SEO_Полный приводБуко - SEO_Полный привод
Буко - SEO_Полный привод
 
5 Продвижение интернет магазина
5 Продвижение интернет магазина5 Продвижение интернет магазина
5 Продвижение интернет магазина
 
Азбука SEO. Что сделать, чтобы о вашем сайте узнали?
Азбука SEO. Что сделать, чтобы о вашем сайте узнали?Азбука SEO. Что сделать, чтобы о вашем сайте узнали?
Азбука SEO. Что сделать, чтобы о вашем сайте узнали?
 
2011 110808003457-phpapp02
2011 110808003457-phpapp022011 110808003457-phpapp02
2011 110808003457-phpapp02
 
иннопром 2011 лавров
иннопром 2011  лавровиннопром 2011  лавров
иннопром 2011 лавров
 
Avdey chto i-kak-poljzovateli-pokupayut-v-internete
Avdey chto i-kak-poljzovateli-pokupayut-v-interneteAvdey chto i-kak-poljzovateli-pokupayut-v-internete
Avdey chto i-kak-poljzovateli-pokupayut-v-internete
 
17
1717
17
 
Affdays Terehoff
Affdays TerehoffAffdays Terehoff
Affdays Terehoff
 
Вебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системамВебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системам
 
Мониторинг "поискового здоровья" интернет-бизнеса
Мониторинг "поискового здоровья" интернет-бизнесаМониторинг "поискового здоровья" интернет-бизнеса
Мониторинг "поискового здоровья" интернет-бизнеса
 
Мониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнесаМониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнеса
 
Исследование рынка клиник 2017
Исследование рынка клиник 2017Исследование рынка клиник 2017
Исследование рынка клиник 2017
 
Повышение конверсии в e-Commerce с FAST Search for Internet Sites
Повышение конверсии в e-Commerce с FAST Search for Internet SitesПовышение конверсии в e-Commerce с FAST Search for Internet Sites
Повышение конверсии в e-Commerce с FAST Search for Internet Sites
 
Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов"
 Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов" Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов"
Вебинар Ingate и "ТопЭксперт" "Безопасное продвижение сайтов"
 

Тонкости фильтрации и группировки запросов

  • 1. Тонкости фильтрации и группировки запросов 26 февраля 2015 Онлайн-марафон «SEO 24/7»
  • 2. Игорь Бакалов • В клиентском SEO с 2010 года • Опыт продвижения: более 60 проектов • Автор блога http://bakalov.info/
  • 3. План доклада: 1) Фильтрация навигационных запросов 2) Автоматическая классификация запросов на «информационные» и «коммерческие» 3) Быстрая группировка семантического ядра для существующего сайта
  • 4. Небольшое отступление… Сперва нужно собрать СЯ: 1) Yandex Wordstat, Rambler AdStat, Google KeywordPlanner 2) Подсказки Яндекс, Google, Mail.ru 3) Счетчики Яндекс.Метрики, Google Analytics 4) Базы ключевых слов: Amazing, Пастухов, UP-base, … 5) Анализаторы: SpyWords, SEMrush, Prodvigator, ADVSE, … Затем выполнить первичную чистку: 1) Чистка дубликатов 2) Чистка по спискам стоп-слов 3) Чистка от запросов с ошибками 4) Чистка от запросов-пустышек
  • 5. Фильтрация навигационных запросов Навигационный запрос – это запрос, по которому пользователь ищет конкретную фирму или сайт. Очень актуально в тематиках: • кафе, рестораны • базы отдыха, турбазы • медицинские клиники • банки и кредитные брокеры • гостиницы, отели, хостелы Частично уже рассматривал данный вопрос: http://www.youtube.com/watch?v=4KQTlNe9HDw
  • 6. Фильтрация навигационных запросов Определяем витальный сайт по запросу в Yandex.XML. Например, по запросу «русский дом база отдыха» сайт russ-dom.ru:
  • 7. Фильтрация навигационных запросов Общая схема: 1) Собрать топ-10 по всему СЯ через Yandex.XML. Разделить запросы на 2 группы: в первой – по XML есть витальные сайты, во второй – нет. 2) Для первой группы – по каждому запросу из топ-10 исключается витальный сайт, затем подсчитывается сколько раз оставшиеся сайты встречаются в группе. Задается минимальный порог «встречаемости». Формируется «итоговый список» доменов, которые встречаются в первой группе с количеством раз не менее заданного порога. 3) Для второй группы – по каждому запросу оценивается топ-10, если сайт встречается в «итоговом списке», то он получает «1», если не встречается, то «0». На выходе получаем оценку для каждого запроса, которая характеризует на сколько топ-10 по конкретному запросу из второй группы «похож» на выдачу по запросу, где есть витальный сайты.
  • 8. Фильтрация навигационных запросов Выгрузка топ-10 по запросам, где есть витальный сайт (из KeyCollector):
  • 9. Фильтрация навигационных запросов Используя функционал Excel «текст по столбцам» и удалением лишних строк, приводится к виду:
  • 10. Фильтрация навигационных запросов Подсчитывается сколько раз каждый домен (кроме витальных) встречается в выдаче, выбираются где домены, которые встречаются 3 и более раз:
  • 11. Фильтрация навигационных запросов Для СЯ, которое необходимо проверить выполняется поиск в топ-10 доменов, которые встречаются по витальным запросам:
  • 12. Фильтрация навигационных запросов Пример в тематике «турбазы» Запросов всего: 3256 Запросов, где по Yandex.XML есть витальный сайт: 222 Порог «встречаемости»: 3 Порог для определения навигационных запросов: 0.3 Запросов прошедших порог: 1444 из 3034 (47.6%) Ошибочно определенных запросов: 129 Точность: 91%
  • 13. Фильтрация навигационных запросов Примеры правильно определенных запросов («турбазы»): база отдыха ландыш, база отдыха речка, сокол турбаза, турбаза остров, база отдыха барсучок, база отдыха голд фиш, база отдыха городок, база отдыха дельфин, база отдыха дубровский, база отдыха остров, база отдыха электрон, база отдыха янисъярви, базы отдыха бурная ладога, турбаза барсучок, турбаза заря, турбаза здоровяк, турбаза зоря, турбаза маяк, турбаза полет Примеры НЕ правильно определенных запросов («турбазы»): турбазы амурской области, турбазы в тверской области недорого, базы отдыха в карманово, базы отдыха городецкого района, базы отдыха кстовский район, базы отдыха на ветлуге, базы отдыха на селигере, базы отдыха на черном море, воротынский район базы отдыха, нижегородские базы отдыха, турбазы нижегородской области, турбазы тверской области, тюменские базы отдыха, база отдыха тверская область, базы отдыха семеновский район
  • 14. Фильтрация навигационных запросов Пример в тематике «доставка суши» Запросов всего: 5786 Запросов, где по Yandex.XML есть витальный сайт: 933 Порог «встречаемости»: 5 Порог для определения навигационных запросов: 0.4 Запросов прошедших порог: 1837 из 4853 (37.9%) Ошибочно определенных запросов: 270 Точность: 85%
  • 15. Фильтрация навигационных запросов Примеры правильно определенных запросов («суши»): суши ласты меню, окинава суши щукинская, суши маг на пионерской, бенто суши москва, евразия суши бар цены, империя суши москва, море суши москва, планета суши меню доставки, ресторан суши таун, суши бар лотос, суши бар япона мама, суши вок ладожская, суши маг гашека, суши сан москва сходненская, суши сити бар, суши шоп время, ямамото суши бар Примеры НЕ правильно определенных запросов («суши»): суши метро лесная, суши бар коломенская, суши бар на арбате, суши метро большевиков, суши фрунзенская, доставка суши метро алексеевская, доставка суши профсоюзная, доставка суши щелковский район, метро молодежная суши, проспект мира суши бар, суши бары москвы, суши бар на гагарина, суши бар на ленина, суши бар на щукинской, суши метро автозаводская, суши метро алексеевская, суши метро арбатская, суши метро баррикадная
  • 16. Фильтрация навигационных запросов Пример в тематике «доставка суши» Из 270 ошибочно определенных запросов: • 117 по станциями метро • 25 по районам • 14 по улицам • 11 по округам Как снизить вероятность ошибки? На начальном этапе выделить все запросы с целевыми топонимами в отдельную группу для ручной фильтрации.
  • 17. “Информационность” и “Коммерческость” запросов Задача: есть 100500 запросов, необходимо определить по каким Яндекс предпочитает показывать информационные сайты, а по каким коммерческие. Коммерческий сайт – продает товары и/или услуги Информационный сайт – ничего напрямую не продает, но может размещать рекламу.
  • 18. “Информационность” и “Коммерческость” запросов Для коммерческого сайта характерно: Наличие контактной информации (телефон, физический адрес), обратная связь, возможность онлайн-заказа, онлайн-консультант и т.д. Для информационного сайта характерно: Очень часто отсутствие выше приведенной информации, наличие рекламы (контекстной, тизеры и т.д.), возможность прямой рекламы на сайте.
  • 19. “Информационность” и “Коммерческость” запросов Общий алгоритм: 1. Собираем СЯ из 100500 запросов; 2. Получаем по каждому запросу топ-10; 3. Все URL объединяются в один список, удаляются дубли; 4. Каждый URL проверяется на наличие тех, или иных признаков; 5. На основе полученных признаков определяется является ли данный URL коммерческим, или информационным; 6. В зависимости от того, сколько и каких URL в топ-10, получаем итоговую оценку по конкретному запросу. О том, как всё это сделать на практике, смотрим: http://www.youtube.com/watch?v=9QKMdcU8yYY
  • 20. “Информационность” и “Коммерческость” запросов Наличие того, или иного фактора определяется при помощи регулярных выражений. Примеры эвристик: • Если на странице есть контекстная реклама – это информационный документ; • Если на странице есть кнопка «Купить» и «Корзина» - это коммерческий документ; • Если на страницы есть форма «Добавить комментарий» и информация «Реклама на сайте» - это информационный документ; • Если на странице есть ссылка на «Наши услуги», «Прайс», городской телефон, онлайн-консультант – это коммерческий документ; • Если на странице нет «факторов» коммерческого документа – это информационный документ.
  • 21. “Информационность” и “Коммерческость” запросов Тематика «эпиляция», коммерческие ГНЗ запросы: ЗАПРОС КОММ ГЕО восковая эпиляция купить материал 1 0 воск для депиляции фирмы 1 0 воск для эпиляции бьюти имидж 1 0 воск для эпиляции в картриджах 1 0 воск для эпиляции где продается 1 0 воск для эпиляции теплый в картридже 1 0 воск для эпиляции beauty image 1 0 все для депиляции заказать 1 0 все для депиляции интернет магазин 1 0 все для депиляции магазин 1 0 эпиляция бедер 0.9 0 эпиляция ног полностью 0.9 0 эпиляция онлайн запись 0.9 0 эпиляция сопрано 0.9 0 эпиляция soprano xl 0.9 0
  • 22. “Информационность” и “Коммерческость” запросов Тематика «эпиляция», информационные ГЗ запросы: ЗАПРОС КОММ ГЕО безболезненная эпиляция зоны бикини эпилятором 0 1 депиляция кремом для беременных 0 1 депиляция усов у девушек 0 1 крем для депиляции беременным 0 1 крем после эпиляции от раздражения 0 1 правильная эпиляция ног эпилятором 0 1 правильная эпиляция эпилятором 0 1 удаление волос навсегда над губой 0 1 эпиляция эпилятором подмышки 0 1 восковая эпиляция беременным 0.1 1 депиляция при беременности воском 0.1 1 крем для эпиляции в зоне бикини 0.1 1 правильная эпиляция воском 0.1 1 сделать эпиляцию сахаром 0.1 1 спрей для обезболивания при эпиляции 0.1 1
  • 23. “Информационность” и “Коммерческость” запросов Тематика «планшеты», коммерческие ГНЗ запросы: ЗАПРОС КОММ ГЕО заказать планшет через интернет недорого 1 0 купить планшет онлайн 1 0 планшет купить онлайн магазин 1 0 планшет купить онлайн недорого 1 0 планшет сони xperia tablet z цена 1 0 заказать бесплатно планшет 0.9 0 купить планшет онлайн в кредит 0.9 0 купить планшет iru p8901g 0.9 0 планшет леново 8000 отзывы цена 0.9 0 планшет 7 дюймов недорого 0.9 0 планшет apple ipad mini цена 0.9 0 планшет apple mini цена 0.9 0 планшет microsoft surface купить 0.9 0 samsung galaxy tab3 планшет цена 0.9 0
  • 24. “Информационность” и “Коммерческость” запросов Тематика «планшеты», информационные ГЗ запросы : ЗАПРОС КОММ ГЕО детский планшет рейтинг 2014 0 1 лучшие планшеты samsung 2014 года 0 1 планшеты рейтинг популярности 0 1 планшет рейтинг 2014 цена качество 0 1 рейтинг дешевых планшетов 0 1 рейтинг планшетов 2015 0 1 купить лучший планшет 2014 года 0.1 1 лучшие планшеты леново топ 10 0.1 1 лучшие планшеты цена качество 0.1 1 лучшие 7 дюймовые планшеты 0.1 1 лучший планшет для дома 0.1 1 планшеты по дешевке 0.1 1 планшет по параметрам 0.1 1 подбор планшета по параметрам 0.1 1 самый дешевый планшет 0.1 1
  • 25. Группировка СЯ для существующего сайта Способы группировки семантики: 1) Ручная группировка: • В Excel • В KeyCollector 2) Автоматические группировщики по SERP: • seo-case.com • engine.seointellect.ru • coolakov.ru • just-magic.org • rush-analytics.ru • semparser.ru • stoolz.ru
  • 26. Группировка СЯ для существующего сайта Минусы ручной группировки: • Долго • Много ошибок Минусы автоматической группировки по SERP: • Получаем группы запросов без привязки к сайту • Не понятно, под какие группы уже есть посадочные страницы, а под какие необходимо их создать.
  • 27. Группировка СЯ для существующего сайта Альтернативный подход: 1) Собрать семантическое ядро для сайта, получить по каждому запросу топ-10 выдачи ПС. 2) Для каждой страницы на сайте выбрать 1 запрос, который ее максимально точно описывает. Для всех этих запросов также получить топ-10 выдачи. 3) Сравнить SERP’ы по «привязанным» запросам с SERP’ами по подобранному семантическому ядру. На основе схожести выдачи привязать запросы из СЯ к страницам сайта.
  • 28. Группировка СЯ для существующего сайта Общий алгоритм: 1) Строится таблица соответствия, в которой указано сколько каждый запрос (из привязанных к сайту) имеет пересечений по URL’ам с каждым запросом из подобранного семантического ядра. 2) Например, если ключ N из СЯ имеет 10 пересекающихся URL с ключом M привязанному к сайту, то ключ N привязывается к ключу M и удаляется из таблицы. 3) В начале группируются ключи, которые имеют 10 пересекающихся URL, затем 9, 8 и т.д. На выходе получается таблица, где для каждой группы запросов известно основное ключевое слово, привязанное к конкретной странице на сайте, а также дополнительные ключевые слова с указанием значения близости, которое зависит от количество пересечений в топ-10.
  • 29. Группировка СЯ для существующего сайта Пример реализации: небольшая десктопная программа, на вход которой подается 2 файла с выгрузками из KeyCollector: Что получается на выходе?
  • 30. Группировка СЯ для существующего сайта Пример группировки в тематике «Айфоны»:
  • 31. Группировка СЯ для существующего сайта Пример группировки в тематике «Духи»:
  • 32. Группировка СЯ для существующего сайта Пример группировки в тематике «Насосы»:
  • 33. Спасибо за внимание! Игорь Бакалов Подписывайтесь на мой блог: http://bakalov.info/ И добавляйтесь в социальных сетях: https://www.facebook.com/bakalov.igor https://twitter.com/Bakalov_Igor https://www.youtube.com/user/b7186rft