SlideShare a Scribd company logo
1 of 20
Инновации
в текстовой оптимизации
Рассказывает Алексей Чекушин.
Kokoc.com / Just-Magic.org
Зоны документа
Title
Plain-текст
Текстовые
фрагменты
<a> - внутренние
Анкор-лист
Анкор-лист – «резиновый»
Как строилась оптимизация до 2014?
• Внимание на <title> и plain-текст.
• Делаем минимальный набор вхождений
Параметры вхождений ограничены «тошнотой»
• В анкор-файл загоняем все возможные вхождения
Отключение ссылочного - 2014
* По большинству коммерческих
гео-зависимых запросов в Москве.
Title
Plain-текст
Текстовые
фрагменты
<a> - внутренние
Что поменялось на практике?
• Исчезла «резиновая» зона «анкор-лист».
• Вхождения, которые были анкор-листе, теперь нужно
компенсировать остальными зонами.
• Структурирование сайта и текстовый анализ стали критически
важными для продвижения.
Особенности ранжирования Яндекса
Большое количество различных текстовых факторов.
Применение машинного обучения.
Больше – не значит лучше.
Мерять нужно все, а не только «тошноту»
Особенности ранжирования Яндекса
Большое количество запросных модификаторов формулы.
Свои правила под каждый запрос/групу запросов.
Необходима предварительная группировка.
Анализ выполнять не по запросу, а для всей группы.
Выводы
• Подсчет отдельных метрик (tf-idf, bm25, и.т.п.) сам по себе смысла
не имеет.
• Подсчет единой «формулы релевантности» также лишен смысла.
• Необходимо анализировать все в совокупности.
И что делать?
• Машинное обучение на топах по большой совокупности факторов
или
• Поиск закономерностей в топе на основе вхождений
Варианты анализа топа.
• Ручной разбор топов «на глазок».
Most popular!
• Полноценный разбор топов руками, автоматизация в excel.
• Полностью автоматический разбор специальными сервисами.
Основные проблемы анализа.
• Определение возможных типов вхождений.
Прямые, обратные, частичные, с пропусками, …
• Определение «окна допустимых значений».
Мало данных, большой шум.
• Совмещение «окон» по нескольким запросам.
Недостатки классического разбора
• Смотрят на одну зону документа, а не на весь документ в
совокупности. (Как правило – на plain-текст).
• Часто пропускают не находящийся по ctrl+f текст.
• Учитывают минимум вариций вхождений и словоформ.
• Человек не может держать в уме несколько документов.
Руками или автоматом?
• Руками разбирать очень долго
На одну продвигаемую страницу уходит ~2 часа
• Высока вероятность ошибки при ручном разборе.
• При ручном разборе проще отобрать только подходящие
документы.
Немного математики
Расчет дисперсии и доверительного интервала на основе предположения
о нормальном распределении некорректен и дает кривые результаты.
Лучше всего работает– межквантильное расстояние при переменных
(зависящих от результата по запросу) значениях квантилей.
Совмещение окон допустимых значений – задача со многими решениями,
необходимо использовать метрику оптимальности результирующего окна
(например – минимизация интегральной величины конфликтов).
Ограничения метода.
• Необходима предварительная кластеризация по топам.
И только по правильным алгоритмам.
• Структура сайта
Сайт под семантику, а не семантика под сайт.
• Ctrl+c – Ctrl+v не пройдет
Все равно придется думать.
А что на практике?
Запрос «купить ноутбук»
«Диван аккордеон» и «купить диван аккордеон»
Остекление коттеджей
Попробовать самому!
Текстовый анализатор на Just-Magic.org
+ Анализ всех зон документа.
+ Одновременно по нескольким запросам.
+ Полная информация для оптимизации.
Платно, с регистрацией, без sms: Just-Magic.org
Финальный слайд с котенком
Ваши вопросы
Алексей Чекушин. Just-Magic.org

More Related Content

What's hot

Аналитика для трафиковых проектов (РИФ 2016)
Аналитика для трафиковых проектов (РИФ 2016)Аналитика для трафиковых проектов (РИФ 2016)
Аналитика для трафиковых проектов (РИФ 2016)Стас Поломарь
 
Как собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиямиКак собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиямиAlexey Trudov
 
презентация F1 #12
презентация F1 #12презентация F1 #12
презентация F1 #12Alexey Chekushin
 
Алгоритмы аннотирования, влияние на сниппеты (IBC 14)
Алгоритмы аннотирования, влияние на сниппеты (IBC 14)Алгоритмы аннотирования, влияние на сниппеты (IBC 14)
Алгоритмы аннотирования, влияние на сниппеты (IBC 14)Стас Поломарь
 
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснетаyaevents
 
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Стас Поломарь
 
Стас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решениемСтас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решениемДмитрий Шахов
 
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в КазаниНовое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в КазаниДмитрий Севальнев
 
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017Дмитрий Шахов
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядроSiteclinic
 
Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)Стас Поломарь
 
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Дмитрий Севальнев
 
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТВ БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТUkrop Media
 
Seo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пфSeo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пфSergey Yurkov
 
Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)Стас Поломарь
 
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваРутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваДмитрий Шахов
 
Как анализировать сайты конкурентов
Как анализировать сайты конкурентовКак анализировать сайты конкурентов
Как анализировать сайты конкурентовSiteclinic
 
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...Vladislav Morgun
 

What's hot (20)

Аналитика для трафиковых проектов (РИФ 2016)
Аналитика для трафиковых проектов (РИФ 2016)Аналитика для трафиковых проектов (РИФ 2016)
Аналитика для трафиковых проектов (РИФ 2016)
 
Как собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиямиКак собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиями
 
презентация F1 #12
презентация F1 #12презентация F1 #12
презентация F1 #12
 
Алгоритмы аннотирования, влияние на сниппеты (IBC 14)
Алгоритмы аннотирования, влияние на сниппеты (IBC 14)Алгоритмы аннотирования, влияние на сниппеты (IBC 14)
Алгоритмы аннотирования, влияние на сниппеты (IBC 14)
 
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEOДмитрий Шахов. Как конкуренты могут обрушить ваше SEO
Дмитрий Шахов. Как конкуренты могут обрушить ваше SEO
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснета
 
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)
 
Стас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решениемСтас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решением
 
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в КазаниНовое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
 
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядро
 
Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)
 
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
 
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТВ БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
 
Seo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пфSeo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пф
 
Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)
 
SEO итоги 2015 (Smartfox)
SEO итоги 2015 (Smartfox)SEO итоги 2015 (Smartfox)
SEO итоги 2015 (Smartfox)
 
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваРутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
 
Как анализировать сайты конкурентов
Как анализировать сайты конкурентовКак анализировать сайты конкурентов
Как анализировать сайты конкурентов
 
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
 

Viewers also liked

Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Yandex
 
Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?
Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?
Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?Anatoly Sharifulin
 
Особенности текстовой оптимизации в 2017 году
Особенности текстовой оптимизации в 2017 годуОсобенности текстовой оптимизации в 2017 году
Особенности текстовой оптимизации в 2017 годуSergey Yurkov
 
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Yandex
 
20 роковых грехов в SEO
20 роковых грехов в SEO20 роковых грехов в SEO
20 роковых грехов в SEOPromo.ua
 
Работа с малоинформативными страницами
Работа с малоинформативными страницамиРабота с малоинформативными страницами
Работа с малоинформативными страницамиСергей Кокшаров
 
User Friendly SEO by Promo.ua
User Friendly SEO by Promo.uaUser Friendly SEO by Promo.ua
User Friendly SEO by Promo.uaPromo.ua
 
Тенденции SEO. Презентация к докладу конференции "День белого SEO"
Тенденции SEO. Презентация к докладу конференции "День белого SEO"Тенденции SEO. Презентация к докладу конференции "День белого SEO"
Тенденции SEO. Презентация к докладу конференции "День белого SEO"Сергей Кокшаров
 
Есть ли будущее у SEO? Над чем работать в 2016
Есть ли будущее у SEO? Над чем работать в 2016Есть ли будущее у SEO? Над чем работать в 2016
Есть ли будущее у SEO? Над чем работать в 2016Сергей Кокшаров
 
Как оптимизировать релевантность посадочных страниц
Как оптимизировать релевантность посадочных страницКак оптимизировать релевантность посадочных страниц
Как оптимизировать релевантность посадочных страницСергей Кокшаров
 
Механики продвижения в Telegram. Кейс @devakatalk
Механики продвижения в Telegram. Кейс @devakatalkМеханики продвижения в Telegram. Кейс @devakatalk
Механики продвижения в Telegram. Кейс @devakatalkСергей Кокшаров
 
Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...
Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...
Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...SEO-Интеллект
 
50 оттенков SEO. Как выбрать подходящий
50 оттенков SEO. Как выбрать подходящий50 оттенков SEO. Как выбрать подходящий
50 оттенков SEO. Как выбрать подходящийСергей Кокшаров
 
Сергей Кокшаров (Devaka.ru) — Продвижение молодого сайта
Сергей Кокшаров (Devaka.ru) — Продвижение молодого сайтаСергей Кокшаров (Devaka.ru) — Продвижение молодого сайта
Сергей Кокшаров (Devaka.ru) — Продвижение молодого сайтаКлуб Интернет-Маркетологов
 
Автоматизация SEO-процессов с помощью Rush Analytics
Автоматизация SEO-процессов с помощью Rush AnalyticsАвтоматизация SEO-процессов с помощью Rush Analytics
Автоматизация SEO-процессов с помощью Rush AnalyticsOlegShestakov
 
SEO эксперименты. Типы, примеры, рекомендации
SEO эксперименты. Типы, примеры, рекомендацииSEO эксперименты. Типы, примеры, рекомендации
SEO эксперименты. Типы, примеры, рекомендацииСергей Кокшаров
 

Viewers also liked (20)

Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
 
Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?
Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?
Мобильное приложение Ostrovok.ru: зачем оно нужно, если есть «букинг»?
 
Особенности текстовой оптимизации в 2017 году
Особенности текстовой оптимизации в 2017 годуОсобенности текстовой оптимизации в 2017 году
Особенности текстовой оптимизации в 2017 году
 
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
 
20 роковых грехов в SEO
20 роковых грехов в SEO20 роковых грехов в SEO
20 роковых грехов в SEO
 
Работа с малоинформативными страницами
Работа с малоинформативными страницамиРабота с малоинформативными страницами
Работа с малоинформативными страницами
 
User Friendly SEO by Promo.ua
User Friendly SEO by Promo.uaUser Friendly SEO by Promo.ua
User Friendly SEO by Promo.ua
 
Тенденции SEO. Презентация к докладу конференции "День белого SEO"
Тенденции SEO. Презентация к докладу конференции "День белого SEO"Тенденции SEO. Презентация к докладу конференции "День белого SEO"
Тенденции SEO. Презентация к докладу конференции "День белого SEO"
 
Алгоритм Hilltop
Алгоритм HilltopАлгоритм Hilltop
Алгоритм Hilltop
 
Есть ли будущее у SEO? Над чем работать в 2016
Есть ли будущее у SEO? Над чем работать в 2016Есть ли будущее у SEO? Над чем работать в 2016
Есть ли будущее у SEO? Над чем работать в 2016
 
SEO для мобильных сайтов
SEO для мобильных сайтовSEO для мобильных сайтов
SEO для мобильных сайтов
 
Как оптимизировать релевантность посадочных страниц
Как оптимизировать релевантность посадочных страницКак оптимизировать релевантность посадочных страниц
Как оптимизировать релевантность посадочных страниц
 
Механики продвижения в Telegram. Кейс @devakatalk
Механики продвижения в Telegram. Кейс @devakatalkМеханики продвижения в Telegram. Кейс @devakatalk
Механики продвижения в Telegram. Кейс @devakatalk
 
Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...
Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...
Практический курс SEO для Bewebby: группировка ключевых запросов, разбивка за...
 
50 оттенков SEO. Как выбрать подходящий
50 оттенков SEO. Как выбрать подходящий50 оттенков SEO. Как выбрать подходящий
50 оттенков SEO. Как выбрать подходящий
 
Сергей Кокшаров (Devaka.ru) — Продвижение молодого сайта
Сергей Кокшаров (Devaka.ru) — Продвижение молодого сайтаСергей Кокшаров (Devaka.ru) — Продвижение молодого сайта
Сергей Кокшаров (Devaka.ru) — Продвижение молодого сайта
 
Автоматизация SEO-процессов с помощью Rush Analytics
Автоматизация SEO-процессов с помощью Rush AnalyticsАвтоматизация SEO-процессов с помощью Rush Analytics
Автоматизация SEO-процессов с помощью Rush Analytics
 
SEO эксперименты. Типы, примеры, рекомендации
SEO эксперименты. Типы, примеры, рекомендацииSEO эксперименты. Типы, примеры, рекомендации
SEO эксперименты. Типы, примеры, рекомендации
 
SEO тренды в Google 2017
SEO тренды в Google 2017SEO тренды в Google 2017
SEO тренды в Google 2017
 
SEO для лендингов
SEO для лендинговSEO для лендингов
SEO для лендингов
 

Similar to Текстовый анализ - теория и практика

20111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture320111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture3Computer Science Club
 
20120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-0420120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-04Computer Science Club
 
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайтаПрезентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайтаAndrew PersonBh
 
Как и зачем можно создать DSL на Python
Как и зачем можно создать DSL на PythonКак и зачем можно создать DSL на Python
Как и зачем можно создать DSL на PythonPyNSK
 
20111001 information retrieval raskovalov_lecture2
20111001 information retrieval raskovalov_lecture220111001 information retrieval raskovalov_lecture2
20111001 information retrieval raskovalov_lecture2Computer Science Club
 
Фишки из патентов Google на GuruConf-2017
Фишки из патентов Google на GuruConf-2017Фишки из патентов Google на GuruConf-2017
Фишки из патентов Google на GuruConf-2017Taras Gushcha
 
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииНарижный Денис
 
Качество текста. Принципы редактуры
Качество текста. Принципы редактурыКачество текста. Принципы редактуры
Качество текста. Принципы редактурыДенис Савельев
 
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серыйVladislav Morgun
 
Аудит для компании Artinvest.org
Аудит для компании Artinvest.orgАудит для компании Artinvest.org
Аудит для компании Artinvest.orgkostetskiy
 
Обзор систем совместной работы
Обзор систем совместной работыОбзор систем совместной работы
Обзор систем совместной работыАнтон Широков
 
Обзор систем совместной работы
Обзор систем совместной работыОбзор систем совместной работы
Обзор систем совместной работыolden_idle
 
Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)Стас Поломарь
 
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаSEO-Интеллект
 
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...DariaShalahinova
 
Kostin drupalconf-2011-presentation
Kostin drupalconf-2011-presentationKostin drupalconf-2011-presentation
Kostin drupalconf-2011-presentationdrupalconf
 
Переводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван Москалёв
Переводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван  МоскалёвПереводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван  Москалёв
Переводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван МоскалёвYandex
 

Similar to Текстовый анализ - теория и практика (20)

20111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture320111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture3
 
20120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-0420120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-04
 
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайтаПрезентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
 
Как и зачем можно создать DSL на Python
Как и зачем можно создать DSL на PythonКак и зачем можно создать DSL на Python
Как и зачем можно создать DSL на Python
 
20111001 information retrieval raskovalov_lecture2
20111001 information retrieval raskovalov_lecture220111001 information retrieval raskovalov_lecture2
20111001 information retrieval raskovalov_lecture2
 
Фишки из патентов Google на GuruConf-2017
Фишки из патентов Google на GuruConf-2017Фишки из патентов Google на GuruConf-2017
Фишки из патентов Google на GuruConf-2017
 
Фишки из патентов Google
Фишки из патентов GoogleФишки из патентов Google
Фишки из патентов Google
 
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
 
Качество текста. Принципы редактуры
Качество текста. Принципы редактурыКачество текста. Принципы редактуры
Качество текста. Принципы редактуры
 
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
 
Аудит для компании Artinvest.org
Аудит для компании Artinvest.orgАудит для компании Artinvest.org
Аудит для компании Artinvest.org
 
Обзор систем совместной работы
Обзор систем совместной работыОбзор систем совместной работы
Обзор систем совместной работы
 
Обзор систем совместной работы
Обзор систем совместной работыОбзор систем совместной работы
Обзор систем совместной работы
 
Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)
 
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
 
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
 
Kostin drupalconf-2011-presentation
Kostin drupalconf-2011-presentationKostin drupalconf-2011-presentation
Kostin drupalconf-2011-presentation
 
Elkamskaya 100330045814-phpapp02
Elkamskaya 100330045814-phpapp02Elkamskaya 100330045814-phpapp02
Elkamskaya 100330045814-phpapp02
 
XXV Elena Kamskaya
XXV Elena KamskayaXXV Elena Kamskaya
XXV Elena Kamskaya
 
Переводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван Москалёв
Переводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван  МоскалёвПереводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван  Москалёв
Переводим без интернета: как мы делали Яндекс.Перевод для iOS, Иван Москалёв
 

More from Alexey Chekushin

Методы оценки качества текстов
Методы оценки качества текстовМетоды оценки качества текстов
Методы оценки качества текстовAlexey Chekushin
 
Значимое в SEO 2016
Значимое в SEO 2016Значимое в SEO 2016
Значимое в SEO 2016Alexey Chekushin
 
Как островок работает с семантикой
Как островок работает с семантикойКак островок работает с семантикой
Как островок работает с семантикойAlexey Chekushin
 
Автоматическая классификация запросов
Автоматическая классификация запросовАвтоматическая классификация запросов
Автоматическая классификация запросовAlexey Chekushin
 
Кластеризация и текстовый анализ
Кластеризация и текстовый анализКластеризация и текстовый анализ
Кластеризация и текстовый анализAlexey Chekushin
 
Текст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успехаТекст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успехаAlexey Chekushin
 
Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015Alexey Chekushin
 
Непорочное продвижение
Непорочное продвижениеНепорочное продвижение
Непорочное продвижениеAlexey Chekushin
 

More from Alexey Chekushin (8)

Методы оценки качества текстов
Методы оценки качества текстовМетоды оценки качества текстов
Методы оценки качества текстов
 
Значимое в SEO 2016
Значимое в SEO 2016Значимое в SEO 2016
Значимое в SEO 2016
 
Как островок работает с семантикой
Как островок работает с семантикойКак островок работает с семантикой
Как островок работает с семантикой
 
Автоматическая классификация запросов
Автоматическая классификация запросовАвтоматическая классификация запросов
Автоматическая классификация запросов
 
Кластеризация и текстовый анализ
Кластеризация и текстовый анализКластеризация и текстовый анализ
Кластеризация и текстовый анализ
 
Текст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успехаТекст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успеха
 
Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015
 
Непорочное продвижение
Непорочное продвижениеНепорочное продвижение
Непорочное продвижение
 

Текстовый анализ - теория и практика

  • 1. Инновации в текстовой оптимизации Рассказывает Алексей Чекушин. Kokoc.com / Just-Magic.org
  • 2. Зоны документа Title Plain-текст Текстовые фрагменты <a> - внутренние Анкор-лист Анкор-лист – «резиновый»
  • 3. Как строилась оптимизация до 2014? • Внимание на <title> и plain-текст. • Делаем минимальный набор вхождений Параметры вхождений ограничены «тошнотой» • В анкор-файл загоняем все возможные вхождения
  • 4. Отключение ссылочного - 2014 * По большинству коммерческих гео-зависимых запросов в Москве. Title Plain-текст Текстовые фрагменты <a> - внутренние
  • 5. Что поменялось на практике? • Исчезла «резиновая» зона «анкор-лист». • Вхождения, которые были анкор-листе, теперь нужно компенсировать остальными зонами. • Структурирование сайта и текстовый анализ стали критически важными для продвижения.
  • 6. Особенности ранжирования Яндекса Большое количество различных текстовых факторов. Применение машинного обучения. Больше – не значит лучше. Мерять нужно все, а не только «тошноту»
  • 7. Особенности ранжирования Яндекса Большое количество запросных модификаторов формулы. Свои правила под каждый запрос/групу запросов. Необходима предварительная группировка. Анализ выполнять не по запросу, а для всей группы.
  • 8. Выводы • Подсчет отдельных метрик (tf-idf, bm25, и.т.п.) сам по себе смысла не имеет. • Подсчет единой «формулы релевантности» также лишен смысла. • Необходимо анализировать все в совокупности.
  • 9. И что делать? • Машинное обучение на топах по большой совокупности факторов или • Поиск закономерностей в топе на основе вхождений
  • 10. Варианты анализа топа. • Ручной разбор топов «на глазок». Most popular! • Полноценный разбор топов руками, автоматизация в excel. • Полностью автоматический разбор специальными сервисами.
  • 11. Основные проблемы анализа. • Определение возможных типов вхождений. Прямые, обратные, частичные, с пропусками, … • Определение «окна допустимых значений». Мало данных, большой шум. • Совмещение «окон» по нескольким запросам.
  • 12. Недостатки классического разбора • Смотрят на одну зону документа, а не на весь документ в совокупности. (Как правило – на plain-текст). • Часто пропускают не находящийся по ctrl+f текст. • Учитывают минимум вариций вхождений и словоформ. • Человек не может держать в уме несколько документов.
  • 13. Руками или автоматом? • Руками разбирать очень долго На одну продвигаемую страницу уходит ~2 часа • Высока вероятность ошибки при ручном разборе. • При ручном разборе проще отобрать только подходящие документы.
  • 14. Немного математики Расчет дисперсии и доверительного интервала на основе предположения о нормальном распределении некорректен и дает кривые результаты. Лучше всего работает– межквантильное расстояние при переменных (зависящих от результата по запросу) значениях квантилей. Совмещение окон допустимых значений – задача со многими решениями, необходимо использовать метрику оптимальности результирующего окна (например – минимизация интегральной величины конфликтов).
  • 15. Ограничения метода. • Необходима предварительная кластеризация по топам. И только по правильным алгоритмам. • Структура сайта Сайт под семантику, а не семантика под сайт. • Ctrl+c – Ctrl+v не пройдет Все равно придется думать.
  • 16. А что на практике? Запрос «купить ноутбук»
  • 17. «Диван аккордеон» и «купить диван аккордеон»
  • 19. Попробовать самому! Текстовый анализатор на Just-Magic.org + Анализ всех зон документа. + Одновременно по нескольким запросам. + Полная информация для оптимизации. Платно, с регистрацией, без sms: Just-Magic.org
  • 20. Финальный слайд с котенком Ваши вопросы Алексей Чекушин. Just-Magic.org