Ежегодная онлайн-конференция по SEO «Битва гладиаторов»
Продвижение сайтов в 2016: нюансы и нововведения
1. Продвижение сайтов в 2016 году: нюансы
работы и нововведения
30 сентября 2016
«SEO CONF 2016»
2. О спикере
Юрков Сергей - руководитель отдела SEO компании
«Пиксель Плюс» с 2015 года.
Опыт в сфере продвижения – более 5 лет.
Специализируюсь на раскрутке проектов в самых
конкурентных регионах и тематиках – всего более 100
сайтов.
Выступление на отраслевых конференциях и курсах по SEO: SEO 2015-2016
Conference в Казани, SEO Conf 2015, SmartFox, SEO-коучинг, SEO-Upgrade, SEO-
практикум. Преподаватель обучающего центра Нетология, Search Engine
Education и старший преподаватель обучающего центра компании «Пиксель
Плюс».
1
3. Тезисы доклада
1. Нюансы работы со ссылочным 2. Нюансы работы с
текстовыми факторами
3. Пост-аналитика при
продвижении проекта
2
4. Учитываем при работе со ссылками
1)Значительная доля SEO-ссылок фильтруется Яндексом и не
вносит/вносит незначительный вклад в ранжирование
(«Непот-фильтр»).
2)Находим рабочие «естественные» ссылки по ссылочным
профилям конкурентов и составляем white-листа сайтов
доноров.
3)Учитываем количество SEO-ссылок в ссылочном профиле
для избегания Минусинска.
3
5. Ход исследования по «Непот»-фильтру
Сбор данных по СНСС
Сбор данных по признакам ссылок
Построение предсказательной модели появления СНСС и оценка
важности признаков в ней
4
6. Сбор данных по СНСС
Дата Всего SEO ссылок
SEO-ссылок, которые
дали НПС
SEO-ссылок, которые не
дали НПС
Январь 2016 6101 1324 (22 %) 4777 (78 %)
Апрель 2016 9391 2548 (27 %) 6843 (73 %)
Сентябрь 2016 7928 368 (5 %) 7560 (95 %)
Порядка 95 % ссылок находятся под «Непот»-фильтром!!!
5
7. Безанкорные ссылки
Дата Всего ссылок Дали СНСС Не дали СНСС
Январь 2016 2422 1044 (43 %) 1378 (57 %)
Апрель 2016 4722 1725 (37 %) 2997 (63 %)
Сентябрь 2016 4796 147 (3 %) 4649 (97 %)
Анкорные ссылки
Дата Всего ссылок Дали СНСС Не дали СНСС
Январь 2016 3680 281 (8 %) 3399 (92 %)
Апрель 2016 4669 823 (18%) 3846 (82 %)
Сентябрь 2016 3132 221 (7 %) 2911 (93 %)
Падение числа СНСС по безанкорным ссылкам на 40 %!!!
Сбор данных по СНСС
6
8. Сбор данных по признакам ссылок
Коммерческость
анкора ссылки,
ведущей на
акцептор
Наличие SEO-ссылок
в ссылочном
профиле сайта
акцептора и донора
Тематическая
близость акцептора-
донора
Коммерческость
анкоров исходящих
с документа-донора
ссылок
7
9. Выводы по полученным данным
1) Была сформирована предсказательная модель на основе деревьев
решений для классификации объекты выборки с СНСС и без нее.
2) Таблицы ошибок классификации для анкорных ссылок:
• Обучающая выборка:
Actual Positive Actual Negative
Predicted Negative 93 2609
Predicted Positive 96 2
• Тестовая выборка:
Actual Positive Actual Negative
Predicted Negative 32 289
Predicted Positive 0 11
8
10. Выводы по полученным данным
3) Таблицы ошибок классификации для безанкорных ссылок:
• Обучающая выборка:
Actual Positive Actual Negative
Predicted Negative 107 3833
Predicted Positive 12 0
• Тестовая выборка:
Actual Positive Actual Negative
Predicted Negative 28 807
Predicted Positive 0 7
9
11. Выводы по полученным данным
4) Наиболее значимые признаки, характерные для появления СНСС для
анкорных ссылок:
Признак Важность
Локализация ссылок на странице доноре 0,43
Локализация анкора ссылки 0,36
Наличие SEO-ссылок у сайта акцептора 0,08
Тематическая близость акцептора/донора 0,07
Наличие SEO-ссылок у сайта донора 0,04
Геозависимость анкора ссылки 0,008
10
12. Выводы по полученным данным
5) Наиболее значимые признаки, характерные для появления СНСС для
безанкорных ссылок:
Признак Важность
Локализация ссылок на странице доноре 0,67
Наличие SEO-ссылок у сайта акцептора 0,19
Наличие SEO-ссылок у сайта донора 0,09
Тематическая близость акцептора/донора 0,04
Геозависимость анкора ссылки 0
Локализация анкора ссылки 0
11
13. Выводы по полученным данным
6) Ссылки, которые дают СНСС (фактически и предсказание):
7) Предсказание СНСС при изменении важных признаков:
Геозависимость
анкора
Локализация
анкора
SEO-ссылки у
акцептора
SEO-ссылки
у донора
Локализаци
я анкоров
на доноре
Тематическая
близость
акцептора-
донора
СНСС
0 0 1 1 67 1 Да
0 0 1 1 24 1 Да
Геозависимость
анкора
Локализация
анкора
SEO-ссылки у
акцептора
SEO-ссылки
у донора
Локализаци
я анкоров
на доноре
Тематическая
близость
акцептора-
донора
СНСС
0 100 1 1 100 1 Нет
0 100 1 1 100 1 Нет
13
14. Поиск рабочих (естественных) ссылок
Выгружаем ссылочные
профили конкурентов
с максимальной
видимостью по СЯ
Производим поиск
доноров, дающих
СНСС
Размещаем ссылки
там же и отслеживаем
появление НПС
Добавляем сайт донор
в White list
14
16. Наращивание ссылок в условиях Минусинска
1) Работа в безопасных диапазонах доли SEO-ссылок.
2) Покупка нескольких ссылок с одного донора.
3) Поиск естественных ссылок.
4) Отслеживание количества SEO-ссылок на этапе прихода
проект на продвижение.
5) Ориентир на количество SEO-ссылок у топовых конкурентов.
6) Арендные ссылки в приоритете перед вечными.
7) Чистка некачественны вечных ссылок в качестве
профилактики для возможности увеличения количества
качественных SEO-ссылок.
16
17. Безопасные пороги SEO-ссылок
Параметр Количество ссылок
75 % проектов менее данного значения 184
Максимальное значение 592
Среднеквадратическое отклонение 81
Доверительный интервал [78;161]
Минимальное значение 3
0
5
10
15
20
25
30
до 50 50-100 100-150 150-200 200-300 больше 300
Доляпроектов,%
Количество SEO-ссылок
17
18. Определение доли SEO-ссылок в ссылочном профиле
• Удаляем все ссылки-картинки;
• Удаляем ссылки с авторитетных доменов (hh.ru, rabota.yandex.ru и
так далее.)
Выгружаем все ссылки из
Яндекс.Вебмастера
• #a#site.ru#/a#;
• #a#тут#/a#;
• #a#здесь#/a#;
• и т.д.
Делаем допущение, что
безанкорные ссылки
естественные
• Запрос геозависимый;
• Процент локализации > 35%;
• Значит анкор коммерческий и ссылка также.
Проверяем геозависимость
и процент локализации
анкорных ссылок
Подробнее https://tools.pixelplus.ru/tools/geo
18
19. Тезисы доклада
1. Нюансы работы со ссылочным 2. Нюансы работы с
текстовыми факторами
3. Пост-аналитика при
продвижении проекта
19
20. Основные проблемы при оптимизации текстов
Низкие
позиции
по
запросам
Недостаточная
текстовая
оптимизация
Переоптимизация
20
22. Причины наложения фильтра за переоптимизацию
Причины наложения
фильтров за текстовую
переоптимизацию
Превышение
статистических
показателей
текста
На документе нет
ответа на запрос
пользователя
(содержит лишь
слова из запроса)
Низкие значения
КФ/ПФ
Низкое качество
текста (даже при
малом
количестве
ключевых слов)
Диагностика
переоптимизации
осложняется рандомизацией
выдачи
21
23. На документе нет ответа на запрос пользователя
Запрос:
• [теплое остекление балкона в
москве цены]
22
25. Диагностика текстовой переоптимизации
Подробнее
• https://tools.pixelplus.ru/tools/reoptimization
• https://tools.pixelplus.ru/faq/reoptimization
Для большей точности рекомендуется проверять
несколько запросов с документа
Для сайтов под бандитом рекомендуется
дополнительно проверять нерелевантные
документу запросы
После внесения правок проверяем наличие фильтра
для определения вектора движения
24
26. Основные проблемы при оптимизации текстов
Низкие
позиции
по
запросам
Недостаточная
текстовая
оптимизация
Переоптимизация
25
27. Проведение текстовой оптимизации
• Какие данные требуется собирать из топ-10
• Статистические показатели текста
• Методы анализа полученных данных
• Тематичность документа запросу
Анализ топ-10
Анализ по дефолтным
значениям
26
28. Проведение текстовой оптимизации
• Какие данные требуется собирать из топ-10
• Статистические показатели текста
• Методы анализа полученных данных
• Тематичность документа запросу
Анализ топ-10
Анализ по дефолтным
значениям
26
29. Какие данные требуется собирать из топ-10
Объем текста и данные по
вхождениям ключевых
слов
Подсветки и переколдовки
Оценка структуры
страницы
Оценка текста на
содержательность
27
30. Оценка структуры страницы
Количество фотографий и инфографики
Средний размер абзацев с текстом и их количество
Количество коммерческих слов на странице: купить, цена, заказать, корзина,
стоимость, недорого, акции
Уникальные исходящие ссылки с вложенным URL + исходящие ссылки со
словами из запроса + далее/подробнее в виде ссылки на странице
Наличие на странице цен
Формы отправки заявки на странице
Таблицы на странице
Средний объем контента в виде цифр и чисел
28
31. Оценка структуры страницы
Выявлять разнообразие и способы
представления контента на разных типах
страниц, не только на тривиальных
листингах товаров.
29
35. Оценка текста на содержательность
Процент числа слов, являющихся 200 самыми частыми словами
языка, от числа всех слов текста + доля вводных слов
Доля по частям речи
Длины предложений и дисперсия длин предложений
Объем текста
Тематичность текста
Наличие орфографических и пунктуационных ошибок,
несогласованных окончаний, нечитабельные фразы
Условные и безусловные вероятности n-грамм в тексте
33
36. Оценка текста на содержательность
Если предложение в тексте не принесло дополнительных знаний, то его можно
убрать из текста.
34
38. Альтернативный алгоритм анализа топ-10
Получаем число точных вхождений по топ-10/15
Рассчитываем среднее значение по выборке – математическое
ожидание
Рассчитываем параметр, учитывающий разброс по данным –
дисперсия/среднеквадратическое отклонение
При расчете мат. ожидания делаем все события не
равновероятными, а отдаем приоритет сайтам с похожими
хостовыми характеристиками/типом документов
Строим распределение с заданным математическим
ожиданием, среднеквадратическим отклонением и
рассчитываем доверительный интервал
36
39. Исходные данные и построение распределения
Позиция
% вхождения слов из
запроса Вес
40 3 0,14
41 2 0,14
42 2 0,14
43 1,7 0,03
… … …
… 0,9 0,03
… 3,1 0,03
… 1,8 0,03
Среднее арифметическое 1,99
Математическое ожидание 2,06
Медиана 1,8
Дисперсия 2,18
Среднеквадратическое отклонение 1,48
Документы под переоптимизацией
Позиция
% вхождения слов из
запроса Вес
1 1,3 0,14
2 2,2 0,14
3 1,8 0,14
4 1,5 0,03
… … …
13 2,3 0,03
14 1,9 0,03
15 1,2 0,03
Среднее арифметическое 1,83
Математическое ожидание 1,73
Медиана 1,7
Дисперсия 0,62
Среднеквадратическое отклонение 0,79
Документы в топ-15
37
40. Баланс между оптимизацией и спамом
------- вероятность переоптимизации при заданном проценте вхождения
ключевого слова;
------- вероятность оптимальной текстовой релевантности при заданном
проценте вхождения.
38
41. Итого
1) Оптимальный процент вхождений равен значению при котором
максимизируется оптимальное значение текстовой релевантности
(1-2%), но минимизируется вероятность переоптимизации (2-3%).
2) Алгоритм при расчете вероятности учитывает приоритет числа
вхождений у документов с похожими хостовыми
характеристиками/типом документов.
3) Небольшая дисперсия доверительных интервалов говорит о
высокой точности полученных данных: переоптимизация [1,30;
2,83] и оптимизация [1,32; 2,13].
39
42. Пример оценки достоверности данных
Позиция Число вхождений Вес
1 100 0,14
2 100 0,14
3 100 0,14
4 100 0,14
5 8 0,14
6 7 0,05
7 9 0,05
8 1 0,05
9 1 0,05
10 1 0,05
11 1 0,05
Среднее арифметическое 38,91
Математическое ожидание 57,72
Медиана 8
Дисперсия 2354,49
Среднеквадратическое отклонение 48,52
При стандартном алгоритме 8/38 вхождений ключевого
слова.
40
43. Альтернативный алгоритм:
1) Алгоритм отдает предпочтение сайтам из топ-5 (в данном примере)
и учитывает число вхождений в нем как приоритетное.
2) Доверительный интервал [33; 83] имеет большую дисперсию (для
параметра числа вхождений). Это говорит о том, что данных мало
или по текущей выборке нельзя извлечь полезный сигнал по
анализируемому фактору.
Пример оценки достоверности данных
41
44. Преимущества алгоритма анализа топ-10
Преимущес
тва
алгоритма
В топ-10
предпочтение
отдается
похожим
сайтам
Оценивает можно
ли получить из
текущего набора
данных полезный
сигнал
Учитывает дисперсию
значений в топ-10, не
отбрасывая крайние
значения
Позволяет рассчитать
оптимальные параметры
текста с учетом антиспама
42
45. Тематичность текста документа/сайта запросу
Оценка тематической близости документов по тематикам «паркет» и «ламинат» с
помощью расчета косинусного расстояния.
Текст Косинусная близость
собственный текст про паркет (топ-1) 0
текст паркет 3 (топ-5) 0,52
текст паркет 2 (топ-5) 0,57
текст про паркет (за 50 позицией) 0,59
текст паркет 1 (топ-5) 0,6
текст ламинат 3 (топ-5) 0,62
текст про паркет (за 50 позицией) 0,63
текст ламинат 2 (топ-5) 0,64
текст про паркет (за 50 позицией) 0,65
текст ламинат 4 (топ-5) 0,68
текст ламинат 1 (топ-5) 0,83
43
46. Тезисы доклада
1. Нюансы работы со ссылочным 2. Нюансы работы с
текстовыми факторами
3. Пост-аналитика при
продвижении проекта
44
47. Стандартный алгоритм работы SEO-специалиста
Распределение
запросов
Написание Title и
текстов
Технический аудит
Покупка ссылок
Динамика видимости
Корректировки
оптимизации
На каком этапе должен
проводиться пост-анализ?!
Если ситуация нестандартная, то
ожидаемой динамики нет
Пост-анализ ситуации
3-4 месяц
работ
45
48. Зачем проводить пост-анализ работ по SEO?
Цели пост-анализа
Выявление
значимых
препятствий роста
сайта на ранних
этапах
Отслеживание
отклика ПС на
наши действия и
корректировка
методик
Сбор данных и
выявление
наиболее
эффективных
методик
продвижения
Оптимизация
рабочих процессов
и анализ
эффективности
расходования
рабочего времени
специалиста
46
49. Выявление причин, мешающих росту медицинского сайта
Был проделан большой пул работ по написанию текстов, но изначально на
продвигаемых страницах был представлен не верный контент:
• листинг лекарств;
• небольшой текст.
47
50. По лекарствам был представлен в топе совсем другой тип страниц:
• листинг лекарств;
• огромный текст о лекарстве с
исчерпывающей информацией о
нем;
• Дополнительная ценность
документа (отзывы, рейтинги,
навигация).
Выявление причин, мешающих росту медицинского сайта
48
51. Выявление причин, мешающих росту сайта займов
Проработка большого числа запросов и документов по сайту МФО:
• по многим запросам высоко
ранжируются агрегаторы, важно
прорабатывать запросы, где
имеют видимость МФО;
• Посадочные страницы не
соответствуют топ-10 и в целом
качество представления текста на
низком уровне.
49
52. Выявление причин, мешающих росту сайта займов
Для роста трафика важно было отыскать запросы, по которым
также высоко ранжируются другие МФО:
• Основные трафиковые
запросы покрывают
агрегаторы;
• Посадочные страницы
представлены списком МФО
и имеют совсем другой тип
страниц.
50
53. Отслеживание отклика ПС на наши действия
По результатам анализа видно, что:
• в тексте слишком много ключей
из запроса;
• ключи должны употребляться в
исходящих ссылках со страницы;
• требуется вывести больше
товаров и описаний
характеристик товаров (сейчас в
каждой исходящей ссылке со
страницы есть ключ).
Например, важно отслеживать как внесение того или иного текста сказывается на
позициях. Часто текст нужен на странице не в «классическом виде».
Подробнее https://tools.pixelplus.ru/tools/analiz-top
51
55. Отслеживание отклика ПС на наши действия
Сопоставление:
• дат производимых работ как в ручном, так и автоматическом режиме
(предварительная классификация работ по типам);
• дат апдейтов ПС (отдельный учет текстовых, ссылочных, ПФ);
• динамики видимости/трафика.
53
56. Отслеживание отклика ПС на наши действия
Построение выводов:
• вывод автоматических уведомлений для специалиста о работах/типах работ, которые
дали рост или проседание позиций для дальнейшей корректировки стратегии;
• автоматизированная пробивка постфильтров и построение выводов о работах, которые
привели к наложению санкций или выходу из под них.
54
57. Выявление эффективных методик продвижения
Классификация списка работ и их привязка к значению дельты KPI до и
после
Сбор выборки достаточного объема по типу производимой работы
Построение распределения случайной величины и расчет его
параметров (мат. ожидание, среднеквадратическое отклонение)
Выявление вероятности роста после проведения данного типа работы
в будущем
Построение доверительного интервала и оценка уверенности в
полученных данных (при низкой уверенности – расчет оптимального
объема выборки и строим распределения на новой выборке)
55
59. Пример: итоговые значения
• По итогам построения нормального распределения -
наиболее вероятные события: рост от +7 до +13 позиций
при проведении события «Правка Title».
• Доверительный интервал [3; 16] говорит о том, что в 95%
случаев проведение данного типа работ приводит к росту
позиций на указанное выше количество пунктов.
57
60. Анализ эффективности расходования рабочего времени
Сбор данных по затрачиваемому времени специалистом на работы
• Стандартизированные чек-листы.
• Создание истории работ по проекту с минимизацией временных
затрат на их ведение специалистами.
Детальная классификация фиксируемых работ по типам
• Создаем систему нормативов
• Находим значимые отклонения от нормативов
Анализ причин отклонения от заданных нормативов
• Автоматизация и оптимизация рабочих процессов
• Обучение специалистов
• Повышение мотивации-)
58
61. Сбор данных по затрачиваемому времени
Чек-лист:
Фиксирование производимых работ:
59
62. Выявление отклонения от норматива
Сопоставление затрачиваемого времени и нормативов:
• По проектам/специалистам/типам работ;
• Автоматизированные уведомления об отклонении от нормы.
60
63. Итоги
• Разобрали аспекты продвижения коммерческих и
информационных запросов, которым уделяется мало внимания.
• Подвели итоги исследования, касательно фильтрации SEO-
ссылок со стороны Яндекса.
• Поговорили о методиках применяемых в текстовой
оптимизации и анализе топ-10.
• Разобрали основные аспекты проведения пост-аналитики для
максимизации эффективности проводимых работ SEO-
специалистами.
61
65. Контактная информация
Запросить презентацию или задать вопросы
— E-mail: sergey.yurkov@pixelplus.ru
— Facebook: https://www.facebook.com/sergey.urkov.pixel
Продвижение сайтов в 2016 году:
нюансы работы и нововведения
manager@pixelplus.ru, seo@pixelplus.ru
Отдел продаж: +7 (495) 989-53-11
Основной офис в Москве:
г. Москва, ул. Шаболовка, дом 34
63