5. Разбор документа
• Сохраненка минус все служебное
– Стили, мета, скрипты и пр.
• Лемматизируем запрос (минус предлоги)
• Лемматизируем очищенную сохраненку
• Ищем леммы слов запроса в обработанной сохраненке
• Инструменты
– Mystem или phpmorphy
– Mystem хорошо тем, что еще разбирает по частям речи и пр.
6. Разбор анкор-листа
• Файл ЯВМ разбираем в БД
• Обработка
– Пустые анкоры
– Сквозняки («ужимаем»)
– Мусор
• Аналогичные приемы по лемматизации
• Считаем в рамках 1 ссылки наличие всех
лемм слов запроса
• Считаем вхождение в рамках анкор-листа
13. #1 Делаем выборки (Запрос)
• Нет в title
• Нет в документе
• Нет в анкор-листе
• Мало в документе / анкор-листе
• Нет синонимов в документе
14. BM25
• Допущение для IDF:
– (кол-во документов со СЛОВО) / (кол-во
документов «lang:ru»)
Важно: смотрим в XML!
15. Статические (URL)
• Количество внешних ссылок
• Количество внутренних ссылок
– Абсолютное
– Относительно размера Host
• Внутренние ссылки парсим ЯВМ
– До 10К запросов в сутки
16. Доля не seo ссылок
• Настраиваем словарь
– Производные урла, компании
– Маркеры
• Размечаем на «естественные»
17. #2 Делаем выборки (URL/Запрос)
• Нет внешних ссылок
• Нет внутренних ссылок
• Мало внутренних ссылок
• Мало естественных ссылок
18. «Отключение» ссылок
• Используем не свои данные для анализа
– !слово1 /+1 !слово2 … lang:en
– !слово1 /+1 !слово2 …
– слово1 /+1 слово2 …
• Доставляем, где не получилось найти
• Агрегируем URL/Host
25. #3 Делаем выборки (URL/Запрос)
• Доп. условие при фильтре по запросам
• Доп. условие при фильтре по URL
• Оценка по Host для общей стратегии
26. Пользовательские сессии
• Типы трафика
– Прямой / ПС / Социальный
• Время
• Глубина
• Сравнение по конкурентам через Similarweb
27. #4 Делаем выборки (URL)
• Только поисковый трафик
• Время хуже среднего по конкурентам
• Глубина хуже среднего по конкурентам
28. Кликовые метрики
• CTR Яндекс
– До 500 запросов
– Поломали с начала года (но обещали
починить!)
– Задержка в 2 недели
• CTR Гугл
– Задержка 3 дня
– Все запросы (с учетом полноты)
29. Полнота данных
• Яндекс
– Полнота по всем запросам = 60%
– Полнота данных по популярным запросам = 70-
75%
• Гугл
– Полнота по всем запросам = 60-65%
36. Семантика
• Запрос <-> URL
• URL-ы группировать по структуре
• Метрики для Запрос:
– Видимость
– WS
• Метрики для URL:
– Видимость Avg
– Видимость % для ТОП_Х
– Видимость WS% для ТОП_Х
– Трафик
37. Семантика
• WS = WS, “WS”, “!WS”
• Трафик = сутки, месяц, год
• ТОПы = ТОП-100 / 10 / 5
• Пара трюков по квотам
– В ГА можно вступить в клуб и расширить до
100К/сутки
– В Метрике можно использовать расшаренные
аккаунты
38. Задачи для решения
• Найти URL
– хорошо ранжируются, есть трафик и потенциал
– хорошо ранжируются, есть потенциал
– плохо ранжируются, есть потенциал
• Найти запросы
– под все URL по результатам выше
– «дотянуть» до ТОП_Х
40. Постапдейтный анализ
• Семантика
– Конкуренты: лидеры роста/падения по группам
запросов
– Мы: изменение видимости по группам запросов
• Наложение изменений
– Метрик
– Статусов
– Штрафов
– Тех данных
41. #7 Делаем выборки (Запрос)
• Изменение видимости VS
– Обновление сохраненки
– Обновление синонимов
– Изменение внешних ссылок
– Высокий CTR
– Наложение штрафа
42. #7 Делаем выборки (URL/Запрос)
• Изменение видимости VS
– Индексация
– Время
– Глубина
– Доля не seo анкоров
– Доля прямой/социальный трафик
– Кол-во внутренних ссылок