SlideShare a Scribd company logo
1 of 23
САНКЦИИ ЗАТЕКСТЫ
Мини-гайд от АлексеяЧекушина
Что будет рассмотрено?
- Основные фильтры и логика их применения.
- Методы распознавания спама/некачественных текстов поисковыми системами.
- Как распознать наложенные санкции поиска.
- Как избежать наложения санкций.
Основные фильтры
■ Доменный спам-фильтр от Яндекса.
■ АГС от Яндекса.
■ «Панда» от Гугла.
■ Фильтрация дублей.
■ Документные фильтры от обеих ПС.
Что такое некачественный текст?
■ Создан для накрутки текстовых факторов ранжирования.
■ Является сгенерированным
■ Или просто «некачественным»
■ Содержит
Методы выделения спама
«Статистические»
Вычисление метрик текста и сравнение их с неким «эталоном»
«Лингвистические»
Разбор текста согласно законам языка, выявление неестественных языковых
конструкций.
Статистические
■ Основа метода – сравнение статистических метрик текста с «эталоном»
■ Примеры статистических метрик:
- Средняя длина/диспесия длины слов/предложений.
- Доля/дисперсия по предложениям частей речи.
- N-граммные вероятности.
- Закон ципфа
И.т.д.
Важно! Ни одна из метрик не может быть использована отдельно.
Лингвистические
Основная метрика – выявление неестественных лингвистических конструкций.
Такие конструкции порождаются ошибками шаблонизации
«купить телевизор» – ок.
«купить стиральная машина» – не ок.
И попытками впихнуть неестественные вхождения
«телефоны самсунг цена»
Санкции
■ Понижение в ранжировании документа.
■ Понижение в ранжировании хоста целиком.
■ «Карантин»
(предназначен для отбивания охоты искать порог спама)
Документные санкции
Основные признаки:
- Понижение позиций по всем запросам (иногда включая цитатный поиск).
- Документ становится не релевант
Важно не путать санкцию с выпадением из «окна» хороших для ранжирования
значений.
Хостовые санкции
Google Panda
За что накладывается:
- Некачественные/спамные тексты на сайте.
- Дубликаты с других доменов или внутри сайта.
Особенности:
- Пенальти на весь хост.
- Возможно как резкое, так и плавное снижение позиций/трафика.
Как определить:
- “PanguinTool”
- Падение не связано со ссылками или индексацией.
Хостовое пенальти от Яндекса
За что накладывается:
- Некачественные/спамные тексты на сайте.
Особенности:
- Пенальти на весь хост, даже если спам-текстов несколько.
- «Карантин» - от 1го месяца.
Как определить:
- Единомоментная (в 1 апдейт) просадка трафика (в 2 и более раза)
(а также проседание по всем позициям, за исключением витальных.Чем
больше конкурентность запроса – тем больше проседание.
- Платон подтверждает.
АГС
■ Фильтр создан преимущественно для «отстрела» ссылочных доноров.
■ Однако, содержит текстовые метрики.
■ Сайт может попасть под «АГС» за тексты даже не имея платных внешних ссылок.
■ Основной текстовый критерий – «качество».
Как не попасть?
■ Отсутствие дубликатов. Как внутри домена, так и вне его.
■ Отсутствие дубликатов
Проверка на дубликаты
Основной метод – проверка по шинглам.
+ Хорошие результаты по обнаружению заимствованных фрагментов.
- Необходимость делать много запросов.
- Невозможность удалить предлоги.
Согласованность текста
Генерацию шаблонов выполняем с использованием числа и падежа вхождения
(Осторожно при использовании автоматических склоняторов. Бывают баги).
Тексты проверяем на согласованность силами любого текстового редактора
(например – MicrosoftWord)
Антивода
Основной метод – выделение «водных» частей речи и проверка по словарям
«водных» слов.
+ Быстро
+ Позволяет выделять совсем плохие тексты
- Не анализирует тематичность.
-
- Выделение по частям речи имеют ограничения
(например, наречия обычно бывают «водными», но «недорого» - не вода).
Частотный словарь по топ-10?
+ Достаточно просто.
+ Возможность выловить некоторые тематические слова.
- Выловим также всю воду в топе, ибо:
Не факт, что основой формирования топа стали тексты.
Ситуации, когда «спам-фильтр отвернулся»
Пример текста из топа
Антивода 2.0
Языковые модели для пословной оценки тематичности слов текста.
+ Гораздо более качественно
+ Оценивается каждое (!) слово.
+ Оценка не абстрактна, а в привязке к запросу.
- Мы ограничены качеством текстов в коллекции по теме.
- Проверка требует несколько запросов на каждое слово.
- Качество оценки падает на однословных и 4+ словных запросах.
«Акварель»
Гибридная униграммная языковая модель.
(Три запроса на каждое слово).
Доступна на Just-Magic.org
Промо-код на лимитиы «Акварели» aquafox (действует только сегодня)
Вот и сказочке конец…А кто слушал…
Может задать вопрос!

More Related Content

What's hot

Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)Стас Поломарь
 
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Стас Поломарь
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядроSiteclinic
 
Как собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиямиКак собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиямиAlexey Trudov
 
Познай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tv
Познай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tvПознай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tv
Познай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tvДмитрий Севальнев
 
Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)Стас Поломарь
 
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев ДмитрийДмитрий Севальнев
 
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТВ БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТUkrop Media
 
Как построить SEO CRM (Sempro 15)
Как построить SEO CRM (Sempro 15)Как построить SEO CRM (Sempro 15)
Как построить SEO CRM (Sempro 15)Стас Поломарь
 
Мониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнесаМониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнесаСтас Поломарь
 
Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)Стас Поломарь
 
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Дмитрий Севальнев
 
Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)Стас Поломарь
 
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в КазаниНовое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в КазаниДмитрий Севальнев
 
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваРутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваДмитрий Шахов
 
Станислав Поломарь, Webit,
Станислав Поломарь,  Webit,Станислав Поломарь,  Webit,
Станислав Поломарь, Webit,Movebo
 
Как анализировать сайты конкурентов
Как анализировать сайты конкурентовКак анализировать сайты конкурентов
Как анализировать сайты конкурентовSiteclinic
 

What's hot (20)

Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)Оптимизация по полочкам (Неделя Байнета 15)
Оптимизация по полочкам (Неделя Байнета 15)
 
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)
 
Как создать эффективное семантическое ядро
Как создать эффективное семантическое ядроКак создать эффективное семантическое ядро
Как создать эффективное семантическое ядро
 
Как собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиямиКак собрать трафик из Google с минимальными усилиями
Как собрать трафик из Google с минимальными усилиями
 
SEO итоги 2015 (Smartfox)
SEO итоги 2015 (Smartfox)SEO итоги 2015 (Smartfox)
SEO итоги 2015 (Smartfox)
 
Познай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tv
Познай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tvПознай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tv
Познай ТОП, выпуск 3. Севальнев Дмитрий и Юрков Сергей на MegaIndex.tv
 
Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)Cемантика измерение и аналитика (Data Driven Seo)
Cемантика измерение и аналитика (Data Driven Seo)
 
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
 
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТВ БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
В БУДУЩЕМ ВНУТРЕННЯЯ ОПТИМИЗАЦИЯ ПОБЕДИТ
 
Как построить SEO CRM (Sempro 15)
Как построить SEO CRM (Sempro 15)Как построить SEO CRM (Sempro 15)
Как построить SEO CRM (Sempro 15)
 
Мониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнесаМониторинг поискового здоровья бизнеса
Мониторинг поискового здоровья бизнеса
 
Доклад MAD conference
Доклад MAD conferenceДоклад MAD conference
Доклад MAD conference
 
Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)
 
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
Познай ТОП, выпуск 2. Севальнев Дмитрий (Пиксель Плюс)
 
Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)
 
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в КазаниНовое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
Новое SEO. Изменения в ранжировании Яндекса 2014. Конференция в Казани
 
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и сноваРутинные операции в SEO, о которых забывают и спрашивают снова и снова
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
 
Master class
Master classMaster class
Master class
 
Станислав Поломарь, Webit,
Станислав Поломарь,  Webit,Станислав Поломарь,  Webit,
Станислав Поломарь, Webit,
 
Как анализировать сайты конкурентов
Как анализировать сайты конкурентовКак анализировать сайты конкурентов
Как анализировать сайты конкурентов
 

Viewers also liked

Методы оценки качества текстов
Методы оценки качества текстовМетоды оценки качества текстов
Методы оценки качества текстовAlexey Chekushin
 
Значимое в SEO 2016
Значимое в SEO 2016Значимое в SEO 2016
Значимое в SEO 2016Alexey Chekushin
 
Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн...
 Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн... Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн...
Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн...MediaMakers2016
 
Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...
Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...
Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...MediaMakers2016
 
Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...
Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...
Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...MediaMakers2016
 
Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...
Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...
Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...MediaMakers2016
 
Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...
Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...
Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...MediaMakers2016
 
Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...
Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...
Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...MediaMakers2016
 
Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...
Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...
Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...MediaMakers2016
 
Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...
Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...
Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...MediaMakers2016
 
Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...
Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...
Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...MediaMakers2016
 
Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...
Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...
Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...MediaMakers2016
 
Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...
Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...
Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...MediaMakers2016
 
Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...
Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...
Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...MediaMakers2016
 
Cross media
Cross mediaCross media
Cross mediatns_ru
 
Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...
Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...
Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...MediaMakers2016
 
LinkedIn and Slideshare
LinkedIn and SlideshareLinkedIn and Slideshare
LinkedIn and SlideshareLinkedIn
 
SlideShare moves to HTML5
SlideShare moves to HTML5 SlideShare moves to HTML5
SlideShare moves to HTML5 Amit Ranjan
 

Viewers also liked (18)

Методы оценки качества текстов
Методы оценки качества текстовМетоды оценки качества текстов
Методы оценки качества текстов
 
Значимое в SEO 2016
Значимое в SEO 2016Значимое в SEO 2016
Значимое в SEO 2016
 
Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн...
 Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн... Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн...
Сергей Паранько, редакционный директор Mail.Ru Group. «Медиа-менеджмент, осн...
 
Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...
Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...
Елена Кирюшина, digital-директор «Ведомостей». «Как мы запустили paywall и на...
 
Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...
Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...
Старший редактор Quartz Гидеон Личфилд: «Как конкурировать с большими издания...
 
Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...
Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...
Антон Капаев, заместитель генерального директора Медиагруппы Актион-МЦФЭР. «И...
 
Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...
Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...
Александр Уржанов, креативный директор телеканала РБК. «Как нужно заниматься ...
 
Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...
Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...
Евгений Вольнов, руководитель отдела рекламных технологий Independent Media. ...
 
Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...
Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...
Илья Лагутин, CEO AiTarget: «Как построить международный медиабизнес на платф...
 
Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...
Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...
Андрей Чернышов, управляющий партнер People&Screens. «Как монетизировать моби...
 
Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...
Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...
Максим Кашулинский, издатель Republic (Slon). «Как мы запустили paywall и нач...
 
Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...
Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...
Кай Дикманн, издатель Bild. «Как мы преобразовали крупнейшую газету Европы в ...
 
Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...
Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...
Михаил Кафанов, создатель Telegram-канала @bestarticles. «Как создать медиа в...
 
Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...
Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...
Эрнст-Ян Пфаут, издатель De Correspondent. «Как создать успешное медиа, опира...
 
Cross media
Cross mediaCross media
Cross media
 
Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...
Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...
Анастасия Сокирко, Александр Гладких, Андрей Старков, соучредители студии диз...
 
LinkedIn and Slideshare
LinkedIn and SlideshareLinkedIn and Slideshare
LinkedIn and Slideshare
 
SlideShare moves to HTML5
SlideShare moves to HTML5 SlideShare moves to HTML5
SlideShare moves to HTML5
 

Similar to Гайд по текстовому антиспаму

Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаSEO-Интеллект
 
SEO-Коучинг 4.0_Day1
SEO-Коучинг 4.0_Day1SEO-Коучинг 4.0_Day1
SEO-Коучинг 4.0_Day1seo-intellect
 
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...Дмитрий Севальнев
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабанzaharec
 
Олег Саламаха. Текстовая аналитика
Олег Саламаха. Текстовая аналитикаОлег Саламаха. Текстовая аналитика
Олег Саламаха. Текстовая аналитикаДмитрий Шахов
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснетаyaevents
 
SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылкиSEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылкиДмитрий Севальнев
 
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016Дмитрий Севальнев
 
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев ДмитрийСанкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев ДмитрийДмитрий Севальнев
 
DOC Использование особенностей языка запросов поиска Яндекса для исследований...
DOC Использование особенностей языка запросов поиска Яндекса для исследований...DOC Использование особенностей языка запросов поиска Яндекса для исследований...
DOC Использование особенностей языка запросов поиска Яндекса для исследований...Eugene Trofimenko
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 finalyaevents
 
Олег Саламаха. Анализ ссылочных профилей сайта
Олег Саламаха. Анализ ссылочных профилей сайтаОлег Саламаха. Анализ ссылочных профилей сайта
Олег Саламаха. Анализ ссылочных профилей сайтаOctopus Events
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабанzaharec
 
Как работают поисковые системы
Как работают поисковые системыКак работают поисковые системы
Как работают поисковые системыNetpeak
 
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииНарижный Денис
 
Техническая внутренняя оптимизация больших сайтов
Техническая внутренняя оптимизация больших сайтовТехническая внутренняя оптимизация больших сайтов
Техническая внутренняя оптимизация больших сайтовIhor Bankovskyi
 
Sem ревизия сайта, ревизия оптимизации сайта
Sem ревизия сайта, ревизия оптимизации сайтаSem ревизия сайта, ревизия оптимизации сайта
Sem ревизия сайта, ревизия оптимизации сайтаОлександр Мілютін
 
10 секретов seo текста продвинуть сайт и не попасть под санкции
10 секретов seo текста  продвинуть сайт и не попасть под санкции10 секретов seo текста  продвинуть сайт и не попасть под санкции
10 секретов seo текста продвинуть сайт и не попасть под санкцииГлеб Лавриненко
 

Similar to Гайд по текстовому антиспаму (20)

Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
 
SEO-Коучинг 4.0_Day1
SEO-Коучинг 4.0_Day1SEO-Коучинг 4.0_Day1
SEO-Коучинг 4.0_Day1
 
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
Фильтры Яндекса, что угрожает вашему сайту? [Севальнев, конференция SEO Практ...
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабан
 
Elkamskaya 100330045814-phpapp02
Elkamskaya 100330045814-phpapp02Elkamskaya 100330045814-phpapp02
Elkamskaya 100330045814-phpapp02
 
XXV Elena Kamskaya
XXV Elena KamskayaXXV Elena Kamskaya
XXV Elena Kamskaya
 
Олег Саламаха. Текстовая аналитика
Олег Саламаха. Текстовая аналитикаОлег Саламаха. Текстовая аналитика
Олег Саламаха. Текстовая аналитика
 
Ранжирование: от строчки кода до Матрикснета
Ранжирование:  от строчки кода до МатрикснетаРанжирование:  от строчки кода до Матрикснета
Ранжирование: от строчки кода до Матрикснета
 
SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылкиSEO-Калининград, Севальнев, Аналитический взгляд на ссылки
SEO-Калининград, Севальнев, Аналитический взгляд на ссылки
 
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
Ссылки. Яндекс. Год 2016 - Севальнев РИФ Воронеж 2016
 
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев ДмитрийСанкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
Санкции поисковых систем — новый виток борьбы. IBC Russia, Севальнев Дмитрий
 
DOC Использование особенностей языка запросов поиска Яндекса для исследований...
DOC Использование особенностей языка запросов поиска Яндекса для исследований...DOC Использование особенностей языка запросов поиска Яндекса для исследований...
DOC Использование особенностей языка запросов поиска Яндекса для исследований...
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
 
Олег Саламаха. Анализ ссылочных профилей сайта
Олег Саламаха. Анализ ссылочных профилей сайтаОлег Саламаха. Анализ ссылочных профилей сайта
Олег Саламаха. Анализ ссылочных профилей сайта
 
презентация фильтры поисковых систем шабан
презентация фильтры поисковых систем   шабанпрезентация фильтры поисковых систем   шабан
презентация фильтры поисковых систем шабан
 
Как работают поисковые системы
Как работают поисковые системыКак работают поисковые системы
Как работают поисковые системы
 
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
 
Техническая внутренняя оптимизация больших сайтов
Техническая внутренняя оптимизация больших сайтовТехническая внутренняя оптимизация больших сайтов
Техническая внутренняя оптимизация больших сайтов
 
Sem ревизия сайта, ревизия оптимизации сайта
Sem ревизия сайта, ревизия оптимизации сайтаSem ревизия сайта, ревизия оптимизации сайта
Sem ревизия сайта, ревизия оптимизации сайта
 
10 секретов seo текста продвинуть сайт и не попасть под санкции
10 секретов seo текста  продвинуть сайт и не попасть под санкции10 секретов seo текста  продвинуть сайт и не попасть под санкции
10 секретов seo текста продвинуть сайт и не попасть под санкции
 

More from Alexey Chekushin

Как островок работает с семантикой
Как островок работает с семантикойКак островок работает с семантикой
Как островок работает с семантикойAlexey Chekushin
 
Автоматическая классификация запросов
Автоматическая классификация запросовАвтоматическая классификация запросов
Автоматическая классификация запросовAlexey Chekushin
 
Кластеризация и текстовый анализ
Кластеризация и текстовый анализКластеризация и текстовый анализ
Кластеризация и текстовый анализAlexey Chekushin
 
Текст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успехаТекст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успехаAlexey Chekushin
 
Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015Alexey Chekushin
 
Непорочное продвижение
Непорочное продвижениеНепорочное продвижение
Непорочное продвижениеAlexey Chekushin
 

More from Alexey Chekushin (6)

Как островок работает с семантикой
Как островок работает с семантикойКак островок работает с семантикой
Как островок работает с семантикой
 
Автоматическая классификация запросов
Автоматическая классификация запросовАвтоматическая классификация запросов
Автоматическая классификация запросов
 
Кластеризация и текстовый анализ
Кластеризация и текстовый анализКластеризация и текстовый анализ
Кластеризация и текстовый анализ
 
Текст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успехаТекст-дзюцу: факторы ранжирования как факторы успеха
Текст-дзюцу: факторы ранжирования как факторы успеха
 
Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015Новинки SEO-автоматизации 2015
Новинки SEO-автоматизации 2015
 
Непорочное продвижение
Непорочное продвижениеНепорочное продвижение
Непорочное продвижение
 

Гайд по текстовому антиспаму

  • 2. Что будет рассмотрено? - Основные фильтры и логика их применения. - Методы распознавания спама/некачественных текстов поисковыми системами. - Как распознать наложенные санкции поиска. - Как избежать наложения санкций.
  • 3. Основные фильтры ■ Доменный спам-фильтр от Яндекса. ■ АГС от Яндекса. ■ «Панда» от Гугла. ■ Фильтрация дублей. ■ Документные фильтры от обеих ПС.
  • 4. Что такое некачественный текст? ■ Создан для накрутки текстовых факторов ранжирования. ■ Является сгенерированным ■ Или просто «некачественным» ■ Содержит
  • 5. Методы выделения спама «Статистические» Вычисление метрик текста и сравнение их с неким «эталоном» «Лингвистические» Разбор текста согласно законам языка, выявление неестественных языковых конструкций.
  • 6. Статистические ■ Основа метода – сравнение статистических метрик текста с «эталоном» ■ Примеры статистических метрик: - Средняя длина/диспесия длины слов/предложений. - Доля/дисперсия по предложениям частей речи. - N-граммные вероятности. - Закон ципфа И.т.д. Важно! Ни одна из метрик не может быть использована отдельно.
  • 7. Лингвистические Основная метрика – выявление неестественных лингвистических конструкций. Такие конструкции порождаются ошибками шаблонизации «купить телевизор» – ок. «купить стиральная машина» – не ок. И попытками впихнуть неестественные вхождения «телефоны самсунг цена»
  • 8. Санкции ■ Понижение в ранжировании документа. ■ Понижение в ранжировании хоста целиком. ■ «Карантин» (предназначен для отбивания охоты искать порог спама)
  • 9. Документные санкции Основные признаки: - Понижение позиций по всем запросам (иногда включая цитатный поиск). - Документ становится не релевант Важно не путать санкцию с выпадением из «окна» хороших для ранжирования значений.
  • 11. Google Panda За что накладывается: - Некачественные/спамные тексты на сайте. - Дубликаты с других доменов или внутри сайта. Особенности: - Пенальти на весь хост. - Возможно как резкое, так и плавное снижение позиций/трафика. Как определить: - “PanguinTool” - Падение не связано со ссылками или индексацией.
  • 12. Хостовое пенальти от Яндекса За что накладывается: - Некачественные/спамные тексты на сайте. Особенности: - Пенальти на весь хост, даже если спам-текстов несколько. - «Карантин» - от 1го месяца. Как определить: - Единомоментная (в 1 апдейт) просадка трафика (в 2 и более раза) (а также проседание по всем позициям, за исключением витальных.Чем больше конкурентность запроса – тем больше проседание. - Платон подтверждает.
  • 13. АГС ■ Фильтр создан преимущественно для «отстрела» ссылочных доноров. ■ Однако, содержит текстовые метрики. ■ Сайт может попасть под «АГС» за тексты даже не имея платных внешних ссылок. ■ Основной текстовый критерий – «качество».
  • 14.
  • 15. Как не попасть? ■ Отсутствие дубликатов. Как внутри домена, так и вне его. ■ Отсутствие дубликатов
  • 16. Проверка на дубликаты Основной метод – проверка по шинглам. + Хорошие результаты по обнаружению заимствованных фрагментов. - Необходимость делать много запросов. - Невозможность удалить предлоги.
  • 17. Согласованность текста Генерацию шаблонов выполняем с использованием числа и падежа вхождения (Осторожно при использовании автоматических склоняторов. Бывают баги). Тексты проверяем на согласованность силами любого текстового редактора (например – MicrosoftWord)
  • 18. Антивода Основной метод – выделение «водных» частей речи и проверка по словарям «водных» слов. + Быстро + Позволяет выделять совсем плохие тексты - Не анализирует тематичность. - - Выделение по частям речи имеют ограничения (например, наречия обычно бывают «водными», но «недорого» - не вода).
  • 19. Частотный словарь по топ-10? + Достаточно просто. + Возможность выловить некоторые тематические слова. - Выловим также всю воду в топе, ибо: Не факт, что основой формирования топа стали тексты. Ситуации, когда «спам-фильтр отвернулся»
  • 21. Антивода 2.0 Языковые модели для пословной оценки тематичности слов текста. + Гораздо более качественно + Оценивается каждое (!) слово. + Оценка не абстрактна, а в привязке к запросу. - Мы ограничены качеством текстов в коллекции по теме. - Проверка требует несколько запросов на каждое слово. - Качество оценки падает на однословных и 4+ словных запросах.
  • 22. «Акварель» Гибридная униграммная языковая модель. (Три запроса на каждое слово). Доступна на Just-Magic.org Промо-код на лимитиы «Акварели» aquafox (действует только сегодня)
  • 23. Вот и сказочке конец…А кто слушал… Может задать вопрос!