View Categories

Дубли страниц

2 min read

Дубли страниц – это страницы, которые совпадают на 90 — 100% и находящиеся под разными URL — адресами. Подобные дубли сильно усложняют индексацию сайта в поисковых системах.

Причины возникновения дублей страниц #
  1. Использование CMS. Это наиболее частая причина возникновения дублей страниц. Например, когда одна и та же запись на сайте относится к нескольким рубрикам, чьи домены включены в адрес сайта самой записи. В результате получаются дубли:
    https://site.ru/page1/info/
    https://site.ru/page2/info/
  2. Технические разделы. Здесь зачастую виноваты CMS Bitrix и Joomla. Например, одна из функций сайта (таких как: поиск по сайту, фильтрация, регистрация и т.д.) генерирует URL — адреса с определенными параметрами и с одинаковой информацией по отношению к ресурсу без параметров в URL — адресе. Например:
    https://site.ru/articles.php
    https://site.ru/articles.php?ajax=Y
  3. Человеческий фактор. В данном случае люди по невнимательности или забывчивости могут разместить одну и ту же статью, но в разных разделах или рубриках.
Как найти дубли страниц #

Существует несколько способов выявить дубли страниц.

  1. Расширенный поиск Google. Необходимо укажите в расширенном поиске URL — адрес главной страницы. Система выдаст список всех проиндексированных страниц. А если указать URL — адрес определенной страницы, то поисковик покажет полный перечень дублей в индексе. В отличие от Google, в Яндексе копии страниц сразу видны.
  2. Программа XENU (Xenu Link Sleuth). Это специализированная программа для аудитов, которая позволяет производить аудит Вашего сайта и найти дубли. Чтобы получить аудит и произвести фильтрацию по заголовку требуется в специальную строку ввести URL — адрес сайта. Программа поможет найти полные совпадения.
  3. Обнаружение дублей при помощи web – мастерской Google Search Console. В разделе «Оптимизация Html», будет выведен список страниц с повторяющимся контентом, тегами <Title>. По таблице можно легко найти чёткие дубли.
  4. Онлайн seo-платформа Serpstat проводит технический seo-аудит сайта по более чем 50 ошибкам. Среди них есть блок для анализа дублируемого контента на сайте. Так сервис найдет дублирующиеся Title, Description, H1 на двух и больше страницах. Также видит случаи, когда H1 дублирует Title, на одной странице по ошибке прописаны два мета-тега Title и больше одного заголовка Н1.
Как убрать дубли #

Есть три способа избавиться от дублей:

  1. Использовать канонические ссылки. Для этого необходимо указать в коде страницы — дубля URL — адрес основной страницы с помощью rel=»canonical».
  2. Запретить индексирование таких страниц в файле robots.txt.
  3. Настроить редирект. Не важно какой, постоянный (301) или временный (302).