ЛИСТАЙ ВНИЗ

Распротраненные ошибки дублированного контента

Внутренний дублированный контент часто возникает из-за неправильной настройки CMS (тема, плагины и т. д.).
Обычно это технические ошибки, которые могут привести к ухудшению рейтинга в поисковых системах. Поэтому очень важно уметь выявлять эти технические ошибки и правильно устранять.

Отдельные версии www или без www и http или https

Например, сайт доступен по протоколу https и с адресом www. Канонический домен будет выглядеть так: https://www.domen.ru.

Если перенаправление на стороне сервера настроено неправильно, домен может быть доступен по адресам:
  • http://www. domen.ru (без https);
  • http://domen.ru (без https и www);
  • https://domen.ru (без www).
В этом случае, чтобы устранить дублирование, необходимо реализовать 301 редирект различных версий, указывающий на каноническую версию https://www.domen.ru.

Варианты URL с учетом регистра

Google различает верхний и нижний регистр в URL-адресах. Это означает, что https://www.domen.ru/url-a/ (нижний регистр) и https://www.domen.ru/URL-A/ (верхний регистр) считаются разными страницами.
Поэтому следует быть осторожным и не допускать опечаток при создании внутренних ссылок, поскольку это может привести к тому, что обе версии URL будут проиндексированы.

URL-адреса с косой чертой и без нее

Косая черта (/) в конце URL называется завершающей косой чертой. URL-адреса часто доступны в обоих вариантах:
  • https://domen.ru/url-a (без конечной косой черты);
  • https://www.domen.ru/url-a/ (с косой чертой)
Чтобы устранить дублирование, нужно решить, какую структуру следует использовать для URL-адресов, и выбрать из них лучший вариант:
  • настроить 301 редирект с альтернативных версий на правильный URL;
  • вставить канонический rel, указывающий на правильную версию.
Доступность главной страницы по нескольким URL-адресам

Может случиться так, что главная страница сайта будет доступна по нескольким URL-адресам из-за неправильной конфигурации сервера.

Например, в дополнение к https://www.domen.ru он может быть доступен через:
  • https://www.domen.ru /index.html;
  • https://www.domen.ru/index.php;
  • https://www.domen.ru/index.asp;
  • https://www.domen.ru/index.aspx.
Чтобы устранить дублирование, надо выбрать URL, который будет использоваться для домашней страницы, а затем:
  • перенаправить другие URL на основной с помощью 301 редиректа;
  • или внедрить rel canonical в исходный код, указывающий на правильную версию.
Параметры URL

Это информация, содержащаяся в строке запроса URL, где строка запроса – это часть URL, которая идет после знака вопроса.
Например, https://www.domen.ru/scarpe?type=sneakers. В данном случае строка запроса type=sneakers.

Параметр URL – это строка, состоящая из букв, цифр и символов. Строки запросов используются для изменения содержимого страницы или отслеживания информации о клике по URL.

Существует два типа параметров URL:
  1. Активные параметры URL, изменяющие содержимое страницы.
  2. Пассивные параметры URL, использующиеся в целях мониторинга и не меняющие содержимое страницы.
Параметры URL используются в электронной коммерции для управления параметрами фильтрации страницы и в этом отношении очень полезны для посетителей. Они могут вызвать проблему дублирования контента. Если параметры URL обрабатываются неправильно, Google может просмотреть и проиндексировать несколько версий одного и того же контента.

Чтобы этого не произошло, следует придерживаться следующей практики:
  1. Сообщить Google, какая версия страницы должна быть проиндексирована с помощью rel canonical.
  2. Использовать функцию управления параметрами в Google Search Console и Bing Webmaster Tools, чтобы проинструктировать краулеров о том, как управлять параметрами.
  3. Оптимизировать файл robots.txt, запретив роботам сканирование определенных разделов сайта (например, Disallow:/clothes/*?).
  4. Правильно использовать внутренние ссылки, всегда ссылаясь на каноническую версию URL и никогда на параметрическую.
Таксономия

Это система классификации контента, которая часто используется в CMS для поддержки категорий и тегов.
Например, на блоге размещена статья в трех разных категориях. Пост может быть доступен через:
  • https://www.domen.ru/categoria-a/post/;
  • https://www.domen.ru/categoria-b/post/;
  • https://www.domen.ru/categoria-c/post/.
В этом примере будет дублированный контент, потому что одна и та же страница может быть доступна по разным URL. Чтобы решить эту проблему, нужно выбрать главную категорию и канонизировать URL других категорий.
WhatsApp Telegram