Канонические URL

В этой статье описано, как использовать канонические URL, чтобы улучшить рейтинг одинакового содержания, размещенного на разных страницах.

На сегодняшний день многие веб-мастера используют системы управления контентом, а также различные методики его распространения. В результате одни и те же материалы могут размещаться на страницах с разными URL (например, это относится к интернет-магазинам). Примеры:

Динамические URL страницы с одним и тем же товаром могут отличаться, если они появляются в результатах поиска или пользователь открывал этот раздел сайта несколько раз.
https://www.example.com/products?category=dresses&color=green

https://example.com/dresses/cocktail?gclid=ABCD 

https://www.example.com/dresses/green/greendress.html
Ваш сервис для работы с блогом автоматически создает несколько URL, если вы размещаете одно сообщение в нескольких разделах.
https://blog.example.com/dresses/green-dresses-are-awesome/

https://blog.example.com/green-things/green-dresses-are-awesome/
Ваш сервер показывает одни и те же материалы в субдомене www и по обычным адресам с префиксом http.
http://example.com/green-dresses

https://example.com/green-dresses

http://www.example.com/green-dresses
Содержание блога, предназначенное для распространения на нескольких сайтах, полностью или частично повторяется в других доменах.
https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (исходное сообщение)

https://news.example.com/green-dresses-for-every-day-155672.html (копия сообщения)

Автоматизированные решения для работы с контентом упрощают его создание и распространение, однако вам придется искать нетривиальные решения в случаях, когда пользователи переходят на вашу страницу из результатов поиска. Примеры:

  • Обобщение информации о URL с одинаковым контентом. Это поможет поисковым системам связать материалы, опубликованные на разных страницах, с одним основным адресом. В результате ссылки с других сайтов на страницу http://example.com/dresses/cocktail?gclid=ABCD будут объединены со ссылками на https://www.example.com/dresses/green/greendress.html.
  • Получение статистики по отдельным продуктам или темам. Если контент размещен на нескольких страницах с разными URL, это затрудняет получение обобщенной статистики по нему.
  • Выбор URL, который будет предлагаться пользователям. Вам нужно указать, что посетители должны переходить на страницу с описанием платьев зеленого цвета по адресу https://www.example.com/dresses/green/greendress.html, а не https://example.com/dresses/cocktail?gclid=ABCD.
  • Указание на источник распространяемого контента. Если вы размещаете свои материалы по различным URL, потребуется задать самый высокий рейтинг для исходной страницы.

Чтобы решить эти проблемы, предоставьте Google канонический URL для идентичного контента, доступного по разным адресам. Вот несколько советов:

Мы рекомендуем использовать перечисленные выше методы, однако ни один из них не является обязательным. Если вы не укажете канонический URL, мы попытаемся определить его самостоятельно.

Не указывайте канонические страницы в файле robots.txt.
Не используйте инструмент удаления URL для указания канонической страницы: в этом случае из результатов поиска будут удалены все варианты адреса.
Не указывайте разные URL одной страницы в качестве канонических (например, в файле Sitemap указан один URL, а в атрибуте rel="canonical" – другой).

Как задать основной домен

Сообщите Google, какой URL сайта нужно использовать для вашего домена. Примеры:

  • https://www.example.com
  • https://example.com

Если в качестве основного вы выберете домен https://example.com, Google будет считать ссылки на https://www.example.com такими же, как https://example.com.

Подробнее о выборе основного домена...

Как указать основной URL при помощи атрибута rel="canonical"

Предположим, вы хотите указать URL https://blog.example.com/dresses/green-dresses-are-awesome/ в качестве основного (причем содержание этой страницы доступно и по другим адресам). Сообщить об этом поисковой системе можно следующим образом:

  • Пометьте каноническую страницу и ее остальные варианты атрибутом rel="canonical".
    Добавьте в раздел <head> этих страниц элемент <link> с атрибутом rel="canonical"
    <link rel="canonical" href="https://blog.example.com/dresses/green-dresses-are-awesome" />

    Таким образом вы указываете основной URL, который будет использоваться для перехода к сообщению о платьях зеленого цвета. Этот же адрес будет представлен в большинстве результатов поиска. Внимание! Мы не можем гарантировать, что он будет отображаться в Google при любых обстоятельствах.

Чтобы снизить вероятность ошибки, в элементах link после атрибута rel="canonical" используйте абсолютные, а не относительные пути.

Используйте следующую структуру URL: https://www.example.com/dresses/green/greendress.html
Не применяйте такие варианты: /dresses/green/greendress.html.

Как указать основные URL идентичного содержания в файле Sitemap

Выберите канонический (основной) URL для каждой страницы и укажите все эти адреса в файле Sitemap, чтобы Google смог их обработать.

Мы не можем гарантировать, что будут использоваться только адреса из файла Sitemap. Однако эта информация поможет Google определить, какие страницы вы считаете самыми важными.

Как использовать переадресацию 301 для неканонических URL

Предположим, на вашу страницу можно перейти по следующим URL:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Выберите один из этих адресов в качестве основного (канонического) и используйте переадресацию 301 на стороне сервера, чтобы перенаправлять на него трафик с других URL. Это один из самых надежных способов. Код статуса 301 означает, что запрашиваемая страница находится по другому адресу.

Как указать способ обработки динамических параметров

Вы можете сообщить Google о параметрах, которые следует игнорировать. Подробнее читайте здесь. При использовании этой функции наши роботы не будут обрабатывать повторяющийся контент, что упростит им работу. Например, если указать, что нужно игнорировать параметр sessionid, Google будет считать идентичными страницы https://www.example.com/dresses/green.php?sessionid=273749 и https://www.example.com/dresses/green.php.

Как указать каноническую ссылку в заголовке HTTP

Если у вас есть доступ к настройкам сервера, можно использовать атрибут rel="canonical" в заголовках HTTP, чтобы указывать канонический URL для документов в формате HTML и файлов других типов. Предположим, что один и тот же файл PDF на вашем сайте можно просмотреть по следующим адресам (например, в целях сбора статистики):

https://www.example.com/downloads/white-paper.pdf
https://www.example.com/downloads/partner-1/white-paper.pdf
https://www.example.com/downloads/partner-2/white-paper.pdf
https://www.example.com/downloads/partner-3/white-paper.pdf

В этом случае можно сообщить Google канонический адрес с помощью заголовка HTTP rel="canonical", как показано ниже:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

В настоящее время Google использует такие элементы только для поиска. 

О преимуществе HTTPS над HTTP в канонических ссылках

При определении канонических ссылок Google отдает предпочтение страницам HTTPS, если при этом не возникают проблемы, например следующие:

  • Страница HTTPS имеет недействительный сертификат SSL.
  • Страница HTTPS содержит небезопасные зависимости.
  • Доступ к странице HTTPS запрещен в файле robots.txt, а к странице HTTP – нет.
  • Страница HTTPS выполняет переадресацию на страницу HTTP.
  • Страница HTTPS указывает на страницу HTTP с помощью атрибута rel="canonical".
  • Страница HTTPS содержит метатег noindex для роботов.

Кроме того, вы можете дополнительно указать на то, что адресу HTTPS следует отдавать предпочтение. Вот как это сделать:

  • Используйте переадресацию 301, 302, JavaScript или с помощью метатегов со страницы HTTP на HTTPS.
  • Добавьте ссылку rel="canonical", указывающую со страницы HTTP на страницу HTTPS.
  • Используйте протокол HSTS.

Как предотвратить использование страницы HTTP в качестве канонической:

  • Проверяйте сертификаты SSL, а также ссылки со страницы HTTPS на HTTP. Ошибки в них могут привести к тому, что каноническим будет считаться адрес HTTP. При этом реализация протокола HSTS не имеет значения.
  • В файлах Sitemap и компонентах hreflang указывайте страницу HTTPS, а не HTTP.
  • Не используйте сертификат SSL/TLS для некорректного хоста (например, если example.com передает сертификат для www.example.com).  Этот сертификат должен соответствовать полному URL сайта или являться групповым, то есть пригодным для использования на нескольких субдоменах.
При блокировке ресурса в файле robots.txt необходимо блокировать обе его версии: как HTTP, так и HTTPS.

 

 

Была ли эта статья полезна?