12-го февраля произошло достаточно крупное для оптимизаторов событие: три поисковых системы — Google, Live и Yahoo заявили о поддержке нового мета тега «canonical url tag». Этот тег предназначен для избавления от дублированных страниц — извечной проблемы множества сайтов.

Синтаксис

Размещается мета тег в HEAD части html документа. Синтаксис обычный:
<link rel=»canonical» href=»http://site.com/page.html»/>

Примеры применения

Большое число сайтов отдают одинаковый контент при разных запрашиваемых URL, например:

  • http://site.com
  • http://site.com/index.html
  • http://www.site.com/
  • http://site.com/index.php?ref_id=12345
  • http://www.site.com/index.php&sessionid=5678

Как можно бороться с этими дублями?

  • задать основной домен через директиву host в robots.txt
  • выбрать «с www» или «без www» в панели вебмастера Google
  • сделать 301 редирект посредством конфигурирования сервера файлом .htaccess
  • создать карту сайта с необходимым URL домена
  • воспользоваться метатегом rel=»canonical»

Как видно, способы избежать проблемы дублированного содержимого существовали и до появления нового тега. Однако существует ряд особенностей, почему применение «canonical» выглядит весьма уместным. Во первых — это простота реализации, ведь для того, чтобы обеспечить правильный 301-й редирект, необходимо обладать достаточными познаниями в настройке сервера. Во вторых, и это важно — можно отдавать пользователям одну страницу, а поисковикам — другую. Например, версию для печати можно теперь не закрывать от индексации — достаточно лишь поставить в таком документе нужный мета тег «canonical».

Ответы  вопросы от Google

Q: Использование rel=»canonical» — это совет или обязательный параметр?
A: Это совет, которому мы призываем следовать. Мы примем во внимание ваше предпочтение, и вместе с другими факторами Google определит наиболее релевантную запросу страницу

Q: Могу ли я указать относительный путь при указании страницы «canonical», например <link rel=»canonical» href=»product.php?item=swedish-fish» />?
A: Да, относительные пути поддерживаются и ожидаются при использовании тега <link>. Также вы можете включить ссылку <base> в ваш документ, тогда относительный путь будет соответственно от URL этого тега.

Q: Допустимо ли, если каноническая страница не в точности дублирует контент?
A: Мы допускаем некоторые отклонения в содержании, например порядок сортировки в списке товаров. Так же мы понимаем, что каноническая страница и дублированная могут быть проиндексированы в разное время, так что мы могли увидеть различное содержимое этой страницы. Все это нами будет учитываться.

Q: Что, если rel=»canonical» ведет на страницу с 404 ошибкой?
A: Мы продолжим индексировать ваш сайт и используем эвристический метод, чтобы найти каноническую страницу, однако мы настоятельно рекомендуем, чтобы этот тег вел на существующую страницу вашего сайта.

Q: Что, если rel=»canonical» ведет на еще не проиндексированную страницу?
A: Как обычно, когда мы встречаем новое доступное содержимое в сети, мы постараемся просканировать каноническую ссылку как можно скорее. Как только страница будет проиндексирована, мы сразу станем учитывать параметр rel=»canonical».

Q: Может ли rel=»canonical» вести на редирект?
A: Да, вы можете указать переадресующую страницу, как каноническую. В этом случае, Google перейдет по адресу и попытается проиндексировать содержимое.

Q: Что, если у меня есть противоречащие  rel=»canonical» указания?
A: Наш алгоритм достаточно мягкий: мы можем следовать канонической цепи, однако для наилучших результатов при использовании канонизации, мы настоятельно рекомендуем чтобы канонические ссылки вели именно на одну, необходимую вам страницу.

Q: Можно ли этим мета-тегом предложить канонический URL на другом домене?
A: Нет. Чтобы перевести робота на другой домен, гораздо лучше подходит постоянная переадресация (301 редирект). Сейчас Google рассматривает канонические ссылки в пределах домена или между поддоменами. Таким образом, владелец сайта может предложить www.example.com vs. example.com vs. help.example.com, но не example.com vs. example-widgets.com.

Q: Звучит здорово, можно ли посмотреть пример?
A: Конечно, сайт yoast.com наш доверенный тестер. Например, вы можете посмотреть, что в исходном коде этой страницы: http://starwars.wikia.com/wiki/Nelvana_Limited указан мета тег  rel=»canonical» такого вида: http://starwars.wikia.com/wiki/Nelvana.
Эти две страницы имеют практически одинаковое содержимое, за исключением короткого сообщения в шапке в странице, открывающейся по первой ссылке. Это хороший пример применения этого тега. Используя rel=»canonical», свойства двух URL объединены нашем индексе и в поисковых результатах показывается именно та версия, которую предпочитает wikia.com

Как можно заметить, я в своем блоге так же использую этот мета тег, за что спасибо плагину для WordPress (см. ниже). Сам тег открывает некоторые заманчивые перспективы, однако остается под вопросом еще несколько моментов. В частности, вес передаваемый со страницы — точно ли 100%? Мэт Катц из Google утверждает, что такой метод равносилен 301 редиректу по части передачи веса страницы. Однако только практика использования покажет, насколько это так.

К сожалению, радость не безгранична ввиду того, что для Яндекса на данный момент этот тег — пустой звук. Остается только уповать на то, что и поисковик рунета №1 станет учитывать этот мета-тег. Иначе, от дублированного контента все-равно придется избавляться старыми добрыми методами.

Полезные ссылки

Статья на официальном блоге Google (на английском)

Видеоролик с участием Matt Cutts (руководитель Google Webmasters) (на английском)

Блог Matt Cutts, где он отвечает на вопросы о новом мета-теге

Плагины «canonical» для WordPress и Drupal

3 комментария

  1. Рускин Алексей Letux

    Спасибо. Интересная статься про canonical tag 😉

  2. Жанат

    кто поможет как можно прикрутить этот тэг к дле я не смог сделать

  3. Андрей

    Поддерживает Яндекс canonical: help.yandex.ru›webmaster/id/1127756

Write A Comment