12-го февраля произошло достаточно крупное для оптимизаторов событие: три поисковых системы - Google, Live и Yahoo заявили о поддержке нового мета тега “canonical url tag”. Этот тег предназначен для избавления от дублированных страниц - извечной проблемы множества сайтов.
Синтаксис
Размещается мета тег в HEAD части html документа. Синтаксис обычный:
<link rel=”canonical” href=”http://site.com/page.html”/>
Примеры применения
Большое число сайтов отдают одинаковый контент при разных запрашиваемых URL, например:
- http://site.com
- http://site.com/index.html
- http://www.site.com/
- http://site.com/index.php?ref_id=12345
- http://www.site.com/index.php&sessionid=5678
Как можно бороться с этими дублями?
- задать основной домен через директиву host в robots.txt
- выбрать “с www” или “без www” в панели вебмастера Google
- сделать 301 редирект посредством конфигурирования сервера файлом .htaccess
- создать карту сайта с необходимым URL домена
- воспользоваться метатегом rel=”canonical”
Как видно, способы избежать проблемы дублированного содержимого существовали и до появления нового тега. Однако существует ряд особенностей, почему применение “canonical” выглядит весьма уместным. Во первых - это простота реализации, ведь для того, чтобы обеспечить правильный 301-й редирект, необходимо обладать достаточными познаниями в настройке сервера. Во вторых, и это важно - можно отдавать пользователям одну страницу, а поисковикам - другую. Например, версию для печати можно теперь не закрывать от индексации - достаточно лишь поставить в таком документе нужный мета тег “canonical”.
Ответы вопросы от Google
Q: Использование rel=”canonical” - это совет или обязательный параметр?
A: Это совет, которому мы призываем следовать. Мы примем во внимание ваше предпочтение, и вместе с другими факторами Google определит наиболее релевантную запросу страницу
Q: Могу ли я указать относительный путь при указании страницы “canonical”, например <link rel=”canonical” href=”product.php?item=swedish-fish” />?
A: Да, относительные пути поддерживаются и ожидаются при использовании тега <link>. Также вы можете включить ссылку <base> в ваш документ, тогда относительный путь будет соответственно от URL этого тега.
Q: Допустимо ли, если каноническая страница не в точности дублирует контент?
A: Мы допускаем некоторые отклонения в содержании, например порядок сортировки в списке товаров. Так же мы понимаем, что каноническая страница и дублированная могут быть проиндексированы в разное время, так что мы могли увидеть различное содержимое этой страницы. Все это нами будет учитываться.
Q: Что, если rel=”canonical” ведет на страницу с 404 ошибкой?
A: Мы продолжим индексировать ваш сайт и используем эвристический метод, чтобы найти каноническую страницу, однако мы настоятельно рекомендуем, чтобы этот тег вел на существующую страницу вашего сайта.
Q: Что, если rel=”canonical” ведет на еще не проиндексированную страницу?
A: Как обычно, когда мы встречаем новое доступное содержимое в сети, мы постараемся просканировать каноническую ссылку как можно скорее. Как только страница будет проиндексирована, мы сразу станем учитывать параметр rel=”canonical”.
Q: Может ли rel=”canonical” вести на редирект?
A: Да, вы можете указать переадресующую страницу, как каноническую. В этом случае, Google перейдет по адресу и попытается проиндексировать содержимое.
Q: Что, если у меня есть противоречащие rel=”canonical” указания?
A: Наш алгоритм достаточно мягкий: мы можем следовать канонической цепи, однако для наилучших результатов при использовании канонизации, мы настоятельно рекомендуем чтобы канонические ссылки вели именно на одну, необходимую вам страницу.
Q: Можно ли этим мета-тегом предложить канонический URL на другом домене?
A: Нет. Чтобы перевести робота на другой домен, гораздо лучше подходит постоянная переадресация (301 редирект). Сейчас Google рассматривает канонические ссылки в пределах домена или между поддоменами. Таким образом, владелец сайта может предложить www.example.com vs. example.com vs. help.example.com, но не example.com vs. example-widgets.com.
Q: Звучит здорово, можно ли посмотреть пример?
A: Конечно, сайт yoast.com наш доверенный тестер. Например, вы можете посмотреть, что в исходном коде этой страницы: http://starwars.wikia.com/wiki/Nelvana_Limited указан мета тег rel=”canonical” такого вида: http://starwars.wikia.com/wiki/Nelvana.
Эти две страницы имеют практически одинаковое содержимое, за исключением короткого сообщения в шапке в странице, открывающейся по первой ссылке. Это хороший пример применения этого тега. Используя rel=”canonical”, свойства двух URL объединены нашем индексе и в поисковых результатах показывается именно та версия, которую предпочитает wikia.com
Как можно заметить, я в своем блоге так же использую этот мета тег, за что спасибо плагину для Wordpress (см. ниже). Сам тег открывает некоторые заманчивые перспективы, однако остается под вопросом еще несколько моментов. В частности, вес передаваемый со страницы - точно ли 100%? Мэт Катц из Google утверждает, что такой метод равносилен 301 редиректу по части передачи веса страницы. Однако только практика использования покажет, насколько это так.
К сожалению, радость не безгранична ввиду того, что для Яндекса на данный момент этот тег - пустой звук. Остается только уповать на то, что и поисковик рунета №1 станет учитывать этот мета-тег. Иначе, от дублированного контента все-равно придется избавляться старыми добрыми методами.
Полезные ссылки
Статья на официальном блоге Google (на английском)
Видеоролик с участием Matt Cutts (руководитель Google Webmasters) (на английском)
Блог Matt Cutts, где он отвечает на вопросы о новом мета-теге
кто поможет как можно прикрутить этот тэг к дле я не смог сделать