Боремся с дублирующимся контентом: link vs clean-param

Недавно большинство популярных поисковиков сделали еще один шаг в борьбе с дублирующимся контентом. Нижеприведенные нововведения призваны помочь поисковикам правильно индексировать и ранжировать в поисковой выдаче повторяющиеся в пределах одного сайта страницы.

28 января 2009 Яндекс анонсировал в своем блоге директиву clean-param для robots.txt.
С ее помощью вы можете указать незначащие cgi-параметры поисковому роботу Яндеска.
Таким образом, если в url страниц вашего сайта содержат динамические параметры (например идентификатор сессии – sid), которые не влияют на их содержимое, вы можете описать их при помощи директивы Clean-param в robots.txt. Робот Яндекса, используя эту информацию, не будет многократно перезакачивать дублирующуюся страницу. Таким образом, вы можете снизить нагрузку на сервер и избежать дублирующихся страниц.
Подробнее про директиву Clean-param можно прочитать в хелпе Яндекса.

А 12 февраля 2009 года большая западная тройка в лице Google, Yahoo и Microsoft анонсировали новый тег, с помощью которого можно сообщить этим поисковикам какой URL имеет ваша страница.
Теперь вы сможете добавить тег <link> с параметром rel=”canonical” в секции <head> вашей страницы, для указания предпочтительной версии url.

Звучит немного сложно, но на деле все довольно просто. Чтобы стало понятнее, разберем на примере:

Допустим у вас есть сайт, на котором на одну и ту же страницу со списком статей. Попасть на эту страницу можно по ссылкам (в зависимости от сортировки статей):
site.ru/article.php
site.ru/article.php?sort=date
site.ru/article.php?sort=type

По сути это одна и та же страница, но поисковики воспримут ее как 3 страницы с одним и тем же содержанием. Однако теперь вы можете добавить тег <link> с параметром rel=”canonical” в секции <head>:

<link rel=”canonical” href=”http://www.site.ru/article.php” />

Таким образом вы показываете поисковикам, что из группы данных страниц основной является site.ru/article.php, а остальные страницы – второстепенные дубли.

И немного технической информации об этом теге:

  • URL в теге <link> может быть относительным и абсолютным. Хотя лучше использовать абсолютный путь.
  • Тег <link> может указывать на канонический URL только в пределах домена. Ссылки на другие домены не будут учитываться.
  • Тег <link> транзитивный, т.е. если страница А указывает на страницу В как на канонический адрес, и В указывает на С как на канонический адрес, то страница С станет канонической и для А, и для В.
  • Тег <link> ведет себя как 301 redirect, в том смысле что все «дополнительные свойства» страниц (PageRank, входящие ссылки и т.д.) передаются канонической странице.
  • Тег <link> является лишь рекомендацией – если поисковики сочтут, что содержание страницы содержащий данный тег и указанной канонической страницы существенно отличается, то каноническая ссылка не будет учитываться.

Комментарии

Елена
04.06.2012 - 01:34

а как добавить тег с параметром rel=”canonical” в секции , именно на определенные страницы?! Буду благодарна за ответ.

Добавить комментарий