Канонические URL-адреса в WordPress: когда и как использовать их. Атрибут link rel=“canonical” как еще один эффективный способ борьбы с дублями и не только Отсутствие цепочек ссылок

Сегодня мы поговорим про атрибут Rel=” Canonical” и в каких случаях его необходимо прописывать.

Что означает Rel Canonical?

Это атрибут указывается в теге и используется для отображения канонических страниц на сайте. Каноническая страница – является главной страницей, именно она будет при на сайте.

История Canonical

12 февраля 2009 года Google представил атрибут canonical, который был создан, чтобы избавить сайт от дублированных страниц, указав необходимый URL адрес (каноническую страницу).

Где прописывать rel canonical

Атрибут тега rel canonical прописывается в разделе и может встречаться только 1 раз на странице. Данный тег не может указывается в других разделах на сайте или

.

Каноническая ссылка – что это?

Каноническая страница – более приоритетная страница по сравнению с остальными.

Давайте разберем конкретный пример:

У нас имеется каноническая страница, на которую мы хотим ссылаться в случае с дублями.

Тег link с атрибутом каноникал будет являться канонической ссылкой .

Данную проблему мы можем решить другим способом. Со страниц дублей будет идти ReDirect 301 на главную (каноническую страницу). О 301-редиректе я расскажу в следующей статье.

Для главной страницы атрибут canonical необязателен, так как мы указываем в robots.txt директиву Host.

Что делать с пагинацией в интернет-магазине?

Нужен ли Canonical, где имеются карточки товаров? На этот вопрос уже ответил Яндекс:

“Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical" тега на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.
Например, страница сайт.рф/ромашки/1 - каноническая, с неё начинается каталог, а страницы вида сайт.рф/ромашки/2 и сайт.рф/ромашки/3 - неканонические, в поиск их можно не включать. Это не только предотвратит возможное дублирование контента, но и позволит указать роботу, какая именно страница должна находиться в выдаче по запросам. “

То если страницы пагинаций вида:

http://site.ru /category-name/” />
Рекомендую ознакомится со следующим списком статей, который помогут сделать внутреннюю оптимизацию сайта качественно:



Как правило, проблемы с дублями возникают со стороны платформы (чаще всего это известные CMS Joomla, Opencart и прочие). Opencart вообще можно вынести в отдельную категорию, так как не до конца решена проблема, во всяком случае у меня разобраться не получилось и пришлось переносить все на другой движок. (Никому не рекомендую данный движок)


Но так же существуют ошибки со стороны оптимизатора которые я описал ниже.

Основные ошибки написания Canonical

Неверный ответ сервера.

Страница, на которую ставим тег link rel=” canonical” должна быть работоспособной. То есть ответ сервера должен быть 200.

Проверить robots.txt

Возможно, что данная страница закрыта от индексации поисковых роботов.

Дублирование и расположение атрибута.

Важно, чтобы тег встречался всего 1 раз на странице и располагался только в теге .

Отсутствие цепочек ссылок.

Со всех дублирующихся страниц все канонические ссылки указывают на 1 каноническую страницу. Чтобы не получилось, что одна ссылка ссылается на другую вторая на третью и так далее.

Rel Canonical в CMS Wordpress

Прописать тег Canonical в CMS Wordpress вы можете c помощью плагинов:



В SEO Yoast ограниченный функционал, можно указать только в поле необходимый канонический URL.

Плагин All in SEO



В All in SEO имеется возможность так же указывать канонический URL, а так же запрещать пагинацию для канонических URL(то есть ПС не будет индексировать эти страницы).

Заключение

Учитывая проблемы многих платформ, данный атрибут обязательно стоит учитывать, ведь он влияет на индексацию страниц вашего сайта.

Думаю, я рассказал большую часть про атрибут Rel=” Canonical”. Пишите в комментариях, как вы используете канонические ссылки на своих сайтах.

Link rel=canonical — атрибут тега , который используется для обозначения канонических страниц на сайте. Что такое канонические страницы? Каноническая страница — это страница сайта адрес которого является каноническим (предпочитаемым), в группе схожих по сердержимому страниц. Проще говоря канонический URL страницы — это адрес, который будет индексироваться при наличии страниц-дублей.

Пример канонических URL адресов страниц

Характерный пример — страница сайта доступна по нескольким адресам:

Site.ru/page?id=3 site.ru/blog/seo/yandex site.ru/blog/yandex

Допустим, что предпочитаемым (каноническим) URL адресом является — /blog/seo/yandex. Значит в коде страниц:

Site.ru/page?id=3 site.ru/blog/yandex

необходимо отразить адрес канонической страницы:

Site.ru/blog/seo/yandex

Что такое канонические ссылки

Каноническая страница — это оригинальная страница или первоисточник . Каноническая ссылка (с атрибутом rel=canonical тега link) — не является строгой дерективой. Это значит, что указание страницы как канонической может как учитываться так и игнорироваться поисковыми роботами. Поисковые системы негативно относятся к дублированому контенту, будь это кража контента с дргого сайта или дубликаты страниц на одном сайте.

Часто дублирование контента происходит из-за некорректной или плохо настроенной CMS. Организация канонических страниц как существенная часть позволяет избежать индексирования страниц-дублей. Кроме того, что это может снизить нагрузку на сайт, удаление ненужных страниц оптимизирует расход ресурсов, которые тратят поисковые системы на индексацию. Поисковые роботы будут быстрее находить новые страницы и другие изменения на сайте.

Как работают канонические ссылки

Правила, которые определяют корректное восприятие rel=canonical поисковыми системами:

  • каноническая страница должна существовать и быть доступна для индексирования;
  • адрес канонической ссылки не должен быть указан в другого сайта (и поддомене для Яндекса);
  • на одной странице не может быть более одного канонического URL страницы;
  • не должно существовать цепочек канонических ссылок, где на странице являющейся канонической для одной стоит каноническая ссылка на другую страницу (1=>2=>3).

Канонические ссылки (атрибут тега link rel canonical) позволяет указать какую именно страницу из группы похожих или одинаковых страниц нужно индексировать. Полезность данного инструмента сложно переоценить и глупо игнорировать. Ведь именно к правильному толкованию страниц сайта поисковыми системами, в значительной степени и сводится SEO сайта. Тем более, что канонические ссылки поддерживаются практически любой современной CMS вроде Joomla или WordPress.

Пишите в комментариях используете ли вы каннонические ссылки на своем сайте.
Делайте репосты статьи. Подписывайтесь на наш .

Не дублируйте контент и ставьте правильные ссылки!

Причин возникновения дублей контента может быть много: особенности CMS сайта, страницы с динамическими параметрами URL, сайт доступен по https://www.site.com/ и по https://site.com/ , http://site.com/ и так далее. Если не указать поисковику приоритетную — каноническую страницу с дублирующимся контентом, робот выберет ее на свое усмотрение и последствия могут быть неприятными, особенно для владельцев сайтов.

Страницы с UTM-метками

Необходимо настроить сервер так, чтобы при нахождении UTM-параметров в адресе страницы, отдавался код «200 ОК» и страница содержала абсолютную каноническую ссылку на URL этой страницы без UTM-метки.

Речь о следующих UTM-параметрах:

  • gclid;
  • utm_medium;
  • utm_source;
  • utm_campaign;
  • utm_content;
  • utm_term;
  • _openstat.

Так, страница «http://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test » должна содержать каноническую ссылку: .

Страницы фильтрации

На страницах фильтрации следует в качестве канонических указывать сами страницы фильтрации.

Например, для страницы «http://site.com/category-1/filter-1/ » нужна ссылка: .

Иногда при переходе на новое доменное имя используется сервер, который не поддерживает переадресацию на своей стороне. В таком случае можно использовать междоменный атрибут rel="canonical" в элементе link.

Важно: на данный момент междоменный каноникал понимает только Google .

О чем следует помнить при простановке rel="canonical"?

  1. Ссылки в атрибуте следует ставить абсолютные — с http:// или https://. Так сокращается риск появления ошибок.
  2. Если на странице с дублирующимся контентом указываете на другую страницу как каноническую, не забудьте в той страницы также прописать ее как каноническую.
  3. Если на странице указаны несколько канонических адресов, поисковый робот проигнорирует их и определит каноническую страницу самостоятельно.
  4. Если канонической указана страница, отдающая код ответа 404, поисковый робот не сможет использовать данную рекомендацию.
  5. Чтобы избежать ошибок, не стоит использовать цепочки канонических страниц.
  6. Поисковые роботы воспринимают атрибут rel="canonical" не как строгую директиву, а как рекомендацию, то есть указанный URL может быть проигнорирован.
  7. При самостоятельном определении канонических страниц поисковая система Google отдает предпочтение страницам на https.

Выводы

В нашей практике бывали случаи, когда контент с сайта копировали полностью, вместе с внутренней текстовой перелинковкой и каноническими адресами. Поэтому атрибут rel="canonical" стоит указывать на всех страницах.

Особенно важно определять каноничность для:

  • страниц пагинации;
  • страниц с UTM-метками;
  • страниц фильтрации.

Это помогает бороться с дублированием контента и обезопасить сайт от копирования.

Если ваш сайт имеет идентичный или очень похожий контент, доступный по разным URL , тогда новый формат позволит указать тот URL , который должен возвращаться в поисковой системе. Также можно быть уверенным, что все характеристики, такие как ссылочный вес и т.д. передадутся на нужную версию адреса.

Теперь вы можете добавить этот тег, для указания вашей версии адреса, внутри тега на страницах с дублированным контентом:

Таким образом, Google поймет, что все дубликаты ссылаются на канонический адрес, указанный в теге. Дополнительные свойства адреса, такие как PageRank и связанные сигналы также перенесутся с дублированных страниц на указанную.

Подобный тег будет полезным в основном при использовании различных движков (phpBB, IPB , WordPress, и т.д., напр. сайту ipbskins.ru – разработка дизайна сайта на IPB , приходится использовать длинный robots.txt в целях избежания дублированного контента), создающих множество похожих страниц, например, это могут быть страницы:

печатной версии статьи:
http://site.ru/article01.html?print=true
текстовой версии статей для моб. телефонов:
http://site.ru/lofiversion/article01.html
дублированные из-за недостатка движка:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=keyword
и ряд других…

Этот стандарт может быть адаптирован любой поисковой машиной при индексации сайта.

Для популярного блог-движка WordPress уже разработан плагин canonical , вставляющий тег на нужные страницы. Другие популярные движки для блогов, форумов, интернет-магазинов и т.д. также в ближайшем будущем расширят свою функциональность (следите за обновлениями).

Ответы на некоторые популярные вопросы по тегу:

Является ли rel=“canonical” подсказкой или директивой?
Это подсказка, которую мы берем во внимание и во взаимодействии с другими сигналами вычисляем наиболее релевантную страницу для отображения в поисковых результатах.

Могу ли я использовать относительный путь для указания canonical, например так: ?
Да, относительные пути распознаются также, как и в обычном теге . Даже если вы введете тег с ссылкой на документ, тогда относительные пути будут считаться в соответствии с базовым URL .

Это нормально, если канонические адреса содержат не полностью дублированный контент?
Мы позволяем небольшие различия, такие как порядок сортировки в таблице продуктов. Также мы понимаем, что канонические адреса могут парситься роботом в разное время, поэтому все это нормально.

Что если rel=“canonical” возвращает 404 ошибку?
Мы продолжим индексировать ваш контент и использовать эвристический подход, для определения канонического адреса, однако, мы рекомендуем, чтобы вы использовали существующие URL в качестве канонических.

Что если rel=“canonical” ещё не проиндексирован?
Мы стараемся достучаться до канонического URL быстро. Как только мы его проиндексируем, тогда сразу же перерассмотрим подсказку rel=“canonical”.

Может ли канонический урл содержать редирект?
Да, вы можете указать редирект, в этом случае поисковая машина обработает просесс перенаправления как обычно и попытается проиндексировать новый адрес.

Что если я имею противоречивые сигналы для rel=“canonical”?
Наши алгоритмы мягкие: мы можем следовать по каноническим цепям, однако, мы настоятельно рекомендуем, чтобы вы на страницах указывали единственный канонический адрес, чтобы быть уверенным в оптимальном результате канонизации.

Может ли этот тег для ссылки предложить канонический адрес на совершенно другом домене?
Нет. Чтобы мигрировать на другой домен, более подходящ. В настоящее время Google поддерживает канонизацию внутри поддоменов или внутри одного домена. Таким образом, владельцы сайтов могут указать www.example.com вместо example.com или help.example.com , однако, не могут указать example.com вместо example-widgets.com .

Звучит интересно, но могу ли я увидеть пример?
Да, wikia.com помогла нам, как трастовый тестер. Например, вы замтетите, что исходный код по адресу http://starwars.wikia.com/wiki/Nelvana_Limited содержит rel=canonical http://starwars.wikia.com/wiki/Nelvana .

Два адреса почти идентичны, исключая то, что Nelvana_Limited, первый URL , содержит короткое сообщение возле заголовка. Это хороший пример использования тега в будущем. С rel=canonical, свойства двух адресов обьединяются и поисковые результаты отображают нужную версию.

Если у вас есть какие-либо вопросы по использованию нового тега, вы можете их задать в комментариях на официальном блоге Google для вебмастеров .

1. Помимо избавления от естественного дублированного контента (из-за недостатка движка), мы также избавляемся от дублированного контента искусственного, когда конкуренты нам пытаются насолить, добавляя в страницы с произвольными параметрами в URL .

2. Теперь нет надобности использовать robots.txt для запрета индексации таких страниц, как “печатная версия” и других дубликатов (напр. в WordPress нужно было закрывать путь /teg/) и угождать каждому поисковику отдельно (есть общие стандарты для robots.txt, но есть также и ряд особенностей работы каждого поисковика с этим файлом, поэтому мы раньше не могли предусмотреть запрет индексации некоторых страниц сразу для всех ботов).

3. Мы теперь имеем хороший инструмент для ускорения индексации сайта 🙂

Канонические URL – это загадка для многих людей, и потому многие могут неправильно использовать такие URL для задания, к примеру, 301 редиректа. Люди предполагают, что эта возможность имеет отношение к SEO, однако они не знают, когда и как следует использовать их. В WordPress в частности (по сравнению с обычным HTML сайтом) может быть достаточно тяжело вручную задавать канонические URL для каждой страницы сайта без обращения к плагинам вследствие работы шаблонов темы, имеющихся в системе управления контентом.

В этой статье мы поможем разрешить некоторые пользовательские вопросы, которые связаны с каноническими URL. Пользователи, которые не работают с WordPress, также могут найти эту статью полезной для себя, поскольку в ней будут предложены основные принципы канонических адресов, применимые к любой системе управления контентом или к методам разработки.

Обратите внимание, что эта статья может показаться для вас достаточно сложной, если у вас нет технических навыков, связанных с WordPress, базовым HTML или SEO. Мы познакомим вас сначала с основными терминами. Если вдруг что-то в статье вам покажется непонятным, вы всегда можете поискать в поисковой системе ответы на возникшие вопросы.

Что представляет собой канонический URL?

Канонический URL (часто описываемый как rel=canonical, канонический тег и т.д.) – это то, что используется поисковыми системами при отсылке к материалу на вашем сайте, когда страница с материалом имеет несколько версий на вашем сайте или даже в сети. Сегодня канонические URL используются для решения некоторых сложных проблем с дублированием контента, и иногда эта возможность применяется для задания 301 редиректа.

Google предлагает прекрасное объяснение целей канонических URL . Я настоятельно рекомендую изучить его. Они сделали его максимально ясным.

Возможно, вы считаете, что ваш сайт не имеет дублированного контента. Прекрасно, если вы позаботились о том, чтобы ваш контент не повторялся на разных страницах. В противном случае это может вылиться в снижение ваших показателей в поисковой выдаче.

Если вы решили продублировать текст на вашем сайте, подумайте об этом серьезно: если бы вы были поисковой системой, которая старается дать ответ на пользовательский запрос, вы бы предложили пользователю две идентичных страницы в поисковой выдаче? Нет! Это бесполезно для людей. Вместо этого вы бы предложили столько разнообразных результатов в выдаче (SERP), сколько сможете найти, что, соответственно, полностью отвечало бы поисковым потребностям людей.

Таким образом, если вы дублируете контент на своем сайте, вы можете – и должны – ожидать, что Google не будет ранжировать все ваши страницы. Однако это не слишком хорошо, если вы думаете только о показателях поисковых систем и присутствию в SERP.

Дубли URL-адресов, о которых вы, возможно, не знали

Отлично, давайте вернемся назад и предположим, что мы убедились в уникальности наших страниц сайта. Однако у вас по-прежнему могут остаться некоторые «скрытые» дублируемые URL, о которых вы просто не знаете (в реальности они, конечно же, не скрыты). Это может удивить вас, но вы должны знать – поисковые системы видят следующие URL как совершенно обособленные, отдельные, даже если они выводят на экран один и тот же контент:

  • http://www.examplesite.com (обратили внимание на www?)
  • http://examplesite.com
  • https://examplesite.com (обратили внимание на https?)
  • http://www.examplesite.com/ (обратили внимание на слэш в конце?)
  • http://examplesite.com/index.php

Именно по этой причине нам и нужны канонические URL в теге HEAD кода HTML всех ваших страниц. Вы должны сообщить поисковым системам, какую из версий всех вышеупомянутых URL (и других версий) они должны просмотреть.

Да, вы должны принять окончательное решение о том, собираетесь ли вы использовать www или нет во всех ваших ссылках в процессе веб-маркетинга. Вы должны придерживаться одной ссылочной стратегии по всему сайту, и даже за его пределами. Все те, кто пользуется вашими URL, должны знать это: сотрудники, партнеры, каталоги, в которых вы перечислены, люди, которые ссылаются на вас – все.

Вы также должны определиться с тем, будете ли вы использовать слэш в конце URL, а также будете ли вы использовать https (если вы принимаете на сайте важную информацию, такую как, к примеру, данные кредитных карт). Выберите один вариант и придерживайтесь его. На вашем месте я бы выбрал тот, который используется чаще всего, чтобы избежать головной боли при исправлении своих URL.

К счастью, если вы пользуетесь WordPress, то большую часть этих проблем удастся решить. Мы рассмотрим разные плагины и другие вещи, которые помогут вам справиться с этим.

Однако есть и другие места, в которых канонические URL оказываются очень полезными.

Дублируемый контент, создаваемый таксономиями

Допустим, вы пишете статью, и вы включаете ту статью в многочисленные рубрики блога с разными метками в WordPress (все это называется таксономиями). Люди всегда делают это. Или, допустим, вы занимаетесь электронной коммерцией, и ваши продукты появляются в многочисленных рубриках. У нас появляется проблема: контент может быть представлен несколько раз по разным URL, что упрощает пользователям навигацию по сайту. К примеру:

  • http://examplesite.com/store/candy/chocolate-truffles
  • http://examplesite.com/store/foods/chocolate-truffles

Вы хотите, чтобы ваши пользователи могли найти шоколадные трюфели в двух рубриках: «candy» и «food». Это прекрасно. Но какой из двух URL должен быть проиндексирован поисковыми системами? Помните, что они не станут ранжировать оба URL. Таким образом, вы должны выбрать это самостоятельно. И именно в этом случае на первый план выходят канонические URL. Такие URL расскажут поисковым системам: «эй, этот контент точно такой же, что и на другой странице; пожалуйста, проиндексируй его».

Помните, что ни одна поисковая система не обязана повиноваться данной канонизации, и они могут проигнорировать ее, если посчитают ее неправильной.

Использование перекрестных канонических URL при дублировании контента с других сайтов

Есть самая важная причина, почему вам требуется канонический URL. Про нее мы поговорим ниже (есть и другие, но они более сложные, при этом принцип – тот же самый). Бывает так, что вы публикуете на своем сайте контент, который также появляется на других сайтах. Самый простой пример такой ситуации – синдикация (к примеру, пресс-релизы).

Допустим, ваша компания публикует пресс-релиз и передает его на ваш сайт. Это вполне нормальное явление. Однако пресс-релизы работают следующим образом: они могут бесплатно использоваться любым издателем контента. Они специально создаются для того, чтобы их копировали и распространяли. Есть даже целые сети синдикации, как, к примеру, PRWeb. Это достаточно старая форма маркетинга.

Однако она порождает проблемы с SEO. Для робота поисковой системы контент пресс-релиза на вашем сайте является точно таким же, как контент пресс-релиза на других новостных сайтах. Как понять, где оригинал? Какой URL выводить в SERP (поисковой выдаче)? Помните – вы должны его выбрать.

Обычно поисковые системы выбирают его самостоятельно, если вы ничего им не предложите. И делается такое предложение при помощи канонического URL. В случае с пресс-релизами, однако, маловероятно, что каждый небольшой новостной журнал будет задавать канонический URL, указывающий на ваш сайт. Помните, что многие про это просто не знают. Я сомневаюсь, что они будут торопиться с указанием оригинального источника контента и с соответствующим кодированием HTML. Они ведь публикуют по несколько разных статей в день.

Таким образом, вы должны позаботиться об этом на своем сайте. На вашем месте я бы использовал канонический URL на странице, содержащей ваш пресс-релиз, и ссылался бы на его копию в основной сети синдикации, в которой вы опубликовали статью для последующей дистрибуции. К примеру, вы можете сослаться на копию статьи на сайте PRweb.com (если вы используете этот сервис).

Если вы хотите увидеть живой пример ситуации, не касающейся пресс-релизов, и при этом затрагивающей канонические URL, давайте посмотрим на следующую статью, которую я написал для KISSmetrics год назад:

Вскоре после этого сайт Entrepreneur.com взял эту статью, потому что у них было соглашение с KISSmetrics (помните, у них было разрешение!)

Теперь у нас есть тот же самый контент, доступный по двум URL адресам. В техническом плане это – дублируемый контент, а это плохо! Однако не стоит бояться. Если вы посмотрите исходный код статьи на Entreprenuer.com, то вы найдете там следующее:

Это говорит поисковым системам о том, где был представлен оригинальный контент, что является верным решением. Это также снимает подозрения о краже контента в глазах поисковых роботов (которые не могут знать о ваших законных правах на публикацию работы).

Однако не стоит создавать целый сайт, состоящий из статей других людей. В этом случае канонический URL вряд ли поможет вам с ранжированием. Поэтому не злоупотребляйте данной тактикой.

В каких случаях вы не можете использовать канонические URL для внешнего дублируемого контента

Я хочу рассказать об этом, поскольку я часто сталкиваюсь с такими ситуациями. Если вы хотите вывести описание компании или персональную биографию на вашем сайте, я не рекомендую использовать те же самые слова и фразы, которые вы используете в ваших социальных профилях или в других местах сети.

Если вы задаете то же самое описание, которое указано у вас в LinkedIn или на вашей бизнес-странице Google Plus, то вы, по сути, дублируете контент. Не стоит использовать канонический URL на странице About, и подцеплять к ней ваш профиль из социальной сети. Ваша страница About должна ранжироваться самостоятельно. В таком случае, пожалуйста, используйте уникальное описание для внешнего использования. Я делаю так для всех своих клиентов.

Как использовать канонические URL в WordPress

Есть несколько способов сделать это, но я собираюсь показать вам самый лучший, которым пользуюсь я сам: просто воспользуйтесь плагином WordPress SEO от Joost De Valk.

Как только вы установите этот плагин на своем сайте, он позволит вам позаботиться о многочисленных SEO показателях, в том числе и о канонических URL. Однако плагин предлагает и другие настройки, на которые нужно обратить внимание.

На скриншоте ниже вы можете видеть, что на экране редактирования отдельной записи или страницы (плагин работает и для произвольных типов записей) панель WordPress SEO предлагает массу настроек и полей. Чтобы задать канонические URL, которые вы можете использовать для разных вещей – пресс-релизов или внешних дублей контента, – перейдите на вкладку Advanced:

Щелкните по выпадающему списку, чтобы выбрать тип URL для канонического адреса в теге head всех ваших страниц:

Когда не нужно использовать канонический URL

Во-первых, прочтите следующую в блоге Google Webmaster Central о распространенных ошибках с rel=canonical URL. Убедитесь в том, что вы – или ваш разработчик – не допустили их. Во-вторых, не используйте канонические URL в следующих ситуациях:

Когда вы хотите сделать 301 редирект

Если вы хотите перенаправить одну страницу к другой, чтобы пользователи, которые ввели старый URL или нажали на мертвую ссылку, были перенаправлены к новому URL, вам нужно использовать 301 редирект. Не используйте для этого канонические URL. Однако в SEO они часто применяются таким вот образом.

Редирект означает, что есть только одно место, где представлен контент, и вы вынуждаете пользователей перейти к этой странице. Это подходит, к примеру, в том случае, если вы перенесли свой сайт на новый домен или настроили новую структуру URL вследствие реконструкции сайта. Вы можете также использовать 301 редирект для отправки людей к версии вашего сайта с www или без www (это позволяет убедиться в том, что никто не перейдет на ваш сайт по неправильному адресу).

Благодаря каноническим адресам, вы можете иметь тот же самый контент на разных страницах в сети, и иметь один «оригинальный» источник контента. Иными словами, разные страницы, содержащие один и тот же контент, могут существовать и просматриваться пользователями.

Однако еще в 2011 году Рэнд Фишкин провел один интересный эксперимент, в котором он использовал канонический URL в хэдере всех страниц старого домена, чтобы таким образом улучшить ранжирование другого нового домена. И это сработало. Он поведал об этой истории в своей записи . Запись также объясняет, почему канонические URL так важны для кросс-доменной синдикации контента в мире SEO. Я не думаю, что сегодня это сработает, но можете попробовать в качестве эксперимента.

Когда вы хотите, чтобы поисковые системы проигнорировали вашу страницу

Помните, что rel=canonical – это не решение проблем с дублями контента. Поисковая оптимизация гораздо сложнее, и иногда более подходящее решение заключается в том, чтобы использовать файл robots для закрытия страниц от индексации. Именно поэтому плагин WordPress SEO включает в себя соответствующие опции.

Я рекомендую своим клиентам закрывать от индексации некоторые страницы, которые не являются полезными для посетителей. К примеру, зачем вам в выдаче страница Terms and Conditions, страницы входа в систему? Их там быть не должно. Лучше освободить дорогу более ценному контенту. К нему относятся продающие страницы, описания товаров и информативные записи блога.

Я также советую использовать правило no-index для страниц с очень малым количеством контента (поскольку ваш сайт в таком случае выглядит слишком несодержательным) и для архивов, которые дублируют контент. В WordPress это применимо к архивам авторов, архивам по дате, и, в моем случае, к архивам меток (поскольку они содержат тот же контент, что и архивы рубрик). Вы можете также закрыть от индексации произвольные типы записей и их архивы, если они только передают контент с других страниц вашего сайта.

Примечание: если вы что-то закрываете от индексации, то вам нужно будет удалить этот контент также из карты сайта, иначе это приведет к ошибкам в Google Webmaster Tools.

Поправляем URL-адрес для соответствия его с каноническим указателем

Помните, мы говорили выше о том, что нужно выбрать одну версию URL, которая будет использовать во всех ссылках с данного момента? Отлично, как только вы сделаете это, вам нужно будет «почистить» или исправить URL-адреса на вашем сайте и в других местах, чтобы они ссылались на выбранную вами версию. Допустим, что вы приняли решение использовать версию без www на вашем сайте. Теперь вам нужно убедиться в том, что все внешние и внутренние ссылки используют выбранную вами версию. Если нет, то надо постараться изменить URL-адреса. Да, это может показаться достаточно сложным действием, но это стоит того.

Чтобы быстро заменить все URL на своем сайте, вы можете использовать такой инструмент, как Search Replace DB . Однако используйте его только в том случае, если вы понимаете, что вы делаете.

Есть также плагины, которые позволяют провести поиск и замену через консоль WordPress. После проведенной замены удалите все, что соединено с вашей базой данных, чтобы избежать лишних рисков, связанных с безопасностью.

Чтобы справиться с мертвыми ссылками в записях и страницах, воспользуйтесь плагином, таким как, к примеру, Redirection , который выполнит эту задачу за вас.

Когда вы все это сделаете, убедитесь в том, что вы вошли в свой аккаунт Google Webmaster Tools и установили предпочтительный URL для вашего сайта. Кроме того, отправьте обе версии – с www и без www – вашего сайта в Google Webmaster Tools, чтобы задать предпочтения.

Заключение: используйте канонические URL для преимуществ в плане SEO

Надеемся, мы справились с хаосом, который имелся вокруг канонических ссылок и влияния их на SEO. Если вы по-прежнему не разобрались во всех аспектах, я рекомендую перейти по ссылкам, приведенным в данной статье. Однако самое лучшее достижение – теперь вы знаете, как использовать канонические адреса, знаете, что у них есть потенциал, который позволит добиться великолепных SEO результатов.

Дублированный контент – проблема, с которой могут справиться далеко не все владельцы бизнес-сайтов. Порой у них просто нет времени, чтобы решать эту проблему. К счастью, поисковые системы понимают, что порой тот же самый контент может быть доступен по разным URL-адресам, причем вполне законно. Поисковые системы предложили нам инструмент, который мы можем использовать – так давайте же воспользуемся им в своих интересах!