Должен ли я блокировать страницы архива Wordpress от поисковых систем?


9

Я использую WordPress и /sample-post/URL-адреса для своих сообщений и /yyyy/mm/для архивов.

Google полностью проиндексировал сайт.

Поскольку в архивах в настоящее время отображаются полные записи, я подумал, что не должен позволять Google индексировать страницы архива, поскольку они содержат полные записи, и это будет дублированный контент. Таким образом, мой robots.txt содержит:

Disallow: /2009/
Disallow: /2010/
Disallow: /2011/
Disallow: /2012/
Disallow: /2013/
Disallow: /2014/
Disallow: /2015/

Как вы думаете, это хорошая практика или это повредит моим рейтингам и / или достижимости?


Хороший пост, просто чтобы прояснить, вы имеете в виду блокировать все, кроме категорий? То, что привлекло мое внимание к этой проблеме, было поиск картинок в Google, и он показал 4 одинаковых изображения из тега / архива, страницы, поста и дома! Это дома как часть слайдера (избранные сообщения). Так в чем же преимущество категории только над страницами и постами? Или ты имеешь ввиду микс или все 3? Я также использую Yoast, но очень плохо знаком с этим.

Ответы:


4

Действительно, вам нужно избегать дублирования контента на вашем сайте Wordpress. Wordpress часто генерирует дублированный контент между категориями, архивами и тегами.

Чтобы решить эту проблему, вы можете заблокировать URL-адреса архивов в файле robots.txt, но лучше всего размещать их <meta name="robots" content="noindex, follow">на страницах архивов, чтобы избежать индексации этих URL-адресов Google.

Для этого вы можете скачать плагин Wordpress SEO от Yoast . Когда плагин установлен, у вас есть возможность разместить эту мету где угодно (на страницах архивов, на страницах тегов, на страницах категорий ...). Вы можете перейти в меню плагина: SEO => Заголовки и метас .

На мой взгляд, лучшая практика для SEO - разместить эту мету на страницах архивов и тегов и позволить Google сканировать страницы категорий. Я всегда избегал дублирования контента на сайте Wordpress, как этот.


Однако я заметил, что несмотря на это noindex, nofollow, Google иногда все еще индексирует эти страницы, поэтому я решил поместить эти страницы в robots.txt. Я написал сообщение в блоге о: vladopandzic.com/search-engine-optimization-seo/…
Владо Панджич,
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.