Страницы Canonical на поддомене отображаются в результатах поиска Google


8

Возможно, вы слышали, что мы запустили переполнение стека Facebook вчера.

В рамках этого мы изменили наш код, добавив <meta rel="canonical" ...теги к каждому вопросу и пользователю в домене facebook.stackoverflow.com, указывающие на «ванильное» переполнение стека.

Например:

Ошибка iAd «Рекламный инвентарь недоступен» на facebook.stackoverflow.com
и
ошибка iAd «Рекламный инвентарь недоступен» на stackoverflow.com

На facebook.stackoverflow HTML содержит метатег

<link rel="canonical" href="/programming/3720459/iad-error-ad-inventory-unavailable">

Намерение заключается в том, чтобы сообщить Google: «Это одна и та же страница, присвоить все ранги страниц копии Stack Overflow и отдать предпочтение в результатах поиска».

Это похоже на точку отсчета rel = "canonical" .

Каноническая страница является предпочтительной версией набора страниц с очень похожим содержанием.

Обычно на сайте несколько страниц со списком одного и того же набора продуктов. Например, на одной странице могут отображаться товары, отсортированные в алфавитном порядке, в то время как на других страницах отображаются товары, перечисленные по цене или по рейтингу. Например:

Если Google знает, что эти страницы имеют одинаковое содержание, мы можем индексировать только одну версию наших результатов поиска. Наши алгоритмы выбирают страницу, которая, по нашему мнению, лучше всего отвечает запросу пользователя. Однако теперь пользователи могут указывать каноническую страницу для поисковых систем, добавляя элемент с атрибутом rel = "canonical" в раздел неканонической версии страницы. Добавление этой ссылки и атрибута позволяет владельцам сайтов идентифицировать наборы идентичного контента и предлагать Google: «Из всех этих страниц с идентичным контентом эта страница является наиболее полезной. Пожалуйста, расставьте приоритеты в результатах поиска».

Тем не менее, мы видим результаты переполнения стека Facebook, а иногда они даже превосходят ванильное переполнение стека ( пример ). Может быть, это как-то связано с независимым sitemap.xml для facebook.stackoverflow.com (что-то вроде удара в темноте)?

пример результата поиска Google

Итак, что мы здесь делаем не так?

Мы надеемся, что поиск формы будет site:facebook.stackoverflow.comработать, но отказ от них вполне приемлем, если требуется общее количество rel="noindex".

Ответы:


4

Согласно той же странице, на которую вы ссылаетесь, rel="canonical" это только предложение, а не директива:

Является ли rel = "canonical" предложением или директивой?

Эта новая опция позволяет владельцам сайтов предлагать версию страницы, которую Google должен рассматривать как каноническую. Google будет учитывать это вместе с другими сигналами при определении того, какие наборы URL-адресов содержат идентичное содержимое, и при расчете наиболее релевантных из этих страниц для отображения в результатах поиска.

Вполне возможно, что Google просто решил игнорировать канонический URL или еще не принял меры.

Но причина, по которой он опережает вопрос StackOverflow, по-видимому, проста: (при условии, что Google игнорирует rel="canonical"директиву) субдомен Facebook имеет «facebook» в URL-адресе, что имеет немало веса в алгоритме ранжирования Google.


Мы надеялись canonicalкомпенсировать это ... Я думаю, нет. Связанная проблема результатов FB.SO, отображаемых на странице, даже без поискового запроса в Facebook ( пример ), звучит так, будто Google просто игнорирует это предложение.
Кевин Монтроз

1
Похоже, Google работал с SO над проблемой дублированного контента, когда другие сайты опережали SO по оригинальному контенту SO. Интересно, будут ли они изучать это и для ТАК?
Джон Конде

3

Я вижу, что эта проблема сейчас решается. Вы можете проверить это, выполнив запрос info: Google, подобный этому, который выведет новый URL.

Результат Google для facebook.stackoverflow.com/q/3720459

Особенность канонического тега в том, что это директива, которая означает, что он не работает 100% времени. Перенаправления 301 одинаковы - они не всегда пропускают 100% веса через редирект.

Кроме того, с любым из них у Google уходит несколько недель, чтобы понять, что они там, чтобы остаться, и за ними следует следовать. Это проблема с новыми страницами, потому что они запускаются и будут на неправильном URL в течение нескольких дней / недель, прежде чем Google будет следовать каноническому.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.