Есть ли какие-то явные признаки того, что мой файл карты сайта полезен?


73

Я недавно создал файл sitemap.xml и загрузил его в свою учетную запись Инструментов Google для веб-мастеров . Google не сообщал ни о каких проблемах или ошибках с загруженной картой сайта моего сайта.

Теперь мой вопрос:

  • Как узнать, работает ли моя карта сайта в Инструментах Google для веб-мастеров?

Причина, по которой я спрашиваю, состоит в том, что я не знаю, что я должен видеть или искать, и мне кажется, что я загрузил бесполезный файл.

Ответы:


93

Файл Sitemap помогает поисковым системам находить новые и обновленные URL - адреса на своем сайте. В частности, если ваш веб-сайт довольно большой, это может помочь им сосредоточиться на новом и обновленном контенте, вместо того, чтобы вслепую просматривать все, чтобы увидеть, изменилось ли что-нибудь. Это может привести к тому, что новый контент будет обнаружен гораздо быстрее, что может быть весьма заметно, особенно если сайт больше или сложнее.

В частности, с Google (я работаю в Google; я не знаю, как другие поисковые системы справляются с этим), он также делает следующее:

  • Найдите количество проиндексированных URL-адресов для вашего веб-сайта: эта статистика пересчитывается ежедневно и очень точна. Вы можете найти их на странице сведений о файлах Sitemap .
  • Обнаружение проблем канонизации. Если числа там не совпадают , это часто свидетельствует о том, что вы указываете URL-адреса в файле Sitemap, которые не совпадают с тем, что мы обнаруживаем во время сканирования. Обычно это признак того, что вам нужно работать над канонизацией .
  • Помощь в канонизации. Когда мы найдем на вашем сайте несколько URL-адресов с одинаковым содержанием, мы дадим дополнительный URL-адрес, указанный в файле Sitemap, даже если вы не используете другие методы канонизации.
  • Найти плохо проиндексированные части вашего сайта: эти показатели предоставляются для каждого файла Sitemap, поэтому вы можете создавать отдельные файлы Sitemap для логических разделов вашего сайта, чтобы обнаружить области, в которых Google не индексирует столько, сколько вам хотелось бы.
  • Приоритизация ошибок сканирования: в разделе ошибок сканирования URL-адреса, указанные в файлах Sitemaps, перечислены отдельно. Поскольку вы специально указали эти URL-адреса, мы предполагаем, что вы хотите, чтобы они были проиндексированы и что любые ошибки при сканировании имеют важное значение.

Кроме того, вы можете использовать несколько расширений в файлах Sitemaps (например, для изображений, видео, новостей или интернационализации), если вы решите это сделать. Эти расширения являются необязательными.

Для большинства веб-сайтов наиболее заметным элементом файлов Sitemaps является то, что вы можете увидеть индексированное количество URL. Это может занять один день или около того, поэтому, если вы только что отправили файл Sitemap в первый раз, вам, возможно, придется проявить немного терпения. В то время как другие способы (например, site: -query) очень и очень приблизительны, этот подсчет чрезвычайно точен.

Отредактировано, чтобы добавить: еще одна вещь, которую я лично нахожу чрезвычайно полезной в отношении файлов Sitemap, заключается в том, что если вы не генерируете их напрямую с помощью CMS, вы неизменно узнаете много о том, как можно сканировать ваш веб-сайт и какие URL-адреса обнаруживаются. во время этого процесса. Я видел много случаев, когда при сканировании веб-сайта с помощью инструмента (например, генератора Sitemaps) возникают проблемы, которые вы могли бы пропустить в противном случае, будь то идентификаторы сеансов в URL-адресах, дублирование контента через различия URL-адресов, бесконечные пробелы (например, как бесконечные календари), или даже части сайта, которые вообще не связаны.


Отличная информация Я также слышал, что на некоторых сайтах с большим трафиком и интенсивным трафиком лучше не использовать карту сайта, потому что Google лучше выполняет сканирование, и если в вашей карте сайта чего-то не хватает, она может перестать индексироваться.
Chris_O

3
@Chris_O Вы смешиваете разные проблемы. В этом примере дело не в том, что Google выполняет «лучшую» работу самостоятельно; Сама карта сайта неисправна. Это не прямая аргументация «вообще не использовать карту сайта». Решение этой ситуации заключается в исправлении карты сайта. Кроме того, карты сайта являются информативными, а не директивами. Чего-то не хватает в карте сайта, это не значит, что Google не найдет ее самостоятельно или не будет ее игнорировать.
Su '30

На рассматриваемом сайте более 40 тыс. Проиндексированных страниц, а новый контент индексируется менее чем за 5 минут (без карты сайта). Основываясь на вашем ответе, мы начнем строить их и разбивать на годы.
Chris_O

@ Джон-Мюллер, привет, мистер. м. - однажды я отправил тестовую карту сайта с 1000 URL, мы вернули индекс около 700, теперь мы проверили все 1000 URL через сайт: www.complete.org/url/to/the/page.html, мы вернулись отсчет намного ниже 700 URL (больше в 200 регионе). что это значит?
Франц

2
@Franz Иногда возникают детали, которые затрудняют воспроизведение количества проиндексированных URL с помощью site: -queries. Например, существуют ситуации, когда мы можем объединить несколько URL-адресов и показать только один из них для сайта: -query. Поэтому, если вы видите разницу, о ней обычно не стоит беспокоиться.
Джон Мюллер

6

Если вы не получили никаких ошибок, вы можете предположить, что Google проанализировал его и знает о содержимом. Но это не значит, что они будут сканировать и / или индексировать эти страницы. Файлы Sitemap - это еще один способ рассказать поисковым системам о ваших страницах. Они не обязаны сканировать и индексировать любую или все эти страницы. То же самое относится и к поиску страниц по ссылкам или URL-адресам.


1
Как добавляется информация, довольно легко увидеть, понимает ли Google карту сайта. Проверьте под Оптимизациями -> Sitemaps. Он скажет вам, сколько URL было отправлено в карте сайта. Карта сайта успешно прочитала содержание и нашла в нем столько ссылок. Второе число - это то, сколько было проиндексировано и, как указывает Джон, полностью зависит от Google в отношении того, считают ли они ничего, некоторые или большую часть вашего контента стоящими. Это всегда будет меньше отправленной суммы, Google просто находит некоторые страницы не слишком горячими и не беспокоится о них.
Fiasco Labs

1

Google обычно хорошо сканирует ваш сайт, если у вас достаточно качественных ссылок. Если вы тратите много времени на просмотр количества проиндексированных страниц, я бы посоветовал улучшить ваш сайт и получить несколько качественных ссылок.


0

Может быть , это инструмент проверки карты сайта , как это , хотя я никогда «не» видел начало карта сайта пнуть в.


Файл уже был проверен. Это не вопрос.
Su '27

0

Для более крупного сайта, например веб-сайта с сотнями, тысячами или миллионами страниц, это весьма полезно. У нас на сайте компании было 400 000 страниц, где URL-адреса создавались динамически по идентификатору контента, а параметры URL использовались вместе с &, Инструменты Google для веб-мастеров будут предоставлять вам отзывы о просканированных страницах и показывать ошибки, вы можете отлаживать или открывать страницу и убедитесь сами, что не так. Таким образом, Google фактически помог нам сделать лучший сайт и несколько раз избавил нас от огромного смущения.

Также полезно видеть количество проиндексированных страниц и количество просканированных.

Для небольших веб-сайтов, если веб-сайт представляет собой небольшую группу HTML-страниц, где каждая страница связана через меню, а сайт обновляется не часто, при загрузке карты сайта ничего не изменится в результатах поиска. Вы не будете иметь никакого преимущества в том, чтобы загружать карту сайта кому-то, кто не загружал карту сайта.

У меня также было около 20 небольших веб-сайтов, где у меня были автоматически генерируемые карты сайта с помощью скрипта cron, и я перестал это делать. Однажды я узнал, что файлы XML не генерируются правильно в течение 6 месяцев по моей ошибке, но, к счастью, Google проигнорировал мою ошибку и полностью проиндексировал эти сайты, даже когда в файлах Sitemap были ошибки, Google использует карту сайта просто как подсказку, куда идти, а не очень серьезно.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.