Файл Sitemap помогает поисковым системам находить новые и обновленные URL - адреса на своем сайте. В частности, если ваш веб-сайт довольно большой, это может помочь им сосредоточиться на новом и обновленном контенте, вместо того, чтобы вслепую просматривать все, чтобы увидеть, изменилось ли что-нибудь. Это может привести к тому, что новый контент будет обнаружен гораздо быстрее, что может быть весьма заметно, особенно если сайт больше или сложнее.
В частности, с Google (я работаю в Google; я не знаю, как другие поисковые системы справляются с этим), он также делает следующее:
- Найдите количество проиндексированных URL-адресов для вашего веб-сайта: эта статистика пересчитывается ежедневно и очень точна. Вы можете найти их на странице сведений о файлах Sitemap .
- Обнаружение проблем канонизации. Если числа там не совпадают , это часто свидетельствует о том, что вы указываете URL-адреса в файле Sitemap, которые не совпадают с тем, что мы обнаруживаем во время сканирования. Обычно это признак того, что вам нужно работать над канонизацией .
- Помощь в канонизации. Когда мы найдем на вашем сайте несколько URL-адресов с одинаковым содержанием, мы дадим дополнительный URL-адрес, указанный в файле Sitemap, даже если вы не используете другие методы канонизации.
- Найти плохо проиндексированные части вашего сайта: эти показатели предоставляются для каждого файла Sitemap, поэтому вы можете создавать отдельные файлы Sitemap для логических разделов вашего сайта, чтобы обнаружить области, в которых Google не индексирует столько, сколько вам хотелось бы.
- Приоритизация ошибок сканирования: в разделе ошибок сканирования URL-адреса, указанные в файлах Sitemaps, перечислены отдельно. Поскольку вы специально указали эти URL-адреса, мы предполагаем, что вы хотите, чтобы они были проиндексированы и что любые ошибки при сканировании имеют важное значение.
Кроме того, вы можете использовать несколько расширений в файлах Sitemaps (например, для изображений, видео, новостей или интернационализации), если вы решите это сделать. Эти расширения являются необязательными.
Для большинства веб-сайтов наиболее заметным элементом файлов Sitemaps является то, что вы можете увидеть индексированное количество URL. Это может занять один день или около того, поэтому, если вы только что отправили файл Sitemap в первый раз, вам, возможно, придется проявить немного терпения. В то время как другие способы (например, site: -query) очень и очень приблизительны, этот подсчет чрезвычайно точен.
Отредактировано, чтобы добавить: еще одна вещь, которую я лично нахожу чрезвычайно полезной в отношении файлов Sitemap, заключается в том, что если вы не генерируете их напрямую с помощью CMS, вы неизменно узнаете много о том, как можно сканировать ваш веб-сайт и какие URL-адреса обнаруживаются. во время этого процесса. Я видел много случаев, когда при сканировании веб-сайта с помощью инструмента (например, генератора Sitemaps) возникают проблемы, которые вы могли бы пропустить в противном случае, будь то идентификаторы сеансов в URL-адресах, дублирование контента через различия URL-адресов, бесконечные пробелы (например, как бесконечные календари), или даже части сайта, которые вообще не связаны.