Мы видим некоторые страницы, которые существуют в нашей, sitemap.xml
но необъяснимо отсутствуют в общедоступном поисковом индексе Google.
Вы не можете скачать /superuser//sitemap.xml - мы защищаем этот файл, потому что в прошлом были проблемы с ним - но googlebot может. С помощью Инструментов Google для веб-мастеров мы убедились, что сегодня sitemap.xml
файл был удален и имеет рейтинг «ОК», ошибок нет (зеленая галочка).
sitemap.xml
Содержит список последних 50000 вопросов на нашем сайте , которые были заданы. Например, этот вопрос ...
/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links
... существует в sitemap.xml
виде ...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
Поиск по «Как увидеть конец длинной цепочки символических ссылок» дает только один результат для questionhub.com, который очищает наши данные (совсем другая проблема).
Вы можете увеличить число подсчета вопросов и выполнить точный поиск заголовка вопроса, и вы увидите, что этот шаблон сохраняется.
Эти URL-адреса находятся в файле sitemap.xml, но они не отображаются в индексе Google - и тем не менее они отображаются на сайтах, которые очищают данные о наших объявлениях. С чего бы это?