У нас проблемы с тем, чтобы Google проиндексировал файлы PDF на нашем сайте. Существует около 50 PDF и размером от 20 КБ до двух мегабайт. Они не защищены, их можно читать анонимно, а внутри PDF Reader вы можете искать документ.
Они перечислены в SiteMap.xml. Я даже могу посмотреть журналы IIS и увидеть, как робот Google читает файлы PDF, но, кроме пяти, они никогда не включаются в результаты поиска.
Если я сделаю filetye: pdf, появятся только пять PDF-файлов. Если я ищу текст, который, как я знаю, находится внутри PDF-файла, PDF-файлы никогда не отображаются (кроме пяти проиндексированных).
Кто-нибудь знает, почему более 45 документов PDF не включены в индекс, даже если они есть в карте сайта и робот Googlebot их читает?