Что такое минимальный действительный файл robots.txt?


14

Мне не нравится, что я вижу много 404 ошибок в access.log моего веб-сервера. Я получаю эти ошибки, потому что сканеры пытаются открыть файл robots.txt , но не могут его найти. Поэтому я хочу разместить простой файл robots.txt , который предотвратит появление 404 ошибок в моем файле журнала.

Какой минимальный допустимый файл robots.txt позволяет сканировать все на сайте?

Ответы:


17

Как указано здесь , создайте текстовый файл с именем robots.txt в каталоге верхнего уровня вашего веб-сервера. Вы можете оставить его пустым или добавить:

User-agent: *
Disallow:

Если вы хотите, чтобы роботы все сканировали . Если нет, то смотрите ссылку выше для большего количества примеров.


Зачем добавлять «Disallow:», а не просто «Allow: *»?
Athoxx

2
@Patrik «Разрешить» предназначен для переопределения любых предыдущих директив «Запретить». Это бессмысленно, если нет «Запретить». Честно говоря, лучшим решением является пустой файл.
Рассерженная шлюха

2
Ах я вижу. Я также согласен, что пустой файл является лучшим.
Athoxx

2
@PatrikAlienus Потому что «Разрешить» не указано в спецификации robots.txt.
user11153

1
@ user11153: А? А как насчет раздела "3.2.2 Разрешить и запрещать линии" в интернет-проекте спецификации 1997 года "Метод управления веб-роботами" ?
Дэвид Кэри

2

Лучший минимум robots.txt- это совершенно пустой файл.

Любые другие «нулевые» директивы, такие как пустые Disallowили Allow: *не только бесполезные, потому что они не используются, но и добавляют ненужную сложность.

Если вы не хотите, чтобы файл был полностью пустым - или вы хотите сделать его более понятным для человека - просто добавьте комментарий, начинающийся с #символа, например # blank file allows all. Сканеры игнорируют строки, начинающиеся с #.


0

Я бы сказал это;

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Это позволит Google сканировать все, но не позволит Google сканировать вашу панель aadminn. Что является идеальной ситуацией для вас.


2
Я могу что-то упустить, но я не думаю, что спрашивающий сказал, что они используют Wordpress.
Максимилиан Ломейстер
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.