Ответы:
Ни один бот, который собирает электронные письма или проверяет ваш сайт на наличие уязвимостей, не будет уважать ваш robots.txt. На самом деле эти вредоносные боты смотрят robots.txt, чтобы лучше отобразить ваш сайт. Если у вас есть точка, Disallow:
это будет использовано для лучшей атаки на ваш сайт. Хакер, который просматривает ваш сайт вручную, должен потратить дополнительное время на изучение любых файлов / каталогов, которые вы пытаетесь запретить.
robots.txt не повысит безопасность вашего сайта и не предотвратит сбор адресов электронной почты. robots.txt - это руководство для поисковых систем, позволяющее пропустить разделы вашего сайта. Они не будут проиндексированы и должны использоваться для любых разделов, которые вы не хотите показывать в общедоступных поисковых системах.
Однако это никоим образом не помешает другим ботам загружать весь ваш сайт для повышения безопасности или предотвращения сбора электронной почты. Для повышения безопасности необходимо добавить аутентификацию и разрешить только аутентифицированным пользователям за пределами защищенных разделов. Чтобы предотвратить сбор адресов электронной почты, не размещайте электронные письма в виде простого текста (или легко дешифруемого текста) на веб-сайте.
Файл robots.txt служит только для запроса, чтобы боты и пауки оставляли определенные фрагменты контента в одиночку; это не может на самом деле предотвратить их доступ. «Хорошие» боты будут уважать его, но «плохие» (вероятно, те, которые вы хотите заблокировать) проигнорируют его и продолжат в любом случае.
Вместо robots.txt, возможно, вам нужно использовать коды CAPTCHA.