Ну, я думаю, у вас есть хороший сканер, который читает robots.txt и следует директиве. И другой, который не следует директиве.
И как вы планируете дать этот URL? По электронной почте, используя Facebook или Twitter? Все эти сервисы сканируют информацию, которую вы отправляете. Gmail анализирует электронную почту, которую вы получаете, чтобы предоставить рекламу. Итак, ваш URL будет как-то сканирован.
Некоторые люди используют панель инструментов Google (или любую другую панель инструментов из поисковой системы). Существует опция (по умолчанию отмечена, если я хорошо помню), которая позволяет панели инструментов отправлять все URL, которые вы посещаете, в Google. Это еще один способ для Google увидеть скрытую сеть. Таким образом, даже если вы сказали человеку не указывать URL-адрес, он неявным образом сделает это (благодаря панели инструментов).
Я думаю, что мы можем найти много других возможностей.
Таким образом, вы можете добавить его в robots.txt, но также предоставить дополнительные мета, такие как noindex, nofollow и т. Д.
редактировать:
Предложение w3d о robots.txt мне кажется хорошим. Так что не добавляйте его в robots.txt и предоставляйте метатег propre.