(В дополнение к ответу @ Джона.)
Есть ли способ сказать Google не индексировать этот сайт?
Скорее любопытно, что, хотя они, кажется, клонировали все (включая ваши файлы сайта XML * 1 ), они не клонировали ваш файл robots.txt. На самом деле robots.txt на этом сайте активно блокирует сканирование всего! Так что, похоже, ничего не поделаешь в этом отношении. Поиск по сайту в этом домене возвращает только пустой домен и уведомление о том, что он заблокирован robots.txt.
(Скорее любопытно, что они намерены сделать при этом? Возможно, вы могли бы просто предположить, что они допустили ошибку с robots.txt - и это может быть так - но это больше похоже на намеренное исключение для меня?)
Кроме того, хотя ваши XML-карты сайта клонированы, они не обновляют URL-адреса в них (как это происходит на главных страницах сайта), поэтому они по-прежнему указывают на ваш сайт.
* 1 Относительно карты сайта XML. На вашем сайте «sitemap.xml» фактически является перенаправлением на «sitemap_index.xml», и клонированный сайт фактически клонировал перенаправление ... которое перенаправляет обратно на ваш сайт! (Несомненно, ошибка с их стороны.) "Sitemap_index.xml" - это просто индекс, ссылающийся на 4 других файла Sitemap. Если какой-либо из этих фактических файлов Sitemap запрашивается непосредственно на клонированном сайте, они корректно клонируются и URL-адреса обновляются. Тем не менее, я бы сказал, что эти карты сайта вряд ли можно найти на клонированном сайте из-за первоначального перенаправления «sitemap.xml». (?) Хотя, если бы они отправили «sitemap_index.xml» напрямую, это, очевидно, обошло бы перенаправление.