В Google Webmaster Tools я заметил, что моя первая страница была проиндексирована два раза:
example.com/example.com/?chocaid=397
Я знаю, что мог бы исправить это с использованием типа ссылки canonical, но мне интересно: откуда этот параметр?
Существуют различные сайты, на которых страницы индексируются именно с этим параметром / значением: https://duckduckgo.com/?q=chocaid%3D397 .
Я искал сходства между этими сайтами. но не смог найти убедительного: часто это первая полоса, но не в каждом случае. Некоторые NSFW, но не все. Когда URL-адрес одного домена имеет этот параметр, часто его имеют и другие дочерние домены того же домена.
Примеры
Википедия

Microsoft Codeplex

?chocaid=397для индексации, вероятно, что-то ссылается на него, чтобы Google сначала нашел ссылку?