Была выпущена новая статья с несколькими тестами против reCAPTCHA:
https://www.blackhat.com/docs/asia-16/materials/asia-16-Sivakorn-Im-Not-a-Human-Breaking-the-Google-reCAPTCHA-wp.pdf
Некоторые основные моменты:
- Сохраняя cookie активным в течение +9 дней (просматривая сайты с помощью ресурсов Google), вы можете передать reCAPTCHA, только установив флажок;
- Нет ограничений на основе запросов на IP;
- Пользовательский агент браузера должен быть реальным, и Google запускает тесты для вашей среды, чтобы убедиться, что он совпадает с пользовательским агентом;
- Google проверяет, может ли браузер отображать Canvas;
- Разрешение экрана и события мыши не влияют на результаты;
Google уже исправил уязвимость в файлах cookie и, вероятно, ограничивает некоторые варианты поведения, основанные на IP-адресах.
Еще одним интересным открытием является то, что Google запускает виртуальную машину на JavaScript, которая запутывает большую часть кода и поведения reCAPTCHA. Эта виртуальная машина называется botguard и используется для защиты других служб, кроме reCAPTCHA:
https://github.com/neuroradiology/InsideReCaptcha
ОБНОВЛЕНИЕ 2017
Недавняя статья (с августа) была опубликована на WOOT 2017 с 85-процентной точностью в решении задач аудио noCAPTCHA reCAPTCHA:
http://uncaptcha.cs.umd.edu/papers/uncaptcha_woot17.pdf
ОБНОВЛЕНИЕ 2018
Google представляет reCAPTCHA v3, который выглядит как «механизм прогнозирования человеческого рейтинга», который откалиброван для каждого веб-сайта. Он может быть установлен на разных страницах веб-сайта (работает как скрипт Google Analytics), чтобы помочь reCAPTCHA и владельцу веб-сайта понять поведение людей и ботов перед заполнением reCAPTCHA.
https://www.google.com/recaptcha/intro/v3beta.html