Сделайте так, чтобы пользователь отмечал объекты в видео, которые не может решить современный классификатор
Создайте современный классификатор видео. Можно также обучить его на данных видеообучения Google YouTube-8M . Но вы также захотите постоянно кормить его оригинальным видео.
Сделайте так, чтобы классификатор пометил как можно больше объектов. Пусть он изолирует, какие объекты он может распознать как объекты, но какие он не может пометить.
Сделайте так, чтобы он выводил видео, в котором обрисовываются объекты. Предпочтительно GIF-файлы, которые можно легко встраивать в формы.
Для 100 из них спросите 100 пользователей, что это за объект. Если 90% пользователей согласны с названием объекта, добавьте это видео в набор каптч. Назовите это предварительно обученным набором.
Каждый раз, когда пользователь должен пройти аутентификацию, показывайте ему один из выделенных объектов в видео, а не из предварительно обученного набора . Если изображение имеет менее 100 показов, запишите этикетку и дайте пользователю еще один из предварительно обученного набора. Если они понимают это правильно, пропустите их, если нет, дайте им еще один из набора предварительно подготовленных.
После того, как на видео, не прошедшем предварительную подготовку, будет показано более 100 показов, и более 90% пользователей, использующих капчу, согласны, добавьте это видео в набор после обучения.
Со временем медленно удаляйте предварительно обученный набор. Поместите истечения в каждое видео в обученном наборе и удалите их после истечения срока, чтобы они не использовались слишком много раз.
В идеале этот процесс постоянно улучшал бы классификатор видео, сохраняя его на современном уровне и немного опережая другие классификаторы. Возможно, он мог бы также отдать предпочтение менее распространенным словам и объектам и более эзотерическим вещам, чтобы специализировать этот классификатор против других классификаторов.
То же самое можно сделать для маркировки изображений, но полезность классификатора видео, вероятно, будет длиться дольше, учитывая успехи в искусственном интеллекте.
Строго говоря, хотя, за исключением некоторой квантовой хитрости, не существует системы капчи, которая не будет однажды решена внешними системами ИИ.
(edit: о, я только что заметил, что вы специально сказали «текстовая капча». Если это то, что вы имеете в виду, то нет, я не думаю, что в классификации текста осталось много загадок. Компьютеры, вероятно, теперь могут подбирать текст из изображений лучше, чем люди. Но технически, ввод в вышеописанной системе кодирования текстовый.)