«Юджин Густман» действительно прошел тест Тьюринга?


18

Говорят, что «Юджин Густман», компьютерная программа, разработанная для имитации 13-летнего мальчика, сумела убедить 33% судей, что это был человек, и, таким образом, прошла тест Тьюринга.

Компьютерная программа, она же чатбот, притворялась 13-летним украинским мальчиком, для которого английский был вторым языком - что-то совсем другое.

Для меня Евгений звучит точно так же, как должен посредственный чат-робот: повторяющийся, бессмысленный и заваленный несеквитурами. Я не знаю, как это убедило судей (что кажется непрофессиональным).

Многие критикуют Юджина, например, профессора Стевана Харнада, который сказал: «Это чепуха» и «Мы не прошли тест Тьюринга. Мы даже не близки».

Мнения расходятся, но мне бы очень хотелось узнать, прошел ли он официально тест?

Также говорится, что:

Два единовременных приза, которые никогда не присуждались. 25K предлагается для первого болтуна, которого судьи не могут отличить от реального человека и который может убедить судей, что человек - это компьютерная программа. 100 000 долларов - это награда за первого болтуна, которого судьи не могут отличить от реального человека в тесте Тьюринга, который включает в себя расшифровку и понимание текстового, визуального и слухового ввода. Как только это будет достигнуто, ежегодный конкурс закончится.

Значит ли это, что Евгений выиграл 25 000 долларов?


2
Очень важно, чтобы судьи знали, что они находятся в ситуации.
Турбьёрн Равн Андерсен

3
2/3 судей считали, что этот бот не человек. Для меня это говорит о том, что искусственный характер этого взаимодействия был очевиден для большинства судей. Я бы назвал это явным провалом. (И даже если «Евгений» «победил» - как искусственный человек собирает реальные деньги? BitCoin? :-)
Боб Джарвис - Восстановить Монику

Можете ли вы привести пример разговора? Я ежедневно общаюсь с украинцами, и то, как они говорят по-английски, легко узнать.
Стефан Бийзиттер

Ответы:


18

Не существует «официального теста Тьюринга», поэтому нет понятия «официально пройти [тест]». Тьюринг описал методологию, которую можно использовать для оценки искусственного интеллекта. Организаторы мероприятия, в котором победил Юджин Густман, реализовали эту методику особым образом, и программа соответствовала критериям, выбранным организаторами. В этом смысле он прошел испытание.

Поскольку нет «официального теста Тьюринга», возможно , было бы более уместно сказать , что женя густман прошел в тест Тьюринга или даже прошел тест Тьюринга стиля. Маловероятно , что СМИ будет забрать на такие тонкости, особенно учитывая известность Тьюринга и идея « в тесте Тьюринга» в общественном сознании.


3
Кроме того, Юджин Густман будет мусором в оригинальной имитационной игре Тьюринга ;-)
Стив Джессоп

9

Я думаю, что призы, о которых вы говорите, это приз Лебнера . Согласно странице Википедии (см. Предыдущую ссылку), победителем в 2014 году стала «Роза» Брюса Уилкокса. Эта программа не выиграла один из разовых призов, но получила $ 4000 призовых. «Евгений Густман» соревновался в 2005 и 2008 годах, финишировав вторым.

Победитель конкурса «Юджин Густман» был организован Кевином Уориком из Университета Ковентри, чтобы отметить 60 лет со дня кончины Алана Тьюринга. Я не знаю ни о каких призовых.

Посмотрите, как Рэй Курцвейл принимает участие в конкурсе и в программе. Выдержка:

Профессор Уорвик утверждает, что тест был «неограниченным». Однако наличие чат-бота, претендующего на то, чтобы быть 13-летним ребенком, и для которого английский не является родным языком, фактически является ограничением. Кроме того, по сообщениям, взаимодействия были ограничены пятью минутами каждое. В такой короткий период времени высока вероятность одурачить наивных судей.

Я поболтал с чатботом Евгением Густманом, и не был впечатлен. Евгений не следит за разговором, повторяет слово в слово и часто отвечает типичным чат-бестонером.

Я также обнаружил, что это хороший комментарий: WIRED - этот компьютер действительно получил F в тесте Тьюринга


1
Мне также понравился бит Wired, в частности: «На соревновании 1991 года бот под названием PC Therapist смог получить пять из десяти судей, чтобы поверить, что это человек». Также относительно «особого» порога обмана на 30%: «Так что отец теста Тьюринга не использовал это в качестве некоторого порога для интеллекта, он просто констатировал свой прогноз того, где, по его мнению, будут компьютеры через пять десятилетий. "
Fizz

10
Итак, бот Евгений «прошел» этот тест не путем симуляции человеческого интеллекта, а путем симуляции человеческой глупости.
сумерки

2

Добавление ссылки на Википедию для более подробной информации о «оригинальном» тесте Тьюринга . Существует множество тестов, называемых «тестом Тьюринга». В Википедии упоминается «как минимум 3 основных версии». Тест, пройденный Eugeene, не относится к числу 3. Тест, пройденный Eugeene, не был разработан Аланом Тьюрингом, но это был тест, названный тестом Тьюринга, вдохновленный Аланом Тьюрингом, и Eugeene его прошел.

Часть, упоминающая как минимум 3 основные версии теста Тьюринга:

Сол Трейгер утверждает, что существует по крайней мере три основных версии теста Тьюринга, две из которых предлагаются в «Вычислительной технике и интеллекте», а другую он описывает как «Стандартная интерпретация». Хотя есть некоторые споры относительно того, является ли «Стандартная интерпретация» той, что описана Тьюрингом, или, вместо этого, на основе неправильного прочтения его статьи, эти три версии не рассматриваются как эквивалентные, а их сильные и слабые стороны различны.

Версия 1

Оригинальная игра Тьюринга описала простую игру для вечеринок с участием трех игроков. Игрок A - мужчина, игрок B - женщина, а игрок C (который играет роль следователя) - любого пола. В игре «Имитация» игрок C не может видеть ни игрока A, ни игрока B и может общаться с ними только посредством письменных заметок. Задавая вопросы игроку A и игроку B, игрок C пытается определить, кто из них мужчина, а кто женщина. Роль игрока A состоит в том, чтобы обмануть следователя в принятии неправильного решения, в то время как игрок B пытается помочь следователю в принятии правильного решения.

Версия 2

Вторая версия появилась позже в газете Тьюринга 1950 года. Как и в «Первоначальном тесте имитационной игры», роль игрока А выполняет компьютер. Однако роль игрока B выполняет мужчина, а не женщина. [...] В этой версии и игрок A (компьютер), и игрок B пытаются обмануть следователя, чтобы тот принял неправильное решение.

Версия 3

Распространено понимание того, что цель теста Тьюринга состоит не в том, чтобы конкретно определить, способен ли компьютер обмануть следователя в убеждение, что это человек, а в том, может ли компьютер подражать человеку. В то время как есть некоторый спор, было ли это толкование предназначено Тьюрингом - Стерретт полагает, что это было и таким образом связывает вторую версию с этой, в то время как другие, такие как Трейгер, не делают - это тем не менее привело к тому, что можно рассматривать как стандартная интерпретация. " В этой версии игрок A - это компьютер, а игрок B - человек любого пола. Роль следователя не в том, чтобы определить, кто из них мужчина, а кто женщина, а кто компьютер, а кто человек. Основная проблема стандартной интерпретации заключается в том, что следователь не может различить, кто отвечает, а кто - машина. Есть вопросы о продолжительности, но стандартная интерпретация обычно рассматривает это ограничение как нечто разумное.

Напротив, в тесте, пройденном Eugeene, судьи-люди болтали с чатботом в течение 5 минут, после чего им приходилось решать, бот это или нет.


0

Да, он выиграл «тест» Тьюринга, который следовал оригинальному описанию Алана Тьюринга как можно точнее.
Однако это не была версия с призовым фондом в 25000 долларов, то есть приз Лебнера, характеристики которого отличаются от описания Алана Тьюринга.
Что еще более важно, Алан Тьюринг никогда не хотел, чтобы это было подлинным испытанием , поэтому результат не является доказательством интеллекта, если вы действительно хотели это знать.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.