Особые требования теста Тьюринга

9

Каковы конкретные требования теста Тьюринга?

Какие требования, если таковые имеются, должен выполнять оценщик, чтобы получить квалификацию для проведения теста?
В разговоре всегда должно быть два участника (один человек и один компьютер) или их может быть больше?
Допускаются или поощряются тесты плацебо (где на самом деле не задействован компьютер)?
Может ли быть несколько оценщиков? Если да, то должно ли решение быть единодушным среди всех оценщиков, чтобы машина прошла тест?

— Люк
источник

9

«Тест Тьюринга» обычно означает обновленную версию «Имитационной игры», которую Алан Тьюринг предложил в одноименной газете 1951 года. В ранней версии были человек (мужчина или женщина) и компьютер, и судья должен был решить, какой, какой и какого они пола, если он человек. Если они были правильными менее чем на 50%, то компьютер считался «интеллектуальным».

Текущая общепринятая версия требует только одного участника и судьи, чтобы решить, человек это или машина. Так что да, иногда это будет плацебо, если мы будем считать человека плацебо.

Ваш первый и четвертый вопросы связаны между собой - и нет строгих правил. Если компьютер может обмануть большее количество судей, то он, конечно, будет считаться лучшим ИИ.

У университета Торонто есть раздел действительности в этой статье по Тьюрингу , который включает в себя ссылку на комментарий Джейсона Хатченса о том, почему тест Тьюринга может быть неактуальным (люди также могут его провалить), и приз Лебнера , формальная реализация Тьюринга Тестовое задание .

— Рори Олсоп
источник

2

Здесь действительно два вопроса, которые я вижу. Один из них «каковы были конкретные требования первоначального теста Тьюринга, как заявил сам Тьюринг?» Другой вопрос: «Какими должны быть конкретные требования современного теста Тьюринга?» Со дня Тьюринга ситуация значительно улучшилась, и я думаю, что для нас было бы разумно рассмотреть вопрос о расширении / изменении его теста, чтобы отразить наше текущее понимание.

Ответ на первый вопрос достаточно прост, поэтому я думаю, что интересным является второй. Как должен выглядеть тест для определения интеллекта? Имея это в виду, я думаю, что ответ на все четыре вопроса, заданных ФП, - «это зависит». Я не думаю, что существует универсальный консенсус в отношении того, как построить идеальный тест Тьюринга, поэтому данный экспериментатор действительно может установить все так, как он хочет.

Все это, конечно, основано на предположении, что тест Тьюринга или тест, подобный тесту Тьюринга, действительно полезен. Это не обязательно дано. Учтите, что в некоторой степени мы говорим о разработке ИИ с исключительной способностью к обману! То есть, если допрашивающему разрешено просто спросить «ты человек», тогда мы должны предположить, что ИИ должен лгать, если он хочет пройти тест. Таким образом, можно справедливо спросить, является ли проектирование системы, которая действительно хороша для лжи, ценным подходом к ИИ?

— Mindcrime
источник

0

Если вы хотите понять относительность, прочитайте Эйнштейна ^1,2 , а не книгу об относительности, написанную профессором, который думает, что он его получил. Если вы хотите понять тест Алана Тьюринга на интеллект в контексте человеческого диалога, прочитайте Тьюринг. ³ Интерпретации могут быть хуже, чем ничего не стоящие. Они часто вводят в заблуждение. Если принципы кажутся слишком толстыми, прочитайте их снова, пока не получите.

В случае теста Тьюринга на интеллект в контексте человеческого диалога, чтобы понять его полностью, при написании статьи Тьюринга предполагается следующий фон, который, если вы прочитаете его статью 1950 года, станет очевидным.

Как теорема Тьюринга о полноте отвечает второй теореме о неполноте Курта Гёделя
Стратегия контролируемого теста
Разница между (а) слухом и речью и (б) слушанием и остроумным ответом - это особенно актуально сегодня, потому что чат-боты делают (а) и могут быть где-то от 5 до 500 лет от выполнения (б). Чтобы достичь (в) глубокого понимания и реагирования с вдохновением, исследователи ИИ должны выйти за рамки моделирования человеческого разума и подойти к задаче моделирования умов таких людей, как Гедель, Эйнштейн и Тьюринг. Будет ли это когда-либо происходить, еще предстоит выяснить.

Конкретные требования «Имитационной игры», подзаголовок Алана Тьюринга выше описания его мысленного эксперимента, являются предметом записей.

Особые требования [Выдержка из фактической статьи]

В [имитационную игру] играют три человека: мужчина (A), женщина (B) и следователь (C), которые могут быть любого пола. Следователь находится в комнате отдельно от двух других. Цель игры для следователя - определить, кто из двух других является мужчиной, а кто женщиной. Он знает их по меткам X и Y, и в конце игры он говорит, что «X - это A, а Y - это B» или «X - это B, а Y - это А.» Следователю разрешено задавать вопросы А и Б таким образом:

C: X скажи мне, пожалуйста, длину его или ее волос?

Теперь предположим, что X на самом деле A, тогда A должен ответить. Цель игры в A - попытаться заставить C сделать неверную идентификацию. Поэтому его ответ может быть следующим:

«Мои волосы опущены, а самые длинные пряди имеют длину около девяти дюймов».

Чтобы тона голоса не могли помочь следователю, ответы должны быть написаны или, что еще лучше, напечатаны на машинке. Идеальное расположение - иметь телепринтер для связи между двумя комнатами. В качестве альтернативы вопрос и ответы могут быть повторены посредником. Цель игры для третьего игрока (B) - помочь следователю.

Лучшая стратегия для нее - дать правдивые ответы. Она может добавить такие вещи, как «Я женщина, не слушай его!» на ее ответы, но это ничего не даст, так как мужчина может сделать подобные замечания.

Теперь мы задаем вопрос: «Что произойдет, когда машина сыграет роль А в этой игре?» Будет ли следователь ошибочно решать, когда в игру играют так, как он, когда в игру играют мужчина и женщина? Эти вопросы заменяют наши оригинальные: «Могут ли машины думать?»

Были тысячи критических анализов как относительности Эйнштейна, так и теста Тьюринга, и ни одна из них не принесла большой пользы. Изучите мышление великих авторов через их собственные слова, и все последующие отказы будут интересны, прежде всего, отсутствием величия.

Вторичные вопросы в этой теме

Какие требования, если таковые имеются, должен выполнять оценщик, чтобы получить квалификацию для проведения теста?

Следователь (С) не является оценщиком. Оценка была бы попыткой быть объективной, однако предпосылка мысленного эксперимента Тьюринга заключается в том, что следователь дает ей или его субъективное суждение. С точки зрения статистики, опросчик должен выбираться случайным образом из населения мира, которое имеет разговорный язык с (A) и (B).

В разговоре всегда должно быть два участника (один человек и один компьютер) или их может быть больше?

Их должно быть ровно два, чтобы соответствовать сценарию, описанному Аланом Тьюрингом. (См. Ниже для более подробной информации.)

Допускаются или поощряются тесты плацебо (где на самом деле не задействован компьютер)?

Можно было бы проверить все виды вещей, и исследователи, однако, сделали бы это вне рамок мыслительного эксперимента Тьюринга. ⁴

Может ли быть несколько оценщиков? Если да, то должно ли решение быть единодушным среди всех оценщиков, чтобы машина прошла тест?

Для тех, кто спонсирует настоящую игру-имитацию, было бы больше информации, которая представляла бы собой полностью рандомизированный тест двойного блайнда, в котором (A), (B) и (C) выбирались из случайной выборки этих мужчин, женщин или программного обеспечения. системы тестируемого типа, которые могут общаться на общем языке, и тест будет выполняться много раз со случайным выбором из выборок.

Единогласие, оценка, дополнительная сложность и общение, отличное от того, что было указано в тесте, только расстроят причину, если кто-то будет придерживаться первоначального намерения Тьюринга в отношении вопроса: «Могут ли компьютеры думать?»

Другие взгляды на интеллект

Тьюринг, как и Рене Декарт, который заявил, что машины никогда не пройдут менее контролируемую версию «Имитационной игры Тьюринга», видел интеллект сквозь призму диалога. Другие рассматривали другие виды диалога и другие контексты, чем диалог. Я обратился к этому в другом вопросе:

Может ли мозг быть разумным без тела?

Ссылки и сноски

[1] Относительность: специальная и общая теория Альберта Эйнштейна, 1916

[2] Принцип относительности Альберта Эйнштейна и Фрэнсиса А. Дэвиса, 1923

[3] А. М. Тьюринг (1950) Вычислительная техника и интеллект. Ум 49: 433-460. https://www.csee.umbc.edu/courses/471/papers/turing.pdf

[4] В статье Тьюринга 1950 года не было рекомендовано, чтобы его мысленный эксперимент был воплощен и использован для коммерческой проверки будущих систем ИИ. Алан Тьюринг, однако, занимался практическими вычислениями в определенный момент своей карьеры. Это было, когда нацисты захватили Францию, разорвали его родину с воздуха и потопили значительную часть английского флота снизу с помощью криптографии Enigma.

— Дуглас Дасеко
источник