Является ли AlphaZero примером AGI?

11

Из исследовательской работы DeepMind на arxiv.org:

В этой статье мы применяем аналогичный, но полностью универсальный алгоритм, который мы называем AlphaZero , к играм в шахматы и сёги, а также в го без каких-либо дополнительных знаний предметной области, кроме правил игры, демонстрируя, что обучение с подкреплением общего назначения Алгоритм может достичь, Tabula Rasa, сверхчеловеческой производительности во многих сложных областях.

Означает ли это, что AlphaZero является примером AGI (искусственного общего интеллекта)?

— Томас
источник

11

Хороший вопрос!

AlphaZero, хотя и является важной вехой, определенно не является AGI :)

AlphaGo, хотя и силен в игре в Го, узко силен («сильно-узкий ИИ»), определяемый как сила в одной проблеме или типе проблемы (например, Го и другие неслучайные, совершенные информационные игры).

AGI, как минимум, должен быть примерно таким же сильным, как люди во всех проблемах, над которыми работали или решали люди.

AGI часто ассоциируется с суперинтеллектом , определяемым как интеллект, превосходящий человеческий уровень.

AGI не обязательно подразумевает супер-интеллект, в том смысле, что мы рассматриваем андроида, который может выполнять все человеческие действия с теми же возможностями, что и люди, как искусственный общий интеллект .

Но технически AlphaGo является узким суперинтеллектом в том смысле, что он превосходит все возможности человека в одной задаче.

— DukeZhou
источник

Здесь нет узких суперинтеллектов. Мы называем это слабым ИИ :). Ни один человек не может найти полуоптимальные компиляции Microsoft Word или Excel при его жизни - в то время как современные машины могут сделать это за несколько часов.

— Quonux

@ Quonux Зависит от определения, я подозреваю. Бостромское определение суперинтеллекта примерно аналогично искусственному общему интеллекту, но сам термин, этимологически говоря, просто означает «высший интеллект», буквально «выше + интеллект». Согласно этому базовому определению «узкий ИИ» может быть синонимом «узкого суперинтеллекта», поскольку первоначальное определение «сильного» было AGI, поэтому после AlphaGo ученые начали использовать «узкий» квалификатор.

— DukeZhou

@Quonux Отчасти моя точка зрения заключается в том, что с появлением AlphaGo термин «слабый» для ИИ, который превосходит возможности человека в одной задаче, по-видимому, был заменен «сильным узким ИИ».

— DukeZhou

2

Предположения, которые могут быть неверными

Есть два предположения, которые можно определить по тону статьи.

Все умственные проблемы могут быть сведены к игре с фиксированными правилами.
Машины лучше людей - это то, что люди действительно хотят или нуждаются.

Есть еще два идентифицируемых в вопросе.

Общий интеллект существует у людей ¹
Если это существует в людях, это возможно в компьютерах.

Все четыре могут быть правдой, но ни один из четырех не уверен.

Производительность AlphaZero

Если наша шахматная доска находится на игровой полке в нашем шкафу, наша трава длинная, а наша газонокосилка сломана, то при подключении к роботу-гуманоиду AlphaZero не будет кодировать правила игры для последовательности задач.

Прислушиваясь к просьбе своего владельца,
Научиться марионетке-мастеру робота,
Нахождение и идентификация всех наших инструментов и запасных частей,
Закрепление газонокосилки и
Дайте нам знать, газонокосилка готова к использованию.

Поэтому в этом сценарии для нас нет особой потребительской ценности. Не очень общий.

Даже если бы он мог косить газон уже работающей газонокосилкой, он имел бы ценность, для которой не требуется умение что-либо выиграть, а скорее способность подчиняться и проявлять нечеловеческий интеллект, необходимый для того, чтобы не бегать по цветочной клумбе.

Примечательно, что умные люди DeepMind решили использовать латинскую tabula rasa вместо чистого листа , но это не так впечатляет, как создание обучающей программы, которая может научиться хорошо играть в три игры, используя только закодированные правила и реальный игровой процесс в качестве входных данных.

Чтобы считать эти игровые программы действительно полезными в пространстве продуктов, нельзя полагаться на постоянный интерес к покупке программного обеспечения, которое каждый раз побеждает покупателя. Чтобы продукты ИИ были жизнеспособными, функции обучения должны обладать способностью, которую обычно называют здравым смыслом, что требует гораздо более широкого и гибкого знания предметной области, чем фиксированные правила игры. Мы можем догадаться, что большинство исследователей, которые достигли вех в обучении геймплею, продвигаются в этом направлении. Они также знают, что их результаты исследований должны в конечном итоге быть произведены или привести к приобретаемому предложению SaaS.

Что было бы впечатляющим для тех, кто находится за пределами области, так это то, что эти достижения могут быть перенаправлены в пространство центра обработки данных для создания лечебных генных методов лечения для лечения рака или герпеса или обратного диабета или болезни Альцгеймера. Тогда мы могли бы простить исследователей за то, что они не предоставили нам загрузку, которая могла бы стать кукольным мастером робота для очистки нашей ванной комнаты. Из документа не ясно, что AlphaZero адекватно продемонстрировал, что он демонстрирует «сверхчеловеческую производительность во многих сложных областях».

То, что они сделали, по-прежнему впечатляет и в том же духе, что и другие. Мало кто из нас посмел бы изобрести игру, которую эти типовые обучающие программы не научат быстро, и победить нас в нескольких игровых примерах.

Прогресс, рассматриваемый в перспективе

Конечно, при выполнении арифметики, сортировке почты, а теперь и при игре, изобретения человечества расширяют возможности обнаженного человека без его инструментов. Этот прогресс ставит компьютерные системы в сферу применения инструмента. Задняя мотыга тоже в каком-то смысле сверхчеловеческая. Попробуйте проложить километр трубы без таковой.

И наоборот, человечество играет роль поставщика медицинских услуг для компьютеров. Если они заболевают или терпят неудачу, мы вынуждены изгнать их вирусы и черви или заменить их неисправные части. В противном случае наши дома и предприятия будут в беспорядке.

Технологии, как и во всем, следует рассматривать в перспективе.

Было бы благоразумно, если бы люди были менее увлечены играми и избивали друг друга и больше сосредоточились на совместном социальном поведении, направленном на решение социальных и экономических проблем с помощью своих недавно изобретенных инструментов, и при этом не создавали новых проблем или приглашали новые зверства.

Сноски

То, что в людях существует как общий интеллект, является спорным на основании доказательств обратного. Многие назвали бы эти стратегии и тенденции доказательством ограничений человеческого интеллекта.

Ядерное сдерживание как стратегия мира
Полное отсутствие умеренности в потреблении конечных, критических природных энергетических ресурсов
Постоянно увеличивающаяся плотность моделей зависимости во всем мире
Причинение шестого массового вымирания на земле

— Дуглас Дасеко
источник

Спасибо за редактирование, так лучше (по крайней мере, для меня), с большим вниманием на технические части ответа. Возможно, существует другой вопрос относительно того, какой должна быть совершенно рациональная или высокоэффективная AGI. Точно так же, к каким стандартам индивидуального или группового поведения мы хотим привязать людей - хотя это не было бы для этого сайта, если бы вопрос не был конкретно о сравнениях с искусственным интеллектом.

— Нил Слейтер