Один из наиболее популярных вопросов, задаваемых на этом сайте, касается перспективы чисто самообучающегося шахматного ИИ.
Сегодня ChessBase отвлекается от освещения турнира кандидатов в ФИДЕ, чтобы сообщить, что новый ИИ впервые побеждает ведущего мастера совершенно другой игры в го, которая в течение многих лет сопротивлялась ИИ в шахматном стиле. Первоначальное прочтение отчета предполагает, что новый ГИ-ИИ не похож на шахматные ИИ, но больше похож на ИИ общего игрового процесса (GGP). Статья ChessBase, однако, не использует термин GGP, но, похоже, говорит, что искусственный интеллект может выиграть в простых видеоиграх.
Есть ли какая-то причина, по которой такой выигрышный ход AI не мог с небольшими корректировками выиграть и в шахматы? Если да, то обещает ли такой ИИ достичь чистого самообучения, о котором ранее уже обсуждалось несколько превосходных ответов на предыдущий вопрос, что в то время еще не было возможно? Почему или почему нет?
Я подозреваю, что по-настоящему полного, полностью информированного ответа на мой вопрос пока не имеется, поэтому будет признателен даже частичный ответ, основанный на соответствующих знаниях.
Для дополнительной справки см. Также этот связанный вопрос и ответы.
ОБНОВИТЬ
Когда вышеупомянутый вопрос был впервые опубликован пять дней назад, и когда были даны некоторые из прекрасных ответов ниже, только что появились первые новости о победе Го ИИ. С тех пор появилась дополнительная информация и комментарии.
Особенно интересным с тех пор была читаемая пятисторонняя дискуссия за круглым столом, в которой Джонатан Шеффер замечает:
Обучение на человеческих играх помогает ускорить процесс обучения. AlphaGo может научиться самостоятельно становиться сильным игроком, не используя человеческие игры. Процесс обучения займет больше времени.
По словам ведущего круглого стола, Шеффер - «профессор компьютерных наук в университете Альберты и человек, который решал шашки»; так что, по-видимому, он может быть компетентным комментировать.
Для получения дополнительной информации, вот отчет о другом открытом обсуждении, многие из участников которого кажутся лучше информированными, чем обычно. Обсуждение проходило во время матча.
Дальнейшее обновление, полтора года спустя: комментатор @MarkS. пишет:
Это просто комментарий, потому что речь идет о Го, а не о Шахматах, но AlphaGo Zero добился «чистого самообучения» только благодаря тому, что ему сообщили, кто выиграл (а не окончательный счет), и он сильнее и намного эффективнее, чем ИИ, победивший Ли Седола. , Для получения дополнительной информации см. Deepmind.com/blog/alphago-zero-learning-scratch