Почему шахматные эксперты были удивлены победой AlphaZero над Stockfish?


10

Это было недавно доведено до моего сведения , что специалисты по шахматам приняли исход этого ныне знаменитого матча , как что - то расстроен.

Смотрите: новый лучший игрок в шахматы - бесстрашный, бесшабашный алгоритм

Поскольку я не являлся экспертом по шахматам и шахматным искусственным интеллектам, я предполагал, что, основываясь на производительности AlphaGo и проверке метода такого типа в отношении комбинаторных игр, у старого искусственного интеллекта не будет шансов.

  • Почему победа AlphaZero была удивительной?

Ответы:


14

Хороший вопрос.

Прежде всего, в Go у глубокого разума не было сверхчеловеческих противников, которые могли бы бросить вызов. Го двигатели не были нигде рядом с высшим уровнем лучших игроков-людей. В шахматах, однако, двигатели на 500 очков ELO сильнее, чем лучшие игроки. Это огромная разница. Объем работы, которая ушла в современные шахматные движки, ошеломляет. Мы говорим о миллионах часов в программировании, сотнях тысяч итераций. Это огромный массив знаний и работы. Преодолеть и превзойти все это за 4 часа ошеломляет.

Во-вторых, это не столько сам результат, который удивляет шахматистов, а то, как AlphaZero играет в шахматы. Весьма иронично, что система, в которой не было никаких человеческих знаний или опыта, играет больше всего, чем мы. Двигатели печально известны тем, что они играют некрасиво выглядящие движения, те, кому не хватает гармонии и т. Д. Трудно объяснить игрокам, не являющимся шахматами, но есть такая вещь, как «Искусственный ход», который часто встречают современные двигатели. AlphaZero так не играет. У него очень человеческий стиль, в котором он доминирует над фигурами противника с глубокой стратегической игрой и потрясающими жертвами позиции. AlphaZero играет так, как мы стремимся, сочетая глубокое позиционное понимание с точностью расчета двигателя.

Редактировать О, и я забыл упомянуть кое-что о самом результате. Если вы не знакомы с компьютерными шахматами, это может показаться невероятным, но это так.

В эти дни границы победы, которые отделяют главные современные двигатели, тонки как бритва. В матче со 100 играми вы можете ожидать результат в виде 85 ничьих, 9 побед и 6 поражений, чтобы определить лучший двигатель.

AlphaZero 28 побед и 72 ничьи с нулевыми потерями был потусторонним сокрушением и был совершенно немыслим до момента, когда это произошло.


Хороший ответ. Ваша точка зрения относительно сравнения AI's Chess интересна с точки зрения ограничения, основанного на цикличности шахмат и триаде Win / Loss / Draw. (Возможно, в будущем нам понадобятся ограниченные, сложные игры, которые позволят провести более детальный анализ с точки зрения результатов.) Я знаком с историей шахматных движков и огромным количеством усилий и человеческих знаний, которые в них вложены, но контекст отсутствия успеха: гораздо более сложный 19x19 Go имел для меня противоположный характер.
DukeZhou

В частности, я предполагал, что, если AlphaGo сможет победить лучших людей в значительно более сложной игре, казалось разумным, что он победит не только лучших людей, но и лучших предыдущих ИИ в любой другой игре.
DukeZhou

Немного об искусственных шагах очень важно, и не то, о чем я видел, что не шахматисты говорят. +1
Стелла Бидерман

4

MCTS для шахмат пробовали в литературе с небольшим успехом. Предполагалось, что подход AlphaGo никогда не сработает в шахматах, может быть, в го, но не в шахматах. Внезапно Google объявил, что подход работает, и он побил сильнейшую шахматную программу в мире с очень значительным преимуществом.

До Google всех шахматных программистов учили, что создание эвристики в программировании двигателя было лучшей стратегией, чем машинное обучение. Независимо от того, как вы реализовали нейронные сети, он никогда не работал бы быстрее, чем куча инструкций 64-битных битбордов. AlphaGo бежал довольно медленно , но играл в сильнейшие шахматы.


2

На основании статей, которые вы предоставляете, я вижу много уровней удивления в победе:

Шахматы - сложная игра, и у контрагента были лучшие мировые практики, у AlphaZero была tabula rasa.

Обучение заняло четыре часа, и AlphaZero не проиграл 100 матчей.

Стиль игры представлял собой инопланетную смесь человеческих и компьютерных движений, агрессивных и иногда казавшихся глупыми с жертвами, которые не имеют ни малейшего представления, но на самом деле делают будущий статус более сильным.

Количество возможностей, учитываемых за ход, было меньше, чем у противоположности, у AlphaZero было таинственное чувство интуиции или интуиция.

Ощущение огорчения возникло из-за количества обучающего материала, с которым AlphaZero построил сам себя, и ограничения по времени, которое, возможно, не давало традиционной машине достаточное количество времени.


Ааа. Так что это связано с отсутствием доверия к новому методу ИИ. В этом есть смысл.
DukeZhou
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.