Прыгнуть на повозке так же легко, заявив, что игра Альфа-Ноль «более» человечна, чем предыдущие компьютерные шахматные программы, так же как прыгнуть на противоположную повозку и сказать, что игра Альфа-Ноль полностью «чужеродна». Не ясно, что игра «Альфа-ноль» «более человечная», особенно учитывая нашу человеческую тенденцию к антропоморфизму.
Шахматы как борьба разума
Но в шахматах эта тенденция верна? Магнус Карлсен однажды говорил о том, что «традиционным» компьютерам вообще не хватает человеческого творчества, говоря:
«Шахматы - это борьба человеческих умов. Это то, что делает их захватывающими. Компьютерные шахматы механические, сухие и мягкие. Конечно, ходы очень сильные, но стиля нет. Если вы пытаетесь играть против шахматного компьютера Вы не только проиграете с очень высокой уверенностью, но вам также будет скучно в процессе.
Магнус Карлсен не видел доказательств человеческого стиля игры в традиционных шахматных компьютерах. Итак, давайте проверим, изменило ли недавнее достижение Альфа-Ноль эту перспективу и подтолкнуло нас к чему-то более напоминающему о себе.
Если под «человеческим» вы подразумеваете игру, демонстрирующую поведение, более склонное апеллировать к нашему чувству антропоморфизма, стиль Альфа-нуля кажется более человечным? Как мы на самом деле проверяем, как эти субъективные близорукие люди любят проецировать на нечеловеческие вещи? Давайте спросим - алгоритм «выборочно выбирает лучше» или «более творческий выбор человека» в своем стиле игры?
Создатели алгоритма указывают, что в отличие от Stockfish, который использует алгоритм поиска Alpha-Beta, Alpha-Zero использует алгоритм поиска по дереву Монте-Карло (MCTS), который принимает в качестве входных данных взвешенные параметры θ, построенные из предыдущих результатов ~ Страница 3. Освоение шахмат и Сёги за счет самостоятельной игры по общему алгоритму обучения подкреплению .
Таким образом, алгоритм не демонстрирует выбор вообще. На самом деле он участвует в случайном, но вероятностном поиске Монти-Карло, где возможные пути поиска, доступные для него, все чаще предвосхищаются предыдущими результатами. Альфа-ноль решил оптимизировать свой стиль игры таким образом, или это был выбор программистов?
Всегда ли у альфа-нуля есть все возможные ходы, доступные ему для рассмотрения, или некоторые ходы предвзяты алгоритмически таким образом, который имитирует опыт, который может быть истолкован людьми антропоморфно?
Первоначально он имел в своем распоряжении все ходы, поэтому его «стиль» был совершенно случайным. Однако, поскольку его поиск все чаще и оптимальнее ограничивается предыдущим успехом или неудачей, его стиль фактически меняется в сторону режима, с которым его сковали программисты. Это «более человечный»? Сравните это с Магнусом Карлесеном, который иногда будет выбирать менее оптимальные движения, потому что они более креативны :
Магнус Карлсен: «Я ценю создание чего-то уникального»
Шахматы как борьба (чужого) разума
Люди могут выбирать критерии, определяющие их собственный стиль игры (например, я часто выбирал импульс и ошибку в своем собственном стиле). Многие видят игру Альфы-ноль в обоих шахматах и идут решительно как Чужие . Ник Хайнс, аспирант Лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL), отмечает:
«То, что мы видим здесь, - это модель, свободная от предвзятости и предубеждений человека: она может выучить то, что определяет оптимально, что действительно может быть более нюансированным, чем наши собственные представления об этом. Это как инопланетная цивилизация, изобретающая свою собственную математику, которая позволяет ей делать такие вещи, как путешествие во времени ... »
Также гроссмейстер Питер Хейне Нильсен сказал Chess.com :
«Прочитав газету, но, особенно, увидев игры, я подумал: ну, я всегда задавался вопросом, как было бы, если бы высший вид приземлился на земле и показал нам, как они играют в шахматы.
Кажется, что большинство реагирует на возникающий стиль игры Альфа-ноль как «игра инопланетян», а не как «более человечный».
Поэтому есть причина не соглашаться с ответами выше, которые говорят «да».