Искусственный интеллект combinatorial-games

4

Как обрабатывать недопустимые движения в обучении подкреплению?

Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть . Имеет …

20 machine-learning reinforcement-learning game-ai combinatorial-games

1

Нейронные сети против генетических алгоритмов в играх, таких как Tic Tac Toe?

В настоящее время я делаю проект по созданию ИИ для игры Gomoku (это похоже на крестики-нолики, но играется на доске 15 * 15 и требует 5 подряд для победы). Я уже успешно реализовал идеальный искусственный интеллект, используя Q-обучение и сохраняя игровые состояния / действия в таблице, но для доски 15 …

9 neural-networks machine-learning genetic-algorithms combinatorial-games

1

Несколько сомнений относительно применения обучения с подкреплением в таких играх, как шахматы

Я изобрел шахматную настольную игру. Я построил двигатель, чтобы он мог играть автономно. Двигатель в основном дерево решений. Он состоит из: Функция поиска, которая на каждом узле находит все возможные законные ходы Функция оценки, которая присваивает числовое значение позиции на доске (положительное значение означает, что первый игрок получает преимущество, отрицательное …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

Вопросы с тегом «combinatorial-games»