Вопросы с тегом «combinatorial-games»

4
Как обрабатывать недопустимые движения в обучении подкреплению?
Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть . Имеет ...

1
Нейронные сети против генетических алгоритмов в играх, таких как Tic Tac Toe?
В настоящее время я делаю проект по созданию ИИ для игры Gomoku (это похоже на крестики-нолики, но играется на доске 15 * 15 и требует 5 подряд для победы). Я уже успешно реализовал идеальный искусственный интеллект, используя Q-обучение и сохраняя игровые состояния / действия в таблице, но для доски 15 ...

1
Несколько сомнений относительно применения обучения с подкреплением в таких играх, как шахматы
Я изобрел шахматную настольную игру. Я построил двигатель, чтобы он мог играть автономно. Двигатель в основном дерево решений. Он состоит из: Функция поиска, которая на каждом узле находит все возможные законные ходы Функция оценки, которая присваивает числовое значение позиции на доске (положительное значение означает, что первый игрок получает преимущество, отрицательное ...
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.