Вопросы с тегом «combinatorial-games»

4
Как обрабатывать недопустимые движения в обучении подкреплению?
Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть . Имеет …

1
Нейронные сети против генетических алгоритмов в играх, таких как Tic Tac Toe?
В настоящее время я делаю проект по созданию ИИ для игры Gomoku (это похоже на крестики-нолики, но играется на доске 15 * 15 и требует 5 подряд для победы). Я уже успешно реализовал идеальный искусственный интеллект, используя Q-обучение и сохраняя игровые состояния / действия в таблице, но для доски 15 …

1
Несколько сомнений относительно применения обучения с подкреплением в таких играх, как шахматы
Я изобрел шахматную настольную игру. Я построил двигатель, чтобы он мог играть автономно. Двигатель в основном дерево решений. Он состоит из: Функция поиска, которая на каждом узле находит все возможные законные ходы Функция оценки, которая присваивает числовое значение позиции на доске (положительное значение означает, что первый игрок получает преимущество, отрицательное …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.