Искусственный интеллект game-ai

4

Как обрабатывать недопустимые движения в обучении подкреплению?

Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть . Имеет …

20 machine-learning reinforcement-learning game-ai combinatorial-games

3

Как выбрать лучший алгоритм для настольной игры, такой как шашки?

Как выбрать лучший алгоритм для настольной игры, такой как шашки? До сих пор я рассмотрел только три алгоритма, а именно минимакс, альфа-бета-обрезку и поиск по дереву Монте-Карло (MCTS). По-видимому, и альфа-бета-обрезка, и MCTS являются расширениями базового минимаксного алгоритма.

15 game-ai minimax alpha-beta-pruning monte-carlo-tree-search

2

Кодирование ввода / вывода для нейронной сети для изучения игры на основе сетки

Я пишу простую игрушечную игру, целью которой является обучение глубокой нейронной сети. Правила игры примерно следующие: В игре есть доска, состоящая из шестиугольных ячеек. Оба игрока имеют одинаковую коллекцию фигур, которую они могут свободно размещать на доске. Размещая различные типы фигур, начисляйте очки (или уменьшайте очки противника) в зависимости от …

13 neural-networks deep-learning game-ai

2

Является ли AlphaZero примером AGI?

Из исследовательской работы DeepMind на arxiv.org: В этой статье мы применяем аналогичный, но полностью универсальный алгоритм, который мы называем AlphaZero , к играм в шахматы и сёги, а также в го без каких-либо дополнительных знаний предметной области, кроме правил игры, демонстрируя, что обучение с подкреплением общего назначения Алгоритм может достичь, …

11 game-ai definitions agi alphago

3

Как подготовить нейронную сеть для круглой настольной игры?

Мне интересно, как подготовить нейронную сеть для настольной игры, основанной на раундах, такой как крестики-нолики, шахматы, риск или любая другая игра на основе раундов. Получить следующий ход по логическому выводу, кажется, довольно просто, путем подачи состояния игры в качестве входных данных и использования выходных данных в качестве хода для текущего …

11 training tensorflow game-ai

4

Может ли нейронная сеть выработать концепцию расстояния?

Представьте себе игру, в которой черный экран отделен от красного и синего пикселей. Передав эту игру человеку, они сначала увидят, что нажатие клавиш со стрелками переместит красный пиксель. Следующая вещь, которую они попытаются, это переместить красный пиксель на синий пиксель. Отдайте эту игру ИИ, он будет случайным образом перемещать красный …

10 neural-networks game-ai path-planning teaching-concepts

1

Несколько сомнений относительно применения обучения с подкреплением в таких играх, как шахматы

Я изобрел шахматную настольную игру. Я построил двигатель, чтобы он мог играть автономно. Двигатель в основном дерево решений. Он состоит из: Функция поиска, которая на каждом узле находит все возможные законные ходы Функция оценки, которая присваивает числовое значение позиции на доске (положительное значение означает, что первый игрок получает преимущество, отрицательное …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

3

Поиск по дереву Монте-Карло квалифицируется как машинное обучение?

Насколько я понимаю, алгоритм поиска дерева Монте-Карло (MCTS) является альтернативой минимаксному поиску дерева узлов. Он работает, выбирая ход (как правило, тот, у которого больше шансов быть лучшим), а затем выполняя случайную игру на ходу, чтобы посмотреть, каков будет результат. Этот процесс продолжается в течение выделенного времени. Это не похоже на …

9 machine-learning reinforcement-learning game-ai monte-carlo-tree-search alphazero

Вопросы с тегом «game-ai»