Теоретический алгоритм почтенного графа кратчайшего пути A * и последующие усовершенствования (например, Иерархический аннотированный A *), безусловно, являются методом выбора для поиска путей в разработке игр.
Вместо этого мне просто кажется, что RL - более естественная парадигма для перемещения персонажа по игровому пространству.
И все же я не знаю ни одного разработчика игр, который бы реализовал движок поиска путей на основе Reinforcement Learning. (Из этого я не делаю вывод, что применение RL в pathfinding равно 0, просто оно очень мало по сравнению с A * и друзьями.)
Безотносительно причины, это не потому, что эти разработчики не знают о RL, о чем свидетельствует тот факт, что RL часто используется в других местах игрового движка.
Этот вопрос не является предлогом для предложения мнения о RL при поиске путей; на самом деле, я предполагаю, что молчаливое предпочтение A * et al. над RL правильно, но это предпочтение не очевидно для меня, и мне очень любопытно узнать причину этого, особенно от любого, кто пытался использовать RL для поиска пути.