Вопросы с тегом «reinforcement-learning»

2
Программирование линии следования робота с обучением подкрепления
Я рассматриваю программирование линии следования робота с использованием алгоритмов обучения подкрепления. Вопрос, над которым я размышляю, состоит в том, как я могу получить алгоритм обучения навигации по любому произвольному пути? Перейдя по Sutton & Барто книгу для обучения с подкреплением, я решить проблему тренировки с участием ипподрома , где в …

2
Как мне моделировать робота?
Ответы, которые я получил на вопрос об обучении робота, следующего за роботом, используя методы обучения с подкреплением , заставили меня задуматься о том, как тренировать робота. Я считаю, что по сути есть два пути - Тренируйте физического робота. Смоделируйте робота и смоделируйте тренировку. Я что-то пропустил? Подход 2, безусловно, лучший …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.