Ответы, которые я получил на вопрос об обучении робота, следующего за роботом, используя методы обучения с подкреплением , заставили меня задуматься о том, как тренировать робота. Я считаю, что по сути есть два пути -
- Тренируйте физического робота.
- Смоделируйте робота и смоделируйте тренировку.
- Я что-то пропустил?
Подход 2, безусловно, лучший подход. Тем не менее, априорные знания о движении (ответ), определенный сигнал ШИМ (стимул) будет вызывать, когда робот находится в данном состоянии, не требуется. Движение, вызванное сигналом ШИМ, может зависеть от ( 1 ) текущего напряжения аккумулятора, ( 2 ) массы робота и ( 3 ) текущей скорости (я что-то пропустил?).
Как мне моделировать такого робота? И как мне смоделировать это быстро? Если я заменю батарею или добавлю несколько плат и других периферийных устройств и поменяю массу робота, мне придется реконструировать и переобучить робота. Могу ли я сделать это, предоставив некоторые ШИМ со случайным стимулом и измерив ответ?
Добавлено: мой связанный вопрос в dsp.SE
Обновление: предлагаемое редактирование заголовка Иана, заслуживающее упоминания: « Как мне моделировать тренировку робота, чтобы, если его динамика изменилась, ему не требовалось полное переобучение? », Я думаю, что это тоже хороший вопрос, но отличный от один я спрашиваю здесь. Сейчас я в порядке с переподготовкой.