Какой хороший ресурс для знакомства с обучением подкреплению?

8

Я знаком с контролируемым и неконтролируемым обучением. Я прошел курс SaaS Эндрю Нга на Coursera.org.

Я ищу что-то подобное для обучения подкреплению.

Вы можете порекомендовать что-нибудь?

reinforcement-learning getting-started

— Мартин С
источник

5

К хорошим ответам здесь я бы добавил

Краткий обзор RL : самые важные понятия в одном месте.
Еще один краткий обзор в формате презентации.
Экскурсия Бена Рехта по RL довольно обширна и доступна.
Уравнения Беллмана : центральные для всей теории РЛ.
Градиенты политики объясняются Андреем Карпати (в других ответах упоминается как «понг из пикселей», это ссылка).

Они едва царапают поверхность RL, но они должны помочь вам начать.

— cantordust
источник

3

Есть список воспроизведения на YouTube (на канале DeepMind ), название которого - Введение в обучение с подкреплением , представляющее собой курс (из 10 уроков) по обучению с подкреплением от David Silver .

Человек, который следовал и закончил курс, написал (как комментарий Youtube):

Отличный курс. Хороший темп, достаточно примеров, чтобы обеспечить хорошую интуицию, и учил кто-то, кто является лидером в области применения RL к играм.

— нбро
источник

3

Перед этим спросите себя, действительно ли вы хотите узнать об «обучении подкреплению». Хотя в обучении с подкреплением много ажиотажа, практическая применимость обучения с подкреплением практически отсутствует. Большинство онлайн-курсов очень мало учат вас машинному обучению, поэтому гораздо лучше освоить его, чем переходить к усиленному обучению. Обучение с подкреплением обучения несколько отличается от обучения методам обучения без учителя / под наблюдением.

Сказав это, самый быстрый способ получить хорошее представление о подкреплении обучения заключается в следующем:

Прочитайте сообщение в блоге Андрея Карпати "Понг из пикселей".
Посмотрите лекции Deep RL Bootcamp .
Чтобы понять математику, лежащую в основе этих методов, обратитесь к Саттону и « Усиленному обучению Барто : Введение» .
Читайте соответствующие статьи (игры и т. Д.).

PS: убедитесь, что вы разбираетесь в основах нейронных сетей, так как большинство современных статей в RL так или иначе используют DNN в качестве аппроксиматоров.

— riemann77
источник

real-world applicability of reinforcement learning is almost non-existent АльфаГо прошел обучение с обучением подкреплению.

— cantordust

Спасибо, что мне нравится в обучении с подкреплением, так это то, что оно может улучшить себя, просто выполняя задание снова и снова. Нет надзора не требуется. Только модель должна правильно описать проблему.

— Мартин С

1

@cantordust, проверьте alexirpan.com/2018/02/14/rl-hard.html

— riemann77

@thecomplexitytheorist Да, я знаю об этом посте, и да, есть трудности, связанные с RL (как и любой другой метод ML). Однако эти трудности не означают, что его применимость равна нулю. Еще один успешный пример (также упоминаемый в посте) - повышение эффективности охлаждения центров обработки данных Google на 40% - едва ли незначительное.

— cantordust

1

@cantordust, вы должны прочитать этот пост полностью, там нет обучения «усиленному обучению», связанному с «повышением эффективности охлаждения», они четко упомянули, что делают прогнозы на основе прошлых данных о потреблении энергии.

— riemann77

2

Я недавно видел курс Microsoft по edx. Это называется «Укрепление обучения объяснил».

Вот ссылка: https://www.edx.org/course/reinforcement-learning-explained-0 Это не совсем исчерпывающе, но, по крайней мере, дает хорошую отправную точку.

— затор
источник

1

Я бы сказал, что этот пост необходимо прочитать:

https://rubenfiszel.github.io/posts/rl4j/2016-08-24-Reinforcement-Learning-and-DQN.html

— Борислав Марков
источник