Книги по усиленному обучению

9

Я уже довольно давно пытаюсь понять обучение с подкреплением, но каким-то образом я не могу представить, как написать программу для обучения подкреплению для решения проблемы мира сетки. Можете ли вы предложить мне несколько учебников, которые помогли бы мне составить четкую концепцию обучения в области подкрепления?

machine-learning books reinforcement-learning

— girl101
источник

stats.stackexchange.com/questions/130130/…

— Антон Тарасенко

Пожалуйста, обратитесь к openai, также это хорошее место, чтобы выучить усиленное обучение

— Vineet Kothari

7

Здесь у вас есть несколько хороших ссылок на обучение в области подкрепления:

классический

Саттон Р.С., Барто АГ. Усиление обучения: введение. Кембридж, Массачусетс: Книга Брэдфорда; 1998. 322 с.

Черновик для второго издания доступен бесплатно: http://incompleteideas.net/book/the-book-2nd.html

Рассел / Норвиг Глава 21:

Рассел С.Дж., Норвиг П., Дэвис Э. Искусственный интеллект: современный подход. Аппер-Седл-Ривер, Нью-Джерси: Прентис Холл; 2010.

Более технический

Szepesvári C. Алгоритмы для обучения с подкреплением. Обобщающие лекции по искусственному интеллекту и машинному обучению. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html

Берцекас Д.П. Динамическое программирование и оптимальное управление. 4-е издание. Belmont, Mass .: Athena Scientific; 2007. 1270 с. Глава 6, том 2 доступен бесплатно: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Для более свежих разработок

Виринг М, ван Оттерло М, редакторы. Усиление обучения. Берлин, Гейдельберг: Springer Berlin Heidelberg; 2012 Доступно по адресу: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Принятие решений в условиях неопределенности: теория и применение. 1 издание. Кембридж, Массачусетс: MIT Press; 2015. 352 с.

Многоагентное обучение с подкреплением

Buşoniu L, Babuška R, Schutter BD. Многоагентное обучение по усилению: обзор. В кн .: Сринивасан Д., Джайн Л.К., редакторы. Инновации в многоагентных системах и приложениях - 1. Springer Berlin Heidelberg; 2010 р. 183-221. Доступно по адресу: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Шварц Х.М. Многоагентное машинное обучение: подход подкрепления. Хобокен, Нью-Джерси: Wiley; 2014.

Видео / Курсы

Я бы также предложил курс Дэвида Сильвера на YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— Хуан Лени
источник

7

Существует бесплатный онлайн-курс по усиленному обучению Udacity. Проверить: Машинное обучение: Укрепление обучения

— Sreejithc321
источник

Стоит упомянуть, что проблема мира сетки представлена как часть этого курса.

— Нил Слэйтер

да, видел это, но не достаточно, чтобы закодировать то же самое

— girl101

4

Мне очень понравилось « Reinforcement Leraning: введение » Ричарда Саттона. Это обеспечивает очень хороший объединяющий взгляд на RL, хотя он не упоминает новейшие подходы (это с 1998 года).

— Мартин Модрак
источник

на самом деле я хотел увидеть, как решается проблема мира сетки с помощью вычислений на ручке и бумаге, потому что это помогло бы мне понять концепцию, если только я не смогу понять концепцию, которую не могу кодировать (особенно значение итерации)

— girl101

1

Вы можете ознакомиться с моей книгой « Практическое обучение усилению с помощью Python», в которой объясняется обучение с подкреплением с нуля до продвинутых современных алгоритмов глубокого обучения с подкреплением.

Весь код вместе с пояснениями уже доступен в моем репозитории github. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
источник