Грокаем глубокое обучение с подкреплением, Моралес М., 2023.
Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах. Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.
Оценка поведения агента.
Вы уже знаете, как сложно сбалансировать краткосрочные и долгосрочные цели. Все мы сталкиваемся с этой проблемой по нескольку раз на дню. Например, чем лучше заняться этим вечером: посмотреть фильм или продолжить чтение книги? Первый вариант сразу же приносит удовлетворение: на протяжении полутора-двух часов вы можете променять нищету на богатство, одиночество на любовь, избыточный вес на стройную фигуру — и все это не переставая жевать попкорн. А вот чтение книги не даст вам особых ощущений сегодня вечером, но в дальнейшем эти ощущения могут (без какой-либо гарантии) оказаться куда сильнее.
Краткое содержание.
Предисловие.
Вступление.
Благодарности.
О книге.
От издательства.
Об авторе.
Глава 1.Введение в глубокое обучение с подкреплением.
Глава 2.Математические основы обучения с подкреплением.
Глава 3.Баланс краткосрочных и долгосрочных целей.
Глава 4.Баланс между сбором и использованием информации.
Глава 5.Оценка поведения агента.
Глава 6.Улучшение поведения агентов.
Глава 7.Более действенные и эффективные способы достижения целей.
Глава 8.Введение в ценностно ориентированное глубокое обучение с подкреплением.
Глава 9.Более стабильные ценностно ориентированные методы.
Глава 10.Ценностно ориентированные методы с эффективным использованием выборок.
Глава 11.Методы градиента политик и «актер-критик».
Глава 12.Продвинутые методы «актер-критик».
Глава 13.Путь к сильному искусственному интеллекту.
Купить .
Теги: Моралес :: книги по программированию :: программирование :: искусственный интеллект :: Python
Смотрите также учебники, книги и учебные материалы:
- Делай как в Google, Разработка программного обеспечения, Винтерс Т., Маншрек Т., Райт Х., 202
- Python и наука о данных для чайников, Мюллер Д.П., Массарон Л., 2020
- Грокаем машинное обучение, Серрано Л., 2024
- Грокаем глубокое обучение, Траск Э., 2020
- Грокаем алгоритмы искусственного интеллекта, Харбанс Р., 2023
- Программирование для Android на Kotlin, Гриффитс Д.
- Глубокое обучение, Легкая разработка проектов на Python, Вейдман С., 2021
- Глубокое обучение с подкреплением, Теория и практика на языке Python, Грессер Л., Кенг В., 2022