Глубокое обучение с подкреплением, AlphaGo и другие технологии, Лапань М., 2020.
В этой книге я попытался систематизировано рассказать об области глубокого обучения с подкреплением с точки зрения практика, задавая себе такие вопросы: каковы основные идеи, как их реализовать, какие есть подводные камни в реализации, на что обращать внимание при отладке методов, и другие подобные вопросы, которые часто остаются за кадром в научных статьях, но очень важны на практике. Я старался свести к минимуму количество формул, предпочитая интуитивное описание происходящего математической строгости. Это может вызвать негодование исследователей, работающих в области RL, заранее прошу у них прощения. Однако, по моему опыту, такой стиль изложения гораздо эффективнее для выработки интуиции в сложных областях, особенно если вы не собираетесь заниматься «высокой наукой», а просто хотите осознанно применять научные наработки на практике.
