когда думаешь, что вроде разобрался с темой машинного обучения, а тут еще полно всего,,, просто бесконечность. Но книги определенно помогают хоть немного держаться в теме на плаву. показывают, применяемые сейчас алгоритмы
Данное руководство по усиленному обучению (Reinforcement Learning, RL), охватывает теоретические основы, практические применения и современные достижения. В начале дается определение RL, его исторический контекст и ключевые отличия от других видов машинного обучения. Примеры применения RL охватывают игры, робототехнику, финансовые рынки и управление ресурсами. Математические основы включают марковские процессы принятия решений, состояния, действия, награды и политики, а также Беллмановские уравнения и итерацию ценности. Основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента политики, REINFORCE и Actor-Critic, рассматриваются вместе с моделями на основе планирования и глубокого усиленного обучения (DQN, DDPG, A3C). Практическая часть книги включает использование OpenAI Gym и других сред, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.
когда думаешь, что вроде разобрался с темой машинного обучения, а тут еще полно всего,,, просто бесконечность. Но книги определенно помогают хоть немного держаться в теме на плаву. показывают, применяемые сейчас алгоритмы
Из книги узнал много нового, ошибочно думал, что не должно сильно отличаться от других видов обучения, но на практике оказалось совсем иначе. Так что книга оказалась полезной и главное понятной!
Отзывы 2