Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
В этой книге:
Доставимо Ваше замовлення в будь-яке місто України. Способи доставки: кур'єром, Нова Пошта, Укрпошта, Justin. Всі замовлення пакуються супернадійно та застраховані.
GRENKA – інтернет магазин розваг. Ми менше, тому більш старанні :). Індивідуальний підхід і прямий зв'язок з директором.
Оплата замовлення будь-яким зручним для Вас способом наш обов'язок. Приват24, карта будь-якого банку світу, готівка банківський переказ або післяплата.
Ваш город: Киев
Обратный звонок
В корзине пусто,
пора покупать :)