English translation is not available yet. Showing Russian content.
online reinforcement learning
online reinforcement learning
Определение
Парадигма обучения агента в реальном времени через взаимодействие со средой и обновление политики на собранных траекториях.