中文翻译暂不可用,显示俄语原文。

online reinforcement learning

online reinforcement learning

Определение

Парадигма обучения агента в реальном времени через взаимодействие со средой и обновление политики на собранных траекториях.

Где встречается

Навигация