中文翻译暂不可用,显示俄语原文。

Actor-Critic architecture

Actor-Critic architecture

Определение

Архитектура с двумя компонентами: агент-исполнитель генерирует ответ, а агент-критик оценивает его и даёт обратную связь; используется для самоисправления агентов и online reinforcement learning.

Где встречается

Навигация