critic agent

critic agent

Определение

Агент, проверяющий вывод основного агента на корректность, полноту и следование инструкциям, и дающий структурированную обратную связь для итеративного улучшения. Также используется как компонент оценки преимущества в PPO.

Где встречается

Навигация