proportional controller
proportional controller
Определение
Пропорциональный контроллер (proportional controller) — это регулятор, который генерирует управляющий сигнал, пропорциональный текущей ошибке. В машинном обучении, например в алгоритме PPO, пропорциональный контроллер применяется для динамической корректировки коэффициента KL-штрафа, чтобы удерживать новую политику вблизи старой. Это позволяет балансировать между исследованием и стабильностью обучения.