adaptive KL controller
adaptive KL controller
Определение
Механизм автоматической подстройки коэффициента KL-штрафа при быстром росте KL-дивергенции для стабилизации обучения.
Механизм автоматической подстройки коэффициента KL-штрафа при быстром росте KL-дивергенции для стабилизации обучения.