English translation is not available yet. Showing Russian content.
adaptive KL controller
adaptive KL controller
Определение
Механизм автоматической подстройки коэффициента KL-штрафа при быстром росте KL-дивергенции для стабилизации обучения.
English translation is not available yet. Showing Russian content.
Механизм автоматической подстройки коэффициента KL-штрафа при быстром росте KL-дивергенции для стабилизации обучения.