Regularized Optimization

Regularized Optimization

Определение

Регуляризованная оптимизация — это подход к обучению моделей, при котором к целевой функции (например, максимизации награды) добавляется штрафное слагаемое, ограничивающее отклонение от некоторого эталонного поведения. В контексте обучения с подкреплением это позволяет сохранить языковые способности базовой модели, не позволяя новой политике слишком сильно удаляться от исходной.

Где встречается

Навигация