English translation is not available yet. Showing Russian content.
Offline preference optimization
Offline preference optimization
Определение
Группа методов выравнивания моделей, которые оптимизируют предпочтения на фиксированных датасетах без генерации новых данных в реальном времени.