English translation is not available yet. Showing Russian content.
DPOTrainer
DPOTrainer
Определение
Компонент библиотеки TRL для обучения модели методом DPO. Требует задания model, ref_model и dataset с предпочтениями.
English translation is not available yet. Showing Russian content.
Компонент библиотеки TRL для обучения модели методом DPO. Требует задания model, ref_model и dataset с предпочтениями.