中文翻译暂不可用,显示俄语原文。
DPOTrainer
DPOTrainer
Определение
Компонент библиотеки TRL для обучения модели методом DPO. Требует задания model, ref_model и dataset с предпочтениями.
中文翻译暂不可用,显示俄语原文。
Компонент библиотеки TRL для обучения модели методом DPO. Требует задания model, ref_model и dataset с предпочтениями.