SFT

SFT

Определение

Supervised Fine-Tuning — метод дообучения модели на размеченных парах инструкция-ответ; первый этап RLHF для адаптации стиля и следования инструкциям.

Где встречается

Навигация