SFTTrainer
SFTTrainer
Определение
Компонент библиотеки Hugging Face TRL для supervised fine-tuning LLM на парах инструкция-ответ.
Где встречается
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 33. Какие фреймворки для fine-tuning вы используете
- 38. Как вы fine-tune модель для функции вызов внешнего API
- 681. Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct
- 800+ вопросов
- 223. Fine-tune LoRA для стиля
- 235. LoRA для function calling
- 244. Fine-tune QLoRA на 1 GPU