Instruction tuning
Instruction tuning
Определение
Процесс дообучения LLM на наборе инструкций и ответов для улучшения следования инструкциям.
Где встречается
- 29. Как fine-tune модель для следования сложным инструкциям
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 33. Какие фреймворки для fine-tuning вы используете
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 258. Что такое weak supervision для разметки данных для fine-tuning и как его применить
- 259. Как вы генерируете synthetic данные для instruction tuning
- 514. Как вы генерируете synthetic данные для instruction tuning
- 681. Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct
- 683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
- Практика
- 800+ вопросов
- 235. LoRA для function calling
- 244. Fine-tune QLoRA на 1 GPU
- 267. Реализовать Evol-Instruct для instruction tuning