English translation is not available yet. Showing Russian content.
Self-instruct
Self-instruct
Определение
Метод генерации синтетических инструкций для тонкой настройки, при котором LLM генерирует инструкции и ответы на основе seed-примеров с последующей фильтрацией низкокачественных данных.
Где встречается
- 83. Как спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)
- 259. Как вы генерируете synthetic данные для instruction tuning
- 514. Как вы генерируете synthetic данные для instruction tuning
- 681. Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 786. Что такое «golden dataset» для агента и как его создавать
- 800+ вопросов
- 95. Написать runbook для synthetic data collapse