Parameter-Efficient Fine-Tuning
Parameter-Efficient Fine-Tuning
Определение
Семейство методов дообучения, при которых обновляется лишь небольшая часть параметров (1–5%) при замороженных остальных; пример — LoRA.
Где встречается
- 22. Какие методы fine-tuning вы знаете и какой используете чаще всего
- 24. Какой размер датасета нужен для fine-tuning
- 26. Как вы предотвращаете catastrophic forgetting при fine-tuning
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 29. Как fine-tune модель для следования сложным инструкциям
- 33. Какие фреймворки для fine-tuning вы используете
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
- 40. Как вы объединяете несколько LoRA адаптеров для разных задач
- 78. Какие LLM для русского языка вы используете
- 356. Что такое data poisoning атака на fine-tuning и как защититься
- 400. Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофиче...
- 481. Что такое LoRA для training (инференс уже знаем)
- 482. Как работает QLoRA (Quantized LoRA) для training
- 484. Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA
- 699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
- 800+ вопросов
- 65. Реализовать process reward model
- 223. Fine-tune LoRA для стиля
- 235. LoRA для function calling
- 244. Fine-tune QLoRA на 1 GPU