Parameter-Efficient Fine-Tuning

Определение

Семейство методов дообучения, при которых обновляется лишь небольшая часть параметров (1–5%) при замороженных остальных; пример — LoRA.

Где встречается

22. Какие методы fine-tuning вы знаете и какой используете чаще всего
24. Какой размер датасета нужен для fine-tuning
26. Как вы предотвращаете catastrophic forgetting при fine-tuning
28. Какие данные нужны для fine-tuning на кастомный стиль общения
29. Как fine-tune модель для следования сложным инструкциям
33. Какие фреймворки для fine-tuning вы используете
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
40. Как вы объединяете несколько LoRA адаптеров для разных задач
78. Какие LLM для русского языка вы используете
356. Что такое data poisoning атака на fine-tuning и как защититься
400. Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофиче...
481. Что такое LoRA для training (инференс уже знаем)
482. Как работает QLoRA (Quantized LoRA) для training
484. Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA
699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
800+ вопросов
65. Реализовать process reward model
223. Fine-tune LoRA для стиля
235. LoRA для function calling
244. Fine-tune QLoRA на 1 GPU

Parameter-Efficient Fine-Tuning

Parameter-Efficient Fine-Tuning

Определение

Где встречается

Навигация