LoRA
LoRA
Определение
Low-Rank Adaptation — метод параметро-эффективного дообучения больших моделей, при котором обучаются только небольшие низкоранговые адаптеры (1-2% параметров), позволяя достичь качества 95-98% от полного fine-tuning.
Где встречается
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 22. Какие методы fine-tuning вы знаете и какой используете чаще всего
- 24. Какой размер датасета нужен для fine-tuning
- 25. Как вы оцениваете качество после fine-tuning
- 26. Как вы предотвращаете catastrophic forgetting при fine-tuning
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 29. Как fine-tune модель для следования сложным инструкциям
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 33. Какие фреймворки для fine-tuning вы используете
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
- 40. Как вы объединяете несколько LoRA адаптеров для разных задач
- 78. Какие LLM для русского языка вы используете
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 356. Что такое data poisoning атака на fine-tuning и как защититься
- 362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
- 367. Что такое Q-Former в BLIP-2 и зачем он нужен
- 418. Как вы деплоите LLM на spot instances в облаке
- 435. Почему MoE (Mixture of Experts) быстрее dense модели при инференсе
- 468. Почему small batch size (32) ухудшает training стабильность
- 469. Как работает Mixed Precision Training (FP16 + FP32 master веса)
- 481. Что такое LoRA для training (инференс уже знаем)
- 482. Как работает QLoRA (Quantized LoRA) для training
- 484. Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA
- 493. Что такое Positional bias в LLM-as-Judge и как его исправить
- 540. Как работает Q-Former в BLIP-2 и зачем он нужен
- 554. Как вы делаем image retrieval по тексту с высокой точностью
- 621. Как вы защищаете LLM от prompt injection через изображения (VL-модели)
- 659. Что такое Adam optimizer и как работают его параметры (β1, β2, ε, learning rate)
- 699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
- 780. Как измерять ROI от fine-tuning (окупается ли дообучение более дешёвым инференсом)
- 842. Как работает prefix caching и prompt caching у провайдеров
- 848. Как работает динамическое бэтчирование в TGI vs vLLM
- 888. Как защититься от prompt stealing (кража системного промпта)
- Практика
- 800+ вопросов
- 65. Реализовать process reward model
- 223. Fine-tune LoRA для стиля
- 235. LoRA для function calling