LoRA

Определение

Low-Rank Adaptation — метод параметро-эффективного дообучения больших моделей, при котором обучаются только небольшие низкоранговые адаптеры (1-2% параметров), позволяя достичь качества 95-98% от полного fine-tuning.

Где встречается

21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
22. Какие методы fine-tuning вы знаете и какой используете чаще всего
24. Какой размер датасета нужен для fine-tuning
25. Как вы оцениваете качество после fine-tuning
26. Как вы предотвращаете catastrophic forgetting при fine-tuning
28. Какие данные нужны для fine-tuning на кастомный стиль общения
29. Как fine-tune модель для следования сложным инструкциям
32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
33. Какие фреймворки для fine-tuning вы используете
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
40. Как вы объединяете несколько LoRA адаптеров для разных задач
78. Какие LLM для русского языка вы используете
117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
356. Что такое data poisoning атака на fine-tuning и как защититься
362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
367. Что такое Q-Former в BLIP-2 и зачем он нужен
418. Как вы деплоите LLM на spot instances в облаке
435. Почему MoE (Mixture of Experts) быстрее dense модели при инференсе
468. Почему small batch size (32) ухудшает training стабильность
469. Как работает Mixed Precision Training (FP16 + FP32 master веса)
481. Что такое LoRA для training (инференс уже знаем)
482. Как работает QLoRA (Quantized LoRA) для training
484. Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA
493. Что такое Positional bias в LLM-as-Judge и как его исправить
540. Как работает Q-Former в BLIP-2 и зачем он нужен
554. Как вы делаем image retrieval по тексту с высокой точностью
621. Как вы защищаете LLM от prompt injection через изображения (VL-модели)
659. Что такое Adam optimizer и как работают его параметры (β1, β2, ε, learning rate)
699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
780. Как измерять ROI от fine-tuning (окупается ли дообучение более дешёвым инференсом)
842. Как работает prefix caching и prompt caching у провайдеров
848. Как работает динамическое бэтчирование в TGI vs vLLM
888. Как защититься от prompt stealing (кража системного промпта)
Практика
800+ вопросов
65. Реализовать process reward model
223. Fine-tune LoRA для стиля
235. LoRA для function calling

LoRA

LoRA

Определение

Где встречается

Навигация

LoRA

LoRA

Определение

Где встречается

Навигация