fine-tuning
fine-tuning
Определение
Метод адаптации предобученной модели под конкретную задачу путём дообучения на кастомном датасете для улучшения производительности.
Где встречается
- 16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 22. Какие методы fine-tuning вы знаете и какой используете чаще всего
- 24. Какой размер датасета нужен для fine-tuning
- 25. Как вы оцениваете качество после fine-tuning
- 26. Как вы предотвращаете catastrophic forgetting при fine-tuning
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
- 38. Как вы fine-tune модель для функции вызов внешнего API
- 70. Как вы снижаете стоимость LLM в production на 50%+
- 72. OpenAI vs Антропик vs Groq vs Self-hosted — что выбираете
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 78. Какие LLM для русского языка вы используете
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 83. Как спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)
- 89. Как вы спроектируете систему, которая может переключаться между разными LLM провайдерами без даунтайма
- 105. Когда DSPy не подходит Назовите 3 сценария.
- 112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
- 132. Как вы калибруете LLM-судью под человеческие оценки
- 133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
- 138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной
- 139. Как вы оцениваете cost-effectiveness LLM-пайплайна
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 149. Как спроектировать агента, который может самоисправляться (self-correction)
- 151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
- 153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 172. Что такое LiveIdeaBench и для чего он нужен
- 175. Как детектировать «объяснительно-решенческую декомпозицию»
- 182. Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением
- 193. Что такое «Clone-Structured Causal Graphs» (CSCG) и как они связаны со схемами
- 195. Как вы проверяете, что модель действительно использует структуру представления, а не игнорирует ее
- 234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
- 251. Как вы деплоите LLM на spot instances в облаке
- 258. Что такое weak supervision для разметки данных для fine-tuning и как его применить
- 259. Как вы генерируете synthetic данные для instruction tuning