fine-tuning

Определение

Метод адаптации предобученной модели под конкретную задачу путём дообучения на кастомном датасете для улучшения производительности.

Где встречается

16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
22. Какие методы fine-tuning вы знаете и какой используете чаще всего
24. Какой размер датасета нужен для fine-tuning
25. Как вы оцениваете качество после fine-tuning
26. Как вы предотвращаете catastrophic forgetting при fine-tuning
28. Какие данные нужны для fine-tuning на кастомный стиль общения
32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
38. Как вы fine-tune модель для функции вызов внешнего API
70. Как вы снижаете стоимость LLM в production на 50%+
72. OpenAI vs Антропик vs Groq vs Self-hosted — что выбираете
74. Как вы мониторите дрейф данных (data drift) для RAG
78. Какие LLM для русского языка вы используете
80. Какие 3 книгикурса вы рекомендуете по production LLM
83. Как спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)
89. Как вы спроектируете систему, которая может переключаться между разными LLM провайдерами без даунтайма
105. Когда DSPy не подходит Назовите 3 сценария.
112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
132. Как вы калибруете LLM-судью под человеческие оценки
133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной
139. Как вы оцениваете cost-effectiveness LLM-пайплайна
140. Как вы проверяете, что новая версия модели не сломала старые кейсы
149. Как спроектировать агента, который может самоисправляться (self-correction)
151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
164. Какие trade-offs между разными архитектурами speculative decoding
172. Что такое LiveIdeaBench и для чего он нужен
175. Как детектировать «объяснительно-решенческую декомпозицию»
182. Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением
193. Что такое «Clone-Structured Causal Graphs» (CSCG) и как они связаны со схемами
195. Как вы проверяете, что модель действительно использует структуру представления, а не игнорирует ее
234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
251. Как вы деплоите LLM на spot instances в облаке
258. Что такое weak supervision для разметки данных для fine-tuning и как его применить
259. Как вы генерируете synthetic данные для instruction tuning

fine-tuning

fine-tuning

Определение

Где встречается

Навигация

fine-tuning

fine-tuning

Определение

Где встречается

Навигация