embedding
embedding
Определение
Преобразование chunk'ов в векторные представления для поиска в векторной БД.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 5. Как вы оцениваете качество retrieval'а в RAG-системе
- 6. Что такое гибридный поиск и когда он нужен
- 13. Как вы загружаете 1000 документов в RAG максимально эффективно
- 16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 50. Как вы ограничиваете бесконечный цикл агента
- 62. Какие метрики вы мониторите для LLM в production
- 71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
- 77. Как вы оптимизируете embedding генерацию для большого количества документов
- 78. Какие LLM для русского языка вы используете
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 86. Как вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”
- 104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
- 112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 128. Что такое Model Poisoning в контексте RAG и как защититься
- 133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
- 141. В чем разница между Naive RAG, Adaptive RAG и Agentic RAG
- 144. Как вы передаете состояние (state) между шагами агента
- 151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
- 153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 177. Как вы измеряете дрейф модели (model drift) для LLM
- 178. Чем отличается эвалюация LLM от эвалюации традиционных ML моделей
- 182. Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением
- 186. Что такое «shaping schema through language representation»
- 187. Как язык промпта (русский vs английский) влияет на схему рассуждения
- 192. Как вы оцениваете качество language representation для задачи
- 198. Какие ограничения у language representation design
- 199. Как вы combine language representation с DSPy
- 200. Что вы видите следующим горизонтом после language representation
- 241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
- 245. Как вы делаете cache invalidation для semantic cache при обновлении знаний
- 251. Как вы деплоите LLM на spot instances в облаке
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 257. Как вы дедуплицируете документы перед индексацией в RAG