векторная БД
векторная БД
Определение
Специализированная база данных, оптимизированная для хранения и быстрого поиска векторных эмбеддингов, поддерживающая семантический поиск и фильтрацию по метаданным; широко используется в RAG-системах для retrieval и памяти агентов.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 13. Как вы загружаете 1000 документов в RAG максимально эффективно
- 14. Как вы обрезаете контекст, когда retrieved documents больше контекстного окна LLM
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 54. Что такое Semantic Kernel и чем отличается от LangChain
- 79. Как вы обновляете embedding модель без полной переиндексации
- 104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
- 112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
- 116. Как вы индексируете видео-контент в RAG-системе
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
- 123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
- 128. Что такое Model Poisoning в контексте RAG и как защититься
- 141. В чем разница между Naive RAG, Adaptive RAG и Agentic RAG
- 142. Как вы проектируете «планировщика» (planner) для Agentic RAG
- 144. Как вы передаете состояние (state) между шагами агента
- 145. LangGraph vs CrewAI vs AutoGen — что вы выберете и для каких задач
- 149. Как спроектировать агента, который может самоисправляться (self-correction)
- 245. Как вы делаете cache invalidation для semantic cache при обновлении знаний
- 249. Как вы делаете load shedding при перегрузке LLM сервера
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 257. Как вы дедуплицируете документы перед индексацией в RAG
- 263. Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)
- 266. Как вы делаете incremental ingestion для часто меняющихся документов
- 283. Что такое selective attention в контексте long context обработки
- 353. Как работает embedding poisoning для RAG и как защититься
- 361. Как работает CLIP и как training contrastive loss выравнивает текст и изображения
- 374. Как вы делаете query rewriting и query expansion в RAG
- 390. Как вы проектируем on-call ротацию для AI сервиса
- 428. Как вы проектируете Kafka топологии для RAG ingestion
- 536. Как работает CLIP (Contrastive Language-Image Pre-training) внутренне
- 541. Как вы делаете RAG для изображений (image retrieval without text)
- 546. Как вы индексируете видео-контент в RAG-системе
- 555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
- 800+ вопросов