Qdrant
Qdrant
Определение
Qdrant — векторная база данных, оптимизированная для production-сценариев: поддерживает фильтрацию, гибридный поиск, gRPC, multi-tenancy и pre-filtering. Широко используется для хранения и поиска эмбеддингов в RAG-системах.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 3 Какие стратегии chunking'а вы знаете и когда какую применяете
- 5. Как вы оцениваете качество retrieval'а в RAG-системе
- 6. Что такое гибридный поиск и когда он нужен
- 8. Как вы обрабатываете запросы, на которые нет ответа в документах
- 9. Как вы обновляете документы в существующей RAG-системе
- 11. Что такое Hypothetical Document Embeddings (HyDE) и зачем
- 12. Как вы фильтруете документы по метаданным в векторной БД
- 13. Как вы загружаете 1000 документов в RAG максимально эффективно
- 18. Что такое Multi-vector retrieval и зачем он нужен
- 20. Как вы обеспечиваете, что RAG работает с документами на русском и английском одновременно
- 41. LangChain vs LlamaIndex vs Haystack — что выберете и почему
- 43. Как спроектировать агента, который может выполнять цепочку из 5-10 действий
- 59. n8n, Make, Zapier — как вы интегрируете их с LLM
- 69. Как вы организуете CICD для RAG-пайплайна
- 71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 79. Как вы обновляете embedding модель без полной переиндексации
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG
- 83. Как спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)
- 86. Как вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”
- 91. Что такое Semantic Caching и как вы его реализуете
- 115. Как вы обрабатываете большие таблицы в RAG (500+ строк)
- 116. Как вы индексируете видео-контент в RAG-системе
- 221. Как работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне
- 225. Как вы выбираете параметры HNSW (M, ef_construction, ef_search) под свои данные
- 229. Как вы измеряем recall@k для ANN индекса и какой порог acceptable
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 264. Как вы делаете backfill эмбеддингов при смене embedding модели
- 266. Как вы делаете incremental ingestion для часто меняющихся документов
- 269. Как вы обрабатываете streaming данные для real-time RAG
- 271. Как вы делаете schema evolution для метаданных документов в RAG
- 378. Как работает многогранный (faceted) поиск в RAG с фильтрами
- 384. Как вы проводим chaos engineering для RAG системы
- 389. Как вы делаем disaster recovery с RPO 1 минута
- 403. Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.
- 410. Как вы делаете blue-green deployment для RAG системы с zero downtime