HNSW
HNSW
Определение
Иерархический алгоритм приближённого поиска ближайших соседей на основе многослойного графа с жадным поиском.
Где встречается
- 7. Как вы уменьшаете latency RAG-системы (время ответа)
- 79. Как вы обновляете embedding модель без полной переиндексации
- 81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG
- 222. Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speedquality
- 223. Как работает Product Quantization (PQ) для сжатия векторов
- 225. Как вы выбираете параметры HNSW (M, ef_construction, ef_search) под свои данные
- 226. Что такое Filtered ANN Search и как оно реализовано в Qdrant vs Weaviate
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 269. Как вы обрабатываете streaming данные для real-time RAG
- 285. Как вы анализируете embedding geometry для отладки retrieval качества
- 372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
- 380. Что такое semantic ranking на основе embeddings (вторая стадия после ANN)
- 403. Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.
- 519. Как вы делаете backfill эмбеддингов при смене embedding модели
- 525. Как вы управляете cost хранения векторной БД при миллиарде векторов
- 541. Как вы делаете RAG для изображений (image retrieval without text)
- 546. Как вы индексируете видео-контент в RAG-системе
- 555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
- 563. Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)
- 750. Как устроена Memory в Harness (in-memory, fs, vector stores, relay)
- Практика
- 800+ вопросов
- 12. Настроить mmap для embeddings