Inverted File Index
Inverted File Index
Определение
Метод приближённого поиска ближайших соседей, основанный на предварительной кластеризации векторов и поиске только в нескольких ближайших кластерах. Часто комбинируется с Product Quantization (IVF+PQ) для баланса скорости и точности.
Где встречается
- 77. Как вы оптимизируете embedding генерацию для большого количества документов
- 79. Как вы обновляете embedding модель без полной переиндексации
- 222. Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speedquality
- 223. Как работает Product Quantization (PQ) для сжатия векторов
- 224. OPQ (Optimized Product Quantization) vs PQ — в чем разница
- 225. Как вы выбираете параметры HNSW (M, ef_construction, ef_search) под свои данные
- 230. Что такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид
- 232. Что такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (16GB)
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 269. Как вы обрабатываете streaming данные для real-time RAG
- 285. Как вы анализируете embedding geometry для отладки retrieval качества
- 525. Как вы управляете cost хранения векторной БД при миллиарде векторов
- 541. Как вы делаете RAG для изображений (image retrieval without text)
- 555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
- 563. Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)
- 750. Как устроена Memory в Harness (in-memory, fs, vector stores, relay)
- Практика
- 800+ вопросов
- 12. Настроить mmap для embeddings
- 269. Реализовать hard negative mining для retrieval
- 285. Реализовать synthetic benchmark генератор