Faiss
Faiss
Определение
Библиотека от Facebook AI для эффективного поиска ближайших соседей по векторным индексам, часто используемая для хранения и поиска эмбеддингов.
Где встречается
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 42. Что такое LangGraph и зачем он нужен
- 51. Как вы передаёте контекст между несколькими агентами (multi-agent system)
- 69. Как вы организуете CICD для RAG-пайплайна
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 77. Как вы оптимизируете embedding генерацию для большого количества документов
- 78. Какие LLM для русского языка вы используете
- 79. Как вы обновляете embedding модель без полной переиндексации
- 86. Как вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”
- 91. Что такое Semantic Caching и как вы его реализуете
- 95. Как вы храните историю изменений промптов (prompt lineage)
- 96. Как вы предотвращаете галлюцинации в production RAG системе
- 104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
- 112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
- 116. Как вы индексируете видео-контент в RAG-системе
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 128. Что такое Model Poisoning в контексте RAG и как защититься
- 134. Как вы оцениваете faithfulness RAG-ответа в production автоматически
- 139. Как вы оцениваете cost-effectiveness LLM-пайплайна
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 141. В чем разница между Naive RAG, Adaptive RAG и Agentic RAG
- 143. Как вы боретесь с «бесконечным циклом» агента в Agentic RAG
- 144. Как вы передаете состояние (state) между шагами агента
- 149. Как спроектировать агента, который может самоисправляться (self-correction)
- 174. Что такое «многошаговая когерентность» (coherence illusion) в cascading agent systems
- 175. Как детектировать «объяснительно-решенческую декомпозицию»
- 196. Как language representation связан с тест-тайм компьютингом
- 221. Как работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне
- 222. Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speedquality
- 223. Как работает Product Quantization (PQ) для сжатия векторов
- 224. OPQ (Optimized Product Quantization) vs PQ — в чем разница
- 225. Как вы выбираете параметры HNSW (M, ef_construction, ef_search) под свои данные
- 229. Как вы измеряем recall@k для ANN индекса и какой порог acceptable
- 230. Что такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид
- 231. Как вы обновляете ANN индекс при добавлении новых векторов без перестроения
- 232. Что такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (16GB)
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user