Recall@k

Определение

Доля релевантных документов среди первых k результатов поиска; основная метрика качества retrieval в RAG-системах.

Где встречается

11. Что такое Hypothetical Document Embeddings (HyDE) и зачем
18. Что такое Multi-vector retrieval и зачем он нужен
69. Как вы организуете CICD для RAG-пайплайна
74. Как вы мониторите дрейф данных (data drift) для RAG
77. Как вы оптимизируете embedding генерацию для большого количества документов
79. Как вы обновляете embedding модель без полной переиндексации
86. Как вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”
114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
116. Как вы индексируете видео-контент в RAG-системе
123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
221. Как работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне
229. Как вы измеряем recall@k для ANN индекса и какой порог acceptable
230. Что такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид
231. Как вы обновляете ANN индекс при добавлении новых векторов без перестроения
232. Что такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (16GB)
233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
373. Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM
376. Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса
379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
502. Как вы AB тестируете две версии промпта в production
503. Как вы измеряете drift retrieval-качества в RAG (когда документы меняются)
519. Как вы делаете backfill эмбеддингов при смене embedding модели
525. Как вы управляете cost хранения векторной БД при миллиарде векторов
531. Как вы делаете active learning loop для улучшения retrieval
684. Как вы генерируете hard negative примеры для retrieval обучения
879. Как делать evaluation для long-context RAG (100k токенов)
883. Как защитить RAG от poisoning (вредоносные документы в базе знаний)
Практика
800+ вопросов
20. Настроить sharding для petabyte embeddings
42. Настроить hybrid search с весами
43. Реализовать RRF (Reciprocal Rank Fusion)
44. Настроить query expansion
50. Настроить contextual retrieval (Anthropic стиль)
91. Написать postmortem для retrieval degradation
227. RAG с гибридным поиском
229. Fine-tune embedding под домен

Recall@k

Recall@k

Определение

Где встречается

Навигация

Recall@k

Recall@k

Определение

Где встречается

Навигация