中文翻译暂不可用,显示俄语原文。
Recall@k
Recall@k
Определение
Доля релевантных документов среди первых k результатов поиска; основная метрика качества retrieval в RAG-системах.
Где встречается
- 11. Что такое Hypothetical Document Embeddings (HyDE) и зачем
- 18. Что такое Multi-vector retrieval и зачем он нужен
- 69. Как вы организуете CICD для RAG-пайплайна
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 77. Как вы оптимизируете embedding генерацию для большого количества документов
- 79. Как вы обновляете embedding модель без полной переиндексации
- 86. Как вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 116. Как вы индексируете видео-контент в RAG-системе
- 123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
- 221. Как работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне
- 229. Как вы измеряем recall@k для ANN индекса и какой порог acceptable
- 230. Что такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид
- 231. Как вы обновляете ANN индекс при добавлении новых векторов без перестроения
- 232. Что такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (16GB)
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 234. Что такое Learned Index Structures for ANN Новые подходы 2025-2026.
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
- 373. Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM
- 376. Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса
- 379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
- 502. Как вы AB тестируете две версии промпта в production
- 503. Как вы измеряете drift retrieval-качества в RAG (когда документы меняются)
- 519. Как вы делаете backfill эмбеддингов при смене embedding модели
- 525. Как вы управляете cost хранения векторной БД при миллиарде векторов
- 531. Как вы делаете active learning loop для улучшения retrieval
- 684. Как вы генерируете hard negative примеры для retrieval обучения
- 879. Как делать evaluation для long-context RAG (100k токенов)
- 883. Как защитить RAG от poisoning (вредоносные документы в базе знаний)
- Практика
- 800+ вопросов
- 20. Настроить sharding для petabyte embeddings
- 42. Настроить hybrid search с весами
- 43. Реализовать RRF (Reciprocal Rank Fusion)
- 44. Настроить query expansion
- 50. Настроить contextual retrieval (Anthropic стиль)
- 91. Написать postmortem для retrieval degradation
- 227. RAG с гибридным поиском
- 229. Fine-tune embedding под домен