Contents
Questions
Practice
Wiki
Community materials
Tests
Search

✈Telegram @ai_varo

…

Contents/Wiki/Hit rate

English translation is not available yet. Showing Russian content.

Hit rate

Hit rate

Определение

Доля запросов, для которых хотя бы один релевантный документ найден в результатах поиска (обычно в топ-k). Используется как офлайн-метрика качества retrieval.

Где встречается

1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
2 Как вы решаете проблему lost in the middle при работе с длинными контекстами
3 Какие стратегии chunking'а вы знаете и когда какую применяете
5. Как вы оцениваете качество retrieval'а в RAG-системе
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
41. LangChain vs LlamaIndex vs Haystack — что выберете и почему
69. Как вы организуете CICD для RAG-пайплайна
115. Как вы обрабатываете большие таблицы в RAG (500+ строк)
119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
192. Как вы оцениваете качество language representation для задачи
222. Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speedquality
223. Как работает Product Quantization (PQ) для сжатия векторов
225. Как вы выбираете параметры HNSW (M, ef_construction, ef_search) под свои данные
264. Как вы делаете backfill эмбеддингов при смене embedding модели
272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
376. Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса
379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
380. Что такое semantic ranking на основе embeddings (вторая стадия после ANN)
410. Как вы делаете blue-green deployment для RAG системы с zero downtime
503. Как вы измеряете drift retrieval-качества в RAG (когда документы меняются)
519. Как вы делаете backfill эмбеддингов при смене embedding модели
531. Как вы делаете active learning loop для улучшения retrieval
554. Как вы делаем image retrieval по тексту с высокой точностью
555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
556. Как вы делаете extraction таблиц из PDF для RAG
559. Что такое Audio RAG (RAG для аудиофайлов)
599. Что такое adversarial retrieval (атака на retrieval компонент RAG)
635. Как работает RAPTOR (иерархическое суммирование для длинного контекста)
645. Что такое hierarchical retrieval для long context RAG (когда контекст 100k)
668. Что такое индуктивные biases трансформеров (positional invariance, order sensitivity)
688. Что такое synthetic data collapse (когда синтетические данные деградируют со временем)
800+ вопросов

Навигация

Индекс терминов
Индекс разборов
Оглавление