reranking
reranking
Определение
Техника улучшения результатов поиска (retrieval) путём повторного ранжирования кандидатов с помощью более точной модели, часто cross-encoder, для повышения релевантности верхних позиций.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 7. Как вы уменьшаете latency RAG-системы (время ответа)
- 14. Как вы обрезаете контекст, когда retrieved documents больше контекстного окна LLM
- 16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 96. Как вы предотвращаете галлюцинации в production RAG системе
- 116. Как вы индексируете видео-контент в RAG-системе
- 128. Что такое Model Poisoning в контексте RAG и как защититься
- 192. Как вы оцениваете качество language representation для задачи
- 196. Как language representation связан с тест-тайм компьютингом
- 241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
- 243. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 371. Что такое LambdaMART и как он используется для reranking в RAG
- 372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
- 373. Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM
- 375. Как вы калибруете retrieval confidence для threshold-based filtering
- 379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
- 380. Что такое semantic ranking на основе embeddings (вторая стадия после ANN)
- 408. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
- 416. Как вы делаете load shedding при перегрузке LLM сервера
- 495. Что такое pairwise comparison vs scalar rating Когда что использовать
- 517. Как вы проектируете feature store для ML фичей, используемых LLM
- 525. Как вы управляете cost хранения векторной БД при миллиарде векторов
- 529. Как вы проектируете feature engineering для контекста RAG (кроме текста)
- 531. Как вы делаете active learning loop для улучшения retrieval
- 541. Как вы делаете RAG для изображений (image retrieval without text)
- 554. Как вы делаем image retrieval по тексту с высокой точностью
- 555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
- 559. Что такое Audio RAG (RAG для аудиофайлов)
- 563. Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)
- 571. Как работают verifier models для agentic RAG и зачем они нужны
- 634. Что такое lost in the middle и как это связано с attention sink
- 644. Как вы оцениваете faithfulness ответа на длинном контексте (когда много информации)
- 645. Что такое hierarchical retrieval для long context RAG (когда контекст 100k)
- 647. Как вы делаете long context для code generation (модель должна видеть весь репозиторий)
- 668. Что такое индуктивные biases трансформеров (positional invariance, order sensitivity)
- 694. Как работает weak supervision для synthetic данных (создание правил разметки)
- 741. Что такое Partial Harnessing (частичное управление)
- 777. Что такое «cost per good answer» и как его измерять
- 809. Как управлять версиями промптов в production (best practices)