reranking

Определение

Техника улучшения результатов поиска (retrieval) путём повторного ранжирования кандидатов с помощью более точной модели, часто cross-encoder, для повышения релевантности верхних позиций.

Где встречается

1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
7. Как вы уменьшаете latency RAG-системы (время ответа)
14. Как вы обрезаете контекст, когда retrieved documents больше контекстного окна LLM
16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
96. Как вы предотвращаете галлюцинации в production RAG системе
116. Как вы индексируете видео-контент в RAG-системе
128. Что такое Model Poisoning в контексте RAG и как защититься
192. Как вы оцениваете качество language representation для задачи
196. Как language representation связан с тест-тайм компьютингом
241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
243. Как вы делаете blue-green deployment для RAG системы с zero downtime
371. Что такое LambdaMART и как он используется для reranking в RAG
372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
373. Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM
375. Как вы калибруете retrieval confidence для threshold-based filtering
379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
380. Что такое semantic ranking на основе embeddings (вторая стадия после ANN)
408. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
416. Как вы делаете load shedding при перегрузке LLM сервера
495. Что такое pairwise comparison vs scalar rating Когда что использовать
517. Как вы проектируете feature store для ML фичей, используемых LLM
525. Как вы управляете cost хранения векторной БД при миллиарде векторов
529. Как вы проектируете feature engineering для контекста RAG (кроме текста)
531. Как вы делаете active learning loop для улучшения retrieval
541. Как вы делаете RAG для изображений (image retrieval without text)
554. Как вы делаем image retrieval по тексту с высокой точностью
555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
559. Что такое Audio RAG (RAG для аудиофайлов)
563. Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)
571. Как работают verifier models для agentic RAG и зачем они нужны
634. Что такое lost in the middle и как это связано с attention sink
644. Как вы оцениваете faithfulness ответа на длинном контексте (когда много информации)
645. Что такое hierarchical retrieval для long context RAG (когда контекст 100k)
647. Как вы делаете long context для code generation (модель должна видеть весь репозиторий)
668. Что такое индуктивные biases трансформеров (positional invariance, order sensitivity)
694. Как работает weak supervision для synthetic данных (создание правил разметки)
741. Что такое Partial Harnessing (частичное управление)
777. Что такое «cost per good answer» и как его измерять
809. Как управлять версиями промптов в production (best practices)

reranking

reranking

Определение

Где встречается

Навигация

reranking

reranking

Определение

Где встречается

Навигация