Поиск
- wikiдвухступенчатый ретривал
# двухступенчатый ретривал ## Определение Метод поиска в RAG, при котором сначала выполняется быстрый ANN-поиск для отбора кандидатов, а затем медленный…
- wikiHugging Face CrossEncoder
# Hugging Face CrossEncoder ## Определение Библиотека для cross-encoder моделей, используемая в двухступенчатом ретривале (fast ANN + slow cross-encoder) для RAG…
- wikiColBERT
# ColBERT ## Определение Модель multi-vector retrieval с late interaction между запросом и каждым токеном документа, альтернатива двухступенчатому ретривалу. ## Где встречается…
- wikiSentenceTransformers
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikitrade-off
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiLate interaction
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiMS MARCO
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikitrade-off качество/латенси
# trade-off качество/латенси ## Определение Компромисс между точностью результатов и временем ответа, ключевой при выборе стратегий ретривала или декодирования. ## Где…
- wikiвекторный индекс
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiGPU
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- answerКак вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG?
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG? ## Краткий тезис [[Вики/двухступенчатый ретривал\|Двухступенчатый ретривал]] — это…
- wikiBi-encoder
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikihard negatives
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiпайплайн
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikitop-k
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiContextual retrieval
# Contextual retrieval ## Определение Метод поиска, обогащающий чанки документов контекстной информацией (например, метаданными) для улучшения релевантности извлечения и смягчения проблемы lost…
- wikiANN
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiNDCG
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiLLM distillation
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiHNSW
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiStreamlit
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiRecall@k
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikibatch size
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiкосинусная близость
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikireranking
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiRAG
…Пайплайн состоит из ингреста, чанкинга, эмбеддинга, индексации, ретривала, переранжирования и генерации. Позволяет модели отвечать по актуальным источникам, снижая галлюцинации и…
- answerКак бы вы спроектировали RAG-систему для 10 000 документов с разной структурой (PDF, Word, сканы, HTML, Excel)?
…Высокая | Применение в [[Вики/RAG\|RAG]] ([[Вики/двухступенчатый ретривал\|двухступенчатый ретривал]] 1. [[Вики/Chroma\|Векторная БД]] ([[Вики/Bi-encoder\|bi…
- answerКак language representation связан с тест-тайм компьютингом?
…Создайте двух агентов: - Агент с простым ретривалом (1 шаг). - Агент с графовым обходом (находить сущность, затем обход соседей). 4. Прогоните…
- answerКак вы делаете RAG для видео (индексация subshots, аудио, ключевые кадры)?
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] | Какие метрики для мультимодального RAG? | | [[373. Что…
- answerКак вы делаете load shedding при перегрузке LLM сервера?
…Если сервис ретривалов (векторная БД) начал отвечать с ошибками, circuit breaker может быстро завершать запросы без обращения к LLM, экономя…
- answerЧто такое multi-query attention (MQA) и grouped-query attention (GQA) и зачем они?
…Если длина контекста большая (сумма всех сообщений истории, ретривальных документов), KV-кэш быстро растёт. Использование [[Вики/Grouped-Query Attention\|GQA…
- answerЧто такое LambdaMART и как он используется для reranking в RAG?
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] - Индекс: [[00. Индекс разборов]]
- answerЧто такое learning-to-rank (LTR) и как он применяется к retrieval для LLM?
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] - Следующий: [[374. Как вы делаете query rewriting…
- answerКак вы проектируете систему для real-time video understanding (поток с камер)?
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] | Как использовать memory в AI-агентах? | | [[373…
- indexИндекс разборов
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372. Как вы строите двухступенчатый ретривал (fast ANN…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…Search & Ranking (371-380) | Вопрос | Тема | Практические задачи (#) | |--------|------|------------------------| | 371 | LambdaMART | Pet 243 | | 372 | Двухступенчатый ретривал | Pet 243, Pet 227 | | 373…
- indexОглавление
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372. Как вы строите двухступенчатый ретривал (fast ANN…
- wikiИндекс терминов
…Групповая стратификация]] ## Д - [[Вики/датасеты|датасеты]] - [[Вики/двухступенчатый ретривал|двухступенчатый ретривал]] - [[Вики/Двухфазная миграция|Двухфазная миграция]] - [[Вики/деанонимизация|деанонимизация]] - [[Вики…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG?** > *Ответ:* Step 1: ANN (HNSW) → top-100. Step…