Поиск

  • wikiдвухступенчатый ретривал

    # двухступенчатый ретривал ## Определение Метод поиска в RAG, при котором сначала выполняется быстрый ANN-поиск для отбора кандидатов, а затем медленный…

  • wikiHugging Face CrossEncoder

    # Hugging Face CrossEncoder ## Определение Библиотека для cross-encoder моделей, используемая в двухступенчатом ретривале (fast ANN + slow cross-encoder) для RAG…

  • wikiColBERT

    # ColBERT ## Определение Модель multi-vector retrieval с late interaction между запросом и каждым токеном документа, альтернатива двухступенчатому ретривалу. ## Где встречается…

  • wikiSentenceTransformers

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikitrade-off

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiLate interaction

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiMS MARCO

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikitrade-off качество/латенси

    # trade-off качество/латенси ## Определение Компромисс между точностью результатов и временем ответа, ключевой при выборе стратегий ретривала или декодирования. ## Где…

  • wikiвекторный индекс

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiGPU

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • answerКак вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG?

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG? ## Краткий тезис [[Вики/двухступенчатый ретривал\|Двухступенчатый ретривал]] — это…

  • wikiBi-encoder

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikihard negatives

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiпайплайн

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikitop-k

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiContextual retrieval

    # Contextual retrieval ## Определение Метод поиска, обогащающий чанки документов контекстной информацией (например, метаданными) для улучшения релевантности извлечения и смягчения проблемы lost…

  • wikiANN

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiNDCG

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiLLM distillation

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiHNSW

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiStreamlit

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiRecall@k

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikibatch size

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiкосинусная близость

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikireranking

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiRAG

    …Пайплайн состоит из ингреста, чанкинга, эмбеддинга, индексации, ретривала, переранжирования и генерации. Позволяет модели отвечать по актуальным источникам, снижая галлюцинации и…

  • answerКак бы вы спроектировали RAG-систему для 10 000 документов с разной структурой (PDF, Word, сканы, HTML, Excel)?

    …Высокая | Применение в [[Вики/RAG\|RAG]] ([[Вики/двухступенчатый ретривал\|двухступенчатый ретривал]] 1. [[Вики/Chroma\|Векторная БД]] ([[Вики/Bi-encoder\|bi…

  • answerКак language representation связан с тест-тайм компьютингом?

    …Создайте двух агентов: - Агент с простым ретривалом (1 шаг). - Агент с графовым обходом (находить сущность, затем обход соседей). 4. Прогоните…

  • answerКак вы делаете RAG для видео (индексация subshots, аудио, ключевые кадры)?

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] | Какие метрики для мультимодального RAG? | | [[373. Что…

  • answerКак вы делаете load shedding при перегрузке LLM сервера?

    …Если сервис ретривалов (векторная БД) начал отвечать с ошибками, circuit breaker может быстро завершать запросы без обращения к LLM, экономя…

  • answerЧто такое multi-query attention (MQA) и grouped-query attention (GQA) и зачем они?

    …Если длина контекста большая (сумма всех сообщений истории, ретривальных документов), KV-кэш быстро растёт. Использование [[Вики/Grouped-Query Attention\|GQA…

  • answerЧто такое LambdaMART и как он используется для reranking в RAG?

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] - Индекс: [[00. Индекс разборов]]

  • answerЧто такое learning-to-rank (LTR) и как он применяется к retrieval для LLM?

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] - Следующий: [[374. Как вы делаете query rewriting…

  • answerКак вы проектируете систему для real-time video understanding (поток с камер)?

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372]] | Как использовать memory в AI-агентах? | | [[373…

  • indexИндекс разборов

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING

    …Search & Ranking (371-380) | Вопрос | Тема | Практические задачи (#) | |--------|------|------------------------| | 371 | LambdaMART | Pet 243 | | 372 | Двухступенчатый ретривал | Pet 243, Pet 227 | | 373…

  • indexОглавление

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG\|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiИндекс терминов

    …Групповая стратификация]] ## Д - [[Вики/датасеты|датасеты]] - [[Вики/двухступенчатый ретривал|двухступенчатый ретривал]] - [[Вики/Двухфазная миграция|Двухфазная миграция]] - [[Вики/деанонимизация|деанонимизация]] - [[Вики…

  • question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG?** > *Ответ:* Step 1: ANN (HNSW) → top-100. Step…