Поиск

  • wikiLong Context RAG

    # Long Context RAG ## Определение Вариант RAG, предназначенный для работы с документами объёмом более 100k токенов. Требует специальных методов, таких как…

  • wikiRULER

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…

  • wikiweighted recall

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…

  • wikiLlama-3-8B-128k

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…

  • wikiLost in the Middle

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiLongBench

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…

  • wikiMulti-hop RAG

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiOpenAIEmbeddings

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiContext Coverage

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[276…

  • answerКак делать evaluation для long-context RAG (>100k токенов)?

    Long-Context RAG **[[Вики/History\|Context]] [[Вики/History\|Context]] [[Вики/Long Context\|Long-Context]] [[Вики/RAG\|RAG]]** — это модификация классического…

  • wikiGPT-4 Turbo

    …Как вы делаете длинный контекст для RAG (100k+ токенов в контексте)]] - [[636. Как вы проектируете промпт для long context рассуждения…

  • wikiSection Recall@k

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiChunk Recall@k

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiMistral-7B-Instruct

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…

  • wikiQuery embedding

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiHierarchical Hit Rate

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiRetrieval success rate

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…

  • wikisentence-transformers/all-MiniLM-L6-v2

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiCohere rerank

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiNeedle in a Haystack

    …тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)]] - [[631. Как вы делаете длинный контекст для RAG (100k…

  • wikiHierarchical Retrieval

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiRecursiveCharacterTextSplitter

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikisentence-level evaluation

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…

  • wikiTop-k routing

    …Как вы уменьшаете latency RAG-системы (время ответа)]] - [[283. Что такое selective attention в контексте long context обработки|283. Что…

  • wikiMemory Networks

    …Альтернатива RAG для долгосрочного запоминания. ## Где встречается - [[57. Настроить recurrent memory для long context|57. Настроить recurrent memory для long

  • wikimax_batched_tokens

    …Настроить chunked prefill для long context|212. Настроить chunked prefill для long context]] - [[236. RAG с оценкой faithfulness|236. RAG

  • wikiMulti-needle

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…

  • wikirecurrent memory

    RAG-систем. ## Где встречается - [[Практика|Практика]] - [[57. Настроить recurrent memory для long context|57. Настроить recurrent memory для long context

  • wikiPickle

    …Настроить recurrent memory для long context]] - [[104. Реализовать Session Management с TTL|104. Реализовать Session Management с TTL]] - [[227. RAG

  • wikiCommand R+

    …оптимизированная для RAG-сценариев и длинного контекста. ## Где встречается - [[639. Как вы делаете model selection для long context (какая модель…

  • wikifull file strategy

    …в RAG, при которой для релевантного фрагмента загружается весь файл целиком. ## Где встречается - [[647. Как вы делаете long context для…

  • wikiChunk overlap

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiheatmap

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[27…

  • wikiSliding window chunking

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiStreamingLLM

    …современные long-context LLM (GPT-4 1M, Claude 200k, Gemini 2M)]] - [[631. Как вы делаете длинный контекст для RAG (100k…

  • wikiReal-time ingestion

    …Когда SSM-архитектуры (Mamba, StripedHyena) лучше трансформеров для long context]] - [[851. Как строить streaming RAG pipeline (real-time ingestion)|851…

  • answerКак вы делаете model selection для long context (какая модель лучше держит 100k+)?

    …Почему long context важен для Agentic RAG? В архитектуре [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/agent\|агент]] может: - анализировать множество…

  • wikiContext precision

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • answerКак вы тестируете long-context capability модели (бенчмарки: RULER, Needle in a Haystack)?

    …Как вы уменьшаете latency RAG-системы (время ответа)\|7]] | Уменьшение latency RAG | --- ## Навигация (Obsidian) - Предыдущий: [[626. Как работают современные long

  • answerКак работают современные long-context LLM (GPT-4 1M, Claude 200k, Gemini 2M)?

    …Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)\|627]] | RAG vs long-context LLM | | [[628…

  • wikiRecall

    …Как вы уменьшаете latency RAG-системы (время ответа)|7. Как вы уменьшаете latency RAG-системы (время ответа)]] - [[12. Как вы…

  • wikihybrid approach

    …делаете long context для code generation (модель должна видеть весь репозиторий)]] - [[858. Как проектировать ETL vs ELT для RAG|858…

  • wikiBatch inference

    …Как вы оцениваете faithfulness RAG-ответа в production автоматически|134. Как вы оцениваете faithfulness RAG-ответа в production автоматически]] - [[139…

  • wikiComposite score

    …Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)|627. Как вы тестируете long-context capability…

  • wikiMulti-step reasoning

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[892…

  • wikiattention sink

    …Как вы делаете длинный контекст для RAG (100k+ токенов в контексте)|631. Как вы делаете длинный контекст для RAG (100k…

  • wikipdfplumber

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • answerКак вы проектируете промпт для long context рассуждения (CoT, ToT, GoT)?

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)\|645]] | Как оценивать качество работы агента? | --- ## Навигация (Obsidian) - Предыдущий…

  • wikicross-encoder

    …Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG

  • wikiROUGE

    …Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…