Поиск
- wikiLong Context RAG
# Long Context RAG ## Определение Вариант RAG, предназначенный для работы с документами объёмом более 100k токенов. Требует специальных методов, таких как…
- wikiRULER
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…
- wikiweighted recall
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…
- wikiLlama-3-8B-128k
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…
- wikiLost in the Middle
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiLongBench
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…
- wikiMulti-hop RAG
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiOpenAIEmbeddings
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiContext Coverage
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[276…
- answerКак делать evaluation для long-context RAG (>100k токенов)?
…Long-Context RAG **[[Вики/History\|Context]] [[Вики/History\|Context]] [[Вики/Long Context\|Long-Context]] [[Вики/RAG\|RAG]]** — это модификация классического…
- wikiGPT-4 Turbo
…Как вы делаете длинный контекст для RAG (100k+ токенов в контексте)]] - [[636. Как вы проектируете промпт для long context рассуждения…
- wikiSection Recall@k
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiChunk Recall@k
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiMistral-7B-Instruct
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…
- wikiQuery embedding
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiHierarchical Hit Rate
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiRetrieval success rate
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] ## Навигация…
- wikisentence-transformers/all-MiniLM-L6-v2
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiCohere rerank
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiNeedle in a Haystack
…тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)]] - [[631. Как вы делаете длинный контекст для RAG (100k…
- wikiHierarchical Retrieval
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiRecursiveCharacterTextSplitter
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikisentence-level evaluation
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…
- wikiTop-k routing
…Как вы уменьшаете latency RAG-системы (время ответа)]] - [[283. Что такое selective attention в контексте long context обработки|283. Что…
- wikiMemory Networks
…Альтернатива RAG для долгосрочного запоминания. ## Где встречается - [[57. Настроить recurrent memory для long context|57. Настроить recurrent memory для long…
- wikimax_batched_tokens
…Настроить chunked prefill для long context|212. Настроить chunked prefill для long context]] - [[236. RAG с оценкой faithfulness|236. RAG…
- wikiMulti-needle
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…
- wikirecurrent memory
…RAG-систем. ## Где встречается - [[Практика|Практика]] - [[57. Настроить recurrent memory для long context|57. Настроить recurrent memory для long context…
- wikiPickle
…Настроить recurrent memory для long context]] - [[104. Реализовать Session Management с TTL|104. Реализовать Session Management с TTL]] - [[227. RAG…
- wikiCommand R+
…оптимизированная для RAG-сценариев и длинного контекста. ## Где встречается - [[639. Как вы делаете model selection для long context (какая модель…
- wikifull file strategy
…в RAG, при которой для релевантного фрагмента загружается весь файл целиком. ## Где встречается - [[647. Как вы делаете long context для…
- wikiChunk overlap
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiheatmap
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[27…
- wikiSliding window chunking
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiStreamingLLM
…современные long-context LLM (GPT-4 1M, Claude 200k, Gemini 2M)]] - [[631. Как вы делаете длинный контекст для RAG (100k…
- wikiReal-time ingestion
…Когда SSM-архитектуры (Mamba, StripedHyena) лучше трансформеров для long context]] - [[851. Как строить streaming RAG pipeline (real-time ingestion)|851…
- answerКак вы делаете model selection для long context (какая модель лучше держит 100k+)?
…Почему long context важен для Agentic RAG? В архитектуре [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/agent\|агент]] может: - анализировать множество…
- wikiContext precision
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- answerКак вы тестируете long-context capability модели (бенчмарки: RULER, Needle in a Haystack)?
…Как вы уменьшаете latency RAG-системы (время ответа)\|7]] | Уменьшение latency RAG | --- ## Навигация (Obsidian) - Предыдущий: [[626. Как работают современные long…
- answerКак работают современные long-context LLM (GPT-4 1M, Claude 200k, Gemini 2M)?
…Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)\|627]] | RAG vs long-context LLM | | [[628…
- wikiRecall
…Как вы уменьшаете latency RAG-системы (время ответа)|7. Как вы уменьшаете latency RAG-системы (время ответа)]] - [[12. Как вы…
- wikihybrid approach
…делаете long context для code generation (модель должна видеть весь репозиторий)]] - [[858. Как проектировать ETL vs ELT для RAG|858…
- wikiBatch inference
…Как вы оцениваете faithfulness RAG-ответа в production автоматически|134. Как вы оцениваете faithfulness RAG-ответа в production автоматически]] - [[139…
- wikiComposite score
…Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)|627. Как вы тестируете long-context capability…
- wikiMulti-step reasoning
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[892…
- wikiattention sink
…Как вы делаете длинный контекст для RAG (100k+ токенов в контексте)|631. Как вы делаете длинный контекст для RAG (100k…
- wikipdfplumber
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- answerКак вы проектируете промпт для long context рассуждения (CoT, ToT, GoT)?
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)\|645]] | Как оценивать качество работы агента? | --- ## Навигация (Obsidian) - Предыдущий…
- wikicross-encoder
…Что такое hierarchical retrieval для long context RAG (когда контекст 100k)|645. Что такое hierarchical retrieval для long context RAG…
- wikiROUGE
…Как делать evaluation для long-context RAG (100k токенов)|879. Как делать evaluation для long-context RAG (100k токенов)]] - [[800…