Поиск
- wikitarget model
…Как работают verifier models для agentic RAG и зачем они нужны|571. Как работают verifier models для agentic RAG и…
- answerЧто такое Quasar и как quantized verification ускоряет инференс?
…Quasar — архитектура для Agentic RAG [[Вики/Quasar\|Quasar]] (предложена в 2026 году) — это фреймворк или архитектура, которая разделяет [[Вики/пайплайн…
- wikiTinyLlama
…Как работают verifier models для agentic RAG и зачем они нужны|571. Как работают verifier models для agentic RAG и…
- wikiJaeger
…Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user]] - [[392. Что такое «agentic mesh» (сеть взаимодействующих агентов…
- wikiAgentic RAG
# Agentic RAG ## Определение Архитектура Retrieval-Augmented Generation, в которой агент самостоятельно решает, когда выполнять поиск, уточнять запрос или генерировать ответ…
- answerNVIDIA Grace Hopper: CPU-GPU unified memory, как это меняет LLM serving?
…Архитектура Agentic RAG: как спроектировать систему с агентами?\|708]] | Общая архитектура agentic RAG, где GH200 упрощает инфраструктуру | | [[710. Как управлять…
- answerКак работают verifier models для agentic RAG и зачем они нужны?
…Что такое tree search agents (MCTS for LLM) и когда они эффективны\|570]] | Архитектура agentic RAG | | [[572. Что такое trajectory…
- answerКак работают verifier models для agentic RAG?
…agentic RAG и проблема доверия Agentic RAG — это архитектура, в которой LLM-агент не просто один раз извлекает документы и…
- answerВ чем разница между Naive RAG, Adaptive RAG и Agentic RAG?
…Agentic RAG (RAG|агентный RAG) — архитектура, где агент (LLM с доступом к инструментам) самостоятельно планирует последовательность действий: может переписать запрос…
- answerВ чем проблема «natural language bottleneck» для LLM?
…Но если документы — тоже текст, [[Вики/Bottleneck\|bottleneck]] сохраняется. [[Вики/Agentic RAG\|Agentic RAG]] — архитектура, в которой [[Вики/agent\|LLM…
- wikiLatency
…В чем разница между Naive RAG, Adaptive RAG и Agentic RAG|141. В чем разница между Naive RAG, Adaptive RAG…
- answerКак вы проектируете disaster recovery для LLM системы при сбое региона?
…для LLM-систем с пользовательскими сессиями ([[Вики/Agentic RAG\|Agentic RAG]]) предпочтителен [[Вики/Active-Active архитектура\|Active-Active]] с синхронной…
- answerКак вы проектируете «планировщика» (planner) для Agentic RAG?
…отдельный LLM-вызов перед execution Типичная архитектура [[Вики/Agentic RAG\|Agentic RAG]] с планировщиком: 1. **Пользовательский [[Вики/Prompt engineering\|запрос…
- answerЧто такое «аутсорсинг» задачи другому LLM (с другим API, другой ценой)?
…Архитектура Agentic RAG\|770]] | Общая архитектура агентов с RAG | | [[771. Multi-agent системы\|771]] | Кооперация нескольких агентов | | [[773. Стоимость и…
- answerКак вы боретесь с «бесконечным циклом» агента в Agentic RAG?
…Agentic RAG и проблема бесконечного цикла Agentic RAG — архитектура, в которой LLM-агент самостоятельно планирует последовательность действий (поиск документов, call…
- answerВ чем разница между Workflow и Guidance в теории harness-engineering?
…Связь с другими вопросами | Вопрос | Тема | |--------|---------------------------------------------| | 741 | Архитектура Agentic RAG: модули и слои | | 743 | ReAct vs Plan-and-Execute паттерны…
- answerКак работает эмбеддинг слой и почему его размер (embedding dimension) важен?
…обучение (sharp vs flat minima)\|670]] | Введение в Agentic RAG: архитектура и компоненты | | [[672. Что такое residual connections и зачем…
- answerЧто такое Learned Index Structures for ANN? Новые подходы 2025-2026?
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.\|236]] | Как агент в Agentic RAG может динамически…
- answerЧто такое «многошаговая когерентность» (coherence illusion) в cascading agent systems?
…Пример из [[Вики/Agentic RAG\|agentic RAG]] - [[Вики/Prompt engineering\|Запрос]]: «Какова численность населения Токио в 2023 году?» - [[Вики/agent…
- wikiдатасеты
…Agentic RAG с саморефлексией|231. Agentic RAG с саморефлексией]] - [[235. LoRA для function calling|235. LoRA для function calling]] - [[266…
- answerЧто такое Chain-of-Thought без токенов (latent CoT) и как это реализовано?
…Архитектура Agentic RAG\|289]] - Следующий: [[291. Планирование в Agentic RAG\|291]] - Индекс: [[00. Индекс разборов]] --- ## Навигация (Obsidian) - Предыдущий: [[289. Как…
- answerКак вы делаете synthetic data generation для редких классов в датасете?
…Проблема дисбаланса в контексте Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] (архитектура, где агент принимает решения о поиске и…
- answerКакие типы задач требуют Level 3 представления (scientific formalization)?
…Что такое уровни представления знаний (Level 1–3) В архитектурах [[Вики/Agentic RAG\|Agentic RAG]] и Knowledge-Enhanced [[Вики/LLM…
- wikiReAct Agent
…В чем разница между Naive RAG, Adaptive RAG и Agentic RAG|141. В чем разница между Naive RAG, Adaptive RAG…
- answerЧто такое agent communication protocol (формат сообщений между агентами)?
…В архитектурах [[Вики/Agentic RAG\|Agentic RAG]] такой протокол позволяет агентам ([[Вики/Planner\|planner]], [[Вики/retrieval\|retrieval]], [[Вики/generator\|generator…
- answerКак вы проектируете feature engineering для контекста RAG (кроме текста)?
…Обычно контекст включает только текст, но feature engineering расширяет его дополнительными атрибутами. [[Вики/Agentic RAG\|Agentic RAG]] — архитектура, в которой…
- answerLangGraph vs CrewAI vs AutoGen — что вы выберете и для каких задач?
…Agentic RAG и Multi-agent системы [[Вики/Agentic RAG\|Agentic RAG]] — это архитектура, где [[Вики/AI agents\|агенты]] (автономные программы…
- answerЧто делать, если embedding pipeline отстаёт от ingestion (backpressure)?
…Тема backpressure органично входит в раздел «Архитектура Agentic RAG», потому что динамическая индексация — ключевое отличие от batch RAG. --- ## Пет-проект…
- answerКак вы делаете disaster recovery с RPO <1 минута?
…В контексте RAG|Agentic RAG обычно стремятся к RTO в несколько минут, чтобы минимизировать простой для пользователей. В Agentic RAG…
- answerЧто вы видите следующим горизонтом после language representation?
…Почему language representation недостаточно для Agentic RAG [[Вики/Agentic RAG\|Agentic RAG]] — это система, где [[Вики/agent\|LLM-агент]] не…
- answerКак тест-тайм компьютинг меняет MLOps?
…Связь с Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/agent\|агент]] может выполнять несколько итераций поиска, уточнения запроса…
- answerКак вы делаете multi-region failover с RTO <5 минут?
…Как вы обрабатываете production incident с LLM (playbook)\|386]] | Архитектура Agentic RAG | | [[388. Что такое SLI (Service Level Indicators) для…
- answerЧто такое streaming LLM для бесконечного контекста (техника rollback)?
…Навигация (Obsidian) - Предыдущий: [[647_Что_такое_Agentic_RAG_архитектура_и_отличия_от_классического_RAG\|647]] - Следующий: [[649_Как_работает_техника…
- answerЧто такое Harness Engineering и чем он отличается от Prompt Engineering и MLOps?
…Почему Harness Engineering критичен для Agentic RAG [[Вики/Agentic RAG\|Agentic RAG]] — это архитектура, где LLM-агент самостоятельно решает, когда…
- answerКак работает whisper.cpp для локального ASR с low latency?
…Интеграция в Agentic RAG (голосовой ввод для AI-агента) В архитектуре [[Вики/Agentic RAG\|Agentic RAG]] голосовой [[Вики/UI\|интерфейс…
- answerПочему естественный язык не подходит для сложного рассуждения?
…Какие failure modes уникальны для multi-agent систем (vs single agent)\|180]] | Что такое Agentic RAG и его архитектура | | [[181…
- answerЧто такое Recurrent Depth в контексте LLM и зачем это нужно?
…Связь с Agentic RAG В контексте [[Вики/Agentic RAG\|Agentic RAG]] recurrent depth может быть использован как компонент для: - Итеративного…
- answerЧто такое Q-Former в BLIP-2 и зачем он нужен?
…Как вы делаете RAG для видео (индексация subshots, аудио, ключевые кадры)\|366]] | Как архитектура Agentic RAG поддерживает работу с изображениями…
- answerЧто такое rate limiting на разных уровнях (user, API key, IP, global) и как реализовать?
…Многоуровневая архитектура rate limiting В [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/rate limiting\|rate limiting]] обычно реализуется как [[Вики/Middleware…
- answerНазовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026)?
…Как тест-тайм компьютинг меняет MLOps\|165]] | Архитектура agentic RAG: отличия от обычного RAG | | [[167. Как вы детектируете Distribution Collapse…
- answerЧто такое sidecar pattern для LLM observability и как его реализовать?
…Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user\|241]] | Архитектура agentic RAG (роль sidecar в цепочках…
- answerКак вы измеряете reasoning degradation с ростом контекста? (curse of length)
…Связь с Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] агент: - накапливает историю взаимодействий (длинный контекст); - одновременно держит несколько retrieved…
- answerКак работает embedding poisoning для RAG и как защититься?
…Как работает multi-agent with role specialization (агенты-эксперты в разных доменах)\|590]] | Архитектура Agentic RAG: обзор | --- ## Навигация (Obsidian) - Предыдущий…
- wikiChain-of-Thought
…Как вы проектируете «планировщика» (planner) для Agentic RAG|142. Как вы проектируете «планировщика» (planner) для Agentic RAG]] - [[144. Как вы…
- answerЧто такое reflection loops для агентов и как они работают?
…Зачем нужны reflection loops в Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/agent\|агент]] не просто ищет документы…
- answerЧто такое planner/executor architecture для агентов и когда она нужна?
…Интеграция с RAG (Agentic RAG) В контексте [[Вики/Agentic RAG\|Agentic RAG]] Planner/Executor используется для многошагового поиска и синтеза…
- answerКакие книги или ресурсы вы рекомендуете по Harness Engineering?
…Примеры заголовков: - «[[Вики/Harness Engineering\|Harness Engineering]] в эпоху [[Вики/Agentic RAG\|Agentic RAG]]: архитектура и реализация» (CSDN) - «[[Вики/Partial…
- answerКак работает Zero-shot classification для изображений (CLIP vs другие методы)?
…Навигация (Obsidian) - Предыдущий: [[556_Agentic_RAG_архитектура\|556]] - Следующий: [[558_Multimodal_RAG_агенты\|558]] - Индекс: [[00. Индекс разборов]] --- ## Навигация (Obsidian…
- answerКак вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)?
…Архитектура Agentic RAG\|392]] - Следующий: [[394. Планирование в агентах\|394]] - Индекс: [[00. Индекс разборов]] --- ## Навигация (Obsidian) - Предыдущий: [[392. Что такое…
- answerЧто такое selective attention в контексте long context обработки?
…Как вы тестируете видение модели (vision-language) на пропущенные детали\|288]] | Agentic RAG: архитектура и компоненты | --- ## 11. Навигация (Obsidian) - Предыдущий…