Поиск

wikicascading agent systems
# cascading agent systems ## Определение То же, что cascading agent system — архитектура с последовательным взаимодействием агентов, где результат каждого шага передаётся…
wikiAgentic RAG
# Agentic RAG ## Определение Архитектура Retrieval-Augmented Generation, в которой агент самостоятельно решает, когда выполнять поиск, уточнять запрос или генерировать ответ…
answerКак language representation связан с тест-тайм компьютингом?
…многократные запросы к LLM, реранкинг, итеративное уточнение, loops|агентные циклы. Связь прямая: чем более структурировано представление, тем больше тест-тайм…
answerКак LLM используются для code generation с формальной верификацией (Dafny, Lean)?
…LLM генерирует код + спецификации, верификатор проверяет, ошибки возвращаются LLM для исправления. | AlphaProof (DeepMind) | | [[Вики/Agentic RAG\|Агентные системы]] | LLM управляет…
answerКак учитывать CAP theorem в AI systems?
…инференса, агентные роутеры), понимание этого компромисса необходимо при проектировании. --- ## 2. Почему CAP критичен для AI-инфраструктуры AI-системы редко состоят…
answerКак вы передаете состояние (state) между шагами агента?
…LangGraph vs CrewAI vs AutoGen — что вы выберете и для каких задач\|145]] | Как тестировать агентные системы? | | [[146. Как вы…
answerЧто такое error budget для AI качества и как его считать?
…Error budget в контексте Agentic RAG Агентные системы имеют дополнительные точки отказа: - **Tool call accuracy**: агент вызывает неправильный инструмент. - **Step…
answerКак вы измеряете и оптимизируете TTFT (Time To First Token) и TPOT (Time Per Output Token)?
…Обе метрики напрямую влияют на пользовательский опыт в **RAG|agentic RAG** (агентные RAG-системы), где требуется быстрая итерация вызовов LLM…
answerКак вы проектируете бенчмарк для нового домена (медицина, юриспруденция)?
…Что такое Constitutional AI и как RLHF связан с ним\|340]] | Как вы тестируете агентные RAG-системы? | | [[342. Что такое…
answerКак вы делаете cache invalidation для semantic cache при обновлении знаний?
…Как вы уменьшаете latency RAG-системы (время ответа)\|7]] | Как вы уменьшаете latency RAG-системы (время ответа)? | | [[10. Что такое…
answerКак вы проектируете бенчмарк для нового домена (медицина, юриспруденция)?
…Сгенерируй 10 вопросов по фармакологии для оценки RAG-системы. Формат каждого вопроса: - Вопрос: ... - Правильный ответ: ... - Источник (название документа): ... Требования: - Вопросы…
answerКак тестировать агентов на недетерминированность?
…Как тестировать агентов на недетерминированность? ## Краткий тезис Агентные системы по своей природе недетерминированы: LLM выводят вероятностные ответы, API|внешние API…
answerКак работает DoRA (Weight-Decomposed LoRA) и чем лучше LoRA?
…Связь с Agentic RAG В контексте [[Вики/Agentic RAG\|Agentic RAG]] (агентные системы, которые используют RAG для поиска информации и…
answerЧто такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса?
…Как вы переключаете агента между инструментами (function calling) с разными сигнатурами\|150]] | Что такое агентные RAG и как TTC используется…
answerНазовите 12+ слоёв эталонной архитектуры Harness?
…Понимание этих слоёв позволяет проектировать модульные, масштабируемые и устойчивые [[Вики/Agentic RAG\|агентные системы]], готовые к изменению требований и данных…
answerЧто такое Context Engineering в рамках Harness и почему это отдельный слой?
…на архитектуру агента? | | 741 | Как вы тестируете и отлаживаете агентные системы? | --- ## Навигация (Obsidian) - Предыдущий: [[739. Как изменилась роль инженера с…
answerЧто такое «canary testing» для агентов (10% трафика на новую версию)?
…Пример конфигурации в псевдокоде: ```python # Псевдокод для системы canary gates def check_gates(v2_metrics, v1_baseline): if v2_metrics…
answerЧто такое chunked prefill и зачем он нужен?
…Агентные системы с длинной историей [[Вики/AI agents\|Агенты]] (например, на базе [[Вики/ReAct Agent\|ReAct]] или [[Вики/Plan-and…
answerЧто такое benchmark chasing и почему это опасно?
…бенчмарки агентов В области [[Вики/Agentic RAG\|Agentic RAG]] (агентные системы с поиском) появились бенчмарки типа [[Вики/WebArena\|WebArena]], [[Вики…
answerЧто такое prefix caching и когда он эффективен?
…Отвечай с примерами кода.» | 50–200 токенов | Каждый запрос | Значительное снижение TTFT | | Агентные системы с фиксированными инструкциями | «Ты — агент, выполняющий…
answerЧто такое «message schema evolution» (Avro/Protobuf)?
…Почему это важно - [[Вики/Microservice architecture\|Микросервисы]] независимо развёртываются — [[Вики/template circuits\|схемы]] могут расходиться. - Потоковые системы ([[Вики/Kafka\|Kafka…
answerКак тест-тайм компьютинг меняет MLOps?
…Назовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026).\|166]] | Как эвалюировать агентные системы? | --- ## Навигация (Obsidian…
answerКак вы индексируете видео-контент в RAG-системе?
…Это позволяет отвечать на вопросы по содержанию видео, искать моменты по описанию и строить [[Вики/Agentic RAG\|агентные системы]], работающие…
answerЧто такое prompt caching у провайдеров (Anthropic, Google) и как его использовать?
…Как вы уменьшаете latency RAG-системы (время ответа)\|7]] | Как уменьшить latency RAG-системы? | | [[10. Что такое Self-RAG и…
answerКак вы реализуете retry с exponential backoff для LLM API с rate limit?
…В контексте LLM API (OpenAI, Anthropic, локальные модели) такая реализация критична, так как агентные RAG-системы совершают десятки последовательных вызовов…
answerЧто такое Recurrent Depth в контексте LLM и зачем это нужно?
…с [[Вики/Agentic RAG\|Agentic RAG]]: [[Вики/Agentic RAG\|агентные системы]] часто требуют итеративного уточнения запросов и документов — [[Вики/Recurrent…
answerЧто такое selective attention в контексте long context обработки?
…Связь с Agentic RAG В контексте [[Вики/Agentic RAG\|Agentic RAG]] ([[Вики/Agentic RAG\|агентные RAG-системы]]) [[Вики/Selective Attention…
answerЧто такое active learning для сбора синтетических данных?
…Как проводить safety case для LLM системы (аналог safety case в авиации)\|735]] | Агентные циклы: self-improvement и обратная связь…
answerКак работает Mixture of Experts (MoE) внутри LLM (спарсинг активации)?
…Таким образом, понимание MoE помогает проектировать эффективные агентные системы с динамическим выбором подзадач. ## Пет-проект для закрепления [[Вики/Task\|Задача…
answerЧто такое Semantic Kernel и чем отличается от LangChain?
…отличается от LangChain?\|55]] | AutoGen (многоагентные системы) | | [[56 Что такое CrewAI?\|56]] | CrewAI (агентные команды) | | [[57 Какие архитектуры AI-агентов…
answerКак вы обрабатываете real-time фичи для LLM (например, текущий сток товара)?
…Как работает CLIP (Contrastive Language-Image Pre-training) внутренне\|536]] | Как тестировать агентные системы? | --- ## Навигация (Obsidian) - Предыдущий: [[532. Что такое…
answerЧто такое rate limiting на разных уровнях (user, API key, IP, global) и как реализовать?
…Зачем нужно rate limiting в Agentic RAG [[Вики/Agentic RAG\|Агентные системы]] ([[Вики/ReAct Agent\|ReAct]], [[Вики/Plan-and-Execute…
answerКак работает asynchronous execution на Hopper (copy engine vs compute)?
…Применение в Agentic RAG [[Вики/Agentic RAG\|Агентные RAG-системы]] часто выполняют несколько параллельных действий: - Поиск в векторной БД ([[Вики…
answerКак Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)?
…Вики/промпт агента\|запрос]] → один ответ), [[Вики/Agentic RAG\|агентные системы]] выполняют несколько раундов внутренних шагов. Проблемы: - Детерминизм: [[Вики/LLM…
answerКакие ограничения у language representation design?
…как агент выбирает действия | | [[199\|199]] | Как тестировать агентные системы | | [[200\|200]] | Промпт-дизайн для агентов | | [[45\|45]] | Ограничения LLM…
answerКак работает Direct Preference Optimization (DPO) в деталях (потеря, градиенты)?
…Применение DPO в Agentic RAG В контексте [[Вики/Agentic RAG\|Agentic RAG]] (агентные системы с поиском) DPO может использоваться для…
answerКак работает adversarial example для embedding моделей (атака на retrieval)?
…заставить агента игнорировать [[Вики/gold documents\|релевантные документы]]. [[Вики/Agentic RAG\|Агентные системы]] сложнее защищать, так как они могут многократно…
answerКак бы вы добавили "отмену" (cancellation) для длительных LLM операций?
…Для [[Вики/LLM\|LLM]] это типично: [[Вики/generation\|генерация]] длинных ответов, агентные [[Вики/цепочки\|цепочки]], [[Вики/Batch inference\|batch-обработка…
answerЧто такое autoscaling inference и как его настроить?
…Особенности autoscaling для LLM Agentic RAG [[Вики/Agentic RAG\|Агентные системы]] создают пикообразную нагрузку: один [[Вики/Prompt engineering\|запрос]] пользователя…
answerЧто такое Q-Former в BLIP-2 и зачем он нужен?
…Применение Q-Former в Agentic RAG В контексте [[Вики/Agentic RAG\|Agentic RAG]] (агентные системы поиска и генерации) Q-Former…
answerЧто такое MLIR и как он используется в IREE/TensorRT-LLM?
…Роль MLIR в Agentic RAG В контексте [[Вики/Agentic RAG\|Agentic RAG]] ([[Вики/Agentic RAG\|агентные системы]] с [[Вики/retrieval…
answerЧто такое idempotency в контексте LLM API и зачем она нужна?
…один ключ на всю сессию отправки, второй запрос игнорируется | | **Агентные системы (Agentic RAG)** | Агент вызывает LLM для генерации ответа, затем…
answerКак вы определяете SLO и SLA для LLM сервиса?
…Как вы проводим chaos engineering для RAG системы\|384]] | Как управлять версиями моделей (model registry, A/B тесты) | | [[385. Как…
question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…AI-системы — это распределенные системы.* **236. Как вы проектируете RAG для 10k RPS с P99 latency <200ms? Архитектура.** > *Ответ:* Multi…