Поиск

answerКак вы оцениваете alignment модели с человеческими ценностями без gold standard?
…RAG\|Agentic RAG]]: alignment агента включает не только ответы, но и выбор инструментов. Оценка — multi-objective: точность retrieval, безопасность действий…
answerКак изменилась роль инженера с приходом Harness Engineering?
…Влияние на архитектуру Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/Harness-engineering\|Harness Engineering]] проявляется особенно ярко: - [[Вики…
answerЧто такое Agent Loop и какие компоненты входят в production-ready loop?
…Такой цикл обеспечивает надёжность, масштабируемость и безопасность агентного поведения. --- ## 1. Термин: Agent Loop – ядро слоя Harness В архитектуре RAG|Agentic…
answerЧто такое Constitutional AI и как RLHF связан с ним?
…обычного RAG? | | [[338. Как вы деплоите policy (RLHF модель) в production с online feedback loop\|338]] | Как обеспечить безопасность и…
answerЧто такое adversarial retrieval (атака на retrieval компонент)?
…Second opinion даёт лучший баланс. --- ## Связь с другими вопросами | Вопрос | Тема | |--------|------| | [[353\|353]] | Prompt injection в RAG | | [[355\|355]] | Безопасность…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать test plan для агента
…LLM, инструменты, memory, RAG) | Собственный пет‑проект (Pet 160) или готовое описание от преподавателя | | Список инструментов агента (search, calculator, email…
answerЧто такое AdmissionController в Harness и зачем он нужен?
…строить agentic RAG? | | 741 | Как спроектировать инфраструктуру для agentic RAG? | | 742 | Как обеспечить безопасность в agentic RAG? | | 745 | Что такое…
answerЧто такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)?
…Как работает model stealing attack и как защититься\|351]] | Как тестировать безопасность RAG-системы? | | [[353. Как работает embedding poisoning для…
answerЧто такое model cards и system cards и как их составлять?
…Как выполнять requirement on transparency (статья 13 EU AI Act) для LLM\|733]] | Как обеспечить безопасность в Agentic RAG (guardrails…
answerЧто такое watermarking для LLM генераций и как его детектировать?
…Применение в Agentic RAG и безопасность В контексте [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/watermarking\|watermarking]] решает несколько задач: - Атрибуция…
answerКак вы управляете секретами (API keys для LLM) в Kubernetes?
…Как вы отслеживаете data drift для распределения запросов к RAG\|260]] | Как обеспечить безопасность Multi‑tenant RAG? | | [[270. Как вы…
answerКак работает prompt leakage (кража системного промпта) и как защититься?
…Что такое malicious embeddings (атака через векторные БД)\|610]] | Как обеспечить безопасность данных в RAG? | | [[601. Что такое data poisoning…
answerЧто такое Harness Engineering и чем он отличается от Prompt Engineering и MLOps?
…Почему Harness Engineering критичен для Agentic RAG [[Вики/Agentic RAG\|Agentic RAG]] — это архитектура, где LLM-агент самостоятельно решает, когда…
answerКак вы оцениваете alignment модели с человеческими ценностями без gold standard?
…methods)\|500]] | Как обеспечить безопасность действий агента? | | [[501. Что такое Path-level evaluation для Agentic RAG и чем оно лучше…
answerЧто такое representation engineering (RepE) и зачем он нужен?
…можно динамически включать/выключать контроль во [[Вики/Latency\|время инференса]]. - [[Вики/Safetysecurity\|Безопасность]]: позволяет блокировать нежелательное поведение ([[Вики/toxic content…
answerКак вы проектируете Harness для mission-critical приложения? Приведите пример с агентом для банковских переводов.
…Для банковских переводов это означает абсолютную [[Вики/reliability\|надёжность]], [[Вики/Safetysecurity\|безопасность]] и аудируемость. - [[Вики/Agentic RAG\|Agentic RAG]] — архитектура…
answerКак вы комбинируете несколько языков представления в одном пайплайне?
…Архитектура пайплайна с мультиязыковым представлением Типичный [[Вики/пайплайн\|пайплайн]] [[Вики/Agentic RAG\|Agentic RAG]] включает следующие этапы, на каждом из…
answerЧто такое Safety & Guardrails как слой Harness? Чем runtime guardrails отличаются от тестирования?
…Вики/Task\|Задача]] Создать простую RAG-систему для поиска по документам компании с безопасностью: реализовать runtime guardrails на входе (детекция…
answerЧто такое Indirect Prompt Injection через RAG и как защититься?
…как Indirect Prompt Injection работает в RAG Типичная RAG-система: 1. Пользователь отправляет запрос. 2. Retrieval ищет релевантные чанки в…
answerКак вы логируете все вызовы LLM для аудита?
…Как вы шифруете данные для RAG (конфиденциальность)\|68]] (безопасность RAG-систем) | Маскировка PII и контроль доступа напрямую связаны с безопасностью…
answerКак вы делаете agent с human values alignment (Constitutional AI для агентов)?
…Что такое Agentic RAG и чем отличается от обычного RAG?\|587]] | Общий контекст, в котором нужно выравнивание | --- ## Навигация (Obsidian) - Предыдущий…
answerЧто такое reflection loops для агентов и как они работают?
…Зачем нужны reflection loops в Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/agent\|агент]] не просто ищет документы…
answerКак вы боретесь с «бесконечным циклом» агента в Agentic RAG?
…Как вы реализуете планирование в Agentic RAG?\|142]] - Следующий: [[144. Как вы обеспечиваете безопасность агента в Agentic RAG?\|144]] - [[Вики…
answerЧто такое «аутсорсинг» задачи другому LLM (с другим API, другой ценой)?
…Как выбирать LLM для RAG-системы\|774]] | Критерии выбора модели для агента | | [[775. Безопасность в Agentic RAG\|775]] | Риски при…
answerЧто такое agent safety constraints (ограничения на действия агента)?
…интеграция в agentic pipeline Типичная архитектура [[Вики/Agentic RAG\|agentic RAG]] с [[Вики/safety\|safety constraints]]: ``` User query -> Orchestrator -> (Planning…
answerКак вы переключаете между уровнями представления для разных типов запросов?
…Интеграция в Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] Router является частью цикла агента. Типичная архитектура: 1. Пользовательский запрос…
answerЧто вы видите следующим горизонтом после language representation?
…Почему language representation недостаточно для Agentic RAG [[Вики/Agentic RAG\|Agentic RAG]] — это система, где [[Вики/agent\|LLM-агент]] не…
answerКак управлять версиями промптов в production (best practices)?
…работу агентов? | | 801 | Что такое Agentic RAG и его архитектура? | | 806 | Как обеспечить безопасность в system prompt? | --- ## Навигация (Obsidian) - Предыдущий…
answerКак вы проектируете бенчмарк для нового домена (медицина, юриспруденция)?
…Как вы оцениваете качество retrieval'а в RAG-системе\|5]] | Как вы оцениваете качество retrieval'а в RAG-системе? | | [[10…
answerКак вы переносите агента из прототипа в production (MLOps)?
…в POC можно игнорировать [[Вики/graceful degradation\|отказоустойчивость]], [[Вики/мониторинг\|мониторинг]] и [[Вики/Safetysecurity\|безопасность]] — в production это критично. --- ## 2…
answerКакие протоколы меж-агентской коммуникации существуют (A2A, MCP, OpenAI swarm)?
…Зачем нужны протоколы меж-агентской коммуникации В [[Вики/Agentic RAG\|Agentic RAG]] и мульти-агентных системах несколько агентов (специализированных [[Вики…
answerКакие failure modes уникальны для multi-agent систем (vs single agent)?
…Оценка качества multi-agent RAG | | [[185. Как код как язык представления улучшает рассуждение LLM\|185]] | Безопасность в multi-agent системах…
answerКак вы A/B тестируете агентов в production?
…AgentA (базовый RAG) и AgentB (с улучшенным retrieval, например, с переранжированием). 2. Реализуйте shadow mode: оба агента запускаются параллельно, ответ…
answerКак вы защищаете LLM от prompt injection через RAG (когда документ содержит инструкцию)?
…Как вы оцениваете качество retrieval'а в RAG-системе\|5]] | Оценка качества retrieval (влияние на безопасность) | | [[7. Как вы уменьшаете…
answerКак бы вы спроектировали multi-tenant RAG (разные компании, изолированные данные)?
…Как бы вы спроектировали multi-tenant RAG (разные компании, изолированные данные)? ## Краткий тезис [[Вики/multi-tenant RAG\|Multi-tenant RAG…
wikiNeMo Guardrails
…Как вы предотвращаете галлюцинации в production RAG системе|96. Как вы предотвращаете галлюцинации в production RAG системе]] - [[108. Что такое…
answerЧто такое adversarial fine-tuning для защиты от jailbreak?
…Как вы защищаете multi-agent систему от вредоносного агента\|359]] | Безопасность RAG-систем | | [[358. Что такое watermarking для LLM генераций…
answerЧто такое benchmark chasing и почему это опасно?
…Специфика benchmark chasing в Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] агент использует инструменты (поиск, калькулятор, API). Бенчмарки для…
answerКак вы защищаете LLM от градиентных атак (white-box jailbreak)?
…Что такое adversarial retrieval (атака на retrieval компонент RAG)\|599]] | Red teaming и безопасность LLM | | Вопрос [[601. Что такое data…
answerКак делать sandboxing для agent tools (изоляция выполнения)?
…Правильный выбор песочницы — [[Вики/trade-off\|компромисс]] между безопасностью, производительностью и сложностью эксплуатации. --- ## 1. Зачем нужен sandboxing в agentic RAG…
answerКак спроектировать агента, который может самоисправляться (self-correction)?
…В контексте [[Вики/Agentic RAG\|Agentic RAG]] это особенно важно, так как [[Вики/AI agents\|агент]] может опираться на неверно…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Multi-tenant RAG с изоляцией данных
…201 | | Безопасность tenant-изоляции в приложениях ИИ | Security | 378 | | LangChain: работа с несколькими векторными сторами | LangChain | 89 | | Тестирование RAG-систем…
answerКак код как язык представления улучшает рассуждение LLM?
…Интеграция в Agentic RAG В архитектуре [[Вики/Agentic RAG\|Agentic RAG]] [[Вики/Code\|код]] используется как универсальный язык для взаимодействия…
answerКак вы обрабатываете production incident с LLM (playbook)?
…recall (через LLM-as-judge) | LangSmith, Weights & Biases, RAGAS | | [[Вики/Safetysecurity\|Безопасность]] | Toxicity score, PII leakage, Prompt injection detection | Guardrails…
answerЧто такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста?
…Связь с Agentic RAG [[Вики/Agentic RAG\|Agentic RAG]] — это подход, в котором [[Вики/agent\|агент]] ([[Вики/GPT-4o\|LLM…
answerКак вы тестируете агента на «неожиданные input» (не только adversarial, но и просто странные)?
…Почему это важно для агента? [[Вики/agent\|Агент]] в [[Вики/Agentic RAG\|Agentic RAG]] не просто генерирует ответ, а может…
answerЧто такое diffusion backends для генерации изображений (Stable Diffusion, Flux) и как их вызывать из агента?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Безопасность агентов (prompt injection) | --- ## 12. Навигация…
answerКак вы обеспечиваете «человека в петле» (HITL) для критических действий агента?
…RAG\|141]] | Инструменты агента (какие действия считать опасными) | | [[144. Как вы передаете состояние (state) между шагами агента\|144]] | Безопасность агента…
answerЧто такое Prompt Injection и как вы защищаетесь?
…Какие embedding-модели вы использовали и почему\|15]] | Безопасность LLM: обзор уязвимостей (OWASP Top [[10. Что такое Self-RAG и…
answerКак работает LLM fingerprinting (идентификация модели по ответам)?
…Fingerprint позволяет это проверить. - Безопасность: обнаружение подмены модели в цепочке агентов (RAG|Agentic RAG) или при использовании сторонних LLM. - Соблюдение…