Оглавление
Вопросы
Практика
Вики
Материалы сообщества
Тесты
Поиск

✈Telegram @ai_varo

…

Оглавление/Вики/NeMo Guardrails

NeMo Guardrails

NeMo Guardrails

Определение

Библиотека для создания runtime guardrails, перехватывающих вредоносный ввод/вывод LLM-агентов и защищающих от атак, включая adversarial prompt.

Где встречается

96. Как вы предотвращаете галлюцинации в production RAG системе
108. Что такое Assertions в DSPy и зачем они нужны
125. Объясните разницу между NeMo Guardrails и Garak. Когда что используется
345. Как вы проектируете red teaming evaluation для jailbreak устойчивости
352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
359. Как вы защищаете multi-agent систему от вредоносного агента
360. Что такое adversarial fine-tuning для защиты от jailbreak
399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs Plan-and-Execute)
497. Как вы проектируете red teaming evaluation для jailbreak устойчивости
589. Как вы делаете agent с human values alignment (Constitutional AI для агентов)
594. Что такое agent safety constraints (ограничения на действия агента)
597. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
616. Как работает rainbow teaming (комбинация red + blue + purple teaming для LLM)
625. Что такое adversarial prompt detection для реального времени (runtime)
736. Что такое red teaming certification (стандарты 2026 для оценки robustness)
738. Назовите 12+ слоёв эталонной архитектуры Harness.
739. Как изменилась роль инженера с приходом Harness Engineering
744. Что такое Agent Loop и какие компоненты входят в production-ready loop
747. Что такое AdmissionController в Harness и зачем он нужен
755. Что такое эволюция (evolution) в Harness Engineering (component registry, drift detection)
758. Как вы проектируете Harness для mission-critical приложения Приведите пример с агентом для банковских переводов.
798. Как тестировать промпты на регрессии (prompt regression suite)
805. Что такое «prompt linting» (статический анализ промптов)
867. Как делать adversarial evals для RAG (проверка на устойчивость)
868. Что такое red teaming для LLM и как его проводить
881. Что такое jailbreak taxonomy (полная классификация)
883. Как защитить RAG от poisoning (вредоносные документы в базе знаний)
885. Как происходит PII leakage через LLM и как защититься
888. Как защититься от prompt stealing (кража системного промпта)
895. Как оптимизировать траектории агента (trajectory optimization)
Практика
800+ вопросов
102. Настроить Guardrails на NeMo

Навигация

Индекс терминов
Индекс разборов
Оглавление