NeMo Guardrails
NeMo Guardrails
Определение
Библиотека для создания runtime guardrails, перехватывающих вредоносный ввод/вывод LLM-агентов и защищающих от атак, включая adversarial prompt.
Где встречается
- 96. Как вы предотвращаете галлюцинации в production RAG системе
- 108. Что такое Assertions в DSPy и зачем они нужны
- 125. Объясните разницу между NeMo Guardrails и Garak. Когда что используется
- 345. Как вы проектируете red teaming evaluation для jailbreak устойчивости
- 352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 359. Как вы защищаете multi-agent систему от вредоносного агента
- 360. Что такое adversarial fine-tuning для защиты от jailbreak
- 399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs Plan-and-Execute)
- 497. Как вы проектируете red teaming evaluation для jailbreak устойчивости
- 589. Как вы делаете agent с human values alignment (Constitutional AI для агентов)
- 594. Что такое agent safety constraints (ограничения на действия агента)
- 597. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 616. Как работает rainbow teaming (комбинация red + blue + purple teaming для LLM)
- 625. Что такое adversarial prompt detection для реального времени (runtime)
- 736. Что такое red teaming certification (стандарты 2026 для оценки robustness)
- 738. Назовите 12+ слоёв эталонной архитектуры Harness.
- 739. Как изменилась роль инженера с приходом Harness Engineering
- 744. Что такое Agent Loop и какие компоненты входят в production-ready loop
- 747. Что такое AdmissionController в Harness и зачем он нужен
- 755. Что такое эволюция (evolution) в Harness Engineering (component registry, drift detection)
- 758. Как вы проектируете Harness для mission-critical приложения Приведите пример с агентом для банковских переводов.
- 798. Как тестировать промпты на регрессии (prompt regression suite)
- 805. Что такое «prompt linting» (статический анализ промптов)
- 867. Как делать adversarial evals для RAG (проверка на устойчивость)
- 868. Что такое red teaming для LLM и как его проводить
- 881. Что такое jailbreak taxonomy (полная классификация)
- 883. Как защитить RAG от poisoning (вредоносные документы в базе знаний)
- 885. Как происходит PII leakage через LLM и как защититься
- 888. Как защититься от prompt stealing (кража системного промпта)
- 895. Как оптимизировать траектории агента (trajectory optimization)
- Практика
- 800+ вопросов
- 102. Настроить Guardrails на NeMo