output filtering
output filtering
Определение
Метод защиты, при котором отдельная модель или фильтр проверяет ответ LLM на наличие системного промпта, чувствительных данных (PII) или других рисков, и при необходимости блокирует или модифицирует его.
Где встречается
- 67. Что такое Prompt Injection и как вы защищаетесь
- 121. Назовите OWASP Top 10 для LLM (2025) и 3 самых критичных риска.
- 123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
- 125. Объясните разницу между NeMo Guardrails и Garak. Когда что используется
- 621. Как вы защищаете LLM от prompt injection через изображения (VL-модели)
- 888. Как защититься от prompt stealing (кража системного промпта)
- 800+ вопросов
- 102. Настроить Guardrails на NeMo