output filtering

Определение

Метод защиты, при котором отдельная модель или фильтр проверяет ответ LLM на наличие системного промпта, чувствительных данных (PII) или других рисков, и при необходимости блокирует или модифицирует его.

Где встречается

67. Что такое Prompt Injection и как вы защищаетесь
121. Назовите OWASP Top 10 для LLM (2025) и 3 самых критичных риска.
123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
125. Объясните разницу между NeMo Guardrails и Garak. Когда что используется
621. Как вы защищаете LLM от prompt injection через изображения (VL-модели)
888. Как защититься от prompt stealing (кража системного промпта)
800+ вопросов
102. Настроить Guardrails на NeMo

output filtering

output filtering

Определение

Где встречается

Навигация