Input sanitization
Input sanitization
Определение
Техника фильтрации или трансформации входа (экранирование, нормализация, удаление токенов) для нейтрализации вредоносных инструкций и защиты от jailbreak.
Где встречается
- 67. Что такое Prompt Injection и как вы защищаетесь
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 355. Как вы защищаете LLM от градиентных атак (white-box jailbreak)
- 600. Как вы защищаете LLM от градиентных атак (white-box jailbreak)
- 621. Как вы защищаете LLM от prompt injection через изображения (VL-модели)
- 890. Как тестировать robustness LLM к adversarial inputs
- 800+ вопросов