prompt leakage
prompt leakage
Определение
Атака, при которой пользователь заставляет модель раскрыть системный промпт или иную конфиденциальную информацию.
Где встречается
- 625. Что такое adversarial prompt detection для реального времени (runtime)
- 881. Что такое jailbreak taxonomy (полная классификация)
- 800+ вопросов