Jailbreak-атаки

Jailbreak-атаки

Определение

Попытки обойти ограничения модели для генерации небезопасного контента. Являются ключевым объектом red teaming и тестирования безопасности.

Где встречается

Навигация