Jailbreak-атаки
Jailbreak-атаки
Определение
Попытки обойти ограничения модели для генерации небезопасного контента. Являются ключевым объектом red teaming и тестирования безопасности.
Попытки обойти ограничения модели для генерации небезопасного контента. Являются ключевым объектом red teaming и тестирования безопасности.